CN113553437A - 基于多尺度空洞卷积的时间知识图谱补全方法 - Google Patents

基于多尺度空洞卷积的时间知识图谱补全方法 Download PDF

Info

Publication number
CN113553437A
CN113553437A CN202110337763.5A CN202110337763A CN113553437A CN 113553437 A CN113553437 A CN 113553437A CN 202110337763 A CN202110337763 A CN 202110337763A CN 113553437 A CN113553437 A CN 113553437A
Authority
CN
China
Prior art keywords
feature
scale
representation
mapping
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110337763.5A
Other languages
English (en)
Inventor
汪璟玢
赖晓连
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202110337763.5A priority Critical patent/CN113553437A/zh
Publication of CN113553437A publication Critical patent/CN113553437A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Databases & Information Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及种基于多尺度空洞卷积的时间知识图谱补全方法,包括以下步骤:步骤S1:对待处理四元组数据进行处理后,使用LSTM建模时间序列和关系之间的特征表示;步骤S2:根据得到的特征表示,基于多尺度空洞卷积神经网络,获取多尺度特征映射;步骤S3:引入注意力机制帮助模型自适应地调整多尺度特征映射的权重,并得到加权后的特征映射;步骤S4:将得到的特征映射经过拉平操作变成向量,然后经过一个全连接层,将拉平后的向量映射到指定维度,最后与尾实体嵌入进行点积得到四元组的得分。本发明解决了传统卷积神经网络模型实体与关系间交互性差、参数量和计算量大的问题。

Description

基于多尺度空洞卷积的时间知识图谱补全方法
技术领域
本发明涉及知识图谱补全领域,具体涉及一种基于多尺度空洞卷积 的时间知识图谱补全方法。
背景技术
现有的静态知识图谱嵌入模型虽然在知识图谱补全任务中取得 了一定的成效,但是由于模型不考虑时间信息,无法建模随时间变化 的知识。比如(X,presidentOf,USA,2010)这个四元组,由于这 类模型不使用时间,会得到多个答案,比如“Obama”、“Clinton”等, 但实际上该四元组只有一个有效的答案“Obama”。近几年来,卷积神 经网络受到了广大研究学者的关注,它学习非线性特征来捕捉复杂的 关系。受CNN的启发,国内外学者提出了ConvE、InteractE等一系 列将卷积神经网络应用于KGC的模型,它们将卷积核作用于关系和实 体拼接的矩阵中获取特征信息,在静态知识图谱补全任务中取得了较 好的效果。但是这类模型使用单个尺度卷积核不能从不同感受野(即 特征映射上的一个点对应输入图上的区域大小)中获取信息,只能提 取局部特征,这不可避免地丢失了一些重要信息,导致模型不能获取 丰富的特征信息,实体与关系之间的交互性也较差。
发明内容
有鉴于此,本发明的目的在于提供一种基于多尺度空洞卷积的时 间知识图谱补全方法,解决了传统卷积神经网络模型实体与关系间交 互性差、参数量和计算量大的问题
为实现上述目的,本发明采用如下技术方案:
一种基于多尺度空洞卷积的时间知识图谱补全方法,包括以下步 骤:
步骤S1:对待处理四元组数据进行处理后,使用LSTM建模时间 序列和关系之间的特征表示;
步骤S2:根据得到的特征表示,基于多尺度空洞卷积神经网络, 获取多尺度特征映射;
步骤S3:引入注意力机制帮助模型自适应地调整多尺度特征映射 的权重,并得到加权后的特征映射;
步骤S4:将得到的特征映射经过拉平操作变成向量,然后经过一 个全连接层,将拉平后的向量映射到指定维度,最后与尾实体嵌入进 行点积得到四元组的得分。
进一步的,所述步骤S1具体为:
对于输入的四元组(s,r,o,t),时间戳t将根据年月日划分成时间序 列,时间序列的向量表示为
Figure RE-GDA0003128769130000021
其中m表示时间序列的长度,d是时间序列的嵌入维度;
将关系表示和时间序列的向量表示组合成LSTM的输入序列,即 X={r,τ12,…τm}
将X输入到LSTM中得到融合时间信息的关系表示rt
将融合时间信息的关系嵌入rt与头实体嵌入es进行形状变换操 作得到他们的2D嵌入表示
Figure BDA0002998234570000031
Figure BDA0002998234570000032
其中d=d1×d2
Figure BDA0002998234570000033
Figure BDA0002998234570000034
进行简单的拼接,得到矩阵A,即
Figure BDA0002998234570000035
进一步的,所述LSTM具体为:
in=σ(hn-1Ui+xnWi)
fn=σ(hn-1Uf+xnWf)
on=σ(hn-1Uo+xnWo)
gn=tanh(hn-1Ug+xnWg)
Figure BDA0002998234570000036
Figure BDA0002998234570000037
其中,xn是输入序列X的第n个元素的表示,in,fn,on分别是第 n个元素的输入门,遗忘门,输出门,gn是一个中间变量, Ui、Uf、Uo、Wi、Wf、Wo是变换矩阵,cn和hn分别是第n个元素的单 元表示和隐藏状态表示,c0和h0的值初始化为0;σ是激活函数;将 LSTM最后一层的隐藏状态表示作为最终关系的表示,即rt=hm+1
进一步的,所述步骤S2具体为:将特征表示A输入到多尺度空 洞卷积神经网络中,通过调整卷积核的空洞率获取不同尺度的卷积核, 然后将不同尺度的卷积核作用于输入特征表示A得到多尺度特征映 射V1,V2,……,Vl
进一步的,所述步骤S3具体为:将步骤S2得到的特征映射 V1,V2,……,Vl输入到多尺度注意力模块中,计算特征映射 V1,V2,……,Vl对应的权重α1,α2,……,αl,将得到的权重α1,α2,……,αl与输入的特征映射V1,V2,……,Vl按元素相乘得到特征映射L1,L2,……,Ll,然后将L1,L2,……,Ll进行拼接并经过一个变换矩阵 进行降维操作得到最终的特征映射P。
进一步的,所述多尺度注意力模块包括特征聚合子模块和特征选 择子模块。
进一步的,所述特征聚合子模块输入有l个分支,代表l种不同 尺度的卷积核提取的特征映射,将l个分支上的特征映射按位相加, 得到聚合后的特征映射U,即U=V1 V2…… Vl
在每一个通道使用全局平均池化Fgap获取全局信息
Figure RE-GDA0003128769130000041
C表 示特征映射的通道个数。q的第c(c∈{1,2,3,.....,C})个元素qc的计算过程 表示为:
Figure RE-GDA0003217461960000042
其中,Uc表示特征映射U的第c个通道的表示。
将获取的全局信息q通过一个全连接层Ffc,得到一个压缩的特 征表示
Figure BDA0002998234570000043
其中C1是压缩后的维度
z=Ffc(q)=Wc(reshape(q))+bc (5)
其中reshape(·)是形状变换函数,它将q变为C×1大小以便于乘法 操作;
Figure RE-GDA0003128769130000044
分别表示全连接层的权重矩阵和偏置。
进一步的,所述特征选择子模块将压缩后的特征表示z经过全连 接层FC映射到压缩前的维度:
μi=Wiz+bi,i∈{1,2,3,……,l} (6)
其中
Figure BDA0002998234570000045
是全连接层的权重矩阵,
Figure BDA0002998234570000046
是全连接层的偏 置;
将μ1,μ2,……,μl经过Softmax函数,得到特征映射V1,V2,……,Vl对 应的权重
Figure BDA0002998234570000051
Figure BDA0002998234570000052
其中reshape(·)函数将归一化后形状为C×1的权重变为C×1×1大 小;
将得到的权重与对应的特征映射进行元素乘法操作,得到特征映 射L1,L2,……,Ll
Li=Vi αi,i {1,2,3,……,l} (8)
加权后的特征映射通过简单的拼接,然后经过一个变换矩阵映射 到指定维度,得到最终的多尺度融合特征
Figure BDA0002998234570000053
P=σ(W[L1;L2;……;Ll]+b) (9)
其中σ是激活函数,W,b是变换矩阵和偏置。
进一步的,所述步骤S4具体为:
步骤S41:将多尺度注意力模块计算得到的特征映射P经过拉平 操作变成向量
Figure BDA0002998234570000054
步骤S42:经过一个全连接层,将拉平后的向量映射到指定维度;
步骤S43:最后与尾实体嵌入进行点积得到四元组的得分。
进一步的,所述步骤S43具体为:
MSDCA的得分函数定义为:
F(s,r,o,t)=f(IWfc+bfc)eo (10)
其中f(·)表示激活函数Relu,
Figure BDA0002998234570000061
表示全连接层的变换 矩阵,bfc是偏置,然后利用Sigmoid函数得到候选实体的概率分布:
p(o|s,r,t)=sigmoid(F(s,r,o,t)) (11)
使用交叉熵损失函数训练模型,损失函数定义如下:
Figure BDA0002998234570000062
其中,N是实体个数,G是正确的四元组的集合,G'是通过随机 替换头尾实体得到的不正确的四元组的集合。
本发明与现有技术相比具有以下有益效果:
1、本发明利用LSTM将时间信息融入到模型中,使模型可以建 模动态知识;
2、本发明利用多尺度空洞卷积神经网络获取多尺度信息,不仅 增强了实体、关系和时间三者之间的交互性,帮助模型提取出深层次 语义特征,而且还解决了多尺度卷积神经网络中参数量和计算量过多 的问题,使模型以较少的参数获得了更好的结果。
附图说明
图1是本发明整体框架图;
图2是本发明一实施例中LSTM结构图;
图3是本发明一实施例中关系-时间融合模块;
图4是本发明一实施例中不同空洞率的卷积核;
图5是本发明一实施例中多尺度注意力模块框架图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种基于多尺度空洞卷积的时间知识图 谱补全方法,由四个部分组成:
(1)关系-时间融合模块:对于输入的四元组(s,r,o,t),将r的初始 化特征向量r和时间戳t的时间序列向量(τ12,……,τm)输入到LSTM中, 学习时间感知的关系表示rt,将rt与头实体的向量表示es进行2D重塑, 然后拼接得到矩阵A。
(2)多尺度空洞卷积神经网络模块:将矩阵A输入到多尺度空 洞卷积神经网络中,通过调整卷积核的空洞率获取不同尺度的卷积核, 然后将不同尺度的卷积核作用于输入矩阵A得到多尺度特征映射 V1,V2,V3
(3)多尺度注意力模块:将多尺度特征映射输入到多尺度注意 力模块中,计算不同尺度卷积核提取的特征映射的权重,经过一系列 操作后得到加权后的特征映射P。
(4)输出四元组评分:将得到的带有权重的特征映射P拉平成向 量I,之后经过全连接层将其映射到实体嵌入维度,最后与尾实体矩 阵进行点积并经过Sigmoid函数进行归一化得到四元组的评分。
在本实施例中,给出预设定义:
时间知识图谱G,G={E,R,T,F},其中E是实体的集合,R是关 系的集合,T是时间戳的集合,F为知识的集合。
四元组quaternion,quaternion=(s,r,o,t)表示一个四元组,s表示头 实体,r表示关系,o表示尾实体,t表示时间戳,其中 s,o E,r R,t T。一个四元组也称为一个事实或一个知识。
实体嵌入表示es
Figure BDA0002998234570000081
表示头实体s和尾实体o的嵌入表示。 其中Ne,d分别表示实体数量和嵌入维度。
关系嵌入表示,本实施例关系涉及两种嵌入表示:关系r的结构 嵌入表示
Figure BDA0002998234570000082
关系r融合了时间信息的关系嵌入表示rt,其中Nr表 示关系数量。
在本实施例中,使用LSTM建模时间序列和关系之间的特征表 示
给定四元组(s,r,o,t),时间戳t将根据年月日划分成时间序列。时 间戳t有时间点和时间段两种形式。如果t是一个时间点,如 “2020-12-29”,则t被划分成长度为3的时间序列,即seq={2020,12,29}; 如果时间戳t是一个时间段,如“[2010-05-12,2020-##-##]”,则t被 划分成长度为6的时间序列,即seq={2010,05,12,2020,##,##}。
时间序列的向量表示为
Figure RE-GDA0003128769130000083
其中m表示时 间序列的长度,d是时间序列的嵌入维度。将关系表示和时间序列的 向量表示组合成LSTM的输入序列,即X={r,τ12,…τm}。
将X输入到LSTM中得到融合时间信息的关系表示rt,LSTM结 构图如图2所示,公式为:
Figure BDA0002998234570000091
其中,xn是输入序列X的第n个元素的表示,in,fn,on分别是第 n个元素的输入门,遗忘门,输出门,gn是一个中间变量, Ui、Uf、Uo、Wi、Wf、Wo是变换矩阵,cn和hn分别是第n个元素的单 元表示和隐藏状态表示,c0和h0的值初始化为0。σ是激活函数。我 们将LSTM最后一层的隐藏状态表示作为最终关系的表示,即rt=hm+1
将融合时间信息的关系嵌入rt与头实体嵌入es进行形状变换操 作(reshape)得到他们的2D嵌入表示
Figure BDA0002998234570000092
Figure BDA0002998234570000093
其中 d=d1×d2。最后将
Figure BDA0002998234570000094
Figure BDA0002998234570000095
进行简单的拼接,得到矩阵A,即
Figure BDA0002998234570000096
关系-时间融合模块的框架图如图3所示。
在本实施例中,本实施例使用空洞卷积来获取多尺度信息:
空洞卷积通过设置空洞率(即卷积核中填充的空格数)来增大卷 积核的大小。如图4所示,对于一个2×2的卷积核,(a)是空洞率a=1 的空洞卷积,即标准卷积,标准卷积是空洞卷积的一个特例;(b)是空 洞率a=2的空洞卷积,此时卷积核大小放大为3×3,图中白色部分为 填充的空洞部分,填充内容为0。同理,(c)的卷积核扩大为4×4。定 义空洞卷积的等效卷积核大小k'为:
k'=k+(k-1)×(a-1) 公式(2)
其中k是标准卷积核的大小,a是空洞率。
空洞卷积虽然通过设置空洞率改变了卷积核的大小,但是由于填 充部分数值为0,实际参与计算的仍然是图5中的蓝色部分,因此计 算量和参数量没有增大,但是感受野会随着空洞率的变化而变化,通 过改变空洞率可以获取不同感受野的信息。
给定四元组(s,r,o,t),得到融合了时间信息的矩阵
Figure BDA0002998234570000101
我们通 过对卷积核设置三个不同的空洞率,得到了三个不同尺度的卷积核 ω1,ω2,ω3,每种尺度的卷积核数量为C。定义第i(i=1,2,3)种尺度的 第j(j∈{1,2,3,.....,C})个卷积核
Figure BDA0002998234570000102
产生的特征映射
Figure BDA0002998234570000103
为:
Figure BDA0002998234570000104
其中*表示卷积操作,f(·)是激活函数,如Relu等,bi是偏置。 由此我们得到了输入A经过不同尺度卷积核提取的特征映射
Figure RE-GDA0003128769130000105
在本实施例中,引入注意力机制帮助模型自适应地调整多尺度 特征信息的权重。基于SKNet的多尺度注意力模块框架图如图5所 示;将节得到的特征映射V1,V2,V3输入到多尺度注意力模块中,计 算特征映射V1,V2,V3对应的权重α1,α2,α3,将得到的权重α1,α2,α3与输入的特征映射V1,V2,V3按元素相乘得到特征映射L1,L2,L3,然 后将L1,L2,L3进行拼接并经过一个变换矩阵进行降维操作得到最终 的特征映射P。多尺度注意力模块主要包括两个部分——特征聚合和 特征选择。
优选的,在本实施例中,特征聚合如图5所示,输入有三个分支, 代表三种不同尺度的卷积核提取的特征映射,我们将三个分支上的特 征映射按位相加,得到聚合后的特征映射U,即U=V1 V2 V3。然后 在每一个通道使用全局平均池化Fgap获取全局信息
Figure RE-GDA0003128769130000111
C表示特 征映射的通道个数。q的第c(c∈{1,2,3,.....,C})个元素qc的计算过程表示 为:
Figure RE-GDA0003217461960000112
其中,Uc表示特征映射U的第c个通道的表示。
将获取的全局信息q通过一个全连接层Ffc,得到一个压缩的特 征表示
Figure BDA0002998234570000112
其中C1是压缩后的维度。
z=Ffc(q)=Wc(reshape(q))+bc 公式(5)
其中reshape(·)是形状变换函数,它将q变为C×1大小以便于乘法 操作。
Figure RE-GDA0003128769130000114
分别表示全连接层的权重矩阵和偏置。
优选的的,在本实施例中,特征选择将压缩后的特征表示z经过 全连接层FC映射到压缩前的维度:
μ1=W1z+b1,μ2=W2z+b2,μ3=W3z+b3 公式 (6)
其中W1,W2
Figure BDA0002998234570000114
是全连接层的权重矩阵,b1,b2
Figure BDA0002998234570000115
是 全连接层的偏置。使用两个全连接层对q先降维再升维,可以让模型 更具有非线性,能够更好地拟合不同尺度的卷积核提取的特征映射之 间的复杂关系。此外,与只使用一个全连接层相比,大大地减少了模 型的参数量和计算量。
将μ1,μ2,μ3经过Softmax函数,得到特征映射V1,V2,V3对应的权 重
Figure RE-GDA0003128769130000121
Figure BDA0002998234570000117
其中reshape(·)函数将归一化后形状为C×1的权重变为C×1×1大 小。将得到的权重与对应的特征映射进行元素乘法操作,得到特征映 射L1,L2,L3
Figure BDA0002998234570000121
加权后的特征映射通过简单的拼接,然后经过一个变换矩阵映射 到指定维度,得到最终的多尺度融合特征
Figure BDA0002998234570000122
P=σ(W[L1;L2;L3]+b) 公式(9)
其中σ是激活函数,W,b是变换矩阵和偏置。
在本实施例中,将多尺度注意力模块计算得到的特征映射P经过 拉平操作变成向量
Figure BDA0002998234570000123
然后经过一个全连接层,将拉平后 的向量映射到指定维度。最后与尾实体嵌入进行点积得到四元组的得 分。
优选的,MSDCA的得分函数定义为:
F(s,r,o,t)=f(IWfc+bfc)eo 公式(10)
其中f(·)表示激活函数Relu,
Figure BDA0002998234570000124
表示全连接层的变换矩阵,bfc是偏置,然后利用Sigmoid函数(它将得分映射到0-1区间)得到候 选实体的概率分布:
p(o|s,r,t)=sigmoid(F(s,r,o,t)) 公式(11)
使用交叉熵损失函数训练模型,损失函数定义如下:
Figure BDA0002998234570000125
其中,N是实体个数,G是正确的四元组的集合,G'是通过随机替换 头尾实体得到的不正确的四元组的集合。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所 做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (10)

1.一种基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,包括以下步骤:
步骤S1:对待处理四元组数据进行处理后,使用LSTM建模时间序列和关系之间的特征表示;
步骤S2:根据得到的特征表示,基于多尺度空洞卷积神经网络,获取多尺度特征映射;
步骤S3:引入注意力机制帮助模型自适应地调整多尺度特征映射的权重,并得到加权后的特征映射;
步骤S4:将得到的特征映射经过拉平操作变成向量,然后经过一个全连接层,将拉平后的向量映射到指定维度,最后与尾实体嵌入进行点积得到四元组的得分。
2.根据权利要求1所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述步骤S1具体为:
对于输入的四元组(s,r,o,t),时间戳t将根据年月日划分成时间序列,时间序列的向量表示为
Figure RE-FDA0003269385480000011
其中m表示时间序列的长度,d是时间序列的嵌入维度;
将关系表示和时间序列的向量表示组合成LSTM的输入序列,即X={r,τ12,…τm}
将X输入到LSTM中得到融合时间信息的关系表示rt
将融合时间信息的关系嵌入rt与头实体嵌入es进行形状变换操作得到他们的2D嵌入表示
Figure RE-FDA0003269385480000012
Figure RE-FDA0003269385480000013
其中d=d1×d2
Figure RE-FDA0003269385480000021
Figure RE-FDA0003269385480000022
进行简单的拼接,得到矩阵A,即
Figure RE-FDA0003269385480000023
3.根据权利要求1所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述LSTM具体为:
in=σ(hn-1Ui+xnWi)
fn=σ(hn-1Uf+xnWf)
on=σ(hn-1Uo+xnWo)
gn=tanh(hn-1Ug+xnWg)
Figure FDA0002998234560000021
Figure FDA0002998234560000022
其中,xn是输入序列X的第n个元素的表示,in,fn,on分别是第n个元素的输入门,遗忘门,输出门,gn是一个中间变量,Ui、Uf、Uo、Wi、Wf、Wo是变换矩阵,cn和hn分别是第n个元素的单元表示和隐藏状态表示,c0和h0的值初始化为0;σ是激活函数;将LSTM最后一层的隐藏状态表示作为最终关系的表示,即rt=hm+1
4.根据权利要求1所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述步骤S2具体为:将特征表示A输入到多尺度空洞卷积神经网络中,通过调整卷积核的空洞率获取不同尺度的卷积核,然后将不同尺度的卷积核作用于输入特征表示A得到多尺度特征映射V1,V2,……,Vl
5.根据权利要求1所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述步骤S3具体为:将步骤S2得到的特征映射V1,V2,……,Vl输入到多尺度注意力模块中,计算特征映射V1,V2,……,Vl对应的权重α1,α2,……,αl,将得到的权重α1,α2,……,αl与输入的特征映射V1,V2,……,Vl按元素相乘得到特征映射L1,L2,……,Ll,然后将L1,L2,……,Ll进行拼接并经过一个变换矩阵进行降维操作得到最终的特征映射P。
6.根据权利要求5所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述多尺度注意力模块包括特征聚合子模块和特征选择子模块。
7.根据权利要求6所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述特征聚合子模块输入有l个分支,代表l种不同尺度的卷积核提取的特征映射,将l个分支上的特征映射按位相加,得到聚合后的特征映射U,即U=V1 V2 …… Vl
在每一个通道使用全局平均池化Fgap获取全局信息
Figure RE-FDA0003269385480000031
C表示特征映射的通道个数;q的第c(c∈{1,2,3,.....,C})个元素qc的计算过程表示为:
Figure RE-FDA0003269385480000032
其中,Uc表示特征映射U的第c个通道的表示。
将获取的全局信息q通过一个全连接层Ffc,得到一个压缩的特征表示
Figure RE-FDA0003269385480000033
其中C1是压缩后的维度
z=Ffc(q)=Wc(reshape(q))+bc (5)
其中reshape(·)是形状变换函数,它将q变为C×1大小以便于乘法操作;
Figure RE-FDA0003269385480000034
分别表示全连接层的权重矩阵和偏置。
8.根据权利要求6所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述特征选择子模块将压缩后的特征表示z经过全连接层FC映射到压缩前的维度:
μi=Wiz+bi,i∈{1,2,3,……,l} (6)
其中
Figure RE-FDA0003269385480000041
是全连接层的权重矩阵,
Figure 1
是全连接层的偏置;
将μ1,μ2,……,μl经过Softmax函数,得到特征映射V1,V2,……,Vl对应的权重
Figure RE-FDA0003269385480000043
Figure RE-FDA0003269385480000044
其中reshape(·)函数将归一化后形状为C×1的权重变为C×1×1大小;
将得到的权重与对应的特征映射进行元素乘法操作,得到特征映射L1,L2,……,Ll
Li=Vi αi,i{1,2,3,……,l} (8)
加权后的特征映射通过简单的拼接,然后经过一个变换矩阵映射到指定维度,得到最终的多尺度融合特征
Figure RE-FDA0003269385480000045
P=σ(W[L1;L2;……;Ll]+b) (9)
其中σ是激活函数,W,b是变换矩阵和偏置。
9.根据权利要求1所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述步骤S4具体为:
步骤S41:将多尺度注意力模块计算得到的特征映射P经过拉平操作变成向量
Figure FDA0002998234560000046
步骤S42:经过一个全连接层,将拉平后的向量映射到指定维度;
步骤S43:最后与尾实体嵌入进行点积得到四元组的得分。
10.根据权利要求9所述的基于多尺度空洞卷积的时间知识图谱补全方法,其特征在于,所述步骤S43具体为:
MSDCA的得分函数定义为:
F(s,r,o,t)=f(IWfc+bfc)eo (10)
其中f(·)表示激活函数Relu,
Figure FDA0002998234560000051
表示全连接层的变换矩阵,bfc是偏置,然后利用Sigmoid函数得到候选实体的概率分布:
p(o|s,r,t)=sigmoid(F(s,r,o,t)) (11)
使用交叉熵损失函数训练模型,损失函数定义如下:
Figure FDA0002998234560000052
其中,N是实体个数,G是正确的四元组的集合,G'是通过随机替换头尾实体得到的不正确的四元组的集合。
CN202110337763.5A 2021-03-30 2021-03-30 基于多尺度空洞卷积的时间知识图谱补全方法 Pending CN113553437A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110337763.5A CN113553437A (zh) 2021-03-30 2021-03-30 基于多尺度空洞卷积的时间知识图谱补全方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110337763.5A CN113553437A (zh) 2021-03-30 2021-03-30 基于多尺度空洞卷积的时间知识图谱补全方法

Publications (1)

Publication Number Publication Date
CN113553437A true CN113553437A (zh) 2021-10-26

Family

ID=78101728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110337763.5A Pending CN113553437A (zh) 2021-03-30 2021-03-30 基于多尺度空洞卷积的时间知识图谱补全方法

Country Status (1)

Country Link
CN (1) CN113553437A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618098A (zh) * 2022-09-08 2023-01-17 淮阴工学院 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN115763167A (zh) * 2022-11-22 2023-03-07 黄华集团有限公司 固体柜断路器及其控制方法
CN115775227A (zh) * 2022-10-12 2023-03-10 浙江吉昌新材料有限公司 防裂匣钵的智能化生产方法及其控制***
CN116431836A (zh) * 2023-06-12 2023-07-14 湖北大学 基于多尺度动态卷积网络模型的知识图谱嵌入方法及***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618098A (zh) * 2022-09-08 2023-01-17 淮阴工学院 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN115775227A (zh) * 2022-10-12 2023-03-10 浙江吉昌新材料有限公司 防裂匣钵的智能化生产方法及其控制***
CN115763167A (zh) * 2022-11-22 2023-03-07 黄华集团有限公司 固体柜断路器及其控制方法
CN115763167B (zh) * 2022-11-22 2023-09-22 黄华集团有限公司 固体柜断路器及其控制方法
CN116431836A (zh) * 2023-06-12 2023-07-14 湖北大学 基于多尺度动态卷积网络模型的知识图谱嵌入方法及***

Similar Documents

Publication Publication Date Title
CN113553437A (zh) 基于多尺度空洞卷积的时间知识图谱补全方法
CN110020682B (zh) 一种基于小样本学习的注意力机制关系对比网络模型方法
WO2021244079A1 (zh) 智能家居环境中图像目标检测方法
CN109635917A (zh) 一种多智能体合作决策及训练方法
CN109829541A (zh) 基于学习自动机的深度神经网络增量式训练方法及***
CN110766063B (zh) 基于压缩激励和紧密连接卷积神经网络的图像分类方法
CN107247989A (zh) 一种神经网络训练方法及装置
CN107358293A (zh) 一种神经网络训练方法及装置
CN107977932A (zh) 一种基于可鉴别属性约束生成对抗网络的人脸图像超分辨率重建方法
CN111325579A (zh) 一种广告点击率预测方法
CN112070078B (zh) 基于深度学习的土地利用分类方法及***
CN109817276A (zh) 一种基于深度神经网络的蛋白质二级结构预测方法
CN111291940B (zh) 一种基于Attention深度学习模型的学生辍课预测方法
CN108764303A (zh) 一种基于注意力机制的遥感图像自然语言生成方法
CN112348191A (zh) 一种基于多模态表示学习的知识库补全方法
CN106951960A (zh) 一种神经网络及该神经网络的学习方法
CN110020639A (zh) 视频特征提取方法及相关设备
CN111861046B (zh) 基于大数据和深度学习的专利价值智能评估***
CN113190654A (zh) 一种基于实体联合嵌入和概率模型的知识图谱补全方法
CN112766283B (zh) 一种基于多尺度卷积网络的两相流流型识别方法
CN114896512B (zh) 基于学习者偏好与群体偏好的学习资源推荐方法及***
CN115966010A (zh) 一种基于注意力和多尺度特征融合的表情识别方法
CN112766600A (zh) 一种城市区域人群流量预测方法及***
CN111950195B (zh) 一种基于画像***与深度回归模型的工程进度预测方法
CN113516133A (zh) 一种多模态图像分类方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination