CN109299216A - 一种融合监督信息的跨模态哈希检索方法和*** - Google Patents
一种融合监督信息的跨模态哈希检索方法和*** Download PDFInfo
- Publication number
- CN109299216A CN109299216A CN201811269037.9A CN201811269037A CN109299216A CN 109299216 A CN109299216 A CN 109299216A CN 201811269037 A CN201811269037 A CN 201811269037A CN 109299216 A CN109299216 A CN 109299216A
- Authority
- CN
- China
- Prior art keywords
- network
- hash
- text
- image
- cross
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种融合监督信息的跨模态哈希检索方法和***,所述方法包括:构建图像网络,文本网络和融合网络;获取图像和文本特征训练样本对,分别输入图像网络和文本网络;将图像网络和文本网络的输出特征作为所述融合网络的输入,并定义所述融合网络的输出;根据所述融合网络的输出和对间相似性构建学习统一哈希码的目标函数;求解所述目标函数,得到统一哈希码;将所述统一哈希码作为监督信息,结合语义信息,训练特定模态的哈希网络。本发明基于端到端的深度学习框架同时地学习特征表示和哈希编码,能够更有效地捕获不同模态数据之间的相关性,有助于跨模态检索精度的提高。
Description
技术领域
本公开涉及跨模态检索方法,更具体地说,涉及一种融合监督信息的跨模态哈希检索方法和***。
背景技术
近些年,随着网络上不同类型数据的急剧增长,近似最近邻(ANN)搜索在相关应用中起着越来越重要的作用。例如,信息检索、数据挖掘、计算机视觉等。哈希技术由于其计算成本低和存储效率高,已经成为ANN搜索中最受欢迎的技术之一。哈希的基本思想是通过学习哈希函数将高维的数据映射到紧凑二进制编码的汉明空间,同时尽可能保留原始空间的相似性结构。目前很多应用于单模态场景中的哈希方法已经被提出,然而在现实世界中具有相同语义的数据往往存在多种模态,例如,图像、文本、视频等。为了充分利用异构数据之间的关系,在ANN搜索中发展跨模态哈希(CMH)方法是很有必要的。具体地,在跨模态相似性搜索中,查询数据的模态与被检索数据的模态不同。本公开以图像检文本(I2T)和文本检图像(T2I)任务为例进行分析和实验,同时此方法可以扩展到其他任意模态之间的检索。
现有的跨模态哈希(CMH)方法大多数是基于手动处理的特征,其特征提取和哈希码学习过程是独立进行的。这就可能会限制样本的判别表示,进而损坏学习的哈希码的准确性。最近,基于深度学习的哈希方法提出了一种端到端的学习框架同时学习特征表示和哈希编码,其能够比浅层学习方法更有效地捕获不同模态之间的非线性相关性。作为经典的方法,深度跨模态哈希(DCMH)将传统的深度模型扩展到跨模态检索中,并对每一种模态执行具有深度神经网络的端到端的学习框架。对间关系引导的深度哈希(PRDH)进一步整合多种对间约束,从模态间和模态内增强哈希码的相似性。
在上述提及的深度跨模态哈希框架中,对于来自两个不同模态的成对样本,它们的哈希码通常被强制设置成一样的。并且,这些方法通过每种模态的深度神经网络分别学习单一样本的特征表示,然后最小化不同模态特征之间的损失来建立异构的关系。这样就存在以下弊端:仅通过简单地对不同模态的神经网络的最后一层施加约束,不能够充分挖掘多模态数据间的复杂关系。
发明内容
为克服上述现有技术的不足,本公开提供了一种融合监督信息的跨模态哈希检索方法和***,所述方法基于端到端的深度学习框架同时地学习特征表示和哈希编码,能够比传统学习方法更有效地捕获不同模态数据之间的相关性,有助于跨模态检索精度的提高。
为实现上述目的,本公开的一个或多个实施例提供了如下技术方案:
一种融合监督信息的跨模态哈希检索方法,包括以下步骤:
构建图像网络,文本网络和融合网络;
获取图像和文本特征训练样本对,分别输入图像网络和文本网络;
将图像网络和文本网络的输出特征作为所述融合网络的输入,并定义所述融合网络的输出;
根据所述融合网络的输出和对间相似性构建学习统一哈希码的目标函数;
求解所述目标函数,得到统一哈希码;
将所述统一哈希码作为监督信息,结合语义信息,训练特定模态的哈希网络。
进一步地,所述图像网络包括5个卷积层和3个全连接层;文本网络包括两个全连接层;融合网络包括两个全连接层;其中,所述图像网络和文本网络最后一层的隐藏单元个数相等,融合网络的第二层为哈希层,并且其激活函数为判别函数。
进一步地,将所述图像网络和文本网络的输出特征通过非线性激活函数,得到所述融合网络的输入。
进一步地,所述学习统一哈希码的目标函数为:
其中,第一项是对间嵌入约束项,并且 其中H*i、H*j分别表示不同训练样本对的融合网络输出,S={sij}表示对间相似性矩阵,B∈{-1,1}k×n表示统一的哈希码矩阵,p(sij|B)表示给定哈希码B时,sij的条件概率分布,λ表示超参;第二项最小化融合网络的输出和二进制码之间的损失,H=h(Z;θz)∈Rk ×n为融合网络的输出;第三项是平衡约束项,用来最大化每一位哈希码的信息,η表示超参,表示F范数。
进一步地,求解所述目标函数包括:
初始化图像、文本和融合网络参数θ={θv,θt,θz},和批量大小;
固定网络参数θ={θv,θt,θz},更新统一的哈希码B;
然后固定B,利用小批量随机梯度下降法更新参数θ={θv,θt,θz};
不断交替更新,直至收敛。
进一步地,所述特定模态的哈希网络中,图像网络包括5个卷积层、2个全连接层和1个哈希层,文本网络包括1个全连接层和1个哈希层;其中,所述图像网络和文本网络中的哈希层的激活函数为判别函数。
进一步地,所述训练特定模态的哈希网络包括:求解总体目标函数,得到图像网络和文本网络的参数;所述目标函数为:
其中,α、β、γ分别表示超参;J1是模态间成对嵌入约束,其中F*i=f(vi;θv)表示从图像网络输出的第i个样本的特征表示,G*j=g(tj;θj)表示从文本网络输出的第j个样本的特征表示;J2使用第一阶段得到的统一哈希码作为监督信息,训练特定模态的哈希网络,B∈{-1,1}k×n表示统一的哈希码矩阵,F表示图片特征输出,G表示文本特征输出;J3将标签信息线性地映射到特定模态的网络,和分别表示图像和文本模态的映射矩阵,Y表示语义矩阵;J4是平衡约束,用来最大化每一位的信息。
进一步地,求解所述总体目标函数包括:
初始化图像网络参数θv、文本网络参数θt和批量大小;
固定参数θv和θt,求解目标函数更新W1和W2;
然后固定W1和W2,利用小批量随机梯度下降法分别更新图像参数θv和文本参数θt;
不断交替更新,直至收敛。
一个或多个实施例提供了一种计算机***,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的融合监督信息的跨模态哈希检索方法。
一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的融合监督信息的跨模态哈希检索方法。
上述技术方案中的一个或多个具有以下有益效果:
1、传统的跨模态哈希方法,其特征提取和哈希编码的学习过程是相互独立的,本公开基于端到端的深度学习框架,同时学习特征表示和哈希编码,能够更有效地捕获不同模态数据之间的相关性。
2、本公开将不同模态的特征成对地输入到融合网络,通过非线性的转换来探索多模态数据之间的相关性,并获得高质量的哈希码来监督特定模态的哈希网络的训练;利用迭代更新的策略求解优化问题,并在优化过程中保持哈希码的离散特性而没有对其进行松弛,这样就减少了量化误差;对间相似性信息和分类信息在同一流形框架下被嵌入到哈希网络,很好地保持了模态间的相似性和语义一致性。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为实施例一中融合监督信息的跨模态哈希检索方法的流程框图;
图2为实施例一中融合监督信息的跨模态哈希检索方法的流程示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本实施例公开了一种融合监督信息的跨模态哈希检索方法,如图1-2所示,包括以下步骤:
第一阶段:统一哈希码学习
步骤1:构建三个网络:图像网络,文本网络和融合网络。(1)图像网络使用的CNN-F网络。原始的CNN-F模型共有8层,包括5个卷积层和3个全连接层。(2)对于文本模态,首先将每一个文本样本表示成bag-of-word(BOW)向量,然后将BOW向量输入到具有两个全连接层的文本网络。特别地,图像和文本网络最后一层的隐藏单元个数相等,且根据不同的编码长度和数据集设置不同的值。(3)融合网络由两个全连接层组成,其成对地结合了图像和文本网络的输出。为了获得统一的哈希码,融合网路的第二层设计为具有k个隐藏单元的哈希层,并且其激活函数为判别函数。
步骤2:给定数据集n代表训练样本对的总数,vi表示图片特征,ti表示文本特征,yi表示语义标记向量。此外,S={sij}表示对间相似性矩阵。本阶段的目标是为每一个样例学习紧凑的二进制码bi∈{-1,1}k,B∈{-1,1}k×n表示统一的哈希码矩阵。
步骤3:表示从图像网络输出的特征表示,表示从文本网络输出的特征表示。通过非线性激活函数(tanh函数)结合以上两种模态的输出,得到融合网络的输入。进一步,定义融合网络的输出H=h(Z;θz)∈Rk×n。为学习统一的哈希码,构建目标函数:
其中,第一项是对间嵌入约束项并且 其中H*i、H*j分别表示不同训练样本对的融合网络输出。S={sij}表示对间相似性矩阵,B∈{-1,1}k×n表示统一的哈希码矩阵,p(sij|B)表示给定哈希码B时,sij的条件概率分布。通过最小化第一项中的负对数似然函数来保持矩阵S中的相似性,即,使得两个相似样本之间的相似性(内积)尽可能的大,而不相似样本之间的相似性(内积)尽可能的小。第二项最小化融合网络的输出和二进制码之间的损失,这样使得学***衡约束项,用来最大化每一位哈希码的信息,即要求每一位有均等的机会为1或-1。,λ表示超参(且λ>0),η表示超参(且η>0),表示F范数。
步骤4:对于公式(1)的优化问题,使用迭代更新策略进行求解。通过固定网络参数θ={θv,θt,θz}学习统一的哈希码B,然后固定B,利用小批量随机梯度下降法(SGD)更新参数θ={θv,θt,θz},经过不断交替更新,直至收敛,求得最优的统一哈希码B。具体地,包括以下步骤:
初始化图像、文本和融合网络参数θ={θv,θt,θz},和批量大小;
固定网络参数θ={θv,θt,θz},根据以下公式更新统一的哈希码B;
B=sign(λH)
然后固定B,利用小批量随机梯度下降法更新参数θ={θv,θt,θz},如下计算其梯度;
不断交替更新,直至收敛。
第二阶段:特定模态哈希网络训练
步骤1:重新设计图像网络和文本网络,用于训练特定模态的哈希网络。除了将图像和文本网络的最后一个全连接层替换为哈希层(具有k个隐藏单元)并且将判别函数作为其激活函数,其他层的设置和上一阶段完全相同。
步骤2:在这一阶段,主要训练图像网络f(V;θv)和文本网络g(T;θt)以获得对应的哈希函数hv(·)和ht(·)来编码训练数据外的样本。
步骤3:定义总体目标函数:
其中,J1是模态间成对嵌入约束,用来保持图像和文本网络的输出之间的跨模态相似性;J2使用第一阶段得到的统一哈希码作为监督信息,训练特定模态的哈希网络;J3直接将标签信息线性地映射到特定模态的网络,以充分挖掘语义信息。J4是平衡约束,用来最大化每一位的信息。它们的具体定义如下:
其中,α、β、γ分别表示超参;J1是模态间成对嵌入约束,其中F*i=f(vi;θv)表示从图像网络输出的第i个样本的特征表示,G*j=g(tj;θj)表示从文本网络输出的第j个样本的特征表示;J2使用第一阶段得到的统一哈希码作为监督信息,训练特定模态的哈希网络,B∈{-1,1}k×n表示统一的哈希码矩阵,F表示图片特征输出,G表示文本特征输出;J3将标签信息线性地映射到特定模态的网络,和分别表示图像和文本模态的映射矩阵,Y表示语义矩阵;J4是平衡约束,用来最大化每一位的信息。
步骤4:对于公式(2)的优化问题,同样地使用迭代更新策略进行求解:通过固定其他参数,更新其中的某一个参数。特别地,利用小批量随机梯度下降,并通过反向传播(BP)算法来更新参数θv和θt。具体地,包括以下步骤:
初始化图像网络参数θv、文本网络参数θt和批量大小;
固定参数θv和θt,求解目标函数并根据如下公式分别更新W1和W2;
然后固定W1和W2,利用小批量随机梯度下降法分别更新图像参数θv和文本参数θt,如下计算其梯度;
不断交替更新,直至收敛。
我们分别在MIRFLICKR-25K和NUS-WIDE两个数据集上进行实验。
MIRFLICKR-25K数据集包含从Flickr网站上搜集的25,000个样例,每一个样例包含一个图片和一些文本标签。并且总共给定24个标签,每一个样例被其中的至少标签一个标注。我们选择至少有20个标签标注的样例用于实验,共包含20,015个图像-文本对。其中,文本模态被表示为1386维的BoW向量,而对于图像模态直接使用原始像素作为输入。在实验中,我们随机取2,000样例作为查询,其余作为被检索的数据库。为了减少计算成本,我们从数据库中取5,000个样例用于训练。
NUS-WIDE,是一个真实网页的图片数据库包含269,648个样例,它们被81个主题标签标注。每一各样例包含一个图片和与其关联的文本标签。在实验中,我们选取最大的10个类构成一个子集,共包含186,577个图像-文本对。对于每一个样例,文本模态被表示成1,000维的BoW向量,图像模态直接使用原始像素作为输入。在此数据集上,我们随机采样2,000各样例作为查询,其余的作为数据库。同样地,随机从数据库中取5,000个数据点用于训练。
本实施例在MatConvNet框架下进行实施。对于图像网络,我们使用在ImageNet数据集上预训练的CNN-F网络进行初始化。对于其它深度神经网络的参数,我们随机进行初始化。此外,对于具有两个全连接层的文本网络,在MIRFLICKR-25K数据集上我们设置其维度是[8192→2500];而在NUS-WIDE数据集上,当编码长度为16和32位时,其维度设置为[8192→1000],当编码长度为64位时,设置为[8192→600]。对于成对地结合了图像和文本网络输出的融合网络,在所有的数据集上我们设置其全连接层的维度都为[4096→k]。在实验中,所有参数经验地取值为1,学习率从10-1.5到10-3变化,算法中的外层循环迭代次数设置为500次。算法实现过程如下。
第1阶段:统一哈希码学习
输入:图片集V和文本集T;对间相似性矩阵S;参数γ,β,α;编码长度k
输出:统一的哈希矩阵B
初始化:初始化图像、文本和融合网络参数θ={θv,θt,θz},批量大小Nv=Nt=128,
循环次数
循环执行下列语句
1.固定参数θ={θv,θt,θz},根据公式B=sign(λH)更新B
2.for iter=1,2,...tz{
①随机从V和T中分别采样Nv和Nt个数据点构建小批量
②对于小批量中成对的样本vi和ti,通过前向传播分别计算 和h(zi;θz)
③计算顶层的梯度,根据下面的公式:
④对图像、文本和融合网络进行反向传播,更新参数θ={θv,θt,θz}}
直至收敛
第2阶段:特定模态哈希网络训练
输入:图片集V和文本集T;对间相似性矩阵S;标记矩阵Y;学习的哈希矩阵B;
参数γ,β,α;编码长度k
输出:特定模态的哈希网络参数θv和θt
初始化:初始化图像、文本网络参数θv和θt,批量大小Nv=Nt=128,循环次数
循环执行下列语句
1.固定参数θv和θt,根据公式更新W1,根据公式更新W2
2.for iter=1,2,...tv{
①随机从V中采样Nv个数据点构建小批量
②对于每一个样本vi,通过前向传播计算f(vi;θv)
③反向传播下面公式中的导数,更新参数θv
3.for iter=1,2,...tt{
①随机从T中采样Nt个数据点构建小批量
②对于每一个样本vt,通过前向传播计算g(ti;θt)
③反向传播下面公式中的导数,更新参数θt
直至收敛
在两个数据集上进行实验,并对比了当前比较流行的其他6种方法(LSSH,CMFH,DCH,SCM,SePHkm,DCMH)。为了保证比较的公平性,我们从本方法中图像网络的第7层提取CNN特征用于浅层的对比方法。从表1-2可以看出:本实施例提供的方法在不同数据集上都表现出优于其他方法的检索性能。
表1
表2
实施例二
本实施例的目的是提供一种计算装置。
一种计算机***,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:
构建图像网络,文本网络和融合网络;
获取图像和文本特征训练样本对,分别输入图像网络和文本网络;
将图像网络和文本网络的输出特征作为所述融合网络的输入,并定义所述融合网络的输出;
根据所述融合网络的输出和对间相似性构建学习统一哈希码的目标函数;
求解所述目标函数,得到统一哈希码;
将所述统一哈希码作为监督信息,结合语义信息,训练特定模态的哈希网络。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
构建图像网络,文本网络和融合网络;
获取图像和文本特征训练样本对,分别输入图像网络和文本网络;
将图像网络和文本网络的输出特征作为所述融合网络的输入,并定义所述融合网络的输出;
根据所述融合网络的输出和对间相似性构建学习统一哈希码的目标函数;
求解所述目标函数,得到统一哈希码;
将所述统一哈希码作为监督信息,结合语义信息,训练特定模态的哈希网络。
以上实施例二和三中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本公开中的任一方法。
以上一个或多个实施例具有以下有益效果:
1、传统的跨模态哈希方法,其特征提取和哈希编码的学习过程是相互独立的,本公开基于端到端的深度学习框架,同时学习特征表示和哈希编码,能够更有效地捕获不同模态数据之间的相关性。
2、本公开将不同模态的特征成对地输入到融合网络,通过非线性的转换来探索多模态数据之间的相关性,并获得高质量的哈希码来监督特定模态的哈希网络的训练;利用迭代更新的策略求解优化问题,并在优化过程中保持哈希码的离散特性而没有对其进行松弛,这样就减少了量化误差;对间相似性信息和分类信息在同一流形框架下被嵌入到哈希网络,很好地保持了模态间的相似性和语义一致性。
本领域技术人员应该明白,上述本申请的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本申请不限制于任何特定的硬件和软件的结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述虽然结合附图对本申请的具体实施方式进行了描述,但并非对本申请保护范围的限制,所属领域技术人员应该明白,在本申请的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本申请的保护范围以内。
Claims (10)
1.一种融合监督信息的跨模态哈希检索方法,其特征在于,包括以下步骤:
构建图像网络,文本网络和融合网络;
获取图像和文本特征训练样本对,分别输入图像网络和文本网络;
将图像网络和文本网络的输出特征作为所述融合网络的输入,并定义所述融合网络的输出;
根据所述融合网络的输出和对间相似性构建学习统一哈希码的目标函数;
求解所述目标函数,得到统一哈希码;
将所述统一哈希码作为监督信息,结合语义信息,训练特定模态的哈希网络。
2.如权利要求1所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,所述图像网络包括5个卷积层和3个全连接层;文本网络包括两个全连接层;融合网络包括两个全连接层;其中,所述图像网络和文本网络最后一层的隐藏单元个数相等,融合网络的第二层为哈希层,并且其激活函数为判别函数。
3.如权利要求1所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,将所述图像网络和文本网络的输出特征通过非线性激活函数,得到所述融合网络的输入。
4.如权利要求3所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,所述学习统一哈希码的目标函数为:
其中,第一项是对间嵌入约束项,并且
其中H*i、H*j分别表示不同训练样本对的融合网络输出,S={sij}表示对间相似性矩阵,B∈{-1,1}k×n表示统一的哈希码矩阵,p(sij|B)表示给定哈希码B时,sij的条件概率分布,λ表示超参;第二项最小化融合网络的输出和二进制码之间的损失,H=h(Z;θz)∈Rk×n为融合网络的输出;第三项是平衡约束项,用来最大化每一位哈希码的信息,η表示超参,表示F范数。
5.如权利要求1所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,求解所述目标函数包括:
初始化图像、文本和融合网络参数θ={θv,θt,θz},和批量大小;
固定网络参数θ={θv,θt,θz},更新统一的哈希码B;
然后固定B,利用小批量随机梯度下降法更新参数θ={θv,θt,θz};
不断交替更新,直至收敛。
6.如权利要求1所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,所述特定模态的哈希网络中,图像网络包括5个卷积层、2个全连接层和1个哈希层,文本网络包括1个全连接层和1个哈希层;其中,所述图像网络和文本网络中的哈希层的激活函数为判别函数。
7.如权利要求1所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,所述训练特定模态的哈希网络包括:求解总体目标函数,得到图像网络和文本网络的参数;所述目标函数为:
其中,α、β、γ分别表示超参;J1是模态间成对嵌入约束,,其中F*i=f(vi;θv)表示从图像网络输出的第i个样本的特征表示,G*j=g(tj;θj)表示从文本网络输出的第j个样本的特征表示;J2使用第一阶段得到的统一哈希码作为监督信息,训练特定模态的哈希网络,B∈{-1,1}k×n表示统一的哈希码矩阵,F表示图片特征输出,G表示文本特征输出;J3将标签信息线性地映射到特定模态的网络,和分别表示图像和文本模态的映射矩阵,Y表示语义矩阵;J4是平衡约束,用来最大化每一位的信息。
8.如权利要求7所述的一种融合监督信息的跨模态哈希检索方法,其特征在于,求解所述总体目标函数包括:
初始化图像网络参数θv、文本网络参数θt和批量大小;
固定参数θv和θt,求解目标函数获取W1和W2;
然后固定W1和W2,利用小批量随机梯度下降法更新网络参数;
不断交替更新,直至收敛。
9.一种计算机***,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8任一项所述的融合监督信息的跨模态哈希检索方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8任一项所述的融合监督信息的跨模态哈希检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811269037.9A CN109299216B (zh) | 2018-10-29 | 2018-10-29 | 一种融合监督信息的跨模态哈希检索方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811269037.9A CN109299216B (zh) | 2018-10-29 | 2018-10-29 | 一种融合监督信息的跨模态哈希检索方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109299216A true CN109299216A (zh) | 2019-02-01 |
CN109299216B CN109299216B (zh) | 2019-07-23 |
Family
ID=65158169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811269037.9A Expired - Fee Related CN109299216B (zh) | 2018-10-29 | 2018-10-29 | 一种融合监督信息的跨模态哈希检索方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109299216B (zh) |
Cited By (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109960732A (zh) * | 2019-03-29 | 2019-07-02 | 广东石油化工学院 | 一种基于鲁棒监督的深度离散哈希跨模态检索方法及*** |
CN110059154A (zh) * | 2019-04-10 | 2019-07-26 | 山东师范大学 | 一种基于继承映射的跨模态迁移哈希检索方法 |
CN110059198A (zh) * | 2019-04-08 | 2019-07-26 | 浙江大学 | 一种基于相似性保持的跨模态数据的离散哈希检索方法 |
CN110083532A (zh) * | 2019-04-12 | 2019-08-02 | 北京中科寒武纪科技有限公司 | 基于深度学习框架的融合模式下运行错误定位方法及装置 |
CN110188223A (zh) * | 2019-06-06 | 2019-08-30 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置及计算机设备 |
CN110188209A (zh) * | 2019-05-13 | 2019-08-30 | 山东大学 | 基于层次标签的跨模态哈希模型构建方法、搜索方法及装置 |
CN110222140A (zh) * | 2019-04-22 | 2019-09-10 | 中国科学院信息工程研究所 | 一种基于对抗学习和非对称哈希的跨模态检索方法 |
CN110298395A (zh) * | 2019-06-18 | 2019-10-01 | 天津大学 | 一种基于三模态对抗网络的图文匹配方法 |
CN110597878A (zh) * | 2019-09-16 | 2019-12-20 | 广东工业大学 | 一种多模态数据的跨模态检索方法、装置、设备及介质 |
CN110647804A (zh) * | 2019-08-09 | 2020-01-03 | 中国传媒大学 | 一种暴力视频识别方法、计算机***和存储介质 |
CN110750660A (zh) * | 2019-10-08 | 2020-02-04 | 西北工业大学 | 一种半配对多模态数据哈希编码方法 |
CN110765281A (zh) * | 2019-11-04 | 2020-02-07 | 山东浪潮人工智能研究院有限公司 | 一种多语义深度监督跨模态哈希检索方法 |
CN111127385A (zh) * | 2019-06-06 | 2020-05-08 | 昆明理工大学 | 基于生成式对抗网络的医学信息跨模态哈希编码学习方法 |
CN111241310A (zh) * | 2020-01-10 | 2020-06-05 | 济南浪潮高新科技投资发展有限公司 | 一种深度跨模态哈希检索方法、设备及介质 |
CN111353076A (zh) * | 2020-02-21 | 2020-06-30 | 华为技术有限公司 | 训练跨模态检索模型的方法、跨模态检索的方法和相关装置 |
CN111460201A (zh) * | 2020-03-04 | 2020-07-28 | 南京邮电大学 | 一种基于生成性对抗网络的模态一致性跨模态检索方法 |
CN111599438A (zh) * | 2020-04-02 | 2020-08-28 | 浙江工业大学 | 一种基于多模态数据的面向糖尿病患者的实时饮食健康监控方法 |
CN111753190A (zh) * | 2020-05-29 | 2020-10-09 | 中山大学 | 一种基于元学习的无监督跨模态哈希检索方法 |
CN111782921A (zh) * | 2020-03-25 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | 检索目标的方法和装置 |
CN111914950A (zh) * | 2020-08-20 | 2020-11-10 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 基于深度对偶变分哈希的无监督跨模态检索模型训练方法 |
CN111914156A (zh) * | 2020-08-14 | 2020-11-10 | 中国科学院自动化研究所 | 自适应标签感知的图卷积网络跨模态检索方法、*** |
CN112559820A (zh) * | 2020-12-17 | 2021-03-26 | 中国科学院空天信息创新研究院 | 基于深度学习的样本数据集智能出题方法、装置及设备 |
CN112667841A (zh) * | 2020-12-28 | 2021-04-16 | 山东建筑大学 | 一种弱监督的深度上下文感知图像表征方法及*** |
CN112765316A (zh) * | 2021-01-19 | 2021-05-07 | 东南大学 | 一种引入胶囊网络的文本生成图像方法及装置 |
CN112817604A (zh) * | 2021-02-18 | 2021-05-18 | 北京邮电大学 | 安卓***控件意图识别方法、装置、电子设备及存储介质 |
CN112989097A (zh) * | 2021-03-23 | 2021-06-18 | 北京百度网讯科技有限公司 | 模型训练、图片检索方法及装置 |
CN113064959A (zh) * | 2020-01-02 | 2021-07-02 | 南京邮电大学 | 一种基于深度自监督排序哈希的跨模态检索方法 |
CN113095415A (zh) * | 2021-04-15 | 2021-07-09 | 齐鲁工业大学 | 一种基于多模态注意力机制的跨模态哈希方法及*** |
CN113157739A (zh) * | 2021-04-23 | 2021-07-23 | 平安科技(深圳)有限公司 | 跨模态检索方法、装置、电子设备及存储介质 |
CN113270199A (zh) * | 2021-04-30 | 2021-08-17 | 贵州师范大学 | 医学跨模态多尺度融合类别指导哈希方法及其*** |
CN113449849A (zh) * | 2021-06-29 | 2021-09-28 | 桂林电子科技大学 | 基于自编码器的学习型文本哈希方法 |
CN113763441A (zh) * | 2021-08-25 | 2021-12-07 | 中国科学院苏州生物医学工程技术研究所 | 无监督学习的医学图像配准方法及*** |
CN114329109A (zh) * | 2022-03-15 | 2022-04-12 | 山东建筑大学 | 基于弱监督哈希学习的多模态检索方法及*** |
CN114942984A (zh) * | 2022-05-26 | 2022-08-26 | 北京百度网讯科技有限公司 | 视觉场景文本融合模型的预训练和图文检索方法及装置 |
CN115687571A (zh) * | 2022-10-28 | 2023-02-03 | 重庆师范大学 | 一种基于模态融合重建哈希的深度无监督跨模态检索方法 |
CN115840827A (zh) * | 2022-11-07 | 2023-03-24 | 重庆师范大学 | 一种深度无监督跨模态哈希检索方法 |
CN115880556A (zh) * | 2023-02-21 | 2023-03-31 | 北京理工大学 | 一种多模态数据融合处理方法、装置、设备及存储介质 |
CN115982403A (zh) * | 2023-01-12 | 2023-04-18 | 之江实验室 | 一种多模态哈希检索方法及装置 |
CN116049459A (zh) * | 2023-03-30 | 2023-05-02 | 浪潮电子信息产业股份有限公司 | 跨模态互检索的方法、装置、服务器及存储介质 |
CN116244484A (zh) * | 2023-05-11 | 2023-06-09 | 山东大学 | 一种面向不平衡数据的联邦跨模态检索方法及*** |
CN116431847A (zh) * | 2023-06-14 | 2023-07-14 | 北京邮电大学 | 基于多重对比和双路对抗的跨模态哈希检索方法及设备 |
CN116594994A (zh) * | 2023-03-30 | 2023-08-15 | 重庆师范大学 | 视觉语言知识蒸馏在跨模态哈希检索的应用 |
CN116825210A (zh) * | 2023-08-28 | 2023-09-29 | 山东大学 | 基于多源生物数据的哈希检索方法、***、设备和介质 |
CN117992805A (zh) * | 2024-04-07 | 2024-05-07 | 武汉商学院 | 基于张量积图融合扩散的零样本跨模态检索方法、*** |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120170722A1 (en) * | 2007-04-03 | 2012-07-05 | Microsoft Corporation | Communications Using Different Modalities |
CN104317837A (zh) * | 2014-10-10 | 2015-01-28 | 浙江大学 | 一种基于主题模型的跨模态检索方法 |
CN104899253A (zh) * | 2015-05-13 | 2015-09-09 | 复旦大学 | 面向社会图像的跨模态图像-标签相关度学习方法 |
JP2017021613A (ja) * | 2015-07-13 | 2017-01-26 | 国立大学法人 筑波大学 | クロスモーダル感覚分析システム、提示情報決定システム、情報提示システム、クロスモーダル感覚分析プログラム、提示情報決定プログラムおよび情報提示プログラム |
CN107256271A (zh) * | 2017-06-27 | 2017-10-17 | 鲁东大学 | 基于映射字典学习的跨模态哈希检索方法 |
CN107273505A (zh) * | 2017-06-20 | 2017-10-20 | 西安电子科技大学 | 基于非参数贝叶斯模型的监督跨模态哈希检索方法 |
CN107402993A (zh) * | 2017-07-17 | 2017-11-28 | 山东师范大学 | 基于判别性关联最大化哈希的跨模态检索方法 |
CN107871014A (zh) * | 2017-11-23 | 2018-04-03 | 清华大学 | 一种基于深度融合哈希的大数据跨模态检索方法及*** |
-
2018
- 2018-10-29 CN CN201811269037.9A patent/CN109299216B/zh not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120170722A1 (en) * | 2007-04-03 | 2012-07-05 | Microsoft Corporation | Communications Using Different Modalities |
CN104317837A (zh) * | 2014-10-10 | 2015-01-28 | 浙江大学 | 一种基于主题模型的跨模态检索方法 |
CN104899253A (zh) * | 2015-05-13 | 2015-09-09 | 复旦大学 | 面向社会图像的跨模态图像-标签相关度学习方法 |
JP2017021613A (ja) * | 2015-07-13 | 2017-01-26 | 国立大学法人 筑波大学 | クロスモーダル感覚分析システム、提示情報決定システム、情報提示システム、クロスモーダル感覚分析プログラム、提示情報決定プログラムおよび情報提示プログラム |
CN107273505A (zh) * | 2017-06-20 | 2017-10-20 | 西安电子科技大学 | 基于非参数贝叶斯模型的监督跨模态哈希检索方法 |
CN107256271A (zh) * | 2017-06-27 | 2017-10-17 | 鲁东大学 | 基于映射字典学习的跨模态哈希检索方法 |
CN107402993A (zh) * | 2017-07-17 | 2017-11-28 | 山东师范大学 | 基于判别性关联最大化哈希的跨模态检索方法 |
CN107871014A (zh) * | 2017-11-23 | 2018-04-03 | 清华大学 | 一种基于深度融合哈希的大数据跨模态检索方法及*** |
Non-Patent Citations (2)
Title |
---|
樊花: "基于哈希方法的跨模态检索研究进展", 《数据通信》 * |
马德魁: "基于跨模态哈希的图文检索研究", 《中国优秀硕士虚伪论文全文数据库信息科技辑》 * |
Cited By (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109960732A (zh) * | 2019-03-29 | 2019-07-02 | 广东石油化工学院 | 一种基于鲁棒监督的深度离散哈希跨模态检索方法及*** |
CN110059198B (zh) * | 2019-04-08 | 2021-04-13 | 浙江大学 | 一种基于相似性保持的跨模态数据的离散哈希检索方法 |
CN110059198A (zh) * | 2019-04-08 | 2019-07-26 | 浙江大学 | 一种基于相似性保持的跨模态数据的离散哈希检索方法 |
CN110059154A (zh) * | 2019-04-10 | 2019-07-26 | 山东师范大学 | 一种基于继承映射的跨模态迁移哈希检索方法 |
CN110059154B (zh) * | 2019-04-10 | 2022-04-15 | 山东师范大学 | 一种基于继承映射的跨模态迁移哈希检索方法 |
CN110083532A (zh) * | 2019-04-12 | 2019-08-02 | 北京中科寒武纪科技有限公司 | 基于深度学习框架的融合模式下运行错误定位方法及装置 |
CN110083532B (zh) * | 2019-04-12 | 2023-05-23 | 中科寒武纪科技股份有限公司 | 基于深度学习框架的融合模式下运行错误定位方法及装置 |
CN110222140A (zh) * | 2019-04-22 | 2019-09-10 | 中国科学院信息工程研究所 | 一种基于对抗学习和非对称哈希的跨模态检索方法 |
CN110222140B (zh) * | 2019-04-22 | 2021-07-13 | 中国科学院信息工程研究所 | 一种基于对抗学习和非对称哈希的跨模态检索方法 |
CN110188209A (zh) * | 2019-05-13 | 2019-08-30 | 山东大学 | 基于层次标签的跨模态哈希模型构建方法、搜索方法及装置 |
CN110188209B (zh) * | 2019-05-13 | 2021-06-04 | 山东大学 | 基于层次标签的跨模态哈希模型构建方法、搜索方法及装置 |
CN111127385A (zh) * | 2019-06-06 | 2020-05-08 | 昆明理工大学 | 基于生成式对抗网络的医学信息跨模态哈希编码学习方法 |
CN110188223B (zh) * | 2019-06-06 | 2022-10-04 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置及计算机设备 |
CN111127385B (zh) * | 2019-06-06 | 2023-01-13 | 昆明理工大学 | 基于生成式对抗网络的医学信息跨模态哈希编码学习方法 |
CN110188223A (zh) * | 2019-06-06 | 2019-08-30 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置及计算机设备 |
CN110298395B (zh) * | 2019-06-18 | 2023-04-18 | 天津大学 | 一种基于三模态对抗网络的图文匹配方法 |
CN110298395A (zh) * | 2019-06-18 | 2019-10-01 | 天津大学 | 一种基于三模态对抗网络的图文匹配方法 |
CN110647804A (zh) * | 2019-08-09 | 2020-01-03 | 中国传媒大学 | 一种暴力视频识别方法、计算机***和存储介质 |
CN110597878A (zh) * | 2019-09-16 | 2019-12-20 | 广东工业大学 | 一种多模态数据的跨模态检索方法、装置、设备及介质 |
CN110597878B (zh) * | 2019-09-16 | 2023-09-15 | 广东工业大学 | 一种多模态数据的跨模态检索方法、装置、设备及介质 |
CN110750660B (zh) * | 2019-10-08 | 2023-03-10 | 西北工业大学 | 一种半配对多模态数据哈希编码方法 |
CN110750660A (zh) * | 2019-10-08 | 2020-02-04 | 西北工业大学 | 一种半配对多模态数据哈希编码方法 |
CN110765281A (zh) * | 2019-11-04 | 2020-02-07 | 山东浪潮人工智能研究院有限公司 | 一种多语义深度监督跨模态哈希检索方法 |
CN113064959A (zh) * | 2020-01-02 | 2021-07-02 | 南京邮电大学 | 一种基于深度自监督排序哈希的跨模态检索方法 |
CN113064959B (zh) * | 2020-01-02 | 2022-09-23 | 南京邮电大学 | 一种基于深度自监督排序哈希的跨模态检索方法 |
CN111241310A (zh) * | 2020-01-10 | 2020-06-05 | 济南浪潮高新科技投资发展有限公司 | 一种深度跨模态哈希检索方法、设备及介质 |
CN111353076B (zh) * | 2020-02-21 | 2023-10-10 | 华为云计算技术有限公司 | 训练跨模态检索模型的方法、跨模态检索的方法和相关装置 |
CN111353076A (zh) * | 2020-02-21 | 2020-06-30 | 华为技术有限公司 | 训练跨模态检索模型的方法、跨模态检索的方法和相关装置 |
CN111460201A (zh) * | 2020-03-04 | 2020-07-28 | 南京邮电大学 | 一种基于生成性对抗网络的模态一致性跨模态检索方法 |
CN111460201B (zh) * | 2020-03-04 | 2022-09-23 | 南京邮电大学 | 一种基于生成性对抗网络的模态一致性跨模态检索方法 |
CN111782921A (zh) * | 2020-03-25 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | 检索目标的方法和装置 |
CN111599438B (zh) * | 2020-04-02 | 2023-07-28 | 浙江工业大学 | 一种基于多模态数据的面向糖尿病患者的实时饮食健康监控方法 |
CN111599438A (zh) * | 2020-04-02 | 2020-08-28 | 浙江工业大学 | 一种基于多模态数据的面向糖尿病患者的实时饮食健康监控方法 |
CN111753190A (zh) * | 2020-05-29 | 2020-10-09 | 中山大学 | 一种基于元学习的无监督跨模态哈希检索方法 |
CN111914156B (zh) * | 2020-08-14 | 2023-01-20 | 中国科学院自动化研究所 | 自适应标签感知的图卷积网络跨模态检索方法、*** |
CN111914156A (zh) * | 2020-08-14 | 2020-11-10 | 中国科学院自动化研究所 | 自适应标签感知的图卷积网络跨模态检索方法、*** |
CN111914950A (zh) * | 2020-08-20 | 2020-11-10 | 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) | 基于深度对偶变分哈希的无监督跨模态检索模型训练方法 |
CN112559820A (zh) * | 2020-12-17 | 2021-03-26 | 中国科学院空天信息创新研究院 | 基于深度学习的样本数据集智能出题方法、装置及设备 |
CN112559820B (zh) * | 2020-12-17 | 2022-08-30 | 中国科学院空天信息创新研究院 | 基于深度学习的样本数据集智能出题方法、装置及设备 |
CN112667841A (zh) * | 2020-12-28 | 2021-04-16 | 山东建筑大学 | 一种弱监督的深度上下文感知图像表征方法及*** |
CN112667841B (zh) * | 2020-12-28 | 2023-03-24 | 山东建筑大学 | 一种弱监督的深度上下文感知图像表征方法及*** |
CN112765316A (zh) * | 2021-01-19 | 2021-05-07 | 东南大学 | 一种引入胶囊网络的文本生成图像方法及装置 |
CN112817604A (zh) * | 2021-02-18 | 2021-05-18 | 北京邮电大学 | 安卓***控件意图识别方法、装置、电子设备及存储介质 |
CN112989097A (zh) * | 2021-03-23 | 2021-06-18 | 北京百度网讯科技有限公司 | 模型训练、图片检索方法及装置 |
CN113095415A (zh) * | 2021-04-15 | 2021-07-09 | 齐鲁工业大学 | 一种基于多模态注意力机制的跨模态哈希方法及*** |
CN113157739B (zh) * | 2021-04-23 | 2024-01-09 | 平安科技(深圳)有限公司 | 跨模态检索方法、装置、电子设备及存储介质 |
CN113157739A (zh) * | 2021-04-23 | 2021-07-23 | 平安科技(深圳)有限公司 | 跨模态检索方法、装置、电子设备及存储介质 |
CN113270199B (zh) * | 2021-04-30 | 2024-04-26 | 贵州师范大学 | 医学跨模态多尺度融合类别指导哈希方法及其*** |
CN113270199A (zh) * | 2021-04-30 | 2021-08-17 | 贵州师范大学 | 医学跨模态多尺度融合类别指导哈希方法及其*** |
CN113449849B (zh) * | 2021-06-29 | 2022-05-27 | 桂林电子科技大学 | 基于自编码器的学习型文本哈希方法 |
CN113449849A (zh) * | 2021-06-29 | 2021-09-28 | 桂林电子科技大学 | 基于自编码器的学习型文本哈希方法 |
CN113763441B (zh) * | 2021-08-25 | 2024-01-26 | 中国科学院苏州生物医学工程技术研究所 | 无监督学习的医学图像配准方法及*** |
CN113763441A (zh) * | 2021-08-25 | 2021-12-07 | 中国科学院苏州生物医学工程技术研究所 | 无监督学习的医学图像配准方法及*** |
CN114329109A (zh) * | 2022-03-15 | 2022-04-12 | 山东建筑大学 | 基于弱监督哈希学习的多模态检索方法及*** |
CN114942984B (zh) * | 2022-05-26 | 2023-11-21 | 北京百度网讯科技有限公司 | 视觉场景文本融合模型的预训练和图文检索方法及装置 |
CN114942984A (zh) * | 2022-05-26 | 2022-08-26 | 北京百度网讯科技有限公司 | 视觉场景文本融合模型的预训练和图文检索方法及装置 |
CN115687571A (zh) * | 2022-10-28 | 2023-02-03 | 重庆师范大学 | 一种基于模态融合重建哈希的深度无监督跨模态检索方法 |
CN115687571B (zh) * | 2022-10-28 | 2024-01-26 | 重庆师范大学 | 一种基于模态融合重建哈希的深度无监督跨模态检索方法 |
CN115840827B (zh) * | 2022-11-07 | 2023-09-19 | 重庆师范大学 | 一种深度无监督跨模态哈希检索方法 |
CN115840827A (zh) * | 2022-11-07 | 2023-03-24 | 重庆师范大学 | 一种深度无监督跨模态哈希检索方法 |
CN115982403A (zh) * | 2023-01-12 | 2023-04-18 | 之江实验室 | 一种多模态哈希检索方法及装置 |
CN115982403B (zh) * | 2023-01-12 | 2024-02-02 | 之江实验室 | 一种多模态哈希检索方法及装置 |
CN115880556A (zh) * | 2023-02-21 | 2023-03-31 | 北京理工大学 | 一种多模态数据融合处理方法、装置、设备及存储介质 |
CN115880556B (zh) * | 2023-02-21 | 2023-05-02 | 北京理工大学 | 一种多模态数据融合处理方法、装置、设备及存储介质 |
CN116594994A (zh) * | 2023-03-30 | 2023-08-15 | 重庆师范大学 | 视觉语言知识蒸馏在跨模态哈希检索的应用 |
CN116049459B (zh) * | 2023-03-30 | 2023-07-14 | 浪潮电子信息产业股份有限公司 | 跨模态互检索的方法、装置、服务器及存储介质 |
CN116594994B (zh) * | 2023-03-30 | 2024-02-23 | 重庆师范大学 | 视觉语言知识蒸馏在跨模态哈希检索的应用方法 |
CN116049459A (zh) * | 2023-03-30 | 2023-05-02 | 浪潮电子信息产业股份有限公司 | 跨模态互检索的方法、装置、服务器及存储介质 |
CN116244484A (zh) * | 2023-05-11 | 2023-06-09 | 山东大学 | 一种面向不平衡数据的联邦跨模态检索方法及*** |
CN116244484B (zh) * | 2023-05-11 | 2023-08-08 | 山东大学 | 一种面向不平衡数据的联邦跨模态检索方法及*** |
CN116431847B (zh) * | 2023-06-14 | 2023-11-14 | 北京邮电大学 | 基于多重对比和双路对抗的跨模态哈希检索方法及设备 |
CN116431847A (zh) * | 2023-06-14 | 2023-07-14 | 北京邮电大学 | 基于多重对比和双路对抗的跨模态哈希检索方法及设备 |
CN116825210B (zh) * | 2023-08-28 | 2023-11-17 | 山东大学 | 基于多源生物数据的哈希检索方法、***、设备和介质 |
CN116825210A (zh) * | 2023-08-28 | 2023-09-29 | 山东大学 | 基于多源生物数据的哈希检索方法、***、设备和介质 |
CN117992805A (zh) * | 2024-04-07 | 2024-05-07 | 武汉商学院 | 基于张量积图融合扩散的零样本跨模态检索方法、*** |
Also Published As
Publication number | Publication date |
---|---|
CN109299216B (zh) | 2019-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299216B (zh) | 一种融合监督信息的跨模态哈希检索方法和*** | |
CN110334219B (zh) | 基于注意力机制融入文本语义特征的知识图谱表示学习方法 | |
CN113707235B (zh) | 基于自监督学习的药物小分子性质预测方法、装置及设备 | |
CN110826303A (zh) | 一种基于弱监督学习的联合信息抽取方法 | |
CN105404632B (zh) | 基于深度神经网络对生物医学文本序列化标注的***和方法 | |
CN109299341A (zh) | 一种基于字典学习的对抗跨模态检索方法和*** | |
CN110413844A (zh) | 基于时空注意力深度模型的动态链路预测方法 | |
CN114418954A (zh) | 一种基于互学习的半监督医学图像分割方法及其*** | |
CN112364174A (zh) | 基于知识图谱的病人病历相似度评估方法及*** | |
CN112199532B (zh) | 一种基于哈希编码和图注意力机制的零样本图像检索方法及装置 | |
CN110674323A (zh) | 基于虚拟标签回归的无监督跨模态哈希检索方法及*** | |
CN113312505B (zh) | 一种基于离散在线哈希学习的跨模态检索方法及*** | |
CN110598022B (zh) | 一种基于鲁棒深度哈希网络的图像检索***与方法 | |
CN113051914A (zh) | 一种基于多特征动态画像的企业隐藏标签抽取方法及装置 | |
CN114896434B (zh) | 一种基于中心相似度学习的哈希码生成方法及装置 | |
CN116204706A (zh) | 一种文本内容结合图像分析的多模态内容检索方法与*** | |
CN116932722A (zh) | 一种基于跨模态数据融合的医学视觉问答方法及*** | |
CN110781271A (zh) | 一种基于层次注意力机制的半监督网络表示学习模型 | |
CN111090765B (zh) | 一种基于缺失多模态哈希的社交图像检索方法及*** | |
CN111191461B (zh) | 一种基于课程学习的远程监督关系抽取方法 | |
CN115827954A (zh) | 动态加权的跨模态融合网络检索方法、***、电子设备 | |
CN116258990A (zh) | 一种基于跨模态亲和力的小样本参考视频目标分割方法 | |
CN114021584A (zh) | 基于图卷积网络和翻译模型的知识表示学习方法 | |
CN112668633B (zh) | 一种基于细粒度领域自适应的图迁移学习方法 | |
CN112380394B (zh) | 面向文本到视频片段定位的渐进式定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190723 Termination date: 20211029 |
|
CF01 | Termination of patent right due to non-payment of annual fee |