CN114168782A - 一种基于三元组网络的深度哈希图像检索方法 - Google Patents

一种基于三元组网络的深度哈希图像检索方法 Download PDF

Info

Publication number
CN114168782A
CN114168782A CN202111448102.6A CN202111448102A CN114168782A CN 114168782 A CN114168782 A CN 114168782A CN 202111448102 A CN202111448102 A CN 202111448102A CN 114168782 A CN114168782 A CN 114168782A
Authority
CN
China
Prior art keywords
image
images
triple
hash
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111448102.6A
Other languages
English (en)
Other versions
CN114168782B (zh
Inventor
曹从军
陈星�
廖开阳
周建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202111448102.6A priority Critical patent/CN114168782B/zh
Publication of CN114168782A publication Critical patent/CN114168782A/zh
Application granted granted Critical
Publication of CN114168782B publication Critical patent/CN114168782B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于三元组网络的深度哈希图像检索方法,具体为:采用三元组网络作为CNN网络进行图像特征学习;根据特征学习的情况进行损失函数优化,使得同一类别的样本图像对在特征空间的距离小于不同类别之间的样本图像对,优化神经网络模型;将查询图像与测试集图像输入三元组网络,分别得到图像的二进制哈希编码和fc7层的深度特征向量,先利用二进制哈希编码进行粗检索,根据汉明距离大小和设定的阈值得到相似图像的候选集图像,再利用fc7层深度特征进行细检索,计算查询图像与候选集图像的fc7层特征向量的欧氏距离,根据欧氏距离由小到大的顺序,得到最终n个检索结果。本发明解决了现有技术中存在的图像检索精度不高的问题。

Description

一种基于三元组网络的深度哈希图像检索方法
技术领域
本发明属于计算机图像检索方法技术领域,涉及一种基于三元组网络的深度哈希图像检索方法。
背景技术
近年来,哈希技术在大规模图像检索中应用广泛,通过将图像的高维特征转换为低维空间的二进制哈希编码,计算汉明距离来进行快速图像检索。该方法具有存储开销小,计算效率高的优点。传统的哈希方法是先提取高维特征,对特征进行学习得到哈希函数,然后利用哈希函数映射将图像高维特征转化为低维空间哈希码。随着CNN的发展,出现了将CNN提取的深度特征与哈希学习相结合的深度哈希算法,能够直接获取代表图像更深层信息的哈希编码。然而现有的大多数深度哈希方法存在监督信息利用不足,无法获取更加具有区分性的哈希编码,从而训练得到的模型没有达到预期的效果,直接影响检索结果精度。
因此,如何提供一种图像检索方法来提高哈希技术的检索精度具有重要的价值。
发明内容
本发明的目的是提供一种基于三元组网络的深度哈希图像检索方法,解决了现有技术中存在的图像检索精度不高的问题。
本发明所采用的技术方案是,一种基于三元组网络的深度哈希图像检索方法,具体按照如下步骤实施:
步骤1,采用并列的三个Alexnet网络模型为CNN网络模型,并在每个Alexnet网络模型的倒数第二个全连接层fc7层后添加隐藏层,即就是添加哈希层,且三个Alexnet网络模型之间共享权重参数;
步骤2,选用图像数据集CIFAR-10,将其划分为训练集和测试集,以训练集图像作为步骤1构建的CNN网络模型的输入图像,每个输入图像均为一个三元组图像,包括锚点图像、正样本图像和负样本图像,其中正样本图像和锚点图像为同一类别,负样本图像与锚点图像为不同类别;
步骤3,将每个输入图像的锚点图像、正样本图像和负样本图像分别输入至一个Alexnet网络模型中,锚点图像、正样本图像和负样本图像分别在输出fc7层和哈希层产生一个输出fc7层的深度特征和一个代表图像特征的初步哈希码;
步骤4,为CNN网络模型引入一个三元组损失函数,使用步骤3生成的初步哈希码通过最小化三元组损失函数,使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,完成对CNN网络模型的优化;
步骤5,将测试集图像与查询图像输入到步骤4优化的CNN网络模型中对应输入锚点图像的Alexnet网络模型中,得到对应的哈希编码和fc7层深度特征,其中测试图像和查询图像均为锚点图像,计算查询图像与测试集图像对应的二进制哈希编码的汉明距离,根据设定的阈值,如果汉明距离小于阈值,则认为查询图像与测试集图像相似,在测试集图像中得到m个最相似的候选图像集,然后计算查询图像向量与候选集图像的深度特征向量的欧式距离,按照从小到大排序获得最终的检索结果,在候选图像集中找到n个最相似的图像,即就是查询图像最相似n图像。
本发明的特征还在于,
图像数据集CIFAR-10共60000张,训练集分10类,每类5000张,测试集分10类,每类1000张。
步骤4中的使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,即就是:
S(xi,xi +)<S(xi,xi -) (2)
等价于
S2(xi,xi +)<S2(xi,xi -) (3)
其中,xi为锚点图像,xi +为正样本图像,即与xi同一类别的样本图像,xi -为负样本图像,即与xi不同样类别的样本图像,S(x,x`)表示两张图像x和x`的相似性,即就是S(xi,xi +)为锚点图像和正样本图像的相似性,S(xi,xi -)锚点图像和负样本图像的相似性,根据此将三元组损失函数定义如下:
loss(xi,xi +,xi -)=max{0,g+S2(xi,xi +)-S2(xi,xi -)} (4)
式中,loss(xi,xi +,xi -)代表三元组损失函数,其中,g为度量同类别图像对与不同类别图像对之间距离的阈值参数。
g=-1。
对CNN网络模型的优化,即就是对三元组损失函数的优化,具体过程为:
记训练集X={Xi},其中{Xi}=(xi,xi +,xi -),则将三元组损失函数的优化转化为以下目标函数L的最小化问题,即就是:
Figure BDA0003382393210000031
其中,W为神经网络参数,λ为提高网络模型泛化能力而引入的正则化系数,n为训练集中三元组的数目;
引入函数d(W,Xi)表示三元组中锚点图像、正样本图像与锚点图像、负样本图像图像对之间的距离,即
d(W,Xi)=S2(xi,xi +)-S2(xi,xi -) (6)
则目标函数可以进一步写成:
Figure BDA0003382393210000041
为优化该目标函数,使其最小,目标函数的偏导数为:
Figure BDA0003382393210000042
Figure BDA0003382393210000043
通过d(W,Xi)的定义可以得到d(W,Xi)的梯度如下:
Figure BDA0003382393210000044
由此可以看出,将三元组图像输入到网络中,进行前向和反向计算即可得到三元组损失函数的梯度,然后使用梯度下降算法即可得到优化的目标函数,从而优化三元组损失函数,得到最优的CNN网络模型。
步骤5中计算查询图像与测试集图像对应的二进制哈希编码的汉明距离具体为:
首先给定测试集中的图像I,将查询图像I输入到步骤5优化后的CNN网络模型中,提取隐藏层,即就是哈希层的输出作为图像特征,记为Out(H),通过设定阈值进行二值化,得到对应的二进制哈希码,即对于每一位j=1...h,h是隐藏层的节点数,输出的二进制编码为
Figure BDA0003382393210000051
设定Γ={I1,I2,...,In}表述用于检索的图像构成的测试集,In表示第n个测试集图像,每个图像对应的二进制编码表示为ΓH={H1,H2,...,Hn},其中Hi∈{0,1}h
对于查询图像Iq和其对应的二进制编码Hq,计算Hq和Hi的汉明距离,如果Hq和Hi∈ΓH汉明距离小于阈值,则认为是相似图像,根据阈值设定最终得到有m张相似图片的候选图像集,得到对应的候选图像集
Figure BDA0003382393210000052
步骤5中计算查询图像向量与候选集图像的深度特征向量的欧式距离具体为:
对于查询图像Iq和候选图像集P,Vq代表查询图像q的特征向量,Vi P表示候选集图像中第i个图像的特征向量,通过下式计算它们对应的特征向量之间的欧氏距离:
si=||Vq-Vi P|| (12)
欧氏距离越小,两幅图像的相似度越高,最终在候选图像集中根据欧氏距离由小到大的排序得到n个最相似的结果图像,n<m。
本发明的有益效果是:
本发明选用三元组网络共享权重进行图像特征学习,能够充分利用图像的监督信息,获取代表图像的深度特征,并利用三元组损失函数进一步优化网络模型,使得同一类别的图像之间的距离更小,不同类别图像之间的距离更大,从而获得更具区分性和更高查询精度的二进制哈希编码。在检索图像时,先利用哈希编码进行粗检索,得到候选图像集,再利用图像的fc7层深度特征进行细检索,最终在候选图像集中得到n个最相似的图像,有效提高检索精度。
附图说明
图1是本发明一种基于三元组网络的深度哈希图像检索方法中图像特征学习的结构示意图;
图2是本发明一种基于三元组网络的深度哈希图像检索方法的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明一种基于三元组网络的深度哈希图像检索方法,其流程如图2所示。具体按照如下步骤实施:
步骤1,如图1所示,采用并列的三个Alexnet网络模型为CNN网络模型,并在每个Alexnet网络模型的倒数第二个全连接层fc7层后添加隐藏层,即就是添加哈希层,且三个Alexnet网络模型之间共享权重参数;
步骤2,选用图像数据集CIFAR-10,将其划分为训练集和测试集,以训练集图像作为步骤1构建的CNN网络模型的输入图像,图像数据集CIFAR-10共60000张,训练集分10类,每类5000张,测试集分10类,每类1000张,每个输入图像均为一个三元组图像,包括锚点图像、正样本图像和负样本图像,其中正样本图像和锚点图像为同一类别,负样本图像与锚点图像为不同类别;
步骤3,将每个输入图像的锚点图像、正样本图像和负样本图像分别输入至一个Alexnet网络模型中,锚点图像、正样本图像和负样本图像分别在输出fc7层和哈希层产生一个输出fc7层的深度特征和一个代表图像特征的初步哈希码;
步骤4,为CNN网络模型引入一个三元组损失函数,使用步骤3生成的初步哈希码通过最小化三元组损失函数,使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,即就是即同一类别图像生成的哈希码更相似,不同类别图像的哈希码差异越大,完成对CNN网络模型的优化;
优化过程具体为:
假设样本图像之间的相对距离关系使用一系列图像三元组来表示:{Xi}=(x,x+,x-),其中x为锚点图像,x+为正样本,即与x同一类别的样本图像,x-为负样本图像,即与x不同样类别的样本图像。根据图像在欧式空间的距离,将两张图像x,x`的相似性定义为:
S(x,x`)=||F(x)-F(x`)||2 (1)
式中S(x,x`)为两张图像的相似性,F(x)为将图像数据映射到欧式空间的函数,对通过深度神经网络实现的特征映射函数,F(x)表示图像x的网络输出,或是图像x的特征表示。
对于训练时的一个三元组来说,使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,即就是期望输出的特征表示应该在L2范数下满足以下条件:
S(xi,xi +)<S(xi,xi -) (2)
等价于
S2(xi,xi +)<S2(xi,xi -) (3)
其中,xi为锚点图像,xi +为正样本图像,即与xi同一类别的样本图像,xi -为负样本图像,即与xi不同样类别的样本图像,S(x,x`)表示两张图像x和x`的相似性,即就是S(xi,xi +)为锚点图像和正样本图像的相似性,S(xi,xi -)锚点图像和负样本图像的相似性,这里使用平方的形式便于后续实施优化时的导数计算。对于给定的三元组{Xi},针对分类问题言,需要最大化同一类别图像对与非同一类别图像对之间的距离,因此将三元组损失函数定义如下:
loss(xi,xi +,xi -)=max{0,g+S2(xi,xi +)-S2(xi,xi -)} (4)
式中,loss(xi,xi +,xi -)代表三元组损失函数,其中,g为度量同类别图像对与不同类别图像对之间距离的阈值参数,g=-1。
对CNN网络模型的优化,即就是对三元组损失函数的优化,具体过程为:
记训练集X={Xi},其中{Xi}=(xi,xi +,xi -),则将三元组损失函数的优化转化为以下目标函数L的最小化问题,即就是:
Figure BDA0003382393210000081
其中,W为神经网络参数,λ为提高网络模型泛化能力而引入的正则化系数,n为训练集中三元组的数目;
引入函数d(W,Xi)表示三元组中锚点图像、正样本图像与锚点图像、负样本图像图像对之间的距离,即
d(W,Xi)=S2(xi,xi +)-S2(xi,xi -) (6)
则目标函数可以进一步写成:
Figure BDA0003382393210000082
为优化该目标函数,使其最小,目标函数的偏导数为:
Figure BDA0003382393210000083
Figure BDA0003382393210000091
通过d(W,Xi)的定义可以得到d(W,Xi)的梯度如下:
Figure BDA0003382393210000092
由此可以看出,将三元组图像输入到网络中,进行前向和反向计算即可得到三元组损失函数的梯度,然后使用梯度下降算法即可得到优化的目标函数,从而优化三元组损失函数,得到最优的CNN网络模型,从而提取到图像最本质的深层特征,获得具有更高的区分性和查询精度的哈希码。
步骤5,将测试集图像与查询图像输入到步骤4优化的CNN网络模型中对应输入锚点图像的Alexnet网络模型中,得到对应的哈希编码和fc7层深度特征,其中测试图像和查询图像均为锚点图像,计算查询图像与测试集图像对应的二进制哈希编码的汉明距离,根据设定的阈值,如果汉明距离小于阈值,则认为查询图像与测试集图像相似,在测试集图像中得到m个最相似的候选图像集,然后计算查询图像向量与候选集图像的深度特征向量的欧式距离,按照从小到大排序获得最终的检索结果,在候选图像集中找到n个最相似的图像,即就是查询图像最相似n图像;
其中,计算查询图像与测试集图像对应的二进制哈希编码的汉明距离具体为:
首先给定测试集中的图像I,将查询图像I输入到步骤5优化后的CNN网络模型中,提取隐藏层,即就是哈希层的输出作为图像特征,记为Out(H),通过设定阈值进行二值化,得到对应的二进制哈希码,即对于每一位j=1...h,h是隐藏层的节点数,输出的二进制编码为
Figure BDA0003382393210000101
设定Γ={I1,I2,...,In}表述用于检索的图像构成的测试集,In表示第n个测试集图像,每个图像对应的二进制编码表示为ΓH={H1,H2,...,Hn},其中Hi∈{0,1}h
对于查询图像Iq和其对应的二进制编码Hq,计算Hq和Hi的汉明距离,如果Hq和Hi∈ΓH汉明距离小于阈值,则认为是相似图像,根据阈值设定最终得到有m张相似图片的候选图像集,得到对应的候选图像集
Figure BDA0003382393210000102
其中,计算查询图像向量与候选集图像的深度特征向量的欧式距离具体为:
对于查询图像Iq和候选图像集P,Vq代表查询图像q的特征向量,Vi P表示候选集图像中第i个图像的特征向量,通过下式计算它们对应的特征向量之间的欧氏距离:
si=||Vq-Vi P|| (12)
欧氏距离越小,两幅图像的相似度越高,最终在候选图像集中根据欧氏距离由小到大的排序得到n个最相似的结果图像,n<m。

Claims (7)

1.一种基于三元组网络的深度哈希图像检索方法,其特征在于,具体按照如下步骤实施:
步骤1,采用并列的三个Alexnet网络模型为CNN网络模型,并在每个Alexnet网络模型的倒数第二个全连接层fc7层后添加隐藏层,即就是添加哈希层,且三个Alexnet网络模型之间共享权重参数;
步骤2,选用图像数据集CIFAR-10,将其划分为训练集和测试集,以训练集图像作为步骤1构建的CNN网络模型的输入图像,每个输入图像均为一个三元组图像,包括锚点图像、正样本图像和负样本图像,其中正样本图像和锚点图像为同一类别,负样本图像与锚点图像为不同类别;
步骤3,将每个输入图像的锚点图像、正样本图像和负样本图像分别输入至一个Alexnet网络模型中,锚点图像、正样本图像和负样本图像分别在输出fc7层和哈希层产生一个输出fc7层的深度特征和一个代表图像特征的初步哈希码;
步骤4,为CNN网络模型引入一个三元组损失函数,使用步骤3生成的初步哈希码通过最小化三元组损失函数,使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,完成对CNN网络模型的优化;
步骤5,将测试集图像与查询图像输入到步骤4优化的CNN网络模型中对应输入锚点图像的Alexnet网络模型中,得到对应的哈希编码和fc7层深度特征,其中测试图像和查询图像均为锚点图像,计算查询图像与测试集图像对应的二进制哈希编码的汉明距离,根据设定的阈值,如果汉明距离小于阈值,则认为查询图像与测试集图像相似,在测试集图像中得到m个最相似的候选图像集,然后计算查询图像向量与候选集图像的深度特征向量的欧式距离,按照从小到大排序获得最终的检索结果,在候选图像集中找到n个最相似的图像,即就是查询图像最相似n图像。
2.根据权利要求1所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述图像数据集CIFAR-10共60000张,训练集分10类,每类5000张,测试集分10类,每类1000张。
3.根据权利要求1所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述步骤4中的使得锚点图像、正样本图像在特征空间的距离小于锚点图像和负样本图像在特征空间的距离,即就是:
S(xi,xi +)<S(xi,xi -) (2)
等价于
S2(xi,xi +)<S2(xi,xi -) (3)
其中,xi为锚点图像,xi +为正样本图像,即与xi同一类别的样本图像,xi -为负样本图像,即与xi不同样类别的样本图像,S(x,x`)表示两张图像x和x`的相似性,即就是S(xi,xi +)为锚点图像和正样本图像的相似性,S(xi,xi -)锚点图像和负样本图像的相似性,根据此将三元组损失函数定义如下:
loss(xi,xi +,xi -)=max{0,g+S2(xi,xi +)-S2(xi,xi -)} (4)
式中,loss(xi,xi +,xi -)代表三元组损失函数,其中,g为度量同类别图像对与不同类别图像对之间距离的阈值参数。
4.根据权利要求3所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,g=-1。
5.根据权利要求3所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述对CNN网络模型的优化,即就是对三元组损失函数的优化,具体过程为:
记训练集X={Xi},其中{Xi}=(xi,xi +,xi -),则将三元组损失函数的优化转化为以下目标函数L的最小化问题,即就是:
Figure FDA0003382393200000031
其中,W为神经网络参数,λ为提高网络模型泛化能力而引入的正则化系数,n为训练集中三元组的数目;
引入函数d(W,Xi)表示三元组中锚点图像、正样本图像与锚点图像、负样本图像图像对之间的距离,即
d(W,Xi)=S2(xi,xi +)-S2(xi,xi -) (6)
则目标函数可以进一步写成:
Figure FDA0003382393200000032
为优化该目标函数,使其最小,目标函数的偏导数为:
Figure FDA0003382393200000033
Figure FDA0003382393200000034
通过d(W,Xi)的定义可以得到d(W,Xi)的梯度如下:
Figure FDA0003382393200000035
由此可以看出,将三元组图像输入到网络中,进行前向和反向计算即可得到三元组损失函数的梯度,然后使用梯度下降算法即可得到优化的目标函数,从而优化三元组损失函数,得到最优的CNN网络模型。
6.根据权利要求4所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述步骤5中计算查询图像与测试集图像对应的二进制哈希编码的汉明距离具体为:
首先给定测试集中的图像I,将查询图像I输入到步骤5优化后的CNN网络模型中,提取隐藏层,即就是哈希层的输出作为图像特征,记为Out(H),通过设定阈值进行二值化,得到对应的二进制哈希码,即对于每一位j=1...h,h是隐藏层的节点数,输出的二进制编码为
Figure FDA0003382393200000041
设定Γ={I1,I2,...,In}表述用于检索的图像构成的测试集,In表示第n个测试集图像,每个图像对应的二进制编码表示为ΓH={H1,H2,...,Hn},其中Hi∈{0,1}h
对于查询图像Iq和其对应的二进制编码Hq,计算Hq和Hi的汉明距离,如果Hq和Hi∈ΓH汉明距离小于阈值,则认为是相似图像,根据阈值设定最终得到有m张相似图片的候选图像集,得到对应的候选图像集
Figure FDA0003382393200000042
7.根据权利要求6所述的一种基于三元组网络的深度哈希图像检索方法,其特征在于,所述步骤5中计算查询图像向量与候选集图像的深度特征向量的欧式距离具体为:
对于查询图像Iq和候选图像集P,Vq代表查询图像q的特征向量,Vi P表示候选集图像中第i个图像的特征向量,通过下式计算它们对应的特征向量之间的欧氏距离:
si=||Vq-Vi P|| (12)
欧氏距离越小,两幅图像的相似度越高,最终在候选图像集中根据欧氏距离由小到大的排序得到n个最相似的结果图像,n<m。
CN202111448102.6A 2021-11-30 2021-11-30 一种基于三元组网络的深度哈希图像检索方法 Active CN114168782B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111448102.6A CN114168782B (zh) 2021-11-30 2021-11-30 一种基于三元组网络的深度哈希图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111448102.6A CN114168782B (zh) 2021-11-30 2021-11-30 一种基于三元组网络的深度哈希图像检索方法

Publications (2)

Publication Number Publication Date
CN114168782A true CN114168782A (zh) 2022-03-11
CN114168782B CN114168782B (zh) 2024-03-15

Family

ID=80482302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111448102.6A Active CN114168782B (zh) 2021-11-30 2021-11-30 一种基于三元组网络的深度哈希图像检索方法

Country Status (1)

Country Link
CN (1) CN114168782B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417046A (zh) * 2022-03-31 2022-04-29 腾讯科技(深圳)有限公司 特征提取模型的训练方法、图像检索方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092183A1 (zh) * 2015-12-03 2017-06-08 中山大学 一种基于可变长深度哈希学习的图像检索方法
CN113190699A (zh) * 2021-05-14 2021-07-30 华中科技大学 一种基于类别级语义哈希的遥感图像检索方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092183A1 (zh) * 2015-12-03 2017-06-08 中山大学 一种基于可变长深度哈希学习的图像检索方法
CN113190699A (zh) * 2021-05-14 2021-07-30 华中科技大学 一种基于类别级语义哈希的遥感图像检索方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯兴杰;程毅玮;: "基于深度卷积神经网络与哈希的图像检索", 计算机工程与设计, no. 03 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417046A (zh) * 2022-03-31 2022-04-29 腾讯科技(深圳)有限公司 特征提取模型的训练方法、图像检索方法、装置及设备

Also Published As

Publication number Publication date
CN114168782B (zh) 2024-03-15

Similar Documents

Publication Publication Date Title
CN113190699B (zh) 一种基于类别级语义哈希的遥感图像检索方法及装置
CN111814871A (zh) 一种基于可靠权重最优传输的图像分类方法
CN110941734B (zh) 基于稀疏图结构的深度无监督图像检索方法
CN113326731A (zh) 一种基于动量网络指导的跨域行人重识别算法
CN108446334B (zh) 一种无监督对抗训练的基于内容的图像检索方法
CN108388656B (zh) 一种基于标记相关性的图片搜索方法
CN112434628B (zh) 基于主动学习和协同表示的小样本图像分类方法
CN110647907A (zh) 利用多层分类和字典学习的多标签图像分类算法
CN112036511B (zh) 基于注意力机制图卷积神经网络的图像检索方法
CN112101473B (zh) 一种基于小样本学习的烟雾检测算法
CN104361135A (zh) 一种图像检索方法
CN114168782B (zh) 一种基于三元组网络的深度哈希图像检索方法
CN114612747A (zh) 基于无监督加权哈希的遥感图像检索方法
CN116452862A (zh) 基于领域泛化学习的图像分类方法
CN114860973A (zh) 一种面向小样本场景的深度图像检索方法
CN113033345B (zh) 基于公共特征子空间的v2v视频人脸识别方法
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN112149556B (zh) 一种基于深度互学习和知识传递的人脸属性识别方法
CN117763185A (zh) 一种基于思考空间维度的哈希图像检索方法
CN110717068A (zh) 一种基于深度学习的视频检索方法
CN116186350A (zh) 基于知识图谱和主题文本的输电线路工程搜索方法和装置
CN112905599B (zh) 基于端到端的分布式深度哈希检索方法
CN115496153A (zh) 多头自注意力的深度卷积嵌入聚类风光荷联合场景方法
CN112132059B (zh) 一种基于深度条件随机场的行人重识别方法和***
CN111401519B (zh) 一种基于物体内和物体间相似性距离的深层神经网络无监督学习方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant