CN106407352A - 基于深度学习的交通图像检索方法 - Google Patents
基于深度学习的交通图像检索方法 Download PDFInfo
- Publication number
- CN106407352A CN106407352A CN201610806287.6A CN201610806287A CN106407352A CN 106407352 A CN106407352 A CN 106407352A CN 201610806287 A CN201610806287 A CN 201610806287A CN 106407352 A CN106407352 A CN 106407352A
- Authority
- CN
- China
- Prior art keywords
- image
- hash
- function
- category
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000006870 function Effects 0.000 claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 9
- 238000013135 deep learning Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000013480 data collection Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 230000000717 retained effect Effects 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229910002056 binary alloy Inorganic materials 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明在智能交通应用场景下,提出一种基于深度学习的交通图像检索方法,实现深度哈希编码进行交通监控视频图像检索。包括:将目标数据集分为训练集与测试集两部分;通过深度卷积神经网络得到目标类别、颜色的特征以及图像哈希编码;类别、颜色特征的分类损失与哈希编码损失经后向传播优化哈希函数;哈希函数对图像进行哈希编码,计算查询图像与测试数据集中图像的哈希编码之间的汉明距离以表征两者相似程度;根据汉明距离的大小进行相似度得分排序来检索图像。本方法进行图像检索即保留了图像中丰富的多级语义信息又利用了各图像中目标特有的属性信息,通过共享网络结构完成检索与图像属性分类多任务,利用分类任务辅助检索。
Description
技术领域
本发明涉及基于内容的图像检索技术领域,特别涉及一种基于深度学习的多属性深度哈希编码图像检索方法,具体是指一种基于深度学习实现交通图像检索的方法。
背景技术
随着平安城市、智能交通等工程的推进,监控摄像为大多数案件留下了影像资料,给警方破案带来了很大的便利。但查找视频、分析视频的工作常常会耗用大量的时间和人力。在海量视频中更方便查找到相关信息的需求越来越强烈,视频检索技术也越来越重要。交通监控视频的数据量非常之大,在这种海量数据中寻找特定目标是不易的,因此这种交通应用场景下的图像检索应运而生。
为了适应海量图像库的检索需求并降低“维数灾难”的影响,常采用的方法为图像哈希的方法。该方法将图像特征映射成二进制哈希码,再用哈希码间的汉明距离表示图像间的相似程度。利用图像哈希方法能够快速计算哈希码间的汉明距离并大大降低了数据的存储量,但其缺点在于:依赖于图像特征的提取,一张图像的复杂程度往往不能用几个特征来表达,此时编码函数不能很好的贴近原图像信息则检索的精确度会下降。
为解决上述问题,研究人员提出了采用多标签图像中包含的多级语义进行深度哈希学习。深度哈希学习可以处理图像中多级语义相似度而不仅是描述图像表观特征。这种方法虽然处理了图像包含的高级语义信息,但是没有利用上图中物体的属性特征信息,这种单一的深度哈希编码方法还有提升的空间。
发明内容
本发明的目的在于克服现有技术的不足,在智能交通应用场景下,提出一种基于深度学习的交通图像检索方法,是一种融合目标的多属性特征与深度哈希编码进行学习从而达到交通监控视频图像检索的方法。本方法基于深度卷积神经网络,通过加入目标属性分类任务融合目标的多属性特征与深度哈希编码进行学习从而达到交通监控视频图像检索的目的。本方法的特点在于既保留了图像中丰富的多级语义信息又利用了各图像中目标特有的属性信息,通过共享网络结构同时利用了CNN输出包含的多种图像属性特征的特点,让深度哈希函数更加好的表达图像信息,使得在交通监控中的视频图像搜索更为精确有效。
本发明的目的通过以下的技术方案实现:
一种基于深度学习的交通图像检索方法,包括下述步骤:
步骤1:将已经分离好且具有多属性标签的运动目标视频帧数据集分为训练集和测试集两部分;
步骤2:把训练集图像输入深度卷积神经网络中,得到目标颜色、类别特征,同时根据哈希编码函数初始参数计算每张图的哈希编码;
步骤3:对图像之间的类标进行相似度排序;
步骤4:计算目标损失函数,先计算训练集中图像哈希编码之间的汉明距离并进行排序,与类标的相似度排序比较进行检索分支损失函数的计算;该目标损失函数由颜色及类别属性分类任务multihinge-loss与哈希函数学习任务的triplet-loss共同组成,经随机梯度下降法与后向传播改变网络参数以得到深度学习哈希编码函数;
步骤5:对于新的查询图像,利用步骤4学习到的哈希编码函数对图像进行哈希编码,计算查询图像与测试集中图像的哈希编码之间的汉明距离,采用该汉明距离表征查询图像与测试集中图像之间的相似程度;
步骤6:根据查询图像与测试集中图像的哈希编码之间的汉明距离得到距离的大小序列进行相似度得分排序来得到检索图像列表,根据被检索图像路径所属的视频段得到相应视频的搜索。
优选地,所述步骤1中,对交通监控视频数据集做运动物体分割识别得到分离好的运动目标,并且采用人工标注方式标注每帧图像上的目标类别与目标颜色,目标视频帧数据集中的图片路径信息包含其所属的视频段标号。
优选地,所述步骤2中,深度卷积神经网络为alex—net网络结构,包含五个卷积层,两个全连接层以及一个哈希编码层;哈希编码函数表达为:
上式中,k表示函数计算的第k个哈希编码值,sgn()为符号函数,为第k个哈希编码值的权重,xi为第i张图像;最终第i张图像的哈希编码表述为:
h(xi)=[h1(xi),h2(xi),…,hk(xi)]。
优选地,所述步骤3中,对图像之间的类标进行相似度排序,具体是:对于训练集中的图像{X1,X2,X3,…,XN},每一张图与其他图进行类标的权重相似度得分排序,N表示训练数据集中的图像数目;采用以下公式:
其中,score(Xi,Xj)代表图像Xi和Xj进行类标的带权重相似度得分排序;w1与w2分别代表类别类标与颜色类标的权重;函数g[…]输入两个集合,返回两个集合相同的个数;表示属于第i张图像的类别类标、颜色类标的集合;排序最终得到一个第i张图Xi与其他图比较得到的关于i的综合相似度排序列表。
优选地,所述步骤4中,颜色与类别属性分类采用SVM分类类器,目标损失函数hinge-loss在SVM分类器的最大化间隔分类中,输出t=±1和分类器分数y,预测分数值y的损失定义如下:
l(y)=max(0,1-t·y)
当t和y有相同的符号时,即表示y预测出正确的分类;
|y|≥1
此时的hinge loss
l(y)=0
但是如果它们的符号相反,l(y)则会根据y线性增加;所属步骤4中哈希编码函数学习任务的目标损失函数是基于图像类标相似度排序三元组的triplet-loss,三元组的三个元素表示为[h(xi),h(xj),h(xk)],其中[i,j,k]是由步骤3中通过类标的score计算得到的排序三元组;通过学习让表征图像i与图像j之间的距离尽可能小,表征图像i与图像k之间的距离尽可能大,并让i、j之间的距离与i、k之间的距离有一个最小间隔α,目标损失函数表示为:
这里距离用汉明距离度量,[·]+表示[·]内的值大于零时取该值为损失,小于零时损失为零。
优选地,所述步骤5中,查询图像输入,采用步骤4中得到的深度哈希函数对查询图像进行哈希编码,数据库里面的每一幅图已经用哈希编码方式储存;汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数,简单用矩阵相乘方式得到;汉明距离d(h)公示表达为:
d(h)=[h(Xi)]*[h(Xj)]
h(Xi),h(Xj)分别表示第i张图与第j张图的哈希编码函数。
本方法与现有技术相比具有如下优点和有益效果:
1.本方法基于深度卷积神经网络,使用哈希编码方法结合物体类别、颜色等目标属性特征学习,得到一个多属性监督的深度哈希编码函数。
2.采用多任务的学习方式,加入了图像的属性特征学习即保留了图像中丰富的多级语义信息又利用了各图像中目标特有的属性信息,改善了传统基于单一哈希编码算法在图像搜索中对图像丰富语义信息提取不足让深度哈希函数更加好的表达图像信息,使得在交通监控中的视频图像搜索更为精确有效。
3.将基于多任务深度学习的图像搜索技术应用到交通图像搜索匹配的领域,填补了该技术在此领域的应用。
附图说明
图1为本发明基于深度学习实现交通图像检索的方法流程示意图。
图2为本发明方法在一般评价标准上的性能曲线示意图。
图3为本发明检索效果示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。
如图1所示,本发明公开的基于深度学习实现交通图像检索的方法,包含以下步骤:
步骤1:本发明实例采用的交通监控视频数据集来源于广州大学城公路监控视频。视频经过分帧后包含照片12510张图像。其中包含4610个目标对象,平均每个目标含有30张图片。每张图片已完成运动物体分割识别,并且采用了人工标注每帧图像上的目标类别与目标颜色等预处理,数据集中的图片路径设信息包含其所属的视频段标号。从中随机选取461个目标当作测试集,其余当作训练集与检索数据库。
步骤2:把训练集图像输入深度卷积神经网络中,得到目标颜色、类别特征与根据哈希编码函数初始参数计算的每张图的哈希编码。如图1所示网络结构图深度卷积神经网络包含五个卷积层,两个全连接层以及一个哈希编码层。每张图最后在通过全连接层以后得到4096维特征向量。该特征向量分两路输出,一路输出到分类器中,另一路输入到哈希编码层中进行编码。其中哈希编码层的哈希函数表达为:
上式中k表示第k个哈希函数,xi为第i中图像提取得到的特征,为第k个哈希函数的权重。最终第i张图像的哈希编码表述为:
h(xi)=[h1(xi),h2(xi)…hk(xi)]
步骤3:根据图像之间类标权重相似度进行排序。对于训练数据库中的图像{X1,X2,X3,…,XN},计算每一张图与其他图进行两两的权重相似度得分排序,N表示训练数据集中的图像数目。采用公式:
其中w1与w2代表类别类标与颜色类标的权重;函数g(.)输入两个集合,返回两个集合相同元素的个数;表示属于第i张图像的类别类标、颜色类标的集合,当图像i与图像j类标相似则score(Xi,Xj)得分就越高,此时就认为这两张图在语义上是相似的,反之则说明两张图是不相似的。两两输入计算得分后得到一个得分方阵:
Score:
图像X | X1 | X2 | … | XN |
X1 | 5 | 4 | … | 3 |
X2 | 4 | 3 | … | 1 |
… | … | … | … | … |
XN | 3 | 1 | … | 5 |
对这个得分矩阵的第i行进行大小排序,输出多个关于第i张图的得分排序三元组[i,j,k]。这个三元组的生成满足第j张图的得分比第k张图得分大,表示图像i与图像j的相似度比图像k要大,通过这个三元组的组合计算tripletloss中特征值之间的距离。
步骤4:计算网络的目标损失函数。目标损失函数由属性分类任务multihinge-loss与哈希函数学习任务的triplet-loss共同组成,经随机梯度下降法与后向传播改变网络参数以得到深度学习哈希编码函数。类别与颜色的属性分类采用SVM分器,损失函数Hinge Loss最常用在SVM中的最大化间隔分类中。哈希函数学习任务的损失函数是基于图像类标相似度排序三元组的triplet-loss,三元组的三个元素表示为[h(xi),h(xj),h(xk)],其中[i,j,k]是由步骤3中通过类标的score计算得到的排序三元组。通过学习让表征图像i与图像j之间的距离尽可能小,表征图像i与图像k之间的距离尽可能大,并让i、j之间的距离与i、k之间的距离有一个最小间隔α。目标函数表示为:
这里两张图之间的距离度量采用汉明距离dH(a,b),[a,b]在式中为[h(xi),h(xj)]代表图像i与图像j的哈希编码。[·]+表示[]内的值大于零时取该值为损失,小于零时损失为零。
步骤5:对于新的查询图像,利用经过网络学习到的哈希编码函数对图像进行哈希编码,计算查询图像与测试数据集中图像的哈希编码之间的汉明距离表征查询图像与测试图像之间的相似程度。查询图像输入如图1网络输入图像所示,采用步骤4中得到的深度哈希函数对查询图像进行哈希编码,检索数据库里面的每一幅图已经用深度哈希函数进行哈希编码储存。计算查询图像哈希编码与数据库中每一个哈希编码的汉明距离,汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数,可以简单用矩阵相乘方式得到。汉明距离d(h)公式表达为:
d(h)=[Xi]*[Xj]
[Xi],[Xj]分别表示第i张图与第j张图的哈希编码。
步骤6:根据得到的汉明距离的大小序列进行检索得分排序来得到检索图像列表,根据被检索图像路径所属的视频段得到相应视频的搜索;图2所示为采用NDCG打分标准对检索结果进行打分,这是用来衡量排序质量的指标,其计算公式为:n代表每张图取排序前n个检索图,r(j)表示检索出来第j张图的真实排序。在检索查询图像top100的图像时,哈希编码比特数越高其得分越高,采用多任务学习与单一的深度哈希学习相比,多任务的得分在相同哈希编码长度中都比较高,进一步说明本方法的有效性。图3所示为比分图像的检索示例,每一行的第一列为查询图像,其他列是对应检索结果做接近的第一到第五张图。从这些结果可以看到检索结果与查询图像是很相近的。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (6)
1.一种基于深度学习的交通图像检索方法,其特征在于,包括下述步骤:
步骤1:将已经分离好且具有多属性标签的运动目标视频帧数据集分为训练集和测试集两部分;
步骤2:把训练集图像输入深度卷积神经网络中,得到目标颜色、类别特征,同时根据哈希编码函数初始参数计算每张图的哈希编码;
步骤3:对图像之间的类标进行相似度排序;
步骤4:计算目标损失函数,先计算训练集中图像哈希编码之间的汉明距离并进行排序,与类标的相似度排序比较进行检索分支损失函数的计算;该目标损失函数由颜色及类别属性分类任务multihinge-loss与哈希函数学习任务的triplet-loss共同组成,经随机梯度下降法与后向传播改变网络参数以得到深度学习哈希编码函数;
步骤5:对于新的查询图像,利用步骤4学习到的哈希编码函数对图像进行哈希编码,计算查询图像与测试集中图像的哈希编码之间的汉明距离,采用该汉明距离表征查询图像与测试集中图像之间的相似程度;
步骤6:根据查询图像与测试集中图像的哈希编码之间的汉明距离得到距离的大小序列进行相似度得分排序来得到检索图像列表,根据被检索图像路径所属的视频段得到相应视频的搜索。
2.根据权利要求1所述的方法,其特征在于:所述步骤1中,对交通监控视频数据集做运动物体分割识别得到分离好的运动目标,并且采用人工标注方式标注每帧图像上的目标类别与目标颜色,目标视频帧数据集中的图片路径信息包含其所属的视频段标号。
3.根据权利要求1所述的方法,其特征在于:所述步骤2中,深度卷积神经网络为alex—net网络结构,包含五个卷积层,两个全连接层以及一个哈希编码层;哈希编码函数表达为:
上式中,k表示第k个哈希编码函数,sgn()为符号函数,为第k个哈希编码值的权重,xi为第i张图像;最终第i张图像的哈希编码函数表述为:
h(xi)=[h1(xi),h2(xi),…,hk(xi)]。
4.根据权利要求1所述方法,其特征在于:所述步骤3中,对图像之间的类标进行相似度排序,具体是:对于训练集中的图像{X1,X2,X3,…,XN},每一张图与其他图进行类标的权重相似度得分排序,N表示训练数据集中的图像数目;采用以下公式:
其中,score(Xi,Xj)代表图像Xi和Xj进行类标的带权重相似度得分排序;w1与w2分别代表类别类标与颜色类标的权重;函数g[…]输入两个集合,返回两个集合相同的个数;表示属于第i张图像的类别类标、颜色类标的集合;排序最终得到一个第i张图Xi与其他图比较得到的关于i的综合相似度排序列表。
5.根据权利要求4所述的方法,其特征在于:所述步骤4中,颜色与类别属性分类采用SVM分类类器,目标损失函数hinge loss在SVM分类器的最大化间隔分类中,对输出t=±1和分类器分数y,预测值y的hinge loss定义如下:
l(y)=max(0,1-t·y)
当t和y有相同的符号时,即表示y预测出正确的分类;
|y|≥1
此时的hinge loss
l(y)=0
但是如果它们的符号相反,l(y)则会根据y线性增加;所属步骤4中哈希编码函数学习任务的目标损失函数是基于图像类标相似度排序三元组的triplet-loss,三元组的三个元素表示为[h(xi),h(xj),h(xk)],其中[i,j,k]是由步骤3中通过类标的score计算得到的排序三元组;通过学习让表征图像i与图像j之间的距离尽可能小,表征图像i与图像k之间的距离尽可能大,并让i、j之间的距离与i、k之间的距离有一个最小间隔α,目标损失函数表示为:
这里距离用汉明距离度量,[·]+表示[·]内的值大于零时取该值为损失,小于零时损失为零。
6.根据权利要求5所述的方法,其特征在于:所述步骤5中,查询图像输入,采用步骤4中得到的深度哈希函数对查询图像进行哈希编码,数据库里面的每一幅图已经用哈希编码方式储存;汉明距离定义为将其中一个变为另外一个所需要作的最小替换次数,简单用矩阵相乘方式得到;汉明距离d(h)公示表达为:
d(h)=[h(Xi)]*[h(Xj)]
h(Xi),h(Xj)分别表示第i张图与第j张图的哈希编码函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610806287.6A CN106407352B (zh) | 2016-09-06 | 2016-09-06 | 基于深度学习的交通图像检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610806287.6A CN106407352B (zh) | 2016-09-06 | 2016-09-06 | 基于深度学习的交通图像检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106407352A true CN106407352A (zh) | 2017-02-15 |
CN106407352B CN106407352B (zh) | 2019-09-10 |
Family
ID=57998751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610806287.6A Active CN106407352B (zh) | 2016-09-06 | 2016-09-06 | 基于深度学习的交通图像检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106407352B (zh) |
Cited By (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106713929A (zh) * | 2017-02-16 | 2017-05-24 | 清华大学深圳研究生院 | 一种基于深度神经网络的视频帧间预测增强方法 |
CN107169106A (zh) * | 2017-05-18 | 2017-09-15 | 珠海习悦信息技术有限公司 | 视频检索方法、装置、存储介质及处理器 |
CN107229757A (zh) * | 2017-06-30 | 2017-10-03 | 中国科学院计算技术研究所 | 基于深度学习和哈希编码的视频检索方法 |
CN107330074A (zh) * | 2017-06-30 | 2017-11-07 | 中国科学院计算技术研究所 | 基于深度学习和哈希编码的图像检索方法 |
CN107391646A (zh) * | 2017-07-13 | 2017-11-24 | 清华大学 | 一种视频图像的语义信息提取方法及装置 |
CN107451189A (zh) * | 2017-06-20 | 2017-12-08 | 中山大学 | 一种基于哈希编码的无监督图像检索方法 |
CN107480785A (zh) * | 2017-07-04 | 2017-12-15 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法及装置 |
CN107679078A (zh) * | 2017-08-29 | 2018-02-09 | 银江股份有限公司 | 一种基于深度学习的卡口图像车辆快速检索方法及*** |
CN107886073A (zh) * | 2017-11-10 | 2018-04-06 | 重庆邮电大学 | 一种基于卷积神经网络的细粒度车辆多属性识别方法 |
CN107977461A (zh) * | 2017-12-21 | 2018-05-01 | 厦门美图之家科技有限公司 | 一种视频特征提取方法及装置 |
CN107992611A (zh) * | 2017-12-15 | 2018-05-04 | 清华大学 | 基于柯西分布哈希方法的高维数据检索方法与*** |
CN108171136A (zh) * | 2017-12-21 | 2018-06-15 | 浙江银江研究院有限公司 | 一种多任务卡口车辆以图搜图的***及方法 |
CN108629414A (zh) * | 2018-05-09 | 2018-10-09 | 清华大学 | 深度哈希学习方法及装置 |
CN108959522A (zh) * | 2018-04-26 | 2018-12-07 | 浙江工业大学 | 基于半监督对抗生成网络的迁移检索方法 |
CN109033107A (zh) * | 2017-06-09 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 图像检索方法和装置、计算机设备和存储介质 |
CN109241317A (zh) * | 2018-09-13 | 2019-01-18 | 北京工商大学 | 基于深度学习网络中度量损失的行人哈希检索方法 |
CN109272044A (zh) * | 2018-09-19 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种图像相似度确定方法、装置、设备及存储介质 |
CN109284420A (zh) * | 2018-08-31 | 2019-01-29 | 国科赛思(北京)科技有限公司 | 电子元器件替代选型***及替代选型方法 |
CN109522436A (zh) * | 2018-11-29 | 2019-03-26 | 厦门美图之家科技有限公司 | 相似图像查找方法及装置 |
CN109783671A (zh) * | 2019-01-30 | 2019-05-21 | 京东方科技集团股份有限公司 | 一种以图搜图的方法、计算机可读介质及服务器 |
CN109919320A (zh) * | 2019-01-23 | 2019-06-21 | 西北工业大学 | 基于语义层次结构的Triplet网络学习方法 |
CN109918532A (zh) * | 2019-03-08 | 2019-06-21 | 苏州大学 | 图像检索方法、装置、设备及计算机可读存储介质 |
CN110072119A (zh) * | 2019-04-11 | 2019-07-30 | 西安交通大学 | 一种基于深度学习网络的内容感知视频自适应传输方法 |
CN110110120A (zh) * | 2018-06-11 | 2019-08-09 | 北方工业大学 | 一种基于深度学习的图像检索方法和装置 |
CN110210988A (zh) * | 2019-05-31 | 2019-09-06 | 北京理工大学 | 一种基于深度哈希的符号社交网络嵌入方法 |
CN110298228A (zh) * | 2019-04-25 | 2019-10-01 | 西北大学 | 一种多目标图像检索方法 |
CN110826363A (zh) * | 2018-08-09 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 图片指纹生成方法及装置 |
CN111125416A (zh) * | 2019-12-27 | 2020-05-08 | 郑州轻工业大学 | 一种基于多特征融合的图像检索方法 |
CN111626408A (zh) * | 2020-05-22 | 2020-09-04 | 深圳前海微众银行股份有限公司 | 哈希编码方法、装置、设备及可读存储介质 |
CN111968171A (zh) * | 2020-08-13 | 2020-11-20 | 北京航空航天大学 | 基于人工智能的飞机油量测量方法及*** |
CN112905820A (zh) * | 2021-03-30 | 2021-06-04 | 山西大学 | 一种基于逻辑学习的多图检索方法 |
CN112949722A (zh) * | 2021-03-05 | 2021-06-11 | 北京大学深圳研究生院 | 一种基于图像组合特征表述的少样本学习方法及*** |
CN113032612A (zh) * | 2021-03-12 | 2021-06-25 | 西北大学 | 一种多目标图像检索模型的构建方法及检索方法和装置 |
CN113326393A (zh) * | 2021-05-31 | 2021-08-31 | 西安理工大学 | 一种基于深度哈希特征和异构并行处理的图像检索方法 |
CN113344012A (zh) * | 2021-07-14 | 2021-09-03 | 马上消费金融股份有限公司 | 物品识别方法、装置及设备 |
CN113744203A (zh) * | 2021-08-13 | 2021-12-03 | 澳门科技大学 | 基于多任务辅助的上消化道病变区域确定方法及装置 |
US11429820B2 (en) * | 2018-03-13 | 2022-08-30 | Recogni Inc. | Methods for inter-camera recognition of individuals and their properties |
CN111563184B (zh) * | 2020-03-25 | 2023-04-18 | 中山大学 | 一种基于深度学习的视频哈希检索表征转换方法 |
WO2023071122A1 (zh) * | 2021-10-29 | 2023-05-04 | 广东坚美铝型材厂(集团)有限公司 | 基于不均衡间隔的语义特征自学习方法、设备及存储介质 |
CN116467485A (zh) * | 2023-03-31 | 2023-07-21 | 沈阳甄视智能科技有限公司 | 一种视频图像检索构建***及其方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030177151A1 (en) * | 2002-03-14 | 2003-09-18 | Yong Ju Lee | Method for managing directories of large-scale file system |
CN104915643A (zh) * | 2015-05-26 | 2015-09-16 | 中山大学 | 一种基于深度学习的行人再标识方法 |
CN105512289A (zh) * | 2015-12-07 | 2016-04-20 | 郑州金惠计算机***工程有限公司 | 基于深度学习和哈希的图像检索方法 |
-
2016
- 2016-09-06 CN CN201610806287.6A patent/CN106407352B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030177151A1 (en) * | 2002-03-14 | 2003-09-18 | Yong Ju Lee | Method for managing directories of large-scale file system |
US6961739B2 (en) * | 2002-03-14 | 2005-11-01 | Electronics And Telecommunciations Research Institute | Method for managing directories of large-scale file system |
CN104915643A (zh) * | 2015-05-26 | 2015-09-16 | 中山大学 | 一种基于深度学习的行人再标识方法 |
CN105512289A (zh) * | 2015-12-07 | 2016-04-20 | 郑州金惠计算机***工程有限公司 | 基于深度学习和哈希的图像检索方法 |
Cited By (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106713929B (zh) * | 2017-02-16 | 2019-06-28 | 清华大学深圳研究生院 | 一种基于深度神经网络的视频帧间预测增强方法 |
CN106713929A (zh) * | 2017-02-16 | 2017-05-24 | 清华大学深圳研究生院 | 一种基于深度神经网络的视频帧间预测增强方法 |
CN107169106A (zh) * | 2017-05-18 | 2017-09-15 | 珠海习悦信息技术有限公司 | 视频检索方法、装置、存储介质及处理器 |
CN107169106B (zh) * | 2017-05-18 | 2023-08-18 | 珠海习悦信息技术有限公司 | 视频检索方法、装置、存储介质及处理器 |
CN109033107A (zh) * | 2017-06-09 | 2018-12-18 | 腾讯科技(深圳)有限公司 | 图像检索方法和装置、计算机设备和存储介质 |
CN109033107B (zh) * | 2017-06-09 | 2021-09-17 | 腾讯科技(深圳)有限公司 | 图像检索方法和装置、计算机设备和存储介质 |
CN107451189A (zh) * | 2017-06-20 | 2017-12-08 | 中山大学 | 一种基于哈希编码的无监督图像检索方法 |
CN107229757A (zh) * | 2017-06-30 | 2017-10-03 | 中国科学院计算技术研究所 | 基于深度学习和哈希编码的视频检索方法 |
CN107330074A (zh) * | 2017-06-30 | 2017-11-07 | 中国科学院计算技术研究所 | 基于深度学习和哈希编码的图像检索方法 |
CN107330074B (zh) * | 2017-06-30 | 2020-05-26 | 中国科学院计算技术研究所 | 基于深度学习和哈希编码的图像检索方法 |
CN107480785A (zh) * | 2017-07-04 | 2017-12-15 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法及装置 |
CN107480785B (zh) * | 2017-07-04 | 2021-01-29 | 北京小米移动软件有限公司 | 卷积神经网络的训练方法及装置 |
CN107391646B (zh) * | 2017-07-13 | 2020-04-10 | 清华大学 | 一种视频图像的语义信息提取方法及装置 |
CN107391646A (zh) * | 2017-07-13 | 2017-11-24 | 清华大学 | 一种视频图像的语义信息提取方法及装置 |
CN107679078A (zh) * | 2017-08-29 | 2018-02-09 | 银江股份有限公司 | 一种基于深度学习的卡口图像车辆快速检索方法及*** |
CN107679078B (zh) * | 2017-08-29 | 2020-01-10 | 银江股份有限公司 | 一种基于深度学习的卡口图像车辆快速检索方法及*** |
CN107886073A (zh) * | 2017-11-10 | 2018-04-06 | 重庆邮电大学 | 一种基于卷积神经网络的细粒度车辆多属性识别方法 |
CN107886073B (zh) * | 2017-11-10 | 2021-07-27 | 重庆邮电大学 | 一种基于卷积神经网络的细粒度车辆多属性识别方法 |
CN107992611A (zh) * | 2017-12-15 | 2018-05-04 | 清华大学 | 基于柯西分布哈希方法的高维数据检索方法与*** |
CN108171136B (zh) * | 2017-12-21 | 2020-12-15 | 浙江银江研究院有限公司 | 一种多任务卡口车辆以图搜图的***及方法 |
CN107977461A (zh) * | 2017-12-21 | 2018-05-01 | 厦门美图之家科技有限公司 | 一种视频特征提取方法及装置 |
CN108171136A (zh) * | 2017-12-21 | 2018-06-15 | 浙江银江研究院有限公司 | 一种多任务卡口车辆以图搜图的***及方法 |
US11429820B2 (en) * | 2018-03-13 | 2022-08-30 | Recogni Inc. | Methods for inter-camera recognition of individuals and their properties |
CN108959522B (zh) * | 2018-04-26 | 2022-06-17 | 浙江工业大学 | 基于半监督对抗生成网络的迁移检索方法 |
CN108959522A (zh) * | 2018-04-26 | 2018-12-07 | 浙江工业大学 | 基于半监督对抗生成网络的迁移检索方法 |
CN108629414A (zh) * | 2018-05-09 | 2018-10-09 | 清华大学 | 深度哈希学习方法及装置 |
CN108629414B (zh) * | 2018-05-09 | 2020-04-14 | 清华大学 | 深度哈希学习方法及装置 |
CN110110120A (zh) * | 2018-06-11 | 2019-08-09 | 北方工业大学 | 一种基于深度学习的图像检索方法和装置 |
CN110826363A (zh) * | 2018-08-09 | 2020-02-21 | 阿里巴巴集团控股有限公司 | 图片指纹生成方法及装置 |
CN109284420A (zh) * | 2018-08-31 | 2019-01-29 | 国科赛思(北京)科技有限公司 | 电子元器件替代选型***及替代选型方法 |
CN109241317A (zh) * | 2018-09-13 | 2019-01-18 | 北京工商大学 | 基于深度学习网络中度量损失的行人哈希检索方法 |
CN109241317B (zh) * | 2018-09-13 | 2022-01-11 | 北京工商大学 | 基于深度学习网络中度量损失的行人哈希检索方法 |
CN109272044A (zh) * | 2018-09-19 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种图像相似度确定方法、装置、设备及存储介质 |
CN109522436A (zh) * | 2018-11-29 | 2019-03-26 | 厦门美图之家科技有限公司 | 相似图像查找方法及装置 |
CN109919320B (zh) * | 2019-01-23 | 2022-04-01 | 西北工业大学 | 基于语义层次结构的Triplet网络学习方法 |
CN109919320A (zh) * | 2019-01-23 | 2019-06-21 | 西北工业大学 | 基于语义层次结构的Triplet网络学习方法 |
US11763164B2 (en) | 2019-01-30 | 2023-09-19 | Boe Technology Group Co., Ltd. | Image-to-image search method, computer-readable storage medium and server |
CN109783671A (zh) * | 2019-01-30 | 2019-05-21 | 京东方科技集团股份有限公司 | 一种以图搜图的方法、计算机可读介质及服务器 |
CN109918532B (zh) * | 2019-03-08 | 2023-08-18 | 苏州大学 | 图像检索方法、装置、设备及计算机可读存储介质 |
CN109918532A (zh) * | 2019-03-08 | 2019-06-21 | 苏州大学 | 图像检索方法、装置、设备及计算机可读存储介质 |
CN110072119A (zh) * | 2019-04-11 | 2019-07-30 | 西安交通大学 | 一种基于深度学习网络的内容感知视频自适应传输方法 |
CN110298228A (zh) * | 2019-04-25 | 2019-10-01 | 西北大学 | 一种多目标图像检索方法 |
CN110210988A (zh) * | 2019-05-31 | 2019-09-06 | 北京理工大学 | 一种基于深度哈希的符号社交网络嵌入方法 |
CN110210988B (zh) * | 2019-05-31 | 2021-04-27 | 北京理工大学 | 一种基于深度哈希的符号社交网络嵌入方法 |
CN111125416A (zh) * | 2019-12-27 | 2020-05-08 | 郑州轻工业大学 | 一种基于多特征融合的图像检索方法 |
CN111563184B (zh) * | 2020-03-25 | 2023-04-18 | 中山大学 | 一种基于深度学习的视频哈希检索表征转换方法 |
CN111626408B (zh) * | 2020-05-22 | 2021-08-06 | 深圳前海微众银行股份有限公司 | 哈希编码方法、装置、设备及可读存储介质 |
CN111626408A (zh) * | 2020-05-22 | 2020-09-04 | 深圳前海微众银行股份有限公司 | 哈希编码方法、装置、设备及可读存储介质 |
CN111968171A (zh) * | 2020-08-13 | 2020-11-20 | 北京航空航天大学 | 基于人工智能的飞机油量测量方法及*** |
CN112949722A (zh) * | 2021-03-05 | 2021-06-11 | 北京大学深圳研究生院 | 一种基于图像组合特征表述的少样本学习方法及*** |
CN112949722B (zh) * | 2021-03-05 | 2023-05-05 | 北京大学深圳研究生院 | 一种基于图像组合特征表述的少样本学习方法及*** |
CN113032612B (zh) * | 2021-03-12 | 2023-04-11 | 西北大学 | 一种多目标图像检索模型的构建方法及检索方法和装置 |
CN113032612A (zh) * | 2021-03-12 | 2021-06-25 | 西北大学 | 一种多目标图像检索模型的构建方法及检索方法和装置 |
CN112905820A (zh) * | 2021-03-30 | 2021-06-04 | 山西大学 | 一种基于逻辑学习的多图检索方法 |
CN112905820B (zh) * | 2021-03-30 | 2022-11-11 | 山西大学 | 一种基于逻辑学习的多图检索方法 |
CN113326393B (zh) * | 2021-05-31 | 2023-04-07 | 深圳前瞻资讯股份有限公司 | 一种基于深度哈希特征和异构并行处理的图像检索方法 |
CN113326393A (zh) * | 2021-05-31 | 2021-08-31 | 西安理工大学 | 一种基于深度哈希特征和异构并行处理的图像检索方法 |
CN113344012A (zh) * | 2021-07-14 | 2021-09-03 | 马上消费金融股份有限公司 | 物品识别方法、装置及设备 |
CN113744203A (zh) * | 2021-08-13 | 2021-12-03 | 澳门科技大学 | 基于多任务辅助的上消化道病变区域确定方法及装置 |
WO2023071122A1 (zh) * | 2021-10-29 | 2023-05-04 | 广东坚美铝型材厂(集团)有限公司 | 基于不均衡间隔的语义特征自学习方法、设备及存储介质 |
CN116467485A (zh) * | 2023-03-31 | 2023-07-21 | 沈阳甄视智能科技有限公司 | 一种视频图像检索构建***及其方法 |
CN116467485B (zh) * | 2023-03-31 | 2024-06-04 | 沈阳甄视智能科技有限公司 | 一种视频图像检索构建***及其方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106407352B (zh) | 2019-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106407352B (zh) | 基于深度学习的交通图像检索方法 | |
CN106227851B (zh) | 基于深度卷积神经网络的分层深度搜索的图像检索方法 | |
Wang et al. | Enhancing sketch-based image retrieval by cnn semantic re-ranking | |
Lu et al. | Object detection based on SSD-ResNet | |
CN106022300B (zh) | 基于级联深度学习的交通标志识别方法和*** | |
CN107330074B (zh) | 基于深度学习和哈希编码的图像检索方法 | |
CN110059206A (zh) | 一种基于深度表征学习的大规模哈希图像检索方法 | |
CN109947963A (zh) | 一种基于深度学习的多尺度哈希检索方法 | |
CN102289522B (zh) | 一种对于文本智能分类的方法 | |
CN105117429A (zh) | 基于主动学习和多标签多示例学习的场景图像标注方法 | |
CN106682696A (zh) | 基于在线示例分类器精化的多示例检测网络及其训练方法 | |
CN109783818A (zh) | 一种企业行业多标签分类方法 | |
CN105469096A (zh) | 一种基于哈希二值编码的特征袋图像检索方法 | |
CN103186538A (zh) | 一种图像分类方法和装置、图像检索方法和装置 | |
CN104573669A (zh) | 图像物体检测方法 | |
CN103020122A (zh) | 一种基于半监督聚类的迁移学习方法 | |
CN104834748A (zh) | 一种利用基于深度语义排序哈希编码的图像检索方法 | |
CN103336795A (zh) | 基于多特征的视频索引方法 | |
CN104346440A (zh) | 一种基于神经网络的跨媒体哈希索引方法 | |
CN106815604A (zh) | 基于多层信息融合的注视点检测方法 | |
CN107992890B (zh) | 一种基于局部特征的多视角分类器及设计方法 | |
CN102129470A (zh) | 标签聚类方法和*** | |
CN107220373A (zh) | 一种基于医学征象和卷积神经网络的肺结节ct图像哈希检索方法 | |
CN103927394A (zh) | 一种基于svm的多标签主动学习分类方法及*** | |
CN110188346A (zh) | 一种基于信息抽取的网络安全法案件智能研判方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |