CN109740660A - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN109740660A
CN109740660A CN201811619251.2A CN201811619251A CN109740660A CN 109740660 A CN109740660 A CN 109740660A CN 201811619251 A CN201811619251 A CN 201811619251A CN 109740660 A CN109740660 A CN 109740660A
Authority
CN
China
Prior art keywords
sample
cluster centre
mentioned
distance
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811619251.2A
Other languages
English (en)
Inventor
戴世稳
钟斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Intellifusion Technologies Co Ltd
Original Assignee
Shenzhen Intellifusion Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Intellifusion Technologies Co Ltd filed Critical Shenzhen Intellifusion Technologies Co Ltd
Priority to CN201811619251.2A priority Critical patent/CN109740660A/zh
Publication of CN109740660A publication Critical patent/CN109740660A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种图像处理方法及装置。其中,该方法包括:确定与第一特征向量对应的第一聚类中心;第一特征向量为查询样本的特征向量,第一聚类中心为根据第一特征向量与第二聚类中心的乘积量化距离得到,第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,第二特征向量为样本库的特征向量;计算第一聚类中心第二聚类中心的汉明距离;根据汉明距离从样本库中确定出与查询样本相似度高的样本集合;根据第一特征向量与第三特征向量的乘积量化距离从样本集合中确定出目标样本;目标样本为与查询样本相似度最高的样本,第三特征向量为样本集合中每个样本的特征向量。采用本申请,可提高查询样本的查询效率。

Description

图像处理方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像处理方法及装置。
背景技术
随着大数据的发展,如何从海量的库样本中筛选出与查询样本相似的图像亟待解决。
一般地,可通过乘积量化(product quantization,PQ)方法,具体的,可将样本图像的特征空间分解为多个低维子空间的笛卡尔乘积,然后单独地对每一个子空间进行量化。更具体的,在训练阶段,每一个子空间经过聚类后可得到k个聚类中心,所有子空间的聚类中心的笛卡尔乘积构成了一个对全空间的密集划分。经过量化学习后,对于给定的查询样本,通过查表的方式可以计算出查询样本和库中样本的非对称距离,从而可得到与查询样本相似的图像。
然而,上述所示的方法计算量非常大,查询效率低下。
发明内容
本申请提供了一种图像处理方法及装置,可有效提高样本的查询效率。
第一方面,本申请实施例提供了一种图像处理方法,包括:
确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;
计算所述第一聚类中心与所述第二聚类中心的汉明距离;
根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;
根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。
本申请实施例中,通过计算查询样本和样本库中第二聚类中心的乘积量化距离,可以将该查询样本归到与样本库中与其距离最近的第一聚类中心;然后通过计算上述第一聚类中心和上述第二聚类中心的汉明距离,可以得到上述样本库中与上述查询样本相似度高的样本集合;进一步通过计算该查询样本与上述样本集合的第三特征向量的乘积量化距离,可确定出与上述查询样本相似度最高的目标样本。实施本申请实施例,由于汉明距离的计算方式简单、高效,因此通过汉明距离可以快速的确定上述样本集合,实现对整个样本库的快速过滤;进一步通过计算上述查询样本与上述样本集合的乘积量化距离(如非对称距离)来确定目标样本,可避免计算查询样本与整个样本库中每个样本的乘积量化距离,大大的减少了计算量,提高了查询效率。
在一种可能的实现方式中,根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合,包括:
根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;
根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;
根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。
本申请实施例中,通过上述汉明距离集合可以确定上述查询样本与上述样本库中每个样本的参考相似值,该参考相似值可表示查询样本与样本库中每个样本的相似程度(如汉明距离越小则表示参考相似值越高),从而通过上述方式即汉明距离值的大小可直观的反映参考相似值的大小,从而快速的确定上述样本集合,提高查询效率。
在一种可能的实现方式中,所述根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,包括:
将所述汉明距离集合中所包含的汉明距离的和确定为所述查询样本与所述样本库中每个样本的参考相似值。
本申请实施例中,通过汉明距离集合中所包含的汉明距离的和来确定参考相似值,不仅可准确的表示上述参考相似值,而且简单高效。
在一种可能的实现方式中,所述计算所述第一聚类中心与所述第二聚类中心的汉明距离之前,所述方法还包括:
对所述第二聚类中心进行编码,得到所述第二聚类中心的乘积量化码;
根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码。
本申请实施例中,通过第二聚类中心的乘积量化码来得到该第二聚类中心的汉明码,不仅使得该第二聚类中心的汉明码具有索引编码的意义,还具有汉明码的意义,从而可使得图像处理装置能够得到第二聚类中心与第一聚类中心的汉明距离,进而有效提高了计算速度。
在一种可能的实现方式中,根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码,包括:
确定所述第二聚类中心的转换码;
计算所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的乘积量化距离,以及所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的汉明距离;
根据所述乘积量化距离以及所述汉明距离,确定所述第二聚类中心的转换码为所述第二聚类中心的汉明码。
本申请实施例中,通过上述第二聚类中心的乘积量化码与上述第二聚类中心的转换码的乘积量化距离以及汉明距离可以确定上述汉明码,通过上述方式可以使上述乘积量化码具有汉明码的意义。
在一种可能的实现方式中,所述计算所述第一聚类中心与第二聚类中心的汉明距离,包括:
根据所述第一聚类中心的汉明码与所述第二聚类中的汉明码,计算所述第一聚类中心与所述第二聚类中心的汉明距离。
本申请实施例中,通过上述第一聚类中心和上述第二聚类中心的汉明码来计算汉明距离,可以使汉明距离的计算更加高效,提高了计算速度,提高了确定与查询样本最相似的样本的效率。
第二方面,本申请实施例提供了一种图像处理装置,包括:
第一确定单元,用于确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;
计算单元,用于计算所述第一聚类中心与所述第二聚类中心的汉明距离;
第二确定单元,用于根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;
第三确定单元,用于根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。
在一种可能的实现方式中,所述第二确定单元包括:
第一确定子单元,根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;
第二确定子单元,用于根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;
第三确定子单元,用于根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。
在一种可能的实现方式中,所述第二确定子单元,具体用于将所述汉明距离集合中所包含的汉明距离的和确定为所述查询样本与所述样本库中每个样本的参考相似值。
在一种可能的实现方式中,所述装置还包括:
第一编码单元,用于对所述第二聚类中心进行编码,得到所述第二聚类中心的PQ码;
第二编码单元,用于根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码。
在一种可能的实现方式中,所述第二编码单元包括:
第四确定子单元,用于确定所述第二聚类中心的转换码;
计算子单元,用于计算所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的乘积量化距离,以及所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的汉明距离;
第五确定子单元,用于根据所述乘积量化距离以及所述汉明距离,确定所述第二聚类中心的转换码为所述第二聚类中心的汉明码。
在一种可能的实现方式中,所述计算单元,具体用于根据所述第一聚类中心的汉明码与所述第二聚类中的汉明码,计算所述第一聚类中心与所述第二聚类中心的汉明距离。
第三方面,本申请实施例还提供了一种图像处理装置,包括:处理器和存储器,所述处理器和所述存储器耦合;其中,所述存储器存储有程序指令;所述程序指令被所述处理器执行时,使所述处理器执行如第一方面所述的相应的方法。
在一种可能的实现方式中,该图像处理装置还包括输入输出接口,所述输入输出接口可用于与其他设备或装置等等进行通信。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被图像处理装置的处理器执行时,使所述处理器执行第一方面所述的方法。
第五方面,本申请实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1是本申请实施例提供的一种图像处理方法的流程示意图;
图2是本申请实施例提供的一种对样本库进行量化的流程示意图;
图3是本申请实施例提供的一种第二聚类中心的编号示意图;
图4是本申请实施例提供的一种汉明码的编码方法的流程示意图;
图5是本申请实施例提供的另一种汉明码的编码方法的流程示意图;
图6是本申请实施例提供的一种PQ码和汉明码编码示意图;
图7是本申请实施例提供的一种图像处理装置的结构示意图;
图8是本申请实施例提供的一种第二确定单元的结构示意图;
图9是本申请实施例提供的另一种图像处理装置的结构示意图;
图10是本申请实施例提供的一种第二编码单元的结构示意图;
图11是本申请实施例提供的又一种图像处理装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同的对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法或设备固有的其他步骤或单元。
参见图1,图1是本申请实施例提供的一种图像处理方法的流程示意图,该图像处理方法可应用于图像处理装置,该图像处理装置可包括服务器、终端设备或芯片,该终端设备可包括手机、台式电脑、手提电脑和其他设备等等,本申请实施例对于该图像处理装置的具体形式不作限定。
如图1所示,该图像处理方法包括:
101、确定与第一特征向量对应的第一聚类中心;其中,上述第一特征向量为查询样本的特征向量,且上述第一特征向量包括N个特征子向量,上述N为大于或等于2的整数,上述第一聚类中心为根据上述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化PQ距离得到,上述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,上述第二特征向量为样本库的特征向量。
本申请实施例中,查询样本可理解为需要进行图像匹配(如待匹配)的图像,即需要与样本库中的样本图像进行匹配的图像。第一特征向量可通过提取查询样本的特征来得到,如可通过提取查询样本的特征点来得到第一特征向量。其中,查询样本特征点的提取方法很多,举例来说,可以通过卷积神经网络、尺度不变特征转换算法(scale-invariantfeature transform,SIFT)、Harris角点检测算法、FAST特征检测算法、SURF特征点检测算法、图像局部显著性特征点测算法GLOH等等算法来提取查询样本的特征点。可理解,本申请实施例中对于查询样本的特征点提取方法不作唯一性限定。
其中,上述样本库中可包括大量样本图像,如样本库中可包括至少两个样本图像。通过对样本库中包括的至少两个样本图像进行特征提取,可以得到这些样本图像的特征向量(即上述第二特征向量),然后对该第二特征向量进行聚类,便可得到上述第二聚类中心。可理解,上述第二特征向量可理解为样本库中包括的至少两个样本图像的特征向量的集合。其中,对样本库中包括的至少两个样本图像的特征点提取方法可参考前述实施方式,这里不再一一详述。
具体的,可以通过乘积量化方法(product quantization,PQ)对第二特征向量进行量化,以及通过k-means聚类算法进行聚类,从而得到上述第二聚类中心。
其中,PQ算法是一种检索算法,是在矢量量化(vector quantization,VQ)的基础上发展而来。k-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。k-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最优分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。可理解,本申请实施例中对于上述第二特征向量的量化方法不作限定,以及对于采用哪种聚类算法得到上述第二聚类中心不作限定。
作为示例,本申请实施例提供了一种对样本库进行量化的方法。参见图2,图2是本申请实施例提供的一种对样本库进行量化的流程示意图,如图2所示,该方法具体可包括:
1、空间切分
由于上述样本库中的第二特征向量的维度较大,因此,需要对该第二特征向量进行降维(即上述空间切分)。假设该样本库中每个样本的维度为D维,首先,PQ算法会将该D维的样本切分成互不相交的N个短向量(即上述N个特征子向量)。
举例来说,假设上述第二特征向量中包括的每个特征向量均为128维,如图2所示,S可理解为样本库中所包括的样本的个数(该S为大于或等于2的整数),即行向量可表示每个样本的特征向量,且列向量总共包括128列。则可以将该第二特征向量中包括的每个128维的的特征向量进行切分,如可切分成4个短向量,也就是说,该第二特征向量中包括的每个128维的特征向量被切分成了4个32维的短向量。也就是说,该第二特征向量被切分成了4个特征子向量(即4个部分的向量)。即可将该第二特征向量的1~32个浮点数(即该第二特征向量可以为浮点数)作为第1部分(该第1部分包括至少两个短向量),第33~64个浮点数作为第2部分(该第2部分包括至少两个短向量),第65~96个浮点数作为第3部分(该第3部分包括至少两个短向量),第97~128个浮点数作为第4部分(该第4部分包括至少两个短向量)。
可理解,N个特征子向量即为上述4个部分的向量,每个特征子向量都包括至少两个短向量,如图2所示,若该样本库中所包括的样本个数为S,则每个特征子向量都包括S个短向量。
2、量化
经过上述降维之后,依次量化上述4个部分的特征子向量,量化的过程就是计算与每个短向量距离最近的聚类中心。可以通过k-means算法对上述4个部分的特征子向量进行聚类。以下将以对上述第1部分的特征子向量进行聚类为例进行说明,如下上述:
(1)对于第1部分包括的S条短向量中选取k1条作为该第1部分的聚类中心,其中,上述S为大于或等于2的整数。
(2)将该S条短向量分别与k1个聚类中心计算欧式距离,该S条短向量与哪个聚类中心的距离最近,就将该短向量归属于哪个聚类中心。举例来说,将该S条短向量中的其中一个短向量记为S1,将该k1个聚类中心的其中一个聚类中心记为k11,该短向量S1与上述聚类中心k11的欧式距离最近,则该短向量S1就归属于该聚类中心k11。
其中,欧几里得度量(euclidean metric)(也称欧氏距离)是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。在二维和三维空间中的欧氏距离就是两点之间的实际距离。
(3)对于上述k1个聚类中心的每个聚类中心,将上述步骤(2)中归属于该聚类中心的短向量,对应的每个浮点数求以及取均值,将最后得到的均值向量作为新的k1个聚类中心。
(4)若聚类次数或者聚类误差减少到一定范围则终止聚类,步骤(3)中得到的新的k1个聚类中心即为最终的上述第1部分的S条短向量的k1个聚类中心,否则回到步骤(2)。
经过上述聚类过程,可以将D=128维的第二特征向量中包括的每个特征向量切分成N=4个的32维的短向量,同时每个短向量都对应一个量化的索引值,索引值即与该短向量距离最近的聚类中心的编号,第二特征向量中包括的每个特征向量可以压缩成N个索引值构成的压缩向量。也就是说,压缩向量其实就是N个索引值,每个索引值对应一个聚类中心,所以要同时保存压缩向量和聚类中心。如图2所示,最终上述第1部分所包括的短向量的聚类中心的数量为256。
可理解,至于其他3个部分的聚类过程可以参考该第1部分的聚类过程,在此不再一一详述。最终,得到256*4个聚类中心,该256*4个聚类中心即为上述第二聚类中心。也就是说,该第二聚类中心包括256*4个聚类中心,可理解,每个聚类中心还可理解为一个向量。举例来说,可以将由上述4个部分的聚类中心表示为K=[k11,k21,k31,k41],其中k11代表上述第1部分中的第二聚类中心,同理,上述k21,k31,k41分别属于第2部分到第4部分中的第二聚类中心。也就是说,本申请实施例中,可以得到至少一个或多个第二聚类中心。
本申请实施例中,同样地,将上述第一特征向量切分成N个特征子向量,且该N的值与上述将第二特征向量切分的数量一致,例如,该N值可以为4。通过该第一特征向量的N个特征子向量与上述第二聚类中心中的每个聚类中心来计算上述PQ距离,其中该PQ距离可以为欧式距离。具体可理解为将第一特征向量***到第二特征向量,从而通过以上所介绍的量化方法(如对样本库的量化方法)来得到第一聚类中心。
举例来说,假设该第一特征子向量为n=[n1,n2,n3,n4],由上述第二聚类中心组成的向量为K=[k11,k21,k31,k41]。计算该向量n和该向量K的欧式距离,可以得到欧式距离d=[d(n1,k11),d(n2,k21),d(n3,k31),d(n4,k41)],并进一步计算d(n1,k11),d(n2,k21),d(n3,k31),d(n4,k41)的距离之和,得到这4个距离的和,记为D。可理解,通过上述第一特征向量与每个第二聚类中心的欧式距离,最终可以得到256个欧式距离(其中一个欧式距离为上述D),然后确定其中一个最小距离值,则与该最小距离值相对应的聚类中心即为上述第一聚类中心。举例来说,若上述D为最小距离值,则由上述第二聚类中心组成的向量为K即为上述第一聚类中心。
实施本实施例,为了确定上述样本库中与上述查询样本最相似的样本图像,可以通过上述方式确定上述第一聚类中心,只需要计算256次欧式距离,大大减少了计算量,可避免该第一特征向量与样本库中第二特征向量所包括的每个特征向量进行计算,提高了计算效率。
102、计算上述第一聚类中心与上述第二聚类中心的汉明距离。
本申请实施例中,汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,如可以以d(x,y)表示两个字x,y之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。汉明距离是以理查德·卫斯里·汉明的名字命名的。在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:
1011101与1001001之间的汉明距离是2;
2143896与2233796之间的汉明距离是3;
"toned"与"roses"之间的汉明距离是3。
其中,参考上述步骤101“每个短向量都对应一个量化的索引值,索引值即与该短向量距离最近的聚类中心的编号,第二特征向量中包括的每个特征向量可以压缩成N个索引值构成的压缩向量。”以及“压缩向量其实就是N个索引值,每个索引值对应一个聚类中心,所以要同时保存压缩向量和聚类中心。”从中可以知道,上述每个第二聚类中心都有一个编号,即上述索引值。
参见图3,图3是本申请实施例提供的一种第二聚类中心的编号示意图。如图3所示,图中的编号为10进制数,也可以将该编号转换成相应的二进制数进行表示,可理解,图3中的编号仅为一种示例,不应作为本申请实施例中对于上述第二聚类中心编号的限定,以及本申请实施例中对于该编号的表示方式不作限定。其中,可以将该编号转换为一种汉明码。至于将该编号转换为汉明码的编码方式可参考图4所示的实现方式,这里先不一一详述。
在一种可能的实现方式中,上述计算上述第一聚类中心与上述第二聚类中心的汉明距离,包括:
根据上述第一聚类中心的汉明码与上述第二聚类中的汉明码,计算上述第一聚类中心与上述第二聚类中心的汉明距离。
通过上述步骤101的计算,最终确定了与上述第一特征向量距离最近的第一聚类中心,因此,该第一聚类中心包括汉明码,上述第一特征向量的汉明码即为该第一聚类中心的汉明码。
举例来说,若上述第一聚类中心的编号为图3中第一行所示编号,即该第一聚类中心的编号为(124,56,132,222),进而根据该编号(124,56,132,222)对应的汉明码与上述第二聚类中心的每个聚类中心对应的汉明码计算汉明距离。
103、根据上述汉明距离从上述样本库中确定出与上述查询样本相似度高的样本集合。
本申请实施例中,上述相似度高低可以通过上述汉明距离的大小来确定,即上述汉明距离越小则相似度越高。
由上述步骤102可以得到上述第一聚类中心与上述第二聚类中心的汉明距离,进而对这些汉明距离值的大小进行排序,并筛选出其中汉明距离值较小的前L1个值,其中,该L1为大于等于2的整数,且该L1<L(该L为第二聚类中心的个数),例如该L1可以为60。其中,该L1个值对应L1个第二聚类中心,则属于该L1个第二聚类中心的样本集合即为与上述查询样本相似度高的样本集合。可理解,本申请实施例还可以根据样本库的数量与样本集合的数量来确定该样本集合,如样本库中包括的样本数量为X,则可以根据汉明距离从包括X个样本的样本库中确定与查询样本相似度高的X1个样本作为样本集合。其中,该X1<X,且X1为大于或等于2的整数,X为大于或等于2是整数。因此,本申请实施例对于该样本集合中具体所包括的样本数量不作唯一性限定。
其中,对于上述过程提到的排序方式可以采用冒泡排序法、快速排序法、直接***排序、选择排序、二分查找等排序方法。可理解,本申请实施例中对于具体的排序方式不作限定。
在一种可能的实现方式中,根据上述汉明距离从上述样本库中确定出与上述查询样本相似度高的样本集合,包括:
根据上述第一聚类中心与上述第二聚类中心的汉明距离,获得上述查询样本与上述样本库中每个样本的汉明距离集合;
根据上述汉明距离集合确定上述查询样本与上述样本库中每个样本的参考相似值,上述参考相似值用于表示上述查询样本与上述样本库中每个样本的相似程度;
根据上述参考相似值从上述样本库中确定出与上述查询样本相似度高的样本集合。
本申请实施例中,上述汉明距离集合可以理解为一种汉明距离的和,或汉明距离的平方。举例来说,假设上述第一聚类中心的汉明编码为(a1,a2,a3,a4),以及假设上述第二聚类中心的汉明编码为(b1,b2,b3,b4),则该汉明距离集合可以理解为d(a1,b1)+d(a2,b2)+d(a3,b3)+d(a4,b4)。或者,该汉明距离集合还可以理解为d(a1,b1)2+d(a2,b2)2+d(a3,b3)2+d(a4,b4)2,其中d(a1,b1)表示该第一聚类中心的特征子向量与该第二聚类中心特征子向量之间的汉明距离。可理解,本申请实施例中对于该汉明距离集合的计算方式不作限定。
对上述汉明距离集合进行排序,可以得到由大到小的一系列数据。根据该由大到小的一系列数据可以确定上述参考相似值,如上述汉明距离越小则表示上述参考相似值越大。可理解,本申请实施例中对于上述参考相似值的表示方式不作限定。筛选出上述参考相似值中比较大的值,确定出与上述查询样本相似度高的样本集合。
或者,还可以通过参考相似值较大的样本占样本库中所包括的样本的总个数的比例来确定上述与上述查询样本相似度高的样本集合。举例来说,若上述样本库包括10亿个样本,若设定上述比例为10%,则上述与上述查询样本相似度高的样本集合数量为1亿。
实施本实施例,通过参考相似值可以快速确定上述与上述查询样本相似度高的样本集合,提高了查询效率。
在一种可能的实现方式中,上述根据上述汉明距离集合确定上述查询样本与上述样本库中每个样本的参考相似值,包括:
将上述汉明距离集合中所包含的汉明距离的和确定为上述查询样本与上述样本库中每个样本的参考相似值。
本申请实施例中,上述参考相似值可以通过上述汉明距离的和来确定。也就是说,上述汉明距离的和即为上述参考相似值,则该参考相似值越高则表示相似度越低。实施本申请实施例,通过汉明距离的和直接表示上述参考相似值,可以避免重新计算参考相似值,减少了计算量,提高了计算效率。
实施本申请实施例,可以通过汉明距离的大小快速的确定与上述查询样本相似度较高的样本集合,且汉明距离的计算过程高效,提高了计算速度。
104、根据上述第一特征向量与第三特征向量的乘积量化PQ距离从上述样本集合中确定出目标样本;其中,上述目标样本为与上述查询样本相似度最高的样本,上述第三特征向量为上述样本集合中每个样本的特征向量,上述第三特征向量包括的N个特征子向量。
本申请实施例中,上述PQ距离可以包括欧式距离。通过计算上述第一特征向量和上述第三特征向量之间的欧式距离,可以确定上述第一特征向量和上述第三特征向量的实际距离。其中,上述第三特征向量为上述样本集合中每个样本的特征向量。可理解,本申请实施例中对于该PQ距离具体是什么不作限定。
上述目标样本为上述样本库中与上述查询样本相似度最高的样本,即与上述查询样本的PQ距离最短的样本。
通过计算上述第一特征向量与第三特征向量的PQ距离,并确定该PQ距离中的最小距离值对应的样本,则该最小距离值对应的样本即为上述目标样本。
实施本实施例,通过计算第一特征向量与第三特征向量的欧式距离(即实际距离),可以精确的确定出与上述查询样本相似度最高的目标样本,提高了查询过程的精确度。
可选的,本申请实施例还提供了一种确定样本集合的方法,即上述步骤102还可以为计算上述第一聚类中心与上述第二特征向量包括的N个特征子向量中每个特征子向量的汉明距离。然后根据该汉明距离从上述样本库中确定出与上述查询样本相似度高的样本集合。
本申请实施例中,通过上述第二聚类中心的索引值可以确定属于该第二聚类中心的第二特征向量的子向量,进一步地,可以确定该特征子向量对应的第二特征向量。因此,可以通过上述第一聚类中心与第二特征向量所包括的每个特征向量直接进行计算来得到上述汉明距离。实施本实施例,由于汉明距离的计算方式比较高效,因此可以提高计算速度。在得到第一聚类中心与第二特征向量的汉明距离之后,便可对该汉明距离进行排序得到距离较小的前L2个值,且该L2<L(该L为第二聚类中心的个数),例如,假设该第二特征向量的数量为10亿,则该L2可以为1亿。也就是说,由该L2个值对应的第二特征向量得到的样本集合即为上述与上述查询样本相似度高的样本集合。可理解,本申请实施例中对于上述L2的具体数值不作限定。
实施本实施例,可以通过上述第一特征向量对应的上述第一聚类中心与上述第二特征向量所包括的每个特征向量直接进行计算来得到上述汉明距离,并对该汉明距离进行排序得到距离较小的前L2个值,最终确定该L2个样本对应的样本集合即为上述与上述查询样本相似度高的样本集合,通过这种方式得到的样本集合,保证了样本库中所有的样本都参与了计算过程,可有效提高精确度。
可选的,在通过图1所示的方法确定出目标样本之后,图1所示的方法还包括:
输出上述目标样本。
本实施例中,输出目标样本可理解为通过图像处理装置显示目标样本,还可理解为通过图像处理装置将该目标样本发送给其他设备或装置,并在其他设备或装置中显示该目标样本,等等。可理解,本实施例对于该目标样本的显示方式不作唯一性限定。
实施本实施例,首先确定与上述查询样本距离最短的上述第一聚类中心,即可确定该查询样本的汉明码,然后通过该查询样本的汉明码(即第一聚类中心的汉明码)与第二聚类中心的汉明码计算汉明距离,通过该汉明距离可以确定出上述与查询样本相似度高的样本集合,进一步地,计算该查询样本的第一特征向量与该样本集合中每个样本的特征向量的PQ距离,可以最终确定出上述目标样本。上述过程中,如果通过计算查询样本和每个样本的欧式距离来确定目标样本,则会导致计算量非常大;然而,通过计算汉明距离可以快速过滤掉样本库中与查询样本相似度低的样本,大大减少了欧式距离计算的次数,能够有效提高查询过程的效率。
上述图1、图2和图3描述了确定与上述查询样本相似度最高的目标样本的过程,以下将描述汉明码的编码过程。
参见图4,图4是本申请实施例提供的一种汉明码的编码方法的流程示意图,该方法可应用于上述图像处理装置。如图4所示,该方法包括:
401、确定第二聚类中心。
本申请实施例中,对于上述步骤401的具体实现方式可参考上述步骤101所示的方式,在此不再一一详述。
402、对第二聚类中心进行编码,得到上述第二聚类中心的PQ码。
本申请实施例中,PQ码为上述第二聚类中心对应的量化索引编码。通过上述步骤102所示的实现方式可以得到上述第二聚类中心的编号,该编号即为一种PQ码。如图3所示,图中的编号为十进制数,也可以将该编号转换成相应的二进制数进行表示,则该二进制数即为一种PQ码。可理解,图2中的编号仅为一种示例,不应作为本申请实施例中对于上述第二聚类中心编号的限定,以及本申请实施例中对于该编号的表示方式不作限定。
403、根据上述第二聚类中心的PQ码的PQ距离对上述第二聚类中心的PQ码重新进行编码,得到上述第二聚类中心的汉明码。
本申请实施例中,通过上述PQ码可以表示上述第二聚类中心,因此,可以通过该PQ码的之间的PQ距离来近似表示上述第二聚类中心之间的PQ距离。进一步地,通过将该PQ距离表示两个PQ码之间的PQ距离,则可以将该PQ码进一步的转换为上述第二聚类中心的汉明码。
在一种可能的实现方式中,根据上述第二聚类中心的PQ码的PQ距离对上述第二聚类中心的PQ码重新进行编码,得到上述第二聚类中心的汉明码,包括:
确定上述第二聚类中心的转换码;
计算上述第二聚类中心的PQ码与上述第二聚类中心的转换码的PQ距离,以及上述第二聚类中心的PQ码与上述第二聚类中心的转换码的汉明距离;
根据上述PQ距离以及上述汉明距离,确定上述第二聚类中心的转换码为上述第二聚类中心的汉明码。
本申请实施例中,上述转换码可以理解为上述PQ码转换为上述汉明码的过渡码。具体的,上述转换码可以通过交换上述PQ码其中任意两个PQ码的位置得到。
在得到上述转换码之后,可以计算上述第二聚类中心的PQ码与上述第二聚类中心的转换码的PQ距离(如欧式距离),将该PQ距离记为D1,以及计算上述第二聚类中心的PQ码与上述第二聚类中心的转换码的汉明距离,将该汉明距离记为D2
进一步地,可以根据该PQ距离D1和汉明距离D2来确定上述第二聚类中心的汉明码。也就是说,上述汉明码既可以表示上述第一聚类中心和上述第二聚类中心的PQ距离,也可以表示上述第一聚类中心和上述第二聚类中心的汉明距离。
实施本申请实施例,通过上述编码过程可以将上述第二聚类中心的编号不仅具有PQ编码的意义,还具有汉明编码的意义,进一步通过任意两个第二聚类中心的汉明距离表示该任意两个第二聚类中心的PQ距离,由于汉明距离的计算比较高效,因此可以大大提高计算速度。
上述图4简单介绍了汉明码的编码过程,为了更清楚的说明汉明码的编码过程,因此,本申请实施例还提供了一种汉明码的具体计算过程,如下上述:
参见图5,图5是本申请实施例提供的另一种汉明码的编码方法的流程示意图,该方法可应用于上述图像处理装置。如图5所示,该方法包括:
501、确定初始化函数π。
本申请实施例中,上述初始化函数π是由上述第二聚类中心的PQ码构成的函数。具体的,该函数π可以表示为π[i]=i(0<=i<=256),其中,i用用于表示每个聚类中心的PQ码。
502、交换上述函数π中任意两个元素的值,得到函数π’。
本申请实施例中,首先,随机获取元素i,j(0<=i,j<=256,且i!=j)。然后,交换π中第i和第j个元素的值得到π’。
举例来说,假设函数π=[π1234],交换其中编号为π2和π3两个元素的位置,则可以得到函数π’=[π’1,π’3,π’2,π’4]。其中,π1=π’1,π2=π’3,π3=π’3,π4=π’4
503、分别计算上述函数π和上述π’的损失值,得到两者损失值的差值。
本申请实施例中,上述函数π的损失值可以表示为L(π),上述函数π’的损失值可以表示为L(π’)。
其中,假设上述π=[π1234],则上述L(π)计算公式如下:
L(π)=[d(π12)-h(π12)]2+[d(π13)-h(π13)]2+[d(π14)-h(π14)]2+[d(π23)-h(π23)]2+[d(π24)-h(π24)]2+[d(π34)-h(π34)]2
其中,上述d(π12)表示π1和π2之间的欧式距离,上述h(π12)表示π1和π2之间的汉明距离。同理,其他表达式可以参考上述d(π12)和上述h(π12)的定义,在此不再一一详述。
其中,假设上述π’=[π’1,π’3,π’2,π’4],则上述L(π’)计算公式如下:
L(π’)=[d(π’1,π’3)-h(π’1,π’3)]2+[d(π’1,π’2)-h(π’1,π’2)]2+[d(π’1,π’4)-h(π’1,π’4)]2+[d(π’3,π’2)-h(π’3,π’2)]2+[d(π’2,π’4)-h(π’2,π’4)]2+[d(π’2,π’4)-h(π’2,π’4)]2
其中,上述d(π’1,π’3)表示π’1和π’3之间的欧式距离,上述h(π’1,π’3)表示π’1和π’3之间的汉明距离。同理,其他表达式可以参考上述d(π’1,π’3)和上述h(π’1,π’3)的定义,在此不再一一详述。
将上述两者损失值的差值记为ΔC,则该ΔC=L(π’)-L(π)。
504、根据上述差值将上述π’更新为上述π。
本申请实施例中,若上述ΔC<0,则保留重排后的π’。也就是说,上述i和上述j所代表的PQ码交换成功。并使重排后的π’更新为π,即使更新后的π=π’。
最终,通过不断更新函数π,使上述第二聚类中心的每个PQ码都转换为汉明码。
通过上述步骤,可以将PQ码转换为汉明码,图6是本申请实施例提供的一种PQ码和汉明码编码示意图。如图6所示,若由PQ码组成的上述初始化函数π=[1000,1100,1010,0000],则通过上述步骤501至步骤504所示的实现方式可以将该函数π中的PQ码转换成对应的汉明码,且该函数π对应的函数π’=[0011,0001,0101,0100]。
实施本申请实施例,通过上述计算过程可以将上述第二距离中心的PQ码转换为汉明码,进一步地,通过汉明距离来计算PQ距离,可以减少计算量,提高计算效率。
可理解,上述各个实施例所示的方法各有侧重,因此在一个实施例中未详尽描述的实现方式还可参考其他实施例,这里不再一一详述。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参见图7,图7是本申请实施例提供的一种图像处理装置的结构示意图,该图像处理装置可以包括:
第二方面,本申请实施例提供了一种图像处理装置,包括:
第一确定单元701,用于确定与第一特征向量对应的第一聚类中心;其中,上述第一特征向量为查询样本的特征向量,且上述第一特征向量包括N个特征子向量,上述N为大于或等于2的整数,上述第一聚类中心为根据上述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化PQ距离得到,上述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,上述第二特征向量为样本库的特征向量;
计算单元702,用于计算上述第一聚类中心与上述第二聚类中心的汉明距离;
第二确定单元703,用于根据上述汉明距离从上述样本库中确定出与上述查询样本相似度高的样本集合;
第三确定单元704,用于根据上述第一特征向量与第三特征向量的乘积量化PQ距离从上述样本集合中确定出目标样本;其中,上述目标样本为与上述查询样本相似度最高的样本,上述第三特征向量为上述样本集合中每个样本的特征向量,上述第三特征向量包括的N个特征子向量。
可选的,图8是本申请实施例提供的一种第二确定单元的结构示意图,如图8所示,上述第二确定单元703包括:
第一确定子单元7031,根据上述第一聚类中心与上述第二聚类中心的汉明距离,获得上述查询样本与上述样本库中每个样本的汉明距离集合;
第二确定子单元7032,用于根据上述汉明距离集合确定上述查询样本与上述样本库中每个样本的参考相似值,上述参考相似值用于表示上述查询样本与上述样本库中每个样本的相似程度;
第三确定子单元7033,用于根据上述参考相似值从上述样本库中确定出与上述查询样本相似度高的样本集合。
可选的,如图8所示,上述第二确定子单元7032,具体用于将上述汉明距离集合中所包含的汉明距离的和确定为上述查询样本与上述样本库中每个样本的参考相似值。
可选的,图9是本申请实施例提供的另一种图像处理装置的结构示意图,如图9所示,上述装置还包括:
第一编码单元705,用于对上述第二聚类中心进行编码,得到上述第二聚类中心的PQ码;
第二编码单元706,用于根据上述第二聚类中心的PQ码的PQ距离对上述第二聚类中心的PQ码重新进行编码,得到上述第二聚类中心的汉明码。
可选的,图10是本申请实施例提供的一种第二编码单元的结构示意图,如图10所示,上述第二编码单元706包括:
第四确定子单元7061,用于确定上述第二聚类中心的转换码;
计算子单元7062,用于计算上述第二聚类中心的PQ码与上述第二聚类中心的转换码的PQ距离,以及上述第二聚类中心的PQ码与上述第二聚类中心的转换码的汉明距离;
第五确定子单元7063,用于根据上述PQ距离以及上述汉明距离,确定上述第二聚类中心的转换码为上述第二聚类中心的汉明码。
可选的,如图7所示,上述计算单元702,具体用于根据上述第一聚类中心的汉明码与上述第二聚类中的汉明码,计算上述第一聚类中心与上述第二聚类中心的汉明距离。
本申请实施例中,通过计算查询样本和样本库中第二聚类中心的PQ距离,可以将该查询样本归到与样本库中与其距离最近的第一聚类中心,然后通过计算上述第一聚类中心和上述第二聚类中心的汉明距离,可以得到上述样本库中与上述查询样本相似度高的样本集合,并通过进一步计算该查询样本与上述样本集合的第三特征向量的PQ距离,最终确定出与上述查询样本相似度最高的目标样本。上述计算过程中,由于汉明距离的计算方式简单、高效,因此通过汉明距离可以快速的确定上述样本集合,实现对整个样本库的快速过滤,然后通过进一步计算上述查询样本与上述样本集合的PQ距离(如非对称距离)来确定目标样本,可避免计算查询样本与整个样本库中每个样本的PQ距离,大大的减少了计算量,提高了查询效率。
参见图11,图11是本申请实施例提供的又一种图像处理装置的结构示意图,该图像处理装置包括处理器1101、存储器1102和输入输出接口1103,上述处理器1101、存储器1102和输入输出接口1103通过总线相互连接。
存储器1102包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmableread only memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器1102用于相关指令及数据。
输入输出接口1103,例如可通过该输入输出接口与其他装置进行通信等。
处理器1101可以是一个或多个中央处理器(central processing unit,CPU),在处理器1101是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
具体的,各个操作的实现还可以对应参照图1、图2、图3、图4、图5和图6所示的方法实施例的相应描述。以及各个操作的实现还可对应参照图7、图8、图9以及图10所示的装置实施例的相应描述。
如在一个实施例中,处理器1101可用于执行步骤101到步骤104所示的方法,又如该处理器1101还可用于执行第一确定单元701、计算单元702、第二确定单元703以及第三确定单元704等所执行的方法。
又如在一个实施例中,处理器1101可用于执行步骤401到步骤402所示的方法,又如该处理器1101还可用于执行第一编码单元705以及第二编码单元706等所执行的方法。
又如在一个实施例中,处理器1101可用于执行步骤501到步骤504所示的方法。
又如在一个实施例中,上述查询样本为一种待匹配的图像,上述目标样本为上述样本库中与上述查询样本相似度最高的样本图像。处理器1101可用于控制输入输出接口1103输入该查询样本,还可用于控制输入输出接口1103输出该目标样本。可理解,本申请实施例中对于该查询样本的输入方式不作限定,以及对于该目标样本的输出方式不作限定。
可以理解的是,图11仅仅示出了图像处理装置的简化设计。在实际应用中,图像处理装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入输出接口、处理器、存储器等,而所有可以实现本申请实施例的图像处理装置都在本申请的保护范围之内。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

Claims (10)

1.一种图像处理方法,其特征在于,包括:
确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;
计算所述第一聚类中心与所述第二聚类中心的汉明距离;
根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;
根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。
2.根据权利要求1所述的方法,其特征在于,根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合,包括:
根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;
根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;
根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。
3.根据权利要求2所述的方法,其特征在于,所述根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,包括:
将所述汉明距离集合中所包含的汉明距离的和确定为所述查询样本与所述样本库中每个样本的参考相似值。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述计算所述第一聚类中心与所述第二聚类中心的汉明距离之前,所述方法还包括:
对所述第二聚类中心进行编码,得到所述第二聚类中心的乘积量化码;
根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码。
5.根据权利要求4所述的方法,其特征在于,根据所述第二聚类中心的乘积量化码的乘积量化距离对所述第二聚类中心的乘积量化码重新进行编码,得到所述第二聚类中心的汉明码,包括:
确定所述第二聚类中心的转换码;
计算所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的乘积量化距离,以及所述第二聚类中心的乘积量化码与所述第二聚类中心的转换码的汉明距离;
根据所述乘积量化距离以及所述汉明距离,确定所述第二聚类中心的转换码为所述第二聚类中心的汉明码。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述计算所述第一聚类中心与第二聚类中心的汉明距离,包括:
根据所述第一聚类中心的汉明码与所述第二聚类中的汉明码,计算所述第一聚类中心与所述第二聚类中心的汉明距离。
7.一种图像处理装置,其特征在于,包括:
第一确定单元,用于确定与第一特征向量对应的第一聚类中心;其中,所述第一特征向量为查询样本的特征向量,且所述第一特征向量包括N个特征子向量,所述N为大于或等于2的整数,所述第一聚类中心为根据所述N个特征子向量中每个特征子向量与第二聚类中心的乘积量化距离得到,所述第二聚类中心为第二特征向量包括的N个特征子向量中每个特征子向量的聚类中心,所述第二特征向量为样本库的特征向量;
计算单元,用于计算所述第一聚类中心与第二聚类中心的汉明距离;
第二确定单元,用于根据所述汉明距离从所述样本库中确定出与所述查询样本相似度高的样本集合;
第三确定单元,用于根据所述第一特征向量与第三特征向量的乘积量化距离从所述样本集合中确定出目标样本;其中,所述目标样本为与所述查询样本相似度最高的样本,所述第三特征向量为所述样本集合的特征向量,所述第三特征向量包括的N个特征子向量。
8.根据权利要求7所述的装置,其特征在于,所述第二确定单元包括:
第一确定子单元,根据所述第一聚类中心与所述第二聚类中心的汉明距离,获得所述查询样本与所述样本库中每个样本的汉明距离集合;
第二确定子单元,用于根据所述汉明距离集合确定所述查询样本与所述样本库中每个样本的参考相似值,所述参考相似值用于表示所述查询样本与所述样本库中每个样本的相似程度;
第三确定子单元,用于根据所述参考相似值从所述样本库中确定出与所述查询样本相似度高的样本集合。
9.一种图像处理装置,其特征在于,包括处理器和存储器,所述处理器和所述存储器耦合;其中,所述存储器存储有程序指令,所述程序指令被所述处理器执行时,使所述处理器执行如权利要求1至6所述的相应的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被图像处理装置的处理器执行时,使所述处理器执行权利要求1至6任意一项所述的方法。
CN201811619251.2A 2018-12-27 2018-12-27 图像处理方法及装置 Pending CN109740660A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811619251.2A CN109740660A (zh) 2018-12-27 2018-12-27 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811619251.2A CN109740660A (zh) 2018-12-27 2018-12-27 图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN109740660A true CN109740660A (zh) 2019-05-10

Family

ID=66361631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811619251.2A Pending CN109740660A (zh) 2018-12-27 2018-12-27 图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN109740660A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110175546A (zh) * 2019-05-15 2019-08-27 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110502651A (zh) * 2019-08-15 2019-11-26 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110517234A (zh) * 2019-08-16 2019-11-29 杭州依图医疗技术有限公司 特征骨异常检测方法及装置
CN110825902A (zh) * 2019-09-20 2020-02-21 深圳云天励飞技术有限公司 特征相似性搜索的实现方法、装置、电子设备及存储介质
CN111143597A (zh) * 2019-12-13 2020-05-12 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN113591943A (zh) * 2021-07-13 2021-11-02 北京淇瑀信息科技有限公司 对新增渠道的用户进行快速认证方法、装置和电子设备
CN114443876A (zh) * 2022-01-14 2022-05-06 广州市玄武无线科技股份有限公司 一种快销行业中商品指纹快速匹配方法及***
WO2023065697A1 (zh) * 2021-10-21 2023-04-27 深圳云天励飞技术股份有限公司 一种乘积量化搜索方法、装置、终端和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844524A (zh) * 2016-12-29 2017-06-13 北京工业大学 一种基于深度学习和Radon变换的医学图像检索方法
WO2018048853A1 (en) * 2016-09-07 2018-03-15 Facebook, Inc. Similarity search using polysemous codes
CN107943938A (zh) * 2017-11-23 2018-04-20 清华大学 一种基于深度乘积量化的大规模图像相似检索方法及***
CN107944046A (zh) * 2017-12-15 2018-04-20 清华大学 大规模高维数据快速检索方法及***
CN108920720A (zh) * 2018-07-30 2018-11-30 电子科技大学 基于深度哈希和gpu加速的大规模图像检索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018048853A1 (en) * 2016-09-07 2018-03-15 Facebook, Inc. Similarity search using polysemous codes
CN106844524A (zh) * 2016-12-29 2017-06-13 北京工业大学 一种基于深度学习和Radon变换的医学图像检索方法
CN107943938A (zh) * 2017-11-23 2018-04-20 清华大学 一种基于深度乘积量化的大规模图像相似检索方法及***
CN107944046A (zh) * 2017-12-15 2018-04-20 清华大学 大规模高维数据快速检索方法及***
CN108920720A (zh) * 2018-07-30 2018-11-30 电子科技大学 基于深度哈希和gpu加速的大规模图像检索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MATTHIJS DOUZE等: "Polysemous codes", 《FACEBOOK AI RESEARCH》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210073577A1 (en) * 2019-05-15 2021-03-11 Shenzhen Sensetime Technology Co., Ltd. Image processing method and device, electronic device and storage medium
JP7128906B2 (ja) 2019-05-15 2022-08-31 シェンチェン センスタイム テクノロジー カンパニー リミテッド 画像処理方法及び装置、電子機器並びに記憶媒体
CN110175546A (zh) * 2019-05-15 2019-08-27 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
JP2021528715A (ja) * 2019-05-15 2021-10-21 シェンチェン センスタイム テクノロジー カンパニー リミテッドShenzhen Sensetime Technology Co.,Ltd 画像処理方法及び装置、電子機器並びに記憶媒体
CN110502651B (zh) * 2019-08-15 2022-08-02 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110502651A (zh) * 2019-08-15 2019-11-26 深圳市商汤科技有限公司 图像处理方法及装置、电子设备和存储介质
CN110517234A (zh) * 2019-08-16 2019-11-29 杭州依图医疗技术有限公司 特征骨异常检测方法及装置
CN110825902A (zh) * 2019-09-20 2020-02-21 深圳云天励飞技术有限公司 特征相似性搜索的实现方法、装置、电子设备及存储介质
CN111143597A (zh) * 2019-12-13 2020-05-12 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111143597B (zh) * 2019-12-13 2023-06-20 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN113591943A (zh) * 2021-07-13 2021-11-02 北京淇瑀信息科技有限公司 对新增渠道的用户进行快速认证方法、装置和电子设备
WO2023065697A1 (zh) * 2021-10-21 2023-04-27 深圳云天励飞技术股份有限公司 一种乘积量化搜索方法、装置、终端和存储介质
CN114443876A (zh) * 2022-01-14 2022-05-06 广州市玄武无线科技股份有限公司 一种快销行业中商品指纹快速匹配方法及***

Similar Documents

Publication Publication Date Title
CN109740660A (zh) 图像处理方法及装置
Yin et al. Incomplete multi-view clustering via subspace learning
EP2499569B1 (en) Clustering method and system
Cao et al. Towards information-theoretic k-means clustering for image indexing
CN104199923B (zh) 基于最优k均值哈希算法的大规模图像库检索方法
CN112329460B (zh) 文本的主题聚类方法、装置、设备及存储介质
Wei et al. Projected residual vector quantization for ANN search
JP2003030222A (ja) 大規模データベースにおける主要クラスタおよびアウトライア・クラスタの検索、検出および同定のための方法、システム、記録媒体、およびサーバ
CN109325510B (zh) 一种基于网格统计的图像特征点匹配方法
CN108268431B (zh) 段落向量化的方法和装置
CN110728313B (zh) 一种用于意图分类识别的分类模型训练方法及装置
CN102123172A (zh) 一种基于神经网络聚类优化的Web服务发现的实现方法
CN104881449A (zh) 基于流形学习数据压缩哈希的图像检索方法
CN115482395A (zh) 模型训练方法、图像分类方法、装置、电子设备和介质
Zhang et al. Anisotropic additive quantization for fast inner product search
Termritthikun et al. Evolutionary neural architecture search based on efficient CNN models population for image classification
CN104573696B (zh) 用于处理人脸特征数据的方法和装置
CN112559640B (zh) 图谱表征***的训练方法及装置
CN114491699A (zh) 基于拓展区间数的三维cad软件易用性量化方法及装置
JP7302229B2 (ja) データ管理システム、データ管理方法、およびデータ管理プログラム
CN115374775A (zh) 一种确定文本相似度的方法、装置、设备及存储介质
CN114121296A (zh) 基于数据驱动的临床信息规则提取方法、存储介质及设备
Pang et al. Unifying sum and weighted aggregations for efficient yet effective image representation computation
Jiang et al. Protein tertiary structure prediction based on multiscale recurrence quantification analysis and horizontal visibility graph
CN107180391B (zh) 一种风电数据跨度选取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190510