CN111797259A

CN111797259A - 一种针对有褶皱形变的图像快速搜索方法

Info

Publication number: CN111797259A
Application number: CN202010659462.XA
Authority: CN
Inventors: 金海云
Original assignee: Hangzhou Murui Technology Co ltd
Current assignee: Hangzhou Murui Technology Co ltd
Priority date: 2020-07-10
Filing date: 2020-07-10
Publication date: 2020-10-20

Abstract

本发明公开了一种针对有褶皱形变的图像快速搜索方法，包括有目标检测模组、特征提取模块、搜索模块，所述目标检测模组基于卷积网络，目标检测模组是一种弱监督模型，负责对图像的内容和材质进行分段抽象，进而确定该图像中的目标位置并计算出最佳的目标区域，所述提取模块利用神经网络来学习实拍图的背景区域。本发明一种针对有褶皱形变的图像快速搜索方法，有效的提升了对有褶皱形变实拍照片，以图搜图准确度及速度，节省了人工比对寻找花型的人力物力，更为省时省力，本发明支持个性化定制图库，以及灵活选择适合本图库的特征算子，以达到最优的效果，经测试及实际使用，在该花型领域的搜索效果及速度远远优于市面上一些通用接口。

Description

一种针对有褶皱形变的图像快速搜索方法

技术领域

本发明涉及神经网络、深度学习、图像识别、图像搜索领域技术领域，尤其涉及一种针对有褶皱形变的图像快速搜索方法。

背景技术

以图搜图技术已经经历了多年的发展，从开始的图片像素级匹配，哈希检索，到近年来的特征点匹配，目标识别，以及深度学习的基于内容的搜索，以图搜图的精确度以及速度都得到了大幅度的提升。目前比较主流的搜图方案是将图片库利用深度学习或特征变换等方法，预先提取出特征点并将特征索引存储起来，搜索时对输入图片进行特征提取并在特征索引库中进行搜索匹配。

现有的褶皱形变的图像搜索方法，搜图方案对于布样搜索花型的场景并不适用，首先打印在布样上的图形会随着不同印染方式和布料有明显差异，提高了搜索的难度，搜索时的输入图片大多是手机实拍照片，实拍时布样会有各种褶皱形变，大幅提高了搜图的难度，另外，图库的数量经常十分庞大，数十万张图片中效率且精准地搜到原图是一项十分棘手的任务。

发明内容

本发明的目的是为了解决了现有的褶皱形变的图像搜索方法，搜图方案对于布样搜索花型的场景并不适用，首先打印在布样上的图形会随着不同印染方式和布料有明显差异，提高了搜索的难度的缺点，而提出的一种针对有褶皱形变的图像快速搜索方法。

为了实现上述目的，本发明采用了如下技术方案：一种针对有褶皱形变的图像快速搜索方法，包括有目标检测模组、特征提取模块、搜索模块，所述目标检测模组基于卷积网络，目标检测模组是一种弱监督模型，负责对图像的内容和材质进行分段抽象，进而确定该图像中的目标位置并计算出最佳的目标区域，所述提取模块利用神经网络来学习实拍图的背景区域，并利用该模型去除形变的布样照片背景，再对去除背景后的图片进行SIFT特征提取，最后到花型图库中进行特征向量检索，返回最佳匹配结果的花型图案。

作为上述技术方案的进一步描述：

所述目标检测模组基于标准的16层VGG网络，加入了soft proposal模块，该模块可***网络的任意一层卷积层后，根据前一层的特征图，计算特征差异与空间距离，从而得到目标置信值（Objectness confidence），最后根据置信图得到预测的前景/背景分割框。

作为上述技术方案的进一步描述：

所述特征提取模块基于尺度不变特征变换（SIFT），该模块提取出图像的最显著的N个关键点，用N个独特的特征向量来表示。

作为上述技术方案的进一步描述：

所述搜索模块基于高维向量相似度检索聚类（FAISS），搜索模块针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索。

作为上述技术方案的进一步描述：

所述搜索模块对于海量的图片库，该模块存储之前SIFT特征提取模块，并集成各种聚类、降维算法降低存储空间。

作为上述技术方案的进一步描述：

所述目标检测模组的步骤：

步骤一、输入图片经过传统VGG网络的（L-1）层卷积层的特征图提取，输出结果传入新增的Soft Proposal层；

步骤二、Soft Proposal生成，根据图传播计算出生成的权重矩阵，表示目标在各像素点的概率；

步骤三、Soft Proposal耦合训练，并利用随机漫步（random walk）模型来更新概率图；

步骤四、重复步骤二步骤三直至收敛，输出概率图计算出的边界框。

作为上述技术方案的进一步描述：

所述特征提取模块的步骤：

步骤一、对一张实拍图进行缩放，像素点不高于2.5亿像素；

步骤二、使用opencv的SIFT特征点提取，提取前N个最显著的特征向量；

步骤三、存储至一个二维矩阵中。

作为上述技术方案的进一步描述：

所述特征搜索模块的步骤：

步骤一、将图库中的所有图片通过步骤2计算出特征点库，并存储在FAISS的索引文件index中，另外还需存储图片id与特征点的对应关系id_vectors；

步骤二、将索引文件index及id_vectors预先加载至内存中；

步骤三、将输入的query图片依次通过步骤1，步骤2计算出特征点，并在内存中搜索其K近邻；

步骤四、返回前K张输入图片的近似图。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

本发明一种针对有褶皱形变的图像快速搜索方法，有效的提升了对有褶皱形变实拍照片，以图搜图准确度及速度，节省了人工比对寻找花型的人力物力，更为省时省力，本发明支持个性化定制图库，以及灵活选择适合本图库的特征算子，以达到最优的效果，经测试及实际使用，在该花型领域的搜索效果及速度远远优于市面上一些通用接口。

附图说明

图1为本发明中一种针对有褶皱形变的***整体架构图；

图2为本发明中卷积网络的图像分类模型图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

参照图1-2，一种针对有褶皱形变的图像快速搜索方法，包括有目标检测模组、特征提取模块、搜索模块，其特征在于，所述目标检测模组基于卷积网络，目标检测模组是一种弱监督模型，负责对图像的内容和材质进行分段抽象，进而确定该图像中的目标位置并计算出最佳的目标区域，所述提取模块利用神经网络来学习实拍图的背景区域，并利用该模型去除形变的布样照片背景，再对去除背景后的图片进行SIFT特征提取，最后到花型图库中进行特征向量检索，返回最佳匹配结果的花型图案，该方法基于三种技术，CNN（卷积网络）、SIFT（尺度不变特征变换）以及FAISS（高维向量相似度检索聚类），是一种快速搜索相同图案的方法，该方法通过对背景及前景图片的不断迭代学习，将大部分实拍褶皱形变图片中的背景噪音抠除后，再对抠好的图片进行SIFT特征提取，最后与图片库中的图片进行特征点匹配，达到搜索相同图案的效果。

进一步的，所述目标检测模组基于标准的16层VGG网络，加入了soft proposal模块，该模块可***网络的任意一层卷积层后，根据前一层的特征图，计算特征差异与空间距离，从而得到目标置信值（Objectness confidence），最后根据置信图得到预测的前景/背景分割框。

进一步的，所述特征提取模块基于尺度不变特征变换（SIFT），该模块提取出图像的最显著的N个关键点，用N个独特的特征向量来表示，这些特征向量具有对尺度缩放、旋转、亮度变化无关的特性，因此对褶皱、形变等实拍图的变换不敏感，非常适用于该搜图***的应用场景。

进一步的，所述搜索模块基于高维向量相似度检索聚类（FAISS），搜索模块针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库。

进一步的，所述搜索模块对于海量的图片库，该模块存储之前SIFT特征提取模块，并集成各种聚类、降维算法降低存储空间，在搜索过程中将预先计算好的向量库加载至内存中，大大降低搜索匹配所消耗的时间。

进一步的，所述目标检测模组的步骤：

进一步的，所述特征提取模块的步骤：

步骤一、对一张实拍图进行缩放，像素点不高于2.5亿像素；

步骤三、存储至一个二维矩阵中。

进一步的，所述特征搜索模块的步骤：

步骤二、将索引文件index及id_vectors预先加载至内存中；

步骤四、返回前K张输入图片的近似图。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种针对有褶皱形变的图像快速搜索方法，包括有目标检测模组、特征提取模块、搜索模块，其特征在于，所述目标检测模组基于卷积网络，目标检测模组是一种弱监督模型，负责对图像的内容和材质进行分段抽象，进而确定该图像中的目标位置并计算出最佳的目标区域，所述提取模块利用神经网络来学习实拍图的背景区域，并利用该模型去除形变的布样照片背景，再对去除背景后的图片进行SIFT特征提取，最后到花型图库中进行特征向量检索，返回最佳匹配结果的花型图案。

2.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述目标检测模组基于标准的16层VGG网络，加入了soft proposal模块，该模块可***网络的任意一层卷积层后，根据前一层的特征图，计算特征差异与空间距离，从而得到目标置信值（Objectness confidence），最后根据置信图得到预测的前景/背景分割框。

3.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述特征提取模块基于尺度不变特征变换（SIFT），该模块提取出图像的最显著的N个关键点，用N个独特的特征向量来表示。

4.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述搜索模块基于高维向量相似度检索聚类（FAISS），搜索模块针对聚类和相似性搜索库，为稠密向量提供高效相似度搜索和聚类，支持十亿级别向量的搜索。

5.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述搜索模块对于海量的图片库，该模块存储之前SIFT特征提取模块，并集成各种聚类、降维算法降低存储空间。

6.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述目标检测模组的步骤：

7.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述特征提取模块的步骤：

步骤一、对一张实拍图进行缩放，像素点不高于2.5亿像素；

步骤三、存储至一个二维矩阵中。

8.根据权利要求1所述的一种针对有褶皱形变的图像快速搜索方法，其特征在于，所述特征搜索模块的步骤：

步骤二、将索引文件index及id_vectors预先加载至内存中；

步骤四、返回前K张输入图片的近似图。