CN113343019B

CN113343019B - 一种结合浅层与深层特征的小样本丝织品图像检索方法

Info

Publication number: CN113343019B
Application number: CN202110732647.3A
Authority: CN
Inventors: 潘宇琳; 韦佳
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2022-11-18
Anticipated expiration: 2041-06-29
Also published as: CN113343019A

Abstract

本发明公开一种结合浅层与深层特征的小样本丝织品检索方法。所述方法包括以下步骤：收集丝织品图像，建立丝织品样本库；建立卷积神经网络模型；使用有约束采样方法对丝织品样本库进行采样得到训练数据集；使用训练数据集训练卷积神经网络模型，得到训练完成的卷积神经网络模型；使用训练完成的卷积神经网络模型提取待检索丝织品图像的特征，并计算提取得到的待检索丝织品图像的特征与样本库中各个丝织品图像提取到的特征的欧式距离，根据欧式距离的大小得到基于图像特征的待检索丝织品图像的检索结果。所述方法可以得到更好的丝织品图像特征表达，且适应于小规模样本数据，较准确地检索到丝织品相似性结果。

Description

一种结合浅层与深层特征的小样本丝织品图像检索方法

技术领域

本发明属于深度学习图像检索领域，具体涉及一种结合浅层与深层特征的小样本丝织品图像检索方法。

背景技术

图像检索一直以来都是计算机视觉领域重要的研究课题，从20世纪90年代早期开始，研究人员便先后设计了图像的全局特征、局部特征等方法对图像检索任务进行探索和研究。由于SIFT(Scale-Invariant Feature Transform)^[1]特征对图像平移、缩放和旋转具有明显的不变性，因此在传统的图像检索领域得到了广泛的应用。尽管十多年来传统人工特征的检索方法占据了图像检索领域，并在视觉检索方面取得了重大进展，但它的缺点也很明显。这类方法严重依赖于人工特征，需要依据任务和数据集人工设计描述符，无法通过端到端的方式进行训练。而随着卷积神经网络的蓬勃发展，深度学习时代的到来带来了新的气象。近年来，深度学习在诸多领域上取得了巨大的成功，其中包含图像检索领域。而在图像检索领域中，丝织品图像检索仍然缺乏研究。相近的任务有布料图像检索(Deng D,Wang R,Wu H,et al.Learning deep similarity models with focus ranking forfabric image retrieval[J].Image and Vision Computing,2018,70:11-20.)，但其只关注浅层的布料纹理特征，而丝织品图像检索需要同时关注浅层纹理特征与深层语义特征。因此该研究并不适用于丝织品图像检索。

发明内容

为克服现有技术缺陷，本发明提出一种结合浅层与深层特征的小样本丝织品图像检索方法。

本发明的目的至少通过以下技术方案之一实现。

一种结合浅层与深层特征的小样本丝织品检索方法，包括以下步骤：

S1、收集丝织品图像，建立丝织品样本库；

S2、建立卷积神经网络模型；

S3、使用有约束采样方法对丝织品样本库进行采样得到训练数据集；

S4、使用训练数据集训练卷积神经网络模型，得到训练完成的卷积神经网络模型；

S5、使用训练完成的卷积神经网络模型提取待检索丝织品图像的特征，并计算提取得到的待检索丝织品图像的特征与样本库中各个丝织品图像提取到的特征的欧式距离，欧氏距离越小表示待检索丝织品图像与样本库中的丝织品图像越相似，根据欧式距离的大小得到基于图像特征的待检索丝织品图像的检索结果。

进一步地，步骤S2中，所述卷积神经网络模型基于U-Net构建，卷积神经网络模型包括U-Net层、3层卷积层、注意力模块、池化层和全连接层；

其中，U-Net层包括从浅层网络至深层网络的跳跃连接，该跳跃连接将浅层网络的特征复制并拼接到深层网络的特征上，通过卷积操作对该拼接后的浅层网络的特征与深层网络的特征进行融合；

输入卷积神经网络模型的丝织品图像先经过U-Net层提取特征，再经过3层卷积层进行卷积计算后输入注意力模块中进行计算得到经过注意力加权的特征图，经过注意力加权的特征图输入池化层和全连接层输出丝织品图像的特征。

进一步地，U-Net层共有14层卷积层，其中每2层卷积层为一组；第一卷积层组down1包括第一层卷积层和第二层卷积层，第二卷积层组down2包括第三层卷积层和第四层卷积层，第三卷积层组down3包括第五层卷积层和第六层卷积层，第四卷积层组bottom包括第七层卷积层和第八层卷积层，第五卷积层组up3包括第九层卷积层和第十层卷积层，第六卷积层组up2包括第十一层卷积层和第十二层卷积层，第七卷积层组up1包括第十三层卷积层和第十四层卷积层；

其中，每组卷积层组包括的两层卷积层中，前一层卷积层使用3x3大小的卷积核，填充为1，后接实例标准化、Leaky ReLU激活函数和取值0.2的随机失活；后一层卷积层使用3x3大小的卷积核，填充为1，后接实例标准化和Leaky ReLU激活函数；

在第一卷积层组down1、第二卷积层组down2、第三卷积层组down3的后面均接有2x2大小的最大池化，在第四卷积层组bottom、第五卷积层组up3、第六卷积层组up2的后面均接有2x2的二次线性插值上采样、卷积核大小为3x3填充为1的卷积、实例标准化和LeakyReLU激活函数；

在第一卷积层组down1与第七卷积层组up1之间、第二卷积层组down2与第六卷积层组up2之间、第三卷积层组down3与第五卷积层组up3之间存在着跳跃连接，作为浅层特征信息与深层特征信息融合的重要手段；该跳跃连接的具体操作为，分别将第一卷积层组down1、第二卷积层组down2和第三卷积层组down3在最大池化前的特征图复制并拼接到第七卷积层组up1、第六卷积层组up2和第五卷积层组up3的输入特征图上，该拼接沿通道方向进行。

进一步地，3层卷积层中的前两层均使用大小为3x3的卷积核，后接批标准化、ReLU激活函数和2x2的最大池化层，卷积操作没有填充；3层卷积层中的最后一层使用大小为3x3的卷积核，后接批标准化、ReLU激活函数，卷积操作没有填充；

池化层使用层级数为3的空间金字塔池化层，空间金字塔池化层输出大小为21的向量；全连接层输出大小为32的向量。

进一步地，注意力模块中结合注意力机制和多任务学习，注意力模块中的操作具体包括以下步骤：

S2.1、使用平均池化技术对最后一层卷积层后的第一特征图D进行池化，得到1x1大小，64通道的第二特征图F；

S2.2a、将第二特征图F输入至全连接层，得到64大小的特征向量，再将该特征向量送入分类器进行图像分类。

S2.2b；、将第一特征图D与第二特征图F进行按通道乘操作，得到经过注意力加权的特征图G，将G送入后续空间金字塔池化层中；

其中，步骤S2.2a与步骤S2.2b为步骤S2.1之后的两个分支，可同时进行，互相独立；

按通道乘的操作具体为：将第二特征图F的每个通道中1x1大小的数值与第一特征图D每个通道中HxW大小的矩阵一一对应，然后每个HxW矩阵中的每一个元素都乘上与之对应的1x1数值，其中，H为矩阵的行数，W为矩阵的列数。

进一步地，步骤S3中，所述有约束采样方法包括以下步骤：

S3.1、在样本库中对所有丝织品类别中的每个类别随机抽取5对相同类别的正样本对；每对正样本对之中的两张图片不一样，不同正样本对之间，可以抽到出现于其他正样本对中的图片；

S3.2、对于所有相同类别的正样本对中每一对的第一张图片，抽取30个随机负样本与该图片组成负样本对，其中前20个负样本来自同一类别，但与正样本对中的图片的类别不同，后10个负样本来自不同类别，与正样本对中的图片的类别不同且与前20个负样本的类别不同；

S3.3、将所有正样本对复制2次，此时每对正样本对总共出现了3次。

S3.4、将所有采样的正样本对与负样本对组成训练数据集。

进一步地，步骤S4中，训练卷积神经网络模型时，卷积神经网络模型的损失函数为：

其中，x_i和x_j分别为输入的丝织品图像对中的丝织品图像i和丝织品图像j经过卷积神经网络模型后提取到的特征；y表示成对标签，输入的丝织品图像对中的丝织品图像i和丝织品图像j为同一类别时y为1，否则为0；D(·)为欧式距离计算公式；margin为预先设定的阈值，表示不同类别特征之间的欧式距离最小不可小于margin值；k表示丝织品图像的类别；p_k表示丝织品图像属于第k类的真实概率，

为卷积神经网络模型预测的该丝织品图像属于第k类的预测概率。

进一步地，使用欧式距离计算图像之间的相似性，欧式距离的计算公式为：

其中，A和B分别为两个图像经过网络计算后提取出的n维特征向量，A_m为向量A在第m维度上的值，B_m为向量B在第m维度上的值。

与现有技术相比，本发明实现的有益效果至少如下：

本发明针对丝织品图像属性特殊的问题，结合了图像的浅层纹理信息和深层语义信息，适应于丝织品图像检索。

本发明针对小样本难训练的问题，提出了区别于随机采样方法的有约束的采样方法，提高样本利用率并提升检索表现。

本发明结合了注意力机制与多任务学习，使神经网络更集中地学习与检索相关的知识，摒弃无关信息的干扰，在不提升额外数据量的情况下有效提高模型性能。

附图说明

图1为本发明实施例中一种结合浅层与深层特征的小样本丝织品检索方法的模型示意图；

图2为本发明实施例中卷积神经网络模型U-Net层结构图。

图3为本发明实施例中损失函数及阈值margin在特征空间中的作用示意图。

具体实施方式

以下结合附图和具体实施方式对本发明的方案做进一步的阐述。

实施例1：

一种结合浅层与深层特征的小样本丝织品检索方法，如图1所示，包括以下步骤：

S1、收集丝织品图像，建立丝织品样本库；

本实施例中，一共5895张丝织品图像，通过人工分类，将相似的丝织品归为一类，总计59类。将5895张图像划分为训练图片4532张，验证图片671张，测试图片672张。

S2、建立卷积神经网络模型；

如图1所示，所述卷积神经网络模型基于U-Net构建，卷积神经网络模型包括U-Net层、3层卷积层、注意力模块、池化层和全连接层；

本实施例中，如图2所示，U-Net层共有14层卷积层，其中每2层卷积层为一组；第一卷积层组down1包括第一层卷积层和第二层卷积层，第二卷积层组down2包括第三层卷积层和第四层卷积层，第三卷积层组down3包括第五层卷积层和第六层卷积层，第四卷积层组bottom包括第七层卷积层和第八层卷积层，第五卷积层组up3包括第九层卷积层和第十层卷积层，第六卷积层组up2包括第十一层卷积层和第十二层卷积层，第七卷积层组up1包括第十三层卷积层和第十四层卷积层；

在第一卷积层组down1与第七卷积层组up1之间、第二卷积层组down2与第六卷积层组up2之间、第三卷积层组down3与第五卷积层组up3之间存在着跳跃连接，作为浅层特征信息与深层特征信息融合的重要手段；该跳跃连接的具体操作为，分别将第一卷积层组down1、第二卷积层组down2和第三卷积层组down3在最大池化前的特征图复制并拼接到第七卷积层组up1、第六卷积层组up2和第五卷积层组up3的输入特征图上，该拼接沿通道方向进行；

图像经过U-Net层提取特征之后，特征图分辨率会恢复成与输入图像一模一样大小。

本实施例中，3层卷积层中的前两层均使用大小为3x3的卷积核，后接批标准化、ReLU激活函数和2x2的最大池化层，卷积操作没有填充；3层卷积层中的最后一层使用大小为3x3的卷积核，后接批标准化、ReLU激活函数，卷积操作没有填充；

注意力模块中结合注意力机制和多任务学习，注意力模块中的操作具体包括以下步骤：

所述有约束采样方法包括以下步骤：

S3.4、将所有采样的正样本对与负样本对组成训练数据集。

本实施例中，将采样好的训练数据集输入建立好的神经网络模型中，通过损失函数训练并更新模型参数，其中每训练10次便用验证图片组成的验证集对模型进行准确度验证。在总共300次训练过后，只取准确度最高的模型参数保存下来，即得到训练完成的卷积神经网络模型；训练卷积神经网络模型时，卷积神经网络模型的损失函数为：

其中，x_i和x_j分别为输入的丝织品图像对中的丝织品图像i和丝织品图像j经过卷积神经网络模型后提取到的特征；y表示成对标签，输入的丝织品图像对中的丝织品图像i和丝织品图像j为同一类别时y为1，否则为0；D(·)为欧式距离计算公式；margin为预先设定的阈值，表示不同类别特征之间的欧式距离最小不可小于margin值，损失函数及阈值margin在特征空间中的作用如图3所示；k表示丝织品图像的类别；p_k表示丝织品图像属于第k类的真实概率，

使用欧式距离计算图像之间的相似性，欧式距离的计算公式为：

采用准确率、精准度和平均精度均值(mAP)图像检索结果评价指标，与ResNet、DenseNet、ReDSL、NetVLAD、DSMFR模型作对比，当检索数量设置为5时，其对比结果如下。

表1不同模型和方法在自建丝织品数据集上的检索性能

从表1可以明显看到，相比于其他现有的检索方法，采用本实施例提供的检索方法的得到丝织品检索结果明显更优，体现了本实施例提供的丝织品检索方法的优越性，可以更为准确地检索到丝织品图像的相似性结果。

实施例2：

在一个具体的实施例中，提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述丝织品图像检索方法的步骤。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、数据库、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储丝织品样本图像以及数据库等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述结合浅层与深层的小样本丝织品图像检索方法。

实施例3：

在一个具体的实施例中，提供了一种计算机可读介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述结合浅层与深层的小样本丝织品图像检索方法的步骤。

本发明中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种结合浅层与深层特征的小样本丝织品图像检索方法，其特征在于，包括以下步骤：

S1、收集丝织品图像，建立丝织品样本库；

S2、建立卷积神经网络模型；所述卷积神经网络模型基于U-Net构建，卷积神经网络模型包括U-Net层、3层卷积层、注意力模块、池化层和全连接层；

输入卷积神经网络模型的丝织品图像先经过U-Net层提取特征，再经过3层卷积层进行卷积计算后输入注意力模块中得到经过注意力加权的特征图，经过注意力加权的特征图输入池化层和全连接层输出丝织品图像的特征；U-Net层共有14层卷积层，其中每2层卷积层为一组；第一卷积层组down1包括第一层卷积层和第二层卷积层，第二卷积层组down2包括第三层卷积层和第四层卷积层，第三卷积层组down3包括第五层卷积层和第六层卷积层，第四卷积层组bottom包括第七层卷积层和第八层卷积层，第五卷积层组up3包括第九层卷积层和第十层卷积层，第六卷积层组up2包括第十一层卷积层和第十二层卷积层，第七卷积层组up1包括第十三层卷积层和第十四层卷积层；

其中，每组卷积层组包括的两层卷积层中，前一层卷积层使用3x3大小的卷积核，填充为1，后接实例标准化、LeakyReLU激活函数和取值0.2的随机失活；后一层卷积层使用3x3大小的卷积核，填充为1，后接实例标准化和LeakyReLU激活函数；

S5、使用训练完成的卷积神经网络模型提取待检索丝织品图像的特征，并计算提取得到的待检索丝织品图像的特征与样本库中各个丝织品图像提取到的特征的欧式距离，根据欧式距离的大小得到基于图像特征的待检索丝织品图像的检索结果。

2.根据权利要求1所述的一种结合浅层与深层特征的小样本丝织品图像检索方法，其特征在于：3层卷积层中的前两层均使用大小为3x3的卷积核，后接批标准化、ReLU激活函数和2x2的最大池化层，卷积操作没有填充；3层卷积层中的最后一层使用大小为3x3的卷积核，后接批标准化、ReLU激活函数，卷积操作没有填充；

3.根据权利要求1所述的一种结合浅层与深层特征的小样本丝织品图像检索方法，其特征在于：注意力模块中结合注意力机制和多任务学习，注意力模块中的操作具体包括以下步骤：

S2.2a、将第二特征图F输入至全连接层，得到64大小的特征向量，再将该特征向量送入分类器进行图像分类；

S2.2b、将第一特征图D与第二特征图F进行按通道乘操作，得到经过注意力加权的特征图G，将G送入后续空间金字塔池化层中；

其中，步骤S2.2a与步骤S2.2b为步骤S2.1之后的两个分支，同时进行，互相独立；

4.根据权利要求1所述的一种结合浅层与深层特征的小样本丝织品图像检索方法，其特征在于：步骤S3中，所述有约束采样方法包括以下步骤：

S3.3、将所有正样本对复制2次，此时每对正样本对总共出现了3次；

S3.4、将所有采样的正样本对与负样本对组成训练数据集。

5.根据权利要求1所述的一种结合浅层与深层特征的小样本丝织品图像检索方法，其特征在于：步骤S3中，步骤S4中，训练卷积神经网络模型时，卷积神经网络模型的损失函数为：

其中，x_i和x_j分别为输入的丝织品图像对中的丝织品图像i和丝织品图像j经过卷积神经网络模型后提取到的特征；y表示成对标签，输入的丝织品图像对中的丝织品图像i和丝织品图像j为同一类别时y为1，否则为0；D(·)为欧式距离计算公式；margin为预先设定的阈值，不同类别特征之间的欧式距离不小于margin；k表示丝织品图像的类别；p_k表示丝织品图像属于第k类的真实概率，

6.根据权利要求5所述的一种结合浅层与深层特征的小样本丝织品图像检索方法，其特征在于：使用欧式距离计算图像之间的相似性，欧式距离的计算公式为：

7.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于：所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。

8.一种计算机可读介质，其上存储有计算机程序，其特征在于：

所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。