CN107292319A - 一种基于可变形卷积层的特征图像提取的方法及装置 - Google Patents

一种基于可变形卷积层的特征图像提取的方法及装置 Download PDF

Info

Publication number
CN107292319A
CN107292319A CN201710660525.1A CN201710660525A CN107292319A CN 107292319 A CN107292319 A CN 107292319A CN 201710660525 A CN201710660525 A CN 201710660525A CN 107292319 A CN107292319 A CN 107292319A
Authority
CN
China
Prior art keywords
sampled point
extracted
target image
image
characteristic image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710660525.1A
Other languages
English (en)
Inventor
刘治
李家兴
章云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201710660525.1A priority Critical patent/CN107292319A/zh
Publication of CN107292319A publication Critical patent/CN107292319A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于可变形卷积层的特征图像提取的方法,所述方法包括获取目标图像;通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值;该方法可以对卷积核中每个采样点增加一个偏移变量,从而使得卷积神经网络实现了学习图像空间几何形变的能力,可以使得卷积核在当前位置附近随意采样,增加了卷积层在提取特征图像时对于发生了形变的图像的适应性,从而会增加了对于发生形变的物体的识别精度;本发明还公开了一种基于可变形卷积神经网络的特征图像提取的装置,同样具有上述有益效果。

Description

一种基于可变形卷积层的特征图像提取的方法及装置
技术领域
本发明涉及人工智能领域,特别是涉及一种基于可变形卷积层的特征图像提取的方法及装置。
背景技术
随着科技不断的进步,近几年深度学习得到了长远的发展。目前最热门的技术是卷积神经网络,并且基于卷积神经网络的图像检测已经成为国防军事、社会安全、公共交通、商业应用等各个领域的基础性研究课题。迄今为止,最好的图像检测技术都是使用卷积神经网络来实现的。
在进行图像检测的过程中,同一个物体在图像中可能呈现不同的大小、姿态、视角变化甚至是刚性形变,获取的图像中对于同一物体会发生形变。当图像发生形变时,在现有技术中,通常的做法是依靠数据本身的多样性,即事先存储有同一物体在不同远近,不同姿态,甚至是不同光线下该物体的特征图像。现有技术中,通常是依靠数据的多样性来提高在图像检测时的精度以及鲁棒性。
但是在现有技术中,对于发生形变的物体需要存储有大量与该物体相关的特征图像,会使得数据量非常大,不方便存储,并且在进行特征图像的对比时会花费大量的时间。现有的卷积网络架构中,无法根据图像的内容自适应的调整卷积核的感受野,从而会限制对于发生形变的物体的识别精度。
发明内容
本发明的目的是提供一种基于可变形卷积层的特征图像提取的方法,可以有效提高图像识别的精度;本发明的另一目的在于提供一种基于可变形卷积层的特征图像提取的装置,可以有效提高图像识别的精度。
为解决上述技术问题,本发明提供一种基于可变形卷积层的特征图像提取的方法,所述方法包括:
获取目标图像;
通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值。
可选的,所述卷积核所提取的像素值为:其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量。
可选的,所述通过可变形卷积层的采样点从所述目标图像中提取特征图像包括:
通过所述采样点从所述目标图像对应于所述采样点相邻的像素点中,根据双线性插值提取像素值,以得到所述特征图像。
可选的,所述偏移变量为取整后的偏移变量。
可选的,所述偏移变量为预先通过梯度反向传播进行训练的偏移变量。
本发明还提供了一种基于可变形卷积神经网络的特征图像提取的装置,所述装置包括:
获取模块:用于获取目标图像;
提取模块:同于通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值。
可选的,所述提取模块具体用于:
通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像,所述卷积核所提取的像素值为:其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量。
可选的,所述提取模块具体用于:
通过所述采样点从所述目标图像对应于所述采样点相邻的像素点中,根据双线性插值提取像素值,以得到所述特征图像。
可选的,所述提取模块具体用于:
通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值,所述偏移变量为取整后的偏移变量。
可选的,所述提取模块具体用于:
通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值,所述偏移变量为预先通过梯度反向传播进行训练的偏移变量。
本发明所提供的一种基于可变形卷积层的特征图像提取的方法,可以对卷积核中每个采样点增加一个偏移变量,从而使得卷积神经网络实现了学习图像空间几何形变的能力,可以使得卷积核在当前位置附近随意采样,增加了卷积层在提取特征图像时对于发生了形变的图像的适应性,即可以根据目标图像的内容自适应的调整卷积核的感受野,从而会增加了对于发生形变的物体的识别精度。本发明还提供了一种基于可变形卷积神经网络的特征图像提取的装置,同样具有上述有益效果,在此不再进行赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的第一种特征图像提取方法的流程图;
图2为现有技术中采样点的分布示意图;
图3为本发明实施例中采样点的分布示意图;
图4为本发明实施例所提供的第二种特征图像提取方法的流程图;
图5为双线性插值的示意图;
图6为本发明实施例提供的特征图像提取装置的结构框图。
具体实施方式
本发明的核心是提供一种基于可变形卷积层的特征图像提取的方法。在现有技术中所使用的网络架构,通常是沿用了二十年的基本网络架构,在获取到的目标图像之后,会对目标图像进行基于规则格点位置采样,然后对于采样到的图像值做卷积处理,并将得到的像素值作为图标图像中该位置的输出。
使用数学表达式表示卷积运算:
yl=Wlxl+bl
其中l是卷积层索引,即表示为第l个卷积层;x是目标图像中的卷继区域,其大小通常设定为k×k的c通道的像素,当然,卷积区域的长和宽也可以不一致,视具体情况而定;W是卷积权重,其形状是d×k×k×c的权值矩阵,d是滤波器数量。
从模型的角度分析,由于卷积核有固定的几个形状,而卷积操作也有固定的几何结构,所以由其层叠搭建而成的卷积神经网络的几何结构也是固定的,其不具有对于发生形变的图像的建模能力。
而为了使得卷积神经网络可以识别出同一物体在不同条件下以及经过不同程度的变形后的该物体,通常是是依靠数据本身的多样性,即事先存储有同一物体在不同远近,不同姿态,甚至是不同光线下该物体的特征图像。现有技术中,通常是依靠数据的多样性来提高在图像检测时的精度以及鲁棒性。
但是在现有技术中,对于发生形变的物体需要存储有大量与该物体相关的特征图像,会使得数据量非常大,不方便存储,并且在进行特征图像的对比时会花费大量的时间。现有的卷积网络架构中,无法根据图像的内容自适应的调整卷积核的感受野,即卷积核的形状,从而会限制对于发生形变的物体的识别精度。
而本发明实施例所提供的一种基于可变形卷积层的特征图像提取的方法,可以对卷积核中每个采样点增加一个偏移变量,从而使得卷积神经网络实现了学习图像空间几何形变的能力,可以使得卷积核在当前位置附近随意采样,增加了卷积层在提取特征图像时对于发生了形变的图像的适应性,即可以根据目标图像的内容自适应的调整卷积核的感受野,从而会增加了对于发生形变的物体的识别精度。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图2和图3;图1为本发明实施例所提供的第一种特征图像提取方法的流程图;图2为现有技术中采样点的分布示意图;图3为本发明实施例中采样点的分布示意图。
在本发明实施例中,所述方法包括:
S101:获取目标图像。
在本步骤中,获取目标图像的方式有很多种,例如通过摄像模组来直接获取所述目标图像,也可以通过由其它设备传输过来的目标图像,在此不做具体限定。
在本发明实施例中,所述目标图像不仅仅限于通过外接设备获取的包括目标物体的原图像,还可以是已经经过其他卷积层提取过后输出的特征图像。由于在现阶段卷积神经网络中,通常是经过多个卷积层来对所述原图像进行提取,在经过多个卷积层依次进行层层提取之后,得到最终的特征图像。而本发明实施例中,经过添加偏移变量的卷积核所在的卷积层不仅限于作为第一层卷积层对原图像进行提取,而是可以作为任意一层卷积层对目标图像进行提取。其中目标图像不仅仅限于通过外接设备获取的包括目标物体的原图像,还可以是已经经过其他卷积层提取过后输出的特征图像。
更进一步的,整个卷积神经网络中各个卷积层中都可以是下述本发明实施例中的卷积层,当然也可以在整个卷积神经网络中只使用一层或几层,视具体的情况而定,在此不做具体限定。
S102:通过卷积层中卷积核的采样点从目标图像中提取像素值以得到特征图像。
在本发明实施例中,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值。
请参考图2,在使用普通的卷积神经网络提取特征图像中,一般分为两步,第一步是在目标图像中使用如图2所示的规则采样点进行采样;第二步是对采样得到的图像值做卷积并输出该位置的像素值。通过不断循环上述两个步骤来得到最终的特征图像。
其中,规则采样点决定了感受野的大小,感受野越大,卷积神经网络中卷积核每次看到的图像区域也就越大。如图2所示,该卷积核大小为3×3,有9个采样点。
相应的,上述卷积核在提取像素值时所用到的公式通常是:
其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn)是所述目标图像对应位置的像素值。
请参考图3,在本发明实施例中,对于每个采样点,均增加了一个偏移变量Δsn,此时采样点的分布不在规则,即卷积核的形状就不再是规则的了,从而感受野的大小与形状也不再规则。此时采样点的位置从原来的sn变成了sn+Δsn,实际效果请参考图3。
相应的,在本发明实施例中,卷积核所提取的像素值为:
其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量。
在增加了偏移变量Δsn之后,整个卷积神经网络拥有了适应图像形变的能力,其中偏移变量Δsn还可以是整个卷积神经网络结构的一部分。而为了将卷积神经网络拥有学习图像空间几何形变的能力,可以通过梯度反向传播来训练所述偏移变量Δsn
在进行梯度反向传播来训练参数时,需要用到梯度下降算法。常用的梯度下降算法有批量梯度下降,随机梯度下降,小批量梯度下降等等,在本发明实施例中,所用的梯度下降算法为随机梯度下降。当然也可以使用其他的梯度下降算法,视具体的情况而定,在此不做具体限定。
在所述梯度下降算法中,设定代价函数:
而上述代价函数的梯度为:
在得到上述代价函数的梯度之后,就可以通过下式更新卷积层中的参数θ:
θj=θj-η·▽θJ(θ;x(i),y(i));
在上述3个公式中,J(θ)是代价函数,hθ(xi)是卷积神经网络的输出,xi和yi是所述输出的样本值与标签值。
本发明实施例所提供的一种基于可变形卷积层的特征图像提取的方法,可以对卷积核中每个采样点增加一个偏移变量,从而使得卷积神经网络实现了学习图像空间几何形变的能力,可以使得卷积核在当前位置附近随意采样,增加了卷积层在提取特征图像时对于发生了形变的图像的适应性,即可以根据目标图像的内容自适应的调整卷积核的感受野,从而会增加了对于发生形变的物体的识别精度。
在本发明中,由于偏移变量Δsn是一个高精度的小数,在添加完偏移变量Δsn之后,采样点通常不会落在上述目标图像中各个像素点上,此时需要相应的计算像素值的算法来计算各个采样点所提取的像素值。详细情况将在下述实施例中做详细描述。
请参考图4和图5,图4为本发明实施例所提供第二种特征图像提取方法的流程图;图5为双线性插值的示意图。
请参考图4,本发明实施例所述的方法包括:
S201:获取目标图像。
本步骤与上述实施例中S101相同,具体情况以在上述实施例中做详细描述,在此不再进行赘述。
S202:通过采样点从目标图像对应于采样点相邻的像素点中,根据双线性插值提取像素值,以得到特征图像。
在本发明实施例中,提供两种计算像素值的方法,第一种是直接将所述偏移变量Δsn取整,使得采样点可以落在上述目标图像的像素点上,之后就可以计算该点的像素值。但是直接取整的话会造成较大的误差,并且该误差会在迭代的时候不断的积累,最终会影响整个卷积神经网络的识别精度。但是该方法不需要额外的计算步骤,所以运算起来比较快速。
在本步骤中,着重介绍第二种计算像素值的方法,即根据双线性插值提取像素值。
先介绍线性插值,假设已知两点的数据分别是(x0,y0),(x1,y1),计算出某一位置x∈(x0,x1)的y,有以下公式进行计算:
即:
上述的公式可以简化成y=αy0+βy1,权重就是x分别到x0,x1的距离,用于对y0,y1进行加权。
请参考图5,双线性插值本质上就是在两个方向上进行线性插值。
假设已知函数f在p11(x1,y1)、p12(x1,y2)、p21(x2,y1)和p22(x2,y2)四个坐标点的值,这里可以看成是已知四个像素点的像素值。现在是要求出s(x,y)的像素值,就有如下公式:
其中f(a1)是a1(x,y1)的像素值;f(a2)是a2(x,y2)的像素值。然后在y方向上进行插值,就得到:
综合上述公式,可以得到最终双线性插值的公式:
将上述双线性插值结合到我发明实施例中,由于目标图像中取样点只会相邻4个像素点,所以上述公式中分母为1。
设x(s)=x(s0+sn+Δsn),则可以得到下述公式:
G(q,s)=g(qx,sx)·g(qy,sy);
其中,q是本发明实施例中输入的目标图像的坐标值;sx是采样点s的横坐标;sy是采样点s的纵坐标;G(q,s)是双线性插值的核函数。
利用梯度反向传播学习偏移变量Δsn可以表示为:
其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量;x(q)是目标图像中对应像素点的像素值;G(q,s0+sn+Δsn)是双线性插值的核函数。
在本发明中,还可以通过其他的方法来计算像素值,在此不做具体限定。
本发明实施例所提供的一种基于可变形卷积层的特征图像提取的方法,可以通过双线性插值的方法精确的得到采样点所处位置的像素值,从而进一步的提高卷积神经网络的图像识别精度。并且给出学习所述偏移变量Δsn的方法,使得卷积神经网络可以学习图像空间几何形变的能力,可以根据目标图像的内容自适应的调整卷积核的感受野,从而提高对于发生形变的图像的识别精度。
下面对本发明实施例提供的一种基于可变形卷积神经网络的特征图像提取的装置进行介绍,下文描述的特征图像提取装置与上文描述的特征图像提取方法可相互对应参照。
图6为本发明实施例提供的特征图像提取装置的结构框图,参照图6特征图像提取装置可以包括:
获取模块100:用于获取目标图像;
提取模块200:同于通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值。
在本发明实施例中,所述提取模块200可以具体用于:
通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像,所述卷积核所提取的像素值为:其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量。
在本发明实施例中,所述提取模块200可以具体用于:
通过所述采样点从所述目标图像对应于所述采样点相邻的像素点中,根据双线性插值提取像素值,以得到所述特征图像。
在本发明实施例中,所述提取模块200可以具体用于:
通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值,所述偏移变量为取整后的偏移变量。
在本发明实施例中,所述提取模块200可以具体用于:
通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的所述实际坐标值,所述偏移变量为预先通过梯度反向传播进行训练的偏移变量。
本实施例的特征图像提取装置用于实现前述的特征图像提取方法,因此特征图像提取装置中的具体实施方式可见前文中的特征图像提取方法的实施例部分,例如,获取模块100,提取模块200,分别用于实现上述特征图像提取方法中步骤S101,和S102,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种基于可变形卷积神经网络的特征图像提取的方法以及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种基于可变形卷积层的特征图像提取的方法,其特征在于,所述方法包括:
获取目标图像;
通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的坐标值。
2.根据权利要求1所述的方法,其特征在于,所述卷积核所提取的像素值为:其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量。
3.根据权利要求2所述的方法,其特征在于,所述通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像包括:
通过所述采样点从所述目标图像对应于所述采样点相邻的像素点中,根据双线性插值提取像素值,以得到所述特征图像。
4.根据权利要求2所述的方法,其特征在于,所述偏移变量为取整后的偏移变量。
5.根据权利要求1至4任一项权利要求所述的方法,其特征在于,所述偏移变量为预先通过梯度反向传播进行训练的偏移变量。
6.一种基于可变形卷积层的特征图像提取的装置,其特征在于,所述装置包括:
获取模块:用于获取目标图像;
提取模块:同于通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的坐标值。
7.根据权利要求6所述的装置,其特征在于,所述提取模块具体用于:
通过卷积层中卷积核的采样点从所述目标图像中提取像素值以得到特征图像,所述卷积核所提取的像素值为:其中,y(s0)是所述特征图像中位置是s0的像素值;w(sn)是所述卷积核在所述目标图像对应位置进行卷积运算的权值;sn是所述采样点在所述卷积核中的位置;x(s0+sn+Δsn)是所述目标图像对应位置的像素值;Δsn是所述偏移变量。
8.根据权利要求7所述的装置,其特征在于,所述提取模块具体用于:
通过所述采样点从所述目标图像对应于所述采样点相邻的像素点中,根据双线性插值提取像素值,以得到所述特征图像。
9.根据权利要求7所述的装置,其特征在于,所述提取模块具体用于:
通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的坐标值,所述偏移变量为取整后的偏移变量。
10.根据权利要求6至9任一项权利要求所述的装置,其特征在于,所述提取模块具体用于:
通过可变形卷积层的采样点从所述目标图像中提取特征图像,所述采样点的实际坐标值是根据预先设置的初始坐标值和预先训练的偏移变量计算得到的坐标值,所述偏移变量为预先通过梯度反向传播进行训练的偏移变量。
CN201710660525.1A 2017-08-04 2017-08-04 一种基于可变形卷积层的特征图像提取的方法及装置 Pending CN107292319A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710660525.1A CN107292319A (zh) 2017-08-04 2017-08-04 一种基于可变形卷积层的特征图像提取的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710660525.1A CN107292319A (zh) 2017-08-04 2017-08-04 一种基于可变形卷积层的特征图像提取的方法及装置

Publications (1)

Publication Number Publication Date
CN107292319A true CN107292319A (zh) 2017-10-24

Family

ID=60105433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710660525.1A Pending CN107292319A (zh) 2017-08-04 2017-08-04 一种基于可变形卷积层的特征图像提取的方法及装置

Country Status (1)

Country Link
CN (1) CN107292319A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909113A (zh) * 2017-11-29 2018-04-13 北京小米移动软件有限公司 交通事故图像处理方法、装置及存储介质
CN108399419A (zh) * 2018-01-25 2018-08-14 华南理工大学 基于二维递归网络的自然场景图像中中文文本识别方法
CN108510467A (zh) * 2018-03-28 2018-09-07 西安电子科技大学 基于深度可变形卷积神经网络的sar图像目标识别方法
CN109272014A (zh) * 2018-08-03 2019-01-25 天津大学 一种基于畸变适应卷积神经网络的图像分类方法
CN109325945A (zh) * 2018-09-13 2019-02-12 北京旷视科技有限公司 图像处理方法、装置、电子设备及储存介质
CN109766873A (zh) * 2019-02-01 2019-05-17 中国人民解放军陆军工程大学 一种混合可变形卷积的行人再识别方法
CN109858612A (zh) * 2019-01-18 2019-06-07 清华大学 一种自适应形变空洞卷积方法
CN110135513A (zh) * 2019-05-22 2019-08-16 广东工业大学 一种基于深度学习的焊接机器人的焊缝识别方法
CN110503125A (zh) * 2018-05-17 2019-11-26 国际商业机器公司 利用感受野中的运动进行动作检测
CN110569757A (zh) * 2019-08-26 2019-12-13 高新兴科技集团股份有限公司 基于深度学习的多姿态行人检测方法及计算机存储介质
CN111476249A (zh) * 2020-03-20 2020-07-31 华东师范大学 多尺度大感受野卷积神经网络的构建方法
WO2020186765A1 (zh) * 2019-03-19 2020-09-24 深圳市商汤科技有限公司 视频处理方法、装置以及计算机存储介质
CN111815510A (zh) * 2020-09-11 2020-10-23 平安国际智慧城市科技股份有限公司 基于改进的卷积神经网络模型的图像处理方法及相关设备
CN111862136A (zh) * 2020-06-22 2020-10-30 南开大学 基于卷积神经网络的多模态核磁影像缺血性脑卒中病变分割方法
CN112580675A (zh) * 2019-09-29 2021-03-30 北京地平线机器人技术研发有限公司 图像处理方法及装置、计算机可读存储介质
CN112893159A (zh) * 2021-01-14 2021-06-04 陕西陕煤曹家滩矿业有限公司 一种基于图像识别的煤矸石分拣方法
WO2021218140A1 (zh) * 2020-04-27 2021-11-04 平安科技(深圳)有限公司 基于可变形卷积的图像识别方法、装置、计算机设备
CN114581510A (zh) * 2022-02-28 2022-06-03 扬州宝祥节能科技有限公司 基于模式识别的卷帘窗阻力点定位方法及人工智能***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101253493A (zh) * 2005-08-31 2008-08-27 微软公司 在图形处理单元上训练卷积神经网络
CN104112113A (zh) * 2013-04-19 2014-10-22 无锡南理工科技发展有限公司 一种基于改进型特征卷积神经网络图像识别方法
CN106407931A (zh) * 2016-09-19 2017-02-15 杭州电子科技大学 一种新型深度卷积神经网络运动车辆检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101253493A (zh) * 2005-08-31 2008-08-27 微软公司 在图形处理单元上训练卷积神经网络
CN104112113A (zh) * 2013-04-19 2014-10-22 无锡南理工科技发展有限公司 一种基于改进型特征卷积神经网络图像识别方法
CN106407931A (zh) * 2016-09-19 2017-02-15 杭州电子科技大学 一种新型深度卷积神经网络运动车辆检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
欧阳针等: "基于可变形卷积神经网络的图像分类研究", 《软件导刊》 *

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909113A (zh) * 2017-11-29 2018-04-13 北京小米移动软件有限公司 交通事故图像处理方法、装置及存储介质
CN108399419A (zh) * 2018-01-25 2018-08-14 华南理工大学 基于二维递归网络的自然场景图像中中文文本识别方法
CN108399419B (zh) * 2018-01-25 2021-02-19 华南理工大学 基于二维递归网络的自然场景图像中中文文本识别方法
CN108510467A (zh) * 2018-03-28 2018-09-07 西安电子科技大学 基于深度可变形卷积神经网络的sar图像目标识别方法
CN108510467B (zh) * 2018-03-28 2022-04-08 西安电子科技大学 基于深度可变形卷积神经网络的sar图像目标识别方法
US11521044B2 (en) 2018-05-17 2022-12-06 International Business Machines Corporation Action detection by exploiting motion in receptive fields
CN110503125A (zh) * 2018-05-17 2019-11-26 国际商业机器公司 利用感受野中的运动进行动作检测
CN110503125B (zh) * 2018-05-17 2023-04-28 国际商业机器公司 利用感受野中的运动进行动作检测
CN109272014A (zh) * 2018-08-03 2019-01-25 天津大学 一种基于畸变适应卷积神经网络的图像分类方法
CN109272014B (zh) * 2018-08-03 2021-05-28 天津大学 一种基于畸变适应卷积神经网络的图像分类方法
CN109325945A (zh) * 2018-09-13 2019-02-12 北京旷视科技有限公司 图像处理方法、装置、电子设备及储存介质
CN109858612A (zh) * 2019-01-18 2019-06-07 清华大学 一种自适应形变空洞卷积方法
CN109766873A (zh) * 2019-02-01 2019-05-17 中国人民解放军陆军工程大学 一种混合可变形卷积的行人再识别方法
WO2020186765A1 (zh) * 2019-03-19 2020-09-24 深圳市商汤科技有限公司 视频处理方法、装置以及计算机存储介质
JP7086235B2 (ja) 2019-03-19 2022-06-17 深▲セン▼市商▲湯▼科技有限公司 ビデオ処理方法、装置及びコンピュータ記憶媒体
JP2021530770A (ja) * 2019-03-19 2021-11-11 深▲せん▼市商▲湯▼科技有限公司Shenzhen Sensetime Technology Co., Ltd. ビデオ処理方法、装置及びコンピュータ記憶媒体
CN109862208B (zh) * 2019-03-19 2021-07-02 深圳市商汤科技有限公司 视频处理方法、装置、计算机存储介质以及终端设备
CN110135513A (zh) * 2019-05-22 2019-08-16 广东工业大学 一种基于深度学习的焊接机器人的焊缝识别方法
CN110569757B (zh) * 2019-08-26 2022-05-06 高新兴科技集团股份有限公司 基于深度学习的多姿态行人检测方法及计算机存储介质
CN110569757A (zh) * 2019-08-26 2019-12-13 高新兴科技集团股份有限公司 基于深度学习的多姿态行人检测方法及计算机存储介质
CN112580675A (zh) * 2019-09-29 2021-03-30 北京地平线机器人技术研发有限公司 图像处理方法及装置、计算机可读存储介质
CN111476249A (zh) * 2020-03-20 2020-07-31 华东师范大学 多尺度大感受野卷积神经网络的构建方法
WO2021218140A1 (zh) * 2020-04-27 2021-11-04 平安科技(深圳)有限公司 基于可变形卷积的图像识别方法、装置、计算机设备
CN111862136A (zh) * 2020-06-22 2020-10-30 南开大学 基于卷积神经网络的多模态核磁影像缺血性脑卒中病变分割方法
CN111815510B (zh) * 2020-09-11 2020-12-22 平安国际智慧城市科技股份有限公司 基于改进的卷积神经网络模型的图像处理方法及相关设备
CN111815510A (zh) * 2020-09-11 2020-10-23 平安国际智慧城市科技股份有限公司 基于改进的卷积神经网络模型的图像处理方法及相关设备
CN112893159A (zh) * 2021-01-14 2021-06-04 陕西陕煤曹家滩矿业有限公司 一种基于图像识别的煤矸石分拣方法
CN112893159B (zh) * 2021-01-14 2023-01-06 陕西陕煤曹家滩矿业有限公司 一种基于图像识别的煤矸石分拣方法
CN114581510A (zh) * 2022-02-28 2022-06-03 扬州宝祥节能科技有限公司 基于模式识别的卷帘窗阻力点定位方法及人工智能***

Similar Documents

Publication Publication Date Title
CN107292319A (zh) 一种基于可变形卷积层的特征图像提取的方法及装置
CN110705448B (zh) 一种人体检测方法及装置
US11715258B2 (en) Method for reconstructing a 3D object based on dynamic graph network
CN104732243B (zh) 基于cnn的sar目标识别方法
CN106796716B (zh) 用于为低分辨率图像提供超分辨率的设备和方法
CN108230278B (zh) 一种基于生成对抗网络的图像去雨滴方法
CN106022355B (zh) 基于3dcnn的高光谱图像空谱联合分类方法
CN105118090B (zh) 一种自适应复杂地形结构的点云滤波方法
CN108734661B (zh) 基于图像纹理信息构建损失函数的高分辨率图像预测方法
CN109271933A (zh) 基于视频流进行三维人体姿态估计的方法
CN107767413A (zh) 一种基于卷积神经网络的图像深度估计方法
CN106529569A (zh) 基于深度学习的三维模型三角面特征学习分类方法及装置
CN108765344A (zh) 一种基于深度卷积神经网络的单幅图像雨线去除的方法
CN107358293A (zh) 一种神经网络训练方法及装置
CN109785344A (zh) 基于特征重标定的双通路残差网络的遥感图像分割方法
CN108090403A (zh) 一种基于3d卷积神经网络的人脸动态识别方法及***
CN106067161A (zh) 一种对图像进行超分辨的方法
CN110210278A (zh) 一种视频目标检测方法、装置及存储介质
CN110222760A (zh) 一种基于winograd算法的快速图像处理方法
CN109284761A (zh) 一种图像特征提取方法、装置、设备及可读存储介质
CN115100383B (zh) 基于普通光源的镜面物体三维重建方法、装置和设备
CN106779055A (zh) 图像特征提取方法和装置
CN104573737B (zh) 特征点定位的方法及装置
CN106407932A (zh) 基于分数阶微积分与广义逆神经网络的手写数字识别方法
CN104050489B (zh) 一种基于多核最优化的合成孔径雷达自动目标识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171024

RJ01 Rejection of invention patent application after publication