CN107563388A - 一种基于深度信息预分割的卷积神经网络物体识别方法 - Google Patents

一种基于深度信息预分割的卷积神经网络物体识别方法 Download PDF

Info

Publication number
CN107563388A
CN107563388A CN201710838112.8A CN201710838112A CN107563388A CN 107563388 A CN107563388 A CN 107563388A CN 201710838112 A CN201710838112 A CN 201710838112A CN 107563388 A CN107563388 A CN 107563388A
Authority
CN
China
Prior art keywords
layer
convolution
neural networks
image
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710838112.8A
Other languages
English (en)
Inventor
王晟
左东昊
谢丽萍
钱唯
刘正阳
方郅昊
高英淇
成奕霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201710838112.8A priority Critical patent/CN107563388A/zh
Publication of CN107563388A publication Critical patent/CN107563388A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度信息预分割的卷积神经网络物体识别方法,包括以下步骤:步骤1:采集场景的深度图像和彩色图像;步骤2:从场景的深度图像中分割出物体的深度图像;步骤3:根据物体的深度图像的分割范围,从场景的彩色图像中分割出物体的彩色图像;步骤4:对分割好的彩色图像进行填充处理;步骤5:将填充好的彩色图像输入到卷积神经网络进行识别,输出识别结果。本发明的基于深度信息预分割的卷积神经网络物体识别方法,可以识别复杂图片中的多个物体,训练速度快、识别速度快,对硬件要求低,可减少卷积神经网络过拟合。

Description

一种基于深度信息预分割的卷积神经网络物体识别方法
技术领域
本发明涉及图像处理和物体识别技术领域,具体涉及一种基于深度信息预分割的卷积神经网络物体识别方法。
背景技术
物体的计算机解释对于机器人学、人工智能等方面的应用具有关键性的作用。将传感器采集的物体图像转化为人类可理解的信息(如文字、声音、影像等)是前科学研究的热点。
现行的物体识别方法主要是对单纯的RGB图像进行识别。这种识别方式可能会将图像的全局特征当作局部特征,从而出现过拟合现象而降低物体的识别率。另一种新型识别方法是将物体的RGB和深度图像一同放入卷积及神经网络进行训练和识别。这种方法的识别度较第一种方法高,但是在对于多物体的训练与识别中计算量过大。
针对目前图像识别中存在的问题,我们提出新的算法,在提高识别率的同时减少了计算量。
发明内容
本发明针对现有技术的不足提供一种基于深度信息预分割和卷积神经网络的物体识别方法,可以识别复杂图片中的多个物体,识别速度快,可减少卷积神经网络过拟合的发生。
本发明提供一种基于深度信息预分割的卷积神经网络物体识别方法,包括以下步骤:
步骤1:采集场景的深度图像和彩色图像;
步骤2:从场景的深度图像中分割出物体的深度图像;
步骤3:根据物体的深度图像的分割范围,从场景的彩色图像中分割出物体的彩色图像;
步骤4:对分割好的彩色图像进行填充和缩放处理;
步骤5:将填充好的彩色图像输入到卷积神经网络进行识别,输出识别结果。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤1具体为:
同一时刻采集同一场景的深度图像和彩色图像,图像采集设备可以为Kinect设备或多目摄像头。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤2具体为:
步骤2.1:采用大津算法将场景的深度图像分为前景和背景,前景代表目标物体,其深度在一定范围内;
步骤2.2:采用种子区域生长算法,将目标物体的深度图像从场景的深度图像中分割出来。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤2.2具体为:
步骤2.2.1:在前景的深度范围内随机选出五个像素点作为种子点;
步骤2.2.2:对每个种子点周围的8个像素点就进行遍历,当灰度变化小于4时该像素点同化为种子点;
步骤2.2.3:重复步骤2.2.2直到图片上所有的像素点被分为种子点和非种子点;
步骤2.2.4:将种子点构成的图像分割出来即获得物体的深度图像。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤3具体为:
场景的彩色图像与深度图像的像素点一一对应,可根据物体的深度图像的分割位置对应到场景的彩色图像上,进而将物体的彩色图像分割出来。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤4包括:
步骤4.1:设定填充区域的RGB颜色值,将分割好的彩色图像的宽高比填充至1:1;
步骤4.2:采用双线性差值算法将填充后的彩色图像调整为规定的尺寸。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤4.1中设定填充区域的RGB颜色值可采用以下几种方法:
a.将物品的边缘像素点的RGB颜色值取均值操作,将该颜色称为边缘平均值,填充区域的RGB颜色值为边缘平均值的反色;
b.设置填充区域的RGB颜色值为(0,0,0),即填充黑色;
c.设置填充区域的RGB颜色值为(255,255,255),即填充白色。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤5包括:
步骤5.1:构建卷积神经网络模型;
步骤5.2:采集多种物体的图像构成训练集对卷积神经网络模型进行训练;
步骤5.3:将填充好的彩色图像输入到训练好的卷积神经网络模型进行识别,并输出结果。
在本发明的基于深度信息预分割的卷积神经网络物体识别方法中,步骤5.1中构建卷积神经网络为包含20个隐含层的神经网络,具体为:
第一层为卷积层conv1,conv1中有64个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第二层为卷积层conv2,conv2中有64个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第三层为池化层subsampling1层,在池化的过程中使用最大池化操作;
第四层为卷积层conv3,conv3中有128个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第五层为卷积层conv4,conv4中有128个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第六层为池化层subsampling2层,在池化的过程中使用最大池化操作;
第七层为卷积层conv5,conv5中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第八层为卷积层conv6,conv6中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第九层为卷积层conv7,conv7中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十层为池化层subsampling3层,在池化的过程中使用最大池化操作;
第十一层为卷积层conv8,conv8中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十二层为卷积层conv9,conv9中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十三层为卷积层conv10,conv10中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十四层为池化层subsampling4层,在池化的过程中使用最大池化操作;
第十五层为卷积层conv11,conv11中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十六层为卷积层conv12,conv12中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十七层为卷积层conv13,conv13中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十八为池化层subsampling5层,在池化的过程中使用最大池化操作;
第十九层为全连接层Fc采用average pooling,以此提高神经网络的训练和预测速度;
第二十层为分类层Softmax,将全连接层Fc输出的特征向量输入分类层,得到识别物体的分类标签,计算出每种分类标签的概率,并将最大概率的标签输出。
本发明的基于深度信息预分割的卷积神经网络物体识别方法,可以识别复杂图片中的多个物体,降低了所需的训练量、识别速度快,对硬件要求低,可减少卷积神经网络过拟合。
附图说明
图1是本发明的一种基于深度信息预分割的卷积神经网络物体识别方法的流程图;
图2是本发明的卷积神经网络的结构示意图。
具体实施方式
本发明提供了一种基于深度信息预分割的卷积神经网络物体识别方法,如图1所示,识别方法包括以下步骤:
步骤1:采集场景的深度图像和彩色图像;
步骤2:从场景的深度图像中分割出物体的深度图像;
步骤3:根据物体的深度图像的分割范围,从场景的彩色图像中分割出物体的彩色图像;
步骤4:对分割好的彩色图像进行填充和缩放处理;
步骤5:将填充好的彩色图像输入到卷积神经网络进行识别,输出识别结果。
步骤1具体为:
同一时刻采集同一场景的深度图像和彩色图像,图像采集设备可以为Kinect设备或多目摄像头。
彩色图像可由摄像头获得,深度图像的采集方法包括不限于以下几种:1.通过副摄像头采集辅助图像然后进行模式匹配,可得到物体在双目摄像头中的两个不同的坐标,从而结合双摄像头之间的距离利用几何关系计算得到深度图像。这种方法价格低廉精度较低,且难以分辨超过五米的物体。2.通过激光雷达高速旋转的同时进行扫描,得到某个周围物体到传感器的距离,在无人驾驶汽车上这一技术得到了广泛的使用,例如,2015年12月10日,百度无人驾驶汽车实际上路测试成功,其车身上采用的Velodyne HDL-64E就是这样的激光雷达技术。类似的技术价格非常高昂,一台设备的价格可以达到数十万人民币。3.采用微软公司的Kinect等商用设备。采用双摄像头结合红外摄像头的方式获得深度信息。这种方式在价格和精度之间达到了较好的平衡,但存在算法非公开的问题。
图像的深度信息由两个摄像头采集然后计算得到,而色彩信息在其中一个摄像头的位置采集,且两者的像素点并非一一对应,需要经过某种矫正算法来将深度图像和彩色图像对齐,以微软Kinect为例,其配套的软件开发包中有相应的函数对两图像进行对齐对应处理。
步骤2具体为:
步骤2.1:采用大津算法将场景的深度图像分为前景和背景,前景代表目标物体,其深度在一定范围内;
此时前景的深度在一定的范围内,譬如目标物体作为前景被大津算法分割出来,该目标物体距离传感器的距离在35cm-42cm之间,称该距离为前景距离范围。但是因为图片中有其他的噪声距离传感器也在前景距离范围以内,我们将37cm对应的灰度值这个值作为种子生长的种子值。
步骤2.2:采用种子区域生长算法,将目标物体的深度图像从场景的深度图像中分割出来,具体为:
步骤2.2.1:在前景的深度范围内随机选出五个像素点作为种子点;
步骤2.2.2:对每个种子点周围的8个像素点就进行遍历,当灰度变化小于4时该像素点同化为种子点;
步骤2.2.3:重复步骤2.2.2直到图片上所有的像素点被分为种子点和非种子点;
步骤2.2.4:将种子点构成的图像分割出来即获得物体的深度图像。
在深度图像分割过程中我们会多次使用大津算法来将图片进行分割,并对每一个分割的结果进行区域生长算法以去掉不相关的信息,如一个两个杯子放在桌面上,区域生长算法可以将两个杯子进行分割。
步骤3具体为:
场景的彩色图像与深度图像的像素点一一对应,可根据物体的深度图像的分割位置对应到场景的彩色图像上,进而将物体的彩色图像分割出来。
在经过大津法和种子区域生长法分割之后的图像比例大小不一,但本发明用到的卷积神经网络需要图片的尺寸比例统一为:宽224像素,高224像素。所以我们对图像进行下述两个操作,填充和缩放。
步骤4对分割好的彩色图像进行填充和缩放处理具体包括:
步骤4.1:设定填充区域的RGB颜色值,将分割好的彩色图像的宽高比填充至1:1;
步骤4.1中设定填充区域的RGB颜色值可采用以下几种方法:
a.将物品的边缘像素点的RGB颜色值取均值操作,将该颜色称为边缘平均值,填充区域的RGB颜色值为边缘平均值的反色;
b.设置填充区域的RGB颜色值为(0,0,0),即填充黑色;
c.设置填充区域的RGB颜色值为(255,255,255),即填充白色。
进行填充,假设该图片的长宽为(w,h),若w>h,将图片填充成(w,w);若w<h,将图片填充成(h,h)。
步骤4.2:采用双线性差值算法将填充后的彩色图像调整为规定的尺寸。
本实施例中,将已经完成填充的长宽为(x,x)的图像缩放到(224,244)。
图像处理完成后,将图像的每一个像素点按照从左到右,从上到下的顺序依次按行输入到卷积神经网络中进行图像识别。步骤5包括:
步骤5.1:构建卷积神经网络模型;
具体实施时,构建卷积神经网络为包含20个隐含层的神经网络,具体为:
第一层为卷积层conv1,conv1中有64个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第二层为卷积层conv2,conv2中有64个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第三层为池化层subsampling1层,在池化的过程中使用最大池化操作;
第四层为卷积层conv3,conv3中有128个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第五层为卷积层conv4,conv4中有128个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第六层为池化层subsampling2层,在池化的过程中使用最大池化操作;
第七层为卷积层conv5,conv5中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第八层为卷积层conv6,conv6中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第九层为卷积层conv7,conv7中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十层为池化层subsampling3层,在池化的过程中使用最大池化操作;
第十一层为卷积层conv8,conv8中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十二层为卷积层conv9,conv9中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十三层为卷积层conv10,conv10中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十四层为池化层subsampling4层,在池化的过程中使用最大池化操作;
第十五层为卷积层conv11,conv11中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十六层为卷积层conv12,conv12中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十七层为卷积层conv13,conv13中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十八为池化层subsampling5层,在池化的过程中使用最大池化操作;
第十九层为全连接层Fc采用average pooling,以此提高神经网络的训练和预测速度;
第二十层为分类层Softmax,将全连接层Fc输出的特征向量输入分类层,得到识别物体的分类标签,计算出每种分类标签的概率,并将最大概率的标签输出。
步骤5.2:采集多种物体的图像构成训练集对卷积神经网络模型进行训练;
步骤5.3:将填充好的彩色图像输入到训练好的卷积神经网络模型进行识别,并输出结果。
本发明使用Image-Net预训练完的卷积层权重,以此提高泛化性能。
以上所述仅为本发明的较佳实施例,并不用以限制本发明的思想,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,包括以下步骤:
步骤1:采集场景的深度图像和彩色图像;
步骤2:从场景的深度图像中分割出物体的深度图像;
步骤3:根据物体的深度图像的分割范围,从场景的彩色图像中分割出物体的彩色图像;
步骤4:对分割好的彩色图像进行填充和缩放处理;
步骤5:将填充好的彩色图像输入到卷积神经网络进行识别,输出识别结果。
2.如权利要求1所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤1具体为:
同一时刻采集同一场景的深度图像和彩色图像,图像采集设备可以为Kinect设备或多目摄像头。
3.如权利要求1所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤2具体为:
步骤2.1:采用大津算法将场景的深度图像分为前景和背景,前景代表目标物体,其深度在一定范围内;
步骤2.2:采用种子区域生长算法,将目标物体的深度图像从场景的深度图像中分割出来。
4.如权利要求3所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤2.2具体为:
步骤2.2.1:在前景的深度范围内随机选出五个像素点作为种子点;
步骤2.2.2:对每个种子点周围的8个像素点就进行遍历,当灰度变化小于4时该像素点同化为种子点;
步骤2.2.3:重复步骤2.2.2直到图片上所有的像素点被分为种子点和非种子点;
步骤2.2.4:将种子点构成的图像分割出来即获得物体的深度图像。
5.如权利要求1所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤3具体为:
场景的彩色图像与深度图像的像素点一一对应,可根据物体的深度图像的分割位置对应到场景的彩色图像上,进而将物体的彩色图像分割出来。
6.如权利要求1所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤4包括:
步骤4.1:设定填充区域的RGB颜色值,将分割好的彩色图像的宽高比填充至1:1;
步骤4.2:采用双线性差值算法将填充后的彩色图像调整为规定的尺寸。
7.如权利要求6所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤4.1中设定填充区域的RGB颜色值可采用以下几种方法:
a.将物品的边缘像素点的RGB颜色值取均值操作,将该颜色称为边缘平均值,填充区域的RGB颜色值为边缘平均值的反色;
b.设置填充区域的RGB颜色值为(0,0,0),即填充黑色;
c.设置填充区域的RGB颜色值为(255,255,255),即填充白色。
8.如权利要求1所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤5包括:
步骤5.1:构建卷积神经网络模型;
步骤5.2:采集多种物体的图像构成训练集对卷积神经网络模型进行训练;
步骤5.3:将填充好的彩色图像输入到训练好的卷积神经网络模型进行识别,并输出结果。
9.如权利要求8所述的基于深度信息预分割的卷积神经网络物体识别方法,其特征在于,步骤5.1中构建卷积神经网络为包含20个隐含层的神经网络,具体为:
第一层为卷积层conv1,conv1中有64个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第二层为卷积层conv2,conv2中有64个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第三层为池化层subsampling1层,在池化的过程中使用最大池化操作;
第四层为卷积层conv3,conv3中有128个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第五层为卷积层conv4,conv4中有128个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第六层为池化层subsampling2层,在池化的过程中使用最大池化操作;
第七层为卷积层conv5,conv5中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第八层为卷积层conv6,conv6中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第九层为卷积层conv7,conv7中有256个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十层为池化层subsampling3层,在池化的过程中使用最大池化操作;
第十一层为卷积层conv8,conv8中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十二层为卷积层conv9,conv9中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十三层为卷积层conv10,conv10中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十四层为池化层subsampling4层,在池化的过程中使用最大池化操作;
第十五层为卷积层conv11,conv11中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十六层为卷积层conv12,conv12中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十七层为卷积层conv13,conv13中有512个3*3的滤波器进行步长为1像素的卷积操作同时在进行卷积之前存在着边缘填充Padding操作在卷积结束后通过一个非线性激活层ReLU函数作为激活函数;
第十八为池化层subsampling5层,在池化的过程中使用最大池化操作;
第十九层为全连接层Fc采用average pooling,以此提高神经网络的训练和预测速度;
第二十层为分类层Softmax,将全连接层Fc输出的特征向量输入分类层,得到识别物体的分类标签,计算出每种分类标签的概率,并将最大概率的标签输出。
CN201710838112.8A 2017-09-18 2017-09-18 一种基于深度信息预分割的卷积神经网络物体识别方法 Pending CN107563388A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710838112.8A CN107563388A (zh) 2017-09-18 2017-09-18 一种基于深度信息预分割的卷积神经网络物体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710838112.8A CN107563388A (zh) 2017-09-18 2017-09-18 一种基于深度信息预分割的卷积神经网络物体识别方法

Publications (1)

Publication Number Publication Date
CN107563388A true CN107563388A (zh) 2018-01-09

Family

ID=60980169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710838112.8A Pending CN107563388A (zh) 2017-09-18 2017-09-18 一种基于深度信息预分割的卷积神经网络物体识别方法

Country Status (1)

Country Link
CN (1) CN107563388A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109917419A (zh) * 2019-04-12 2019-06-21 中山大学 一种基于激光雷达与图像的深度填充密集***及方法
CN110059597A (zh) * 2019-04-04 2019-07-26 南京理工大学 基于深度相机的场景识别方法
CN110084828A (zh) * 2019-04-29 2019-08-02 北京华捷艾米科技有限公司 一种图像分割方法、装置及终端设备
CN110136144A (zh) * 2019-05-15 2019-08-16 北京华捷艾米科技有限公司 一种图像分割方法、装置及终端设备
CN110232326A (zh) * 2019-05-20 2019-09-13 平安科技(深圳)有限公司 一种三维物体识别方法、装置及存储介质
CN110378276A (zh) * 2019-07-16 2019-10-25 顺丰科技有限公司 车辆状态获取方法、装置、设备、及存储介质
CN111272753A (zh) * 2019-09-06 2020-06-12 山东大学 基于图像识别与分析的隧道内围岩石英含量预测***与方法
CN111468430A (zh) * 2020-04-17 2020-07-31 无锡雪浪数制科技有限公司 一种基于深度视觉的煤矸石分离方法
CN111667493A (zh) * 2020-05-27 2020-09-15 华中科技大学 基于可变形卷积神经网络的果园果树区域分割方法和***
CN111742344A (zh) * 2019-06-28 2020-10-02 深圳市大疆创新科技有限公司 图像语义分割方法、可移动平台及存储介质
CN112183185A (zh) * 2020-08-13 2021-01-05 天津大学 基于光流法和cnn-svm的液体泄漏检测方法
CN113052124A (zh) * 2021-04-09 2021-06-29 济南博观智能科技有限公司 一种起雾场景的识别方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217214A (zh) * 2014-08-21 2014-12-17 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于可配置卷积神经网络的rgb-d人物行为识别方法
CN106127164A (zh) * 2016-06-29 2016-11-16 北京智芯原动科技有限公司 基于显著性检测和卷积神经网络的行人检测方法及装置
US9542626B2 (en) * 2013-09-06 2017-01-10 Toyota Jidosha Kabushiki Kaisha Augmenting layer-based object detection with deep convolutional neural networks
CN106384353A (zh) * 2016-09-12 2017-02-08 佛山市南海区广工大数控装备协同创新研究院 一种基于rgbd的目标定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542626B2 (en) * 2013-09-06 2017-01-10 Toyota Jidosha Kabushiki Kaisha Augmenting layer-based object detection with deep convolutional neural networks
CN104217214A (zh) * 2014-08-21 2014-12-17 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于可配置卷积神经网络的rgb-d人物行为识别方法
CN106127164A (zh) * 2016-06-29 2016-11-16 北京智芯原动科技有限公司 基于显著性检测和卷积神经网络的行人检测方法及装置
CN106384353A (zh) * 2016-09-12 2017-02-08 佛山市南海区广工大数控装备协同创新研究院 一种基于rgbd的目标定位方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110059597A (zh) * 2019-04-04 2019-07-26 南京理工大学 基于深度相机的场景识别方法
CN109917419B (zh) * 2019-04-12 2021-04-13 中山大学 一种基于激光雷达与图像的深度填充密集***及方法
CN109917419A (zh) * 2019-04-12 2019-06-21 中山大学 一种基于激光雷达与图像的深度填充密集***及方法
CN110084828A (zh) * 2019-04-29 2019-08-02 北京华捷艾米科技有限公司 一种图像分割方法、装置及终端设备
CN110136144A (zh) * 2019-05-15 2019-08-16 北京华捷艾米科技有限公司 一种图像分割方法、装置及终端设备
CN110232326A (zh) * 2019-05-20 2019-09-13 平安科技(深圳)有限公司 一种三维物体识别方法、装置及存储介质
CN110232326B (zh) * 2019-05-20 2024-05-31 平安科技(深圳)有限公司 一种三维物体识别方法、装置及存储介质
CN111742344A (zh) * 2019-06-28 2020-10-02 深圳市大疆创新科技有限公司 图像语义分割方法、可移动平台及存储介质
WO2020258297A1 (zh) * 2019-06-28 2020-12-30 深圳市大疆创新科技有限公司 图像语义分割方法、可移动平台及存储介质
CN110378276A (zh) * 2019-07-16 2019-10-25 顺丰科技有限公司 车辆状态获取方法、装置、设备、及存储介质
CN110378276B (zh) * 2019-07-16 2021-11-30 顺丰科技有限公司 车辆状态获取方法、装置、设备、及存储介质
CN111272753A (zh) * 2019-09-06 2020-06-12 山东大学 基于图像识别与分析的隧道内围岩石英含量预测***与方法
CN111468430A (zh) * 2020-04-17 2020-07-31 无锡雪浪数制科技有限公司 一种基于深度视觉的煤矸石分离方法
CN111667493A (zh) * 2020-05-27 2020-09-15 华中科技大学 基于可变形卷积神经网络的果园果树区域分割方法和***
CN112183185A (zh) * 2020-08-13 2021-01-05 天津大学 基于光流法和cnn-svm的液体泄漏检测方法
CN113052124A (zh) * 2021-04-09 2021-06-29 济南博观智能科技有限公司 一种起雾场景的识别方法、装置和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN107563388A (zh) 一种基于深度信息预分割的卷积神经网络物体识别方法
CN109584248B (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
CN108830285B (zh) 一种基于Faster-RCNN的加强学习的目标检测方法
CN108492271B (zh) 一种融合多尺度信息的自动图像增强***及方法
CN107229904A (zh) 一种基于深度学习的目标检测与识别方法
CN106920243A (zh) 改进的全卷积神经网络的陶瓷材质件序列图像分割方法
CN114724120B (zh) 基于雷视语义分割自适应融合的车辆目标检测方法及***
CN111553949B (zh) 基于单帧rgb-d图像深度学习对不规则工件的定位抓取方法
CN104077577A (zh) 一种基于卷积神经网络的商标检测方法
CN110619638A (zh) 一种基于卷积块注意模块的多模态融合显著性检测方法
CN106682569A (zh) 一种基于卷积神经网络的快速交通标识牌识别方法
CN110991444B (zh) 面向复杂场景的车牌识别方法及装置
CN104299006A (zh) 一种基于深度神经网络的车牌识别方法
CN108280488A (zh) 基于共享神经网络的可抓取物体识别方法
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN110443775B (zh) 基于卷积神经网络的离散小波变换域多聚焦图像融合方法
CN110136130A (zh) 一种检测产品缺陷的方法及装置
CN108052989A (zh) 一种基于样条卷积神经网络的图像分类方法
CN109360179A (zh) 一种图像融合方法、装置及可读存储介质
CN110399908A (zh) 基于事件型相机的分类方法和装置、存储介质、电子装置
CN109872326B (zh) 基于深度强化网络跳跃连接的轮廓检测方法
CN110136075A (zh) 一种基于边缘锐化循环生成对抗网络的遥感影像去雾方法
CN112562255A (zh) 微光环境下电缆沟道烟雾火情的智能图像检测方法
CN113971764A (zh) 一种基于改进YOLOv3的遥感图像小目标检测方法
CN108734200A (zh) 基于bing特征的人体目标视觉检测方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180109