CN105956532B - 一种基于多尺度卷积神经网络的交通场景分类方法 - Google Patents
一种基于多尺度卷积神经网络的交通场景分类方法 Download PDFInfo
- Publication number
- CN105956532B CN105956532B CN201610261849.3A CN201610261849A CN105956532B CN 105956532 B CN105956532 B CN 105956532B CN 201610261849 A CN201610261849 A CN 201610261849A CN 105956532 B CN105956532 B CN 105956532B
- Authority
- CN
- China
- Prior art keywords
- neural networks
- convolutional neural
- scale
- image
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/54—Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种交通场景多目标分类方法,包括以下步骤:提取基于多尺度卷积神经网络的隐性特征;获取最优覆盖分割树。本发明在实现交通场景分类的过程中,采用多尺度卷积神经网络,通过对原始图像在不同尺度上有效提取具有不变性的优秀隐性特征,相比于单一尺度的卷积神经网络,实现了图像更加丰富有效特征信息的获取。本发明通过将卷积神经网络提取的有效信息与图像的原始分割树结合,形成最优纯度代价树,并进行最优纯度的覆盖,实现了获得更加清晰的目标轮廓,增加了分类的准确性。本发明通过将RGB‑D作为卷积神经网络输入,相比传统RGB卷积神经网络输入,训练的特征增加了深度信息,实现了输入图像更加精确的分类。
Description
技术领域
本发明属于车辆智能交通领域,特别是一种城郊区道路交通场景分类方法。
背景技术
车辆智能化是当今汽车工业发展的三大核心科技之一,对道路交通场景的分类是提高智能车辆和高级辅助驾驶***(ADAS)智能化程度的重要前提和基础。
交通场景分类是指基于车载摄像机拍摄交通场景图像,采用不同的机器学习方法,模拟人类的视觉感知过程,实现对所拍摄视景内车辆、行人、道路、环境元素进行分类标记。目前,按照机器学习模型层次结构的深度不同,可以将交通场景的分类方法分为基于浅层学习的方法和基于深度学习的方法两种。浅层学习有限的模型复杂度和表达能力难以应对交通场景的多目标分类问题。随着分类复杂度的增加,需要的参数和样本巨大,会导致浅层学习模型的学习结构效率低下,难以实现。此外,显性特征的确定及提取需要以丰富的专家经验为基础。深度学习方法能够直接作用于原始图像数据,能够提取反映数据本质的隐性特征,具有足够的模型复杂度,可以实现交通场景中多目标分类,但深度学习方法的模型结构多样,仍存在很大的发展与优化空间,在现有的深度学习方法中分类图像的轮廓清晰度和准确性需要提高。因此,需要设计一种能够提高分类图像轮廓清晰度和准确性的交通场景多目标分类方法。
发明内容
为解决现有技术存在的上述问题,本发明要设计一种能够提高分类图像轮廓清晰度和准确性的交通场景多目标分类方法。
为了实现上述目的,本发明的技术方案如下:一种基于多尺度卷积神经网络的交通场景分类方法,包括以下步骤:
A、提取基于多尺度卷积神经网络的隐性特征
A1、基于车载RGB-D相机,获取车辆前方交通场景的RGB-D图像,即彩色图和深度图,形成四通道拉普拉斯金字塔图像作为深度学习算法的数据输入;同时,基于图像最小生成树分割,利用经典的区域融合方法,以交通场景中RGB-D图像为输入,构造具有层级结构的原始分割树。
A2、为有效提取并融合四通道拉普拉斯金字塔图像不同尺度上的有效信息,处理四通道拉普拉斯金字塔图像的卷积神经网络模型为多尺度结构,四通道拉普拉斯金字塔图像在多尺度卷积神经网络模型中以金字塔的形式存储。每一个比例的四通道拉普拉斯金字塔图像层建立一个与其他尺度图像共享权重参数的多级卷积神经网络,每级卷积神经网络包含卷积层及特征池化层,经过卷积和池化过程,获得卷积神经网络的多尺度特征图。
对同一个尺度上的卷积神经网络:卷积过程中,每个特征图只有一个卷积核与之对应并与之进行卷积运算,前一层特征图通过一个可训练卷积核进行卷积,其结果再通过一个激活函数形成下一层特征图;池化过程中,池化层中的每个特征图都分别和卷积层中的特征图一一对应,通过感受野对卷积层进行抽样,选取局部感受野中值最大的点。
对不同尺度上的卷积神经网络,在每一个尺度上相对应的卷积层中使用相同的卷积核,相对应的池化层中使用相同的池化函数,并且使用相同的权重参数。大尺度的特征图反应原始图像的细节,即局部信息,小尺度的特征图反应原始图像各部分整体信息。设F1、F2...FN分别代表不同尺度卷积神经网络经过卷积、池化后的特征图,其中,F1的大小即为原始图像的大小。其公式如下式:
fS(XS,θS)=WLHL-1 s=1,2,...,N
Hl=pool(tanh(WlHl-1+bl)) l=1,2,...,L
其中,fS是尺度为s的卷积神经网络,XS是尺度为s的四通道拉普拉斯金字塔输入图像,θS是尺度为s的卷积神经网络模型参数,N为多尺度卷积神经网络总的尺度数量,L为卷积神经网络的总层数,l表示卷积神经网络的第l层,WL为最后一层第L层的Toeplitz矩阵,HL-1为第L-1层的特征图,Wl为第l层Toeplitz矩阵,Hl为第l层的特征图,pool为池化操作,tanh为激活函数,bl为偏置。
A3、对卷积池化后与F1不同尺度的特征图F2,F3,...,FN进行上采样,使不同尺度上卷积池化后的特征图像大小变为与F1具有相同尺寸的上采样操作输出特征图,形成包含不同尺度上有效信息且尺度相同的特征图集合F。其公式如下式:
F=[F1,u(F2),...,u(FN)]
其中,F为N个尺度上采样操作后的特征图集合,Fs为多尺度卷积神经网络经卷积池化后尺度为s的未进行上采样操作的特征图,尺度s的取值范围为s=1,2,...,N,u为上采样函数。
A4、基于卷积神经网络上采样操作输出的包含不同尺度上有效信息的特征图集合,对每一个分割树节点对应原始图像位置的特征向量,使用最大池化函数对其进行特征聚合,生成每个节点对应的聚合特征向量组。
B、获取最优覆盖分割树
B1、将交通场景图像中的物体分为七类:第一类为车辆,第二类为行人,第三类为道路,第四类为交通标志,第五类为建筑物,第六类为天空,第七类为树木。采用神经网络分类器进行聚合特征向量组的分类,获得每个节点的类别分布。其中神经网络分类器是一个两层的神经网络模型,输入为聚合特征向量组,输出为分割树节点代表原始图像中所属类别,神经网络分类器模型的网络参数通过神经网络分类器训练获得。
同时,定义类别分布混乱度函数作为覆盖该节点的纯度代价函数,得出覆盖该节点的代价值,代价值越小,表明该节点的纯度越高,越倾向于将该节点覆盖。至此,构造出分类纯度代价树。
分类纯度代价函数公式如下:
ki=argmin(Zi) i=1,2,...,M
其中,Zi为分割树第i个节点的类别分布代价值,ki为反映分割树第i个节点类别的指标,argmin()为函数获得使ki最小的Zi的值,M为分割树的节点个数。
B2、从分类纯度代价树的每个叶子节点出发,寻找其至根节点路径中使纯度代价函数最优的节点,由这些最优节点组成的集合将形成涵盖整幅原始图像的最优覆盖分割树,实现轮廓清晰的交通场景多目标分类。
与现有技术相比,本发明具有以下有益效果:
1、本发明在实现交通场景分类的过程中,采用多尺度卷积神经网络,通过对原始图像在不同尺度上有效提取具有不变性的优秀隐性特征,相比于单一尺度的卷积神经网络,实现了图像更加丰富有效特征信息的获取。
2、本发明通过将卷积神经网络提取的有效信息与图像的原始分割树结合,形成最优纯度代价树,并进行最优纯度的覆盖,实现了获得更加清晰的目标轮廓,增加了分类的准确性。
3、本发明通过将RGB-D作为卷积神经网络输入,相比传统RGB卷积神经网络输入,训练的特征增加了深度信息,卷积神经网络的训练效果更加明显,实现了输入图像更加精确的分类。
附图说明
本发明共有附图2张,其中:
图1是基于多尺度卷积神经网络及最优覆盖分割树的交通场景分类方法流程图。
图2是基于多尺度卷积神经网络及最优覆盖分割树的交通场景分类方法实例图。
图中:1、彩色图,2、深度图,3、原始分割树,4、四通道拉普拉斯金字塔,5、多尺度特征图,6、聚合特征向量组,7、神经网络分类器,8、分类纯度代价树,9、最优覆盖分割树。
具体实施方式
以下结合附图对本发明作进一步地说明。
如图1所示,本发明的具体实施方式包括以下步骤:
A、提取基于多尺度卷积神经网络的隐性特征
A1、基于车载RGB-D相机,获取车辆前方交通场景的RGB-D图像,即彩色图1和深度图2,形成四通道拉普拉斯金字塔图像4作为深度学习算法的数据输入;同时,基于图像最小生成树分割,利用经典的区域融合方法,以交通场景中RGB-D图像为输入,构造具有层级结构的原始分割树3。其中,原始分割树3中的每个节点都对应于一个原始分类图像区域,根节点C10代表整幅原始分类图像,叶节点C1、C2、C3、C4、C5代表原始分类图像被分割的最小区域。
A2、为有效提取并融合四通道拉普拉斯金字塔图像4不同尺度上的有效信息,处理四通道拉普拉斯金字塔图像4的卷积神经网络模型为多尺度结构,四通道拉普拉斯金字塔图像4在多尺度卷积神经网络模型中以金字塔的形式存储。每一个比例的四通道拉普拉斯金字塔图像层建立一个与其他尺度图像共享权重参数的多级卷积神经网络,每级卷积神经网络包含卷积层及特征池化层,经过卷积和池化过程,获得卷积神经网络的多尺度特征图5。
对同一个尺度上的卷积神经网络:卷积过程中,每个特征图只有一个卷积核与之对应并与之进行卷积运算,前一层特征图通过一个可训练卷积核进行卷积,其结果再通过一个激活函数形成下一层特征图;池化过程中,池化层中的每个特征图都分别和卷积层中的特征图一一对应,通过感受野对卷积层进行抽样,选取局部感受野中值最大的点。
对不同尺度上的卷积神经网络,在每一个尺度上相对应的卷积层中使用相同的卷积核,相对应的池化层中使用相同的池化函数,并且使用相同的权重参数。大尺度的特征图反应原始图像的细节,即局部信息,小尺度的特征图反应原始图像各部分整体信息。图2中所采用的卷积神经网络是一个三尺度卷积神经网络,其中,F1、F2、F3分别代表不同尺度卷积神经网络经过卷积、池化后的特征图,F1的大小即为原始图像的大小。其公式如下式:
fS(XS,θS)=WLHL-1 s=1,2,...,N
Hl=pool(tanh(WlHl-1+bl)) l=1,2,...,L
其中,fS是尺度为s的卷积神经网络,XS是尺度为s的拉普拉斯金字塔输入图像,θS是尺度为s的卷积神经网络模型参数,N为多尺度卷积神经网络总的尺度数量,L为卷积神经网络的总层数,l表示卷积神经网络的第l层,WL为最后一层第L层的Toeplitz矩阵,HL-1为第L-1层的特征图,Wl为第l层Toeplitz矩阵,Hl为第l层的特征图,pool为池化操作,tanh为激活函数,bl为偏置。
A3、对卷积池化后与F1不同尺度的特征图F2,F3,...,FN进行上采样,使不同尺度上卷积池化后的特征图像大小变为与F1具有相同尺寸的上采样操作输出特征图,形成包含不同尺度上有效信息且尺度相同的特征图集合F,如图2中5所示。其公式如下式:
F=[F1,u(F2),...,u(FN)]
其中,F为N个尺度上采样操作后的特征图集合,Fs为多尺度卷积神经网络经卷积池化后尺度为s的未进行上采样操作的特征图,尺度s的取值范围为s=1,2,...,N,u为上采样函数。
A4、基于卷积神经网络上采样操作输出的包含不同尺度上有效信息的特征图集合,对每一个分割树节点对应原始图像位置的特征向量,使用最大池化函数对其进行特征聚合,生成每个节点对应的聚合特征向量组6。
B、获取最优覆盖分割树
B1、将交通场景图像中的物体分为七类:第一类为车辆,第二类为行人,第三类为道路,第四类为交通标志,第五类为建筑物,第六类为天空,第七类为树木。采用神经网络分类器7进行聚合特征向量组6的分类,获得每个节点的类别分布。其中神经网络分类器7是一个两层的神经网络模型,输入为聚合特征向量组6,输出为原始分割树3节点代表原始图像中所属类别,神经网络分类器模型的网络参数通过神经网络分类器训练获得。
同时,定义类别分布混乱度函数作为覆盖该节点的纯度代价函数,得出覆盖该节点的代价值,代价值越小,表明该节点的纯度越高,越倾向于将该节点覆盖。至此,构造出分类纯度代价树8。
分类纯度代价函数公式如下:
ki=argmin(Zi) i=1,2,...,M
其中,Zi为分割树第i个节点的类别分布代价值,ki为反映分割树第i个节点类别的指标,argmin()为函数获得使ki最小的Zi的值,M为分割树的节点个数。
B2、从分类纯度代价树8的每个叶子节点出发,寻找其至根节点路径中使纯度代价函数最优的节点,由这些最优节点组成的集合将形成涵盖整幅原始图像的最优覆盖分割树9,实现轮廓清晰的交通场景多目标分类。
图2中最优节点Z2、Z5、Z6、Z7、Z8被覆盖,最终形成了轮廓清晰的交通场景分类。
Claims (1)
1.一种基于多尺度卷积神经网络的交通场景分类方法,其特征在于:包括以下步骤:
A、提取基于多尺度卷积神经网络的隐性特征
A1、基于车载RGB-D相机,获取车辆前方交通场景的RGB-D图像,即彩色图(1)和深度图(2),形成四通道拉普拉斯金字塔(4)图像作为深度学习算法的数据输入;同时,基于图像最小生成树分割,利用经典的区域融合方法,以交通场景中RGB-D图像为输入,构造具有层级结构的原始分割树(3);
A2、为有效提取并融合四通道拉普拉斯金字塔(4)图像不同尺度上的有效信息,处理四通道拉普拉斯金字塔(4)图像的卷积神经网络模型为多尺度结构,四通道拉普拉斯金字塔(4)图像在多尺度卷积神经网络模型中以金字塔的形式存储;每一个比例的四通道拉普拉斯金字塔(4)图像层建立一个与其他尺度图像共享权重参数的多级卷积神经网络,每级卷积神经网络包含卷积层及特征池化层,经过卷积和池化过程,获得卷积神经网络的多尺度特征图(5);
对同一个尺度上的卷积神经网络:卷积过程中,每个特征图只有一个卷积核与之对应并与之进行卷积运算,前一层特征图通过一个可训练卷积核进行卷积,其结果再通过一个激活函数形成下一层特征图;池化过程中,池化层中的每个特征图都分别和卷积层中的特征图一一对应,通过感受野对卷积层进行抽样,选取局部感受野中值最大的点;
对不同尺度上的卷积神经网络,在每一个尺度上相对应的卷积层中使用相同的卷积核,相对应的池化层中使用相同的池化函数,并且使用相同的权重参数;大尺度的特征图反应原始图像的细节,即局部信息,小尺度的特征图反应原始图像各部分整体信息;设F1、F2...FN分别代表不同尺度卷积神经网络经过卷积、池化后的特征图,其中,F1的大小即为原始图像的大小;其公式如下式:
fS(XS,θS)=WLHL-1 s=1,2,...,N
Hl=pool(tanh(WlHl-1+bl)) l=1,2,...,L
其中,fS是尺度为s的卷积神经网络,XS是尺度为s的四通道拉普拉斯金字塔(4)输入图像,θS是尺度为s的卷积神经网络模型参数,N为多尺度卷积神经网络总的尺度数量,L为卷积神经网络的总层数,l表示卷积神经网络的第l层,WL为最后一层第L层的Toeplitz矩阵,HL-1为第L-1层的特征图,Wl为第l层Toeplitz矩阵,Hl为第l层的特征图,pool为池化操作,tanh为激活函数,bl为偏置;
A3、对卷积池化后与F1不同尺度的特征图F2,F3,...,FN进行上采样,使不同尺度上卷积池化后的特征图像大小变为与F1具有相同尺寸的上采样操作输出特征图,形成包含不同尺度上有效信息且尺度相同的特征图集合F;其公式如下式:
F=[F1,u(F2),...,u(FN)]
其中,F为N个尺度上采样操作后的特征图集合,Fs为多尺度卷积神经网络经卷积池化后尺度为s的未进行上采样操作的特征图,尺度s的取值范围为s=1,2,...,N,u为上采样函数;
A4、基于卷积神经网络上采样操作输出的包含不同尺度上有效信息的特征图集合,对每一个分割树节点对应原始图像位置的特征向量,使用最大池化函数对其进行特征聚合,生成每个节点对应的聚合特征向量组(6);
B、获取最优覆盖分割树(9)
B1、将交通场景图像中的物体分为七类:第一类为车辆,第二类为行人,第三类为道路,第四类为交通标志,第五类为建筑物,第六类为天空,第七类为树木;采用神经网络分类器(7)进行聚合特征向量组(6)的分类,获得每个节点的类别分布;其中神经网络分类器(7)是一个两层的神经网络模型,输入为聚合特征向量组(6),输出为分割树节点代表原始图像中所属类别,神经网络分类器(7)模型的网络参数通过神经网络分类器(7)训练获得;
同时,定义类别分布混乱度函数作为覆盖该节点的纯度代价函数,得出覆盖该节点的代价值,代价值越小,表明该节点的纯度越高,越倾向于将该节点覆盖;至此,构造出分类纯度代价树(8);
分类纯度代价函数公式如下:
ki=argmin(Zi)i=1,2,...,M
其中,Zi为分割树第i个节点的类别分布代价值,ki为反映分割树第i个节点类别的指标,argmin()为函数获得使ki最小的Zi的值,M为分割树的节点个数;
B2、从分类纯度代价树(8)的每个叶子节点出发,寻找其至根节点路径中使纯度代价函数最优的节点,由这些最优节点组成的集合将形成涵盖整幅原始图像的最优覆盖分割树(9),实现轮廓清晰的交通场景多目标分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610261849.3A CN105956532B (zh) | 2016-04-25 | 2016-04-25 | 一种基于多尺度卷积神经网络的交通场景分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610261849.3A CN105956532B (zh) | 2016-04-25 | 2016-04-25 | 一种基于多尺度卷积神经网络的交通场景分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105956532A CN105956532A (zh) | 2016-09-21 |
CN105956532B true CN105956532B (zh) | 2019-05-21 |
Family
ID=56915250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610261849.3A Expired - Fee Related CN105956532B (zh) | 2016-04-25 | 2016-04-25 | 一种基于多尺度卷积神经网络的交通场景分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105956532B (zh) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10255040B2 (en) * | 2017-05-11 | 2019-04-09 | Veridium Ip Limited | System and method for biometric identification |
CN106599773B (zh) * | 2016-10-31 | 2019-12-24 | 清华大学 | 用于智能驾驶的深度学习图像识别方法、***及终端设备 |
CN106650786A (zh) * | 2016-11-14 | 2017-05-10 | 沈阳工业大学 | 基于多列卷积神经网络模糊评判的图像识别方法 |
CN108154153B (zh) * | 2016-12-02 | 2022-02-22 | 北京市商汤科技开发有限公司 | 场景分析方法和***、电子设备 |
CN106682592B (zh) * | 2016-12-08 | 2023-10-27 | 北京泛化智能科技有限公司 | 一种基于神经网络方法的图像自动识别***及方法 |
CN106651915B (zh) * | 2016-12-23 | 2019-08-09 | 大连理工大学 | 基于卷积神经网络的多尺度表达的目标跟踪方法 |
CN106780631B (zh) * | 2017-01-11 | 2020-01-03 | 山东大学 | 一种基于深度学习的机器人闭环检测方法 |
CN108509826B (zh) * | 2017-02-27 | 2022-03-01 | 千寻位置网络有限公司 | 一种遥感影像的道路识别方法及其*** |
CN106991382A (zh) * | 2017-03-13 | 2017-07-28 | 南京信息工程大学 | 一种遥感场景分类方法 |
CN106971155B (zh) * | 2017-03-21 | 2020-03-24 | 电子科技大学 | 一种基于高度信息的无人车车道场景分割方法 |
CN108805152A (zh) * | 2017-05-05 | 2018-11-13 | 上海荆虹电子科技有限公司 | 一种场景分类方法及装置 |
CN107220657B (zh) * | 2017-05-10 | 2018-05-18 | 中国地质大学(武汉) | 一种面向小数据集的高分辨率遥感影像场景分类的方法 |
WO2018218643A1 (en) * | 2017-06-02 | 2018-12-06 | Shanghaitech University | Method and apparatus for estimating depth of field information |
CN107368787B (zh) * | 2017-06-16 | 2020-11-10 | 长安大学 | 一种面向深度智驾应用的交通标志识别方法 |
CN107392252A (zh) * | 2017-07-26 | 2017-11-24 | 上海城诗信息科技有限公司 | 计算机深度学习图像特征并量化感知度的方法 |
CN107564009B (zh) * | 2017-08-30 | 2021-02-05 | 电子科技大学 | 基于深度卷积神经网络的室外场景多目标分割方法 |
CN109557114B (zh) * | 2017-09-25 | 2021-07-16 | 清华大学 | 检查方法和检查设备以及计算机可读介质 |
CN107730514B (zh) * | 2017-09-29 | 2021-02-12 | 北京奇宝科技有限公司 | 场景分割网络训练方法、装置、计算设备及存储介质 |
CN107767384B (zh) * | 2017-11-03 | 2021-12-03 | 电子科技大学 | 一种基于对抗训练的图像语义分割方法 |
CN108229650B (zh) * | 2017-11-15 | 2021-04-09 | 北京市商汤科技开发有限公司 | 卷积处理方法、装置及电子设备 |
CN107979554B (zh) * | 2017-11-17 | 2019-10-08 | 西安电子科技大学 | 基于多尺度卷积神经网络的无线电信号调制识别方法 |
CN108491856B (zh) * | 2018-02-08 | 2022-02-18 | 西安电子科技大学 | 一种基于多尺度特征卷积神经网络的图像场景分类方法 |
CN108537773B (zh) * | 2018-02-11 | 2022-06-17 | 中国科学院苏州生物医学工程技术研究所 | 针对胰腺癌与胰腺炎性疾病进行智能辅助鉴别的方法 |
CN108875537B (zh) * | 2018-02-28 | 2022-11-08 | 北京旷视科技有限公司 | 对象检测方法、装置和***及存储介质 |
CN110390228B (zh) * | 2018-04-20 | 2022-05-10 | 北京四维图新科技股份有限公司 | 基于神经网络的交通标志图片识别方法、装置及存储介质 |
CN108596102B (zh) * | 2018-04-26 | 2022-04-05 | 北京航空航天大学青岛研究院 | 基于rgb-d的室内场景物体分割分类器构造方法 |
EP3794505A4 (en) * | 2018-05-14 | 2022-05-18 | Nokia Technologies OY | METHOD AND DEVICE FOR IMAGE RECOGNITION |
CN108734713A (zh) * | 2018-05-18 | 2018-11-02 | 大连理工大学 | 一种基于多特征图的交通图像语义分割方法 |
CN110647898B (zh) * | 2018-06-27 | 2022-11-01 | 北京市商汤科技开发有限公司 | 图像处理方法、装置、电子设备及计算机存储介质 |
CN109118490B (zh) * | 2018-06-28 | 2021-02-26 | 厦门美图之家科技有限公司 | 一种图像分割网络生成方法及图像分割方法 |
CN109117717A (zh) * | 2018-06-29 | 2019-01-01 | 广州烽火众智数字技术有限公司 | 一种城市行人检测方法 |
CN109215034B (zh) * | 2018-07-06 | 2021-09-21 | 成都图必优科技有限公司 | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 |
CN108985217A (zh) * | 2018-07-10 | 2018-12-11 | 常州大学 | 一种基于深度空间网络的交通标志识别方法及*** |
CN109325534B (zh) * | 2018-09-22 | 2020-03-17 | 天津大学 | 一种基于双向多尺度金字塔的语义分割方法 |
CN109376667B (zh) * | 2018-10-29 | 2021-10-01 | 北京旷视科技有限公司 | 目标检测方法、装置及电子设备 |
CN109635662B (zh) * | 2018-11-14 | 2022-06-21 | 浙江科技学院 | 一种基于卷积神经网络的道路场景语义分割方法 |
CN109919917B (zh) * | 2019-02-21 | 2020-10-20 | 国网山东省电力公司临沂供电公司 | 基于图像处理的架空输电线路的异物检测方法 |
CN110119760B (zh) * | 2019-04-11 | 2021-08-10 | 华南理工大学 | 一种基于层次化多尺度循环神经网络的序列分类方法 |
CN110826565B (zh) * | 2019-11-01 | 2023-07-14 | 北京中科芯健医疗科技有限公司 | 基于跨连接的卷积神经网络齿痕舌象分类方法及*** |
CN110866550B (zh) * | 2019-11-01 | 2022-06-14 | 云南大学 | 卷积神经网络、金字塔条状池化方法及恶意软件分类方法 |
CN110956094B (zh) * | 2019-11-09 | 2023-12-01 | 北京工业大学 | 一种基于非对称双流网络的rgb-d多模态融合人员检测方法 |
WO2021098554A1 (zh) * | 2019-11-20 | 2021-05-27 | Oppo广东移动通信有限公司 | 一种特征提取方法、装置、设备及存储介质 |
CN111178181B (zh) * | 2019-12-16 | 2023-06-09 | 深圳市华尊科技股份有限公司 | 交通场景分割方法及相关装置 |
CN111340189B (zh) * | 2020-02-21 | 2023-11-24 | 之江实验室 | 一种空间金字塔图卷积网络实现方法 |
CN111382685B (zh) * | 2020-03-04 | 2023-03-28 | 电子科技大学 | 一种基于深度学习的场景识别方法和*** |
CN113449589B (zh) * | 2021-05-16 | 2022-11-15 | 桂林电子科技大学 | 一种无人驾驶汽车在城市交通场景中驾驶策略计算方法 |
CN115311338B (zh) * | 2022-08-11 | 2023-04-07 | 浙江盛发纺织印染有限公司 | 军用帐篷内衬面料智能化生产***及其方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103927526A (zh) * | 2014-04-30 | 2014-07-16 | 长安大学 | 一种基于高斯差分多尺度边缘融合的车辆检测方法 |
CN104834747A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
CN105488534A (zh) * | 2015-12-04 | 2016-04-13 | 中国科学院深圳先进技术研究院 | 交通场景深度解析方法、装置及*** |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9400925B2 (en) * | 2013-11-15 | 2016-07-26 | Facebook, Inc. | Pose-aligned networks for deep attribute modeling |
-
2016
- 2016-04-25 CN CN201610261849.3A patent/CN105956532B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103927526A (zh) * | 2014-04-30 | 2014-07-16 | 长安大学 | 一种基于高斯差分多尺度边缘融合的车辆检测方法 |
CN104834747A (zh) * | 2015-05-25 | 2015-08-12 | 中国科学院自动化研究所 | 基于卷积神经网络的短文本分类方法 |
CN105488534A (zh) * | 2015-12-04 | 2016-04-13 | 中国科学院深圳先进技术研究院 | 交通场景深度解析方法、装置及*** |
Non-Patent Citations (4)
Title |
---|
《Multi-scale Convolutional Neural Networks for Lung Nodule Classification》;W Shen,et al.;《Inf Process Med Imaging》;20151231;第588-599页 |
《Traffic sign recognition with multi-scale Convolutional Networks》;P Sermanet,et al.;《International Joint Conference on Neural Networks》;20111231;第42卷(第4期);第2809-2813页 |
《基于多尺度上下文语义信息的图像场景分类算法》;张瑞杰,等;《电子学报》;20140430;第42卷(第4期);第646-652页 |
《基于多尺度卷积神经网络的场景标记》;尹蕊;《图形图像》;20160229;第48-50页 |
Also Published As
Publication number | Publication date |
---|---|
CN105956532A (zh) | 2016-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105956532B (zh) | 一种基于多尺度卷积神经网络的交通场景分类方法 | |
CN108875674B (zh) | 一种基于多列融合卷积神经网络的驾驶员行为识别方法 | |
CN111612807B (zh) | 一种基于尺度和边缘信息的小目标图像分割方法 | |
CN106599773B (zh) | 用于智能驾驶的深度学习图像识别方法、***及终端设备 | |
CN110163187B (zh) | 基于f-rcnn的远距离交通标志检测识别方法 | |
WO2022083784A1 (zh) | 一种基于车联网的道路检测方法 | |
CN103955702B (zh) | 基于深度rbf网络的sar图像地物分类方法 | |
CN107862261A (zh) | 基于多尺度卷积神经网络的图像人群计数方法 | |
CN105894045B (zh) | 一种基于空间金字塔池化的深度网络模型的车型识别方法 | |
CN105701508B (zh) | 基于多级卷积神经网络的全局‑局部优化模型及显著性检测算法 | |
CN109993082A (zh) | 卷积神经网络道路场景分类与道路分割方法 | |
CN109461157A (zh) | 基于多级特征融合及高斯条件随机场的图像语义分割方法 | |
CN108764063A (zh) | 一种基于特征金字塔的遥感影像时敏目标识别***及方法 | |
CN108509978A (zh) | 基于cnn的多级特征融合的多类目标检测方法及模型 | |
CN107609602A (zh) | 一种基于卷积神经网络的驾驶场景分类方法 | |
CN105956560A (zh) | 一种基于池化多尺度深度卷积特征的车型识别方法 | |
CN109409240A (zh) | 一种结合随机游走的SegNet遥感图像语义分割方法 | |
CN112949647B (zh) | 三维场景描述方法、装置、电子设备和存储介质 | |
CN107679462A (zh) | 一种基于小波的深度多特征融合分类方法 | |
CN110706239B (zh) | 融合全卷积神经网络与改进aspp模块的场景分割方法 | |
CN110222767B (zh) | 基于嵌套神经网络和栅格地图的三维点云分类方法 | |
CN106611423B (zh) | 基于脊波滤波器和反卷积结构模型的sar图像分割方法 | |
CN108122003A (zh) | 一种基于深度神经网络的弱小目标识别方法 | |
CN108647682A (zh) | 一种基于区域卷积神经网络模型的品牌Logo检测与识别方法 | |
CN110807485B (zh) | 基于高分遥感影像二分类语义分割图融合成多分类语义图的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190521 Termination date: 20210425 |