CN106529578A - 一种基于深度学习的车辆品牌型号精细识别方法与*** - Google Patents
一种基于深度学习的车辆品牌型号精细识别方法与*** Download PDFInfo
- Publication number
- CN106529578A CN106529578A CN201610917763.1A CN201610917763A CN106529578A CN 106529578 A CN106529578 A CN 106529578A CN 201610917763 A CN201610917763 A CN 201610917763A CN 106529578 A CN106529578 A CN 106529578A
- Authority
- CN
- China
- Prior art keywords
- image
- image block
- vehicle
- layer
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 63
- 239000013604 expression vector Substances 0.000 claims abstract description 54
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000013527 convolutional neural network Methods 0.000 claims description 39
- 238000013135 deep learning Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 24
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 238000011176 pooling Methods 0.000 abstract description 11
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000012706 support-vector machine Methods 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 abstract description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 239000000284 extract Substances 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于深度学***均池化层;根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。本发明具有鲁棒性好和识别准确率高的优点,可广泛应用于图像处理领域。
Description
技术领域
本发明涉及图像处理领域,尤其是一种基于深度学习的车辆品牌型号精细识别方法与***。
背景技术
近年来,随着道路的监控安防布控逐渐完善,交通管理部门每天需要处理的视频图像数据也急剧增加,因此作为智能交通***的重要组成部分,基于图像的车辆品牌型号精细识别得到了越来越多的关注。基于图像的车辆品牌型号精细识别的主要工作是从一个图像中识别出未知的车辆类型、品牌、型号、年款等。与传统的车辆类型识别不同,车辆品牌型号精细识别的有以下两个难点:第一个是车辆的外观具有较高的相似性,特别是同一品牌的不同年款的车辆;第二个由于拍摄时候的光照、天气以及拍摄角度等的影响,即便是同一款车辆也可能呈现出不同的图像特征。
现有的车辆品牌型号精细识别方法可以分为基于传统模式识别方法与基于深度学习的识别算法。基于传统模式识别的方法首先利用人工设计的特征描述子(如SIFT以及HOG等)去提取车辆的图像特征,然后把特征向量直接送入预先训练好的分类器(该分类器通过模式识别的方法设计出)进行识别。这种方法通常需要提取车辆的特定区域(如车脸区域等),当遇到车辆图像背景较复杂的情况时将无法完整提取甚至无法提取车辆的特定区域,这将会影响后续的车辆品牌型号精细识别的准确率。此外,人工设计的特征是针对一定场景和问题设计的,无法很好地描述车辆图像的内在信息,在面对复杂场景时,人工设计的特征的描述效果可能会大打折扣,泛化能力较差。而基于深度学习的识别算法则通过卷积神经网络自适应提取图像的特征并进行分类。基于深度学习的识别算法优势在于自适应提取的图像特征能很好地描述车辆图像的内在信息,泛化能力较好,但是这种方法并没有考虑车辆的空间结构信息,对后续的识别准确率造成一定的影响。
因此,业内亟需一种能自适应学习特征,而且能捕捉车辆的空间结构信息的,车辆品牌型号精细识别方法与***。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种鲁棒性好和识别准确率高的,基于深度学习的车辆品牌型号精细识别方法。
本发明的另一目的在于:提供一种鲁棒性好和识别准确率高的,基于深度学习的车辆品牌型号精细识别***。
本发明所采取的技术方案是:
一种基于深度学习的车辆品牌型号精细识别方法,包括以下步骤:
获取原始车辆图像;
对原始车辆图像进行空间金字塔划分,将原始车辆图像划分为三个层次共21个图像块,所述三个层次中图像块的数量分别是1、4以及16个;
采用改进的卷积神经网络对划分后的各个图像块进行特征提取,得到各个图像块的特征向量,所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层;
根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;
将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
进一步,所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X,所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y,其中,s3是卷积层输入二维特征图的数量,s1×s2是卷积层输入二维特征图的大小,t3是卷积层输出的二维特征图的数量,t1×t2是卷积层输出的二维特征图的大小,输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到,所述卷积层输出与输入的关系表达式为:式中,xi是卷积层第i个输入二维特征图,yj是卷积层第j个输出的二维特征图,代表卷积操作,kij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数,kij由卷积神经网络训练得到,f(·)是激活函数,激活函数f(v)的表达式为:f(v)=max(0,v)。
进一步,所述平均池化层的计算公式为:
其中,yc,d,e表示平均池化层第e个输出特征图中坐标为c,d的像素值,bc+p,d+q,e表示平均池化层第e个输入特征图中坐标为(c+p),(d+q)的像素值,αp,q是一个大小为f1×f2且值为1/(f1×f2)的平均池化层滤波器,f1和f2均为7,p和q的取值范围分别为和所述平均池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到;
所述最大池化层的计算公式为:
yg,h,k=max(bg-p′,h-q′,k,bg-p′+1,h-q′+1,k,...,bg+p′,h+q′,k),
其中,yg,h,k表示最大池化层第k个输出特征图中坐标为g,h的像素值,bg-p′,h-q′,k表示最大池化层第k个输入特征图中坐标为(g-p′),(h-q′)的像素值,bg+p′,h+q′,k表示最大池化层第k个输入特征图中坐标为(g+p′),(h+q′)的像素值,f11和f22分别为最大池化层滤波器的两个设定大小参数,所述最大池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到。
进一步,所述架构层先分别通过3个1×1卷积模板和1个3×3最大池化模板一分为四,然后分别与1、3×3卷积模板、5×5卷积模板和1×1卷积模板进行卷积运算,最后再将这四个卷积运算的结果进行堆叠。
进一步,所述根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量这一步骤,其包括:
根据每个图像块的特征向量计算每个图像块的最终表达向量,所述每个子区域的最终表达向量计算公式为:
Ft=Wt*Ut,
其中,Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21;所述图像块的编号t的编号规则为:第一个层次的1个图像块编号t=1,第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5;第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…,21;
把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
进一步,所述21个图像块的权重集合W的表达式为:
W={w|w=Wt}={3,1,1,3,3,1,1,1,1,1,1,1,1,3,3,3,3,3,3,3,3}。
进一步,所述多类线性支持向量机分类器的参数采用one-vs-rest的方法训练得到。
本发明所采取的另一技术方案是:
一种基于深度学习的车辆品牌型号精细识别***,包括:
获取模块,用于获取原始车辆图像;
空间金字塔划分模块,用于对原始车辆图像进行空间金字塔划分,将原始车辆图像划分为三个层次共21个图像块,所述三个层次中图像块的数量分别是1、4以及16个;
特征提取模块,用于采用改进的卷积神经网络对划分后的各个图像块进行特征提取,得到各个图像块的特征向量,所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层;
最终表达向量获取模块,用于根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;
识别模块,用于将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
进一步,所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X,所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y,其中,s3是卷积层输入二维特征图的数量,s1×s2是卷积层输入二维特征图的大小,t3是卷积层输出的二维特征图的数量,t1×t2是卷积层输出的二维特征图的大小,输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到,所述卷积层输出与输入的关系表达式为:式中,xi是卷积层第i个输入二维特征图,yj是卷积层第j个输出的二维特征图,代表卷积操作,kij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数,kij由卷积神经网络训练得到,f(·)是激活函数,激活函数f(v)的表达式为:f(v)=max(0,v)。
进一步,所述最终表达向量获取模块包括:
计算单元,用于根据每个图像块的特征向量计算每个图像块的最终表达向量,所述每个子区域的最终表达向量计算公式为:
Ft=Wt*Ut,
其中,Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21;所述图像块的编号t的编号规则为:第一个层次的1个图像块编号t=1,第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5;第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…,21;
连接单元,用于把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
本发明的方法的有益效果是:基于深度学***均池化层,去掉了传统卷积神经网络的全连接层以及分类层,把卷积神经网络当作***的一个特征提取器,减少了网络再训练的成本以及提高了后续的识别准确率;增设了采用权值空间金字塔的方法得到车辆图像的最终表达向量的步骤,能捕捉到车辆的空间信息,有效地提高了识别准确率。
本发明的***的有益效果是:基于深度学***均池化层,去掉了传统卷积神经网络的全连接层以及分类层,把卷积神经网络当作***的一个特征提取器,减少了网络再训练的成本以及提高了后续的识别准确率;增设了用于采用权值空间金字塔的方法得到车辆图像的最终表达向量的最终表达向量获取模块,能捕捉到车辆的空间信息,有效地提高了识别准确率。
附图说明
图1为本发明一种基于深度学习的车辆品牌型号精细识别方法的整体流程图;
图2为本发明实施例一的***流程图;
图3为本发明的空间金字塔划分示意图;
图4为本发明改进的卷积神经网络架构层的结构示意图;
图5为本发明的权值空间金字塔示意图。
具体实施方式
参照图1,一种基于深度学习的车辆品牌型号精细识别方法,包括以下步骤:
获取原始车辆图像;
对原始车辆图像进行空间金字塔划分,将原始车辆图像划分为三个层次共21个图像块,所述三个层次中图像块的数量分别是1、4以及16个;
采用改进的卷积神经网络对划分后的各个图像块进行特征提取,得到各个图像块的特征向量,所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层;
根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;
将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
进一步作为优选的实施方式,所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X,所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y,其中,s3是卷积层输入二维特征图的数量,s1×s2是卷积层输入二维特征图的大小,t3是卷积层输出的二维特征图的数量,t1×t2是卷积层输出的二维特征图的大小,输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到,所述卷积层输出与输入的关系表达式为:式中,xi是卷积层第i个输入二维特征图,yj是卷积层第j个输出的二维特征图,代表卷积操作,kij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数,kij由卷积神经网络训练得到,f(·)是激活函数,激活函数f(v)的表达式为:f(v)=max(0,v)。
进一步作为优选的实施方式,所述平均池化层的计算公式为:
其中,yc,d,e表示平均池化层第e个输出特征图中坐标为c,d的像素值,bc+p,d+q,e表示平均池化层第e个输入特征图中坐标为(c+p),(d+q)的像素值,αp,q是一个大小为f1×f2且值为1/(f1×f2)的平均池化层滤波器,f1和f2均为7,p和q的取值范围分别为和所述平均池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到;
所述最大池化层的计算公式为:
yg,h,k=max(bg-p′,h-q′,k,bg-p′+1,h-q′+1,k,...,bg+p′,h+q′,k),
其中,yg,h,k表示最大池化层第k个输出特征图中坐标为g,h的像素值,bg-p′,h-q′,k表示最大池化层第k个输入特征图中坐标为(g-p′),(h-q′)的像素值,bg+p′,h+q′,k表示最大池化层第k个输入特征图中坐标为(g+p′),(h+q′)的像素值,f11和f22分别为最大池化层滤波器的两个设定大小参数,所述最大池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到。
进一步作为优选的实施方式,所述架构层先分别通过3个1×1卷积模板和1个3×3最大池化模板一分为四,然后分别与1、3×3卷积模板、5×5卷积模板和1×1卷积模板进行卷积运算,最后再将这四个卷积运算的结果进行堆叠。
进一步作为优选的实施方式,所述根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量这一步骤,其包括:
根据每个图像块的特征向量计算每个图像块的最终表达向量,所述每个子区域的最终表达向量计算公式为:
Ft=Wt*Ut,
其中,Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21;所述图像块的编号t的编号规则为:第一个层次的1个图像块编号t=1,第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5;第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…,21;
把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
进一步作为优选的实施方式,所述21个图像块的权重集合W的表达式为:
W={w|w=Wt}={3,1,1,3,3,1,1,1,1,1,1,1,1,3,3,3,3,3,3,3,3}。
进一步,所述多类线性支持向量机分类器的参数采用one-vs-rest的方法训练得到。
参照图1,一种基于深度学习的车辆品牌型号精细识别***,包括:
获取模块,用于获取原始车辆图像;
空间金字塔划分模块,用于对原始车辆图像进行空间金字塔划分,将原始车辆图像划分为三个层次共21个图像块,所述三个层次中图像块的数量分别是1、4以及16个;
特征提取模块,用于采用改进的卷积神经网络对划分后的各个图像块进行特征提取,得到各个图像块的特征向量,所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层;
最终表达向量获取模块,用于根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;
识别模块,用于将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
进一步作为优选的实施方式,所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X,所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y,其中,s3是卷积层输入二维特征图的数量,s1×s2是卷积层输入二维特征图的大小,t3是卷积层输出的二维特征图的数量,t1×t2是卷积层输出的二维特征图的大小,输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到,所述卷积层输出与输入的关系表达式为:式中,xi是卷积层第i个输入二维特征图,yj是卷积层第j个输出的二维特征图,代表卷积操作,kij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数,kij由卷积神经网络训练得到,f(·)是激活函数,激活函数f(v)的表达式为:f(v)=max(0,v)。
进一步作为优选的实施方式,所述最终表达向量获取模块包括:
计算单元,用于根据每个图像块的特征向量计算每个图像块的最终表达向量,所述每个子区域的最终表达向量计算公式为:
Ft=Wt*Ut,
其中,Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21;所述图像块的编号t的编号规则为:第一个层次的1个图像块编号t=1,第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5;第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…,21;
连接单元,用于把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
下面结合说明书附图和具体实施例对本发明作进一步解释和说明。
实施例一
针对现有技术鲁棒性较差和识别准确率低的问题,本发明提出了一种基于深度学习的车辆品牌型号精细识别方法与***,它利用卷积神经网络对车辆全图图像自适应提取车辆的特征,这种特征无需人工设计,提高了算法的鲁棒性;本发明不同于传统神经网络***架构和功能,它把卷积神经网络作为特征提取器,去掉了全连接层以及分类层,同时结合了其他识别工具来进行识别,这样做减少了网络再训练的成本以及提高了识别准确率,本发明还针对传统卷积神经网络中缺失空间信息的问题,提出了一种权值空间金字塔的方法来捕捉车辆的空间信息,有效地提高了后续的识别准确率。
本发明提供了一个基于深度学习的车辆品牌型号精细识别***,该***的流程图如图2所示。该***主要包含有4个模块,分别是车辆图像获取模块、空间信息获取模块、特征提取模块、分类模块。本发明的整个***分为离线以及在线两个模式,在离线模式中,***会利用训练集图片去训练特征提取模块以及分类模块。而在在线模式中,本发明的***会通过车辆图像获取模块去获取车辆原始图像,然后通过空间信息获取模块去捕捉车辆的空间信息,接着通过特征提取模块提取车辆的特征,最后通过分类模块得到车辆的品牌型号信息。
本发明一种基于深度学习的车辆品牌型号精细识别方法的具体过程包括:
(一)获取原始车辆图像。
本发明的***首先通过安装在治安卡口的摄像头对过往车辆进行拍摄,得到原始车辆图像。
(二)对原始车辆图像进行空间金字塔划分。
为了获取车辆的空间信息,本发明对得到的原始车辆图像进行空间金字塔划分,划分方式如图3所示,原始图像被划分为三个层次,每个层次分别有1、4和16个图像块。
(三)采用改进的卷积神经网络对划分后的各个图像块进行特征提取。
本发明改进的卷积神经网络的结构如表1所示,这个卷积神经网络包含有卷积层(convolution)、最大池化层(max pooling)、架构层(inception)和平均池化层(averagepooling)。本发明的卷积神经网络架构与传统卷积神经网络最大的不同是:传统的卷积神经网络以图像为输入,然后直接输出分类结果,而本发明则去掉了全连接层以及分类层,使卷积神经网成为一个特征提取器,卷积神经网输出的是图像的特征向量,能有效地减少了网络再训练的成本以及提高了后续的识别准确率。
表1卷积神经网络的结构图
类型 | 滤波器大小/步长 | 输入特征图大小 |
convolution | 7×7/2 | 112×112×64 |
max pooling | 3×3/2 | 56×56×64 |
convolution | 3×3/1 | 56×56×192 |
max pooling | 3×3/2 | 28×28×192 |
inception(3a) | 28×28×256 | |
inception(3b) | 28×28×480 | |
max pooling | 3×3/2 | 14×14×480 |
inception(4a) | 14×14×512 | |
inception(4b) | 14×14×512 | |
inception(4c) | 14×14×512 | |
inception(4d) | 14×14×528 | |
inception(4e) | 14×14×832 | |
max pooling | 3×3/2 | 7×7×832 |
inception(5a) | 7×7×832 | |
inception(5b) | 7×7×1024 | |
average pooling | 7×7/1 | 1×1×1024 |
其中,卷积层的作用是利用一个非线性的映射把低层次的图像特征转换为高层次的语义特征。卷积层的输入是一个三维矩阵X,大小为s1×s2×s3,其中,s3是输入二维特征图的数量,s1×s2是二维特征图xi的大小。卷积层的输出是一个三维矩阵Y,大小为t1×t2×t3,其中,t3是输出的二维特征图的数量,t1×t2是输出的二维特征图yj的大小。因此,yj可以通过下式计算得到:
其中,xi是卷积层第i个输入特征图,yj是卷积层第j个输出特征图,代表着卷积操作,kij表示的是第j个输出特征图对应第i个输入特征图的二维卷积核。本发明的卷积核参数都是由网络训练得到的。f(·)是激活函数,定义如下:
f(v)=max(0,v) (2)
而最大池化层和平均池化层的作用都是通过降采样的方式使得特征具有几何以及平移不变性。本发明的平均池化层的计算方式如下:
其中,yc,d,e表示平均池化层第e个输出特征图中坐标为c,d的像素值,bc+p,d+q,e表示平均池化层第e个输入特征图中坐标为(c+p),(d+q)的像素值,αp,q是一个大小为f1×f2且值为1/(f1×f2)的滤波器,f1=f2=7,p和q的取值范围分别为和
最大池化层的计算方式如下:
yg,h,k=max(bg-p′,h-q′,k,bg-p′+1,h-q′+1,k,...,bg+p′,h+q′,k) (4)
其中,yg,h,k表示最大池化层第k个输出特征图中坐标为g,h的像素值,bg-p′,h-q′,k表示最大池化层第k个输入特征图中坐标为(g-p′),(h-q′)的像素值,bg+p′,h+q′,k表示最大池化层第k个输入特征图中坐标为(g+p′),(h+q′)的像素值,最大池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到。若最大池化层滤波器的设定大小为f11×f22,则参数
本发明的架构层是一个互相堆叠1×1、3×3、5×5卷积层以及max pooling层的模块,其结构如图4所示。本发明的架构层堆叠1×1、3×3、5×5卷积层以及max pooling层有两个好处:第一是降维,减少了整个网络的计算量,降低了网络过拟合的风险;第二是增加了网络的宽度,实现了多尺度特征的有效利用,提高了神经网络的表达能力。
本发明以224×224×3的RGB图像块作为输入,通过如表1所示的卷积神经网络的计算后得到一个1024维的特征向量。对所有图像块进行卷积神经网络的特征提取后,图像I可以用一个特征集合U进行表示:
U=[u1,u2,...,uN]∈RD×N (5)
其中,D为特征向量的维度,这里D为1024,N为图像块的数量,这里N为21。
(四)采用权值空间金字塔的方法得到车辆图像的最终表达向量。
对于车辆来说,它们的差异大部分都只集中在车辆的下半部分,因此车辆的下半部分应该给予更多的关注。针对这个问题,本发明提出一种权值空间金字塔的方法,该方法核心思想是根据每个图像块的层次以及位置给予相应的图像特征向量不同权重,每个图像块的最终表达向量计算如下式:
Ft=Wt*Ut (6)
其中,N是图像块的数量,本实施例中,N的值是21。Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21。每个区域按照下面的规则进行编号,如图5所示,层次1中的区域为第一个图像块,层次2中的左上区域为第二个图像块,右上区域为第三个图像块,左下为第四个图像块,右下为第五个图像块,后面层次3的区域编号也如此。而经过多次实验后发现,权重矩阵设置为[3,1,1,3,3,1,1,1,1,1,1,1,1,3,3,3,3,3,3,3,3]时识别准确率最高。
最终把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
(五)将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
针对车辆品牌型号精细识别的准确性和实时性要求,本发明选择训练一个多类线性SVM作为分类器,传统的二分类线性SVM的分类平面定义如下:
oTz+r=0 (7)
其中,o和r是这个分类平面的参数。一般的二分类线性SVM是用于解决二分类问题,而车辆品牌型号精细识别是一种多分类的问题,因此本发明还利用one-vs-rest的方法去训练M个二分类线性SVM来构建一个多分类的线性SVM,其中,M是需要识别的车辆品牌型号的数量。
本发明利用SVM对车辆品牌型号精细识别的方法共有两个阶段,一个阶段是训练阶段,另外一个是识别阶段。在训练阶段,训练集(Fs,Cs),s=1,2,3,...,L被送入多分类的线性SVM中进行训练,得到具有最佳的分类平面参数o和r的分类器。其中,Fs是训练集中第s幅图像的最终表达向量,Cs是第s幅图像的品牌型号,L是训练图像的数量。而在识别阶段,本发明首先把待识别的车辆图像转换为最终表达向量,然后把最终表达向量送入训练好的多分类线性SVM中即能完成车辆品牌型号的识别。
与现有技术相比,本发明具有以下优点:
1)基于深度学习,采用改进的卷积神经网络对车辆全图图像自适应提取车辆的特征,无需人工设计的特征,也不需要提取车辆的特定区域,能对全车图像进行识别,增强了算法鲁棒性。
2)改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层,对传统的卷积神经网络进行了架构上的修改,去掉了全连接层以及分类层,把卷积神经网络当作***的一个特征提取器,不仅能有效地刻画车辆图像的丰富内在信息,提高了后续的识别准确率,而且能有效降低网络再训练的成本。
3)提出了权值空间金字塔的方法,能有效解决了传统卷积神经网络中空间信息缺失的问题,同时能根据每个图像块的层次以及位置来赋予不同的权重,有效地捕捉到车辆之间的差异,使得最终表达向量更具有判别性,大大提高了识别准确率。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种基于深度学习的车辆品牌型号精细识别方法,其特征在于:包括以下步骤:
获取原始车辆图像;
对原始车辆图像进行空间金字塔划分,将原始车辆图像划分为三个层次共21个图像块,所述三个层次中图像块的数量分别是1、4以及16个;
采用改进的卷积神经网络对划分后的各个图像块进行特征提取,得到各个图像块的特征向量,所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层;
根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;
将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
2.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法,其特征在于:所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X,所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y,其中,s3是卷积层输入二维特征图的数量,s1×s2是卷积层输入二维特征图的大小,t3是卷积层输出的二维特征图的数量,t1×t2是卷积层输出的二维特征图的大小,输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到,所述卷积层输出与输入的关系表达式为:式中,xi是卷积层第i个输入二维特征图,yj是卷积层第j个输出的二维特征图,代表卷积操作,kij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数,kij由卷积神经网络训练得到,f(·)是激活函数,激活函数f(v)的表达式为:f(v)=max(0,v)。
3.根据权利要求1所述的一种基于深度学***均池化层的计算公式为:
其中,yc,d,e表示平均池化层第e个输出特征图中坐标为c,d的像素值,bc+p,d+q,e表示平均池化层第e个输入特征图中坐标为(c+p),(d+q)的像素值,αp,q是一个大小为f1×f2且值为1/(f1×f2)的平均池化层滤波器,f1和f2均为7,p和q的取值范围分别为和所述平均池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到;
所述最大池化层的计算公式为:
yg,h,k=max(bg-p′,h-q′,k,bg-p′+1,h-q′+1,k,...,bg+p′,h+q′,k),其中,yg,h,k表示最大池化层第k个输出特征图中坐标为g,h的像素值,bg-p′,h-q′,k表示最大池化层第k个输入特征图中坐标为(g-p′),(h-q′)的像素值,bg+p′,h+q′,k表示最大池化层第k个输入特征图中坐标为(g+p′),(h+q′)的像素值,f11和f22分别为最大池化层滤波器的两个设定大小参数,所述最大池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到。
4.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法,其特征在于:所述架构层先分别通过3个1×1卷积模板和1个3×3最大池化模板一分为四,然后分别与1、3×3卷积模板、5×5卷积模板和1×1卷积模板进行卷积运算,最后再将这四个卷积运算的结果进行堆叠。
5.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法,其特征在于:所述根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量这一步骤,其包括:
根据每个图像块的特征向量计算每个图像块的最终表达向量,所述每个子区域的最终表达向量计算公式为:
Ft=Wt*Ut,
其中,Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21;所述图像块的编号t的编号规则为:第一个层次的1个图像块编号t=1,第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5;第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…,21;
把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
6.根据权利要求5所述的一种基于深度学习的车辆品牌型号精细识别方法,其特征在于:所述21个图像块的权重集合W的表达式为:
W={w|w=Wt}={3,1,1,3,3,1,1,1,1,1,1,1,1,3,3,3,3,3,3,3,3}。
7.根据权利要求1-6任一项所述的一种基于深度学习的车辆品牌型号精细识别方法,其特征在于:所述多类线性支持向量机分类器的参数采用one-vs-rest的方法训练得到。
8.一种基于深度学习的车辆品牌型号精细识别***,其特征在于:包括:
获取模块,用于获取原始车辆图像;
空间金字塔划分模块,用于对原始车辆图像进行空间金字塔划分,将原始车辆图像划分为三个层次共21个图像块,所述三个层次中图像块的数量分别是1、4以及16个;
特征提取模块,用于采用改进的卷积神经网络对划分后的各个图像块进行特征提取,得到各个图像块的特征向量,所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层;
最终表达向量获取模块,用于根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量;
识别模块,用于将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。
9.根据权利要求8所述的一种基于深度学习的车辆品牌型号精细识别***,其特征在于:所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X,所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y,其中,s3是卷积层输入二维特征图的数量,s1×s2是卷积层输入二维特征图的大小,t3是卷积层输出的二维特征图的数量,t1×t2是卷积层输出的二维特征图的大小,输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到,所述卷积层输出与输入的关系表达式为:式中,xi是卷积层第i个输入二维特征图,yj是卷积层第j个输出的二维特征图,代表卷积操作,kij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数,kij由卷积神经网络训练得到,f(·)是激活函数,激活函数f(v)的表达式为:f(v)=max(0,v)。
10.根据权利要求8或9所述的一种基于深度学习的车辆品牌型号精细识别***,其特征在于:所述最终表达向量获取模块包括:
计算单元,用于根据每个图像块的特征向量计算每个图像块的最终表达向量,所述每个子区域的最终表达向量计算公式为:
Ft=Wt*Ut,
其中,Ut为第t个图像块的特征向量,Ft为第t个图像块的最终表达向量,Wt为第t个图像块的权重,t=1,2,…,21;所述图像块的编号t的编号规则为:第一个层次的1个图像块编号t=1,第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5;第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…,21;
连接单元,用于把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610917763.1A CN106529578A (zh) | 2016-10-20 | 2016-10-20 | 一种基于深度学习的车辆品牌型号精细识别方法与*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610917763.1A CN106529578A (zh) | 2016-10-20 | 2016-10-20 | 一种基于深度学习的车辆品牌型号精细识别方法与*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106529578A true CN106529578A (zh) | 2017-03-22 |
Family
ID=58332924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610917763.1A Pending CN106529578A (zh) | 2016-10-20 | 2016-10-20 | 一种基于深度学习的车辆品牌型号精细识别方法与*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106529578A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107766865A (zh) * | 2017-11-06 | 2018-03-06 | 北京旷视科技有限公司 | 池化方法、物体检测方法、装置、***及计算机可读介质 |
CN107832794A (zh) * | 2017-11-09 | 2018-03-23 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法、车系识别方法及计算设备 |
CN108629288A (zh) * | 2018-04-09 | 2018-10-09 | 华中科技大学 | 一种手势识别模型训练方法、手势识别方法及*** |
CN108932523A (zh) * | 2017-05-26 | 2018-12-04 | 日东电工株式会社 | 图像分类以及分类数据制作***和方法、存储介质 |
CN109190513A (zh) * | 2018-08-14 | 2019-01-11 | 中山大学 | 结合图像显著性检测和神经网络的车辆重识别方法与*** |
CN109325583A (zh) * | 2017-07-31 | 2019-02-12 | 财团法人工业技术研究院 | 深度神经网络、使用深度神经网络的方法及可读媒体 |
CN109948610A (zh) * | 2019-03-14 | 2019-06-28 | 西南交通大学 | 一种基于深度学习的视频中车辆细粒度分类方法 |
CN110009043A (zh) * | 2019-04-09 | 2019-07-12 | 广东省智能制造研究所 | 一种基于深度卷积神经网络的病虫害检测方法 |
CN110019773A (zh) * | 2017-08-14 | 2019-07-16 | ***通信有限公司研究院 | 一种垃圾短信检测方法、终端及计算机可读存储介质 |
CN110288030A (zh) * | 2019-06-27 | 2019-09-27 | 重庆大学 | 基于轻量化网络模型的图像识别方法、装置及设备 |
CN110378321A (zh) * | 2019-08-12 | 2019-10-25 | 乌鲁木齐明华智能电子科技有限公司 | 一种基础深度神经网络的车辆识别与抓拍技术 |
CN111465941A (zh) * | 2017-11-21 | 2020-07-28 | 国立研究开发法人理化学研究所 | 分类装置、分类方法、程序以及信息记录介质 |
CN111767928A (zh) * | 2020-06-28 | 2020-10-13 | 中国矿业大学 | 基于卷积神经网络提取图像特征信息的方法及装置 |
CN111860499A (zh) * | 2020-07-01 | 2020-10-30 | 电子科技大学 | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 |
CN112070889A (zh) * | 2020-11-13 | 2020-12-11 | 季华实验室 | 一种三维重构方法、装置、***、电子设备及存储介质 |
CN113011556A (zh) * | 2021-02-20 | 2021-06-22 | 安徽大学 | 基于INC-DenseUnet网络识别模型建立方法 |
CN113780062A (zh) * | 2021-07-26 | 2021-12-10 | 岚图汽车科技有限公司 | 一种基于情感识别的车载智能交互方法、存储介质及芯片 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996041A (zh) * | 2014-05-15 | 2014-08-20 | 武汉睿智视讯科技有限公司 | 一种基于匹配的车辆颜色识别方法和*** |
CN104376326A (zh) * | 2014-11-02 | 2015-02-25 | 吉林大学 | 一种用于图像场景识别的特征提取方法 |
US20150278642A1 (en) * | 2014-04-01 | 2015-10-01 | Superfish Ltd. | Neural network image representation |
CN105260736A (zh) * | 2015-09-08 | 2016-01-20 | 西安交通大学 | 基于归一化非负稀疏编码器的图像快速特征表示方法 |
CN105404859A (zh) * | 2015-11-03 | 2016-03-16 | 电子科技大学 | 一种基于池化车辆图片原始特征的车型识别方法 |
CN105574550A (zh) * | 2016-02-02 | 2016-05-11 | 北京格灵深瞳信息技术有限公司 | 一种车辆识别方法及装置 |
CN105718960A (zh) * | 2016-01-27 | 2016-06-29 | 北京工业大学 | 基于卷积神经网络和空间金字塔匹配的图像排序模型 |
US20160196672A1 (en) * | 2015-01-05 | 2016-07-07 | Superfish Ltd. | Graph image representation from convolutional neural networks |
CN105787466A (zh) * | 2016-03-18 | 2016-07-20 | 中山大学 | 一种车辆类型的精细识别方法及*** |
CN105868734A (zh) * | 2016-04-22 | 2016-08-17 | 江苏电力信息技术有限公司 | 基于bow图像表征模型的输电线路大型施工车辆识别方法 |
CN105894045A (zh) * | 2016-05-06 | 2016-08-24 | 电子科技大学 | 一种基于空间金字塔池化的深度网络模型的车型识别方法 |
CN106022232A (zh) * | 2016-05-12 | 2016-10-12 | 成都新舟锐视科技有限公司 | 基于深度学习的车牌检测方法 |
-
2016
- 2016-10-20 CN CN201610917763.1A patent/CN106529578A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150278642A1 (en) * | 2014-04-01 | 2015-10-01 | Superfish Ltd. | Neural network image representation |
CN103996041A (zh) * | 2014-05-15 | 2014-08-20 | 武汉睿智视讯科技有限公司 | 一种基于匹配的车辆颜色识别方法和*** |
CN104376326A (zh) * | 2014-11-02 | 2015-02-25 | 吉林大学 | 一种用于图像场景识别的特征提取方法 |
US20160196672A1 (en) * | 2015-01-05 | 2016-07-07 | Superfish Ltd. | Graph image representation from convolutional neural networks |
CN105260736A (zh) * | 2015-09-08 | 2016-01-20 | 西安交通大学 | 基于归一化非负稀疏编码器的图像快速特征表示方法 |
CN105404859A (zh) * | 2015-11-03 | 2016-03-16 | 电子科技大学 | 一种基于池化车辆图片原始特征的车型识别方法 |
CN105718960A (zh) * | 2016-01-27 | 2016-06-29 | 北京工业大学 | 基于卷积神经网络和空间金字塔匹配的图像排序模型 |
CN105574550A (zh) * | 2016-02-02 | 2016-05-11 | 北京格灵深瞳信息技术有限公司 | 一种车辆识别方法及装置 |
CN105787466A (zh) * | 2016-03-18 | 2016-07-20 | 中山大学 | 一种车辆类型的精细识别方法及*** |
CN105868734A (zh) * | 2016-04-22 | 2016-08-17 | 江苏电力信息技术有限公司 | 基于bow图像表征模型的输电线路大型施工车辆识别方法 |
CN105894045A (zh) * | 2016-05-06 | 2016-08-24 | 电子科技大学 | 一种基于空间金字塔池化的深度网络模型的车型识别方法 |
CN106022232A (zh) * | 2016-05-12 | 2016-10-12 | 成都新舟锐视科技有限公司 | 基于深度学习的车牌检测方法 |
Non-Patent Citations (5)
Title |
---|
CHRISTIAN SZEGEDY等: "Going Deeper with Convolutions", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
JONATHAN MASCI等: "Steel Defect Classification with Max-Pooling Convolutional Neural Networks", 《WCCI 2012 IEEE WORLD CONGRESS ON COMPUTATIONAL INTELLIGENCE》 * |
SYED ZUBAIR等: "Dictionary learning based sparse coefficients for audio classification with max and average pooling", 《DIGITAL SIGNAL PROCESSING》 * |
史忠植编著: "《人工智能》", 31 January 2016, 机械工业出版社 * |
时增林等: "基于序的空间金字塔池化网络的人群计数方法", 《自动化学报》 * |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932523A (zh) * | 2017-05-26 | 2018-12-04 | 日东电工株式会社 | 图像分类以及分类数据制作***和方法、存储介质 |
CN108932523B (zh) * | 2017-05-26 | 2024-04-09 | 日东电工株式会社 | 图像分类以及分类数据制作***和方法、存储介质 |
CN109325583A (zh) * | 2017-07-31 | 2019-02-12 | 财团法人工业技术研究院 | 深度神经网络、使用深度神经网络的方法及可读媒体 |
CN110019773A (zh) * | 2017-08-14 | 2019-07-16 | ***通信有限公司研究院 | 一种垃圾短信检测方法、终端及计算机可读存储介质 |
CN107766865A (zh) * | 2017-11-06 | 2018-03-06 | 北京旷视科技有限公司 | 池化方法、物体检测方法、装置、***及计算机可读介质 |
CN107832794A (zh) * | 2017-11-09 | 2018-03-23 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法、车系识别方法及计算设备 |
CN107832794B (zh) * | 2017-11-09 | 2020-07-14 | 车智互联(北京)科技有限公司 | 一种卷积神经网络生成方法、车系识别方法及计算设备 |
CN111465941A (zh) * | 2017-11-21 | 2020-07-28 | 国立研究开发法人理化学研究所 | 分类装置、分类方法、程序以及信息记录介质 |
CN108629288B (zh) * | 2018-04-09 | 2020-05-19 | 华中科技大学 | 一种手势识别模型训练方法、手势识别方法及*** |
CN108629288A (zh) * | 2018-04-09 | 2018-10-09 | 华中科技大学 | 一种手势识别模型训练方法、手势识别方法及*** |
CN109190513A (zh) * | 2018-08-14 | 2019-01-11 | 中山大学 | 结合图像显著性检测和神经网络的车辆重识别方法与*** |
CN109948610A (zh) * | 2019-03-14 | 2019-06-28 | 西南交通大学 | 一种基于深度学习的视频中车辆细粒度分类方法 |
CN110009043A (zh) * | 2019-04-09 | 2019-07-12 | 广东省智能制造研究所 | 一种基于深度卷积神经网络的病虫害检测方法 |
CN110009043B (zh) * | 2019-04-09 | 2021-08-17 | 广东省智能制造研究所 | 一种基于深度卷积神经网络的病虫害检测方法 |
CN110288030B (zh) * | 2019-06-27 | 2023-04-07 | 重庆大学 | 基于轻量化网络模型的图像识别方法、装置及设备 |
CN110288030A (zh) * | 2019-06-27 | 2019-09-27 | 重庆大学 | 基于轻量化网络模型的图像识别方法、装置及设备 |
CN110378321A (zh) * | 2019-08-12 | 2019-10-25 | 乌鲁木齐明华智能电子科技有限公司 | 一种基础深度神经网络的车辆识别与抓拍技术 |
CN111767928A (zh) * | 2020-06-28 | 2020-10-13 | 中国矿业大学 | 基于卷积神经网络提取图像特征信息的方法及装置 |
CN111767928B (zh) * | 2020-06-28 | 2023-08-08 | 中国矿业大学 | 基于卷积神经网络提取图像特征信息的方法及装置 |
CN111860499A (zh) * | 2020-07-01 | 2020-10-30 | 电子科技大学 | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 |
CN111860499B (zh) * | 2020-07-01 | 2022-07-12 | 电子科技大学 | 一种基于特征分组的双线性卷积神经网络的汽车品牌识别方法 |
CN112070889A (zh) * | 2020-11-13 | 2020-12-11 | 季华实验室 | 一种三维重构方法、装置、***、电子设备及存储介质 |
CN113011556B (zh) * | 2021-02-20 | 2022-10-11 | 安徽大学 | 基于INC-DenseUnet网络识别模型建立方法 |
CN113011556A (zh) * | 2021-02-20 | 2021-06-22 | 安徽大学 | 基于INC-DenseUnet网络识别模型建立方法 |
CN113780062A (zh) * | 2021-07-26 | 2021-12-10 | 岚图汽车科技有限公司 | 一种基于情感识别的车载智能交互方法、存储介质及芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106529578A (zh) | 一种基于深度学习的车辆品牌型号精细识别方法与*** | |
CN104809443B (zh) | 基于卷积神经网络的车牌检测方法及*** | |
CN105354572B (zh) | 一种基于简化卷积神经网络的车牌自动识别*** | |
CN104537393B (zh) | 一种基于多分辨率卷积神经网络的交通标志识别方法 | |
CN108427920A (zh) | 一种基于深度学习的边海防目标检测方法 | |
CN108334881B (zh) | 一种基于深度学习的车牌识别方法 | |
CN110348376A (zh) | 一种基于神经网络的行人实时检测方法 | |
CN106504233A (zh) | 基于Faster R‑CNN的无人机巡检图像电力小部件识别方法及*** | |
CN106096602A (zh) | 一种基于卷积神经网络的中文车牌识别方法 | |
CN105354568A (zh) | 基于卷积神经网络的车标识别方法 | |
CN106127196A (zh) | 基于动态纹理特征的人脸表情的分类与识别方法 | |
CN107729872A (zh) | 基于深度学习的人脸表情识别方法及装置 | |
CN108345894B (zh) | 一种基于深度学习和熵模型的交通事件检测方法 | |
CN106815604A (zh) | 基于多层信息融合的注视点检测方法 | |
CN108875608A (zh) | 一种基于深度学习的机动车交通信号识别方法 | |
CN105335716A (zh) | 一种基于改进udn提取联合特征的行人检测方法 | |
CN107145889A (zh) | 基于具有RoI池化的双CNN网络的目标识别方法 | |
CN107944399A (zh) | 一种基于卷积神经网络目标中心模型的行人重识别方法 | |
CN107315998B (zh) | 基于车道线的车辆种类划分方法和*** | |
CN105654107A (zh) | 一种基于svm的有形成分分类方法 | |
CN105718889A (zh) | 基于GB(2D)2PCANet深度卷积模型的人脸身份识别方法 | |
CN107092876A (zh) | 基于Retinex与S‑SIFT特征结合的低照度车型识别方法 | |
CN107818299A (zh) | 基于融合hog特征和深度信念网络的人脸识别算法 | |
CN106503748A (zh) | 一种基于s‑sift特征和svm训练器的车型识别算法 | |
Masita et al. | Pedestrian detection using R-CNN object detector |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170322 |
|
RJ01 | Rejection of invention patent application after publication |