CN109740422B - 一种识别汽车的方法及装置 - Google Patents

一种识别汽车的方法及装置 Download PDF

Info

Publication number
CN109740422B
CN109740422B CN201811401131.5A CN201811401131A CN109740422B CN 109740422 B CN109740422 B CN 109740422B CN 201811401131 A CN201811401131 A CN 201811401131A CN 109740422 B CN109740422 B CN 109740422B
Authority
CN
China
Prior art keywords
image
automobile
identified
headstock
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811401131.5A
Other languages
English (en)
Other versions
CN109740422A (zh
Inventor
刘均
李方勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Launch Technology Co Ltd
Original Assignee
Shenzhen Launch Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Launch Technology Co Ltd filed Critical Shenzhen Launch Technology Co Ltd
Priority to CN201811401131.5A priority Critical patent/CN109740422B/zh
Publication of CN109740422A publication Critical patent/CN109740422A/zh
Application granted granted Critical
Publication of CN109740422B publication Critical patent/CN109740422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Image Analysis (AREA)

Abstract

本申请公开了一种识别汽车的方法及装置。该方法包括:获取预处理后的第一待识别图像,其中,所述第一待识别图像为待识别汽车的车头图像;对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;根据所述车头特征图像,识别汽车的品牌或型号。还公开了相应的装置。通过车头神经网络模型对待识别汽车的车头图像进行卷积操作,并提取出车头特征图像,softmax层再根据车头特征图像中的车头特征对待识别汽车的品牌或型号进行预测,自主、快速地得到汽车品牌或型号的概率,最后根据概率值准确地识别出待识别汽车的品牌或型号。

Description

一种识别汽车的方法及装置
技术领域
本申请涉及人工智能技术领域,尤其涉及一种识别汽车的方法及装置。
背景技术
近些年,经济发展迅猛,人们的生活水平不断提高,越来越多的人购买了汽车。汽车为人们带来了很多便利,但归根结底,汽车也是个机器,也会有故障。不同型号的汽车的结构及零部件均不相同,因此,在对汽车进行维修时,需要准确的识别出汽车的型号。
维修师傅在某些情形下难以通过肉眼识别车辆的具体型号,而包括车辆检测分隔、特征提取与选择、模式识别等过程在内的传统的车辆识别技术在复杂背景下识别率又较低。
发明内容
本申请提供一种识别汽车的方法及装置,以实现对汽车车型的识别。
第一方面,提供了一种识别汽车的方法,包括:获取预处理后的第一待识别图像;对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;根据所述车头特征图像,识别汽车的品牌或型号。
在一种可能实现的方式中,所述获取待识别汽车的车头图像,包括:获取所述第一待识别图像;归一化处理所述车头图像,得到所述预处理后的第一待识别图像。
在另一种可能实现的方式中,所述对所述预处理后的第一待识别图像进行第一图像特征处理,包括:对所述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征;将所述提取到的车头图像特征的尺寸缩小至目标尺寸,得到第一车头特征图像;对所述第一车头特征图像进行目标次数所述卷积操作和所述尺寸缩小,得到所述车头特征图像。
在又一种可能实现的方式中,所述方法还包括:根据所述处理后的图像特征对所述第一待识别图像中的车头对应的汽车品牌或型号进行预测,得到一个或多个概率值,其中,所述概率值为所述待识别汽车的型号或品牌的概率;将所述一个或多个概率值中的最大值对应的汽车型号或汽车品牌,作为识别出的汽车的品牌或型号。
在又一种可能实现的方式中,所述方法还包括:当所述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像,其中,所述第二待识别图像为待识别汽车的车尾图像;对所述预处理后的第二待识别图像进行第二图像特征处理,得到与所述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,所述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;根据所述车尾特征图像,得到所述待识别汽车对应的汽车型号。
第二方面,提供了一种识别汽车的装置,包括:获取单元,用于获取预处理后的第一待识别图像;第一处理单元,用于对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;第一识别单元,用于根据所述车头特征图像,识别汽车的品牌或型号。
在一种可能实现的方式中,所述获取单元,包括:获取子单元,用于获取待识别汽车的车头图像;归一化子单元,用于归一化处理所述车头图像,得到所述预处理后的第一待识别图像。
在另一种可能实现的方式中,所述第一处理单元,包括:第一处理子单元,用于对所述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征;第二处理子单元,用于将所述提取到的车头图像特征的尺寸缩小至目标尺寸,得到第一车头特征图像;第三处理子单元,用于对所述第一车头特征图像进行目标次数所述卷积操作和所述尺寸缩小,得到所述车头特征图像。
在又一种可能实现的方式中,所述装置还包括:预测单元,用于根据所述处理后的图像特征对所述第一待识别图像中的车头对应的汽车品牌或型号进行预测,得到一个或多个概率值,其中,所述概率值为所述待识别汽车的型号或品牌的概率;确定单元,用于将所述一个或多个概率值中的最大值对应的汽车型号或汽车品牌,作为识别出的汽车的品牌或型号。
在又一种可能实现的方式中,所述装置还包括:所述获取单元,还用于当所述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像,其中,所述第二待识别图像为待识别汽车的车尾图像;第二处理单元,用于对所述预处理后的第二待识别图像进行第二图像特征处理,得到与所述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,所述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;第二识别单元,用于根据所述车尾特征图像,得到所述待识别汽车对应的汽车型号。
第三方面,提供了一种识别汽车的装置,包括:包括处理器、存储器;所述处理器被配置为支持所述装置执行上述第一方面及其任一种可能的实现方式的方法中相应的功能。存储器用于与处理器耦合,其保存所述装置必要的程序(指令)和数据。可选的,所述装置还可以包括输入/输出接口,用于支持所述装置与其他装置之间的通信。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面及其任一种可能的实现方式的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面及其任一种可能的实现方式的方法。
本申请实施例通过车头神经网络模型对待识别汽车的车头图像进行卷积操作,并提取出车头特征图像,softmax层再根据车头特征图像中的车头特征对待识别汽车的品牌或型号进行预测,自主、快速地得到汽车品牌或型号的概率,最后根据概率值准确地识别出待识别汽车的品牌或型号;由于车头神经网络模型识别的结果可能只有汽车的品牌,因此,再在识别得到的汽车品牌的基础上,通过汽车品牌神经网络模型对待识别汽车的车尾进行识别,并得到待识别汽车的车型。上述识别过程均无需人工参与,用户只需将拍摄的待识别汽车的车头图像和车尾图像分别输入模型即可获得高精确度识别结果。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例提供的一种识别汽车的方法的流程示意图;
图2为本申请实施例提供的另一种识别汽车的方法的流程示意图;
图3为本申请实施例提供的一种识别汽车的装置的结构示意图;
图4为本申请实施例提供的一种识别汽车的装置的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
下面结合本申请实施例中的附图对本申请实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种识别汽车的方法的流程示意图。
101、获取预处理后的第一待识别图像。
本申请实施例主要通过车头神经网络模型对汽车的具体型号进行识别,需要指出的是,上述具体型号指具体到某一品牌的某一具体车型,如:宝马的3系、5系;奥迪的A4、A6;大众的迈腾、帕萨特等。车头神经网络模型需要对汽车车头图像进行处理,即对第一待识别图像进行处理,并给出识别结果,为是车头神经网络模型对第一待识别图像的处理效果更佳,需先对第一待识别图像进行预处理。
102、对上述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像。
车头神经网络模型对上述预处理后的第一待识别图像进行卷积操作,从预处理后的第一待识别图像中提取车头特征图像,并通过对车头图像进行池化处理,缩小车头特征的大小,以减小后续处理的计算量。需要指出的是,车头神经网络模型由多层卷积层组成,上一层卷积层提取到的特征将作为下一层卷积操作的输入,卷积层数越多,所提取出的特征信息就越丰富,最终提取的特征的准确率也就越高。
103、根据上述车头特征图像,识别汽车的品牌或型号。
车头神经网络模型中的softmax层将根据上述车头特征图像中的车头特征,对待识别汽车的品牌或型号进行识别,并给出待识别汽车为某个品牌或型号的概率,最后选取最大概率值对应的汽车品牌或型号作为待识别汽车的品牌或型号。
本申请实施例通过车头神经网络模型对待识别汽车的车头图像进行卷积操作,并提取出车头特征图像,softmax层再根据车头特征图像中的车头特征对待识别汽车的品牌或型号进行预测,自主、快速地得到汽车品牌或型号的概率,最后根据概率值准确地识别出待识别汽车的品牌或型号。
请参阅图2,图2是本申请实施例提供的另一种识别汽车的方法的流程示意图。
201、获取待识别汽车的车头图像。
本申请实施例主要通过车头神经网络模型对汽车的具体型号进行识别,需要指出的是,上述具体型号指具体到某一品牌的某一具体车型,如:宝马的3系、5系;奥迪的A4、A6;大众的迈腾、帕萨特等。车头神经网络模型需要对汽车车头图像进行处理,并给出识别结果,因此,用户在需要通过本申请对未知车型的汽车进行识别时,首先需要获取该待识别汽车的车头图像,即获取第一待识别图像。可选地,上述车头神经网络模型可基于VGG16深度神经网络训练得到;第一待识别图像可通过任意带摄像头的智能终端(如:手机、平板电脑等)拍摄获得。
202、归一化处理车头图像,得到预处理后的第一待识别图像。
由于后续需要将第一待识别图像输入到车头神经网络模型中进行处理。一方面,因为深度神经网络在对第一待识别图像进行处理并提取特征的过程其实就是完成对数据的分布,并需要在后续的测试集上达到很好的泛化效果,显然,如果每次输入到深度神经网络的数据都具有不同的分布,将会给网络的特征提取带来很大的困难。另一方面,在上述提取特征的过程中,深度神经网络中每一层网络的输入都会因为前一层网络参数的变化导致其分布发生改变,数据经过一层层网络计算后,其数据分布也会发生变化,这样会给下一层网络的特征提取带来困难。因此,在对第一待识别图像进行后续处理之前,需先对其进行归一化处理,以去除数据的相关性,并突出特征数据之间的分布差异,并得到预处理后的第一待识别图像。归一化处理的具体操作步骤可参见下例:
假设输入数据是β=x1→m共m个数据,输出是yi=BN(x),归一化处理将对数据进行如下操作:
先求出上述批量数据β=x1→m的平均值,即
Figure BDA0001876349150000051
再根据平均值μβ求出上述批量数据的方差,即
Figure BDA0001876349150000052
再根据平均值μβ和方差
Figure BDA0001876349150000053
对上述批量数据进行归一化处理,即
Figure BDA0001876349150000054
其中,ε为常数,得到
Figure BDA0001876349150000055
即为归一化处理后的数据。
203、对上述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征。
通过车头神经网络模型对预处理后的第一待识别图像进行卷积操作,并从预处理后的第一待识别图像中提取车头图像特征。具体地,对预处理后的第一待识别图像做卷积操作,利用卷积核在预处理后的第一待识别图像上滑动,将图像点上的像素灰度值与对应的卷积核上的数值相乘,然后将所有相乘后的值的和作为卷积核中间像素对应的图像上像素的灰度值,最终滑动处理完预处理后的第一待识别图像中的所有图像点,并提取出车头图像特征。
需要理解的是,车头神经网络模型提取出的车头图像特征由对VGG16深度神经网络的训练决定,此处不做详细阐述。
204、将提取到的车头图像特征的尺寸缩小至目标尺寸,得到第一车头特征图像。
由于上述提取到的车头图像特征数量较多,尺寸较大,若直接用上述提取到的车头图像特征去做后续处理将产生巨大的计算量,因此,在对上述提取到的车头图像特征进行后续处理之前,先池化处理上述提取到的车头图像特征,将上述提取到的车头图像特征的尺寸缩小到一个目标大小,以满足后续处理的需要,同时能大大减小后续处理的计算量。
池化处理的具体实现过程可参见下例:假设上述提取到的车头图像特征的大小为h*w,当我们想要得到获得的车头图像特征的目标大小为H*W时,可将该目标动作特征划分成H*W个格子,这样,每一个格子的大小为(h/H)*(w/W),然后计算每一个格子中车头图像特征的平均值或最大值,即可得到获得目标大小的车头特征图像。
205、对上述第一车头特征图像进行目标次数卷积操作和尺寸缩小,得到车头特征图像。
如上所述,本申请实施例中的车头申请网络模型是基于VGG16深度神经网络训练得到的,因此,该模型的主要架构与VGG16深度神经网络的架构一致,具体架构及相关参数如下:
第一层为输入层,输入层输入的是第一待识别图像,输出的是预处理后的第一待识别图像,尺寸为256*256*3。
第二层至第四层为第一个卷积神经网络单元。第二层为卷积层,该卷积层包含64个3*3卷积核,通过卷积核对预处理后的第一待识别图像进行卷积操作,提取出车头特征,得到车头特征图像。第三层为卷积层,该卷积层包含64个3*3卷积核,通过卷积核对第二层提取到的车头特征图像进行卷积,进一步提取出车头特征。第四卷积层为池化层,该池化层步长设置为2*2,用于对取到的车头特征图像进行池化处理,缩小车头特征的尺寸。
第五层至第七层为第二个卷积神经网络单元。第五层为卷积层,该卷积层包含128个3*3卷积核,通过卷积核对上一层输出的车头特征图像进行卷积操作,进一步提取出车头特征,得到车头特征图像。第六层为卷积层,该卷积层包含128个3*3卷积核,通过卷积核对第五层提取到的车头特征图像进行卷积,进一步提取出车头特征。第七卷积层为池化层,该池化层步长设置为2*2,用于对取到的车头特征图像进行池化处理,缩小车头特征的尺寸。
第八层至第十层为第三个卷积神经网络单元。第八层为卷积层,该卷积层包含256个3*3卷积核,通过卷积核对上一层输出的车头特征图像进行卷积操作,进一步提取出车头特征,得到车头特征图像。第九层为卷积层,该卷积层包含256个3*3卷积核,通过卷积核对第八层提取到的车头特征图像进行卷积,进一步提取出车头特征。第十卷积层为池化层,该池化层步长设置为2*2,用于对取到的车头特征图像进行池化处理,缩小车头特征的尺寸。
第十一层至第十三层为第四个卷积神经网络单元。第十一层为卷积层,该卷积层包含512个3*3卷积核,通过卷积核对上一层输出的车头特征图像进行卷积操作,进一步提取出车头特征,得到车头特征图像。第十二层为卷积层,该卷积层包含512个3*3卷积核,通过卷积核对第十一层提取到的车头特征图像进行卷积,进一步提取出车头特征。第十三卷积层为池化层,该池化层步长设置为2*2,用于对取到的车头特征图像进行池化处理,缩小车头特征的尺寸。
第十四层至第十六层为第五个卷积神经网络单元。第十四层为卷积层,该卷积层包含512个3*3卷积核,通过卷积核对上一层输出的车头特征图像进行卷积操作,进一步提取出车头特征,得到车头特征图像。第十五层为卷积层,该卷积层包含512个3*3卷积核,通过卷积核对第十四层提取到的车头特征图像进行卷积,进一步提取出车头特征。第十六卷积层为池化层,该池化层步长设置为2*2,用于对取到的车头特征图像进行池化处理,缩小车头特征的尺寸。
从上述网络结构和参数可以看出,车头神经网络模型包含多层卷积层,上一层卷积层提取到的特征将作为下一层卷积操作的输入,越到后面的卷积层,其包含的卷积核就越多,相应地,所提取出的特征信息就越丰富,最终提取的特征的准确率也就越高。203~205对上述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,上述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小。
206、根据上述处理后的图像特征对上述第一待识别图像中的车头对应的汽车品牌或型号进行预测,得到一个或多个概率值。
十七、十八、十九层为全连接层,总共包含4096个神经核。第二十层为softmax层,共有N个神经核,激活函数为softmax。需要指出的是,N个卷积核与N个汽车品牌一一对应,如:市面上共有M个汽车品牌,则为每个汽车品牌选取至少一张车头图像作为训练素材,输入至VGG16深度神经网络进行训练,这样,最终获得的车头神经网络模型中的softmax层就会有M个卷积核,分别用于识别M个汽车品牌。
softmax层可通过内置的softmax函数将输入的不同特征映射成0至1之间的值,且映射后的所有值的和为1,映射后的值与输入的特征一一对应,这样,就相当于对每个输入特征完成了预测,并以数值的形式给出相应的概率。具体可参见下例:假如,对应10个输入动作有10个神经核,即在输入动作1,动作2,动作3...一直到动作10中的任意一中动作,softmax层会给出这个输入的动作分别是动作1,动作2,动作3,一直到动作10相应的概率,并预测其中概率值最大的动作为输入动作。
可选地,在对VGG16深度神经网络进行训练时,可通过softmax层对车头特征图像中的车头特征进行预测。具体地,softmax层会结合车头特征图像中不同的车头特征,对待识别汽车为具体某一车型或某一品牌进行预测,并给出待识别汽车为该车型或该品牌的概率,最终得到一个或多个汽车车型或汽车品牌的概率值。从上述多个概率值中选取最大的概率值对应的车型,作为识别结果输出。通过与输入图像中待识别汽车的车型进行对比,并调整softmax函数相关参数,完成对softmax层的训练。
需要指出的是,在实际应用中,将上述一个或多个概率值中的最大值对应的汽车型号或汽车品牌,作为识别出的汽车的品牌或型号,也就是说,车头神经网络模型输出的识别结果不一定是车型。
207、当上述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像。
如上所述,车头神经网络模型输出的识别结果不一定是车型,也可能是待识别汽车的品牌,显然用户需要的识别结果是待识别汽车的型号,而当车头神经网络模型输出的识别结果是汽车品牌时,本申请实施例将通过汽车品牌神经网络模型对待识别汽车的车尾进行识别。与车头神经网络模型一样,汽车品牌神经网络模型也是基于VGG16深度神经网络训练得到的,因此,汽车品牌神经网络模型的结构和卷积核的数量可参见205。由于每个汽车品牌旗下包含有多个车型,即每个汽车品牌对应与多个汽车型号,在通过车头神经网络模型识别车待识别汽车的品牌后,即可针对该品牌进行汽车型号的识别,这样,可缩小识别范围,加快运算速度,提高识别准确率。因此,本申请对每个汽车品牌均单独训练得到一个汽车品牌神经网络模型,该模型可识别出对应汽车品牌旗下的所有车型。
汽车品牌神经网络模型识别的是第二待识别图像,即待识别汽车的车尾图像,整个识别过程可总结为以下三个步骤:对预处理后的第二待识别图像进行第二图像特征处理,得到与上述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,上述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;根据所述车尾特征图像,得到上述待识别汽车对应的汽车型号。由于对第二待识别图像的识别过程与对第一待识别图像的识别过程相似,具体可参见201~206,此处将不再详细阐述。
本申请实施例通过车头神经网络模型对待识别汽车的车头图像进行卷积操作,并提取出车头特征图像,softmax层再根据车头特征图像中的车头特征对待识别汽车的品牌或型号进行预测,自主、快速地得到汽车品牌或型号的概率,最后根据概率值准确地识别出待识别汽车的品牌或型号;由于车头神经网络模型识别的结果可能只有汽车的品牌,因此,再在识别得到的汽车品牌的基础上,通过汽车品牌神经网络模型对待识别汽车的车尾进行识别,并得到待识别汽车的车型。上述识别过程均无需人工参与,用户只需将拍摄的待识别汽车的车头图像和车尾图像分别输入模型即可获得高精确度识别结果。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参阅图3,图3为本申请实施例提供的一种识别汽车的装置的结构示意图,该装置1000包括:获取单元11、第一处理单元12、第一识别单元13、预测单元14、确定单元15、第二处理单元16及第二识别单元17。其中:
获取单元11,用于获取预处理后的第一待识别图像;
第一处理单元12,用于对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;
第一识别单元13,用于根据所述车头特征图像,识别汽车的品牌或型号。
进一步地,所述获取单元11,包括:获取子单元111,用于获取所述第一待识别图像;归一化子单元112,用于归一化处理所述第一待识别图像,得到所述预处理后的第一待识别图像。
进一步地,所述第一处理单元12,包括:第一处理子单元121,用于对所述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征;第二处理子单元122,用于将所述提取到的车头图像特征的尺寸缩小至目标尺寸,得到第一车头特征图像;第三处理子单元123,用于对所述第一车头特征图像进行目标次数所述卷积操作和所述尺寸缩小,得到所述车头特征图像。
进一步地,所述装置1000还包括:预测单元14,用于根据所述处理后的图像特征对所述第一待识别图像中的车头对应的汽车品牌或型号进行预测,得到一个或多个概率值,其中,所述概率值为所述待识别汽车的型号或品牌的概率;确定单元15,用于将所述一个或多个概率值中的最大值对应的汽车型号或汽车品牌,作为识别出的汽车的品牌或型号。
进一步地,所述装置1000还包括:所述获取单元11,还用于当根据所述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像,其中,所述第二待识别图像为待识别汽车的车尾图像;第二处理单元16,用于对所述预处理后的第二待识别图像进行第二图像特征处理,得到与所述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,所述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;第二识别单元17,用于根据所述车尾特征图像,得到所述待识别汽车对应的汽车型号。
本申请实施例通过车头神经网络模型对待识别汽车的车头图像进行卷积操作,并提取出车头特征图像,softmax层再根据车头特征图像中的车头特征对待识别汽车的品牌或型号进行预测,自主、快速地得到汽车品牌或型号的概率,最后根据概率值准确地识别出待识别汽车的品牌或型号;由于车头神经网络模型识别的结果可能只有汽车的品牌,因此,再在识别得到的汽车品牌的基础上,通过汽车品牌神经网络模型对待识别汽车的车尾进行识别,并得到待识别汽车的车型。上述识别过程均无需人工参与,用户只需将拍摄的待识别汽车的车头图像和车尾图像分别输入模型即可获得高精确度识别结果。
图4为本申请实施例提供的一种识别汽车的装置的硬件结构示意图。该识别装置包括处理器21,还可以包括输入装置22、输出装置23和存储器24。该输入装置22、输出装置23、存储器24和处理器21之间通过总线相互连接。
存储器包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmable readonly memory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置用于输入数据和/或信号,以及输出装置用于输出数据和/或信号。输出装置和输入装置可以是独立的器件,也可以是一个整体的器件。
处理器可以包括是一个或多个处理器,例如包括一个或多个中央处理器(centralprocessing unit,CPU),在处理器是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器用于存储网络设备的程序代码和数据。
处理器用于调用该存储器中的程序代码和数据,执行如下步骤:
在一个实现方式中,所述处理器用于执行如下步骤:获取预处理后的第一待识别图像,其中,所述第一待识别图像为待识别汽车的车头图像;对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;根据所述车头特征图像,识别汽车的品牌或型号。
在另一个实现方式中,所述处理器用于执行如下步骤:获取所述第一待识别图像;归一化处理所述第一待识别图像,得到所述预处理后的第一待识别图像。
在又一个实现方式中,所述处理器用于执行如下步骤:对所述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征;缩小所述提取到的车头图像特征的尺寸,得到第一车头特征图像;对所述第一车头特征图像进行多次所述卷积操作和所述尺寸缩小,得到所述车头特征图像。
在又一个实现方式中,所述处理器用于执行如下步骤:根据所述处理后的图像特征对所述第一待识别图像中的车头对应的汽车品牌或型号进行预测,得到一个或多个概率值,其中,所述概率值为所述待识别汽车的型号或品牌的概率;将所述一个或多个概率值中的最大值对应的汽车型号或汽车品牌,作为识别出的汽车的品牌或型号。
在又一个实现方式中,所述处理器用于执行如下步骤:当所述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像,其中,所述第二待识别图像为待识别汽车的车尾图像;对所述预处理后的第二待识别图像进行第二图像特征处理,得到与所述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,所述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;根据所述车尾特征图像,得到所述待识别汽车对应的汽车型号。
可以理解的是,图4仅仅示出了一种识别汽车的装置的简化设计。在实际应用中,识别汽车的装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、控制器、存储器等,而所有可以实现本申请实施例的识别汽车的装置都在本申请的保护范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital versatiledisc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存储存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。

Claims (8)

1.一种识别汽车的方法,其特征在于,包括:
获取预处理后的第一待识别图像;
根据车头神经网络模型对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;
所述车头神经网络模型中的softmax层根据所述车头特征图像中的车头特征,识别汽车的品牌或型号;
当所述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像,其中,所述第二待识别图像为待识别汽车的车尾图像;
根据汽车品牌神经网络模型对所述预处理后的第二待识别图像进行第二图像特征处理,得到与所述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,所述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;
所述汽车品牌神经网络模型根据所述车尾特征图像,得到所述待识别汽车对应的汽车型号。
2.根据权利要求1所述的方法,其特征在于,所述获取预处理后的第一待识别图像,包括:
获取待识别汽车的车头图像;
归一化处理所述车头图像,得到所述预处理后的第一待识别图像。
3.根据权利要求1所述的方法,其特征在于,所述根据车头神经网络模型对所述预处理后的第一待识别图像进行第一图像特征处理,包括:
所述车头神经网络模型对所述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征;
将所述提取到的车头图像特征的尺寸缩小至目标尺寸,得到第一车头特征图像;
对所述第一车头特征图像进行目标次数所述卷积操作和所述尺寸缩小,得到所述车头特征图像。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:
根据所述处理后的图像特征对所述第一待识别图像中的车头对应的汽车品牌或型号进行预测,得到一个或多个概率值,其中,所述概率值为所述待识别汽车的型号或品牌的概率;
将所述一个或多个概率值中的最大值对应的汽车型号或汽车品牌,作为识别出的汽车的品牌或型号。
5.一种识别汽车的装置,其特征在于,包括:
获取单元,用于获取预处理后的第一待识别图像;
第一处理单元,用于根据车头神经网络模型对所述预处理后的第一待识别图像进行第一图像特征处理,得到车头特征图像,其中,所述第一图像特征处理包括一次或多次车头图像特征的提取和车头图像特征的尺寸逐级缩小;
第一识别单元,用于所述车头神经网络模型中的softmax层根据所述车头特征图像中的车头特征,识别汽车的品牌或型号;
所述获取单元,还用于当所述车头特征图像识别出汽车品牌时,获取预处理后的第二待识别图像,其中,所述第二待识别图像为待识别汽车的车尾图像;
第二处理单元,用于根据汽车品牌神经网络模型对所述预处理后的第二待识别图像进行第二图像特征处理,得到与所述车头特征图像相关联的一个或多个汽车型号的车尾特征图像,其中,所述第二图像特征处理包括一次或多次车尾图像特征的提取和车尾图像特征的尺寸逐级缩小;
第二识别单元,用于所述汽车品牌神经网络模型根据所述车尾特征图像,得到所述待识别汽车对应的汽车型号。
6.根据权利要求5所述的装置,其特征在于,所述第一处理单元还包括:
第一处理子单元,用于所述车头神经网络模型对所述预处理后的第一待识别图像进行卷积操作,得到提取到的车头图像特征;
第二处理子单元,用于将所述提取到的车头图像特征的尺寸缩小至目标尺寸,得到第一车头特征图像;
第三处理子单元,用于对所述第一车头特征图像进行目标次数所述卷积操作和所述尺寸缩小,得到所述车头特征图像。
7.一种识别汽车的装置,其特征在于,包括:处理器、存储器;所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如权利要求1~4任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如权利要求1~4任一项所述的方法。
CN201811401131.5A 2018-11-22 2018-11-22 一种识别汽车的方法及装置 Active CN109740422B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811401131.5A CN109740422B (zh) 2018-11-22 2018-11-22 一种识别汽车的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811401131.5A CN109740422B (zh) 2018-11-22 2018-11-22 一种识别汽车的方法及装置

Publications (2)

Publication Number Publication Date
CN109740422A CN109740422A (zh) 2019-05-10
CN109740422B true CN109740422B (zh) 2023-05-05

Family

ID=66358027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811401131.5A Active CN109740422B (zh) 2018-11-22 2018-11-22 一种识别汽车的方法及装置

Country Status (1)

Country Link
CN (1) CN109740422B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111444867A (zh) * 2020-03-31 2020-07-24 高新兴科技集团股份有限公司 一种基于卷积神经网络的车辆后拍子品牌识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446949A (zh) * 2016-09-26 2017-02-22 成都通甲优博科技有限责任公司 一种车辆型号识别方法及装置
WO2018076575A1 (zh) * 2016-10-24 2018-05-03 深圳市元征科技股份有限公司 非法行驶记录方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106548145A (zh) * 2016-10-31 2017-03-29 北京小米移动软件有限公司 图像识别方法及装置
CN108805934B (zh) * 2017-04-28 2021-12-28 华为技术有限公司 一种车载摄像机的外部参数标定方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446949A (zh) * 2016-09-26 2017-02-22 成都通甲优博科技有限责任公司 一种车辆型号识别方法及装置
WO2018076575A1 (zh) * 2016-10-24 2018-05-03 深圳市元征科技股份有限公司 非法行驶记录方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周必书 ; .基于深度学习特征表达的车辆检测和分析.信息通信.2018,(04),全文. *

Also Published As

Publication number Publication date
CN109740422A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN108875522B (zh) 人脸聚类方法、装置和***及存储介质
CN109934198B (zh) 人脸识别方法及装置
CN111160375B (zh) 三维关键点预测及深度学习模型训练方法、装置及设备
CN111179419B (zh) 三维关键点预测及深度学习模型训练方法、装置及设备
CN109471945B (zh) 基于深度学习的医疗文本分类方法、装置及存储介质
CN108875487B (zh) 行人重识别网络的训练及基于其的行人重识别
CN107958230B (zh) 人脸表情识别方法及装置
CN112580643B (zh) 一种基于深度学习的车牌识别方法、装置及存储介质
CN111738403B (zh) 一种神经网络的优化方法及相关设备
CN113408570A (zh) 一种基于模型蒸馏的图像类别识别方法、装置、存储介质及终端
CN111950570B (zh) 目标图像提取方法、神经网络训练方法及装置
CN113869282A (zh) 人脸识别方法、超分模型训练方法及相关设备
CN110909817B (zh) 分布式聚类方法及***、处理器、电子设备及存储介质
CN113822207A (zh) 高光谱遥感图像识别方法、装置、电子设备及存储介质
CN111540375A (zh) 音频分离模型的训练方法、音频信号的分离方法及装置
CN111340213B (zh) 神经网络的训练方法、电子设备、存储介质
CN109740422B (zh) 一种识别汽车的方法及装置
CN110503600B (zh) 特征点检测方法、装置、电子设备和可读存储介质
CN110717407A (zh) 基于唇语密码的人脸识别方法、装置及存储介质
CN112699907B (zh) 数据融合的方法、装置和设备
CN116631060A (zh) 基于单帧图像的手势识别方法及装置
CN113408571B (zh) 一种基于模型蒸馏的图像分类方法、装置、存储介质及终端
CN113139561B (zh) 一种垃圾分类方法、装置、终端设备及存储介质
CN114332993A (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN109101992B (zh) 图像匹配方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant