WO2018157862A1

WO2018157862A1 - 车型的识别方法和装置、存储介质、电子装置

Info

Publication number: WO2018157862A1
Application number: PCT/CN2018/077898
Authority: WO
Inventors: 郑克松; 张力; 徐浩; 申玉
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2017-03-02
Filing date: 2018-03-02
Publication date: 2018-09-07
Also published as: CN108304754A

Abstract

本申请公开了一种车型的识别方法和装置、存储介质、电子装置。其中，该方法包括：获取到对目标图片中的车辆进行车型识别的请求；使用预设神经网络模型识别出目标图片中的车辆为目标车型，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；响应于请求，返回包括目标车型的识别结果。本申请解决了相关技术中进行车型识别的准确率较低的技术问题。

Description

车型的识别方法和装置、存储介质、电子装置

本申请要求于提交中国专利局，申请号为2017101216098、发明名称“车型的识别方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及监控领域，具体而言，涉及一种车型的识别方法和装置、存储介质、电子装置。

背景技术

在智能视频监控中，车型识别技术是公安图像侦查和交通状态分析的一个前期处理中的重要分体。随着信息技术的发展，车型识别技术也得到了进一步的发展，当前的车型识别技术与传统意义上的车型识别存在着较大的区别，传统意义上的车型识别仅能分辨出车辆的大致类型，如小型车辆、中型车辆和大型车辆。而当前意义上的车型识别技术就是对从车辆的车脸区域图像中提取出的车型特征进行分类，以确定该车辆所属的品牌型号。随着计算机技术的进步，基于车脸特征的车型识别技术逐渐走向实用，不但可以识别车辆品牌，甚至可以识别该车辆品牌旗下的系列和年款，从而大大扩展了该技术在相关领域的应用。

目前的车型识别算法主要包括以下两种：基于模版匹配的方法和基于统计模式识别的方法，这两种方法对图像的要求高(如对光照、角度、清晰度、是否有遮挡等)，且识别率较低、缺乏鲁棒性。

针对相关技术中进行车型识别的准确率较低的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种车型的识别方法和装置、存储介质、电子装置，以至少解决相关技术中进行车型识别的准确率较低的技术问题。

根据本申请实施例的一个方面，提供了一种车型的识别方法，包括：获取到对目标图片中的车辆进行车型识别的请求；使用预设神经网络模型识别出目标图片中的车辆为目标车型，其中，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；响应于请求，返回包括目标车型的识别结果。

根据本申请实施例的另一方面，还提供了一种车型的识别装置，包括：获取单元，用于获取到对目标图片中的车辆进行车型识别的请求；识别单元，用于使用预设神经网络模型识别出目标图片中的车辆为目标车型，其中，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；响应单元，用于响应于请求，返回包括目标车型的识别结果。

根据本申请实施例的另一方面，还提供了一种存储介质，该存储介质包括存储的程序，其中，该程序被设置为运行时执行上述的任一种方法。

根据本申请实施例的另一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序，处理器被设置为通过计算机程序执行上述的任一种方法。

在本申请实施例中，通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型，在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型进行识别，由于训练集合是对多个车型的图片进行第一预处理得到的图片集合，而第一预处理可增强预设神经网络模型的鲁棒性，也即可以消除环境、拍摄角度对车型识别的影响，可以解决了相关技术中进行车型识别的准确率较低的技术问题，进而达到提升车型识别的准确率的技术效果。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的车型的识别方法的硬件环境的示意图；

图2是根据本申请实施例的一种可选的车型的识别方法的流程图；

图3是根据本申请实施例的一种可选的车型的识别方法的流程图；

图4是根据本申请实施例的一种可选的车型的识别方法的流程图；

图5是根据本申请实施例的一种可选的车型的识别方法的流程图；

图6是根据本申请实施例的一种可选的车型的识别方法的流程图；

图7是根据本申请实施例的一种可选的车型的识别装置的示意图；

图8是根据本申请实施例的一种可选的车型的识别装置的示意图；以及

图9是根据本申请实施例的一种终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语 “第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或者术语适用于如下解释：

鲁棒性:是Robust的音译，也就是健壮和强壮的意思。它是在异常和危险情况下***生存的关键。比如说，计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下，能否不死机、不崩溃，就是该软件的鲁棒性。所谓“鲁棒性”，是指控制***在一定(结构，大小)的参数摄动下，维持其它某些性能的特性。根据对性能的不同定义，可分为稳定鲁棒性和性能鲁棒性。以闭环***的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。

人工神经网络：Artificial Neural Networks，简写为ANN，也简称为神经网络(NNs)或称作连接模型(Connection Model)，它是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。这种网络依靠***的复杂程度，通过调整内部大量节点之间相互连接的关系，从而达到处理信息的目的。

根据本申请实施例，提供了一种车型的识别方法的方法实施例。

可选地，在本实施例中，上述车型的识别方法可以应用于如图1所示的由服务器102和终端104所构成的硬件环境中。如图1所示，服务器102通过网络与终端104进行连接，还可包括用于为服务器提供数据存储服务的数据库106，上述网络包括但不限于：广域网、城域网或局域网，终端104并不限定于PC、手机、平板电脑等。本申请实施例的车型的识别方法可以由服务器102来执行(具体可执行下述步骤S202至步骤S206)，也可以由终端104来执行，还可以是由服务器102和终端104共同执行。其中，终端104执行本申请实施例的车型的识别方法也可以是由安装在其上的客户端来执行。

图2是根据本申请实施例的一种可选的车型的识别方法的流程图，如图2所示，该方法可以包括以下步骤：

步骤S202，获取到对目标图片中的车辆进行车型识别的请求，例如图1所示的点击“查询车型”触发的请求；

步骤S204，使用预设神经网络模型识别出目标图片中的车辆为目标车型，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；

步骤S206，响应于请求，返回包括目标车型的识别结果，如图1所示，识别结果可显示在用户终端上，如“识别结果：XX品牌XX车型”。

通过上述步骤S202至步骤S206，通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型，在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型来进行识别，由于训练集合是对多个车型的图片进行第一预处理得到的图片集合，而第一预处理可增强预设神经网络模型的鲁棒性，也即可以消除环境、拍摄角度对车型识别的影响，可以解决了相关技术中进行车型识别的准确率较低的技术问题，进而达到提升车型识别的准确率的技术效果。

上述的目标图片为用户任意拍摄的汽车的图片；多个车型的图片是指预先采集好的知道车型的图片，为了提高识别的效率和准确率，可以针对每个车型从不同角度拍摄到多张图片，然后通过预处理即可得到上述的训练集。

可选地，上述的鲁棒性包括性能鲁棒性和稳定鲁棒性。

上述的神经网络模型是指深度卷积神经网络模型，该神经网络模型包括多个隐层(即卷积层)和特征提取层。

需要说明的是，对于普通的神经网络DNN，其下层神经元和所有上层神经元都能够形成连接，带来的潜在问题是参数数量的膨胀，在训练时不仅容易过拟合，而且极容易陷入局部最优，在图像中有固有的局部模式(比如轮廓、边界等)可以利用，可将图像处理中的概念和神经网络技术相结合，而利用本申请的深度卷积神经网络模型恰恰可以实现上述目的。

在深度卷积神经网络模型中，并不是所有上下层神经元都能直接相连，而是通过“卷积核”(即卷积层)作为中介，同一个卷积核在所有图像内是共享的，图像通过卷积操作后仍然保留原先的位置关系，正是由于深度卷积神经网络模型限制了参数的个数并挖掘了局部结构的这个特点，从而可以减少参数量，并提高网络的鲁棒性。

例如，需要识别一幅彩色图像，这幅图像具有四个通道ARGB(即透明度和红绿蓝，对应了四幅相同大小的图像)，假设卷积核大小为2*2，共使用10个卷积核(w1到w10，每个卷积核用于学习不同的结构特征)，用w1在ARGB图像上进行卷积操作，可以得到隐含层的第一幅图像；这幅隐含层图像左上角第一个像素是四幅输入图像左上角2*2区域内像素的加权求和，以此类推，得到对应该卷积核的其它图像。同理，算上其他卷积核，隐含层对应10幅“图像”。每幅图像对是对原始图像中不同特征的响应，按照这样的结构继续传递下去，另外，在深度卷积神经网络模型中还有max-pooling(特征分类)等操作进一步提高鲁棒性。

深度卷积神经网络DCNN(Deep Convolutional Neural Network)包括卷积层、池化层(即特征分类层)，多个卷积-池化单元构成特征表达，可应用于二维图像识别。可将DCNN看作是带有二维离散卷积操作的DNN。

DCNN的结构包括多个特征提取层(即卷积层)和特征映射层(即特征分类层)，在卷积层中，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征，一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等，特征映射结构可采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数，可在卷积神经网络中的每一个卷积层后跟着设置一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。

在进行车型识别时，可使用基于模版匹配的方法，该方法的缺点是模版很难建立，汽车在图像中发生旋转或者尺度反生变化时则无法识别车型，即使发生较小范围的遮挡也无法正常识别车型；还可以使用基于统计模式识别的方法，该方法要求各个类别总体的概率分布是已知的，决策分类的类别数是一致的，该方法对光照、遮挡等因素不具有鲁棒性，即容易受到光照、遮挡等因素的影响。

相对于上述的车型识别方法，使用本申请的深度卷积网络模型，对图片识别具有更好的效果，利用深度卷积神经网络可解决传统车型识别算法遇到的问题，解决上述车型识别方案中对图像的要求高(如对光照、角度、清晰度、是否有遮挡)、识别率较低、鲁棒性不好等技术难题，避免光照、遮挡等因素对车型识别造成的影响，提高识别的鲁棒性。

在上述实施例中，在获取到对目标图片中的车辆进行车型识别的请求之前，可按照如下方式进行训练得到预设神经网络模型：对多个车型的图片进行第一预处理，得到训练集合；使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练，得到预设神经网络模型。

可选地，对多个车型的图片进行第一预处理包括：对多个车型的图片中的每个图片进行如下处理，其中，每个图片被视为当前图片：对当前图片进行第一处理操作和第二处理操作，得到第一图片，其中，第一图片被视为训练集合中的图片，第一处理操作包括随机旋转和随机裁剪的操作，随机旋转和随机裁剪的操作用于消除图像采集角度对车型识别的影响，第二处理操作用于消除图像采集环境对车型识别的影响。

可选地，对当前图片进行第一处理操作和第二处理操作包括：对当前图片执行如下处理中的至少之一：尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整(即第一处理操作)，得到第二图片；对第二图片进行直方图均衡化处理，得到第三图片；对第三图片进行白化处理(均衡化处理和白化处理即第二处理操作)，得到第一图片。

可选地，对当前图片进行第一处理操作和第二处理操作时，可以执行“尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整”这些操作中的一个，如仅执行随机旋转以提高模型从不同角度识别出车型的能力、仅执行亮度调整以提高模型在不同亮度下识别车型的能力、仅执行尺寸调整以提高模型在不同外观大小的情况下识别出车型的能力等；也可执行这些操作中的多个，需要说明的是，在执行这些操作中的多个时，可以按照“尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整”这一顺序来执行，也可根据需求来选择执行顺序，所选择的操作可以为尺寸调整和随机旋转，或为随机裁剪、高斯平滑处理以及亮度调整，又或者为尺寸调整、随机旋转、亮度调整以及饱和度调整，甚至为尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整。

需要说明的是，可以根据模型需要提升的能力来选择上述操作中的一种或者多种，若同时选择这些操作中的多种，相当于经过一次训练(同一个训练集)就能提高模型的多种能力，显然可以提高训练效率。

可选地，使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练，得到预设神经网络模型包括：通过深度卷积神经网络模型的多个卷积层识别出训练集合中属于每个车型的所有图片的多个第一特征信息；通过深度卷积神经网络模型的特征分类层从每个车型的所有第一特征信息中提取出每个车型的特征集合之后，得到预设神经网络模型，其中，特征集合包括所有第一特征信息中用于指示车型的第二特征信息，特征集合保存在预设神经网络模型中。

在上述的随机旋转、随机裁剪中，可进行多次随机旋转，每次随机旋转得到一张图片，也即进行多次随机旋转可以得到多张图片；同理，在随机裁剪时，也可进行多次随机裁剪得到多张图片。通过使用多次随机旋转和随机裁剪之后的图片进行训练，由于包括了更为丰富的拍摄环境(拍摄角度、拍摄到的内容等)，因而可以提取到更为丰富的特征，进而可以学习到更多的特征，以学习到不同车型间的区别，也能更为准确的识别不同角度拍摄到的车辆的车型。

在步骤S202提供的技术方案中，获取到对目标图片中的车辆进行车型识别的请求包括：接收第一客户端向服务器发送的用于进行车型识别的请求，其中，第一客户端通过互联网与服务器连接。

在服务器上提供用于进行车型识别的函数接口(即预设接口)，这样，服务器就可以在预设接口上接收客户端发送的用于进行车型识别的请求。

需要说明的是，该函数接口为一个通用的接口，客户端或者网页可以调用该接口进行车型识别，例如，在即使通讯应用中，利用该函数接口将拍摄到的图片发送给服务器，由服务器识别出结果之后通过预设接口返回包括目标车型的识别结果至调用预设接口的对象。

在步骤S204提供的技术方案中，在使用预设神经网络模型识别出目标图片中的车辆为目标车型之前，对目标图片进行第二预处理。在使用预设神经网络模型识别出目标图片中的车辆为目标车型时，将经过第二预处理的目标图片的图片数据作为预设神经网络模型的输入，以识别出目标图片中的车辆为目标车型。

可选地，对目标图片进行第二预处理包括：对目标图片执行如下处理中的至少之一：按照汽车框架进行裁剪、尺寸调整、高斯平滑处理、亮度调整以及饱和度调整，得到第四图片，例如，仅执行尺寸调整，或仅进行亮度调整等，又或者执行尺寸调整和高斯平滑处理，或者执行亮度调整和饱和度调整；将第四图片进行直方图均衡化处理，得到第五图片；将第五图片进行白化处理，得到待输入预设神经网络模型的图片数据。

可选地，将经过第二预处理的目标图片的图片数据作为预设神经网络模型的输入，以识别出目标图片中的车辆为目标车型包括：通过预设神经网络模型的多个卷积层识别出目标图片的第三特征信息；获取目标图片的第三特征信息与每个车型的特征集合中的特征信息的匹配度，例如，确定目标图片的第三特征信息中与每个车型的特征集合中的特征信息相同的数量，将该数量与每个车型的特征集合中的所有特征信息的数量的比值作为匹配度；确定与多个车型的多个匹配度中的目标匹配度对应的车型为目标车型，目标匹配度包括多个匹配度中数值从大到小的排列中的前N个匹配度，N为正整数。

上述的N为小于车型数量的正整数，上述的目标匹配度为所有匹配度从大到小排列时靠前的N个。

在步骤S206提供的技术方案中，响应于请求，返回包括目标车型的识别结果包括：在得到了上述的目标匹配度(即N个较大的匹配度)之后，将N个匹配度通过函数接口返回给客户端，有客户端展示给用户。

本申请提供的方法中，针对车型识别问题，提出了一种基于深度卷积神经网络的车型识别框架，结合传统的数字图像处理技术做图像预处理，解决了传统方法识别车型时对输入图片要求高，同时识别率较低的问题。本方案在识别车型时具有很好的鲁棒性，对光照、噪声、旋转、部分遮挡等因素不敏感，并且识别率有大幅度提升，与现有方法的区别是不需要手工设计、提取车型图像特征，采用CNN自动设计、提取、优化特征。不仅减少工作量，并且提升了识别率。

作为一种可选的实施例，在用本申请提供的方法进行图片识别时，将训练图片(即当前图片)预处理之后作为深度卷积神经网络的输入，开始训练，得到网络参数并保存；线上运营时，重新加载网络参数；用户输入图片，做预处理，将该图片作为网络输入；得到各类的概率分布，将前N个最大的概率的类别作为输出返回。下面结合图3至图6详述本申请的实施例。

步骤S302，获取训练数据集合。

收集训练图片到数据集合，数据集合的收集非常重要，数据集合质量将直接决定模型参数的优劣，实际操作中可以采取人工采集以及与汽车专业网站合作的方式获取各个车型的训练图片。

步骤S304，对数据集合中的数据进行预处理。

在将训练图片输入深度卷积神经网络，先要对训练图片进行预处理，预处理流程是非常重要的，不同的预处理流程对预测结果有显著的影响，同时，本方案设计的预处理流程也是本方案具有很好的鲁棒性以及其他优点的重要来源。

步骤S306，将预处理后的数据输入深度卷积神经网络。

深度卷积神经网络在选择时需要注意选择能够适应类别数量多、能辨识细节特征的网络，因为车型的类别数据较大，同时汽车、特别是同一品牌不同系列的车型在外观上面的差异非常小。

预先选择一个深度卷积神经网络，如***的InceptionV3。Inception-V3网络一个重要的特点是将大卷积核分解为小卷积核，如将7*7的卷积分解成两个一维卷积(1*7和7*1)，从而可以加快计算速度，同时增加了网络的深度以及网络的非线性，从而增强了网络的特征提取以及表示能力。

在深度卷积神经网络中，其卷积层可以看作是一个特征提取器，为了实现特征提取的尺度不变性、旋转不变性、光照等，在图像特征提取器在应用时可采用如图像金字塔、白化等技术。对于深度卷积神经网络，可以通过数据的预处理以及合适的网络结构来解决这些问题，如对于尺度不变性，Inception-V3通过不同大小的卷积核栈来适应不同尺度的物体图像。

在本方案中，可利用深度卷积神经网络作为车型图像特征提取器，使用softmax作为分类器。在训练时，使用较为丰富的预处理技术，解决诸如旋转不变性、光照等问题。

步骤S308，得到深度卷积神经网络。

进行训练流程的预处理方法如图4所示：

步骤S402，调整待输入图片的尺寸。

为了适应深度卷积网络的输入层，比如其输入层要求为299*299，那么就可以将图片的尺寸调整为299*299。

步骤S404，为了增强网络对于物体被旋转之后的图像的适应性，需要对图片进行随机旋转。

步骤S406，为增强网络对于物体被部分遮挡时的适应性，可对图片进行随机裁剪。

步骤S408，为了去除高斯噪声，增强网络对于输入图像含有较多噪声的适应性，可对图片进行高斯平滑处理。

步骤S410，为了增强对于较暗图像的适应性，可对图片的亮度进行随机处理。

步骤S412，为了增强网络对于不同饱和度图像的适应性，可调整图片的饱和度。

步骤S414，在调整饱和度之后，进行直方图均衡化处理，使用直方图均衡化，增强图像的对比度，同时使得输入像素值更为均匀。

直方图(Histogram)又称质量分布图，如果一副图像的像素占有很多的灰度级而且分布均匀，那么这样的图像往往有高对比度和多变的灰度色调。直方图均衡化就是一种能仅靠输入图像直方图信息自动达到这种效果的变换函数。它的基本思想是对图像中像素个数多的灰度级进行展宽，而对图像中像素个数少的灰度进行压缩，从而扩展像原取值的动态范围，提高了对比度和灰度色调的变化，使图像更加清晰。

步骤S416，进行白化处理，即将图像数据去中心化，同时可归一化输入，作为网络的输入。

可选地，白化处理与主成分分析PCA(Principal Component Analysis)算法相似，例如，假设训练数据是第三图像，由于第三图像中相邻像素之间具有较强的相关性，所以用于训练时的输入是冗余的，白化的目的就是降低输入的冗余性，即去中心化；通过白化过程使得深度卷积神经网络的输入具有如下性质：特征(所输入的图像)之间相关性较低、特征具有相同的方差(如图像处理中设置的单位方差)。

可选地，上述归一化处理为对图像数据的归一化处理，图像数据包括但不局限于长度、宽度、灰度值等，如对于像素点的灰度值而言，其取值区间是0到255，对于任意一个灰度值为N的像素点，其灰度值可以归一化为N/255。

进行预测的流程如图5所示：

步骤S502，获取深度卷积神经网络的参数。

步骤S504，获取汽车图片。

步骤S506，对获取到的汽车图片进行预处理。

步骤S508，将预处理之后的汽车图片输入深度卷积神经网络。

步骤S510，得到深度卷积神经网络输出的结果。

需要说明的是，模型参数采用高斯分布，如对于卷积核，使用二维高斯分布去初始化相应位置的卷积核参数；预处理过程各种技术的参数，比如随机提升亮度，这里的随机可使用高斯分布，对应的参数即为高斯分布的参数。

进行预测的预处理如图6所示：

步骤S602，调整待输入图片的尺寸。

步骤S604，检测图片中汽车的粗略框架。

步骤S606，对图片进行随机裁剪。

步骤S608，对图片进行高斯平滑处理。

步骤S610，对图片的亮度进行随机处理。

步骤S612，调整图片的饱和度。

步骤S614，对图片进行直方图均衡化处理。

步骤S616，对图片进行白化处理。

需要说明的是，预测流程中的预处理不需要旋转以及随机裁剪，而是用一个简单的汽车检测器，将汽车的大概位置取出来。这么做的原因是如果用户拍照时，汽车并不处于前景中，网络很可能造成误分类。

在本申请提供的方法中，针对车型识别问题，提出了一种基于深度卷积神经网络的车型识别框架，结合传统的数字图像处理技术做图像预处理，解决了传统方法识别车型时对输入图片要求高，同时识别率较低的问题。本方案在识别车型时具有很好的鲁棒性，对光照、噪声、旋转、部分遮挡等因素不敏感，并且识别率有大幅度提升，与现有方法的区别是不需要手工设计、提取车型图像特征，采用CNN自动设计、提取、优化特征。不仅减少工作量，并且提升了识别率。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

根据本申请实施例，还提供了一种用于实施上述车型的识别方法的车型的识别装置。图7是根据本申请实施例的一种可选的车型的识别装置的示意图，如图7所示，该装置可以包括：获取单元72、识别单元74以及响应单元76。

获取单元72，用于获取到对目标图片中的车辆进行车型识别的请求；

识别单元74，用于使用预设神经网络模型识别出目标图片中的车辆为目标车型，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；

响应单元76，用于响应于请求，返回包括目标车型的识别结果。

需要说明的是，该实施例中的获取单元72可以用于执行本申请实施例中的步骤S202，该实施例中的识别单元74可以用于执行本申请实施例中的步骤S204，该实施例中的响应单元76可以用于执行本申请实施例中的步骤S206。

此处需要说明的是，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在如图1所示的硬件环境中，可以通过软件实现，也可以通过硬件实现。

通过上述模块，通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型，在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型，由于训练集合是对多个车型的图片进行第一预处理得到的图片集合，而第一预处理可增强预设神经网络模型的鲁棒性，也即可以消除环境、拍摄角度对车型识别的影响，可以解决了相关技术中进行车型识别的准确率较低的技术问题，进而达到提升车型识别的准确率的技术效果。

可选地，上述的鲁棒性包括性能鲁棒性和稳定鲁棒性。

需要说明的是，对于普通的神经网络DNN，其下层神经元和所有上层神经元都能够形成连接，带来的潜在问题是参数数量的膨胀，在训练时不仅容易过拟合，而且极容易陷入局部最优，在图像中有固有的局部模式(比如轮廓、边界等)可以利用，显然应该将图像处理中的概念和神经网络技术相结合，而利用本申请的深度卷积神经网络模型恰恰可以实现上述目的。

相对于相关的车型识别方法，使用本申请的深度卷积网络模型，对图片识别具有更好的效果，利用深度卷积神经网络可解决传统车型识别算法遇到的问题，解决上述车型识别方案中对图像的要求高(如对光照、角度、清晰度、是否有遮挡)、识别率较低、鲁棒性不好等技术难题，避免光照、遮挡等因素对车型识别造成的影响，提高识别的鲁棒性。

可选地，如图8所示，本申请的装置还包括：处理单元82，用于在获取到对目标图片中的车辆进行车型识别的请求之前，对多个车型的图片进行第一预处理，得到训练集合；训练单元84，用于使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练，得到预设神经网络模型。

上述的处理单元还用于对多个车型的图片中的每个图片进行如下处理，其中，每个图片被视为当前图片：对当前图片进行第一处理操作和第二处理操作，得到第一图片，其中，第一图片被视为训练集合中的图片，第一处理操作包括随机旋转和随机裁剪的操作，随机旋转和随机裁剪的操作用于消除图像采集角度对车型识别的影响，第二处理操作用于消除图像采集环境对车型识别的影响。

可选地，处理单元包括：第一处理模块，用于对当前图片执行如下处理中的至少之一：尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整，得到第二图片；第二处理模块，用于对第二图片进行直方图均衡化处理，得到第三图片；第三处理模块，用于对第三图片进行白化处理，得到第一图片。

可选地，训练单元包括：识别模块，用于通过深度卷积神经网络模型的多个卷积层识别出训练集合中属于每个车型的所有图片的多个第一特征信息；训练模块，用于通过深度卷积神经网络模型的特征分类层从每个车型的所有第一特征信息中提取出每个车型的特征集合之后，得到预设神经网络模型，其中，特征集合包括所有第一特征信息中用于指示车型的第二特征信息，特征集合保存在预设神经网络模型中。

可选地，识别单元还用于在使用预设神经网络模型识别出目标图片中的车辆为目标车型之前，对目标图片进行第二预处理；在使用预设神经网络模型识别出目标图片中的车辆为目标车型时，将经过第二预处理的目标图片的图片数据作为预设神经网络模型的输入，以识别出目标图片中的车辆为目标车型。

可选地，识别单元包括预处理模块，预处理模块用于对目标图片执行如下处理中的至少之一：按照汽车框架进行裁剪、尺寸调整、高斯平滑处理、亮度调整以及饱和度调整，得到第四图片；将第四图片进行直方图均衡化处理，得到第五图片；将第五图片进行白化处理，得到待输入预设神经网络模型的图片数据。

可选地，识别单元包括识别模块，识别模块用于通过预设神经网络模型的多个卷积层识别出目标图片的第三特征信息；获取目标图片的第三特征信息与每个车型的特征集合中的特征信息的匹配度；确定与多个车型的多个匹配度中的目标匹配度对应的车型为目标车型，其中，目标匹配度包括多个匹配度中数值从大到小的排列中的前N个匹配度，N为正整数。

上述的获取单元还用于接收第一客户端向服务器发送的用于进行车型识别的请求，其中，第一客户端通过互联网与服务器连接。

需要说明的是，该函数接口为一个通用的接口，任意的客户端或者网页均可以调用该接口进行车型识别，例如，在即使通讯应用中，利用该函数接口将拍摄到的图片发送给服务器，由服务器识别出结果之后通过预设接口返回包括目标车型的识别结果至调用预设接口的对象。

此处需要说明的是，上述模块与对应的步骤所实现的示例和应用场景相同，但不限于上述实施例所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在如图1所示的硬件环境中，可以通过软件实现，也可以通过硬件实现，其中，硬件环境包括网络环境。

根据本申请实施例的另一方面，还提供了一种存储介质(也称为存储器)，该存储介质包括存储的程序，其中，该程序被设置为运行时执行上述的任一种方法。

根据本申请实施例，还提供了一种用于实施上述车型的识别方法的服务器或终端(也称为电子装置)。

图9是根据本申请实施例的一种终端的结构框图，如图9所示，该终端可以包括：一个或多个(图9中仅示出一个)处理器901、存储器903、以及传输装置905(如上述实施例中的发送装置)，如图9所示，该终端还可以包括输入输出设备907。

其中，存储器903可用于存储软件程序以及模块，如本申请实施例中的车型的识别方法和装置对应的程序指令/模块，处理器901通过运行存储在存储器903内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的车型的识别方法。存储器903可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器903可进一步包括相对于处理器901远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置905用于经由一个网络接收或者发送数据，还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置905包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置905为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

其中，可选地，存储器903用于存储应用程序。

处理器901可以通过传输装置905调用存储器903存储的应用程序，以执行下述步骤：获取到对目标图片中的车辆进行车型识别的请求；使用预设神经网络模型识别出目标图片中的车辆为目标车型，其中，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；响应于请求，返回包括目标车型的识别结果。

处理器901还用于执行下述步骤：对多个车型的图片进行第一预处理，得到训练集合；使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练，得到预设神经网络模型。

采用本申请实施例，通过使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到预设神经网络模型，在获取到对目标图片中的车辆进行车型识别的请求时即可通过预设神经网络模型，由于训练集合是对多个车型的图片进行第一预处理得到的图片集合，而第一预处理可增强预设神经网络模型的鲁棒性，也即可以消除环境、拍摄角度对车型识别的影响，可以解决了相关技术中进行车型识别的准确率较低的技术问题，进而达到提升车型识别的准确率的技术效果。

可选地，本实施例中的具体示例可以参考上述实施例中所描述的示例，本实施例在此不再赘述。

本领域普通技术人员可以理解，图9所示的结构仅为示意，终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图9其并不对上述电子装置的结构造成限定。例如，终端还可包括比图9中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图9所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于执行车型的识别方法的程序代码。

可选地，在本实施例中，上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：

S1，获取到对目标图片中的车辆进行车型识别的请求；

S2，使用预设神经网络模型识别出目标图片中的车辆为目标车型，其中，预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，训练集合是对多个车型的图片进行第一预处理得到的图片集合，第一预处理用于增强预设神经网络模型的鲁棒性，多个车型包括目标车型；

S3，响应于请求，返回包括目标车型的识别结果。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

一种车型的识别方法，包括：

获取到对目标图片中的车辆进行车型识别的请求；

使用预设神经网络模型识别出所述目标图片中的车辆为目标车型，其中，所述预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，所述训练集合是对多个车型的图片进行第一预处理得到的图片集合，所述第一预处理用于增强所述预设神经网络模型的鲁棒性，多个所述车型包括所述目标车型；

响应于所述请求，返回包括所述目标车型的识别结果。
根据权利要求1所述的方法，其中，在获取到对目标图片中的车辆进行车型识别的请求之前，所述方法还包括：

对多个所述车型的图片进行所述第一预处理，得到所述训练集合；

使用所述训练集合对用于进行车型识别的所述深度卷积神经网络模型进行训练，得到所述预设神经网络模型。
根据权利要求2所述的方法，其中，对多个所述车型的图片进行所述第一预处理包括：

对多个所述车型的图片中的每个图片进行如下处理，其中，所述每个图片被视为当前图片：

对所述当前图片进行第一处理操作和第二处理操作，得到第一图片，其中，所述第一图片被视为所述训练集合中的图片，所述第一处理操作包括随机旋转和随机裁剪的操作，所述随机旋转和所述随机裁剪的操作用于消除图像采集角度对车型识别的影响，所述第二处理操作用于消除图像采集环境对车型识别的影响。
根据权利要求3所述的方法，其中，对所述当前图片进行第一处理操作和第二处理操作包括：

对所述当前图片执行如下处理中的至少之一：尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整，得到第二图片；

对所述第二图片进行直方图均衡化处理，得到第三图片；

对所述第三图片进行白化处理，得到所述第一图片。
根据权利要求2所述的方法，其中，使用所述训练集合对用于进行车型识别的所述深度卷积神经网络模型进行训练，得到所述预设神经网络模型包括：

通过所述深度卷积神经网络模型的多个卷积层识别出所述训练集合中属于每个所述车型的所有图片的多个第一特征信息；

通过所述深度卷积神经网络模型的特征分类层从每个所述车型的所有所述第一特征信息中提取出每个所述车型的特征集合之后，得到所述预设神经网络模型，其中，所述特征集合包括所有所述第一特征信息中用于指示所述车型的第二特征信息，所述特征集合保存在所述预设神经网络模型中。
根据权利要求1所述的方法，其中，

在使用预设神经网络模型识别出所述目标图片中的车辆为目标车型之前，所述方法还包括：对所述目标图片进行第二预处理；

使用预设神经网络模型识别出所述目标图片中的车辆为目标车型包括：将经过所述第二预处理的所述目标图片的图片数据作为所述预设神经网络模型的输入，以识别出所述目标图片中的车辆为所述目标车型。
根据权利要求6所述的方法，其中，对所述目标图片进行第二预处理包括：

对所述目标图片执行如下处理中的至少之一：按照汽车框架进行裁剪、尺寸调整、高斯平滑处理、亮度调整以及饱和度调整，得到第四图片；

将所述第四图片进行直方图均衡化处理，得到第五图片；

将所述第五图片进行白化处理，得到待输入所述预设神经网络模型的图片数据。
根据权利要求6所述的方法，其中，将经过所述第二预处理的所述目标图片的图片数据作为所述预设神经网络模型的输入，以识别出所述目标图片中的车辆为所述目标车型包括：

通过所述预设神经网络模型的多个卷积层识别出所述目标图片的第三特征信息；

获取所述目标图片的第三特征信息与每个所述车型的特征集合中的特征信息的匹配度；

确定与多个所述车型的多个所述匹配度中的目标匹配度对应的所述车型为所述目标车型，其中，所述目标匹配度包括多个所述匹配度中数值从大到小的排列中的前N个所述匹配度，N为正整数。
根据权利要求1至8中任意一项所述的方法，其中，获取到对目标图片中的车辆进行车型识别的请求包括：

接收第一客户端向服务器发送的用于进行车型识别的所述请求，其中，所述第一客户端通过互联网与所述服务器连接。
根据权利要求1至8中任意一项所述的方法，其中，

获取到对目标图片中的车辆进行车型识别的请求包括：在预设接口上接收向服务器发送的用于进行车型识别的所述请求，其中，所述预设接口为所述服务器提供的用于进行车型识别的函数接口；

响应于所述请求，返回包括所述目标车型的识别结果包括：响应于所述请求，通过所述预设接口返回包括所述目标车型的识别结果至调用所述预设接口的对象。
一种车型的识别装置，包括：

获取单元，被设置为获取到对目标图片中的车辆进行车型识别的请求；

识别单元，被设置为使用预设神经网络模型识别出所述目标图片中的车辆为目标车型，其中，所述预设神经网络模型是使用训练集合对用于进行车型识别的深度卷积神经网络模型进行训练得到的，所述训练集合是对多个车型的图片进行第一预处理得到的图片集合，所述第一预处理用于增强所述预设神经网络模型的鲁棒性，多个所述车型包括所述目标车型；

响应单元，被设置为响应于所述请求，返回包括所述目标车型的识别结果。
根据权利要求11所述的装置，其中，所述装置还包括：

处理单元，被设置为在获取到对目标图片中的车辆进行车型识别的请求之前，对多个所述车型的图片进行所述第一预处理，得到所述训练集合；

训练单元，被设置为使用所述训练集合对用于进行车型识别的所述深度卷积神经网络模型进行训练，得到所述预设神经网络模型。
根据权利要求12所述的装置，其中，所述处理单元还被设置为对多个所述车型的图片中的每个图片进行如下处理，其中，所述每个图片被视为当前图片：对所述当前图片进行第一处理操作和第二处理操作，得到第一图片，其中，所述第一图片被视为所述训练集合中的图片，所述第一处理操作包括随机旋转和随机裁剪的操作，所述随机旋转和所述随机裁剪的操作用于消除图像采集角度对车型识别的影响，所述第二处理操作用于消除图像采集环境对车型识别的影响。
根据权利要求13所述的装置，其中，所述处理单元包括：

第一处理模块，被设置为对所述当前图片执行如下处理中的至少之一：尺寸调整、随机旋转、随机裁剪、高斯平滑处理、亮度调整以及饱和度调整，得到第二图片；

第二处理模块，被设置为对所述第二图片进行直方图均衡化处理，得到第三图片；

第三处理模块，被设置为对所述第三图片进行白化处理，得到所述第一图片。
根据权利要求12所述的装置，其中，所述训练单元包括：

识别模块，被设置为通过所述深度卷积神经网络模型的多个卷积层识别出所述训练集合中属于每个所述车型的所有图片的多个第一特征信息；

训练模块，被设置为通过所述深度卷积神经网络模型的特征分类层从每个所述车型的所有所述第一特征信息中提取出每个所述车型的特征集合之后，得到所述预设神经网络模型，其中，所述特征集合包括所有所述第一特征信息中用于指示所述车型的第二特征信息，所述特征集合保存在所述预设神经网络模型中。
一种存储介质，其中，所述存储介质中存储有计算机程序，所述计算机程序被设置为运行时执行权利要求1至10中任意一项所述的方法。
一种电子装置，包括存储器和处理器，其中，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序，以执行权利要求1至10中任意一项所述的方法。