WO2021008018A1

WO2021008018A1 - 基于人工智能的车辆识别方法、装置、程序及存储介质

Info

Publication number: WO2021008018A1
Application number: PCT/CN2019/116552
Authority: WO
Inventors: 戴广宇; 王晶晶
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-07-18
Filing date: 2019-11-08
Publication date: 2021-01-21
Also published as: CN110516703A

Abstract

一种基于人工智能的车辆识别方法、装置、程序及计算机可读存储介质，涉及人工智能技术领域。所述方法包括：获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作（S1）；构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类（S2）；利用摄像头获取待识别的车辆图像，使用上述已训练好的车辆识别模型中识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述车辆类别进行编码输出（S3）。自动识别车辆类别，从而实现按照不同车型收取不同的费用。

Description

基于人工智能的车辆识别方法、装置、程序及存储介质

本申请基于巴黎公约申明享有2019年7月18日递交的申请号为CN201910651863.8、名称为“基于人工智能的车辆识别方法、装置及存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种基于人工智能的车辆识别方法、装置、程序及计算机可读存储介质。

背景技术

随着社会经济的发展，机动车保有量迅速增长，居民乘小汽车出行的次数增多，许多城市“停车难，难停车”的问题日渐显著，供需紧张、乱收费、违章停车、进出停车场不易、寻找停车场困难等现象普遍存在。为了城市交通的更好发展以及更好的利用有限的停车位资源，很多城市逐渐开始实行按照不同车型收取不同的停车费用的收费方法。对于绝大部分停车场来说，每日的车辆出入量巨大，单凭人工方式判断车辆类型极易发生混乱。

发明内容

本申请提供一种基于人工智能的车辆识别方法、装置、程序及计算机可读存储介质，其主要目的在于提供一种车辆种类的自动识别方案。

为实现上述目的，本申请提供的一种基于人工智能的车辆识别方法，包括：

获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作，其中，所述车辆图像包括使用网络爬虫程序从互联网中获取的车辆图像以及使用摄像机在预设区域捕获的出入车辆的车辆图像；

构建深度残差网络的车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型识别图像中车辆的种类，并在所述车辆识别模型训练中，使用随机失活方法增强所述车辆识别模型的泛化能力，使用批标准化算法在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布；

获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述待识别的车辆类别进行编码输出。

此外，为实现上述目的，本申请还提供一种基于人工智能的车辆识别装置，该装置包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的基于人工智能的车辆识别程序，所述基于人工智能的车辆识别程序被所述处理器执行时实现如下步骤：

构建深度残差网络的车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型识别图像中车辆的种类，并在所述车辆识别模型训练中，使用随机失活方法增强所述车辆识别模型的泛化能力，使用批标准化算法在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布。

此外，为实现上述目的，本申请还提供一种基于人工智能的车辆识别程序，所述基于人工智能的车辆识别程序包括：

数据集建立模块：用于获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作；

模型训练模块：用于构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类；及

车辆类别识别模块：用于获取待识别的车辆图像，使用上述已训练好的车辆识别模型中识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述车辆类别进行编码输出。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于人工智能的车辆识别程序，所述基于人工智能的车辆识别程序可被一个或者多个处理器执行，以实现如上所述的基于人工智能的车辆识别方法的步骤。

本申请提出的基于人工智能的车辆识别方法、装置、程序及计算机可读存储介质获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作；构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类；利用摄像头获取待识别的车辆图像，使用上述已训练好的车辆识别模型中识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述车辆类别进行编码输出。因此，本申请可以自动识别车辆类别，从而可以实现按照不同车型收取不同的费用。

附图说明

图1为本申请一实施例提供的基于人工智能的车辆识别方法的流程示意图；

图2为本申请一实施例提供的基于人工智能的车辆识别方法中中值滤波算法的示意图；

图3为本申请一实施例提供的基于人工智能的车辆识别装置的内部结构示意图；

图4为本申请一实施例提供的基于人工智能的车辆识别程序的模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，所述“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。

进一步地，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本申请要求的保护范围之内。

本申请提供一种基于人工智能的车辆识别方法。参照图1所示，为本申请一实施例提供的基于人工智能的车辆识别方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，基于人工智能的车辆识别方法包括：

S1、获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作。

本申请较佳实施例使用网络爬虫程序从互联网中获取车辆图像。

网络爬虫，又被称为网页蜘蛛，网络机器人，是一种按照一定的规则，自动地抓取互联网信息的程序或者脚本。

由于训练深度残差网络需要大量有标记的样本，而且对各类型车辆进行图像采集会耗费大量人力物力，所以本申请较佳实施例提出一种使用爬虫程序从互联网上获取各类型车辆图像的方法，并通过人工标记的方式对每幅车辆图像标记类别标签，生成基础车辆图像数据集。

进一步地，本申请较佳实施例还可以使用摄像机获取预设区域，如停车场、高速路口等，出入车辆的车辆图像。

在机器学习领域，只有当训练集与测试集的样本服从同一分布时，识别模型才会达到较好的分类效果，因此，在基础车辆图像数据集的基础上，本申请对于摄像头，例如停车场摄像头获取的实际的车辆图片，同样使用人工标注的方式对图像进行车辆类别的标注。

本申请将基础车辆图像数据集与摄像头获取的实际应用中的车辆图像数据集合并成一个车辆图像数据集。这种方法的优势在于，第一，保证深度残差网络有足够的训练集进行训练可以达到收敛。第二，由于在基础车辆图像数据集中加入了停车场、高速出入口实际应用场景中的车辆图像，使得训练集与测试集的分布更加相似，这将对深度残差网络模型的分类效果产生正面影响。

由于互联网中的图片质量良莠不齐，因此需要对车辆图像数据集的车辆图像进行预处理操作。

本申请较佳实施例中，所述预处理操作包括：

(1)使用中值滤波算法对车辆图像进行降噪处理。

中值滤波是一种非线性数字滤波器技术，用于去除图像或者其他信号中的噪声。中值滤波的主要思想是检查输入信号中的采样并判断它是否代表了信号，使用奇数个采样组成的观察窗实现这项功能。观察窗口中的数值进行排序，位于观察窗中间的的中值作为输出，然后，丢弃最早的值，取得新的采样，重复上面的计算过程。中值滤波对于图像中的斑点噪声和椒盐噪声来说尤其有用。

本申请较佳实施例中，所述中值滤波的具体操作过程如图2所示。其中，所述滤波器为N*N大小，N为正整数，图2中采用的是3*3大小的滤波器。如图2所示，中值滤波法将以预设像素点，如像素值为1的像素点，为滤波器原始中心值，对3*3大小的窗内的所有像素值(即图2中阴影区域)进行排序，用所述N*N大小的滤波器窗内排序后的中间值代替所述滤波器原始中心值。在发明实施例中，值为1的像素值被像素值23代替，中值滤波后的结果如图2的右侧部分所示。

(2)使用翻转旋转方法对车辆图像进行数据增强处理。

实际应用中待识别车辆图像获取的方式可能与车辆图像数据集中不同，比如说拍摄的方向/位置/角度等发生了变化，这会引起训练集与测试集中的样本分布发生变化。为了提高深度残差网络模型的识别准确性，本案对数据集中的样本进行数据增强处理，所述数据增强的内容包括：将所述车辆图像进行水平翻转，垂直翻转，旋转变换与仿射变换处理。

本申请所述数据增强方法可以增强深度残差网络的鲁棒性。

S2、构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类。

本申请较佳实施例使用深度残差网络(ResNet)作为车辆识别模型，进行车辆种类的分类识别。

所述ResNet模型的总体思想是根据输入将层表示为学习残差函数。实验表明，深度残差网络更容易优化，并且能够通过增加相当的深度来提高准确率。ResNet的核心是解决了增加深度带来的副作用，也就是深度神经网络的退化问题。这样能够通过单纯地增加网络的深度来提高网络性能。根据多层的神经网络理论上可以拟合任意函数，那么在ResNet中可以利用一些层来拟合函数。

可选地，本申请较佳实施例在利用所述车辆图像数据集训练所述车辆识别模型时还包括：使用随机失活(dropout)技术增强识别模型泛化能力，及/或使用Batch Normalization加快模型训练速度以及缩小训练集与数据集之间的分布差异。

本申请使用dropout技术来增加深度残差网络的泛化性能。dropout是指在深度残差网络的训练过程中，对神经网络单元按照一定的概率将其暂时从网络中丢弃。对于随机梯度下降来说，由于是随机丢弃，故而每一个mini-batch实质上都在训练一个不同的网络。dropout技术可以有效地防止深度神经网络发生过拟合，提高识别模型的泛化性能。在每一轮batch的迭代过程中dropout都会强迫一个神经单元和随机挑选出来的其他神经单元共同工作。这消除了神经元节点之间的联合适应性，使得模型的泛化性能提升。

进一步地，本申请在深度残差网络中引入了批标准化(Batch Normalization)技术。对于车辆识别任务，识别模型基于一条非常重要的假设，那就是训练集与测试集中的样本是独立同分布的。但在车辆识别的实际应用中，保证训练集与测试集严格的服从同一分布是比较困难的。除此之外，由于训练深度残差网络需要耗费的时间较多。本实施例使用Batch Normalization技术来解决这些问题。Batch Normalization就是在深度残差网络训练过程中使得每一层神经网络的输入保持相同分布的。因为深度残差网络在做非线性变换前的激活输入值随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近，所以这导致反向传播时底层神经网络的梯度消失，这是训练深度残差网络收敛越来越慢的本质原因，而Batch Normalization就是通过一定的规范化手段，把每层神经网络任意神经元的输入值的分布强行约束到均值为0方差为1的标准正态分布，实质上是将越来越偏的分布约束回比较标准的分布。这使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化。

进一步地，本申请较佳实施例使用softmax回归函数作为深度残差网络的输出层输出网络模型识别结果。

本申请较佳实施例使用softmax层作为深度残差网络的输出层输出车辆识别结果。Softmax在机器学习和深度学习中有着非常广泛的应用。尤其是在处理多分类问题方面，分类器最后的输出单元需要softmax函数进行数值处理。

关于softmax函数的定义如下所示：

其中，V _i是分类器前级输出单元的输出。i表示类别索引，总的类别个数为C，e为无限不循环小数。S _i表示当前元素的指数与所有元素指数和的比值。softmax将多分类的输出数值转化为相对概率，更容易理解与比较。softmax的输出表征了不同类别之间的相对概率。在车辆识别任务当中，假设第一维对应的概率值最大，则代表待识别车辆属于第一类车辆类型的可能性更大。softmax将连续数值转化为相对概率使得结果选取更加直观。

S3、利用摄像头获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别图像中车辆的种类，并使用独热编码对车辆类别进行编码输出。

所述独热编码又称一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都有其独立的寄存器位，并且在任意时候只有一位有效。独热编码是类目变量作为二进制向量的表示。该方法要求将分类标签映射到整数值。然后，每个整数值被表示为二进制向量，除了整数的索引位置为1外，其余的位置都为0。对于车辆识别任务来说。假设我们有‘AA品牌 A系’和‘BB品牌B系’这两种车辆标签，我们可以将‘AA品牌A系’的整数值分配为0，‘BB品牌B系’的整数值分配为1。当前的分配方式叫做整数编码。那么根据整数编码我们可以得到车辆的类别标签。编码为0的‘AA品牌A系’将用二进制向量[1,0]表示，其中第0个索引被标记为1。编码为1的‘BB品牌B系’标签将用一个二进制向量[0,1]表示，其中第一个索引被标记为1。独热编码进行数据的分类更加准确，由于深度神经网络无法直接用于数据分类。数据的类别必须转换成数字，对于分类的输入和输出变量都是一样的。整数编码只适用于类别标签之间存在比较关系的情况中，比如说‘冷’，‘温暖’，‘热’。但是对于车辆识别任务来说，由于类别之间没有比较关系的存在，所以在这个任务中，只适用于使用独热编码。

进一步地，本申请还包括S4、根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。

本申请还提供一种基于人工智能的车辆识别装置。参照图3所示，为本申请一实施例提供的基于人工智能的车辆识别装置的内部结构示意图。

在本实施例中，基于人工智能的车辆识别装置1可以是PC(Personal Computer，个人电脑)，也可以是智能手机、平板电脑、便携计算机等终端设备。该基于人工智能的车辆识别装置1至少包括存储器11、处理器12，通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是基于人工智能的车辆识别装置1的内部存储单元，例如该基于人工智能的车辆识别装置1的硬盘。存储器11在另一些实施例中也可以是基于人工智能的车辆识别装置1的外部存储设备，例如基于人工智能的车辆识别装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括基于人工智能的车辆识别装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于基于人工智能的车辆识别装置1的应用软件及各类数据，例如基于人工智能的车辆识别程序01的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行基于人工智能的车辆识别程序01等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

可选地，该装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在基于人工智能的车辆识别装置1中处理的信息以及用于显示可视化的用户界面。

图3仅示出了具有组件11-14以及基于人工智能的车辆识别程序01的基于人工智能的车辆识别装置1，本领域技术人员可以理解的是，图1示出的结构并不构成对基于人工智能的车辆识别装置1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图3所示的装置1实施例中，存储器11中存储有基于人工智能的车辆识别程序01；处理器12执行存储器11中存储的基于人工智能的车辆识别程序01时实现如下步骤：

步骤一、获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作。

本申请较佳实施例中，所述预处理操作包括：

(2)使用中值滤波算法对车辆图像进行降噪处理。

(2)使用翻转旋转方法对车辆图像进行数据增强处理。

本申请所述数据增强方法可以增强深度残差网络的鲁棒性。

步骤二、构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类。

本申请使用dropout技术来增加深度残差网络的泛化性能。dropout是指在深度残差网络的训练过程中，对神经网络单元按照一定的概率将其暂时从网络中丢弃。对于随机梯度下降来说。由于是随机丢弃，故而每一个mini-batch实质上都在训练一个不同的网络。dropout技术可以有效地防止深度神经网络发生过拟合，提高识别模型的泛化性能。在每一轮batch的迭代过程中dropout都会强迫一个神经单元和随机挑选出来的其他神经单元共同工作。这消除了神经元节点之间的联合适应性，使得模型的泛化性能提升。

进一步地，本申请在深度残差网络中引入了批标准化(Batch Normalization) 技术。对于车辆识别任务，识别模型基于一条非常重要的假设，那就是训练集与测试集中的样本是独立同分布的。但在车辆识别的实际应用中，保证训练集与测试集严格的服从同一分布是比较困难的。除此之外，由于训练深度残差网络需要耗费的时间较多。本实施例使用Batch Normalization技术来解决这些问题。Batch Normalization就是在深度残差网络训练过程中使得每一层神经网络的输入保持相同分布的。因为深度残差网络在做非线性变换前的激活输入值随着网络深度加深或者在训练过程中，其分布逐渐发生偏移或者变动，之所以训练收敛慢，一般是整体分布逐渐往非线性函数的取值区间的上下限两端靠近，所以这导致反向传播时底层神经网络的梯度消失，这是训练深度残差网络收敛越来越慢的本质原因，而Batch Normalization就是通过一定的规范化手段，把每层神经网络任意神经元的输入值的分布强行约束到均值为0方差为1的标准正态分布，实质上是将越来越偏的分布约束回比较标准的分布。这使得激活输入值落在非线性函数对输入比较敏感的区域，这样输入的小变化就会导致损失函数较大的变化。

关于softmax函数的定义如下所示：

其中，V _i是分类器前级输出单元的输出。i表示类别索引，总的类别个数为C。S _i表示的是当前元素的指数与所有元素指数和的比值。softmax将多分类的输出数值转化为相对概率，更容易理解与比较。softmax的输出表征了不同类别之间的相对概率。在车辆识别任务当中，假设第一维对应的概率值最大，则代表待识别车辆属于第一类车辆类型的可能性更大。softmax将连续数值转化为相对概率使得结果选取更加直观。

步骤三、利用摄像头获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别图像中车辆的种类，并使用独热编码对车辆类别进行编码输出。

所述独热编码又称一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都有其独立的寄存器位，并且在任意时候只有一位有效。独热编码是类目变量作为二进制向量的表示。该方法要求将分类标签映射到整数值。然后，每个整数值被表示为二进制向量，除了整数的索引位置为1外，其余的位置都为0。对于车辆识别任务来说。假设我们有‘AA品牌A系’和‘BB品牌B系’这两种车辆标签，我们可以将‘AA品牌A系’的整数值分配为0，‘BB品牌B系’的整数值分配为1。当前的分配方式叫做整数编码。那么根据整数编码我们可以得到车辆的类别标签。编码为0的‘AA品牌A系’将用二进制向量[1,0]表示，其中第0个索引被标记为1。编码为1的‘BB品牌B系’标签将用一个二进制向量[0,1]表示，其中第一个索引被标记为1。独热编码进行数据的分类更加准确，由于深度神经网络无法直接用于数据分类。数据的类别必须转换成数字，对于分类的输入和输出变量都是一样的。整数编码只适用于类别标签之间存在比较关系的情况中，比如说‘冷’，‘温暖’，‘热’。但是对于车辆识别任务来说，由于类别之间没有比较关系的存在，所以在这个任务中，只适用于使用独热编码。

进一步地，本申请还包括步骤四、根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。

可选地，在其他实施例中，基于人工智能的车辆识别程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本申请，本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述基于人工智能的车辆识别程序在基于人工智能的车辆识别装置中的执行过程。

例如，参照图4所示，为本申请基于人工智能的车辆识别程序一实施例的程序模块示意图，该实施例中，基于人工智能的车辆识别程序可以被分割为数据集建立模块10、模型训练模块20、车辆类别识别模块30，示例性地：

数据集建立模块10用于：获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作。

可选地，所述对所述车辆图像数据集中的图像进行预处理操作包括：

使用中值滤波算法对车辆图像进行降噪处理；

使用翻转旋转方法对车辆图像进行数据增强处理。

可选地，所述降噪处理包括：

取N*N大小的滤波器，其中，N为正整数；

以预设像素点为滤波器原始中心值，对N*N大小的滤波器窗内的所有像素值进行排序；

用所述N*N大小的滤波器窗内排序后的中间值代替所述滤波器原始中心值。

模型训练模块20用于：构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类。

可选地，所述利用所述车辆图像数据集训练所述车辆识别模型，还包括：

使用随机失活技术增强所述车辆识别模型的泛化能力；

使用Batch Normalization技术在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布；及

使用回归函数作为所述车辆识别模型的输出层，输出所述车辆识别模型的识别结果。

车辆类别识别模块30用于：利用摄像头获取待识别的车辆图像，使用上述已训练好的车辆识别模型中识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述车辆类别进行编码输出。

进一步地，所述基于人工智能的车辆识别程序01还包括：费用计算模块40，示例性地：

费用计算模块40用于：根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。

上述数据集建立模块10、模型训练模块20、车辆类别识别模块30、费用计算模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有基于人工智能的车辆识别程序，所述基于人工智能的车辆识别程序可被一个或多个处理器执行，以实现如下操作：

构建深度残差网络的车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型识别图像中车辆的种类，并在所述车辆识别模型训练中，使用随机失活方法增强所述车辆识别模型的泛化能力，使用批标准化算法在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布；获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述待识别的车辆类别进行编码输出。

本申请计算机可读存储介质具体实施方式与上述基于人工智能的车辆识别装置和方法各实施例基本相同，在此不作累述。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种基于人工智能的车辆识别方法，其特征在于，所述方法包括：

获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作，其中，所述车辆图像包括使用网络爬虫程序从互联网中获取的车辆图像以及使用摄像机在预设区域捕获的出入车辆的车辆图像；

构建深度残差网络的车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型识别图像中车辆的种类，并在所述车辆识别模型训练中，使用随机失活方法增强所述车辆识别模型的泛化能力，使用批标准化算法在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布；及

获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述待识别的车辆类别进行编码输出。
如权利要求1所述的基于人工智能的车辆识别方法，其特征在于，所述对所述车辆图像数据集中的图像进行预处理操作包括：

使用中值滤波算法对车辆图像进行降噪处理；及

使用翻转旋转方法对车辆图像进行数据增强处理。
如权利要求2所述的基于人工智能的车辆识别方法，其特征在于，所述降噪处理包括：

取N*N大小的滤波器，其中，N为正整数；

以预设像素点为滤波器原始中心值，对N*N大小的滤波器窗内的所有像素值进行排序；及

用所述N*N大小的滤波器窗内排序后的中间值代替所述滤波器原始中心值。
如权利要求1所述的基于人工智能的车辆识别方法，其特征在于，所述车辆识别模型的输出层使用回归函数输出所述车辆识别模型的识别结果，其中，所述函数的定义如下所示：

其中，V _i是分类器前级输出单元的输出，i表示类别索引，e为无限不循环小数，C为总的类别个数，S _i表示当前元素的指数与所有元素指数和的比值。
如权利要求1至4中任意一项所述的基于人工智能的车辆识别方法，其特征在于，该方法还包括：

根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。
一种基于人工智能的车辆识别装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的基于人工智能的车辆识别程序，所述基于人工智能的车辆识别程序被所述处理器执行时实现如下步骤：

获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作，其中，所述车辆图像包括使用网络爬虫程序从互联网中获取的车辆图像以及使用摄像机在预设区域捕获的出入车辆的车辆图像；

构建深度残差网络的车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型识别图像中车辆的种类，并在所述车辆识别模型训练中，使用随机失活方法增强所述车辆识别模型的泛化能力，使用批标准化算法在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布。
如权利要求6所述的基于人工智能的车辆识别装置，其特征在于，所述对所述车辆图像数据集中的图像进行预处理操作包括：

使用中值滤波算法对车辆图像进行降噪处理；及

使用翻转旋转方法对车辆图像进行数据增强处理。
如权利要求7所述的基于人工智能的车辆识别装置，其特征在于，所述降噪处理包括：

取N*N大小的滤波器，其中，N为正整数；

以预设像素点为滤波器原始中心值，对N*N大小的滤波器窗内的所有像素值进行排序；及

用所述N*N大小的滤波器窗内排序后的中间值代替所述滤波器原始中心值。
如权利要求6所述的基于人工智能的车辆识别装置，其特征在于，所述基于人工智能的车辆识别程序被所述处理器执行时实现如下步骤：获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述待识别的车辆类别进行编码输出。
如权利要求6所述的基于人工智能的车辆识别装置，其特征在于，所述车辆识别模型的输出层使用回归函数输出所述车辆识别模型的识别结果，其中，所述函数的定义如下所示：

其中，V _i是分类器前级输出单元的输出，i表示类别索引，e为无限不循环小数，C为总的类别个数，S _i表示当前元素的指数与所有元素指数和的比值。
如权利要求6至10中任意一项所述的基于人工智能的车辆识别装置，其特征在于，所述基于人工智能的车辆识别程序被所述处理器执行时实现如下步骤：根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于人工智能的车辆识别程序，所述基于人工智能的车辆识别程序可被一个或者多个处理器执行，以实现如下步骤：

获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作，其中，所述车辆图像包括使用网络爬虫程序从互联网中获取的车辆图像以及使用摄像机在预设区域捕获的出入车辆的车辆图像；

构建深度残差网络的车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型识别图像中车辆的种类，并在所述车辆识别模型训练中，使用随机失活方法增强所述车辆识别模型的泛化能力，使用批标准化算法在所述车辆识别模型训练过程，使得每一层神经网络的输入保持相同分布；及

获取待识别的车辆图像，使用上述已训练好的车辆识别模型识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述待识别的车辆类别进行编码输出。
如权利要求12所述的计算机可读存储介质，其特征在于，所述对所述车辆图像数据集中的图像进行预处理操作包括：

使用中值滤波算法对车辆图像进行降噪处理；及

使用翻转旋转方法对车辆图像进行数据增强处理。
如权利要求13所述的计算机可读存储介质，其特征在于，所述降噪处理包括：

取N*N大小的滤波器，其中，N为正整数；

以预设像素点为滤波器原始中心值，对N*N大小的滤波器窗内的所有像素值进行排序；及

用所述N*N大小的滤波器窗内排序后的中间值代替所述滤波器原始中心值。
如权利要求12所述的计算机可读存储介质，其特征在于，所述车辆识别模型的输出层使用回归函数输出所述车辆识别模型的识别结果，其中，所述函数的定义如下所示：

其中，V _i是分类器前级输出单元的输出，i表示类别索引，e为无限不循环小数，C为总的类别个数，S _i表示当前元素的指数与所有元素指数和的比值。
如权利要求12至15中任意一项所述的计算机可读存储介质，其特征在于，所述基于人工智能的车辆识别程序被所述处理器执行时实现如下步骤：根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。
一种基于人工智能的车辆识别程序，其特征在于，所述基于人工智能的车辆识别程序包括：

数据集建立模块：用于获取车辆图像，对所述车辆图像标记类别标签，存储所述带有类别标签的车辆图像，建立车辆图像数据集，并对所述车辆图像数据集中的图像进行预处理操作；

模型训练模块：用于构建车辆识别模型，并利用所述车辆图像数据集训练所述车辆识别模型，使用所述车辆识别模型识别图像中车辆的种类；及

车辆类别识别模块：用于获取待识别的车辆图像，使用上述已训练好的车辆识别模型中识别所述待识别的车辆图像中的车辆种类，并使用独热编码对所述车辆类别进行编码输出。
如权利要求17所述的基于人工智能的车辆识别程序，其特征在于，所述对所述车辆图像数据集中的图像进行预处理操作包括：

使用中值滤波算法对车辆图像进行降噪处理；及

使用翻转旋转方法对车辆图像进行数据增强处理；

其中，所述降噪处理包括：

取N*N大小的滤波器，其中，N为正整数；

以预设像素点为滤波器原始中心值，对N*N大小的滤波器窗内的所有像素值进行排序；及

用所述N*N大小的滤波器窗内排序后的中间值代替所述滤波器原始中心值。
如权利要求17所述的基于人工智能的车辆识别程序，其特征在于，所述车辆识别模型的输出层使用回归函数输出所述车辆识别模型的识别结果，其中，所述函数的定义如下所示：

其中，V _i是分类器前级输出单元的输出，i表示类别索引，e为无限不循环小数，C为总的类别个数，S _i表示当前元素的指数与所有元素指数和的比值。
如权利要求17至19中任意一项所述的基于人工智能的车辆识别程序，其特征在于，所述基于人工智能的车辆识别程序还包括：

费用计算模块：用于根据所述车辆的种类，利用预设的费用规则，计算并输出对应的收费标准。