CN111428556A

CN111428556A - 一种基于胶囊神经网络的交通标志识别方法

Info

Publication number: CN111428556A
Application number: CN202010095806.9A
Authority: CN
Inventors: 任条娟; 陈友荣; 陈鹏; 苏子漪; 刘半藤; 江俊
Original assignee: Zhejiang Shuren University
Current assignee: Zhejiang Shuren University
Priority date: 2020-02-17
Filing date: 2020-02-17
Publication date: 2020-07-17
Anticipated expiration: 2040-02-17
Also published as: CN111428556B

Abstract

本发明涉及一种基于胶囊神经网络的交通标志识别方法，采用图像均衡化、最大稳定极值区域分割、归一化等方法预处理图像，消除运动模糊、背景干扰、光照以及交通标志局部遮挡破损等因素干扰，并分割出感兴趣区域的图像，可有效提取感兴趣区域图像，提高弱光条件的查全率，增强鲁棒性；引入胶囊神经网络结构，采用卷积层底层特征，通过主胶囊层张量向量后封装成向量化的胶囊单元，采用动态路由聚类和反向传播更新权重参数，实现模型训练和输出模型权重参数，具有较快的训练速度，且减少训练时间；最终根据训练好的模型权重参数和动态路由聚类实现图像的分类，可有效提高弱光照图片的查全率，提高交通标志的识别率。

Description

一种基于胶囊神经网络的交通标志识别方法

技术领域：

本发明涉及交通标志检测和识别技术领域，具体涉及一种基于胶囊神经网络的交通标志识别方法。

背景技术：

随着社会经济的发展，汽车已成为世界上使用最多的交通工具，导致交通事故频发和交通阻塞日益严重，造成大量的经济损失。面对这一问题，汽车厂商、学术界和政府专家共同努力致力于研发先进的智能交通***，以改善和加强交通安全，因此智能交通***迅速发展，其中道路交通标志识别是智能交通领域中难度较大的问题之一。现今的车载***，交通标志的提示大多通过数字地图数据获知，但是该方法只限于有地图数据的一部分道路，而无法获知其他情况下的交通标志，因此基于人工智能和机器视觉的识别***拥有大量的需求。近年来随着物联网、高性能计算机和智能移动终端的普及与发展，图像采集设备和处理能力的提高，交通标志识别成为了实景图像识别的热点研究问题之一。

在交通标志识别方面，目前部分学者侧重于研究机器视觉领域的特征提取以及分类器等方法，实现交通标志图像的识别分类，如戈侠等人针对图像特征提取时由于内部噪点的存在造成交通标志内部指示信息识别错误的问题，提出了一种自适应串行融合特征的识别方法，该方法计算交通标志图像中每一小块的梯度直方图，得到权重系数，选取权重较大的方向梯度直方图特征和内部局部二值模式特征进行自适应串行融合特征，最后使用支持向量机进行识别。Madani A等人针对交通标志图像特征信息较多导致分类识别较差的问题，提出了一种基于颜色、形状和图像文字的交通标志识别方法，可提取交通标志边缘颜色、形状和图像文字等图像特征，使用逻辑门和支持向量机分类方法进行分类。Abdi L等人针对提取交通标志图像时空间特征信息不足的问题，提出了一种基于增强空间视觉词包的交通标志识别方法。该方法将视觉词的出现频率和图像空间信息融入到基于视觉特征的词袋模型中，改进适用于交通标志识别***的词袋模型。然而上述方法需要人工设计先验知识的特征，且特征提取较复杂，需花费大量的人力和时间。

因此部分学者侧重于研究适用于交通标志识的卷积神经网络(ConvolutionalNeural Network,CNN)等深度学***移等变化后的同一张图像。

综上所述，目前机器学***移等变化的图像，增加了方法的计算量。鉴于现有技术中的各种方法都存在各自的缺陷，发明人通过研究，提出一种全新的交通标志识别方法，即：一种基于胶囊神经网络的交通标志识别方法，本案由此而生。

发明内容：

本发明考虑胶囊神经网络，提出一种基于胶囊神经网络的交通标志识别方法，该方法在预处理和识别图像的过程中能较好的检测交通标志所在区域，可有效提取感兴趣区域图像，提高弱光条件的查全率，增强鲁棒性；在训练阶段，采用胶囊神经网络，具有较快的训练速度，减少训练时间；在识别阶段，可有效提高了弱光照图片的查全率，提高了交通标志的识别率。

为了实现上述发明目的，本发明所采用的技术方案为：

一种基于胶囊神经网络的交通标志识别方法，内容包括：

1)将交通标志图像分成若干不同类型并构建交通标志数据集，每一类交通标志图像中随机选取若干张交通标志图像，用实际摄像头所拍摄的交通标志图像予以替换，最终获得用于模型训练的训练集；

2)判断当前的模型状态：如果当前状态是训练状态，则加载训练集的RGB图像数据；如果当前状态为识别状态，则加载训练好的网络模型，并读取摄像头采集的RGB图像数据；

3)读取当前的RGB图像数据，将当前的RGB图像转化为YCbCr图像，采用公式(1)对图像的亮度分量Y进行直方化处理，并将处理后的YCbCr图像转化为RGB图像，更新当前的图像；

其中，S_n表示处理后的亮度分量值，X_i表示亮度分量值为i的像素个数，N表示像素个数总和；

4)将当前的RGB图像进行颜色增强，对交通标志特有的红色、黄色、蓝色三色进行增强，对非交通标志的其他颜色进行抑制；

5)通过颜色筛选当前图像潜在区域，将当前RGB颜色模型转化为HSV颜色模型，然后对整幅图像进行目标颜色提取，判断蓝色区域是否满足公式(2)，红色区域是否满足公式(3)，黄色区域是否满足公式(4)，筛选出满足公示(2)～(4)条件的区域并转化为RGB图像；

230≤H≤255||0≤H≤15,160≤S≤240，V≥180 (2)

170≤H≤180，S＞40，30≤V＜235 (3)

15≤H≤45,S≥145,60≤V≤235 (4)

其中，H表示图像颜色色调，S表示图像饱和度，V表示图像亮度；

6)通过图像区域块分割方法，从图像增强和颜色筛选处理后的当前图像中分割出交通标志所在的区域图像；

7)使用最邻近插值法将分割出来的交通标志潜在区域图像规格化，获得32×32的固定大小图像；

8)判断图像是否处理完成：如果每一个图像处理完，则跳到步骤9)，否则判断当前状态，如果当前状态是训练状态，则读取训练集中下一个图像，跳到步骤3)，否则读取摄像头采集的下一个图像，跳到步骤3)；

9)将规格化后的图像输入胶囊神经网络的卷积层，提取交通标志底层各个部分特征，输出底层特征张量；

10)将胶囊神经网络模型卷积层提取的底层特征张量输入胶囊神经网络模型主胶囊层，将特征张量向量化输出；

11)将主胶囊层输出的向量胶囊单元传入模型的数字胶囊层，且在数字胶囊层进行动态路由聚类，获得耦合系数和连接一致性参数，获得高层胶囊单元，实现分类；

12)根据数字胶囊层输出的若干个类别的胶囊单元向量，计算向量模长即为向量的长度；如果当前状态是训练状态，则跳到步骤13)，若为识别状态则每个类别向量的长度为输出图像时该类别的概率，并选择概率最大的类别即为类结果，输出类结果，重新读取摄像头采集的RGB图像数据，跳到步骤3)；

13)根据公式(14)构建损失函数，计算各个类别的损失值，累加各个L_k，获得总的损失值Loss；如果Loss小于阈值L_yu，则训练完成，获得可固定胶囊网络模型的权重参数，获得网络模型，令当前状态为识别状态，读取摄像头采集的RGB图像数据，跳到步骤3)；若Loss大于等于阈值L_yu，则跳到步骤14)；

L_k＝T_kmax(0,m⁺-||v_k||)²+λ(1-T_k)max(0,||v_k||-m^-)² (14)

其中，L_k表示分类类别k的损失值且k的取值范围为1～43，T_k表示分类类别k的指示函数，如果不属于类别k，则T_k＝1，否则T_k＝0，v_k表示动态路由聚类为类别k的向量单元，m⁺为上边界，m^-为下边界，λ为权重降低损失值；

14)利用损失值反向传播，通过公式(15)更新网络中动态路由的权重矩阵w，然后跳到步骤9)：

其中，

表示更新后的权重矩阵，η表示学习率，即梯度，

表示更新前的权重矩阵。

进一步，所述步骤1)中的交通标志图像分成43类，将43类交通标志图像分开存储；从每一类交通标志图像中随机选取30张交通标志图像，共1290张图像，用实际摄像头所拍摄的交通标志图像予以替换，最终获得具有43类不同类型交通标志的39209张图像的训练集。

所述步骤6)中交通标志的图像区域块分割方法步骤如下：

(6.1)将当前图像转换成灰度图像，对灰度图像中每一列的灰度值从大到小排序；

(6.2)将排序后的灰度值放入与原图像尺寸大小相同的矩阵中，使用并查集方法判断排序好后的每列灰度值点之间是否链接，如果存在链接，输出灰度值点排在相邻位置的矩阵，令t＝0；

(6.3)选取二值化阈值t-Δ，t和t+Δ，其中Δ表示阈值的变化量，分别选择灰度值为该阈值的像素点组成的多个区域，计算这些区域面积

和

通过公式(5)计算第i个区域的变化率

其中，

表示选取二值化阈值t时的第i个区域的面积；

(6.4)令t＝t+1，如果t小于256，则重新跳到步骤(6.3)，否则完成变化率

的计算，并选择具有最小变化率

的区域为最大极值稳定区域Rt；

(6.5)计算区域Rt的纵横比为R，计算区域与其外接矩形的面积比A，判断R是否满足公式(6)和A是否满足公式(7)：

R_min＜R＜R_max (6)

A＞A_min (7)

其中，R_min表示纵横比最小值，R_max表示纵横比最大值，A_min表示面积比最小值；如果R满足公式(6)且A满足公式(7)，则跳到步骤(6.6)，否则表示当前图像中没有交通标志的区域块，直接跳到步骤(8)；

(6.6)令筛选出的极大值稳定区域的灰度值为255，其他灰度值为0，使用公式(8)计算图像每一个灰度值和周围区域灰度值的标准差，将标准差最大的灰度值点为交通标志潜在区域边界的灰度点，连接这些灰度值点组成图像区域，获得区域的图像坐标；分割该坐标内所有像素点，得到交通标志图像的潜在区域；

其中，y_i表示第i个灰度值，Z表示周围区域内灰度值的总个数，σ为标准差。

所述步骤9)中胶囊神经网络模型的第一层卷积层中256个卷积核大小均为9×9，深度和步幅均为1，采用非线性激活函数提升卷积层的运算能力，输出24×24×256的底层特征张量。

所述步骤10)中胶囊神经网络模型主胶囊层通过8×32个大小为9×9和步长为2的卷积核，进行32次的通道数为8的不同卷积，生成8个6×6×1×32的张量，将这8个张量合并成6×6×8×32的向量胶囊单元输出。

所述步骤11)中的动态路由聚类方法的步骤如下：

11.1)输入低层胶囊单元的胶囊单元和连接权重矩阵，通过公式(9)计算所有的预测向量：

其中，u_i表示低层胶囊单元的第i个胶囊单元，w_ij表示第i胶囊单元与第j个预测胶囊单元的连接权重矩阵，U_j|i表示第i个胶囊单元到第j个预测胶囊单元的预测向量，令当前胶囊所在的层数为L，且L＝0，令路由迭代次数为D次，令当前循环次数r＝1；

11.2)令b_ij表示L层第i个胶囊单元连接L+1层第j个胶囊单元的一致性参数，且其初始值全为0；

11.3)如果当前循环次数小于D，则跳到步骤11.4)，否则跳到步骤11.8)；

11.4)通过公式(10)，计算每一个胶囊单元的耦合系数c_ij；

其中，b_ij表示第i个胶囊单元与下一层第j个胶囊单元的连接一致性参数，b_ik表示第i个胶囊单元与下一层第k个胶囊单元的连接一致性参数，且k的取值范围为k∈[1,43)，exp()表示以e为底的指数函数；

11.5)通过公式(11)，计算第L+1层的所有胶囊单元的加权和；

其中，s_j表示第j个胶囊单元的加权和；

11.6)通过公式(12)采用squash压缩激活函数压缩加权和s_j，获得L+1层的所有胶囊单元；

其中，v_j表示L+1层的第j个胶囊单元，||s_j||表示加权和向量的模长；

11.7)根据L层的所有预测向量U_j|i和L+1层的所有胶囊单元v_j的连接关系，通过公式(13)更新参数b_ij，r＝r+1，跳到步骤11.3)；

11.8)输出固定动态路由过程中使用的耦合系数c_ij和连接一致性参数b_ij，输出高层胶囊单元v_j。

与现有技术相比，本发明有益效果主要表现在：本方法采用图像均衡化、最大稳定极值区域分割、归一化等方法预处理图像，从而消除运动模糊、背景干扰、光照以及交通标志局部遮挡破损等因素干扰，并分割出感兴趣区域的图像，从而在预处理和识别图像的过程中能较好的检测交通标志所在区域，可有效提取感兴趣区域图像，提高弱光条件的查全率，增强鲁棒性。同时，引入胶囊神经网络结构，采用卷积层底层特征，通过主胶囊层张量向量后封装成向量化的胶囊单元，采用动态路由聚类和反向传播更新权重参数，实现模型训练和输出模型权重参数，具有较快的训练速度，且减少训练时间。最终根据训练好的模型权重参数和动态路由聚类实现图像的分类，可有效提高弱光照图片的查全率，提高交通标志的识别率。

附图说明：

图1为本发明实施例中交通标志识别方法的工作流程示意图。

具体实施方式：

本实施例公开一种基于胶囊神经网络的交通标志识别方法，如图1所示，主要步骤如下：

1)将交通标志图像按类型分成43类不同类型，构建交通标志数据集，将43类交通标志图像分开存储；从每一类交通标志图像中随机选取30张交通标志图像，共1290张图像，并用实际摄像头所拍摄的交通标志图像予以替换，最终获得具有43类不同类型交通标志的39209张图像的训练集。

2)判断当前模型状态是训练状态还是识别状态，如果当前状态是训练状态，则加载训练集的RGB图像数据；如果当前状态为识别状态，则加载训练好的网络模型，并读取摄像头采集的RGB图像数据。

3)读取当前的RGB图像数据，将当前的RGB图像转化为YCbCr图像，采用公式(1)对图像的亮度分量Y进行直方化处理，并将处理后的YCbCr图像转化为RGB图像，更新当前的图像。

其中，S_n表示处理后的亮度分量值，X_i表示亮度分量值为i的像素个数，N表示像素个数总和。

4)将当前的RGB图像进行颜色增强，对交通标志特有的红色、黄色、蓝色三色进行增强，对非交通标志的其他颜色进行抑制。

5)通过颜色筛选当前图像潜在区域，将当前RGB颜色模型转化为HSV颜色模型，然后对整幅图像进行目标颜色提取，判断蓝色区域是否满足公式(2)，红色区域是否满足公式(3)，黄色区域是否满足公式(4)，筛选出满足公示(2)～(4)条件的区域并转化为RGB图像。

230≤H≤255||0≤H≤15,160≤S≤240，V≥180 (2)

170≤H≤180，S＞40，30≤V＜235 (3)

15≤H≤45,S≥145,60≤V≤235 (4)

其中，H表示图像颜色色调，S表示图像饱和度，V表示图像亮度。

6)通过图像区域块分割方法，从图像增强和颜色筛选处理后的当前图像中分割出交通标志所在的区域图像。其中交通标志的图像区域块分割方法步骤如下：

(6.1)将当前图像转换成灰度图像，对灰度图像中每一列的灰度值从大到小排序。

(6.2)将排序后的灰度值放入与原图像尺寸大小相同的矩阵中，使用并查集方法判断排序好后的每列灰度值点之间是否链接。如果存在链接，输出灰度值点排在相邻位置的矩阵。令t＝0。

和

通过公式(5)计算第i个区域的变化率

其中，

表示选取二值化阈值t时的第i个区域的面积。

的计算，并选择具有最小变化率

的区域为最大极值稳定区域Rt。

R_min＜R＜R_max (6)

A＞A_min (7)

其中，R_min表示纵横比最小值，R_max表示纵横比最大值，A_min表示面积比最小值。如果R满足公式(6)且A满足公式(7)，则跳到步骤(6.6)，否则表示当前图像中没有交通标志的区域块，直接跳到步骤(8)。

(6.6)令筛选出的极大值稳定区域的灰度值为255(白色)，其他灰度值为0(黑色)。使用公式(8)计算图像每一个灰度值和周围区域灰度值的标准差，将标准差最大的灰度值点为交通标志潜在区域边界的灰度点，连接这些灰度值点组成图像区域，获得区域的图像坐标。分割该坐标内所有像素点，得到交通标志图像的潜在区域。

7)使用最邻近插值法将分割出来的交通标志潜在区域图像规格化，获得32×32的固定大小图像。

8)判断图像是否处理完成。如果每一个图像处理完，则跳到步骤9)，否则判断当前状态，如果当前状态是训练状态，则读取训练集中下一个图像，跳到步骤3)，否则读取摄像头采集的下一个图像，跳到步骤3)。

9)设置胶囊神经网络模型的第一层卷积层中256个卷积核大小均为9×9，深度和步幅均为1，采用非线性激活函数提升卷积层的运算能力。将规格化后的图像输入胶囊神经网络的卷积层，提取交通标志底层各个部分特征，输出24×24×256的张量。

10)将胶囊神经网络模型卷积层提取的底层特征张量输入胶囊神经网络模型主胶囊层，同时主胶囊层通过8×32个大小为9×9和步长为2的卷积核，进行32次的通道数为8的不同卷积，生成8个6×6×1×32的张量。将这8个张量合并成6×6×8×32的向量胶囊单元输出。

11)将主胶囊层输出的向量胶囊单元传入模型的数字胶囊层，且在数字胶囊层进行动态路由聚类，获得耦合系数和连接一致性参数，获得高层胶囊单元，实现分类。其中动态路由聚类方法的步骤如下：

11.4)通过公式(10)，计算每一个胶囊单元的耦合系数c_ij；

其中，b_ij表示第i个胶囊单元与下一层第j个胶囊单元的连接一致性参数，b_ik表示第i个胶囊单元与下一层第k个胶囊单元的连接一致性参数，且k的取值范围为k∈[1,43)，exp()表示以e为底的指数函数。

11.5)通过公式(11)，计算第L+1层的所有胶囊单元的加权和；

其中，s_j表示第j个胶囊单元的加权和；

其中，v_j表示L+1层的第j个胶囊单元，||s_j||表示加权和向量的模长。

12)根据数字胶囊层输出的43个类别的胶囊单元向量，计算向量模长即为向量的长度。如果当前状态是训练状态，则跳到步骤13)，若为识别状态则每个类别向量的长度为输出图像时该类别的概率，并选择概率最大的类别即为类结果，输出类结果，重新读取摄像头采集的RGB图像数据，跳到步骤3)。

13)根据公式(14)构建损失函数，计算各个类别的损失值，累加各个L_k，获得总的损失值Loss。如果Loss小于阈值L_yu，则训练完成，获得可固定胶囊网络模型的权重参数，获得网络模型，令当前状态为识别状态，读取摄像头采集的RGB图像数据，跳到步骤3)；若Loss大于等于阈值L_yu，则跳到步骤14)。

L_k＝T_kmax(0,m⁺-||v_k||)²+λ(1-T_k)max(0,||v_k||-m^-)² (14)

其中，L_k表示分类类别k的损失值且k的取值范围为1～43，T_k表示分类类别k的指示函数(如果不属于类别k，则T_k＝1，否则T_k＝0)，v_k表示动态路由聚类为类别k的向量单元，m⁺为上边界，m^-为下边界，λ为权重降低损失值。

其中，

表示更新后的权重矩阵，η表示学习率，即梯度，

表示更新前的权重矩阵。

Claims

1.一种基于胶囊神经网络的交通标志识别方法，其特征在于：内容包括：

230≤H≤255||0≤H≤15,160≤S≤240，V≥180 (2)

170≤H≤180，S＞40，30≤V＜235 (3)

15≤H≤45,S≥145,60≤V≤235 (4)

L_k＝T_kmax(0,m⁺-||v_k||)²+λ(1-T_k)max(0,||v_k||-m^-)² (14)

其中，

表示更新后的权重矩阵，η表示学习率，即梯度，

表示更新前的权重矩阵。

2.根据权利要求1所述的一种基于胶囊神经网络的交通标志识别方法，其特征在于：所述步骤1)中的交通标志图像分成43类，将43类交通标志图像分开存储；从每一类交通标志图像中随机选取30张交通标志图像，共1290张图像，用实际摄像头所拍摄的交通标志图像予以替换，最终获得具有43类不同类型交通标志的39209张图像的训练集。

3.根据权利要求1所述的一种基于胶囊神经网络的交通标志识别方法，其特征在于：所述步骤6)中交通标志的图像区域块分割方法步骤如下：