CN106056071A

CN106056071A - 一种驾驶员打电话行为的检测方法及装置

Info

Publication number: CN106056071A
Application number: CN201610368797.XA
Authority: CN
Inventors: 李志国
Original assignee: Beijing Zhi Xinyuandong Science And Technology Ltd
Current assignee: Beijing Zhi Xinyuandong Science And Technology Ltd
Priority date: 2016-05-30
Filing date: 2016-05-30
Publication date: 2016-10-26
Anticipated expiration: 2036-05-30
Also published as: CN106056071B

Abstract

本发明提供了一种驾驶员打电话行为的检测方法，该方法包括：选取标签的彩色图像为样本图像，采用卷积神经网络对样本图像进行反复训练，获取训练好的打电话检测模型；根据车牌区域获取车窗的候选区域；采用Hough变换在车窗的候选区域内检测直线，对直线进行聚类处理，提取车窗区域；采用人脸检测算法在车窗区域内进行检测，提取人脸区域；根据人脸区域获取打电话的感兴趣区域；利用训练好的打电话检测模型对感兴趣区域进行检测，输出检测结果。与现有技术相比，本发明能准确的检测出驾驶员的打电话行为，且鲁棒性较好。

Description

一种驾驶员打电话行为的检测方法及装置

技术领域

本发明涉及图像处理、视频监控以及智能交通，特别涉及驾驶员打电话行为的检测方法及装置。

背景技术

随着交通运输业的发展，交通事故已成为当今危害人类生命安全的主要公害之一，同时也是当前世界各国所面临的一个严重的社会问题。在交通事故的发生原因中，驾驶员注意力不集中是主要原因之一。据统计报告显示，开车时打电话会严重干扰驾驶员的注意力，使得发生车祸的风险比正常驾驶时高4倍以上。

目前，对于驾驶员行车途中打电话行为检测的研究还比较少，主要集中在基于手机信号进行检测。由于很难分辨是驾驶员在打电话还是乘客在打电话，基于手机信号的方式会有很多误检。随着计算机硬件和软件技术、图像处理技术和计算机视觉、模式识别等技术的发展，近年来基于图像处理的打电话行为检测得到了研究。

现有的基于图像处理的打电话行为检测大多是基于分类器的，例如公开号为CN104573659A和CN102567743A的中国发明专利申请是基于SVM(Support VectorMachines，支持向量机)分类器的，公开号为CN104966059A的中国发明专利申请是基于Cascade级联分类器的。然而由于分类器提取的特征有限，因此影响了打电话行为检测的检测准确率。

综上所述，目前迫切需要提出一种检测准确率较高的驾驶员打电话行为的检测方法及装置。

发明内容

有鉴于此，本发明的主要目的在于实现驾驶员打电话行为的检测，且检测准确率较高。

为达到上述目的，按照本发明的第一个方面，提供了一种驾驶员打电话行为的检测方法，该方法包括：

第一步骤，选取标签的彩色图像为样本图像，采用卷积神经网络对样本图像进行反复训练，获取训练好的打电话检测模型；

第二步骤，根据车牌区域获取车窗的候选区域；

第三步骤，采用Hough变换在车窗的候选区域内检测直线，对直线进行聚类处理，提取车窗区域；

第四步骤，采用人脸检测算法在车窗区域内进行检测，提取人脸区域；

第五步骤，根据人脸区域获取打电话的感兴趣区域；

第六步骤，利用训练好的打电话检测模型对感兴趣区域进行检测，输出检测结果。

所述第一步骤进一步包括：

样本选取步骤，选取标签驾驶员打电话的彩色图像、标签驾驶员未打电话的彩色图像、标签模糊的彩色图像作为样本图像；

初步训练步骤，利用卷积神经网络对样本图像进行特征训练，获得初步训练的模型；

二次训练步骤，选取测试图像，根据初步训练的模型对测试图像进行反复训练，直至模型收敛；

模型输出步骤，将收敛的模型作为训练好的驾驶员打电话检测模型并输出。

所述初步训练步骤中卷积神经网络包括：输入层、Th_Con个卷积层、Th_Pool个池化层、Th_Full个全连接层。其中，每层卷积层包括Th_CK个卷积核，卷积核的大小为CKSi*CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全连接层输出的神经元的数量为3，即为3个驾驶员打电话检测类别。

进一步地，所述卷积神经网络包括：

输入层，输入Width*Height的图像；

第一层卷积层，输出Th_CK1个卷积核，卷积核的大小为CKSi1*CKSi1、步长为1；

第一层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第二层卷积层，输出Th_CK2个卷积核，卷积核的大小为CKSi2*CKSi2、步长为1；

第二层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第三层卷积层，输出Th_CK3个卷积核，卷积核的大小为CKSi3*CKSi3、步长为1；

第三层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

全连接层，输出3个神经元，即3个打电话检测类别。

所述二次训练步骤进一步包括：

训练特征提取步骤，根据初步训练的模型提取测试图像的特征；

训练分类判定步骤，计算该特征与每一驾驶员打电话检测类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为候选检测类别；

反复训练步骤，计算判定结果与真实结果的误差，利用反向传播算法来训练模型，重复训练特征提取步骤和训练分类判定步骤，直至该模型收敛。

所述第二步骤进一步包括：

车牌区域定位步骤，根据车牌定位算法从采集的彩色图像中获取车牌区域；

车窗的候选区域边界获取步骤，根据车牌区域获取车牌区域的左边边界x＝pl、右边边界x＝pr、上边边界y＝pt、下边边界y＝pb，则车窗的候选区域的左边边界为右边边界为上边边界为下边边界为W_p为车牌区域的宽度，W为采集图像的宽度，λ3＜λ2；

车窗的候选区域输出步骤，根据车窗的候选区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为车窗的候选区域。

所述第三步骤进一步包括：

竖直边缘获取步骤，将车窗的候选区域进行灰度化处理，获取灰度的候选区域，采用滤波器，获取灰度的候选区域的竖直边缘图像；

二值图像获取步骤，采用阈值Th_F对数值边缘图像进行分割，获取二值图像；

直线检测步骤，采用Hough变换直线检测算法对二值图像进行处理，获取检测的直线序列y＝k_ix+b_i，i＝1，2，…，N₁，N₁为直线的数量；

直线筛选步骤，若arctan|k_i|≤Th_θ，则保留该直线，否则删除该直线，由此得到剩余的直线序列y＝k_jx+b_j，j＝1，2，…，N₂，N₂为剩余直线的数量；

上下边界获取步骤，扫描每条直线y＝k_jx+b_j，j＝1，2，…，N₂，获取直线y＝k_jx+b_j的第一个像素点(x_j1,y_j1)和最后一个像素点(x_j2,y_j2)，在y方向上按将直线进行分段，获取对应的x方向上的长度，并将其放入LineHist数组中，采用聚类算法对LineHist数组进行聚类，将获取的聚类值最大的两条直线分别作为上边界和下边界；

左右边界获取步骤，分别扫描上边界、下边界，将上边界的第一个像素点和下边界的第一个像素点构成的直线作为左边界，将上边界的最后一个像素点和下边界的最后一个像素点构成的直线作为右边界；

车窗区域获取步骤，由上边界、左边界、右边界、下边界围成的区域即为车窗区域。

所述第五步骤进一步包括：

感兴趣区域边界获取步骤，根据人脸区域获取人脸区域的左边边界x＝fl、右边边界x＝fr、上边边界y＝ft、下边边界y＝fb，则打电话的感兴趣区域的左边边界为右边边界为上边边界为下边边界为W_f为人脸区域的宽度，W和H分别为采集图像的宽度和高度；

感兴趣区域获取步骤，根据打电话的感兴趣区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为感兴趣区域。

所述第六步骤进一步包括：

识别特征提取步骤，利用训练好的打电话检测模型提取感兴趣区域的特征；

识别分类判定步骤，计算感兴趣区域的特征与每一类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为驾驶员打电话检测结果并输出。

按照本发明的另一个方面，提供了一种驾驶员打电话行为的检测装置，该装置包括：

打电话检测模型获取模块，用于选取标签的彩色图像为样本图像，采用卷积神经网络对样本图像进行反复训练，获取训练好的打电话检测模型；

车窗的候选区域提取模块，用于根据车牌区域获取车窗的候选区域；

车窗区域提取模块，用于采用Hough变换在车窗的候选区域内检测直线，对直线进行聚类处理，提取车窗区域；

人脸区域提取模块，用于采用人脸检测算法在车窗区域内进行检测，提取人脸区域；

感兴趣区域提取模块，用于根据人脸区域获取打电话的感兴趣区域；

打电话检测模型检测模块，用于利用训练好的打电话检测模型对感兴趣区域进行检测，输出检测结果。

所述打电话检测模型获取模块进一步包括：

样本选取模块，用于选取标签驾驶员打电话的彩色图像、标签驾驶员未打电话的彩色图像、标签模糊的彩色图像作为样本图像；

初步训练模块，用于利用卷积神经网络对样本图像进行特征训练，获得初步训练的模型；

二次训练模块，用于选取测试图像，根据初步训练的模型对测试图像进行反复训练，直至模型收敛；

模型输出模块，用于将收敛的模型作为训练好的驾驶员打电话检测模型并输出。

所述二次训练模块进一步包括：

训练特征提取模块，用于根据初步训练的模型提取测试图像的特征；

训练分类判定模块，用于计算该特征与每一驾驶员打电话检测类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为候选检测类别；

反复训练模块，用于计算判定结果与真实结果的误差，利用反向传播算法来训练模型，重复训练特征提取模块和训练分类判定模块，直至该模型收敛。

所述车窗的候选区域提取模块进一步包括：

车牌区域定位模块，用于根据车牌定位算法从采集的彩色图像中获取车牌区域；

车窗的候选区域边界获取模块，用于根据车牌区域获取车牌区域的左边边界x＝pl、右边边界x＝pr、上边边界y＝pt、下边边界y＝pb，则车窗的候选区域的左边边界为右边边界为上边边界为下边边界为W_p为车牌区域的宽度，W为采集图像的宽度，λ3＜λ2；

车窗的候选区域获取模块，用于根据车窗的候选区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为车窗的候选区域。

所述车窗区域提取模块进一步包括：

竖直边缘获取模块，用于将车窗的候选区域进行灰度化处理，获取灰度的候选区域，采用滤波器，获取灰度的候选区域的竖直边缘图像；

二值图像获取模块，用于采用阈值Th_F对数值边缘图像进行分割，获取二值图像；

直线检测模块，用于采用Hough变换直线检测算法对二值图像进行处理，获取检测的直线序列y＝k_ix+b_i，i＝1,2,…，N₁，N₁为直线的数量；

直线筛选模块，用于若arctan|k_i|≤Th_θ，则保留该直线，否则删除该直线，由此得到剩余的直线序列y＝k_jx+b_j，j＝1，2，…，N₂，N₂为剩余直线的数量；

上下边界获取模块，用于扫描每条直线y＝k_jx+b_j，j＝1，2，…，N₂，获取直线y＝k_jx+b_j的第一个像素点(x_j1,y_j1)和最后一个像素点(x_j2,y_j2)，在y方向上按将直线进行分段，获取对应的x方向上的长度，并将其放入LineHist数组中，采用聚类算法对LineHist数组进行聚类，将获取的聚类值最大的两条直线分别作为上边界和下边界；

左右边界获取模块，用于分别扫描上边界、下边界，将上边界的第一个像素点和下边界的第一个像素点构成的直线作为左边界，将上边界的最后一个像素点和下边界的最后一个像素点构成的直线作为右边界；

车窗区域获取模块，用于由上边界、左边界、右边界、下边界围成的区域即为车窗区域。

所述感兴趣区域提取模块进一步包括：

感兴趣区域边界获取模块，用于根据人脸区域获取人脸区域的左边边界x＝fl、右边边界x＝fr、上边边界y＝ft、下边边界y＝fb，则打电话的感兴趣区域的左边边界为右边边界为上边边界为下边边界为W_f为人脸区域的宽度，W和H分别为采集图像的宽度和高度；

感兴趣区域获取模块，用于根据打电话的感兴趣区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为感兴趣区域。

所述打电话检测模型检测模块进一步包括：

识别特征提取模块，用于利用训练好的打电话检测模型提取感兴趣区域的特征；

识别分类判定模块，用于计算感兴趣区域的特征与每一类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为驾驶员打电话检测结果并输出。

与现有的驾驶员打电话行为的检测技术相比，本发明的一种驾驶员打电话行为的检测方法及装置采用卷积神经网络，可以准确的检测出驾驶员打电话的行为，且鲁棒性较好；另外，本发明中的卷积神经网络训练了驾驶员打电话、驾驶员未打电话、模糊三个类别，可以分辨出模糊的情况。

附图说明

图1示出了按照本发明的一种驾驶员打电话行为的检测方法的流程图。

图2示出了按照本发明的一种驾驶员打电话行为的检测装置的框架图。

具体实施方式

为使贵审查员能进一步了解本发明的结构、特征及其他目的，现结合所附较佳实施例详细说明如下，所说明的较佳实施例仅用于说明本发明的技术方案，并非限定本发明。

图1给出了按照本发明的一种驾驶员打电话行为的检测方法的流程图。如图1所示，按照本发明的一种驾驶员打电话行为的检测方法包括：

第一步骤S1，选取标签的彩色图像为样本图像，采用卷积神经网络对样本图像进行反复训练，获取训练好的打电话检测模型；

第二步骤S2，根据车牌区域获取车窗的候选区域；

第三步骤S3，采用Hough变换在车窗的候选区域内检测直线，对直线进行聚类处理，提取车窗区域；

第四步骤S4，采用人脸检测算法在车窗区域内进行检测，提取人脸区域；

第五步骤S5，根据人脸区域获取打电话的感兴趣区域；

第六步骤S6，利用训练好的打电话检测模型对感兴趣区域进行检测，输出检测结果。

所述第一步骤S1进一步包括：

样本选取步骤S11，选取标签驾驶员打电话的彩色图像、标签驾驶员未打电话的彩色图像、标签模糊的彩色图像作为样本图像；

初步训练步骤S12，利用卷积神经网络对样本图像进行特征训练，获得初步训练的模型；

二次训练步骤S13，选取测试图像，根据初步训练的模型对测试图像进行反复训练，直至模型收敛；

模型输出步骤S14，将收敛的模型作为训练好的驾驶员打电话检测模型并输出。

其中，所述样本选取步骤S11中样本图像的宽度为Width、高度为Height。Width∈[64,192]，Height∈[64,192]。优选地，Width选为128，Height选为128。选取的标签驾驶员打电话的彩色图像数量可以大于500，选取的标签驾驶员未打电话的彩色图像数量可以大于500，选取的标签模糊的彩色图像数量可以大于500。优选地，分别选取1000～5000000个标签驾驶员打电话、驾驶员未打电话、模糊的彩色图像为样本图像。

所述初步训练步骤S12中卷积神经网络包括：输入层、Th_Con个卷积层、Th_Pool个池化层、Th_Full个全连接层。其中，每层卷积层包括Th_CK个卷积核，卷积核的大小为CKSi*CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全连接层输出的神经元的数量为3，即为3个驾驶员打电话检测类别。

其中，所述Th_Con∈[2，8]，Th_Pool∈[2,8]，Th_Full∈[1,3]，Th_CK∈[Th_CK_min,Th_CK_max]，Th_CK_min∈[6,16]，Th_CK_max∈[30,512]，CKSi∈[3,7]，KSi∈[2,4]。

进一步地，所述卷积神经网络包括：

输入层，输入Width*Height的图像；

第一层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第二层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第三层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

全连接层，输出3个神经元，即3个打电话检测类别。

其中，Th_CK1∈[6,20]，CKSi1∈[3,5]，KSi∈[2,4]，Th_CK2∈[6,40]，CKSi2∈[3,5]，Th_CK3∈[6,40]，CKSi3∈[3,5]，Th_Neur∈[64，10000]。

优选地，Th_CK1设为8，CKSi1设为5，KSi设为2，Th_CK2设为8，CKSi2设为5，Th_CK3设为8，CKSi3设为5，Th_Neur设为128。

所述第一层、第二层、第三层的池化层中的最大池化法可以替换为平均池化法。

所述全连接层中ReLU全称为Rectified Linear Units，中文译为修正线性单元，可以参考文献“Taming the ReLU with Parallel Dither in a Deep NeuralNetwork.AJR Simpson.Computer Science,2015”。

所述全连接层中ReLU可以替换为sigmoid函数或者tanh函数作为激活函数。

所述二次训练步骤S13进一步包括：

训练特征提取步骤S131，根据初步训练的模型提取测试图像的特征；

训练分类判定步骤S132，计算该特征与每一驾驶员打电话检测类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为候选检测类别；

反复训练步骤S133，计算判定结果与真实结果的误差，利用反向传播算法来训练模型，重复训练特征提取步骤S131和训练分类判定步骤S132，直至该模型收敛。

所述第二步骤S2进一步包括：

车牌区域定位步骤S21，根据车牌定位算法从采集的彩色图像中获取车牌区域；

车窗的候选区域边界获取步骤S22，根据车牌区域获取车牌区域的左边边界x＝pl、右边边界x＝pr、上边边界y＝pt、下边边界y＝pb，则车窗的候选区域的左边边界为右边边界为上边边界为下边边界为W_p为车牌区域的宽度，W为采集图像的宽度，λ3＜λ2；

车窗的候选区域输出步骤S23，根据车窗的候选区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为车窗的候选区域。

所述车牌区域定位步骤S21中车牌定位算法为现有的车牌定位算法。例如，“李文举，梁德群，张旗，樊鑫.基于边缘颜色对的车牌定位新方法.《计算机学报》,2004,27(2):204-208”。

所述λ1∈[1.2,1.8]，λ2∈[4.2,4.8]，λ3∈[0.3,0.8]。优选地，λ1选为1.5，λ2选为4.5，λ3选为0.5。

所述第三步骤S3进一步包括：

竖直边缘获取步骤S31，将车窗的候选区域进行灰度化处理，获取灰度的候选区域，采用滤波器，获取灰度的候选区域的竖直边缘图像；

二值图像获取步骤S32，采用阈值Th_F对数值边缘图像进行分割，获取二值图像；

直线检测步骤S33，采用Hough变换直线检测算法对二值图像进行处理，获取检测的直线序列y＝k_ix+b_i，i＝1,2,…,N₁，N₁为直线的数量；

直线筛选步骤S34，若arctan|k_i|≤Th_θ，则保留该直线，否则删除该直线，由此得到剩余的直线序列y＝k_jx+b_j，j＝1,2,…,N₂，N₂为剩余直线的数量；

上下边界获取步骤S35，扫描每条直线y＝k_jx+b_j，j＝1,2,…,N₂，获取直线y＝k_jx+b_j的第一个像素点(x_j1,y_j1)和最后一个像素点(x_j2,y_j2)，在y方向上按将直线进行分段，获取对应的x方向上的长度，并将其放入LineHist数组中，采用聚类算法对LineHist数组进行聚类，将获取的聚类值最大的两条直线分别作为上边界和下边界；

左右边界获取步骤S36，分别扫描上边界、下边界，将上边界的第一个像素点和下边界的第一个像素点构成的直线作为左边界，将上边界的最后一个像素点和下边界的最后一个像素点构成的直线作为右边界；

车窗区域获取步骤S37，由上边界、左边界、右边界、下边界围成的区域即为车窗区域。

其中，所述二值图像获取步骤S32中Th_F∈[10,30]。优选地，Th_F选为20。

所述直线检测步骤S33中Hough变换直线检测算法通过现有的技术实现。例如，“段汝娇，赵伟，黄松岭，陈建业.一种基于改进Hough变换的直线快速检测算法.《仪器仪表学报》,2010,31(12):2774-2780”。

所述直线筛选步骤S34中Th_θ∈[5°,15°]。优选地。Th_θ选为10°。

所述上下边界获取步骤S35中Th_S为采样间隔，Th_S∈[5,20]。优选地，Th_S选为12。所述聚类算法通过现有的聚类算法实现。

所述第四步骤S4中的人脸检测算法可以通过现有的技术实现。例如，“郭志波，华继钊，严云洋，陈才扣，杨静宇.基于双阈值继承型AdaBoost算法的人脸快速检测.《数据采集与处理》,2008,23(3):306-310”。

所述第五步骤S5进一步包括：

感兴趣区域边界获取步骤S51，根据人脸区域获取人脸区域的左边边界x＝fl、右边边界x＝fr、上边边界y＝ft、下边边界y＝fb，则打电话的感兴趣区域的左边边界为右边边界为上边边界为下边边界为W_f为人脸区域的宽度，W和H分别为采集图像的宽度和高度；

感兴趣区域获取步骤S52，根据打电话的感兴趣区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为感兴趣区域。

其中，所述λ4∈[0.8,1.3]，λ5∈[0.3,0.8]，λ6∈[0.3,0.8]。优选地，λ4选为1，λ5选为0.5，λ6选为0.5。

所述第六步骤S6进一步包括：

识别特征提取步骤S61，利用训练好的打电话检测模型提取感兴趣区域的特征；

识别分类判定步骤S62，计算感兴趣区域的特征与每一类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为驾驶员打电话检测结果并输出。

图2给出了按照本发明的一种驾驶员打电话行为的检测装置的框架图。如图2所示，按照本发明的一种驾驶员打电话行为的检测装置包括：

打电话检测模型获取模块1，用于选取标签的彩色图像为样本图像，采用卷积神经网络对样本图像进行反复训练，获取训练好的打电话检测模型；

车窗的候选区域提取模块2，用于根据车牌区域获取车窗的候选区域；

车窗区域提取模块3，用于采用Hough变换在车窗的候选区域内检测直线，对直线进行聚类处理，提取车窗区域；

人脸区域提取模块4，用于采用人脸检测算法在车窗区域内进行检测，提取人脸区域；

感兴趣区域提取模块5，用于根据人脸区域获取打电话的感兴趣区域；

打电话检测模型检测模块6，用于利用训练好的打电话检测模型对感兴趣区域进行检测，输出检测结果。

所述打电话检测模型获取模块1进一步包括：

样本选取模块11，用于选取标签驾驶员打电话的彩色图像、标签驾驶员未打电话的彩色图像、标签模糊的彩色图像作为样本图像；

初步训练模块12，用于利用卷积神经网络对样本图像进行特征训练，获得初步训练的模型；

二次训练模块13，用于选取测试图像，根据初步训练的模型对测试图像进行反复训练，直至模型收敛；

模型输出模块14，用于将收敛的模型作为训练好的驾驶员打电话检测模型并输出。

其中，所述样本选取模块11中样本图像的宽度为Width、高度为Height。Width∈[64,192]，Height∈[64,192]。优选地，Width选为128，Height选为128。选取的标签驾驶员打电话的彩色图像数量可以大于500，选取的标签驾驶员未打电话的彩色图像数量可以大于500，选取的标签模糊的彩色图像数量可以大于500。优选地，分别选取1000～5000000个标签驾驶员打电话、驾驶员未打电话、模糊的彩色图像为样本图像。

所述初步训练模块12中卷积神经网络包括：输入层、Th_Con个卷积层、Th_Pool个池化层、Th_Full个全连接层。其中，每层卷积层包括Th_CK个卷积核，卷积核的大小为CKSi*CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全连接层输出的神经元的数量为3，即为3个驾驶员打电话检测类别。

其中，所述Th_Con∈[2,8]，Th_Pool∈[2,8]，Th_Full∈[1,3]，Th_CK∈[Th_CK_min,Th_CK_max]，Th_CK_min∈[6,16]，Th_CK_max∈[30,512]，CKSi∈[3,7]，KSi∈[2,4]。

进一步地，所述卷积神经网络包括：

输入层，输入Width*Height的图像；

第一层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第二层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第三层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

全连接层，输出3个神经元，即3个打电话检测类别。

所述二次训练模块13进一步包括：

训练特征提取模块131，用于根据初步训练的模型提取测试图像的特征；

训练分类判定模块132，用于计算该特征与每一驾驶员打电话检测类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为候选检测类别；

反复训练模块133，用于计算判定结果与真实结果的误差，利用反向传播算法来训练模型，重复训练特征提取模块131和训练分类判定模块132，直至该模型收敛。

所述车窗的候选区域提取模块2进一步包括：

车牌区域定位模块21，用于根据车牌定位算法从采集的彩色图像中获取车牌区域；

车窗的候选区域边界获取模块22，用于根据车牌区域获取车牌区域的左边边界x＝pl、右边边界x＝pr、上边边界y＝pt、下边边界y＝pb，则车窗的候选区域的左边边界为右边边界为上边边界为下边边界为W_p为车牌区域的宽度，W为采集图像的宽度，λ3＜λ2；

车窗的候选区域获取模块23，用于根据车窗的候选区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为车窗的候选区域。

所述车牌区域定位模块21中车牌定位算法为现有的车牌定位算法。例如，“李文举，梁德群，张旗，樊鑫.基于边缘颜色对的车牌定位新方法.《计算机学报》,2004,27(2):204-208”。

所述车窗区域提取模块3进一步包括：

竖直边缘获取模块31，用于将车窗的候选区域进行灰度化处理，获取灰度的候选区域，采用滤波器，获取灰度的候选区域的竖直边缘图像；

二值图像获取模块32，用于采用阈值Th_F对数值边缘图像进行分割，获取二值图像；

直线检测模块33，用于采用Hough变换直线检测算法对二值图像进行处理，获取检测的直线序列y＝k_ix+b_i，i＝1,2,…，N₁，N₁为直线的数量；

直线筛选模块34，用于若arctan|k_i|≤Th_θ，则保留该直线，否则删除该直线，由此得到剩余的直线序列y＝k_jx+b_j，j＝1，2，…，N₂，N₂为剩余直线的数量；

上下边界获取模块35，用于扫描每条直线y＝k_jx+b_j，j＝1，2，…，N₂，获取直线y＝k_jx+b_j的第一个像素点(x_j1,y_j1)和最后一个像素点(x_j2,y_j2)，在y方向上按将直线进行分段，获取对应的x方向上的长度，并将其放入LineHist数组中，采用聚类算法对LineHist数组进行聚类，将获取的聚类值最大的两条直线分别作为上边界和下边界；

左右边界获取模块36，用于分别扫描上边界、下边界，将上边界的第一个像素点和下边界的第一个像素点构成的直线作为左边界，将上边界的最后一个像素点和下边界的最后一个像素点构成的直线作为右边界；

车窗区域获取模块37，用于由上边界、左边界、右边界、下边界围成的区域即为车窗区域。

其中，所述二值图像获取模块32中Th_F∈[10,30]。优选地，Th_F选为20。

所述直线检测模块33中Hough变换直线检测算法通过现有的技术实现。例如，“段汝娇，赵伟，黄松岭，陈建业.一种基于改进Hough变换的直线快速检测算法.《仪器仪表学报》,2010,31(12):2774-2780”。

所述直线筛选模块34中Th_θ∈[5°,15°]。优选地。Th_θ选为10°。

所述上下边界获取模块35中Th_S为采样间隔，Th_S∈[5,20]。优选地，Th_S选为12。所述聚类算法通过现有的聚类算法实现。

所述人脸区域提取模块4中的人脸检测算法可以通过现有的技术实现。例如，“郭志波，华继钊，严云洋，陈才扣，杨静宇.基于双阈值继承型AdaBoost算法的人脸快速检测.《数据采集与处理》,2008,23(3):306-310”。

所述感兴趣区域提取模块5进一步包括：

感兴趣区域边界获取模块51，用于根据人脸区域获取人脸区域的左边边界x＝fl、右边边界x＝fr、上边边界y＝ft、下边边界y＝fb，则打电话的感兴趣区域的左边边界为右边边界为上边边界为下边边界为W_f为人脸区域的宽度，W和H分别为采集图像的宽度和高度；

感兴趣区域获取模块52，用于根据打电话的感兴趣区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为感兴趣区域。

所述打电话检测模型检测模块6进一步包括：

识别特征提取模块61，用于利用训练好的打电话检测模型提取感兴趣区域的特征；

识别分类判定模块62，用于计算感兴趣区域的特征与每一类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为驾驶员打电话检测结果并输出。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，应当理解，本发明并不限于这里所描述的实现方案，这些实现方案描述的目的在于帮助本领域中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的情况下进行进一步的改进和完善，因此本发明只受到本发明权利要求的内容和范围的限制，其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等同方案。

Claims

1.一种驾驶员打电话行为的检测方法，其特征在于，该方法包括：

第二步骤，根据车牌区域获取车窗的候选区域；

第五步骤，根据人脸区域获取打电话的感兴趣区域；

2.如权利要求1所述的方法，其特征在于，所述第一步骤包括：

3.如权利要求2所述的方法，其特征在于，所述卷积神经网络包括：输入层、Th_Con个卷积层、Th_Pool个池化层、Th_Full个全连接层；

其中，每层卷积层包括Th_CK个卷积核，卷积核的大小为CKSi*CKSi、步长为1；每层池化层的核的大小为KSi*KSi、步长为KSi；所述全连接层的最后一层全连接层输出的神经元的数量为3，即为3个驾驶员打电话检测类别；

Th_Con∈[2,8]，Th_Pool∈[2,8]，Th_Full∈[1,3]，Th_CK∈[Th_CK_min,Th_CK_max]，Th_CK_min∈[6,16]，Th_CK_max∈[30,512]，CKSi∈[3,7]，KSi∈[2,4]。

4.如权利要求3所述的方法，其特征在于，所述卷积神经网络包括：

输入层，输入Width*Height的图像；

第一层卷积层，输出Th_CK1个卷积核，卷积核的大小为CKSi1*CKSi1、步长为 1；

第一层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第二层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第三层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

全连接层，输出3个神经元，即3个打电话检测类别；

其中，Width∈[64,192]，Height∈[64,192]；Th_CK1∈[6,20]，CKSi1∈[3,5]，KSi∈[2,4]，Th_CK2∈[6,40]，CKSi2∈[3,5]，Th_CK3∈[6,40]，CKSi3∈[3,5]，Th_Neur∈[64,10000]。

5.如权利要求2所述的方法，所述二次训练步骤包括：

6.如权利要求1所述的方法，其特征在于，所述第二步骤包括：

车窗的候选区域输出步骤，根据车窗的候选区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为车窗的候选区域；

其中，λ1∈[1.2,1.8]，λ2∈[4.2,4.8]，λ3∈[0.3,0.8]。

7.如权利要求1所述的方法，其特征在于，所述第三步骤包括：

二值图像获取步骤，采用阈值Th_F对数值边缘图像进行分割，获取二值图像；直线检测步骤，采用Hough变换直线检测算法对二值图像进行处理，获取检测的直线序列y＝k_ix+b_i，i＝1，2，…，N₁，N₁为直线的数量；

车窗区域获取步骤，由上边界、左边界、右边界、下边界围成的区域即为车窗区域；

其中，Th_F∈[10,30]，Th_θ∈[5°,15°]，Th_S∈[5,20]。

8.如权利要求1所述的方法，其特征在于，所述第五步骤包括：

感兴趣区域获取步骤，根据打电话的感兴趣区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为感兴趣区域；

其中，λ4∈[0.8,1.3]，λ5∈[0.3,0.8]，λ6∈[0.3,0.8]。

9.如权利要求1所述的方法，其特征在于，所述第六步骤包括：

10.一种驾驶员打电话行为的检测装置，其特征在于，该装置包括：

11.如权利要求10所述的装置，其特征在于，所述打电话检测模型获取模块包括：

12.如权利要求11所述的装置，其特征在于，所述卷积神经网络包括：输入层、Th_Con个卷积层、Th_Pool个池化层、Th_Full个全连接层；

13.如权利要求12所述的装置，其特征在于，所述卷积神经网络包括：

输入层，输入Width*Height的图像；

第一层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第二层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

第三层池化层，采用最大池化法输出KSi*KSi、步长为KSi的核；

全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

全连接层，输出3个神经元，即3个打电话检测类别；

14.如权利要求11所述的装置，所述二次训练模块包括：

15.如权利要求10所述的装置，其特征在于，所述车窗的候选区域提取模块包括：

车牌区域定位模块，用于根据车牌定位算法从采集的彩色图像中获取车牌区域；车窗的候选区域边界获取模块，用于根据车牌区域获取车牌区域的左边边界x＝pl、右边边界x＝pr、上边边界y＝pt、下边边界y＝pb，则车窗的候选区域的左边边界为右边边界为上边边界为下边边界为W_p为车牌区域的宽度，W为采集图像的宽度，λ3＜λ2；

车窗的候选区域获取模块，用于根据车窗的候选区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为车窗的候选区域；

其中，λ1∈[1.2,1.8]，λ2∈[4.2,4.8]，λ3∈[0.3,0.8]。

16.如权利要求10所述的装置，其特征在于，所述车窗区域提取模块包括：

直线检测模块，用于采用Hough变换直线检测算法对二值图像进行处理，获取检测的直线序列y＝k_ix+b_i，i＝1，2，…，N₁，N₁为直线的数量；

车窗区域获取模块，用于由上边界、左边界、右边界、下边界围成的区域即为车窗区域；

其中，Th_F∈[10,30]，Th_θ∈[5°,15°]，Th_S∈[5,20]。

17.如权利要求10所述的装置，其特征在于，所述感兴趣区域提取模块包括：感兴趣区域边界获取模块，用于根据人脸区域获取人脸区域的左边边界x＝fl、右边边界x＝fr、上边边界y＝ft、下边边界y＝fb，则打电话的感兴趣区域的左边边界为右边边界为上边边界为下边边界为W_f为人脸区域的宽度，W和H分别为采集图像的宽度和高度；

感兴趣区域获取模块，用于根据打电话的感兴趣区域的左边边界、右边边界、上边边界、下边边界，确定矩形区域，该矩形区域即为感兴趣区域；

其中，λ4∈[0.8,1.3]，λ5∈[0.3,0.8]，λ6∈[0.3,0.8]。

18.如权利要求10所述的装置，其特征在于，所述打电话检测模型检测模块包括：

识别特征提取模块，用于利用训练好的打电话检测模型提取感兴趣区域的特征；识别分类判定模块，用于计算感兴趣区域的特征与每一类别特征的相似度Simi_k，k表示第k个类别，k＝{1，2，3}，选取Simi_k值最大的类别作为驾驶员打电话检测结果并输出。