CN104573659B

CN104573659B - 一种基于svm的驾驶员接打***控方法

Info

Publication number: CN104573659B
Application number: CN201510013139.4A
Authority: CN
Inventors: 张卡; 何佳; 曹昌龙; 尼秀明
Original assignee: ANHUI QINGXIN INTERNET INFORMATION TECHNOLOGY Co Ltd
Current assignee: ANHUI QINGXIN INTERNET INFORMATION TECHNOLOGY Co Ltd
Priority date: 2015-01-09
Filing date: 2015-01-09
Publication date: 2018-01-09
Anticipated expiration: 2035-01-09
Also published as: CN104573659A

Abstract

本发明涉及一种基于svm的驾驶员接打***控方法，该监控方法包括以下顺序的步骤：建立人脸检测分类器和以接打电话时手部图像为训练正样本的手部检测分类器；实时采集驾驶员的驾驶状态图像；选择合适的图像子区域作为手部运动检测和接打电话检测的有效检测区域；根据有效检测区域图像，实时判断驾驶员是否存在接打电话的准备动作；根据有效检测区域图像，详细监视驾驶员的手停留在耳朵旁边的时间，并根据停留时间的长短判断驾驶员是否正在接打电话；将驾驶员接打电话的实时视频发送至远程服务器，并接收远程服务器发送的命令。

Description

一种基于svm的驾驶员接打***控方法

技术领域

本发明涉及安全驾驶技术领域，具体涉及一种基于svm的驾驶员接打***控方法。

背景技术

随着汽车保有量的快速增长，人们在享受到交通的便利和快捷的同时，也伴随着各类交通事故的频发，造成巨大的人员和经济损失。造成交通事故的因素很多，驾驶员开车途中接打电话是重要的诱因之一。由于无法实时获取驾驶员的驾驶行为视频，一些客运和货运企业的监管部门只能以事后的推断作为划分责任的依据，无法进行事前的监控和预防。因此，实时的监控驾驶员的接打电话行为，及时反馈给运输企业监管部门进行预防，对于避免重大交通事故，起着无可替代的作用。

支持向量机(svm)是一种有监督学习算法，它在解决小样本、非线性及高维模式识别中表现出许多特有的优势，该方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的，根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折中，以期获得最好的推广能力(或称泛化能力)。

目前，对于驾驶员接打电话行为的监控，常用的技术方法有以下几种：

(1)基于手机信号进行监控，该类方法通过在驾驶室里放置一个手机信号检测器，根据信号波动的不同程度，判断是否存在接打电话行为。该类方法在货运车辆上可以达到监控接打电话的效果。但是在客运车辆上，存在较多的干扰，如客车上乘客的手机信号干扰等，存在严重的漏检和误检，无法实现实时全面的监控驾驶员接打电话行为。

(2)基于视频图像进行监控，该类方法通过实时监控驾驶员双手是否放在方向盘上，一旦出现某只手离开方向盘，即被认为是在接打电话。该类方法存在严重的误检，因为很多驾驶员存在一只手扶方向盘的习惯，因此，该方法在实际环境中使用会有较大的问题。

发明内容

本发明的目的在于提供一种基于svm的驾驶员接打***控方法，该监控方法是基于视频图像处理技术，通过实时监控驾驶员耳朵区域手部的状态来判断接打电话行为，具有监控准确度高，漏检误检较少，速度快，成本低等特点。

本发明的技术方案为：

一种基于svm的驾驶员接打***控方法，该监控方法包括以下顺序的步骤：

(1)建立人脸检测分类器和以接打电话时手部图像为训练正样本的手部检测分类器；

(2)实时采集驾驶员的驾驶状态图像；

(3)选择合适的图像子区域作为手部运动检测和接打电话检测的有效检测区域；

(4)根据有效检测区域图像，实时判断驾驶员是否存在接打电话的准备动作；若是，则执行步骤(5)；若否，则返回执行步骤(2)；

(5)根据有效检测区域图像，详细监视驾驶员的手停留在耳朵旁边的时间，并根据驾驶员的手停留在耳朵旁边的时间长短判断驾驶员是否正在接打电话；若是，则执行步骤(6)；若否，则返回执行步骤(2)；

(6)将驾驶员接打电话的实时视频发送至远程服务器，并接收远程服务器发送的命令。

步骤(3)中，所述的选择合适的图像子区域作为手部运动检测和接打电话检测的有效检测区域，具体包括以下顺序的步骤：

(31)采用harr特征和adaboost分类算法，检测人脸位置；

(32)根据人脸的三庭五眼布局规律，粗定位左、右两眼的位置；

(33)精确定位出眼睛的位置；

(34)选择合适的有效图像子区域。

步骤(4)中，所述的根据有效检测区域图像，实时判断驾驶员是否存在接打电话的准备动作，具体包括以下顺序的步骤：

(41)在左、右有效检测区域内分别进行均匀点采样；

(42)进行采样点的精确跟踪；

(43)获取正确跟踪采样点的运动信息；

(44)获取有效检测区域的统计特征，所述的检测区域的统计特征包括左有效检测区域的平均运动强度avem_l、右有效检测区域的平均运动强度avem_r、左有效检测区域的运动广度R_l和右有效检测区域的运动广度R_r；

(45)判断是否存在抬手靠近耳朵的动作。

步骤(5)中，所述的根据有效检测区域图像，详细监视驾驶员的手停留在耳朵旁边的时间，并根据驾驶员的手停留在耳朵旁边的时间长短判断驾驶员是否正在接打电话；具体包括以下顺序的步骤：

(51)将有效检测区域图像作为当前图像，计算当前图像的梯度特征，并对梯度方向角度进行校正，将梯度方向的范围限定在[0 π]；

(52)构造一个宽为W、高为H的矩形检测窗口，W和H的值分别等于手部训练器的训练样本的宽高值，并对矩形检测窗口进行子窗口划分；

(53)将矩形检测窗口以一定步长在有效检测区域内滑动，判断矩形检测窗口覆盖的区域是否存在手部图像；

(54)判断矩形检测窗口是否滑动到当前图像的结尾处；若是，则执行步骤(55)；若否，则矩形检测窗口滑动到下一个位置，再次执行步骤(53)；

(55)设当前图像的宽为W_image，高为H_image，对当前图像进行尺度变换，进行尺度变换后的图像的宽为σW_image，高为σH_image，将进行尺度变换后的图像设为当前图像；其中，0＜σ＜1；

(56)判断当前图像的尺寸是否小于最低门限；若当前图像的尺寸小于最低门限，则执行步骤(57)；若当前图像的尺寸大于最低门限，则返回执行步骤(51)；

(57)根据候选区域列表中的候选目标的个数和位置，综合判断当前帧中手部的位置；

(58)判断累积帧数是否达到单位帧数；若是，则执行步骤(59)；若否，则返回执行步骤(51)；

(59)统计单位帧数内，存在手部图像的帧数所占比例；并根据手部图像的帧数所占比例判断驾驶员是否正处于接打电话状态。

步骤(34)中，所述的选择合适的有效图像子区域，具体采用以下公式实现：

其中，rect_left、rect_right分别表示选择的左、右耳朵附近矩形子区域，rect表示检测到的人脸位置矩形区域，point_l、point_r分别表示左眼的左边缘点和右眼的右边缘点。

步骤(43)中，所述的获取正确跟踪采样点的运动信息，具体采用以下公式实现：

其中，M(i)表示第i个采样点的运动幅值，θ(i)表示第i个采样点的运动方向，xpoint_i表示第i个采样点在当前帧上的坐标，ypoint_i表示第i个采样点在上一帧上的坐标，Dx表示某个采样点在x方向的运动量，Dy表示某个采样点在y方向的运动量。

步骤(44)中，所述的获取有效检测区域的统计特征，具体采用以下公式实现：

其中，sum_l表示左检测区域内具有明显运动的采样点的运动幅值，N_ml表示左检测区域内具有明显运动的采样点的数目，N_l表示左检测区域内具有明显运动且向耳朵靠近的采样点的数目；

sum_r表示右检测区域内具有明显运动的采样点的运动幅值，N_mr表示右检测区域内具有明显运动的采样点的数目，N_r表示右检测区域内具有明显运动且向耳朵靠近的采样点的数目；

M_l(i)表示左检测区域内第i个正确跟踪采样点的运动幅值，θ_l(i)表示左检测区域内第i个正确跟踪采样点的运动方向；

M_r(i)表示右检测区域内第i个正确跟踪采样点的运动幅值，θ_r(i)表示右检测区域内第i个正确跟踪采样点的运动方向。

步骤(45)中，所述的判断是否存在抬手靠近耳朵的动作，具体采用以下公式实现：

其中，exist＝1表示存在抬手靠近耳朵的动作，exist＝0表示不存在抬手靠近耳朵的动作，s_l表示在左侧有效检测区域内是否存在抬手靠近耳朵的动作；s_r表示在右侧有效检测区域内是否存在抬手靠近耳朵的动作；T_ml表示在左侧有效检测区域内抬手靠近耳朵时运动强度阈值；T_θl表示在左侧有效检测区域内抬手靠近耳朵时的运动广度阈值；T_mr表示在右侧有效检测区域内抬手靠近耳朵时运动强度阈值；T_θr表示在右侧有效检测区域内抬手靠近耳朵时的运动广度阈值；T_mlb表示在左侧有效检测区域内，标准的抬手靠近耳朵时的平均运动强度；T_θlb表示在左侧有效检测区域内，标准的抬手靠近耳朵时的平均运动广度；T_mrb表示在右侧有效检测区域内，标准的抬手靠近耳朵时的平均运动强度；T_θrb表示在右侧有效检测区域内，标准的抬手靠近耳朵时的平均运动广度。

步骤(51)中，所述的计算当前图像的梯度特征，并对梯度方向角度进行校正，具体采用以下公式实现：

其中，M(x,y)、θ(x,y)分别表示像素(x,y)处的梯度幅值和梯度方向，f(x,y)表示像素(x,y)处的灰度值。Gx表示像素(x,y)处x方向的偏导数，Gy表示像素(x,y)处y方向的偏导数。

步骤(53)中，所述的将矩形检测窗口以一定步长在有效检测区域内滑动，判断矩形检测窗口覆盖的区域是否存在手部图像；具体采用以下顺序的步骤实现：

(531)统计每一个子窗口覆盖区域的梯度直方图；

(532)获取矩形检测窗口覆盖区域的特征向量；

(533)将矩形检测窗口覆盖区域的特征向量进行归一化处理；

(534)将矩形检测窗口覆盖区域的特征向量送入手部svm分类器，预测其所属类别；若手部svm分类器预测该特征向量属于手部图像，则将矩形检测窗口所在位置加入候选区域列表中。

相比其它驾驶员接打***控方法，本发明采用视频图像处理技术，通过触发监控模式实时监控驾驶员耳朵区域的手部存在状态，判定接打电话行为，具有监控准确度高，漏检误检较少，速度快，成本低等特点。

附图说明

图1是本发明的方法流程图；

图2是触发模块工作流程图；

图3是监控模块工作流程图；

图4是训练正样本样图；

图5是定位有效检测区域示意图；

图6是点采样效果图；

图7是矩形检测窗口的子窗口划分示意图；

图8是矩形检测窗口滑动示意图；

图9是手部候选检测位置效果图，其中，矩形框1是有效检测区域，矩形框2是候选检测区域；

图10是手部最终检测位置效果图，其中，矩形框1是有效检测区域，矩形框2是最终检测位置。

具体实施方式

下面结合附图进一步说明本发明。

如图1所示，实施例中，本发明所述基于svm的驾驶员接打***控***包含初始化模块、采集模块、定位模块、触发模块、监控模块和通信模块。该基于svm的驾驶员接打***控***的具体实施步骤如下：

S1、执行初始化模块。

初始模块的功能是，加载和训练***必须的分类器文件，具体步骤如下：

S11、加载已有的人脸检测分类器文件。

S12、如图4所示，收集接打电话时手部图像作为正样本，基于svm理论训练手部检测分类器文件。

S2、执行采集模块。

采集模块的功能是，实时采集驾驶员的驾驶状态图像，主要是驾驶员的头部图像。

S3、执行定位模块。

定位模块的功能是，选择合适的图像子区域作为手部运动检测和接打电话检测的有效区域，主要是选择左、右耳朵附近的局部区域。该模块可以极大的提升检测速度，去除更多的干扰区域，如图5所示。该模块的具体步骤如下：

S31、采用harr特征和adaboost分类算法，检测人脸位置。

S32、基于人脸的三庭五眼布局规律，粗定位左、右两眼的位置。

S33、精确定位出眼睛的位置。

S34、采用公式(1)和公式(2)选择合适的有效图像子区域。

S4、判断触发模块开闭状态，若触发模块处于开启状态，则执行步骤S5，若触发模块处于关闭状态，则执行步骤S7。

S5、执行触发模块。

触发模块的功能是，实时判断驾驶员是否存在接打电话的准备动作，具体是指驾驶员是否存在抬手靠近耳朵的动作。如果存在，说明驾驶员有可能准备接打电话，此时退出触发模块，返回开启监控模块信号；如果不存在该动作，***会继续进行实时判断，等待下一次接打电话准备动作的出现。如图2所示，该模块的具体步骤如下：

S51、在左、右有效检测区域内分别进行均匀点采样，效果如图6。

S52、进行采样点的精确跟踪。具体跟踪算法参见文献：Forward-Backward Error:Automatic Detection of Tracking Failures，Zdenek Kalal，Krystian Mikolajczyk，Jiri Matas，Pattern Recognition (ICPR)，2010 20th International Conference on。

S53、采用公式(3)和公式(4)获取正确跟踪采样点的运动信息；

S54、采用公式(5)和公式(6)获取有效检测区域的统计特征。所述的有效检测区域的统计特征包括左边有效检测区域的平均运动强度avem_l、右边有效检测区域的平均运动强度avem_r、左边有效检测区域的运动广度R_l和右边有效检测区域的运动广度R_r。

其中，sum_l表示左检测区域内具有明显运动的采样点的运动幅值，N_ml表示左检测区域内具有明显运动的采样点的数目，N_l表示左检测区域内具有明显运动且向耳朵靠近的采样点的数目；sum_r表示右检测区域内具有明显运动的采样点的运动幅值，N_mr表示右检测区域内具有明显运动的采样点的数目，N_r表示右检测区域内具有明显运动且向耳朵靠近的采样点的数目；M_l(i)表示左检测区域内第i个正确跟踪采样点的运动幅值，θ_l(i)表示左检测区域内第i个正确跟踪采样点的运动方向；M_r(i)表示右检测区域内第i个正确跟踪采样点的运动幅值，θ_r(i)表示右检测区域内第i个正确跟踪采样点的运动方向。

S55、采用公式(7)-(10)，判断是否存在抬手靠近耳朵的动作。若存在，则退出触发模块；若否，则继续执行触发模块。

其中，exist＝1表示存在抬手靠近耳朵的动作，exist＝0表示不存在抬手靠近耳朵的动作。s_l表示在左侧有效检测区域内是否存在抬手靠近耳朵的动作；s_r表示在右侧有效检测区域内是否存在抬手靠近耳朵的动作；T_ml表示在左侧有效检测区域内抬手靠近耳朵时运动强度阈值；T_θl表示在左侧有效检测区域内抬手靠近耳朵时的运动广度阈值；T_mr表示在右侧有效检测区域内抬手靠近耳朵时运动强度阈值；T_θr表示在右侧有效检测区域内抬手靠近耳朵时的运动广度阈值；T_mlb表示在左侧有效检测区域内，标准的抬手靠近耳朵时的平均运动强度；T_θlb表示在左侧有效检测区域内，标准的抬手靠近耳朵时的平均运动广度；T_mrb表示在右侧有效检测区域内，标准的抬手靠近耳朵时的平均运动强度；T_θrb表示在右侧有效检测区域内，标准的抬手靠近耳朵时的平均运动广度。

S6、判断是否触发监控模块。若存在接打电话的准备动作，则监控模块将被触发开启，进行详细监控，同时关闭触发模块。若不存在接打电话的准备动作，则直接回到采集模块，进行下一次的触发判断。

S7、执行监控模块。

监控模块的功能是，详细监视驾驶员的手停留在耳朵旁边的时间。若驾驶员的手停留在耳朵旁边的时间足够长，说明驾驶员正在接打电话，则返回开启通信模块信号。若否，则说明本次触发开启属于误判。如图3所示，该模块的具体步骤如下：

S71、使用有效检测区域图像作为当前图像，采用公式(11)和公式(12)，计算当前图像的梯度特征，并采用公式(13)对梯度方向角度进行校正，将梯度方向的范围限定在[0π]。

其中，M(x,y)、θ(x,y)表示像素(x,y)处的梯度幅值和梯度方向，f(x,y)表示像素(x,y)处的灰度值。

S72、构造一个宽高分别为W和H的矩形检测窗口，W和H的值等于手部svm分类器的训练样本的宽高值。如图7所示，对矩形检测窗口进行子窗口划分。划分依据为：驾驶员不接电话时，由于耳朵旁边没有手的干扰，此时有效检测区域内的头部轮廓总体上是竖直的，因此，选择纵向窄矩形区域作为子窗口是合理的。

S73、如图8所示，将矩形检测窗口以一定步长在有效检测区域内滑动，并判断矩形检测窗口覆盖的区域是否存在手部图像，具体步骤如下：

S731、采用公式(14)统计每一个子窗口覆盖区域的梯度直方图hist[bin]。

其中，floor(x)表示选取不大于x的最大整数，bin的取值范围是1～10。

S732、串联所有子窗口覆盖区域的梯度直方图，获取检测窗口覆盖区域的特征向量。

S733、将矩形检测窗口覆盖区域的特征向量归一化；

S734、判断检测窗口覆盖区域是否属于手部图像，效果如图9。图9中，方框1表示左右有效检测区域，方框2表示矩形检测窗口覆盖区域属于手部图像。具体方法是将检测窗口覆盖区域的特征向量送入手部svm分类器，预测其所属类别。若属于手部图像，则将矩形检测窗口所在位置放入候选区域列表中。

S74、判断检测窗口是否滑动到当前图像的结尾处。若未到达图像结尾，则矩形检测窗口滑动到下一个位置，并再次执行步骤S73；若已到达图像结尾，则执行步骤S75。

S75、设当前图像尺寸为W_image、H_image，对当前图像进行尺度变换，则尺度变换后图像尺寸变为σW_image、σH_image，并将尺度变换后的图像记为当前图像。其中0＜σ＜1。

S76、判断当前图像尺寸是否小于最低门限。若小于门限，则说明当前图像过小，已经不可能存在手部，执行步骤S77；若大于门限，则说明当前图像中仍有可能存在手部，执行步骤S71继续检测过程。

S77、根据候选区域列表中的候选目标的个数和位置，综合判断当前帧中手部的位置，效果如图10。图10中，方框1表示左右有效检测区域，方框2表示矩形检测窗口覆盖区域属于手部图像。

S78、判断累积帧数是否达到单位帧数。若达到，则执行步骤S79；若否，则执行步骤S71继续检测过程。

S79、统计单位帧数内，存在手部图像的帧数所占比例。若该比例大于一定阈值，则说明当前驾驶员正处于接打电话状态。

S710、开启触发模块，关闭监控模块。

S8、执行通信模块。

通信模块的功能是，当驾驶员处于接打电话状态时，该模块向远程服务器发送驾驶员接打电话的实时视频，此时运输企业监管部门可以通过该视频进行及时的处理；如果需要和驾驶员通话，还可以通过该模块接收远程命令。

以上所述实施方式仅仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案作出的各种变形和改进，均应落入本发明的权利要求书确定的保护范围内。

Claims

1.一种基于svm的驾驶员接打***控方法，其特征在于：该监控方法包括以下顺序的步骤：

(2)实时采集驾驶员的驾驶状态图像；

(6)将驾驶员接打电话的实时视频发送至远程服务器，并接收远程服务器发送的命令；

(41)在左、右有效检测区域内分别进行均匀点采样；

(42)进行采样点的精确跟踪；

(43)获取正确跟踪采样点的运动信息；

(45)判断是否存在抬手靠近耳朵的动作；

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mi>M</mi> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>=</mo> <mi>s</mi> <mi>q</mi> <mi>r</mi> <mi>t</mi> <mo>(</mo> <msup> <msub> <mi>D</mi> <mi>x</mi> </msub> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>D</mi> <mi>y</mi> </msub> <mn>2</mn> </msup> <mo>)</mo> </mtd> </mtr> <mtr> <mtd> <mi>&theta;</mi> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>=</mo> <mi>a</mi> <mi>r</mi> <mi>c</mi> <mi>t</mi> <mi>a</mi> <mi>n</mi> <mo>(</mo> <mfrac> <msub> <mi>D</mi> <mi>y</mi> </msub> <msub> <mi>D</mi> <mi>x</mi> </msub> </mfrac> <mo>)</mo> </mtd> </mtr> </mtable> </mfenced>

其中，M(i)表示第i个采样点的运动幅值，θ(i)表示第i个采样点的运动方向，xpoint_i表示第i个采样点在当前帧上的坐标，ypoint_i表示第i个采样点在上一帧上的坐标，Dx表示某个采样点在x方向的运动量，Dy表示某个采样点在y方向的运动量；

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>sum</mi> <mi>l</mi> </msub> <mo>=</mo> <msub> <mi>sum</mi> <mi>l</mi> </msub> <mo>+</mo> <msub> <mi>M</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>2</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>N</mi> <mrow> <mi>m</mi> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>N</mi> <mrow> <mi>m</mi> <mn>1</mn> </mrow> </msub> <mo>+</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>2</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>N</mi> <mi>l</mi> </msub> <mo>=</mo> <msub> <mi>N</mi> <mi>l</mi> </msub> <mo>+</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>2</mn> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mfrac> <mi>&pi;</mi> <mn>4</mn> </mfrac> <mo><</mo> <msub> <mi>&theta;</mi> <mi>l</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&le;</mo> <mfrac> <mi>&pi;</mi> <mn>2</mn> </mfrac> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>sum</mi> <mi>r</mi> </msub> <mo>=</mo> <msub> <mi>sum</mi> <mi>r</mi> </msub> <mo>+</mo> <msub> <mi>M</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>2</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>N</mi> <mrow> <mi>m</mi> <mi>r</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>N</mi> <mrow> <mi>m</mi> <mi>r</mi> </mrow> </msub> <mo>+</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>2</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>N</mi> <mi>r</mi> </msub> <mo>=</mo> <msub> <mi>N</mi> <mi>r</mi> </msub> <mo>+</mo> <mn>1</mn> </mrow> </mtd> <mtd> <mrow> <msub> <mi>M</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>2</mn> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mfrac> <mi>&pi;</mi> <mn>2</mn> </mfrac> <mo><</mo> <msub> <mi>&theta;</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&le;</mo> <mfrac> <mrow> <mn>3</mn> <mo>*</mo> <mi>&pi;</mi> </mrow> <mn>4</mn> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced>

M_r(i)表示右检测区域内第i个正确跟踪采样点的运动幅值，θ_r(i)表示右检测区域内第i个正确跟踪采样点的运动方向；

<mrow> <mi>e</mi> <mi>x</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <msub> <mi>s</mi> <mi>l</mi> </msub> <mo>+</mo> <msub> <mi>s</mi> <mi>r</mi> </msub> <mo>=</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <msub> <mi>s</mi> <mi>l</mi> </msub> <mo>+</mo> <msub> <mi>s</mi> <mi>r</mi> </msub> <mo>&NotEqual;</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

<mrow> <msub> <mi>s</mi> <mi>l</mi> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <msub> <mi>avem</mi> <mi>l</mi> </msub> <mo>&GreaterEqual;</mo> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>l</mi> </mrow> </msub> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <msub> <mi>R</mi> <mi>l</mi> </msub> <mo>&GreaterEqual;</mo> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>l</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <msub> <mi>avem</mi> <mi>l</mi> </msub> <mo><</mo> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>l</mi> </mrow> </msub> <mi>o</mi> <mi>r</mi> <mi> </mi> <msub> <mi>R</mi> <mi>l</mi> </msub> <mo><</mo> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>l</mi> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

<mrow> <msub> <mi>s</mi> <mi>r</mi> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <msub> <mi>avem</mi> <mi>r</mi> </msub> <mo>&GreaterEqual;</mo> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>r</mi> </mrow> </msub> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <msub> <mi>R</mi> <mi>r</mi> </msub> <mo>&GreaterEqual;</mo> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>r</mi> </mrow> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <msub> <mi>avem</mi> <mi>r</mi> </msub> <mo><</mo> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>r</mi> </mrow> </msub> <mi>o</mi> <mi>r</mi> <mi> </mi> <msub> <mi>R</mi> <mi>r</mi> </msub> <mo><</mo> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>r</mi> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>l</mi> <mi>b</mi> </mrow> </msub> <mo>*</mo> <mn>0.7</mn> </mtd> </mtr> <mtr> <mtd> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>l</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>l</mi> <mi>b</mi> </mrow> </msub> <mo>*</mo> <mn>0.7</mn> </mtd> </mtr> <mtr> <mtd> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>r</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>T</mi> <mrow> <mi>m</mi> <mi>r</mi> <mi>b</mi> </mrow> </msub> <mo>*</mo> <mn>0.7</mn> </mtd> </mtr> <mtr> <mtd> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>r</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>T</mi> <mrow> <mi>&theta;</mi> <mi>r</mi> <mi>b</mi> </mrow> </msub> <mo>*</mo> <mn>0.7</mn> </mtd> </mtr> </mtable> </mfenced>

其中，exist＝1表示存在抬手靠近耳朵的动作，exist＝0表示不存在抬手靠近耳朵的动作；s_l表示在左侧有效检测区域内是否存在抬手靠近耳朵的动作；s_r表示在右侧有效检测区域内是否存在抬手靠近耳朵的动作；

T_ml表示在左侧有效检测区域内抬手靠近耳朵时运动强度阈值；T_θl表示在左侧有效检测区域内抬手靠近耳朵时的运动广度阈值；T_mr表示在右侧有效检测区域内抬手靠近耳朵时运动强度阈值；T_θr表示在右侧有效检测区域内抬手靠近耳朵时的运动广度阈值；

T_mlb表示在左侧有效检测区域内，标准的抬手靠近耳朵时的平均运动强度；T_θlb表示在左侧有效检测区域内，标准的抬手靠近耳朵时的平均运动广度；T_mrb表示在右侧有效检测区域内，标准的抬手靠近耳朵时的平均运动强度；T_θrb表示在右侧有效检测区域内，标准的抬手靠近耳朵时的平均运动广度。

2.根据权利要求1所述的一种基于svm的驾驶员接打***控方法，其特征在于：步骤(3)中，所述的选择合适的图像子区域作为手部运动检测和接打电话检测的有效检测区域，具体包括以下顺序的步骤：

(31)采用harr特征和adaboost分类算法，检测人脸位置；

(33)精确定位出眼睛的位置；

(34)选择合适的有效图像子区域。

3.根据权利要求1所述的一种基于svm的驾驶员接打***控方法，其特征在于：步骤(5)中，所述的根据有效检测区域图像，详细监视驾驶员的手停留在耳朵旁边的时间，并根据驾驶员的手停留在耳朵旁边的时间长短判断驾驶员是否正在接打电话；具体包括以下顺序的步骤：

(51)将有效检测区域图像作为当前图像，计算当前图像的梯度特征，并对梯度方向角度进行校正，将梯度方向的范围限定在[0π]；

4.根据权利要求2所述的一种基于svm的驾驶员接打***控方法，其特征在于：步骤(34)中，所述的选择合适的有效图像子区域，具体采用以下公式实现：

5.根据权利要求3所述的一种基于svm的驾驶员接打***控方法，其特征在于：步骤(51)中，所述的计算当前图像的梯度特征，并对梯度方向角度进行校正，具体采用以下公式实现：

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mi>M</mi> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> <mo>=</mo> <msqrt> <mrow> <msup> <msub> <mi>G</mi> <mi>x</mi> </msub> <mn>2</mn> </msup> <mo>+</mo> <msup> <msub> <mi>G</mi> <mi>y</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>a</mi> <mi>r</mi> <mi>c</mi> <mi>t</mi> <mi>a</mi> <mi>n</mi> <mrow> <mo>(</mo> <mfrac> <msub> <mi>G</mi> <mi>y</mi> </msub> <msub> <mi>G</mi> <mi>x</mi> </msub> </mfrac> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced>

<mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>&pi;</mi> </mrow> </mtd> <mtd> <mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo><</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

其中，M(x,y)、θ(x,y)分别表示像素(x,y)处的梯度幅值和梯度方向，f(x,y)表示像素(x,y)处的灰度值；Gx表示像素(x,y)处x方向的偏导数，Gy表示像素(x,y)处y方向的偏导数。

6.根据权利要求3所述的一种基于svm的驾驶员接打***控方法，其特征在于：步骤(53)中，所述的将矩形检测窗口以一定步长在有效检测区域内滑动，判断矩形检测窗口覆盖的区域是否存在手部图像；具体采用以下顺序的步骤实现：

(531)统计每一个子窗口覆盖区域的梯度直方图；

(532)获取矩形检测窗口覆盖区域的特征向量；

(533)将矩形检测窗口覆盖区域的特征向量进行归一化处理；