(二)、背景技术:在传统的视频监控环境下,监控管理人员往往要对监控视频画面中搜索出的人脸进行仔细观察并与嫌疑犯人的图片进行比对,一旦需要关注的前端视频画面或嫌疑人过多,将十分耗费人的精力。随着人工智能和计算机图像技术的飞速发展,实时人脸检测和识别技术不断取得新的发展,这些技术在一定程度上能够替代管理人员对监控画面中出现的人脸自动进行检测、识别。相对于指纹、虹膜、掌纹、语音等其他识别技术,人脸识别具有可以隐藏操作,非接触式采集,没有侵犯性,图像采集设备成本低等特点。人脸识别技术将广泛地应用于公安、银行、机场、车站、码头、商场、考场等众多公共场所与领域。
视频监控下的人脸识别技术涉及到多个领域的专业知识。虽在国内外取得了一些应用成果,还未取得类似指纹识别和虹膜识别的类似的满意结果。目前的人脸识别技术受人脸区域的光照、遮挡、尺度或移动等因素影响,人脸识别算法的性能达不到预想效果。
(三)、发明内容:
本发明要解决的技术问题是:克服现有技术的缺陷,提供一种识别准确的人脸识别方法。
本发明的技术方案:
一种人脸识别方法,首先,采用摄像机进行视频图像的采集,并将摄像机输出的视频信号送到工作站或高性能计算机中,工作站或高性能计算机将接收到的视频流数据按帧存储在自身的存储器中,接着按下列步骤进行人脸识别:
步骤1:从存储器中按顺序取出一帧图像数据进行图像预处理,该图像预处理含有光照补偿和中值滤波操作;一方面,人脸图像会随着光照强度的改变而改变,光照变化是影响人脸检测性能的关键因素之一,光照条件不好,尤其是偏光、暗光、强光破坏了人脸模式的灰度特征,因此,采用光照补偿算法来弱化光照对人脸检测的影响。另一方面,在实际图像拍摄中一般会携带随机噪声和干扰噪声,如果对噪声不处理直接进行人脸检测,肯定会影响检测的效果,对检测结果带来很大的误差。因此在进行人脸检测之前尽量先去噪,使用中心滤波器对每帧图像数据进行中值滤波处理。
步骤2:对图像预处理后的帧数据进行人脸检测:首先建立起反应人脸目标形状变化规律的形状统计模型和反应人脸目标灰度分布规律的局部灰度模型,局部灰度模型通过训练得到;然后,利用局部灰度模型进行人脸搜索,利用形状统计模型对搜索到的形状进行近似表达,同时对合理性进行判断,对不合理的形状进行调整以保证形状在统计意义上的合理性;如果检测到有人脸目标,则执行步骤3,如果没有检测到人脸目标,则执行步骤1;
步骤3:对检测到的当前帧图像数据中存在的人脸图片进行人脸图片尺度变换处理和人脸图片灰度归一化处理;
步骤4:采用DCT(Discreat Cosine Transform,离散余玄变换)算法和MMSD(Multiple Maximum Scatter Difference,最大散度差)算法相结合的人脸识别算法,先对预先采集到的人脸数据库的人脸图片进行二维DCT变换,然后再对二维DCT变换后的变换系数矩阵应用MMSD算法进行特征提取,获得最优特征鉴别矩阵W;
最优特征鉴别矩阵W的计算过程为:首先,对预先采集到的人脸数据库的每个样本做二维DCT变换,得到的变换系数矩阵为T={x1,x2,...,xi...,xN},其中,xi为每个样本经过二维DCT变换后得到的变换系数向量,N是人脸数据库的样本数;
然后,依据变换系数矩阵T计算类间散度矩阵Sw和类内散度矩阵Sb;
最后,基于MMSD算法获得人脸数据库的最优特征鉴别矩阵W;
步骤5:将步骤3中经过尺度变换处理和灰度归一化处理后的人脸图片先经过二维DCT变换,然后再投影到步骤4中的最优特征鉴别矩阵W,利用最近邻分类方法匹配人脸图片,利用欧式距离进行测度运算,运算公式如下:
其中,Y为人脸图片经过二维DCT变换后投影到最优特征鉴别矩阵W的向量,Zj=WTxj,WT为W的转置,xj是变换系数矩阵T的第j列数据,j=1,2,...,N,yk表示Y的第k个值,zjk表示Zj的第k个值,dist(Y,Zj)为Y和Zj的欧氏距离,m为Y的列数;
人脸识别的最终结果为:
r*=mindist(Y,Zj)
其中,Zj为Z的第j个列向量,Z=WTT,r*表示Y与Zj的欧氏距离最小,这时的Zj的列号对应的类别就是人脸识别的最终结果。
工作站或高性能计算机的控制信号输出端输出摄像机控制信号,该摄像机控制信号控制摄像机的工作参数,摄像机的工作参数含有图像的亮度、图像的色度、图像的对比度、镜头和对焦,这样可使摄像机达到最佳的采集检测效果。
步骤3中的人脸图片灰度归一化处理采用典型的直方图均衡方法,其变换公式如下:
其中,n1是人脸图片中像素的总和,n1j1是灰度级为rj1的像素个数,L为人脸图片中可能的灰度级总数,pr(rj1)指灰度级为rj1的像素占总的像素的比例,直方图均衡方法就是根据该变换公式将人脸图片中灰度级为rj1的各像素映射到输出图像中灰度级为sk1的对应像素;
步骤3中的人脸图片尺度变换处理方法为:按照预先设定的宽高,采用三次插值算法裁剪人脸图片的大小,方便以后的识别操作。
DCT算法是一种优良的数据压缩方法,一幅人脸图像经过二维DCT变换后,其变换系数矩阵左上角的有限个系数包含了人脸图像的大部分信息。一个M×M的人脸图片f(α,b)(α,b=0,1,...,M-1)经过二维DCT变换后得到的变换系数向量F(u,v)为:
其中,α、β分别为人脸图片的两个空域序列,u、v分别为人脸图片的两个变换域序列,u,v=0,1,...,M-1。
最小化类内散步矩阵和最大化类间散布矩阵是两个通用的鉴别特征提取准则。LDA(Linear Discriminant Analysis,线性判别分析)算法虽然给出了一种熵的准则提取鉴别特征,但LDA本身无法克服小样本问题。最大间距准则是基于特征空间的类间散度与类内散度的差的最大化,其目的是需求一组最佳鉴别矢量为投影轴进行投影变换,使得特征空间样本的类间散度最大、类内散度最小。
步骤4中的MMSD算法(最优特征提取准则)可以由下式给出:
W=arg max(WT(Sb-σ·Sw)W)
其中,W为最优特征鉴别矩阵,WT为W的转置,σ是平衡因子;W为Sb-σ·Sw的前c-1个非零特征值对应的特征向量形成的矩阵,c指人脸数据库中的类数。
本发明的有益效果:
1、本发明采用工作站或高性能计算机对视频信号进行采集,然后从采集到的视频信号中取得人脸图片,再对人脸图片进行尺度变换和灰度归一化处理;采用DCT和MMSD相结合的算法对预先采集到的人脸数据库的人脸图片进行处理,获得最优特征鉴别矩阵;最后根据处理过的人脸图片和最优特征鉴别矩阵进行人脸识别;本发明对人脸的识别较准确。
(四)、具体实施方式:
人脸识别方法为:首先,采用摄像机进行视频图像的采集,并将摄像机输出的视频信号送到工作站或高性能计算机中,工作站或高性能计算机将接收到的视频流数据按帧存储在自身的存储器中,接着按下列步骤进行人脸识别:
步骤1:从存储器中按顺序取出一帧图像数据进行图像预处理,该图像预处理含有光照补偿和中值滤波操作;一方面,人脸图像会随着光照强度的改变而改变,光照变化是影响人脸检测性能的关键因素之一,光照条件不好,尤其是偏光、暗光、强光破坏了人脸模式的灰度特征,因此,采用光照补偿算法来弱化光照对人脸检测的影响。另一方面,在实际图像拍摄中一般会携带随机噪声和干扰噪声,如果对噪声不处理直接进行人脸检测,肯定会影响检测的效果,对检测结果带来很大的误差。因此在进行人脸检测之前尽量先去噪,使用中心滤波器对每帧图像数据进行中值滤波处理。
步骤2:对图像预处理后的帧数据进行人脸检测:首先建立起反应人脸目标形状变化规律的形状统计模型和反应人脸目标灰度分布规律的局部灰度模型,局部灰度模型通过训练得到;然后,利用局部灰度模型进行人脸搜索,利用形状统计模型对搜索到的形状进行近似表达,同时对合理性进行判断,对不合理的形状进行调整以保证形状在统计意义上的合理性;如果检测到有人脸目标,则执行步骤3,如果没有检测到人脸目标,则执行步骤1;
步骤3:对检测到的当前帧图像数据中存在的人脸图片进行人脸图片尺度变换处理和人脸图片灰度归一化处理;
步骤4:采用DCT(Discreat Cosine Transform,离散余玄变换)算法和MMSD(Multiple Maximum Scatter Difference,最大散度差)算法相结合的人脸识别算法,先对预先采集到的人脸数据库的人脸图片进行二维DCT变换,然后再对二维DCT变换后的变换系数矩阵应用MMSD算法进行特征提取,获得最优特征鉴别矩阵W;
最优特征鉴别矩阵W的计算过程为:首先,对预先采集到的人脸数据库的每个样本做二维DCT变换,得到的变换系数矩阵为T={x1,x2,...,xi...,xN},其中,xi为每个样本经过二维DCT变换后得到的变换系数向量,N是人脸数据库的样本数;
然后,依据变换系数矩阵T计算类间散度矩阵Sw和类内散度矩阵Sb;
最后,基于MMSD算法获得人脸数据库的最优特征鉴别矩阵W;
步骤5:将步骤3中经过尺度变换处理和灰度归一化处理后的人脸图片先经过二维DCT变换,然后再投影到步骤4中的最优特征鉴别矩阵W,利用最近邻分类方法匹配人脸图片,利用欧式距离进行测度运算,运算公式如下:
其中,Y为人脸图片经过二维DCT变换后投影到最优特征鉴别矩阵W的向量,Zj=WTxj,WT为W的转置,xj是变换系数矩阵T的第j列数据,j=1,2,...,N,yk表示Y的第k个值,zjk表示Zj的第k个值,dist(Y,Zj)为Y和Zj的欧氏距离,m为Y的列数;
人脸识别的最终结果为:
r*=mindist(Y,Zj)
其中,Zj为Z的第j个列向量,Z=WTT,r*表示Y与Zj的欧氏距离最小,这时的Zj的列号对应的类别就是人脸识别的最终结果。
工作站或高性能计算机的控制信号输出端输出摄像机控制信号,该摄像机控制信号控制摄像机的工作参数,摄像机的工作参数含有图像的亮度、图像的色度、图像的对比度、镜头和对焦,这样可使摄像机达到最佳的采集检测效果。
步骤3中的人脸图片灰度归一化处理采用典型的直方图均衡方法,其变换公式如下:
其中,n1是人脸图片中像素的总和,n1j1是灰度级为rj1的像素个数,L为人脸图片中可能的灰度级总数,pr(rj1)指灰度级为rj1的像素占总的像素的比例,直方图均衡方法就是根据该变换公式将人脸图片中灰度级为rj1的各像素映射到输出图像中灰度级为sk1的对应像素;
步骤3中的人脸图片尺度变换处理方法为:按照预先设定的宽高,采用三次插值算法裁剪人脸图片的大小,方便以后的识别操作。
DCT算法是一种优良的数据压缩方法,一幅人脸图像经过二维DCT变换后,其变换系数矩阵左上角的有限个系数包含了人脸图像的大部分信息。一个M×M的人脸图片f(α,β)(α,β=0,1,...,M-1)经过二维DCT变换后得到的变换系数向量F(u,v)为:
其中,α、β分别为人脸图片的两个空域序列,u、v分别为人脸图片的两个变换域序列,u,v=0,1,...,M-1。
最小化类内散步矩阵和最大化类间散布矩阵是两个通用的鉴别特征提取准则。LDA(Linear Discriminant Analysis,线性判别分析)算法虽然给出了一种熵的准则提取鉴别特征,但LDA本身无法克服小样本问题。最大间距准则是基于特征空间的类间散度与类内散度的差的最大化,其目的是需求一组最佳鉴别矢量为投影轴进行投影变换,使得特征空间样本的类间散度最大、类内散度最小。
步骤4中的MMSD算法(最优特征提取准则)可以由下式给出:
W=arg max(WT(Sb-σ·Sw)W)
其中,W为最优特征鉴别矩阵,WT为W的转置,σ是平衡因子;W为Sb-σ·Sw的前c-1个非零特征值对应的特征向量形成的矩阵,c指人脸数据库中的类数。