CN109614928B

CN109614928B - 基于有限训练数据的熊猫脸部识别方法

Info

Publication number: CN109614928B
Application number: CN201811500473.2A
Authority: CN
Inventors: 张志和; 江伟健; 侯蓉; 迈特科沃斯基.沃切克.麦考尔; 徐兴鹏; 苏菡; 陈鹏; 崔凯
Original assignee: CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Current assignee: CHENGDU RESEARCH BASE OF GIANT PANDA BREEDING
Priority date: 2018-12-07
Filing date: 2018-12-07
Publication date: 2020-03-10
Anticipated expiration: 2038-12-07
Also published as: CN109614928A

Abstract

本发明公开了一种基于有限训练数据的熊猫脸部识别方法，首先输入原始熊猫图像并进行手动熊猫脸部分割，对分割后的熊猫脸部图像进行边界检测，找到每张脸部图像之间对应的关键点；提取熊猫脸部图像特征，将所有其它图像与目标图像进行关键点对齐后使用偏最小二乘回归作为分类器，输入正负样本为每个熊猫脸部图像单独训练分类器；用留一交叉验证进行测试，完成熊猫脸部识别模型建立。本发明用脸部边缘进行算法执行，使用偏最小二乘回归作为分类器，可限制所需的熊猫数量和每只熊猫的训练图像数量，在熊猫个体及图像数量有限的基础上更有助于熊猫脸部的准确有效识别。

Description

基于有限训练数据的熊猫脸部识别方法

技术领域

本发明属于图像分析技术领域，具体涉及熊猫的脸部图像识别分析领域。

背景技术

大熊猫(Ailuropodamelanoleuca)是我国特有的珍稀濒危动物，是国际野生动物保护的旗舰物种，保护、繁殖作为“中国活化石”的大熊猫、推动野生动物保护可持续发展是我们的职责、义务，也是我们最基本、重要的工作。为更好、更有效地保护大熊猫，国家从1974年起，每十年进行一次全国调查。至今为止，我国一共开展了四次全国大熊猫调查。据2015年2月国家***公布的全国第四次大熊猫调查结果显示，截至2013年底，全国野生大熊猫种群数量达1864只，圈养大熊猫种群数量达到375只，野生大熊猫栖息地面积为258万公顷，潜在栖息地91万公顷，分布在四川、陕西、甘肃三省的17个市(州)、49个县(市、区)、196个乡镇。有大熊猫分布和栖息地分布的保护区数量增加到67处(全国第四次大熊猫调查结果公布，中国林业网，[EB/OL])。国家***通过对本次调查与前三次调查的结果对比发现，野生种群数量稳定增长，栖息地范围明显扩大，圈养种群规模快速发展，保护管理能力逐步增强。这无疑是对大熊猫保护工作的肯定。

但国家***也同时指出，部分大熊猫局域种群面临生存风险，栖息地破碎化严重，圈养大熊猫种群间遗传交流不足，保护形势依然十分严峻。另，据《今日美国》2017年9月25日报道称，“研究人员报告说，中国大熊猫栖息地在过去30年里一直在萎缩和***。”中科院生态环境研究中心欧阳志云教授、杜克大学的斯图尔特·皮默等研究者发表在《NatureEcology&Evolution》的“Reassessing the conservation status of the giant pandausing remote sensing”中研究了1976年到2013年整个大熊猫所在地理范围的变化，指出由于地震、人类侵占、农业、筑路和伐木等造成大熊猫栖息地划分为更小面积，栖息地正在碎片化。皮默指出，野生大熊猫繁殖可能受到严重影响，需要对此密切关注。面对以上严峻的形势，完全依赖于10年一次、耗时4年左右的全国调查，可能会出现数据、信息滞后，延误改善、补救的时间，造成不可估量的后果。寻找、研究更有效的调查、保护大熊猫的技术迫在眉睫。其中，高效、准确计算野生大熊猫的数量、分布情况是非常紧迫、重要的任务。

目前大熊猫检测方面主要集中于基于图像的方法。其中，加州大学圣迭戈分校SVC实验室的研究者Vasconcelos等利用深度学习框架进行了大熊猫检测，对从圣地亚哥动物园采集的为数不多大熊猫数据进行了验证。Han和Vasconcelos研究了无定型形状的野外目标检测问题，并以熊猫作为样例进行了测试。该方法通过建立一个两层的网络来模拟神经生理学模型检测目标，结果显示用两层神经元可以达到实时检测。国内，陈娟等提出了基于拓扑建模的熊猫脸部区域检测的方法，检测结果良好，但作者未将数据来源明确交代，造成无法重现实验问题。同年，陈娟提出了大熊猫头部检测方法[1]，根据颜色信息找到可能的大熊猫皮肤区域然后采用区域生长和KNN聚类算法来定位头部。Zhang等在IEEETransaction on Image Processing[2]也发表了关于动物头部检测的方法。黄佳棋等在[3]采用灰度空间的阈值分割方法对熊猫个体进行了分割。北京林业大学学生曾陈颖在其毕业论文[4]研究了面向珍稀野生动物保护的图像监测与识别技术，重点研究了检测问题，同时在论文中提出了基于BP神经网络的图像识别算法，但此部分内容阐述显单薄，未能将具体方法详细介绍，且数据集未明确交代。此外，陈娟等对熊猫姿态进行了研究[5]，利用大熊猫不同姿态的几何长宽比对其姿态进行了判断。

如前所述，现有的熊猫图像分析工作大多不用于验证或鉴别，曾陈颖[4]及陈娟[1]等适用于熊猫识别。在他们的工作中主要用了熊猫的步态。与他们有本质的区别，我们采用了熊猫脸。在我们的工作中，我们采用了熊猫眼睛、鼻子和嘴来实现配准及提取大量的特征，最后使用了线性分类器。由于熊猫个体及图像数量的有限问题，本方法将有助于大熊猫验证。

[1]Chen J，Wen Q，Zhuo C，et al.A novel approach towards head detectionof giant pandas in the free-range environment[C]//International Congress onImage and Signal Processing.IEEE，2013：814-818.

[2]Zhang W，Sun J，Tang X.From tiger to panda：animal head detection.[J].IEEE Transactions on Image ProcessingA Publication ofthe IEEE SignalProcessing Society，2011，20(6)：1696-708.

[3]黄佳琪，王雪琴，曾陈颖，等.基于灰度空间大熊猫图像分割方法研究[J].科技资讯，2014，12(7)：11-14.

[4]曾陈颖.面向珍稀野生动物保护的图像监测与识别技术研究[D].北京林业大学，2015.

[5]Chen J，Wen Q，Zhuo C，et al.Pose recognition of giant pandas basedon gradient shapes[C]//International Conference on Computational Problem-Solving.IEEE.2012：358-362.

发明内容

本发明的目的在于：目前熊猫识别方法未基于熊猫脸部特征识别熊猫，且目前检测中采用非线性分类器，这容易过度学习，且还要求大型数据库进行训练，由于熊猫个体及图像数量的有限，故不利于熊猫识别验证，为解决上述问题，提出一种基于有限训练数据的熊猫脸部识别方法，可限制所需的熊猫数量和每只熊猫的训练图像数量，通过熊猫脸部独有的特征数据检测识别熊猫脸部，进而实现对熊猫的精确识别。

本发明采用的技术方案如下：

基于有限训练数据的熊猫脸部识别方法，方法步骤如下：

步骤1、输入手动分割后的熊猫脸部图像，对熊猫脸部图像进行边界检测，将检测到的边界上的所有点视为关键点，找到每张熊猫脸部图像之间对应的关键点，并确定可对齐不同图像之间关键点的仿射变换；

步骤2、从能够覆盖熊猫脸部的七种网格的每个块中抽取LBP和Gabor直方图作为特征，对于给定的熊猫A，它的图像被视为正样本，其他熊猫的图像被视为负样本；

步骤3、定义来自特定熊猫的正样本为目标图像，来自其他熊猫的负样本为其他图像，基于步骤1中确定的仿射变换将所有其它图像与目标图像进行关键点对齐，然后使用偏最小二乘回归作为分类器，分别输入每个熊猫脸部图像的正负样本，为每个熊猫脸部图像单独训练分类器；步骤4、采用留一交叉验证对熊猫脸部图像在步骤3得到的分类器上进行测试，完成熊猫脸部识别模型建立，输入待检测图像到模型中，得到熊猫脸部识别结果。

进一步，所述步骤1中熊猫脸部图像进行的手动分割处理包括：对熊猫图像进行超像素分割，将覆盖脸部区域的超像素标记为前景，将其余超像素标记为背景，并将分割后的熊猫脸部图像以0.5比例缩小。

进一步，所述步骤1中采用Sobel过滤器，以0.1为阈值对分割处理后的熊猫脸部图像进行边界检测。

进一步，所述步骤1中使用CPD配准算法找到分割后的每张熊猫脸部图像之间对应的关键点。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

1、本发明中，通过熊猫脸部独有的特征数据识别熊猫脸部，由于熊猫脸始终是黑白的，可以使用脸部的所有边缘进行算法执行，采用脸部边缘对齐可以最小化熊猫脸的变化，实现对熊猫的精确识别，本发明方法中可限制所需的熊猫数量和每只熊猫的训练图像数量，在熊猫个体及图像数量有限的基础背景下本方法更有助于熊猫脸部的准确有效识别，且本发明使用大型特征集可以提取丰富的特征，避免使用非线性分类器(例如神经网络)从而容易学习过度产生过拟合，而且需要大型数据库来进行训练的问题，大型特征集还可以避免使用核方法，例如核函数支持向量机，也会存在学习过度。

2、本发明中，使用熊猫脸部边缘进行算法执行，也可以消除手动注释的需求。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明方法流程图；

图2为本发明方法输入的熊猫脸部图像例子；

图3为本发明方法具体实施方式中从由七种网格定义的不同的块中提取到的特征的类型；

图4为本发明验证实验验证结果的ROC曲线和识别实验识别结果的CMC曲线。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明，即所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以下结合实施例对本发明的特征和性能作进一步的详细描述。

基于有限训练数据的熊猫脸部识别方法，方法步骤如下：

步骤1输入手动分割后的熊猫脸部图像，对熊猫脸部图像进行边界检测，将检测到的边界上的所有点视为关键点，使用CPD配准算法找到每张熊猫脸部图像之间对应的关键点，并确定可对齐不同图像之间关键点的仿射变换。

仿射变换，又称仿射映射，是指在几何中，一个向量空间进行一次线性变换并接上一个平移，变换为另一个向量空间。

假设x与y为任意两张熊猫脸部的关键点集的列向量。其仿射变换矩阵A定义为：

y＝Ax+b，

该表达式在齐次坐标上等价于：

步骤2、从能够覆盖熊猫脸部的七个网格的每个块中抽取LBP和Gabor直方图作为特征，对于给定的熊猫A，它的图像被视为正样本，其他熊猫的图像被视为负样本；

步骤3、定义来自特定熊猫的正样本为目标图像，来自其他熊猫的负样本为其他图像，基于步骤1中确定的仿射变换将所有其它图像与目标图像进行关键点对齐，然后使用偏最小二乘回归作为分类器，分别输入每个熊猫脸部图像的正负样本，为每个熊猫脸部图像单独训练分类器；

步骤4、采用留一交叉验证对熊猫脸部图像进行分类器测试，完成熊猫脸部识别模型建立，输入待检测图像到模型中，得到熊猫脸部识别结果。

方法流程图如图1所示，方法流程可分为注册阶段和测试阶段。注册阶段对应方法的步骤1-3，测试阶段对应方法的步骤4。分类器注册阶段，这个阶段的任务就是训练生成分类器，其输入是特征和训练样本，输出是分类器的回归系数。分类器测试阶段，这个阶段是使用分类器对待分类项进行分类，其输入是分类器和待分类项，输出是待分类项与类别的映射关系。

所述步骤1具体为：

步骤1.1、输入原始熊猫图像，对熊猫脸部区域进行分割，并将分割后的熊猫脸部图像以0.5比例缩小，熊猫脸部图像的样本图像如图2所示。本算法采用手动分割的方法，该方法是基于超像素的，包含熊猫脸部的超像素被标记为前景，其余超像素被标记为背景。

步骤1.2、采用Sobel过滤器，以0.1的阈值对分割处理后的熊猫脸部图像进行边界检测，将检测到的边界上的所有点视为关键点。

步骤1.3、使用CPD配准算法找到分割后的每张熊猫脸部图像之间对应的关键点，并确定可对齐不同图像之间关键点的仿射变换。

所述步骤2具体为：

从能够覆盖熊猫脸部的七种分割网格中的每个块中抽取LBP和Gabor直方图作为特征，对于给定的熊猫A，它的图像被视为正样本，其他熊猫的图像被视为负样本。

Gabor方向场由下述公式计算得出：

其中，

是Gabor滤波器，其方向为θ_k＝kπ/8，正弦成分波长为λ_mk，椭圆高斯窗口标准差为σ_m，空间纵横比为γ，尺度指数为m，方向指数为k，

表示求一组θ_k使得φ的值最大化。在具体算法实现中，我们使用了四个尺度以及十六个方向的滤波器。Gabor方向场的计算是基于灰度图像的，将每一个块中提取到的直方图进行级联，构成Gabor特征。

局部二值模式LBP_P，R由下述公式计算得出：

其中p表示邻域的下标，P是采样点的数量，R是采样圈的半径，g_c是中心像素值，g_p是邻域像素值，当0≤x时，s(x)＝1，否则s(x)＝0。在具体算法实现中，我们使用的是

以及

和

分别在R，G，B通道上进行计算，将每一个块中提取到的直方图(如图3所示，表中为从由七个网格定义的不同的块中提取到的特征的类型)进行级联，构成LBP特征。

正负样本图像中包含了提取的特征。

所述步骤3具体为：

定义来自特定熊猫的正样本为目标图像，来自其他熊猫的负样本为其他图像，基于步骤1中确定的仿射变换将所有其它图像与目标图像进行关键点对齐，然后使用偏最小二乘回归作为分类器，分别输入每个熊猫脸部图像的正负样本，为每个熊猫脸部图像单独训练分类器，共得163分类器。

偏最小二乘回归在熊猫脸部识别中的具体应用方法如下：

模型：偏最小二乘将矩阵X和向量y分解为：

X＝TP^T+E (1)

y＝UQ^T+F (2)

训练：矩阵T，P，U，Q由非线性迭代偏最小二乘(NIPALS)算法迭代计算得出。回归系数β由下述公式计算得出：

β＝X^TU(T^TXX^TU)^-1T^Ty (3)测试：应用偏最小二乘回归来计算对比得分

对于一个测试特征向量x_test以及目标熊猫类别β，其对比得分

的计算如下：

训练偏最小二乘分类器：分类器由一对全部(one-against-all)的方式进行构建。对于一只目标熊猫脸部图像，其训练特征矩阵定义如下：

其中，x_i＝[x_i，1，x_i，2，...，x_i，m]是第i行特征向量，n是训练图像数量，m是特征的数量(特征维度)。目标向量y＝[y₁，y₂，...，y_n]^T是一个列向量，当x_i来自目标熊猫类别时y_i＝1，否则y_i＝-1。在运行NIPALS算法之前，矩阵X和向量y通过减去相应的平均值并除以相应的标准差来进行标准化。矩阵U和T由带有k个潜在组成部分的NIPALS算法来进行计算。用作目标熊猫脸部图像的分类器的回归系数β由公式(3)计算得出。训练集中的目标熊猫图像的数目为n，因此需要构建n个偏最小二乘分类器。值得注意的是，由于采用全部熊猫脸部与目标熊猫脸部图像进行对齐的策略(all-to-one)，每个分类器要构建在不同的矩阵X上。

测试偏最小二乘分类器(识别)：我们使用公式(4)，也就是回归系数和特征向量的点积，来对测试熊猫图像x_test进行分类测试。对于n个目标熊猫脸部图像应用公式(4)会得到n个对比得分，这些得分按照降序进行排序，便得到了熊猫分类结果的排序。值得注意的是，每个x_test对于不同的目标熊猫脸部是不同的，因为测试熊猫脸部与目标熊猫脸部图像进行了对齐(one-to-one)。这里测试偏最小二乘分类器即为步骤4的测试内容。

所述步骤4具体包括：

采用留一交叉验证对熊猫脸部图像进行分类器测试，即从训练集中抽取一张图像作为探测图像，其余图像分别在162个分类器上测试，完成熊猫脸部识别模型建立，输入待检测图像到模型中，得到熊猫脸部识别结果。

图4(a)和(b)分别为验证和识别两组实验，图4(a)为验证结果的ROC曲线，圆圈所在位置是最优操作点，图4(b)为识别结果的CMC曲线，AUC曲线下的面积为0.94。验证实验得到了922个真实匹配和25484个错误匹配。图4(a)显示了此实验在最优操作点(0.007，0.517)上的接收器工作特性曲线(ROC)，曲线下方的面积为0.92。在识别实验中，该算法在1级和5级的正确率分别达到了63.58％和85.80％。图4(b)显示的累积匹配特性曲线(CMC)表明，两组实验的结果表明本方法对于熊猫脸部识别算法的研究和开发都是有积极意义和作用的。

本发明中，采用了熊猫眼睛、鼻子和嘴来实现配准及提取大量的特征，通过熊猫脸部独有的特征数据识别熊猫脸部，由于熊猫脸始终是黑白的，可以使用脸部的所有边缘进行执行算法，采用脸部边缘对齐可以最小化熊猫脸的变化，实现对熊猫的精确识别，本发明方法中采用熊猫脸部图像分割，提取图像特征，再使用偏最小二乘分类器进行训练分类器，可限制所需的熊猫数量和每只熊猫的训练图像数量，在熊猫个体及图像数量有限的基础背景下采用本方法更有助于熊猫脸部的准确有效识别。可以把每只熊猫训练图像的有限数量集定义为每只熊猫的图像数量少于五十张，意思是每只熊猫图像少于五十张都算作有限数量。且本发明使用大型特征集可以提取丰富的特征，避免使用非线性分类器(例如神经网络)从而容易学习过度产生过拟合，而且需要大型数据库来进行训练的问题，大型特征集还可以避免使用核方法，例如核函数支持向量机，也会存在学习过度。本发明中，使用熊猫脸部边缘进行算法执行，也可以消除手动注释的需求。

以上所述仅为本发明的较佳实施方式而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.基于有限训练数据的熊猫脸部识别方法，其特征在于：方法步骤如下：

步骤1、输入手动分割后的熊猫脸部图像，对熊猫脸部图像进行边界检测，基于熊猫脸是黑白的，使用脸部的所有边缘进行算法执行，将检测到的边界上的所有点视为关键点，找到每张熊猫脸部图像之间对应的关键点，并确定可对齐不同图像之间关键点的仿射变换；

步骤2、从能够覆盖熊猫脸部的七种网格中的每个块中抽取LBP和Gabor直方图作为特征，对于给定的熊猫A，它的图像被视为正样本，其他熊猫的图像被视为负样本；

步骤3、定义来自特定熊猫的正样本为目标图像，来自其他熊猫的负样本为其他图像，基于步骤1中确定的仿射变换将所有其它图像与目标图像进行关键点对齐，然后使用偏最小二乘回归作为分类器，分别输入每个熊猫脸部图像的正负样本为每个熊猫脸部图像单独训练分类器；

步骤4、采用留一交叉验证对熊猫脸部图像在步骤3得到的分类器上进行测试，完成熊猫脸部识别模型建立，输入待检测图像到模型中，得到熊猫脸部识别结果。

2.根据权利要求1所述的基于有限训练数据的熊猫脸部识别方法，其特征在于：所述步骤1中熊猫脸部图像进行的手动分割处理包括：对熊猫图像进行超像素分割，将覆盖脸部区域的超像素标记为前景，将其余超像素标记为背景，并将分割后的熊猫脸部图像以0.5比例缩小。

3.根据权利要求1所述的基于有限训练数据的熊猫脸部识别方法，其特征在于：所述步骤1中采用Sobel过滤器，以0.1为阈值对熊猫脸部图像进行边界检测。

4.根据权利要求1所述的基于有限训练数据的熊猫脸部识别方法，其特征在于：所述步骤1中使用CPD配准算法找到分割后的每张熊猫脸部图像之间对应的关键点。