CN108154066B

CN108154066B - 一种基于曲率特征递归神经网络的三维目标识别方法

Info

Publication number: CN108154066B
Application number: CN201611096314.1A
Authority: CN
Inventors: 梁炜; 李杨; 郑萌; 谈金东; 彭士伟
Original assignee: Shenyang Institute of Automation of CAS
Current assignee: Shenyang Institute of Automation of CAS
Priority date: 2016-12-02
Filing date: 2016-12-02
Publication date: 2021-04-27
Anticipated expiration: 2036-12-02
Also published as: CN108154066A

Abstract

本发明涉及图像识别技术，为了有效地刻画三维目标在不同视角下的特征，针对三维目标识别过程中存在的图像噪声问题，提出了一种基于曲率特征递归神经网络的三维目标识别方法。首先，本发明通过计算目标三维模型的局部平均高斯曲率和平均均值曲率得出目标三维模型的联合曲率，并通过提取联合曲率局部极大值构成三维模型的曲率草图，利用透射投影变换生成360°二维图像序列作为训练递归神经网络的输入；其次，利用双向递归神经网络(BRNN)作为三维模型多视角序列特征学习方法，在softmax层利用softmax函数求得正确概率最大的识别类别。本发明能够自动提取三维目标与二维图像的共同特征，能够在图像噪声条件下保持较好的鲁棒性和较高的目标识别率。

Description

一种基于曲率特征递归神经网络的三维目标识别方法

技术领域

本发明涉及图像识别技术领域，具体地说是一种基于曲率特征递归神经网络的三维目标识别方法。

背景技术

三维目标识别是指从任意给定的二维图像场景中自动检测、定位、识别出指定目标模式的过程，是计算机视觉研究的关键问题之一。随着计算机视觉技术的不断发展，三维目标识别越来越广泛地应用于工业检测、增强现实和医学影像等领域。但是，由于受到光照变化、图像噪声和目标遮挡等因素的影响，难以提取三维目标及其在不同视角下二维图像的共同特征，成为三维目标识别亟待解决的问题。

三维目标识别的关键是找到三维目标模型的二维表达，提取三维目标和二维图像的共同特征。现有的三维目标识别方法主要包括基于人工标记点的方法、基于几何特征的方法和基于深度学***的图像特征融合成带有语义信息的高水平特征，能够很好地解决三维目标识别过程中二维图像的图像噪声问题，但是通常使用的深度卷积神经网络无法表达序列属性，不能有效地刻画三维目标在不同视角下的特征。因此，亟需提出一种在不同视角图像中对图像噪声问题鲁棒的自动化三维目标识别方法。

发明内容

本发明目的是能够更有效地刻画三维目标在不同视角下的特征，降低特征提取过程对图像噪声的敏感程度，提高三维目标识别准确率，本发明提出一种基于曲率特征递归神经网络的三维目标识别方法。

本发明为实现上述目的所采用的技术方案是：一种基于曲率特征递归神经网络的三维目标识别方法，包括以下步骤：

步骤1：计算目标三维模型的联合曲率

提取联合曲率

的局部极大值构成三维模型的曲率草图R_Sketch；再对三维模型的曲率草图R_Sketch利用透射投影变换生成360°二维图像P_m，其中m＝1,2,...,360；

步骤2：将360°二维图像输入BRNN，利用多角度特征进行学习计算其在多视角下的序列属性；在softmax层利用softmax函数求得序列属性的正确概率最大时的识别类别；所述BRNN为双向递归神经网络。

所述计算目标三维模型的联合曲率

包括以下步骤：

设

是目标三维模型R上给定一点(x,y,z)的法向量；令

则p_x,p_y,q_x,q_y定义为

计算三维模型R上每一点的法向量周围3×3邻域内的平均高斯曲率

和平均均值曲率

其中，

为平均曲率矩阵，trace(·)是矩阵的迹，

分别为p,q,p_x,p_y,q_x,q_y在3×3邻域内的平均值；

定义目标三维模型R的联合曲率

为：

所述将360°二维图像输入BRNN，利用多角度特征进行学习计算出其在多视角下的序列属性，包括以下步骤：

获取360°二维图像的一维特征序列T_S,s＝1,2,...,360，则特征序列T_S在BRNN第i层的输出分为正向输出

和反向输出

并且分别与本层BRNN上一序列的正向输出

本层BRNN下一序列的反向输出

以及上一层BRNN的正向输出

和反向输出

有如下关系：

其中，

为各输出间的权值矩阵，b为偏置，tanh为神经元激活函数；

则特征序列T_S在BRNN的总输出O^s，即为全连接层fc的输入I_fc为：

其中，

分别为正向输出和反向输出在全连接层的连接权值；

因此，特征序列T_S在全连接层fc的累加输出为

即为序列属性。

所述在softmax层利用softmax函数求得序列属性的正确概率最大时的识别类别，包括以下步骤：

在softmax层利用softmax函数计算出识别结果为第k类的正确概率p(C_k)

其中，C为识别类别总数，A_k为第k类三维目标的序列属性在全连接层fc的累加输出结果；

然后利用最大似然估计方法求得损失函数最小值时，即正确概率p(C_k)最大时的识别类别k：

其中，δ(·)是克罗内克函数

r表示特征序列T_S的正确识别类别。

本发明具有以下有益效果及优点：

1.本发明设计的联合曲率草图特征提取方法，能够自动提取三维模型与二维图像的共同特征，并且联合曲率所使用的局部平均高斯曲率和局部平均均值曲率可以有效的解决图像噪声问题。

2.本发明设计多角度特征学习双向递归神经网络，能够同时考虑三维模型在多角度下的特征序列，能够在任意角度的二维图像中准确识别三维目标。

附图说明

图1为本发明方法流程图；

图2为本发明方法中的多角度特征学习双向递归神经网络框架图。

具体实施方式

下面结合附图及实施例对本发明做进一步的详细说明。

本发明主要分为两部分，如图1所示为本发明方法流程图，具体实现过程如下所述。

步骤1：计算目标三维模型的联合曲率，并通过提取联合曲率局部极大值构成三维模型的曲率草图，利用透射投影变换生成360°二维图像作为训练递归神经网络的输入；

步骤1.1：设

是三维模型上给定一点(x,y,z)的法向量。令

则p_x,p_y,q_x,q_y定义为

则三维模型的高斯曲率G_K为

G_K＝|C|，

其中曲率矩阵

三维模型的均值曲率M_K为

trace(·)是矩阵的迹。为了消除噪声影响，本发明计算三维模型上每一点的法向量周围其3×3邻域内的平均高斯曲率

和平均均值曲率

其中

为平均曲率矩阵，

分别为p,q,p_x,p_y,q_x,q_y在3×3邻域内的平均值。由此，我们定义三维模型的联合曲率

为

步骤1.2：提取联合曲率

的局部最大值点构成三维模型R的曲率草图R_Sketch。通过透视投影变换，生成三维曲率草图R_Sketch的360°二维投影图像P_m,m=1,2,...,360，作为BRNN的输入。

步骤2：本发明采用一种深度递归神经网络(DRNN)作为曲率特征识别方法，DRNN框架如图2所示。利用多角度特征学习BRNN刻画三维模型在多视角下的序列属性，在softmax层利用softmax函数求得正确概率最大的识别类别。

步骤2.1：为了刻画三维模型在不同视角下特征的序列性，定义三维模型在多视角下的一维特征序列为T_S,s＝1,2,...,360，则特征序列T_S在BRNN第i层的输出分为正向输出

和反向输出

分别与本层BRNN上一序列的正向输出

本层BRNN下一序列的反向输出

以及上一层BRNN的正向输出

和反向输出

有如下关系：

其中

为各输出间的权值矩阵，b为偏执，tanh为神经元激活函数；则特征序列T_S在BRNN的总输出O^s，即为全连接层fc的输入I_fc为

其中，

分别为正向输出和反向输出在全连接层的连接权值。

步骤2.2：特征序列T_S在全连接层fc的累加输出为

即为序列属性。在softmax层利用softmax函数计算识别结果为第k类的正确概率p(C_k)

其中C为识别类别总数，A_k为第k类三维目标的序列属性在全连接层fc的累加输出结果。然后利用最大似然估计方法求得损失函数最小值时，即正确概率p(C_k)最大时的识别类别k：

其中δ(·)是克罗内克函数

r表示特征序列T_S的正确识别类别。

Claims

1.一种基于曲率特征递归神经网络的三维目标识别方法，其特征在于，包括以下步骤：

步骤1：计算目标三维模型的联合曲率

提取联合曲率

步骤2：将360°二维图像输入BRNN，利用多角度特征进行学习计算其在多视角下的序列属性；在softmax层利用softmax函数求得序列属性的正确概率最大时的识别类别；所述BRNN为双向递归神经网络；

所述计算目标三维模型的联合曲率

包括以下步骤：

设

是目标三维模型R上给定一点(x,y,z)的法向量；令

则p_x,p_y,q_x,q_y定义为

和平均均值曲率

其中，

为平均曲率矩阵，trace(·)是矩阵的迹，

分别为p,q,p_x,p_y,q_x,q_y在3×3邻域内的平均值；

定义目标三维模型R的联合曲率

为：

2.按照权利要求1所述一种基于曲率特征递归神经网络的三维目标识别方法，其特征在于，所述将360°二维图像输入BRNN，利用多角度特征进行学习计算出其在多视角下的序列属性，包括以下步骤：

和反向输出

并且分别与本层BRNN上一序列的正向输出

本层BRNN下一序列的反向输出

以及上一层BRNN的正向输出

和反向输出

有如下关系：

其中，

为各输出间的权值矩阵，b为偏置，tanh为神经元激活函数；

其中，

分别为正向输出和反向输出在全连接层的连接权值；

因此，特征序列T_S在全连接层fc的累加输出为

即为序列属性。

3.按照权利要求1所述一种基于曲率特征递归神经网络的三维目标识别方法，其特征在于，所述在softmax层利用softmax函数求得序列属性的正确概率最大时的识别类别，包括以下步骤：

其中，δ(·)是克罗内克函数

r表示特征序列T_S的正确识别类别；T_S为获取360°二维图像的一维特征序列，s＝1,2,...,360。