WO2019007258A1

WO2019007258A1 - 相机姿态信息的确定方法、装置、设备及存储介质

Info

Publication number: WO2019007258A1
Application number: PCT/CN2018/093418
Authority: WO
Inventors: 林祥凯; 暴林超; 刘威
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2017-07-07
Filing date: 2018-06-28
Publication date: 2019-01-10
Also published as: US20210174124A1; JP6824433B2; US10963727B2; EP3579192A4; US20190244050A1; CN110517319B; TWI683259B; KR102319207B1; CN110517319A; JP2020509506A; EP3579192A1; CN109215077A; KR20190127838A; US11605214B2; EP3579192B1; TW201837783A; CN109215077B

Abstract

本申请实施例公开了一种相机姿态信息的确定方法、装置、设备及存储介质，包括：获取第一图像、第二图像以及模板图像；将模板图像的第一特征点和第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；根据所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点确定第一目标单应矩阵，并根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵；对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息。本申请实施例可以对相机姿态追踪过程中得到的两个单应矩阵进行互补滤波处理，得到更为精确的相机姿态信息。

Description

相机姿态信息的确定方法、装置、设备及存储介质

本申请要求于2017年07月07日提交中国国家知识产权局、申请号为201710552105.1、发明名称为“一种相机姿态信息确定的方法及相关装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种相机姿态信息的确定方法、装置、设备及存储介质。

背景技术

增强现实(Augmented Reality，AR)技术，是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频或3D模型的技术，这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。

目前，在AR类的游戏宣传、AR类的教育应用等互动场景中，可以采用自然图像作为用于匹配的模板图像(Marker)并得到相应的相机姿态信息。自然图像即为正常拍摄的图像，Marker图像除了可以是自然图像，还可以是规则图像。即具有非常明显几何特征的图像。在根据Marker图像得到相机姿态信息的过程中，首先需要对Marker图像进行检测，在检测到Marker图像之后依赖于对其特征点的追踪进行相机定位，即得到相机姿态信息。

然而，在当前图像中追踪Marker图像的特征点时，并没有考虑到特征点的变化。在仿射变换明显的情况下，若将Marker图像中一个图像层的特征点与当前图像中的特征点进行匹配，所得到的相机姿态信息精度较低；若获取Marker图像中多个图像层，并将每个图像层的特征点与当前图像中的特征点进行匹配，则需要过多的匹配开销，不利于运行效率。

发明内容

本申请实施例提供了一种相机姿态信息的确定方法、装置、设备及存储介质。

本申请的一个方面，提供了一种相机姿态信息的确定方法，所述方法包括：

获取第一图像、第二图像以及模板图像；所述第一图像是所述第二图像的上一帧图像，所述第一图像和所述第二图像是所述相机采集的图像，所述模板图像是用于匹配的基准图像；

将所述模块图像中的第一特征点和所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；

根据所述第一图像中的第一光流特征点和所述第二图像的第一目标单应矩阵，并根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，所述第二目标单应矩阵是所述模板图像到所述第一图像的单应矩阵；

对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息。

本申请的另一方面，提供了一种相机姿态信息的确定装置，所述装置包括：

第一获取模块，用于获取第一图像、第二图像以及模板图像，其中，所述第一图像是所述第二图像的上一帧图像，所述模板图像是所述相机采集的图像，所述模板图像是用于匹配的基准图像；

检测模块，用于将所述模块图像中的第一特征点与所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；

追踪模块，用于根据所述第一图像中的第一光流特征点和所述第二图像的第一目标单应矩阵，并根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，所述第二目标单应矩阵是所述模板图像到所述第一图像的单应矩阵；

互补滤波模块，用于对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息。

本申请的另一方面，提供了一种相机姿态信息确定装置，所述装置包括：存储器、收发器、处理器以及总线***；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序以实现如下步骤：

将所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点进行特征点追踪，得到第二单应矩阵；

本申请的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的相机姿态信息的确定方法。

从以上技术方案可以看出，本申请实施例至少具有以下优点：

由于第一单应矩阵是根据模板图像和第二图像通过特征点检测方式得到的，因此输出结果的速度慢且精度低，而第二单应矩阵是根据第一图像和第二图像的光流追踪结果以及模板图像和第一图像的光流追踪结果估计得到的，因此光流速度快、精度更高、输出的结果更加稳定平滑但会随着时间推移而累积误差，本实施例提供的方法通过将第一单应矩阵和第二单应矩阵进行互补滤波处理，能够使得两个单应矩阵的特点进行互补，从而得到更为精确的相机姿态信息。

附图说明

图1为本申请实施例中终端的结构框图；

图2为本申请一个示例性实施例提供的AR应用场景的场景示意图；

图3为本申请实施例中Marker图像的示意图；

图4为本申请实施例中在当前图像中检测到Marker图像的示意图；

图5为本申请实施例中相机姿态信息的确定方法的一个实施例示意图；

图6为本申请实施例中相机姿态信息的确定方法的一个流程示意图；

图7为本申请实施例中相机姿态信息的确定方法的一个实施例示意图；

图8为本申请实施例中模板图像的示意图；

图9为本申请实施例中在原始图像层上确定目标特征点的实施例示意图；

图10为本申请实施例中对第一旋转平移矩阵和第二旋转平移矩阵进行滤波处理的实施例示意图；

图11为本申请实施例中相机姿态信息的确定装置的另一个实施例示意图；

图12为本申请实施例中相机姿态信息的确定装置的另一个实施例示意图；

图13为本申请实施例中相机姿态信息的确定装置的另一个实施例示意图；

图14为本申请实施例中相机姿态信息的确定装置的另一个实施例示意图；

图15为本申请实施例中相机姿态信息的确定装置的另一个实施例示意图；

图16为本申请实施例中相机姿态信息的确定装置的另一个实施例示意图；

图17为本申请实施例中相机姿态信息的确定装置的一个结构示意图。

具体实施方式

本申请实施例提供了一种相机姿态信息的确定方法及相关装置，将模板图像划分为多个相等的栅格，且一个栅格中最多提取一个目标特征点，因此目标特征点分布较为均匀并具有较高的匹配度和融合度，从而在保证运行效率的情况下，利用目标特征点可以获取到精度较高的相机姿态信息。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1示出了本申请一个示例性实施例提供的终端的结构框图。该终端包括：处理器120、存储器140和相机160。

处理器120包括一个或多个处理核心，比如1核心处理器、8核心处理器等。处理器120用于执行存储器140中存储的指令、代码、代码片段和程序中的至少一种。

处理器120与存储器140电性相连。可选地，处理器120通过总线与存储器140相连。存储器140存储有一个或多个指令、代码、代码片段和/或程序。该指令、代码、代码片段和/或程序在被处理器120执行时，用于实现如下各个实施例中提供的相机姿态信息的确定方法。

处理器120还与相机160电性相连。可选地，处理器120通过总线与相机160相连。相机160是具有图像采集能力的传感器件。相机160还可称为摄像头、感光器件等其它名称。相机160具有连续采集图像或多次采集图像的能力。可选地，相机160设置在设备内部或设备外部。在本申请实施例中，该相机160可以连续采集多帧图像，多帧图像中的第i 帧图像为第一图像，多帧图像中的第i+1帧图像为第二图像。

图2示出了本申请一个示例性实施例提供的AR应用场景的场景示意图。在现实世界中存在一个桌面220，该桌面220上有一幅画222，这幅画222的画面内容可以认为是Marker图像，该Marker图像是用于匹配的基准图像。具有相机的移动终端240以该桌面220为拍摄图像进行连续拍摄，得到一帧帧图像，比如图中示出的图像1至6。该连续拍摄的一帧帧图像会依次输入至处理器中进行处理。本申请实施例中，第一图像用于泛指相机采集的第i帧图像，第二图像用于泛指相机采集的第i+1帧图像。移动终端通过检测器(Detector)对Marker图像与第二图像之间的单应矩阵进行测算，以及通过追踪器(Tracker)对第一图像与第二图像之间的单应矩阵进行测算；然后对两个单应矩阵进行互补滤波(Complementary Filtering)处理后，计算得到移动终端自身的相机姿态信息，该相机姿态信息用于表征移动终端在现实世界中拍摄第二图像时的空间位置。

单应矩阵(homographycm)又称单应性矩阵，通常描述处于共同平面上的一些点在两张图像之间的变换关系。单应矩阵描述了两个平面之间的映射关系，若现实环境中的特征点都落在同一物理平面上，则可以通过单应矩阵在两帧图像之间进行运动估计。对于图像A和图像B，当图像A和图像B中存在至少四对相匹配的特征点时，移动终端通过ransac(Random Sample Consensus，随机抽样一致性算法)对该单应矩阵进行分解，得到旋转平移矩阵R|T。其中，R是相机从拍摄图像A时的第一姿态改变至拍摄图像B时的第二姿态所对应的旋转矩阵，T是相机从拍摄图像A时的第一姿态改变至拍摄图像B时的第二姿态所对应的位移向量。

应理解，本申请针对移动设备运算能力低的特点，本方案利用互补滤波算法准确地融合对用户储存的自然图像的检测结果及图像帧间追踪的结果，从而实现了一套稳定的、快速的且鲁棒性强的相机姿态信息确定方法。该方法可以应用于AR场景，如AR类的游戏场景、AR类的教育场景、AR类的会议场景等互动场景。该方法可以应用于基于Marker图像的相机定位及姿态矫正的应用程序中。本申请中的模板图像即为Marker图像。该Marker图像还可称为标记(Anchor)图像。

可选地，Marker图像包括某种规则图像或者正常拍摄的自然图像。自然图像是指正常的一张拍摄图像，规则图像是具有非常明显几何特征的图像，如一个黑色矩形框，棋盘格等。该Marker图像还会出现在现实世界中，比如该Marker图像还会出现在桌面上或者书本上，也即移动终端需要拍摄的场景中会出现Marker图像，以便基于该Marker图像建立现实世界的三维坐标系。

下面将介绍一个具体场景，假设用户希望能够直接在某一个指定的场景(如给定一个图像)上进行交互操作，这样可以便于引导用户体验。请参阅图3，图3为本申请实施例中Marker图像的示意图，如图所示，在智能手机的AR游戏中，用户可以通过一张给定的自然图像，或者用手机现场拍摄一张图像作为Marker图像，之后智能手机将在当前图像中检测该Marker部分，并在Marker坐标系上绘制一个虚拟物体，如图4所示，图4为本申请实施例中在当前图像中检测到Marker图像的示意图，从而完成和用户的互动。Marker部分是指Marker图像在当前图像中所处的图像区域，Marker坐标系是指在当前图像中基于Marker部分为现实世界所建立的坐标系。比如图4中书本上的封面图像与图3给出的Marker图像相同，基于该封面图像为现实世界建立Mark坐标系后，在图4的书本上增加显示三维的动漫人物与用户进行互动。

下面从具有相机的移动终端的角度，对本申请中相机姿态信息的确定方法进行介绍。请参阅图5，示出了本申请一个示例性实施例中提供的相机姿态信息的确定方法的流程图。该方法包括：

步骤501、获取第一图像、第二图像以及模板图像；第一图像是第二图像的上一帧图像，第一图像和第二图像是相机采集的图像，模板图像是用于匹配的基准图像；

终端获取模板图像。可选地，终端获取用户选择或上传的模板图像，或者，终端获取用户控制相机采集的某一帧图像作为模板图像。

该模板图像是用于对相机在移动过程中采集的多帧图像进行匹配时的基准图像。或者说，该模板图像是用于对第二图像进行匹配时的基准图像，该第二图像是相机在移动过程中采集的多帧图像中的某一帧图像。

可选地，终端还获取相机在移动过程中采集的多帧图像，其中，终端将第i帧图像作为第一图像，第一图像也称上一帧图像；将第i+1帧图像作为第二图像，第二图像也称当前图像。

可选地，模板图像的获取过程，与第一图像/第二图像的获取过程是互相独立的，本实施例并不限定这两个获取过程的时序关系。

步骤502、将模块图像中的第一特征点和第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；

终端将模板图像中的第一特征点和第二图像中的第二特征点进行特征点检测，匹配得到模板图像和第二图像中Marker部分的至少四对特征点，根据该至少四对特征点计算得到第一单应矩阵。

第一单应矩阵用于表征模板图像到第二图像的相机姿态变化。

步骤503、将第一图像中的第一光流特征点和第二图像的第二光流特征点进行特征点追踪，得到第二单应矩阵；

终端还将第二图像相对于第一图像进行光流(Optical Flow)追踪，得到第二图像的第二光流特征点相对于第一图像中的第一光流特征点的光流匹配结果，该光流匹配结果包括至少四对特征点，根据该至少四对特征点计算得到第一目标单应矩阵，然后获取缓存的模板图像到第一图像的第二目标单应矩阵，根据第一目标单应矩阵和第二目标单应矩阵得到第二单应矩阵。

光流是一种描述像素随时间在图像之间运动的方法。随着时间的流逝，同一个像素会在图像中运动，而我们希望追踪它的运动过程。其中，计算部分像素运动的称为稀疏光流，计算所有像素的称为稠密光流。本申请以计算稀疏光流的Lucas-Kanade光流算法为例来说明，简称LK光流。

第二单应矩阵也用于表征模板图像到第二图像的相机姿态变化。虽然第一单应矩阵和第二单应矩阵都用于表征模板图像到第二图像的相机姿态变化，但是第一单应矩阵和第二单应矩阵是通过不同的计算方式计算到的。

步骤504、对第一单应矩阵和第二单应矩阵进行互补滤波处理，得到相机的相机姿态信息。

互补滤波处理是指将第一单应矩阵和第二单应矩阵进行滤波融合的处理方式。可选地，该互补滤波处理采用卡尔曼滤波器或互补滤波器实现。

综上所述，由于第一单应矩阵是根据模板图像和第二图像通过特征点检测方式得到的，因此输出结果的速度慢且精度低，而第二单应矩阵是根据第一图像和第二图像的光流追踪结果以及模板图像和第一图像的光流追踪结果估计得到的，因此光流速度快、精度更高、输出的结果更加稳定平滑但会随着时间推移而累积误差，本实施例提供的方法通过将第一单应矩阵和第二单应矩阵进行互补滤波处理，能够使得两个单应矩阵的特点进行互补，从而得到更为精确的相机姿态信息。

在基于图5的一个可选实施例中，所述对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息，包括：

根据所述第一单应矩阵确定第一旋转平移矩阵，并根据所述第二单应矩阵确定第二旋转平移矩阵，其中，所述第一单应矩阵和所述第二单应矩阵为二维信息，所述第一旋转平移矩阵与所述第二旋转平移矩阵为三维信息；

对所述第一旋转平移矩阵和所述第二旋转平移矩阵进行互补滤波处理，以获取所述相机姿态信息。

在基于图5的一个可选实施例中，所述对所述第一旋转平移矩阵和所述第二旋转平移矩阵进行互补滤波处理，以获取所述相机姿态信息，包括：

将所述第一旋转平移矩阵输入至低通滤波器，得到第一滤波结果；

将所述第二旋转平移矩阵输入至高通滤波器，得到第二滤波结果；

根据所述第一滤波结果和所述第二滤波结果确定所述相机姿态信息。

在基于图5的一个可选实施例中，所述根据所述第一单应矩阵确定第一旋转平移矩阵，并根据所述第二单应矩阵确定第二旋转平移矩阵，包括：

根据所述第一单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第一旋转平移矩阵；

根据所述第二单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第二旋转平移矩阵。

在基于图5的一个可选实施例中，所述模板图像对应有阵列排布的多个栅格；

所述将所述模块图像中的第一特征点和所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵，包括：

将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配，在所述多个栅格中的每个目标栅格中确定出一组特征点对，所述特征点对包括：位于所述目标栅格中的第一特征点，以及所述第二特征点中与所述第一特征点匹配度最大的特征点；

根据所述目标栅格中的所述特征点对，计算出所述模块图像和所述第二图像之间的第一单应矩阵。

在基于图5的一个可选实施例中，所述方法还包括：

从所述模板图像的每个图像层中分别提取所述第一特征点，并在原始图像层中确定所述第一特征点；

其中，所述原始图像层为所述模板图像中的一个图像层，所述原始图像层中包含所述多个栅格。

在基于图5的一个可选实施例中，所述从所述模板图像的每个图像层中分别提取第一特征点，并在原始图像层中确定所述第一特征点，包括：

从所述模板图像的第一图像层中提取所述第一特征点；

从所述模板图像的第二图像层中提取所述第一特征点，其中，所述第一图像层与所述第二图像层具有不同的尺寸大小；

对所述第一图像层中的所述第一特征点以及所述第二图像层中的所述第一特征点进行缩放处理，并投影至所述原始图像层。

在基于图5的一个可选实施例中，所述将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配之前，所述方法还包括：

从所述第二图像中提取第二特征点；

所述将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配，在所述多个栅格中的每个目标栅格中确定出一组特征点对，包括：

对于所述原始图像层的每个所述目标栅格中的第一特征点，将所述第一特征点与第二特征点进行匹配，并得到至少一对相互匹配的待选择特征点对，每组所述待选择特征点对对应有一个匹配分值；

从所述至少一对待选择特征点对中选择匹配分值最高的特征点对，作为所述目标栅格中确定出的特征点对。

在基于图5的一个可选实施例中，所述将所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点进行特征点追踪，得到第二单应矩阵，包括：

根据所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点确定第一目标单应矩阵；

根据所述第一目标单应矩阵和第二目标单应矩阵确定所述第二单应矩阵。

在基于图5的一个可选实施例中，所述根据所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点确定第一目标单应矩阵，包括：

在所述第一图像的预设区域中获取第一光流特征点，所述预设区域是与所述模板图像对应的区域；

根据所述第一光流特征点获取第二光流特征点；

根据所述第一光流特征点与所述第二光流特征点，计算从所述第一图像到所述第二图像的所述第一目标单应矩阵。

在基于图5的一个可选实施例中，所述根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，包括：

获取所述模板图像到所述第一图像的第二目标单应矩阵；

根据所述第一目标单应矩阵和所述第二目标单应矩阵，计算从所述第二图像到所述模板图像的所述第二单应矩阵。

在基于图5的一个可选实施例中，所述方法还包括：

若所述第二光流特征点的数量小于预设门限，则获取q个光流特征点作为所述第二光流特征点，以使所述第二光流特征点的数量达到所述预设门限，所述q为正整数。

为了便于理解，请参阅图6，图6为本申请实施例中确定相机姿态信息的确定方法的一个流程示意图，如图所示，相机会不断采集现实世界中的一帧帧图像，在101模块中首先加载新的一帧图像作为当前图像，然后通过103模块的检测器检测出模板图像到当前图像 (即第二图像)的第一单应矩阵，进而在105模块判断是否得到第一单应矩阵，如果是，则到达107模块。另一方面，在102模块中判断追踪器是否已经初始化，若是，则进入104模块的追踪器，该追踪器用于将第二图像相对于第一图像进行光流追踪；若否，则跳转至101模块。

104模块的追踪器中将追踪模板图像，并更新第二单应矩阵。于是可以在模块107中将第一单应矩阵和第二单应矩阵通过互补滤波处理进行融合，在模块108中输出融合后得到的相机姿态信息。如果105模块判断出检测有结果且109模块判断追踪器没有初始化，则初始化追踪器，追踪器从下一帧开始工作。

可以理解的是，检测器和追踪器属于相机姿态信息确定装置。

下文从相机姿态信息确定装置的角度，对本申请中相机姿态信息的确定方法进行介绍，请参阅图7，示出了本申请一个示例性实施例中提供的相机姿态信息的确定方法的流程图，所述方法包括：

701、获取第一图像、第二图像以及模板图像，其中，第一图像是第二图像的上一帧图像，模板图像为用于匹配的图像，模板图像包含多个图像层；

本实施例中，相机姿态信息确定装置获取第一图像、第二图像以及模板图像，其中，第一图像是第二图像的上一帧图像，第二图像可以理解为是当前拍摄到的图像或者当前正在处理的图像。而模板图像为待匹配的图像，也可以称为Marker图像或者Anchor图像。可选地，模板图像包含多个图像层。

相机姿态信息确定装置可以是终端设备，例如手机、平板电脑、个人数字助理(Personal Digital Assistant，PDA)、销售终端(Point of Sales，POS)或者车载电脑等任意终端设备。

702、从模板图像的每个图像层中分别提取第一特征点，并在原始图像层中确定第一特征点，原始图像层为模板图像中的一个图像层，原始图像层中包含多个栅格；

本实施例中，由于模板图像包含了多个图像层。通常情况下，这些图像层的尺寸大小不一致，具有原始大小的模板图像称为原始图像层。可选地，在预处理阶段，终端对于原始大小的模板图像降采样生成金字塔图像，金字塔图像包括对原始大小的模板图像按照预设比例进行缩放后的图像。以金字塔图像包括四层图像为例，按照缩放比例1.0、0.8、0.6、0.4将模板图像进行缩放后，得到模板图像的四张不同尺度的图像层。对于每一图像层都提取第一特征点，故得到了模板图像在多个尺度下的多层特征描述子(即第一特征点)，同时放缩这些第一特征点，把所有第一特征点的位置放缩到原始图像层的对应位置中，并制作一个原始图像层大小的掩膜(即掩膜的尺寸和原始图形层的尺寸一致)，将掩膜均匀划分成多个小栅格备用。换句话说，终端对每一层金字塔图像都提取特征点并计算ORB特征描述子。对于不是原始尺度(1.0)的金字塔图像上提取的特征点，将该金字塔图像按照缩放比例放大到原始尺度后，记录每个特征点在原始尺度的金字塔图像(也即原始图像层)上的二维坐标。这些金字塔图像上的特征点以及二维坐标，可称为第一特征点。在一个例子中，每层金字塔图像上最多有500个第一特征点。

需要说明的是，第一特征点可以是尺度不变特征变换(scale-invariant feature transform，SIFT)，或者加速稳健特征(speeded-up robust features，SURF)，或者快速提取和描述(oriented fast and rotated brief，ORB)特征点，或者方向梯度直方图(histogram of oriented gradient,HOG)特征，或者局部二值模式(local binary patterns，LBP)，为了保证实时性，我们在本方案中采用ORB特征点作为第一特征点，然而这并不构成对本方案的限定。一个ORB特征点包括FAST角点(Key-point)和BRIER描述子(Binary Robust Independent Elementary Feature Descirptor)两部分。

FAST角点是指该ORB特征点在图像中所在的位置。FAST角点主要检测局部像素灰度变化明显的地方，以速度快著称。FAST角点的思想是：如果一个像素与邻域的像素差别较大(过亮或过暗)，则该像素可能是一个角点。

BRIEF描述子是一个二进制表示的向量，该向量按照某种人为设计的方式描述了该关键点周围像素的信息。BRIEF描述子的描述向量由多个0和1组成，这里的0和1编码了FAST角点附近的两个像素的大小关系。

ORB特征点是采用加速算法的描述子，添加了旋转不变性，速度很快。因此适用于移动设备上实施。

703、将第一特征点与第二特征点进行匹配，以在原始图像层的每个栅格中确定一个目标特征点，其中，目标特征点为第一特征点与第二特征点之间匹配度最大的特征点，目标特征点用于确定第一单应矩阵，第二特征点是从第二图像中提取的特征点；

本实施例中，由于第一特征点没有尺度不变性，而我们的应用中模板图像尺度变化很明显，用户可能在不同的尺度下拍摄到模板图像，故必须解决尺度问题。于是需要通过对模板图像生成金字塔图像，对模板图像的每一层图像层都提取第一特征点，然后和第二图像中的第二特征点进行匹配。

相机姿态信息确定装置检测当前拍摄的第二图像中是否存在模板图像，原理是将第二图像上提取的第二特征点与原始图像层上的第一特征点进行匹配。对于原始图像层中的每个目标栅格内的第一特征点，若第二图像上存在属于该目标栅格内且与该第一特征点相匹配的多个第二特征点，则在每个目标栅格中最多选择出一个待选择特征点作为目标特征点，然后利用这些目标特征点计算第一单应矩阵。

704、根据第一图像中的第一光流特征点和第二图像的第二光流特征点确定第一目标单应矩阵，并根据第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵；

本实施例中，步骤702至步骤703是完成了模板图像的检测工作，在步骤204中相机姿态信息确定装置需要采用光流追踪方法来追踪图像。具体地，在追踪图像时主要采用光流Lucas-Kanade算法，从新图像来时利用上一帧图像(即第一图像)提取的第一光流特征点进行光流，从而找到两帧之间的匹配点，从而计算出第一图像到第二图像的第一目标单应矩阵，以及获取历史光流过程中缓存的模板图像到第一图像的第二目标单应矩阵，进而得到模板图像到第二图像的第二单应矩阵。

705、根据第一单应矩阵与第二单应矩阵确定相机姿态信息。

本实施例中，相机姿态信息确定装置根据第一单应矩阵和第二单应矩阵可以计算得到相机姿态信息。可选地，相机姿态信息确定装置对第一单应矩阵和第二单应矩阵进行互补滤波处理，得到相机的相机姿态信息。

本申请实施例中，提供一种相机姿态信息确定的方法，相机姿态信息确定装置首先获取第一图像、第二图像以及模板图像，然后从模板图像的每个图像层中分别提取第一特征点，并在原始图像层中确定第一特征点，原始图像层为模板图像中的一个图像层，原始图像层中包含多个栅格，相机姿态信息确定装置再将第一特征点与第二特征点进行匹配，以在原始图像层的每个栅格中确定一个目标特征点，其中，所述目标特征点为所述第一特征点与所述第二特征点之间匹配度最大的特征点，目标特征点用于确定第一单应矩阵，而第二特征点是从第二图像中提取的特征点，接下来，相机姿态信息确定装置可以根据第一图像中的第一光流特征点和第二图像的第二光流特征点确定第一目标单应矩阵，并根据第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，最后根据第一单应矩阵与第二单应矩阵确定相机姿态信息。通过上述方式，将模板图像划分为多个相等的栅格，且一个栅格中仅存在一个目标特征点，因此目标特征点分布较为均匀并具有较高的匹配度和融合度，从而在保证运行效率的情况下，利用目标特征点可以获取到精度较高的相机姿态信息。

可选地，在上述图7对应的实施例的基础上，本申请实施例提供的相机姿态信息的确定方法的第一个可选实施例中，从模板图像的每个图像层中分别提取第一特征点，并在原始图像层中确定第一特征点，可以包括：

从模板图像的第一图像层中提取第一特征点；

从模板图像的第二图像层中提取第一特征点，其中，第一图像层与第二图像层具有不同的尺寸大小；

对第一图像层中的第一特征点以及第二图像层中的第一特征点进行缩放处理，并投影至原始图像层。

本实施例中，将介绍在原始图像层中确定第一特征点的方式。首先在模板图像中提取多层图像(或按照不同缩放比例缩小得到多层图像)，且这些图像的尺寸呈金字塔型，即图像的尺寸从小到大排序。假设第一图像层在第二图像层之上，那么可以认为第一图像层比第二图像层的尺寸小一些。然后相机姿态信息确定装置分别从第一图像层和第二图像层中提取第一特征点，再将所有的第一特征点进行缩放，以投影到原始图像层上。

可以理解的是，原始图像层的尺寸可以根据实际情况进行设计，此处不作限定。在一个示意性的例子中，将模板图像的原始图像层按照缩放比例1.0、0.8、0.6、0.4进行缩放后，得到模板图像的第一图像层、第二图像层、第三图像层和第四图像层。然后

其次，本申请实施例中，相机姿态信息确定装置首先从模板图像的第一图像层中提取第一特征点，从模板图像的第二图像层中提取第一特征点，其中，第一图像层与第二图像层具有不同的尺寸大小，然后对第一图像层的中的第一特征点以及第二图像层中的第一特征点进行缩放处理，并投影至原始图像层。通过上述方式，可以在模板图像对应的原始图形层上融合每个图形层提取出来的所有第一特征点，从而得到尽可能多的第一特征点以便于对这些第一特征点进行进一步的筛选，由此提升筛选的准确度。同时增强了匹配性能，保证了在大尺度变化下也能检测到物体。

可选地，在上述图7对应的第一个实施例的基础上，本申请实施例提供的相机姿态信息的确定方法的第二个可选实施例中，所述模板图像对应有阵列排布的多个栅格；

其中，目标栅格是模板图像的多个栅格中的一部分栅格。也即，目标栅格中的第一特征点在第二图像中存在匹配的目标特征点，且每个目标栅格仅对应一组匹配的特征点对。因为两张图像进行单应矩阵计算时，仅需要至少四对特征点对即可计算出单应矩阵，对特征点对的数量要求较少但质量要求较高。而同一个栅格内的特征点对的相似程度较高，终端尽可能选择属于不同目标栅格中的特征点对进行后续计算。

本实施例中，假设模板图像倾斜很严重，如图8所示。图8中书本的封面图像为本申请实施例中模板图像的示意图，这种情况下左半部分尺度很小，而右半部分尺度很大，单一一层的金字塔空间无法准确描述这种情况。因此，可以采用如下方式描述这类特征。

具体地，请参阅图9，图9为本申请实施例中在原始图像层上确定目标特征点的实施例示意图，对于原始的模板图像降采样生成金字塔，对于每一层都提取第一特征点，故得到了多个尺度下的模板图像的多层第一特征点。同时放缩特征点，把所有特征点的位置放缩统一到原始图像层大小，并制作一个原始图像层大小的掩膜，均匀划分成多个小栅格备用。

对于新读取的每一张图像，只提取一次第二特征点，然后分别与原始图像层上的第一特征点进行匹配，即可得到多个尺度下特征匹配。对于上述的每一个匹配(或者说特征点对)，都包括有一个当前图像上的点和一个模板图像上的点。对于模板图像上的点而言，由于每个点有多个尺度且都放缩到了原始图像层大小，故会有多个匹配上的特征点聚集在同一个栅格区域内。对于每一个栅格内，只选取一个匹配分数最高的点作为代表。通过网格过滤器的筛选，就可以得到多组栅格筛选后的模板图像到第二图像的匹配。当存在至少四组栅格筛选后的模板图像到第二图像的特征点对，则根据该至少四组特征点对计算得到模板图像到第二图像的第一单应矩阵。

在这样的模板图像的栅格里，可能融合了不止一层的特征点。我们的栅格筛选法就相当于平滑了相邻的两层特征点，按照比例利用了两层的匹配信息，因此可以大大降低需要的金字塔层数。以图9为例，栅格筛选自动的选择对应尺度，在左半部分选择了低尺度，在右半部分选择了高尺度，从而可以匹配的更好。

再次，本申请实施例中，相机姿态信息确定装置先从第二图像中提取第二特征点，然后在原始图像层的每个栅格中，将第一特征点与第二特征点进行匹配，并得到至少一个待选择特征点，其中，每个待选择特征点对应一个匹配分值，最后在原始图像层的每个栅格中，从至少一个待选择特征点中选择匹配分值最高的特征点作为目标特征点。通过上述方式，采用栅格限制了匹配的最大数量，保证了计算第一单应矩阵的稳定性，且在运行时只对第二图像提取一次第二特征点，增加的特征匹配耗时较小，并不会影响运行速度，从而加快了匹配效率。

可选地，在上述图7对应的实施例的基础上，本申请实施例提供的相机姿态信息的确定方法的第三个可选实施例中，根据第一图像中的第一光流特征点和第二图像的第二光流特征点确定第一目标单应矩阵，可以包括：

在第一图像的预设区域中获取第一光流特征点，所述预设区域是与所述模板图像对应的区域；

根据所述第一光流特征点获取第二光流特征点；

根据第一光流特征点与第二光流特征点，计算从第一图像到第二图像的第一目标单应矩阵。

本实施例中，相机姿态信息确定装置在确定第一目标单应矩阵的过程中，需要在第一图像的预设区域中获取第一光流特征点，预设区域可以包括四个顶点，这四个顶点即初始化一个图像区域，该图像区域是模板图像在第一图像中所处的区域，在此区域上提取一些Shi-Tomasi角点作为第一光流特征点。

随着相机移动，之前的光流特征点可能会不那么好，尤其随着旋转和透视投影之前的光流点可能在当前图像上都不能再观测到，因此需要每隔数帧更新光流追踪的光流特征点。利用上一帧计算出来的预设区域的四个顶点(可以参阅图9右下方的图中书本的四个顶点)，缩小一圈找一个掩膜，利用光流算法在该掩膜中确定第二光流特征点。可以理解的是，这整个过程都是在后台线程运行，不影响主线程速度。通过上述方法，自动的更新了追踪的光流特征点，保证了光流算法的稳定性。根据第一光流特征点与第二光流特征点，计算从第一图像到第二图像的第一目标单应矩阵，该第一目标单应矩阵作为第一图像到模板图像的递推基础。

掩膜的像素数量小于预设区域的像素数量，这是因为我们需要得到模板图像上的光流特征点，边缘的特征点容易检测错误，所以缩小一圈得到的掩膜像素数量也就少了。

其次，本申请实施例中，相机姿态信息确定装置在在第一图像的预设区域中获取第一光流特征点，并且根据光流算法和第一光流特征点在第二图像的掩膜中获取第二光流特征点。最后根据第一光流特征点与第二光流特征点，计算从第一图像到第二图像的第一目标单应矩阵。通过上述方式，利用上一帧图像计算出来的预设区域顶点缩小一圈，得到掩膜，这样可以减少检测到边缘特征点的情况，从而降低检测的错误率。

可选地，在上述图7对应的第三个实施例的基础上，本申请实施例提供的相机姿态信息的确定方法的第四个可选实施例中，根据第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，可以包括：

获取模板图像到第一图像的第二目标单应矩阵；

根据第一目标单应矩阵和第二目标单应矩阵，计算从第二图像到模板图像的第二单应矩阵。

本实施例中，相机姿态信息确定装置在确定第二单应矩阵的过程中或者在确定第二单应矩阵之前，需要在模板图像中获取第三光流特征点，然后根据第三光流特征点和第一光流特征点找到模板图像与第一图像的匹配点，从而计算出第二目标单应矩阵，将第二目标单应矩阵乘以第一目标单应矩阵得到模板图像到第二图像的第二单应矩阵。

其中，当前图像为第二图像，上一帧图像即为第一图像。

再次，本申请实施例中，介绍了相机姿态信息装置确定第二单应矩阵的方式，即先获取模板图像到第一图像的第二目标单应矩阵，然后根据第一目标单应矩阵和第二目标单应矩阵，计算从第二图像到模板图像的第二单应矩阵。通过上述方式，可以利用光流特征点得到第二单应矩阵，从而提升方案的可行和实用性。

可选地，在上述图7对应的第三个或第四个实施例的基础上，在本申请实施例提供的相机姿态信息的确定方法的第五个可选实施例中，还可以包括：

若第二光流特征点的数量小于预设门限，则获取q个光流特征点作为第二光流特征点，以使第二光流特征点的数量达到预设门限，q为正整数。

本实施例中，如果第二图像中从掩膜中获取的第二光流特征点数量小于预设门限，说明剩下的第二光流特征点太少了，不足以表示掩膜的特征，因此需要再次在掩膜中提取q个光流特征点作为第二光流特征点，以使得第二光流特征点的数量达到预设门限。

可以理解的是，预设门限可以是50，或者100，也可以是其他的数值，此处不做限定。

进一步地，本申请实施例中，如果第二光流特征点的数量小于预设门限，则相机姿态信息确定装置从掩膜中获取q个光流特征点作为第二光流特征点，以使第二光流特征点的数量达到预设门限。通过上述方式，在第二光流特征点数量不够的情况下，可以重新提取新的光流特征点来弥补，也就相当于自动更新了追踪的特征点，提升了光流算法的稳定性。

可选地，在上述图7对应的实施例的基础上，在本申请实施例提供的相机姿态信息确定的方法的第六个可选实施例中，根据第一单应矩阵与第二单应矩阵确定相机姿态信息，可以包括：

根据第一单应矩阵确定第一旋转平移矩阵，并根据第二单应矩阵确定第二旋转平移矩阵，其中，第一单应矩阵和第二单应矩阵为二维信息，第一旋转平移矩阵与第二旋转平移矩阵为三维信息；

对第一旋转平移矩阵和第二旋转平移矩阵进行互补滤波处理，以获取相机姿态信息。

本实施例中，相机姿态信息确定装置在确定相机姿态信息时，需要分为两个步骤，第一个步骤主要为确定两个旋转平移矩阵。第二个步骤主要为对这两个旋转平移矩阵进行互补滤波处理，最后得到相机姿态信息。

将单应矩阵转换为旋转平移矩阵的过程，可以理解为是将二维坐标转换为三维坐标的过程，具体的实现方式可以参阅图7对应的第七个实施例。得到三维坐标即可确定相机采集模板图像时在现实世界中的位置。

可以理解的是，对于相机姿态信息确定装置而言，耗时的部分主要在于检测上。对于一帧图像而言，追踪器追踪一帧图像最多不超过10毫秒，检测器检测一帧图像接近30毫秒。因此另外一种替代方案是，将第一旋转平移矩阵和第二旋转平移矩阵进行融合并不是在每一帧都做，而是将每一帧图像的检测和融合都放到后端线程，将融合得到的修正增量用于修正后续的相机姿态，这样主线程就只需要追踪的时间，检测和融合就不会阻塞主线程，计算速度就会得以提升。

其次，本申请实施例中，将确定相机姿态信息的过程分为两个部分，一部分为根据第一单应矩阵确定第一旋转平移矩阵，并根据第二单应矩阵确定第二旋转平移矩阵，另一部分为对第一旋转平移矩阵和第二旋转平移矩阵进行互补滤波处理，以获取相机的相机姿态信息。通过上述方式，可以将二维的单应矩形分解成三维的旋转平移矩阵，由于将模板图像上的所有第一特征点都在原始图形层上做了融合，因此可以只得到一组旋转平移矩阵的解，从而提升方案的可操作性。采用互补滤波的方式能够得到更平滑的相机姿态信息。

可选地，在上述图7对应的第六个实施例的基础上，在本申请实施例提供的相机姿态信息的确定方法的第七个可选实施例中，根据第一单应矩阵确定第一旋转平移矩阵，并根据第二单应矩阵确定第二旋转平移矩阵，可以包括：

根据第一单应矩阵、第二图像的透视投影矩阵以及模板图像的透视投影矩阵计算第一旋转平移矩阵。可选地，第一旋转平移矩阵中的旋转部分用于表示相机从采集模板图像时的第一姿态向采集第二图像时的第二姿态变化时的空间旋转变化，第一旋转平移矩阵中的平移部分用于表示相机从采集模板图像时的第一姿态向采集第二图像时的第二姿态变化时的空间位移变化。

根据第二单应矩阵、第二图像的透视投影矩阵以及模板图像的透视投影矩阵计算第二旋转平移矩阵。可选地，第二旋转平移矩阵中的旋转部分也用于表示相机从采集模板图像时的第一姿态向采集第二图像时的第二姿态变化时的空间旋转变化，第二旋转平移矩阵中的平移部分也用于表示相机从采集模板图像时的第一姿态向采集第二图像时的第二姿态变化时的空间位移变化。

本实施例中，当我们有了第一单应矩阵，再结合上相机参数即可分解出第一旋转平移矩阵。同样地，有了第二单应矩阵，再结合上相机参数即可分解出第二旋转平移矩阵。下面将以分解得到第一旋转平移矩阵为例进行介绍，分解出第二旋转平移矩阵的方式与分解出第一旋转平移矩阵的方式类似，此处不做赘述。

利用我们的模板图像上的所有点都在同一个平面上的特性，我们采用如下的方法，可以分解出一组确定的解，根据单应矩阵的定义和相机间旋转平移矩阵的定义，可以有如下的公式：

xc＝H*xm；

xc＝s*P*(R|T)*P ^-1*xm；

其中，xc表示是第二图像上的二维坐标齐次表示，xm为模板图像上的二维坐标齐次表示，H表示第一单应矩阵，(R|T)表示第一旋转平移矩阵，P表示透视投影矩阵，s表示尺度因子，这是由于xm反投影出三维点时取z＝1，丢失了深度，故需要用尺度因子s进行补偿。

比如2D点[x,y] ^T的齐次坐标是[x,y,1] ^T，3D点[x,y,z] ^T的齐次坐标是[x,y,z,1] ^T。故可以推出：

其中，P _c表示第二图像的透视投影矩阵，P _m表示模板图像的透视投影矩阵。上述公式中xm通过模板图像的相机参数反投影出的三维点全是z＝1的点，然而，因为所有的点都在同一个平面上，故可把z＝1平移到z＝0，上述式子并不会改变，但同时由于z＝0，故R|T的第三列均为0，可以删去，从而得到新的等式，如下：

因此可以对应的求出sR ₀₀,sR ₁₀,sR ₂₀...,sT ₀,sT ₁,sT ₂

由于R为旋转矩阵，满足列向量为单位矩阵的特性，从而可以求出尺度因子s，通过R0和R1可以算出第三列R2，用S和左式第三列可以算出T。尺度因子s有正负号的选择，可以通过算出RT后计算模板图像在第二图像中的位置，由位置一定在相机前方(Tz<0)可以推断出s的符号，从而得到一组确定的旋转平移矩阵，从而得到确定的相机姿态信息。

再次，本申请实施例中，介绍了计算第一旋转平移矩阵和第二旋转平移矩阵的方式。通过上述方式，可以得到更加可靠计算结果，且提升方案的实用性。

可选地，在上述图7对应的第六个实施例的基础上，在本申请实施例提供的相机姿态信息的确定方法的第八个可选实施例中，对第一旋转平移矩阵和第二旋转平移矩阵进行互补滤波处理，以获取相机姿态信息，可以包括：

将第一旋转平移矩阵输入至低通滤波器，并得到第一滤波结果；

将第二旋转平移矩阵输入至高通滤波器，并得到第二滤波结果；

根据第一滤波结果和第二滤波结果确定相机姿态信息。

本实施例中，获取第一旋转平移矩阵的速度较慢，精度较低，输出的结果在正确值周围波动，具有高频误差但均值较稳定。相比起来，获取第二旋转平移矩阵的速度较快，精度较高，输出的结果更加稳定平滑，不会有高频的抖动，但是随着时间的推移会累计误差从而产生漂移。第一旋转平移矩阵和第二旋转平移矩阵结合正好形成互补，故进行互补滤波，可以得到平滑的输出结果。

需要说明的是，低通滤波器和高通滤波器可以组成互补滤波器，此外，卡尔曼滤波器也可以实现低通滤波器和高通滤波器的功能。卡尔曼滤波器和互补滤波器在性能上相差无几，但互补滤波器更为简洁，且我们应用场景的特性和互补滤波器更为接近，故采用类似的思想实现一个视觉的互补滤波器。

为了便于介绍，请参阅图10，图10为本申请实施例中对第一旋转平移矩阵和第二旋转平移矩阵进行滤波处理的实施例示意图，如图所示，第一单应矩阵表示从检测器中检测出来的单应矩阵，代表着从模板图像到当前相机图像的转换。该第一单应矩阵可以直接分解出第一旋转平移矩阵(R1|T1)。第二单应矩阵代表从追踪器中追踪出来的单应矩阵，也代表从模板图像到当前图像(即第二图像)的转换，该第二单应矩阵可以分解出第二旋转平移矩阵(R2|T2)。第一单应矩阵R1|T1经过一个低通滤波器可以过滤掉高频的噪声，得到第一滤波结果(Rf1|Tf1)；第二单应矩阵R2|T2经过一个高通滤波器过滤掉低频的漂移，得到第二滤波结果(Rf2|Tf2)。

对于平移T具有可加性，故可以直接融合，旋转不直接具有可加性。需要先利用罗德里格旋转公式(Rodrigues)公式转换为四元数，通过球面线性(slerp)插值进行融合，从而得到过滤后的真实数据。该过滤后的真实数据描述了准确的从模板图像到当前相机图像的旋转和平移(R|T)变化。

通过相机参数可以算出模板图像坐标系下四个顶点的真实坐标，乘上上述R|T可以算出对应的当前相机上模板图像的四个顶点的三维坐标，通过透视投影计算出对应二维坐标，从而找到四组模板图像到当前相机图像上二维坐标点的匹配，从而计算出更新后的单应矩阵，用它来更新积分仪，从而消除了追踪器的累积误差。

需要说明的是，本实施例提供的互补滤波是一种框架，能进行滤波的不仅仅局限于通过检测器得到的追踪结果和通过追踪器得到的光流追踪结果。而可以是任意两种或者多种不同来源的模板图像追踪结果，甚至包括外界传感器传入的数据(如惯性测量单元测得的数据)，同样的也可以采用卡尔曼滤波器进行对应的处理。

再次，本申请实施例中，采用对第一旋转平移矩阵和第二旋转平移矩阵进行互补滤波处理，即将第一旋转平移矩阵输入至低通滤波器，并得到第一滤波结果，同时将第二旋转平移矩阵输入是高通滤波器，并得到第二滤波结果，最后根据第一滤波结果和所述第二滤波结果确定相机姿态信息。通过上述方式，可以弥补第一旋转平移矩阵精度低，且具有高频误差的缺点，也可以弥补第二旋转平移矩阵因为时间推移累积误差而产生漂移的缺点，采用互补滤波的方式能够得到平滑的输出结果，从而提升方案的可行性。

下面对本申请中的相机姿态信息确定装置进行详细描述，图11为本申请实施例中相机姿态信息的确定装置的一个实施例示意图，相机姿态信息的确定装置30包括：

第一获取模块301，用于获取第一图像、第二图像以及模板图像，其中，所述第一图像是所述第二图像的上一帧图像，所述第一图像和所述第二图像是所述相机采集的图像，所述模板图像是用于匹配的基准图像；

检测模块302，用于将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；

追踪模块303，用于根据所述第一图像中的第一光流特征点和所述第二图像的第一目标单应矩阵，并根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，所述第二目标单应矩阵是所述模板图像到所述第一图像的单应矩阵；

互补滤波模块304，用于根据所述第一单应矩阵与所述第一确定模块304确定的所述第二单应矩阵确定相机姿态信息。

在基于图11的可选实施例中，如图12所示，所述互补滤波模块304，包括：

确定单元3041，用于根据所述第一单应矩阵确定第一旋转平移矩阵，并根据所述第二单应矩阵确定第二旋转平移矩阵，其中，所述第一单应矩阵和所述第二单应矩阵为二维信息，所述第一旋转平移矩阵与所述第二旋转平移矩阵为三维信息；

处理单元3042，用于对所述第一旋转平移矩阵和所述第二旋转平移矩阵进行互补滤波处理，以获取所述相机姿态信息。

在基于图12的可选实施例中，如图13所示，所述处理单元3042，包括：

第一输入子单元30421，用于将所述第一旋转平移矩阵输入至低通滤波器，得到第一滤波结果；

第二输入子单元30422，用于将所述第二旋转平移矩阵输入至高通滤波器，得到第二滤波结果；

确定子单元30423，用于根据所述第一滤波结果和所述第二滤波结果确定所述相机姿态信息。

在基于图12的可选实施例中，如图14所示，所述确定单元3041，包括：

第一计算子单元30411，用于根据所述第一单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第一旋转平移矩阵；

第二计算子单元30412，用于根据所述第二单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第二旋转平移矩阵。

在基于图11的可选实施例中，如图15所示，所述模板图像对应有阵列排布的多个栅格；

所述检测模块302，包括：

匹配模块3021，用于将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配，在所述多个栅格中的每个目标栅格中确定出一组特征点对，所述特征点对包括：位于所述目标栅格中的第一特征点，以及所述第二特征点中与所述第一特征点匹配度最大的特征点；

第一确定模块3022，用于根据所述目标栅格中的所述特征点对，计算出所述模块图像和所述第二图像之间的第一单应矩阵。

在基于图15所示的可选实施例中，所述装置还包括：

第一提取模块，用于从所述模板图像的每个图像层中分别提取所述第一特征点，并在原始图像层中确定所述第一特征点；

在基于图15所示的可选实施例中，所述第一提取模块，包括：

第一提取单元，用于从所述模板图像的第一图像层中提取所述第一特征点；

第二提取单元，用于从所述模板图像的第二图像层中提取所述第一特征点，其中，所述第一图像层与所述第二图像层具有不同的尺寸大小；

投影单元，用于对所述第一图像层中的所述第一特征点以及所述第二图像层中的所述第一特征点进行缩放处理，并投影至所述原始图像层。

在基于图15所示的可选实施例中，所述装置还包括：

第二提取模块，用于从所述第二图像中提取第二特征点；

所述匹配模块，包括：

匹配单元，用于对于所述原始图像层的每个所述目标栅格中的第一特征点，将所述第一特征点与第二特征点进行匹配，并得到至少一对相互匹配的待选择特征点对，每组所述待选择特征点对对应有一个匹配分值；

选择单元，用于从所述至少一对待选择特征点对中选择匹配分值最高的特征点对，作为所述目标栅格中确定出的特征点对。

在基于图11所示的可选实施例中，如图16所示，所述追踪模块303，包括：

第一获取单元3031，用于在所述第一图像的预设区域中获取第一光流特征点，所述预设区域是与所述模板图像对应的区域；

第二获取单元3033，用于根据所述第一光流特征点获取第二光流特征点；

第一计算单元3032，用于根据所述第一光流特征点与所述第二光流特征点，计算从所述第一图像到所述第二图像的所述第一目标单应矩阵。

在基于图15所示的可选实施例中，所述装置还包括：

第二获取模块，用于若所述第二光流特征点的数量小于预设门限，则获取q个光流特征点作为所述第二光流特征点，以使所述第二光流特征点的数量达到所述预设门限，所述q为正整数。

本申请实施例还提供了另一种相机姿态信息确定装置，如图17所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、PDA、POS、车载电脑等任意终端设备，以终端为手机为例：

图17示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图17，手机包括：射频(Radio Frequency，RF)电路410、存储器420、输入单元430、显示单元440、传感器450、音频电路460、无线保真(wireless fidelity，WiFi)模块470、处理器480、以及电源490等部件。本领域技术人员可以理解，图17中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图17对手机的各个构成部件进行具体的介绍：

RF电路410可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器480处理；另外，将设计上行的数据发送给基站。通常，RF电路410包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。此外，RF电路410还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(Global System of Mobile communication，GSM)、通用分组无线服务(General Packet Radio Service，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器420可用于存储软件程序以及模块，处理器480通过运行存储在存储器420的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元430可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元430可包括触控面板431以及其他输入设备432。触控面板431，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板431上或在触控面板431附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板431可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器480，并能接收处理器480发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板431。除了触控面板431，输入单元430还可以包括其他输入设备432。具体地，其他输入设备432可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元440可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元440可包括显示面板441，可选的，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板441。进一步的，触控面板431可覆盖显示面板441，当触控面板431检测到在其上或附近的触摸操作后，传送给处理器480以确定触摸事件的类型，随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图17中，触控面板431与显示面板441是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板431与显示面板441集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器450，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板441的亮度，接近传感器可在手机移动到耳边时，关闭显示面板441和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路460、扬声器461，传声器462可提供用户与手机之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号，传输到扬声器461，由扬声器461转换为声音信号输出；另一方面，传声器462将收集的声音信号转换为电信号，由音频电路460接收后转换为音频数据，再将音频数据输出处理器480处理后，经RF电路410以发送给比如另一手机，或者将音频数据输出至存储器420以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图17示出了WiFi模块470，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器480是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器420内的软件程序和/或模块，以及调用存储在存储器420内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器480可包括一个或多个处理单元；可选的，处理器480可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器480中。

手机还包括给各个部件供电的电源490(比如电池)，可选的，电源可以通过电源管理***与处理器480逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，该终端所包括的存储器420用于存储程序，处理器480用于执行所述存储器420中的程序以实现如上各个实施例所述的相机姿态信息的确定方法。

在本申请实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质包括指令，当其在计算机上运行时，使得计算机执行如上各个实施例所述的相机姿态信息的确定方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

一种相机姿态信息的确定方法，其特征在于，应用于具有相机的移动终端中，所述方法包括：

获取第一图像、第二图像以及模板图像；所述第一图像是所述第二图像的上一帧图像，所述第一图像和所述第二图像是所述相机采集的图像，所述模板图像是用于匹配的基准图像；

将所述模块图像中的第一特征点和所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；

根据所述第一图像中的第一光流特征点和所述第二图像的第一目标单应矩阵，并根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，所述第二目标单应矩阵是所述模板图像到所述第一图像的单应矩阵；

对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息。
根据权利要求1所述的方法，其特征在于，所述对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息，包括：

根据所述第一单应矩阵确定第一旋转平移矩阵，并根据所述第二单应矩阵确定第二旋转平移矩阵，其中，所述第一单应矩阵和所述第二单应矩阵为二维信息，所述第一旋转平移矩阵与所述第二旋转平移矩阵为三维信息；

对所述第一旋转平移矩阵和所述第二旋转平移矩阵进行互补滤波处理，以获取所述相机姿态信息。
根据权利要求2所述的方法，其特征在于，所述对所述第一旋转平移矩阵和所述第二旋转平移矩阵进行互补滤波处理，以获取所述相机姿态信息，包括：

将所述第一旋转平移矩阵输入至低通滤波器，得到第一滤波结果；

将所述第二旋转平移矩阵输入至高通滤波器，得到第二滤波结果；

根据所述第一滤波结果和所述第二滤波结果确定所述相机姿态信息。
根据权利要求2所述的方法，其特征在于，所述根据所述第一单应矩阵确定第一旋转平移矩阵，并根据所述第二单应矩阵确定第二旋转平移矩阵，包括：

根据所述第一单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第一旋转平移矩阵；

根据所述第二单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第二旋转平移矩阵。
根据权利要求1至4任一所述的方法，其特征在于，所述模板图像对应有阵列排布的多个栅格；

所述将所述模块图像中的第一特征点和所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵，包括：

将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配，在所述多个栅格中的每个目标栅格中确定出一组特征点对，所述特征点对包括：位于所述目标栅格中的第一特征点，以及所述第二特征点中与所述第一特征点匹配度最大的特征点；

根据所述目标栅格中的所述特征点对，计算出所述模块图像和所述第二图像之间的第一单应矩阵。
根据权利要求5所述的方法，其特征在于，所述方法还包括：

从所述模板图像的每个图像层中分别提取所述第一特征点，并在原始图像层中确定所述第一特征点；

其中，所述原始图像层为所述模板图像中的一个图像层，所述原始图像层中包含所述多个栅格。
根据权利要求6所述的方法，其特征在于，所述从所述模板图像的每个图像层中分别提取第一特征点，并在原始图像层中确定所述第一特征点，包括：

从所述模板图像的第一图像层中提取所述第一特征点；

从所述模板图像的第二图像层中提取所述第一特征点，其中，所述第一图像层与所述第二图像层具有不同的尺寸大小；

对所述第一图像层中的所述第一特征点以及所述第二图像层中的所述第一特征点进行缩放处理，并投影至所述原始图像层。
根据权利要求5所述的方法，其特征在于，所述将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配之前，所述方法还包括：

从所述第二图像中提取第二特征点；

所述将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配，在所述多个栅格中的每个目标栅格中确定出一组特征点对，包括：

对于所述原始图像层的每个所述目标栅格中的第一特征点，将所述第一特征点与第二特征点进行匹配，并得到至少一对相互匹配的待选择特征点对，每组所述待选择特征点对对应有一个匹配分值；

从所述至少一对待选择特征点对中选择匹配分值最高的特征点对，作为所述目标栅格中确定出的特征点对。
根据权利要求1至4任一所述的方法，其特征在于，所述根据所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点确定第一目标单应矩阵，包括：

在所述第一图像的预设区域中获取第一光流特征点，所述预设区域是与所述模板图像对应的区域；

根据所述第一光流特征点获取第二光流特征点；

根据所述第一光流特征点与所述第二光流特征点，计算从所述第一图像到所述第二图像的所述第一目标单应矩阵。
根据权利要求9所述的方法，其特征在于，所述方法还包括：

若所述第二光流特征点的数量小于预设门限，则获取q个光流特征点作为所述第二光流特征点，以使所述第二光流特征点的数量达到所述预设门限，所述q为正整数。
一种相机姿态信息的确定装置，其特征在于，所述装置具有相机，所述装置包括：

第一获取模块，用于获取第一图像、第二图像以及模板图像，其中，所述第一图像是所述第二图像的上一帧图像，所述第一图像和所述第二图像是所述相机采集的图像，所述模板图像是用于匹配的基准图像；

检测模块，用于将所述模块图像中的第一特征点与所述第二图像中的第二特征点进行特征点检测，得到第一单应矩阵；

追踪模块，用于根据所述第一图像中的第一光流特征点和所述第二图像的第二光流特征点确定第一目标单应矩阵，并根据所述第一目标单应矩阵和第二目标单应矩阵确定第二单应矩阵，所述第二目标单应矩阵是所述模板图像到所述第一图像的单应矩阵；

互补滤波模块，用于对所述第一单应矩阵和所述第二单应矩阵进行互补滤波处理，得到所述相机的相机姿态信息。
根据权利要求11所述的装置，其特征在于，所述互补滤波模块，包括：

确定单元，用于根据所述第一单应矩阵确定第一旋转平移矩阵，并根据所述第二单应矩阵确定第二旋转平移矩阵，其中，所述第一单应矩阵和所述第二单应矩阵为二维信息，所述第一旋转平移矩阵与所述第二旋转平移矩阵为三维信息；

处理单元，用于对所述第一旋转平移矩阵和所述第二旋转平移矩阵进行互补滤波处理，以获取所述相机姿态信息。
根据权利要求12所述的装置，其特征在于，所述处理单元，包括：

第一输入子单元，用于将所述第一旋转平移矩阵输入至低通滤波器，得到第一滤波结果；

第二输入子单元，用于将所述第二旋转平移矩阵输入至高通滤波器，得到第二滤波结果；

确定子单元，用于根据所述第一滤波结果和所述第二滤波结果确定所述相机姿态信息。
根据权利要求12所述的装置，其特征在于，所述确定单元，包括：

第一计算子单元，用于根据所述第一单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第一旋转平移矩阵；

第二计算子单元，用于根据所述第二单应矩阵、所述第二图像的透视投影矩阵以及所述模板图像的透视投影矩阵计算所述第二旋转平移矩阵。
根据权利要求11至14任一所述的装置，其特征在于，所述模板图像对应有阵列排布的多个栅格；

所述检测模块，包括：

匹配模块，用于将所述模板图像中的第一特征点与所述第二图像中的第二特征点进行匹配，在所述多个栅格中的每个目标栅格中确定出一组特征点对，所述特征点对包括：位于所述目标栅格中的第一特征点，以及所述第二特征点中与所述第一特征点匹配度最大的特征点；

第一确定模块，用于根据所述目标栅格中的所述特征点对，计算出所述模块图像和所述第二图像之间的第一单应矩阵。
根据权利要求15所述的装置，其特征在于，所述装置还包括：

第一提取模块，用于从所述模板图像的每个图像层中分别提取所述第一特征点，并在原始图像层中确定所述第一特征点；

其中，所述原始图像层为所述模板图像中的一个图像层，所述原始图像层中包含所述多个栅格。
根据权利要求16所述的装置，其特征在于，所述第一提取模块，包括：

第一提取单元，用于从所述模板图像的第一图像层中提取所述第一特征点；

第二提取单元，用于从所述模板图像的第二图像层中提取所述第一特征点，其中，所述第一图像层与所述第二图像层具有不同的尺寸大小；

投影单元，用于对所述第一图像层中的所述第一特征点以及所述第二图像层中的所述第一特征点进行缩放处理，并投影至所述原始图像层。
根据权利要求15所述的装置，其特征在于，所述装置还包括：

第二提取模块，用于从所述第二图像中提取第二特征点；

所述匹配模块，包括：

匹配单元，用于对于所述原始图像层的每个所述目标栅格中的第一特征点，将所述第一特征点与第二特征点进行匹配，并得到至少一对相互匹配的待选择特征点对，每组所述待选择特征点对对应有一个匹配分值；

选择单元，用于从所述至少一对待选择特征点对中选择匹配分值最高的特征点对，作为所述目标栅格中确定出的特征点对。
根据权利要求11至14任一所述的装置，其特征在于，所述追踪模块，包括：

第一获取单元，用于在所述第一图像的预设区域中获取第一光流特征点，所述预设区域是与所述模板图像对应的区域；

第二获取单元，用于根据所述第一光流特征点获取第二光流特征点；

第一计算单元，用于根据所述第一光流特征点与所述第二光流特征点，计算从所述第一图像到所述第二图像的所述第一目标单应矩阵。
根据权利要求19所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于若所述第二光流特征点的数量小于预设门限，则获取q个光流特征点作为所述第二光流特征点，以使所述第二光流特征点的数量达到所述预设门限，所述q为正整数。
一种移动终端，其特征在于，所述移动终端包括：处理器和存储器；

所述存储器用于存储程序，所述处理器用于执行所述存储器中的程序以实现如权利要求1至12任一所述的相机姿态信息的确定方法。
一种计算机可读存储介质，所述计算机可读存储介质包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至12任一所述的相机姿态信息的确定方法。