WO2021088498A1

WO2021088498A1 - 虚拟物体显示方法以及电子设备

Info

Publication number: WO2021088498A1
Application number: PCT/CN2020/113340
Authority: WO
Inventors: 姜军; 林涛; 苏琪
Original assignee: 华为技术有限公司
Priority date: 2019-11-08
Filing date: 2020-09-03
Publication date: 2021-05-14
Also published as: CN112785715A; US11776151B2; US20220237816A1; EP4030391A4; EP4030391A1

Abstract

一种虚拟物体显示方法，应用于具有显示组件（323）和摄像头（324）的电子设备（10），该方法包括：检测到用户打开应用的操作；响应于该操作下载全局子地图并存储到电子设备（10）的即时定位与地图构建SLAM***中；全局子地图（123）是全局地图中与电子设备（10）的位置对应的子地图；在显示组件（323）上显示虚拟物体的位置与姿态，虚拟物体的位置与姿态是至少根据摄像头（324）采集的视频图像和全局子地图（123）执行位姿计算得到的。能够解决电子设备（10）的位姿漂移的问题，提升用户使用体验。

Description

虚拟物体显示方法以及电子设备

本申请要求于2019年11月08日提交到中国专利局、申请号为201911092326.0、申请名称为“虚拟物体显示方法以及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及虚拟场景技术领域，尤其涉及虚拟物体显示方法以及电子设备。

背景技术

虚拟现实(Virtual Reality，VR)、增强现实(Augmented Reality，AR)和混合现实(Mixed Reality，MR)技术是近年来新兴的多媒体虚拟场景技术。其中，VR技术是一种可以创建和体验虚拟世界的仿真技术，AR技术是一种可以将虚拟现实和真实世界叠加并进行互动的技术。MR技术是通过合并真实世界和虚拟世界而产生的新的可视化环境，并且在真实世界、虚拟世界和用户之间搭起一个交互反馈的信息回路的综合技术。

在上述虚拟场景技术中，通常采用同时定位与建图(Simultaneous Localization and Mapping，SLAM)技术进行电子设备自身在环境中的定位。SLAM技术具体可实现电子设备(例如手机、VR眼镜等移动电子设备)在环境中从一个未知位置开始移动时,在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图，以便于后续的定位，采用SLAM技术的***或模块又可称为空间定位引擎。

在一些城市级交互式VR或AR应用中，服务器端的全局坐标系与电子设备的SLAM***的局部坐标系对齐之后，全局坐标系中的VR或AR应用的虚拟物体就可以在电子设备显示。然而，当SLAM***长时间运行后，电子设备在局部坐标系下的位姿会出现漂移，导致虚拟物体在电子设备的显示位置和方向也会出现偏移，给用户带来使用上的不便。

发明内容

本申请实施例提供了虚拟物体显示方法以及电子设备，能够一定程度上解决电子设备的位姿漂移的问题，提升用户使用体验。

第一方面，本申请实施例提供了一种虚拟物体显示方法，该方法可应用于具有显示组件(例如显示屏(例如，触摸屏、柔性屏、曲面屏等，或者光学组件)和摄像头的电子设备，电子设备可以是手持终端(如手机)，VR或AR眼镜，无人机，无人车等。方法包括：检测到用户打开应用的操作；响应于所述操作，下载全局子地图并存储到所述电子设备的即时定位与地图构建(SLAM)***中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；在所述显示组件上显示所述虚拟物体的位置与姿态，所述虚拟物体的位置与姿态是所述SLAM***至少根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算得到的。

需要说明的是，计算位姿例如可以采用BA(Bundle Adjustment)的方法。所述虚拟物体的姿态，例如可以指的是所述虚拟物体的朝向。

其中，所谓“打开应用的操作”可以是通过点击、触摸、滑动、或抖动等方式打开应用，也可以是声控或者其它途径打开应用，本申请对此不作限定。举例来说，电子设备检测到用户的触摸操作后，应用中的导航功能被启动，摄像头被启动等等。

本申请又一种可能的实现中，电子设备也可以通过其他方式来启动下载全局子地图的步骤，例如，通过检测环境光线的变化来启动下载全局子地图的步骤。

其中，服务器可作为向电子设备的VR或AR或MR应用提供内容和信息支撑的平台。在服务器中存储有全局地图，通常来讲，全局地图是一种大地理范围的高精度的地图，所谓“大地理范围”是相对于电子设备中的SLAM地图所代表的地理范围而言的，例如全局地图可以是由一个或多个电子设备生成的多个SLAM地图按照一定的规则进行整合得到的。相应的，全局子地图表示全局地图中与电子设备的位置对应的子地图，也就是说，可以以电子设备的实际位置在去全局地图中的位置点为起点，获取起点周围预设区域内的地图内容作为所述全局子地图。

本实施例中，电子设备可安装有VR或AR或MR应用等虚拟场景应用，并可基于用户的操作(例如点击、触摸、滑动、抖动、声控等)运行该VR或AR或MR应用。电子设备可通过本地摄像头采集环境中的视频图像，结合采集的视频图像以及所下载的全局子地图确定电子设备的当前位姿，进而基于电子设备的当前位姿在显示组件上显示虚拟物体的位置与姿态。虚拟物体相应可以为VR场景、AR场景或MR场景中的虚拟物体(即虚拟环境中的物体)。

现有方案中，SLAM***在电子设备不断移动的过程中，不断在创建SLAM地图，并基于SLAM地图估计的位姿和由自身传感器采集的数据所估计的位姿来共同生成电子设备的最终位姿。而SLAM地图建立过程中会不断引入噪声，即基于SLAM地图估计的位姿会累积误差，传感器采集的数据同样会存在噪声，由自身传感器采集的数据所估计的位姿也会累积误差，导致出现位姿漂移现象。

而本申请实施例中，电子设备检测到用户打开应用的操作后，通过请求服务器下载全局子地图，利用比SLAM地图精度更高的全局子地图作为视觉观测输入给SLAM***，SLAM***使用全局子地图和采集的视频图像来估计电子设备的位姿，能够有效减少甚至消除SLAM***长时间位姿估计出现的位姿漂移现象，进而确保在VR或AR或MR应用的长时间(例如超过1分钟)运行中虚拟物体在电子设备的显示位置和方向不会偏移，长时间正确地显示虚拟物体(例如，在视频图像所表示的环境和时长下，以相对准确的方式显示虚拟物体)，从而提升用户的使用体验。

本文中，电子设备在全局子地图中的位姿又可称为全局位姿，相应的，电子设备在自身所构建的SLAM地图中的位姿又可称为局部位姿。

基于第一方面，在一种可能的实施方式中，所述电子设备的位姿数据用于表征所述虚拟物体的位置与姿态，所述电子设备的位姿数据是所述SLAM***至少根据所述摄像头采集的视频图像和所述全局子地图以第一频率执行位姿计算得到的。

其中，第一频率表示电子设备中的SLAM***执行全局位姿估计的频率，即调用全局子地图的频率。例如，第一频率的取值范围可以是10～30Hz，即每秒10～30帧，即调用全局子地图的频率可以是10～30帧中的某个值。第一频率在数值上可以小于等于显示组件(例如显示面板)显示视频流的频率。

也就是说，电子设备的SLAM***可以以较高的固定频率调用所述全局子地图，以实现对电子设备的位姿跟踪或位姿更新。这样，在实时获得电子设备的全局位姿(即位姿数据)后，可以根据电子设备的全局位姿在显示组件内实时显示和更新AR场景中虚拟物体的位置与姿态。并且在长时间的位姿更新过程中，在虚拟物体的位置与姿态也不会发生跳动现象。这是因为，一方面，在这段时间内，电子设备中的SLAM***是访问存储的全局子地图来计算电子设备的全局位姿，能够克服电子设备中预先构建的SLAM地图不准确的问题，尽量避免位姿误差的累计，从而最大程度地克服漂移现象的发生；另一方面电子设备能够稳定地、高频次地访问存储的全局子地图来执行全局位姿估计，极大减少了全局位姿的突变；再一方面，计算全局位姿的过程在电子设备侧完成，位姿估计的算法延迟低，位姿跟踪效果好。所以，本实施例能长时间显示虚拟物体且虚拟物体在画面中不会偏移出错，消除了由于位姿突变导致的虚拟物体的跳动现象，进一步提升用户体验。

本申请实施例中，SLAM地图例如可以包含以下地图内容：多个关键帧、三角测量的特征点以及关键帧和特征点之间的关联。关键帧可以基于摄像头采集的图像和用来产生图像的相机参数(例如，电子设备在SLAM坐标系中的位姿)而形成。其中所述特征点可以表示SLAM地图中沿着三维空间的不同的3D地图点以及在3D地图点上的特征描述。每一特征点可具有关联的特征位置。每个特征点可表示3D坐标位置，并且与一或多个描述符相关联。特征点又可称为3D特征、特征点、3D特征点或者其他合适的名字。

其中，3D地图点(或称三维地图点)表示在三维空间轴线X、Y及Z上的坐标，例如，对于局部坐标系下的SLAM地图，3D地图点表示在局部坐标系三维空间轴线X、Y及Z上的坐标。对于全局坐标系下的SLAM地图，3D地图点表示在全局坐标系三维空间轴线X、Y及Z上的坐标。

基于第一方面，在一种可能的实施方式中，所述位姿计算的过程包括：根据所述摄像头采集的视频图像、所述全局子地图以及所述电子设备采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。

本实施例中，所述电子设备采集的运动数据例如可以是电子设备中的惯性测量单元(Inertial Measurement Unit，IMU)采集的运动数据，IMU可以高频率地采集电子设备的角速度、线加速度等信息，角加速度、线加速度等进行积分来估计电子设备的位姿。电子设备可以基于采集的视频图像和IMU高频率，采用SLAM算法高频率的调用全局子地图的3D特征(3D地图点)，通过引入IMU来进一步提高所估计的全局位姿的准确度，保证了全局子地图的3D特征(3D地图点)有效作为量测值作用到SLAM算法中，通过高精度地执行位姿估计来避免位姿漂移现象和跳动现象的发生。

基于第一方面，在一种可能的实施方式中，所述响应于所述操作，下载全局子地图，包括：响应于所述操作，向服务器发送所述电子设备的初始位置的指示信息；从所述服务器接收所述全局子地图，所述全局子地图是根据所述电子设备的初始位置确定的。

本申请实施例通过上传电子设备的初始位置的指示信息的方式来请求下载全局子地图，而不需要上传视频图像，这样就能够实现获得与电子设备的初始位置相关的全局子地图，也有利于节省带宽资源，减少服务器的处理负担，还有利于减少或消除了隐私泄露的风险。

基于第一方面，在一种可能的实施方式中，所述电子设备的初始位置的指示信息包括用于指示所述电子设备的初始位置的第一位置指纹信息；所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。

其中，所述位置指纹信息所指示的初始位置可能是所述电子设备请求下载地图时电子设备所处的地理位置信息，例如位置指纹信息来源包括GNSS/WiFi/蓝牙/基站等定位方式所测得的初始位置信息、信号强度信息、信号特征信息等等；也可能是在由用户输入的位置信息。

本申请实施例通过在服务器执行上传的位置指纹信息与全局子地图的位置指纹信息匹配，能够将有用的全局子地图下载到电子设备侧，提高了匹配效率和精准度，进而有利于减少下载地图的时延。

基于第一方面，在一种可能的实施方式中，所述方法还包括：电子设备根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图。

具体的，可以先将SLAM地图转换到全局子地图对应的坐标系(即全局坐标系)下，这样，由于电子设备的位姿、SLAM地图都已经处于全局坐标系下，所以电子设备可以将电子设备的全局位姿反馈到全局坐标系下的SLAM地图，基于全局位姿将当前的图像帧(关键帧)融合进全局坐标系下的SLAM地图，从而实现SLAM地图的扩展/延伸，且更新后的SLAM地图相比于传统的SLAM地图更加准确。

基于第一方面，在一种可能的实施方式中，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图之前，进一步包括：根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；相应的，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图，包括：以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。

其中，所述第K帧图像指的是摄像头采集的视频图像序列中的某一帧。应当理解的是，也就是说，所述摄像头采集的视频图像可以是一个视频序列(视频流)，可以包括多帧图像，而第K帧图像可以是视频流中的某一帧。

本文中，构建SLAM地图所采用的坐标系可称为第一坐标系，本文中的第一坐标系在某些应用场景下也可能被称为局部坐标系、SLAM坐标系、相机坐标系或其他某个合适的术语。相应的，电子设备在局部坐标系下所体现出的位姿可以称为局部位姿。

构建该全局地图所采用的坐标系可称为第二坐标系，本文中的第二坐标系在某些应用场景下也可能被称为全局坐标系、世界坐标系或其他某个合适的术语。相应的，电子设备在全局坐标系下所体现出的位姿可以称为全局位姿。

所述电子设备的位姿数据为第一坐标系下的所述电子设备的位姿数据，或者，第二坐标系下的所述电子设备的位姿数据；所述第一坐标系下是所述SLAM***的SLAM地图的坐标系，所述第二坐标系是所述全局子地图的坐标系。

本申请实施例通过根据同一帧分别获得终端在局部坐标系中的位姿和全局坐标系中的位姿，基于这两种位姿就能够获得两种坐标系之间的坐标系变换信息(例如坐标系变换矩阵)，根据这个坐标系变换矩阵就可以实现了两个坐标系同步，这样，原先用局部坐标系来表示的信息(例如局部位姿、图像的特征点、SLAM地图的3D地图点等等)就可以基于坐标系变换矩阵变换到全局坐标系下。这样就实现了SLAM***中的位姿、3D地图点与全局子地图中的3D地图点在同一个坐标系下表示。进而，全局子地图中3D地图点就可以作为SLAM***的量测值输入，实现全局子地图和SLAM***的紧耦合，进而通过位姿估计实时跟踪电子设备的全局位姿，这将能够有效消除SLAM位姿跟踪的漂移。后续需要更新SLAM地图时，就可以将电子设备的全局位姿作为在全局坐标系下的SLAM地图中的位姿数据来更新所述第二坐标系下的SLAM地图。

基于第一方面，在一种可能的实施方式中，所述根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据，包括：根据所述第K帧图像、所述第一坐标系下的SLAM地图以及所述电子设备采集的运动数据，获得所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；所述运动数据包括运动速度数据和运动方向数据。

例如，电子设备中设置有IMU，SLAM***的输入信号包括来自摄像头采集的视频图像、IMU采集的运动数据和局部坐标系下的SLAM地图。IMU高频率地检测电子设备的角速度和线加速度，并对角加速度和线加速度分别积分，进而可计算出电子设备的位姿。摄像头采集的视频图像通过在局部坐标系下的SLAM地图中做匹配，从而也能计算获得电子设备的位姿。那么，基于这两种位姿以一定算法进行运算，就可以获得该第一位姿数据。

又例如，电子设备中除了摄像头和IMU外，还设置有与位姿或运动相关的定位模块(GPS定位、北斗定位、WIFI定位、或基站定位等)，那么，SLAM***还可共同参考摄像头采集的视频图像、IMU采集的运动数据、局部坐标系下的SLAM地图以及定位模块所采集的数据来计算获得该第一位姿数据，进一步提高第一位姿数据的准确性。

基于第一方面，在一种可能的实施方式中，所述根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据，包括：

根据所述第K帧图像进行特征提取，获得图像特征；将所述图像特征在所述第二坐标系下的全局子地图中进行特征匹配，获得与所述图像特征匹配的地图特征；根据所述图像特征和所述地图特征，计算获得所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据。

例如，电子设备对第K帧图像进行特征检测，在第K帧图像中提取出特征的图像位置，特征检测算法不限于FAST、ORB、SIFT、SURF、D2Net、SuperPoint等特征检测方法。然后对每一个检测出的特征进行特征描述，特征描述算法不限于ORB、SIFT、SURF、BRIEF、BRISK、FREAK、D2Net、SuperPoint等特征描述方法，从而形成一个一维向量，用于后续的特征匹配。通过特征匹配，电子设备可从全局子地图中匹配出与第K帧图像最相似的地图内容(例如一帧或多帧关键帧)，具体方法例如包括基于BOW、VLAD等传统图像检索方法以及基于NetVLAD、AI的新型图像检索方法。找出与第K帧图像最相似的地图内容后，就可以基于第K帧图像和最相似的地图内容进行位姿估计，例如可采用PnP、EPnP、3D-3D等配准算法，从而可以计算出该第二位姿数据。

本申请实施例可以实现在电子设备侧，充分利用电子设备的运算能力，计算第一位姿数据和第二位姿数据，提高了处理效率，还能够减轻服务器的计算负担。

向服务器发送所述第K帧图像；从所述服务器接收所述第二位姿数据，所述第二位姿数据是所述服务器根据所述第K帧图像和所述第二坐标系下的全局子地图进行特征提取和特征匹配确定的。

其中，所述第K帧图像可以是摄像头拍摄的视频图像序列中的第1帧图像。

本实施例中，由于电子设备需要先下载对应区域的全局子地图。下载地图的过程需要花费一定时间。为了加快用户进入应用的速度，可以采用第一次全局位姿估计在服务器端完成的方式。也即是说，应用启动后，第一次全局位姿估计在服务器侧进行，在启动全局位姿估计的同时，服务器相应获取全局子地图并向电子设备传输，提高用户进入应用的速度。用户并不会感知到地图下载流程的时延存在，这样，能够避免了下载时延造成的用户等待，进一步提升用户体验。

基于第一方面，在一种可能的实施方式中，所述在所述显示组件上显示所述虚拟物体的位置与姿态，包括：在所述显示组件上显示第一界面，在所述第一界面显示视频流和虚拟物体；所述虚拟物体相对于所述视频流的位置与姿态是基于所述电子设备的位姿数据来显示的，所述电子设备的位姿数据是至少根据所述摄像头采集的所述视频图像和所述全局子地图执行位姿计算过程得到的。

其中，所述虚拟物体相对于所述视频流的位置与姿态例如所述虚拟物体叠加于所述视频流的位置与姿态。所述虚拟物体叠加于所述视频流的位置与姿态是基于所述电子设备的位姿数据来显示的，所述电子设备的位姿数据是至少根据所述摄像头采集的所述视频流和所述全局子地图执行位姿计算处理得到的。

例如，AR应用可借助计算机图形技术和可视化技术生成现实环境中不存在的虚拟物体，并基于电子设备当前的全局位姿，从而在取景框内把虚拟物体叠加到取景框的视频流中。即所述虚拟物体叠加于所述视频流的位置与姿态是基于所述电子设备的位姿数据来显示的。所述电子设备的位姿数据是至少根据所述摄像头采集的所述视频流和所述全局子地图执行位姿计算处理得到的。

需要说明的是，本申请的方案也可应用于VR场景(例如应用于VR眼镜)，在VR场景中显示屏所显示的内容可以只有虚拟物体而没有真实环境的视频流。

第二方面，本申请实施例提供又一种虚拟物体显示方法，该方法可应用于具有显示组件和摄像头的电子设备，电子设备可以是手持终端(如手机)，VR或AR眼镜，无人机，无人车等，所述方法包括：获取全局子地图并存储到所述电子设备的即时定位与地图构建 (SLAM)***中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据；基于所述电子设备的位姿数据，在所述显示组件上显示所述虚拟物体(或者，在所述显示组件上显示所述虚拟物体的位置与姿态)。

其中，所述电子设备的位姿数据可以是第一坐标系(用于SLAM***生成的SLAM地图的局部坐标系)下的位姿数据，或者，第二坐标系(全局子地图对应的全局坐标系)下的位姿数据，

本实施例中，电子设备可从服务器下载全局子地图，通过本地摄像头采集环境中的视频图像，结合采集的视频图像以及所下载的全局子地图确定电子设备的当前位姿，进而基于电子设备的当前位姿在显示组件上显示虚拟物体的位置与姿态。虚拟物体相应可以为VR场景、AR场景或MR场景中的虚拟物体(即虚拟环境中的物体)。电子设备的显示组件具体可以包括显示面板，也可以包括镜片(例如VR眼镜)或者投影屏等。

通常来讲，全局地图是一种大地理范围的高精度的地图，所谓“大地理范围”是相对于电子设备中的SLAM地图所代表的地理范围而言的，例如全局地图可以是由一个或多个电子设备生成的多个SLAM地图按照一定的规则进行整合得到的。相应的，全局子地图表示全局地图中与电子设备的位置对应的子地图，也就是说，可以以电子设备的实际位置在去全局地图中的位置点为起点，获取起点周围预设区域内的地图内容作为所述全局子地图。

本申请实施例中，电子设备通过请求服务器下载全局子地图，利用比SLAM地图精度更高的全局子地图作为视觉观测输入给SLAM***，SLAM***使用全局子地图来估计电子设备的位姿，能够有效减少甚至消除SLAM***长时间位姿估计出现的位姿漂移现象，进而确保在VR或AR或MR应用的长时间(例如超过1分钟)运行中虚拟物体在电子设备的显示位置和方向不会偏移，长时间正确地显示虚拟物体(例如，在视频图像所表示的环境和时长下，以相对准确的方式显示虚拟物体)，从而提升用户的使用体验。

基于第二方面，在一种可能的实施方式中，所述根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据，包括：至少根据所述摄像头采集的视频图像和所述全局子地图以第一频率执行位姿计算，以得到所述电子设备的位姿数据。

其中，第一频率表示电子设备中的SLAM***执行全局位姿估计的频率，即调用全局子地图的频率。第一频率在数值上可以小于等于显示面板显示视频流的频率。例如，第一频率的取值范围可以是10～30Hz，即每秒10～30帧，即调用全局子地图的频率可以是10～30帧中的某个值。

也就是说，电子设备的SLAM***可以以较高的固定频率调用所述全局子地图，以实现对电子设备的位姿跟踪。这样，在实时获得电子设备的全局位姿后，可以根据电子设备的全局位姿在显示组件内实时显示和更新AR场景中虚拟物体的位置与姿态。并且在长时间的位姿更新过程中，在虚拟物体的位置与姿态也不会发生跳动现象。这是因为，一方面，在这段时间内，电子设备中的SLAM***是基于全局子地图来计算电子设备的全局位姿，能够克服电子设备中预先构建的SLAM地图不准确的问题，尽量避免位姿误差的累计，从而最大程度地克服漂移现象的发生；另一方面电子设备能够稳定地、高频次地基于全局子地图来执行全局位姿估计，极大减少了全局位姿的突变；再一方面，计算全局位姿的过程在电子设备侧完成，位姿估计的算法延迟低，位姿跟踪效果好。所以，本实施例能长时间显示虚拟物体且虚拟物体在画面中不会偏移出错，消除了由于位姿突变导致的虚拟物体的跳动现象，进一步提升用户体验。

基于第二方面，在一种可能的实施方式中，所述电子设备的位姿数据为第一坐标系下的所述电子设备的位姿数据，或者，第二坐标系下的所述电子设备的位姿数据；所述第一坐标系下是所述SLAM***的SLAM地图的坐标系，所述第二坐标系是所述全局子地图的坐标系。

基于第二方面，在一种可能的实施方式中，所述根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据，包括：根据所述摄像头采集的视频图像、所述全局子地图以及所述电子设备采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。所述电子设备采集的运动数据例如可以是电子设备中的惯性测量单元(IMU)采集的运动数据，通过引入IMU来进一步提高所估计的全局位姿的准确度，保证了全局子地图的3D特征有效作为量测值作用到SLAM算法中，通过高精度地执行位姿估计来避免位姿漂移现象和跳动现象的发生。

基于第二方面，在一种可能的实施方式中，所述方法还包括：电子设备根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图。

基于第二方面，在一种可能的实施方式中，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图之前，进一步包括：根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；相应的，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图，包括：以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。

基于第二方面，在一种可能的实施方式中，所述获取全局地图的全局子地图，包括：向服务器发送用于指示所述电子设备的初始位置的第一位置指纹信息；从所述服务器接收所述全局子地图，所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。通过服务器执行地图匹配操作，提高了匹配效率和精准度，进而有利于减少下载地图的时延。

基于第二方面，在一种可能的实施方式中，所述虚拟物体为虚拟现实VR场景、增强现实AR场景、或混合现实MR场景中的虚拟物体。

第三方面，本申请实施例提供了一种用于虚拟物体显示的电子设备，包括：交互模块、数据采集模块、通信模块和SLAM模块，其中：

交互模块，用于检测到用户打开应用的操作；

通信模块，用于响应于所述操作，下载全局子地图并存储到所述电子设备的即时定位与地图构建(SLAM)模块中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；

所述交互模块还用于在所述显示组件上显示所述虚拟物体的位置与姿态，所述虚拟物体的位置与姿态是SLAM模块至少根据数据采集模块采集的视频图像和所述全局子地图执行位姿计算得到的。

其中，所述SLAM模块可以是本申请的实施例中所描述的SLAM***，例如可以是本文后文实施例描述的SLAM***12。

基于第三方面，在一种可能的实施方式中，所述电子设备的位姿数据用于表征所述虚拟物体的位置与姿态，所述电子设备的位姿数据是所述SLAM模块至少根据所述数据采集模块采集的视频图像和所述全局子地图以第一频率执行位姿计算得到的。

基于第三方面，在一种可能的实施方式中，所述SLAM模块执行位姿计算的过程包括：根据所述数据采集模块采集的视频图像、所述全局子地图以及所述数据采集模块采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。

基于第三方面，在一种可能的实施方式中，所述通信模块具体用于：响应于所述操作，向服务器发送所述电子设备的初始位置的指示信息；从所述服务器接收所述全局子地图，所述全局子地图是根据所述电子设备的初始位置确定的。

基于第三方面，在一种可能的实施方式中，所述电子设备的初始位置的指示信息包括用于指示所述电子设备的初始位置的第一位置指纹信息；所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。

基于第三方面，在一种可能的实施方式中，所述SLAM模块还用于，根据所述电子设备的位姿数据更新所述SLAM模块的SLAM地图。

基于第三方面，在一种可能的实施方式中，所述电子设备还包括全局定位模块和坐标系变化矩阵计算模块；

所述SLAM模块具体用于，根据所述数据采集模块采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；

所述全局定位模块具体用于，根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；

所述坐标系变化矩阵计算模块具体用于，通过所述坐标系变化矩阵计算模块根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；

所述SLAM模块还用于，根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。

基于第三方面，在一种可能的实施方式中，所述SLAM模块具体用于：根据所述第K帧图像、所述第一坐标系下的SLAM地图以及所述数据采集模块采集的运动数据，获得所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；所述运动数据包括运动速度数据和运动方向数据。

基于第三方面，在一种可能的实施方式中，全局定位模块具体用于：所述根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据，包括：根据所述第K帧图像进行特征提取，获得图像特征；将所述图像特征在所述第二坐标系下的全局子地图中进行特征匹配，获得与所述图像特征匹配的地图特征；根据所述图像特征和所述地图特征，计算获得所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据。

基于第三方面，在一种可能的实施方式中，所述通信模块还用于：向服务器发送所述第K帧图像；从所述服务器接收所述第二位姿数据，所述第二位姿数据是所述服务器根据所述第K帧图像和所述第二坐标系下的全局子地图进行特征提取和特征匹配确定的。

基于第三方面，在一种可能的实施方式中，所述交互模块具体用于：在所述显示组件上显示第一界面，在所述第一界面显示视频流和虚拟物体；所述虚拟物体相对于所述视频流的位置与姿态是基于所述电子设备的位姿数据来显示的，所述电子设备的位姿数据是至少根据所述数据采集模块采集的所述视频图像和所述全局子地图执行位姿计算过程得到的。

第四方面，本申请实施例提供了一种用于虚拟物体显示的电子设备，包括交互模块、数据采集模块、通信模块和SLAM模块，其中：

通信模块，用于获取全局子地图并存储到所述电子设备的即时定位与地图构建(SLAM)模块中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；

SLAM模块，用于根据所述数据采集模块采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据；

交互模块，用于基于所述电子设备的位姿数据，在所述显示组件上显示所述虚拟物体。

基于第四方面，在一种可能的实施方式中，所述SLAM模块具体用于：至少根据所述数据采集模块采集的视频图像和所述全局子地图以第一频率执行位姿计算，以得到所述电子设备的位姿数据。

基于第四方面，在一种可能的实施方式中，所述电子设备的位姿数据为第一坐标系下的所述电子设备的位姿数据，或者，第二坐标系下的所述电子设备的位姿数据；所述第一坐标系下是所述SLAM模块的SLAM地图的坐标系，所述第二坐标系是所述全局子地图的坐标系。

基于第四方面，在一种可能的实施方式中，所述SLAM模块具体用于：根据所述数据采集模块采集的视频图像、所述全局子地图以及所述数据采集模块采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。

基于第四方面，在一种可能的实施方式中，所述SLAM模块还用于，根据所述电子设备的位姿数据更新所述SLAM模块的SLAM地图。

基于第四方面，在一种可能的实施方式中，所述电子设备还包括全局定位模块和坐标系变化矩阵计算模块；

基于第四方面，在一种可能的实施方式中，所述通信模块还用于，向服务器发送用于指示所述电子设备的初始位置的第一位置指纹信息；从所述服务器接收所述全局子地图，所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。

基于第四方面，在一种可能的实施方式中，所述虚拟物体为虚拟现实VR场景、增强现实AR场景、或混合现实MR场景中的虚拟物体。

第五方面，本申请实施例提供了一种用于虚拟物体显示的电子设备，包括：显示组件、摄像头、一个或多个处理器、存储器以及一个或多个应用程序、一个或多个计算机程序；所述一个或多个计算机程序被存储在所述存储器中，所述一个或多个计算机程序包括指令，当所述指令被所述电子设备执行时，使得电子设备执行上述第一方面或第一方面任一项可能的实施方式中描述的虚拟物体显示方法。

第六方面，本申请实施例提供了一种用于虚拟物体显示的电子设备，包括：显示组件、摄像头、一个或多个处理器、存储器，以及一个或多个计算机程序；所述一个或多个计算机程序被存储在所述存储器中，所述一个或多个计算机程序包括指令，当所述指令被所述电子设备执行时，使得电子设备执行上述第二方面或第二方面任一项可能的实施方式中描述的虚拟物体显示方法。

第七方面，本申请实施例提供一种芯片，所述芯片包括处理器与数据接口，所述处理器通过所述数据接口读取存储器上存储的指令，执行第一方面或第一方面的任一可能的实施方式中的虚拟物体显示方法。

可选地，作为一种实施方式，所述芯片还可以包括存储器，所述存储器中存储有指令，所述处理器用于执行所述存储器上存储的指令，当所述指令被执行时，所述处理器用于执行第一方面或第一方面的任一可能的实施方式中的虚拟物体显示方法。

第八方面，本申请实施例提供一种芯片，所述芯片包括处理器与数据接口，所述处理器通过所述数据接口读取存储器上存储的指令，执行第二方面或第二方面的任一可能的实施方式中的虚拟物体显示方法。

可选地，作为一种实施方式，所述芯片还可以包括存储器，所述存储器中存储有指令，所述处理器用于执行所述存储器上存储的指令，当所述指令被执行时，所述处理器用于执行第二方面或第二方面的任一可能的实施方式中的虚拟物体显示方法。

第九方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读介质存储用于设备执行的程序代码，所述程序代码包括用于执行第一方面或者第一方面的任一可能的实施方式中的方法的指令，或者，所述程序代码包括用于执行第二方面或者第二方面的任一可能的实施方式中的方法的指令。

第十方面，本发明实施例提供了一种计算机程序产品，该计算机程序产品可以为一个软件安装包，该计算机程序产品包括程序指令，当该计算机程序产品被电子设备执行时，该电子设备的处理器执行前述第一方面或第二方面中的任一可能的实施方式中的方法。

可以看到，实施本申请实施例，电子设备通过请求服务器下载全局子地图，利用比SLAM地图精度更高的全局子地图作为视觉观测输入给SLAM***，电子设备的SLAM***可以以较高的固定频率调用所述全局子地图，以实现对电子设备的位姿跟踪。这样，在实时获得电子设备的全局位姿后，可以根据电子设备的全局位姿在显示组件内实时显示和更新AR场景中虚拟物体的位置与姿态。并且在长时间的位姿更新过程中，在虚拟物体的位置与姿态也不会发生漂移现象和跳动现象。

附图说明

为了更清楚地说明本申请实施例或背景技术中的技术方案，下面将对本申请实施例或背景技术中所需要使用的附图进行说明。

图1是本申请实施例提供的一种应用架构的示意图；

图2是本申请实施例提供的一种电子设备的结构示意图；

图3是本申请实施例提供的一种服务器的结构示意图；

图4是一种AR场景中出现位姿漂移情况与理想情况的比较图；

图5是本申请实施例提供的一种***，以及该***中的电子设备和服务器的结构示意图；

图6是本申请实施例提供的又一种***，以及该***中的电子设备和服务器的结构示意图；

图7是本申请实施例提供的一种虚拟物体显示方法的流程示意图；

图8是本申请实施例提供的一种采用本申请方法实现的场景的示意图；

图9是本申请实施例提供的又一种采用本申请方法实现的场景的示意图；

图10是本申请实施例提供的又一种采用本申请方法实现的场景的示意图；

图11是本申请实施例提供的又一种虚拟物体显示方法的流程示意图；

图12是本申请实施例提供的又一种虚拟物体显示方法的流程示意图；

图13是本申请实施例提供的一种坐标系变换矩阵相关的场景示意图；

图14是本申请实施例提供的又一种***，以及该***中的电子设备和服务器的结构示意图；

图15是本申请实施例提供的又一种虚拟物体显示方法的流程示意图。

具体实施方式

下面结合本申请实施例中的附图对本申请实施例进行描述。本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释，而非旨在限定本申请。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别不同对象，而不是用于限定特定顺序。在本申请实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

在本申请实施例或所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。如本文所使用的，单数形式的“一”、“某”和“该”旨在也包括复数形式，除非上下文另有明确指示。还将理解，术语“包括”、“具有”、“包含”和/或“含有”在本文中使用时指定所陈述的特征、整数、步骤、操作、要素、和/或组件的存在，但并不排除一个或多个其他特征、整数、步骤、操作、要素、组件和/或其群组的存在或添加。

需要说明的是，在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。

首先描述本申请实施例所涉及的一种应用架构。

参见图1，本申请实施例提供的应用架构包括电子设备10和服务器20，电子设备10和服务器20之间可进行通信，例如电子设备10可通过比如无线保真(wireless-fidelity，Wifi)通信、蓝牙通信、或蜂窝2/3/4/5代(2/3/4/5generation，2G/3G/4G/5G)通信等方式与服务器20进行通信。

电子设备10可以为配置有摄像头和显示组件的各种类型的设备，例如电子设备10可以为手机、平板电脑、笔记本电脑、录像机等终端设备(如图1以电子设备为手机为例)，也可以是用于虚拟场景交互的设备，如VR眼镜、AR设备，MR互动设备等，可以为智能手表、智能手环等可穿戴电子设备，还可以是无人驾驶车辆、无人机等载具中的车载设备。本申请实施例对电子设备的具体形式不做特殊限制。

此外，电子设备10也可能被称为用户装备(UE)、订户站、移动单元、订户单元、无线单元、远程单元、移动设备、无线设备、无线通信设备、远程设备、移动订户站、终端设备、接入终端、移动终端、无线终端、智能终端、远程终端、手持机、用户代理、移动客户端、客户端、或其他某个合适的术语。

服务器20具体可以是一台或多台物理服务器(例如图1中示例性地示出了一台物理服务器)，也可以是计算机集群，还可以是云计算场景的虚拟机，等等。

本申请实施例中，电子设备10可安装VR或AR或MR应用等虚拟场景应用程序，并可基于用户的操作(例如点击、触摸、滑动、抖动、声控等)运行该VR或AR或MR应用。电子设备可通过本地摄像头和/或传感器采集环境中任意物体的视频图像，根据采集的视频图像在显示组件上显示虚拟物体。虚拟物体相应可以为VR场景、AR场景或MR场景中的虚拟物体(即虚拟环境中的物体)。

需要说明的是，本申请实施例中，电子设备10中的虚拟场景应用可以是电子设备自身内置的应用程序，也可以是用户自行安装的第三方服务商提供的应用程序，本申请实施例不作限定。

本申请实施例中，电子设备10还配置有即时定位与地图构建(simultaneous localization and mapping，SLAM)***，SLAM***能够实现在完全未知环境中创建地图，并利用该地图进行自主定位、位姿(位置与姿态)确定、导航等。本文中由SLAM***所构建的地图可简称SLAM地图，SLAM地图可以理解为SLAM***根据采集设备采集到的环境信息所绘制出的地图，采集设备例如可以包括电子设备中的图像采集装置(例如摄像头或相机)和惯性测量单元(Inertial Measurement Unit，IMU)，IMU中可以包括：陀螺仪、加速度计等传感器。

例如，SLAM地图可以包含以下地图内容：多个关键帧、三角测量的特征点以及关键帧和特征点之间的关联。关键帧可以基于摄像头采集的图像和用来产生图像的相机参数(例如，电子设备在SLAM坐标系中的位姿)而形成。其中所述特征点可以表示SLAM地图中沿着三维空间的不同的3D地图点以及在3D地图点上的特征描述。每一特征点可具有关联的特征位置。每个特征点可表示3D坐标位置，并且与一或多个描述符相关联。特征点又可称为3D特征、特征点、3D特征点或者其他合适的名字。

构建该SLAM地图所采用的坐标系可称为第一坐标系，本文中的第一坐标系在某些应用场景下也可能被称为局部坐标系、SLAM坐标系、相机坐标系或其他某个合适的术语。为了理解上的方便，后文将主要以“局部坐标系”的名称进行方案的介绍。相应的，电子设备在局部坐标系下所体现出的位姿可以称为局部位姿。

本申请实施例中，服务器20可作为向电子设备10的VR或AR或MR应用提供内容和信息支撑的平台。服务器20中也存储有地图，本文中该地图可简称为全局地图。通常的，全局地图相比单一电子设备中的SLAM地图而言，包含了更大的区域，而且地图内容精度更高，由服务器对全局地图进行维护和更新。在一种实现中，可预先在服务器中离线构建全局地图。在又一种实现中，全局地图可以是由一个或多个电子设备采集到的多个SLAM地图按照一定的规则进行整合得到的。

构建该全局地图所采用的坐标系可称为第二坐标系，本文中的第二坐标系在某些应用场景下也可能被称为全局坐标系、世界坐标系或其他某个合适的术语。为了理解上的方便，后文将主要以“全局坐标系”的名称进行方案的介绍。相应的，电子设备在全局坐标系下所体现出的位姿可以称为全局位姿。

参见图2，图2示例性地示出了电子设备10的一种结构示意图。应该理解的是，本申请实施例示意的结构并不构成对电子设备10的具体限定。在本申请另一些实施例中，电子设备10可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

如图2所示，电子设备10可包括：芯片310、存储器315(一个或多个计算机可读存储介质)、用户接口322、显示组件323、摄像头324、用于设备定位的定位模块331以及用于通信的收发器332。这些部件可在一个或多个通信总线314上通信。

芯片310可集成包括：一个或多个处理器311、时钟模块312以及电源管理模块313。集成于芯片310中的时钟模块312主要用于为处理器311提供数据传输和时序控制所需要的计时器，计时器可实现数据传输和时序控制的时钟功能。处理器311可以根据指令操作码和时序信号，执行运算，产生操作控制信号，完成取指令和执行指令的控制。集成于芯片310中的电源管理模块313主要用于为芯片310以及电子设备10的其他部件提供稳定的、高精确度的电压。

处理器110又可称为中央处理器(CPU，central processing unit)，处理器110具体可以包括一个或多个处理单元，例如：处理器110可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processing unit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的器件，也可以集成在一个或多个处理器中。

在一些实施例中，处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit，I2C)接口，集成电路内置音频(inter-integrated circuit sound，I2S)接口，脉冲编码调制(pulse code modulation，PCM)接口，通用异步收发传输器(universal asynchronous receiver/transmitter，UART)接口，移动产业处理器接口(mobile industry processor interface，MIPI)，通用输入输出(general-purpose input/output，GPIO)接口，用户标识模块(subscriber identity module，SIM)接口，和/或通用串行总线(universal serial bus，USB)接口等。

存储器315可与处理器311通过总线连接，也可以与处理器311耦合在一起，用于存储各种软件程序和/或多组指令。具体实现中，存储器315可包括高速随机存取的存储器(例如高速缓冲存储器)，并且也可包括非易失性存储器，例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。存储器315可以存储操作***，例如ANDROID，IOS，WINDOWS，或者LINUX等嵌入式操作***。存储器315还用于存储SLAM***的相关程序。存储器315用于存储数据(例如图像数据、点云数据、地图数据、关键帧数据、位姿数据、坐标系转换信息等)。存储器315还可以存储通信程序，该通信程序可用于与一个或多个服务器或者其他设备进行通信。存储器315还可以存储一个或多个应用程序。如图示中这些应用程序可包括：AR/VR/MR等虚拟场景应用程序、地图类应用程序、图像管理类应用程序等等。存储器115还可以存储用户界面程序，该用户界面程序可以通过图形化的操作界面将应用程序的内容(如AR/VR/MR等虚拟场景中的虚拟物体)形象逼真的显示出来并通过显示组件323呈现，以及实现通过菜单、对话框以及按键等输入控件接收用户对应用程序的控制操作。存储器315可以用于存储计算机可执行程序代码，该可执行程序代码包括指令。

用户接口322例如可以是触控面板，通过触控面板可检测用户在检测触控面板上的操作指令，用户接口322也可以是小键盘、物理按键或者鼠标。

电子设备10可以包括一个或多个显示组件323。电子设备10可通过显示组件323、芯片310中的图形处理器(GPU)以及应用处理器(AP)等共同实现显示功能。GPU为用于图像处理的微处理器，连接显示组件323和应用处理器。GPU用于执行数学和几何计算，用于图形渲染。显示组件323用于显示***当前输出的界面内容，例如显示AR/VR/MR等虚拟场景中的图像、视频等，界面内容可包括正在运行的应用程序的界面以及***级别菜单等，具体可由下述界面元素组成：输入型界面元素，例如按键(Button)，文本输入框(Text)，滑动条(Scroll Bar)，菜单(Menu)等等；以及输出型界面元素，例如视窗(Window)，标签(Label)，图像，视频，动画等等。

显示组件323在具体实现中，可以是显示面板，镜片(例如VR眼镜)，投影屏等。显示面板也可以称为显示屏，例如可以是触摸屏、柔性屏、曲面屏等，或者其他光学组件。也即是说在本申请中电子设备具有显示屏时，显示屏可以是触摸屏、柔性屏、曲面屏或者其它形式的屏幕，电子设备的显示屏具有显示图像的功能，至于显示屏的具体材质以及形状本申请对此不作任何限定。

例如，当显示组件323包括显示面板时，显示面板可以采用液晶显示屏(liquid crystal display，LCD)，有机发光二极管(organic light-emitting diode，OLED)，有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode的，AMOLED)，柔性发光二极管(flex light-emitting diode，FLED)，Miniled，MicroLed，Micro-oLed，量子点发光二极管(quantum dot light emitting diodes，QLED)等。此外，一些具体实现中，可以将用户接口322中的触控面板和显示组件323中的显示面板耦合在一起设置，例如触控面板可设置于显示面板下方，触控面板可用于检测用户通过显示面板输入触控操作(例如点击、滑动，触摸等)时作用于显示面板上的触控压力，显示面板用于进行内容显示。

摄像头324可以是单目摄像头或双目摄像头或深度摄像头，用于对环境进行拍摄/录像，以获得图像/视频图像。摄像头324所采集的图像/视频图像例如可作为SLAM***的一种输入数据，或者可通过显示组件323进行图像/视频显示。

在一些场景中，也可以把摄像头324视为一种传感器。摄像头324采集的图像可以是IMG格式，也可以是其他格式类型，这里不做限定。

传感器325可用于采集与电子设备10的状态变化(例如旋转、摆动、移动、抖动等)相关的数据，传感器325所采集的数据例如可作为SLAM***的一种输入数据。传感器325可包括一种或多种传感器，例如惯性测量单元(Inertial Measurement Unit，IMU)，飞行时间(Time of Flight，TOF)传感器等。其中IMU中可进一步包括陀螺仪、加速度计等传感器。陀螺仪可用于测量电子设备运动时的角速度，加速度计用于测量电子设备运动时的加速度。TOF传感器可进一步包括光发射器和光接收器，光发射器可用于向外发射光线，例如激光、红外线、雷达波等，光接收器可用于检测反射的光线，例如反射的激光、红外线、雷达波等。

需要说明的，传感器325还可以包括更多的其他传感器，例如惯性传感器，气压计，磁力计，轮速计等。

定位模块331用于实现对电子设备10的物理定位，例如用于获取电子设备10的初始位置。定位模块331例如可包括WIFI定位模块、蓝牙定位模块、基站定位模块、卫星定位模块中的一个或多个。其中卫星定位模块中可设置有全球导航卫星***(Global Navigation Satellite System，GNSS)以辅助定位，GNSS不限于北斗***、GPS***、GLONASS***、Galileo***。

收发器332用于实现电子设备10与服务器或其他终端设备之间的通信。收发器332集成了发射器和接收器，分别用于发送和接收射频信号。具体实现中，收发器332可包括但不限于：天线***、RF收发器、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC芯片、SIM卡和存储介质等。在一些实施例中，还可在单独的芯片上实现收发器332。收发器332例如可支持通过2G/3G/4G/5G等中的至少一种的数据网络通信，和/或支持以下近距无线通信的方式中的至少一种：蓝牙(Bluetooth，BT)通信，无线保真(WirelessFidelity，WiFi)通信，近场通信(Near Field Communication，NFC)，红外(Infrared，IR)无线通信，超宽带(UWB，Ultra Wide Band)通信，ZigBee通信。

本申请实施例中，处理器311通过运行存储在存储器315的指令，从而执行电子设备10的各种功能应用以及数据处理，具体的，可执行如图7实施例所示方法步骤，或者可执行如图11、图12、或图15实施例中电子设备侧的功能。

参见图3，图3是本申请实施例提供的一种服务器20的实施方式的结构框图。如图3所示，服务器20包括处理器403、存储器401(一个或多个计算机可读存储介质)、收发器402。这些部件可在一个或多个通信总线404上通信。其中：

处理器403可以是一个或多个中央处理器(Central Processing Unit，CPU)，在处理器403是一个CPU的情况下，该CPU可以是单核CPU，也可以是多核CPU。

存储器401可与处理器403通过总线连接，也可以与处理器403耦合在一起，用于存储各种软件程序和/或多组指令、以及数据(例如地图数据、位姿数据等)。具体实现中，存储器401包括但不限于是随机存储记忆体(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、或便携式只读存储器(Compact Disc Read-Only Memory，CD-ROM)。

收发器402主要集成了接收器和发射器，其中接收器用于接收电子设备发送的数据(例如请求、图像等)，发射器用于向电子设备发送数据(例如地图数据、位姿数据等)。

应当理解，上述服务器20仅为本申请实施例提供的一个例子，具体实现中，服务器20可具有比图示更多的部件。

本申请具体实施例中处理器403可用于调用存储器401中的程序指令，执行如图11、图12、或图15实施例中服务器侧的功能。

本文所使用的术语“耦合”意指直接连接到、或通过一个或多个居间组件或电路来连接。本文所描述的在各种总线上提供的任何信号可以与其他信号进行时间复用并且在一条或多条共用总线上提供。另外，各电路元件或软件块之间的互连可被示为总线或单信号线。每条总线可替换地为单信号线，而每条单信号线可替换地为总线，并且单线或总线可表示用于各组件之间的通信的大量物理或逻辑机制中的任一个或多个。

在AR/VR/MR等虚拟场景中，电子设备在显示组件上实时呈现的虚拟物体的位置/姿态与电子设备自身的位置/姿态息息相关，也即是说，电子设备自身的位姿数据决定了所呈现的虚拟物体形态、大小、内容等。所以，需要对电子设备的位姿进行跟踪。在一种现有的位姿跟踪方案中，SLAM***对输入的图像进行特征提取，并基于已建成的SLAM地图获得一种估计位姿，利用IMU采集的加速度、角速度等信息进行处理获得又一种估计位姿，最后将两种估计位姿通过一定算法进行整合处理，得到电子设备的最终位姿。然而，由于每次估计的位姿均存在一定的误差，所以，在进行位姿跟踪过程中，误差不断迭代累计，越来越大，所以当SLAM***长时间运行(例如1分钟)后，电子设备在局部坐标系下的位姿(局部位姿)会出现漂移现象，虚拟物体在电子设备的显示位置和方向也会出现明显偏移。

为了纠正漂移现象，现有方案中电子设备向服务器传输当前图像，服务器基于该当前图像计算出电子设备在全局坐标系下的位姿并传回电子设备(中间时延例如2秒)，电子设备计算并更新出全局坐标系和局部坐标系之间的坐标变换矩阵。由于SLAM***已存在漂移现象，当前计算的坐标系变换矩阵与前一次计算的坐标系变换矩阵数值上将会有明显差异，因此SLAM***在使用当前计算的坐标系变换矩阵来更新局部位姿时，局部位姿将有显著改变，导致所呈现的虚拟物体存在跳动现象。

为了便于理解，以图4所示AR场景为例，图4示出了一种出现位姿偏移情况的场景和理想情况的场景。图示中104表示环境中的真实图像，导航指示105、店面指示106、互动机器人107均为使用图形技术和可视化技术生成的虚拟对象。基于当前电子设备的位姿，可以计算出这些虚拟对象在画面中的位姿和姿态，从而使得这些虚拟对象与真实环境图像融合为一体，以呈现给用户真实的感观体验。对比图6中的两种情况可以看到，当SLAM***出现位姿漂移现象时，这些虚拟对象会在画面中呈现中不合理的偏移，导致虚拟对象与真实环境图像的融合效果失真，极大影响用户感观体验。当SLAM***对漂移现象进行纠正时，画面中的这些虚拟对象从不合理的偏移状态跳转为正常理想状态，所以用户会看到“虚拟对象跳动”的现象，这也给用户带来了不好的使用体验。

参见图5，图5是本申请实施例提供的一种***的结构框图。该***包括电子设备10和服务器20，电子设备10和服务器20之间可通过各自的收发器实现通信连接。为了实现在电子设备10上减少甚至消除位姿的漂移现象和跳动现象，实现高度准确的位姿跟踪，本申请实施例中，在电子设备10中配置SLAM***12、数据采集模块13、交互模块14和通信模块11，SLAM***12、数据采集模块13、交互模块14和通信模块11可以以软件代码的形式存在，在一具体实现中，这些功能模块的数据/程序可被存储于如图2所示的存储器315，并可运行于如图2所示的处理器311。其中：

通信模块11可利用如图2所示的收发器332，实现与服务器20的通信，具体的，通信模块11被配置成从服务器20获取全局子地图，所述全局子地图是服务器20所存储的全局地图中与电子设备10的位置信息对应的子地图。并将全局子地图存储到电子设备10的SLAM***12中的全局子地图的数据库123中。

数据采集模块13被配置成利用如图2所示的传感器325来获得电子设备10的状态数据，利用如图2所示的摄像头324来获得视频图像，以及利用如图2所示的定位模块331来获得电子设备的位置。

交互模块14被配置成利用如图2所示的用户接口322实现用户操作的检测获得，以及利用如图2所示的显示组件323实现图像/视频/虚拟物体等的显示，例如AR/VR/MR等应用内容的显示。

SLAM***12中的计算模块121被配置成根据摄像头324采集的视频图像和所下载的全局子地图执行位姿计算，以得到电子设备10的位姿数据；交互模块14可基于电子设备10的位姿数据，在显示组件上显示虚拟物体。

SLAM***12自身所构建的SLAM地图保存在SLAM地图的数据库122中，SLAM***还被配置成基于电子设备10的位姿数据来更新数据库122中的SLAM地图。

具体实施例中，电子设备10中的各功能模块可相互配合，以执行如图7实施例所示方法中的步骤，或者执行如图11、图12、或图15实施例中电子设备侧的功能。

在服务器20中配置通信模块21、处理模块22、全局地图的数据库23。通信模块21、处理模块22和全局地图的数据库23可以以软件代码的形式存在。在一具体实现中，这些功能模块的数据/程序可被存储于如图3所示的存储器401，并可运行于如图3所示的处理器403。其中：

全局地图的数据库23用于存储、维护和更新全局地图。

处理模块22可被配置成基于电子设备10的位置信息从数据库23所存储的全局地图中获取与电子设备10的位置信息对应的子地图，即全局子地图。

通信模块21可利用如图3所示的收发器402，实现与电子设备10的通信。具体的，通信模块21可将全局子地图发送给电子设备10。

具体实施例中，服务器20中的各功能模块可相互配合，以执行如图11、图12、或图15实施例中服务器侧的功能。

参见图6，图6示出了在一种具体实现中，图5所示的电子设备10中的各功能模块进一步可能包含的组件(或称子模块)，以及服务器20中的各功能模块进一步可能包含的组件(或称子模块)。需要说明的是，电子设备10中的各功能模块(例如SLAM***、数据采集模块13，交互模14)进一步可能包含的组件和服务器20中的各功能模块(例如处理模块22)进一步可能包含的组件(或称子模块)仅为本申请实施例的示例，在其他实施例中，上述功能模块还可以包含更多或更少的组件(或称子模块)。

如图6所示，SLAM***12中的计算模块121进一步包括建图模块1211，位姿估计模块1212，位姿估计模块1212、特征处理模块1213和闭环纠正模块。此外，在电子设备10中还包括全局定位模块16和软件开发工具包(Software Development Kit,SDK)。全局定位模块16进一步包括图像检索模块161、特征提取模块162、特征匹配模块163和位姿估计模块164。SDK中可包括分别用于全局位姿和局部位姿的数据库以及坐标系变化矩阵计算模块15，SDK还可以调用交互模块14通过显示组件实现显示。

特征处理模块1213可用于与视觉特征处理相关的操作，例如在一种实施例中特征处理模块1213可进一步包括特征提取模块(图未示)和特征匹配模块(图未示)。特征提取模块包括特征检测功能和特征描述功能，特征检测功能是在图像中提取出特征的图像位置，特征描述功能是对每一个检测出的特征进行描述，形成一个一维向量，用于特征匹配模块的特征匹配中。

数据采集模块13(例如IMU传感器)能输出高频率的角速度、线加速度，位姿估计模块1212对角加速度、线加速度分别积分，并结合摄像头拍摄的视频图像进行位姿估计，可计算出电子设备的位置和姿态。位姿估计的结果可作为SLAM***输出。同时，位姿估计的结果也可作为建图模块1211的输入。建图模块1211在局部坐标系下，创建SLAM***能感知到的环境地图，即SLAM地图。SLAM***在空间中不断运行的过程中，不断在创建/更新SLAM地图。当SLAM***回到运行过的场景时，闭环纠正模块1214可用于减少SLAM地图可能累计的误差。在一些实施例中，SLAM地图反过来也可以作为位姿估计模块1212进行位姿估计的输入，提高位姿估计的准确度。

在一种实施例中，数据库123中保存有从服务器10下载的全局子地图，位姿估计模块1212被配置成根据所述全局子地图和摄像头324采集的视频图像以及传感器325采集的运动数据执行位姿计算以得到电子设备10的位姿数据，即获得电子设备10的全局位姿，从而实现对电子设备10的位姿的跟踪定位。所述运动数据包括电子设备10的运动速度数据和运动方向数据，例如加速度、角速度等。具体的，特征处理模块1213可用于提取视频图像的2D特征，位姿估计模块1212可根据所述视频图像的2D特征、全局子地图的3D地图点以及数据采集模块13(例如IMU)采集的运动数据，获得电子设备10在所述全局子地图中的全局位姿。

在一种实施例中，位姿估计模块1212被配置成以相对较高的第一频率来跟踪电子设备10的全局位姿，第一频率表示SLAM***执行全局位姿估计的频率，即SLAM***调用数据库123中的全局子地图的频率，第一频率在数值上可以小于等于显示组件显示视频流的频率。例如，第一频率为每秒30帧，当然这里只是解释说明而非限定。也就是说，位姿估计模块1212可以以较高的固定频率调用所述全局子地图实现对电子设备10的位姿跟踪。这样，在实时获得电子设备10的全局位姿后，可以根据电子设备10的全局位姿在所述显示组件上显示AR/VR/MR等虚拟场景中虚拟物体的位置与姿态。

SLAM***的位姿估计模块1212也可用于根据摄像头采集的视频图像序列中的第K帧图像和局部坐标系下的SLAM地图，确定电子设备10在局部坐标系下的SLAM地图中的局部位姿(这里的局部位姿可称为第一位姿数据)，K为大于等于1的整数。具体的，特征处理模块1213可用于提取所述第K帧图像中的2D特征，位姿估计模块1212可根据所述第K帧图像中的2D特征、局部坐标系下的SLAM地图的3D地图点以及数据采集模块13(例如IMU)采集的运动数据，获得电子设备10在所述局部坐标系下的SLAM地图中的第一位姿数据；所述运动数据包括电子设备10的运动速度数据和运动方向数据，例如加速度、角速度等。

全局位姿模块16用于在初始时刻乃至之后的任一时刻，根据所采集的视频图像中的第K帧图像和全局子地图，确定所述电子设备10在全局子地图中的全局位姿(这里的全局位姿可称为第二位姿数据)，K为大于等于1的整数。具体的，可通过图像检索模块161获取视频图像序列中的第K帧图像，通过特征提取模块162根据所述第K帧图像进行特征提取，获得图像特征，通过特征匹配模块163将所述图像特征在全局子地图中进行特征匹配，获得与所述图像特征匹配的地图特征；通过位姿估计模块164根据所述图像特征和所述地图特征，计算获得所述电子设备10在全局子地图中的第二位姿数据。

上述第一位姿数据(局部位姿)和第二位姿数据(全局位姿)可分别保存于SDK中的数据库。坐标系变化矩阵计算模块15可配置成根据所述第一位姿数据和所述第二位姿数据，计算获得所述SLAM地图的局部坐标系和所述全局地图的全局坐标系之间的坐标系变换信息(例如，坐标系变换矩阵)。并将该坐标系变换信息反馈给SLAM***。

SLAM***中的建图模块1211可被配置成根据电子设备10的位姿数据更新SLAM***的数据库122中的SLAM地图。具体的，建图模块1211可将根据坐标系变换信息将SLAM地图变换到全局坐标系下，以电子设备10的全局位姿作为在全局坐标系下的SLAM地图中的位姿数据来更新所述全局坐标系下的SLAM地图。

具体实施例中，电子设备10中的各功能模块可相互配合，以执行如图7实施例所示方法中的步骤，或者执行如图11、图12实施例中电子设备侧的功能。

在一种实施例中，服务器20中的处理模块22进一步包括子地图处理模块221和位置指纹匹配模块222，位置指纹匹配模块222被配置成根据电子设备10的发送的初始位置的位置指纹信息(这里可称为第一位置指纹信息)，在所述全局地图中寻找具有与所述第一位置指纹信息相匹配的位置指纹信息(这里可称为第二位置指纹信息)。子地图处理模块221用于在所述数据库23的全局地图中取出具有所述第二位置指纹信息的全局子地图。该全局子地图也可另外保存于服务器20的数据库，以便于下次快捷取用。服务器20可将具有所述第二位置指纹信息的全局子地图发送给电子设备10。

具体实施例中，服务器20中的各功能模块可相互配合，以执行如图11、图12实施例中服务器侧的功能。

基于上文的描述，下面给出本申请实施例提供的一些虚拟物体显示方法。对于下文描述的各方法实施例，为了方便起见，将其都表述为一系列的动作步骤的组合，但是本领域技术人员应该知悉，本申请技术方案的具体实现并不受所描述的一系列的动作步骤的顺序的限制。

参见图7，图7是本申请实施例提供的一种虚拟物体显示方法的流程示意图，在一些实现中，该方法可应用于具有显示组件和摄像头的电子设备。该方法包括但不限于以下步骤：

S1011、检测到用户打开应用的操作。

S1012、响应于该操作，下载全局子地图并存储到电子设备的SLAM***中；所述全局子地图是全局地图中与电子设备的位置对应的子地图。

S1013、在电子设备的显示组件上显示虚拟物体的位置与姿态，虚拟物体的位置与姿态是至少根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算得到的。

本申请实施例中，用户在电子设备上输入用于打开应用(application，APP)的操作，例如点击、触摸、滑动、抖动、声控等操作，响应于所述操作，一方面在电子设备的显示组件(例如显示面板或者镜片)上显示应用的界面，另一方面启动从服务器或者其他设备(例如其他终端设备或硬盘、USB等存储介质)下载全局子地图的进程。其中，应用可以是电子设备中安装的AR/VR/MR等应用。

示例性的，参见图8，在一种可能的实现场景中，以电子设备10为手机为例，电子设备10中安装有某种虚拟场景应用(例如，可以是带有AR功能的导航地图应用)，图8中的(a)示出了电子设备10的显示面板上的一种图形用户界面(graphical user interface，GUI)，该GUI为电子设备的桌面101。当电子设备检测到用户点击桌面101上的虚拟场景应用的图标102的操作后，一方面在后台启动下载全局子地图的流程，另一方面，在启动该虚拟场景应用后，在显示面板上显示如图8中的(b)所示的另一GUI，该GUI的用户界面103以AR导航界面为例，该用户界面103又可称为第一界面。该用户界面103上可以包括取景框104。该取景框104内可以实时显示电子设备10所在的真实环境的预览视频流。该预览视频流是通过电子设备10的摄像头拍摄获得的。在该预览视频流上，还叠加有AR应用的虚拟物体。虚拟物体的数量可以是一个或多个，如图8中的(b)所示中，虚拟物体示例性地以导航指示105、店面指示106、互动机器人107为例，导航指示105能够通过方位箭头来实时指示当前位置到达某目的地的导航路线，店面指示106能够实时、准确地在指示取景框104的视频流中显式或隐式出现的店铺的类型名称，互动机器人107可用来实现语音对话、语音介绍、或者仅仅作为街边趣味性的展示等等。

具体的，在电子设备10在后台(处理器)中，根据所获得的全局子地图和摄像头实时拍摄的视频图像，执行位姿计算，从而实时获得电子设备10当前在全局坐标系下的位姿数据(即全局位姿)。AR场景中虚拟物体的位置和姿态可由电子设备10的全局位姿来决定，即电子设备的全局位姿表征了所述虚拟物体的位置与姿态。所以，可以实时基于电子设备10的全局位姿，在该取景框104内显示AR场景中虚拟物体的位置与姿态。

AR应用可借助计算机图形技术和可视化技术生成现实环境中不存在的虚拟物体，并基于电子设备10当前的全局位姿，将虚拟物体叠加到取景框104内，从而在取景框104内把虚拟物体叠加到取景框104的视频流中。

举例来说，电子设备10通过摄像头捕获到视频图像后，AR应用向AR云服务器发送视频图像，以向AR云服务器请求获取与视频图像对应的待渲染对象，待渲染对象可以包括待渲染对象的标识和/或待渲染对象的名称、元数据等信息。AR云服务器将与视频图像对应的待渲染对象发给电子设备10，电子设备10确定出与该待渲染对象对应的业务规则，利用每个待渲染对象的业务规则渲染对应的待渲染对象，从而生成多个一个或多个AR对象(即虚拟物体)，并基于电子设备10的全局位姿，把虚拟物体叠加到取景框104的视频流中。

在一种实施例中，电子设备10的全局位姿是电子设备10至少根据电子设备10摄像头采集的视频图像和所述全局子地图以相对较高的第一频率执行位姿计算得到的，第一频率表示电子设备10中的SLAM***执行全局位姿估计的频率，即调用全局子地图的频率。第一频率在数值上可以小于等于显示面板显示视频流的频率。也就是说，电子设备10的SLAM***可以以较高的固定频率调用所述全局子地图实现对电子设备10的位姿跟踪。这样，在实时获得电子设备10的全局位姿后，可以根据电子设备10的全局位姿在该取景框104内实时显示和更新AR场景中虚拟物体的位置与姿态。

当用户手持电子设备10行走一段时间(例如1分钟、5分钟、10分钟等，这里不做限定)，在这段时间内，电子设备10能够持续将虚拟物体准确地叠加在取景框104的视频流中。如图8中的(c)所示，在电子设备10移动一段时间后，取景框104的视频流104中依然能够准确无误地显示导航指示105、店面指示106、互动机器人107，在这段时间内既没有漂移现象也没有跳动现象。之所以如此是因为，一方面，在这段时间内，电子设备10中的SLAM***是基于全局子地图来计算电子设备10的位姿，能够克服电子设备10中预先构建的SLAM地图不准确的问题，尽量避免位姿误差的累计，从而最大程度地克服漂移现象的发生；另一方面电子设备10能够稳定地、高频次地基于全局子地图来执行全局位姿估计，避免了全局位姿的突变，从而也最大程度地克服跳动现象的发生，提升用户使用体验。

在一种实施例中，当电子设备10快要移出全局子地图的地理范围时，可以基于电子设备10的位置提前请求下载新的全局子地图，后续电子设备10即可根据新的全局子地图来执行全局位姿估计，从而能进一步避免在两个全局子地图对应的地理范围切换时位姿突变的发生，进一步提升用户使用体验。

参见图9，在又一种可能的实现场景中，从用户点击虚拟场景应用到显示面板呈现AR画面的过程还可以通过如下方式实现：

同样以电子设备10为手机为例，电子设备10中安装有某种虚拟场景应用(例如，可以是带有AR功能的导航地图应用)，图9中的(a)示出了电子设备10的显示面板上的桌面101。当电子设备检测到用户点击桌面101上的虚拟场景应用的图标102的操作后，在电子设备10的显示面板上显示如图9中的(b)所示的用户界面108，用户界面108中包括用于输入账号和密码的文本框，以提示用户通过验证身份来登陆应用。当电子设备10检测到用户输入账号和密码进行登录后，且电子设备10验证账号和密码正确后，一方面，在显示面板上显示如图9中的(c)所示的该应用的用户界面103，在图9中的(c)中，该用户界面103上可以包括取景框104。该取景框104内可以实时显示电子设备10所在的真实环境的预览视频流。该预览视频流是通过电子设备10的摄像头拍摄获得的。可选的，在预览视频流上还可叠加有预设的导航输入框，以便于用于输入用于AR导航的出发地和目的地。另一方面，在后台启动下载全局子地图的流程，下载流程可能会消耗一定的时间(例如2秒)，但是由于当前已为用户呈现了视频流实景画面，而且还需要用户花一定时间输入 AR导航的出发地和目的地，所以用户并不会感知到地图下载流程的存在，这样，能够避免了下载时延造成的用户等待，进一步提升用户体验。

同样，全局子地图下载完成后，电子设备10可在后台处理器中，根据所获得的全局子地图和摄像头实时拍摄的视频图像，执行位姿计算，从而实时获得电子设备10当前在全局坐标系下的位姿数据(即全局位姿)。这样，就可以实时基于电子设备10的全局位姿，在该取景框104内显示AR场景中虚拟物体的位置与姿态。如图9中的(d)所示中，虚拟物体示例性地以导航指示105、店面指示106、互动机器人107为例。电子设备10的SLAM***可以以较高的固定频率调用所述全局子地图实现对电子设备10的位姿跟踪。这样，在实时获得电子设备10的全局位姿后，可以根据电子设备10的全局位姿在该取景框104内实时显示和更新AR场景中虚拟物体的位置与姿态，能够最大程度地克服漂移现象和跳动现象的发生。

参见图10，在又一种可能的实现场景中，从用户点击虚拟场景应用到显示面板呈现AR画面的过程还可以通过如下方式实现：

同样以电子设备10为手机为例，电子设备10中安装有某种虚拟场景应用(例如，可以是带有AR功能的导航地图应用)，图10中的(a)示出了电子设备10的显示面板上的桌面101。当电子设备检测到用户点击桌面101上的虚拟场景应用的图标102的操作后，在电子设备10的显示面板上显示如图9中的(b)所示的该应用的一个用户界面108，这里的用户界面108中包括电子地图的界面以及多个控件109，如图示中包括电子地图控件，卫星地图控件和AR控件。当电子设备10检测到用户点击AR控件后，一方面，在显示面板上显示如图10中的(c)所示的该应用的用户界面103，在图10中的(c)中，该用户界面103上可以包括取景框104。该取景框104内可以实时显示电子设备10所在的真实环境的预览视频流。该预览视频流是通过电子设备10的摄像头拍摄获得的。可选的，在预览视频流上还可叠加有预设的导航输入框，以便于用于输入用于AR导航的出发地和目的地。另一方面，在后台启动下载全局子地图的流程，由于当前已为用户呈现了视频流实景画面而且还需要用户花一定时间输入AR导航的出发地和目的地，所以用户并不会感知到地图下载流程的存在，这样，能够避免了下载时延造成的用户等待，进一步提升用户体验。

同样，全局子地图下载完成后，电子设备10可在后台处理器中，根据所获得的全局子地图和摄像头实时拍摄的视频图像，执行位姿计算，从而实时获得电子设备10当前在全局坐标系下的位姿数据(即全局位姿)。这样，就可以实时基于电子设备10的全局位姿，在该取景框104内显示AR场景中虚拟物体的位置与姿态。如图10中的(d)所示中，虚拟物体示例性地以导航指示105、店面指示106、互动机器人107为例。电子设备10的SLAM***可以以较高的固定频率调用所述全局子地图实现对电子设备10的位姿跟踪。这样，在实时获得电子设备10的全局位姿后，可以根据电子设备10的全局位姿在该取景框104内实时显示和更新AR场景中虚拟物体的位置与姿态，能够最大程度地克服漂移现象和跳动现象的发生。

参见图11，图11是本申请实施例提供的又一种虚拟物体显示方法的流程示意图，从电子设备和服务器侧分别进行描述。该方法包括但不限于以下步骤：

S201、服务器基于电子设备的请求，下发全局子地图给电子设备。相应的，电子设备接收该全局子地图。该全局子地图是全局地图中与电子设备的位置对应的子地图。

S202、电子设备将该全局子地图存储到所述电子设备的SLAM***中。

S203、电子设备根据所述摄像头采集的视频图像和所述全局子地图，以第一频率执行位姿计算，以持续更新所述电子设备的全局位姿。

其中，第一频率表示电子设备的SLAM***执行全局位姿估计的频率，即SLAM***调用全局子地图的频率，第一频率在数值上可以小于等于显示组件显示视频流的频率。例如，第一频率为每秒30帧，当然这里只是解释说明而非限定。也就是说，SLAM***可以以较高的固定频率调用所述全局子地图实现对电子设备的位姿跟踪。这样，在实时获得电子设备的全局位姿后，可以根据电子设备的全局位姿在所述显示组件上显示AR/VR/MR等虚拟场景中虚拟物体的位置与姿态。

其中，电子设备的全局位姿用于表示电子设备在全局坐标系中的位置和姿态(方位)，举例来说，位置可以通过三个坐标轴x、y、z表示，姿态(方位)可以通过(α,β,γ)来表示，(α,β,γ)表示围绕三个坐标轴旋转的角度。

在一可能实施例中，电子设备中设置有摄像头，在每次的全局位姿计算中，SLAM***的输入信号包括摄像头采集的视频图像和全局子地图，SLAM***可根据摄像头采集的视频图像在全局子地图中做匹配，从而计算获得电子设备在全局子地图中的全局位姿。

在又一可能实施例中，电子设备中设置有惯性测量单元(IMU)，在每次的全局位姿计算中，SLAM***的输入信号包括来自摄像头采集的视频图像、IMU采集的运动数据和全局子地图。IMU高频率地检测电子设备的角速度和线加速度，并对角加速度和线加速度分别积分，进而可计算出电子设备的位姿(例如这里的位姿可称为IMU所测位姿)。摄像头采集的视频图像通过在全局子地图中做匹配，从而也能计算获得电子设备的位姿(例如这里的位姿可称为图像所测位姿)。那么，基于IMU所测位姿和图像所测位姿共同运算，就可以获得较准确的最终位姿，该最终位姿作为电子设备在全局子地图中的全局位姿。

在又一可能实施例中，电子设备中除了摄像头和IMU外，还设置有与位姿或运动相关的定位模块(GPS定位、北斗定位、WIFI定位、或基站定位等)，那么，SLAM***还可共同参考摄像头采集的视频图像、IMU采集的运动数据、全局子地图以及定位模块所采集的数据来计算获得电子设备在全局子地图中的全局位姿。

S204、电子设备基于所述电子设备的全局位姿，在所述显示组件上显示所述虚拟物体。

可以看到，IMU信号和图像信号作为SLAM的输入，估计相机为的过程。此过程内部包含了SLAM地图数据作为位姿估计输入。虽然SLAM地图经过内部的闭环纠正模块之后，可以减少SLAM地图的长时间漂移，但是，仍然存在较大误差。因此，本专利在下载完子地图之后，将子地图作为位姿估计模块的输入，其作用于SLAM地图作为位姿估计的作用一样。但是，子地图的准确度比SLAM地图更加准确，作为位姿估计的输入消除位姿估计长时间漂移，也可以消除SLAM地图的长时间漂移现象和跳动现象。

可以看到，本申请实施例中，电子设备通过请求服务器下载全局子地图，利用比SLAM地图精度更高的全局子地图作为视觉观测输入给SLAM***，电子设备的SLAM***可以以较高的固定频率调用所述全局子地图，以实现对电子设备的位姿跟踪。这样，在实时获得电子设备的全局位姿后，可以根据电子设备的全局位姿在显示组件内实时显示和更新AR场景中虚拟物体的位置与姿态。并且在长时间的位姿更新过程中，在虚拟物体的位置与姿态也不会发生漂移现象和跳动现象。一方面，在这段时间内，电子设备中的SLAM***是基于全局子地图来计算电子设备的全局位姿，能够克服电子设备中预先构建的SLAM地图不准确的问题，尽量避免位姿误差的累计，从而最大程度地克服漂移现象的发生；另一方面电子设备能够稳定地、高频次地基于全局子地图来执行全局位姿估计，极大减少了全局位姿的突变；再一方面，计算全局位姿的过程在电子设备侧完成，位姿估计的算法延迟低，位姿跟踪效果好。所以，本实施例能长时间显示虚拟物体且虚拟物体在画面中不会偏移出错，消除了由于位姿突变导致的虚拟物体的跳动现象，进一步提升用户体验。

参见图12，图12是本申请实施例提供的又一种虚拟物体显示方法的流程示意图，从电子设备和服务器侧分别进行描述。该方法包括但不限于以下步骤：

S301、电子设备向服务器发送用于指示所述电子设备的初始位置的第一位置指纹信息。

本申请实施例中，电子设备向服务器上传位置指纹信息，所述初始位置可能是所述电子设备请求下载地图时电子设备所处的地理位置信息，例如位置指纹信息来源包括GNSS/WiFi/蓝牙/基站等定位方式所测得的初始位置信息、信号强度信息、信号特征信息等等；也可能是在由用户输入的位置信息。

S302、服务器从全局地图中，获取与第一位置指纹信息匹配的全局子地图。所述全局子地图是全局地图中与所述电子设备的位置对应的子地图。

S303、服务器下发全局子地图给电子设备。相应的，电子设备接收全局子地图。

一种实施例中，服务器根据上述第一位置指纹信息，与服务器预先保存在数据库中的子地图的位置指纹信息做匹配，所述数据库中的子地图为隶属于全局地图的子地图。如果有匹配上的子地图，则将匹配上的子地图传输到电子设备。

又一种实施例中，服务器根据上述第一位置指纹信息，在服务器保存的全局地图中遍历，直到寻找到位置指纹信息匹配的区域，服务器从全局地图中取出该区域作为全局子地图，将全局子地图传输到电子设备。

S304、电子设备将该全局子地图存储到所述电子设备的SLAM***中。

S305、电子设备计算坐标系变换信息，并基于坐标系变换信息对SLAM地图进行变换。

具体的，电子设备计算坐标系变换信息的过程可描述如下：电子设备获取摄像头采集的视频图像序列中的第K帧图像，K为大于等于1的整数；然后，一方面，根据该第K帧图像和SLAM地图，确定电子设备在原先所构建的局部坐标系下的SLAM地图中的局部位姿(这里可称为第一位姿数据)。

又例如，电子设备中除了摄像头和IMU外，还设置有与位姿或运动相关的定位模块(GPS 定位、北斗定位、WIFI定位、或基站定位等)，那么，SLAM***还可共同参考摄像头采集的视频图像、IMU采集的运动数据、局部坐标系下的SLAM地图以及定位模块所采集的数据来计算获得该第一位姿数据。

另一方面，可根据该第K帧图像和全局子地图，对第K帧图像进行特征提取，并与全局子地图进行特征匹配，进而确定电子设备在全局子地图中的全局位姿(这里可称为第二位姿数据)。

例如，电子设备对第K帧图像进行特征检测，在第K帧图像中提取出特征的图像位置，特征检测算法不限于FAST、ORB、SIFT、SURF、D2Net、SuperPoint等特征检测方法。然后对每一个检测出的特征进行特征描述，特征描述算法不限于ORB、SIFT、SURF、BRIEF、BRISK、FREAK、D2Net、SuperPoint等特征描述方法，从而形成一个一维向量，用于后续的特征匹配。通过特征匹配，电子设备可从全局子地图中匹配出与第K帧图像最相似的地图内容(例如一帧或多帧关键帧)，具体方法例如包括基于BOW、VLAD等传统图像检索方法以及基于NetVLAD、AI的新型图像检索方法。特征匹配具体是计算两个特征描述之间的相似程度，对于Float型向量，可以通过欧氏距离计算；对于二值向量，可以通过异或计算。找出与第K帧图像最相似的地图内容后，就可以基于第K帧图像和最相似的地图内容进行位姿估计，例如可采用PnP、EPnP、3D-3D等配准算法，从而可以计算出该第二位姿数据。

然后，电子设备可根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息，坐标系变换信息例如可以是坐标系变换矩阵。

例如，如图13所示，令第K帧图像在局部坐标系下的位姿(第一位姿数据)为 ^LT _c，在全局坐标系下位姿(第二位姿数据)为 ^GT _c，则

^GT _c＝ ^GT _L ^LT _c (1)

^GT _L＝ ^GT _c( ^LT _c) ^-1 (2)

这里， ^GT _L可表示局部坐标系和全局坐标系之间的坐标系变换矩阵，根据这个坐标系变换矩阵就可以实现了两个坐标系同步，这样，原先用局部坐标系来表示的信息(例如局部位姿、图像的特征点、SLAM地图的3D地图点等等)就可以基于坐标系变换矩阵变换到全局坐标系下。

具体实施例中，在获得坐标系变换信息后，电子设备就可根据坐标系变换信息，将局部坐标系下的SLAM地图变换到全局坐标系下，即获得了全局坐标系下的SLAM地图。

S306、电子设备根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以获得电子设备的全局位姿。

在S305实现坐标系同步之后，全局子地图中的3D地图点与SLAM***的坐标系就能够统一。在一些实施例中，可以将全局子地图中的3D地图点将作为SLAM***的量测值输入，实现全局子地图和SLAM***的紧耦合，进而通过位姿估计实时跟踪电子设备的全局位姿。

具体地，基于坐标系变换信息后，局部坐标系下的位姿(局部位姿)和SLAM地图的3D 地图点就可以变换到全局坐标系下，这样就实现了SLAM***中的位姿、3D地图点与全局子地图中的3D地图点在同一个坐标系下表示。进而，全局子地图中3D地图点就可以作为SLAM***的量测值，这将有效消除SLAM***位姿跟踪的漂移现象。

例如，在位姿估计算法中，传统的视觉量测值(SLAM地图的3D地图点)是通过局部坐标系下SLAM***的三角化算法计算的，而三角化算法计算生成的3D地图点的准确度，依赖于位姿估计的准确度，由于位姿估计存在长时间漂移，因此，SLAM***计算的SLAM地图的3D地图点存在较大误差。反过来，当这些3D地图点作为量测值时，会导致位姿估计存在较大误差，如公式(3)所示：

表示传统方式中产生的位姿误差，公式中，i为图像帧索引，j为某一个图像帧观测到的特征索引，L表示在SLAM***的局部坐标系下的描述，p表示特征点的3D坐标值，P表示电子设备的位姿，z表示2D特征在图像上的观测值，

表示基于估计的电子设备的位姿和2D特征对应的3D坐标通过相机投影函数h投影在图像上的2D坐标值。 ^Lp _j表示SLAM***中三角化算法计算得到的3D地图点坐标值，作为量测值作用在SLAM算法中。

而本申请实施例中，通过在利用更为准确的全局子地图中的3D地图点替代SLAM***生成SLAM地图的3D地图点，能够消除位姿估计的误差，如公式(4)所示

这里，

表示本申请实施例方案中产生的位姿误差，G表示在全局坐标系下的描述， ^Gp _j表示第i个图像帧观测到的第j个特征对应的3D地图点坐标值，这个坐标值来自全局子地图；在SLAM地图点的坐标转化到全局坐标系之后， ^Gp _j也可以来自全局坐标系下的SLAM地图。 ^Gp _j为全局子地图中的3D地图点，作为量测值作用在SLAM算法中。

S307、电子设备基于电子设备的全局位姿，在显示组件上显示虚拟物体。

S308、电子设备基于电子设备的全局位姿，更新全局坐标系下的SLAM地图。

可以理解的，由于电子设备的位姿、SLAM地图都已经转换到全局坐标系下，所以电子设备既可以基于电子设备的全局位姿，在显示组件上实时显示和更新虚拟物体，又可以将电子设备的全局位姿反馈到全局坐标系下的SLAM地图，基于全局位姿将当前的图像帧(关键帧)融合进全局坐标系下的SLAM地图，从而实现SLAM地图的扩展/延伸，且更新后的SLAM地图相比于传统的SLAM地图更加准确。

可以看到，本申请实施例中，通过根据同一帧分别获得终端在局部坐标系中的位姿和全局坐标系中的位姿，基于这两种位姿就能够获得两种坐标系之间的坐标系变换信息(例如坐标系变换矩阵)，根据这个坐标系变换矩阵就可以实现了两个坐标系同步，这样，原先用局部坐标系来表示的信息(例如局部位姿、图像的特征点、SLAM地图的3D地图点等等) 就可以基于坐标系变换矩阵变换到全局坐标系下。这样就实现了SLAM***中的位姿、3D地图点与全局子地图中的3D地图点在同一个坐标系下表示。进而，全局子地图中3D地图点就可以作为SLAM***的量测值输入，实现全局子地图和SLAM***的紧耦合，进而通过位姿估计实时跟踪电子设备的全局位姿，这将能够有效消除SLAM位姿跟踪的漂移。后续需要更新SLAM地图时，就可以将电子设备的全局位姿作为在全局坐标系下的SLAM地图中的位姿数据来更新所述第二坐标系下的SLAM地图，提高了SLAM地图的准确性。

此外，本申请实施例，充分利用电子设备的运算能力，计算第一位姿数据、第二位姿数据以及坐标系变换信息，提高了处理效率，降低了处理时延，还能够减轻服务器的计算负担。

参见图14，图14示出了在又一种具体实现中，图5所示的电子设备10中的各功能模块进一步可能包含的组件，以及服务器20中的各功能模块进一步可能包含的组件。图14实施例和前述图6实施例的主要区别在于，图14实施例所示功能模块架构中，全局定位模块16的功能配置在服务器20侧实现，即服务器20中还包括图像检索模块161、特征提取模块162、特征匹配模块163和位姿估计模块164。

服务器20中的全局位姿模块16用于在初始时刻乃至之后的任一时刻，获取电子设备上传的至少一帧视频图像，基于该视频图像计算出电子设备10在全局子地图中的全局位姿(即第二位姿数据)，并将第二位姿数据发送给电子设备10。具体的，可通过图像检索模块161获取电子设备10上传的视频图像序列中的第K帧图像，通过特征提取模块162根据所述第K帧图像进行特征提取，获得图像特征，通过特征匹配模块163将所述图像特征在全局子地图中进行特征匹配，获得与所述图像特征匹配的地图特征；通过位姿估计模块164根据所述图像特征和所述地图特征，计算获得所述电子设备10在全局子地图中的第二位姿数据，并将第二位姿数据发送给电子设备10。

图14所示的服务器20中的其他功能模块进一步可能包含的组件可类似参考前述图6实施例中对服务器20的相关描述，为了说明书的简洁，这里不再赘述。

图14所示的电子设备10中的各功能模块进一步可能包含的组件可类似参考前述图6实施例中对电子设备10的相关描述，为了说明书的简洁，这里也不再赘述。

具体实施例中，电子设备10中的各功能模块可相互配合，以执行如图15实施例中电子设备侧的功能。服务器20中的各功能模块可相互配合，以执行如图15实施例中服务器侧的功能。

参见图15，图15是本申请实施例提供的又一种虚拟物体显示方法的流程示意图，从电子设备和服务器侧分别进行描述。该方法包括但不限于以下步骤：

S501、电子设备向服务器发送用于指示所述电子设备的初始位置的第一位置指纹信息和至少一帧视频图像。

具体实施例中，为实现电子设备的第一次全局定位，电子设备需要向服务器上传位置指纹信息和至少一张或多张当前采集的视频图像。其中，所述至少一帧视频图像可以是电子设备通过摄像头拍摄的视频图像序列中的第K帧图像。比如，可以是摄像头拍摄的视频图像序列中的第1帧图像。所述位置指纹信息所指示的初始位置可能是所述电子设备请求下载地图时电子设备所处的地理位置信息，例如位置指纹信息来源包括GNSS/WiFi/蓝牙/基站等定位方式所测得的初始位置信息、信号强度信息、信号特征信息等等；也可能是在由用户输入的位置信息。

在一种具体实现中，电子设备可以将第一位置指纹信息和一帧视频图像一起打包发送给服务器。

在又一种具体实现中，电子设备也可以将第一位置指纹信息和一帧视频图像分别独立发送给服务器。

S502、服务器从全局地图中，获取与第一位置指纹信息匹配的全局子地图。所述全局子地图是全局地图中与所述电子设备的位置对应的子地图。

一种实施例中，服务器根据上述第一位置指纹信息，与服务器预先保存在数据库中的子地图的位置指纹信息做匹配，所述数据库中的子地图为隶属于全局地图的子地图。如果有匹配上的子地图，则该子地图即为后续需要下发给电子设备的全局子地图。

又一种实施例中，服务器根据上述第一位置指纹信息，在服务器保存的全局地图中遍历，直到寻找到位置指纹信息匹配的区域，服务器从全局地图中取出该区域作为全局子地图。

S503、服务器根据该视频图像和全局子地图进行位姿计算，获得电子设备在全局子地图中的全局位姿(这里也可称为第二位姿数据)。

本申请的一种实施例中，第一次计算电子设备的全局位姿可以放在服务器端完成，服务器执行全局位姿计算的过程同样包括图像检索、特征提取、特征匹配、位姿估计等过程，

例如，服务器对该视频图像进行特征检测，在该视频图像中提取出特征的图像位置，特征检测算法不限于FAST、ORB、SIFT、SURF、D2Net、SuperPoint等特征检测方法。然后对每一个检测出的特征进行特征描述，特征描述算法不限于ORB、SIFT、SURF、BRIEF、BRISK、FREAK、D2Net、SuperPoint等特征描述方法，从而形成一个一维向量，用于后续的特征匹配。通过特征匹配，服务器可从全局子地图中匹配出与该视频图像最相似的地图内容(例如一帧或多帧关键帧)，具体方法例如包括基于BOW、VLAD等传统图像检索方法以及基于NetVLAD、AI的新型图像检索方法。特征匹配具体是计算两个特征描述之间的相似程度，对于Float型向量，可以通过欧氏距离计算；对于二值向量，可以通过异或计算。找出与视频图像最相似的地图内容后，就可以基于该视频图像和最相似的地图内容进行位姿估计，例如可采用PnP、EPnP、3D-3D等配准算法，从而可以计算出该第二位姿数据。

S504、服务器在完成位姿估计之后，下发所述电子设备在全局子地图中的全局位姿(第二位姿数据)给电子设备。相应的，电子设备接收该第二位姿数据。电子设备后续可利用该第二位姿数据来计算坐标系变换信息(例如坐标系变换矩阵)。

S505、服务器下发全局子地图给电子设备。相应的，电子设备接收该全局子地图。

S506、电子设备将该全局子地图存储到所述电子设备的SLAM***中。

S507、电子设备计算坐标系变换信息，并基于坐标系变换信息对SLAM地图进行变换。

同样的，电子设备计算坐标系变换信息的过程可描述如下：电子设备获取摄像头采集的视频图像序列中的第K帧图像，所述第K帧图像和S501中所发送给服务器的视频图像为相同图像；然后，一方面，根据该第K帧图像和SLAM地图，确定电子设备在原先所构建的局部坐标系下的SLAM地图中的局部位姿(这里可称为第一位姿数据)。具体实现过程可类似参考图12实施例的S305中有关于第一位姿数据的描述，为了说明书的简洁，这里不再赘述。

然后，电子设备可根据所述第一位姿数据和通过S504所获得的第二位姿数据，进一步获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息，坐标系变换信息例如可以是坐标系变换矩阵。关于坐标系变换矩阵的相关内容可类似参考图13实施例的相关描述，为了说明书的简洁，这里也不再赘述。

S508、电子设备根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以获得电子设备的全局位姿。

S509、电子设备基于电子设备的全局位姿，在显示组件上显示虚拟物体。

S510、电子设备基于电子设备的全局位姿，更新全局坐标系下的SLAM地图。

有关于S508-S510的相关内容可类似参考图12实施例的S306-S308的相关描述，为了说明书的简洁，这里也不再赘述。

可以看到，本申请实施例中，电子设备需要先下载对应区域的全局子地图，下载地图的过程需要花费一定时间。为了加快用户进入应用的速度，可以采用第一次全局位姿估计在服务器端完成的方式。也即是说，应用启动后，第一次全局位姿估计在服务器侧进行，在启动全局位姿估计的同时，服务器相应获取全局子地图并向电子设备传输，提高用户进入应用的速度。用户并不会感知到地图下载流程的时延存在，这样，能够避免了下载时延造成的用户等待，进一步提升用户体验。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者任意组合来实现。当使用软件实现时，可以全部或者部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令，在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或其他可编程装置。所述计算机指令可存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网络站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、微波等)方式向另一个网络站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质，也可以是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD等)、或者半导体介质(例如固态硬盘)等等。

在上述实施例中，对各个实施例的描述各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

Claims

一种虚拟物体显示方法，应用于具有显示组件和摄像头的电子设备，其特征在于，所述方法包括：

检测到用户打开应用的操作；

响应于所述操作，下载全局子地图并存储到所述电子设备的即时定位与地图构建(Simultaneous Localization and Mapping，SLAM)***中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；

在所述显示组件上显示所述虚拟物体的位置与姿态，所述虚拟物体的位置与姿态是所述SLAM***至少根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算得到的。
根据权利要求1所述的方法，其特征在于，

所述电子设备的位姿数据用于表征所述虚拟物体的位置与姿态，所述电子设备的位姿数据是所述SLAM***至少根据所述摄像头采集的视频图像和所述全局子地图以第一频率执行位姿计算得到的。
根据权利要求1或2所述的方法，其特征在于，所述位姿计算的过程包括：

根据所述摄像头采集的视频图像、所述全局子地图以及所述电子设备采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。
根据权利要求1-3任一项所述的方法，其特征在于，所述响应于所述操作，下载全局子地图，包括：

响应于所述操作，向服务器发送所述电子设备的初始位置的指示信息；

从所述服务器接收所述全局子地图，所述全局子地图是根据所述电子设备的初始位置确定的。
根据权利要求4所述的方法，其特征在于，所述电子设备的初始位置的指示信息包括用于指示所述电子设备的初始位置的第一位置指纹信息；所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。
根据权利要求2-5任一项所述的方法，其特征在于，所述方法还包括：

根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图。
根据权利要求6所述的方法，其特征在于，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图之前，进一步包括：

根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；

根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；

根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；

根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；

相应的，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图，包括：

以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。
根据权利要求7所述的方法，其特征在于，所述根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据，包括：

根据所述第K帧图像、所述第一坐标系下的SLAM地图以及所述电子设备采集的运动数据，获得所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；所述运动数据包括运动速度数据和运动方向数据。
根据权利要求7或8所述的方法，其特征在于，所述根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据，包括：

根据所述第K帧图像进行特征提取，以得到图像特征；

将所述图像特征在所述第二坐标系下的全局子地图中进行特征匹配，以得到与所述图像特征匹配的地图特征；

根据所述图像特征和所述地图特征，计算得到所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据。
根据权利要求7或8所述的方法，其特征在于，所述根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据，包括：

向服务器发送所述第K帧图像；

从所述服务器接收所述第二位姿数据，所述第二位姿数据是所述服务器根据所述第K帧图像和所述第二坐标系下的全局子地图进行特征提取和特征匹配确定的。
根据权利要求1-10任一项所述的方法，其特征在于，所述在所述显示组件上显示所述虚拟物体的位置与姿态，包括：

在所述显示组件上显示第一界面，在所述第一界面显示视频图像和虚拟物体；所述虚拟物体相对于所述视频图像的位置与姿态是基于所述电子设备的位姿数据来显示的，所述电子设备的位姿数据是至少根据所述摄像头采集的所述视频图像和所述全局子地图执行位姿计算过程得到的。
一种虚拟物体显示方法，应用于具有显示组件和摄像头的电子设备，其特征在于，所述方法包括：

获取全局子地图并存储到所述电子设备的即时定位与地图构建(SLAM)***中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；

根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据；

基于所述电子设备的位姿数据，在所述显示组件上显示所述虚拟物体。
根据权利要求12所述的方法，其特征在于，所述根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据，包括：

至少根据所述摄像头采集的视频图像和所述全局子地图以第一频率执行位姿计算，以得到所述电子设备的位姿数据。
根据权利要求12或13所述的方法，其特征在于，所述电子设备的位姿数据为第一坐标系下的所述电子设备的位姿数据，或者，第二坐标系下的所述电子设备的位姿数据；所述第一坐标系下是所述SLAM***的SLAM地图的坐标系，所述第二坐标系是所述全局子地图的坐标系。
根据权利要求12-14任一项所述的方法，其特征在于，所述根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据，包括：

根据所述摄像头采集的视频图像、所述全局子地图以及所述电子设备采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。
根据权利要求12-15任一项所述的方法，其特征在于，所述方法还包括：

根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图。
根据权利要求16所述的方法，其特征在于，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图之前，进一步包括：

根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；

根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；

根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；

根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；

相应的，所述根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图，包括：

以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。
根据权利要求12-17任一项所述的方法，其特征在于，所述获取全局地图的全局子地图，包括：

向服务器发送用于指示所述电子设备的初始位置的第一位置指纹信息；

从所述服务器接收所述全局子地图，所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。
根据权利要求12-18任一项所述的方法，其特征在于，所述虚拟物体为虚拟现实VR场景、增强现实AR场景、或混合现实MR场景中的虚拟物体。
一种用于虚拟物体显示的电子设备，其特征在于，包括：

显示组件；摄像头；一个或多个处理器；存储器；多个应用程序；以及一个或多个计算机程序，其中所述一个或多个计算机程序被存储在所述存储器中，所述一个或多个计算机程序包括指令，当所述指令被所述电子设备执行时，使得所述电子设备执行以下步骤：

检测到用户打开应用的操作；

响应于所述操作，下载全局子地图并存储到所述电子设备的即时定位与地图构建(Simultaneous Localization and Mapping，SLAM)***中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；

在所述显示组件上显示所述虚拟物体的位置与姿态，所述虚拟物体的位置与姿态是所述SLAM***至少根据所述摄像头采集的视频图像和所述全局子地图执行位姿计算得到的。
根据权利要求20所述的电子设备，其特征在于，

所述电子设备的位姿数据用于表征所述虚拟物体的位置与姿态，所述电子设备的位姿数据是所述SLAM***至少根据所述摄像头采集的视频图像和所述全局子地图以第一频率执行位姿计算得到的。
根据权利要求20或21所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

根据所述摄像头采集的视频图像、所述全局子地图以及所述电子设备采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。
根据权利要求20-22任一项所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

响应于所述操作，向服务器发送所述电子设备的初始位置的指示信息；

从所述服务器接收所述全局子地图，所述全局子地图是根据所述电子设备的初始位置确定的。
根据权利要求23所述的电子设备，其特征在于，所述电子设备的初始位置的指示信息包括用于指示所述电子设备的初始位置的第一位置指纹信息；所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。
根据权利要求20-24任一项所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备还执行以下步骤：

根据所述电子设备的位姿数据更新所述SLAM***的SLAM地图。
根据权利要求25所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

根据所述摄像头采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；

根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；

根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；

根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；

以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。
根据权利要求26所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

根据所述第K帧图像、所述第一坐标系下的SLAM地图以及所述电子设备采集的运动数据，获得所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；所述运动数据包括运动速度数据和运动方向数据。
根据权利要求26或27所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

根据所述第K帧图像进行特征提取，获得图像特征；

将所述图像特征在所述第二坐标系下的全局子地图中进行特征匹配，获得与所述图像特征匹配的地图特征；

根据所述图像特征和所述地图特征，计算获得所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据。
根据权利要求26或27所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

向服务器发送所述第K帧图像；

从所述服务器接收所述第二位姿数据，所述第二位姿数据是所述服务器根据所述第K帧图像和所述第二坐标系下的全局子地图进行特征提取和特征匹配确定的。
根据权利要求20-29任一项所述的电子设备，其特征在于，当所述指令被所述电子设备执行时，使得所述电子设备具体执行以下步骤：

在所述显示组件上显示第一界面，在所述第一界面显示视频流和虚拟物体；所述虚拟物体相对于所述视频流的位置与姿态是基于所述电子设备的位姿数据来显示的，所述电子设备的位姿数据是至少根据所述摄像头采集的所述视频图像和所述全局子地图执行位姿计算过程得到的。
一种用于虚拟物体显示的电子设备，其特征在于，包括：

通信模块，用于获取全局子地图并存储到所述电子设备的即时定位与地图构建(Simultaneous Localization and Mapping，SLAM)模块中；所述全局子地图是全局地图中与所述电子设备的位置对应的子地图；

SLAM模块，用于根据所述数据采集模块采集的视频图像和所述全局子地图执行位姿计算，以得到所述电子设备的位姿数据；

交互模块，用于基于所述电子设备的位姿数据，在所述显示组件上显示所述虚拟物体。
根据权利要求31所述的电子设备，其特征在于，所述SLAM模块具体用于：

至少根据所述数据采集模块采集的视频图像和所述全局子地图以第一频率执行位姿计算，以得到所述电子设备的位姿数据。
根据权利要求31或32所述的电子设备，其特征在于，所述电子设备的位姿数据为第一坐标系下的所述电子设备的位姿数据，或者，第二坐标系下的所述电子设备的位姿数据；所述第一坐标系下是所述SLAM模块的SLAM地图的坐标系，所述第二坐标系是所述全局子地图的坐标系。
根据权利要求31-33任一项所述的电子设备，其特征在于，所述SLAM模块具体用于：

根据所述数据采集模块采集的视频图像、所述全局子地图以及所述数据采集模块采集的运动数据执行位姿计算，以得到所述电子设备的位姿数据，所述运动数据包括运动速度数据和运动方向数据。
根据权利要求31-34任一项所述的电子设备，其特征在于，所述SLAM模块还用于，根据所述电子设备的位姿数据更新所述SLAM模块的SLAM地图。
根据权利要求35所述的电子设备，其特征在于，所述电子设备还包括全局定位模块和坐标系变化矩阵计算模块；

所述SLAM模块具体用于，根据所述数据采集模块采集的视频图像中的第K帧图像和第一坐标系下的SLAM地图，确定所述电子设备在所述第一坐标系下的SLAM地图中的第一位姿数据；K为大于等于1的整数；

所述全局定位模块具体用于，根据所述第K帧图像和第二坐标系下的全局子地图，确定所述电子设备在所述第二坐标系下的全局子地图中的第二位姿数据；

所述坐标系变化矩阵计算模块具体用于，通过所述坐标系变化矩阵计算模块根据所述第一位姿数据和所述第二位姿数据，获得所述SLAM地图的第一坐标系和所述全局地图的第二坐标系之间的坐标系变换信息；

所述SLAM模块还用于，根据所述坐标系变换信息，将所述第一坐标系下的SLAM地图变换成所述第二坐标系下的SLAM地图；以所述电子设备的位姿数据作为在所述第二坐标系下的SLAM地图中的位姿数据更新所述第二坐标系下的SLAM地图。
根据权利要求31-36任一项所述的电子设备，其特征在于，所述通信模块还用于：

向服务器发送用于指示所述电子设备的初始位置的第一位置指纹信息；从所述服务器接收所述全局子地图，所述全局子地图对应有第二位置指纹信息，且所述第一位置指纹信息和所述第二位置指纹信息相匹配。
根据权利要求31-37任一项所述的电子设备，其特征在于，所述虚拟物体为虚拟现实VR场景、增强现实AR场景、或混合现实MR场景中的虚拟物体。
一种计算机存储介质，其特征在于，包括计算机指令，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如权利要求1至11中任一项所述的虚拟物体显示方法或者执行如权利要求12至19中任一项所述的虚拟物体显示方法。