WO2024119902A1

WO2024119902A1 - 图像拼接方法及装置

Info

Publication number: WO2024119902A1
Application number: PCT/CN2023/115094
Authority: WO
Inventors: 彭璐; 徐海; 林建平
Original assignee: 华为技术有限公司
Priority date: 2022-12-05
Filing date: 2023-08-25
Publication date: 2024-06-13
Also published as: CN118154415A

Abstract

本申请公开了一种图像拼接方法及装置，属于图像处理技术领域。获取多相机模组在同一时刻采集的多帧图像。当该多相机模组中相邻部署的第一相机和第二相机的视野重叠区域内包括拍摄目标时，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数。采用目标拼接参数对第一相机采集的图像和第二相机采集的图像进行拼接，得到拼接图像。本申请通过离线标定第一相机和第二相机针对视野重叠区域内的不同标定位置的相机参数，得到不同标定位置对应的拼接参数，进一步根据多个标定位置对应的拼接参数确定适用于拍摄目标所在的位置的拼接参数，从而提升对拍摄目标的成像拼接效果。

Description

图像拼接方法及装置

本申请要求于2022年12月05日提交的申请号为202211550973.3、发明名称为“一种图像拼接的方法”的中国专利申请的优先权，以及于2023年02月14日提交的申请号为202310140790.2、发明名称为“图像拼接方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，特别涉及一种图像拼接方法及装置。

背景技术

目前应用于会议终端的相机的视场角(field of view，FOV)通常较小，大部分相机的水平视场角在90°以内。对于大中型会议室，单相机的拍摄区域无法完全覆盖整个会议场景，可能会出现与会人位于相机两侧的视野盲区的情况。为了增大拍摄视角，目前一种常用的方法是通过部署多个相机分别采集图像，然后对该多个相机采集到的图像进行拼接，得到全景图像。但是，对多个相机采集到的图像进行拼接得到的全景图像经常存在明显的拼缝，拼接效果较差。如何提升图像拼接效果是目前亟需解决的问题。

发明内容

本申请提供了一种图像拼接方法及装置，可以提升图像拼接效果。

第一方面，提供了一种图像拼接方法，该方法可以应用于图像处理设备。该方法包括：获取多相机模组在同一时刻采集的多帧图像，该多相机模组包括多个相机，该多个相机包括相邻部署的第一相机和第二相机。第一相机和第二相机具有视野重叠区域。该多帧图像包括第一相机采集的第一图像和第二相机采集的第二图像。当第一相机和第二相机的视野重叠区域内包括拍摄目标时，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数，该多组拼接参数分别基于第一相机和第二相机共同针对视野重叠区域内的不同标定位置标定的相机参数得到。采用目标拼接参数对第一图像和第二图像进行拼接，得到拼接图像。

本申请中，通过离线标定多相机模组中相邻部署的两个相机针对视野重叠区域内的不同标定位置的相机参数，对于每个标定位置，进一步可以根据这两个相机针对该标定位置标定得到的相机参数确定拼接参数，以得到不同标定位置分别对应的拼接参数。当拍摄目标位于两个相机的视野重叠区域内时，图像处理设备可以根据该视野重叠区域内的多个标定位置各自对应的拼接参数确定适用于拍摄目标所在的位置的拼接参数，进而使得拼接图像中拍摄目标所在的位置的拼接效果较好，从而提升拍摄目标在拼接图像中的显示效果。

可选地，第一相机和第二相机对应的每组拼接参数包括第一相机采集的图像到第二相机采集的图像的投影变换参数，或者，第一相机和第二相机对应的每组拼接参数包括第一相机采集的图像到目标平面坐标系的投影变换参数以及第二相机采集的图像到目标平面坐标系的投影变换参数。

其中，第一相机采集的图像到第二相机采集的图像的投影变换参数用于将第一相机采集的图像变换到第二相机采集的图像对应的像素坐标系下。第一相机采集的图像到目标平面坐标系的投影变换参数用于将第一相机采集的图像变换到目标平面坐标系下，第二相机采集的图像到目标平面坐标系的投影变换参数用于将第二相机采集的图像变换到目标平面坐标系下。本申请通过将第一相机采集的图像与第二相机采集的图像变换到同一平面坐标系下，可以实现对第一相机采集的图像中的像素点与第二相机采集的图像中的像素点的配对。

可选地，第一相机和第二相机的视野重叠区域内的多个标定位置中的任意两个标定位置满足以下一个或多个条件：两个标定位置到第一相机和第二相机的中心位置的距离不同；两个标定位置相对于第一相机和第二相机的排布方向的水平角度不同；两个标定位置相对于第一相机和第二相机的排布方向的垂直角度不同。第一相机和第二相机的排布方向例如可以是第一相机与第二相机的连线所在直线的方向。

可选地，第一相机和第二相机的视野重叠区域内包括一个拍摄目标，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数的实现方式，包括：根据多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定目标拼接参数。

可选地，根据多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定目标拼接参数的实现方式，包括：如果多个标定位置包括拍摄目标所在的位置，将拍摄目标所在的位置对应的拼接参数作为目标拼接参数。如果多个标定位置不包括拍摄目标所在的位置，根据多个标定位置中距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定目标拼接参数。

本申请中，在第一相机和第二相机的视野重叠区域内只有一个拍摄目标的情况下，将拍摄目标所在的位置对应的拼接参数作为目标拼接参数，或者根据距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数计算得到目标拼接参数，将该目标拼接参数用于对第一相机和第二相机采集的图像进行拼接时，可以使拍摄目标所在的位置的拼接效果较好，从而可以保证拍摄目标在拼接图像中的显示效果。

可选地，根据多个标定位置中距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定目标拼接参数的实现方式，包括：基于拍摄目标所在的位置相对于两个标定位置的距离，采用两个标定位置对应的拼接参数插值计算得到拍摄目标所在的位置对应的目标拼接参数。

可选地，第一相机和第二相机的视野重叠区域内包括多个拍摄目标，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数的一种实现方式，包括：根据多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数。

本实现方式可以应用于多相机模组采用导播模式的场景。

可选地，根据多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数的一种实现方式，包括：将目标标定位置对应的拼接参数作为目标拼接参数，目标标定位置为多个标定位置中到多个拍摄目标所在的位置的距离之和最小的标定位置。

本实现方式综合考虑对多个拍摄目标的图像拼接效果，选择到多个拍摄目标所在的位置的距离之和最小的标定位置对应的拼接参数作为目标拼接参数，将该目标拼接参数用于对第一相机和第二相机采集的图像进行拼接时，可以使多个拍摄目标所在的位置的整体拼接效果较好，从而使得多个拍摄目标在拼接图像中的整体显示效果较好。另外本实现方式的计算过程简单，所消耗的处理资源较少。

或者，根据多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数的另一种实现方式，包括：针对多个拍摄目标中的每个拍摄目标，获取多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数。根据针对多个拍摄目标获取的所有拼接参数，确定目标拼接参数。

本实现方式综合考虑对多个拍摄目标的图像拼接效果，根据距离各个拍摄目标最近的一个或多个标定位置对应的拼接参数确定目标拼接参数，将该目标拼接参数用于对第一相机和第二相机采集的图像进行拼接时，可以折中多个拍摄目标所在的位置的拼接效果，尽可能使多个拍摄目标所在的位置的拼接效果趋于一致，从而使得多个拍摄目标在拼接图像中的整体显示效果较好。

可选地，在采用目标拼接参数对第一图像和第二图像进行拼接，得到拼接图像之后，输出裁剪图像到屏幕上显示，该裁剪图像从拼接图像中裁剪得到，裁剪图像包含位于第一相机和第二相机的视野重叠区域内的所有拍摄目标。

可选地，视野重叠区域内包括多个拍摄目标，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数的另一种实现方式，包括：针对多个拍摄目标中的每个拍摄目标，根据多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定拍摄目标对应的拼接参数。相应地，采用目标拼接参数对第一图像和第二图像进行拼接，得到拼接图像的实现方式，包括：针对每个拍摄目标，采用拍摄目标对应的拼接参数对第一图像和第二图像进行拼接，得到拍摄目标对应的拼接图像。

本实现方式可以应用于多相机模组采用智能均分模式或多人同框模式的场景。

可选地，在针对多个拍摄目标中的每个拍摄目标，采用拍摄目标对应的拼接参数对第一图像和第二图像进行拼接，得到拍摄目标对应的拼接图像之后，输出组合图像到屏幕上显示，该组合图像由多张裁剪图像组合得到，多张裁剪图像分别从多个拍摄目标对应的多张拼接图像中裁剪得到，且每张裁剪图像分别包含所裁剪的拼接图像中对应的拍摄目标。

本申请中，图像处理设备针对多个拍摄目标中的每个拍摄目标分别进行一次图像拼接，得到多张拼接图像，以保证每个拍摄目标在对应的拼接图像中的显示效果，使得图像处理设备输出的组合图像中的每个拍摄目标所来自的拼接图像都能够保证该拍摄目标具有较好的显示效果，因此能够保证最终输出的组合图像的显示效果。

可选地，图像处理设备中存储有多相机模组中相邻部署的两个相机在多种部署场景下分别对应的拼接参数，在根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数之前，获取多相机模组的部署场景。获取第一相机和第二相机在多相机模组的部署场景下对应的多组拼接参数。

本申请通过提供多相机模组在多种不同部署场景下不同位置对应的拼接参数，图像处理设备可以根据多相机模组的部署场景灵活选择对应的拼接参数，使得图像拼接效果与当前部署场景更匹配，从而能够实现多相机模组不同部署场景下采集的图像都有较好的图像拼接效果。或者也可以不区分多相机模组的部署场景，所有部署场景使用同一套拼接参数。

第二方面，提供了一种图像拼接装置。所述装置包括多个功能模块，所述多个功能模块相互作用，实现上述第一方面及其各实施方式中的方法。所述多个功能模块可以基于软件、硬件或软件和硬件的结合实现，且所述多个功能模块可以基于具体实现进行任意组合或分割。

第三方面，提供了一种图像拼接装置，包括：处理器和存储器；

所述存储器，用于存储计算机程序，所述计算机程序包括程序指令；

所述处理器，用于调用所述计算机程序，实现上述第一方面及其各实施方式中的方法。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令被处理器执行时，实现上述第一方面及其各实施方式中的方法。

第五方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，实现上述第一方面及其各实施方式中的方法。

第六方面，提供了一种芯片，芯片包括可编程逻辑电路和/或程序指令，当芯片运行时，实现上述第一方面及其各实施方式中的方法。

附图说明

图1是本申请实施例提供的一种多相机模组的结构示意图；

图2是本申请实施例提供的一种应用场景示意图；

图3是本申请实施例提供的一种图像拼接方法的流程示意图；

图4是本申请实施例提供的一种相机标定场景示意图；

图5是本申请实施例提供的一种用户交互界面示意图；

图6是本申请实施例提供的一种拍摄目标所在的位置的示意图；

图7是本申请实施例提供的另一种拍摄目标所在的位置的示意图；

图8是本申请实施例提供的又一种拍摄目标所在的位置的示意图；

图9是本申请实施例提供的一种会议室场景示意图；

图10是本申请实施例提供的另一种会议室场景示意图；

图11是本申请实施例提供的一种多相机模组采集的图像示意图；

图12是本申请实施例提供的一种拼接图像示意图；

图13是本申请实施例提供的一种裁剪图像示意图；

图14是本申请实施例提供的另一种多相机模组采集的图像示意图；

图15是本申请实施例提供的一种组合图像示意图；

图16是本申请实施例提供的一种图像拼接装置的结构示意图；

图17是本申请实施例提供的一种图像处理设备的硬件结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

为了便于读者对本申请技术方案的理解，首先对本申请实施例涉及的部分名词进行介绍。

1、目标检测(object detection，OD)：找出图像中所有感兴趣的目标(物体)，确定目标的类别以及目标在图像中的位置。

2、声源定位(sound source localization，SSL)：利用多个麦克风在环境不同位置点对声信号进行测量，由于声信号到达各麦克风的时间有不同程度的延迟，利用算法对测量到的声信号进行处理，由此获得声源点相对于麦克风的到达方向(包括方位角和俯仰角)和距离等。

3、声像匹配：以图像中所有目标的框位置和声源定位坐标为输入，将声源定位坐标对应到图像中对应的像素位置，就可以找到发声者，如发言人，该过程称为声像匹配。其中，目标的框位置指的是包含目标在内的框的位置，该框可以是标注的真实框或通过目标检测得到的预测框。

4、像素坐标系：像素坐标系是以相机采集到的图像的左上顶点为坐标原点的坐标系。像素坐标系的x轴(横轴)与y轴(纵轴)分别为相机采集到的图像的宽高方向。

5、世界坐标系：世界坐标系能够描述相机在现实世界中的位置，同样还能够描述相机采集到的图像中的物体在现实世界中的位置。

6、相机标定：通过一系列算法求解世界坐标系与相机采集的图像对应的像素坐标系之间的投影变换关系的过程，也可理解为确定相机参数的过程。相机参数包括相机内参和相机外参。其中相机内参是相机的固有属性，包含畸变系数，与相机焦距、像元尺寸相关。相机外参与相机在世界坐标系下的位姿有关，位姿包括位置和姿态，位置指相机在世界坐标系下的坐标，姿态指相机在世界坐标系下的朝向。

图像拼接技术是一个日益流行的研究领域，它已经成为照相绘图学、计算机视觉、图像处理和计算机图形学研究的热点。一系列空间重叠的图像，通过图像拼接技术处理，构成一个高清晰的图像，拼接后的图像具有比单个图像更高的分辨率和更大的视野。但是，由于不同相机之间存在双目视差，以及受到拼接算法误差、算力受限等因素影响，对多个相机采集到的图像进行拼接得到的全景图像经常存在明显的拼缝，过渡不自然。对于会议场景，当与会人位于图像重叠区域时，人脸或人体可能会因拼缝而显示不完整，影响图像显示效果。

为了提升图像拼接效果，目前常用的图像拼接技术主要有两种。一种是利用离线生成的固定的拼接参数在线进行拼接，主要原理是对多相机模组在出厂前或安装前进行离线标定，得到多相机模组中每个相机固定的相机参数，然后基于各个相机固定的相机参数得到固定的拼接参数，并使用固定的拼接参数对多相机模组采集的图像进行拼接。其中，相机参数包括相机内参和相机外参，相机内参包括畸变参数。在这种图像拼接技术下，由于拼接图像时使用的拼接参数始终是固定的，最终得到的拼接图像的重叠区域内有些位置的拼接效果较好，有些位置的拼接效果较差，无法兼顾图像重叠区域内多个位置的拼接效果。另一种是在线实时拼接，拼接时检测图像重叠区域的特征点并进行匹配，从而实时生成拼接的相机图像映射关系。在这种图像拼接技术下，一方面，需要相邻部署的两个相机的视野重叠区域较大且视野重叠区域内要有明显的特征点，否则特征点匹配容易出错，导致拼接效果较差；另一方面针对每个相机采集的每帧图像都需要实时进行特征点检测与匹配，图像拼接所需的算力较大。

基于此，本申请实施例提供了一种图像拼接方法，由多相机模组采集图像，该多相机模组包括多个相机，该多个相机的相对部署位置是固定的，该多个相机中相邻部署的两个相机具有视野重叠区域。图像处理设备获取多相机模组在同一时刻采集的多帧图像之后，当该多相机模组中相邻部署的两个相机的视野重叠区域内包括拍摄目标时，根据该两个相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数，再采用目标拼接参数对该两个相机采集的图像进行拼接，得到拼接图像。其中，该两个相机对应的多组拼接参数分别基于该两个相机共同针对视野重叠区域内的不同标定位置标定的相机参数得到。本申请实施例通过离线标定多相机模组中相邻部署的两个相机针对视野重叠区域内的不同标定位置的相机参数，对于每个标定位置，进一步可以根据这两个相机针对该标定位置标定得到的相机参数确定拼接参数，以得到不同标定位置分别对应的拼接参数。当拍摄目标位于两个相机的视野重叠区域内时，图像处理设备可以根据该视野重叠区域内的多个标定位置各自对应的拼接参数确定适用于拍摄目标所在的位置的拼接参数，进而使得拼接图像中拍摄目标所在的位置的拼接效果较好，从而提升拍摄目标在拼接图像中的显示效果。另外，本申请实施例中无需对图像进行特征点检测和匹配，适用于更多的拍摄场景且所需算力较低。

下面从应用场景、方法流程、软件装置、硬件装置等多个角度，对本申请提供的技术方案进行详细介绍。

下面对本申请实施例的应用场景举例说明。

本申请实施例提供的图像拼接方法可以应用于图像处理设备。该图像处理设备可以是多相机模组，或者也可以是显示设备，又或者可以是与显示设备连接的视频服务器。可选地，显示设备内置有多相机模组，或者，显示设备与外置的多相机模组相连。多相机模组包括多个相机，该多个相机的相对部署位置固定。该多个相机分别用于采集不同拍摄区域的图像，以得到多路视频流。多相机模组也可称为全景相机。图像处理设备用于对多相机模组在同一时刻采集的多帧图像进行拼接，以供显示设备显示拼接图像。视频服务器可以是一台服务器，或者由多台服务器组成的服务器集群，或者云计算平台等。

可选地，多相机模组中所有相机采集图像的时刻和频率相同。例如可以采用相机同步技术实现多相机模组中所有相机的同步拍摄。多相机模组中的任意相邻两个相机具有视野重叠区域。其中，两个相机具有视野重叠区域，是指该两个相机的拍摄区域具有重合区域。可选地，多相机模组中的多个相机可以采用直线排布方式、扇形排布方式或其它不规则排布方式等，可根据实际拍摄场景设计相应的相机排布方式。例如，图1是本申请实施例提供的一种多相机模组的结构示意图。如图1所示，多相机模组10包括3个相机，分别为相机1-3。相机1-3采用直线排布方式依次设置。其中，相机1与相机2具有视野重叠区域A12。相机2与相机3具有视野重叠区域A23。图1示出的多相机模组所包含的相机数量和相机排布方式仅用作示例性说明，不作为对本申请实施例涉及的多相机模组的限定。

可选地，多相机模组中的相机所采集图像的编码格式可以是RGB、YUV或HSV等。其中，RGB中的R(red)是红色分量，G(green)是绿色分量，B(blue)是蓝色分量。YUV中的Y是亮度分量，U和V是色彩分量。HSV中的H(hue)是色相分量，S(saturation)是饱和度分量，V(value)是明度分量。相机所采集图像的分辨率可以是4K，或者也可以是1080P、720P、540P或360P等。相机所采集图像的画面比例可以是4:3或16:9等。多相机模组中不同相机所采集的图像的编码格式、分辨率、画面比例可以相同或者也可以不同，如果不同，则后续需要先将图像转换成统一格式之后再进行图像处理。本申请实施例对相机所采集的图像的编码格式、分辨率和画面比例均不作限定。

本申请实施例提供的图像拼接方法可以应用于多种场景，包括但不限于视频会议场景、监控场景或视频直播场景。本申请实施例以图像拼接方法应用于视频会议场景为例进行说明，显示设备可以是会议终端，例如可以是大屏、电子白板、手机、平板电脑或智能可穿戴设备等具有显示功能的电子设备。

例如，图2是本申请实施例提供的一种应用场景示意图。该应用场景是视频会议场景。如图2所示，该应用场景包括会议终端201A和会议终端201B(统称为会议终端201)。会议终端201A与会议终端201B通信连接。会议终端201A内置有多相机模组(图中未示出)。

可选地，请继续参见图2，该应用场景还包括视频服务器202。多个会议终端201分别与视频服务器202连接。多个会议终端201之间通过视频服务器202实现通信，视频服务器202例如可以是多点控制单元(multi control unit，MCU)。当然，本申请实施例也不排除不同会议终端之间直接相连的情况。

在如图2所示的应用场景中，会议终端201A在获取内置的多相机模组采集的多路视频流之后，会议终端201A可以对该多路视频流中采集时刻相同的多帧图像进行拼接处理，并将拼接得到的拼接图像作为一路视频流发送给视频服务器202，再由视频服务器202发送给会议终端201B，以供会议终端201B显示。或者，会议终端201A可以将该多路视频流发送给视频服务器202，由视频服务器202对该多路视频流中采集时刻相同的多帧图像进行拼接处理，再将拼接得到的拼接图像作为一路视频流发送给会议终端201B，以供会议终端201B显示。又或者，会议终端201A可以将该多路视频流发送给视频服务器202，由视频服务器202将该多路视频流发送给会议终端201B，再由会议终端201B对该多路视频流中采集时刻相同的多帧图像进行拼接处理，并显示拼接得到的拼接图像。也就是说，本申请实施例提供的图像拼接方法可以由图像采集侧的设备(比如会议终端201A)执行，或者可以由图像转发设备(比如视频服务器202)执行，又或者可以由图像接收侧的设备(比如会议终端201B)执行，本申请实施例对方案的执行主体不做限定。

下面对本申请实施例的方法流程举例说明。

例如，图3是本申请实施例提供的一种图像拼接方法的流程示意图。该方法可以应用于图像处理设备。图像处理设备例如可以是图2示出的应用场景中的会议终端201A、视频服务器202或会议终端201B。如图3所示，该方法包括但不限于以下步骤301至步骤303。

步骤301、获取多相机模组在同一时刻采集的多帧图像。

多相机模组包括多个相机，该多个相机包括相邻部署的第一相机和第二相机。第一相机和第二相机具有视野重叠区域。多相机模组在同一时刻采集的多帧图像包括第一相机采集的第一图像和第二相机采集的第二图像。本申请以下实施例均以多相机模组中相邻部署的第一相机和第二相机为例，对第一相机和第二相机采集的图像的拼接过程进行说明，对多相机模组中其它相邻部署的相机采集的图像的拼接过程可参考对第一相机和第二相机采集的图像的拼接过程，本申请实施例不再一一赘述。

可选地，图像处理设备获取多相机模组在同一时刻采集的多帧图像之后，可以先对多帧图像分别进行预处理，以去除图像中的噪声，例如可以对图像进行中值滤波处理，再对经过预处理的图像执行后续拼接流程。

步骤302、当第一相机和第二相机的视野重叠区域内包括拍摄目标时，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数。

第一相机和第二相机对应的多组拼接参数分别基于第一相机和第二相机共同针对视野重叠区域内的不同标定位置标定的相机参数得到，也就是说，第一相机和第二相机对应的一组拼接参数基于第一相机和第二相机针对视野重叠区域内的同一标定位置标定的相机参数得到。可选地，第一相机和第二相机的视野重叠区域内的多个标定位置中的任意两个标定位置满足以下一个或多个条件：两个标定位置到第一相机和第二相机中的中心位置的距离不同；两个标定位置相对于第一相机和第二相机的排布方向的水平角度不同。两个标定位置相对于第一相机和第二相机的排布方向的垂直角度不同。第一相机和第二相机的排布方向例如可以是第一相机与第二相机的连线所在直线的方向。

可选地，多相机模组中各个相机的相机参数可以通过离线标定得到，离线标定可以是在产品出厂前、或者产品安装时、或者产品安装后进行。例如，图4是本申请实施例提供的一种相机标定场景示意图。以不同标定位置到多相机模组的距离不同为例，如图4所示，第一相机和第二相机的视野重叠区域内设置有6个标定位置，包括标定位置A-F。标定位置A-F到多相机模组的距离分别为1米、3米、5米、8米、10米和20米。则在多相机模组应用之前，先针对标定位置A-F分别对第一相机和第二相机进行相机标定，得到第一相机分别针对标定位置A-F标定的6组相机参数以及第二相机分别针对标定位置A-F标定的6组相机参数。相机采用针对某个标定位置标定的相机参数成像时，该标定位置的成像效果相较于其它位置的成像效果更好，例如该标定位置的重投影误差更小。

本申请实施例对相机标定的实现方式不做限定。一种实现方式，可以将棋盘格作为标定参照物进行标定，具体是将棋盘格放置在拍摄场景中的不同位置，分别拍摄多张包含棋盘格的图像，然后检测棋盘格角点位置，通过标定算法求解得到对应的相机参数。此处标定算法可以采用张正友标定算法，也可以采用其他算法。这种实现方式下，可以使用更多将棋盘格放置在某个标定位置时相机拍摄的图像进行相机标定，相应地，可以得到该相机针对该标定位置标定的相机参数。另一种实现方式，不需要棋盘格作为标定参照物，例如可以采用主动视觉相机标定法，利用已知相机的某些运动信息对相机进行标定，或者也可以采用自标定算法，包括但不限于Hartley的QR分解法、Triggs的绝对二次曲面法、Pollefeys的模约束法。

可选地，在获取第一相机针对第一相机与第二相机的视野重叠区域内的多个标定位置标定的相机参数以及第二相机针对该多个标定位置标定的相机参数之后，可以进一步计算得到该多个标定位置分别对应的拼接参数。

可选地，第一相机和第二相机对应的每组拼接参数包括第一相机采集的图像到第二相机采集的图像的投影变换参数，该投影变换参数用于将第一相机采集的图像变换到第二相机采集的图像对应的像素坐标系下。本申请实施例中将第二相机采集的图像作为基准图像，并将第一相机采集的图像作为待配准图像。第一相机采集的图像到第二相机采集的图像的投影变换参数可以采用像素坐标映射表来表示，像素坐标映射表包括第一相机采集的图像中的多个像素坐标与第二相机采集的图像中的多个像素坐标的对应关系，这里的对应关系可以是第一相机采集的图像中的一个或多个像素坐标与第二相机采集的图像中的一个像素坐标的对应关系，比如第一相机采集的图像中的像素坐标(x1，y1)与第二相机采集的图像中的像素坐标(x2， y2)对应，则在将第一相机采集的图像变换到第二相机采集的图像对应的像素坐标系时，可以将像素坐标(x1，y1)处的像素值对应设置在像素坐标(x2，y2)处，又比如第一相机采集的图像中的像素坐标(x11，y11)和(x12，y12)与第二相机采集的图像中的像素坐标(x2，y2)对应，则在将第一相机采集的图像变换到第二相机采集的图像对应的像素坐标系时，可以对像素坐标(x11，y11)处的像素值与像素坐标(x12，y12)处的像素值进行插值计算或取均值计算等，并将计算得到的像素值对应设置在像素坐标(x2，y2)处。或者，第一相机采集的图像到第二相机采集的图像的投影变换参数也可以采用图像变换矩阵表示，则图像处理设备可以将第一相机采集的图像的像素坐标与该图像变换矩阵相乘，以得到第一相机采集的图像在第二相机采集的图像对应的像素坐标系下的像素坐标。

本申请实施例中，针对第一相机与第二相机的视野重叠区域内的一个标定位置，可以采用第一相机针对该标定位置标定的相机参数以及第二相机针对该标定位置标定的相机参数计算得到第一相机采集的图像到第二相机采集的图像的投影变换参数。例如可以采用第一相机针对该标定位置标定的相机参数对第一相机采集的图像进行柱面投影变换或球面投影变换，以及采用第二相机针对该标定位置标定的相机参数对第二相机采集的图像进行柱面投影变换或球面投影变换，以使第一相机采集的图像和第二相机采集的图像投影变换到同一柱面或同一球面上，从而确定第一相机采集的图像与第二相机采集的图像的重叠区域内的相同像素点，再根据重叠区域内的多个像素点分别在第一相机采集的图像中的像素坐标以及在第二相机采集的图像中的像素坐标生成像素坐标映射表，或者计算第一相机采集的图像到第二相机采集的图像的图像变换矩阵。

或者，第一相机和第二相机对应的每组拼接参数包括第一相机采集的图像到目标平面坐标系的投影变换参数以及第二相机采集的图像到目标平面坐标系的投影变换参数。目标平面坐标系不同于第一相机采集的图像对应的像素坐标系以及第二相机采集的图像对应的像素坐标系。第一相机采集的图像到目标平面坐标系的投影变换参数和第二相机采集的图像到目标平面坐标系的投影变换参数分别可以采用像素坐标映射表来表示。比如第一相机采集的图像到目标平面坐标系的投影变换参数可以采用像素坐标映射表A来表示，像素坐标映射表A包括第一相机采集的图像中的多个像素坐标与目标平面坐标系中的多个坐标的对应关系。第二相机采集的图像到目标平面坐标系的投影变换参数可以采用像素坐标映射表B来表示，像素坐标映射表B包括第二相机采集的图像中的多个像素坐标与目标平面坐标系中的多个坐标的对应关系。或者，第一相机采集的图像到目标平面坐标系的投影变换参数和第二相机采集的图像到目标平面坐标系的投影变换参数分别可以采用图像变换矩阵表示。比如第一相机采集的图像到目标平面坐标系的投影变换参数可以采用图像变换矩阵A表示，第二相机采集的图像到目标平面坐标系的投影变换参数可以采用图像变换矩阵B表示。图像处理设备可以将第一相机采集的图像的像素坐标与图像变换矩阵A相乘，以得到第一相机采集的图像在目标平面坐标系下的像素坐标。图像处理设备可以将第二相机采集的图像的像素坐标与图像变换矩阵B相乘，以得到第二相机采集的图像在目标平面坐标系下的像素坐标。

针对第一相机与第二相机的视野重叠区域内的一个标定位置，可以采用第一相机针对该标定位置标定的相机参数计算得到第一相机采集的图像到目标平面坐标系的投影变换参数。例如可以采用第一相机针对该标定位置标定的相机参数对第一相机采集的图像进行柱面投影变换或球面投影变换，再将柱面图像或球面图像投影到目标平面坐标系所在的平面上，根据多个像素点分别在第一相机采集的图像中的像素坐标以及在目标平面坐标系中的坐标生成像素坐标映射表A，或者计算第一相机采集的图像到目标平面坐标系的投影变换参数。同理，可以采用第二相机针对标定位置标定的相机参数计算得到第二相机采集的图像到目标平面坐标系的投影变换参数，具体计算方式可参考对第一相机采集的图像到目标平面坐标系的投影变换参数的计算方式，本申请实施例在此不再赘述。

本申请实施例中，可以基于像素坐标映射表实现对第一相机采集的图像中的像素点与第二相机采集的图像中的像素点的配对，或者可以通过图像变换矩阵将第一相机采集的图像与第二相机采集的图像变换到同一平面坐标系下，实现对第一相机采集的图像中的像素点与第二相机采集的图像中的像素点的配对。

可选地，第一相机和第二相机对应的每组拼接参数还包括图像融合参数，该图像融合参数用于对第一相机采集的图像与第二相机采集的图像进行图像融合处理。图像融合参数包括但不限于第一相机采集的图像与第二相机采集的图像的像素值权重、第一相机采集的图像的曝光权重、第二相机采集的图像的曝光权重、第一相机采集的图像的白平衡权重或第二相机采集的图像的白平衡权重等。其中，像素值权重用于计算第一相机采集的图像和第二相机采集的图像的重叠区域内的像素点的像素值，像素值权重具体包括第一相机采集的图像的像素值在融合后的图像中的占比以及第二相机采集的图像的像素值在融合后的图像中的占比。曝光权重用于调整图像亮度，第一相机采集的图像的曝光权重用于调整第一相机采集的图像的亮度，第二相机采集的图像的曝光权重用于调整第二相机采集的图像的亮度，通过设置曝光权重，可以使第一相机采集的图像与第二相机采集的图像的亮度趋于一致。白平衡权重用于调整图像色彩度，第一相机采集的图像的白平衡权重用于调整第一相机采集的图像的色彩度，第二相机采集的图像的白平衡权重用于调整第二相机采集的图像的色彩度，通过设置白平衡权重，可以使第一相机采集的图像与第二相机采集的图像的色彩度趋于一致。图像融合参数可以是人工设置且可调整的。

本申请实施例中，使用第一相机与第二相机的视野重叠区域内的某个标定位置对应的拼接参数对第一相机采集的图像和第二相机采集的图像进行拼接时，该标定位置的拼接效果相较于其它位置的拼接效果更好。

可选地，图像处理设备中可以存储有多相机模组中相邻部署的两个相机对应的多组拼接参数与该两个相机的视野重叠区域内多个标定位置的对应关系。或者，图像处理设备中可以存储有多相机模组中相邻部署的两个相机各自的多组相机参数与该两个相机的视野重叠区域内多个标定位置的对应关系，在需要使用该两个相机对应的拼接参数时，图像处理设备根据各个标定位置分别对应的该两个相机的相机参数计算对应的拼接参数。

本申请实施例还可以针对不同部署场景分别生成多个不同标定位置对应的拼接参数。以视频会议场景为例，不同部署场景即不同会议室场景，包括会议室类型不同和/或会议室大小不同。会议室类型可以分为开放式会议室、半开放式会议室和封闭式会议室这三种，或者可以分为室内会议室和室外会议室这两种。会议室大小包括会议室的长(距离多相机模组的最大深度距离)、宽(左右宽度)、高(上下高度)。例如，本申请实施例可以针对开放式会议室、半开放式会议室、封闭式会议室这3种类型，以及3种大小的共9种会议室场景中的每种场景分别生成不同位置下的拼接参数。比如对于封闭式、大型会议室，可以生成距离多相机模组1米、3米、5米、8米、10米和20米这6个位置对应的拼接参数。

一种可能实现方式，图像处理设备中存储有多相机模组中相邻部署的两个相机在多种部署场景下分别对应的拼接参数，则图像处理设备在根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数之前，需要先获取多相机模组的部署场景，再获取第一相机和第二相机在该多相机模组的部署场景下对应的多组拼接参数。

这种实现方式下，图像处理设备首先需要获取多相机模组的部署场景。可选地，多相机模组的部署场景可以由图像处理设备根据多相机模组采集的图像确定，或者可以由其它传感器识别，又或者可以通过用户交互界面输入或选择。

以多相机模组的部署场景为视频会议场景为例，图像处理设备可以根据多相机模组采集的图像识别会议室类型以及估计会议室大小。一种具体实现方式，图像处理设备可以对多相机模组中一个或者多个相机采集的图像采用分类算法以识别当前会议室类型，如果采用多个相机采集的图像进行分类，图像处理设备可以对每个相机采集的图像分别进行分类，并对分类结果加权平均得到最终分类结果，或者图像处理设备也可以将多个相机采集的图像输入一个分类模型，然后得到分类模型输出的分类结果。另一种具体实现方式，图像处理设备可以根据单目图像进行三维设计(3D layout)空间尺寸估计，例如通过深度学习模型对输入的单目图像进行空间尺寸估计。或者，可以通过毫米波雷达、超声波雷达或多麦克风阵列等进行测距或生成三维点云图像，计算得到会议室大小，再通过分类模型确定会议室场景。上述图像识别方案和传感器识别方案也可以结合使用，例如可以基于图像确定会议室类型，以及通过毫米波雷达计算会议室大小，进而根据会议室类型以及会议室大小确定会议室场景。

可选地，图像处理设备可以通过用户交互界面显示多种部署场景的选项以供用户选择。例如，图5是本申请实施例提供的一种用户交互界面示意图。如图5所示，该用户交互界面为部署场景选择界面，该用户交互界面包括三种会议室类型选项和三种会议室大小选项，三种会议室类型选项分别为开放式、半开放式和封闭式，三种会议室大小选项分别为大、中、小。可选地，会议室大小选项还可以包括大、中、小分别对应的具体会议室尺寸，例如长宽高，图中未一一展示。用户可以在该用户交互界面上选择会议室类型和会议室大小，进而图像处理设备根据用户选择结果确定多相机模组所部署的会议室场景。

本申请实施例通过提供多相机模组在多种不同部署场景下不同位置对应的拼接参数，图像处理设备可以根据多相机模组的部署场景灵活选择对应的拼接参数，使得图像拼接效果与当前部署场景更匹配，从而能够实现多相机模组不同部署场景下采集的图像都有较好的图像拼接效果。或者也可以不区分多相机模组的部署场景，所有部署场景使用同一套拼接参数，本申请实施例对此不做限定。

可选地，第一相机和第二相机的视野重叠区域内可能有一个拍摄目标，也可能有多个拍摄目标。图像处理设备可以基于图像、声音或传感器估计拍摄目标所在的位置。位置估计可以采用导播技术实现，例如拍摄目标为人，可以通过人脸或人体跟踪确定人的位置，或者通过声源定位确定人的位置，又或者通过毫米波传感器或超声波传感器采用活体检测算法确定人的位置，又或者将通过运动检测算法确定的运动物体的位置作为人的位置，又或者结合使用至少两种上述位置估计方案确定人的位置。或者，拍摄目标所在的位置也可以通过手动输入得到，例如用户可以通过用户交互界面输入位置坐标。本申请实施例对图像处理设备获取拍摄目标所在的位置的方式不做限定。

可选地，拍摄目标所在的位置可以是一维、二维或三维的，这里所确定的拍摄目标所在的位置的维度可以与相机标定时所选用的标定位置的维度一致。比如，位于相邻部署的两个相机的视野重叠区域内的拍摄目标所在的位置的一维表示可以是拍摄目标到该两个相机的中心位置的距离，或者拍摄目标相对于该两个相机的排布方向的水平(左右)角度，或者拍摄目标相对于该两个相机的排布方向的垂直(上下)角度。位于相邻部署的两个相机的视野重叠区域内的拍摄目标所在的位置的二维表示可以是拍摄目标到该两个相机的中心位置的距离以及拍摄目标相对于该两个相机的排布方向的水平角度，或者拍摄目标到该两个相机的中心位置的距离以及拍摄目标相对于该两个相机的排布方向的垂直角度，或者拍摄目标相对于该两个相机的排布方向的水平角度以及拍摄目标相对于该两个相机的排布方向的垂直角度。拍摄目标所在的位置的三维表示可以是拍摄目标到该两个相机的中心位置的距离，拍摄目标相对于该两个相机的排布方向的水平角度，以及拍摄目标相对于该两个相机的排布方向的垂直角度。例如，图6至图8分别是本申请实施例提供的一种拍摄目标所在的位置的示意图。如图6所示，拍摄目标到多相机模组的距离为3米。如图7所示，拍摄目标到多相机模组的距离为3米，且拍摄目标相对于多相机模组的水平角度为30°，其中0°表示正前方，水平正角度表示在多相机模组右边，水平负角度表示在多相机模组左边，拍摄目标相对于多相机模组的水平角度为30°表示拍摄目标在多相机模组的正前方右侧30°。如图8所示，拍摄目标到多相机模组的距离为3米，拍摄目标相对于多相机模组的水平角度为30°，且拍摄目标相对于多相机模组的垂直角度为20°，其中垂直正角度表示在多相机模组上方，垂直负角度表示在多相机模组下方，拍摄目标相对于多相机模组的垂直角度为20°表示拍摄目标在多相机模组的正上方20°。在针对图6至图8的描述中，拍摄目标到多相机模组的距离可以是拍摄目标到构成拍摄目标所在视野重叠区域的两个相机的中心位置的距离，拍摄目标相对于多相机模组的水平角度或垂直角度可以是拍摄目标到构成拍摄目标所在视野重叠区域的两个相机的排布方向的水平角度或垂直角度，图中未具体示出多相机模组中的相机，仅以多相机模组统一表示。其中，图7和图8中的x轴方向为水平方向，y轴方向为深度方向，图8中的z轴方向为高度方向。

本申请以下实施例针对视野重叠区域内包括一个拍摄目标的情况和包括多个拍摄目标的情况，对步骤302的实现方式分别进行说明。可选地，拍摄目标可以是人，或者也可以是动物、汽车或工厂工件等任意物体，本申请实施例对拍摄目标的类型不做限定。

第一种可能情况，第一相机和第二相机的视野重叠区域内包括一个拍摄目标，步骤302的实现方式可以是，图像处理设备根据第一相机和第二相机的视野重叠区域内的多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定目标拼接参数。可选地，如果该多个标定位置包括拍摄目标所在的位置，图像处理设备可以将拍摄目标所在的位置对应的拼接参数作为目标拼接参数。如果该多个标定位置不包括拍摄目标所在的位置，图像处理设备可以根据该多个标定位置中距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定目标拼接参数。

可选地，图像处理设备根据多个标定位置中距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定目标拼接参数的一种实现方式，包括：图像处理设备基于拍摄目标所在的位置相对于两个标定位置的距离，采用两个标定位置对应的拼接参数插值计算得到拍摄目标所在的位置对应的目标拼接参数。比如，拍摄目标距离多相机模组2.2米，离拍摄目标最近的两个标定位置分别距离多相机模组2米和3米，那么可以采用距离多相机模组2米的标定位置对应的拼接参数以及距离多相机模组3米的标定位置对应的拼接参数插值计算得到距离多相机模组2.2米处的拼接参数，并将该拼接参数作为目标拼接参数。可选地，这里采用的插值算法可以是线性插值算法或非线性插值算法。以采用线性插值算法为例，假设距离多相机模组2米的标定位置对应的拼接参数为T1，距离多相机模组3米的标定位置对应的拼接参数为T2，则采用线性插值算法计算得到的距离多相机模组2.2米处的拼接参数为(0.8*T1+0.2*T2)。

或者，图像处理设备也可以将距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数的均值作为拍摄目标所在的位置对应的目标拼接参数。

本申请实施例中，在第一相机和第二相机的视野重叠区域内只有一个拍摄目标的情况下，将拍摄目标所在的位置对应的拼接参数作为目标拼接参数，或者根据距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数计算得到目标拼接参数，将该目标拼接参数用于对第一相机和第二相机采集的图像进行拼接时，可以使拍摄目标所在的位置的拼接效果较好，从而可以保证拍摄目标在拼接图像中的显示效果。

第二种可能情况，第一相机和第二相机的视野重叠区域内包括多个拍摄目标。这种可能情况下，图像处理设备可以针对多个拍摄目标确定一个拼接参数，或者也可以针对多个拍摄目标中的每个拍摄目标分别确定对应的拼接参数，本申请以下实施例对这两种实现方式分别进行说明。

第一种实现方式，图像处理设备可以针对多个拍摄目标确定一个拼接参数。该实现方式可以应用于多相机模组采用导播模式的场景。可选地，导播模式包括但不限于智能取景(auto framing)模式、发言人特写模式、演讲者跟踪模式或对话模式。其中发言人特写模式和演讲者跟踪模式是指对会议中发言的个人进行框选和跟踪。这些模式中都需要进行人脸检测，其中发言人特写模式还需要进行声源定位。由于声源定位存在误差，这就要求声源位置和图像进行匹配。根据声源定位后的位置，在图像中该位置寻找人脸，如果成功找到人脸，则导播特写该人脸，这也就是声像匹配的过程。

在第一种实现方式下，步骤302的具体实现方式可以是，图像处理设备根据第一相机和第二相机对应的多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数。

可选地，图像处理设备根据第一相机和第二相机对应的多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数的一种实现方式，包括：图像处理设备将目标标定位置对应的拼接参数作为目标拼接参数，目标标定位置为多个标定位置中到该多个拍摄目标所在的位置的距离之和最小的标定位置。比如，第一相机和第二相机的视野重叠区域内有3个拍摄目标，该3个拍摄目标到多相机模组的距离分别为2米，3米和5米，则距离多相机模组3米的标定位置到这3个拍摄目标所在的位置的距离之和为1+0+2＝3米，距离多相机模组4米的标定位置到这3个拍摄目标所在的位置的距离之和为2+1+1＝4米，因此可以将距离多相机模组3米的标定位置对应的拼接参数作为目标拼接参数。

可选地，图像处理设备根据第一相机和第二相机对应的多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数的另一种实现方式，包括：图像处理设备针对该多个拍摄目标中的每个拍摄目标，获取多个标定位置中距离该拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数。图像处理设备根据针对该多个拍摄目标获取的所有拼接参数，确定目标拼接参数。其中，如果多个标定位置包括拍摄目标所在的位置，则距离拍摄目标所在的位置最近的一个或多个标定位置可以是该拍摄目标所在的位置。如果多个标定位置不包括拍摄目标所在的位置，则距离拍摄目标所在的位置最近的一个或多个标定位置可以是距离拍摄目标所在的位置最近的两个标定位置。

可选地，图像处理设备根据针对该多个拍摄目标获取的所有拼接参数，确定目标拼接参数的一种实现过程，包括：图像处理设备先确定每个拍摄目标所在的位置分别对应的拼接参数，再根据该多个拍摄目标所在的位置分别对应的拼接参数，确定目标拼接参数。其中，图像处理设备确定单个拍摄目标所在的位置对应的拼接参数的实现过程可参考上述第一种可能情况中的相关描述，本申请实施例在此不再赘述。

可选地，图像处理设备可以将该多个拍摄目标所在的位置分别对应的拼接参数的平均值作为目标拼接参数。比如，第一相机和第二相机的视野重叠区域内有2个拍摄目标，其中一个拍摄目标所在的位置对应的拼接参数为T1，另一个拍摄目标所在的位置对应的拼接参数为T2，则目标拼接参数可以是(T1+T2)/2。或者，图像处理设备也可以将该多个拍摄目标所在的位置分别对应的拼接参数的加权平均值作为目标拼接参数，各个拍摄目标所在的位置对应的拼接参数的权重占比与到该多个拍摄目标所在的位置的聚类中心的距离正相关。

或者，图像处理设备根据针对该多个拍摄目标获取的所有拼接参数，确定目标拼接参数的另一种实现过程，包括：图像处理设备将针对该多个拍摄目标获取的所有拼接参数的平均值作为目标拼接参数。比如，第一相机和第二相机的视野重叠区域内有2个拍摄目标，距离其中一个拍摄目标所在的位置最近的2个标定位置对应的拼接参数分别为T1和T2，距离其中另一个拍摄目标所在的位置最近的2个标定位置对应的拼接参数分别为T3和T4，则目标拼接参数可以是(T1+T2+T3+T4)/4。

第二种实现方式，图像处理设备可以针对多个拍摄目标中的每个拍摄目标分别确定对应的拼接参数。该实现方式可以应用于多相机模组采用智能均分模式或多人同框模式的场景。

在第二种实现方式下，步骤302的具体实现方式可以是，针对多个拍摄目标中的每个拍摄目标，图像处理设备根据第一相机和第二相机的视野重叠区域内的多个标定位置中距离该拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定该拍摄目标对应的拼接参数。也即是，这种可能情况下，图像处理设备针对每个拍摄目标分别确定该拍摄目标所在的位置对应的拼接参数，图像处理设备确定单个拍摄目标所在的位置对应的拼接参数的实现过程可参考上述第一种可能情况中的相关描述，本申请实施例在此不再赘述。

智能均分模式或多人同框模式是指，将多人特写画面组合后在同一个屏幕上显示。这种可能情况下，目标拼接参数包括多个拍摄目标中的每个拍摄目标对应的拼接参数。

步骤303、采用目标拼接参数对第一相机采集的第一图像和第二相机采集的第二图像进行拼接，得到拼接图像。

可选地，目标拼接参数包括第一图像到第二图像的投影变换参数，或者，目标拼接参数包括第一图像到目标平面坐标系的投影变换参数以及第二图像到目标平面坐标系的投影变换参数。采用目标拼接参数对第一相机采集的第一图像和第二相机采集的第二图像进行拼接，可以是采用第一图像到第二图像的投影变换参数将第一图像变换到第二图像对应的像素坐标系下，再对第二图像与经过变换的第一图像进行图像融合，或者可以是采用第一图像到目标平面坐标系的投影变换参数将第一图像变换到目标平面坐标系所在的平面上，以及采用第二图像到目标平面坐标系的投影变换参数将第二图像变换到目标平面坐标系所在的平面上，再对经过变换的第一图像和经过变换的第二图像进行图像融合。对第一图像和第二图像进行图像融合，实际上是对第一图像和第二图像的重叠区域进行图像融合。可选地，目标拼接参数还包括图像融合参数，图像处理设备可以基于图像融合参数对第一图像和第二图像的重叠区域进行图像融合，比如基于曝光权重调整第一图像和/或第二图像的亮度，基于白平衡权重调整第一图像和/或第二图像的色彩度，基于像素值权重计算第一图像和第二图像的重叠区域内像素点的像素值。对第一图像和第二图像的重叠区域进行图像融合，可以包括，根据第一图像和第二图像的重叠区域内同一像素点的像素值计算得到目标像素值，并将该目标像素值作为融合得到的图像中该像素点的像素值。在图像融合参数包括第一图像与第二图像的像素值权重的情况下，可以采用该像素值权重计算目标像素值。或者，在图像融合参数不包括第一图像与第二图像的像素值权重的情况下，也可以采用加权平均法计算两帧图像的重叠区域中每个像素点的目标像素值。假设第一图像和第二图像的重叠区域存在同一像素点a，像素点a在第一图像中的像素值为p，像素点a在第二图像中的像素值为q，则像素点a在由第一图像和第二图像融合得到的最终图像中的目标像素值可以是(p*0.5+q*0.5)。

结合上述步骤302中的第一种可能情况或第二种可能情况中的第一种实现方式，图像处理设备针对所有拍摄目标进行一次图像拼接，得到一张拼接图像。在图像处理设备得到拼接图像之后，图像处理设备可以输出裁剪图像到屏幕上显示，该裁剪图像从拼接图像中裁剪得到，该裁剪图像包含位于第一相机和第二相机的视野重叠区域内的所有拍摄目标。比如，图像处理设备可以对该拼接图像进行裁剪，以得到包含所有拍摄目标的裁剪图像，并输出裁剪图像到屏幕上显示。

可选地，对于发言人特写模式，图像处理设备可以先拼接得到全景图，然后对全景图裁剪得到发言人的特写图像。为了优化性能、降低资源消耗，图像处理设备也可以直接根据发言人的位置，仅对发言人所在区域的图像进行拼接，得到拼接后的发言人特写图像。

例如，图9和图10分别是本申请实施例提供的一种会议室场景示意图。如图9或图10所示，多相机模组部署在会议室前方，会议室中有A、B、C、D四个不同位置。其中多相机模组的结构可以如图1所示，A位置和C位置位于相机1和相机2的视野重叠区域A12内，B位置和D位置位于相机2和相机3的视野重叠区域A23内。

如图9所示，假设导播场景的发言人初始时在A位置，则多相机模组中的3个相机采集的图像可以如图11所示，其中图像1a是相机1采集的图像，图像2a是相机2采集的图像，图像3a是相机3采集的图像。图像2a是指位于矩形框内的区域，图中为了示意，将相机2对发言人未拍全的部分也进行了体现，位于矩形框外的部分实际不属于图像2a。由于导播的发言人在A位置，此时图像处理设备可以采用A位置对应的拼接参数对图像1和图像2进行拼接，得到如图12所示的拼接图像。如果切换到发言人特写模式，则图像处理设备可以从图12中裁剪出包含发言人的位置框进行放大显示，得到的裁剪图像可以如图13所示。当导播的发言人从A位置移动到B位置时，图像处理设备可以采用B位置对应的拼接参数对相机2采集的图像和相机3采集的图像进行拼接。同理，当导播的发言人在C位置或D位置时，图像处理设备均可以采用发言人所在位置对应的拼接参数对相应相机采集的图像进行拼接。

如图10所示，A、B、C、D四个位置处有4个不同的发言人，可以在不同时刻分别不同发言人进行导播特写。在对A位置的发言人进行导播特写时，图像处理设备采用A位置对应的拼接参数对相机1和相机2采集的图像进行拼接。在对B位置的发言人进行导播特写时，图像处理设备采用B位置对应的拼接参数对相机2和相机3采集的图像进行拼接。在对C位置的发言人进行导播特写时，图像处理设备采用C位置对应的拼接参数对相机1和相机2采集的图像进行拼接。在对D位置的发言人进行导播特写时，图像处理设备采用D位置对应的拼接参数对相机2和相机3采集的图像进行拼接。这样能够使得当前导播特写对象所在位置具有较好的图像拼接效果，进而保证导播特写对象的显示效果。

可选地，导播模式与全景显示模式之间可以相互切换。在全景显示模式下，图像处理设备对多相机模组中所有相机采集的图像进行拼接。比如在图9或图10示出的会议室场景中，图像处理设备可以先对相机1和相机2采集的图像进行拼接，再将得到的拼接图像与相机3采集的图像进行拼接，得到全景图像。或者，图像处理设备可以先对相机1和相机2采集的图像进行拼接，以及对相机2和相机3采集的图像进行拼接，再对得到的两张拼接图像进行进一步拼接，得到全景图像。本申请实施例中的图像拼接可以是对相邻部署的相机采集的图像进行拼接。

结合上述步骤302中的第二种可能情况的第二种实现方式，第一相机和第二相机的视野重叠区域内包括多个拍摄目标，步骤303的实现方式为，针对每个拍摄目标，图像处理设备采用该拍摄目标对应的拼接参数对第一图像和第二图像进行拼接，得到该拍摄目标对应的拼接图像。也即是，图像处理设备针对多个拍摄目标中的每个拍摄目标分别进行一次图像拼接，得到多张拼接图像，以保证每个拍摄目标在对应的拼接图像中的显示效果。

可选地，在图像处理设备得到多个拍摄目标分别对应的拼接图像之后，图像处理设备可以输出组合图像到屏幕上显示，该组合图像由多张裁剪图像组合得到，多张裁剪图像分别从多个拍摄目标对应的多张拼接图像中裁剪得到，且每张裁剪图像分别包含所裁剪的拼接图像中对应的拍摄目标。比如，图像处理设备可以针对每个拍摄目标对应的拼接图像，对该拼接图像进行裁剪，以得到包含对应的拍摄目标的裁剪图像，图像处理设备对该多个拍摄目标对应的多张裁剪图像进行组合，以得到组合图像，并输出组合图像到屏幕上显示。

本申请实施例中，由于图像处理设备生成的组合图像中的每个拍摄目标所来自的拼接图像能够保证该拍摄目标具有较好的显示效果，因此能够保证最终输出的组合图像的显示效果。

可选地，对于智能均分模式或多人同框模式，为了优化性能、降低资源消耗，图像处理设备可以直接根据拍摄目标所在的位置，采用该拍摄目标对应的拼接参数对包含拍摄目标所在区域的图像进行拼接。比如多相机模组包括3个相机，如果一个与会者只出现在两个相机的视野范围内，则拼接时只对这两个相机采集的图像进行拼接。如果一个与会者同时出现在三个相机的视野范围内，则拼接时可以选取其中相邻两个相机的图像进行拼接，只需保证拼接得到的图像中该与会者的成像完整即可。

例如，在如图10所示的会议室场景中，多相机模组中的3个相机采集的图像可以如图14所示，其中图像1b是相机1采集的图像，图像2b是相机2采集的图像，图像3b是相机3采集的图像。图像1b-3b是指位于矩形框内的区域，图中为了示意，将相机对发言人未拍全的部分也进行了体现，位于矩形框外的部分实际不属于对应的图像。图像处理设备可以采用A位置对应的拼接参数对图像1b和图像2b进行拼接，并从拼接得到的图像中裁剪出包含A位置的发言人的区域。图像处理设备可以采用B位置对应的拼接参数对图像2b和图像3b进行拼接，并从拼接得到的图像中裁剪出包含B位置的发言人的区域。图像处理设备可以采用C位置对应的拼接参数对图像1b和图像2b进行拼接，并从拼接得到的图像中裁剪出包含C位置的发言人的区域。图像处理设备可以采用D位置对应的拼接参数对图像2b和图像3b进行拼接，并从拼接得到的图像中裁剪出包含D位置的发言人的区域。进一步地，图像处理设备可以对裁剪出来的四个区域进行组合，得到如图15所示的组合图像。

可选地，图像处理设备输出图像到屏幕上显示，可以是在自身屏幕上显示图像，或者也可以是向其它设备发送图像以供其它设备显示。例如在视频会议场景中，会议终端可以对本端多相机模组采集的多帧图像进行拼接得到拼接图像，进一步可以显示拼接图像、裁剪图像或组合图像。或者，会议终端还可以向远端的其它会议终端发送拼接图像、裁剪图像或组合图像，以供其它会议终端显示。

在本申请实施例提供的图像拼接方法中，通过离线标定多相机模组中相邻部署的两个相机针对视野重叠区域内的不同标定位置的相机参数，对于每个标定位置，进一步可以根据这两个相机针对该标定位置标定得到的相机参数确定拼接参数，以得到不同标定位置分别对应的拼接参数。当拍摄目标位于两个相机的视野重叠区域内时，图像处理设备可以根据该视野重叠区域内的多个标定位置各自对应的拼接参数确定适用于拍摄目标所在的位置的拼接参数，进而使得拼接图像中拍摄目标所在的位置的拼接效果较好，从而提升拍摄目标在拼接图像中的显示效果。另外，本申请实施例中无需对图像进行特征点检测和匹配，适用于更多的拍摄场景且所需算力较低。

本申请实施例提供的图像拼接方法的步骤的先后顺序能够进行适当调整，步骤也能够根据情况进行相应增减。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内。比如，本申请实施例以拍摄目标位于多相机模组中的两个相机的拍摄区域内为例对图像拼接过程进行说明，如果拍摄目标位于多相机模组中的三个或三个以上相机的拍摄区域内，则图像处理设备可以选取其中相邻部署的两个相机采集的图像进行拼接，只需保证拍摄目标在拼接得到的图像中的成像完整即可，本申请实施例不再一一赘述。

下面对本申请实施例涉及的虚拟装置举例说明。

例如，图16是本申请实施例提供的一种图像拼接装置的结构示意图。该图像拼接图像可以应用于图像处理设备，如图16所示，该装置1600包括但不限于：获取模块1601、确定模块1602和拼接模块1603。可选地，该装置1600还包括输出模块1604。

获取模块1601，用于获取多相机模组在同一时刻采集的多帧图像，多相机模组包括多个相机，多个相机包括相邻部署的第一相机和第二相机，第一相机和第二相机具有视野重叠区域，多帧图像包括第一相机采集的第一图像和第二相机采集的第二图像。

确定模块1602，用于当视野重叠区域内包括拍摄目标时，根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数，多组拼接参数分别基于第一相机和第二相机共同针对视野重叠区域内的不同标定位置标定的相机参数得到。

拼接模块1603，用于采用目标拼接参数对第一图像和第二图像进行拼接，得到拼接图像。

第一相机和第二相机对应的每组拼接参数包括第一相机采集的图像到第二相机采集的图像的投影变换参数，或者，第一相机和第二相机对应的每组拼接参数包括第一相机采集的图像到目标平面坐标系的投影变换参数以及第二相机采集的图像到目标平面坐标系的投影变换参数。

可选地，多个标定位置中的任意两个标定位置满足以下一个或多个条件：两个标定位置到第一相机和第二相机的中心位置的距离不同；两个标定位置相对于第一相机和第二相机的排布方向的水平角度不同；两个标定位置相对于第一相机和第二相机的排布方向的垂直角度不同。

可选地，视野重叠区域内包括一个拍摄目标，确定模块1602，用于：根据多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定目标拼接参数。

可选地，确定模块1602，具体用于：如果多个标定位置包括拍摄目标所在的位置，将拍摄目标所在的位置对应的拼接参数作为目标拼接参数。如果多个标定位置不包括拍摄目标所在的位置，根据多个标定位置中距离拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定目标拼接参数。

可选地，确定模块1602，具体用于：基于拍摄目标所在的位置相对于两个标定位置的距离，采用两个标定位置对应的拼接参数插值计算得到拍摄目标所在的位置对应的目标拼接参数。

可选地，视野重叠区域内包括多个拍摄目标，确定模块1602，用于：根据多组拼接参数以及多个拍摄目标所在的位置确定目标拼接参数。

可选地，确定模块1602，具体用于：将目标标定位置对应的拼接参数作为目标拼接参数，目标标定位置为多个标定位置中到多个拍摄目标所在的位置的距离之和最小的标定位置。

或者，确定模块1602，具体用于：针对多个拍摄目标中的每个拍摄目标，获取多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数。根据针对多个拍摄目标获取的所有拼接参数，确定目标拼接参数。

可选地，输出模块1604，用于在采用目标拼接参数对第一图像和第二图像进行拼接，得到拼接图像之后，输出裁剪图像到屏幕上显示，裁剪图像从拼接图像中裁剪得到，裁剪图像包含所有拍摄目标。

可选地，视野重叠区域内包括多个拍摄目标，确定模块1602，用于：针对多个拍摄目标中的每个拍摄目标，根据多个标定位置中距离拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定拍摄目标对应的拼接参数。相应地，拼接模块1603，用于：针对每个拍摄目标，采用拍摄目标对应的拼接参数对第一图像和第二图像进行拼接，得到拍摄目标对应的拼接图像。

可选地，输出模块1604，用于在针对多个拍摄目标中的每个拍摄目标，采用拍摄目标对应的拼接参数对第一图像和第二图像进行拼接，得到拍摄目标对应的拼接图像之后，输出组合图像到屏幕上显示，组合图像由多张裁剪图像组合得到，多张裁剪图像分别从多个拍摄目标对应的多张拼接图像中裁剪得到，且每张裁剪图像分别包含所裁剪的拼接图像中对应的拍摄目标。

可选地，图像处理设备中存储有多相机模组中相邻部署的两个相机在多种部署场景下分别对应的拼接参数。获取模块1601，还用于在根据第一相机和第二相机对应的多组拼接参数以及拍摄目标所在的位置确定目标拼接参数之前，获取多相机模组的部署场景，并获取第一相机和第二相机在多相机模组的部署场景下对应的多组拼接参数。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

下面对本申请实施例涉及的基本硬件结构举例说明。

例如，图17是本申请实施例提供的一种图像处理设备的硬件结构示意图。如图17所示，图像处理设备1700包括处理器1701和存储器1702，存储器1701与存储器1702通过总线1703连接。图17以处理器1701和存储器1702相互独立说明。可选地，处理器1701和存储器1702集成在一起。可选地，结合图2来看，图17中的图像处理设备1700是图2所示的应用场景中的任一会议终端201或视频服务器202。

其中，存储器1702用于存储计算机程序，计算机程序包括操作***和程序代码。存储器1702是各种类型的存储介质，例如只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、电可擦可编程只读存储器(electrically erasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)、闪存、光存储器、寄存器、光盘存储、光碟存储、磁盘或者其它磁存储设备。

其中，处理器1701是通用处理器或专用处理器。处理器1701可能是单核处理器或多核处理器。处理器1701包括至少一个电路，以执行本申请实施例提供的上述图像拼接方法。

可选地，图像处理设备1700还包括网络接口1704，网络接口1704通过总线1703与处理器1701和存储器1702连接。网络接口1704能够实现图像处理设备1700与其它设备通信。例如，处理器1701能够通过网络接口1704与其它设备通信来获取相机采集的图像等。

可选地，图像处理设备1700还包括输入/输出(input/output，I/O)接口1705，I/O接口1705通过总线1703与处理器1701和存储器1702连接。处理器1701能够通过I/O接口1705接收输入的命令或数据等。I/O接口1705用于图像处理设备1700连接输入设备，这些输入设备例如是键盘、鼠标等。可选地，在一些可能的场景中，上述网络接口1704和I/O接口1705被统称为通信接口。

可选地，图像处理设备1700还包括显示器1706，显示器1706通过总线1703与处理器1701和存储器1702连接。显示器1706能够用于显示处理器1701执行上述方法产生的中间结果和/或最终结果等，例如显示拼接图像、裁剪图像或组合图像等。在一种可能的实现方式中，显示器1706是触控显示屏，以提供人机交互接口。

其中，总线1703是任何类型的，用于实现图像处理设备1700的内部器件互连的通信总线。例如***总线。本申请实施例以图像处理设备1700内部的上述器件通过总线1703互连为例说明，可选地，图像处理设备1700内部的上述器件采用除了总线1703之外的其他连接方式彼此通信连接，例如图像处理设备1700内部的上述器件通过图像处理设备1700内部的逻辑接口互连。

上述器件可以分别设置在彼此独立的芯片上，也可以至少部分的或者全部的设置在同一块芯片上。将各个器件独立设置在不同的芯片上，还是整合设置在一个或者多个芯片上，往往取决于产品设计的需要。本申请实施例对上述器件的具体实现形式不做限定。

图17所示的图像处理设备1700仅仅是示例性的，在实现过程中，图像处理设备1700包括其他组件，本文不再一一列举。图17所示的图像处理设备1700可以通过执行上述实施例提供的方法的全部或部分步骤来实现图像拼接。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令被处理器执行时，实现如图3所示的图像拼接方法。

本申请实施例还提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，实现如图3所示的图像拼接方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本申请实施例中，术语“第一”、“第二”和“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

本申请中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

需要说明的是，本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的构思和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种图像拼接方法，其特征在于，应用于图像处理设备，所述方法包括：

获取多相机模组在同一时刻采集的多帧图像，所述多相机模组包括多个相机，所述多个相机包括相邻部署的第一相机和第二相机，所述第一相机和所述第二相机具有视野重叠区域，所述多帧图像包括所述第一相机采集的第一图像和所述第二相机采集的第二图像；

当所述视野重叠区域内包括拍摄目标时，根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数，所述多组拼接参数分别基于所述第一相机和所述第二相机共同针对所述视野重叠区域内的不同标定位置标定的相机参数得到；

采用所述目标拼接参数对所述第一图像和所述第二图像进行拼接，得到拼接图像。
根据权利要求1所述的方法，其特征在于，每组所述拼接参数包括所述第一相机采集的图像到所述第二相机采集的图像的投影变换参数，或者，每组所述拼接参数包括所述第一相机采集的图像到目标平面坐标系的投影变换参数以及所述第二相机采集的图像到所述目标平面坐标系的投影变换参数。
根据权利要求1或2所述的方法，其特征在于，所述多个标定位置中的任意两个标定位置满足以下一个或多个条件：

所述两个标定位置到所述第一相机和所述第二相机的中心位置的距离不同；

所述两个标定位置相对于所述第一相机和所述第二相机的排布方向的水平角度不同；

所述两个标定位置相对于所述第一相机和所述第二相机的排布方向的垂直角度不同。
根据权利要求1至3任一所述的方法，其特征在于，所述视野重叠区域内包括一个拍摄目标，所述根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数，包括：

根据所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定所述目标拼接参数。
根据权利要求4所述的方法，其特征在于，所述根据所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定所述目标拼接参数，包括：

如果所述多个标定位置包括所述拍摄目标所在的位置，将所述拍摄目标所在的位置对应的拼接参数作为所述目标拼接参数；

如果所述多个标定位置不包括所述拍摄目标所在的位置，根据所述多个标定位置中距离所述拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定所述目标拼接参数。
根据权利要求5所述的方法，其特征在于，所述根据所述多个标定位置中距离所述拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定所述目标拼接参数，包括：

基于所述拍摄目标所在的位置相对于所述两个标定位置的距离，采用所述两个标定位置对应的拼接参数插值计算得到所述拍摄目标所在的位置对应的所述目标拼接参数。
根据权利要求1至3任一所述的方法，其特征在于，所述视野重叠区域内包括多个拍摄目标，所述根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数，包括：

根据所述多组拼接参数以及所述多个拍摄目标所在的位置确定所述目标拼接参数。
根据权利要求7所述的方法，其特征在于，所述根据所述多组拼接参数以及所述多个拍摄目标所在的位置确定所述目标拼接参数，包括：

将目标标定位置对应的拼接参数作为所述目标拼接参数，所述目标标定位置为所述多个标定位置中到所述多个拍摄目标所在的位置的距离之和最小的标定位置。
根据权利要求7所述的方法，其特征在于，所述根据所述多组拼接参数以及所述多个拍摄目标所在的位置确定所述目标拼接参数，包括：

针对所述多个拍摄目标中的每个拍摄目标，获取所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数；

根据针对所述多个拍摄目标获取的所有拼接参数，确定所述目标拼接参数。
根据权利要求4至9任一所述的方法，其特征在于，在所述采用所述目标拼接参数对所述第一图像和所述第二图像进行拼接，得到拼接图像之后，所述方法还包括：

输出裁剪图像到屏幕上显示，所述裁剪图像从所述拼接图像中裁剪得到，所述裁剪图像包含所有所述拍摄目标。
根据权利要求1至3任一所述的方法，其特征在于，所述视野重叠区域内包括多个拍摄目标，所述根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数，包括：

针对所述多个拍摄目标中的每个拍摄目标，根据所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定所述拍摄目标对应的拼接参数；

所述采用所述目标拼接参数对所述第一图像和所述第二图像进行拼接，得到拼接图像，包括：

针对所述每个拍摄目标，采用所述拍摄目标对应的拼接参数对所述第一图像和所述第二图像进行拼接，得到所述拍摄目标对应的拼接图像。
根据权利要求11所述的方法，其特征在于，在所述针对所述多个拍摄目标中的每个拍摄目标，采用所述拍摄目标对应的拼接参数对所述第一图像和所述第二图像进行拼接，得到所述拍摄目标对应的拼接图像之后，所述方法还包括：

输出组合图像到屏幕上显示，所述组合图像由多张裁剪图像组合得到，所述多张裁剪图像分别从所述多个拍摄目标对应的多张拼接图像中裁剪得到，且每张所述裁剪图像分别包含所裁剪的拼接图像中对应的拍摄目标。
根据权利要求1至12任一所述的方法，其特征在于，所述图像处理设备中存储有所述多相机模组中相邻部署的两个相机在多种部署场景下分别对应的拼接参数，在所述根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数之前，所述方法还包括：

获取所述多相机模组的部署场景；

获取所述第一相机和所述第二相机在所述多相机模组的部署场景下对应的所述多组拼接参数。
一种图像拼接装置，其特征在于，应用于图像处理设备，所述装置包括：

获取模块，用于获取多相机模组在同一时刻采集的多帧图像，所述多相机模组包括多个相机，所述多个相机包括相邻部署的第一相机和第二相机，所述第一相机和所述第二相机具有视野重叠区域，所述多帧图像包括所述第一相机采集的第一图像和所述第二相机采集的第二图像；

确定模块，用于当所述视野重叠区域内包括拍摄目标时，根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数，所述多组拼接参数分别基于所述第一相机和所述第二相机共同针对所述视野重叠区域内的不同标定位置标定的相机参数得到；

拼接模块，用于采用所述目标拼接参数对所述第一图像和所述第二图像进行拼接，得到拼接图像。
根据权利要求14所述的装置，其特征在于，每组所述拼接参数包括所述第一相机采集的图像到所述第二相机采集的图像的投影变换参数，或者，每组所述拼接参数包括所述第一相机采集的图像到目标平面坐标系的投影变换参数以及所述第二相机采集的图像到所述目标平面坐标系的投影变换参数。
根据权利要求14或15所述的装置，其特征在于，所述多个标定位置中的任意两个标定位置满足以下一个或多个条件：

所述两个标定位置到所述第一相机和所述第二相机的中心位置的距离不同；

所述两个标定位置相对于所述第一相机和所述第二相机的排布方向的水平角度不同；

所述两个标定位置相对于所述第一相机和所述第二相机的排布方向的垂直角度不同。
根据权利要求14至16任一所述的装置，其特征在于，所述视野重叠区域内包括一个拍摄目标，所述确定模块，用于：

根据所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定所述目标拼接参数。
根据权利要求17所述的装置，其特征在于，所述确定模块，用于：

如果所述多个标定位置包括所述拍摄目标所在的位置，将所述拍摄目标所在的位置对应的拼接参数作为所述目标拼接参数；

如果所述多个标定位置不包括所述拍摄目标所在的位置，根据所述多个标定位置中距离所述拍摄目标所在的位置最近的两个标定位置对应的拼接参数确定所述目标拼接参数。
根据权利要求18所述的装置，其特征在于，所述确定模块，用于：

基于所述拍摄目标所在的位置相对于所述两个标定位置的距离，采用所述两个标定位置对应的拼接参数插值计算得到所述拍摄目标所在的位置对应的所述目标拼接参数。
根据权利要求14至16任一所述的装置，其特征在于，所述视野重叠区域内包括多个拍摄目标，所述确定模块，用于：

根据所述多组拼接参数以及所述多个拍摄目标所在的位置确定所述目标拼接参数。
根据权利要求20所述的装置，其特征在于，所述确定模块，用于：

将目标标定位置对应的拼接参数作为所述目标拼接参数，所述目标标定位置为所述多个标定位置中到所述多个拍摄目标所在的位置的距离之和最小的标定位置。
根据权利要求20所述的装置，其特征在于，所述确定模块，用于：

针对所述多个拍摄目标中的每个拍摄目标，获取所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数；

根据针对所述多个拍摄目标获取的所有拼接参数，确定所述目标拼接参数。
根据权利要求17至22任一所述的装置，其特征在于，所述装置还包括：

输出模块，用于在采用所述目标拼接参数对所述第一图像和所述第二图像进行拼接，得到拼接图像之后，输出裁剪图像到屏幕上显示，所述裁剪图像从所述拼接图像中裁剪得到，所述裁剪图像包含所有所述拍摄目标。
根据权利要求14至16任一所述的装置，其特征在于，所述视野重叠区域内包括多个拍摄目标，所述确定模块，用于：

针对所述多个拍摄目标中的每个拍摄目标，根据所述多个标定位置中距离所述拍摄目标所在的位置最近的一个或多个标定位置对应的拼接参数确定所述拍摄目标对应的拼接参数；

所述拼接模块，用于：

针对所述每个拍摄目标，采用所述拍摄目标对应的拼接参数对所述第一图像和所述第二图像进行拼接，得到所述拍摄目标对应的拼接图像。
根据权利要求24所述的装置，其特征在于，所述装置还包括：

输出模块，用于在针对所述多个拍摄目标中的每个拍摄目标，采用所述拍摄目标对应的拼接参数对所述第一图像和所述第二图像进行拼接，得到所述拍摄目标对应的拼接图像之后，输出组合图像到屏幕上显示，所述组合图像由多张裁剪图像组合得到，所述多张裁剪图像分别从所述多个拍摄目标对应的多张拼接图像中裁剪得到，且每张所述裁剪图像分别包含所裁剪的拼接图像中对应的拍摄目标。
根据权利要求14至25任一所述的装置，其特征在于，所述图像处理设备中存储有所述多相机模组中相邻部署的两个相机在多种部署场景下分别对应的拼接参数，

所述获取模块，还用于在所述根据所述第一相机和所述第二相机对应的多组拼接参数以及所述拍摄目标所在的位置确定目标拼接参数之前，获取所述多相机模组的部署场景，并获取所述第一相机和所述第二相机在所述多相机模组的部署场景下对应的所述多组拼接参数。
一种图像拼接装置，其特征在于，包括：处理器和存储器；

所述存储器，用于存储计算机程序，所述计算机程序包括程序指令；

所述处理器，用于调用所述计算机程序，实现如权利要求1至13任一所述的图像拼接方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有指令，当所述指令被处理器执行时，实现如权利要求1至13任一所述的图像拼接方法。
一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序被处理器执行时，实现如权利要求1至13任一所述的图像拼接方法。