CN112529097B

CN112529097B - 样本图像生成方法、装置以及电子设备

Info

Publication number: CN112529097B
Application number: CN202011536978.1A
Authority: CN
Inventors: 陈思利; 刘赵梁; 赵洋
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-23
Filing date: 2020-12-23
Publication date: 2024-03-26
Anticipated expiration: 2040-12-23
Also published as: US20210374902A1; CN112529097A; JP7277548B2; JP2022028854A

Abstract

本公开涉及一种样本图像生成方法、装置以及电子设备，涉及增强现实和深度学***面物体的第一显示平面；对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得；获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域；根据所述第一区域的图像，生成样本图像。可实现基于已有的第一图像，生成样本图像，可降低样本图像获取的时间成本和人工成本，提高了样本图像获取的效率。

Description

样本图像生成方法、装置以及电子设备

技术领域

本公开涉及图像处理技术领域，具体为增强现实和深度学习技术，尤其涉及一种样本图像生成方法、装置以及电子设备。

背景技术

室内平面物体指的是挂画、广告牌、招牌、海报之类的平面物体。平面物体检测网络是用来检测图像(相机或手机等采集得到)是否包含目标平面物体(即在训练数据中出现过的平面物体)的神经网络。平面物体检测网络可被用于多种应用场景，例如，在检测到的平面物体上叠加虚拟物体，以实现增强现实(Augmented Reality，AR)效果(如在美术馆里，在名画上叠加说明文字等)，另外，还可以应用在室内定位、导航等场景下。

训练平面物体检测网络需要大量采集实物图像，并在采集到的图像里标注出目标平面物体，生成足够的训练数据集，保证平面物体检测网络的鲁棒性。

发明内容

本公开提供了一种样本图像生成方法、装置以及电子设备。

根据本公开的第一方面，提供了一种样本图像生成方法，包括：

获取第一图像，所述第一图像包括目标平面物体的第一显示平面；

对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得；

获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域；

根据所述第一区域的图像，生成样本图像。

根据本公开的第二方面，提供了一种样本图像生成装置，包括：

第一获取模块，用于获取第一图像，所述第一图像包括目标平面物体的第一显示平面；

映射模块，用于对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得；

第二获取模块，用于获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域；

生成模块，用于根据所述第一区域的图像，生成样本图像。

根据本公开的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面任一项所述的方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行第一方面任一项所述的方法。

根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据第一方面所述的方法。

本公开提供的方法，可实现基于已有的第一图像，生成样本图像，降低样本图像获取的成本，提高样本图像获取的效率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开实施例提供的样本图像生成方法的一流程图；

图2a是本公开实施例提供的第一图像示意图；

图2b是本公开实施例提供的第二图像示意图；

图3是本公开实施例提供的样本图像生成装置的结构图；

图4是用来实现本公开实施例的样本图像生成方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

参见图1，图1是本公开实施例提供的样本图像生成方法的流程图，如图1所示，本实施例提供一种样本图像生成方法，由电子设备执行，包括以下步骤：

步骤101、获取第一图像，所述第一图像包括第一显示平面。

本公开提供的方法实现的目的是基于少量样本图像，生成更多样本图像，第一图像可为已有的少量样本图像中的图像。第一图像包括至少一个第一显示平面，这些第一显示平面可以为不同目标平面物体的显示平面，也可以为同一个目标平面物体的不同角度的显示平面，对于第一图像中的每一个第一显示平面，都可采用本公开提供的样本图像生成方法生成新的样本图像。第一显示平面通过对目标平面物体进行拍摄获得，目标平面物体包括挂画、广告牌、招牌、海报等平面物体。

步骤102、对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得。

对第一图像进行映射，使得目标平面物体以正视图的视向显示在第二图像中，即第二显示平面为目标平面物体的正视图，第二显示平面由第一显示平面映射在第二图像中获得。图2a所示为第一图像，图2b所示为第二图像，标号11所示为地板区域，标号12所示为天花板区域，标号13所述为墙面区域。图2a中包括两张海报的第一显示平面，分别标识为A和B，图2b中包括两张海报的第二显示平面，分别标识为C和D，其中，标识为A的第一显示平面映射为标识为C的第二显示平面，标识为B的第一显示平面映射为标识为D的第二显示平面，标识为C和D的第二显示平面分别为两张海报的正视图。

为便于区分，将第一图像中的目标平面物体的显示平面称为第一显示平面，将第二图像中的目标平面物体的显示平面称为第二显示平面。

步骤103、获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域。

第二显示平面所在的区域可位于第一区域的中心位置，例如，第二显示平面的中心位置与第一区域的中心位置重合。进一步的，第一区域不包括第二图像中其他显示平面所在的区域，例如，若第一图像中有多个第一显示平面的情况下，每个第一显示平面均映射到第二图像中，使得第二图像包括多个第二显示平面，第二图像中其他显示平面所在的区域即是指除当前关注的第二显示平面之外的其他第二显示平面所在的区域。当前关注的第二显示平面即第一区域包括的第二显示平面。如图2b所示，若当前关注C所标识的第二显示平面，则D标识的第二显示平面属于其他显示平面。

步骤104、根据所述第一区域的图像，生成样本图像。

可将第一区域从第二图像中截取出来，获得第一区域的图像，并基于该第一区域的图像，生成样本图像，例如，对第一区域的图像做随机射影变换、随机光照变换等，获得样本图像。

进一步的，获得的样本图像可与已有的少量样本图像作为训练集，对平面物体检测网络模型进行训练，提高平面物体检测网络模型的鲁棒性。

本实施例中，获取第一图像，所述第一图像包括目标平面物体的第一显示平面；对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得；获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域；根据所述第一区域的图像，生成样本图像。可实现基于已有的第一图像，生成样本图像，降低了样本图像获取的成本，例如时间成本和人工成本，提高了样本图像获取的效率。

在本公开提供的一个实施例中，步骤101、获取第一图像，包括：

从图像数据集中获取所述第一图像，所述图像数据集包括所述第一图像和第三图像，所述第一图像和所述第三图像均包括所述目标平面物体的显示平面，所述第一图像中的显示平面与所述第三图像中的显示平面具有不同的姿态。

本公开提供的方法实现的目的是基于少量样本图像，生成更多样本图像，第一图像可为已有的少量样本图像中的图像。图像数据集包括少量样本图像，图像数据集中的图像可为标注好的图像，例如，对图像中的第一显示平面的顶点位置进行了标注。

对于同一个目标平面物体，图像数据集中有至少两张图像包括该目标平面物体的显示平面，且这至少两张图像包括的目标平面物体的显示平面具有不同的姿态，也就是说，图像数据集包括第一图像和第三图像，第一图像和第三图像均包括目标平面物体的显示平面，第一图像中的显示平面与第三图像中的显示平面具有不同的姿态，例如，不同的旋转角度和平移量。

将第一图像中的目标平面物体的显示平面称为第一显示平面，第一显示平面通过对目标平面物体进行拍摄获得，目标平面物体包括挂画、广告牌、招牌、海报等平面物体。进一步的，第三图像中的显示平面也可通过对目标平面物体进行拍摄获得。图像数据集中的图像都可视为第一图像，即在对图像数据集中的第三图像进行处理时，也可采用对第一图像进行处理的方式生成新的样本图像，使得基于图像数据集生成的样本图像具有多样性。

本实施例中，从图像数据集中获取所述第一图像，所述图像数据集包括所述第一图像和第三图像，所述第一图像和所述第三图像均包括所述目标平面物体的显示平面，所述第一图像中的显示平面与所述第三图像中的显示平面具有不同的姿态，可使得后续获得的样本图像具有多样性，从而在采用样本图像对平面物体检测网络模型进行训练时，可提高平面物体检测网络模型的鲁棒性。

在本公开提供的一个实施例中，所述第一图像还包括所述第一显示平面的第一顶点位置；

步骤102、对所述第一图像进行映射，获得包括第二显示平面的第二图像，包括如下步骤：

确定所述第一顶点位置映射到所述第二图像中的第二顶点位置；

根据所述第一顶点位置和所述第二顶点位置，确定所述第一显示平面从所述第一图像映射至所述第二图像的射影变换；

根据所述射影变换，对所述第一图像进行映射，获得包括所述第二显示平面的所述第二图像。

上述中，第一显示平面的顶点位置称为第一顶点位置，第一显示平面可以有多个第一顶点位置，例如图2a中，标识为A的第一显示平面具有四个第一顶点位置，进一步的。第一显示平面至少包括四个第一顶点位置。第一顶点位置可事先采用人工标注的方式标注出。

在本实施例中，将第一顶点位置映射到第二图像中的第二顶点位置，根据第一图像中的第一顶点位置和第二图像中的第二顶点位置，可求解获得第一图像与第二图像之间的射影变换。基于射影变换，将第一图像进行映射，获得第二图像，第二图像中的第二显示平面即是第一图像中的第一显示平面通过射影变换获得。

上述中，对第一显示平面的第一顶点位置进行映射，获得第二顶点位置，然后基于第一顶点位置和第二顶点位置获取射影变换，并根据射影变换对第一图像进行映射，获得第二图像。获得第二图像的过程计算简单，处理效率高，从而可提高后续获取样本图像的效率。

在本公开提供的一个实施例中，确定所述第一顶点位置映射到所述第二图像中的第二顶点位置，包括如下步骤：

根据所述第一顶点位置，获得所述第一顶点位置对应的三维空间位置；

根据所述三维空间位置，获得所述第一显示平面的长宽比；

根据所述长宽比与所述第一图像的尺寸大小，确定所述第一显示平面映射到所述第二图像中的尺寸大小；

根据所述第一显示平面映射到所述第二图像中的尺寸大小，确定所述第一显示平面映射到所述第二图像中的第二顶点位置。

以图2a所示为例，第一显示平面包括四个第一顶点位置，则分别计算出该四个第一顶点在三维空间的位置，计算方式本公开不做限定，例如，可用运动结构恢复(StructureFrom Motion，SFM)算法计算。每个第一顶点位置对应一个三维空间位置，四个第一顶点位置对应四个三维空间位置。根据四个三维空间位置，可计算获得第一显示平面的长宽比。根据长宽比与第一图像的尺寸大小，可确定第一显示平面映射到所述第二图像中的尺寸大小，即确定第二显示平面的大小。

例如，若长宽比为1：2，第一图像大小640×480，则可设置目标平面物体在正视图(即第二图像)里的长为150，宽为300，该尺寸即第二显示平面的尺寸，若将第二显示平面的中心位置与第二图像的中心位置重合，则中心点坐标为(x，y)＝(320，240)，第二显示平面左上角顶点坐标(即第二顶点位置)为(320-(150/2),240-(300/2))＝(245,90)，第二显示平面其他三个顶点坐标可采用相同方式获得。

本实施例中的确定第一顶点位置映射到第二图像中的第二顶点位置的过程，计算方式简单高效，可提高后续获取样本图像的效率。

在本公开提供的一个实施例中，步骤103、获取所述第二图像的第一区域，包括如下步骤：

以所述第二显示平面所在区域的边界为起始位置，朝背向所述第二显示平面所在区域的方向延伸，直到延伸至所述第二图像的边界，或者，延伸至所述第二图像中其他显示平面所在区域的边界，获得边界区域，所述第二显示平面位于所述边界区域的中间位置；

在所述边界区域内确定所述第一区域，所述第一区域包括所述第二显示平面所在区域，且大于所述第二显示平面所在区域。

上述中，第一区域在边界区域中选择，第一区域不能越过边界区域。第一区域包括第二显示平面所在区域，且第一区域大于所述第二显示平面所在区域，小于或等于边界区域。优选的，第二显示平面位于第一区域的中心位置。例如，第二显示平面的中心位置与第一区域的中心位置重合，且第二显示平面的各条边分别与第一区域的边平行。

第二显示平面位于边界区域的中间位置，中间位置可理解为第二显示平面所在的区域位于边界区域的中心位置，例如，第二显示平面的中心位置与边界区域的中心位置重合，且第二显示平面的各条边分别与边界区域的边平行。中间位置还可以理解为第二显示平面所在的区域位于边界区域的中心位置附近，例如，第二显示平面的中心位置与边界区域的中心位置之间的距离差小于预设阈值，且第二显示平面的各条边分别与边界区域的边平行。

如图2b所示，标号14所示的虚线框包围的区域为通过上述方式获取的边界区域，第一区域可在边界区域内随机选择，同时需要满足第一区域包括第二显示平面所在区域，且第一区域大于第二显示平面所在区域，同时第一区域不超出边界区域。

本实施例中，设置的边界区域中不包括其他显示平面，可避免获得的第一区域中有其他显示平面，从而减少生成的样本图像中其他显示平面造成的干扰，提高样本图像的可用性。

在本公开提供的一个实施例中，步骤104、根据所述第一区域的图像，生成样本图像，包括如下步骤：

获取所述第二图像中第一区域的图像；

对所述第一区域的图像进行随机射影变换，获得第一中间图像；

为所述第一中间图像添加预获取的背景图像，获得第二中间图像；

对所述第二中间图像进行随机光照变换，获得样本图像。

具体的，在确定第一区域后，可从第二图像中截取出第一区域，获得第一区域的图像(以下简称区域图像)，然后用随机射影变换对区域图像进行处理，获得第一中间图像，并将第一中间图像贴到预获取的随机背景图像中，获得第二中间图像；再对第二中间图像进行随机光照变换，随机光照变换可使用神经网络框架下的变换函数，在此不做限定，最终获得样本图像。

上述中，在确定第一区域之后，对第一区域的图像做随机射影变换、添加背景图像、进行随机光照变换等处理，以模拟现实场景，以获得多样性的样本图像，可提高平面物体检测网络模型的训练集中样本图像的场景覆盖率，最终提高平面物体检测网络模型的鲁棒性。

以下对本公开提供的样本图像生成方法进行举例说明。

本公开提供的样本图像生成方法可以基于少量标注过的数据(即第一图像)，生成更多的训练数据(即样本图像)，可降低训练数据集生成成本。

以下把人工采集、标注好的小数据集称为数据集S。把生成的、数量更大、变换更多的大数据集称为数据集L。

数据集S中的图像需要满足：同一个目标平面物体需要在数据集的至少两张图像中以不同的姿态出现，例如，旋转角度不同和/或平移量不同。

根据数据集S生成数据集L的过程如下：

对于数据集S中的每一张图像(即第一图像)，对目标平面物体在第一图像中的第一显示平面，利用求取的射影变换，将第一显示平面变成第二显示平面，第二显示平面为目标平面物体的正视图，值得说明的是，每个第一显示平面对应一个射影变换，根据该射影变换可将第一图像映射为第二图像。第一图像中的第一显示平面可采用人工标注的方式将第一显示平面的顶点位置标注出。

若第一图像里有n个第一显示平面，则会生成n张正视图(即第二图像)，即每个第一显示平面对应一张第二图像，n为正整数。

计算射影变换的过程如下：

计算一个目标平面物体在第一图像中被标注出的四个角点(即第一显示平面的四个顶角)在三维(3D)空间的位置。计算的方式比较多，在本公开中不做限定。可采用SFM算法计算相对位姿R(指旋转矩阵)和t(指平移向量)，再根据R、t以及第一显示平面的四个顶角位置，通过三角测量获得。

根据四个点在三维空间里的位置计算目标平面物体的长宽比。

根据长宽比和第一图像的大小，选定目标平面物体在正视图里的大小，从而计算得到目标平面物体在正视图里四个点的坐标(该坐标为二维坐标)。

例如，若长宽比为1：2，第一图像大小640×480，则可设置目标平面物体在正视图(即第二图像)里的长为150，宽为300，该尺寸即第二显示平面的尺寸，若将第二显示平面的中心位置与第二图像的中心位置重合，则中心点坐标为(x，y)＝(320，240)，第二显示平面左上角顶点坐标(即第二顶点位置)为(320-(150/2)),240-(300/2))＝(245,90)，第二显示平面其他三个顶点坐标可采用相同方式获得。

根据正视图里四个角点的坐标，以及第一显示平面标注出的对应四个角点的坐标，可求解得到第一图像和第二图像之间的射影变换。射影变换自由度为8，可由四个任意三点不共线的点求解得到。

对于每个目标平面物体的第一显示平面，都可采用上述计算方式来获得对应的射影变换。

确定正视图中第一区域的取值范围。第一区域包括第二显示平面所在区域，第一区域大于第二显示平面所在区域，且小于或等于边界区域。

在上述例子中，第二显示平面所在的区域为由(245，90)、(245，390)、(395，390)、(395，90)四个角点组成的矩形区域。

边界区域可以是以第二显示平面所在区域为中心，向外扩大矩形范围，直到达到图像边界、或是接触到另一个平面物体为止的最大区域，具体可参见图2b相关记载。

随机在第一区域的取值范围内选择一个区域，用随机射影变换对这个区域做变换，并贴到随机背景图片上，并加上随机光照变换(可使用神经网络框架下的变换函数，比如pytorch里的transforms.ColorJitter)，获得样本图像。上述随机生成样本图像的过程可以离线完成，也可以在线完成。

上述过程可以用少量标注过的数据，自动生成更多的训练数据，训练获得鲁棒的平面物体检测网络模型，降低了训练数据集生成成本。

参见图3，图3是本公开实施例提供的样本图像生成装置的结构图，如图3所示，本实施例提供一种样本图像生成装置300，由电子设备执行，包括：

第一获取模块301，用于获取第一图像，所述第一图像包括目标平面物体的第一显示平面；

映射模块302，用于对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得；

第二获取模块303，用于获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域；

生成模块304，用于根据所述第一区域的图像，生成样本图像。

进一步的，所述第一获取模块，包括：

第一获取子模块，用于以所述第二显示平面所在区域的边界为起始位置，朝背向所述第二显示平面所在区域的方向延伸，直到延伸至所述第二图像的边界，或者，延伸至所述第二图像中其他显示平面所在区域的边界，获得所述边界区域，所述第二显示平面位于所述边界区域的中间位置；

第一确定子模块，用于在所述边界区域内确定所述第一区域，所述第一区域包括所述第二显示平面所在区域，且大于所述第二显示平面所在区域。

进一步的，所述第一图像还包括所述第一显示平面的第一顶点位置；

所述映射模块302，包括：

第二确定子模块，用于确定所述第一顶点位置映射到所述第二图像中的第二顶点位置；

第三确定子模块，用于根据所述第一顶点位置和所述第二顶点位置，确定所述第一显示平面从所述第一图像映射至所述第二图像的射影变换；

映射子模块，用于根据所述射影变换，对所述第一图像进行映射，获得包括所述第二显示平面的所述第二图像。

进一步的，所述第二确定子模块，包括：

第一获取单元，用于根据所述第一顶点位置，获得所述第一顶点位置对应的三维空间位置；

第二获取单元，用于根据所述三维空间位置，获得所述第一显示平面的长宽比；

第一确定单元，用于根据所述长宽比与所述第一图像的尺寸大小，确定所述第一显示平面映射到所述第二图像中的尺寸大小；

第二确定单元，用于根据所述第一显示平面映射到所述第二图像中的尺寸大小，确定所述第一显示平面映射到所述第二图像中的第二顶点位置。

进一步的，所述第一获取模块301，用于：

进一步的，所述生成模块304，包括：

第二获取子模块，用于获取所述第二图像中第一区域的图像；

第三获取子模块，用于对所述第一区域的图像进行随机射影变换，获得第一中间图像；

第四获取子模块，用于为所述第一中间图像添加预获取的背景图像，获得第二中间图像；

第五获取子模块，用于对所述第二中间图像进行随机光照变换，获得样本图像。

本公开实施例的样本图像生成装置300，获取第一图像，所述第一图像包括目标平面物体的第一显示平面；对所述第一图像进行映射，获得包括第二显示平面的第二图像，所述第二图像为所述目标平面物体的正视图，所述第二显示平面由所述第一显示平面映射在所述第二图像获得；获取所述第二图像的第一区域，所述第一区域包括所述第二显示平面所在区域，且所述第一区域大于所述第二显示平面所在区域；根据所述第一区域的图像，生成样本图像。可实现基于已有的第一图像，生成样本图像，降低了样本图像获取的时间成本和人工成本，提高了样本图像获取的效率。

根据本公开的实施例，本公开还提供了一种电子设备、计算机程序产品和一种可读存储介质。

图4示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图4所示，设备400包括计算单元401，其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序，来执行各种适当的动作和处理。在RAM 403中，还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

设备400中的多个部件连接至I/O接口405，包括：输入单元406，例如键盘、鼠标等；输出单元407，例如各种类型的显示器、扬声器等；存储单元408，例如磁盘、光盘等；以及通信单元409，例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理，例如样本图像生成方法。例如，在一些实施例中，样本图像生成方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元404。在一些实施例中，计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM 403并由计算单元401执行时，可以执行上文描述的样本图像生成方法的一个或多个步骤。备选地，在其他实施例中，计算单元401可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行样本图像生成方法。

本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物体主机与VPS服务(“VirtualPrivate Server”,或简称“VPS”)中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式***的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种样本图像生成方法，包括：

根据所述第一区域的图像，生成样本图像；

其中，所述第一图像还包括所述第一显示平面的第一顶点位置；

所述对所述第一图像进行映射，获得包括第二显示平面的第二图像，包括：

2.根据权利要求1所述的方法，其中，所述获取所述第二图像的第一区域，包括：

3.根据权利要求1所述的方法，其中，所述确定所述第一顶点位置映射到所述第二图像中的第二顶点位置，包括：

根据所述三维空间位置，获得所述第一显示平面的长宽比；

4.根据权利要求1所述的方法，其中，所述获取第一图像，包括：

5.根据权利要求1所述的方法，其中，所述根据所述第一区域的图像，生成样本图像，包括：

获取所述第二图像中第一区域的图像；

对所述第二中间图像进行随机光照变换，获得样本图像。

6.一种样本图像生成装置，包括：

生成模块，用于根据所述第一区域的图像，生成样本图像；

所述映射模块，包括：

7.根据权利要求6所述的装置，其中，所述第一获取模块，包括：

第一获取子模块，用于以所述第二显示平面所在区域的边界为起始位置，朝背向所述第二显示平面所在区域的方向延伸，直到延伸至所述第二图像的边界，或者，延伸至所述第二图像中其他显示平面所在区域的边界，获得边界区域，所述第二显示平面位于所述边界区域的中间位置；

8.根据权利要求6所述的装置，其中，所述第二确定子模块，包括：

9.根据权利要求6所述的装置，其中，所述第一获取模块，用于：

10.根据权利要求6所述的装置，其中，所述生成模块，包括：

11.一种电子设备，其中，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的方法。