CN117474785B

CN117474785B - 一种多个人物姿态图像合成一个图像的方法

Info

Publication number: CN117474785B
Application number: CN202311817945.8A
Authority: CN
Inventors: 凌靖; 汝乐; 陈来松
Original assignee: Jiangsu Austin Photoelectric Technology Co ltd
Current assignee: Jiangsu Austin Photoelectric Technology Co ltd
Priority date: 2023-12-27
Filing date: 2023-12-27
Publication date: 2024-05-10
Anticipated expiration: 2043-12-27
Also published as: CN117474785A

Abstract

本发明公开了一种多个人物姿态图像合成一个图像的方法，所述人物姿态图像是指单个人物模仿模板中的人物姿态后得到的待合成人物姿态图像，所述模板中包括多个人物姿态；具体方法包括如下步骤：步骤1，获取模板中的各个人物姿态以及所在模板图像中的位置；步骤2，获取待合成人物姿态图像中的人物姿态；步骤3，将待合成人物姿态与模板中每个人物姿态作对比，找出模板中与待合成人物姿态最相似的人物姿态，并使用所述待合成人物图像替换模板中所述最相似的人物图像；重复步骤3，使用每一个待合成人物图像替换模板中与其姿态最相似的人物图像，得到合成后的图像OUT1。且进一步的对合成图像整体进行亮度、饱和度的一致化。

Description

一种多个人物姿态图像合成一个图像的方法

技术领域

本发明属于图像处理技术领域，尤其涉及一种多个人物姿态图像合成一个图像的方法。

背景技术

在很多分布式场合，例如网络会议、远程同步的同学会上，需要各自作出一个姿态，然后合成出一个完整的图像作为纪念。现有的方案是各自在图像中划置出一个指定大小的框，各自单独显示，这些方案没有把所有人融合成一个整体，缺乏团体效果，显得单调。如果在全国范围内，几位朋友各自模仿模板中的一个人物姿态，再各自拍摄成人物姿态图像，需要把他们各自的人物姿态图像合成到一个图像中，形成更加有气氛、更加有团建效果的图像。例如，如图1所示，模板图像ImMP1中包括了模板人物MP1和模板人物MP2，模板人物的姿态为一人伸出左臂，一人伸出右臂，活动参与人员分别模仿模板人物的姿态，一人模仿模板人物MP1的姿态，得到待合成人物HP1的姿态图像，另一个人模仿模板人物MP2的姿态，得到待合成人物HP2的姿态图像；把两人各自单独的姿态图像按模板中姿态排列的方式合成一个整体图像。

发明内容

本发明基于现有数据处理技术、人工智能技术，提出了一种多个人物姿态图像合成一个图像的方法，把所有人待合成的人物姿态从图像中提取出来，再把各个待合成的人物姿态匹配上模板中对应姿态的人物区域、调整角度、大小，并调整整体的亮度、明度，从而合成出一个整体的图像。

本发明提出的一种多个人物姿态图像合成一个图像的方法，所述人物姿态图像是指单个人物模仿模板中的人物姿态后得到的待合成人物姿态图像，所述模板中包括多个人物姿态；所述方法包括如下步骤：

步骤1，获取模板中的各个人物姿态以及所在模板图像中的位置；

步骤2，获取待合成人物姿态图像中的人物姿态；

步骤3，将待合成人物姿态与模板中每个人物姿态作对比，找出模板中与待合成人物姿态最相似的人物姿态，并使用所述待合成人物姿态图像替换模板中与其姿态最相似的人物图像；

步骤4，重复步骤3，使用每一个待合成人物姿态图像替换模板中与其姿态最相似的人物图像，得到合成后的图像OUT1。

进一步的，步骤1中获取模板中的各个人物姿态所在区域以及姿态，包括如下步骤：

步骤1.1，将模板图像转化成人物骨骼图，提取人物骨骼图中各人物骨骼关键点；

采用OpenPose方法，将模板图像ImMP1转换成为骨骼图像ImMP2，模板中每个人物骨骼图像采用SKMP(mpi)表示，其中mpi的范围是从1到mpn，mpn表示骨骼图像ImMP2中共有mpn个人物骨骼图像，

模板中第mpi个人物的骨骼关键点坐标表示为SKMP(mpi,ski)，ski是骨骼点的编号，ski的取值范围是1~18；

所述关键点包括鼻子、脖颈、右肩、右肘、右手、左肩、左肘、左手、右髋、右膝、右脚、左髋、左膝、左脚、右眼、左眼、右耳、左耳；

步骤1.2，获取模板中每个人物的最小外包络圆，第mpi个人物的最小外包络圆表示为SKMPC(mpi)={x,y,r}，其中x,y是外包络圆圆心的坐标，r是半径；

步骤1.3，设置参考半径r_ref，将模板中所有人物骨骼图像进行缩放，使得缩放后的人物骨骼图像的最小外包络圆半径均为r_ref；

具体为，找出mpn个外包络圆SKMPC(mpi)中半径r最大的外包络圆，记为r_mpmax，参考半径rref等于r_mpmax；

步骤1.4，将缩放后的人物骨骼图像投影到笛卡尔坐标系中，第mpi个人物的第ski个骨骼关键点坐标表示为mpux(mpi,ski)、mpuy(mpi,ski)。

进一步的，步骤2中获取待合成人物姿态图像的人物姿态，具体包括如下步骤：

步骤2.1，采用OpenPose方法将待合成人物姿态图像ImHP1(hpimg)转换成为骨骼图像ImHP2(hpimg)，其中ImHP1(hpimg)是指第hpimg个待合成人物姿态图像；所述待合成人物姿态图像ImHP1(hpimg)中包含一个模仿模板中人物姿态的目标人物；

步骤2.2，获取待合成人物骨骼图像中目标人物的最小外包络圆；

步骤2.3，对目标人物骨骼图像进行缩放，使得缩放后的目标人物骨骼图像的最小外包络圆半径均为r_ref；

步骤2.4，将缩放后的目标人物骨骼图像投影到笛卡尔坐标系中，待合成人物姿态图像ImHP1(hpimg)中目标人物骨骼关键点坐标表示为hpux(hpimg,ski)、hpuy(hpimg,ski)。

进一步的，在步骤2中，当待合成人物姿态图像ImHP1(hpimg)中不仅包含模仿模板中人物姿态的目标人物，还包含了干扰人物时，寻找合成图像ImHP1(hpimg)中的目标人物，方法如下：

设待合成人物姿态图像ImHP1(hpimg)中包括hpi个人物，其中只有一个为目标人物；获取待合成人物骨骼图像ImHP2(hpimg)中每个人物骨骼图像的最小外包络圆，共有hpi个包络圆；在hpi个包络圆中，半径最大的包络圆对应的人物就是待合成的目标人物。

进一步的，步骤3中将待合成人物姿态与模板中每个人物姿态作对比，找出模板中与待合成人物姿态最相似的人物姿态，并使用所述待合成人物姿态图像替换模板中与其姿态最相似的人物图像，具体包括如下步骤：

步骤3.1，将每个待合成人物姿态图像ImHP1(hpimg)中目标人物骨骼关键点坐标排列成行，得到待合成人物骨骼特征行，记为SKHPF(hpimg)={ hpux(hpimg,1), hpuy(hpimg,1), hpux(hpimg,2), hpuy(hpimg,2),…, hpux(hpimg,18), hpuy(hpimg,18)}，再转置成列，得到待合成人物的骨骼特征列；

步骤3.2，对待合成人物的骨骼特征列进行theta角旋转，得到骨骼特征SKHPF(hpimg, theta)；theta取值范围是1~360度，分辨率为1度；

步骤3.3，在不同的theta旋转后，计算矩阵：

；

步骤3.4，找出矩阵的最大值，记为M2_SMH(mpi, hpimg)，及其对应的theta角，记为theta1_hpimg；

步骤3.5，在矩阵M2_SMH(mpi, hpimg)的hpimg列中找出最大值，所述最大值对应的行号mpi，就是最相似的人物姿态；从而找出每个待合成人物姿态在模板中对应的人物姿态及位置；

步骤3.6，将待合成人物姿态图像ImHP1(hpimg)中目标人物旋转theta1_hpimg角后，替换模板中对应的最相似人物图像。

进一步的，步骤3.6中将待合成人物姿态图像ImHP1(hpimg)中目标人物图像旋转theta1_hpimg角后，替换模板中对应的最相似人物图像，具体包括如下步骤：

步骤3.6.1，从待合成人物姿态图像ImHP1(hpimg)中提取目标人物图像；以及从模板中删除与所述目标人物对应的最相似人物图像；

步骤3.6.2，对模板中删除的图像部分进行背景填充；

步骤3.6.3，对提取的目标人物图像进行缩放，使得缩放后目标人物骨骼图像的最小外包络圆半径，与提取的模板中最相似人物图像的外包络圆半径相同；

步骤3.6.4，将缩放后的目标人物图像旋转theta1_hpimg角后，放在模板中对应的最相似人物图像所在区域。

进一步的，采用无监督生成对抗网络对所述合成后的图像OUT1进行风格调整，采用的损失函数为：

其中，MT是图OUT1的总长，NT是图像OUT1的总宽，mi是长度方向的第mi个像素，ni是宽度方向的第ni个像素；合成图像OUT1输入到所述无监督生成对抗网络后再不断调整后生成新图像OUT2。S_OUT2是图像OUT2的HSV空间图像中的饱和度分量，V_OUT2是图像OUT2的HSV空间图像中的明度分量。S_ImMP1是模板图像ImMP1的HSV空间图像中的饱和度分量，V_ImMP1是模板图像ImMP1的HSV空间图像中的明度分量。

有益效果：本发明的一种多个人物姿态图像合成一个图像的方法，提取出模板中人物姿态、待合成人物姿态，找出模板中与待合成人物姿态最相似的人物，把待合成人物放置到模板中的对应区域，实现了将每个单独的人物姿态图像依模板融合成一张群体图像，且进一步的对合成图像整体进行亮度、饱和度的一致化。

与现在技术相比，本发明在合成的过程中，进行了目标人物定位、判断大小尺寸等，解决了从多人中提取目标人物、角度旋转、与模板中人物大小不一等问题。同时，现有的AI合成技术主要面向的是单张图像，而本发明解决了多张合成的合成内容定义问题。

附图说明

图1是本发明实施例的模板图像和待合成图像的关系示意图；

图2是本发明实施例的整体流程示意图；

图3是本发明实施例的最小外包络圆的示意图；

图4是本发明实施例的步骤2中从3维降2维的关系示意图。

具体实施方式

如图2所示，本发明的一种多个人物姿态图像合成一个图像的方法主要包括4个步骤：

步骤1，对模板图像进行人物区域提取和姿态提取，对待合成人物进行姿态提取。

步骤1.1，对模板中人物区域进行提取；

工作目标是提取出模板中每个人物所在的区域、计算每个人物所在区域的中心位置、尺寸大小，模板中每个人物的姿态 (MPA)。

步骤1.1.1，采用OpenPose方法，将模板图像ImMP1转换成为骨骼图ImMP2。

其中，OpenPose是美国***梅隆大学（CMU）基于卷积神经网络和监督学习并以Caffe为框架开发的人体姿态识别算法开源库，其说明和源代码可见网址（https://github.com/CMU-Perceptual-Computing-Lab/openpose）。

骨骼图像ImMP2包含有模板中所有人物的骨骼信息，假设模板中有mpn个人物骨骼图，每个人物骨骼图像表示为SKMP(mpi)，其中mpi表示人物骨骼图像的编号，mpi的范围是从1到mpn。每个SKMP(mpi)都是无背景的18个点标准的骨骼数据SKMP(mpi,ski)。其中，ski是骨骼点的编号，ski的取值范围是1~18。18个骨骼点编号分别对应身体的18个关键点，每个关键点有在骨骼图像ImMP2上的坐标x和y坐标记为ImMP2x(mpi, mki)、ImMP2y(mpi,mki)；ImMP2x(mpi, mki)、ImMP2y(mpi, mki)表示模板中第mpi个人物的第mki个关键点的坐标。

18个关键点在物理意义上依次为：鼻子、脖颈、右肩、右肘、右手、左肩、左肘、左手、右髋、右膝、右脚、左髋、左膝、左脚、右眼、左眼、右耳、左耳。

步骤1.1.2，如图3所示，以最小外包络圆，而非常见类似于YOLO方案中的IOU方案，对模板中每个人物骨骼图SKMP(mpi)进行区域提取区域，具体是采用达芬奇人体骨骼图的方案，寻找到每个人物姿态的核心区域。该步骤执行后得到mpi个包络圆，每个包络圆表示为SKMPC(mpi)={x,y,r}，其中x,y是外包络圆圆心的坐标，r是半径，也就是该区域的尺寸大小。

步骤1.1.3，找出mpn个包络图半径r中的最大值，记为r_mpmax，对模板中所有的人物骨骼图SKMP(mpi)进行比例放大，使得放大后模板中每个人物的外包络图的半径均为r_mpmax。

步骤1.1.4，然后，把每个人物姿态的最小外包络圆中的骨骼图投影到单独的新的笛卡尔坐标系中，得到mpi个大小一致的骨骼数据SKMPU(mpi)，统一大小后的第mpi个人物的第ski个骨骼关键点的坐标SKMPU(mpi, ski) ={mupx,mpuy}；第mpi个人物的第ski个骨骼关键点的坐标ux和uy也可以写成mpux(mpi,ski)、mpuy(mpi,ski)。

步骤1.1.5，把模板中每个人物的骨骼关键点坐标mpux(mpi,ski)、mpuy(mpi,ski)排列成一个行，得到模板中每个人物(MP)的骨骼特征行SKMPF(mpi)={ mpux(mpi,1), mpuy(mpi,1), mpux(mpi,2), mpuy(mpi,2),…, mpux(mpi,18), mpuy(mpi,18)}，SKMPF(mpi)本质上是反映了模板中每个人物的姿态 (MPA)。

步骤1.2，对待合成人物姿态图像进行人物区域提取；

该部分的工作目标是提取出待合成人物(HP)区域，计算区域的中心位置、尺寸大小，待合成人物的姿态 (HPA)。

步骤1.2.1 与步骤1.1.1一样，采用OpenPose方法将待合成人物姿态图像ImHP1(hpimg)转换成为骨骼数据ImHP2(hpimg)，hpimg是第hpimg个待合成人物姿态图像。需要注意的是，待合成人物姿态图像ImHP1(hpimg)中有hpi个人物，hpi大于等于1，也就是说待合成人物姿态图像ImHP1(hpimg)中不仅包含模仿模板中姿态的目标人物，还有可能包含了干扰人物，干扰人物不对模板中的姿态进行模仿。

步骤1.2.2，与步骤1.1.2一样，以最小外包络圆的方式，得到一组包络圆SKHPC(hpi)={x,y,r}，其中x,y是包络圆的圆心位置，r是包络图半径，表示了包络圆所在区域的尺寸大小。

步骤1.2.3，比较待合成人物姿态图像ImHP1(hpimg)中hpi 个包络圆的半径r，找出最大半径r_hpmax，最大半径的包络圆对应的人物就是待合成的目标人物，然后，将目标人物骨骼图的尺寸进行放大，使得待合成人物姿态图像ImHP1(hpimg)中目标人物外包络图的半径等于步骤1.1.3中的尺寸r_mpmax。

步骤1.2.4，将待合成人物姿态图像ImHP1(hpimg)中目标人物骨骼图投影到一个单独的新的笛卡尔坐标系中，得到统一大小过后的骨骼图SKHPU(hpi)，这样就得到第hpimg个待合成人物姿态图像，统一大小过后，待合成人物姿态图像ImHP1(hpimg)中目标人物骨骼关键点的坐标SKHPU(hpimg,ski) ={ux,uy}，待合成人物姿态图像ImHP1(hpimg)中目标人物骨骼关键点坐标hpux和hpuy也可以写成hpux(hpimg,ski)、hpuy(hpimg,ski)。

步骤1.2.5，重复步骤1.2.1-1.2.4，得到所有待合成人物姿态图像ImHP1(hpimg)的hpimg 的统一大小后的骨骼点坐标SKHPU(hpimg,ski)。

步骤1.2.6，把每个待合成人物的骨骼坐标hpux(hpimg,ski)、hpuy(hpimg,ski)排列成一行，得到每个待合成人物(HP)的骨骼特征行SKHPF(hpimg)={ hpux(hpimg,1), hpuy(hpimg,1), hpux(hpimg,2), hpuy(hpimg,2),…, hpux(hpimg,18), hpuy(hpimg,18)}，SKHPF(hpimg)从本质上反映了每个待合成人物HP的其姿态 (HPA)。

步骤2，分析出MPA和HPA的在所有旋转角度下的相似性；

该部分的工作目的是自动分析出每个待合成人物姿态HPA和模板中每个人物姿态MPA的相似程度，从而判断出每个待合成人物姿态图像应该放置到模板中哪个人物姿态的位置上。其中，为了防止相同的姿态，由于拍摄角度的不同，出现旋转角度的偏差，所以在本具体实施方式中把每个待合成人物姿态HPA的图像进行不同角度的旋转，然后在经过不同的旋转角度后的图像找到最大的相似关系。其具体的方案是：

把待合成人物的骨骼特征行SKHPF(hpimg)转置成列，并进行theta角旋转，得到经theta旋转角旋转的待合成人物的骨骼特征SKHPF(hpimg, theta)，把模板中每个人物的SKMPF(mpi)和SKHPF(hpimg, theta)相乘，得到三维矩阵M1_SMH(mpi, hpimg, theta)，写作：

M1_SMH(mpi, hpimg, theta)= SKMPF(mpi)* SKHPF(hpimg, theta) ；

其中，theta取值范围是1~360度，分辨率为1度。

那么三维矩阵M1_SMH(mpi, hpimg, theta)从theta维度看是360层，每层是一个在固定theta角度下的M1_SMH(mpi, hpimg,theta)，例如旋转角为1度时，就是M1_SMH(mpi,hpimg,1)；然后，在不同的theta下，计算矩阵SMH(mpi, hpimg)。

SMH(mpi, hpimg)= mpux(mpi,ski), mpuy(mpi,ski)

矩阵SMH(mpi, hpimg)表示模板中人物MP的骨骼点x坐标和每个待合成人物姿态的骨骼点的x坐标相乘，每个模板中人物MP的骨骼点y坐标和每个待合成人物姿态的骨骼点的y坐标相乘，然后相加。这样，就得到一个关系矩阵SMH(mpi, hpimg)。关系矩阵SMH(mpi,hpimg)是三维矩阵M1_SMH(mpi, hpimg, theta)中的一层。

如图4所示，然后，寻找不同角度中的矩阵SMH(mpi, hpimg)的最大值，其数学内容就是进行降维，从3维降到2维，对每一个相同位置(mpi, hpimg)的而言，在360个theta值中，取最大值的那个，形成2维的相关度矩阵M2_SMH(mpi, hpimg)，因为最大值对应一个mpi和hpimg在该角度的角度相关性最大，并记下这个角度，形成角度值矩阵Theta1(mpi,hpimg)矩阵，这个矩阵是2维的。

然后，在这个关系矩阵M2_SMH(mpi, hpimg)中，每一列()中找出最大值，其对应的行号(mpi)，就是最相似姿态，从而判断出每个待合成人物姿态图像应该放置到模板中哪个人物的位置上，即对应关系式mpi=OP(hpimg)，并从Theta1(mpi, hpimg)矩阵中把那个最大值的位置对应的角度值挑选出来，形成角度值矩阵Theta2(mpi, hpimg)矩阵，这个矩阵是1维的，它的含义是，把待合成人物姿态图像放置到模板中对应人物姿态位置前，需要旋转的角度。

步骤3，图像合成；

该步骤的工作主要有3个，一个是对待合成人物姿态图像人物部分(HPImg)、模板中人物姿态图像(MPImg)部分进行提取；二是对模板中原有的人物姿态图像(MPImg)提取后，填充其背景；三是把待合成人物姿态图像人物部分HPImg放大旋转后移植到模板中人物姿态图像MPImg部分。

步骤3.1，图像提取；

对于人物图像提取部分，本发明采用的是文献[1]（Achanta R , Shaji A ,Smith K ,et al. SLIC Superpixels Compared to State-of-the-Art SuperpixelMethods[J].IEEE Transactions on Software Engineering, 2012, 34(11).DOI:10.1109/TPAMI.2012.120.）中的提取方案；

通过文献[1]提出的方法，本发明可以把每个hpimg对应待合成人物姿态图像人物部分HPImg(hpimg)，和mpi对应的模板中人物姿态图像MPImg(mpi)提取出来，但是这两个图像在轮廓上是有不同的，所以不能直接替代，需要把模板中提取人物姿态后的背景填充好，再替代，从而防止由于模板人物和待合成人物轮廓不一致导致边界出现问题。

步骤3.2，背景填充；

对于背景填充问题，本发明采用的是文献[2]（张恒志. 基于图像结构和注意力机制的图像填充算法的研究与应用[D].太原科技大学,2022.DOI:10.27721/d.cnki.gyzjc.2022.000229）中的填充方案。通过文献[2]提出的方案，本发明把每个mpi对应的模板中人物姿态图像MPImg(mpi)提取出来后，在原先的地方，填充好一个与背景风格统一的背景图像。

步骤3.3，替代；

利用在步骤2、3中提取的最小外包络圆的半径，把每个hpimg对应图像HPImg(hpimg)调整到时模板中其对应的人物姿态图像MPImg(mpi)的大小，例如原先HPImg(hpimg) 最小外包络圆的半径是100、MPImg(mpi) 最小外包络圆的半径是200的话，那么就是放大到200，这样其HPImg(hpimg)整体就是放大2倍。

然后，按照步骤2的内容，把HPImg(hpimg)图像按照Theta2(mpi, hpimg)矩阵对应的角度进行旋转。

然后把HPImg(hpimg)中心值放到MPImg(mpi)的中心值的位置；这样就得到了初步的合成图像OUT1。

步骤4，对成的图像的整体风格进行一致性调整；

上面的步骤已经是实现了内容的合成，但是由于待合成的图像和模板的多个图像之间是在不同拍摄条件下拍摄的，所以无论是饱和度、亮度等细节上，有着很大的差异，因此需要把整体风格进行调整。这里，采用的是无监督生成对抗网络的方式，整体的网络结构采用的是文献[3] (A multi-stage underwater image aesthetic enhancementalgorithm based on a generative adversarial network. https://doi.org/10.1016/j.engappai.2023.106196.)中的网络框架，对其中的损失函数进行了修改，将其判别器的损失函数修改为：

其中MT是图像的总长，NT是图像的总宽，mi是长方向的第mi个像素，ni是宽方向的第ni个像素。OUT2是第3步合成图像OUT1输入到生成网络后不断调整后生成的新图像。S_OUT2是图像OUT2的HSV空间图像中的饱和度分量，V_OUT2是图像OUT2的HSV空间图像中的明度分量。S_ImMP1是第1.1.1步模板图像ImMP1的HSV空间图像中的饱和度分量，V_ ImMP1是第1.1.1.步模板图像ImMP1的HSV空间图像中的明度分量。该损失函数的作用就是通过生成对抗网络，不断调整输出图像OUT2，使得OUT2在明度和饱和度上，与原先的模板图像相似，而不管内容细节，从而达到在饱和度、明度上的一致性。

这样，通过实现本发明，在基于模板图像，可以把所有的人的姿态提取出来，自动把各个待合成人物的姿态图像匹配上模板的对应的姿态的位置，调整角度、大小，并调整好整体的亮度、明度，从而合成出一个整体的图像，形成一个更加有气势、更加有团建效果的图像。

本发明方法面向用户的操作流程是：

[1].用户选择好模板图像，模板图像内容包括多个人物姿态，以及一个共同的宣传背景；保证模板中人物数量与目标人物数量一致。

[2].用户按模板中人物姿态进行模仿，得到多张待合成的人物姿态图像，所述待合成的人物姿态图像中存在干扰人物情况下，目标人物在图像中所占的面积为最大。如果有10个人物被合成到背景中，那么就需要10张各包含有1个目标人物的图像。

[3].合成图像后输出。

Claims

1.一种多个人物姿态图像合成一个图像的方法，其特征在于，所述人物姿态图像是指单个人物模仿模板中的人物姿态后得到的待合成人物姿态图像，所述模板中包括多个人物姿态；所述方法包括如下步骤：

步骤2，获取待合成人物姿态图像中的人物姿态；

步骤3，将待合成人物姿态与模板中每个人物姿态作对比，找出模板中与待合成人物姿态最相似的人物姿态，并使用所述待合成人物图像替换模板中所述最相似的人物图像；

步骤4，重复步骤3，使用每一个待合成人物图像替换模板中与其姿态最相似的人物图像，得到合成后的图像OUT1。

2.根据权利要求1所述一种多个人物姿态图像合成一个图像的方法，其特征在于，步骤1中获取模板中的各个人物姿态所在区域以及姿态，包括如下步骤：

将模板图像ImMP1转换成为骨骼图像ImMP2，模板中每个人物骨骼图像采用SKMP(mpi)表示，其中mpi的范围是从1到mpn，mpn表示骨骼图像ImMP2中共有mpn个人物骨骼图像，

模板中第mpi个人物的骨骼关键点坐标表示为SKMP(mpi,ski)，ski是骨骼点的编号，ski的取值范围是1～18；

步骤1.2，获取模板图像中每个人物的最小外包络圆，第mpi个人物的最小外包络圆表示为SKMPC(mpi)＝{x,y,r}，其中x,y是外包络圆圆心的坐标，r是半径；

步骤1.3，设置参考半径r_ref，将模板图像中所有人物骨骼图像进行缩放，使得缩放后的人物骨骼图像的最小外包络圆半径均为r_ref；

3.根据权利要求2所述一种多个人物姿态图像合成一个图像的方法，其特征在于，步骤1.1中所述关键点包括鼻子、脖颈、右肩、右肘、右手、左肩、左肘、左手、右髋、右膝、右脚、左髋、左膝、左脚、右眼、左眼、右耳、左耳。

4.根据权利要求2所述一种多个人物姿态图像合成一个图像的方法，其特征在于，找出mpn个外包络圆SKMPC(mpi)中半径r最大的外包络圆，记为r_mpmax，参考半径r_ref等于r_mpmax。

5.根据权利要求2所述一种多个人物姿态图像合成一个图像的方法，其特征在于，步骤2中获取待合成人物姿态图像的人物姿态，具体包括如下步骤：

步骤2.1，将待合成人物姿态图像ImHP1(hpimg)转换成为骨骼图像ImHP2(hpimg)，其中ImHP1(hpimg)是指第hpimg个待合成人物姿态图像；所述待合成人物姿态图像ImHP1(hpimg)中包含一个模仿模板中人物姿态的目标人物；

6.根据权利要求5所述一种多个人物姿态图像合成一个图像的方法，其特征在于，在步骤2中，当待合成人物姿态图像ImHP1(hpimg)中不仅包含模仿模板中人物姿态的目标人物，还包含了干扰人物时，寻找合成图像ImHP1(hpimg)中的目标人物，方法如下：

7.根据权利要求5所述一种多个人物姿态图像合成一个图像的方法，其特征在于，步骤3中将待合成人物姿态与模板中每个人物姿态作对比，找出模板中与待合成人物姿态最相似的人物姿态，并使用所述待合成人物图像替换模板中所述最相似的人物图像，具体包括如下步骤：

步骤3.1，将每个待合成人物姿态图像ImHP1(hpimg)中目标人物骨骼关键点坐标排列成行，得到待合成人物骨骼特征行，记为SKHPF(hpimg)＝{hpux(hpimg,1),hpuy(hpimg,1),hpux(hpimg,2),hpuy(hpimg,2),…,hpux(hpimg,18),hpuy(hpimg,18)}，再转置成列，得到待合成人物的骨骼特征列；

步骤3.2，对待合成人物的骨骼特征列进行theta角旋转，得到骨骼特征SKHPF(hpimg,theta)；theta取值范围是1～360度，分辨率为1度；

步骤3.3，在不同的theta旋转后，计算矩阵SMH(mpi,hpimg)：

步骤3.4，找出矩阵SMH(mpi,hpimg)的最大值，记为M2_SMH(mpi,hpimg)，及其对应的theta角，记为theta1_hpimg；

步骤3.5，在矩阵M2_SMH(mpi,hpimg)的hpimg列中找出最大值，所述最大值对应的行号mpi，就是最相似的人物姿态；从而找出每个待合成人物姿态在模板中对应的人物姿态及位置；

8.根据权利要求7所述一种多个人物姿态图像合成一个图像的方法，其特征在于，步骤3.6中将待合成人物姿态图像ImHP1(hpimg)中目标人物图像旋转theta1_hpimg角后，替换模板中对应的最相似人物图像，具体包括如下步骤：

步骤3.6.2，对模板中删除的图像部分进行背景填充；

9.根据权利要求1所述一种多个人物姿态图像合成一个图像的方法，其特征在于，采用无监督生成对抗网络对所述合成后的图像OUT1进行风格调整，采用的损失函数为：

其中，MT是图OUT1的总长，NT是图像OUT1的总宽，mi是长度方向的第mi个像素，ni是宽度方向的第ni个像素；合成图像OUT1输入到所述无监督生成对抗网络后再不断调整后生成新图像OUT2；S_OUT2是图像OUT2的HSV空间图像中的饱和度分量，V_OUT2是图像OUT2的HSV空间图像中的明度分量；S_ImMP1是模板图像ImMP1的HSV空间图像中的饱和度分量，V_ImMP1是模板图像ImMP1的HSV空间图像中的明度分量。