CN113194254A

CN113194254A - 图像拍摄方法及装置、电子设备和存储介质

Info

Publication number: CN113194254A
Application number: CN202110467998.6A
Authority: CN
Inventors: 徐伟伟; 黄岗桂; 谢东明; 王家园
Original assignee: Shanghai Sensetime Intelligent Technology Co Ltd
Current assignee: Shanghai Sensetime Intelligent Technology Co Ltd
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-07-30
Also published as: KR20220149503A; WO2022227393A1

Abstract

本公开涉及一种图像拍摄方法及装置、电子设备和存储介质，所述方法包括：获取与拍摄界面对应的场景图像；对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态；对场景图像进行人体关键点检测，确定场景图像中的对象以及对象的真实人体姿态；在拍摄界面中显示真实人体姿态以及推荐人体姿态，以引导对象根据推荐人体姿态进行姿态调整；在满足拍摄条件的情况下，得到对象的拍摄图像。本公开实施例可实现有效提高图像拍摄效果，有利于得到令用户满足的拍摄图像。

Description

图像拍摄方法及装置、电子设备和存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及一种图像拍摄方法及装置、电子设备和存储介质。

背景技术

随着摄像技术的发展，用户可利用手机、平板电脑等移动终端上的拍摄功能进行拍照。当用户缺乏拍照技巧，或用户在镜头前会肢体不够自然且拍照姿势单一，拍摄得到的图像可能无法令用户满意，使得拍摄体验下降。

发明内容

本公开提出了一种图像拍摄技术方案。

根据本公开的一方面，提供了一种图像拍摄方法，包括：获取与拍摄界面对应的场景图像；对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态；对所述场景图像进行人体关键点检测，确定所述场景图像中的对象以及所述对象的真实人体姿态；在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，以引导所述对象根据所述推荐人体姿态进行姿态调整；在满足拍摄条件的情况下，得到所述对象的拍摄图像。通过该方式，有效提高图像拍摄效果，提升用户的拍摄体验，有利于得到令用户满足的拍摄图像。

在一种可能的实现方式中，所述推荐人体姿态包括单人姿态，所述在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，包括：根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态以及所述单人姿态；或，根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态，并在所述拍摄界面的第一指定区域处显示所述单人姿态。通过该方式，能够有效引导对象完成单人姿态的拍摄，提升拍摄体验，并且推荐人体姿态可固定显示、可跟随对象显示，能够满足不同的姿态显示需求。

在一种可能的实现方式中，所述推荐人体姿态包括多人组合姿态，所述方法还包括：根据所述场景图像中多个对象之间的相对位置，以及所述多人组合姿态中各个姿态之间的相对位置，从所述多人组合姿态中分别确定各对象的对应姿态；其中，在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，包括：针对任一对象，根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态以及所述对象的对应姿态；或，根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态，并在所述拍摄界面的第二指定区域处显示所述对象的对应姿态。通过该方式，能够有效引导多个对象共同完成多人组合姿态，提升拍摄体验，并且推荐人体姿态可固定显示、可跟随对象显示，能够满足不同的姿态显示需求。

在一种可能的实现方式中，所述方法还包括：确定所述真实人体姿态的第一人体关键点，与所述推荐人体姿态的第二人体关键点之间的关键点对；根据所述关键点对的第一相似度，从所述第一人体关键点中确定出所述第一相似度小于第一预设阈值的第三人体关键点；其中，所述在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，包括：突出显示所述第三人体关键点所在的区域，其中，突出显示的方式包括高亮、加粗、变更颜色中的至少一种。通过该方式，能够对显示的真实人体姿态中相似度低的人体部位，进行突出显示，从而更有效地引导用户调整姿态，以提升拍摄体验。

在一种可能的实现方式中，所述方法还包括：根据所述真实人体姿态与所述推荐人体姿态之间的关键点对的第一相似度，确定所述真实人体姿态与所述推荐人体姿态之间的第二相似度，所述关键点对是根据所述真实人体姿态的第一人体关键点与所述推荐人体姿态的第二人体关键点确定的；在所述拍摄界面中显示所述第二相似度，以引导所述对象根据所述第二相似度进行姿态调整。通过该方式，能够显示真实人体姿态与推荐人体姿态之间整体的相似程度，以有效引导用户根据整体的相似度调整姿态，提升拍摄体验。

在一种可能的实现方式中，所述方法还包括：将所述场景图像输入至区域推荐网络，得到所述场景图像的推荐拍照区域，所述推荐拍照区域用于表征在所述场景图像中推荐拍照的区域，所述区域推荐网络是通过标注拍照区域的第一样本集训练得到的神经网络；在所述拍摄界面中，采用标识符指示所述推荐拍照区域，和/或，在所述拍摄界面的所述推荐拍照区域处显示所述推荐人体姿态，以引导所述对象根据所述推荐拍照区域进行位置调整。通过该方式，能够向对象推荐视觉效果较好的拍照区域，有效引导对象调整位置来提升拍摄图像的视觉效果，从而提升用户拍摄体验。

在一种可能的实现方式中，对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态，包括：通过姿态推荐网络对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态，其中，所述姿态推荐网络是通过标注有样本场景类别以及样本人体姿态的第二样本集训练得到的神经网络，所述第二样本集包括对象上传的样本图像。通过该方式，能够使姿态推荐网络从优质图像中学习人体姿态，从而有效地基于场景图像输出优质的推荐人体姿态。

在一种可能的实现方式中，所述推荐人体姿态包括多个，所述方法还包括：在所述拍摄界面中显示多个推荐人体姿态对应的姿态图；响应于针对所述姿态图的选择操作，根据选中的姿态图，确定与所述选中的姿态图对应的推荐人体姿态并进行显示。通过该方式，能够便于用户选择不同的推荐人体姿态，满足不同的姿态喜好，提升拍摄体验，有利于得到令用户满意的拍摄图像。

在一种可能的实现方式中，所述拍摄条件包括：所述真实人体姿态与所述推荐人体姿态之间的第二相似度大于或等于第二预设阈值；或，所述拍摄界面中的拍摄控件被触发。

在一种可能的实现方式中，所述方法还包括：对所述拍摄图像进行处理，得到处理后的拍摄图像，其中，所述处理包括以下至少一种：对所述拍摄图像中的对象进行美颜处理、对所述拍摄图像添加滤镜；所述对所述拍摄图像添加滤镜，包括：根据与所述推荐人体姿态对应的推荐滤镜，调整所述拍摄图像的饱和度、色温、亮度中的至少一种。通过该方式，能够使拍摄图像的视觉效果更优质，有利于得到令用户满意的拍摄图像，提升图像拍摄体验。

在一种可能的实现方式中，所述方法应用于人工智能教育平台，所述人工智能教育平台与智能硬件连接；其中，所述人工智能教育平台用于编辑实现所述图像拍摄方法的项目代码，并将所述项目代码发送至所述智能硬件；所述智能硬件用于采集场景图像及运行所述项目代码，得到运行结果，并将所述运行结果发送至所述人工智能教育平台，以在所述人工智能教育平台的显示界面中显示所述运行结果。通过该方式，能够使用户通过有趣的案例进行学习，学习人体姿态识别、人体关键点检测等人工智能算法。

根据本公开的一方面，提供了一种图像拍摄装置，包括：获取模块，用于获取与拍摄界面对应的场景图像；识别模块，用于对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态；检测模块，用于对所述场景图像进行人体关键点检测，确定所述场景图像中的对象以及所述对象的真实人体姿态；显示模块，在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，以引导所述对象根据所述推荐人体姿态进行姿态调整；拍摄模块，用于在满足拍摄条件的情况下，得到所述对象的拍摄图像。

在一种可能的实现方式中，所述推荐人体姿态包括单人姿态，所述显示模块，包括：第一显示子模块，用于根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态以及所述单人姿态；或，第二显示子模块，用于根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态，并在所述拍摄界面的第一指定区域处显示所述单人姿态。

在一种可能的实现方式中，所述推荐人体姿态包括多人组合姿态，所述装置还包括：位置确定模块，用于根据所述场景图像中多个对象之间的相对位置，以及所述多人组合姿态中各个姿态之间的相对位置，从所述多人组合姿态中分别确定各对象的对应姿态；其中，所述显示模块，包括：第三显示子模块，用于针对任一对象，根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态以及所述对象的对应姿态；或，第四显示子模块，用于根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态，并在所述拍摄界面的第二指定区域处显示所述对象的对应姿态。

在一种可能的实现方式中，所述装置还包括：第一确定模块，用于确定所述真实人体姿态的第一人体关键点，与所述推荐人体姿态的第二人体关键点之间的关键点对；第二确定模块，用于根据所述关键点对的第一相似度，从所述第一人体关键点中确定出所述第一相似度小于第一预设阈值的第三人体关键点；其中，所述显示模块，包括：突出显示子模块，用于突出显示所述第三人体关键点所在的区域，其中，突出显示的方式包括高亮、加粗、变更颜色中的至少一种。

在一种可能的实现方式中，所述装置还包括：第三确定模块，用于根据所述真实人体姿态与所述推荐人体姿态之间的关键点对的第一相似度，确定所述真实人体姿态与所述推荐人体姿态之间的第二相似度，所述关键点对是根据所述真实人体姿态的第一人体关键点与所述推荐人体姿态的第二人体关键点确定的；相似度显示模块，用于在所述拍摄界面中显示所述第二相似度，以引导所述对象根据所述第二相似度进行姿态调整。

在一种可能的实现方式中，所述装置还包括：区域确定模块，用于将所述场景图像输入至区域推荐网络，得到所述场景图像的推荐拍照区域，所述推荐拍照区域用于表征在所述场景图像中推荐拍照的区域，所述区域推荐网络是通过标注拍照区域的第一样本集训练得到的神经网络；区域显示模块，用于在所述拍摄界面中，采用标识符指示所述推荐拍照区域，和/或，在所述拍摄界面的所述推荐拍照区域处显示所述推荐人体姿态，以引导所述对象根据所述推荐拍照区域进行位置调整。

在一种可能的实现方式中，对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态，包括：通过姿态推荐网络对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态，其中，所述姿态推荐网络是通过标注有样本场景类别以及样本人体姿态的第二样本集训练得到的神经网络，所述第二样本集包括对象上传的样本图像。

在一种可能的实现方式中，所述推荐人体姿态包括多个，所述装置还包括：姿态图显示模块，用于在所述拍摄界面中显示多个推荐人体姿态对应的姿态图；选择模块，用于响应于针对所述姿态图的选择操作，根据选中的姿态图，确定与所述选中的姿态图对应的推荐人体姿态并进行显示。

在一种可能的实现方式中，所述装置还包括：处理模块，用于对所述拍摄图像进行处理，得到处理后的拍摄图像，其中，所述处理包括以下至少一种：对所述拍摄图像中的对象进行美颜处理、对所述拍摄图像添加滤镜；所述对所述拍摄图像添加滤镜，包括：根据与所述推荐人体姿态对应的推荐滤镜，调整所述拍摄图像的饱和度、色温、亮度中的至少一种。

在一种可能的实现方式中，所述装置应用于人工智能教育平台，所述人工智能教育平台与智能硬件连接；其中，所述人工智能教育平台用于编辑实现所述图像拍摄装置的项目代码，并将所述项目代码发送至所述智能硬件；所述智能硬件用于采集场景图像及运行所述项目代码，得到运行结果，并将所述运行结果发送至所述人工智能教育平台，以在所述人工智能教育平台的显示界面中显示所述运行结果。

根据本公开的一方面，提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。

根据本公开的一方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。

在本公开实施例中，能够根据场景图像的场景类别，向用户推荐与场景类别对应的推荐人体姿态，这样使得推荐人体姿态是与场景图像匹配的，并且通过在拍摄界面中显示真实人体姿态以及推荐人体姿态，可引导用户根据显示的推荐人体姿态进行姿态调整或便于用户根据显示的推荐人体姿态来指导拍摄对象进行姿态调整，有效提高图像拍摄效果，提升用户的拍摄体验，有利于得到令用户满足的拍摄图像。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本公开。根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开的技术方案。

图1示出根据本公开实施例的图像拍摄方法的流程图。

图2示出根据本公开实施例的一种拍摄界面的示意图。

图3示出根据本公开实施例的一种多人组合姿态的示意图。

图4示出根据本公开实施例的一种真实人体姿态的示意图。

图5示出根据本公开实施例的一种拍摄界面的示意图。

图6示出根据本公开实施例的场景图像的示意图。

图7示出根据本公开实施例的拍摄界面的示意图。

图8示出根据本公开实施例的一种拍摄界面的示意图。

图9示出根据本公开实施例的一种拍摄界面的示意图。

图10示出根据本公开实施例的一种拍摄界面的示意图。

图11a、图11b示出根据本公开实施例的拍摄界面的示意图。

图12示出根据本公开实施例的图像拍摄方法的应用示意图。

图13示出根据本公开实施例的图像拍摄装置的框图。

图14示出根据本公开实施例的一种电子设备的框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括A、B、C中的至少一种，可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。

应当理解，本公开的权利要求、说明书及附图中的术语“第一”、“第二”及“第三”等是用于区别描述，而不是用于描述特定顺序，也不能理解为指示或暗示相对重要性。本公开的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

另外，为了更好地说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

图1示出根据本公开实施例的图像拍摄方法的流程图，如图1所示，所述图像拍摄方法包括：

在步骤S11中，获取与拍摄界面对应的场景图像；

在步骤S12中，对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态；

在步骤S13中，对场景图像进行人体关键点检测，确定场景图像中的对象以及对象的真实人体姿态；

在步骤S14中，在拍摄界面中显示真实人体姿态以及推荐人体姿态，以引导对象根据推荐人体姿态进行姿态调整；

在步骤S15中，在满足拍摄条件的情况下，得到对象的拍摄图像。

在一种可能的实现方式中，所述图像拍摄方法可以由终端设备执行，终端设备可以为用户设备(User Equipment，UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant，PDA)、手持设备、计算设备、车载设备、可穿戴设备等，所述方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。本公开实施例对于终端设备的类型不作限制。

在一种可能的实现方式中，终端设备中可部署有实现该图像拍摄方法的应用程序(Application，APP)，这样用户可通过直接使用该应用程序，进行图像拍摄；也可以将该图像拍摄方法作为一种拍摄模式，集成在终端设备自带的拍摄功能中，这样用户在使用终端设备的拍摄功能时，可选择实现该图像拍摄方法的拍摄模式，进行图像拍摄，对此本公开实施例不作限制。

应理解的是，在启动实现本公开中图像拍摄方法的应用程序，或选择实现本公开中图像拍摄方法的拍摄模式后，可通过终端设备上装配的图像采集设备(如摄像头)，或与终端设备连接的图像采集设备，实时采集实际场景的场景图像，并显示在终端设备的拍摄界面中。在步骤S11中，获取与拍摄界面对应的场景图像，也即，获取图像采集设备采集的场景图像。

图2示出根据本公开实施例的一种拍摄界面的示意图，如图2所示，拍摄界面中可显示场景图像，拍摄界面中可提供用于触发拍摄的拍摄控件、用于查看已拍摄图像的查看控件、用于触发对场景图像进行识别的触发控件等。

需要说明的是，图2示出的拍摄界面是本公开实施例提供的一种实现方式，应理解的是，本公开应不限于此，本领域技术人员可根据实际需求设置拍摄界面中的功能控件，对此本公开实施例不作限制。

在一种可能的实现方式中，在步骤S12中，可通过触发如图2所示的触发控件，触发对场景图像进行识别；也可在用户启动实现图像拍摄方法的应用程序，或选择实现图像拍摄方法的拍摄模式后，自动触发对场景图像进行识别，对此本公开实施例不作限制。

在一种可能的实现方式中，在步骤S12中，对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态，可包括：对场景图像进行识别，得到场景图像中的场景特征和/或对象特征；根据识别出的场景特征和/或对象特征，确定场景图像对应的场景类型；根据预设的场景类型与推荐人体姿态之间的对应关系，确定与场景类型对应的推荐人体姿态。

其中，场景特征可用于指示对象所处的实际场景的场景类型，例如，草原的场景特征可包括草地、牛羊等；室内的场景特征可包括墙面、窗户等；若识别出的场景特征包括草地和牛羊，可得到场景图像对应的场景类型为草原。

在一种可能的实现方式中，对象特征可包括以下至少一种：服饰特征、形体特征、性别特征等。其中，服饰特征可用于指示对象的穿着，形体特征可用于指示对象的体型(例如体型高大、体型小巧)，性别特征可用于指示对象的性别。通过该方式，能够结合场景特征与对象特征确定场景类型，从而获得更精准的推荐人体姿态。

举例来说，若场景特征指示实际场景为室内，对象特征指示对象穿着“毛衣、长裤、手提包”、对象为小巧女生，则场景类别可为“室内-小巧-女生-穿着毛衣、长裤、手提包”，进而依此场景类别确定对应的推荐人体姿态。

其中，可通过预训练的场景识别网络对场景图像进行识别，得到场景图像中的场景特征和/或对象特征，对于场景识别网络的网络类型、网络结果以及训练方式，本公开实施例不作限制。

在一种可能的实现方式中，还可将识别出的场景特征与对象特征显示在拍摄界面中，例如，可通过标签的方式标注场景特征与对象特征，以提高图像拍摄的趣味性。

应理解的是，不同的场景类型可对应不同的推荐人体姿态，可预设场景类型与推荐人体姿态的对应关系，在根据识别出的场景特征确定出场景类型后，可根据该对应关系确定与场景类别对应的推荐人体姿态。

在一种可能的实现方式中，在步骤S12中，也可通过预训练的姿态推荐网络，对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态。其中，对于姿态推荐网络的网络类型、网络结构以及训练方式等，本公开实施例不作限制。

在一种可能的实现方式中，可采用自监督的训练方式，训练姿态推荐网络学习不同场景类型下的推荐人体姿态，或者说，学习场景类型与推荐人体姿态之间的对应关系，从而可利用该姿态推荐网络基于场景图像直接得到推荐人体姿态。通过该方式，相对于上述根据预设的场景类型与推荐人体姿态之间的对应关系确定推荐人体姿态的方式，可智能化地得到更为丰富的场景类型以及推荐人体姿态，并可更为准确地向用户推荐与场景图像对应的推荐人体姿态。

在一种可能的实现方式中，推荐人体姿态可包括上述姿态推荐网络从样本图像中学习得到的人体姿态，例如还可包括用户(如技术人员)手动绘制的人体姿态，对此本公开实施例不作限制。应理解的是，推荐人体姿态可通过人体骨架(如人体关节点连接得到的骨架)的形式表征，也可通过人体轮廓的形式表征，对此本公开实施例不作限制。

其中，样本图像可是拍摄效果较优的优质图像，从优质图像中学习人体姿态并向用户推荐，可引导对象接近优质图像中的人体姿态，从而获得较好的拍摄效果，提升用户拍摄体验。

在一种可能的实现方式中，推荐人体姿态可包括单人姿态(例如单人比心)，也可包括多人组合姿态(例如双人组合比心)。应理解的是，与场景类别对应的推荐人体姿态可包括至少一种单人姿态和/或至少一种多人组合姿态。图3示出根据本公开实施例的一种多人组合姿态的示意图，如图3所示，姿态n与姿态m共同组成“比心”的姿态。

在一种可能的实现方式中，场景类型例如可至少包括：风景类、室内类、户外类等；其中，风景类可分为沙滩类、山水类、草原类、湖泊类等，室内类可分为办公室类、会议室类、居家类等，户外类可分为：街景类、游乐场类、公园类等。

应理解的是，场景类型的分类可不限于此，实际上，本领域技术人员可根据实际需求预先设置各种场景类型，或，也可通过上述姿态推荐网络自学习场景类型，对此本公开实施例不作限制。

在一种可能的实现方式中，在步骤S13中，可以采用任何已知的人体关键点检测方式，如采用人体关键点检测网络，对场景图像进行人体关键点检测，对此本公开实施例不作限制。其中，对于人体关键点检测网络的网络类型、网络结构以及训练方式，本公开实施例不作限制。

在一种可能的实现方式中，对场景图像进行人体关键点检测，可包括：提取场景图像中对象的人体关节部位关键点(如20个关节部位的人体关键点)，其中，人体关节部位关键点的数量及位置可以根据实际需求确定，对此本公开实施例不做限制。

在一种可能的实现方式中，可根据检测出的人体关节部位关键点，确定出场景图像中的对象，以及对象的多个人体关节部位关键点在场景图像中的坐标值；进而可以基于坐标值，将多个人体关节部位关键点按照人体的结构连接，得到对象的人体骨架，也即得到对象的真实人体姿态。图4示出根据本公开实施例的一种真实人体姿态的示意图，如图4所示，将20个人体关节部位关键点连接，得到对象的真实人体姿态。

在一种可能的实现方式中，在步骤S13中，对场景图像进行人体关键点检测，也可包括：提取场景图像中对象的人体轮廓上的轮廓关键点，得到对象的人体轮廓，进而用人体轮廓表征对象的真实人体姿态。对于采用何种方式表征人体姿态，可依据实际需求确定，对此本公开实施例不作限制。

需要说明的是，上述步骤S12和步骤S13可以同时执行；也可以是先执行步骤S12，再执行步骤S13；也可先执行步骤S13，再执行步骤S12。具体可依据终端设备的处理能力、该终端设备的资源占用情况、应用过程中对于时延的限制等因素进行设定，对此本公开实施例不做限制。

在一种可能的实现方式中，在步骤S14中，在拍摄界面中显示真实人体姿态以及推荐人体姿态，可包括：在拍摄界面中显示推荐人体姿态对应的人体骨架与真实人体姿态对应的人体骨架；或，在拍摄界面中显示推荐人体姿态对应的人体轮廓与真实人体姿态对应的人体轮廓。换句话说，可在拍摄界面中采用人体骨架或人体轮廓的形式，显示真实人体姿态及推荐人体姿态。通过该方式，可引导用户根据显示的推荐人体姿态进行姿态调整，以达到与推荐人体姿态相似度较高的状态，从获得较好的拍摄效果。

图5示出根据本公开实施例的一种拍摄界面的示意图，如图5所示，可基于人体骨架的形式，显示出对象的真实人体姿态及推荐人体姿态；其中，可用不同的颜色来分别表征对象的真实人体姿态以及推荐人体姿态，如，用黄色表征推荐人体姿态，用绿色表征真实人体姿态。如图5所示，还可在拍摄界面中显示引导信息，如显示真实人体姿态与推荐人体姿态之间的相似度：30％，以及显示引导用户调整姿态的提示语“换个动作试试？尽量跟黄线保持一致”。

应理解的是，图5示出的真实人体姿态及推荐人体姿态的表现形式，是本公开实施例提供的一种实现方式，本公开应不限于此，实际上，本领域技术人员可根据实际需求设置真实人体姿态及推荐人体姿态的颜色，以及设置引导信息的内容，对此本公开实施例不作限制。

在一种可能的实现方式中，在步骤S15中，拍摄条件可包括拍摄界面中的拍摄控件被触发，可理解为，拍摄者点击如图2、图4、图5示出的拍摄界面中的拍摄控件触发拍照操作，得到对象的拍摄图像并保存本地相册，以供查看。

如上文所述，推荐人体姿态可包括单人姿态，在一种可能的实现方式中，在步骤S14中，在拍摄界面中显示真实人体姿态以及推荐人体姿态，包括：

根据对象在场景图像中的位置，在拍摄界面中显示真实人体姿态以及单人姿态；或，

根据对象在场景图像中的位置，在拍摄界面中显示真实人体姿态，并在拍摄界面的第一指定区域处显示单人姿态。

应理解的是，场景图像中可包括一个或多个对象。上述对场景图像进行人体关键点检测，可包括：对场景图像进行人体检测，得到场景图像中的对象以及对象的人体区域；进而对人体区域内的对象进行人体关键点检测。应理解的是，人体检测可得到场景图像中是否包含对象、包含的对象的数量以及对象在场景图像中的位置(也即人体区域在场景图像中的位置)等信息。

针对推荐人体姿态为单人姿态的情况，若场景图像中包含一个对象，则可直接根据该一个对象的位置，显示该对象的真实人体姿态；若场景图像中包含多个对象，则按照预设的选取规则，从多个对象中的选取对象，根据该选取的对象的位置，显示该选取的对象的真实人体姿态。

在一种可能的实现方式中，预设的选取规则，例如可包括：选取处于场景图像中间位置的对象、或选取距离终端设备最近的对象等，对此本公开实施例不作限制。其中，可采用本领域已知的技术得到对象与终端设备之间的距离，例如，可采用飞行时间法(Time offlight，TOF)，对此本公开实施例不作限制。

如上所述，可基于人体骨架或人体轮廓的形式，表征真实人体姿态以及推荐人体姿态。在一种可能的实现方式中，对象在场景图像中的位置可包括：场景图像中对象的人体骨架上或人体轮廓上的人体关键点的位置坐标；也可包括在场景图像中对象的人体区域的位置，其中，可通过上述人体检测得到该对象的人体区域。

应理解的是，通过上述人体关键点检测，可得到人体关键点的位置坐标，进而可依据人体关键点的位置坐标，在拍摄界面中显示真实人体姿态。通过该方式，能够使拍摄界面中的真实人体姿态跟随对象的位置显示。

在一种可能的实现方式中，对于推荐人体姿态，可设置为跟随对象的位置显示，也即根据对象在场景图像中的位置显示推荐人体姿态；也可设置为在拍摄界面中的第一指定区域显示该推荐人体姿态，也即将推荐人体姿态固定显示在拍摄界面某个预设区域中。

在一种可能的实现方式中，根据对象在场景图像中的位置，在拍摄界面中显示单人姿态，可包括：根据场景图像中对象的人体区域的位置，在拍摄界面的该人体区域处显示单人姿态。通过该方式，可较为便捷的实现推荐人体姿态根据对象的位置显示，便于引导对象比较单人姿态与真实人体姿态，以进行姿态调整。

在一种可能的实现方式中，根据对象在场景图像中的位置，在拍摄界面中显示单人姿态，还可包括：根据真实人体姿态上任一人体关键点(如颈部关键点)的位置坐标，在拍摄界面中显示单人姿态。该方式可理解为，使单人姿态上任一人体关键点与真实人体姿态上对应的人体关键点重合，例如，可设置使两姿态上颈部关键点重合，并在此基础上显示单人姿态，从而实现单人姿态跟随对象的位置显示。通过该方式，可实现使单人姿态较为精准地跟随对象的位置显示，便于用户对比单人姿态与真实人体姿态。

需要说明的是，以上在拍摄界面中显示单人姿态的方式，是本公开实施例提供的一些实现方式，实际上，本公开应不限于，只要是根据对象在场景图像中的位置显示单人姿态的实现方式，均在本公开的保护范围内。

在一种可能的实现方式中，拍摄界面中的第一指定区域，可根据实际需求设定，例如，可是拍摄界面的中间区域、左侧区域、右侧区域、四个顶点区域等，对此本公开实施例不作限制。通过在拍摄界面的第一指定区域处显示单人姿态，能够将推荐人体姿态固定显示在拍摄界面中，节省绘制推荐人体姿态所需的运算资源。

其中，对于第一指定区域的范围大小，单人姿态在第一指定区域内的显示大小，可依据实际需求设定，对此本公开实施例不作限制。

在本公开实施例中，能够有效引导对象完成单人姿态的拍摄，提升拍摄体验，并且推荐人体姿态可固定显示、可跟随对象显示，能够满足不同的姿态显示需求。

如上所述，推荐人体姿态包括多人组合姿态，在一种可能的实现方式中，所述方法还包括：

根据场景图像中多个对象之间的相对位置，以及多人组合姿态中各个姿态之间的相对位置，从多人组合姿态中分别确定各对象的对应姿态。通过该方式，能够有效确定出场景图像中各个对象在多人组合姿态中分别对应的姿态，从而便于引导各个对象完成多个组合姿态。

如上所述，场景图像中可包括一个或多个对象。对场景图像进行人体关键点检测，可包括：对场景图像进行人体检测，得到场景图像中的对象以及对象的人体区域；进而对人体区域内的对象进行人体关键点检测。应理解的是，人体检测可得到场景图像中是否包含对象、包含的对象的数量以及对象在场景图像中的位置(也即人体区域在场景图像中的位置)等信息。

针对推荐人体姿态为多人组合姿态的情况，在一种可能的实现方式中，若场景图像中对象的数量，小于实现多人组合姿态所需的对象数量，可例如通过语音或文字等形式，提示用户人数不够实现多人组合姿态，从而引导增加被拍摄对象的数量；或者从多人组合姿态中选取与场景图像中对象的数量相符的人体姿态，并基于选取的人体姿态确定对象的对应姿态。

其中，从多人组合姿态中选取与场景图像中对象的数量相符的人体姿态，例如，可随机选取与对象的数量相符的人体姿态，也可依据预设的选取策略，选取与对象的数量相符的人体姿态，选取策略例如可包括按照从左到右、从上到下的顺序选取，对此本公开实施例不作限制。

应理解的是，若选取的人体姿态为一个，则可直接将该一个选取的人体姿态作为对象的对应姿态；若选取的人体姿态为多个，可按照多个选取的人体姿态之间的相对位置，确定各对象的对应姿态。

若场景图像中对象的数量，大于或等于实现多人组合姿态所需的对象数量，可根据场景图像中多个对象之间的相对位置，以及多人组合姿态中各个姿态之间的相对位置，从多人组合姿态中分别确定各对象的对应姿态。其中，相对位置可例如包括前后位置、左右位置、上下位置等，对此本公开实施例不作限制。

举例来说，图6示出根据本公开实施例的场景图像的示意图。如图6所示，场景图像中包含对象A、对象B、对象C，当前的推荐人体姿态例如为图3示出的多人组合姿态(即“比心”姿态)。那么根据对象A、对象B、对象C之间的相对位置，以及多人组合姿态中姿态m及姿态n之间的相对位置，可得到对象A与对象B分别与姿态m及姿态n对应，也即确定出对象A的对应姿态为“姿态m”，对象B的对应姿态为“姿态n”，可理解为，对象A与对象B之间的相对位置，更适合完成图3示出的多人组合姿态。

在推荐人体姿态为多人组合姿态，并从多人组合姿态中分别确定出各对象的对应姿态的情况下，在一种可能的实现方式中，在步骤S14中，在拍摄界面中显示真实人体姿态以及推荐人体姿态，包括：

针对任一对象，根据对象在场景图像中的位置，在拍摄界面中显示对象的真实人体姿态以及对象的对应姿态；或，根据对象在场景图像中的位置，在拍摄界面中显示对象的真实人体姿态，并在拍摄界面的第二指定区域处显示对象的对应姿态。

其中，根据对象在场景图像中的位置，在拍摄界面中显示对象的真实人体姿态，可参照上述本公开实施例中公开的内容，在此不做赘述。

在一种可能的实现方式中，根据对象在场景图像中的位置，在拍摄界面中显示对象的对应姿态，可与上述本公开实施例中根据对象在场景图像中的位置在拍摄界面中显示单人姿态的实现方式相同，对此本公开实施例不作限制。通过该方式，能够针对多个对象中的各个对象，实现各个对象的对应姿态跟随各个对象的位置显示，从而便于引导各个对象比较各自的对应姿态与真实人体姿态，以进行姿态调整。

在一种可能的实现方式中，拍摄界面中的第二指定区域，可根据实际需求设定，例如，可是拍摄界面的中间区域、左侧区域、右侧区域、四个顶点区域等，对此本公开实施例不作限制。通过在拍摄界面的第二指定区域处显示对象的对应姿态，能够将推荐人体姿态固定显示在拍摄界面中，节省绘制推荐人体姿态所需的运算资源。

应理解的是，第一指定区域与第二指定区域可不同、可相同；第二指定区域可包括多个区域，可在多个区域分别显示多人组合姿态中各个姿态；第二指定区域也可包括一个区域，在该一个区域内显示该多人组合姿态，对此本公开实施例不作限制。图7示出根据本公开实施例的拍摄界面的示意图，如图7所示，可在第二指定区域处显示多人组合姿态，并根据各个对象在场景图像中的位置，在拍摄界面中显示各个对象的真实人体姿态。

其中，对于第二指定区域的范围大小，对应姿态在第二指定区域内的显示大小，可依据实际需求设定，对此本公开实施例不作限制。

在本公开实施例中，能够有效引导多个对象共同完成多人组合姿态，提升拍摄体验，并且推荐人体姿态可固定显示、可跟随对象显示，能够满足不同的姿态显示需求。

考虑到，对象在调整姿态时，可能存在部分人体部位的姿态，接近推荐人体姿态，而部分人体部位的姿态并不接近推荐人体姿态的情况，例如，双臂的姿态与推荐人体姿态接近(也即相似度高)，双腿的姿态与推荐人体姿态不接近(也即相似度低)。

为更有效地引导用户调整姿态，可对显示的真实人体姿态中相似度低的人体部位进行突出显示。在一种可能的实现方式中，所述方法还包括：

确定真实人体姿态的第一人体关键点，与推荐人体姿态的第二人体关键点之间的关键点对；根据关键点对的第一相似度，从第一人体关键点中确定出第一相似度小于第一预设阈值的第三人体关键点；

其中，在步骤S13中，在拍摄界面中显示真实人体姿态以及推荐人体姿态，包括：

突出显示第三人体关键点所在的区域，其中，突出显示的方式包括高亮、加粗、变更颜色中的至少一种。

在一种可能的实现方式中，为便于比较真实人体姿态与推荐人体姿态，真实人体姿态的第一人体关键点与推荐人体姿态的第二人体关键点可是对应的，例如，真实人体姿态的第一人体关键点包括20个人体关节部位关键点，推荐人体姿态的第二人体关键点也对应包含20个人体关节部位关键点。基于此，可从真实人体姿态的第一人体关键点与推荐人体姿态的第二人体关键点中，确定出关键点对，例如，第一人体关键点中的左肩关键点，与第二人体关键点中的左肩关键点是一对关键点对，20个人体关节部位关键点，可确定出20个关键点对。

在一种可能的实现方式中，真实人体姿态的第一人体关键点可带有标识，推荐人体姿态的第二人体关键点也可带有标识。应理解的是，标识可用于指示人体不同关节部位或不同轮廓位置上的关键点，通过两个姿态上带有的相同/相似标识，可便于确定出真实人体姿态的第一人体关键点，与推荐人体姿态的第二人体关键点之间的关键点对。

需要说明的是，以上通过标识确定关键点对的方式，本公开实施例公开的一种实现方式，实际上，本领域技术人员可采用任何已知的方式，确定出第一人体关键点与第二人体关键点之间的关键点对，对此本公开实施例不作限制。

在一种可能的实现方式中，关键点对的第一相似度，可用关键点对中两个关键点之间的距离(如欧氏距离、余弦距离等)表征，也可用距离的偏差表征，对此本公开实施例不作限制。其中，可设置第一相似度与距离或与距离的偏差负相关，也即，距离越小或距离的偏差越小，第一相似度越高。应理解的是，关键点对的数量，与第一相似度的数量一致，也即各关键点对分别对应各自的第一相似度。

其中，距离的偏差，可理解为，任一关键点对的距离，与全部关键对的距离的平均值之间的差值，例如，20个关键点对的距离的平均值为X，关键点对a的距离为x，则关键点对a的距离的偏差为“x-X”，也即可用“x-X”表征关键点对a的第一相似度。

在一种可能的实现方式中，可根据推荐人体姿态的显示方式：跟随对象显示或固定显示，选择用距离，还是用距离的偏差来表征第一相似度。例如，在推荐人体姿态是跟随对象显示的情况下，可使用距离表征第一相似度；在推荐人体姿态是固定显示在拍摄界面中的情况下，可用距离的偏差表征第一相似度。

应理解的是，在推荐人体姿态是固定显示在拍摄界面中的情况下，对象在场景图像中的位置是会变化的，用距离可能无法准确表征关键点对的第一相似度，这是因为任一关键点对的距离远，并不意味着该关键点对不相似，可能是真实人体姿态与推荐人体姿态整体距离远，此时采用距离的偏差，能够较准确地反映各关键点对的第一相似度。

在一种可能的实现方式中，第一预设阈值可根据实际需求、第一相似度的计算方式等确定，对此本公开实施例不作限制。第一相似度小于第一预设阈值，可意味着该第一相似度所对应的关键点对的相似程度低，也即，该关键点对表征的人体部位的部分姿态与推荐人体姿态相似度低；反之，第一相似度大于或等于第一预设阈值，可意味着该第一相似度对应的关键点对的相似程度高，也即，该关键点对表征的人体部位的部分姿态与推荐人体姿态相似度高。

在一种可能的实现方式中，根据关键点对的第一相似度，从第一人体关键点中确定出第一相似度小于第一预设阈值的第三人体关键点，可包括：根据关键点对的第一相似度，从关键点对确定出第一相似度小于第一预设阈值的目标关键点对，将目标关键点对中的第一人体关键点作为第三人体关键点，也即实现从第一人体关键点中确定出第一相似度小于第一预设阈值的第三人体关键点。

在一种可能的实现方式中，突出显示第三人体关键点所在的区域，可理解为，突出显示该第三人体关键点在拍摄界面中所占的区域。举例来说，如图4示出的真实人体姿态中用实心圆表征人体关节部位，那么实心圆的所占区域可是第三人体关键点所在的区域。

应理解的是，突出显示的方式包括高亮、加粗、变更颜色中的至少一种，是本公开实施例提供的一些实现方式，实际上，本领域技术人员可根据实际需求设计不同的突出显示的方式，对此本公开实施例不作限制。其中，变更颜色，例如将用绿色显示的真实人体姿态中的第三人体关键点变为红色，对此本公开实施例不作限制。

图8示出根据本公开实施例的一种拍摄界面的示意图，如图8所示，可通过加粗的方式表征相似度较低的膝关节部位的关键点，其中，还可对该膝关节部位的关键点所对应的连接线(也即表征腿部的连接线)进行加粗，对此本公开实施例不作限制。

在本公开实施例中，能够对显示的真实人体姿态中相似度低的人体部位，进行突出显示，从而更有效地引导用户调整姿态，以提升拍摄体验。

如上文所述，可在拍摄界面中显示真实人体姿态与推荐人体姿态之间的相似度，以引导对象进行姿态调整。在一种可能的实现方式中，所述方法还包括：

根据真实人体姿态与推荐人体姿态之间的关键点对的第一相似度，确定真实人体姿态与推荐人体姿态之间的第二相似度，关键点对是根据真实人体姿态的第一人体关键点与推荐人体姿态的第二人体关键点确定的；

在拍摄界面中显示第二相似度，以引导对象根据第二相似度进行姿态调整。

其中，关键点对的确定方式，可参照上述本公开实施例，在此不做赘述。

如上所述，关键点对的第一相似度可用关键点对的距离或距离的偏差表征。在一种可能的实现方式中，根据关键点对的第一相似度，确定真实人体姿态与推荐人体姿态之间的第二相似度，可包括：根据全部关键点对的距离的累加值、平均值、方差或标准差，确定第二相似度，对此本公开实施例不作限制。

其中，距离的累加值、平均值、方差或标准差，可与第二相似度成负相关，也即，距离的累加值、平均值、方差或标准差等越小，代表第二相似度越高；反之，距离的累加值、平均值、方差或标准差等越大，代表第二相似度越低。应理解的是，第二相似度可反映真实人体姿态与推荐人体姿态之间整体的相似程度。

在一种可能的实现方式中，为便于对象理解第二相似度的高低，或者说理解相似程度的高低，第二相似度可用百分比的形式显示在拍摄界面中。基于此，可设置距离的累加值、平均值、方差或标准差，与第二相似度之间存在映射关系，从而根据该映射关系，将距离的累加值、平均值、方差或标准差，映射成百分比形式下的第二相似度。

其中，本领域技术人员可采用任何已知的方式，设置距离的累加值、平均值、方差或标准差，与第二相似度之间的映射关系，对此本公开实施例不作限制。

在一种可能的实现方式中，在拍摄界面中显示第二相似度，例如可通过图5、图8示出的方式，显示第二相似度。应理解的是，本领域技术人员可根据实际需求设计第二相似度的显示方式，对此本公开实施例不作限制。

在一种可能的实现方式中，还可通过神经网络得到真实人体姿态与推荐人体姿态之间的第二相似度，也即可将真实人体姿态对应的第一人体关键点与推荐人体姿态对应的第二人体关键点输入至神经网络中，输出第二相似度。其中，第一人体关键点与第二人体关键点可采用向量或矩阵的形式，输入至神经网络中。对于该神经网络的网络类型、网络结构以及训练方式，本公开实施例不作限制。

在本公开实施例中，能够显示真实人体姿态与推荐人体姿态之间整体的相似程度，以有效引导用户根据整体的相似度调整姿态，提升拍摄体验。

如上所述，在步骤S15中，在满足拍摄条件的情况下，得到对象的拍摄图像。在一种可能的实现方式中，拍摄条件可包括真实人体姿态与所述推荐人体姿态之间的第二相似度大于或等于第二预设阈值。通过该方式，可实现在真实人体姿态与推荐人体姿态相似度较高的情况下，自动触发拍摄操作，得到拍摄图像并保存本地相册，以供对象查看。

其中，第二预设阈值，可根据实际需求设定，例如，可设置为80％，对此本公开实施例不作限制。应理解的是，拍摄条件也可包括拍摄界面中的拍摄控件被触发，也即，拍摄者手动进行拍照操作。

考虑到，若对象在实际场景中有较好的站位，或者说对象在场景图像中所在的位置较为合适，能够使拍摄图像呈现出较好的视觉效果，例如，构图上更加协调、悦目。在一种可能的实现方式中，所述方法还包括：

将场景图像输入至区域推荐网络，得到场景图像的推荐拍照区域，推荐拍照区域用于表征在场景图像中推荐拍照的区域，区域推荐网络是通过标注拍照区域的第一样本集训练得到的神经网络；

在拍摄界面中，采用标识符指示推荐拍照区域，和/或，在拍摄界面的推荐拍照区域处显示推荐人体姿态，以引导对象根据推荐拍照区域进行位置调整。

其中，区域推荐网络可采用已知的神经网络，例如，卷积神经网络等，对于区域推荐网络的网络类型、网络结构以及训练方式，本公开实施例不作限制。

在一种可能的实现方式中，第一样本集的样本图像可是视觉效果较优的图像。通过从视觉效果较优的第一样本集中学习推荐拍照区域，可引导对象调整位置来提升拍摄图像的视觉效果，从而提升用户拍摄体验。

其中，第一样本集的样本图像中人体的所在区域，可是标注的拍照区域。应理解的是，可采用已知的标注技术，实现对第一样本集的样本图像中人体区域的标注，对此本公开实施例不作限制。

在一种可能的实现方式中，用于指示推荐拍照区域的标识符，可采用字符和/或图形等任何形式显示在拍摄界面中，从而实现引导用户对象根据推荐拍照区域进行位置调整，对此本公开实施例不作限制。图9示出根据本公开实施例的一种拍摄界面的示意图，如图9所示，可通过图形、提示语“推荐站位”等形式指示推荐拍照区域。

如上文所述，推荐人体姿态可固定显示在拍摄界面的指定区域(上述第一指定区域或第二指定区域)中。在一种可能的实现方式中，可在拍摄界面的推荐拍照区域处显示推荐人体姿态，换句话说，可用推荐人体姿态指示推荐拍照区域。应理解的是，上述第一指定区域或第二指定区域可包括推荐拍照区域。通过该方式，能够有效地引导对象根据推荐拍照区域进行位置调整，也便于对象根据推荐人体姿态进行姿态调整。

应理解的是，可同时采用标识符及推荐人体姿态指示推荐拍照区域，也可仅采用标识符或推荐人体姿态指示推荐拍照区域，对此本公开实施例不作限制。

在一种可能的实现方式中，在采用标识符指示推荐拍照区域，且检测到场景图像中对象处于推荐拍照区域内的情况下，可隐藏该标识符，从而可使拍摄界面更简洁。其中，判断对象是否处于推荐拍照区域内，可根据场景图像中对象的人体区域的位置确定，也可根据人体关键点的位置坐标确定，对此本公开实施例不作限制。

在本公开实施例中，能够向对象推荐视觉效果较好的拍照区域，有效引导对象调整位置来提升拍摄图像的视觉效果，从而提升用户拍摄体验。

如上所述，可通过姿态推荐网络对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态。在一种可能的实现方式中，在步骤S12中，对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态，包括：

通过姿态推荐网络对场景图像进行识别，确定场景图像对应的场景类别以及与场景类别对应的推荐人体姿态，其中，姿态推荐网络是通过标注有样本场景类别以及样本人体姿态的第二样本集训练得到的神经网络，第二样本集包括对象上传的样本图像。

其中，姿态推荐网络可采用已知的神经网络，例如，卷积神经网络、残差神经网络等。如上所述，对于姿态推荐网络的网络类型、网络结构以及训练方式等，本公开实施例不作限制。

如上所述，可采用自监督的训练方式，使姿态推荐网络学习不同场景类型下的推荐人体姿态，或者说，学习场景类型与推荐人体姿态之间的对应关系，从而可利用该姿态推荐网络基于场景图像输出推荐人体姿态。

应理解的是，第一样本集与第二样本集可是相同的样本集，也可是不同的样本集，对于第一样本集与第二样本集中样本图像的来源，本公开实施例不作限制。

其中，可采用已知的标注技术，实现对第二样本集的样本图像中样本场景类别以及样本人体姿态的标注，对此本公开实施例不作限制。

在一种可能的实现方式中，实现图像拍摄方法的应用程序或实现图像拍摄方法的拍摄模式中，还可提供用于上传样本图像的上传功能，该样本图像可以是用户已拍摄图像中效果较好的图像。通过该方式，能够丰富用于训练姿态推荐网络的第二样本集，使训练得到的姿态推荐网络，可更准确地基于场景图像输出推荐人体姿态。

应理解的是，用户上传的样本图像可是用户授权进入后台训练姿态推荐网络的图像，这样用户上传的样本图像仅对后台可见，其他用户看到的均为处理过的推荐人体姿态及对应的姿态图(姿态图中例如隐去人脸或者替换了人脸或替换人物等)，从而保障了用户隐私安全，其中，姿态图可用于选择不同的推荐人体姿态。

其中，可采用本领域的已知的技术，在应用程序和/或拍摄模式中实现该图像上传功能，对此本公开实施例不作限制。

应理解的是，姿态推荐网络的训练过程可在服务器进行。在一种可能的实现方式中样本图像可上传至服务器来扩充第二样本集，并可定期基于第二样本集再训练姿态推荐网络，得到新版本的姿态推荐网络，进而更新终端设备中已部署的姿态推荐网络。通过该方式，可使姿态推荐网络学习到丰富的人体姿态，从而使训练得到的姿态推荐网络所输出的推荐人体姿态更全面、更丰富。

在一种可能的实现方式中，终端设备中已部署的姿态推荐网络的再训练过程，也可在终端设备上进行，也即，可直接利用对象上传的样本图像，对终端设备上已部署的姿态推荐网络进行增量训练。通过该方式，可使已部署的姿态推荐网络所输出的推荐人体姿态，更贴近对象的喜好，具有针对性。

应理解的是，第二样本集可是拍摄效果较优的优质图像，在本公开实施例中，能够使姿态推荐网络从优质图像中学习人体姿态，从而有效地基于场景图像输出优质的推荐人体姿态，以引导拍摄对象接近优质的推荐人体姿态，从而获得较好的拍摄效果，提升用户拍摄体验。

如上所述，推荐人体姿态包括多个，为便于对象选择或切换不同的推荐人体姿态，在一种可能的实现方式中，所述方法还包括：

在拍摄界面中显示多个推荐人体姿态对应的姿态图；

响应于针对姿态图的选择操作，根据选中的姿态图，确定与选中的姿态图对应的推荐人体姿态并进行显示。

图10示出根据本公开实施例的一种拍摄界面的示意图，如图10所示，拍摄界面中可展示多个姿态图，还可展示识别出的场景特征“窗框、墙面”和对象特征“毛衣、长裤、手提高”，以提高趣味性。其中，可参照上述本公开实施例中对场景图像进行识别的方式，得到识别出的场景特征及对象特征，在此不做赘述。应理解的是，拍摄界面中还可提供用于查看多个姿态图的滑动控件，以通过滑动操作查看其它当前未显示在拍摄界面中的姿态图。

在一种可能的实现方式中，显示的姿态图可是缩略图，可理解为推荐人体姿态对应的预览图、示意图等。应理解的是，姿态图与推荐人体姿态对应，根据选中的任一姿态图，可得到对应的推荐人体姿态。

在一种可能的实现方式中，针对姿态图的选择操作，例如可包括滑动查看姿态图、点击选中任一姿态图等操作。其中，被选中的姿态图可突出显示，实现友好的人机交互。

如上所述，显示的姿态图可是缩略图，在一种可能的实现方式中，在如图10示出的拍摄界面中选中任一姿态图后，可在拍摄界面中显示该姿态图对应的放大图，以便于对象更清楚的查看姿态图。

图11a、图11b示出根据本公开实施例的拍摄界面的示意图。如图11a所示，中间区域显示的可是被选中的姿态图对应的放大图，其中，还可响应于长按放大图、双击放大图等操作，在如图11b所示的放大图中预览该姿态图对应的推荐人体姿态。

在一种可能的实现方式中，可通过点击图11a、图11b中示出的“拍同款”按钮，以确定选中的姿态图及对应的推荐人体姿态，并在如图5、图7、图8示出的拍摄界面中显示与选中的姿态图对应的推荐人体姿态。其中，显示推荐人体姿态的方式可参照上述本公开实施例，在此不做赘述。

需要说明的是，以上图10、图11a、图11b中显示姿态图以及选择姿态图的方式，是本公开实施例提供的一种实现方式，实际上，本领域技术人员可根据实际需求，设计姿态图在拍摄界面中的显示方式、以及针对姿态图的选择方式等，对此本公开实施例不作限制。

在本公开实施例中，能够便于用户选择不同的推荐人体姿态，满足不同的姿态喜好，提升拍摄体验，有利于得到令用户满意的拍摄图像。

在一种可能的实现方式中，所述方法还包括：

对拍摄图像进行处理，得到处理后的拍摄图像，其中，处理包括以下至少一种：对拍摄图像中的对象进行美颜处理、对拍摄图像添加滤镜；

所述对拍摄图像添加滤镜，包括：根据与推荐人体姿态对应的推荐滤镜，调整拍摄图像的饱和度、色温、亮度中的至少一种。

其中，可采用任何已知的图像美颜技术，实现对拍摄图像中的对象进行美颜处理，对此本公开实施例不作限制。例如，美颜处理的过程可包括：确定拍摄图像中人脸面部位置，再确定面部瑕疵位置，根据定位到面部瑕疵位置进行填补、修复或滤除等处理。

如上所示，推荐人体姿态可是从样本图像中学习到的，在一种可能的实现方式中，推荐滤镜可通过分析样本图像的滤镜获得，基于此，推荐人体姿态可与推荐滤镜对应。

应理解的是，推荐滤镜可包括推荐的饱和度、色温、亮度等滤镜参数。在一种可能的实现方式中，调整拍摄图像的饱和度、色温、亮度中的至少一种，可包括：将拍摄图像的饱和度、色温、亮度中的至少一种，调整至与推荐滤镜的滤镜参数一致。

其中，本领域技术人员可采用本领域已知的图像处理技术，实现调整拍摄图像的饱和度、色温、亮度，对此本公开实施例不作限制。

在本公开实施例中，能够使拍摄图像的视觉效果更优质，有利于得到令用户满意的拍摄图像，提升图像拍摄体验。

在一种可能的实现方式中，本公开实施例的图像拍摄方法，能够应用于人工智能教育平台、社交分享平台、视频图像拍摄软件等，能够根据场景图像智能地推荐与场景图像对应的推荐人体姿态，供用户进行自拍和摄像构图指导，提高图像拍摄的趣味性，提高拍摄体验，有利于得到令用户满足的拍摄图像。

其中，将图像拍摄方法应用于人工智能教育平台时，可借助与该人工智能教育平台连接的智能硬件，如Jetson Nano(一种英伟达开发的微型计算机),树莓派Raspberry Pi(一种微型电脑)等实现上述图像拍摄方法，通过该方式，能够基于可视化的形态，使用户更容易启发学习兴趣。

图12示出根据本公开实施例的图像拍摄方法的应用示意图。如图12所示，人工智能教育平台与智能硬件连接，其中，人工智能教育平台用于编辑实现所述图像拍摄方法的项目代码，并将项目代码发送至智能硬件，智能硬件用于采集场景图像及运行项目代码，得到运行结果，并将运行结果发送至人工智能教育平台，以在人工智能教育平台的显示界面中显示运行结果。

其中，可在人工智能教育平台的网页端的显示界面中显示场景图像、拍摄图像以及图像拍摄方法的运行结果。其中，运行结果可包括推荐人体姿态、真实人体姿态、对拍摄图像添加滤镜后的拍摄图像、对拍摄图像中的对象进行美颜处理后的拍摄图像等。

在一种可能的实现方式中，该人工智能教育平台可以支持学生在平台上编辑实现上述图像拍摄方法的项目代码，例如训练姿态推荐网络等代码，并连接智能硬件，将用于实现上述图像拍摄方法的项目代码发送到智能硬件上执行，从而可通过智能硬件实时采集场景图像，并基于采集的场景图像实现上述图像拍摄方法。

其中，学生还可以在该人工智能教育平台上编辑项目代码，以更新优化上述图像拍摄方法，例如优化各神经网络等。

在本公开实施例中，可无须在本地安装各类硬件驱动、部署各类人工智能算法的依赖库和依赖环境，能够使用户通过有趣的案例进行学习，学习人体姿态识别、人体关键点检测等人工智能算法。

可以理解，本公开提及的上述各个方法实施例，在不违背原理逻辑的情况下，均可以彼此相互结合形成结合后的实施例，限于篇幅，本公开不再赘述。本领域技术人员可以理解，在具体实施方式的上述方法中，各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。

此外，本公开还提供了图像拍摄装置、电子设备、计算机可读存储介质、程序，上述均可用来实现本公开提供的任一种图像拍摄方法，相应技术方案和描述和参见方法部分的相应记载，不再赘述。

图13示出根据本公开实施例的图像拍摄装置的框图，如图13所示，所述装置包括：

获取模块101，用于获取与拍摄界面对应的场景图像；

识别模块102，用于对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态；

检测模块103，用于对所述场景图像进行人体关键点检测，确定所述场景图像中的对象以及所述对象的真实人体姿态；

显示模块104，在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，以引导所述对象根据所述推荐人体姿态进行姿态调整；

拍摄模块105，用于在满足拍摄条件的情况下，得到所述对象的拍摄图像。

在一种可能的实现方式中，所述推荐人体姿态包括单人姿态，所述显示模块104，包括：第一显示子模块，用于根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态以及所述单人姿态；或，第二显示子模块，用于根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态，并在所述拍摄界面的第一指定区域处显示所述单人姿态。

在一种可能的实现方式中，所述推荐人体姿态包括多人组合姿态，所述装置还包括：位置确定模块，用于根据所述场景图像中多个对象之间的相对位置，以及所述多人组合姿态中各个姿态之间的相对位置，从所述多人组合姿态中分别确定各对象的对应姿态；其中，所述显示模块104，包括：第三显示子模块，用于针对任一对象，根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态以及所述对象的对应姿态；或，第四显示子模块，用于根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态，并在所述拍摄界面的第二指定区域处显示所述对象的对应姿态。

在一种可能的实现方式中，所述装置还包括：第一确定模块，用于确定所述真实人体姿态的第一人体关键点，与所述推荐人体姿态的第二人体关键点之间的关键点对；第二确定模块，用于根据所述关键点对的第一相似度，从所述第一人体关键点中确定出所述第一相似度小于第一预设阈值的第三人体关键点；其中，所述显示模块104，包括：突出显示子模块，用于突出显示所述第三人体关键点所在的区域，其中，突出显示的方式包括高亮、加粗、变更颜色中的至少一种。

在一些实施例中，本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法，其具体实现可以参照上文方法实施例的描述，为了简洁，这里不再赘述。

本公开实施例还提出一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。

本公开实施例还提出一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。

本公开实施例还提供了一种计算机程序产品，包括计算机可读代码，当计算机可读代码在设备上运行时，设备中的处理器执行用于实现如上任一实施例提供的图像拍摄方法的指令。

本公开实施例还提供了另一种计算机程序产品，用于存储计算机可读指令，指令被执行时使得计算机执行上述任一实施例提供的图像拍摄方法的操作。

电子设备可以被提供为终端设备。

图14示出根据本公开实施例的一种电子设备800的框图。例如，电子设备800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等终端。

参照图14，电子设备800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制电子设备800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理***，一个或多个电源，及其他与为电子设备800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当电子设备800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和***接口模块之间提供接口，上述***接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为电子设备800提供各个方面的状态评估。例如，传感器组件814可以检测到电子设备800的打开/关闭状态，组件的相对定位，例如所述组件为电子设备800的显示器和小键盘，传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变，用户与电子设备800接触的存在或不存在，电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如互补金属氧化物半导体(CMOS)或电荷耦合装置(CCD)图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络，如无线网络(WiFi)，第二代移动通信技术(2G)或第三代移动通信技术(3G)，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种非易失性计算机可读存储介质，例如包括计算机程序指令的存储器804，上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。

本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中，所述计算机程序产品具体体现为计算机存储介质，在另一个可选实施例中，计算机程序产品具体体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种图像拍摄方法，其特征在于，包括：

获取与拍摄界面对应的场景图像；

对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态；

对所述场景图像进行人体关键点检测，确定所述场景图像中的对象以及所述对象的真实人体姿态；

在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，以引导所述对象根据所述推荐人体姿态进行姿态调整；

在满足拍摄条件的情况下，得到所述对象的拍摄图像。

2.根据权利要求1所述的方法，其特征在于，所述推荐人体姿态包括单人姿态，所述在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，包括：

根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态以及所述单人姿态；或，

根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述真实人体姿态，并在所述拍摄界面的第一指定区域处显示所述单人姿态。

3.根据权利要求1或2所述的方法，其特征在于，所述推荐人体姿态包括多人组合姿态，所述方法还包括：

根据所述场景图像中多个对象之间的相对位置，以及所述多人组合姿态中各个姿态之间的相对位置，从所述多人组合姿态中分别确定各对象的对应姿态；

其中，在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，包括：

针对任一对象，根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态以及所述对象的对应姿态；或，

根据所述对象在所述场景图像中的位置，在所述拍摄界面中显示所述对象的真实人体姿态，并在所述拍摄界面的第二指定区域处显示所述对象的对应姿态。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

确定所述真实人体姿态的第一人体关键点，与所述推荐人体姿态的第二人体关键点之间的关键点对；

根据所述关键点对的第一相似度，从所述第一人体关键点中确定出所述第一相似度小于第一预设阈值的第三人体关键点；

其中，所述在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，包括：

突出显示所述第三人体关键点所在的区域，其中，突出显示的方式包括高亮、加粗、变更颜色中的至少一种。

5.根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：

根据所述真实人体姿态与所述推荐人体姿态之间的关键点对的第一相似度，确定所述真实人体姿态与所述推荐人体姿态之间的第二相似度，所述关键点对是根据所述真实人体姿态的第一人体关键点与所述推荐人体姿态的第二人体关键点确定的；

在所述拍摄界面中显示所述第二相似度，以引导所述对象根据所述第二相似度进行姿态调整。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述方法还包括：

将所述场景图像输入至区域推荐网络，得到所述场景图像的推荐拍照区域，所述推荐拍照区域用于表征在所述场景图像中推荐拍照的区域，所述区域推荐网络是通过标注拍照区域的第一样本集训练得到的神经网络；

在所述拍摄界面中，采用标识符指示所述推荐拍照区域，和/或，在所述拍摄界面的所述推荐拍照区域处显示所述推荐人体姿态，以引导所述对象根据所述推荐拍照区域进行位置调整。

7.根据权利要求1-6任一项所述的方法，其特征在于，对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态，包括：

通过姿态推荐网络对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态，其中，所述姿态推荐网络是通过标注有样本场景类别以及样本人体姿态的第二样本集训练得到的神经网络，所述第二样本集包括对象上传的样本图像。

8.根据权利要求1所述的方法，其特征在于，所述推荐人体姿态包括多个，所述方法还包括：

在所述拍摄界面中显示多个推荐人体姿态对应的姿态图；

响应于针对所述姿态图的选择操作，根据选中的姿态图，确定与所述选中的姿态图对应的推荐人体姿态并进行显示。

9.根据权利要求1或5所述的方法，其特征在于，所述拍摄条件包括：

所述真实人体姿态与所述推荐人体姿态之间的第二相似度大于或等于第二预设阈值；或，

所述拍摄界面中的拍摄控件被触发。

10.根据权利要求1-9任一项所述的方法，其特征在于，所述方法还包括：

对所述拍摄图像进行处理，得到处理后的拍摄图像，其中，所述处理包括以下至少一种：对所述拍摄图像中的对象进行美颜处理、对所述拍摄图像添加滤镜；

所述对所述拍摄图像添加滤镜，包括：根据与所述推荐人体姿态对应的推荐滤镜，调整所述拍摄图像的饱和度、色温、亮度中的至少一种。

11.根据权利要求1-10任一项所述的方法，其特征在于，所述方法应用于人工智能教育平台，所述人工智能教育平台与智能硬件连接；

其中，所述人工智能教育平台用于编辑实现所述图像拍摄方法的项目代码，并将所述项目代码发送至所述智能硬件；

所述智能硬件用于采集场景图像及运行所述项目代码，得到运行结果，并将所述运行结果发送至所述人工智能教育平台，以在所述人工智能教育平台的显示界面中显示所述运行结果。

12.一种图像拍摄装置，其特征在于，包括：

获取模块，用于获取与拍摄界面对应的场景图像；

识别模块，用于对所述场景图像进行识别，确定所述场景图像对应的场景类别以及与所述场景类别对应的推荐人体姿态；

检测模块，用于对所述场景图像进行人体关键点检测，确定所述场景图像中的对象以及所述对象的真实人体姿态；

显示模块，在所述拍摄界面中显示所述真实人体姿态以及所述推荐人体姿态，以引导所述对象根据所述推荐人体姿态进行姿态调整；

拍摄模块，用于在满足拍摄条件的情况下，得到所述对象的拍摄图像。

13.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为调用所述存储器存储的指令，以执行权利要求1至11中任意一项所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至11中任意一项所述的方法。