CN109091869B

CN109091869B - 虚拟对象的动作控制方法、装置、计算机设备及存储介质

Info

Publication number: CN109091869B
Application number: CN201810910097.8A
Authority: CN
Inventors: 黄盈; 张力柯
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-08-10
Filing date: 2018-08-10
Publication date: 2022-07-26
Anticipated expiration: 2038-08-10
Also published as: CN109091869A

Abstract

本发明公开了一种虚拟对象的动作控制方法、装置、计算机设备及存储介质，属于计算机技术领域。方法包括：获取目标虚拟对象的信息和目标虚拟对象的视野范围内的环境信息；将目标虚拟对象的信息和环境信息输入动作获取模型中，由动作获取模型根据所述目标虚拟对象的信息和所述环境信息，输出目标虚拟对象的目标动作信息；在终端界面中，控制目标虚拟对象在所述虚拟场景中按照目标动作信息做出动作。本发明通过仅获取了该目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息，而不是获取虚拟场景中所有虚拟对象的信息，可以提高电子游戏的公平性，也可以真实模拟现实场景中玩家基于终端界面的显示图像进行控制操作的场景。

Description

虚拟对象的动作控制方法、装置、计算机设备及存储介质

技术领域

本发明涉及计算机技术领域，特别涉及一种虚拟对象的动作控制方法、装置、计算机设备及存储介质。

背景技术

随着计算机技术的发展和终端功能的多样化，在终端中能够进行的电子游戏的游戏类型越来越多。其中，射击类游戏即为一种电子游戏，在这类电子游戏中，终端可以自行控制虚拟对象在虚拟场景中做出不同的动作，以实现无需用户操作即可控制该虚拟对象与虚拟场景中的其他虚拟对象进行战斗。

目前，虚拟对象的动作控制方法通常是调用电子游戏应用的内部应用程序编程接口(Application Programming Interface,API)，获取该电子游戏应用中正在进行的电子游戏中所有虚拟对象的信息，并根据该所有虚拟对象的信息，确定当前终端控制的虚拟对象下一步的动作，从而控制该虚拟对象在虚拟场景中做出相应的动作。

上述方法中获取虚拟场景中所有虚拟对象的信息，从而根据该信息，确定终端所控制的虚拟对象的动作，使得该虚拟对象相较于其他虚拟对象更具优势，影响了电子游戏的公平性，也不能真实模拟现实生活中人根据自身观察到的场景做出不同动作的场景。

发明内容

本发明实施例提供了一种虚拟对象的动作控制方法、装置、计算机设备及存储介质，可以解决相关技术中影响电子游戏的公平性，不能真实模拟现实场景的问题。所述技术方案如下：

一方面，提供了一种虚拟对象的动作控制方法，所述方法包括：

获取目标虚拟对象的信息和所述目标虚拟对象的视野范围内的环境信息；

将所述目标虚拟对象的信息和所述环境信息输入动作获取模型中，由所述动作获取模型根据所述目标虚拟对象的信息和所述环境信息，输出所述目标虚拟对象的目标动作信息；

在终端界面中，控制所述目标虚拟对象在虚拟场景中按照所述目标动作信息做出动作。

一方面，提供了一种虚拟对象的动作控制装置，所述装置包括：

获取模块，用于获取目标虚拟对象的信息和所述目标虚拟对象的视野范围内的环境信息；

输入输出模块，用于将所述目标虚拟对象的信息和所述环境信息输入动作获取模型中，由所述动作获取模型根据所述目标虚拟对象的信息和所述环境信息，输出所述目标虚拟对象的目标动作信息；

控制模块，用于在终端界面中，控制所述目标虚拟对象在虚拟场景中按照所述目标动作信息做出动作。

一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现所述虚拟对象的动作控制方法所执行的操作。

一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现所述虚拟对象的动作控制方法所执行的操作。

本发明实施例通过仅获取目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息，通过动作获取模型为该目标虚拟对象规划如何进行移动或如何应对当前场景，从而输出目标动作信息，并控制目标虚拟对象做出相应的动作，达到控制目标虚拟对象的动作的目的，在上述过程中，仅获取了该目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息，而不是获取虚拟场景中所有虚拟对象的信息，可以提高电子游戏的公平性，也可以真实模拟现实场景中玩家基于终端界面的显示图像进行控制操作的场景。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种模型训练***的示意图；

图2是本发明实施例提供的一种动作获取模型训练方法流程图；

图3是本发明实施例提供的一种动作获取模型的训练方法的平台架构示意图；

图4是本发明实施例提供的一种自动化***的功能示意图；

图5是本发明实施例提供的一种图像识别模块的功能示意图；

图6是本发明实施例提供的一种AI训练***的功能示意图；

图7是本发明实施例提供的一种虚拟对象的动作控制方法流程图；

图8是本发明实施例提供的一种游戏场景下的虚拟对象的动作控制示意图；

图9是本发明实施例提供的一种虚拟对象的动作控制装置的结构示意图；

图10是本发明实施例提供的一种计算机设备的结构框图；

图11是本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例主要涉及电子游戏或者模拟训练场景，以电子游戏场景为例，用户可以提前在该终端上进行操作，该终端检测到用户的操作后，可以下载电子游戏的游戏配置文件，该游戏配置文件可以包括该电子游戏的应用程序、界面显示数据或虚拟场景数据等，以使得该用户在该终端上登录电子游戏时可以调用该游戏配置文件，对电子游戏界面进行渲染显示。用户可以在终端上进行触控操作，该终端检测到触控操作后，可以确定该触控操作所对应的游戏数据，并对该游戏数据进行渲染显示，该游戏数据可以包括虚拟场景数据、该虚拟场景中虚拟对象的行为数据等。

本发明涉及到的虚拟场景可以用于模拟一个三维虚拟空间，也可以用于模拟一个二维虚拟空间，该三维虚拟空间或二维虚拟空间可以是一个开放空间。该虚拟场景可以用于模拟现实中的真实环境，例如，该虚拟场景中可以包括天空、陆地、海洋等，该陆地可以包括沙漠、城市等环境元素，用户可以控制虚拟对象在该虚拟场景中进行移动，该虚拟对象可以是该虚拟场景中的一个虚拟的用于代表用户的虚拟形象，该虚拟形象可以是任一种形态，例如，人、动物等，本发明对此不限定。该虚拟场景中可以包括多个虚拟对象，每个虚拟对象在虚拟场景中具有自身的形状和体积，占据虚拟场景中的一部分空间。

以射击类游戏为例，用户可以控制虚拟对象在该虚拟场景的天空中自由下落、滑翔或者打开降落伞进行下落等，在陆地上中跑动、跳动、爬行、弯腰前行等，也可以控制虚拟对象在海洋中游泳、漂浮或者下潜等，当然，用户也可以控制虚拟对象乘坐载具在该虚拟场景中进行移动，在此仅以上述场景进行举例说明，本发明实施例对此不作具体限定。用户也可以控制虚拟对象通过兵器与其他虚拟对象进行战斗，该兵器可以是冷兵器，也可以是热兵器，本发明对此不作具体限定。例如，用户可以控制虚拟对象使用枪械兵器瞄准射击其他虚拟对象，终端可以在屏幕中显示瞄准点，该瞄准点可以用于表示虚拟对象的瞄准方向，用户可以根据该瞄准点，确定攻击落点。

在一种可能实现方式中，终端还可以自行控制虚拟对象在虚拟场景中做出不同的动作，而无需用户操作。在本发明实施例中，目标虚拟对象即是指由机器人控制的虚拟对象，而不是由用户控制的虚拟对象。对于由机器人控制的虚拟对象，无需用户做出控制操作，终端即可根据虚拟对象的信息，确定该虚拟对象下一步的动作，并控制虚拟对象做出下一步动作。而对于由用户控制的虚拟对象，用户需在终端上进行控制操作，终端在检测到用户的控制操作后，才可根据该控制操作，控制虚拟对象做出该控制操作对应的动作。而如果没有检测到用户的控制操作，则终端不会控制虚拟对象做任何动作。例如，对于由机器人控制的虚拟对象，在人机对战模式，或在测试场景中，通常终端可以自行开始电子游戏，并在电子游戏中控制虚拟对象在虚拟场景中移动，例如，跑动或爬动等，或者在电子游戏中控制虚拟对象在虚拟场景中拾取虚拟道具，或控制虚拟道具攻击其他虚拟对象。

在本发明实施例中，可以通过模型训练***，训练如何控制虚拟对象的动作，以真实模拟现实玩家在进行电子游戏时的操作控制。图1是本发明实施例提供的一种模型训练***的示意图，具体地，在一种可能实现方式中，该模型训练***可以包括计算机设备101和多个计算机设备102。在另一种可能实现方式中，该模型训练***也可以仅包括计算机设备101。

其中，在一种可能实现方式中，该计算机设备101和多个计算机设备102可以通过网络连接，也可以通过数据线连接，本发明实施例对此不作限定。该计算机设备101可以用于训练动作获取模型，该动作获取模型即用于根据虚拟对象的相关信息，确定如何控制虚拟对象在虚拟场景中做出哪个动作。该计算机设备102用于自行进行电子游戏，并将电子游戏中终端界面的图像发送至该计算机设备101，从而实现样本数据的采集。该计算机设备102即可根据采集到的样本数据，训练动作获取模型。

在另一种可能实现方式中，该计算机设备101中包括样本数据库，在该样本数据库中预先存储有样本数据，该计算机设备101在训练动作获取模型时，可以从该样本数据库中获取样本数据，从而进行模型训练过程。

需要说明的是，本发明实施例中计算机设备在进行动作获取模型训练时可以采用上述两种实现方式中任一种，也可以采用两种实现方式，本发明实施例对此不作限定。

图2是本发明实施例提供的一种动作获取模型训练方法流程图，该动作获取模型训练方法可以应用于计算机设备，该计算机设备可以为终端，也可以为服务器，本发明实施例对此不作限定。参见图2，该方法可以包括：

201、计算机设备获取多个样本虚拟对象的样本信息和每个样本虚拟对象的视野范围内的样本环境信息，一个样本虚拟对象的样本信息和样本环境信息对应。

在本发明实施例中，控制虚拟对象需要做哪个动作时，需要考虑到该虚拟对象当前的状态和看到该虚拟对象的视野画面中的环境情况，则计算机设备可以获取样本虚拟对象的样本信息和该样本虚拟对象的视野范围内的样本环境信息，并基于上述样本数据，确定样本虚拟对象做哪个动作，并基于该样本虚拟对象做这个动作是否与用户操作是否相同，或者该样本虚拟对象做这个动作是否对自身有益，从而训练该动作获取模型，使得通过该动作获取模型，可以确定当前状态下对样本虚拟对象更有利的动作，或者更贴近用户选择的动作。

其中，该样本虚拟对象的样本信息可以包括该样本虚拟对象的虚拟收益，例如，积分或金币、该样本虚拟对象击败敌方虚拟对象的数量等，也可以包括该样本虚拟对象的属性信息，例如，该样本虚拟对象的生命值，该环境信息包括虚拟环境的信息和该虚拟环境中其他虚拟对象的信息。例如，该虚拟对象的视野范围内的建筑物位置，该虚拟对象的位置，以及该虚拟环境中其他虚拟对象的位置等。当然，该样本信息和样本环境信息还可以包括其他信息，例如，控制的虚拟道具的类型或虚拟道具的数量等，本发明实施例对此不作限定。

计算机设备可以获取样本数据，从而基于样本数据，对初始动作获取模型进行训练，得到动作获取模型。具体地，基于上述模型训练***的不同实现方式，该样本数据可以包括多种获取方式：

第一种方式、计算机设备实时采集样本数据。具体地，该第一种方式具体可以通过以下步骤(1)和(2)实现：

(1)计算机设备获取多个样本虚拟对象的样本图像，每个样本虚拟对象的样本图像均为该样本虚拟对象的视野画面。

计算机设备可以从其他计算机设备中获取样本图像，也可以从自身获取样本图像，例如，在电子游戏场景中，其他计算机设备可以正在运行电子游戏，该计算机设备可以获取该其他计算机设备的终端界面的显示图像，在该计算机设备中也可以正在运行电子游戏，该计算机设备也可以获取自身的终端界面的显示图像。

例如，如果该电子游戏为***，则该其他计算机设备可以为手机，也可以为电脑等其他终端，在该电脑等其他终端上可以通过应用运行该***，该应用可以为游戏模拟器，当然，还可以包括一种场景：该计算机设备本地运行该***。当然，该计算机设备中还可以通过多个应用同时运行该***，该应用可以为游戏模拟器，从而该计算机设备可以获取到多个样本虚拟对象的样本图像，本发明实施例对该样本图像的具体来源不作限定。

在一种可能实现方式中，该计算机设备可以同时采集多个其他计算机设备的终端界面的显示图像作为样本图像，也可以同时采集该计算机设备自身的多个正在运行中的应用的显示图像，从而还可以采用多个进程并行处理该多个样本图像，也即是可以采用多个进程并行对多个样本图像进行识别。其中，多个其他计算机设备的型号可以相同，也可以不同，本发明实施例对该多个其他计算机设备的具体型号不作限定。

(2)对于每个样本虚拟对象的样本图像，计算机设备对该样本图像进行识别，得到该样本虚拟对象的样本信息和该样本虚拟对象的视野范围内的样本环境信息。

计算机设备可以对采集到的样本图像进行图像识别，得到后续进行模型训练所需的样本数据。具体地，在该计算机设备中还可以预设有图像识别算法，则该计算机设备可以采用图像识别算法，对样本图像进行识别，以得到样本数据。与上述步骤(1)中的内容同理，该计算机设备可以采用多个进程并行对多个样本图像进行识别。具体地，计算机设备可以创建图像进程，每个图像进程在某个时刻仅可以对一帧图像进行识别，在对该图像识别完成后，计算机设备还可以销毁该图像进程，本发明实施例在此不多做赘述。

在一种可能实现方式中，计算机设备还可以采用动态链接库更新该图像识别算法。具体地，如何更新该图像识别算法，可以通过由相关技术人员确定该动态链接库的相关信息实现，本发明实施例对此不作限定。这样可以适用于某些特定电子游戏的图像对图像识别算法的需求不同的情况，从而提高了上述动作获取模型训练方法的实用性和适用性。

第二种方式、计算机设备获取预先存储的样本数据。

该计算机设备在需要进行模型训练时，获取预先存储的样本数据即可，不同于第一种方式，在该第二种方式中，计算机设备无需实时采集样本图像，也无需对样本图像进行识别，可以省去图像识别步骤，节省了模型训练过程所需花费的时间，从而提高了模型训练的效率。

具体地，该第二种方式可以为：计算机设备从样本数据库中获取多个样本虚拟对象的样本信息和该多个样本虚拟对象的视野范围内的环境信息，每个样本虚拟对象的样本信息和样本环境信息携带有动作标签。

在该第二种方式中，该计算机设备中可以预设有样本数据库中，该样本数据库中可以预先存储有多个样本虚拟对象的样本信息和该多个样本虚拟对象的视野范围内的环境信息。与上述第一种方式不同的是，该每个样本虚拟对象的样本信息和样本环境信息还可以携带有动作标签。该动作标签是指该样本虚拟对象在当前样本信息和样本环境信息时将要做出的动作，具体地，该动作标签可以为动作的信息，也可以为动作的指令，当然，该动作标签还可以是预先为该动作的信息或该动作的指令设置的动作编号，本发明实施例对此不作限定。例如，该样本虚拟对象在生命值较少，且生命值正在逐渐减少的状态时，将要做出的动作为使用药品，以补充生命值。

其中，该样本数据库中的样本数据的获取过程通过下述步骤(1)至步骤(3)实现：

(1)计算机设备获取多个样本视频文件包括的样本图像，每帧样本图像为每个样本虚拟对象的视野画面。

该计算机设备可以获取多个样本视频文件，每个样本视频文件中包括多帧样本图像，且每帧样本图像均为每个样本虚拟对象的视野画面。该多个样本视频文件可以为在该计算机设备上预先录制得到，也可以在其他计算机设备上预先录制，并从该其他计算机设备处获取得到，本发明实施例对此不作限定。例如，在电子游戏场景中，可以在多个计算机设备中运行该电子游戏，并录制该电子游戏的全部显示图像得到样本视频文件。

(2)对于多帧样本图像中任一帧样本图像，计算机设备对该样本图像进行识别，得到样本虚拟对象的样本信息、该样本虚拟对象的视野范围内的样本环境信息和该样本虚拟对象的样本动作信息。

与上述第一种方式中的步骤(2)同理，计算机设备也可以对采集到的样本图像进行图像识别，得到样本数据。需要说明的是，在该第二种方式的步骤(2)中，计算机设备还可以对图像进行识别得到该样本虚拟对象的样本动作信息。其中，该样本动作信息可以为该样本虚拟对象的动作的信息，也可以为该样本虚拟对象的动作的指令，当然，该样本动作信息还可以是预先为该动作的信息或该动作的指令设置的动作编号，本发明实施例对此不作限定。具体地，该计算机设备可以通过对该图像中各个控制按钮的显示状态进行识别，从而得到该样本虚拟对象的样本动作信息。当然，该计算机设备还可以通过其他方式得到该样本动作信息，本发明实施例对此不作限定。

(3)计算机设备基于该样本动作信息生成动作标签，并将该样本信息、样本环境信息和该动作标签对应存储于样本数据库中。

计算机设备可以将该样本动作信息作为该样本信息和样本环境信息的动作标签，该动作标签即用于标识该样本虚拟对象在当前状态下时，用户进行了哪种控制操作，或控制该样本虚拟对象的计算机设备做出了哪种控制操作，则以此作为当前状态下该样本虚拟对象的一个动作标准，在后续进行模型训练使得训练得到的动作获取模型可以在虚拟对象的信息和环境信息与该样本信息和样本环境信息相同时，输出与该动作标签对应的样本动作信息相同的动作信息。

202、计算机设备将多个样本信息和多个样本环境信息输入初始动作获取模型中，得到每个样本虚拟对象的目标动作信息。

在该计算机设备中可以预设有初始动作获取模型，该初始动作获取模型的模型参数均为预设的初始值。具体地，该初始动作获取模型中可以包括多个数据处理模块，每个数据处理模块对应于一个数据处理功能，该多个数据处理模块中还可以包括多个数据处理子模块，每个数据子模块对应数据处理功能的一种处理方式。需要说明的是，该初始动作获取模型具体包括哪几个数据处理模块，以及每个数据处理模块中包括哪几种数据处理子模块，均可以由相关技术人员根据实际需求自定义设置，本发明实施例对此不作限定。

上述多个数据处理模块可以串联在一起，对于任一个数据处理模块，则计算机设备可以基于上个数据处理模块的数据处理结果，确定下个数据处理模块具体采用哪个数据处理子模块，从而可以采用该数据处理子模块对样本数据进行处理，得到该数据处理模块的数据处理结果。

例如，该动作获取模型中可以包括样本确定模块，计算机设备可以确定是否将本次输入的样本信息和样本环境信息作为样本数据，如果是，则计算机设备可以将该样本信息和样本环境信息作为样本数据，并将结果输入至下一数据处理模块，则下一数据处理模块可以继续对该样本数据进行处理。当然，还可以将该样本信息和样本环境信息存储于样本数据库中，如果否，则可以将丢弃该样本信息和样本环境信息。

又例如，该动作获取模型中还可以包括数据类型判断模块和数据计算模块，对于上述样本信息和样本环境信息中的全部或部分信息，该数据类型判断模块可以根据该模块的初始参数，对上述信息的类型进行判断，并将判断结果输入下个数据计算模块中，该数据计算模块可以根据上述判断结果，选择该信息的类型相应的数据计算方式，从而可以基于该数据计算方式对上述信息中包括的相关数据进行计算，从而再进一步将结果输入下个数据处理模块。最终，由该动作获取模块中的最后一个数据处理模块，判断该样本信息和样本环境信息对应的目标动作信息。

也即是，在该步骤202中，该计算机设备将获取到的样本信息和样本环境信息输入该初始动作获取模型中，该初始动作获取模型中各个数据处理模块可以基于初始参数，对该样本信息和样本环境信息进行处理，并最终输出该样本信息和样本环境信息对应的目标动作信息。

203、对于每个目标动作信息，计算机设备基于该样本虚拟对象的样本信息对应的动作标签，或该样本虚拟对象的信息、环境信息的变化情况，确定该目标动作信息的准确度。

上述步骤201中获取样本虚拟对象的样本信息、样本环境信息的获取方式不同，在该步骤203中，计算机设备确定目标动作信息的准确度的方式也不同。具体地，对应于上述步骤201中的两种方式，该目标动作信息的准确度的确定方式也可以包括以下两种方式：

第一种方式、计算机设备控制该样本虚拟对象按照该目标动作信息做出相应的动作，根据该样本虚拟对象的信息的变化情况或该样本虚拟对象的环境信息的变化情况，确定该目标动作信息的准确度。

该第一种方式即为：对于每个目标动作信息，计算机设备基于该样本虚拟对象的信息、环境信息的变化情况，确定该目标动作信息的准确度。

对应于步骤201中的第一种方式，计算机设备可以实时采集样本虚拟对象的样本信息和样本环境信息，则在确定了目标动作信息后，可以通过控制该样本虚拟对象按照该目标动作信息做出相应的动作，确定该样本虚拟对象的样本信息或样本环境信息的变化情况，来确定该目标动作信息是否能使得该样本虚拟对象的状态更好，使得该样本虚拟对象在与其他虚拟对象战斗时更具优势。

由于该目标动作信息可以包括不用的形式，该控制该样本虚拟对象按照该目标动作信息做出相应的动作也可以包括不同的实现方式。具体地，目标动作信息可以为动作指令，则该计算机设备可以执行该动作指令，以实现控制该样本虚拟对象按照该目标动作信息做出相应的动作。该目标动作信息还可以为动作的信息，则该计算机设备可以根据该动作的信息，获取相应的动作指令，从而可以执行动作指令，本发明实施例对具体采用哪种实现方式不作限定。

例如，该样本虚拟对象的生命值是否提高，或者该样本虚拟对象的虚拟收益是否提高，或者该样本虚拟对象击败其他虚拟对象的数量是否增加等，具体该样本虚拟对象的信息的变化情况或环境信息的变化情况与目标动作信息的准确度的对应关系可以由相关技术人员根据需求进行设置，本发明实施例对此不作限定。

第二种方式、计算机设备基于该目标动作信息和该样本虚拟对象的样本信息对应的动作标签，确定该目标动作信息的准确度。

该第二种方式即为：对于每个目标动作信息，计算机设备基于该样本虚拟对象的样本信息对应的动作标签，确定该目标动作信息的准确度。

对应于步骤201中的第二种方式，该样本信息和样本环境携带有动作标签，则计算机设备可以将该动作标签作为动作标准，判断上述初始动作获取模型输出的目标动作信息的准确度。在一种可能实现方式中，该计算机设备可以计算该目标动作信息和动作标签的相似度，从而将该相似度作为目标动作信息的准确度，或者通过预设的相似度与准确度之间的对应关系，确定该目标动作信息的准确度。

当然，该计算机设备还可以通过其他方式确定目标动作信息的准确度，例如，在该计算机设备中预设有目标动作信息之间的相似度或目标动作信息之间的准确度，也即是，计算机设备确定第一目标动作信息，动作标签为第二目标动作信息时，准确度为80％，计算机设备确定第二目标动作信息，动作标签为第一目标动作信息时，准确度为90％，本发明实施例对此不作限定。

204、计算机设备根据该准确度，对该初始动作获取模型中的参数进行调整，直到符合预设条件时，得到动作获取模型。

计算机设备在获取到目标动作信息的准确度后，可以根据该准确度，调整动作获取模型中的参数，再基于调整后的参数，针对其他样本数据，执行上述步骤201至步骤204，得到其他样本数据对应的目标动作信息和该目标动作信息的准确度，并多次对训练中的动作获取模型的参数进行调整。

需要说明的是，对于任一个样本数据，计算机设备在执行上述步骤201至步骤203时均为一次迭代过程，在每次迭代过程后，该计算机设备可以执行步骤204，对训练的动作获取模型中的参数进行调整，直到符合预设条件时，动作获取模型训练完成。在一种可能实现方式中，该预设条件可以为准确度收敛，也可以为迭代次数达到预设次数，也即是上述每次迭代过程后对参数进行调整，直到某次迭代后准确度收敛，或者某次迭代后迭代次数达到预设次数时，动作获取模型训练完成。其中，该准确度收敛可以通过梯度下降算法确定，也可以通过其他方式确定，本发明实施例对此不作限定。当然，该预设条件还可以为其他预设条件，需要说明的是，该预设条件可以由相关技术人员预先设置，本发明实施例对此不作限定。

在一个具体的可能实施例中，还可以通过测试样本对上述训练得到的动作获取模型进行测试，如果准确度符合条件，则可以确定训练得到的动作获取模型可以作为后续使用的成品，否则，则可以继续采集更多样的样本数据对动作获取模型进行训练，本发明实施例在此不多做赘述。

在一个具体的可能实施例中，在上述动作获取模型训练方法中，还可以预设有操作***层，则可以在不同的操作***的计算机设备中进行上述模型训练过程，当然，上述训练得到的动作获取模型也可以适用于不同的操作***，提高了上述模型训练方法的实用性和适用性。

在一个具体的可能实施例中，如图3所示，用于实施上述动作获取模型的训练方法的平台架构可以包括：自动化***、图像识别模块和人工智能(Artificial Intelligence，AI)训练***。

对于自动化***，如图4所示，该自动化***可以具有手机管理、模拟器管理、本地游戏管理、图像进程管理和Tensor flow版本管理等功能。

其中，该手机管理是指对多个手机设备的管理、与多个手机设备的数据交互、控制该多个手机设备进行游戏安装和游戏登录等。模拟器管理是指控制多个本地模拟器进行游戏安装和游戏登录以及与该多个本地模拟器的数据交互。本地游戏管理是指控制该计算机设备自身的本地游戏启动、进行数据截取以及进程通信等。图像进程管理是指负责图像进程的创建与销毁，Tensorflow版本管理是指负责Tensorflow版本的升级、更新和部署等。

例如，该计算机设备可以与多个手机设备相连接，从该多个手机设备中获取样本数据，则该自动化***可以控制该多个手机设备安装并运行某个电子游戏，具体地，还可以登录该电子游戏，开始游戏，并进入电子游戏后，控制虚拟对象与其他虚拟对象进行战斗，还可以通过数据交互，获取到样本数据。同理地，该计算机设备也可以控制多个使用模拟器，或控制自身本地游戏进行上述游戏启动以及样本数据获取的过程。该图像进程管理是用于对图像识别模块中的图像进程的管理。Tensorflow版本则是指在该模型训练过程中生成不同版本的模型或者对该平台架构进行了改动后生成新版本时均可以自行对版本进行升级、更新和部署等。

对于图像识别模块，如图5所示，该图像识别模块可以具有图像采集、图像识别并输出识别结果等功能。该图像识别模块可以根据AI训练***的需求启动一个或者多个图像识别进程。该图像识别模块可以包括图像采集子模块、图像识别子模块和用户界面(UserInterface，UI)自动化控制模块。

其中，图像采集子模块可以从数据源采集图像，图像识别子模块可以采用图像识别算法对图像进行识别，并根据识别结果确定是否输入AI训练***，还是进行UI自动化控制。对于未进入电子游戏的场景，也即是未进入虚拟场景时，可以进行UI自动化控制，例如，关闭推送窗口，点击“开始游戏”按钮等，对于已进入电子游戏时的场景，也即是已进入虚拟场景时，可以将识别结果输入AI训练***，作为模型训练的样本数据。具体地，上述逻辑均可以由该计算机设备中的控制脚本中的内容确定，本发明实施例在此不多做赘述。

其中，在***场景中，上述数据源可以为：直接在手机上运行的游戏、在PC中运行的手游模拟器运行的游戏、在训练机器(计算机设备)本地运行的游戏以及提前录制的游戏视频。该计算机设备从数据源中获取图像时，可以根据配置文件或者输入命令来实现图像获取过程。

在一种可能实现方式中，上述图像识别模块的识别过程可以包括：根据脚本的配置来识别UI和游戏内容。其中，识别UI是指识别UI的状态，并根据UI状态自动完成UI界面点击进入游戏和退出游戏等操作。游戏内容即是指上述输入AI训练***的样本数据，也即是，上述样本虚拟对象的样本信息和样本虚拟对象的视野范围内的环境信息。例如，比分、击杀数、血量或地图位置信息等。

需要说明的是，上述将图像采集子模块与图像识别子模块合并为图像识别模块可以降低数据传输中的带宽开销，为后面多路并行训练的过程留出足够的内存带宽。

对于AI训练***，如图6所示，该AI训练***中可以有预设的AI Demo(动作获取模型)，例如，Q值深度学习网络(Deep Q-Learning Network，DQN)、Double DQN或A3C(Asynchronous Advantage Actor-Critic)等深度强化学习模型，也可以包括基于动作克隆(Behavioral Cloning)的模仿学习模型，或其他深度学习模型，当然，相关技术人员也可以根据需求设置其他模型以供训练，具体可以通过AI训练接口进行设置，本发明实施例对此不作限定。该AI训练***中还可以对样本数据进行管理，例如，可以将采集到的样本存储到样本数据库中，该AI训练***中还可以包括在线训练样本库和离线训练样本库。其中，该在线训练样本库中的样本数据的来源方式即对应于上述步骤201中第一种方式，该离线训练样本库中的样本数据的来源方式即对应于上述步骤201中第二种方式。该AI训练***还可以设置有动作模块，该动作模块中可以包括动作接口，可以通过该动作接口输出目标动作信息，以控制虚拟对象的动作。

在一种可能实现方式中，在该计算机设备中还可以包括一些特殊接口，对于一些特定的游戏，该游戏的开发者可以提供特殊接口以实现游戏的样本数据采集、同步和参数收集等过程，本发明实施例对此不作限定。

本发明实施例通过采集样本虚拟对象的样本信息和该样本虚拟对象的视野范围内的样本环境信息，对初始动作获取模型进行训练，得到动作获取模型，使得该动作获取模型可以根据虚拟对象的信息和该虚拟对象的视野内的环境信息，可以准确地做出判断，确定对该虚拟对象的动作控制，而不是在获知所有虚拟对象的信息后进行判断，提高了电子游戏的公平性，可以真实模拟现实场景中人在控制虚拟对象时当前状态下会进行的控制操作。

进一步地，上述模型训练过程中训练进程可以和游戏进程异步进行，而无需与游戏进程同步，相较于相关技术中训练和游戏的进程同步的设计，提高了实用性，也提高了训练方法的效率。且进一步地，相较于相关技术中训练过程中的奖励参数需要调用游戏内部接口获取，本发明实施例中通过获取游戏图像，对图像进行识别获取到样本数据，无需调用游戏内部接口，提高了模型训练的实用性和便捷性。

上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。

图7是本发明实施例提供的一种虚拟对象的动作控制方法流程图，该虚拟对象的动作控制方法可以应用于计算机设备，该计算机设备可以为终端，也可以为服务器，在此仅以终端为例进行说明，参见图7，该方法可以包括：

701、终端获取终端界面的显示图像，该显示图像为该目标虚拟对象的视野画面。

在该终端中可以预设有动作获取模型，具体地，该动作获取模型可以通过上述模型训练方法在该终端中训练得到，也可以由上述计算机设备训练得到动作获取模型后，将该动作获取模型进行封装为安装包或配置文件，并发送至该终端。在该终端需要确定由终端自行控制的虚拟对象的动作时，可以调用该动作获取模型，确定虚拟对象的目标动作信息，也即是确定虚拟对象下一步做哪种动作。

终端可以获取终端界面的显示图像，该显示图像是指该目标虚拟对象的视野画面，终端可以从该显示图像中提取目标虚拟对象的信息和该视野画面中的其它信息，以控制该目标虚拟对象做出下一个动作。其中，该目标虚拟对象即是指上述由终端自行控制的虚拟对象，也即是，该目标虚拟对象为由机器人控制的虚拟对象，而不是由用户控制的虚拟对象。

702、终端对该显示图像进行识别，得到该目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息。

与步骤201中的内容同理，终端可以对该显示图像进行识别，得到该目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息。其中，该目标虚拟对象的信息可以包括目标虚拟对象的虚拟收益，例如，积分或金币、该目标虚拟对象击败敌方虚拟对象的数量等，也可以包括该目标虚拟对象的属性信息，例如，该目标虚拟对象的生命值，该环境信息可以包括虚拟环境的信息和该虚拟环境中其他虚拟对象的信息。例如，该目标虚拟对象的视野范围内的建筑物位置，该目标虚拟对象的位置，以及该虚拟环境中其他虚拟对象的位置等。当然，该信息和环境信息还可以包括其他信息，例如，控制的虚拟道具的类型或虚拟道具的数量等，本发明实施例对此不作限定。

上述步骤701和步骤702为获取目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息的过程，上述仅以通过采集图像，并对图像进行识别为例进行说明，通过图像采集和识别的方式，可以无需调用游戏内部接口，即可获取到目标虚拟对象的相关信息，也不需要获取所有虚拟对象的信息，获取过程方便，也不会影响电子游戏的公平性。

703、终端将该目标虚拟对象的信息和该环境信息输入动作获取模型中，由该动作获取模型根据该目标虚拟对象的信息和该环境信息，输出该目标虚拟对象的目标动作信息。

终端可以将识别得到的目标虚拟对象的相关信息输入动作获取模型中，该动作获取模型可以基于训练好的流程和参数，对该相关信息进行处理，得到该相关信息对应的目标动作信息，从而输出目标动作信息。具体地，该动作获取模型在确定目标动作信息时，可以确定多个候选目标动作信息的被选中概率，从而输出被选中概率最大的候选目标动作信息。该动作获取模型可以通过预设的动作接口输出该目标动作信息，以在后续基于该目标动作信息控制虚拟对象的动作。其中，该动作获取模型的获取过程具体可以参见图2所示实施例，本发明实施例在此不多做赘述。

704、终端在终端界面中，控制该目标虚拟对象在虚拟场景中按照该目标动作信息做出动作。

终端可以在步骤701中获取该目标虚拟对象对应的每帧显示图像，并针对每帧显示图像，执行上述步骤702至步骤704，在步骤704中，终端可以根据该目标动作信息，确定该目标虚拟对象在下一帧显示图像中的位置、显示形态以及下一帧中该目标虚拟对象的其他信息等，当然，下一帧显示图像中还可以包括其他虚拟对象的信息，也即是与这帧显示图像中同等类型的信息，本发明实施例在此不一一列举。例如，上述步骤703中，如果该目标动作信息为动作指令，终端确定目标动作信息为使用药品，则终端可以执行该动作指令，则在下一帧显示图像中，该目标虚拟对象的显示形态为正在使用药品。又如果该目标动作信息为使用药品这个动作的信息，则终端可以根据该信息去获取对应的动作指令，来实现上述过程。

例如，上述方法可以应用于游戏应用中，图8是本发明实施例提供的一种游戏场景下的虚拟对象的动作控制示意图，如图8所示，可以根据上述方法在该终端中自动运行某个游戏应用，自动登录游戏、进入游戏，可以实时采集游戏界面的图像，对游戏界面图像进行识别，获取目标虚拟对象的信息和视野范围内的环境信息，从而可以调用预先训练好的动作获取模型，该动作获取模型可以根据获取到的信息，确定目标虚拟对象在下一帧中的动作，从而控制该目标虚拟对象在游戏内进行动作，例如，在第一人称射击游戏(First-person shooting game，FPS)或第三人称射击游戏(Third-person shooting game，TPS)中，终端可以通过上述过程控制目标虚拟对象在游戏内完成地图探索、拾取枪械类虚拟道具、转动视角调整瞄准位置或射击敌人等。

图9是本发明实施例提供的一种虚拟对象的动作控制装置的结构示意图，参见图9，该装置包括：

获取模块901，用于获取目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息；

输入输出模块902，用于将该目标虚拟对象的信息和该环境信息输入动作获取模型中，由该动作获取模型根据该目标虚拟对象的信息和该环境信息，输出该目标虚拟对象的目标动作信息；

控制模块903，用于在终端界面中，控制该目标虚拟对象在虚拟场景中按照该目标动作信息做出动作。

在一种可能实现方式中，该获取模块901用于：

获取该终端界面的显示图像，该显示图像为该目标虚拟对象的视野画面；

对该显示图像进行识别，得到该目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息。

在一种可能实现方式中，该获取模块901还用于获取多个样本虚拟对象的样本信息和每个样本虚拟对象的视野范围内的样本环境信息，一个样本虚拟对象的样本信息和样本环境信息对应；

该输入输出模块902还用于将多个样本信息和多个样本环境信息输入初始动作获取模型中，得到每个样本虚拟对象的目标动作信息；

该装置还包括：

确定模块，用于对于每个目标动作信息，基于该样本虚拟对象的样本信息对应的动作标签，或该样本虚拟对象的信息、环境信息的变化情况，确定该目标动作信息的准确度；

调整模块，用于根据该准确度，对该初始动作获取模型中的参数进行调整，直到符合预设条件时，得到动作获取模型。

在一种可能实现方式中，该获取模块901用于：

获取多个样本虚拟对象的样本图像，每个样本虚拟对象的样本图像均为该样本虚拟对象的视野画面；

对于每个样本虚拟对象的样本图像，对该样本图像进行识别，得到该样本虚拟对象的样本信息和该样本虚拟对象的视野范围内的样本环境信息。

在一种可能实现方式中，该确定模块用于控制该样本虚拟对象按照该目标动作信息做出相应的动作，根据该样本虚拟对象的信息的变化情况或该样本虚拟对象的环境信息的变化情况，确定该目标动作信息的准确度。

在一种可能实现方式中，该获取模块901用于从样本数据库中获取多个样本虚拟对象的样本信息和该多个样本虚拟对象的视野范围内的环境信息，每个样本虚拟对象的样本信息和样本环境信息携带有动作标签。

在一种可能实现方式中，该获取模块901还用于获取多个样本视频文件包括的多帧样本图像，每帧样本图像为每个样本虚拟对象的视野画面；

该获取模块901还用于对于多帧样本图像中任一帧样本图像，对该样本图像进行识别，得到样本虚拟对象的样本信息、该样本虚拟对象的视野范围内的样本环境信息和该样本虚拟对象的样本动作信息；

该装置还包括：

存储模块，用于基于该样本动作信息生成动作标签，并将该样本信息、样本环境信息和该动作标签对应存储于样本数据库中。

在一种可能实现方式中，该确定模块用于基于该目标动作信息和该样本虚拟对象的样本信息对应的动作标签，确定该目标动作信息的准确度。

在一种可能实现方式中，该获取模块901还用于采用图像识别算法，对该样本图像进行识别；

相应地，该装置还包括：

更新模块，用于采用动态链接库更新该图像识别算法。

本发明实施例提供的装置，通过仅获取目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息，通过动作获取模型为该目标虚拟对象规划如何进行移动或如何应对当前场景，从而输出目标动作信息，并控制目标虚拟对象做出相应的动作，达到控制目标虚拟对象的动作的目的，在上述过程中，仅获取了该目标虚拟对象的信息和该目标虚拟对象的视野范围内的环境信息，而不是获取虚拟场景中所有虚拟对象的信息，可以提高电子游戏的公平性，也可以真实模拟现实场景中玩家基于终端界面的显示图像进行控制操作的场景。

需要说明的是：上述实施例提供的虚拟对象的动作控制装置在控制虚拟对象的动作时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的虚拟对象的动作控制装置与虚拟对象的动作控制方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图10是本发明实施例提供的一种计算机设备的结构框图。该计算机设备可以被提供为一终端。该计算机设备1000可以是：智能手机、平板电脑、MP3播放器(Moving PictureExperts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。计算机设备1000还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，计算机设备1000包括有：处理器1001和存储器1002。

处理器1001可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1001可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1001还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1002可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1002中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1001所执行以实现本发明中方法实施例提供的虚拟对象的动作控制方法。

在一些实施例中，计算机设备1000还可选包括有：***设备接口1003和至少一个***设备。处理器1001、存储器1002和***设备接口1003之间可以通过总线或信号线相连。各个***设备可以通过总线、信号线或电路板与***设备接口1003相连。具体地，***设备包括：射频电路1004、触摸显示屏1005、摄像头1006、音频电路1007、定位组件1008和电源1009中的至少一种。

***设备接口1003可被用于将I/O(Input/Output，输入/输出)相关的至少一个***设备连接到处理器1001和存储器1002。在一些实施例中，处理器1001、存储器1002和***设备接口1003被集成在同一芯片或电路板上；在一些其他实施例中，处理器1001、存储器1002和***设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1004用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1004包括：天线***、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它计算机设备进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1004还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本发明对此不加以限定。

显示屏1005用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时，显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时，显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1005可以为一个，设置计算机设备1000的前面板；在另一些实施例中，显示屏1005可以为至少两个，分别设置在计算机设备1000的不同表面或呈折叠设计；在再一些实施例中，显示屏1005可以是柔性显示屏，设置在计算机设备1000的弯曲表面上或折叠面上。甚至，显示屏1005还可以设置成非矩形的不规则图形，也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(OrganicLight-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件1006用于采集图像或视频。可选地，摄像头组件1006包括前置摄像头和后置摄像头。通常，前置摄像头设置在计算机设备的前面板，后置摄像头设置在计算机设备的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1001进行处理，或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在计算机设备1000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1007还可以包括耳机插孔。

定位组件1008用于定位计算机设备1000的当前地理位置，以实现导航或LBS(Location Based Service，基于位置的服务)。定位组件1008可以是基于美国的GPS(Global Positioning System，全球定位***)、中国的北斗***、俄罗斯的格雷纳斯***或欧盟的伽利略***的定位组件。

电源1009用于为计算机设备1000中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，计算机设备1000还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于：加速度传感器1011、陀螺仪传感器1012、压力传感器1013、指纹传感器1014、光学传感器1015以及接近传感器1016。

加速度传感器1011可以检测以计算机设备1000建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号，控制触摸显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1012可以检测计算机设备1000的机体方向及转动角度，陀螺仪传感器1012可以与加速度传感器1011协同采集用户对计算机设备1000的3D动作。处理器1001根据陀螺仪传感器1012采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1013可以设置在计算机设备1000的侧边框和/或触摸显示屏1005的下层。当压力传感器1013设置在计算机设备1000的侧边框时，可以检测用户对计算机设备1000的握持信号，由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在触摸显示屏1005的下层时，由处理器1001根据用户对触摸显示屏1005的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1014用于采集用户的指纹，由处理器1001根据指纹传感器1014采集到的指纹识别用户的身份，或者，由指纹传感器1014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1001授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1014可以被设置计算机设备1000的正面、背面或侧面。当计算机设备1000上设置有物理按键或厂商Logo时，指纹传感器1014可以与物理按键或厂商Logo集成在一起。

光学传感器1015用于采集环境光强度。在一个实施例中，处理器1001可以根据光学传感器1015采集的环境光强度，控制触摸显示屏1005的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1005的显示亮度；当环境光强度较低时，调低触摸显示屏1005的显示亮度。在另一个实施例中，处理器1001还可以根据光学传感器1015采集的环境光强度，动态调整摄像头组件1006的拍摄参数。

接近传感器1016，也称距离传感器，通常设置在计算机设备1000的前面板。接近传感器1016用于采集用户与计算机设备1000的正面之间的距离。在一个实施例中，当接近传感器1016检测到用户与计算机设备1000的正面之间的距离逐渐变小时，由处理器1001控制触摸显示屏1005从亮屏状态切换为息屏状态；当接近传感器1016检测到用户与计算机设备1000的正面之间的距离逐渐变大时，由处理器1001控制触摸显示屏1005从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图10中示出的结构并不构成对计算机设备1000的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图11是本发明实施例提供的一种计算机设备的结构示意图，该计算机设备可以被提供为一服务器，该计算机设备1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)1101和一个或一个以上的存储器1102，其中，该存储器1102中存储有至少一条指令，该至少一条指令由该处理器1101加载并执行以实现上述各个方法实施例提供的虚拟对象的动作控制方法。当然，该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该计算机设备还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由处理器执行以完成上述实施例中的虚拟对象的动作控制方法。例如，该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory，RAM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

上述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种虚拟对象的动作控制方法，其特征在于，所述方法包括：

获取目标虚拟对象的信息和所述目标虚拟对象的视野范围内的环境信息，所述虚拟对象的信息包括虚拟收益；

在终端界面中，控制所述目标虚拟对象在虚拟场景中按照所述目标动作信息做出动作；

其中，所述动作获取模型的训练过程包括：

获取多个样本虚拟对象的样本信息和每个样本虚拟对象的视野范围内的样本环境信息，一个样本虚拟对象的样本信息和样本环境信息对应；

将多个样本信息和多个样本环境信息输入初始动作获取模型中，得到每个样本虚拟对象的目标动作信息；

对于每个目标动作信息，基于所述样本虚拟对象的样本信息对应的动作标签，确定所述目标动作信息的准确度，所述动作标签用于表示所述样本虚拟对象在对应于当前样本信息和样本环境信息时，将要做出的动作；

根据所述准确度，对所述初始动作获取模型中的参数进行调整，直到符合预设条件时，得到动作获取模型。

2.根据权利要求1所述的方法，其特征在于，所述获取目标虚拟对象的信息和所述目标虚拟对象的视野范围内的环境信息，包括：

获取所述终端界面的显示图像，所述显示图像为所述目标虚拟对象的视野画面；

对所述显示图像进行识别，得到所述目标虚拟对象的信息和所述目标虚拟对象的视野范围内的环境信息。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对于每个目标动作信息，基于所述样本虚拟对象的信息、环境信息的变化情况，确定所述目标动作信息的准确度。

4.根据权利要求1所述的方法，其特征在于，所述获取多个样本虚拟对象的样本信息和每个样本虚拟对象的视野范围内的样本环境信息，包括：

获取多个样本虚拟对象的样本图像，每个样本虚拟对象的样本图像均为所述样本虚拟对象的视野画面；

对于每个样本虚拟对象的样本图像，对所述样本图像进行识别，得到所述样本虚拟对象的样本信息和所述样本虚拟对象的视野范围内的样本环境信息。

5.根据权利要求4所述的方法，其特征在于，所述基于所述样本虚拟对象的样本信息对应的动作标签，确定所述目标动作信息的准确度，包括：

控制所述样本虚拟对象按照所述目标动作信息做出相应的动作，根据所述样本虚拟对象的信息的变化情况或所述样本虚拟对象的环境信息的变化情况，确定所述目标动作信息的准确度。

6.根据权利要求4所述的方法，其特征在于，所述基于所述样本虚拟对象的信息、环境信息的变化情况，确定所述目标动作信息的准确度，包括：

7.根据权利要求1所述的方法，其特征在于，所述获取多个样本虚拟对象的样本信息和每个样本虚拟对象的视野范围内的样本环境信息，包括：

从样本数据库中获取多个样本虚拟对象的样本信息和所述多个样本虚拟对象的视野范围内的环境信息，每个样本虚拟对象的样本信息和样本环境信息携带有动作标签。

8.根据权利要求7所述的方法，其特征在于，所述从样本数据库中获取多个样本虚拟对象的样本信息和所述多个样本虚拟对象的视野范围内的环境信息之前，所述方法还包括：

获取多个样本视频文件包括的样本图像，每帧样本图像为每个样本虚拟对象的视野画面；

对于多帧样本图像中任一帧样本图像，对所述样本图像进行识别，得到样本虚拟对象的样本信息、所述样本虚拟对象的视野范围内的样本环境信息和所述样本虚拟对象的样本动作信息；

基于所述样本动作信息生成动作标签，并将所述样本信息、样本环境信息和所述动作标签对应存储于样本数据库中。

9.根据权利要求7所述的方法，其特征在于，所述基于所述样本虚拟对象的样本信息对应的动作标签，或所述样本虚拟对象的信息、环境信息的变化情况，确定所述目标动作信息的准确度，包括：

基于所述目标动作信息和所述样本虚拟对象的样本信息对应的动作标签，确定所述目标动作信息的准确度。

10.根据权利要求4或8所述的方法，其特征在于，所述对所述样本图像进行识别，包括：

采用图像识别算法，对所述样本图像进行识别；

相应地，所述方法还包括：采用动态链接库更新所述图像识别算法。

11.一种虚拟对象的动作控制装置，其特征在于，所述装置包括：

获取模块，用于获取目标虚拟对象的信息和所述目标虚拟对象的视野范围内的环境信息，所述虚拟对象的信息包括虚拟收益；

控制模块，用于在终端界面中，控制所述目标虚拟对象在虚拟场景中按照所述目标动作信息做出动作；

其中，所述获取模块还用于获取多个样本虚拟对象的样本信息和每个样本虚拟对象的视野范围内的样本环境信息，一个样本虚拟对象的样本信息和样本环境信息对应；

所述输入输出模块还用于将多个样本信息和多个样本环境信息输入初始动作获取模型中，得到每个样本虚拟对象的目标动作信息；

所述装置还包括：

确定模块，用于对于每个目标动作信息，基于所述样本虚拟对象的样本信息对应的动作标签，确定所述目标动作信息的准确度，所述动作标签用于表示所述样本虚拟对象在对应于当前样本信息和样本环境信息时，将要做出的动作；

调整模块，用于根据所述准确度，对所述初始动作获取模型中的参数进行调整，直到符合预设条件时，得到动作获取模型。

12.根据权利要求11所述的装置，其特征在于，所述获取模块用于：

13.根据权利要求11所述的装置，其特征在于，所述确定模块用于：

14.根据权利要求11所述的装置，其特征在于，所述获取模块还用于：

从样本数据库中获取多个样本虚拟对象的样本信息和所述多个样本虚拟对象的视野范围内的环境信息，每个样本虚拟对象的样本信息和样本环境信息携带有动作标签；或，

获取多个样本虚拟对象的样本图像，每个样本虚拟对象的样本图像均为所述样本虚拟对象的视野画面；对于每个样本虚拟对象的样本图像，对所述样本图像进行识别，得到所述样本虚拟对象的样本信息和所述样本虚拟对象的视野范围内的样本环境信息。

15.根据权利要求14所述的装置，其特征在于，所述确定模块用于：

16.根据权利要求14所述的装置，其特征在于，所述获取模块还用于对于多帧样本图像中任一帧样本图像，对所述样本图像进行识别，得到样本虚拟对象的样本信息、所述样本虚拟对象的视野范围内的样本环境信息和所述样本虚拟对象的样本动作信息；

所述装置还包括：

存储模块，用于基于所述样本动作信息生成动作标签，并将所述样本信息、样本环境信息和所述动作标签对应存储于样本数据库中。

17.根据权利要求14所述的装置，其特征在于，所述确定模块用于基于所述目标动作信息和所述样本虚拟对象的样本信息对应的动作标签，确定所述目标动作信息的准确度。

18.根据权利要求14或16所述的装置，其特征在于，所述获取模块还用于采用图像识别算法，对所述样本图像进行识别；

所述装置还包括：

更新模块，用于采用动态链接库更新所述图像识别算法。

19.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述指令由所述处理器加载并执行以实现如权利要求1至权利要求10任一项所述的虚拟对象的动作控制方法所执行的操作。

20.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现如权利要求1至权利要求10任一项所述的虚拟对象的动作控制方法所执行的操作。