CN115456162B

CN115456162B - 基于虚拟交互的用户行为习惯学习模型的训练方法及装置

Info

Publication number: CN115456162B
Application number: CN202210968814.9A
Authority: CN
Inventors: 成建国; 谢昱
Original assignee: Xingluo Home Yunwulian Technology Co ltd
Current assignee: Xingluo Home Yunwulian Technology Co ltd
Priority date: 2022-08-12
Filing date: 2022-08-12
Publication date: 2023-07-14
Anticipated expiration: 2042-08-12
Also published as: CN115456162A

Abstract

本发明实施例公开了一种基于虚拟交互的用户行为习惯学习模型的训练方法，该方法包括：设置每个虚拟人在虚拟场景中的行走路径；在预设时间段内控制虚拟人在虚拟场景中按照设定的行走路径进行动作，同时采集按照行走路径行走时触发的各个智能家居设备上传的行为数据；将采集到的行为数据作为相应虚拟人的训练数据，将虚拟人对应的行走路径作为相应的行为习惯标注；基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型。该方法能够省时省力进行训练数据的构建，大大提高了模型训练的效率。此外，还提出了一种基于虚拟交互的智能家居控制模型的训练装置、设备及存储介质。

Description

基于虚拟交互的用户行为习惯学习模型的训练方法及装置

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于虚拟交互的用户行为习惯学习模型的训练方法、装置、设备及存储介质。

背景技术

随着物联网技术的发展，智能家居开始走入了人们的生活。但是目前行业内的普遍问题是智能家居不够“智能”，几乎所有的控制依然需要用户主动通过按键和语音等交互方式主动操作。虽然和传统家居模式相比确实更加便捷，但仍达不到全屋智能的要求。当前智能家居产品在执行动作和场景时所需的用户主动参与度太高，占用用户大量的个人资源。为了实现智能化，现有技术中提出了可以预设一些场景或操作模式来实现智能控制，然而在对其预设时操作繁琐，并且预设的场景或者操作模式很多时候并不能真正贴合用户的实际需求，与用户习惯偏差较大，导致预设的场景或者操作模式无法使用。

随着机器学习技术的发展，目前有人提出了通过机器学习来自动学习用户的行为习惯，根据用户的行为习惯来达到智能控制智能家居设备的目的，比如，用户如果进门之后有打开屋内灯光的习惯，通过机器学习，可以实现当获取到用户进门时，自动进行屋内的灯光打开，不需要用户主动操作就可以智能化的控制。但是由于机器学习是需要大量的训练数据的，而训练数据的获取往往需要很长一段时间，而且需要对训练数据进行人工标注，不仅耗时耗力，而且获取的训练数据往往是各种各样的，需要经过一系列规范化处理才可以，导致模型训练难度加大，这也是目前全屋智能没有全面推广的原因之一。

发明内容

基于此，有必要针对上述训练数据获取耗时耗力、模型训练难度大的问题，提出了一种基于虚拟交互的用户行为习惯学习模型的训练方法、装置、设备及存储介质。该方法实现了快速简便地获取统一数据格式的训练数据，大大降低了模型训练的难度。

一种基于虚拟交互的用户行为习惯学习模型的训练方法，所述方法包括：

设置每个虚拟人在虚拟场景中的行走路径，每个虚拟人对应有唯一的虚拟人标识，所述行走路径是有一系列动作组成的，每个动作对应有相应的时间点；

在预设时间段内控制所述虚拟人在所述虚拟场景中按照设定的所述行走路径进行动作，同时采集所述虚拟人在所述虚拟场景中按照所述行走路径行走时触发的各个智能家居上传的行为数据，所述行为数据包括：动作和对应的时间点；

将所述预设时间段内采集到的与每个虚拟人标识对应的行为数据作为相应虚拟人的训练数据，将所述虚拟人对应的行走路径作为相应的行为习惯标注；

基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型。

一种基于虚拟交互的智能家居控制模型的训练装置，所述装置包括：

设置模块，用于设置每个虚拟人在虚拟场景中的行走路径，每个虚拟人对应有唯一的虚拟人标识，所述行走路径是有一系列动作组成的，每个动作对应有相应的时间点；

采集模块，用于在预设时间段内控制所述虚拟人在所述虚拟场景中按照设定的所述行走路径进行动作，同时采集所述虚拟人在所述虚拟场景中按照所述行走路径行走时触发的各个智能家居上传的行为数据，所述行为数据包括：动作和对应的时间点；

构建模块，用于将所述预设时间段内采集到的与每个虚拟人标识对应的行为数据作为相应虚拟人的训练数据，将所述虚拟人对应的行走路径作为相应的行为习惯标注；

训练模块，用于基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

一种计算机可读存储介质，包括：存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

上述基于虚拟交互的用户行为习惯学习模型的训练方法、装置、计算机设备及存储介质，通过设置虚拟人在虚拟场景中的行走路径来模拟真人在真实环境中的行为操作习惯，当虚拟人在虚拟场景中操作智能家居设备时，会像真实环境一样触发相应的虚拟智能家居设备，虚拟智能家居设备会自动将虚拟人的这些行为数据上传到云端，这样就可以从云端来获取到预设时间段内每个虚拟人对应的行为数据作为训练数据，与此同时，可以将预先设置的虚拟人行走路径作为相应的行为习惯标注，这样不仅可以快速获取到训练数据，而且自动对训练数据进行了标注，省时省力，且该获取得到的训练数据都是统一格式，大大降低了处理的难度，基于训练数据和对应的行为习惯标注对用户行为习惯学习模型进行训练，从而得到了可以用于学习用户行为习惯的用户行为习惯学习模型。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为一个实施例中基于虚拟交互的用户行为习惯学习模型的训练方法的流程图；

图2为一个实施例中基于虚拟交互的用户行为习惯学习模型的训练装置的结构框图；

图3为一个实施例中计算机设备的内部结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，在一个实施例中，一种基于虚拟交互的用户行为习惯学习模型的训练方法，该方法包括：

步骤102，设置每个虚拟人在虚拟场景中的行走路径，每个虚拟人对应有唯一的虚拟人标识，行走路径是有一系列动作组成的，每个动作对应有相应的时间点。

其中，虚拟人可以是3D虚拟人，也可以是简单的虚拟形象。虚拟场景是指通过VR技术构建的可以进行真实交互的虚拟场景。在虚拟场景中设置有各类虚拟的智能家居设备，可以在虚拟场景中通过操作这些智能家居设备实现在虚拟场景中控制相应的智能家居的开启或关闭，还可以实现虚拟场景与真实设备的联动，即通过虚拟场景中的开关实现对现实场景中智能家居设备的控制。为了简易地获取到用于模型训练的训练数据，首先设置虚拟人在虚拟场景中的行走路径，行走路径是有一系列动作组成的，比如，先打开家门的智能锁，然后打开灯光，再然后走到冰箱前，然后打开冰箱，之后关上冰箱，然后走到沙发处，再然后坐下，之后打开电视机等一些列动作。每个动作都设置对应有时间点，然后根据具体的时间点执行对应的动作，即让虚拟人模拟真实人的行为习惯。

为了使得训练得到的用户行为习惯学习模型能够用于后续学习到真实用户的行为习惯。虚拟人采用的是3D虚拟人，这样可以最大程度地模拟真实人的行为习惯，从而最大程度地学习到真实人的行为习惯。之所以设置3D虚拟人，是因为需要3D虚拟人尽量去模仿人的动作，这样摄像头就可以将拍摄到的虚拟人的动作来进行预测，比如，识别到虚拟人每次手上提东西走到冰箱前面时会打开冰箱，那么学习到这些虚拟人的行为习惯后，当下一次识别到虚拟人提着东西走到冰箱前面时，会自动打开冰箱，基于此训练得到的模型用于后续更好地来识别学习到真实人的行为习惯。

步骤104，在预设时间段内控制虚拟人在虚拟场景中按照设定的行走路径进行动作，同时采集虚拟人在虚拟场景中按照行走路径行走时触发的各个智能家居上传的行为数据，行为数据包括：动作和对应的时间点。

其中，预设时间段是指设置的一段时间，比如，一个星期。因为要学习虚拟人(模拟真实人)的行为习惯，所以需要采集一段时间段内的虚拟人的行为习惯数据，该行为习惯数据是通过智能家居采集上传的，比如，用户打开了智能冰箱，智能冰箱会将用户在什么时间点打开了冰箱这个动作上传到云端记录。

步骤106，将预设时间段内采集到的与每个虚拟人标识对应的行为数据作为相应虚拟人的训练数据，将虚拟人对应的行走路径作为相应的行为习惯标注。

其中，预先会设置很多个虚拟人，每个虚拟人都有对应有相应的虚拟人标识(比如，faceID)，将虚拟人标识与对应的行为数据进行关联，将行为数据作为训练数据，同时将之前设置的对应的行走路径作为行为习惯标注，解决了现有的收集数据困难，周期长，且标注困难的问题，相当于传统的构建数据集的方式，该方法大大节约了时间，且数据格式统一，大大降低处理难度。

步骤108，基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型。

其中，初始的用户行为习惯模型是采用神经网络模型作为基础构建的，通过基于训练数据的学习才能得到训练好的用户行为习惯学习模型，训练好的用户行为习惯学习模型可以用于用户行为习惯的学习，后续当需要学习用户行为习惯时，只需要将预设时间段内采集到的用户行为数据作为模型的输入，就可以预测出用户的行为习惯，然后基于用户的行为习惯去控制相应的智能家居设备。

上述基于虚拟交互的用户行为习惯学习模型的训练方法，通过设置虚拟人在虚拟场景中的行走路径来模拟真人在真实环境中的行为操作习惯，当虚拟人在虚拟场景中操作智能家居设备时，会像真实环境一样触发相应的虚拟智能家居设备，虚拟智能家居设备会自动将虚拟人的这些行为数据上传到云端，这样就可以从云端来获取到预设时间段内每个虚拟人对应的行为数据作为训练数据，与此同时，可以将预先设置的虚拟人行走路径作为相应的行为习惯标注，这样不仅可以快速获取到训练数据，而且自动对训练数据进行了标注，省时省力，且该获取得到的训练数据都是统一格式，大大降低了处理的难度，基于训练数据和对应的行为习惯标注对用户行为习惯学习模型进行训练，从而得到了可以用于学习用户行为习惯的用户行为习惯学习模型。

在一个实施例中，所述方法还包括：

将所述虚拟人标识和所述虚拟人标识对应的训练数据作为所述训练好的用户行为习惯学习模型的输入，所述训练好的用户行为习惯学习模型通过对所述训练数据的学习，得到了与所述虚拟人标识对应的虚拟人行为习惯学习模型；

当获取到虚拟人标识和当前动作时，根据所述当前动作采用所述虚拟人行为习惯学习模型输出所述虚拟人的下一步动作，基于所述下一步动作对智能家居设备进行智能控制。

其中，利用训练好的用户行为习惯学习模型对虚拟人的行为习惯进行学习，可以得到与该虚拟人对应的虚拟人行为习惯学习模型，后续根据该虚拟人行为习惯学习模型来预测虚拟人的下一步动作，从而基于下一步动作对智能家居设备进行智能控制。其中，当前动作对应有当前时间的，将当前动作和当前时间点作为相应虚拟人行为习惯学习模型来预测虚拟人的下一步动作。上述训练好的用户行为习惯学习模型是学习得到的通用的基础模型，为了预测具体虚拟人的行为习惯，需要基于该基础模型学习得到对应的虚拟人行为习惯学习模型。比如，学习到虚拟人的行为习惯是先打开门，然后开灯。那当检测到虚拟人打开门这个动作时，自动打开屋内灯光。

在一个实施例中，所述方法还包括：

当真实用户还不存在对应的历史行为数据时，通过问卷的方式获取真实用户的行为习惯，基于所述真实用户的行为习惯与数据库中的N个虚拟人的行为习惯进行相似度计算，将相似度最高的虚拟人标识对应的虚拟人行为习惯学习模型作为所述真实用户的初始行为习惯学习模型；

当获取到一段时间内在真实环境中智能家居设备上传的真实用户的使用行为数据时，基于所述使用行为数据对所述初始行为习惯学习模型进行更新，直到得到与所述真实用户对应的个性化行为习惯学习模型。

其中，目前用户购买完智能家居产品回家后需要很长一段时间内才能学习到用户的真实行为习惯，继而才能实现全屋智能控制，这对于初购买智能家居设备的用户是很不友好的，即用户不能在短期内享受到全屋智能控制的效果。为此，本方案中提出了先训练得到很多个(N个)虚拟人行为习惯学习模型，这N个虚拟人分别代表的是一种真实用户的行为习惯。为了让客户初购买智能家居设备便可享受到智能控制的效果，通过问卷的方式获取真实用户的行为习惯，然后与N个虚拟人的行为习惯进行相似度计算，将相似度最高的作为真实用户的初始行为习惯学习模型，该初始行为习惯学习模型，具体地，将相似度最高的虚拟人行为习惯学习模型下载到用户真实的智能家居场景中，该模型已经有很多习惯是和用户很相似了，所以用户可以快速享受到全屋智能控制的效果，当然和真实用户的行为习惯肯定还是会存在差异的，所以当后续收集到真实环境中真实用户的使用行为数据时会自动对模型进行更新，从而得到与真实用户对应的个性化行为习惯学习模型。且由于之前的行为习惯已经很相似的，即初始化已经很接近了，所以该后续更新模型所花费的时间就大大缩短了，从而提高了个性化行为习惯学习模型的学习效率。

在一个实施例中，基于所述真实用户的行为习惯与数据库中的N个虚拟人的行为习惯进行相似度计算，包括：将所述真实用户的行为习惯进行动作关联拆分，将行为习惯中两两关联动作作为一个目标单元，确定所述真实用户对应的多个目标单元；获取每个虚拟人对应的多个标准单元；将所述真实用户的多个目标单元分别与每个所述虚拟人的多个标准单元进行匹配，得到所述真实用户与每个所述虚拟人的相似度。

其中，为了计算相似度，将真实用户的行为习惯进行动作关联拆分，将相邻的两个关联动作作为一个目标单元，比如，用户习惯进门后开灯，然后开灯后又去打开冰箱，这样就可以将进门-开灯作为一个目标单元，开灯-开冰箱作为一个目标单元，从而得到多个目标单元。然后同样地，将每个虚拟人的行为习惯进行动作关联拆分，为了区分，将虚拟人的两个关联动作称为标准单元。通过将真实用户的多个目标单元分别与虚拟人的多个标准单元进行匹配，匹配数量越多，说明相似度越高。

在一个实施例中，所述方法还包括：当获取到真实用户的当前动作时，将所述真实用户的用户标识和当前动作作为对应的个性化行为习惯学习模型的输入，输出所述真实用户的下一步行为习惯动作；基于所述下一步行为习惯动作向智能家居设备发送控制指令，所述控制指令用于控制相应的智能家居设备的打开或关闭。

其中，在训练得到真实用户对应的个性化行为习惯学习模型后，就可以利用该个性化行为习惯学习模型进行用户习惯的下一步预测，从而可以提前发送控制指令，达到提前预判客户行为，从而给客户提供更加智能的服务。

在一个实施例中，所述方法还包括：当在真实场景中存在多人共用一套智能家居设备时，每个人佩戴有感应手环，所述智能家居设备通过感应手环识别用户标识，将用户标识与相应的操作动作一起上传到云端进行存储。

其中，对于一个家庭来说，往往是有多个家庭成员的，为了能够学习到每个人的行为习惯，需要对用户进行区分识别，即能识别到不同用户。通过给每个成员配备智能手环来达到识别用户的目的，这样将可以将用户标识与相应的操作智能家居的动作一起上传到云端进行存储，从而可以训练得到与每个家庭成员对应的个性化行为习惯学习模型。

在一个实施例中，所述基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型，包括：根据得到的每个虚拟人对应的训练数据和行为习惯标注确定训练数据集和测试数据集；基于所述训练数据集对所述用户行为习惯学习模型进行训练，得到目标用户行为习惯学习模型；基于所述测试数据集对所述目标用户行为习惯学习模型进行验证，若验证符合要求，则将所述目标用户行为习惯学习模型作为所述训练好的用户行为习惯学习模型。

其中，为了对训练得到的模型性能进行校验，在模型训练时，将训练数据分为训练数据集和测试数据集，由测试数据集对训练得到的模型进行验证，验证合格才判定为训练完成。即利用虚拟场景中采集到的训练数据不仅可以对模型进行训练，而且可以完成模型验证，从而实现了利用虚拟场景的训练数据就可以训练完成用户行为习惯学习模型。

如图2所示，提出了一种基于虚拟交互的智能家居控制模型的训练装置，该装置包括：

设置模块202，用于设置每个虚拟人在虚拟场景中的行走路径，每个虚拟人对应有唯一的虚拟人标识，所述行走路径是有一系列动作组成的，每个动作对应有相应的时间点；

采集模块204，用于在预设时间段内控制所述虚拟人在所述虚拟场景中按照设定的所述行走路径进行动作，同时采集所述虚拟人在所述虚拟场景中按照所述行走路径行走时触发的各个智能家居上传的行为数据，所述行为数据包括：动作和对应的时间点；

构建模块206，用于将所述预设时间段内采集到的与每个虚拟人标识对应的行为数据作为相应虚拟人的训练数据，将所述虚拟人对应的行走路径作为相应的行为习惯标注；

训练模块208，用于基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型。

在一个实施例中，上述装置还包括：

学习模块，用于将所述虚拟人标识和所述虚拟人标识对应的训练数据作为所述训练好的用户行为习惯学习模型的输入，所述训练好的用户行为习惯学习模型通过对所述训练数据的学习，得到了与所述虚拟人标识对应的虚拟人行为习惯学习模型；

第一控制模块，用于当获取到虚拟人标识和当前动作时，根据所述当前动作采用所述虚拟人行为习惯学习模型输出所述虚拟人的下一步动作，基于所述下一步动作对智能家居设备进行智能控制。

在一个实施例中，上述装置还包括：

计算模块，用于当真实用户还不存在对应的历史行为数据时，通过问卷的方式获取真实用户的行为习惯，基于所述真实用户的行为习惯与数据库中的N个虚拟人的行为习惯进行相似度计算，将相似度最高的虚拟人标识对应的虚拟人行为习惯学习模型作为所述真实用户的初始行为习惯学习模型；

更新模块，用于当获取到一段时间内在真实环境中智能家居设备上传的真实用户的使用行为数据时，基于所述使用行为数据对所述初始行为习惯学习模型进行更新，直到得到与所述真实用户对应的个性化行为习惯学习模型。

在一个实施例中，计算模块还用于将所述真实用户的行为习惯进行动作关联拆分，将行为习惯中两两关联动作作为一个目标单元，确定所述真实用户对应的多个目标单元；获取每个虚拟人对应的多个标准单元；将所述真实用户的多个目标单元分别与每个所述虚拟人的多个标准单元进行匹配，得到所述真实用户与每个所述虚拟人的匹配度。

在一个实施例中，上述装置还包括：

输出模块，用于当获取到真实用户的当前动作时，将所述真实用户的用户标识和当前动作作为对应的个性化行为习惯学习模型的输入，输出所述真实用户的下一步行为习惯动作；

第二控制模块，用于基于所述下一步行为习惯动作向智能家居设备发送控制指令，所述控制指令用于控制相应的智能家居设备的打开或关闭。

在一个实施例中，上述装置还包括：

上传模块，用于当在真实场景中存在多人共用一套智能家居设备时，每个人佩戴有感应手环，所述智能家居设备通过感应手环识别用户标识，将用户标识与相应的操作动作一起上传到云端进行存储。

在一个实施例中，训练模块还用于根据得到的每个虚拟人对应的训练数据和行为习惯标注确定训练数据集和测试数据集；基于所述训练数据集对所述用户行为习惯学习模型进行训练，得到目标用户行为习惯学习模型；基于所述测试数据集对所述目标用户行为习惯学习模型进行验证，若验证符合要求，则将所述目标用户行为习惯学习模型作为所述训练好的用户行为习惯学习模型。

图3示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图3所示，该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质有存储操作***，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现上述的基于虚拟交互的用户行为习惯学习模型的训练方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行上述的基于虚拟交互的用户行为习惯学习模型的训练方法。本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的设备的限定，具体的设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，所述存储器有存储计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述基于虚拟交互的用户行为习惯学习模型的训练方法的步骤。

在一个实施例中，提出了一种计算机可读存储介质，有存储计算机程序，计算机程序被处理器执行时，使得处理器执行上述基于虚拟交互的用户行为习惯学习模型的训练方法的步骤。

可以理解的是，上述基于虚拟交互的用户行为习惯学习模型的训练方法、装置、计算机设备以及计算机可读存储介质属于一个总的发明构思，实施例可相互适用。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种基于虚拟交互的用户行为习惯学习模型的训练方法，其特征在于，所述方法包括：

在预设时间段内控制所述虚拟人在所述虚拟场景中按照设定的所述行走路径进行动作，同时采集所述虚拟人在所述虚拟场景中按照所述行走路径行走时触发的各个智能家居设备上传的行为数据，所述行为数据包括：动作和对应的时间点；

基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型；

所述方法还包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，基于所述真实用户的行为习惯与数据库中的N个虚拟人的行为习惯进行相似度计算，包括：

将所述真实用户的行为习惯进行动作关联拆分，将行为习惯中两两关联动作作为一个目标单元，确定所述真实用户对应的多个目标单元；

获取每个虚拟人对应的多个标准单元；

将所述真实用户的多个目标单元分别与每个所述虚拟人的多个标准单元进行匹配，得到所述真实用户与每个所述虚拟人的匹配度。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当获取到真实用户的当前动作时，将所述真实用户的用户标识和当前动作作为对应的个性化行为习惯学习模型的输入，输出所述真实用户的下一步行为习惯动作；

基于所述下一步行为习惯动作向智能家居设备发送控制指令，所述控制指令用于控制相应的智能家居设备的打开或关闭。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当在真实场景中存在多人共用一套智能家居设备时，每个人佩戴有感应手环，所述智能家居设备通过感应手环识别用户标识，将用户标识与相应的操作动作一起上传到云端进行存储。

6.根据权利要求1所述的方法，其特征在于，所述基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型，包括：

根据得到的每个虚拟人对应的训练数据和行为习惯标注确定训练数据集和测试数据集；

基于所述训练数据集对所述用户行为习惯学习模型进行训练，得到目标用户行为习惯学习模型；

基于所述测试数据集对所述目标用户行为习惯学习模型进行验证，若验证符合要求，则将所述目标用户行为习惯学习模型作为所述训练好的用户行为习惯学习模型。

7.一种基于虚拟交互的用户行为习惯学习模型的训练装置，其特征在于，所述装置包括：

训练模块，用于基于每个虚拟人对应的训练数据和行为习惯标注对用户行为习惯学习模型进行训练，得到训练好的用户行为习惯学习模型；

8.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述的基于虚拟交互的用户行为习惯学习模型的训练方法的步骤。

9.一种计算机设备，包括存储器和处理器，其特征在于，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述的基于虚拟交互的用户行为习惯学习模型的训练方法的步骤。