CN114358186A

CN114358186A - 一种数据处理方法、装置及计算机可读存储介质

Info

Publication number: CN114358186A
Application number: CN202210004186.2A
Authority: CN
Inventors: 路杰程; 叶碧荣
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-01-04
Filing date: 2022-01-04
Publication date: 2022-04-15

Abstract

本申请实施例公开了一种数据处理方法、装置及计算机可读存储介质。该方法包括：获取目标时间数据序列的关联特征集合，关联特征集合是根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的；基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集；基于数据预测模型的多重加权自注意力机制对第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据；调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。采用本申请，可以在时间以及不同序列特征的多维度上全面、准确地提取时间数据序列的表征信息，提升预测模型的准确度。

Description

一种数据处理方法、装置及计算机可读存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种数据处理方法、装置及计算机可读存储介质。

背景技术

目前，可以通过多元时间数据集合对初始模型进行模型训练，以得到具备一定功能的模型(如具备预测功能的模型)。但是，针对时间数据集合中大量的时间数据序列，通常是通过人工筛选对当前时间数据序列有效的时间数据序列，以确定初始模型的输入数据。通过上述方式确定初始模型的输入数据，可能会漏选对当前时间数据序列有效的时间数据序列，模型无法全面、准确地学习到不同维度特征相互之间的深层联系，进而使得训练出的模型的预测准确度较低。

发明内容

本申请实施例提供一种数据处理方法、装置及计算机可读存储介质，可以在时间以及不同序列特征的多维度上全面、准确地提取到时间数据序列的表征信息，提升预测模型的预测结果的准确度。

本申请实施例一方面提供了一种数据处理方法，包括：

获取目标时间数据序列的关联特征集合，关联特征集合是根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，目标时间数据序列为至少一个时间数据序列中的任意一个；

基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集；

基于数据预测模型的多重加权自注意力机制对第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据；

调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。

本申请实施例一方面提供了一种数据处理装置，包括：

获取模块，用于获取目标时间数据序列的关联特征集合，关联特征集合是根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，目标时间数据序列为至少一个时间数据序列中的任意一个；

上述获取模块，还用于基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集；

处理模块，用于基于数据预测模型的多重加权自注意力机制对第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据；

上述处理模块，还用于调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。

本申请实施例一方面提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行本申请实施例提供的数据处理方法。

本申请实施例一方面提供了一种计算机存储介质，计算机存储介质存储有计算机程序，计算机程序包括程序指令，程序指令当被处理器执行时，执行本申请实施例提供的数据处理方法。

本申请实施例一方面提供了一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括计算机指令，计算机指令存储在计算机可读存储介质中，计算机指令被计算机设备的处理器执行时，执行本申请实施例提供的数据处理方法。

本申请实施例中，数据处理设备可以获取到根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的关联特征集合，以获取到模型训练过程中学习到的全局特征；并基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集；基于数据预测模型的多重加权自注意力机制对第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据，以获取到时间数据序列内部时间维度的特征，以及通过时间数据序列的局部注意力和各个时间数据序列相互间的全局注意力交互的综合注意力；调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，得到第二时间的预测数据，可以在时间以及不同序列特征的多维度上全面、准确地提取到时间数据序列的表征信息，以提升预测模型的预测结果的准确度，并充分利用获取到的全局信息和局部信息，使得数据预测模型可以有效识别预测值的决定因素，从而提升数据预测模型精度以及各个时间数据序列的信息使用率，进而提升拟合效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数据处理***；

图2是本申请实施例提供的一种数据处理方法的流程示意图；

图3是本申请实施例提供的一种第一关联特征子集的示意图；

图4是本申请实施例提供的另一种第一关联特征子集的示意图；

图5是本申请实施例提供的另一种数据处理方法的流程示意图；

图6是本申请实施例提供的一种目标时间数据序列的预测效果示意图；

图7是本申请实施例提供的又一种数据处理方法的流程示意图；

图8是本申请实施例提供的一种计算相关度评价信息流程示意图；

图9是本申请实施例提供的一种确定关联特征集合的流程示意图；

图10是本申请实施例提供的一种相关度评价信息的可视化示意图；

图11是本申请实施例提供的一种第二关联特征子集的示意图；

图12是本申请实施例提供的一种多重自注意力机制的流程示意图；

图13是本申请实施例提供的一种多重自注意力矩阵的可视化示意图；

图14是本申请实施例提供的又一种数据处理方法的流程示意图；

图15是本申请实施例提供的一种初始模型的训练效果示意图；

图16是本申请实施例提供的一种数据处理装置的结构示意图；

图17是本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供了一种数据处理方法，可以有效结合全局数据以及局部特征的交互信息，使得数据预测模型的性能更稳定。本申请实施例提供的数据处理方法可以基于人工智能技术中的一种或者多种技术实现。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

在可行的实施例中，本申请实施例提供的数据处理方法还可以基于云技术(Cloudtechnology)实现。具体可以涉及云技术中的云存储(Cloud storage)、云数据库(CloudDatabase)中的一种或者多种。例如，从云数据库中获取目标时间数据序列的关联特征集合，或者通过云存储对调用数据预测模型处理得到的第二时间的预测数据进行存储。

请参见图1，图1为本申请实施例提供的一种数据处理***。图1所示的数据处理设备10可以是具备数据处理功能的服务器；该数据处理设备10可以用于对初始模型进行训练，以及调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理。图1所示的终端设备11可以具备可视化显示功能；该终端设备11可以用于对数据处理设备10的数据处理过程中产生的各种中间数据、预测结果等进行可视化的显示。可选的，对初始模型进行训练的任务也可以由该终端设备11完成，本申请对此不作限制。其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、车载终端，等等，但并不局限于此。

本申请实施例提供的数据处理方法可以由数据处理设备10执行，具体的：获取目标时间数据序列的关联特征集合，并基于第一时间和预设时间窗从上述关联特征集合中获取第一关联特征子集，基于数据预测模型的多重加权自注意力机制对该第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据，以调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，从而得到第二时间的预测数据，进而有效地结合全局数据以及局部特征的交互信息(即第一时间的特征表示数据)，完成对第二时间对应的数据的预测。其中，上述数据预测模型是基于关联特征集合的第二关联特征子集以及多重加权自注意力机制，对初始模型进行训练得到的。具体的，对初始模型的训练过程可以由数据处理设备10执行：在获取目标时间数据序列的关联特征集合之后，可以基于第三时间和预设时间窗从关联特征集合中获取第二关联特征子集；并基于初始模型的多重加权自注意力机制对该第二关联特征子集进行处理，得到目标时间数据序列在第三时间的特征表示数据；并利用目标时间数据序列在第三时间的特征表示数据，以及目标时间数据序列中对应的参考数据(如目标时间数据序列中第四时间对应的参考数据，该第四时间可以为通过目标时间数据序列在第三时间的特征表示数据进行预测的某一待预测时间)，对初始模型进行训练，从而在多次训练过程之后，可以使该初始模型具备数据预测的功能，进而得到上述数据预测模型，以调用该数据预测模型对第二时间的数据进行预测。

请参见图2，图2是本申请实施例提供的一种数据处理方法的流程示意图。该方法可以由图1所示的数据处理设备执行，具体可由该数据处理设备的处理器执行。该数据处理方法包括如下步骤：

S201，获取目标时间数据序列的关联特征集合，关联特征集合是根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，目标时间数据序列为至少一个时间数据序列中的任意一个。

本申请实施例中，数据处理设备可以调用数据预测模型实现各种不同的功能，例如：数据处理设备可以调用数据预测模型实现预测的功能，或者基于调用数据预测模型得到的预测结果实现分类的功能等等。该数据处理设备在对目标数据进行处理时，可以根据需要具体实现的预测功能确定目标时间数据序列，并从原始数据集(即上述至少一个时间数据序列)中，获取与该目标时间数据序列的相关信息(如相关度较高的其他时间数据序列的集合，即上述关联特征集合)，从而在通过数据预测模型对待预测时间(如下文的第二时间)的数据进行预测时，可以结合全局特征以得到更加准确的预测数据。

其中，上述时间数据序列可以为与时间相关的数据序列，例如：记录着某个城市在某一天不同时间点的降雨量的数据序列，记录着某公司在某一年不同季度的净利润的数据序列，记录着某医院在某个月内每天患感冒人数的数据序列等，本申请对时间数据序列包括的具体内容不作限制。需要说明的是，上述时间数据序列对应的时间，可以为一个时间点(如下午5点)，也可以为一个时间段(如一个月)，本申请对此不作限制。

可选的，目标时间数据序列可以为一个或多个，本申请对此不作限制。可选的，若存在多个目标时间数据序列，则可以分别获取每个目标时间数据序列的关联特征集合，并分别对该每个关联特征集合执行如下步骤的处理，本申请在此不再赘述。

其中，上述关联特征集合中可以包括与目标时间数据序列相关度较高的时间数据序列。该关联特征集合中的各个时间数据序列可以为上述原始数据集中的任一时间数据序列。需要说明的是，由于目标时间数据序列与自身的相关度可以为最高值，因此，上述与目标时间数据序列相关度较高的各个时间数据序列中可以包括目标时间数据序列本身。

示例性的，在医疗场景，假设上述数据处理设备需要实现对下个星期口腔科就诊人数的预测功能，则该数据处理设备可以确定口腔科就诊人数时间数据序列为目标时间数据序列，并从原始数据集中获取与口腔科就诊人数时间数据序列相关度较高的其他时间数据序列，如：医院总就诊人数时间数据序列、所在地天气时间数据序列等，以作为目标时间数据序列的关联特征集合。如表1所示，表1可以为口腔科就诊人数时间数据序列的关联特征集合。

表1

其中，表1中的第一列为各个时间数据序列对应的时间数据，第二列为口腔科就诊人数时间数据序列对应的人数数据，第三列为医院总就诊人数时间数据序列对应的人数数据，第四列为所在地天气时间数据序列对应的天气数据。

需要说明的是，数据处理设备可以通过下文实施例中涉及的组合重要性抽取模块所实施的方法(如下文提及的相关度评价方法)，从原始数据集中获取与目标时间数据序列相关度较高的其他时间数据序列，具体内容请参见下文中的详细描述，本申请在此不再赘述。

S202，基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集。

其中，上述第一时间可以为与待预测时间(即下文提及的第二时间)最相近的，且满足预设时间窗时长的时间。可选的，上述预设时间窗的时长可以为固定时长(如预先设置的固定时长)，也可以为可调整的时长(如在模型训练过程中进行调整过的时长)，本申请对此不作限制。可选的，预设时间窗的步长可以固定数值，也可以为可调数值，本申请对此不作限制。

数据处理设备在获取到待预测时间后，可以基于该待预测时间以及预设时间窗的时长确定第一时间，并根据该第一时间以及预设时间窗，对目标时间数据序列的关联特征集合进行截取。也就是说，以上述第一时间为预设时间窗的起始时间对关联特征集合进行截取，从而获取上述第一关联特征子集。

示例性的，如图3所示，假设预先设置时间窗的时长为3天，步长为每步移动1天的时长，若数据处理设备需要预测第5天的医院总就诊人数，即目标时间数据序列为医院总就诊人数时间数据序列(图3中以S₁表示)，则可以根据该第5天以及上述时间窗的时长，确定第2天为上述第一时间，并可以基于该第一时间以及预先设置的时间窗，从关联特征集合中获取到第一关联特征子集；即以第2天为时间窗的起始时间，从医院总就诊人数的时间数据序列的关联特征集合中，截取从第2天至第4天的数据作为上述第一关联特征子集。

可选的，在根据待预测时间确定出第一时间后，若数据处理设备以第一时间为时间窗的起始时间所截取的第一关联特征子集中，存在未被预测的时间，则可以将该未被预测的时间作为第一待预测时间，以将该第一待预测时间的数据进行预测之后，再对待预测时间的数据进行预测。

示例性的，如图4所示，假设预先设置时间窗的时长为3天，步长为每步移动1天的时长，若数据处理设备需要预测第6天的医院总就诊人数，则可以根据上述时间窗的时长确定第3天为上述第一时间，并可以基于该第一时间以及预先设置的时间窗从关联特征集合中获取到第一关联特征子集。如图4所示，该第一关联特征子集中，第5天为未被预测的时间，则可以将该第5天作为第一待预测时间，以先对该第5天的数据进行预测，并根据该第5天的预测数据再对上述第6天的数据进行预测。

可选的，上述第一待预测时间可以包括至少一个未被预测时间，数据处理设备可以依次将该至少一个未被预测时间的数据进行预测之后，再根据预测出的至少一个预测数据对需要预测的待预测时间的数据进行预测。例如：在图4对应示例的前提下，若数据处理设备需要预测第10天的医院总就诊人数，则可以依次对第5天至第9天的数据，并在获取到该第5天至第9天的预测数据之后，将第7天至第9天的数据作为上述第一关联特征子集，以对第10天的医院总就诊人数进行预测。

需要说明的是，数据处理设备在对第5天至第9天的数据进行预测时，可以将关联特征集合中的各个时间数据序列进行预测以及更新，从而根据更新后的关联特征集合，以对待预测时间(即上述第10天)的数据进行预测。通过上述更新方式，数据处理设备对一部分数据进行预测以及更新后，可以快速地得到更新后的关联特征集合，从而快速地对待预测时间的数据进行预测。

可选的，数据处理设备还可以将原始数据集中的至少一个时间数据序列进行预测以及更新，从而从更新后的至少一个时间数据序列中确定出更新后的关联特征集合，进而根据该更新后的关联特征集合，对待预测时间的数据进行预测。需要说明的是，通过将原始数据集中的至少一个时间数据序列进行预测以及更新，可以再次对原始数据集的全局特征进行评价，以从全局的角度对待预测时间的数据进行预测。可选的，数据处理设备可以根据不同的需求，设置不同的预测更新方式，本申请对此不作限制。

S203，基于数据预测模型的多重加权自注意力机制对第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据。

其中，上述数据预测模型是基于关联特征集合的第二关联特征子集以及多重加权自注意力机制，对初始模型进行训练得到的。该第二关联特征子集可以为对初始模型进行模型训练时所使用的数据，关于该第二关联特征子集的详细描述可参见图7对应的实施例中的相关内容，本申请在此不再赘述。

需要说明的是，上述目标时间数据序列在第一时间的特征表示数据，可以为融合了目标时间数据序列的全局特征、局部特征以及综合特征，且与待预测时间最相近的特征表示数据。其中，该目标时间数据序列在第一时间的特征表示数据，可以通过向量的形式表示，也可以通过矩阵的形式表示，本申请对此不作限制。

其中，上述多重加权自注意力机制可以为数据预测模型中的一个自注意力功能模块(如称作多重加权自注意力模块)，本申请对此不作限制。如图5所示，第一关联特征子集通过数据预测模型的自注意力功能模块(图5中为多重加权自注意力机制)之后，可以得到目标时间数据序列在第一时间的特征表示数据。可以理解的是，如图5所示，该目标时间数据序列在第一时间的特征表示数据，可以作为自注意力功能模块的输出，也可以作为数据预测模型的输入，本申请对此不作限制。

需要说明的是，图2对应实施例中S202和S203的相关内容，与下文图7对应实施例中所涉及的获取第二关联特征子集的相关内容，以及得到目标时间数据序列在第三时间的特征表示数据的相关内容，可以理解为在不同数据处理过程中相同的执行步骤。但是，在图2对应的实施例中，所得到的目标时间数据序列在第一时间的特征表示数据，是用于对第二时间的数据进行预测；在图3对应的实施例中，所得到的目标时间数据序列在第三时间的特征表示数据，是用于对初始模型进行训练。因此，仍然需要将上述两个不同过程中的特征表示数据加以区分。

S204，调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。

数据处理设备获取到上述目标时间数据序列在第一时间的特征表示数据之后，可以调用数据预测模型对该特征表示数据进行处理，以通过该数据预测模型对第二时间(即待预测时间)的数据进行预测，从而得到该第二时间的预测数据。

由前述内容可知，若目标时间数据序列为多个，则可以调用数据预测模型分别对多个目标时间数据序列在第一时间的特征表示数据进行处理，从而得到多个目标时间数据序列在第二时间的预测数据。示例性的，如图6所示，图6示出了三个目标时间数据序列(即目标时间数据序列1、目标时间数据序列2和目标时间数据序列3)对应的预测效果图。

本申请实施例提供的数据处理方法，不仅可以用于传染病发病人数预测、症候群预测、疾病防控指标预测、医保人口结构预测，还可以用于其他医疗、金融、制造等多领域的时间数据序列的预测问题，该数据处理方法能够有效解决传统方法难以处理多维度时间数据序列、不能充分利用多维时序信息、变量筛选困难、模型训练拟合效果差、人力与算力消耗大等现实问题，并且能够高效地支持决策团队对目标时间数据序列的数据进行理解与预测。

本申请实施例中，数据处理设备通过获取目标时间数据序列关联特征集合，可以基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集，并基于数据预测模型的多重加权自注意力机制对该第一关联特征子集进行处理，以得到目标时间数据序列在第一时间的特征表示数据，并调用上述数据预测模型对该目标时间数据序列在第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据，从而使得数据处理设备可以基于目标时间数据序列时间维度以及不同特征维度(全局特征、局部特征以及综合特征)，获取到稳定性更强、可信度更高的预测数据。

图7是本申请实施例提供的一种数据处理方法的流程示意图。该方法可以由图1所示的数据处理设备执行，具体可由该数据处理设备的处理器执行。该数据处理方法包括如下步骤：

S701，获取目标时间数据序列的关联特征集合，关联特征集合是根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，目标时间数据序列为至少一个时间数据序列中的任意一个。

本申请实施例中，数据处理设备在对初始模型进行训练时，可以获取到目标时间数据序列的关联特征集合。可以理解的是，对初始模型进行训练的时间，可以早于调用数据预测模型进行预测的时间；因此，本申请实施例中S701获取到目标时间数据序列的关联特征集合的时间，可以早于图2对应的实施例中S201获取到目标时间数据序列的时间。

可选的，图2对应的实施例中S201获取到的目标时间数据序列，可以为本申请实施例中S701获取到目标时间数据序列的关联特征集合，即数据预测模型应用过程中所使用的关联特征集合可以为初始模型训练过程中所获取的关联特征集合。

需要说明的是，上述S701的相关内容可参见前述图2对应实施例中S201的详细描述，本申请在此不再赘述。

在一种实现方式中，数据处理设备可以获取至少一个时间数据序列；基于至少一个相关度评价方法获取至少一个时间数据序列中任意两个时间数据序列之间的至少一个相关度；基于任意两个时间数据序列之间的至少一个相关度确定该至少一个时间数据序列的相关度评价信息；根据相关度评价信息确定目标时间数据序列的关联特征集合。

其中，数据处理设备可以通过将原始数据集进行分组处理，以得到上述至少一个时间数据序列。可选的，也可以理解为，原始数据集中包括上述至少一个时间数据序列。也就是说，数据处理设备在对初始模型进行训练之前，可以对原始数据集进行获取，以基于该原始数据集中包括的至少一个时间数据序列对初始模型进行训练。

上述相关度评价方法可以为计算上述至少一个时间数据序列中，任意两个时间数据序列之间的相关度的方法。可选的，上述相关度评价方法可以包括一个或多个相关度评价方法。可以理解的是，上述一个或多个相关度评价方法可以对应一个或多个相关度，即一个相关度评价方法可以计算出一个相关度，多个相关度评价方法可以计算出多个相关度。

若上述相关度评价方法为多个，则数据处理设备可以分别利用该多个相关度评价方法中的每一个相关度评价方法，对原始数据集中任意两个时间数据序列之间的至少一个相关度进行计算，以分别确定每一个相关度评价方法对应的相关度评价信息，从而将多个相关度评价方法对应的多个相关度评价信息进行加权求和运算，得到上述相关度评价信息。

本申请实施例中，通过组合重要性抽取架构(即上述多个相关度评价信息加权求和的处理方法)，可以将原始数据集处理为一系列时间数据序列分组，并计算出目标时间数据序列与其他时间数据序列的相关度评价信息，以通过该相关度评价信息筛选出建立该目标时间数据序列对应的数据预测模型的输入集(即上述关联特征集合)。

示例性的，如图8所示，图8中原始数据集S＝(s₁，s₂，...，s_n)^T，原始数据集中的任意一个时间数据序列s_i＝(x_i1，x_i2，...，x_iT)^T，其中，n为时间序列特征数量，x_ij为第i个时间数据序列内的第j个元素，T为时间序列总长度。相关度评价方法o＝(o₁，o₂，...，o_p)，其中，o_i为相关度评价方法中的任意一个相关度评价方法，p为相关度评价方法的数量。数据处理设备可以利用每个o_i分别对原始数据集中进行计算，得到每个o_i对应的相关度评价信息R_i(也可称为相关度评价矩阵)，其中i＝1…p。将每个o_i对应的相关度评价信息R_i经归一化后，可以按照用户需求进行加权求和，从而获取到加权求和后的相关度评价信息(也可称作组合相关度评价信息)。该加权求和后的相关度评价信息即为目标时间数据序列与其他时间数据序列之间的相关度评价信息。具体公式如下：

I＝w_r1R₁+w_r2R₂+…+w_rpR_p∈R^n×n

其中，上述w_r1可以为R₁对应的权重，w_r2可以为R₂对应的权重，w_rp可以为R_p对应的权重。需要说明的是，每个R_i对应的权重可以相同(即w_r1＝w_r2＝…＝w_rp)，也可以不同(即w_r1≠w_r2≠…≠w_rp)，还可以部分相同另一部分不同(即w_r1＝w_r2≠…≠w_rp)，本申请对此不作限制。上述每个R_i对应的权重可以根据用户的不同需求进行调整，本申请对此不作限制。

如图10所示，图10可以为上述I的可视化示意图。由图10可以直观地看出，各个时间数据序列(如图10中的序列1、序列2、序列3和序列4)中的任意两个时间数据序列相互之间的相关度。在图10中，以白色作为相关度评价信息为1，以黑色作为相关度评价信息为0，仅用于举例，不对本申请造成限制。

示例性的，本申请实施例以数据处理设备设置以下三种相关度评价方法为例，进行详细说明：

1、格兰杰因果检验方法(Granger Causality Test Operator)。

格兰杰因果检验方法可以通过对两个时间数据序列的滞后值建立回归模型，以检验该两个时间数据序列的过去值是否对另一个时间数据序列存在显著影响，从而探索一个时间数据序列是否对另一个时间数据序列的预测有贡献，以及两个时间数据序列是否存在时间因果上的联系。数据处理设备可以定义o_granger(l)为使用滞后l期滞后值的因果检验方法，通过该方法可以计算出原数据集中每两个时间数据序列每个滞后值的显著性系数p，并可以将滞后l期的显著性系数相加，以作为该两个时间数据序列的相关度评价信息(可称作R₁)。

2、动态时间规整方法(Dynamic Time Warping Operator)。

动态时间规整方法可以用来衡量两个时间数据序列在形状特征维度以及趋势特征维度上的相似性。该方法可以通过将一个时间数据序列某时间步上的值与另一个时间数据序列上相近时间步上的多个值进行匹配并以此计算距离。在保证每个时间点的值都可以计算到的情况下，数据处理设备可以使用该动态时间规划方法，计算出所有可能匹配中的最短距离。数据处理设备可以定义o_DTW，对每两个时间数据序列计算其相似度距离，以作为该两个时间数据序列的相关度评价信息(可称作R₂)。

3、线性回归方法(Linear Regression Operator)。

数据处理设备可以定义o_OLS，对每两个时间数据序列建立简单的线性回归模型，以计算该两个时间数据序列的回归系数，并获取其显著性p，以作为该两个时间数据序列的相关度评价信息(可称作R₃)。其中，上述线性回归方法可以直接计算出未经转换的原始时间数据序列的相似度。

需要说明的是，数据处理设备通过上述三种相关度评价方法，得到R₁、R₂以及R₃之后，可以对该三个相关度评价信息进行加权求和，以获取到组合了上述三种相关度评价方法后的相关度评价信息。

可选的，上述相关度评价方法可以根据实际时间数据序列的数据结构进行调整、修改或替换。例如：可以将上述线性回归方法中对归一化后数据使用p值计算相关度，改为对归一化后数据同时使用p值与回归系数的组合计算相关度，从而达到量化时间数据序列之间相关度的大小的要求。其中，p值与回归系数的组合可以理解为将p值与回归系数相加，本申请对此不作限制。可选的，数据处理设备还可以根据实际数据类型，选择逻辑斯蒂回归(logistic regression)、最小绝对收缩和选择(Least Absolute Shrinkage andSelection Operator,LASSO)回归、空间距离、或交叉熵等各类损失函数为元素，构建数据处理模型的相关度评价方法，本申请对此不做限制。

在一种实现方式中，根据相关度评价信息包括的目标时间数据序列与至少一个时间数据序列中任一时间数据序列之间的相关度，对至少一个时间数据序列进行排序；根据排序结果从至少一个时间数据序列中确定预设数量个时间数据序列，预设数量个时间数据序列包括目标时间数据序列；将预设数量个时间数据序列添加到目标时间数据序列的关联特征集合中。

需要说明的是，对于两个时间数据序列(如序数为i_c和i_r的时间数据序列)，该两个时间数据序列的相关度评价信息可以为

数据处理设备可以对相关度评价信息(图8中的矩阵I)的每行信息进行排序，以获取排序后的相关度评价信息的向量

以及相关度排序后的时间数据序列

其中，r_i1...n为排序后的时间数据序列，所对应的原始时间数据序列下标。例如：假设目标时间数据序列为s_i，按照相关度排序后s_i对应的I_i中可以包括

其中，可以看出

在原始时间数据序列中排在第一位，

在原始时间数据序列中排在第四位，

在原始时间数据序列中排在第三位，

在原始时间数据序列中排在第二位。

如图9所示，以S_i为目标时间数据序列为例，I_i为该目标时间数据序列对应的相关度评价信息。数据处理设备可以对I_i进行排序，以获取排序后的相关度评价信息，并根据该排序后的相关度评价信息，确定出按照与S_i相关度排序的时间数据序列集合。其中，I_i中包括了S_i与自身的相关度评价信息，因此按照与S_i相关度排序的时间数据序列集合中也可以包括S_i本身。可选的，由于S_i与自身的相关度最高，因此

可以为S_i与自身的相关度，本申请对此不作限制。

如图9所示，对于目标时间数据序列S_i，数据处理设备可以按照划分比例w_s，以获取排序后的前n×w_s个(即上述预设数量个)时间数据序列，并将该前n×w_s个时间数据序列确定为目标时间数据序列S_i的关联特征集合G_i，以将该关联特征集合G_i作为训练时间数据序列S_i对应的数据预测模型的输入数据集。其中，G_i中可以包括目标时间数据序列S_i本身。

示例性的，假设一共有10个(即n＝10)时间数据序列，则数据处理设备可以对目标时间数据序列s_i对应的10个时间数据序列按照相关度的大小进行排序；若划分比例w_s为0.5，即在与目标时间数据序列s_i对应的10个时间数据序列中，取前5个时间数据序列，以作为目标时间数据序列的关联特征集合。

需要说明的是，本申请实施例按照划分比例w_s作为筛选目标时间数据序列的关联特征集合的标准，仅用于举例，不对本申请造成限制。可选的，在目标时间数据序列的关联特征数量较多时，也可以使用固定数值以作为关联特征的数量，或是设定相关度评价信息阈值来确定关联特征的数量，本申请对此不作限制。

通过将原始数据集进行分组，可以确定上述至少一个时间数据序列，并利用至少一个相关度评价方法对该至少一个时间数据序列进行相关度计算，以筛选出目标时间数据序列的关联特征集合，以作为对应数据预测模型的输入集，从而可以大幅减少时间成本与人力成本，并减轻模型迁移难度，进而可以使用相关度较高的关联特征进行模型训练，在降低计算复杂度的同时，还可以提高数据预测模型的准确度以及提升数据预测模型的稳定性。

S702，基于第三时间和预设时间窗从关联特征集合中获取第二关联特征子集。

其中，上述第三时间可以是初始模型训练过程中，选取的目标时间数据序列中的任一时间。可选的，该第三时间可以与前述第一时间相同，也可以与前述第一时间不同，本申请对此不作限制。上述第二关联特征子集可以为初始模型训练过程中，以第三时间为预设时间窗的起始时间，从上述关联特征集合中截取的关联特征子集。可选的，在第三时间与前述第一时间相同的情况下，第二关联特征子集可以与前述第一关联特征子集相同，本申请对此不作限制。

在初始模型的训练过程中，数据处理设备可以按照预设时间窗的步长，依次对关联特征集合进行截取。也就是说，数据处理设备可以基于多个时间(即上述第三时间)和预设时间窗，以从关联特征集合中获取多个关联特征子集(即上述第二关联特征子集)。例如：如图11所示，假设上述至少一个时间数据序列中的各个时间数据序列均包含5天(即T＝5)的数据，若预设时间窗的时长为3天，步长为每步移动1天的时长，则数据处理设备可以分别以第1天、第2天和第3天为预设时间窗的起始时间，从关联特征集合中截取到三个关联特征子集(如图11中的关联特征子集1、关联特征子集2和关联特征子集3)。

需要说明的是，本申请实施例中S702的相关内容可参见前述图2对应实施例中S202的详细描述，本申请在此不再赘述。

S703，基于初始模型的多重加权自注意力机制对第二关联特征子集进行处理，得到目标时间数据序列在第三时间的特征表示数据。

数据处理设备在获取到上述第二关联特征子集之后，可以基于初始模型的多重加权自注意力机制对该第二关联特征子集进行处理，以使得该第二关联特征子集在注意力机制内部学习到时间维度上的注意力以及时间序列间交互的注意力，在外部使用相关度评价信息合成多个注意力的结果，从而可以使得对初始模型的训练更有效。

在一种实现方式中，对第二关联特征子集包括的各个时间数据序列分别进行遮挡处理，得到目标时间数据序列的至少一个局部关联特征矩阵；基于至少一个局部关联特征矩阵中每个局部关联特征矩阵的自注意力信息，以及目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，确定第二关联特征子集的多重加权自注意力信息；基于第二关联特征子集以及多重加权自注意力信息，确定目标时间数据序列在第三时间的特征表示数据。

如图12所示，数据处理设备可以对第二关联特征子集所包括的各个时间数据序列分别进行遮挡处理(也可称作mask处理)，以在第二关联特征子集中除去该被遮挡的时间数据序列，进而得到共nw_s个局部关联特征矩阵(即图12中的X_im)。其中，X_imj可以为局部关联特征矩阵中的任意一个局部关联特征矩阵，j＝(1,...,nw_s)。可选的，数据处理设备可以将被遮挡的时间数据序列置0，以达到对其遮挡的效果，本申请对此不作限制。

在一种实现方式中，基于初始模型的自注意力参数，对至少一个局部关联特征矩阵中每个局部关联特征矩阵进行处理，得到每个局部关联特征矩阵的第一自注意力信息；从目标时间数据序列的相关度评价信息中，获取目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度；基于每个局部关联特征矩阵的第一自注意力信息以及上述相关度，确定每个局部关联特征矩阵的第二自注意力信息；基于每个局部关联特征矩阵的第二自注意力信息确定第二关联特征子集的多重加权自注意力信息。

需要说明的是，数据处理设备可以使用至少一个自注意力参数，对于每个X_imj进行计算，以得到每个X_imj的第一自注意力信息。具体的计算公式如下：

其中，LocalAttention(X_imj)可以表示X_imj的第一自注意力信息，W_a可以表示第一自注意力参数，W_b可以表示第二自注意力参数，

可以表示L_t维度下的缩放因子(其中，L_t可以为预设时间窗的时长)。

需要说明的是，计算第一自注意力信息的公式中以初始模型存在两个自注意力参数(即W_a以及W_b)为例进行说明，不对本申请造成限制。可选的，上述自注意力参数可以为矩阵，也可以为向量，本申请对此不作限制。可选的，对于第一个局部自注意力矩阵(即X_im1)所使用W_a1和W_b1，可以与第二个局部自注意力矩阵(即X_im2)所使用W_a2和W_b2相同，也可以不同，还可以部分相同另一部分不同，本申请对此不作限制。

在获取到上述每个局部关联特征矩阵的第一自注意力信息之后，数据处理设备可以从前述目标时间数据序列的相关度评价信息中，分别获取目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，以将上述第一自注意力信息与上述相关度相乘，从而得到每个局部关联特征矩阵的第二自注意力信息，进而将每个局部关联特征矩阵的第二自注意力信息进行加权平均运算，得到第二关联特征子集的多重加权自注意力信息。具体的计算公式如下：

其中，Attention(X_i)可以表示第二关联特征子集的多重加权自注意力信息，Score_ij可以表示目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，

可以表示X_imj的第一自注意力信息，即为前述LocalAttention(X_imj)。

示例性的，假设第一局部关联特征矩阵X_im1中对第一时间数据序列S₁进行了遮挡处理，则数据处理设备可以从前述相关度评价信息中，获取到目标时间数据序列与该第一时间数据序列S₁之间的相关度(即

)，并基于该

和前述第一自注意力信息，确定第二自注意力信息。

可以理解的是，数据处理设备可以分别对每个局部关联特征矩阵执行上述处理，从而得到每个局部关联特征矩阵的第二自注意力信息，进而将每个局部关联特征矩阵的第二自注意力信息进行加权平均运算，得到第二关联特征子集的多重加权自注意力信息。

在一种实现方式中，基于放缩器和残差连接，对多重加权自注意力信息进行处理，得到处理后的多重加权自注意力信息；基于第二关联特征子集以及处理后的多重加权自注意力信息，得到目标时间数据序列在第三时间的特征表示数据。

数据处理设备通过初始模型的多重加权注意力机制，获取到了第二关联特征子集(即上述X_i)的多重加权自注意力信息(即上述Attention(X_i))之后，可以将该多重加权自注意力信息输入放缩器(如多层感知(Multi-layer Perceptron,MLP)放缩器)，以使用全连接网络将上述多重加权自注意力信息扩展到高维再降至原维度，从而获取该多重加权自注意力信息的高维交互信息，并得到MLP(Attention(X_i))。可选的，数据处理设备该可以使用残差连接，将Attention(X_i)与MLP(Attention(X_i))相加，以得到上述处理后的多重加权注意力信息；并将该处理后的多重加权自注意力信息与X_i相加，进而得到上述目标时间数据序列在第三时间的特征表示数据。

如图13所示，图13为本申请实施例提供的一种多重自注意力矩阵的可视化示意图。通过该图13可以清晰地看出数据序列的自注意力大小，即哪个坐标对应的数据颜色更浅，从而可以直观地了解到目标时间数据序列与其他时间数据序列的综合自注意力，进而可以在时间以及不同序列特征的多维度上全面、准确地提取到时间数据序列的表征信息，以提升预测模型的预测结果的准确度。

本申请实施例中，通过相关度评价方法与多重加权自注意力机制的结合，初始模型能够可以同时学习到每个关联特征集合内部时间维度与部分特征的局部注意力、关联特征集合每列所代表的时间数据序列特征相互间的全局注意力，以及上述局部注意力和全部注意力交互所获取的综合注意力。多重加权自注意力机制充分利用了关联特征集合内部时间序列上的局部信息，以及相关度评价方法获取的关联特征集合之外的全局信息，可以帮助初始模型有效地识别预测值的决定因素，以提升初始模型的精度以及多元序列信息的使用率，从而提升初始模型的拟合效率。

需要说明的是，上述多重加权自注意力机制中以使用预设时间窗方式获取关联特征子集，仅用于举例，不对本申请造成限制。可选的，数据处理设备还可以使用其他方法对上述输入数据(如上述关联特征集合)进行处理，本申请对此不作限制。例如：对原始数据进行卷积操作以形成输入数据；将模型结构设置为循环神经网络(Recurrent NeuralNetwork,RNN)类模型或编码-解码(Encoder-Decoder)模型，通过调整时间步区间形成输入数据等方式。可选的，数据处理设备还可以根据不同的应用场景，加入对应行业内常用的数学模型及专家知识作为初始模型的输入数据。例如：在传染病预测模型的构建中，加入传染病动力学(Susceptible-Exposed-Infected-Removed,SEIR)模型的参数与结果，以作为特征输入本申请实施例的初始模型，从而可以增加模型的可解释性，进而能够更好地适应应用场景需求。

S704，利用目标时间数据序列在第三时间的特征表示数据以及目标时间数据序列中对应的参考数据，对初始模型进行训练，得到数据预测模型。

其中，上述参考数据可以为初始模型训练过程中所获取到的真实数据。例如：在医院总就诊人数时间数据序列中真实存在的第3天的数据，可以医院总就诊人数时间数据序列中的一个参考数据。

由前述内容可知，目标时间数据序列在第三时间的特征表示数据可以作为自注意力功能模块的输出，也可以作为数据预测模型的输入。也就是说，在目标时间数据序列的关联特征集合通过初始模型的多重加权自注意力机制处理后，所得到的目标时间数据序列在第三时间的特征表示数据，可以作为数据预测模型进行模型训练的输入数据，如图12中所示的INPUT(X_i)。

数据处理设备可以通过该输入数据对初始模型进行训练，以得到目标时间数据序列在第三时间的预测数据，并根据目标时间数据序列中第三时间对应的参考数据，对初始模型进行训练，以得到数据预测模型。

在一种实现方式中，利用初始模型对目标时间数据序列在第三时间的特征表示数据进行处理，得到第四时间的预测数据；从目标时间数据序列中获取第四时间对应的参考数据；基于第四时间的预测数据和第四时间对应的参考数据，对初始模型的模型参数进行调整，得到数据预测模型。其中，模型参数包括自注意力参数。

数据处理设备利用初始模型对目标时间数据序列在第三时间的特征表示数据进行处理，以对第四时间的数据进行预测，并得到该第四时间的预测数据之后，可以从目标数据序列中获取第四时间对应的参考数据，从而可以对上述第四时间的预测数据和第四时间对应的参考数据进行对比，进而可以根据该对比结果对初始模型的模型参数进行调整，以调整到最优的模型参数，并将该初始模型训练为具备一定功能的数据预测模型。

需要说明的是，上述模型参数可以包括自注意力参数，即上述W_a和W_b。也就是说，在初始模型的训练过程中，可以不断地对上述W_a以及W_b进行调整，以使得训练后的初始模型可以达到更好的预测效果。可选的，在数据处理设备的算力允许的情况下，也可以将前述多个相关度评价信息的权重视为模型参数加入学习，或者还可以将相关度的计算过程加入训练，从而获取到更优权重参数。可选的，上述模型参数还可以包括其他初始模型中的参数，本申请对此不作限制。

请参见图14，图14为本申请实施例提供的数据处理方法的流程图。如图14所示，数据处理设备可以通过收集原始数据集，并对该原始数据集进行预处理，从而通过组合重要性抽取模块(即上述相关度评价方法)，得到重要性评分矩阵(即上述相关度评价信息)以及时序特征帅选分组(即上述关联特征集合)，从而通过多重加权自注意力模块(即上述多重加权自注意力机制)，以及预测模型架构(即上述初始模型)，对数据预测模型进行训练，并将训练过程中的相关度评价信息示意图(如图10所示)、多重自注意力机制的效果图(如图13所示)、训练效果图(如图15所示)等可视化地显示出来。

需要说明的是，本申请实施例提供的数据处理方法可以在多平台上实现，如可以使用python数据处理包进行数据预处理，可以使用statsmodels、scikit-learn等统计与机器学习包构建组合重要性抽取模块，可以使用pytorch等深度学习框架构建多重加权自注意力模块及预测模型等。其中，该预测模型的架构可以是根据具体问题设计的全连接神经网络、卷积神经网络等结构，本申请对此不作限制。

如图15所示，图15为本申请实施例提供的初始模型的训练效果示意图。图15中的训练1可以为第1次训练的效果示意图，训练2可以为第100次训练的效果示意图。由该训练1和训练2的对比可知，经过多次训练后的初始模型所预测出的预测结果，越来越趋近于真实数据(如：纵坐标的损失值越来越逼近于0)，且所需要的训练时间也越来越短。

本申请实施例中，数据处理设备通过获取目标时间数据序列的关联特征集合，并基于第三时间和预设时间窗从上述关联特征集合中获取第二关联特征子集，以基于初始模型的多重加权自注意力机制对上述第二关联特征子集进行处理，得到目标时间数据序列在第三时间的特征表示数据；从而利用该目标时间数据序列在第三时间的特征表示数据以及目标时间数据序列中对应的参考数据，对初始模型进行训练，以使得该初始模型可以学习到每组输入数据内部时间维度与部分特征的局部注意力、输入数据每列所代表时间序列特征相互间的全局注意力，以及两者交互所获取的综合注意力；进而使得训练得到的数据预测模型，可以有效识别预测值的决定因素，以提升该数据预测模型的精度以及多元时间数据序列的信息使用率，从而提升拟合效率。

另外，在本申请的具体实施方式中，涉及到至少一个时间数据序列(可以包括如医院总就诊人数、口腔科就诊人数、某公司净利润等等)中的相关的数据，所涉及使用到的数据均是经过用户授权的。当本申请以上实施例运用到具体产品或技术中时，所涉及使用到的数据需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

进一步的，请参见图16，图16是本申请实施例提供的一种数据处理装置的结构示意图。如图16所示，数据处理装置1600可以应用于上述图1对应实施例中的数据处理设备。具体的，数据处理装置1600可以是运行于数据处理设备中的一个计算机程序(包括程序代码)，例如该数据处理装置1600为一个应用软件；该数据处理装置1600可以用于执行图2和图7对应实施例提供的方法中的相应步骤。

数据处理装置1600可以包括：获取单元1601和处理单元1602。

获取单元1601，用于获取目标时间数据序列的关联特征集合，关联特征集合是根据目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，目标时间数据序列为至少一个时间数据序列中的任意一个；

上述获取单元1601，还用于基于第一时间和预设时间窗从关联特征集合中获取第一关联特征子集；

处理单元1602，用于基于数据预测模型的多重加权自注意力机制对第一关联特征子集进行处理，得到目标时间数据序列在第一时间的特征表示数据；

上述处理单元1602，还用于调用数据预测模型对目标时间数据序列在第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。

在一种可能的实现方式中，上述获取单元1601，还用于基于第三时间和预设时间窗从关联特征集合中获取第二关联特征子集；上述处理单元1602，还用于基于初始模型的多重加权自注意力机制对第二关联特征子集进行处理，得到目标时间数据序列在第三时间的特征表示数据；上述处理单元1602，还用于利用目标时间数据序列在第三时间的特征表示数据以及目标时间数据序列中对应的参考数据，对初始模型进行训练，得到数据预测模型。

在一种可能的实现方式中，上述处理单元1602，还用于对第二关联特征子集包括的各个时间数据序列分别进行遮挡处理，得到目标时间数据序列的至少一个局部关联特征矩阵；上述处理单元1602，还用于基于至少一个局部关联特征矩阵中每个局部关联特征矩阵的自注意力信息，以及目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，确定第二关联特征子集的多重加权自注意力信息；上述处理单元1602，还用于基于第二关联特征子集以及多重加权自注意力信息，确定目标时间数据序列在第三时间的特征表示数据。

在一种可能的实现方式中，上述处理单元1602，还用于基于初始模型的自注意力参数，对至少一个局部关联特征矩阵中每个局部关联特征矩阵进行处理，得到每个局部关联特征矩阵的第一自注意力信息；上述获取单元1601，还用于从目标时间数据序列的相关度评价信息中，获取目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度；上述处理单元1602，还用于基于每个局部关联特征矩阵的第一自注意力信息以及上述相关度，确定每个局部关联特征矩阵的第二自注意力信息；上述处理单元1602，还用于基于每个局部关联特征矩阵的第二自注意力信息确定第二关联特征子集的多重加权自注意力信息。

在一种可能的实现方式中，上述处理单元1602，还用于基于放缩器和残差连接，对多重加权自注意力信息进行处理，得到处理后的多重加权自注意力信息；上述处理单元1602，还用于基于第二关联特征子集以及处理后的多重加权自注意力信息，得到目标时间数据序列在第三时间的特征表示数据。

在一种可能的实现方式中，上述处理单元1602，还用于利用初始模型对目标时间数据序列在第三时间的特征表示数据进行处理，得到第四时间的预测数据；上述获取单元1601，还用于从目标时间数据序列中获取第四时间对应的参考数据；上述处理单元1602，还用于基于第四时间的预测数据和第四时间对应的参考数据，对初始模型的模型参数进行调整，得到数据预测模型。其中，模型参数包括自注意力参数。

在一种可能的实现方式中，上述获取单元1601，还用于获取至少一个时间数据序列；上述获取单元1601，还用于基于至少一个相关度评价方法获取至少一个时间数据序列中任意两个时间数据序列之间的至少一个相关度；上述处理单元1602，还用于基于任意两个时间数据序列之间的至少一个相关度确定该至少一个时间数据序列的相关度评价信息；上述处理单元1602，还用于根据相关度评价信息确定目标时间数据序列的关联特征集合。

在一种可能的实现方式中，上述处理单元1602，还用于根据相关度评价信息包括的目标时间数据序列与至少一个时间数据序列中任一时间数据序列之间的相关度，对至少一个时间数据序列进行排序；上述处理单元1602，还用于根据排序结果从至少一个时间数据序列中确定预设数量个时间数据序列，预设数量个时间数据序列包括目标时间数据序列；上述处理单元1602，还用于将预设数量个时间数据序列添加到目标时间数据序列的关联特征集合中。

根据本申请的实施例，图16所示的数据处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其它实施例中，基于数据处理装置也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。

根据本申请的实施例，可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2和图7所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图16中所示的数据处理装置，以及来实现本申请实施例数据处理方法。上述计算机程序可以记载于例如计算机存储介质上，并通过计算机存储介质装载于上述计算设备中，并在其中运行。

进一步地，请参见图17，图17是本申请实施例提供的一种计算机设备的结构示意图。该计算机设备1700还可以用于实现上述方法实施例中服务器的功能。如图17所示，该计算机设备1700至少可包括：处理器1701、通信接口1702以及计算机存储介质1703。其中，处理器1701、通信接口1702以及计算机存储介质1703可通过总线或其他方式连接。

计算机存储介质1703可以存储在计算机设备1700的存储器1704中，该计算机存储介质1703用于存储计算机程序，该计算机程序包括程序指令，上述处理器1701用于执行计算机存储介质1703存储的程序指令。处理器1701(或称CPU(Central Processing Unit，中央处理器))是计算机设备1700的计算核心以及控制核心，其适于实现一条或多条指令，具体适于加载并执行：

在一种可能的实现方式中，上述处理器1701，还用于基于第三时间和预设时间窗从关联特征集合中获取第二关联特征子集；上述处理器1701，还用于基于初始模型的多重加权自注意力机制对第二关联特征子集进行处理，得到目标时间数据序列在第三时间的特征表示数据；上述处理器1701，还用于利用目标时间数据序列在第三时间的特征表示数据以及目标时间数据序列中对应的参考数据，对初始模型进行训练，得到数据预测模型。

在一种可能的实现方式中，上述处理器1701，还用于对第二关联特征子集包括的各个时间数据序列分别进行遮挡处理，得到目标时间数据序列的至少一个局部关联特征矩阵；上述处理器1701，还用于基于至少一个局部关联特征矩阵中每个局部关联特征矩阵的自注意力信息，以及目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，确定第二关联特征子集的多重加权自注意力信息；上述处理器1701，还用于基于第二关联特征子集以及多重加权自注意力信息，确定目标时间数据序列在第三时间的特征表示数据。

在一种可能的实现方式中，上述处理器1701，还用于基于初始模型的自注意力参数，对至少一个局部关联特征矩阵中每个局部关联特征矩阵进行处理，得到每个局部关联特征矩阵的第一自注意力信息；上述处理器1701，还用于从目标时间数据序列的相关度评价信息中，获取目标时间数据序列与每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度；上述处理器1701，还用于基于每个局部关联特征矩阵的第一自注意力信息以及上述相关度，确定每个局部关联特征矩阵的第二自注意力信息；上述处理器1701，还用于基于每个局部关联特征矩阵的第二自注意力信息确定第二关联特征子集的多重加权自注意力信息。

在一种可能的实现方式中，上述处理器1701，还用于基于放缩器和残差连接，对多重加权自注意力信息进行处理，得到处理后的多重加权自注意力信息；上述处理器1701，还用于基于第二关联特征子集以及处理后的多重加权自注意力信息，得到目标时间数据序列在第三时间的特征表示数据。

在一种可能的实现方式中，上述处理器1701，还用于利用初始模型对目标时间数据序列在第三时间的特征表示数据进行处理，得到第四时间的预测数据；上述处理器1701，还用于从目标时间数据序列中获取第四时间对应的参考数据；上述处理器1701，还用于基于第四时间的预测数据和第四时间对应的参考数据，对初始模型的模型参数进行调整，得到数据预测模型。其中，模型参数包括自注意力参数。

在一种可能的实现方式中，上述处理器1701，还用于获取至少一个时间数据序列；上述处理器1701，还用于基于至少一个相关度评价方法获取至少一个时间数据序列中任意两个时间数据序列之间的至少一个相关度；上述处理器1701，还用于基于任意两个时间数据序列之间的至少一个相关度确定该至少一个时间数据序列的相关度评价信息；上述处理器1701，还用于根据相关度评价信息确定目标时间数据序列的关联特征集合。

在一种可能的实现方式中，上述处理器1701，还用于根据相关度评价信息包括的目标时间数据序列与至少一个时间数据序列中任一时间数据序列之间的相关度，对至少一个时间数据序列进行排序；上述处理器1701，还用于根据排序结果从至少一个时间数据序列中确定预设数量个时间数据序列，预设数量个时间数据序列包括目标时间数据序列；上述处理器1701，还用于将预设数量个时间数据序列添加到目标时间数据序列的关联特征集合中。

应当理解，本申请实施例中所描述的计算机设备1700可执行前文图2和图7所对应实施例中对数据处理方法的描述，也可执行前文图16实施例中对数据处理装置1600在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。

此外，这里需要指出的是：本申请实施例还提供了一种计算机存储介质，且计算机存储介质中存储有前文提及的数据处理装置1600所执行的计算机程序，且计算机程序包括程序指令，当处理器执行程序指令时，能够执行前文图2和图7所对应实施例中对数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本申请所涉及的计算机存储介质实施例中未披露的技术细节，请参照本申请方法实施例的描述。作为示例，程序指令可以被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，分布在多个地点且通过通信网络互联的多个计算机设备上执行，分布在多个地点且通过通信网络互联的多个计算机设备可以组合为区块链网络。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备可以执行前文图2和图7所对应实施例中的方法，因此，这里将不再进行赘述。

本领域普通技术人员可以意识到，结合本申请中所公开的实施例描述的各示例的单元及步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用，使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程设备。计算机指令可以存储在计算机存储介质中，或者通过计算机存储介质进行传输。计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如，同轴电缆、光纤、数字用户线(DSL))或无线(例如，红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如，固态硬盘(Solid State Disk，SSD))等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

获取目标时间数据序列的关联特征集合，所述关联特征集合是根据所述目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，所述目标时间数据序列为所述至少一个时间数据序列中的任意一个；

基于第一时间和预设时间窗从所述关联特征集合中获取第一关联特征子集；

基于数据预测模型的多重加权自注意力机制对所述第一关联特征子集进行处理，得到所述目标时间数据序列在所述第一时间的特征表示数据；

调用所述数据预测模型对所述目标时间数据序列在所述第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

基于第三时间和所述预设时间窗从所述关联特征集合中获取第二关联特征子集；

基于初始模型的多重加权自注意力机制对所述第二关联特征子集进行处理，得到所述目标时间数据序列在所述第三时间的特征表示数据；

利用所述目标时间数据序列在所述第三时间的特征表示数据以及所述目标时间数据序列中对应的参考数据，对初始模型进行训练，得到所述数据预测模型。

3.根据权利要求2所述的方法，其特征在于，所述基于初始模型的多重加权自注意力机制对所述第二关联特征子集进行处理，得到所述目标时间数据序列在所述第三时间的特征表示数据，包括：

对所述第二关联特征子集包括的各个时间数据序列分别进行遮挡处理，得到所述目标时间数据序列的至少一个局部关联特征矩阵；

基于所述至少一个局部关联特征矩阵中每个局部关联特征矩阵的自注意力信息，以及所述目标时间数据序列与所述每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，确定所述第二关联特征子集的多重加权自注意力信息；

基于所述第二关联特征子集以及所述多重加权自注意力信息，确定所述目标时间数据序列在所述第三时间的特征表示数据。

4.根据权利要求3所述的方法，其特征在于，所述基于所述至少一个局部关联特征矩阵中每个局部关联特征矩阵的自注意力信息，以及所述目标时间数据序列与所述每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度，确定所述第二关联特征子集的多重加权自注意力信息，包括：

基于初始模型的自注意力参数，对所述至少一个局部关联特征矩阵中每个局部关联特征矩阵进行处理，得到所述每个局部关联特征矩阵的第一自注意力信息；

从所述目标时间数据序列的相关度评价信息中，获取所述目标时间数据序列与所述每个局部关联特征矩阵对应遮挡的时间数据序列之间的相关度；

基于所述每个局部关联特征矩阵的第一自注意力信息以及所述相关度，确定所述每个局部关联特征矩阵的第二自注意力信息；

基于所述每个局部关联特征矩阵的第二自注意力信息确定所述第二关联特征子集的多重加权自注意力信息。

5.根据权利要求3或4所述的方法，其特征在于，所述基于所述第二关联特征子集以及所述多重加权自注意力信息，确定所述目标时间数据序列在所述第三时间的特征表示数据，包括：

基于放缩器和残差连接，对所述多重加权自注意力信息进行处理，得到处理后的多重加权自注意力信息；

基于所述第二关联特征子集以及所述处理后的多重加权自注意力信息，得到所述目标时间数据序列在所述第三时间的特征表示数据。

6.根据权利要求2～4中任一项所述的方法，其特征在于，所述利用所述目标时间数据序列在所述第三时间的特征表示数据以及所述目标时间数据序列中对应的参考数据，对初始模型进行训练，得到所述数据预测模型，包括：

利用初始模型对所述目标时间数据序列在所述第三时间的特征表示数据进行处理，得到第四时间的预测数据；

从所述目标时间数据序列中获取所述第四时间对应的参考数据；

基于所述第四时间的预测数据和所述第四时间对应的参考数据，对所述初始模型的模型参数进行调整，得到所述数据预测模型，所述模型参数包括自注意力参数。

7.根据权利要求1～4中任一项所述的方法，其特征在于，所述方法还包括：

获取至少一个时间数据序列；

基于至少一个相关度评价方法获取所述至少一个时间数据序列中任意两个时间数据序列之间的至少一个相关度；

基于所述任意两个时间数据序列之间的至少一个相关度确定所述至少一个时间数据序列的相关度评价信息；

根据所述相关度评价信息确定所述目标时间数据序列的关联特征集合。

8.根据权利要求7所述的方法，其特征在于，所述根据所述相关度评价信息确定所述目标时间数据序列的关联特征集合，包括：

根据所述相关度评价信息包括的所述目标时间数据序列与所述至少一个时间数据序列中任一时间数据序列之间的相关度，对所述至少一个时间数据序列进行排序；

根据排序结果从所述至少一个时间数据序列中确定预设数量个时间数据序列，所述预设数量个时间数据序列包括所述目标时间数据序列；

将所述预设数量个时间数据序列添加到所述目标时间数据序列的关联特征集合中。

9.一种数据处理装置，其特征在于，包括：

获取模块，用于获取目标时间数据序列的关联特征集合，所述关联特征集合是根据所述目标时间数据序列与至少一个时间数据序列中的各个时间数据序列之间的相关度确定的，所述目标时间数据序列为所述至少一个时间数据序列中的任意一个；

所述获取模块，还用于基于第一时间和预设时间窗从所述关联特征集合中获取第一关联特征子集；

处理模块，用于基于数据预测模型的多重加权自注意力机制对所述第一关联特征子集进行处理，得到所述目标时间数据序列在所述第一时间的特征表示数据；

所述处理模块，还用于调用所述数据预测模型对所述目标时间数据序列在所述第一时间的特征表示数据进行预测处理，以得到第二时间的预测数据。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令被处理器执行时，使得具有所述处理器的计算机设备执行权利要求1-8中任一项所述方法的步骤。