CN117009042A

CN117009042A - 物联网模式下的信息计算负载调度方法、装置、设备及介质

Info

Publication number: CN117009042A
Application number: CN202210469759.9A
Authority: CN
Inventors: 彭聪; 张�浩; 陈立平; 赵坤; 龙飞; 杨亚光
Original assignee: Institute of Microelectronics of CAS
Current assignee: Institute of Microelectronics of CAS
Priority date: 2022-04-30
Filing date: 2022-04-30
Publication date: 2023-11-07

Abstract

本发明涉及人工智能技术领域，公开了一种物联网模式下的信息计算负载调度方法、装置、设备及介质，包括：接收信息计算任务，将信息计算任务分配给相应的目标执行容器；生成各目标执行容器内的信息计算任务的优先级队列；通过预训练的资源分配器，调控各目标执行容器的计算资源分配比例；通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序。实现平台运算资源的充分利用，减少任务优先级加权平均执行时间，提升用户使用满意度。

Description

物联网模式下的信息计算负载调度方法、装置、设备及介质

技术领域

本发明涉及计算机处理技术领域，尤其涉及一种物联网模式下的信息计算负载调度方法、装置、设备及介质。

背景技术

随着物联网技术的不断发展，应用场景的不断延伸，生理信息的采集已经从医院实验室走向千家万户。得益于生理信息采集设备逐渐小型化智能化，各类采集设备小巧便携、智能化、可长时间穿戴的特点使得各类可穿戴设备，当前可穿戴设备已经在采集心率、血氧、体态、体温、呼吸、血压等人体健康数据方面有了许多应用，甚至部分生理信息仅通过智能设备就可以进行运算处理，生理信息的广泛采集有力的支撑了远程医疗和居家监护的发展。

随着生理信息采集的便捷化，所需处理的数据规模上有了数量级规模的增长，并且随着需求的进一步开发，传统的数据离线汇总和简单的实时运算已经无法满足越来越多复杂的运算需求和更加实时的监护需求。因此需要改进云数据计算中心的服务架构来满足复杂的计算过程，大量的并行数据和较强的实时性要求。由于需要处理的数据的规模和复杂度上都有极大的增长，这给云数据中心带来了很大的挑战。不同于传统互联网模式下的用户数据，生理信息的时间跨度长，数据种类多，数据量又较大，在同一时间段内云数据中心可能既要处理实时监护任务，又要处理各个设备采集上传的数据。而生理信息时间跨度长，计算场景相对复杂，处理过程顺序依赖性强，实时任务一般存在过往数据依赖等特点，导致传统应对独立计算任务的资源分配算法很难合理有效的协调生理信息计算的调度和资源的有效分配。因此也需要对资源分配和任务调度算法进行改进，使得在生理信息的运算场景下，集群服务能够尽量释放算力，发挥更高的效率。

发明内容

本发明提供一种物联网模式下的信息计算负载调度方法、装置、计算机设备及介质，在满足优先级需求的情况下能尽量提升运算任务的执行效率，降低任务的等待时间。

第一方面，提供了一种物联网模式下的信息计算负载调度方法，包括：

接收信息计算任务，将所述信息计算任务分配给相应的目标执行容器；

生成各目标执行容器内的所述信息计算任务的优先级队列；

通过预训练的资源分配器，调控各所述目标执行容器的计算资源分配比例；

通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序。

在一些实施例中，所述将所述信息计算任务分配给相应的目标执行容器，包括：

根据所述信息计算任务的类型和资源分配器内各容器的负载系数，将所述信息计算任务分配给相应的目标执行容器。

在一些实施例中，所述生成各目标执行容器内的所述信息计算任务的优先级队列，包括：

根据当前任务的等待时间和当前任务的执行期望时间和优先等级，生成所述优先级队列。

在一些实施例中，所述通过预训练的资源分配器，调控各所述目标执行容器的计算资源分配比例，包括：

根据每个所述目标执行容器内的所述优先级队列的负载指数来调控各所述目标执行容器的计算资源分配比例。

在一些实施例中，还包括训练所述资源分配器，其中，所述训练所述资源分配器包括：

通过所述资源分配器的演员网络对当前环境状态进行决策；

根据所述演员部分的决策结果分配目标容器的运算资源；

运行预设时间段，根据环境奖励积累经验池直至所述经验池大小达到预设阈值；

使用所述经验池更新评论家网络，根据所述评论家网络获取梯度更新所述演员网络；

根据所述资源分配器的收敛，确定所述资源分配器训练的迭代次数。

在一些实施例中，所述待训练的执行调度器包括多个层次的拓扑层，每个层次的拓扑层包括两个DQN结构，其中一个DQN结构为本层决策模型和另一个DQN结构为上层次决策的时间预估模型；

所述方法还包括训练所述执行调度器，其中，所述训练所述资源分配器包括：

确定所述待训练的执行调度器中的当前训练的层级结构是否为顶层结构，若是，则根据所述待训练的执行调度器设置DQN结构参数；

使用训练集训练DQN结构；

积累经验池训练层级DQN结构；

根据所述层级DQN结构是否收敛，确定所述DQN结构训练的迭代次数；

若不是，则根据模型设置运算资源状态与令牌数量限制

在限制内随机生成环境初始状态数；

选取初始化层级DQN结构环境；

积累经验池训练DQN结构；

根据所述层级DQN结构是否收敛，确定所述DQN结构训练的迭代次数。

在一些实施例中，所述待训练的执行调度器包括多个层次的子调度器，每个层次的子调度器包括1个DQN结构，所述DQN结构为本层决策模型；

所述通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序，包括：

将所述当前执行任务的计算任务状态输入多层DQN结构，对于每一层次的DQN，计算获得本层次的任务执行目标，根据任务类型将本层次的任务执行目标输入对应的下层DQN结构，获得下层任务执行目标，如此迭代直到目标输入底层DQN结构产生真实任务执行步骤顺序，得到调整后的执行任务的执行顺序。

第二方面，提供了一种物联网模式下的信息计算负载调度装置，包括：

接收单元，用于接收信息计算任务，将所述信息计算任务分配给相应的目标执行容器；

优先队列单元，用于生成各目标执行容器内的所述信息计算任务的优先级队列；

资源分配单元，用于通过预训练的资源分配器，调控各所述目标执行容器的计算资源分配比例；

执行调度单元，用于通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序。

第三方面，提供了一种计算机设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述物联网模式下的信息计算负载调度方法的步骤。

第四方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述物联网模式下的信息计算负载调度方法的步骤。

上述物联网模式下的信息计算负载调度方法、装置、计算机设备及存储介质所实现的方案中，接收信息计算任务，将信息计算任务分配给相应的目标执行容器；生成各目标执行容器内的信息计算任务的优先级队列；通过预训练的资源分配器，调控各目标执行容器的计算资源分配比例；通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序。因此，任务执行调度优化和资源分配调度优化。优先级队列用于进行任务的粗略调度，任务执行调度基于优先级队列优化对优化问题的简化进行任务的精细调度，资源分配调度用于弥补容器内的任务调度无法处理容器间负载差异的不足。任务执行调度器的任务精细调度基于优先级队列的任务粗略调度，资源分配调度的工作用于平衡节点容器之间的负载差异。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中物联网模式下的信息计算负载调度方法的一流程示意图；

图2是本发明一实施例中物联网模式下的信息计算负载调度方法的调度策略结构图；

图3是本发明一实施例中物联网模式下的信息计算负载调度方法的节点计算资源分配架构；

图4是本发明一实施例中物联网模式下的信息计算负载调度方法的节点计算资源模型训练流程图；

图5是本发明一实施例中物联网模式下的信息计算负载调度方法的任务执行调度器层次化DQN结构图；

图6是本发明一实施例中物联网模式下的信息计算负载调度方法的层次化DQN训练流程图；

图7是本发明一实施例中计算机设备的一结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1所示，图1为本发明实施例提供的物联网模式下的信息计算负载调度方法的一个流程示意图，包括如下步骤：

步骤10、接收信息计算任务，将信息计算任务分配给相应的目标执行容器；

其中，接收到新的生理信息计算任务后，按照任务类型通过节点资源分配器内各容器的负载系数选择目标执行容器，将新任务送到目标执行容器的任务队列中等待处理。

在一些实施例中，将信息计算任务分配给相应的目标执行容器，包括：

根据信息计算任务的类型和资源分配器内各容器的负载系数，将信息计算任务分配给相应的目标执行容器。

步骤20、生成各目标执行容器内的信息计算任务的优先级队列；

其中，容器内部的任务队列为优先级队列，根据各个任务的执行预期时间和优先级计算优先级系数，选出优先级系数最高的几个任务进行下一步处理。将优先级最高的几个任务的任务类型和执行参数送入任务执行调度器，通过任务执行调度器决定当前***需要执行的操作进行执行。

图3为容器内部优先级队列结构图，通过左侧部分优先级队列对任务进行预排续，从队列中选出最值得执行的固定数量任务，送入任务调度器执行，任务调度器功能，执行任务；

单个任务在t_i时刻的惩罚值计算方法为：

其中p_i表示任务的优先级，e_i表示任务的期望运行时间，σ_i表示任务的标准差系数用于控制奖励下降曲线，t_i表示任务的运行时间。优先级指数的计算公式如下：

p(task)＝[Penalty(t_task+t_c)-Penalty(t_task)]

上式中t_i为当前时刻，t_c＝γ*e_task，e_task是当前任务的期望执行时间，γ是一个超参数，一般设定值为γ∈[1，3)(期望执行时间)。令调度算法任务上限为N，根据优先级指数排序，选取队列中优先级指数最高的N个任务进入算法处理。

步骤30、通过预训练的资源分配器，调控各目标执行容器的计算资源分配比例；

其中，资源分配调度用于弥补容器内的任务调度无法处理容器间负载差异的不足。

图3所示，节点级资源分配器是一个基于演员评论家架构的策略算法，通过收集节点内每个POD容器内优先级队列的负载指数来调控各POD的计算资源分配比例。任务执行调度器是一个基于层次化DQN的任务执行策略算法，通过当前执行任务的状态来决定任务的执行顺序，在考虑优先级的情况下最大化升运算任务的执行效率，降低任务的等待时间。优先级队列用于对累计的任务进行优先级排序，用以找出降低整体任务等待时间最需要执行的几个任务，交由任务调度器处理。

决策算法基于AC框架DDPG算法，Actot部分的决策函数为a_t＝π(s_t|θ^μ)，其中s_t为当前各容器任务队列状态，a_t为当前时刻的模型决策，对应当前各容器的资源分配比重变化量。Critic部分的参数，价值函数Q(s_t，a_t|θ^Q)为当前状态动作对(s_t，a_t)的惩罚值期望。目标函数为不考虑折损系数的总惩罚值：

优化目标为最小化目标函数，可得Actor部分参数θ^μ的梯度公式为：

Critic部分参数θ^Q的损失函数为：

与DDPG算法相同，上式中θ^μ-与θ^Q-表示DQN目标网络部分中的策略网络参数θ^μ与价值网络参数0^Q。令y＝p_i+Q(s_i+1，π(s_i+1，θ^μ-)|θ^Q-)可得0^Q梯度公式为：

环境状态s_t的计算方法为对该节点下的每一个容器计算当前的罚值上升期望作为负载指数组成向量，向量内部容器位置固定不变，当前的全局时钟为T，负载指数计算公式如下：

load(pod)＝∑_{t∈Task(pod)}f(T-start(t)；e(t)，σ(t))

上式中，pod为当前需要计算负载指数的容器，Task(pod)为pod内部的任务集合，start(t)为任务t的创建时间戳，e(t)为任务t的期望运行时间，σ(t)为任务t的标准差系数。函数f(t；e，σ)定义为一个正态分布，公式如下：

其中t为任务的执行时间，e为任务的平均期望执行时间，σ为分布标准差系数，

环境状态s_t可表示为[load(pod₀)，load(pod₁)，...，load(pod_n)]。新创建的任务通过上层次积累的容器负载指数决定放入哪一个容器队列。

在一些实施例中，如图5所示，还包括训练资源分配器，其中，训练资源分配器包括：

通过资源分配器的演员网络对当前环境状态进行决策；

根据演员部分的决策结果分配目标容器的运算资源；

运行预设时间段，根据环境奖励积累经验池直至经验池大小达到预设阈值；

使用经验池更新评论家网络，根据评论家网络获取梯度更新演员网络；

根据资源分配器的收敛，确定资源分配器训练的迭代次数。

步骤40、通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序。

任务执行调度器是一个基于层次化DQN的任务执行策略算法，通过当前执行任务的状态来决定任务的执行顺序，在考虑优先级的情况下最大化升运算任务的执行效率，降低任务的等待时间。

图6为基于强化学习的任务执行调度器内部结构以及训练方式，通过强化学习的方法判断各类任务执行顺序的收益，将强化学习收益最高的目标改为惩罚值最低，选择总惩罚值最低的执行顺序的执行；

对于生理信息的计算过程而言，具体的运算过程层次性很强，比如对于某生理信号的处理包括预处理和运算两个步骤，其中预处理步骤可以被细分为数据格式预处理，数据填充，数据滤波等，因此可以将运算过程建模为多个层次的拓扑结构，每个层级的局部拓扑结构对应上一层级的一类运算操作。

对于局部拓扑结构，状态转移序列样本为(t_i，g_i，p_i，a_i，g_i+1)，其中g_i为决策时刻i当前层次拓扑结构模型中所有未完成运算的任务状态，g_i+1为i+1下一次决策时的环境状态。对于每一层级拓扑逻辑训练两个DQN结构，分别为用于本层决策的策略模型Q_c和用于上层决策的时间估计模型Q_t。

决策策略Q_c的训练目标为最小化局部拓扑网的总惩罚值期望，公式如下：

其中π_ag为当前局部拓扑结构的执行策略，对于第i次决策，g_i为局部拓扑结构目标状态，a_i为当前环境下的动作决策既将要执行的任务。因为***中所有任务的执行步骤路径确定且不存在任务回环，总体惩罚值不受任务执行步骤的影响，因此上式中不设折扣率参数。p_i为行动的局部惩罚值计算方法如下：

与DQN模型的训练模式相同，局部拓扑结构的整体损失函数为当前层级模型的价值网络输出的Q值与目标价值网络输出的Q值之间的均方差，Q_c的误差函数如下：

对上式的参数θ^c求偏导，可得梯度公式如下：

时间评估模型Q_t的作用为评估局部拓扑网在状态g_i的总时间消耗期望，时间评估模型不参与本层模型的决策，仅评估当前环境状态下所有任务执行完成所需的总时间，Q_t使用决策模型策略进行训练，目标公式为：

令可得误差函数如下：

对上式的参数θ求偏导，可得梯度公式如下：

对于上层局部拓扑结构，将下层局部拓扑视为一类运算操作，将参与运算操作的任务集合作为下层输入目标状态g，使用下层拓扑的时间评估模型Q_t对于这类变迁的时间消耗：

在一些实施例中，如图7所示，待训练的执行调度器包括多个层次的拓扑层，每个层次的拓扑层包括两个DQN结构，其中一个DQN结构为本层决策模型和另一个DQN结构为上层次决策的时间预估模型；

方法还包括训练执行调度器，其中，训练资源分配器包括：

确定待训练的执行调度器中的当前训练的层级结构是否为顶层结构，若是，则根据待训练的执行调度器设置DQN结构参数；

使用训练集训练DQN结构；

积累经验池训练层级DQN结构；

根据层级DQN结构是否收敛，确定DQN结构训练的迭代次数；

若不是，则根根模型设置运算资源状态与令牌数量限制

在限制内随机生成环境初始状态数；

选取初始化层级DQN结构环境；

积累经验池训练DQN结构；

根据层级DQN结构是否收敛，确定DQN结构训练的迭代次数。

在一些实施例中，待训练的执行调度器包括多个层次的拓扑层，每个层次的拓扑层包括1个DQN结构，DQN结构为本层决策模型；

通过预训练的执行调度器，根据优先级队列中当前执行任务的状态调整执行任务的执行顺序，包括：

将当前执行任务的计算任务状态输入多层DQN结构，对于每一层次的DQN，计算获得本层次的任务执行目标，根据任务类型将本层次的任务执行目标输入对应的下层DQN结构，获得下层任务执行目标，如此迭代直到目标输入底层DQN结构产生真实任务执行步骤顺序，得到调整后的执行任务的执行顺序。

在一些实施例中，本发明实施例提供的一种物联网模式下的信息计算负载调度装置，包括：

接收单元，用于接收信息计算任务，将信息计算任务分配给相应的目标执行容器；

优先队列单元，用于生成各目标执行容器内的信息计算任务的优先级队列；

资源分配单元，用于通过预训练的资源分配器，调控各目标执行容器的计算资源分配比例；

在一个实施例中，提供了一种计算机设备，该计算机设备可以是客户端，其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种物联网模式下的信息计算负载调度方法客户端侧的功能或步骤

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

接收信息计算任务，将信息计算任务分配给相应的目标执行容器；

生成各目标执行容器内的信息计算任务的优先级队列；

通过预训练的资源分配器，调控各目标执行容器的计算资源分配比例；

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

生成各目标执行容器内的信息计算任务的优先级队列；

需要说明的是，上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤，可对应参阅前述方法实施例中，服务端侧以及客户端侧的相关描述，为避免重复，这里不再一一描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种物联网模式下的信息计算负载调度方法，其特征在于，包括：

生成各目标执行容器内的所述信息计算任务的优先级队列；

2.如权利要求1所述的物联网模式下的信息计算负载调度方法，其特征在于，所述将所述信息计算任务分配给相应的目标执行容器，包括：

3.如权利要求1所述的物联网模式下的信息计算负载调度方法，其特征在于，所述生成各目标执行容器内的所述信息计算任务的优先级队列，包括：

4.如权利要求1所述的物联网模式下的信息计算负载调度方法，其特征在于，所述通过预训练的资源分配器，调控各所述目标执行容器的计算资源分配比例，包括：

5.如权利要求1所述的物联网模式下的信息计算负载调度方法，其特征在于，还包括训练所述资源分配器，其中，所述训练所述资源分配器包括：

通过所述资源分配器的演员网络对当前环境状态进行决策；

根据所述演员部分的决策结果分配目标容器的运算资源；

6.如权利要求1所述的物联网模式下的信息计算负载调度方法，其特征在于，所述待训练的执行调度器包括多个层次的拓扑层，每个层次的拓扑层包括两个DQN结构，其中一个DQN结构为本层决策模型和另一个DQN结构为上层次决策的时间预估模型；

确定所述待训练的执行调度器中的当前训练的层级结构是否为顶层结构，

若是，则根据所述待训练的执行调度器设置DQN结构参数；

使用训练集训练DQN结构；

积累经验池训练层级DQN结构；

若不是，则根据模型设置运算资源状态与令牌数量限制

在限制内随机生成环境初始状态数；

选取初始化层级DQN结构环境；

积累经验池训练DQN结构；

7.如权利要求1所述的物联网模式下的信息计算负载调度方法，其特征在于，所述待训练的执行调度器包括多个层次的拓扑层，每个层次的拓扑层包括1个DQN结构，所述DQN结构为本层决策模型；

将所述当前执行任务的计算任务输入对应层次的DQN结构，得到调整后的执行任务的执行顺序。

8.一种物联网模式下的信息计算负载调度装置，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述物联网模式下的信息计算负载调度方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述物联网模式下的信息计算负载调度方法的步骤。