CN110196762A

CN110196762A - 混合关键性容错***动态资源管理协议及该协议的调度方法

Info

Publication number: CN110196762A
Application number: CN201910314452.XA
Authority: CN
Inventors: 陈刚; 杨俊杰; 黄凯
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2019-04-18
Filing date: 2019-04-18
Publication date: 2019-09-03
Anticipated expiration: 2039-04-18
Also published as: CN110196762B

Abstract

本发明涉及实时和嵌入式***设计技术领域，更具体地，涉及一种混合关键性容错***动态资源管理协议及该协议的调度方法。资源管理协议RFHP在***检测到瞬态故障发生时，根据当前***资源的运行负载，自适应地在任务调度模型中添加中间层关键级，通过调整关键级对***资源的利用率进行提升。同时提出了一种针对该协议的调度方法，通过资源管理协议与调度方法的配合，在保证***稳定性和可调度性的前提下，避免了悲观的***资源分配策略，通过灵活***关键级实现了对***资源利用率的进一步提升，由此提升了***整体服务性能。

Description

混合关键性容错***动态资源管理协议及该协议的调度方法

技术领域

本发明涉及实时和嵌入式***设计技术领域，更具体地，涉及一种混合关键性容错***动态资源管理协议及该协议的调度方法。

背景技术

在通用硬件平台上整合不同认证要求的安全关键性任务已经成为实时和嵌入式***设计的发展趋势。对于安全关键的嵌入式***，容错是***设计中特别必要的，它能防止潜在的故障，以实现高的安全性和可靠性。目前，容错技术主要采用重新执行和检查点回滚技术处理故障的发生。重执行机制要求在故障出现时重新执行全部作业，是一种粗粒度的容错机制；检查点回滚机制则会在运行中阶段性保存***状态，并在故障出现时将***回滚至最近的正常检查点状态。

最近的一些研究已经集中于解决存在瞬时故障的混合关键性***中容错任务映射与调度问题，解决满足混合关键性***的安全需求和实时性能的调度问题。然而，这些研究都是在传统的混合关键性模型的基础上集成重执行容错机制。到目前为止，基于检查点回滚机制的灵活混合关键调度的研究还没有处于研究空白。其主要是因为，经典混合关键级***模型存在一些悲观性假设问题： (1)经典混合关键级***模型对于故障的处理不够灵活，在高关键级任务出现超时运行时，***将抛弃所有的低关键级任务来保证高关键级任务的执行。这种过于悲观的资源分配方法严重影响了***的实际运行性能。(2)现有双关键级***模型的容错解决方案均采用重执行机制来处理***瞬态故障，但是***任务(尤其是较长流水线任务)的反复重新执行会严重消耗***资源。由此看出，该方法无法识别不必要的计算任务，体现出过于粗粒度的缺点。

到目前为止，缺乏一种动态灵活的混合关键性调度机制来处理和检查点回滚机制中这种动态行为。因此，需要针对上述问题对混合关键性调度进行创新并整合检查点回滚机制中的细粒度动态调整行为，从而提高***资源的利用效率进而提升***性能。具体来说，需要从如下两个层面进行分析：

1.如何解决容错***中出现瞬态故障任务时的***合理调度问题。处理***瞬态故障需要额外的计算资源和时间，此时不合理的***调度将严重恶化任务的相应时间，最终导致***性能恶化，因此一个合理的***动态调度机制是十分必要的。

2.如何解决容错***中用于解决瞬态故障的***资源管理问题。当***检测到出瞬态故障时，应该对现有可用资源进行评估和合理分配，因此需要满足***可靠性要求的资源管理。

发明内容

本发明为克服上述现有技术所述的至少一种缺陷，提供一种混合关键性容错***动态资源管理协议及该协议的调度方法，在保证***稳定性和可调度性的前提下，避免了悲观的***资源分配策略，提升了***整体服务性能。

为解决上述技术问题，本发明采用的技术方案是：一种混合关键性容错***动态资源管理协议，资源管理协议RFHP在***检测到瞬态故障发生时，根据当前***资源的运行负载，自适应地在任务调度模型中添加中间层关键级，通过调整关键级对***资源的利用率进行提升；所述的资源管理协议具体包括以下流程：

S1.对于存在运行截止期限越界的超时任务τ_j，该任务τ_j中的作业j正处于向关键级l_j切换的过程中；根据当前***状态：

(1)定义当前***的资源利用率为u_j(l_j-1)，该利用率可以通过底层***进行监控；

(2)定义作业j的运行截止期限伸缩系数为用于实现对运行截止期限的灵活管理；

(3)定义作业j超时运行时***的资源利用率为u_j(l_j)；

上述定义的所有状态变量作为***资源管理协议RFHP的输入信息；

S2.通过***状态监控机制获取到上述输入信息之后，根据此时***资源的剩余可用程度，按照以下流程管理***资源：

首先，判断当前***资源的剩余可用状态，即是否满足条件如果***资源状态满足该条件，则进行如下状态变量更新：

(1)直接赋值：

(2)直接赋值：u_j(l_j)←u_j(l_j-1)；

(3)依据更新p_j(X_j-1)；

(4)依据更新

如果***状态不满足上述条件，则进行如下状态变量更新：

(1)依据更新p_j(l_j)；

(2)依据更新

(3)依据更新

然后，通过反复迭代上述资源管理流程直至满足边界***状态，最终得到对于超时运行任务τ_j，其超时运行作业j通过***模式切换获得了对应更新后的截止期限伸缩系数，并使用该伸缩系数确定新的超时运行截止期限；

S3.根据超时运行任务的运行情况，给出整个***的资源利用率退化量，用于监控***整体资源利用率的实时状态。

本发明还提供一种混合关键性容错***动态资源管理协议的调度方法，该方法使用混合关键级***调度模型即FMC-MST模型对上述资源管理协议进行可调度性分析；所述的FMC-MST模型的的可调度性分析由如下定理1表示：

定理1：对于满足l_j≥1的模式切换当高关键级任务τ_j超时运行越过其平均最差运行时间C_j(l_j-1)时，当以下条件满足时***满足可调度性：

p_j(l_j)≤0； (5)

当高关键级任务因为故障修复中的阶段性重启导致超时运行越过 C_j(l_j-1)时，只要***状态满足上述不等式则可以保证该故障修复的适用性。

进一步的，对于复杂的故障发生场景，需要保证***始终满足定理1；通过权利要求1提出的资源管理协议RFHP，运行参数如p_j(l_j)和均应被一致地确定以用于计算***要求低关键级服务的恶化情况最终用于补偿超时运行任务。

进一步的，定理1中不等式(1)到不等式(6)在所述的资源管理协议RFHP中需满足以下条件：

条件1：保证不等式(5)和(6)成立：给定在故障发生场景中的u_j(l_j)，确定满足不等式(5)和(6)的p_j(l_j)的值；

规则1：确定p_j(l_j)的值的方法为：对于高关键级任务τ_j从C_j(l_j-1)超时运行至C_j(l_j)的模式切换场景中，p_j(l_j)通过如下方程确定：

性质1：规则1保证了p_j(l_j)满足定理1中不等式(6)和不等式(7)。

条件2:保证不等式(1)至(4)成立：为了实现资源利用率均衡，首先在假设不等式(5)成立的前提下确定和的值；

规则2：确定的方法为：对于高关键级任务τ_j从C_j(l_j-1)超时运行至C_j(l_j)的模式切换场景中，给定u_j(l_j)并假定则通过如下利用率平衡公式确定：

规则3：确定的方法为：对于模式切换场景在成立的前提下，可以使用如下公式进行计算：

性质2：由规则1-3确定的满足定理1中的不等式(4)。

性质3：根据规则2和性质2，始终成立。

规则4：终止条件：对于模式切换场景在成立的前提下，任务τ将直接在关键级X_j-1下执行；

规则5：确定当高关键级任务τ_j结束自适应关键级***策略并从关键级l_j-1跳转至关键级X_j-1时，资源利用率恶化可以根据不等式(2)进行确定。

性质4：根据规则5确定的资源利用率恶化满足定理1中的条件。

进一步的，根据定理1中的描述，每一次任务超时运行都会造成低关键级任务资源利用率的下降；对低关键级任务，需要保证在最差超时运行场景即每一个高关键级任务都处于最悲观关键级状态中剩余低关键级任务的资源利用率不低于0，即满足以下不等式：

其中，X_j表示运行时***的关键级层数目。

进一步的，对于最差执行场景中的单个任务低关键级服务退化可以通过如下分析进行派生：

引理1：一个高关键级任务τ_j根据权利要求1中所述的算法流程进行关键级***；对于任务τ_j的低关键级服务退化可以通过如下公式确定下界：

根据引理1，RFHP协议给出了对于单一任务保证混合关键级***可调度性的低关键级任务退化下界。因此给出说明在整个***层面中RFHP具有适用性的定理2：

定理2：对于一个***已知资源利用率边界u_j(0)和u_j(X_j-1)的混合关键级任务集，使用RFHP协议使混合关键级***可调度的条件如下：

根据定理2，需要为每一个高关键级τ_j找到一个适用的来保证整个混合关键级***的可调度性；将上述所有条件结合，可以将***离线可调度性问题公式化为一个约束满足问题CSP从而为每一个高关键级任务找到合适的

进一步的，为了避免可调度性能的恶化，提出一个新的终止条件，在新的终止策略中，自适应关键级***将在没有为关键级***准备的剩余服务恶化预算时终止，由此来避免低关键级服务的过度恶化，为了量化表示剩余服务恶化预算，提出了如下定义：

定义1：***状态表示在进行模式切换之后任务关键级状态的集合；

定义2：需求恶化边界定义为当所有高关键级任务都切换至最悲观关键级状态X_j-1的最差执行场景中需要低关键级任务做出服务恶化牺牲的边界；在运行过程中，利用率恶化边界在每一次关键级***时根据规则5 进行更新；对于初始状态中所有高关键级任务在0级进行执行，此时的恶化边界DDM₀可以通过如下公式进行初始化：

定义3：可用恶化预算定义为在当前***状态下可用的低关键级任务利用率；在***模式切换发生时，可用恶化预算由如下公式进行更新：

其中由RFHP协议确定，对于初始状态中所有高关键级任务在0 级进行执行，此时的恶化边界AUB₀可以初始化为U_L(0)。

在进行关键级l_j***时，一方面需要确保为当前超时运行准备足够的低关键级文图资源，另一方面要为未来的关键级转换预留足够的资源。该关键级转换表示最差执行场景即所有高关键级任务切换至最悲观关键级X_j-1。在每一次关键级***发生时，新的规则要求检查是否满足来决定是否终止关键级***。

规则6：新的终止条件：对于在模式切换的***状态如果满足如下条件：则任务τ_j将直接在关键级X_j-1下执行。

进一步的，通过将原始RFHP协议中的规则4的终止条件替换为规则6所示的新终止条件，然后根据定义2和定义3添加更新恶化边界的操作，即可得到改进的RFHP资源管理协议；此时，改进后RFHP资源管理协议在***层面可调度性的适用性可由定理3说明；

定理3：对于一个混合关键级任务集，已知资源使用率边界u_j(0)和 u_j(X_j-1)，那么在满足以下条件的时候该混合关键级任务集具有可调度性：

与现有技术相比，有益效果是：本发明提出的一种合关键性容错***动态资源管理协议及该协议的调度方法，在保证***稳定性和可调度性的前提下，避免了悲观的***资源分配策略，通过灵活***关键级实现了对***资源利用率的进一步提升，由此提升了***整体服务性能。

附图说明

图1是本发明提出的资源管理协议的算法流程图。

具体实施方式

附图仅用于示例性说明，不能理解为对本发明的限制；为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明，不能理解为对本发明的限制。

一种混合关键性容错***动态资源管理协议，资源管理协议RFHP在***检测到瞬态故障发生时，根据当前***资源的运行负载，自适应地在任务调度模型中添加中间层关键级，通过调整关键级对***资源的利用率进行提升；所述的资源管理协议具体包括以下流程：

(3)定义作业j超时运行时***的资源利用率为u_j(lj)；

(1)直接赋值：

(2)直接赋值：u_j(l_j)←u_j(l_j-1)；

(3)依据更新p_j(X_j-1)；

(4)依据更新

如果***状态不满足上述条件，则进行如下状态变量更新：

(1)依据更新p_j(l_j)；

(2)依据更新

(3)依据更新

在每一次任务τ_j因为超时运行将***资源利用率从u_j(l_j-1)提升至 u_j(l_j)而导致***模式切换发生时，上述协议首先根据规则4检查是否有必要切换至最悲观层级X_j-1。如果存在切换的必要，那么***将直接在 X_j-1模式下运行，并根据定理1计算相应的否则，***将会***中间关键级l_j。根据规则1-3可以确定截止期限伸缩系数和资源利用率恶化一般来说，上述资源管理协议允许基于随机超时运行利用率参数设定的自适应关键级***，而这一过程由运行过程中故障发生来自适应决定的。

FMC-MST是一种泛化混合关键级***调度模型，在FMC-MST模型中，每一个高关键级任务被允许在离线预定义的多个中间层关键级之间切换，而低关键级任务则根据高关键级任务的超时运行情况通过多阶跳转机制精确地让出计算资源。虽然，FMC-MST允许***多种中间悲观层级的关键级，避免传统模型的悲观性假设。但是，这种多层级的***要求在***运行之前进行离线指定，不能在线动态制定。这种离线制定的方式限制FMC-MST调度模型在容错***中的实际使用。一方面，这种离线***方式面临着分析状态组合***问题。例如，一个任务有N个错误检查点，那么一个任务将会有2^N资源超载情况， FMC-MST调度模型需要离线***2^N临时状态(针对每一种超时情况FMC-MST需要***一个临时状态来重新调度高优先级任务和低优先级的资源)。一方面，这种离线***方式不够高效，不能根据错误发生情况在线调整。针对这一问题，本发明拟提出一种动态在线的资源管理协议和给出了该协议的可调度条件。该协议假设FMC-MST允许***无限个相隔无线接近的关键级别。本发明希提出的资源管理协议，在动态调度和关键级别切换时，能够保证资源的分配始终满足FMC-MST的可调度条件。

本发明提出的一种混合关键性容错***动态资源管理协议的调度方法，该方法使用混合关键级***调度模型即FMC-MST模型对上述资源管理协议进行可调度性分析；所述的FMC-MST模型的的可调度性分析由如下定理1表示：

p_j(l_j)≤0； (5)

定理1展示了对于超时运行的一种泛化的基于资源利用率的可调度测试条件。在该定理的分析基础上，***可以自适应地决定为低关键级任务预留多少运行资源预算，由此在确保***运行期间可调度性能的同时处理超时运行。但是现有方法仍然存在资源管理和***调度性能低效的问题，因此本发明提出了一种统一的资源管理协议。该协议可提供处理故障修复时的***调度决策，与此同时保证***的可靠性和认证要求。每当出现一个超时运行实例，调度决策应该保证进行中和未来发生的故障处理满足时序要求。因此对于复杂的故障发生场景，必须保证***始终满足定理1。通过本发明提出的资源管理协议RFHP，运行参数如p_j(l_j)和均应被一致地确定以用于计算***要求低关键级服务的恶化情况最终用于补偿超时运行任务。

定理1中不等式(1)到不等式(6)在所述的资源管理协议RFHP中需满足以下条件：

条件1：保证不等式(5)和(6)成立：给定在故障发生场景中的u_j(1_j)，确定满足不等式(5)和(6)的p_j(l_j)的值；

条件2：保证不等式(1)至(4)成立：为了实现资源利用率均衡，首先在假设不等式(5)成立的前提下确定和的值；

性质2：由规则1-3确定的满足定理1中的不等式(4)。

性质3：根据规则2和性质2，始终成立。

规则4：终止条件：对于模式切换场景在成立的前提下，任务τ_j将直接在关键级X_j-1下执行；

在资源管理协议RFHP中，定理1中条件的满足只能保证单次关键级***的在线可调度性，因此需要确定RFHP对于一个给定关键级边界区间的混合关键级任务集的适用性。为了保证可调度性，需要保证RFHP可以在任意任务执行场景中成功调度任务集。根据定理1中的描述，每一次任务超时运行都会造成低关键级任务资源利用率的下降。对低关键级任务，需要保证在最差超时运行场景(每一个高关键级任务都处于最悲观关键级状态)中剩余低关键级任务的资源利用率不低于0。因此要求下列不等式满足：

其中，X_j表示运行时***的关键级层数目。公式C_j(X_j-1)＝n_j·C_j(0)的成立基于执行时间n_j可以统一地离线派生。对于最差执行场景中的单个任务低关键级服务退化可以通过如下分析进行派生：

根据引理1，RFHP协议给出了对于单一任务保证混合关键级***可调度性的低关键级任务退化下界，由此给出说明在整个***层面中RFHP具有适用性的定理2：

最后，阐述经过改进的RFHP协议满足***可调度性的最终条件；

规则4中基于贪心策略的关键级***会导致过多中间层关键级***而引起低关键级任务的过度恶化，最终如引理1所示地影响***的可调度性性能。因此为了避免可调度性能的恶化，提出了一个比贪心策略更加合适的资源管理终止条件。在新的终止策略中，自适应关键级***将在没有为关键级***准备的剩余服务恶化预算时终止，由此来避免低关键级服务的过度恶化。为了量化表示剩余服务恶化预算，提出了如下定义：

通过将原始RFHP协议中的规则4的终止条件替换为规则6所示的新终止条件，然后根据定义2和定义3添加更新恶化边界的操作，即可得到改进的RFHP 资源管理协议；此时，改进后RFHP资源管理协议在***层面可调度性的适用性可由定理3说明；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种混合关键性容错***动态资源管理协议，其特征在于，资源管理协议RFHP在***检测到瞬态故障发生时，根据当前***资源的运行负载，自适应地在任务调度模型中添加中间层关键级，通过调整关键级对***资源的利用率进行提升；所述的资源管理协议具体包括以下流程：

(3)定义作业j超时运行时***的资源利用率为u_j(l_j)；

(1)直接赋值：

(2)直接赋值：u_j(l_j)←u_j(l_j-1)；

(3)依据更新p_j(X_j-1)；

(4)依据更新

如果***状态不满足上述条件，则进行如下状态变量更新：

(1)依据更新p_j(l_j)；

(2)依据更新

(3)依据更新

2.一种混合关键性容错***动态资源管理协议的调度方法，其特征在于，使用混合关键级***调度模型即FMC-MST模型对权利要求1提出的资源管理协议进行可调度性分析；所述的FMC-MST模型的的可调度性分析由如下定理1表示：

p_j(l_j)≤0； (5)

3.根据权利要求2所述的混合关键性容错***动态资源管理协议的调度方法，其特征在于，对于复杂的故障发生场景，需要保证***始终满足定理1；通过权利要求1提出的资源管理协议RFHP，运行参数如p_j(l_j)和均应被一致地确定以用于计算***要求低关键级服务的恶化情况最终用于补偿超时运行任务。

4.根据权利要求3所述的混合关键性容错***动态资源管理协议的调度方法，其特征在于，对定理1中不等式(1)到不等式(6)在所述的资源管理协议RFHP中需满足以下条件：

条件1:保证不等式(5)和(6)成立：给定在故障发生场景中的u_j(l_j)，确定满足不等式(5)和(6)的p_j(l_j)的值；

5.根据权利要求4所述的混合关键性容错***动态资源管理协议的调度方法，其特征在于，根据定理1中的描述，每一次任务超时运行都会造成低关键级任务资源利用率的下降；对低关键级任务，需要保证在最差超时运行场景即每一个高关键级任务都处于最悲观关键级状态中剩余低关键级任务的资源利用率不低于0，即满足以下不等式：

其中，X_j表示运行时***的关键级层数目。

6.根据权利要求5所述的混合关键性容错***动态资源管理协议的调度方法，其特征在于，对于最差执行场景中的单个任务低关键级服务退化可以通过如下分析进行派生：

一个高关键级任务τ_j根据权利要求1中所述的算法流程进行关键级***；对于任务τ_j的低关键级服务退化可以通过如下公式确定下界：

根据上述公式，RFHP协议讨论了对于单一任务保证混合关键级***可调度性的低关键级任务退化下界；由此给出说明在整个***层面中RFHP具有适用性的定理2：

对于一个***已知资源利用率边界u_j(0)和u_j(X_j-1)的混合关键级任务集，使用RFHP协议使混合关键级***可调度的条件如下：

7.根据权利要求6所述的混合关键性容错***动态资源管理协议的调度方法，其特征在于，为了避免可调度性能的恶化，提出一个新的终止条件，在新的终止策略中，自适应关键级***将在没有为关键级***准备的剩余服务恶化预算时终止，由此来避免低关键级服务的过度恶化，为了量化表示剩余服务恶化预算，提出了如下定义：

定义2：需求恶化边界定义为当所有高关键级任务都切换至最悲观关键级状态X_j-1的最差执行场景中需要低关键级任务做出服务恶化牺牲的边界；在运行过程中，利用率恶化边界在每一次关键级***时根据规则5进行更新；对于初始状态中所有高关键级任务在0级进行执行，此时的恶化边界DDM₀可以通过如下公式进行初始化：

其中由RFHP协议确定，对于初始状态中所有高关键级任务在0级进行执行，此时的恶化边界AUB₀可以初始化为U_L(0)；

8.根据权利要求7所述的混合关键性容错***动态资源管理协议的调度方法，其特征在于，通过将原始RFHP协议中的规则4的终止条件替换为规则6所示的新终止条件，然后根据定义2和定义3添加更新恶化边界的操作，即可得到改进的RFHP资源管理协议；此时，改进后RFHP资源管理协议在***层面可调度性的适用性可由定理3说明；

定理3：对于一个混合关键级任务集，已知资源使用率边界u_j(0)和u_j(X_j-1)，那么在满足以下条件的时候该混合关键级任务集具有可调度性：