CN110196762A - 混合关键性容错***动态资源管理协议及该协议的调度方法 - Google Patents

混合关键性容错***动态资源管理协议及该协议的调度方法 Download PDF

Info

Publication number
CN110196762A
CN110196762A CN201910314452.XA CN201910314452A CN110196762A CN 110196762 A CN110196762 A CN 110196762A CN 201910314452 A CN201910314452 A CN 201910314452A CN 110196762 A CN110196762 A CN 110196762A
Authority
CN
China
Prior art keywords
critical level
task
resource
resource management
agreement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910314452.XA
Other languages
English (en)
Other versions
CN110196762B (zh
Inventor
陈刚
杨俊杰
黄凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN201910314452.XA priority Critical patent/CN110196762B/zh
Publication of CN110196762A publication Critical patent/CN110196762A/zh
Application granted granted Critical
Publication of CN110196762B publication Critical patent/CN110196762B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/486Scheduler internals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/503Resource availability

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本发明涉及实时和嵌入式***设计技术领域,更具体地,涉及一种混合关键性容错***动态资源管理协议及该协议的调度方法。资源管理协议RFHP在***检测到瞬态故障发生时,根据当前***资源的运行负载,自适应地在任务调度模型中添加中间层关键级,通过调整关键级对***资源的利用率进行提升。同时提出了一种针对该协议的调度方法,通过资源管理协议与调度方法的配合,在保证***稳定性和可调度性的前提下,避免了悲观的***资源分配策略,通过灵活***关键级实现了对***资源利用率的进一步提升,由此提升了***整体服务性能。

Description

混合关键性容错***动态资源管理协议及该协议的调度方法
技术领域
本发明涉及实时和嵌入式***设计技术领域,更具体地,涉及一种混合关键性容错***动态资源管理协议及该协议的调度方法。
背景技术
在通用硬件平台上整合不同认证要求的安全关键性任务已经成为实时和嵌入式***设计的发展趋势。对于安全关键的嵌入式***,容错是***设计中特别必要的,它能防止潜在的故障,以实现高的安全性和可靠性。目前,容错技术主要采用重新执行和检查点回滚技术处理故障的发生。重执行机制要求在故障出现时重新执行全部作业,是一种粗粒度的容错机制;检查点回滚机制则会在运行中阶段性保存***状态,并在故障出现时将***回滚至最近的正常检查点状态。
最近的一些研究已经集中于解决存在瞬时故障的混合关键性***中容错任务映射与调度问题,解决满足混合关键性***的安全需求和实时性能的调度问题。然而,这些研究都是在传统的混合关键性模型的基础上集成重执行容错机制。到目前为止,基于检查点回滚机制的灵活混合关键调度的研究还没有处于研究空白。其主要是因为,经典混合关键级***模型存在一些悲观性假设问题: (1)经典混合关键级***模型对于故障的处理不够灵活,在高关键级任务出现超时运行时,***将抛弃所有的低关键级任务来保证高关键级任务的执行。这种过于悲观的资源分配方法严重影响了***的实际运行性能。(2)现有双关键级***模型的容错解决方案均采用重执行机制来处理***瞬态故障,但是***任务(尤其是较长流水线任务)的反复重新执行会严重消耗***资源。由此看出,该方法无法识别不必要的计算任务,体现出过于粗粒度的缺点。
到目前为止,缺乏一种动态灵活的混合关键性调度机制来处理和检查点回滚机制中这种动态行为。因此,需要针对上述问题对混合关键性调度进行创新并整合检查点回滚机制中的细粒度动态调整行为,从而提高***资源的利用效率进而提升***性能。具体来说,需要从如下两个层面进行分析:
1.如何解决容错***中出现瞬态故障任务时的***合理调度问题。处理***瞬态故障需要额外的计算资源和时间,此时不合理的***调度将严重恶化任务的相应时间,最终导致***性能恶化,因此一个合理的***动态调度机制是十分必要的。
2.如何解决容错***中用于解决瞬态故障的***资源管理问题。当***检测到出瞬态故障时,应该对现有可用资源进行评估和合理分配,因此需要满足***可靠性要求的资源管理。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种混合关键性容错***动态资源管理协议及该协议的调度方法,在保证***稳定性和可调度性的前提下,避免了悲观的***资源分配策略,提升了***整体服务性能。
为解决上述技术问题,本发明采用的技术方案是:一种混合关键性容错***动态资源管理协议,资源管理协议RFHP在***检测到瞬态故障发生时,根据当前***资源的运行负载,自适应地在任务调度模型中添加中间层关键级,通过调整关键级对***资源的利用率进行提升;所述的资源管理协议具体包括以下流程:
S1.对于存在运行截止期限越界的超时任务τj,该任务τj中的作业j正处于向关键级lj切换的过程中;根据当前***状态:
(1)定义当前***的资源利用率为uj(lj-1),该利用率可以通过底层***进行监控;
(2)定义作业j的运行截止期限伸缩系数为用于实现对运行截止期限的灵活管理;
(3)定义作业j超时运行时***的资源利用率为uj(lj);
上述定义的所有状态变量作为***资源管理协议RFHP的输入信息;
S2.通过***状态监控机制获取到上述输入信息之后,根据此时***资源的剩余可用程度,按照以下流程管理***资源:
首先,判断当前***资源的剩余可用状态,即是否满足条件如果***资源状态满足该条件,则进行如下状态变量更新:
(1)直接赋值:
(2)直接赋值:uj(lj)←uj(lj-1);
(3)依据更新pj(Xj-1);
(4)依据更新
如果***状态不满足上述条件,则进行如下状态变量更新:
(1)依据更新pj(lj);
(2)依据更新
(3)依据更新
然后,通过反复迭代上述资源管理流程直至满足边界***状态,最终得到对于超时运行任务τj,其超时运行作业j通过***模式切换获得了对应更新后的截止期限伸缩系数,并使用该伸缩系数确定新的超时运行截止期限;
S3.根据超时运行任务的运行情况,给出整个***的资源利用率退化量,用于监控***整体资源利用率的实时状态。
本发明还提供一种混合关键性容错***动态资源管理协议的调度方法,该方法使用混合关键级***调度模型即FMC-MST模型对上述资源管理协议进行可调度性分析;所述的FMC-MST模型的的可调度性分析由如下定理1表示:
定理1:对于满足lj≥1的模式切换当高关键级任务τj超时运行越过其平均最差运行时间Cj(lj-1)时,当以下条件满足时***满足可调度性:
pj(lj)≤0; (5)
当高关键级任务因为故障修复中的阶段性重启导致超时运行越过 Cj(lj-1)时,只要***状态满足上述不等式则可以保证该故障修复的适用性。
进一步的,对于复杂的故障发生场景,需要保证***始终满足定理1;通过权利要求1提出的资源管理协议RFHP,运行参数如pj(lj)和均应被一致地确定以用于计算***要求低关键级服务的恶化情况最终用于补偿超时运行任务。
进一步的,定理1中不等式(1)到不等式(6)在所述的资源管理协议RFHP中需满足以下条件:
条件1:保证不等式(5)和(6)成立:给定在故障发生场景中的uj(lj),确定满足不等式(5)和(6)的pj(lj)的值;
规则1:确定pj(lj)的值的方法为:对于高关键级任务τj从Cj(lj-1)超时运行至Cj(lj)的模式切换场景中,pj(lj)通过如下方程确定:
性质1:规则1保证了pj(lj)满足定理1中不等式(6)和不等式(7)。
条件2:保证不等式(1)至(4)成立:为了实现资源利用率均衡,首先在假设不等式(5)成立的前提下确定的值;
规则2:确定的方法为:对于高关键级任务τj从Cj(lj-1)超时运行至Cj(lj)的模式切换场景中,给定uj(lj)并假定通过如下利用率平衡公式确定:
规则3:确定的方法为:对于模式切换场景 成立的前提下,可以使用如下公式进行计算:
性质2:由规则1-3确定的满足定理1中的不等式(4)。
性质3:根据规则2和性质2,始终成立。
规则4:终止条件:对于模式切换场景成立的前提下,任务τ将直接在关键级Xj-1下执行;
规则5:确定当高关键级任务τj结束自适应关键级***策略并从关键级lj-1跳转至关键级Xj-1时,资源利用率恶化可以根据不等式(2)进行确定。
性质4:根据规则5确定的资源利用率恶化满足定理1中的条件。
进一步的,根据定理1中的描述,每一次任务超时运行都会造成低关键级任务资源利用率的下降;对低关键级任务,需要保证在最差超时运行场景即每一个高关键级任务都处于最悲观关键级状态中剩余低关键级任务的资源利用率不低于0,即满足以下不等式:
其中,Xj表示运行时***的关键级层数目。
进一步的,对于最差执行场景中的单个任务低关键级服务退化可以通过如下分析进行派生:
引理1:一个高关键级任务τj根据权利要求1中所述的算法流程进行关键级***;对于任务τj的低关键级服务退化可以通过如下公式确定下界:
根据引理1,RFHP协议给出了对于单一任务保证混合关键级***可调度性的低关键级任务退化下界。因此给出说明在整个***层面中RFHP具有适用性的定理2:
定理2:对于一个***已知资源利用率边界uj(0)和uj(Xj-1)的混合关键级任务集,使用RFHP协议使混合关键级***可调度的条件如下:
根据定理2,需要为每一个高关键级τj找到一个适用的来保证整个混合关键级***的可调度性;将上述所有条件结合,可以将***离线可调度性问题公式化为一个约束满足问题CSP从而为每一个高关键级任务找到合适的
进一步的,为了避免可调度性能的恶化,提出一个新的终止条件,在新的终止策略中,自适应关键级***将在没有为关键级***准备的剩余服务恶化预算时终止,由此来避免低关键级服务的过度恶化,为了量化表示剩余服务恶化预算,提出了如下定义:
定义1:***状态表示在进行模式切换之后任务关键级状态的集合;
定义2:需求恶化边界定义为当所有高关键级任务都切换至最悲观关键级状态Xj-1的最差执行场景中需要低关键级任务做出服务恶化牺牲的边界;在运行过程中,利用率恶化边界在每一次关键级***时根据规则5 进行更新;对于初始状态中所有高关键级任务在0级进行执行,此时的恶化边界DDM0可以通过如下公式进行初始化:
定义3:可用恶化预算定义为在当前***状态下可用的低关键级任务利用率;在***模式切换发生时,可用恶化预算由如下公式进行更新:
其中由RFHP协议确定,对于初始状态中所有高关键级任务在0 级进行执行,此时的恶化边界AUB0可以初始化为UL(0)。
在进行关键级lj***时,一方面需要确保为当前超时运行准备足够的低关键级文图资源,另一方面要为未来的关键级转换预留足够的资源。该关键级转换表示最差执行场景即所有高关键级任务切换至最悲观关键级Xj-1。在每一次关键级***发生时,新的规则要求检查是否满足来决定是否终止关键级***。
规则6:新的终止条件:对于在模式切换的***状态如果满足如下条件:则任务τj将直接在关键级Xj-1下执行。
进一步的,通过将原始RFHP协议中的规则4的终止条件替换为规则6所示的新终止条件,然后根据定义2和定义3添加更新恶化边界的操作,即可得到改进的RFHP资源管理协议;此时,改进后RFHP资源管理协议在***层面可调度性的适用性可由定理3说明;
定理3:对于一个混合关键级任务集,已知资源使用率边界uj(0)和 uj(Xj-1),那么在满足以下条件的时候该混合关键级任务集具有可调度性:
与现有技术相比,有益效果是:本发明提出的一种合关键性容错***动态资源管理协议及该协议的调度方法,在保证***稳定性和可调度性的前提下,避免了悲观的***资源分配策略,通过灵活***关键级实现了对***资源利用率的进一步提升,由此提升了***整体服务性能。
附图说明
图1是本发明提出的资源管理协议的算法流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本发明的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本发明的限制。
一种混合关键性容错***动态资源管理协议,资源管理协议RFHP在***检测到瞬态故障发生时,根据当前***资源的运行负载,自适应地在任务调度模型中添加中间层关键级,通过调整关键级对***资源的利用率进行提升;所述的资源管理协议具体包括以下流程:
S1.对于存在运行截止期限越界的超时任务τj,该任务τj中的作业j正处于向关键级lj切换的过程中;根据当前***状态:
(1)定义当前***的资源利用率为uj(lj-1),该利用率可以通过底层***进行监控;
(2)定义作业j的运行截止期限伸缩系数为用于实现对运行截止期限的灵活管理;
(3)定义作业j超时运行时***的资源利用率为uj(lj);
上述定义的所有状态变量作为***资源管理协议RFHP的输入信息;
S2.通过***状态监控机制获取到上述输入信息之后,根据此时***资源的剩余可用程度,按照以下流程管理***资源:
首先,判断当前***资源的剩余可用状态,即是否满足条件如果***资源状态满足该条件,则进行如下状态变量更新:
(1)直接赋值:
(2)直接赋值:uj(lj)←uj(lj-1);
(3)依据更新pj(Xj-1);
(4)依据更新
如果***状态不满足上述条件,则进行如下状态变量更新:
(1)依据更新pj(lj);
(2)依据更新
(3)依据更新
然后,通过反复迭代上述资源管理流程直至满足边界***状态,最终得到对于超时运行任务τj,其超时运行作业j通过***模式切换获得了对应更新后的截止期限伸缩系数,并使用该伸缩系数确定新的超时运行截止期限;
S3.根据超时运行任务的运行情况,给出整个***的资源利用率退化量,用于监控***整体资源利用率的实时状态。
在每一次任务τj因为超时运行将***资源利用率从uj(lj-1)提升至 uj(lj)而导致***模式切换发生时,上述协议首先根据规则4检查是否有必要切换至最悲观层级Xj-1。如果存在切换的必要,那么***将直接在 Xj-1模式下运行,并根据定理1计算相应的否则,***将会***中间关键级lj。根据规则1-3可以确定截止期限伸缩系数和资源利用率恶化一般来说,上述资源管理协议允许基于随机超时运行利用率参数设定的自适应关键级***,而这一过程由运行过程中故障发生来自适应决定的。
FMC-MST是一种泛化混合关键级***调度模型,在FMC-MST模型中,每一个高关键级任务被允许在离线预定义的多个中间层关键级之间切换,而低关键级任务则根据高关键级任务的超时运行情况通过多阶跳转机制精确地让出计算资源。虽然,FMC-MST允许***多种中间悲观层级的关键级,避免传统模型的悲观性假设。但是,这种多层级的***要求在***运行之前进行离线指定,不能在线动态制定。这种离线制定的方式限制FMC-MST调度模型在容错***中的实际使用。一方面,这种离线***方式面临着分析状态组合***问题。例如,一个任务有N个错误检查点,那么一个任务将会有2^N资源超载情况, FMC-MST调度模型需要离线***2^N临时状态(针对每一种超时情况FMC-MST需要***一个临时状态来重新调度高优先级任务和低优先级的资源)。一方面,这种离线***方式不够高效,不能根据错误发生情况在线调整。针对这一问题,本发明拟提出一种动态在线的资源管理协议和给出了该协议的可调度条件。该协议假设FMC-MST允许***无限个相隔无线接近的关键级别。本发明希提出的资源管理协议,在动态调度和关键级别切换时,能够保证资源的分配始终满足FMC-MST的可调度条件。
本发明提出的一种混合关键性容错***动态资源管理协议的调度方法,该方法使用混合关键级***调度模型即FMC-MST模型对上述资源管理协议进行可调度性分析;所述的FMC-MST模型的的可调度性分析由如下定理1表示:
定理1:对于满足lj≥1的模式切换当高关键级任务τj超时运行越过其平均最差运行时间Cj(lj-1)时,当以下条件满足时***满足可调度性:
pj(lj)≤0; (5)
当高关键级任务因为故障修复中的阶段性重启导致超时运行越过 Cj(lj-1)时,只要***状态满足上述不等式则可以保证该故障修复的适用性。
定理1展示了对于超时运行的一种泛化的基于资源利用率的可调度测试条件。在该定理的分析基础上,***可以自适应地决定为低关键级任务预留多少运行资源预算,由此在确保***运行期间可调度性能的同时处理超时运行。但是现有方法仍然存在资源管理和***调度性能低效的问题,因此本发明提出了一种统一的资源管理协议。该协议可提供处理故障修复时的***调度决策,与此同时保证***的可靠性和认证要求。每当出现一个超时运行实例,调度决策应该保证进行中和未来发生的故障处理满足时序要求。因此对于复杂的故障发生场景,必须保证***始终满足定理1。通过本发明提出的资源管理协议RFHP,运行参数如pj(lj)和均应被一致地确定以用于计算***要求低关键级服务的恶化情况最终用于补偿超时运行任务。
定理1中不等式(1)到不等式(6)在所述的资源管理协议RFHP中需满足以下条件:
条件1:保证不等式(5)和(6)成立:给定在故障发生场景中的uj(1j),确定满足不等式(5)和(6)的pj(lj)的值;
规则1:确定pj(lj)的值的方法为:对于高关键级任务τj从Cj(lj-1)超时运行至Cj(lj)的模式切换场景中,pj(lj)通过如下方程确定:
性质1:规则1保证了pj(lj)满足定理1中不等式(6)和不等式(7)。
条件2:保证不等式(1)至(4)成立:为了实现资源利用率均衡,首先在假设不等式(5)成立的前提下确定的值;
规则2:确定的方法为:对于高关键级任务τj从Cj(lj-1)超时运行至Cj(lj)的模式切换场景中,给定uj(lj)并假定通过如下利用率平衡公式确定:
规则3:确定的方法为:对于模式切换场景 成立的前提下,可以使用如下公式进行计算:
性质2:由规则1-3确定的满足定理1中的不等式(4)。
性质3:根据规则2和性质2,始终成立。
规则4:终止条件:对于模式切换场景成立的前提下,任务τj将直接在关键级Xj-1下执行;
规则5:确定当高关键级任务τj结束自适应关键级***策略并从关键级lj-1跳转至关键级Xj-1时,资源利用率恶化可以根据不等式(2)进行确定。
性质4:根据规则5确定的资源利用率恶化满足定理1中的条件。
在资源管理协议RFHP中,定理1中条件的满足只能保证单次关键级***的在线可调度性,因此需要确定RFHP对于一个给定关键级边界区间的混合关键级任务集的适用性。为了保证可调度性,需要保证RFHP可以在任意任务执行场景中成功调度任务集。根据定理1中的描述,每一次任务超时运行都会造成低关键级任务资源利用率的下降。对低关键级任务,需要保证在最差超时运行场景(每一个高关键级任务都处于最悲观关键级状态)中剩余低关键级任务的资源利用率不低于0。因此要求下列不等式满足:
其中,Xj表示运行时***的关键级层数目。公式Cj(Xj-1)=nj·Cj(0)的成立基于执行时间nj可以统一地离线派生。对于最差执行场景中的单个任务低关键级服务退化可以通过如下分析进行派生:
引理1:一个高关键级任务τj根据权利要求1中所述的算法流程进行关键级***;对于任务τj的低关键级服务退化可以通过如下公式确定下界:
根据引理1,RFHP协议给出了对于单一任务保证混合关键级***可调度性的低关键级任务退化下界,由此给出说明在整个***层面中RFHP具有适用性的定理2:
定理2:对于一个***已知资源利用率边界uj(0)和uj(Xj-1)的混合关键级任务集,使用RFHP协议使混合关键级***可调度的条件如下:
根据定理2,需要为每一个高关键级τj找到一个适用的来保证整个混合关键级***的可调度性;将上述所有条件结合,可以将***离线可调度性问题公式化为一个约束满足问题CSP从而为每一个高关键级任务找到合适的
最后,阐述经过改进的RFHP协议满足***可调度性的最终条件;
规则4中基于贪心策略的关键级***会导致过多中间层关键级***而引起低关键级任务的过度恶化,最终如引理1所示地影响***的可调度性性能。因此为了避免可调度性能的恶化,提出了一个比贪心策略更加合适的资源管理终止条件。在新的终止策略中,自适应关键级***将在没有为关键级***准备的剩余服务恶化预算时终止,由此来避免低关键级服务的过度恶化。为了量化表示剩余服务恶化预算,提出了如下定义:
定义1:***状态表示在进行模式切换之后任务关键级状态的集合;
定义2:需求恶化边界定义为当所有高关键级任务都切换至最悲观关键级状态Xj-1的最差执行场景中需要低关键级任务做出服务恶化牺牲的边界;在运行过程中,利用率恶化边界在每一次关键级***时根据规则5 进行更新;对于初始状态中所有高关键级任务在0级进行执行,此时的恶化边界DDM0可以通过如下公式进行初始化:
定义3:可用恶化预算定义为在当前***状态下可用的低关键级任务利用率;在***模式切换发生时,可用恶化预算由如下公式进行更新:
其中由RFHP协议确定,对于初始状态中所有高关键级任务在0 级进行执行,此时的恶化边界AUB0可以初始化为UL(0)。
在进行关键级lj***时,一方面需要确保为当前超时运行准备足够的低关键级文图资源,另一方面要为未来的关键级转换预留足够的资源。该关键级转换表示最差执行场景即所有高关键级任务切换至最悲观关键级Xj-1。在每一次关键级***发生时,新的规则要求检查是否满足来决定是否终止关键级***。
规则6:新的终止条件:对于在模式切换的***状态如果满足如下条件:则任务τj将直接在关键级Xj-1下执行。
通过将原始RFHP协议中的规则4的终止条件替换为规则6所示的新终止条件,然后根据定义2和定义3添加更新恶化边界的操作,即可得到改进的RFHP 资源管理协议;此时,改进后RFHP资源管理协议在***层面可调度性的适用性可由定理3说明;
定理3:对于一个混合关键级任务集,已知资源使用率边界uj(0)和 uj(Xj-1),那么在满足以下条件的时候该混合关键级任务集具有可调度性:
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (8)

1.一种混合关键性容错***动态资源管理协议,其特征在于,资源管理协议RFHP在***检测到瞬态故障发生时,根据当前***资源的运行负载,自适应地在任务调度模型中添加中间层关键级,通过调整关键级对***资源的利用率进行提升;所述的资源管理协议具体包括以下流程:
S1.对于存在运行截止期限越界的超时任务τj,该任务τj中的作业j正处于向关键级lj切换的过程中;根据当前***状态:
(1)定义当前***的资源利用率为uj(lj-1),该利用率可以通过底层***进行监控;
(2)定义作业j的运行截止期限伸缩系数为用于实现对运行截止期限的灵活管理;
(3)定义作业j超时运行时***的资源利用率为uj(lj);
上述定义的所有状态变量作为***资源管理协议RFHP的输入信息;
S2.通过***状态监控机制获取到上述输入信息之后,根据此时***资源的剩余可用程度,按照以下流程管理***资源:
首先,判断当前***资源的剩余可用状态,即是否满足条件如果***资源状态满足该条件,则进行如下状态变量更新:
(1)直接赋值:
(2)直接赋值:uj(lj)←uj(lj-1);
(3)依据更新pj(Xj-1);
(4)依据更新
如果***状态不满足上述条件,则进行如下状态变量更新:
(1)依据更新pj(lj);
(2)依据更新
(3)依据更新
然后,通过反复迭代上述资源管理流程直至满足边界***状态,最终得到对于超时运行任务τj,其超时运行作业j通过***模式切换获得了对应更新后的截止期限伸缩系数,并使用该伸缩系数确定新的超时运行截止期限;
S3.根据超时运行任务的运行情况,给出整个***的资源利用率退化量,用于监控***整体资源利用率的实时状态。
2.一种混合关键性容错***动态资源管理协议的调度方法,其特征在于,使用混合关键级***调度模型即FMC-MST模型对权利要求1提出的资源管理协议进行可调度性分析;所述的FMC-MST模型的的可调度性分析由如下定理1表示:
定理1:对于满足lj≥1的模式切换当高关键级任务τj超时运行越过其平均最差运行时间Cj(lj-1)时,当以下条件满足时***满足可调度性:
pj(lj)≤0; (5)
3.根据权利要求2所述的混合关键性容错***动态资源管理协议的调度方法,其特征在于,对于复杂的故障发生场景,需要保证***始终满足定理1;通过权利要求1提出的资源管理协议RFHP,运行参数如pj(lj)和均应被一致地确定以用于计算***要求低关键级服务的恶化情况最终用于补偿超时运行任务。
4.根据权利要求3所述的混合关键性容错***动态资源管理协议的调度方法,其特征在于,对定理1中不等式(1)到不等式(6)在所述的资源管理协议RFHP中需满足以下条件:
条件1:保证不等式(5)和(6)成立:给定在故障发生场景中的uj(lj),确定满足不等式(5)和(6)的pj(lj)的值;
规则1:确定pj(lj)的值的方法为:对于高关键级任务τj从Cj(lj-1)超时运行至Cj(lj)的模式切换场景中,pj(lj)通过如下方程确定:
条件2:保证不等式(1)至(4)成立:为了实现资源利用率均衡,首先在假设不等式(5)成立的前提下确定的值;
规则2:确定的方法为:对于高关键级任务τj从Cj(lj-1)超时运行至Cj(lj)的模式切换场景中,给定uj(lj)并假定通过如下利用率平衡公式确定:
规则3:确定的方法为:对于模式切换场景 成立的前提下,可以使用如下公式进行计算:
规则4:终止条件:对于模式切换场景成立的前提下,任务τj将直接在关键级Xj-1下执行;
规则5:确定当高关键级任务τj结束自适应关键级***策略并从关键级lj-1跳转至关键级Xj-1时,资源利用率恶化可以根据不等式(2)进行确定。
5.根据权利要求4所述的混合关键性容错***动态资源管理协议的调度方法,其特征在于,根据定理1中的描述,每一次任务超时运行都会造成低关键级任务资源利用率的下降;对低关键级任务,需要保证在最差超时运行场景即每一个高关键级任务都处于最悲观关键级状态中剩余低关键级任务的资源利用率不低于0,即满足以下不等式:
其中,Xj表示运行时***的关键级层数目。
6.根据权利要求5所述的混合关键性容错***动态资源管理协议的调度方法,其特征在于,对于最差执行场景中的单个任务低关键级服务退化可以通过如下分析进行派生:
一个高关键级任务τj根据权利要求1中所述的算法流程进行关键级***;对于任务τj的低关键级服务退化可以通过如下公式确定下界:
根据上述公式,RFHP协议讨论了对于单一任务保证混合关键级***可调度性的低关键级任务退化下界;由此给出说明在整个***层面中RFHP具有适用性的定理2:
对于一个***已知资源利用率边界uj(0)和uj(Xj-1)的混合关键级任务集,使用RFHP协议使混合关键级***可调度的条件如下:
根据定理2,需要为每一个高关键级τj找到一个适用的来保证整个混合关键级***的可调度性;将上述所有条件结合,可以将***离线可调度性问题公式化为一个约束满足问题CSP从而为每一个高关键级任务找到合适的
7.根据权利要求6所述的混合关键性容错***动态资源管理协议的调度方法,其特征在于,为了避免可调度性能的恶化,提出一个新的终止条件,在新的终止策略中,自适应关键级***将在没有为关键级***准备的剩余服务恶化预算时终止,由此来避免低关键级服务的过度恶化,为了量化表示剩余服务恶化预算,提出了如下定义:
定义1:***状态表示在进行模式切换之后任务关键级状态的集合;
定义2:需求恶化边界定义为当所有高关键级任务都切换至最悲观关键级状态Xj-1的最差执行场景中需要低关键级任务做出服务恶化牺牲的边界;在运行过程中,利用率恶化边界在每一次关键级***时根据规则5进行更新;对于初始状态中所有高关键级任务在0级进行执行,此时的恶化边界DDM0可以通过如下公式进行初始化:
定义3:可用恶化预算定义为在当前***状态下可用的低关键级任务利用率;在***模式切换发生时,可用恶化预算由如下公式进行更新:
其中由RFHP协议确定,对于初始状态中所有高关键级任务在0级进行执行,此时的恶化边界AUB0可以初始化为UL(0);
规则6:新的终止条件:对于在模式切换的***状态如果满足如下条件:则任务τj将直接在关键级Xj-1下执行。
8.根据权利要求7所述的混合关键性容错***动态资源管理协议的调度方法,其特征在于,通过将原始RFHP协议中的规则4的终止条件替换为规则6所示的新终止条件,然后根据定义2和定义3添加更新恶化边界的操作,即可得到改进的RFHP资源管理协议;此时,改进后RFHP资源管理协议在***层面可调度性的适用性可由定理3说明;
定理3:对于一个混合关键级任务集,已知资源使用率边界uj(0)和uj(Xj-1),那么在满足以下条件的时候该混合关键级任务集具有可调度性:
CN201910314452.XA 2019-04-18 2019-04-18 混合关键性容错***动态资源管理方法及该方法的调度方法 Active CN110196762B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910314452.XA CN110196762B (zh) 2019-04-18 2019-04-18 混合关键性容错***动态资源管理方法及该方法的调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910314452.XA CN110196762B (zh) 2019-04-18 2019-04-18 混合关键性容错***动态资源管理方法及该方法的调度方法

Publications (2)

Publication Number Publication Date
CN110196762A true CN110196762A (zh) 2019-09-03
CN110196762B CN110196762B (zh) 2021-07-27

Family

ID=67751998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910314452.XA Active CN110196762B (zh) 2019-04-18 2019-04-18 混合关键性容错***动态资源管理方法及该方法的调度方法

Country Status (1)

Country Link
CN (1) CN110196762B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112799808A (zh) * 2021-01-26 2021-05-14 中山大学 混合关键级***中的一种空闲资源调度方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040059957A1 (en) * 2002-07-12 2004-03-25 Tundra Semiconductor Corporation Fault tolerance
CN101309511A (zh) * 2008-02-26 2008-11-19 中山大学 Ims策略决策功能实体及其承载资源控制的实现方法
CN103825964A (zh) * 2014-03-19 2014-05-28 北京邮电大学 一种基于云计算PaaS平台的SLS调度装置和方法
CN103944769A (zh) * 2014-05-05 2014-07-23 江苏物联网研究发展中心 基于rpc协议的集群资源统一管理***
CN104991830A (zh) * 2015-07-10 2015-10-21 山东大学 基于服务等级协议的yarn资源分配和节能调度方法及***
CN106445673A (zh) * 2016-10-14 2017-02-22 苏州光蓝信息技术有限公司 一种面向混合关键性实时***的容错性任务调度方法
CN106776005A (zh) * 2016-11-23 2017-05-31 华中科技大学 一种面向容器化应用的资源管理***及方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040059957A1 (en) * 2002-07-12 2004-03-25 Tundra Semiconductor Corporation Fault tolerance
CN101309511A (zh) * 2008-02-26 2008-11-19 中山大学 Ims策略决策功能实体及其承载资源控制的实现方法
CN103825964A (zh) * 2014-03-19 2014-05-28 北京邮电大学 一种基于云计算PaaS平台的SLS调度装置和方法
CN103944769A (zh) * 2014-05-05 2014-07-23 江苏物联网研究发展中心 基于rpc协议的集群资源统一管理***
CN104991830A (zh) * 2015-07-10 2015-10-21 山东大学 基于服务等级协议的yarn资源分配和节能调度方法及***
CN106445673A (zh) * 2016-10-14 2017-02-22 苏州光蓝信息技术有限公司 一种面向混合关键性实时***的容错性任务调度方法
CN106776005A (zh) * 2016-11-23 2017-05-31 华中科技大学 一种面向容器化应用的资源管理***及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PENGCHENG HUANG 等: "On the scheduling of fault-tolerant mixed-criticality systems", 《2014 51ST ACM/EDAC/IEEE DESIGN AUTOMATION CONFERENCE (DAC)》 *
张奕 等: "混合关键度驱动的实时调度研究", 《西北工业大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112799808A (zh) * 2021-01-26 2021-05-14 中山大学 混合关键级***中的一种空闲资源调度方法
CN112799808B (zh) * 2021-01-26 2023-11-10 中山大学 混合关键级***中的一种空闲资源调度方法

Also Published As

Publication number Publication date
CN110196762B (zh) 2021-07-27

Similar Documents

Publication Publication Date Title
CN100543682C (zh) 任务执行装置及方法
US9027027B2 (en) Thread management based on device power state
Guo et al. Uniprocessor mixed-criticality scheduling with graceful degradation by completion rate
CN106445673B (zh) 一种面向混合关键性实时***的容错性任务调度方法
US20090100435A1 (en) Hierarchical reservation resource scheduling infrastructure
CN111694633A (zh) 集群节点负载均衡方法、装置及计算机存储介质
CN112052092B (zh) 一种风险感知的边缘计算任务分配方法
CN109597378B (zh) 一种资源受限混合任务能耗感知方法
CN103179048A (zh) 云数据中心的主机QoS策略变换方法及***
CN113467933B (zh) 分布式文件***线程池优化方法、***、终端及存储介质
Santy et al. Two protocols to reduce the criticality level of multiprocessor mixed-criticality systems
CN107885577A (zh) 一种基于任务主副本和重提交结合的云计算资源混合式容错调度方法
CN106095581B (zh) 一种私有云条件下的网络存储虚拟化调度方法
CN105912383A (zh) 一种高可靠性的依赖任务调度与资源配置方法
CN110196762A (zh) 混合关键性容错***动态资源管理协议及该协议的调度方法
CN103763373A (zh) 一种基于云计算的调度方法和调度器
EP2238534A1 (en) System resource influenced staged shutdown
CN107589993A (zh) 一种基于linux实时操作***的动态优先级调度算法
EP4288863A1 (en) Cloud computing capacity management system using automated fine-grained admission control
CN112328383A (zh) 基于优先权的作业并发控制及调度算法
CN113986497A (zh) 基于多租户技术的队列调度方法、装置及***
Kumar et al. Improved EDF algorithm for fault tolerance with energy minimization
CN103959276A (zh) 基于用户意图和进程独立性的知识的资源分配优先化
CN108874517B (zh) 固定优先级待机备用***利用率划分能耗优化方法
CN115509724A (zh) 基于任务分层与回填最早完成时间的任务调度方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant