CN113032145A - 基于国产化多numa节点cpu结温均衡策略的任务调度方法 - Google Patents

基于国产化多numa节点cpu结温均衡策略的任务调度方法 Download PDF

Info

Publication number
CN113032145A
CN113032145A CN202110292192.8A CN202110292192A CN113032145A CN 113032145 A CN113032145 A CN 113032145A CN 202110292192 A CN202110292192 A CN 202110292192A CN 113032145 A CN113032145 A CN 113032145A
Authority
CN
China
Prior art keywords
junction temperature
numa
numa node
cpu
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110292192.8A
Other languages
English (en)
Other versions
CN113032145B (zh
Inventor
郭申
谭智敏
赵博颖
段心明
刘更
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Computer Technology and Applications
Original Assignee
Beijing Institute of Computer Technology and Applications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Computer Technology and Applications filed Critical Beijing Institute of Computer Technology and Applications
Priority to CN202110292192.8A priority Critical patent/CN113032145B/zh
Publication of CN113032145A publication Critical patent/CN113032145A/zh
Application granted granted Critical
Publication of CN113032145B publication Critical patent/CN113032145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明涉及一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法,属于操作***任务调度技术领域。本发明提出一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法,当NUMA接电脑结温超过阈值时,将高负载计算任务调度至结温较低的核心,保证CPU的稳定运行。该任务调度方法能有效降低CPU最高工作结温,且对计算负载任务性能损失小,避免CPU长时间超结温阈值工作,提升CPU工作的稳定性。

Description

基于国产化多NUMA节点CPU结温均衡策略的任务调度方法
技术领域
本发明属于操作***任务调度技术领域,具体涉及一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法。
背景技术
随着信息产业的蓬勃发展,数据的产生以近乎几何级数的速度高速增长,对计算能力提出了巨大需求。但受限于半导体摩尔定律,单CPU核心的主频和计算能力不会有跨越式提升。近年来,在服务器等计算密集型领域,CPU经历了单核、多核到多NUMA节点的发展历程。目前,高性能计算服务器具有数十个NUMA节点,数百个计算核心。
在航空航天、国防军工等领域,计算设备的稳定运行和数据安全关系着重大国家利益、社会稳定。因此,在这些关系着国计民生的领域中,计算设备中CPU等核心硬件有明确的国产化自主可控需求。近年来,国产化CPU研发技术有了迅猛发展,计算性能比肩世界先进水平。但另一方面,国产化CPU,受限于制程工艺等原因,功耗高,发热量大。目前应用的一块集成8个NUMA节点64核心的国产化CPU,芯片面积达到3600mm2以上,功耗150W以上。在进行高负载任务测试时,发现CPU不同核心结温差异较大,不同NUMA节点的最高结温与最低结温差别在20度以上。
由于NUMA节点对临近内存访问效率高,操作***默认对NUMA节点的任务调度表现出亲和性的特点。若某个任务task在t周期在0号NUMA节点上运行,那么在t+1,t+2,t+3周期,操作***都优先将task在0号NUMA节点上运行。在国产化CPU平台上,这种默认的任务调度方式,会导致0号NUMA节点结温远超过其他节点,当长时间超过CPU最大工作结温时,CPU运行可靠性大大降低。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:国产化多NUMA节点CPU发热量大,不同NUMA节点间结温差异大,无法长时间运行高负载任务的问题。
(二)技术方案
为了解决上述技术问题,本发明提供了一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法,包括以下步骤:
步骤1、确定NUMA节点体质系数;
步骤2、根据CPU芯片手册中规定的最高工作结温,确定任务调度方法启动结温阈值TS,确定检测时间间隔TimeI
步骤3、轮询检测N个NUMA节点结温,当结温超过结温阈值,启动任务调度;
步骤4、计算NUMA结温差值数;
步骤5、基于步骤4计算NUMA节点迁移值;
步骤6、若N-1个迁移值均小于0,将负载任务挂起指定时间;
步骤7、将负载任务调度至迁移值最大的NUMA继续运行。
优选地,步骤1中,首先确定HPL测试矩阵规模,使用MPI工具控制HPL多进程并行运行,用numactl工具将HPL分别绑定HPL在N个NUMA节点运行,记录下每个NUMA节点的测试结温,第i个NUMA节点测试结温表示为Mi,全部NUMA节点中的最低结温记为Mmin,第i个NUMA节点的体质系数记为
Figure BDA0002982676980000031
i=1,2…N。
优选地,检测时间间隔TimeI的默认值为10秒。
优选地,步骤4中,第i个NUMA节点的结温值记为Ti,第i个NUMA节点与第j个NUMA节点的结温差值数记为
Figure BDA0002982676980000032
i=1,2…N,j=1,2…N。
优选地,步骤5中,第i个NUMA节点负载应用向第j个NUMA节点的迁移系数记为Vij=Dij·Cj,i=1,2…N,j=1,2…N;进而计算出第i个NUMA节点的最大迁移值maxj=1,2…N(Vij)。
优选地,步骤6中,当全部NUMA节点结温均超过上限阈值时,任务调度方法已无法通过均衡方式保障CPU稳定运行,将全部负载任务挂起指定时间TimeD
优选地,步骤6中,TimeD取值采用二进制指数类型退避算法得到,即第k次触发时,TimeD=2k+1,k为正整数。
优选地,HPL是计算机性能测试工具,通过对线性代数方程组进行测试,评估计算机***的性能。
优选地,numactl是在NUMA架构计算机***中,用于控制任务在指定NUMA节点运行的工具。
优选地,MPI用于控制任务多核心并行运行。
(三)有益效果
本发明提出一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法,当NUMA接电脑结温超过阈值时,将高负载计算任务调度至结温较低的核心,保证CPU的稳定运行。该任务调度方法能有效降低CPU最高工作结温,且对计算负载任务性能损失小,避免CPU长时间超结温阈值工作,提升CPU工作的稳定性。
附图说明
图1为本发明的任务调度方法流程图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明提出一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法,首先,确定N个NUMA节点体质系数、最高结温阈值、检测间隔时间等参数。第一步,按照检测间隔时间轮询N个NUMA节点结温,当结温超过最高结温阈值,启动任务调度。第二步,计算N-1个NUMA节点间结温差值数,计算迁移值。第三步,若N-1个迁移值均小于0,将负载任务挂起指定时间。第四步,将负载任务调度至迁移值最大的NUMA继续运行。最后,用发明方法,与默认操作***默认任务调度方法对比,以结果数据证明本发明方法的有效性。
具体地,如图1所示,本发明的方法包括以下步骤:
步骤1、确定NUMA节点体质系数。由于芯片制程工艺的限制,CPU各NUMA节点的体质会有差异,运行同样负载计算量的最大结温不同。首先确定HPL测试矩阵规模,使用MPI工具控制HPL多进程并行运行,用numactl工具将HPL分别绑定HPL在N个NUMA节点运行,记录下每个NUMA节点的测试结温,第i个NUMA节点测试结温表示为Mi,全部NUMA节点中的最低结温记为Mmin,第i个NUMA节点的体质系数记为
Figure BDA0002982676980000051
i=1,2…N;
其中,HPL:是计算机性能测试工具,通过对线性代数方程组进行测试,评估计算机***的性能,对CPU有很大负载压力,可调整计算矩阵规模,控制测试计算量;numactl是在NUMA架构计算机***中,用于控制任务在指定NUMA节点运行的工具;MPI:用于控制任务多核心并行运行。
步骤2、根据CPU芯片手册中规定的最高工作结温,确定任务调度方法启动结温阈值TS,确定检测时间间隔TimeI,默认值为10秒;
步骤3、轮询检测N个NUMA节点结温,当结温超过结温阈值,启动任务调度;
步骤4、计算NUMA结温差值数。第i个NUMA节点的结温值记为Ti,第i个NUMA节点与第j个NUMA节点的结温差值系数记为
Figure BDA0002982676980000052
i=1,2…N,j=1,2…N;
步骤5、基于步骤4计算NUMA节点迁移值。第i个NUMA节点负载应用向第j个NUMA节点的迁移系数记为Vij=Dij·Cj,i=1,2…N,j=1,2…N;进而计算出第i个NUMA节点的最大迁移值maxj=1,2…N(Vij);
步骤6、若N-1个迁移值均小于0,将负载任务挂起指定时间。由于国产化CPU不具备动态降低频率功能,因此当全部NUMA节点结温均超过上限阈值时,任务调度方法已无法通过均衡方式保障CPU稳定运行,将全部负载任务挂起指定时间TimeD,以保证CPU运行的稳定性。为避免频繁挂起负载任务,TimeD取值采用二进制指数类型退避算法,即第k次触发时,TimeD=2k+1,单位为秒,k为正整数;
步骤7、将负载任务调度至迁移值最大的NUMA继续运行。
下面给出本发明方法测试结果:
测试机器使用的国产化CPU共有8个NUMA节点,每个节点16个计算核心。CPU芯片手册中规定最高工作结温90度。HPL测试矩阵规模为80000,MPI工具控制HPL任务64进程运行,HPL任务共使用4个NUMA节点。
测试方式1:使用操作***默认任务调度方法,测试过程中CPU最高结温108度,测试时间共7349秒,通过对CPU使用率的统计,HPL任务超过95%的时间运行在NUMA 0-3节点,测试分数179.5GFlops。
测试方式2:启用本发明方法,检测间隔时间TimeI=10s,将负载任务在0-7号NUMA节点上调度。测试过程中CPU最高结温93度。总测试时间共7617秒,其中停用时间值累计TimeD133秒,通过对CPU使用率的统计,HPL任务约64%时间运行在NUMA0-3节点测试分数175.1GFops。
对测试结果数据进行分析,运行同样计算量负载任务,采用本发明方法对比操作***默认任务调度方法,CPU最高工作结温下降15度,任务运行时间增加了3.6%,测试分数下降了2.6%。
以上测试结果表明,负载任务调度方法能有效降低CPU最高工作结温,且对计算负载任务性能损失小,避免CPU长时间超结温阈值工作,提升CPU工作的稳定性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种基于国产化多NUMA节点CPU结温均衡策略的任务调度方法,其特征在于,包括以下步骤:
步骤1、确定NUMA节点体质系数;
步骤2、根据CPU芯片手册中规定的最高工作结温,确定任务调度方法启动结温阈值TS,确定检测时间间隔TimeI
步骤3、轮询检测N个NUMA节点结温,当结温超过结温阈值,启动任务调度;
步骤4、计算NUMA结温差值数;
步骤5、基于步骤4计算NUMA节点迁移值;
步骤6、若N-1个迁移值均小于0,将负载任务挂起指定时间;
步骤7、将负载任务调度至迁移值最大的NUMA继续运行。
2.如权利要求1所述的方法,其特征在于,步骤1中,首先确定HPL测试矩阵规模,使用MPI工具控制HPL多进程并行运行,用numactl工具将HPL分别绑定HPL在N个NUMA节点运行,记录下每个NUMA节点的测试结温,第i个NUMA节点测试结温表示为Mi,全部NUMA节点中的最低结温记为Mmin,第i个NUMA节点的体质系数记为
Figure FDA0002982676970000011
3.如权利要求1所述的方法,其特征在于,检测时间间隔TimeI的默认值为10秒。
4.如权利要求2所述的方法,其特征在于,步骤4中,第i个NUMA节点的结温值记为Ti,第i个NUMA节点与第j个NUMA节点的结温差值数记为
Figure FDA0002982676970000021
5.如权利要求4所述的方法,其特征在于,步骤5中,第i个NUMA节点负载应用向第j个NUMA节点的迁移系数记为Vij=Dij·Cj,i=1,2...N,j=1,2...N;进而计算出第i个NUMA节点的最大迁移值maxj=1,2...N(Vij)。
6.如权利要求5所述的方法,其特征在于,步骤6中,当全部NUMA节点结温均超过上限阈值时,任务调度方法已无法通过均衡方式保障CPU稳定运行,将全部负载任务挂起指定时间TimeD
7.如权利要求6所述的方法,其特征在于,步骤6中,TimeD取值采用二进制指数类型退避算法得到,即第k次触发时,TimeD=2k+1,k为正整数。
8.如权利要求1所述的方法,其特征在于,HPL是计算机性能测试工具,通过对线性代数方程组进行测试,评估计算机***的性能。
9.如权利要求1所述的方法,其特征在于,numactl是在NUMA架构计算机***中,用于控制任务在指定NUMA节点运行的工具。
10.如权利要求1所述的方法,其特征在于,MPI用于控制任务多核心并行运行。
CN202110292192.8A 2021-03-18 2021-03-18 基于国产化多numa节点cpu结温均衡策略的任务调度方法 Active CN113032145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110292192.8A CN113032145B (zh) 2021-03-18 2021-03-18 基于国产化多numa节点cpu结温均衡策略的任务调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110292192.8A CN113032145B (zh) 2021-03-18 2021-03-18 基于国产化多numa节点cpu结温均衡策略的任务调度方法

Publications (2)

Publication Number Publication Date
CN113032145A true CN113032145A (zh) 2021-06-25
CN113032145B CN113032145B (zh) 2023-12-26

Family

ID=76471541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110292192.8A Active CN113032145B (zh) 2021-03-18 2021-03-18 基于国产化多numa节点cpu结温均衡策略的任务调度方法

Country Status (1)

Country Link
CN (1) CN113032145B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277637A (ja) * 2005-03-30 2006-10-12 Nec Corp 温度監視によってジョブを割り当てるマルチプロセッサ計算機システム、及びコンピュータプログラム
US20080046895A1 (en) * 2006-08-15 2008-02-21 International Business Machines Corporation Affinity dispatching load balancer with precise CPU consumption data
CN103440173A (zh) * 2013-08-23 2013-12-11 华为技术有限公司 一种多核处理器的调度方法和相关装置
CN104636187A (zh) * 2015-02-15 2015-05-20 浙江大学 基于负载预测的numa架构中虚拟机调度方法
CN106293914A (zh) * 2016-08-01 2017-01-04 深圳市金立通信设备有限公司 一种任务调度的方法及终端
CN106844051A (zh) * 2017-01-19 2017-06-13 河海大学 一种边缘计算环境中功耗优化的负载任务迁移算法
US9747139B1 (en) * 2016-10-19 2017-08-29 International Business Machines Corporation Performance-based multi-mode task dispatching in a multi-processor core system for high temperature avoidance
CN107346168A (zh) * 2016-05-06 2017-11-14 联发科技股份有限公司 低功耗政策的自适应优化方法和相关装置
CN107733016A (zh) * 2017-10-20 2018-02-23 维沃移动通信有限公司 一种移动终端充电控制方法及移动终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277637A (ja) * 2005-03-30 2006-10-12 Nec Corp 温度監視によってジョブを割り当てるマルチプロセッサ計算機システム、及びコンピュータプログラム
US20080046895A1 (en) * 2006-08-15 2008-02-21 International Business Machines Corporation Affinity dispatching load balancer with precise CPU consumption data
CN103440173A (zh) * 2013-08-23 2013-12-11 华为技术有限公司 一种多核处理器的调度方法和相关装置
CN104636187A (zh) * 2015-02-15 2015-05-20 浙江大学 基于负载预测的numa架构中虚拟机调度方法
CN107346168A (zh) * 2016-05-06 2017-11-14 联发科技股份有限公司 低功耗政策的自适应优化方法和相关装置
CN106293914A (zh) * 2016-08-01 2017-01-04 深圳市金立通信设备有限公司 一种任务调度的方法及终端
US9747139B1 (en) * 2016-10-19 2017-08-29 International Business Machines Corporation Performance-based multi-mode task dispatching in a multi-processor core system for high temperature avoidance
CN106844051A (zh) * 2017-01-19 2017-06-13 河海大学 一种边缘计算环境中功耗优化的负载任务迁移算法
CN107733016A (zh) * 2017-10-20 2018-02-23 维沃移动通信有限公司 一种移动终端充电控制方法及移动终端

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DAVID K. NEWSOM 等: "Thread-Level CPU Power Measurement for High Performance Parallel Systems: Impact Analysis of System Control Parameters on HPC Energy Efficiency", 《INTERNATIONAL JOURNAL OF COMPUTING AND DIGITAL SYSTEMS》, no. 3, pages 189 - 209 *
施继成 等: "面向多处理器虚拟机的动态NUMA方法", 《小型微型计算机***》, vol. 36, no. 04, pages 39 - 44 *
李翔 等: "绿色数据中心的热量管理方法研究", 《计算机学报》, vol. 38, no. 10, pages 1976 - 1996 *

Also Published As

Publication number Publication date
CN113032145B (zh) 2023-12-26

Similar Documents

Publication Publication Date Title
US20140277750A1 (en) Information handling system dynamic fan power management
US20040128100A1 (en) Method and apparatus for thermal relief for critical tasks in multiple resources environment
CN110347498B (zh) 一种容器和虚拟机混合云环境下的负载动态迁移方法
CN108563949B (zh) 针对多核处理器信息安全的任务映射方法
Fan et al. Improving MapReduce performance by balancing skewed loads
Li et al. Towards thermal-aware workload distribution in cloud data centers based on failure models
Choi et al. Task Classification Based Energy‐Aware Consolidation in Clouds
CN105242954A (zh) 一种虚拟cpu与物理cpu之间的映射方法及电子设备
Hu et al. Improved heuristic job scheduling method to enhance throughput for big data analytics
Tao et al. Load feedback-based resource scheduling and dynamic migration-based data locality for virtual hadoop clusters in openstack-based clouds
TW201319828A (zh) 虛擬資源調整裝置、方法及儲存其之電腦可讀取紀錄媒體
US20120054762A1 (en) Scheduling apparatus and method for a multicore device
Chavan et al. TIGER: Thermal-aware file assignment in storage clusters
CN103984588B (zh) 一种基于温度的虚拟机迁移方法及其***
CN108241526B (zh) 基于模式预测的自适应控制策略
CN113032145A (zh) 基于国产化多numa节点cpu结温均衡策略的任务调度方法
CN106201658A (zh) 一种迁移虚拟机目的主机多目标优化选择方法
CN201804331U (zh) 一种基于协处理器的重复数据删除***
CN109582119B (zh) 基于动态电压频率调整的双层Spark节能调度方法
WO2024021475A1 (zh) 一种容器调度方法及装置
CN111580950A (zh) 一种提升云可靠性的自适应反馈资源调度方法
Mao et al. A fine-grained and dynamic MapReduce task scheduling scheme for the heterogeneous cloud environment
Baiquan et al. The block diagram method for designing the particle swarm optimization algorithm
CN107193362B (zh) 一种增强云计算环境节能装置
Upadhyay et al. An efficient speculative task detection algorithm for mapreduce schedulers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant