CN110471766B

CN110471766B - 一种基于cuda的gpu资源调度***和方法

Info

Publication number: CN110471766B
Application number: CN201910724239.6A
Authority: CN
Inventors: 苏斌
Original assignee: Beijing Huaheng Shengshi Technology Co ltd
Current assignee: Beijing Huaheng Shengshi Technology Co ltd
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2022-12-30
Anticipated expiration: 2039-08-06
Also published as: CN110471766A

Abstract

本发明公开了一种基于CUDA的GPU资源调度***，管理节点和***用户，所述***用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBM Power计算节点和NVDIA DGX计算节点。本发明针对不同类型的应用采用不同的GPU特性，提高整个***中GPU的利用率，加速应用在GPU中的运行效率。***可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU，提高GPU利用率，支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度***中，提高了这个***的GPU资源利用率以及应用的运行效率。

Description

一种基于CUDA的GPU资源调度***和方法

技术领域

本发明涉及CUDA GPU及资源调度***技术领域，具体为一种基于CUDA的GPU资源调度***，同时，本发明还涉及一种基于CUDA的GPU资源调度方法。

背景技术

GPU又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器

随着GPU(Graphic Processing Unit，图形处理器)通用技术的发展，GPU不仅能够处理图像负载，也能够处理特定类型的通用程序。目前，当有多个不同的kernel程序需要访问GPU时，一般是以序列化的方式使请求访问GPU的kernel程序按照发送请求的时间顺序逐个访问GPU。

GPU目前在机器学习，深度学习，科学计算，游戏制作等领域有着广泛的应用。随着GPU的普及，原来越多的集群配置了GPU。其中CUDA GPU的应用最为广泛，其支持的特性包括GPU内存，GPU类型(如TeslaK80，Tesla P100)，GPU Factor，GPU MPS(Multiple ProcessService多进程服务)，GPU模式，GPU NVLINK(一种基于总线的高速通讯协议)等，不同类型的应用使用不同的GPU特性可以提高应用的运行效率，进而提升整个资源调度***的GPU利用率。目前主流资源调度***PBS，Slurm，LSF等对GPU资源的调度主要集中在GPU个数及GPU内存的使用限制，没有一种资源调度***可以把各种GPU特性整合在***中，为此我们提出一种基于CUDA的GPU资源调度***和方法。

发明内容

本发明的目的在于提供一种基于CUDA的GPU资源调度***和方法，针对不同类型的应用采用不同的GPU特性，提高整个***中GPU的利用率，加速应用在GPU中的运行效率。***可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU，提高GPU利用率。支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度***中，提高了这个***的GPU资源利用率以及应用的运行效率，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种基于CUDA的GPU资源调度***，管理节点和***用户，所述***用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBMPower计算节点和NVDIA DGX计算节点。

优选的，所述管理节点负责接收作业GPU请求，根据作业GPU请求为作业分配合适的GPU计算节点。

优选的，所述IBM Power计算节点负责按照作业GPU请求启动GPU作业，修改GPU模式，以及收集作业GPU使用信息。

优选的，所述NVDIA DGX计算节点负责使用CUDA API(NVIDIA GPU应用开发接口来收集计算节点GPU信息并上报给管理节点，所收集的GPU信息包括GPU个数、GPU内存、GPU类型和GPU NVLINK拓扑结构。

优选的，所述GPU类型包括GeForce系列、Tesla系列和Quadro系列。

本发明还提供一种基于CUDA的GPU资源调度方法，包括以下步骤：

S1：在计算节点上调用CUDA API来收集GPU信息并上报给管理节点；

S2：***用户把应用作为GPU作业提交至管理节点，管理节点调度***根据作业的GPU内存，GPU类型，GPU NVLINK的GPU相关请求为作业分配最合适的GPU计算节点，如作业需要GPU内存为10G，则调度***会将作业调度到GPU可用内存大于10G的机器上运行；作业需要GPU类型为Tesla K80，则调度***会将作业调度到含有GPU类型为Tesla K80GPU的机器上运行；作业需要GPU之间具有NVLINK连接，则调度***会将作业调度到GPU之间具有NVLINK的机器上，并确保分配的都个GPU之间都具有NVLINK连接；

S3：计算机点启动作业之前，***根据作业请求的GPU模式动态切换为作业所分配的GPU的模式，如作业请求以独占的方式使用GPU，则***可将GPU模式从共享模式切换为独占模式并分配给作业使用，其它作业不能再使用该切换为独占模式的GPU；作业请求以共享的方式使用GPU，则***也可将GPU模式从独占模式切换为共享模式，其它作业可以共享方式与此作业共同使用该切换为共享模式的GPU；

S4：计算节点为同一用户相同GPU请求作业启动GPU MPS，使同一用户的不同作业以独占的方式共享使用分配的GPU；

S5：计算节点收集作业GPU使用信息并展示给***用户。

与现有技术相比，本发明的有益效果是：

1、本发明针对不同类型的应用采用不同的GPU特性，提高整个***中GPU的利用率，加速应用在GPU中的运行效率。***可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPU MPS以独占的方式共享使用GPU，提高GPU利用率。支持IBM Power和NVIDIA DGX两种GPU NVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度***中，提高了这个***的GPU资源利用率以及应用的运行效率。

附图说明

图1为本发明IBM Power NVLINK图；

图2为本发明NVDIA DGX-1NVLINK图；

图3为本发明一种基于CUDA的GPU资源调度***的整体架构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-3，本发明提供一种技术方案：一种基于CUDA的GPU资源调度***，管理节点和***用户，所述***用户通过提交作业模块连接到管理节点，所述管理节点通过派发作业模块连接有IBMPower计算节点和NVDIA DGX计算节点。

具体的，所述管理节点负责接收作业GPU请求，根据作业GPU请求为作业分配合适的GPU计算节点。

具体的，所述IBM Power计算节点负责按照作业GPU请求启动GPU作业，修改GPU模式，以及收集作业GPU使用信息。

具体的，所述NVDIA DGX计算节点负责使用CUDA API(NVIDIA GPU应用开发接口来收集计算节点GPU信息并上报给管理节点，所收集的GPU信息包括GPU个数、GPU内存、GPU类型和GPU NVLINK拓扑结构。

具体的，所述GPU类型包括GeForce系列、Tesla系列和Quadro系列。

S5：计算节点收集作业GPU使用信息并展示给***用。

综上所述：本发明针对不同类型的应用采用不同的GPU特性，提高整个***中GPU的利用率，加速应用在GPU中的运行效率。***可以针对应用需求，动态切换GPU模式，根据应用需要选择最适合应用的GPU类型及其需要的GPU Factor，同一用户多个应用可通过GPUMPS以独占的方式共享使用GPU，提高GPU利用率。支持IBM Power和NVIDIA DGX两种GPUNVLINK拓扑，将应用分配到带有NVLINK互联的GPU上，通过把当前GPU的主要特性应用于资源调度***中，提高了这个***的GPU资源利用率以及应用的运行效率。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种利用了基于CUDA的GPU资源调度***的资源调度方法，其特征在于：

所述资源调度***包括：管理节点和***用户，所述***用户通过提交作业模块连接到所述管理节点，所述管理节点通过派发作业模块连接到GPU计算节点，所述GPU计算节点包括IBM Power计算节点和NVDIA DGX计算节点；

所述资源调度方法包括以下步骤：

S1：在所述GPU计算节点上调用CUDA API来收集GPU信息，并上报给所述管理节点；

S2：***用户把应用作为GPU作业提交至所述管理节点，所述管理节点根据作业的GPU内存、GPU类型和GPU NVLINK的GPU请求，为作业分配最合适的GPU计算节点，具体包括：

若作业需要GPU内存为10G，则所述管理节点将作业调度到GPU可用内存大于10G的机器上运行；

若作业需要GPU类型为Tesla K80，则所述管理节点将作业调度到含有Tesla K80 GPU的机器上运行；

若作业需要GPU之间具有NVLINK连接，则所述管理节点将作业调度到GPU之间具有NVLINK连接的机器上，并确保分配的每个GPU之间都具有NVLINK连接；

S3：在GPU计算节点启动作业之前，管理节点根据作业请求的GPU模式动态切换为作业所分配的GPU的模式，具体包括：

若作业请求以独占的方式使用GPU，则管理节点将GPU模式从共享模式切换为独占模式并分配给该作业使用，其它作业不能再使用该独占模式的GPU；

若作业请求以共享的方式使用GPU，则管理节点将GPU模式从独占模式切换为共享模式，其它作业以共享方式与该作业共同使用该共享模式的GPU；

S4：GPU计算节点为同一***用户针对同一GPU的不同GPU作业启动GPU MPS，从而使同一***用户的不同GPU作业以独占的方式共享使用分配的GPU；

S5：GPU计算节点收集作业GPU的使用信息，并展示给***用户。