CN116402674A - Gpu的命令处理方法、装置、电子设备和存储介质 - Google Patents
Gpu的命令处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116402674A CN116402674A CN202310347378.8A CN202310347378A CN116402674A CN 116402674 A CN116402674 A CN 116402674A CN 202310347378 A CN202310347378 A CN 202310347378A CN 116402674 A CN116402674 A CN 116402674A
- Authority
- CN
- China
- Prior art keywords
- gpu
- cpu
- command
- load
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003860 storage Methods 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims description 104
- 230000004044 response Effects 0.000 claims description 67
- 238000009877 rendering Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multi Processors (AREA)
Abstract
本公开涉及一种GPU的命令处理方法、装置、电子设备和存储介质。所述方法包括:获取GPU的负载信息;响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种GPU的命令处理方法、GPU的命令处理装置、电子设备、存储介质和程序产品。
背景技术
GPU(Graphic Processing Unit,图形处理器),又称显示核心、视觉处理器、显示芯片,是一种能够在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机)等上做图像和图形相关运算工作的处理器。
GPU最初是作为专门用于加速特定3D(3Dimensions,三维)渲染任务的ASIC(Application Specific Integrated Circuit,专用集成电路)开发而成的。随着时间的推移,这些功能固定的引擎变得更加可编程化、更加灵活。尽管图形处理和当下视觉效果越来越真实的顶级游戏仍是GPU的主要功能,但同时,它也已经演化为用途更普遍的并行处理器,能够处理越来越多的应用程序。
目前,通常通过提高GPU的硬件性能来提高GPU的命令处理效率。如何在有限的GPU资源下,提高GPU的命令处理效率,是亟待解决的技术问题。
发明内容
本公开提供了一种GPU的命令处理技术方案。
根据本公开的一方面,提供了一种GPU的命令处理方法,包括:
获取GPU的负载信息;
响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
通过获取GPU的负载信息,响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令,由此在GPU处于高负载状态时,能够将GPU的一部分负载卸载到CPU侧,利用CPU中的GPU模拟程序处理GPU对应的命令请求队列中的至少部分命令,从而在GPU处于高负载状态时,能够通过CPU分担GPU的负载,利用CPU提高GPU对应的命令请求队列的处理效率,进而不仅能够在有限的GPU资源下提高电子设备的综合性能,还能够提高CPU的利用率。
在一种可能的实现方式中,所述预设的高负载状态包括第一预设高负载状态;
所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:
响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此可以在GPU的负载过高情况下,利用CPU处理GPU对应的命令请求队列中的至少部分命令,从而能够在有限的GPU资源下提高整机性能。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;
所述方法还包括:
响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态。
在该实现方式中,通过响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态,由此能够基于第一预设负载率准确地判断GPU是否处于第一预设高负载状态。
在一种可能的实现方式中,所述预设的高负载状态包括第二预设高负载状态;
所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:
获取所述GPU对应的命令请求队列中的命令的数量;
响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第二预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过获取所述GPU对应的命令请求队列中的命令的数量,并响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此可以在GPU的负载较高且GPU对应的命令请求队列中的命令的数量较大的情况下,利用CPU处理GPU对应的命令请求队列中的至少部分命令,从而能够在有限的GPU资源下提高整机性能。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;
所述方法还包括:
响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态。
在该实现方式中,通过响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态,由此能够基于第二预设负载率和预设数量准确地判断GPU是否处于第二预设高负载状态。
在一种可能的实现方式中,所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:
获取所述CPU的负载信息;
响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU。
在该实现方式中,通过获取所述CPU的负载信息,并响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,由此在GPU处于高负载状态且CPU处于预设的低负载状态时,能够将GPU的一部分负载卸载到CPU侧,通过CPU分担GPU的负载,这样能够在GPU高负载的情况下提高硬件的使用效率,从而能够在有限的GPU资源下提高电子设备的综合性能。
在一种可能的实现方式中,所述CPU的负载信息包括所述CPU的负载率;
所述方法还包括:
响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率。
在该实现方式中,通过响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率,由此能够基于第三预设负载率准确地判断CPU是否处于预设的低负载状态。
在一种可能的实现方式中,所述将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,包括:
通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此CPU能够及时获取到GPU对应的命令请求队列中的命令,从而有助于CPU更及时地处理GPU对应的命令请求队列中的命令。
在一种可能的实现方式中,所述方法还包括:
响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU。
在该实现方式中,响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU,由此能够与GPU进行命令处理进度的同步。
在一种可能的实现方式中,所述方法还包括:
将来自于所述CPU的命令处理结果写入所述GPU对应的命令响应队列中;
向所述CPU发送命令完成消息。
在该实现方式中,命令处理器在将来自于所述CPU的任一命令对应的命令处理结果写入所述GPU对应的命令响应队列中之后,可以向CPU发送命令完成消息,以通知CPU该命令已完成。
在一种可能的实现方式中,所述CPU还用于响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成。
在该实现方式中,通过CPU响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成,由此图形驱动可以执行下一步的操作。
在一种可能的实现方式中,所述GPU对应的命令请求队列中的命令包括图像渲染命令;
所述方法还包括:
将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中。
在该实现方式中,通过将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中,由此能够使GPU和CPU中的GPU模拟程序渲染得到的画面帧按顺序显示。
根据本公开的一方面,提供了一种GPU的命令处理装置,包括:
获取模块,用于获取GPU的负载信息;
分发模块,用于响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
在一种可能的实现方式中,所述预设的高负载状态包括第一预设高负载状态;
所述分发模块用于:
响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;
所述装置还包括:
第一确定模块,用于响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态。
在一种可能的实现方式中,所述预设的高负载状态包括第二预设高负载状态;
所述分发模块用于:
获取所述GPU对应的命令请求队列中的命令的数量;
响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第二预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;
所述装置还包括:
第二确定模块,用于响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态。
在一种可能的实现方式中,所述分发模块用于:
获取所述CPU的负载信息;
响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU。
在一种可能的实现方式中,所述CPU的负载信息包括所述CPU的负载率;
所述装置还包括:
第三确定模块,用于响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率。
在一种可能的实现方式中,所述分发模块用于:
通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在一种可能的实现方式中,所述装置还包括:
第一发送模块,用于响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU。
在一种可能的实现方式中,所述装置还包括:
写入模块,用于将来自于所述CPU的命令处理结果写入所述GPU对应的命令响应队列中;
第二发送模块,用于向所述CPU发送命令完成消息。
在一种可能的实现方式中,所述CPU还用于响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成。
在一种可能的实现方式中,所述GPU对应的命令请求队列中的命令包括图像渲染命令;
所述装置还包括:
推入模块,用于将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中。
根据本公开的一方面,提供了一种电子设备,包括CPU、GPU和命令处理器;
所述命令处理器用于获取所述GPU的负载信息,并响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;
所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
根据本公开的一方面,提供了一种电子设备,包括:一个或多个处理器;用于存储可执行指令的存储器;其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
根据本公开的一方面,提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
在本公开实施例中,通过获取GPU的负载信息,响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令,由此在GPU处于高负载状态时,能够将GPU的一部分负载卸载到CPU侧,利用CPU中的GPU模拟程序处理GPU对应的命令请求队列中的至少部分命令,从而在GPU处于高负载状态时,能够通过CPU分担GPU的负载,利用CPU提高GPU对应的命令请求队列的处理效率,进而不仅能够在有限的GPU资源下提高电子设备的综合性能,还能够提高CPU的利用率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出本公开实施例提供的GPU的命令处理方法的流程图。
图2示出本公开实施例提供的GPU的命令处理方法的示意图。
图3示出本公开实施例提供的GPU的命令处理装置的框图。
图4示出本公开实施例提供的电子设备400的一框图。
图5示出本公开实施例提供的电子设备1900的另一框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
本公开实施例提供了一种GPU的命令处理方法,通过获取GPU的负载信息,响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令,由此在GPU处于高负载状态时,能够将GPU的一部分负载卸载到CPU侧,利用CPU中的GPU模拟程序处理GPU对应的命令请求队列中的至少部分命令,从而在GPU处于高负载状态时,能够通过CPU分担GPU的负载,利用CPU提高GPU对应的命令请求队列的处理效率,进而不仅能够在有限的GPU资源下提高电子设备的综合性能,还能够提高CPU的利用率。
下面结合附图对本公开实施例提供的GPU的命令处理方法进行详细的说明。
图1示出本公开实施例提供的GPU的命令处理方法的流程图。在一种可能的实现方式中,所述GPU的命令处理方法的执行主体可以是GPU的命令处理装置,例如,所述GPU的命令处理方法可以由终端设备或服务器或其它电子设备执行。其中,终端设备可以是用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备或者可穿戴设备等。在一些可能的实现方式中,所述GPU的命令处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图1所示,所述GPU的命令处理方法包括步骤S11至步骤S12。
在步骤S11中,获取GPU的负载信息。
在步骤S12中,响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
在一种可能的实现方式中,所述GPU的命令处理方法的执行主体可以是命令处理器(command processor)。作为该实现方式的一个示例,所述命令处理器可以为固件。当然,本领域技术人员可以根据实际应用场景需求灵活设置所述GPU的命令处理方法的执行主体,在此不做限定。在下文中,以所述GPU的命令处理方法的执行主体为命令处理器为例进行说明。
在本公开实施例中,CPU(Central Processing Unit,中央处理器)可以响应于检测到待GPU处理的命令,将命令发送至GPU对应的命令请求队列,并通知命令处理器。在本公开实施例中,GPU对应的命令请求队列中的命令可以由GPU或者GPU模拟程序处理。GPU对应的命令请求队列中的命令可以包括图形渲染命令、计算命令(例如流体仿真命令、空气动力学仿真命令)等等,在此不做限定。
命令处理器可以至少获取GPU的负载信息,并可以至少根据所述GPU的负载信息,判断将所述GPU对应的命令请求队列中命令分发给GPU或CPU。其中,GPU的负载信息可以是能够表示GPU的负载的高度程度的任意信息。
在一种可能的实现方式中,命令处理器可以通过GPU的寄存器获取GPU的负载信息。例如,命令处理器可以通过GPU的寄存器获取GPU的负载率。
在另一种可能的实现方式中,GPU可以定时主动向命令处理器发送GPU的负载信息。
在一种可能的实现方式中,所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:获取所述CPU的负载信息;响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU。在该实现方式中,CPU的负载信息可以是能够表示CPU的负载的高度程度的任意信息。
作为该实现方式的一个示例,命令处理器可以通过中断与CPU通信,以获取CPU的负载信息。例如,命令处理器可以通过中断与CPU通信,以获取CPU的负载率。
作为该实现方式的另一个示例,CPU可以定时主动向命令处理器发送CPU的负载信息。
在该实现方式中,命令处理器可以根据所述GPU的负载信息,确定所述GPU是否处于预设的高负载状态,并根据所述CPU的负载信息,确定所述CPU是否处于预设的低负载状态。若命令处理器判定所述GPU处于预设的高负载状态且所述CPU处于预设的低负载状态,则可以将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。例如,若命令处理器判定所述GPU处于预设的高负载状态且所述CPU处于预设的低负载状态,则可以将所述GPU对应的命令请求队列中的所有命令分发给所述CPU。又如,若命令处理器判定所述GPU处于预设的高负载状态且所述CPU处于预设的低负载状态,则可以将所述GPU对应的命令请求队列中的一部分命令分发给所述CPU,另一部分命令分发给GPU。
在该实现方式中,通过获取所述CPU的负载信息,并响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,由此在GPU处于高负载状态且CPU处于预设的低负载状态时,能够将GPU的一部分负载卸载到CPU侧,通过CPU分担GPU的负载,这样能够在GPU高负载的情况下提高硬件的使用效率,从而能够在有限的GPU资源下提高电子设备的综合性能。
在一种可能的实现方式中,所述预设的高负载状态包括第一预设高负载状态;所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,命令处理器可以仅根据GPU的负载信息,判断GPU是否处于第一预设高负载状态。若命令处理器根据所述GPU的负载信息判定所述GPU处于所述第一预设高负载状态,则可以将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此可以在GPU的负载过高情况下,利用CPU处理GPU对应的命令请求队列中的至少部分命令,从而能够在有限的GPU资源下提高整机性能。
在另一种可能的实现方式中,所述预设的高负载状态包括第一预设高负载状态;所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:获取所述CPU的负载信息;响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,且根据所述CPU的负载信息,确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU。
在该实现方式中,命令处理器可以仅根据GPU的负载信息,判断GPU是否处于第一预设高负载状态,并可以根据CPU的负载信息,判断CPU是否处于预设的低负载状态。若命令处理器根据所述GPU的负载信息判定所述GPU处于所述第一预设高负载状态且根据所述CPU的负载信息判定所述CPU处于预设的低负载状态,则可以将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过获取所述CPU的负载信息,并响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,且根据所述CPU的负载信息,确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,由此可以在GPU的负载过高且CPU的负载较低的情况下,利用CPU处理GPU对应的命令请求队列中的至少部分命令,从而能够在有限的GPU资源下提高整机性能。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;所述方法还包括:响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态。其中,第一预设负载率可以表示预先设置的用于判断GPU是否处于第一预设高负载状态的负载率阈值。其中,第一预设负载率可以为80%、90%、85%等等,在此不做限定。
在该实现方式中,若GPU的负载率大于或等于第一预设负载率,则可以确定GPU处于第一预设高负载状态;若GPU的负载率小于第一预设负载率,则可以确定GPU不处于第一预设高负载状态。
例如,第一预设负载率为80%;若GPU的负载率大于或等于80%率,则可以确定GPU处于第一预设高负载状态;若GPU的负载率小于80%,则可以确定GPU不处于第一预设高负载状态。
在该实现方式中,通过响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态,由此能够基于第一预设负载率准确地判断GPU是否处于第一预设高负载状态。
在一种可能的实现方式中,所述预设的高负载状态包括第二预设高负载状态;所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:获取所述GPU对应的命令请求队列中的命令的数量;响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第二预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,命令处理器可以根据GPU的负载信息和GPU对应的命令请求队列中的命令的数量,判断GPU是否处于第二预设高负载状态。若命令处理器根据所述GPU的负载信息和GPU对应的命令请求队列中的命令的数量判定所述GPU处于所述第二预设高负载状态,则可以将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过获取所述GPU对应的命令请求队列中的命令的数量,并响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此可以在GPU的负载较高且GPU对应的命令请求队列中的命令的数量较大的情况下,利用CPU处理GPU对应的命令请求队列中的至少部分命令,从而能够在有限的GPU资源下提高整机性能。
在另一种可能的实现方式中,所述预设的高负载状态包括第二预设高负载状态;所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:获取所述GPU对应的命令请求队列中的命令的数量;响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第二预设高负载状态,且根据所述CPU的负载信息,确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,命令处理器可以根据GPU的负载信息和GPU对应的命令请求队列中的命令的数量,判断GPU是否处于第二预设高负载状态,并可以根据CPU的负载信息,判断CPU是否处于预设的低负载状态。若命令处理器根据所述GPU的负载信息和GPU对应的命令请求队列中的命令的数量判定所述GPU处于所述第二预设高负载状态且根据所述CPU的负载信息判定所述CPU处于预设的低负载状态,则可以将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过获取所述GPU对应的命令请求队列中的命令的数量,并响应于根据所述GPU的负载信息、所述数量和所述CPU的负载信息,确定所述GPU处于所述第一预设高负载状态且所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此可以在GPU的负载较高、GPU对应的命令请求队列中的命令的数量较大且CPU的负载较低的情况下,利用CPU处理GPU对应的命令请求队列中的至少部分命令,从而能够在有限的GPU资源下提高整机性能。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;所述方法还包括:响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态。其中,第二预设负载率可以表示预先设置的用于判断GPU是否处于第二预设高负载状态的负载率阈值。第二预设负载率可以小于第一预设负载率。其中,第二预设负载率可以为70%、75%等等,在此不做限定。预设数量可以为10、8、5等等,在此不做限定。
在该实现方式中,若GPU的负载率大于或等于第二预设负载率,且GPU对应的命令请求队列中的命令的数量大于或等于预设数量,则可以确定GPU处于第二预设高负载状态;若GPU的负载率小于第二预设负载率,则可以确定GPU不处于第二预设高负载状态;若GPU对应的命令请求队列中的命令的数量小于预设数量,则可以确定GPU不处于第二预设高负载状态。
例如,第二预设负载率为70%,预设数量为10。若GPU的负载率大于或等于70%,且GPU对应的命令请求队列中的命令的数量大于或等于10,则可以确定GPU处于第二预设高负载状态;若GPU的负载率小于70%,则可以确定GPU不处于第二预设高负载状态;若GPU对应的命令请求队列中的命令的数量小于10,则可以确定GPU不处于第二预设高负载状态。
在该实现方式中,通过响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态,由此能够基于第二预设负载率和预设数量准确地判断GPU是否处于第二预设高负载状态。
在一种可能的实现方式中,命令处理器可以访问所述GPU对应的命令请求队列,以获取所述GPU对应的命令请求队列中的命令的数量。
在一种可能的实现方式中,所述CPU的负载信息包括所述CPU的负载率;所述方法还包括:响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率。第三预设负载率可以表示预先设置的用于判断CPU是否处于预设的低负载状态的负载率阈值。
在该实现方式中,若CPU的负载率小于或等于第三预设负载率,则可以确定CPU处于预设的低负载状态;若CPU的负载率大于第三预设负载率,则可以确定CPU不处于预设的低负载状态。
在该实现方式中,通过响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率,由此能够基于第三预设负载率准确地判断CPU是否处于预设的低负载状态。
在一种可能的实现方式中,所述将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,包括:通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在该实现方式中,通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,由此CPU能够及时获取到GPU对应的命令请求队列中的命令,从而有助于CPU更及时地处理GPU对应的命令请求队列中的命令。
在该实现方式中,CPU收到中断后,可以通过寄存器获取中断意图。若CPU发现该中断是命令处理器发来的GPU对应的命令请求队列中的命令,则可以将该命令交给GPU模拟程序进行处理。
在本公开实施例中,GPU模拟程序可以表示CPU中模拟GPU硬件运行机制的进程。在一些应用场景中,GPU模拟程序还可以称为GPU模拟器、虚拟GPU等等,在此不做限定。
在本公开实施例中,CPU可以响应于得到GPU对应的命令请求队列中的任一命令对应的命令处理结果,将命令处理结果发送至命令处理器。例如,CPU中的GPU模拟程序可以响应于得到GPU对应的命令请求队列中的任一命令对应的命令处理结果,将命令处理结果发送至命令处理器。
在一种可能的实现方式中,CPU可以响应于得到GPU对应的命令请求队列中的任一命令对应的命令处理结果,通过中断将命令处理结果发送至命令处理器。
在一种可能的实现方式中,所述方法还包括:响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU。
作为该实现方式的一个示例,命令处理器可以响应于收到CPU的中断通知,检查中断意图。若命令处理器发现该中断用于通知命令处理结果,则命令处理器可以将命令处理结果发送至GPU。GPU可以根据当前的工作状态(例如依赖情况)决定是否使用来自于CPU的命令处理结果。例如,若来自于CPU的命令处理结果与GPU的命令处理结果不存在依赖,则可以不对来自于CPU的命令处理结果进行处理;若来自于CPU的命令处理结果与GPU的命令处理结果存在依赖,则可以进行同步、合并等操作。
在该实现方式中,响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU,由此能够与GPU进行命令处理进度的同步。
在一种可能的实现方式中,所述方法还包括:将来自于所述CPU的命令处理结果写入所述GPU对应的命令响应队列中;向所述CPU发送命令完成消息。
作为该实现方式的一个示例,命令处理器可以通过中断向CPU发送命令完成消息。
在该实现方式中,命令处理器在将来自于所述CPU的任一命令对应的命令处理结果写入所述GPU对应的命令响应队列中之后,可以向CPU发送命令完成消息,以通知CPU该命令已完成。
作为该实现方式的一个示例,所述CPU还用于响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成。
例如,CPU收到中断后,可以通过寄存器获取中断意图。若CPU发现该中断是命令处理器发来的命令完成消息,则可以通知图形驱动所述命令已完成。
在该示例中,通过CPU响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成,由此图形驱动可以执行下一步的操作。
在一种可能的实现方式中,所述GPU对应的命令请求队列中的命令包括图像渲染命令;所述方法还包括:将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中。
在该实现方式中,命令处理器可以将GPU和CPU中的GPU模拟程序渲染得到的画面帧按顺序推入帧队列里,等显示控制器来消耗。
在该实现方式中,通过将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中,由此能够使GPU和CPU中的GPU模拟程序渲染得到的画面帧按顺序显示。
下面通过一个具体的应用场景说明本公开实施例提供的GPU的命令处理方法。图2示出本公开实施例提供的GPU的命令处理方法的示意图。
在该应用场景中,CPU可以响应于检测到待GPU处理的命令,将命令发送至GPU对应的命令请求队列,并通知命令处理器。
命令处理器可以通过GPU的寄存器获取GPU的负载率,通过中断与CPU通信以获取CPU的负载率,并访问GPU对应的命令请求队列以获取所述GPU对应的命令请求队列中的命令的数量。
若GPU的负载率大于或等于第一预设负载率,且CPU的负载率小于或等于第三预设负载率,则可以确定GPU处于第一预设高负载状态且CPU处于所述预设的低负载状态,其中,第一预设负载率大于第三预设负载率。在GPU处于第一预设高负载状态且CPU处于所述预设的低负载状态的情况下,命令处理器可以通过中断将GPU对应的命令请求队列中的至少部分命令分发给CPU。
若GPU的负载率大于或等于第二预设负载率,GPU对应的命令请求队列中的命令的数量大于或等于预设数量,且CPU的负载率小于或等于第三预设负载率,则可以确定GPU处于第二预设高负载状态且CPU处于所述预设的低负载状态,其中,第二预设负载率大于第三预设负载率,且第二预设负载率小于第一预设负载率。在GPU处于第二预设高负载状态且CPU处于所述预设的低负载状态的情况下,命令处理器可以通过中断将GPU对应的命令请求队列中的至少部分命令分发给CPU。
CPU收到中断后,可以通过寄存器获取中断意图。若CPU发现该中断是命令处理器发来的GPU对应的命令请求队列中的命令,则可以将该命令交给GPU模拟程序进行处理。
CPU可以响应于得到GPU对应的命令请求队列中的任一命令对应的命令处理结果,通过中断将命令处理结果发送至命令处理器。命令处理器可以响应于收到CPU的中断通知,检查中断意图。若命令处理器发现该中断用于通知命令处理结果,则命令处理器可以将命令处理结果发送至GPU。GPU可以根据当前的工作状态(例如依赖情况)决定是否使用来自于CPU的命令处理结果。另外,命令处理器在将来自于所述CPU的任一命令对应的命令处理结果写入所述GPU对应的命令响应队列中之后,可以通过中断向CPU发送命令完成消息,以通知CPU该命令已完成。
CPU收到中断后,可以通过寄存器获取中断意图。若CPU发现该中断是命令处理器发来的命令完成消息,则可以通知图形驱动所述命令已完成。
GPU可以响应于得到GPU对应的命令请求队列中的任一命令对应的命令处理结果,将命令处理结果写入所述GPU对应的命令响应队列中,并通知命令处理器所述命令已完成。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了GPU的命令处理装置、电子设备、计算机可读存储介质、计算机程序产品,上述均可用来实现本公开提供的任一种GPU的命令处理方法,相应技术方案和技术效果可参见方法部分的相应记载,不再赘述。
图3示出本公开实施例提供的GPU的命令处理装置的框图。如图3所示,所述GPU的命令处理装置包括:
获取模块31,用于获取GPU的负载信息;
分发模块32,用于响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
在一种可能的实现方式中,所述预设的高负载状态包括第一预设高负载状态;
所述分发模块32用于:
响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;
所述装置还包括:
第一确定模块,用于响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态。
在一种可能的实现方式中,所述预设的高负载状态包括第二预设高负载状态;
所述分发模块32用于:
获取所述GPU对应的命令请求队列中的命令的数量;
响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第二预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在一种可能的实现方式中,所述GPU的负载信息包括所述GPU的负载率;
所述装置还包括:
第二确定模块,用于响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态。
在一种可能的实现方式中,所述分发模块32用于:
获取所述CPU的负载信息;
响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU。
在一种可能的实现方式中,所述CPU的负载信息包括所述CPU的负载率;
所述装置还包括:
第三确定模块,用于响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率。
在一种可能的实现方式中,所述分发模块32用于:
通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
在一种可能的实现方式中,所述装置还包括:
第一发送模块,用于响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU。
在一种可能的实现方式中,所述装置还包括:
写入模块,用于将来自于所述CPU的命令处理结果写入所述GPU对应的命令响应队列中;
第二发送模块,用于向所述CPU发送命令完成消息。
在一种可能的实现方式中,所述CPU还用于响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成。
在一种可能的实现方式中,所述GPU对应的命令请求队列中的命令包括图像渲染命令;所述装置还包括:推入模块,用于将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中。
本公开实施例通过获取GPU的负载信息,响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令,由此在GPU处于高负载状态时,能够将GPU的一部分负载卸载到CPU侧,利用CPU中的GPU模拟程序处理GPU对应的命令请求队列中的至少部分命令,从而在GPU处于高负载状态时,能够通过CPU分担GPU的负载,利用CPU提高GPU对应的命令请求队列的处理效率,进而不仅能够在有限的GPU资源下提高电子设备的综合性能,还能够提高CPU的利用率。
图4示出本公开实施例提供的电子设备400的一框图。如图4所示,所述电子设备包括CPU410、GPU420和命令处理器430。其中,所述命令处理器430用于获取所述GPU420的负载信息,并响应于根据所述GPU420的负载信息确定所述GPU420处于预设的高负载状态,将所述GPU420对应的命令请求队列中的至少部分命令分发给CPU410;所述CPU410用于响应于接收到所述GPU420对应的命令请求队列中的任一命令,通过所述CPU410中的GPU模拟程序411处理所述命令。
在一种可能的实现方式中,所述预设的高负载状态包括第一预设高负载状态;所述命令处理器430具体用于:响应于根据所述GPU420的负载信息,确定所述GPU420处于所述第一预设高负载状态,将所述GPU420对应的命令请求队列中的至少部分命令分发给所述CPU410。
在一种可能的实现方式中,所述GPU420的负载信息包括所述GPU420的负载率;所述命令处理器430还用于:响应于所述GPU420的负载率大于或等于第一预设负载率,确定所述GPU420处于所述第一预设高负载状态。
在一种可能的实现方式中,所述预设的高负载状态包括第二预设高负载状态;所述命令处理器430具体用于:获取所述GPU420对应的命令请求队列中的命令的数量;响应于根据所述GPU420的负载信息和所述数量,确定所述GPU420处于所述第二预设高负载状态,将所述GPU420对应的命令请求队列中的至少部分命令分发给所述CPU410。
在一种可能的实现方式中,所述GPU420的负载信息包括所述GPU420的负载率;所述命令处理器430还用于:响应于所述GPU420的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU420处于所述第二预设高负载状态。
在一种可能的实现方式中,所述命令处理器430具体用于:获取所述CPU410的负载信息;响应于根据所述GPU420的负载信息确定所述GPU420处于预设的高负载状态,且根据所述CPU410的负载信息确定所述CPU410处于预设的低负载状态,将所述GPU420对应的命令请求队列中的至少部分命令分发给CPU410。
在一种可能的实现方式中,所述CPU410的负载信息包括所述CPU410的负载率;所述命令处理器430还用于:响应于所述CPU410的负载率小于或等于第三预设负载率,确定所述CPU410处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率。
在一种可能的实现方式中,所述命令处理器430具体用于:通过中断将所述GPU420对应的命令请求队列中的至少部分命令分发给所述CPU410。
在一种可能的实现方式中,所述命令处理器430还用于:用于响应于来自于所述CPU410的命令处理结果,将所述命令处理结果发送给所述GPU420。
在一种可能的实现方式中,所述命令处理器430还用于:将来自于所述CPU410的命令处理结果写入所述GPU420对应的命令响应队列中;向所述CPU410发送命令完成消息。
在一种可能的实现方式中,所述CPU410还用于:响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成。
在一种可能的实现方式中,所述GPU420对应的命令请求队列中的命令包括图像渲染命令;所述命令处理器430还用于:将所述GPU420处理所述图像渲染命令得到的画面帧和所述GPU模拟程序411处理所述图像渲染命令得到的画面帧按顺序推入帧队列中。
在本公开实施例,通过命令处理器于获取所述GPU的负载信息,并响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,通过CPU响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令,由此在GPU处于高负载状态时,能够将GPU的一部分负载卸载到CPU侧,利用CPU中的GPU模拟程序处理GPU对应的命令请求队列中的至少部分命令,从而在GPU处于高负载状态时,能够通过CPU分担GPU的负载,利用CPU提高GPU对应的命令请求队列的处理效率,进而不仅能够在有限的GPU资源下提高电子设备的综合性能,还能够提高CPU的利用率。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现和技术效果可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。其中,所述计算机可读存储介质可以是非易失性计算机可读存储介质,或者可以是易失性计算机可读存储介质。
本公开实施例还提出一种计算机程序,包括计算机可读代码,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备中运行时,所述电子设备中的处理器执行上述方法。
本公开实施例还提供一种电子设备,包括:一个或多个处理器;用于存储可执行指令的存储器;其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图5示出本公开实施例提供的电子设备1900的另一框图。例如,电子设备1900可以被提供为一终端或一服务器。参照图5,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入/输出接口1958(I/O接口)。电子设备1900可以操作基于存储在存储器1932的操作***,例如微软服务器操作***(Windows ServerTM),苹果公司推出的基于图形用户界面操作***(MacOS XTM),多用户多进程的计算机操作***(UnixTM),自由和开放原代码的类Unix操作***(LinuxTM),开放原代码的类Unix操作***(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
若本公开实施例的技术方案涉及个人信息,应用本公开实施例的技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本公开实施例的技术方案涉及敏感个人信息,应用本公开实施例的技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (16)
1.一种GPU的命令处理方法,其特征在于,包括:
获取GPU的负载信息;
响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
2.根据权利要求1所述的方法,其特征在于,所述预设的高负载状态包括第一预设高负载状态;
所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:
响应于根据所述GPU的负载信息,确定所述GPU处于所述第一预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
3.根据权利要求2所述的方法,其特征在于,所述GPU的负载信息包括所述GPU的负载率;
所述方法还包括:
响应于所述GPU的负载率大于或等于第一预设负载率,确定所述GPU处于所述第一预设高负载状态。
4.根据权利要求1所述的方法,其特征在于,所述预设的高负载状态包括第二预设高负载状态;
所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:
获取所述GPU对应的命令请求队列中的命令的数量;
响应于根据所述GPU的负载信息和所述数量,确定所述GPU处于所述第二预设高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
5.根据权利要求4所述的方法,其特征在于,所述GPU的负载信息包括所述GPU的负载率;
所述方法还包括:
响应于所述GPU的负载率大于或等于第二预设负载率,且所述数量大于或等于预设数量,确定所述GPU处于所述第二预设高负载状态。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU,包括:
获取所述CPU的负载信息;
响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,且根据所述CPU的负载信息确定所述CPU处于预设的低负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU。
7.根据权利要求6所述的方法,其特征在于,所述CPU的负载信息包括所述CPU的负载率;
所述方法还包括:
响应于所述CPU的负载率小于或等于第三预设负载率,确定所述CPU处于所述预设的低负载状态,其中,所述第三预设负载率小于第一预设负载率,且所述第三预设负载率小于第二预设负载率。
8.根据权利要求1至5中任意一项所述的方法,其特征在于,所述将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU,包括:
通过中断将所述GPU对应的命令请求队列中的至少部分命令分发给所述CPU。
9.根据权利要求1至5中任意一项所述的方法,其特征在于,所述方法还包括:
响应于来自于所述CPU的命令处理结果,将所述命令处理结果发送给所述GPU。
10.根据权利要求1至5中任意一项所述的方法,其特征在于,所述方法还包括:
将来自于所述CPU的命令处理结果写入所述GPU对应的命令响应队列中;
向所述CPU发送命令完成消息。
11.根据权利要求10所述的方法,其特征在于,所述CPU还用于响应于任一命令对应的命令完成消息,通知图形驱动所述命令已完成。
12.根据权利要求1至5中任意一项所述的方法,其特征在于,所述GPU对应的命令请求队列中的命令包括图像渲染命令;
所述方法还包括:
将所述GPU处理所述图像渲染命令得到的画面帧和所述GPU模拟程序处理所述图像渲染命令得到的画面帧按顺序推入帧队列中。
13.一种GPU的命令处理装置,其特征在于,包括:
获取模块,用于获取GPU的负载信息;
分发模块,用于响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;其中,所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
14.一种电子设备,其特征在于,包括CPU、GPU和命令处理器;
所述命令处理器用于获取所述GPU的负载信息,并响应于根据所述GPU的负载信息确定所述GPU处于预设的高负载状态,将所述GPU对应的命令请求队列中的至少部分命令分发给CPU;
所述CPU用于响应于接收到所述GPU对应的命令请求队列中的任一命令,通过所述CPU中的GPU模拟程序处理所述命令。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
用于存储可执行指令的存储器;
其中,所述一个或多个处理器被配置为调用所述存储器存储的可执行指令,以执行权利要求1至12中任意一项所述的方法。
16.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至12中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310347378.8A CN116402674B (zh) | 2023-04-03 | 2023-04-03 | Gpu的命令处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310347378.8A CN116402674B (zh) | 2023-04-03 | 2023-04-03 | Gpu的命令处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116402674A true CN116402674A (zh) | 2023-07-07 |
CN116402674B CN116402674B (zh) | 2024-07-12 |
Family
ID=87009799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310347378.8A Active CN116402674B (zh) | 2023-04-03 | 2023-04-03 | Gpu的命令处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116402674B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289782A (zh) * | 2010-06-18 | 2011-12-21 | 索尼公司 | 信息处理装置、用于控制信息处理装置的方法、和程序 |
CN104106053A (zh) * | 2012-02-08 | 2014-10-15 | 英特尔公司 | 使用功率的动态cpu gpu 负载平衡 |
US20150116342A1 (en) * | 2013-10-25 | 2015-04-30 | Harman International Industries, Incorporated | Start-up processing task distribution among processing units |
KR20190074165A (ko) * | 2017-12-19 | 2019-06-27 | 주식회사 티맥스클라우드 | 가상화 환경에서의 gpu 자원 관리 방법 및 장치 |
CN111506434A (zh) * | 2020-06-30 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种任务处理方法、装置及计算机可读存储介质 |
US20210216365A1 (en) * | 2018-09-19 | 2021-07-15 | Intel Corporation | Hybrid virtual gpu co-scheduling |
CN113256481A (zh) * | 2021-06-21 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 图形处理器中的任务处理方法、装置、电子设备及存储介质 |
CN114025163A (zh) * | 2021-09-28 | 2022-02-08 | 郑州云海信息技术有限公司 | 一种图像解码方法、图像解码***及相关装置 |
-
2023
- 2023-04-03 CN CN202310347378.8A patent/CN116402674B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102289782A (zh) * | 2010-06-18 | 2011-12-21 | 索尼公司 | 信息处理装置、用于控制信息处理装置的方法、和程序 |
CN104106053A (zh) * | 2012-02-08 | 2014-10-15 | 英特尔公司 | 使用功率的动态cpu gpu 负载平衡 |
US20150116342A1 (en) * | 2013-10-25 | 2015-04-30 | Harman International Industries, Incorporated | Start-up processing task distribution among processing units |
KR20190074165A (ko) * | 2017-12-19 | 2019-06-27 | 주식회사 티맥스클라우드 | 가상화 환경에서의 gpu 자원 관리 방법 및 장치 |
US20210216365A1 (en) * | 2018-09-19 | 2021-07-15 | Intel Corporation | Hybrid virtual gpu co-scheduling |
CN111506434A (zh) * | 2020-06-30 | 2020-08-07 | 腾讯科技(深圳)有限公司 | 一种任务处理方法、装置及计算机可读存储介质 |
CN113256481A (zh) * | 2021-06-21 | 2021-08-13 | 腾讯科技(深圳)有限公司 | 图形处理器中的任务处理方法、装置、电子设备及存储介质 |
CN114025163A (zh) * | 2021-09-28 | 2022-02-08 | 郑州云海信息技术有限公司 | 一种图像解码方法、图像解码***及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116402674B (zh) | 2024-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020207454A1 (zh) | 信息推送方法和装置 | |
CN110825436B (zh) | 应用于人工智能芯片的计算方法和人工智能芯片 | |
CN109656646B (zh) | 一种远程桌面控制方法、装置、设备及虚拟化芯片 | |
CN112506581B (zh) | 渲染小程序的方法、装置、电子设备和可读存储介质 | |
CN110007936B (zh) | 数据处理方法和装置 | |
CN109766319B (zh) | 压缩任务处理方法、装置、存储介质及电子设备 | |
CN113835992A (zh) | 内存泄露的处理方法、装置、电子设备及计算机存储介质 | |
CN116483584B (zh) | Gpu的任务处理方法、装置、电子设备和存储介质 | |
CN111580883B (zh) | 应用程序启动方法、装置、计算机***和介质 | |
CN116402674B (zh) | Gpu的命令处理方法、装置、电子设备和存储介质 | |
US20180052700A1 (en) | Facilitation of guest application display from host operating system | |
CN110825342B (zh) | 存储调度器件和用于处理信息的***、方法及装置 | |
CN111324376A (zh) | 功能配置方法、装置、电子设备及计算机可读介质 | |
CN115861510A (zh) | 对象渲染方法、装置、电子设备、存储介质及程序产品 | |
CN113781154A (zh) | 一种信息回滚方法、***、电子设备及存储介质 | |
CN116009792B (zh) | 一种图像处理中的数据读取、写入装置及方法、电子设备 | |
CN111813407A (zh) | 游戏开发方法、游戏运行方法、装置和电子设备 | |
CN111124907A (zh) | 一种***测试方法、装置和服务器 | |
CN113687879B (zh) | 跨平台框架与平台交互库的交互方法及装置 | |
CN113438419B (zh) | 相机启动方法、装置和电子设备 | |
CN113312131B (zh) | 标注工具的生成、运行方法和装置 | |
CN117311882A (zh) | 一种画面渲染方法、装置、设备及介质 | |
CN117742957A (zh) | 内存分配方法、装置、电子设备和存储介质 | |
CN116977468A (zh) | 图像帧的绘制处理方法、装置、设备及介质 | |
CN116881121A (zh) | 测试方法、装置、电子设备、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |