CN115712551A - 一种高性能计算应用的性能监测装置及*** - Google Patents
一种高性能计算应用的性能监测装置及*** Download PDFInfo
- Publication number
- CN115712551A CN115712551A CN202211504001.0A CN202211504001A CN115712551A CN 115712551 A CN115712551 A CN 115712551A CN 202211504001 A CN202211504001 A CN 202211504001A CN 115712551 A CN115712551 A CN 115712551A
- Authority
- CN
- China
- Prior art keywords
- module
- performance
- computing
- data
- calculation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种高性能计算应用的性能监测装置及***,涉及高性能计算技术领域,本发明先通过评测模块对***进行评测,完成后对各个模块发送指令,将数据导入计算模块完成计算后得到高性能数值,高性能数值送入并行开发模块完成存储并显现出来,在此过程中容错模块一直对数据和***进行检测,评测模块能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高***的稳定性,计算模块和并行开发模块通过隐式使用共享数据来完成任务间的数据交换,获得较高的互联网络带宽和较低的延迟,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力。
Description
技术领域
本发明涉及一种高性能计算应用的性能监测装置及***,属于高性能计算技术领域。
背景技术
作为数据中心的传统技术,高性能计算技术一直以来都具有举足轻重地位。如何监测高性能计算应用,来确定一个高性能计算应用是否适合当前高性能计算集群,以及是否能够效率最大化的利用当前平台,是高性能计算领域重要的技术问题,也是高性能计算集群运维人员、应用推广人员以及普通用户所关注的,其中的关键在于监测的***。
目前市场上的性能监测装置一般都包括数字化模块,首先,需要利用数字化模块从众多因素中提取影响最大的关键因素,作为评测指标;其次,通过编程模块建立性能评测程序集,设定约束条件,形成测试题目,按照测试方法进行测试,在此过程中需要使用计算模块进行计算,并且依据标准对测试结果进行定性和定量评估,展示在性能监测装置的外部。
但是现有的性能监测用***正常工作时,计算模块与并行开发模块之间只有单纯的数值传输,计算模块得出的高性能数值传输至开发模块后,开发模块中需要对高性能数值进行多次运算,内部的数值交换不够充分,外界数值一直在输入,计算过程会随之重复,从而导致***的计算耗时较久,并且在数据进入之前,只简单的对其进行分类,并未考虑到***内部的计算资源分配和应用处理的能力,在数据导入过多时,***无法处理,会造成一定的错乱,得到错误的结果,从而影响后续的工作。
发明内容
本发明要解决的技术问题是:提供一种高性能计算应用的性能监测装置及***,可以有效解决背景技术中现有的性能监测用***正常工作时,计算模块与并行开发模块之间只有单纯的数值传输,计算模块得出的高性能数值传输至开发模块后,开发模块中需要对高性能数值进行多次运算,内部的数值交换不够充分,外界数值一直在输入,计算过程会随之重复,从而导致***的计算耗时较久,并且在数据进入之前,只简单的对其进行分类,并未考虑到***内部的计算资源分配和应用处理的能力,在数据导入过多时,***无法处理,会造成一定的错乱,得到错误的结果,从而影响后续的工作的问题。
本发明采取的技术方案为:一种高性能计算应用的性能监测装置,包括监测装置主体,监测装置主体的内部左侧设置有评测模块,评测模块的一侧设置有计算模块,计算模块的底端设置有并行开发模块,并行开发模块远离评测模块的一侧设置有容错模块,检测装置主体的表面设置有显示装置,计算模块与并行开发模块之间设置有数据传输线。
优选地,上述评测模块与容错模块沿计算模块的中轴面对称设置,评测模块与容错模块之间电性连接。
一种高性能计算应用的性能监测用***,包括评测模块、计算模块、并行开发模块、容错模块和显示装置;
其中,评测模块将***规模、***功能、***性能三个方面对***进行评测,并且对***应用采用典型数值模式来完成评测;
计算模块包括高性能通用处理器、加速处理器,以及异构混合高性能处理器,还包括能彻底突破功耗墙、访存墙或性能墙障碍的碳纳米管、低温超导量子管和忆阻器,以及基于概率、认知的以类脑、纳米光学、超导量子器件为基础的新型计算模型建立的新型处理器,评测模块完成评测后将高计算数据送入计算模块中进行计算;
并行开发模块包括内存存储单元和多个编程单元,多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,提供灵活的任务调度策略单次调用多个程序和数据结构,计算后的数据在并行开发模块中进行分类,与不同的编程语言相配合工作,共同储存在内存存储单元中,并通过显示装置展现出来;
容错模块为数字化模块和计算模块提供可靠性保障技术和并行容错方法,在评测模块评测***不合格时,容错模块得到指令停止***的工作,在计算模块与并行开发模块运行时,容错模块实时监测计算模块的准确率和并行开发模块的承载率。
优选地,上述高性能通用处理器采用向量化、持续增宽的SIMD设计,该SIMD设计在支持浮点/定点乘加运算的前提上将单个功能部件的数据宽度增加到了512位宽、8个长整数或双精度向量。
优选地,上述并行开发模块中内存存储单元利用新型存储介质设计混合多层次存储结构,通过利用I/O局部性,在多个存储层次处理响应I/O访问请求,以提供高带宽、可均衡扩展的I/O能力,同时,采用软件存储和服务器平台,实现面向存储的功能定制、并发I/O性能优化功能,I/O性能优化功能是指通过利用I/O局部性,在多个存储层次处理响应I/O访问请求。
优选地,上述计算模块将计算后的数据送入并行开发模块中配合并行开发模块的工作,消除存储单元的瓶颈(以多层次存储结构在不同层次上实现计算与存储相融合就近处理数据),研究计算与存储融合的体系结构,以及计算与存储微观集成的体系结构;以新型存储器件技术、三维封装技术和互连技术为基础,根据技术成熟度和应用需求,在宏观和微观的不同层次上实现计算与存储相融合就近处理数据,来完成数据分配工作。
优选地,上述忆阻器具备逻辑计算能力,可以同时进行图像处理运算与存储融合的结构设计,在图像数据的存储位置上即可进行简单的图像处理操作;面向大数据处理,研究设计数据查询、排序、聚合数据的处理操作。
优选地,上述***规模指高性能计算***所能提供的理论计算峰值性能、处理器核数、存储容量等反映***实际资源规模的量化指标;***功能指高性能计算***对多个应用提供的功能支撑;***性能包括***单项性能和***综合性能,***单项性能指***处理器核的浮点计算能力、***单节点计算能力、高性能计算网络数据交换能力和***I/O能力的单项性能指标;***综合性能指典型数值模式在高性能计算***可获得的持续计算能力、***软、硬件配置是否合理、运行是否协调,包括***的可扩展性、平衡性、容错性、稳定性、易用性、可靠性及场地环境支撑能力的指标。
优选地,上述在应用评测指标中,根据每道测试题目的业务需求和测试目的设定评测指标,包括在固定问题规模,满足时效需求前提下,完成计算任务所需的最小***资源配置、最短时间。
优选地,上述高性能计算***在底层硬件架构、***软件层都设置有平衡模块,来充分考虑I/O性能,使***的计算能力和数据访问能力能够达到平衡。
本发明的有益效果:与现有技术相比,本发明的效果如下:
1)本发明中,通过计算模块和并行开发模块的设置,对高性能计算的数据进行合理性的检查,在一定的时间内,由多个处理器共同完成1个计算任务,以提高计算效率,缩短计算时间,并行开发模块中多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,因此获得较高的互联网络带宽和较低的延迟,进一步提高并行计算效率,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力,使***的计算能力和数据访问能力能够达到平衡;
2)本发明中,通过容错模块的设置,保障了***的稳定性,不仅对整个***的各个模块提出了一定的指标要求,还可以保障***性能均衡,运行稳定,结合外界的软件支撑***可以获得更高的计算效率和更好的使用效果;
3)本发明中,通过评测模块的设置,由于对***评测主要考虑***理论/持续计算峰值性能、***整体性能是否均衡、单核CPU峰值性能及缓存/内存配比是否合理、应用软件、***软件是否满足需求等;对应用评测主要考虑应用在各测试***的持续计算性能、并行可扩展性与其对计算资源需求的映射关系,结合测试***计算能力、I/O能力、高速计算网络数据交换能力计算出目标***配置规模;可以判断该***是否与应用相匹配,在考虑***性能属性和应用计算特征时,可以评测***与应用之间的相似度和差异度,将***中的计算与典型数值模式相关联,为典型数值模式在计算***中的计算评测提供依据,能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高***的稳定性。
附图说明
图1为本发明一种高性能计算应用的性能监测装置的剖面图;
图2为本发明一种高性能计算应用的性能监测用***的流程图;
图3为本发明一种高性能计算应用的性能监测用***中并行开发模块的工作原理图;
图4为本发明一种高性能计算应用的性能监测用***中评测模块的工作流程图。
具体实施方式
下面结合附图及具体的实施例对本发明进行进一步介绍。
实施例1:如图1-4所示,一种高性能计算应用的性能监测装置,包括监测装置主体,监测装置主体的内部左侧设置有评测模块,评测模块的一侧设置有计算模块,计算模块的底端设置有并行开发模块,并行开发模块远离评测模块的一侧设置有容错模块,检测装置主体的表面设置有显示装置,计算模块与并行开发模块之间设置有数据传输线,评测模块与容错模块沿计算模块的中轴面对称设置,评测模块与容错模块之间电性连接,方便数据传输,减少传输损耗。
实施例2:如图1-4所示,一种高性能计算应用的性能监测用***,包括评测模块、计算模块、并行开发模块、容错模块和显示装置,高性能计算***在底层硬件架构、***软件层都设置有平衡模块,来充分考虑I/O性能,使***的计算能力和数据访问能力能够达到平衡;
其中,评测模块将***规模、***功能、***性能三个方面对***进行评测,***规模指高性能计算***所能提供的理论计算峰值性能、处理器核数﹑存储容量等反映***实际资源规模的量化指标;***功能指高性能计算***对多个应用提供的功能支撑;***性能包括***单项性能和***综合性能,***单项性能指***处理器核的浮点计算能力、***单节点计算能力、高性能计算网络数据交换能力和***I/O能力的单项性能指标;***综合性能指典型数值模式在高性能计算***可获得的持续计算能力、***软、硬件配置是否合理、运行是否协调,包括***的可扩展性、平衡性、容错性、稳定性、易用性、可靠性及场地环境支撑能力的指标,并且对***应用采用典型数值模式来完成评测,在应用评测指标中,根据每道测试题目的业务需求和测试目的设定评测指标,包括在固定问题规模,满足时效需求前提下,完成计算任务所需的最小***资源配置、最短时间;
对***评测主要考虑***理论/持续计算峰值性能、***整体性能是否均衡、单核CPU峰值性能及缓存/内存配比是否合理、应用软件、***软件是否满足需求等;对应用评测主要考虑应用在各测试***的持续计算性能、并行可扩展性与其对计算资源需求的映射关系,结合测试***计算能力、I/O能力、高速计算网络数据交换能力计算出目标***配置规模;可以判断该***是否与应用相匹配,在考虑***性能属性和应用计算特征时,可以评测***与应用之间的相似度和差异度,将***中的计算与典型数值模式相关联,为典型数值模式在计算***中的计算评测提供依据,能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高***的稳定性,可以针对数据和***的计算处理能力进行一定的分配;
其中,计算模块包括高性能通用处理器、加速处理器,以及异构混合高性能处理器,高性能通用处理器采用向量化、持续增宽的SIMD设计,该SIMD设计在支持浮点/定点乘加运算的前提上将单个功能部件的数据宽度增加到了512位宽、8个长整数或双精度向量,在低功耗与高可靠的前提下,有效提高了处理器的性能,另外还包括能彻底突破功耗墙、访存墙或性能墙障碍的碳纳米管、低温超导量子管和忆阻器,忆阻器具备逻辑计算能力,可以同时进行图像处理运算与存储融合的结构设计,在图像数据的存储位置上即可进行简单的图像处理操作,从而大大减少图像数据的访存操作,达到提高图像处理性能和效率的目的;面向大数据处理,研究设计数据查询、排序、聚合数据的处理操作,以及基于概率、认知的以类脑、纳米光学、超导量子器件为基础的新型处理器,评测模块完成评测后将高计算数据送入计算模块中进行计算;
其中,并行开发模块包括内存存储单元和多个编程单元,多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,提供灵活的任务调度策略单次调用多个程序和数据结构,计算后的数据在并行开发模块中进行分类,与不同的编程语言相配合工作,共同储存在内存存储单元中,并通过显示装置展现出来,因此获得较高的互联网络带宽和较低的延迟,进一步提高并行计算效率,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力,使***的计算能力和数据访问能力能够达到平衡,并行开发模块中内存存储单元利用新型存储介质设计混合多层次存储结构,通过利用I/O局部性,在多个存储层次处理响应I/O访问请求,以提供高带宽、可均衡扩展的I/O能力,同时,采用软件定义存储和服务器平台,实现面向存储的功能定制、并发I/O性能优化功能,I/O性能优化功能是指通过利用I/O局部性,在多个存储层次处理响应I/O访问请求;
计算模块将计算后的数据送入并行开发模块中配合并行开发模块的工作,可以消除存储单元的瓶颈,研究计算与存储融合的体系结构,以及计算与存储微观集成的体系结构;以新型存储器件技术、三维封装技术和互连技术为基础,根据技术成熟度和应用需求,在宏观和微观等不同层次上实现计算与存储相融合就近处理数据,来完成数据分配工作。
其中,容错模块为数字化模块和计算模块提供可靠性保障技术和并行容错方法,保障并行计算的可靠性和稳定性,在评测模块评测***不合格时,容错模块得到指令停止***的工作,在计算模块与并行开发模块运行时,容错模块实时监测计算模块的准确率和并行开发模块的承载率,保障了***的稳定性,不仅对整个***的各个模块提出了一定的指标要求,还可以保障***性能均衡,运行稳定,结合外界的软件支撑***可以获得更高的计算效率和更好的使用效果。
本发明的工作原理为:先通过评测模块对***进行评测,将***中的计算与典型数值模式相关联,为典型数值模式在计算***中的计算评测提供依据,能提供足够的作业管理调度制度,提供计算资源灵活调配的应用需求,进而提高***的稳定性,完成后对各个模块发送指令,将数据导入计算模块完成计算后得到高性能数值,高性能数值送入并行开发模块完成存储并显现出来,并行开发模块中的多个编程单元可以共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,因此获得较高的互联网络带宽和较低的延迟,并且混合开发编程可以有效减少数据重复的情况发生,提高了扩展能力,使***的计算能力和数据访问能力能够达到平衡,在此过程中容错模块一直对数据和***进行检测。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种高性能计算应用的性能监测装置,其特征在于:包括监测装置主体,所述监测装置主体的内部左侧设置有评测模块,所述评测模块的一侧设置有计算模块,所述计算模块的底端设置有并行开发模块,所述并行开发模块远离评测模块的一侧设置有容错模块,所述检测装置主体的表面设置有显示装置,所述计算模块与并行开发模块之间设置有数据传输线。
2.根据权利要求1所述的一种高性能计算应用的性能监测装置,其特征在于:所述评测模块与容错模块沿计算模块的中轴面对称设置,所述评测模块与容错模块之间电性连接。
3.一种高性能计算应用的性能监测用***,其特征在于:包括评测模块、计算模块、并行开发模块、容错模块和显示装置;
所述评测模块将***规模、***功能、***性能三个方面对***进行评测,并且对***应用采用典型数值模式来完成评测;
所述计算模块包括高性能通用处理器、加速处理器,以及异构混合高性能处理器,还包括能彻底突破功耗墙、访存墙或性能墙障碍的碳纳米管、低温超导量子管和忆阻器、以及基于概率、认知的以类脑、纳米光学、超导量子器件为基础的新型计算模型建立的新型处理器,评测模块完成评测后将高计算数据送入计算模块中进行计算;
所述并行开发模块包括内存存储单元和多个编程单元,多个编程单元在不同的环境下采用多种编程语言混合开发编程的数据,每个编程单元得到一个任务,多个任务并行存储在内存储存单元中,多个编程单元共享内存存储单元内部的信息,通过隐式使用共享数据来完成任务间的数据交换,提供灵活的任务调度策略单次调用多个程序和数据结构,计算后的数据在并行开发模块中进行分类,与不同的编程语言相配合工作,共同储存在内存存储单元中,并通过显示装置展现出来;
所述容错模块为数字化模块和计算模块提供可靠性保障技术和并行容错方法,在评测模块评测***不合格时,容错模块得到指令停止***的工作,在计算模块与并行开发模块运行时,容错模块实时监测计算模块的准确率和并行开发模块的承载率。
4.根据权利要求3所述的一种高性能计算应用的性能监测***,其特征在于:所述高性能通用处理器采用向量化、持续增宽的SIMD设计,该SIMD设计在支持浮点/定点乘加运算的前提上将单个功能部件的数据宽度增加到了512位宽、8个长整数或双精度向量。
5.根据权利要求3所述的一种高性能计算应用的性能监测***,其特征在于:所述并行开发模块中内存存储单元利用新型存储介质设计混合多层次存储结构,通过利用I/O局部性,在多个存储层次处理响应I/O访问请求,以提供高带宽、可均衡扩展的I/O能力,同时,采用软件定义存储和服务器平台,实现面向存储的功能定制、并发I/O性能优化功能,I/O性能优化功能是指通过利用I/O局部性,在多个存储层次处理响应I/O访问请求。
6.根据权利要求3所述的一种高性能计算应用的性能监测***,其特征在于:所述计算模块将计算后的数据送入并行开发模块中配合并行开发模块的工作,消除存储单元的瓶颈,研究计算与存储融合的体系结构,以及计算与存储微观集成的体系结构;以新型存储器件技术、三维封装技术和互连技术为基础,根据技术成熟度和应用需求,在宏观和微观的不同层次上实现计算与存储相融合就近处理数据,来完成数据分配工作。
7.根据权利要求3所述的一种高性能计算应用的性能监测用***,其特征在于:所述忆阻器具备逻辑计算能力,同时进行图像处理运算与存储融合的结构设计,在图像数据的存储位置上即可进行简单的图像处理操作;面向大数据处理,研究设计数据查询、排序、聚合数据的处理操作。
8.根据权利要求3所述的一种高性能计算应用的性能监测用***,其特征在于:所述***规模指高性能计算***所能提供的理论计算峰值性能、处理器核数和存储容量反映***实际资源规模的量化指标;***功能指高性能计算***对多个应用提供的功能支撑;***性能包括***单项性能和***综合性能,***单项性能指***处理器核的浮点计算能力、***单节点计算能力、高性能计算网络数据交换能力和***I/O能力的单项性能指标;***综合性能指典型数值模式在高性能计算***获得的持续计算能力、***软、硬件配置是否合理、运行是否协调,包括***的可扩展性、平衡性、容错性、稳定性、易用性、可靠性及场地环境支撑能力的指标。
9.根据权利要求3所述的一种高性能计算应用的性能监测用***,其特征在于:所述在应用评测指标中,根据每道测试题目的业务需求和测试目的设定评测指标,包括在固定问题规模,满足时效需求前提下,完成计算任务所需的最小***资源配置和最短时间。
10.根据权利要求3所述的一种高性能计算应用的性能监测用***,其特征在于:所述高性能计算***在底层硬件架构、***软件层都设置有平衡模块,用于考虑I/O性能,使***的计算能力和数据访问能力能够达到平衡。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211504001.0A CN115712551A (zh) | 2022-11-28 | 2022-11-28 | 一种高性能计算应用的性能监测装置及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211504001.0A CN115712551A (zh) | 2022-11-28 | 2022-11-28 | 一种高性能计算应用的性能监测装置及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115712551A true CN115712551A (zh) | 2023-02-24 |
Family
ID=85235193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211504001.0A Pending CN115712551A (zh) | 2022-11-28 | 2022-11-28 | 一种高性能计算应用的性能监测装置及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115712551A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116074179A (zh) * | 2023-03-06 | 2023-05-05 | 鹏城实验室 | 基于cpu-npu协同的高扩展节点***及训练方法 |
-
2022
- 2022-11-28 CN CN202211504001.0A patent/CN115712551A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116074179A (zh) * | 2023-03-06 | 2023-05-05 | 鹏城实验室 | 基于cpu-npu协同的高扩展节点***及训练方法 |
CN116074179B (zh) * | 2023-03-06 | 2023-07-14 | 鹏城实验室 | 基于cpu-npu协同的高扩展节点***及训练方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zheng et al. | Real-time big data processing framework: challenges and solutions | |
US8631410B2 (en) | Scheduling jobs in a cluster having multiple computing nodes by constructing multiple sub-cluster based on entry and exit rules | |
CN107391258B (zh) | 一种软硬件一体的便携式遥感影像实时处理*** | |
CN103617087A (zh) | 一种适合迭代计算的MapReduce优化方法 | |
CN111190735B (zh) | 一种基于Linux的片上CPU/GPU流水化计算方法及计算机*** | |
CN105808358B (zh) | 一种用于众核***的数据相关性线程分组映射方法 | |
CN113821332B (zh) | 自动机器学习***效能调优方法、装置、设备及介质 | |
CN115712551A (zh) | 一种高性能计算应用的性能监测装置及*** | |
Du et al. | Model parallelism optimization for distributed inference via decoupled CNN structure | |
CN106250348A (zh) | 一种基于gpu访存特性的异构多核架构缓存管理方法 | |
Shi et al. | Virtual machine resource allocation optimization in cloud computing based on multiobjective genetic algorithm | |
Song et al. | Energy efficiency optimization in big data processing platform by improving resources utilization | |
Wen et al. | The application of artificial intelligence technology in cloud computing environment resources | |
CN103903295A (zh) | 一种基于InfiniBand实时调度海量高精度三维场景数据的方法 | |
Zhou et al. | Semantic-based discovery method for high-performance computing resources in cyber-physical systems | |
Zhou et al. | Task Offloading Strategy of 6G Heterogeneous Edge‐Cloud Computing Model considering Mass Customization Mode Collaborative Manufacturing Environment | |
CN104331336B (zh) | 匹配于高性能计算机结构的多层嵌套负载平衡方法 | |
Yang et al. | Study on static task scheduling based on heterogeneous multi-core processor | |
Wang et al. | Directive-based hybrid parallel power system dynamic simulation on multi-core cpu and many-core gpu architecture | |
Fang et al. | A Scheduling Strategy for Reduced Power Consumption in Mobile Edge Computing | |
CN113835869B (zh) | 基于mpi负载平衡方法、装置、计算机设备和存储介质 | |
CN114819367A (zh) | 一种基于工业互联网的公共服务平台 | |
Fang et al. | A real-time and reliable dynamic migration model for concurrent taskflow in a GPU cluster | |
CN109446294B (zh) | 一种并行的相互子空间Skyline查询方法 | |
Dandamudi et al. | Architectures for parallel query processing on networks of workstations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |