CN113535386A - 一种应用于电力仪器设备的板间多运算芯片资源监控*** - Google Patents

一种应用于电力仪器设备的板间多运算芯片资源监控*** Download PDF

Info

Publication number
CN113535386A
CN113535386A CN202110698558.1A CN202110698558A CN113535386A CN 113535386 A CN113535386 A CN 113535386A CN 202110698558 A CN202110698558 A CN 202110698558A CN 113535386 A CN113535386 A CN 113535386A
Authority
CN
China
Prior art keywords
module
chip
board
power
computing power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110698558.1A
Other languages
English (en)
Other versions
CN113535386B (zh
Inventor
芦红彦
刘猛
崔巍
杜鹏宏
梁隽
王林翰
李天添
缪中章
胡俊
周键
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Zhongxing Jineng Electric Power Development Co ltd
Shanghai Sichuang Electric Equipment Co Ltd
Original Assignee
Hebei Zhongxing Jineng Electric Power Development Co ltd
Shanghai Sichuang Electric Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Zhongxing Jineng Electric Power Development Co ltd, Shanghai Sichuang Electric Equipment Co Ltd filed Critical Hebei Zhongxing Jineng Electric Power Development Co ltd
Priority to CN202110698558.1A priority Critical patent/CN113535386B/zh
Publication of CN113535386A publication Critical patent/CN113535386A/zh
Application granted granted Critical
Publication of CN113535386B publication Critical patent/CN113535386B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明公开的一种应用于电力仪器设备的板间多运算芯片资源监控***,包括数据采集层、通信层和控制层,其中:所述数据采集层包括单板算力监测模块和单板芯片权重模块;所述通信层包括通信模块和数据整合模块;所述控制层包括主控模块。本发明主要用于电力仪器设备的***上存在多个运算电路板且各个运算电路板的运算任务内容相差较大,算力需求相差较大的应用场景下。本发明为统筹调配任务内容,将各运算芯片中执行的运算内容进行平衡,以达到平衡各运算电路板算力,提高***整体运行效率的作用。同时,还可将***架构所需要的高性能运算芯片替换为一系列低性能运算芯片,大大降低***成本。

Description

一种应用于电力仪器设备的板间多运算芯片资源监控***
技术领域
本发明涉及电力仪器设备技术领域,特别涉及一种应用于电力仪器设备的板间多运算芯片资源监控***。
背景技术
现有电力仪器设备大多采用裸机***或简易OS***进行运行,缺少板间***OS,对于运行过程中的板间资源占有情况一无所知,会造成运行过程中堵塞、宕机等情况,需要一种资源监控***来实时得知板间资源占有率情况,以得知当前***运行状况。另外现有的情况下,在开发过程中对于板间的资源使用情况大多依靠经验进行,模块化进行,不考虑其他电路板运算芯片的算力利用问题,因此,会出现资源浪费的情况,或出现资源不足,算法无法运行的情况,需要一种资源监控***来提高开发效率。
发明内容
本发明所要解决的技术问题在于针对现有电力仪器设备所存在的上述不足之处而提供一种应用于电力仪器设备的板间多运算芯片资源监控***。
为了实现上述发明目的,本发明所要解决的技术问题可以通过以下技术方案来实现:
一种应用于电力仪器设备的板间多运算芯片资源监控***,包括数据采集层、通信层和控制层,其中:
所述数据采集层包括单板算力监测模块和单板芯片权重模块,所述单板算力监测模块对于单板上的运算芯片、存储芯片进行算力资源监控,为单板上各运算芯片的冗余算力信息、冗余存储资源信息和冗余IO资源信息;所述单板芯片权重模块通过所述控制层进行初始化设置,通过对于单板上各芯片所运行的计算任务进行权重处理;
所述通信层包括通信模块和数据整合模块,所述数据整合模块将所述数据采集层所采集的单板算力资源信息整合并标记时间戳,存储于单板算力资源数据库中;所述通信模块负责***中各模块的通信工作;
所述控制层包括主控模块,所述主控模块负责向平行电力仪器设备、上下级电力仪器设备以及用户端提供本电力仪器设备各电路板的算力监控情况。
在本发明的一个优选实施例中,所述单板芯片权重模块的权重设置方式为:芯片所运行的任务占主业务逻辑任务比重越大,芯片所运行的任务越重要,其权重越高,即其需要冗余资源对该芯片的运算任务进行保护。
在本发明的一个优选实施例中,单板所消耗的总资源,最终的监控结果如下述公式所示:
S=ΣScur*l1
其中S位最终资源使用情况,Scur为各芯片的当前资源使用情况,11为单板芯片权重模块中各芯片的权重值。
在本发明的一个优选实施例中,在所述主板需要获取相应板间算力数据的时候,将距离目前时刻最近的时间戳所对应的整合完成的单板资源信息传递给主控模块。
在本发明的一个优选实施例中,所述数据整合模块包括单板算力资源数据库和时域信号处理模块,所述时域信号处理模块通过时域信号处理方法,对于单板算力资源数据库中的前置单板算力资源信息进行时域信号分析及预测,获取各单板当前预估算力情况;将所获取各单板当前预估算力情况进行整合后传递进入所述主控模块中,并在任务池中添加一个延时任务,对于该无法及时采集的数据进行重新获取采集,并及时根更新至所述主控模块。
在本发明的一个优选实施例中,所述板间多运算芯片资源监控***存在以下两种算力监控模式,第一种为定时算力监控模式,在该定时算力监控模式下,所述主控模块定时将所述数据整合模块发送算力情况信息获取请求,所述数据整合模块将距离目前最近的时间戳所对应的单板资源信息传递给主控模块;第二种为突发算力监控模式,在所述主控模块接收到来自于平行或上下级电力仪器设备的算力信息获取请阿牛,或来自于用户的实时算力信息获取请求后所述主控模块将向数据整合模块发送实时算力情况信息获取请求;所述数据整合模块在收到该请求后,向数据采集层下发数据采集命令并获取相应信息,整合完成后上传给所述主控模块。
由于采用了如上的技术方案,本发明主要对于位于电力仪器设备中的大量数字电路板进行整体性能监控,主要包含了算力监控和存储资源监控,其中,存储资源监控主要对于电路板的数据存储资源和其IO资源监控。
本发明主要用于电力仪器设备的***上存在多个运算电路板且各个运算电路板的运算任务内容相差较大,算力需求相差较大的应用场景下。本发明为统筹调配任务内容,将各运算芯片中执行的运算内容进行平衡,以达到平衡各运算电路板算力,提高***整体运行效率的作用。同时,还可将***架构所需要的高性能运算芯片替换为一系列低性能运算芯片,大大降低***成本。
附图说明
图1为本发明应用于电力仪器设备的板间多运算芯片资源监控***的架构示意图。
图2为本发明的数据整合模块的结构示意图。
具体实施方式
以下结合附图和具体实施方式来进一步描述本发明。
一套电力仪器***包含了多个模拟电路板和数字电路板。位于数字电路板上还有为数众多的数字芯片,数字芯片中最重要的是运算芯片。本发明主要对于位于电力仪器***中的大量数字电路板进行整体性能监控,主要包含了算力监控和存储资源监控。其中,存储资源监控主要对于电路板的数据存储资源和其IO资源进行监控。
本发明应用于电力仪器设备的板间多运算芯片资源监控***运行于***中所有数字电路板之上。
本发明应用于电力仪器设备的板间多运算芯片资源监控***架构图如图1所示。
本发明应用于电力仪器设备的板间多运算芯片资源监控***与电路板中正常运行的软件之间为并行运行关系,微观为时分复用关系。在本发明应用于电力仪器设备的板间多运算芯片资源监控***的运算电路板中运行的操作***上,本发明应用于电力仪器设备的板间多运算芯片资源监控***与业务程序之间的关系为互不干扰的多个平行进程。且本发明应用于电力仪器设备的板间多运算芯片资源监控***自该电路板上电初始化完成之时启动,持续运行至该电路板结束工作为止。
本发明的应用于电力仪器设备的板间多运算芯片资源监控***,包括数据采集层10、通信层20和控制层30,其中:
数据采集层10包括单板算力监测模块11和单板芯片权重模块12,单板算力监控模块11主要负责对于单板上的运算芯片,存储芯片进行算力资源监控工作。主要提供当前单板上各运算芯片的冗余算力信息,冗余存储资源信息,冗余IO资源信息等。
单板芯片权重模块12主要通过主控模块31进行初始化设置,主要通过对于单板上各芯片所运行的计算任务进行权重处理。该权重设置方式为,芯片所运行的任务占主业务逻辑任务比重越大,芯片所运行的任务越重要,其权重越高——即其需要冗余资源对该芯片的运算任务进行保护。该单板芯片权重模块12主要作用是直观的表现芯片对于资源的需求(包含冗余资源),而非单纯的运算任务所本身所包含的资源。反映了在工程应用运行的背景下,芯片所需要的安全运行资源。
在本***中,单板所消耗的总资源,最终的监控结果如下述公式所示:
S=ΣScur*l1
其中S为最终资源使用情况,Scur为各芯片的当前资源使用情况,l1为单板芯片权重模块12中各芯片的权重值,通过ΣSavailable*l1计算,获取单板的资源使用情况。
通信层20包括通信模块21和数据整合模块22,参见图2,数据整合模块22包括单板算力资源数据库22a和时域信号处理模块22b。
数据整合模块22主要将数据采集层10所采集的单板算力资源信息整合并标记时间戳,存储于单板算力资源数据库22a中。在主控模块31需要获取相应板间算力数据的时候,将距离目前时刻最近的时间戳所对应的整合完成的单板资源信息传递给主控模块31。
在***运行过程中,可能存在包括但不限于通信模块阻塞,通信误码乱码,数据采集层阻塞,等意外情况导致数据采集层无法及时传递当下数据给数据整合模块22的情况。数据整合模块22中存在一个时域信号处理模块22b。该时域信号处理模块22b通过时域信号处理方法,对于单板算力资源数据库中的前置单板算力资源信息进行时域信号分析及预测,获取各单板当前预估算力情况。将上述信息进行整合后传递进入主控模块31中。并在任务池中添加一个延时任务,对于该次无法及时采集的数据进行重新获取采集,并及时更新至主控模块中。
通信模块21主要负责***内各模块的通信工作。
控制层30包括主控模块31,主控模块31主要负责向其他平行电力仪器设备,上下级电力仪器设备,以及用户端,提供本仪器各电路板的算力监控情况。
本发明应用于电力仪器设备的板间多运算芯片资源监控***主要存在两种算力监控模式。第一种为定时算力监控模式,在该模式下,主控模块31定时向数据整合模块22发送算力情况信息获取请求。数据整合模块22将距离目前时刻最近的时间戳所对应的单板资源信息传递给主控模块31。第二种为突发算力监控模式,在主控模块31接收到来自于平行,或上下级电力仪器设备的算力信息获取请求,或来自于用户的实时算力信息获取请求后,主控模块31将向数据请求模块22发送实时算力情况信息获取请求。数据整合模块22在收到该请求后,向数据采集层10下发数据采集命令并获取相应信息,整合完成后上传给主控模块31。

Claims (6)

1.一种应用于电力仪器设备的板间多运算芯片资源监控***,其特征在于,包括数据采集层、通信层和控制层,其中:
所述数据采集层包括单板算力监测模块和单板芯片权重模块,所述单板算力监测模块对于单板上的运算芯片、存储芯片进行算力资源监控,为单板上各运算芯片的冗余算力信息、冗余存储资源信息和冗余IO资源信息;所述单板芯片权重模块通过所述控制层进行初始化设置,通过对于单板上各芯片所运行的计算任务进行权重处理;
所述通信层包括通信模块和数据整合模块,所述数据整合模块将所述数据采集层所采集的单板算力资源信息整合并标记时间戳,存储于单板算力资源数据库中;所述通信模块负责***中各模块的通信工作;
所述控制层包括主控模块,所述主控模块负责向平行电力仪器设备、上下级电力仪器设备以及用户端提供本电力仪器设备各电路板的算力监控情况。
2.根据权利要求1所述的一种应用于电力仪器设备的板间多运算芯片资源监控***,其特征在于,所述单板芯片权重模块的权重设置方式为:芯片所运行的任务占主业务逻辑任务比重越大,芯片所运行的任务越重要,其权重越高,即其需要冗余资源对该芯片的运算任务进行保护。
3.根据权利要求2所述的一种应用于电力仪器设备的板间多运算芯片资源监控***,其特征在于,单板所消耗的总资源,最终的监控结果如下述公式所示:
S=ΣScur*l1
其中S位最终资源使用情况,Scur为各芯片的当前资源使用情况,11为单板芯片权重模块中各芯片的权重值。
4.根据权利要求3所述的一种应用于电力仪器设备的板间多运算芯片资源监控***,其特征在于,在所述主板需要获取相应板间算力数据的时候,将距离目前时刻最近的时间戳所对应的整合完成的单板资源信息传递给主控模块。
5.根据权利要求4所述的一种应用于电力仪器设备的板间多运算芯片资源监控***,其特征在于,所述数据整合模块包括单板算力资源数据库和时域信号处理模块,所述时域信号处理模块通过时域信号处理方法,对于单板算力资源数据库中的前置单板算力资源信息进行时域信号分析及预测,获取各单板当前预估算力情况;将所获取各单板当前预估算力情况进行整合后传递进入所述主控模块中,并在任务池中添加一个延时任务,对于该无法及时采集的数据进行重新获取采集,并及时根更新至所述主控模块。
6.根据权利要求5所述的一种应用于电力仪器设备的板间多运算芯片资源监控***,其特征在于,所述板间多运算芯片资源监控***存在以下两种算力监控模式,第一种为定时算力监控模式,在该定时算力监控模式下,所述主控模块定时将所述数据整合模块发送算力情况信息获取请求,所述数据整合模块将距离目前最近的时间戳所对应的单板资源信息传递给主控模块;第二种为突发算力监控模式,在所述主控模块接收到来自于平行或上下级电力仪器设备的算力信息获取请阿牛,或来自于用户的实时算力信息获取请求后所述主控模块将向数据整合模块发送实时算力情况信息获取请求;所述数据整合模块在收到该请求后,向数据采集层下发数据采集命令并获取相应信息,整合完成后上传给所述主控模块。
CN202110698558.1A 2021-06-23 2021-06-23 一种应用于电力仪器设备的板间多运算芯片资源监控*** Active CN113535386B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110698558.1A CN113535386B (zh) 2021-06-23 2021-06-23 一种应用于电力仪器设备的板间多运算芯片资源监控***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110698558.1A CN113535386B (zh) 2021-06-23 2021-06-23 一种应用于电力仪器设备的板间多运算芯片资源监控***

Publications (2)

Publication Number Publication Date
CN113535386A true CN113535386A (zh) 2021-10-22
CN113535386B CN113535386B (zh) 2022-09-02

Family

ID=78096510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110698558.1A Active CN113535386B (zh) 2021-06-23 2021-06-23 一种应用于电力仪器设备的板间多运算芯片资源监控***

Country Status (1)

Country Link
CN (1) CN113535386B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115190127A (zh) * 2022-07-08 2022-10-14 中国联合网络通信集团有限公司 一种算力服务的存证方法、装置及***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1687804A (zh) * 2005-05-13 2005-10-26 武汉大学 一种高频地波雷达***的远程监控***
CN103957413A (zh) * 2014-01-13 2014-07-30 南京达鹏信息技术有限公司 一种针对移动网络视频通信应用的实时误码掩盖方法和装置
CN106851747A (zh) * 2015-12-03 2017-06-13 中兴通讯股份有限公司 一种移动通信***内动态资源分配方法和装置
CN208001290U (zh) * 2018-02-01 2018-10-23 国网湖北省电力公司信息通信公司 一种多维电力通信网流量预测***
CN109857542A (zh) * 2018-12-14 2019-06-07 贵州华芯通半导体技术有限公司 算力资源调节方法、***及装置
CN110764904A (zh) * 2019-09-23 2020-02-07 合肥中科类脑智能技术有限公司 一种基于fpga芯片的资源调度方法及***
CN111464336A (zh) * 2020-03-13 2020-07-28 南京南瑞信息通信科技有限公司 一种基于电力通信机房高并发数据处理方法及***
CN112162518A (zh) * 2020-10-14 2021-01-01 河北中兴冀能电力发展有限公司 一种应用于电力仪器设备的单板多运算芯片算力监控***
WO2021108680A1 (en) * 2019-11-25 2021-06-03 Strong Force Iot Portfolio 2016, Llc Intelligent vibration digital twin systems and methods for industrial environments

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1687804A (zh) * 2005-05-13 2005-10-26 武汉大学 一种高频地波雷达***的远程监控***
CN103957413A (zh) * 2014-01-13 2014-07-30 南京达鹏信息技术有限公司 一种针对移动网络视频通信应用的实时误码掩盖方法和装置
CN106851747A (zh) * 2015-12-03 2017-06-13 中兴通讯股份有限公司 一种移动通信***内动态资源分配方法和装置
CN208001290U (zh) * 2018-02-01 2018-10-23 国网湖北省电力公司信息通信公司 一种多维电力通信网流量预测***
CN109857542A (zh) * 2018-12-14 2019-06-07 贵州华芯通半导体技术有限公司 算力资源调节方法、***及装置
CN110764904A (zh) * 2019-09-23 2020-02-07 合肥中科类脑智能技术有限公司 一种基于fpga芯片的资源调度方法及***
WO2021108680A1 (en) * 2019-11-25 2021-06-03 Strong Force Iot Portfolio 2016, Llc Intelligent vibration digital twin systems and methods for industrial environments
CN111464336A (zh) * 2020-03-13 2020-07-28 南京南瑞信息通信科技有限公司 一种基于电力通信机房高并发数据处理方法及***
CN112162518A (zh) * 2020-10-14 2021-01-01 河北中兴冀能电力发展有限公司 一种应用于电力仪器设备的单板多运算芯片算力监控***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115190127A (zh) * 2022-07-08 2022-10-14 中国联合网络通信集团有限公司 一种算力服务的存证方法、装置及***

Also Published As

Publication number Publication date
CN113535386B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
KR101984714B1 (ko) 가상화 자원 모니터링 시스템
US7568028B2 (en) Bottleneck detection system, measurement object server, bottleneck detection method and program
CN109144813B (zh) 一种云计算***服务器节点故障监控***及方法
CN102314391A (zh) 一种基于硬件基础工具监视虚拟化***性能的架构及方法
CN113535386B (zh) 一种应用于电力仪器设备的板间多运算芯片资源监控***
CN116244159B (zh) 一种训练时长预测方法、装置、多元异构计算设备及介质
CN108647137B (zh) 一种作业性能预测方法、装置、介质、设备及***
CN111985831A (zh) 云计算资源的调度方法、装置、计算机设备及存储介质
CN114816721A (zh) 一种基于边缘计算的多任务优化调度方法及***
CN1286429A (zh) 一种嵌入处理机内存的检测和监控方法
CN115373835A (zh) Flink集群的任务资源调整方法、装置及电子设备
CN111045912B (zh) 一种ai应用性能评估方法、装置及其相关设备
CN116723198A (zh) 一种多节点服务器主机控制方法、装置、设备、存储介质
CN115495231B (zh) 一种高并发任务复杂场景下的动态资源调度方法及***
CN112162518A (zh) 一种应用于电力仪器设备的单板多运算芯片算力监控***
CN116893900A (zh) 集群计算压力负载均衡方法、***、设备及ic设计平台
CN113688125B (zh) 基于人工智能的异常值检测方法、装置、电子设备及介质
CN111611167A (zh) 基于dsp的嵌入式软件测试方法与***
CN106844021B (zh) 计算环境资源管理***及其管理方法
CN111209102A (zh) 一种分布式任务分发方法与***
CN117234711B (zh) Flink***资源动态分配方法、***、设备及介质
CN112667614A (zh) 一种数据处理方法、装置及计算机设备
CN110597689A (zh) 一种基于zynq的健康管理平台的实现方法及***
CN216751819U (zh) 基于5g通讯技术的智能检测***
WO2023103627A1 (zh) 网络巡检的方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant