CN112764509B - 计算核、计算核温度调整方法、设备、介质、芯片和*** - Google Patents

计算核、计算核温度调整方法、设备、介质、芯片和*** Download PDF

Info

Publication number
CN112764509B
CN112764509B CN202110166064.9A CN202110166064A CN112764509B CN 112764509 B CN112764509 B CN 112764509B CN 202110166064 A CN202110166064 A CN 202110166064A CN 112764509 B CN112764509 B CN 112764509B
Authority
CN
China
Prior art keywords
temperature
operation unit
temperature control
core
working
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110166064.9A
Other languages
English (en)
Other versions
CN112764509A (zh
Inventor
何伟
沈杨书
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Lynxi Technology Co Ltd
Original Assignee
Beijing Lynxi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Lynxi Technology Co Ltd filed Critical Beijing Lynxi Technology Co Ltd
Priority to CN202110166064.9A priority Critical patent/CN112764509B/zh
Publication of CN112764509A publication Critical patent/CN112764509A/zh
Priority to PCT/CN2022/073713 priority patent/WO2022166679A1/zh
Application granted granted Critical
Publication of CN112764509B publication Critical patent/CN112764509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)
  • Microcomputers (AREA)

Abstract

本发明实施例公开了一种计算核、计算核温度调整方法、设备、介质、芯片和***。所述方法包括:计算核包括:相连的运算单元和温控单元;所述运算单元用于执行所述计算核的计算任务;所述温控单元用于调整所述运算单元的工作频率和/或工作时长,以调整所述运算单元的工作温度。本发明实施例可以调整局部芯片温度,提高芯片的处理效率。

Description

计算核、计算核温度调整方法、设备、介质、芯片和***
技术领域
本发明实施例涉及人工智能领域,尤其涉及一种计算核、计算核温度调整方法、设备、介质、芯片和***。
背景技术
近年来,随着人工智能相关应用和技术的飞速发展,对计算能力和功耗效率的要求日益提高,专用人工智能(Artificial Intelligence,AI)芯片来运行AI算法已经成为未来的趋势。
然而,相关技术中在众核芯片温度较高时,通过与众核芯片连接的时钟电路降低频率,以降低整个众核芯片上所有计算核的工作频率,从而降低整个众核芯片温度。在该方案中,由于众核芯片上所有计算核的工作频率整体下降,导致正常工作的众核芯片区域也不能按照正常的频率进行工作,影响正常工作的众核芯片区域的工作效率。
发明内容
本发明实施例提供一种计算核、计算核温度调整方法、设备、介质、芯片和***,可以调整局部芯片温度,提高芯片的处理效率。
第一方面,本发明实施例提供了一种计算核,包括:相连的运算单元和温控单元;
所述运算单元用于执行所述计算核的计算任务;
所述温控单元用于调整所述运算单元的工作频率和/或工作时长,以调整所述运算单元的工作温度。
第二方面,本发明实施例还提供了一种计算核温度调整方法,应用于如本发明实施例任一项所述的计算核,所述方法包括:
通过所述温控单元调整运算单元的工作频率和/或工作时长;
通过所述运算单元以调整后的工作频率和/或工作时长执行计算任务。
第三方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序所述处理器执行所述程序时实现如本发明实施例中任一所述的计算核温度调整方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的计算核温度调整方法。
第五方面,本发明实施例还提供了一种众核芯片,其特征在于,包括:至少一个如本发明实施例任一项所述的计算核;
所述计算核用于执行计算任务,所述计算核的温度预测值大于或等于第一温度值。
第六方面,本发明实施例还提供了一种芯片温控***,包括如本发明实施例所述的众核芯片、时钟电路和锁相环,所述众核芯片与所述锁相环相连,所述时钟电路与所述锁相环相连;
所述众核芯片用于执行计算任务;
所述时钟电路用于生成输出信号,并发送至所述锁相环;
所述锁相环用于接收所述输出信号,并调整成时钟信号,发送至所述众核芯片,以使所述众核芯片正常工作。
本发明实施例通过在计算核中配置运算单元和温控单元,温控单元用于调整运算单元的工作频率和/或工作时长,以调整运算单元的工作温度,可以针对计算核进行工作温度调整,解决了现有技术中只能调整整个芯片的温度,影响正常工作的芯片区域的工作效率的问题,实现针对性局部调整计算核的温度,在降低高温工作计算核的同时,可以兼顾避免影响正常温度工作的计算核,可以减少高温对芯片的损伤,并同时提高芯片的运算效率。
附图说明
图1是本发明实施例一中的一种计算核的结构示意图;
图2是本发明实施例一中的一种计算核的结构示意图;
图3是本发明实施例一中的一种计算核的结构示意图;
图4是本发明实施例一中的一种计算核的结构示意图;
图5是本发明实施例一中的一种计算核的结构示意图;
图6是本发明实施例一中的一种计算核的结构示意图;
图7是本发明实施例二中的一种计算核温度调整方法的流程图;
图8是本发明实施例二中的三种信号的示意图;
图9是本发明实施例三中的一种计算机设备的结构示意图;
图10是本发明实施例五中的一种众核芯片的结构示意图;
图11是本发明实施例五中的一种众核芯片的结构示意图;
图12是本发明实施例五中的一种众核芯片的结构示意图;
图13是本发明实施例六中的一种芯片温控***的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一中的一种计算核的结构示意图,本实施例可适用于在计算核工作时,调整计算核的工作温度的情况。如图1所示,本实施例的计算核100,包括:相连的运算单元101和温控单元102;运算单元101用于执行计算核100的计算任务;温控单元102用于调整运算单元101的工作频率和/或工作时长,以调整运算单元101的工作温度。
运算单元101用于执行计算任务,计算任务是指进行算数运算和/或逻辑运算的任务,例如,加、减、乘、除和矩阵运算等。运算单元101可以是指用于实现运算的集成电路。温控单元102用于控制运算单元101的工作温度,温控单元102向运算单元101输出时钟信号,并通过调整时钟信号的频率和/或配置不存在时钟信号的时长,以实现调整运算单元101的工作频率和/或工作时长,最终实现调整运算单元101的工作温度。温控单元102用于实现调整时钟信号频率的集成电路。其中,工作时长为一个周期内存在时钟信号的时长,存在时钟信号可以理解为时钟信号不为0。
本发明实施例中的计算核是众核芯片中的计算核,众核芯片包括多个计算核。在众核芯片中,采用本发明实施例提供的计算核,可以仅改变部分计算核的工作温度,可以避免部分计算核的工作温度过高,而改变整个芯片上所有计算核的工作温度,从而避免影响以正常温度工作的计算核。
本发明实施例通过在计算核中配置运算单元和温控单元,温控单元用于调整运算单元的工作频率和/或工作时长,以调整运算单元的工作温度,可以针对单一计算核进行工作温度调整,解决了现有技术中只能调整整个芯片的温度,影响正常工作的芯片区域的工作效率的问题,实现针对性局部调整计算核的温度,在降低高温工作计算核的同时,可以兼顾避免影响正常温度工作的计算核,可以减少高温对芯片的损伤,并同时提高芯片的运算效率。
可选的,如图2所示,计算核100还包括:时钟信号接口103;时钟信号接口103与温控单元102相连,温控单元102用于通过时钟信号接口103接收外部时钟信号,并根据时钟信号调整运算单元101的工作频率和/或工作时长。
时钟信号接口103分别与计算核100和外部时钟电路相连。其中,外部时钟电路是指芯片之外的时钟电路,外部时钟电路生成外部时钟信号,并发送至时钟信号接口103,该外部时钟信号用于对整片的工作频率进行整体控制,计算核100从时钟信号接口103接收外部时钟信号。时钟信号接口103具体与计算核100中的温控单元102相连,温控单元102接收到时钟信号,并对时钟信号进行处理,将处理后的时钟信号发送至运算单元101,运算单元101基于接收到的时钟信号正常工作,执行运算任务。对时钟信号的处理操作可以包括调整时钟信号频率和/或调整时钟信号为0的时长,调整时钟信号频率具体可以包括调整后的时钟信号的频率不变,相当于是直接转发外部时钟信号至运算单元101,或者调整时钟信号的频率发生变化,频率变高,运算单元101的工作温度升高;频率变低,运算单元101的工作温度降低。调整时钟信号为0的时长,可以包括调整后的时钟信号在一个周期的部分时长内(如前半段)不为0,相应的,运算单元在该部分时长工作;在该周期的剩余部分时长内(如后半段)为0,相应的,运算单元在该剩余部分时长不工作,以使运算单元由一直工作变为存在不工作的时间段,从而实现调整运算单元的工作时长。
现有的运算单元101可以直接获取外部时钟信号,并基于外部时钟信号执行运算任务,即芯片上所有计算核的工作频率均与外部时钟信号保持一致。而本发明实施例,通过在外部时钟信号到达运算单元101之前,经过温控单元102进行处理,可以精准控制时钟信号的频率,并将处理后的时钟信号发送至运算单元101,处理后的时钟信号决定运算单元101的工作频率和/或工作时长,运算单元101接收到的时钟信号实际是由温控单元102控制,从而,温控单元102精准控制运算单元101的工作频率和/或工作时长。
通过配置时钟信号接口与温控单元相连,以使温控单元通过时钟信号接口接收到时钟信号,并根据时钟信号,调整运算单元的工作频率和/或工作时长,可以在不改变整片工作频率和/或工作时长的情况下,调节单一计算核的工作频率和/或工作时长,精准控制运算单元的工作温度,从而实现在众核芯片中,精准控制局部核的工作温度。
可选的,如图3所示,温控单元101,包括:相连的信号生成单元104和逻辑操作单元105;信号生成单元104用于生成温控信号;逻辑操作单元105用于接收外部时钟信号和所述温控信号,并将所述温控信号与所述时钟信号进行逻辑操作,调整所述时钟信号的频率,并将调整后的时钟信号发送给运算单元102,以调整运算单元102的工作频率和/或工作时长。
信号生成单元可以生成温控信号,示例性的,信号生成单元可以是信号发生器。逻辑操作可以对时钟信号和温控信号进行逻辑操作。逻辑操作可以包括与逻辑操作和/或或逻辑操作。温控信号用于调整时钟信号的频率。示例性的,逻辑操作单元可以是逻辑电路。信号生成单元与逻辑操作单元相连,信号生成单元将生成的温控单元发送给该逻辑操作单元。逻辑操作单元还与时钟信号接口相连,逻辑操作单元通过时钟信号接口发送的外部时钟信号。
通过配置温控单元包括信号生成单元和逻辑操作单元可以精准对时钟信号进行调整,从而准确调整运算单元的工作频率和/或工作时长,同时仅通过信号生成单元和逻辑操作单元的结构实现对运算单元的工作频率和/或工作时长进行调整,可以降低运算单元的工作频率和/或工作时长调整成本,从而降低工作温度调整成本。
可选的,如图4所示,计算核100还包括:温度传感器106,用于测量运算单元102的实时温度;温度传感器106与温控单元101相连,用于向温控单元101发送实时温度,以使温控单元101根据所述实时温度判断是否调整运算单元102的工作温度。
温度传感器用于测量运算单元的实时温度。温度传感器与温控单元相连,温度传感器测量运算单元的实时温度,并发送给温控单元。示例性的,如果信号承载的实时温度大于等于温度阈值,此时温控单元确定需要调整运算单元的工作温度;如果信号承载的实时温度小于温度阈值,此时温控单元确定不需要调整运算单元的工作温度。温控单元根据实时温度,判断是否需要对运算单元的工作频率和/或工作时长进行调整,以及调整方向和调整数值等。
通过配置温度传感器,可以准确实时测量运算单元的温度,从而实时进行工作温度调整,提高温度调控的实时性和精准性。
可选的,如图5所示,运算单元102包括矩阵运算单元107和向量运算单元108;温控单元101与矩阵运算单元107相连,温控单元102用于调整矩阵运算单元107的工作频率和/或工作时长,以调整矩阵运算单元107的工作温度。
在计算核中,矩阵运算单元通常用于进行矩阵计算;向量运算单元用于进行向量计算。通常AI计算任务中存在大量的矩阵计算操作,以及存在较少的向量计算操作。从而,矩阵运算单元的运算量大于向量运算单元的运算量,相应的,矩阵运算单元的工作温度高于向量运算单元的工作温度。可以理解为,在计算核中,产生热量的主体结构是矩阵运算单元,控制住矩阵运算模块的工作频率和/或工作时长,就控制住了计算核的工作温度。
通过温控单元与矩阵运算单元相连,控制矩阵运算单元的工作频率和/或工作时长,以控制矩阵运算单元的工作温度,可以有效控制运算单元中最能产热的单元,从而有效控制整个运算单元的工作温度。
可选的,如图6所示,计算核100还包括:存储单元109和路由单元110;存储单元109分别与运算单元102、温控单元101和路由单元110相连,用于存储各单元的数据;路由单元110用于确定计算核100的传输数据的传输路线。
存储单元可以与计算核中包括的其他单元相连,用于存储计算核在运行过程中涉及到的输入数据、输出数据和中间数据等。具体可以存储相连的运算单元、温控单元和路由单元关联的数据。计算核与计算核之间传输数据,传输路线上的计算核对传输数据进行传输,路由单元用于规划计算核的传输路线,以及确定当前计算核针对传输数据的传输方向。
通过配置存储单元可以存储计算核关联的数据,提供存储功能,通过配置路由单元可以确定所属计算核的传输路线,提供路由功能,准确发送传输数据。
实施例二
图7为本发明实施例二中的一种计算核温度调整方法的流程图的示意图,本实施例可适用于推流服务器渲染图像,并将渲染的图像添加到视频流的情况,该方法可以由本发明实施例提供的计算核来执行。如图7所示,本实施例的方法具体包括:
S201,通过所述温控单元调整运算单元的工作频率和/或工作时长。
本发明实施例未详尽的描述可以参考前述内容。
S202,通过所述运算单元以调整后的工作频率和/或工作时长执行计算任务。
运算单元以调整后的工作功率执行计算任务,即以调整后的工作温度执行计算任务。
本发明实施例通过温控单元调整运算单元的工作频率和/或工作时长,同时通过运算单元以调整后的工作频率和/或工作时长执行计算任务,以实现调整运算单元的工作温度,可以针对单个计算核进行工作温度调整,可以实现针对性局部调整计算核的温度,在降低高温工作计算核的同时,可以兼顾避免影响正常温度工作的计算核,可以减少高温对芯片的损伤,并降低高温计算核的工作温度的同时,不降低正常温度计算核的工作频率,实现维持正常温度的计算核的工作效率,从而提高芯片的运算效率。
可选的,所述通过所述温控单元调整运算单元的工作频率和/或工作时长,包括:获取温度预测值;根据所述温度预测值、实时温度和温度阈值,通过所述温控单元调整运算单元的工作频率和/或工作时长。
温度预测值可以是指对运算单元在工作时的工作温度进行预测得到的温度值。温度预测值可以根据运算单元所执行的计算任务对应的应用程序的编译情况,预测运算单元的计算量,进而根据计算量计算温度预测值。温度预测值可以***运算单元的高温工作情况,并在温度还没有过高的时候预先调整运算单元的工作频率和/或工作时长,可以预防温度过高。
实时温度可以是指运算单元在当前时刻的温度,即运算单元的实时温度。实时温度可以表征运算单元的实时温度,并在温度过高时,及时调整运算单元的工作频率和/或工作时长,可以及时在温度过高时降低温度。
温度阈值用于根据温度预测值和/或实时温度,判断是否对运算单元进行工作频率和/或工作时长调整,即是否进行工作温度调整。
在存在温度预测值时,如果温度预测值大于等于温度阈值,则确定需要调整运算单元的工作频率和/或工作时长,温控单元确定生成温控信号;如果温度预测值小于温度阈值,则确定不需要调整运算单元的工作频率和/或工作时长,温控单元确定不生成温控信号。在存在实时温度时,如果实时温度大于等于温度阈值,则确定需要调整运算单元的工作频率和/或工作时长,温控单元确定生成温控信号;如果实时温度小于温度阈值,则确定不需要调整运算单元的工作频率和/或工作时长,温控单元确定不生成温控信号。
在同时存在温度预测值和实时温度时,如果温度预测值或实时温度大于等于温度阈值,则确定需要调整运算单元的工作频率和/或工作时长,温控单元确定生成温控信号;如果温度预测值且实时温度均小于温度阈值,则确定不需要调整运算单元的工作频率和/或工作时长,温控单元确定不生成温控信号。
通过配置温度预测值预防温度过高,通过配置实时温度,可以及时调整温度,提高温度调整的实时性,有效减少运算单元温度过高的情况,从而减少计算核的高温损失。
可选的,所述获取温度预测值,包括:获取所述运算单元的计算量预测值;根据所述计算量预测值,以及预设的计算量预测值和所述温度预测值之间的关系,计算温度预测值。
计算量预测值可以是指在运算单元执行计算任务过程中,预测计算任务的计算量。计算量预测值可以表示运算单元的计算能力。运算单元的计算量预测值获取方式,可以是统计运算单元的历史计算量确定,例如,运行运算单元执行任意计算任务,统计计算量,确定为计算量预测值。
计算量预测值和温度预测值之间的关系,可以是指描述计算量预测值和温度预测值之间的数值关系,用于根据计算量预测值,计算温度预测值。示例性的,计算量预测值和所述温度预测值之间的关系可以用预设公式表示,例如,y=Ax,y为温度预测值,x为计算量预测值,A为比例系数,A可以通过实验统计获取。此外,还可以根据具体情况确定计算量预测值和所述温度预测值之间的关系,对此,不作具体限制。
通过获取计算量预测值,以及计算量预测值和温度预测值之间的关系,计算温度预测值,可以准确计算得到温度预测值,及时调整运算单元的工作频率和/或工作时长,准确预防温度过高。
可选的,所述工作频率为时钟信号的频率;所述通过所述温控单元调整运算单元的工作频率和/或工作时长,包括:在检测到温度控制信号时,通过所述温控单元生成温控信号;通过所述温控单元将所述温控信号与所述时钟信号进行逻辑操作,调整所述时钟信号的频率。
运算单元将时钟信号的频率作为工作频率和/或工作时长。温控单元在检测到温度控制信号时,确定需要调整运算单元的工作频率和/或工作时长,生成温控信号,并将温控信号与时钟信号进行逻辑操作,例如,进行与操作。
检测到温度控制信号,可以包括:温度单元接收承载实时温度的信号,并提取实时温度;获取温度预测值,如果确定实时温度和/或温度预测值大于等于温度阈值,则确定检测到温度控制信号。温控单元未检测到温度控制信号,不生成温控信号。将逻辑操作得到的信号作为调整后的时钟信号发送给运算单元,从而运算单元的工作频率由时钟信号的频率调整成调整后的时钟信号的频率,实现对运算单元的工作频率和/或工作时长的调整。
实时温度和/或温度预测值大于等于温度阈值,生成频率小于时钟信号的频率的温控信号,将该温控信号和时钟信号进行与操作,得到调整后的时钟信号的频率小于调整前时钟信号的频率,以降低时钟信号的频率,从而降低运算单元的工作频率和/或工作时长,并降低运算单元的工作温度。
此外,如果需要提高时钟信号的频率,可以生成频率大于时钟信号的频率的温控信号,将该温控信号和时钟信号进行与操作,得到调整后的时钟信号的频率大于调整前时钟信号的频率,以提高时钟信号的频率,从而提高运算单元的工作频率和/或工作时长,并提高运算单元的工作温度。
在一个具体的例子中,如图8所示,时钟信号为频率较高的方波,第一周期包括多个周期方波信号,例如,10个周期的方波信号。温控信号为频率较低的方波,第一周期包括一个周期的方波信号。将时钟信号与温控信号进行与操作,得到调整后的时钟信号如图所示。由图8可知,第一周期包括一个周期的调整后的时钟信号。若第一周期为t,调整前的时钟信号为t的十分之一,调整后的时钟信号的周期为t,相应的,若第一周期的频率为第一频率,时钟信号的频率由10倍的第一频率降低为第一频率,实现降低时钟信号频率。或者,由图8可知,将第一周期均分为两半,调整后的时钟信号在第一周期前半段信号不为0,调整后的时钟信号在第一周期后半段信号为0。将调整后的时钟信号发送给运算单元,运算单元的工作频率和/或工作时长相应降低。
通过温控单元在检测到温度信号时生成温控信号,并与时钟信号进行逻辑操作,将得到的信号确定为调整后的时钟信号,以调整时钟信号的频率,可以针对性对运算单元进行频率调整,同时,通过温控信号与时钟信号逻辑操作实现对时钟信号进行频率调整,简化时钟信号频率的调整过程,加快时钟信号频率的调整效率。
实施例三
图9为本发明实施例三提供的一种计算机设备的结构示意图。图9示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图9显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,***存储器28,连接不同***组件(包括***存储器28和处理单元16)的总线18。计算机设备12可以是挂接在总线上的设备。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及***组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器28可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***34可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘运动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘运动器,以及对可移动非易失性光盘(例如紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM),数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘运动器。在这些情况下,每个运动器可以通过一个或者多个数据介质接口与总线18相连。***存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如***存储器28中,这样的程序模块42包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output,I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网(Wide Area Network,WAN)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图9中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备运动器、冗余处理单元、外部磁盘运动阵列、(Redundant Arrays of Inexpensive Disks,RAID)***、磁带运动器以及数据备份存储***等。
处理单元16通过运行存储在***存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的一种计算核温度调整方法。
实施例四
本发明实施例四提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有发明实施例提供的计算核温度调整方法:
也即,该程序被处理器执行时实现:通过所述温控单元调整运算单元的工作频率和/或工作时长;通过所述运算单元以调整后的工作频率和/或工作时长执行计算任务。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、只读存储器(Read OnlyMemory,ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、无线电频率(Radio Frequency,RF)等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括LAN或WAN——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
实施例五
图10为本发明实施例五中的一种众核芯片的结构示意图,本实施例可适用于在众核芯片工作时,调整局部计算核的工作温度的情况。如图1所示,本实施例的众核芯片400,包括:至少一个如本发明实施例任一项所述的计算核100。计算核100用于执行计算任务,计算核100的温度预测值大于或等于温度阈值。
众核(Many Core)芯片是由大量(未来将会是成百上千个)以及多种类的核心,以预设方式连接在一起,具备高性能并行处理能力的核心集合。
本发明实施例中的众核芯片可以针对单个计算核进行工作温度调整,可以实现针对性局部调整计算核的温度,在降低高温工作计算核的同时,可以兼顾避免影响正常温度工作的计算核,可以减少高温对芯片的损伤,并降低高温计算核的工作温度的同时,不降低正常温度计算核的工作频率和/或工作时长,实现维持正常温度的计算核的工作效率,从而提高芯片的运算效率。
可选的,如图11所示,众核芯片400还包括:温度传感器401;温度传感器401与至少一个计算核100相连,用于测量各相连的计算核100的实时温度。
温度传感器401可以是众核芯片400中各计算核100复用的温度传感器。图11所示的温度传感器401与众核芯片400中全部计算核100相连,此外,温度传感器401可以仅与众核芯片400中部分非全部的计算核100相连。需要说明的是,在计算核100内部可以配置温度传感器106,或者可以不再计算核内部配置106,或者可以不在计算核100内部配置温度传感器106,在众核芯片内配置温度传感器401,以使各计算核100复用一个温度传感器。或者还可以既在计算核100内部配置温度传感器106,同时在中俄和芯片内配置温度传感器401。根据需要进行选择配置。
通过配置温度传感器,可以准确实时测量计算核的温度,从而实时进行工作温度调整,提高温度调控的实时性和精准性。
可选的,如图12所示,众核芯片400还包括:至少一个计算核410;计算核410用于执行计算任务,计算核410的温度预测值小于温度阈值。
众核芯片400中包括可以调整工作温度的计算核100,还可以包括不能调整工作温度的计算核410。计算核410可以是指几乎工作在小于温度阈值的工作温度下的计算核,计算核410的工作温度几乎不会超过温度阈值,从而可以不需要进行温度调整。
通过在众核芯片中配置第二计算核,可以只针对工作温度过高的计算核配置工作温度调整功能,可以减少众核芯片的成本。
实施例六
图13为本发明实施例六中的一种芯片温控***的结构示意图,本实施例可适用于在众核芯片工作时,调整局部计算核的工作温度的情况。如图13所示,本实施例的芯片温控***500,包括:如本发明实施例任一项所述的众核芯片400、时钟电路501和锁相环502,众核芯片400与锁相环502相连,时钟电路501与锁相环502相连;众核芯片400用于执行计算任务;时钟电路501用于生成输出信号,并发送至锁相环502;锁相环502用于接收所述输出信号,并调整成时钟信号,发送至众核芯片400,以使众核芯片400正常工作。
时钟电路为直接生成信号的电路。锁相环用于对时钟电路生成的信号进行调整,以调整成目标频率的信号。通常时钟信号的频率是预设的,锁相环需要将时钟电路生成的不稳定的信号,稳定在目标频率,以得到固定频率的时钟信号,确保众核芯片中计算核正常工作。
锁相环输出的时钟信号用于调控各计算核的存储单元、路由单元和向量运算单元,即为各计算核的存储单元、路由单元和向量运算单元提供统一的时钟信号。部分计算核的矩阵运算单元不需要调整工作温度,同样直接由锁相环输出的时钟信号进行调控。部分计算核的矩阵运算单元需要进行工作温度调整,需要通过获取锁相环输出的时钟信号经过调整后的时钟信号进行工作。
本发明实施例中的芯片温控***中众核芯片可以针对单个计算核进行工作温度调整,可以实现针对性局部调整计算核的温度,在降低高温工作计算核的同时,可以兼顾避免影响正常温度工作的计算核,可以减少高温对芯片的损伤,并降低高温计算核的工作温度的同时,不降低正常温度计算核的工作频率和/或工作时长,实现维持正常温度的计算核的工作效率,从而提高芯片的运算效率。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (13)

1.一种计算核,其特征在于,包括:相连的运算单元和温控单元;
所述运算单元用于执行所述计算核的计算任务;
所述温控单元用于调整所述运算单元的工作频率和/或工作时长,以调整所述运算单元的工作温度;
所述计算核还包括:时钟信号接口;
所述时钟信号接口与所述温控单元相连,所述温控单元用于通过所述时钟信号接口接收外部时钟信号,并根据所述时钟信号调整所述运算单元的工作频率和/或工作时长;
所述温控单元,包括:相连的信号生成单元和逻辑操作单元;
所述信号生成单元用于生成温控信号;
所述逻辑操作单元用于接收外部时钟信号和所述温控信号,并将所述温控信号与所述时钟信号进行逻辑操作,调整所述时钟信号的频率,并将调整后的时钟信号发送给所述运算单元,以调整所述运算单元的工作频率和/或工作时长。
2.根据权利要求1所述的计算核,其特征在于,还包括:温度传感器,用于测量所述运算单元的实时温度;
所述温度传感器与所述温控单元相连,用于向所述温控单元发送所述实时温度,以使所述温控单元根据所述实时温度判断是否调整所述运算单元的工作温度。
3.根据权利要求1所述的计算核,其特征在于,所述运算单元包括矩阵运算单元和向量运算单元;
所述温控单元与所述矩阵运算单元相连,所述温控单元用于调整所述矩阵运算单元的工作频率和/或工作时长,以调整所述矩阵运算单元的工作温度。
4.根据权利要求1所述的计算核,其特征在于,还包括:存储单元和路由单元;
所述存储单元分别与所述运算单元、所述温控单元和所述路由单元相连,用于存储各单元的数据;
所述路由单元用于确定所述计算核的传输数据的传输路线。
5.一种计算核温度调整方法,其特征在于,应用于如权利要求1-4任一项所述的计算核,所述方法包括:
通过所述温控单元调整运算单元的工作频率和/或工作时长;
通过所述运算单元以调整后的工作频率和/或工作时长执行计算任务。
6.根据权利要求5所述的方法,其特征在于,所述通过所述温控单元调整运算单元的工作频率和/或工作时长,包括:
获取温度预测值;
根据所述温度预测值、实时温度和温度阈值,通过所述温控单元调整运算单元的工作频率和/或工作时长。
7.根据权利要求6所述的方法,其特征在于,所述获取温度预测值,包括:
获取所述运算单元的计算量预测值;
根据所述计算量预测值,以及预设的计算量预测值和所述温度预测值之间的关系,计算温度预测值。
8.根据权利要求5-7任一项所述的方法,其特征在于,所述工作频率为时钟信号的频率;
所述通过所述温控单元调整运算单元的工作频率和/或工作时长,包括:
在检测到温度控制信号时,通过所述温控单元生成温控信号;
通过所述温控单元将所述温控信号与所述时钟信号进行逻辑操作,调整所述时钟信号的频率。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求5-8中任一所述的计算核温度调整方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求5-8中任一所述的计算核温度调整方法。
11.一种众核芯片,其特征在于,包括:至少一个如权利要求1-4任一项所述的计算核;
所述计算核用于执行计算任务,所述计算核的温度预测值大于或等于第一温度值。
12.根据权利要求11所述的众核芯片,其特征在于,还包括:温度传感器;
所述温度传感器与至少一个所述计算核相连,用于测量各相连的计算核的实时温度。
13.一种芯片温控***,包括如权利要求11或12所述的众核芯片、时钟电路和锁相环,所述众核芯片与所述锁相环相连,所述时钟电路与所述锁相环相连;
所述众核芯片用于执行计算任务;
所述时钟电路用于生成输出信号,并发送至所述锁相环;
所述锁相环用于接收所述输出信号,并调整成时钟信号,发送至所述众核芯片,以使所述众核芯片正常工作。
CN202110166064.9A 2021-02-03 2021-02-03 计算核、计算核温度调整方法、设备、介质、芯片和*** Active CN112764509B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110166064.9A CN112764509B (zh) 2021-02-03 2021-02-03 计算核、计算核温度调整方法、设备、介质、芯片和***
PCT/CN2022/073713 WO2022166679A1 (zh) 2021-02-03 2022-01-25 计算核、计算核温度调整方法、设备、介质、芯片和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110166064.9A CN112764509B (zh) 2021-02-03 2021-02-03 计算核、计算核温度调整方法、设备、介质、芯片和***

Publications (2)

Publication Number Publication Date
CN112764509A CN112764509A (zh) 2021-05-07
CN112764509B true CN112764509B (zh) 2024-03-01

Family

ID=75705258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110166064.9A Active CN112764509B (zh) 2021-02-03 2021-02-03 计算核、计算核温度调整方法、设备、介质、芯片和***

Country Status (2)

Country Link
CN (1) CN112764509B (zh)
WO (1) WO2022166679A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112764509B (zh) * 2021-02-03 2024-03-01 北京灵汐科技有限公司 计算核、计算核温度调整方法、设备、介质、芯片和***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952846A (zh) * 2005-10-17 2007-04-25 鸿富锦精密工业(深圳)有限公司 中央处理器被动式降温控制***及方法
CN103189814A (zh) * 2010-10-29 2013-07-03 超威半导体公司 用于处理节点的热控制的方法和装置
KR101621655B1 (ko) * 2015-04-27 2016-05-17 성균관대학교산학협력단 반도체 장치를 위한 실시간 온도 예측 장치 및 방법
CN106537285A (zh) * 2014-08-15 2017-03-22 英特尔公司 处理器温度的平衡控制
CN111308329A (zh) * 2020-03-20 2020-06-19 深圳芯行科技有限公司 用于众核计算芯片可测性设计的电路、装置及方法
CN112068957A (zh) * 2020-08-27 2020-12-11 北京灵汐科技有限公司 资源分配方法、装置、计算机设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9946327B2 (en) * 2015-02-19 2018-04-17 Qualcomm Incorporated Thermal mitigation with power duty cycle
KR102603299B1 (ko) * 2017-12-08 2023-11-17 한국전자통신연구원 그래픽 처리 장치 및 이의 동작 방법
CN109101392A (zh) * 2018-07-04 2018-12-28 杭州嘉楠耘智信息科技有限公司 一种智能化计算装置及其故障排除方法
CN109947620A (zh) * 2019-03-11 2019-06-28 上海肇观电子科技有限公司 一种多核处理器的运行方法、装置及计算机可读存储介质
CN110687990A (zh) * 2019-10-08 2020-01-14 展讯半导体(成都)有限公司 温度校准装置及数字货币矿机
CN112764509B (zh) * 2021-02-03 2024-03-01 北京灵汐科技有限公司 计算核、计算核温度调整方法、设备、介质、芯片和***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1952846A (zh) * 2005-10-17 2007-04-25 鸿富锦精密工业(深圳)有限公司 中央处理器被动式降温控制***及方法
CN103189814A (zh) * 2010-10-29 2013-07-03 超威半导体公司 用于处理节点的热控制的方法和装置
CN106537285A (zh) * 2014-08-15 2017-03-22 英特尔公司 处理器温度的平衡控制
KR101621655B1 (ko) * 2015-04-27 2016-05-17 성균관대학교산학협력단 반도체 장치를 위한 실시간 온도 예측 장치 및 방법
CN111308329A (zh) * 2020-03-20 2020-06-19 深圳芯行科技有限公司 用于众核计算芯片可测性设计的电路、装置及方法
CN112068957A (zh) * 2020-08-27 2020-12-11 北京灵汐科技有限公司 资源分配方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
WO2022166679A1 (zh) 2022-08-11
CN112764509A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
US10067805B2 (en) Technologies for offloading and on-loading data for processor/coprocessor arrangements
US10732684B2 (en) Method and apparatus for managing global chip power on a multicore system on chip
Singla et al. Predictive dynamic thermal and power management for heterogeneous mobile platforms
US9348664B2 (en) Acceleration prediction in hybrid systems
US7069189B2 (en) Method and apparatus for controlling multiple resources using thermal related parameters
CN111738446A (zh) 深度学习推理引擎的调度方法、装置、设备和介质
US11036277B2 (en) Methods and apparatus to dynamically throttle compute engines
CN115269108A (zh) 一种数据处理方法、装置及设备
CN112764509B (zh) 计算核、计算核温度调整方法、设备、介质、芯片和***
CN111859775A (zh) 加速深度学习推断的软硬件协同设计
CN114500339A (zh) 一种节点带宽监测方法、装置、电子设备及存储介质
US11354163B2 (en) Virtual machine placement method and virtual machine placement device implementing the same
CN116627237B (zh) 一种基于芯粒Chiplet的电源管理芯片架构***
WO2019153188A1 (en) Gpu power modeling using system performance data
Chen et al. Quality optimization of adaptive applications via deep reinforcement learning in energy harvesting edge devices
US11740597B2 (en) Semiconductor device and prediction method for resource usage in semiconductor device
US11966786B2 (en) Proxy-based instruction throttling control
CN118113561B (zh) 一种通过动态和静态信息融合的gpu能源效率优化方法
US10417050B2 (en) Apparatus and method to control calculation resources of an information processing device based on predictive values of reference data
Xie et al. TrainBF: High-Performance DNN Training Engine Using BFloat16 on AI Accelerators
CN118113561A (zh) 一种通过动态和静态信息融合的gpu能源效率优化方法
WO2024142349A1 (ja) Uncore周波数制御装置、Uncore周波数制御方法、および、Uncore周波数制御プログラム
CN118349098A (zh) 一种动态电压频率调整装置、相关方法及存储介质
JP6239210B1 (ja) 制御装置、機器および制御プログラム
CN116136816A (zh) 资源调度方法、资源调度装置、存储介质与电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant