CN112598114B

CN112598114B - 功耗模型构建方法、功耗测量方法、装置和电子设备

Info

Publication number: CN112598114B
Application number: CN202011499533.0A
Authority: CN
Inventors: 徐祥俊; 黄维; 卢海平
Original assignee: Haiguang Information Technology Co Ltd
Current assignee: Haiguang Information Technology Co Ltd
Priority date: 2020-12-17
Filing date: 2020-12-17
Publication date: 2023-11-03
Anticipated expiration: 2040-12-17
Also published as: CN112598114A

Abstract

本申请提供了一种功耗模型构建方法、功耗测量方法、装置和电子设备，其中，该方法包括：根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，该第一功耗计算模型包括输入层、多层隐藏层和输出层；确定出该第一功耗计算模型中的该输出层连接的各项全互联权重；根据该输出层的各项全互联权重，将该第一功耗计算模型中的各个节点中全互联权重小于权值限定值的连接和对应的节点删除，以形成第二功耗计算模型；根据该训练数据集和该测试数据集对该第二功耗计算模型进行更新训练，以得到目标功耗计算模型，该目标功耗计算模型用于检测芯片的功耗。能够降低功耗检测对观测信号的依赖性。

Description

功耗模型构建方法、功耗测量方法、装置和电子设备

技术领域

本申请涉及芯片检测技术领域，具体而言，涉及一种功耗模型构建方法、功耗测量方法、装置和电子设备。

背景技术

随着集成电路的集成度不断提升，单位面积上晶体管的密度也就不断增加，导致芯片的功耗和散热问题越发突出。

而目前针对芯片的功耗的测量在技术上还存在一定的困难。一般是通过相关技术人员选取一些观测信号，通过在芯片运行时动态统计观测信号和时钟信号来评估整个芯片的动态功耗。上述芯片功耗的评估方式的准确度严重依赖于选取的观测信号的有效性。

发明内容

本申请的目的在于提供一种功耗模型构建方法、功耗测量方法、装置和电子设备，能够解决芯片的功耗计算依赖于观测信号的有效性的问题。

第一方面，本发明提供一种功耗模型构建方法，包括：

根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，所述第一功耗计算模型包括：多层结构，所述多层结构包括输出层，每一层结构包括多个节点；

确定出所述第一功耗计算模型中的所述输出层的各项全互联权重；

根据所述输出层的各项全互联权重，将所述第一功耗计算模型中的各层结构中的节点进行删减，以形成第二功耗计算模型；

根据所述训练数据集和所述测试数据集对所述第二功耗计算模型进行更新训练，以得到目标功耗计算模型，所述目标功耗计算模型用于检测芯片的功耗。

在可选的实施方式中，所述多层结构还包括：输入层、多层隐藏层；所述根据所述输出层的各项全互联权重，将所述第一功耗计算模型中的各层结构中的节点进行删减，以形成第二功耗计算模型，包括：

将所述输出层的全互联权重小于权值限定值的对应的输入连接线删除；

将目标隐藏层中不包含输出连接线的目标节点删除，所述目标隐藏层为与所述输出层相邻的隐藏层，所述目标隐藏层的输出连接线连接至所述输出层，为所述输出层的输入连接线；

将中间隐藏层和所述输入层中与所述目标节点连接的连接线删除，形成第二功耗计算模型，所述中间隐藏层为所述多层隐藏层中除所述目标隐藏层以外的隐藏层。

通过上述实施方式，可以降低功耗计算模型的复杂度，从而可以减少在进行功耗测量时，所需的计算量，提高功耗测量的效率。

在可选的实施方式中，所述方法还包括：

计算所述第一功耗计算模型中与所述输出层连接的目标隐藏层中各个节点的全互联权重的全互联权重均值；

根据所述全互联权重均值确定出所述权值限定值。

在可选的实施方式中，所述方法还包括：

对芯片的目标功能模块在第一数量的应用场景中进行仿真，以得到仿真数据；

将所述仿真数据分成所述训练数据集和所述测试数据集。

在上述实施方式中，通过对目标功能模块进行仿真得到训练数据集和测试数据集，可以确定出的训练数据集和测试数据集能够满足量的需求的同时，还能够相对更符合芯片的运行情况，提高对初始功耗计算模型训练的有效性。

在可选的实施方式中，目标功能模块包括第二数量的端口；所述初始功耗计算模型包括输入层、隐藏层和输出层；

所述输入层中包含所述第二数量的节点；

各层所述隐藏层包含所述第二数量的节点。

在可选的实施方式中，所述隐藏层包括：线性运算模块、池化运算模块和激活函数模块。

在上述实施方式中，通过上述结构的初始功耗计算模型，能够适应对目标功能模块的端口数据。

在可选的实施方式中，所述根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，包括：

使用所述训练数据集采用反向传播算法和批量梯度下降法对所述初始功耗计算模型中的各层结构中的节点的全互联权重进行计算，得到当前功耗计算模型；

根据所述当前功耗计算模型计算所述测试数据集中的各条测试数据对应的预测功耗数据；

计算所述预测功耗数据与所述测试数据对应的实际功耗数据的功耗误差；

当所述功耗误差大于或等于误差阈值时，使用所述训练数据集对所述当前功耗计算模型的各层结构中的节点的全互联权重进行计算，得到更新的当前功耗计算模型；

当所述功耗误差小于所述误差阈值时，将所述当前功耗计算模型作为所述第一功耗计算模型。

在上述实施方式中，通过上述流程对初始功耗计算模型进行训练，可以实现对初始功耗计算模型中的各项参数进行更新，以满足功耗测量的需求。

第二方面，本发明提供一种功耗测量方法，包括：

获取待检测芯片的状态数据；

将所述状态数据输入通过前述实施方式任意一项所述的方法确定的目标功耗计算模型进行计算，以得到所述待检测芯片的功耗。

第三方面，本发明提供一种功耗模型构建装置，包括：

第一训练模块，用于根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，所述第一功耗计算模型包括：多层结构，所述多层结构包括输出层、输入层以及多层隐藏层，所述多层结构中除所述输出层之外的每一层结构包括多个节点；

确定模块，用于确定出所述第一功耗计算模型中的所述输出层的各项全互联权重；

删除模块，用于将所述输出层的全互联权重小于权值限定值的对应的输入连接线删除；将目标隐藏层中不包含输出连接线的目标节点删除，所述目标隐藏层为与所述输出层相邻的隐藏层，所述目标隐藏层的输出连接线连接至所述输出层，为所述输出层的输入连接线；将中间隐藏层和所述输入层中与所述目标节点连接的连接线删除，形成第二功耗计算模型，所述中间隐藏层为所述多层隐藏层中除所述目标隐藏层以外的隐藏层；

第二训练模块，用于根据所述训练数据集和所述测试数据集对所述第二功耗计算模型进行更新训练，以得到目标功耗计算模型，所述目标功耗计算模型用于检测芯片的功耗。

第四方面，本发明提供一种功耗测量装置，包括：

获取模块，用于获取待检测芯片的状态数据；

计算模块，用于将所述状态数据输入前述实施方式任意一项所述的方法确定的目标功耗计算模型进行计算，以得到所述待检测芯片的功耗。

第五方面，本发明提供一种电子设备，包括：处理器、存储器，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述机器可读指令被所述处理器执行时执行如前述实施方式任一所述的方法的步骤。

第六方面，本发明提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如前述实施方式任一所述的方法的步骤。

本申请实施例的有益效果是：通过机器学习技术应用到芯片功耗的测量中，基于机器学习训练得到的功耗计算模型能够更高效地实现对芯片功耗的测量，且不需要依赖于技术人员的经验对观测信号的选取。进一步地，在训练功耗计算模型阶段还基于节点的全互联权重大小对第一功耗计算模型进行更新，缩小第一功耗计算模型中的节点数量，从而还可以进一步地减小功耗测量过程所需的计算量。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的电子设备的方框示意图。

图2为本申请实施例提供的功耗模型构建方法的流程图。

图3为本申请实施例提供的功耗模型构建方法中使用到的功耗计算模型的结构示意图。

图4为本申请实施例提供的功耗模型构建方法中使用到的功耗计算模型中的一层结构的结构示意图。

图5为本申请实施例提供的功耗模型构建装置的功能模块示意图。

图6为本申请实施例提供的功耗测量方法的流程图。

图7为本申请实施例提供的功耗测量装置的功能模块示意图。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行描述。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

现有芯片动态功耗估算技术主要通过设计人员依靠设计经验来选择已有信号作为观测信号用于评估动态功耗。经发明人对现有的功耗计算方式进行研究，了解到其中存在两大问题：1)现有的数字信号中未必一定存在适合评估动态功耗的观测信号；2)观测信号的选取只能依靠设计经验，缺乏选取和评判标准。

为了解决现有的芯片功耗评估方法的不足，本申请实施提供一种提出一种功耗模型构建方法和功耗测量方法，基于机器学习技术建立功能模块的端口信号状态和功能模块动态功耗之间的模型，根据功耗计算模型估算各个功能模块的动态功耗，进而得到整个芯片的动态功耗。下面通过几个实施例描述本申请的实现方式。

实施例一

为便于对本实施例进行理解，首先对执行本申请实施例所公开的功耗模型构建方法和功耗测量方法的电子设备进行详细介绍。

如图1所示，是电子设备的方框示意图。电子设备100可以包括存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115、显示单元116。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对电子设备100的结构造成限定。例如，电子设备100还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

上述的存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115及显示单元116各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。上述的处理器113用于执行存储器中存储的可执行模块。

其中，存储器111可以是，但不限于，随机存取存储器(Random Access Memory，简称RAM)，只读存储器(Read Only Memory，简称ROM)，可编程只读存储器(ProgrammableRead-Only Memory，简称PROM)，可擦除只读存储器(Erasable Programmable Read-OnlyMemory，简称EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory，简称EEPROM)等。其中，存储器111用于存储程序，所述处理器113在接收到执行指令后，执行所述程序，本申请实施例任一实施例揭示的过程定义的电子设备100所执行的方法可以应用于处理器113中，或者由处理器113实现。

上述的处理器113可能是一种集成电路芯片，具有信号的处理能力。上述的处理器113可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(digital signalprocessor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本实施例中的电子设备100可以用于执行本申请实施例提供的各个方法中的各个步骤。下面通过几个实施例详细描述功耗模型构建方法和功耗测量方法的实现过程。

实施例二

请参阅图2，是本申请实施例提供的功耗模型构建方法的流程图。下面将对图2所示的具体流程进行详细阐述。

步骤201，根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型。

本实施例中，第一功耗计算模型包括多层结构。该多层结构包括：输入层、多层隐藏层和输出层。所述多层结构中除所述输出层之外的每一层结构可以包括多个节点。

在一个实例中，如图3所示，第一功耗计算模型可以包括一层输入层，该输入层包括五个节点，分别为：L_1，1,L_1，2,L_1，3,L_1，4,L_1，5；两层隐藏层，每一层隐藏层的节点数与输入层的节点数相同，均为五个节点：L_2，1,L_2，2,L_2，3,L_2，4,L_2，5和L_3，1,L_3，2,L_3，3,L_3，4,L_3，5；一层输出层，该输出层包括一个节点L_4，1，且最后一层隐藏层中的所有节点均与该输出层的一个节点连接。在此实例中，每一层的所有节点均与相邻层的所有节点连接。

示例性地，隐藏层可以包括：线性运算模块、池化运算模块和激活函数模块。

示例性地，输入层也可以包括：线性运算模块、池化运算模块和激活函数模块。

在一个实例中，以每层网络包括五个节点为例，如图4所示，第n层网络结构与第n+1层网络结构的详细模块图连接图。图4所示的实例中，每个节点都包括三个模块的运算，线性运算、池化运算和激活函数。该第n+1层网络结构的五个节点中使用到的线性运算分别表示为：yw₁,yw₂,yw₃,yw₄,yw₅；五个节点中使用到的池化运算分别表示为：yp₁,yp₂,yp₃,yp₄,yp₅；五个节点中使用到的激活函数分别表示为：y₁,y₂,y₃,y₄,y₅；其中，x₁,x₂,x₃,x₄,x₅表示第n层网络结构的输出。

示例性地，线性运算的计算公式可以如下所示：

其中，yw_i表示线性运算模块中第i项线性运算的计算得到的输出值，w_i,j,n第n-1层网络结构的第j个节点的全互联权重值，x_j表示第n-1层网络结构的第j个节点的输出值，其中，x_j是长度为T_n-1的一维向量，表示为1的偏置分量，L_n-1表示第n-1层网络结构的节点数量。

可选地，池化层中的池化运算可以用于降低线性运算输出向量的长度。示例性地，该池化运算的计算公式可以如下所示：

A＝T_n-1/T_n；

其中，yp_i,j表示池化运算模块对应的第i项池化运算的计算得到的输出值。

示例性地，该激活函数的计算公式可以如下所示：

y_i＝1/(1+exp(-yp_i))；

其中，y_i表示激活函数模块对应的第i项激活函数的计算得到的输出值。

可选地，步骤201可以包括以下。

步骤2011，使用所述训练数据集采用反向传播算法和批量梯度下降法对所述初始功耗计算模型中的各层结构中的节点的全互联权重进行计算，得到当前功耗计算模型。

步骤2012，根据所述当前功耗计算模型计算所述测试数据集中的各条测试数据对应的预测功耗数据。

示例性地，可以分别将各条测试数据输入当前功耗计算模型中进行计算，以得到每一条测试数据的预测功耗数据。

可选地，测试数据集中的数据条数可以小于训练数据集中的数据条数。在一个实例中，若仿真得到了40000份数据，则可以将40000份数据随机分为30000份和10000份两部分，其中30000份仿真数据作为训练数据集用于训练模型，10000份仿真数据作为测试数据集用于测试模型。

步骤2013，计算所述预测功耗数据与所述测试数据对应的实际功耗数据的功耗误差。

可选地，该功耗误差可以等于预测功耗数据与实际功耗数据的差值。

步骤2014，当所述功耗误差大于或等于误差阈值时，使用所述训练数据集对所述当前功耗计算模型的各层结构中的节点的全互联权重进行计算，得到更新的当前功耗计算模型。

可选地，该误差阈值可以根据目标功能模块设定。

可选地，本实施例中用于训练模型的数据可以是通过仿真得到的。示例性地，本申请实施例提供的功耗模型构建方法还包括：对目标功能模块在第一数量的应用场景中进行仿真，以得到仿真数据；将所述仿真数据分成所述训练数据集和所述测试数据集。

可选地，目标功能模块包括第二数量的端口。初始功耗计算模型包括输入层、隐藏层和输出层。

初始功耗计算模型的输入层中包含所述第二数量的节点，初始功耗计算模型的各层所述隐藏层包含所述第二数量的节点。

在一个实例中，对目标功能模块M，从设计功能上确定需要进行仿真的应用场景C₁,C₂,...,C_N。其中，应用场景C₁,C₂,...,C_N能够覆盖目标功能模块的重要应用场景以及不同工作状态。

分别对目标功能模块的每个应用场景进行功耗仿真，对于每个应用场景仿真，以时间T为单位对仿真内容进行切割。可以分别获取每块切割后仿真内容中目标功能模块的每个端口信号在每一时刻的状态s_i,j,k(i＝1,2,...,C,j＝1,2,…,R,k＝1,2,…,T)和模块动态功耗P_i(i＝1,2,..,C)，其中R为目标功能模块的端口信号总比特数，C为目标功能模块的仿真数据的分块数量，T为目标功能模块的仿真时长。

在一个实例中，以目标功能模块为PCIE(peripheral component interconnectexpress，高速串行计算机扩展总线标准)控制器模块为例进行仿真。

其中，PCIE控制器模块的工作主要应用场景，可以包括：PCIE GEN1、PCIE GEN2、PCIE GEN3和PCIE GEN4，传输数据类型分为以大数据包为主、以小数据包为主和混合数据包三大类。根据应用场景和传输数据类型分别PCIE控制器模块进行功耗仿真。示例性地，该PCIE控制器模块工作频率设定在1GHz，以65.536微秒为单位切分仿真结果。例如，可以得到40000份仿真数据。由于时间单位为65.536微秒，模块工作时钟频率为1GHz，所以每份仿真数据记录了每个端口信号共65536个状态。

在上述实例中，PCIE控制器模块的端口信号总数为3000个，则初始功耗计算模型的网络层数可以为5，输入层和隐藏层的节点数可以为3000，输出层节点数为1的DNN(DeepNeural Network，深度神经网络)网络。

基于步骤201可以实现构建出能够实现对芯片的功耗进行测量的第一功耗计算模型。但是考虑到芯片的功能模块设计各异，模块端口信号数目也千差万别。例如，一些功能模块的端口信号数目可能相对较多，在功能模块的端口信号数目较大的情况下导致训练得到的第一功耗计算模型较为庞大，不易于硬件实现。因此，还可以对训练得到的第一功耗计算模型进行优化，删减与功能模块的动态功耗相关性不大的端口信号。

例如，在上述实例中PCIE控制器模块的端口信号有3000个，导致基于该实例确定出的第一功耗计算模型中节点数多达3000*4+1＝12001个，全互联权重w_i,j,n数据量则达到了(4-1)*(3000+1)*3000+3000+1，其中，每一层隐藏层的全互联权重的数量为(3000+1)*3000，输出层的全互联权重的数量为3000+1。该第一功耗计算模型对于硬件实现是一个巨大的负担，因此，可以进一步地优化第一功耗计算模型，减小功耗计算模型的规模。本实施例中，可以通过减少第一功耗计算模型的各层结构的节点数。

步骤202，确定出所述第一功耗计算模型中的所述输出层的各项全互联权重。

示例性地，可以从第一功耗计算模型输出层开始，对输出层的节点L_N,1的L_N-1+1个全互联权重w_i,j,N(j＝1,2,…,L_n-1+1)，计算均值we_1,N，找出w_1,j,N中所有全互联权重小于z*we_1,N的全互联权重。其中，z的取值可以按照需求设定。

步骤203，根据所述输出层的各项全互联权重，将所述第一功耗计算模型中的各层结构中的节点进行删减，以形成第二功耗计算模型。

可选地，步骤203可以包括：将所述输出层的全互联权重小于权值限定值的对应的输入连接线删除；将目标隐藏层中不包含输出连接线的目标节点删除；将中间隐藏层和所述输入层中与所述目标节点连接的连接线删除，形成第二功耗计算模型。

其中，上述的目标隐藏层为与所述输出层相邻的隐藏层。

其中，中间隐藏层为所述多层隐藏层中除所述目标隐藏层以外的隐藏层。

本实施例中，上述的输入连接线指前一层中的各个节点与当前层的各个节点的连接的连接线。例如，当前层是输出层时，输出层的输入连接线为最后一层隐藏层与该输出层的连接的连接线。

本实施例中，上述的输出连接线指当前层中的各个节点与后一层的各个节点的连接的连接线。例如，当前层是与输出层相邻隐藏层时，与输出层相邻隐藏层的输出连接线为该与输出层相邻隐藏层与该输出层的连接的连接线。

在一个实例中，输入层和隐藏层的节点可以都是五个节点，而确定输出层的第一项全互联权重和第三项全互联权重小于权值限定值，可以将输出层的第一输入连接线和第三输入连接线删除，该第一输入连接线为输出层与目标隐藏层的第一个节点的连接的连接线，第三输入连接线为输出层与目标隐藏层的第三个节点的连接的连接线，该目标隐藏层为与输出层相邻的一层结构。

进一步地，在上述实例中，由于第一输入连接线和第三输入连接线被删除，则目标隐藏层的第一个节点和第三个节点均不包含输出连接线，则可以将目标隐藏层的第一个节点和第三个节点删除。

进一步地，在上述实例中，所有与第一节点和第三节点的连接的连接线由于没有输出的目的节点，则也可以对应删除。

可选地，步骤203可以包括：将所述输出层的全互联权重小于权值限定值的对应的输入连接线删除；将第M层中不包含输出连接线的目标节点删除，所述目标隐藏层为与所述输出层相邻的隐藏层；将M-1层的各个节点与已删除节点的连接的连接线删除，形成第二功耗计算模型，其中，M为大于二的正整数，M+1等于第一功耗计算模型的网络层数。

可选地，可以先计算所述第一功耗计算模型中与所述输出层连接的目标隐藏层中各个节点的全互联权重的全互联权重均值，然后根据所述全互联权重均值确定出所述权值限定值。

步骤204，根据所述训练数据集和所述测试数据集对所述第二功耗计算模型进行更新训练，以得到目标功耗计算模型。

本实施例中，该目标功耗计算模型用于检测芯片的功耗。

以PCIE控制器模块为例，可以重复步骤202-步骤204，逐步缩减功耗计算模型中的各层网络结构中的节点数量，可以使得到的功耗计算模型的输入层仅剩余150个模块端口信号。以剩余的150个模块端口信号作为输入采用训练数据重新训练功耗计算模型，功耗计算模型的层数可以选定为5层，输入层和隐藏层节点数设为150，输出层节点数设为1，输入层和隐藏层池化参数A选择为16，输出层可以仅包括线性运算，不需要池化运算和非线性运算。当功耗计算模型的全互联权重w_i,j,n收敛后，采用测试数据检测模型，计算模型输出的动态功耗与功耗仿真动态功耗之间的误差，当最大误差e_max小于预设值时，则确定为目标功耗计算模型。示例性地，该预设值的取值可以是5％，当然，根据不同的需求该预设值的取值也可以不同，例如，该预设值也可以为3％、4％、6％等。

在本申请实施例提供的功耗模型构建方法中，通过机器学习技术应用到芯片功耗的测量中，基于机器学习训练得到的功耗计算模型能够更高效地实现对芯片功耗的测量，且不需要依赖于技术人员的经验对观测信号的选取。进一步地，在训练功耗计算模型阶段还基于节点的全互联权重大小对第一功耗计算模型进行更新，缩小第一功耗计算模型中的节点数量，从而还可以进一步地减小功耗测量过程所需的计算量。进一步地，通过本申请实施例提供的方法在建立目标功耗计算模型过程中不依赖于特定观测信号或者对设计功能的理解，并且模型有效性可以很好的进行量化评估。

实施例三

基于同一申请构思，本申请实施例中还提供了与功耗模型构建方法对应的功耗模型构建装置，由于本申请实施例中的装置解决问题的原理与前述的功耗模型构建方法实施例相似，因此本实施例中的装置的实施可以参见上述方法的实施例中的描述，重复之处不再赘述。

请参阅图5，是本申请实施例提供的功耗模型构建装置的功能模块示意图。本实施例中的功耗模型构建装置中的各个模块用于执行上述方法实施例中的各个步骤。功耗模型构建装置包括：第一训练模块301、确定模块302、删除模块303以及第二训练模块304；其中，

第一训练模块301，用于根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，所述第一功耗计算模型包括输入层、多层隐藏层和输出层；

确定模块302，用于根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，所述第一功耗计算模型包括：多层结构，所述多层结构包括输出层、输入层以及多层隐藏层，所述多层结构中除所述输出层之外的每一层结构包括多个节点；

删除模块303，用于将所述输出层的全互联权重小于权值限定值的对应的输入连接线删除；将目标隐藏层中不包含输出连接线的目标节点删除，所述目标隐藏层为与所述输出层相邻的隐藏层，所述目标隐藏层的输出连接线连接至所述输出层，为所述输出层的输入连接线；将中间隐藏层和所述输入层中与所述目标节点连接的连接线删除，形成第二功耗计算模型，所述中间隐藏层为所述多层隐藏层中除所述目标隐藏层以外的隐藏层；

第二训练模块304，用于根据所述训练数据集和所述测试数据集对所述第二功耗计算模型进行更新训练，以得到目标功耗计算模型，所述目标功耗计算模型用于检测芯片的功耗。

一种可能的实施方式中，本申请实施例提供的功耗模型构建装置还包括：

根据所述全互联权重均值确定出所述权值限定值。

仿真模块，用于对目标功能模块在第一数量的应用场景中进行仿真，以得到仿真数据；

划分模块，用于将所述仿真数据分成所述训练数据集和所述测试数据集。

一种可能的实施方式中，每个所述应用场景中包括第二数量的端口；所述初始功耗计算模型包括输入层、隐藏层和输出层；

所述输入层中包含所述第二数量的节点；

各层所述隐藏层包含所述第二数量的节点。

一种可能的实施方式中，所述隐藏层包括：线性运算模块、池化运算模块和激活函数模块。

一种可能的实施方式中，第一训练模块301，用于：

实施例四

请参阅图6，是本申请实施例提供的功耗测量方法的流程图。下面将对图6所示的具体流程进行详细阐述。

步骤401，获取待检测芯片的状态数据。

步骤402，将所述状态数据输入上述目标功耗计算模型进行计算，以得到所述待检测芯片的功耗。

通过本申请实施例提供的功耗测量方法，可以不需要依赖于观测信号就能够实现对芯片功耗的测量，且基于目标功耗计算模型对芯片的功耗进行计算，效率相对更高。

实施例五

基于同一申请构思，本申请实施例中还提供了与功耗测量方法对应的功耗测量装置，由于本申请实施例中的装置解决问题的原理与前述的功耗测量方法实施例相似，因此本实施例中的装置的实施可以参见上述方法的实施例中的描述，重复之处不再赘述。

请参阅图7，是本申请实施例提供的功耗测量装置的功能模块示意图。本实施例中的功耗测量装置中的各个模块用于执行上述方法实施例中的各个步骤。功耗测量装置包括获取模块501和计算模块502；其中，

获取模块501，用于获取待检测芯片的状态数据；

计算模块502，用于将所述状态数据输入上述目标功耗计算模型进行计算，以得到所述待检测芯片的功耗。

此外，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述的功耗模型构建方法或功耗测量方法的步骤。

本申请实施例所提供的功耗模型构建方法和功耗测量方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的功耗模型构建方法或功耗测量方法的步骤，具体可参见上述方法实施例，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种功耗模型构建方法，其特征在于，包括：

将所述仿真数据分成训练数据集和测试数据集；

根据所述训练数据集和所述测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，所述第一功耗计算模型包括：多层结构，所述多层结构包括输出层、输入层以及多层隐藏层，所述多层结构中除所述输出层之外的每一层结构包括多个节点；

将中间隐藏层和所述输入层中与所述目标节点连接的连接线删除，形成第二功耗计算模型，所述中间隐藏层为所述多层隐藏层中除所述目标隐藏层以外的隐藏层；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述全互联权重均值确定出所述权值限定值。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述仿真数据分成所述训练数据集和所述测试数据集。

4.根据权利要求3所述的方法，其特征在于，所述目标功能模块包括第二数量的端口；所述初始功耗计算模型包括输入层、隐藏层和输出层；

所述输入层中包含所述第二数量的节点；

各层所述隐藏层包含所述第二数量的节点。

5.根据权利要求4所述的方法，其特征在于，所述隐藏层包括：线性运算模块、池化运算模块和激活函数模块。

6.根据权利要求1所述的方法，其特征在于，所述根据训练数据集和测试数据集对初始功耗计算模型进行训练，以得到第一功耗计算模型，包括：

7.一种功耗测量方法，其特征在于，包括：

获取待检测芯片的状态数据；

将所述状态数据输入通过权利要求1-6任意一项所述的方法确定的目标功耗计算模型进行计算，以得到所述待检测芯片的功耗。

8.一种功耗模型构建装置，其特征在于，包括：

9.一种功耗测量装置，其特征在于，包括：

获取模块，用于获取待检测芯片的状态数据；

计算模块，用于将所述状态数据输入权利要求1-6任意一项所述的方法确定的目标功耗计算模型进行计算，以得到所述待检测芯片的功耗。

10.一种电子设备，其特征在于，包括：处理器、存储器，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法的步骤。

11.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至7任一所述的方法的步骤。