WO2024125525A1

WO2024125525A1 - Ai算力上报方法、终端及网络侧设备

Info

Publication number: WO2024125525A1
Application number: PCT/CN2023/138240
Authority: WO
Inventors: 杨昂; 孙鹏
Original assignee: 维沃移动通信有限公司
Priority date: 2022-12-15
Filing date: 2023-12-12
Publication date: 2024-06-20
Also published as: CN118214750A

Abstract

本申请公开了一种AI算力上报方法、终端及网络侧设备，属于通信技术领域，本申请实施例的AI算力上报方法包括：终端获取第一AI算力信息；所述终端向所述网络侧设备发送所述第一AI算力信息；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。

Description

AI算力上报方法、终端及网络侧设备

相关申请的交叉引用

本申请主张在2022年12月15日在中国提交的申请号为202211616288.6的中国专利的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于通信技术领域，具体涉及一种AI算力上报方法、终端及网络侧设备。

背景技术

目前，人工智能(Artificial Intelligence，AI)技术在多个领域获得了广泛的应用，将人工智能融入无线通信网络，显著提升吞吐量、时延以及用户容量等技术指标是未来的无线通信网络的重要任务。

相关技术中，网络侧可以指示用户设备(User Equipment，UE)使用特定的AI模型。

但是，网络侧无法准确估计UE剩余AI算力，导致UE AI算力的利用率较低，影响通信***的性能。

发明内容

本申请实施例提供一种AI算力上报方法、终端及网络侧设备，能够提高通信***的性能。

第一方面，提供了一种AI算力上报方法，该方法包括：

终端获取第一AI算力信息；

所述终端向网络侧设备发送所述第一AI算力信息；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。

第二方面，提供了一种AI算力上报方法，该方法包括：

网络侧设备接收终端发送的第一AI算力信息；

所述网络侧设备基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示所述网络侧设备估计的所述终端剩余的AI模型计算资源；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。

第三方面，提供了一种AI算力上报装置，该装置包括：

第一获取模块，用于获取第一AI算力信息；

发送模块，用于向网络侧设备发送所述第一AI算力信息；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。

第四方面，提供了一种AI算力上报装置，该装置包括：

接收模块，用于接收终端发送的第一AI算力信息；

第二获取模块，用于基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示网络侧设备估计的所述终端剩余的AI模型计算资源；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。

第五方面，提供了一种终端，该终端包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第六方面，提供了一种终端，包括处理器及通信接口；其中，所述处理器用于：获取第一AI算力信息，所述通信接口用于：向网络侧设备发送所述第一AI算力信息；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。

第七方面，提供了一种网络侧设备，该网络侧设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第二方面所述的方法的步骤。

第八方面，提供了一种网络侧设备，包括处理器及通信接口；其中，所述通信接口用于：接收终端发送的第一AI算力信息，所述处理器用于：基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示网络侧设备估计的所述终端剩余的AI模型计算资源；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。

第九方面，提供了一种AI算力上报***，包括：终端及网络侧设备，所述终端可用于执行如第一方面所述的方法的步骤，所述网络侧设备可用于执行如第二方面所述的方法的步骤。

第十方面，提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤，或者实现如第二方面所述的方法的步骤。

第十一方面，提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法，或实现如第二方面所述的方法。

第十二方面，提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤，或者实现如第二方面所述的方法的步骤。

在本申请实施例中，终端通过获取当前剩余的可用于AI模型相关操作的AI模型计算资源，即第一AI算力信息，然后向网络侧设备上报终端的第一AI算力信息，使得网络侧设备获得准确的终端剩余算力，从而网络侧设备可以基于准确的终端剩余算力进行AI配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

附图说明

图1是本申请实施例可应用的无线通信***的示意图；

图2是本申请实施例提供的神经网络的结构示意图；

图3是本申请实施例提供的神经元的计算逻辑示意图；

图4是本申请实施例提供的AI算力上报方法的流程示意图之一；

图5是本申请实施例提供的AI算力上报方法的流程示意图之二；

图6是本申请实施例提供的AI算力上报方法的信令交互示意图；

图7是本申请实施例提供的AI算力上报装置的结构示意图之一；

图8是本申请实施例提供的AI算力上报装置的结构示意图之二；

图9是本申请实施例提供的通信设备的结构示意图；

图10是本申请实施例提供的终端的结构示意图；

图11是本申请实施例提供的网络侧设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。本申请的说明书和权利要求书中的术语“指示”既可以是一个明确的指示，也可以是一个隐含的指示。其中，明确的指示可以理解为，发送方在发送的指示中明确告知了接收方需要执行的操作或请求结果；隐含的指示可以理解为，接收方根据发送方发送的指示进行判断，根据判断结果确定需要执行的操作或请求结果。

值得指出的是，本申请实施例所描述的技术不限于长期演进型(Long Term Evolution，LTE)/LTE的演进(LTE-Advanced，LTE-A)***，还可用于其他无线通信***，诸如码分多址(Code Division Multiple Access，CDMA)、时分多址(Time Division Multiple Access，TDMA)、频分多址(Frequency Division Multiple Access，FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access，OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access，SC-FDMA)和其他***。本申请实施例中的术语“***”和“网络”常被可互换地使用，所描述的技术既可用于以上提及的***和无线电技术，也可用于其他***和无线电技术。以下描述出于示例目的描述了新空口(New Radio，NR)***，并且在以下大部分描述中使用NR术语，但是这些技术也可应用于NR***应用以外的通信***，如第6代(6^th Generation，6G)通信***。

图1是本申请实施例可应用的无线通信***的示意图，图1示出的无线通信***包括终端11和网络侧设备12。其中，终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal Digital Assistant，PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personal computer，UMPC)、移动上网装置(Mobile Internet Device，MID)、增强现实(augmented reality，AR)/虚拟现实(virtual reality，VR)设备、机器人、可穿戴式设备(Wearable Device)、车载设备(VUE)、行人终端(PUE)、智能家居(具有无线通信功能的家居设备，如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer，PC)、柜员机或者自助机等终端侧设备，可穿戴式设备包括：智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。除了上述终端设备，终端11也可以是终端内的芯片，例如调制解调器(Modem)芯片，***级芯片(System on Chip，SoC)。需要说明的是，在本申请实施例并不限定终端11的具体类型。

网络侧设备12可以包括接入网设备或核心网设备，其中，接入网设备也可以称为无线接入网设备、无线接入网(Radio Access Network，RAN)、无线接入网功能或无线接入网单元。接入网设备可以包括基站、WLAN接入点或WiFi节点等，基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station，BTS)、无线电基站、无线电收发机、基本服务集(Basic Service Set，BSS)、扩展服务集(Extended Service Set，ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point，TRP)或所述领域中其他某个合适的术语，只要达到相同的技术效果，所述基站不限于特定技术词汇，需要说明的是，在本申请实施例中仅以NR***中的基站为例进行介绍，并不限定基站的具体类型。核心网设备可以包含但不限于如下至少一项：核心网节点、核心网功能、移动管理实体(Mobility Management Entity，MME)、接入移动管理功能(Access and Mobility Management Function，AMF)、会话管理功能(Session Management Function，SMF)、用户平面功能(User Plane Function，UPF)、策略控制功能(Policy Control Function，PCF)、策略与计费规则功能单元(Policy and Charging Rules Function，PCRF)、边缘应用服务发现功能(Edge Application Server Discovery Function，EASDF)、统一数据管理(Unified Data Management，UDM)，统一数据仓储(Unified Data Repository，UDR)、归属用户服务器(Home Subscriber Server，HSS)、集中式网络配置(Centralized network configuration，CNC)、网络存储功能(Network Repository Function，NRF)，网络开放功能(Network Exposure Function，NEF)、本地NEF(Local NEF，或L-NEF)、绑定支持功能(Binding Support Function，BSF)、应用功能(Application Function，AF)、位置管理功能(location manage function，LMF)、增强服务移动定位中心(Enhanced Serving Mobile Location Centre，E-SMLC)、网络数据分析功能(network data analytics function，NWDAF)等。需要说明的是，在本申请实施例中仅以NR***中的核心网设备为例进行介绍，并不限定核心网设备的具体类型。

为了便于更加清晰地理解本申请各实施例提供的技术方案，首先对一些相关的背景知识进行如下介绍。

人工智能(AI)

人工智能(AI)目前在各个领域获得了广泛的应用，将人工智能融入无线通信网络，显著提升吞吐量、时延以及用户容量等技术指标是未来的无线通信网络的重要任务。AI模块有多种实现方式，例如神经网络、决策树、支持向量机、贝叶斯分类器等。本申请以神经网络为例进行说明，但是并不限定AI模块的具体类型。

图2是本申请实施例提供的神经网络的结构示意图，如图2所示，一个神经网络包括输入层、隐层及输出层；其中，X₁、X₂、X_n为神经网络的输入，Y为神经网络的输出。

其中，神经网络由神经元组成，图3是本申请实施例提供的神经元的计算逻辑示意图，如图3所示，a₁、a_k、a_K为输入，w₁、w_k、w_K为权值(乘性系数)，b为偏置(加性系数)，σ(z)为激活函数。常见的激活函数包括Sigmoid、tanh、线性整流函数(又称修正线性单元(Rectified Linear Unit，ReLU))等等；z可以通过以下公式(1)表示：
z＝a₁w₁+...+a_kw_k+...+a_Kw_K+b (1)

神经网络的参数通过梯度优化算法进行优化。梯度优化算法是一类最小化或者最大化目标函数(有时候也叫损失函数)的算法，而目标函数往往是模型参数和数据的数学组合。

例如给定数据X和其对应的标签Y，我们构建一个神经网络模型f(.)，有了模型后，根据输入X就可以得到预测输出f(x)，并且可以计算出预测值和真实值之间的差距(f(x)-Y)，这个就是损失函数。我们的目的是找到合适的w、b使上述的损失函数的值达到最小，损失值越小，则说明我们的模型越接近于真实情况。

目前常见的优化算法，基本都是基于误差反向传播(error Back Propagation，BP)算法。BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时，输入样本从输入层传入，经各隐层逐层处理后，传向输出层。若输出层的实际输出与期望的输出不符，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程，是周而复始地进行的。权值不断调整的过程，也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度，或进行到预先设定的学习次数为止。

常见的优化算法有梯度下降(Gradient Descent)、随机梯度下降(Stochastic Gradient Descent，SGD)、小批量梯度下降(mini-batch gradient descent)、动量法(Momentum)、带动量的随机梯度下降(Nesterov)、自适应梯度下降(ADAptive GRADient descent，Adagrad)、Adadelta、均方根误差降速(root mean square prop，RMSprop)、自适应动量估计(Adaptive Moment Estimation，Adam)等。

这些优化算法在误差反向传播时，都是根据损失函数得到的误差/损失，对当前神经元求导数/偏导，加上学习速率、之前的梯度/导数/偏导等影响，得到梯度，将梯度传给上一层。

相关技术中，网络侧可以指示UE使用特定的AI模型。但是，目前尚无UE上报自己剩余AI算力的方法，导致网络侧无法准确估计UE剩余AI算力。如果网络侧估计的UE剩余算力多于实际，则网络侧指示UE使用过于复杂的AI模型，造成UE无法正常运行AI模型；如果网络侧估计的UE剩余算力低于实际，则网络侧指示UE使用过于简单的AI模型，造成UE AI算力的浪费。也就是说，网络侧无法准确估计UE剩余AI算力，导致UE AI算力的利用率较低，影响通信***的性能。

综上所述，针对上述存在的问题，本申请实施例提供了一种AI算力上报方法、终端及网络侧设备，能够提高通信***的性能。

图4是本申请实施例提供的AI算力上报方法的流程示意图之一，如图4所示，该方法包括步骤401-402；其中：

步骤401、终端获取第一AI算力信息；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。

需要说明的是，本申请实施例可应用于基于AI模型进行通信的场景中。所述终端包括但不限于上述所列举的终端11的类型；网络侧设备包括但不限于上述所列举的网络侧设备12的类型；本申请对此并不限定。

由于网络侧设备无法准确估计终端剩余AI算力，导致终端AI算力的利用率较低，影响通信***的性能；因此，为了提升终端AI算力的利用率，提升通信***的性能，在本实施例中，首先终端需要获取第一AI算力信息。

可选地，所述第一AI算力信息包括M个AI unit算力单元，M为整数或小数；每个AI unit用于指示N1个计算资源单位，N1为正整数或小数。

AI unit算力单元是指衡量AI模型计算资源的单元，其中，AI模型计算资源例如是AI模型的运算次数。

可选地，所述计算资源单位，包括以下至少一项：

a)单次操作(operation，OP)的运算次数；

b)万亿操作(Trillion operation，TOP)的运算次数；

c)浮点操作(FLoating point Operation，FLOP)的运算次数；或者每秒浮点操作(FLoating point Operations per second，FLOPS)的运算次数；

d)内存访问成本(Memory Access Cost，MAC)；

e)乘加数操作(multiply-accumulate operation，MACC)的运算次数。

可选地，所述AI unit的定义满足以下至少一项：

a)由协议约定；

b)由所述终端定义；

c)由所述网络侧设备配置。

其中，所述AI unit的定义包括：N1的取值，和/或，计算资源单位的类型。

步骤402、所述终端向网络侧设备发送所述第一AI算力信息。

在本实施例中，终端需要将获取到的第一AI算力信息发送至网络侧设备。相应地，网络侧设备接收到第一AI算力信息之后，需要基于第一AI算力信息，获取终端对应的第二AI算力信息；其中，第二AI算力信息用于指示网络侧设备估计的终端剩余的AI模型计算资源。

也就是说，网络侧设备基于终端发送的第一AI算力信息，可以实时估计出终端剩余的AI模型计算资源，从而可以基于终端剩余的AI模型计算资源为终端下发，或者向终端指示合适的第一AI模型。

在本申请实施例提供的AI算力上报方法中，终端通过获取当前剩余的可用于AI模型相关操作的AI模型计算资源，即第一AI算力信息，然后向网络侧设备上报终端的第一AI算力信息，使得网络侧设备获得准确的终端剩余算力，从而网络侧设备可以基于准确的终端剩余算力进行AI配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

可选地，所述终端获取第一AI算力信息，可以通过以下任一种方式实现：

方式1、所述终端基于终端配置信息，确定所述第一AI算力信息。

在实际应用中，在终端配置信息中预配置有终端的第一AI算力信息，终端可以直接从终端配置信息中获取第一AI算力信息。

方式2、所述终端基于终端配置信息及已占用AI算力信息，确定所述第一AI算力信息。

在实际应用中，在终端当前已占用AI算力信息的情况下，可以用终端配置信息中预配置的总AI算力信息减去已占用AI算力信息，进而得到第一AI算力信息。

可选地，在所述AI模型的模型配置信息或关联信息中，包括所述AI模型占用的AI unit的数目；所述AI模型占用的AI unit的数目，由所述AI模型的计算复杂度换算得到。

在本实施例中，在AI模型注册、AI模型配置、AI模型传输及AI模型传递时，AI模型的模型配置信息或关联信息中，包括AI模型占用的AI unit的数目；其中AI模型占用的AI unit的数目，由AI模型的计算复杂度换算得到。

例如，一个AI unit用于指示5 TOP的运算次数，一个AI模型的计算复杂度为15 TOP的运算次数，则AI模型占用的AI unit为15 TOP的运算次数除以5 TOP的运算次数，即AI模型占用3个AI unit。

可选地，所述AI模型的计算复杂度为N2个计算资源单位，N2为正整数或小数；

AI模型的计算复杂度通过AI模型占用的AI unit的数目来衡量，而每个AI unit用于指示N1个计算资源单位；因此，AI模型的计算复杂度可以用N2个计算资源单位来表示。

所述AI模型占用的AI unit的数目，由以下任一种方式得到：

方式1、在M为小数的情况下，计算N2除以N1，得到所述AI模型占用的AI unit的数目。

例如，一个AI unit用于指示4 TOP的运算次数，一个AI模型的计算复杂度为15 TOP的运算次数，则AI模型占用的AI unit为15 TOP的运算次数除以4 TOP的运算次数，即AI模型占用3.75个AI unit。

方式2、在M为整数的情况下，计算N2除以N1，将计算得到的商进行向上取整或近似取整，得到所述AI模型占用的AI unit的数目。

例如，一个AI unit用于指示10 TOP的运算次数，一个AI模型的计算复杂度为23 TOP的运算次数，则AI模型占用的AI unit为23 TOP的运算次数除以10 TOP的运算次数，然后将计算得到的商进行向上取整，即AI模型占用3个AI unit；或者将计算得到的商进行近似取整，即AI模型占用的2个AI unit。

在上述实施方式中，通过AI模型占用的AI unit的数目来表示AI模型的计算复杂度，可以使终端可以基于AI unit的数目，准确的将当前剩余的可用于AI模型相关操作的AI模型计算资源发送至网络侧设备，使得网络侧设备获得准确的终端剩余算力。

可选地，所述终端向网络侧设备发送所述第一AI算力信息，具体可以通过以下步骤实现：

所述终端在向所述网络侧设备上报所述终端的AI能力信息的过程中，向所述网络侧设备发送所述第一AI算力信息。

也就是说，终端在向网络侧设备上报自己的AI能力时，同时上报/携带自己总的AI unit算力单元。

可选地，所述AI模型计算资源用于以下至少一项AI模型相关操作：

a)基于AI模型的信号处理；

具体地，基于AI模型的信号处理包括信号检测、滤波、均衡等；其中，信号包括解调参考信号(Demodulation Reference Signal，DMRS)、探测参考信号(Sounding Reference Signal，SRS)、同步信号块(Synchronization Signal Block，SSB)、跟踪参考信号(Tracking Reference Signal，TRS)、相位跟踪参考信号(Phase-Tracking Reference Signals，PTRS)、信道状态信息参考信号(Channel State Information-Reference Signal，CSI-RS)等。

b)基于AI模型的信号传输/接收/解调/发送；

具体地，信号传输/接收/解调/发送所包括的信道例如可以是：物理下行控制信道(Physical downlink control channel，PDCCH)、物理下行共享信道(Physical downlink shared channel，PDSCH)、物理上行控制信道(Physical Uplink Control Channel，PUCCH)、物理上行共享信道(Physical Uplink Shared Channel，PUSCH)、物理随机接入信道(Physical Random Access Channel，PRACH)、物理广播信道(Physical broadcast channel，PBCH)等。

c)基于AI模型的信道状态信息获取；包括：

信道状态信息反馈，包括信道相关信息、信道矩阵相关信息、信道特征信息、信道矩阵特征信息、预编码矩阵指示(Precoding matrix indicator，PMI)、秩指示(Rank indicator，RI)、CSI-RS资源指示(CSI-RS Resource Indicator，CRI)、信道质量指示(Channel quality indicator，CQI)、层指示(Layer Indicator，LI)等。

FDD上下行部分互易性。对于频分双工(Frequency Division Duplexing，FDD)***，根据部分互异性，基站根据上行信道获取角度和时延信息，可以通过CSI-RS预编码或者直接指示的方法，将角度信息和时延信息通知UE，UE根据基站的指示上报或者在基站的指示范围内选择并上报，从而减少UE的计算量和CSI上报的开销。

d)基于AI模型的波束管理；包括：波束测量、波束上报、波束预测、波束失败检测、波束失败恢复、波束失败恢复中的新波束指示。

e)基于AI模型的信道预测；包括信道状态信息的预测、波束预测。

f)基于AI模型的干扰抑制；包括小区内干扰、小区间干扰、带外干扰、交调干扰等。

g)基于AI模型的定位；

例如，通过参考信号(例如SRS)，估计出的UE的具***置(包括水平位置和或垂直位置)或未来可能的轨迹，或辅助位置估计或轨迹估计的信息。

h)基于AI模型的高层业务和参数的预测和管理；包括吞吐量、所需数据包大小、业务需求、移动速度、噪声信息等。

i)基于AI模型的控制信令解析；例如功率控制的相关信令，波束管理的相关信令。

图5是本申请实施例提供的AI算力上报方法的流程示意图之二，如图5所示，该方法包括步骤501-502；其中：

步骤501、网络侧设备接收终端发送的第一AI算力信息；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。

由于网络侧设备无法准确估计终端剩余AI算力，导致终端AI算力的利用率较低，影响通信***的性能；因此，为了提升终端AI算力的利用率，提升通信***的性能，在本实施例中，网络侧设备需要接收终端发送的第一AI算力信息。

可选地，所述计算资源单位，包括以下至少一项：

a)单次操作的运算次数；

b)万亿操作的运算次数；

c)浮点操作的运算次数；

d)内存访问成本；

e)乘加数操作的运算次数。

可选地，所述AI unit的定义满足以下至少一项：

a)由协议约定；

b)由所述终端定义；

c)由所述网络侧设备配置。

步骤502、所述网络侧设备基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示所述网络侧设备估计的所述终端剩余的AI模型计算资源。

在本实施例中，网络侧设备基于终端发送的第一AI算力信息，可以实时估计出终端剩余的AI模型计算资源，从而可以基于终端剩余的AI模型计算资源为终端下发，或者向终端指示合适的第一AI模型。

在本申请实施例提供的AI算力上报方法中，网络侧设备通过接收终端发送的第一AI算力信息，使得网络侧设备获得准确的终端剩余算力，从而网络侧设备可以基于准确的终端剩余算力进行AI配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

所述AI模型占用的AI unit的数目，由以下任一种方式得到：

可选地，在网络侧设备获取到终端对应的第二AI算力信息之后，还需要基于终端剩余的AI模型计算资源，向终端配置或指示第一AI模型，以提高终端AI算力的利用率。具体可以通过以下任一种方式实现：

方式1、在第一AI模型占用的AI unit的数目小于或不大于所述第二AI算力信息的情况下，所述网络侧设备将所述第一AI模型下发给所述终端。

具体地，网络侧设备向终端下发的第一AI模型的复杂度不能大于，或者不能大于等于终端当前空闲AI unit(即第二AI算力信息)。

例如，网络侧设备估计的终端剩余的AI模型计算资源为5个AI unit；则网络侧设备向终端下发的第一AI模型占用的AI unit的数目应该小于5。

方式2、在第一AI模型占用的AI unit的数目小于或不大于所述第二AI算力信息的情况下，所述网络侧设备指示所述终端激活所述第一AI模型。

具体地，网络侧设备可以向终端发送指示信息，以使终端激活第一AI模型；可以理解的是，网络侧设备向终端指示的第一AI模型的复杂度不能大于，或者不能大于等于终端当前空闲AI unit(即第二AI算力信息)。

例如，网络侧设备估计的终端剩余的AI模型计算资源为5个AI unit；则网络侧设备向终端指示的第一AI模型占用的AI unit的数目应该小于5。

方式3、在第一AI模型占用的AI unit的数目与第二AI模型占用的AI unit的数目的第一差值小于或不大于所述第二AI算力信息的情况下，所述网络侧设备指示所述终端去激活所述第二AI模型，及激活所述第一AI模型。

具体地，在网络侧设备指示终端从第二AI模型切换至第一AI模型(即，网络侧设备指示终端去激活当前使用的第一AI模型，激活第二AI模型)的情况下，则第一AI模型超过第二AI模型的复杂度不能大于，或者不能大于等于终端当前空闲AI unit(即第二AI算力信息)。

可以理解的是，若第一AI模型的复杂度低于当前使用的第二AI模型，则网络侧设备可以直接指示终端去激活所述第二AI模型，及激活所述第一AI模型。

在上述实施方式中，网络侧设备可以准确的基于终端剩余的AI模型计算资源(即第二AI算力信息)进行AI模型的配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

可选地，在网络侧设备将第一AI模型下发给所述终端之后，还需要对第二AI算力信息进行更新，具体可以通过以下步骤实现：

所述网络侧设备从所述第二AI算力信息中减去所述第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

例如，网络侧设备估计的终端剩余的AI模型计算资源为5个AI unit，第一AI模型占用了2个AI unit；则更新后的第二AI算力信息即3个AI unit。

可选地，在网络侧设备指示所述终端激活所述第一AI模型之后，还需要对第二AI算力信息进行更新，具体可以通过以下步骤实现：

可选地，在网络侧设备指示所述终端去激活所述第二AI模型，及激活所述第一AI模型之后，还需要对第二AI算力信息进行更新，具体可以通过以下步骤实现：

所述网络侧设备计算所述第一AI模型占用的AI unit的数目与所述第二AI模型占用的AI unit的数目的第一差值；从所述第二AI算力信息中减去所述第一差值，得到更新后的第二AI算力信息。

需要说明的是，第一差值可以为负数。例如，网络侧设备估计的终端剩余的AI模型计算资源为5个AI unit，第一AI模型占用了2个AI unit，第二AI模型占用了3个AI unit，第一差值为-1个AI unit，则更新后的第二AI算力信息即6个AI unit。

可选地，在网络侧设备指示所述终端去激活第三AI模型的情况下，所述网络侧设备从所述第二AI算力信息中加上所述第三AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

例如，网络侧设备估计的终端剩余的AI模型计算资源为5个AI unit，第三AI模型占用了2个AI unit；网络侧设备指示终端去激活第三AI模型的情况下，更新后的第二AI算力信息即7个AI unit。

在上述实施方式中，网络侧设备可以实现对第二AI算力信息的实时更新，从而使网络侧设备可以进一步地基于准确的终端剩余算力进行AI配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

a)基于AI模型的信号处理；

b)基于AI模型的信号传输/接收/解调/发送；

c)基于AI模型的信道状态信息获取；

d)基于AI模型的波束管理；

e)基于AI模型的信道预测；

f)基于AI模型的干扰抑制；

g)基于AI模型的定位；

h)基于AI模型的高层业务和参数的预测和管理；

i)基于AI模型的控制信令解析。

图6是本申请实施例提供的AI算力上报方法的信令交互示意图。如图6所示，具体包括步骤1-步骤7：

步骤1、终端获取第一AI算力信息。

具体地，第一AI算力信息包括M个AI unit算力单元，M为整数或小数；每个AI unit用于指示N1个计算资源单位，N1为正整数或小数。

计算资源单位，包括以下至少一项：a)单次操作的运算次数；b)万亿操作的运算次数；c)浮点操作的运算次数；d)内存访问成本；e)乘加数操作的运算次数。

AI unit的定义满足以下至少一项：a)由协议约定；b)由所述终端定义；c)由所述网络侧设备配置。

步骤2、终端向网络侧设备发送终端的AI能力信息，其中，终端的AI能力信息中包括第一AI算力信息。

步骤3、网络侧设备基于第一AI算力信息，获取终端对应的第二AI算力信息。

具体地，第二AI算力信息用于指示网络侧设备估计的终端剩余的AI模型计算资源。

需要说明的是，在执行完毕步骤3之后，开始执行步骤4至步骤6中至少一项。

步骤4、网络侧设备向终端下发第一AI模型。

具体地，在第一AI模型占用的AI unit的数目小于或不大于第二AI算力信息的情况下，网络侧设备将第一AI模型下发给终端。

步骤5、网络侧设备向终端发送第一指示信息；第一指示信息用于指示第一AI模型。

具体地，在第一AI模型占用的AI unit的数目小于或不大于第二AI算力信息的情况下，网络侧设备指示终端激活第一AI模型。

步骤6、网络侧设备向终端发送第二指示信息；第二指示信息用于指示终端去激活第二AI模型，及激活第一AI模型。

具体地，在第一AI模型占用的AI unit的数目与第二AI模型占用的AI unit的数目的第一差值小于或不大于第二AI算力信息的情况下，网络侧设备指示终端去激活第二AI模型，及激活第一AI模型。

步骤7、网络侧设备更新第二AI算力信息，得到更新后的第二AI算力信息。

具体地，网络侧设备在执行完毕步骤4的情况下，需要从第二AI算力信息中减去第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

网络侧设备在执行完毕步骤5的情况下，需要从第二AI算力信息中减去第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

网络侧设备在执行完毕步骤6的情况下，需要计算第一AI模型占用的AI unit的数目与第二AI模型占用的AI unit的数目的第一差值；然后从第二AI算力信息中减去第一差值，得到更新后的第二AI算力信息。

在网络侧设备指示终端去激活第三AI模型的情况下，网络侧设备需要从第二AI算力信息中加上第三AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

本申请实施例提供的AI算力上报方法，执行主体可以为AI算力上报装置。本申请实施例中以AI算力上报装置执行AI算力上报方法为例，说明本申请实施例提供的AI算力上报装置。

图7是本申请实施例提供的AI算力上报装置的结构示意图之一，如图7所示，该AI算力上报装置700，应用于终端，包括：

第一获取模块701，用于获取第一AI算力信息；

发送模块702，用于向网络侧设备发送所述第一AI算力信息；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。

本申请实施例提供的AI算力上报装置中，通过获取当前剩余的可用于AI模型相关操作的AI模型计算资源，即第一AI算力信息，然后向网络侧设备上报终端的第一AI算力信息，使得网络侧设备获得准确的终端剩余算力，从而网络侧设备可以基于准确的终端剩余算力进行AI配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

可选地，所述计算资源单位，包括以下至少一项：

单次操作的运算次数；

万亿操作的运算次数；

浮点操作的运算次数；

内存访问成本；

乘加数操作的运算次数。

可选地，所述AI unit的定义满足以下至少一项：由协议约定；由所述终端定义；由所述网络侧设备配置。

所述AI模型占用的AI unit的数目，由以下任一种方式得到：

在M为小数的情况下，计算N2除以N1，得到所述AI模型占用的AI unit的数目；

在M为整数的情况下，计算N2除以N1，将计算得到的商进行向上取整或近似取整，得到所述AI模型占用的AI unit的数目。

可选地，所述第一获取模块701，进一步用于以下任一项：

基于终端配置信息，确定所述第一AI算力信息；

基于终端配置信息及已占用AI算力信息，确定所述第一AI算力信息。

可选地，发送模块702，进一步用于：

在向所述网络侧设备上报所述终端的AI能力信息的过程中，向所述网络侧设备发送所述第一AI算力信息。

基于AI模型的信号处理；

基于AI模型的信号传输/接收/解调/发送；

基于AI模型的信道状态信息获取；

基于AI模型的波束管理；

基于AI模型的信道预测；

基于AI模型的干扰抑制；

基于AI模型的定位；

基于AI模型的高层业务和参数的预测和管理；

基于AI模型的控制信令解析。

图8是本申请实施例提供的AI算力上报装置的结构示意图之二，如图8所示，该AI算力上报装置800，应用于网络侧设备，包括：

接收模块801，用于接收终端发送的第一AI算力信息；

第二获取模块802，用于基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示网络侧设备估计的所述终端剩余的AI模型计算资源；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。

本申请实施例提供的AI算力上报装置中，通过接收终端发送的第一AI算力信息，使得网络侧设备获得准确的终端剩余算力，从而网络侧设备可以基于准确的终端剩余算力进行AI配置或指示，能够提升终端AI算力的利用率，提升通信***的性能。

可选地，所述计算资源单位，包括以下至少一项：

单次操作的运算次数；

万亿操作的运算次数；

浮点操作的运算次数；

内存访问成本；

乘加数操作的运算次数。

所述AI模型占用的AI unit的数目，由以下任一种方式得到：

可选地，所述装置还包括以下至少一项：

下发模块，用于在第一AI模型占用的AI unit的数目小于或不大于所述第二AI算力信息的情况下，将所述第一AI模型下发给所述终端；

第一指示模块，用于在第一AI模型占用的AI unit的数目小于或不大于所述第二AI算力信息的情况下，指示所述终端激活所述第一AI模型；

第二指示模块，用于在第一AI模型占用的AI unit的数目与第二AI模型占用的AI unit的数目的第一差值小于或不大于所述第二AI算力信息的情况下，指示所述终端去激活所述第二AI模型，及激活所述第一AI模型。

可选地，在将所述第一AI模型下发给所述终端之后，所述装置还包括：

第一更新模块，用于从所述第二AI算力信息中减去所述第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

可选地，在指示所述终端激活所述第一AI模型之后，所述装置还包括：

第二更新模块，用于从所述第二AI算力信息中减去所述第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

可选地，在指示所述终端去激活所述第二AI模型，及激活所述第一AI模型之后，所述装置还包括：

第三更新模块，用于计算所述第一AI模型占用的AI unit的数目与所述第二AI模型占用的AI unit的数目的第一差值；从所述第二AI算力信息中减去所述第一差值，得到更新后的第二AI算力信息。

可选地，所述装置还包括：

第三指示模块，用于指示所述终端去激活第三AI模型；

第四更新模块，用于从所述第二AI算力信息中加上所述第三AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。

基于AI模型的信号处理；

基于AI模型的信号传输/接收/解调/发送；

基于AI模型的信道状态信息获取；

基于AI模型的波束管理；

基于AI模型的信道预测；

基于AI模型的干扰抑制；

基于AI模型的定位；

基于AI模型的高层业务和参数的预测和管理；

基于AI模型的控制信令解析。

本申请实施例中的AI算力上报装置可以是电子设备，例如具有操作***的电子设备，也可以是电子设备中的部件，例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，终端可以包括但不限于上述所列举的终端11的类型，其他设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)等，本申请实施例不作具体限定。

本申请实施例提供的AI算力上报装置能够实现图4至图5的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

图9是本申请实施例提供的通信设备的结构示意图，如图9所示，该通信设备900，包括处理器901和存储器902，存储器902上存储有可在所述处理器901上运行的程序或指令，例如，该通信设备900为终端时，该程序或指令被处理器901执行时实现上述AI算力上报方法实施例的各个步骤，且能达到相同的技术效果。该通信设备900为网络侧设备时，该程序或指令被处理器901执行时实现上述AI算力上报方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供一种终端，包括处理器和通信接口，所述处理器用于：获取第一AI算力信息，所述通信接口用于：向网络侧设备发送所述第一AI算力信息；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。该终端实施例与上述终端侧方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中，且能达到相同的技术效果。

图10是本申请实施例提供的终端的结构示意图，如图10所示，该终端1000包括但不限于：射频单元1001、网络模块1002、音频输出单元1003、输入单元1004、传感器1005、显示单元1006、用户输入单元1007、接口单元1008、存储器1009以及处理器1010等中的至少部分部件。

本领域技术人员可以理解，终端1000还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理***与处理器1010逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图10中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

应理解的是，本申请实施例中，输入单元1004可以包括图形处理单元(Graphics Processing Unit，GPU)10041和麦克风10042，图形处理器10041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元1006可包括显示面板10061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板10061。用户输入单元1007包括触控面板10071以及其他输入设备10072中的至少一种。触控面板10071，也称为触摸屏。触控面板10071可包括触摸检测装置和触摸控制器两个部分。其他输入设备10072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

本申请实施例中，射频单元1001接收来自网络侧设备的下行数据后，可以传输给处理器1010进行处理；另外，射频单元1001可以向网络侧设备发送上行数据。通常，射频单元1001包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。

存储器1009可用于存储软件程序或指令以及各种数据。存储器1009可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器1009可以包括易失性存储器或非易失性存储器，或者，存储器1009可以包括瞬态和非瞬态存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DRRAM)。本申请实施例中的存储器x09包括但不限于这些和任意其它适合类型的存储器。

处理器1010可包括一个或多个处理单元；可选的，处理器x10集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作***、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器1010中。

本申请实施例还提供一种网络侧设备，包括处理器和通信接口，所述通信接口用于：接收终端发送的第一AI算力信息，所述处理器用于：基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示网络侧设备估计的所述终端剩余的AI模型计算资源；其中，所述第一AI算力信息用于指示以下至少一项：所述终端当前剩余的AI模型计算资源；所述终端当前可用的AI模型计算资源；所述终端所有的AI模型计算资源；所述终端所有的可用于无线通信的AI模型计算资源。该网络侧设备实施例与上述网络侧设备方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中，且能达到相同的技术效果。

图11是本申请实施例提供的网络侧设备的结构示意图，如图11所示，该网络侧设备1100包括：天线1101、射频装置1102、基带装置1103、处理器1104和存储器1105。天线1101与射频装置1102连接。在上行方向上，射频装置1102通过天线1101接收信息，将接收的信息发送给基带装置1103进行处理。在下行方向上，基带装置1103对要发送的信息进行处理，并发送给射频装置1102，射频装置1102对收到的信息进行处理后经过天线1101发送出去。

以上实施例中网络侧设备执行的方法可以在基带装置1103中实现，该基带装置1103包括基带处理器。

基带装置1103例如可以包括至少一个基带板，该基带板上设置有多个芯片，如图11所示，其中一个芯片例如为基带处理器，通过总线接口与存储器1105连接，以调用存储器1105中的程序，执行以上方法实施例中所示的网络设备操作。

该网络侧设备还可以包括网络接口1106，该接口例如为通用公共无线接口(common public radio interface，CPRI)。

具体地，本发明实施例的网络侧设备1100还包括：存储在存储器1105上并可在处理器1104上运行的指令或程序，处理器1104调用存储器1105中的指令或程序执行如上所述的AI算力上报方法，并达到相同的技术效果，为避免重复，故不在此赘述。

本申请实施例还提供了一种AI算力上报***，包括：终端及网络侧设备，所述终端可用于执行如上所述图4所示的AI算力上报方法的步骤，所述网络侧设备可用于执行如上所述图5所示的AI算力上报方法的步骤。

本申请实施例还提供一种可读存储介质，所述可读存储介质可以是以易失性的，也可以是非易失性的，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述AI算力上报方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上述AI算力上报方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为***级芯片，***芯片，芯片***或片上***芯片等。

本申请实施例另提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现上述AI 算力上报方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种人工智能AI算力上报方法，包括：

终端获取第一AI算力信息；

所述终端向网络侧设备发送所述第一AI算力信息；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。
根据权利要求1所述的AI算力上报方法，其中，所述第一AI算力信息包括M个AI unit算力单元，M为整数或小数；每个AI unit用于指示N1个计算资源单位，N1为正整数或小数。
根据权利要求2所述的AI算力上报方法，其中，所述计算资源单位，包括以下至少一项：

单次操作的运算次数；

万亿操作的运算次数；

浮点操作的运算次数；

内存访问成本；

乘加数操作的运算次数。
根据权利要求2或3所述的AI算力上报方法，其中，所述AI unit的定义满足以下至少一项：由协议约定；由所述终端定义；由所述网络侧设备配置。
根据权利要求2至4任一项所述的AI算力上报方法，其中，在所述AI模型的模型配置信息或关联信息中，包括所述AI模型占用的AI unit的数目；所述AI模型占用的AI unit的数目，由所述AI模型的计算复杂度换算得到。
根据权利要求5所述的AI算力上报方法，其中，所述AI模型的计算复杂度为N2个计算资源单位，N2为正整数或小数；

所述AI模型占用的AI unit的数目，由以下任一种方式得到：

在M为小数的情况下，计算N2除以N1，得到所述AI模型占用的AI unit的数目；

在M为整数的情况下，计算N2除以N1，将计算得到的商进行向上取整或近似取整，得到所述AI模型占用的AI unit的数目。
根据权利要求1至6任一项所述的AI算力上报方法，其中，所述终端获取第一AI算力信息，包括以下任一项：

所述终端基于终端配置信息，确定所述第一AI算力信息；

所述终端基于终端配置信息及已占用AI算力信息，确定所述第一AI算力信息。
根据权利要求1至7任一项所述的AI算力上报方法，其中，所述终端向网络侧设备发送所述第一AI算力信息，包括：

所述终端在向所述网络侧设备上报所述终端的AI能力信息的过程中，向所述网络侧设备发送所述第一AI算力信息。
根据权利要求1至8任一项所述的AI算力上报方法，其中，所述AI模型计算资源用于以下至少一项AI模型相关操作：

基于AI模型的信号处理；

基于AI模型的信号传输/接收/解调/发送；

基于AI模型的信道状态信息获取；

基于AI模型的波束管理；

基于AI模型的信道预测；

基于AI模型的干扰抑制；

基于AI模型的定位；

基于AI模型的高层业务和参数的预测和管理；

基于AI模型的控制信令解析。
一种人工智能AI算力上报方法，包括：

网络侧设备接收终端发送的第一AI算力信息；

所述网络侧设备基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示所述网络侧设备估计的所述终端剩余的AI模型计算资源；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。
根据权利要求10所述的AI算力上报方法，其中，所述第一AI算力信息包括M个AI unit算力单元，M为整数或小数；每个AI unit用于指示N1个计算资源单位，N1为正整数或小数。
根据权利要求11所述的AI算力上报方法，其中，所述计算资源单位，包括以下至少一项：

单次操作的运算次数；

万亿操作的运算次数；

浮点操作的运算次数；

内存访问成本；

乘加数操作的运算次数。
根据权利要求11或12所述的AI算力上报方法，其中，所述AI unit的定义满足以下至少一项：由协议约定；由所述终端定义；由所述网络侧设备配置。
根据权利要求11至13任一项所述的AI算力上报方法，其中，在所述AI模型的模型配置信息或关联信息中，包括所述AI模型占用的AI unit的数目；所述AI模型占用的AI unit的数目，由所述AI模型的计算复杂度换算得到。
根据权利要求14所述的AI算力上报方法，其中，所述AI模型的计算复杂度为N2个计算资源单位，N2为正整数或小数；

所述AI模型占用的AI unit的数目，由以下任一种方式得到：

在M为小数的情况下，计算N2除以N1，得到所述AI模型占用的AI unit的数目；

在M为整数的情况下，计算N2除以N1，将计算得到的商进行向上取整或近似取整，得到所述AI模型占用的AI unit的数目。
根据权利要求10所述的AI算力上报方法，其中，所述方法还包括以下至少一项：

在第一AI模型占用的AI unit的数目小于或不大于所述第二AI算力信息的情况下，所述网络侧设备将所述第一AI模型下发给所述终端；

在第一AI模型占用的AI unit的数目小于或不大于所述第二AI算力信息的情况下，所述网络侧设备指示所述终端激活所述第一AI模型；

在第一AI模型占用的AI unit的数目与第二AI模型占用的AI unit的数目的第一差值小于或不大于所述第二AI算力信息的情况下，所述网络侧设备指示所述终端去激活所述第二AI模型，及激活所述第一AI模型。
根据权利要求16所述的AI算力上报方法，其中，在所述网络侧设备将所述第一AI模型下发给所述终端之后，所述方法还包括：

所述网络侧设备从所述第二AI算力信息中减去所述第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。
根据权利要求16所述的AI算力上报方法，其中，在所述网络侧设备指示所述终端激活所述第一AI模型之后，所述方法还包括：

所述网络侧设备从所述第二AI算力信息中减去所述第一AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。
根据权利要求16所述的AI算力上报方法，其中，在所述网络侧设备指示所述终端去激活所述第二AI模型，及激活所述第一AI模型之后，所述方法还包括：

所述网络侧设备计算所述第一AI模型占用的AI unit的数目与所述第二AI模型占用的AI unit的数目的第一差值；从所述第二AI算力信息中减去所述第一差值，得到更新后的第二AI算力信息。
根据权利要求10所述的AI算力上报方法，其中，所述方法还包括：

所述网络侧设备指示所述终端去激活第三AI模型；

所述网络侧设备从所述第二AI算力信息中加上所述第三AI模型占用的AI unit的数目，得到更新后的第二AI算力信息。
根据权利要求10至20任一项所述的AI算力上报方法，其中，所述AI模型计算资源用于以下至少一项AI模型相关操作：

基于AI模型的信号处理；

基于AI模型的信号传输/接收/解调/发送；

基于AI模型的信道状态信息获取；

基于AI模型的波束管理；

基于AI模型的信道预测；

基于AI模型的干扰抑制；

基于AI模型的定位；

基于AI模型的高层业务和参数的预测和管理；

基于AI模型的控制信令解析。
一种人工智能AI算力上报装置，包括：

第一获取模块，用于获取第一AI算力信息；

发送模块，用于向网络侧设备发送所述第一AI算力信息；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。
一种人工智能AI算力上报装置，包括：

接收模块，用于接收终端发送的第一AI算力信息；

第二获取模块，用于基于所述第一AI算力信息，获取所述终端对应的第二AI算力信息；所述第二AI算力信息用于指示网络侧设备估计的所述终端剩余的AI模型计算资源；

其中，所述第一AI算力信息用于指示以下至少一项：

所述终端当前剩余的AI模型计算资源；

所述终端当前可用的AI模型计算资源；

所述终端所有的AI模型计算资源；

所述终端所有的可用于无线通信的AI模型计算资源。
一种终端，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至9任一项所述的AI算力上报方法的步骤。
一种网络侧设备，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求10至21任一项所述的AI算力上报方法的步骤。
一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-9任一项所述的AI算力上报方法，或者实现如权利要求10至21任一项所述的AI算力上报方法的步骤。