CN116668309A

CN116668309A - Ai模型的在线学习方法、装置、通信设备及可读存储介质

Info

Publication number: CN116668309A
Application number: CN202210157466.7A
Authority: CN
Inventors: 贾承璐; 孙布勒; 王园园
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2022-02-21
Filing date: 2022-02-21
Publication date: 2023-08-29
Also published as: WO2023155839A1

Abstract

本申请公开了一种人工智能AI模型的在线学习方法、装置、通信设备及可读存储介质。本申请实施例的人工智能AI模型的在线学习方法包括：第二设备为第一设备配置第一AI模型；第二设备为该第一设备配置上述第一AI模型的在线学习信息。

Description

AI模型的在线学习方法、装置、通信设备及可读存储介质

技术领域

本申请属于电子信息技术领域，具体涉及一种AI模型的在线学习方法、装置、通信设备及可读存储介质。

背景技术

随着人工智能(Artificial Intelligence，AI)在各个领域的广泛的应用，将AI融入无线通信网络，来提升网络吞吐量、时延以及用户容量等技术指标成为无线通信网络的重要任务。目前，无线通信网络中的AI模块有多种实现方式。例如，神经网络(neuralnetwork，NN)决策树(decision tree，DT)、支持向量机(support vector machine，SVM)、遗传算法(genetic algorithm，GA)等。

在相关技术中，通常是离线训练AI模型，然后将训练好的AI模型部署于无线通信***。然而，在无线通信环境发生变化时，使得AI模型的输出结果的准确性较低。如此，导致AI模型的计算精准较差。

发明内容

本申请实施例提供一种AI模型的在线学习方法、装置、通信设备以及可读存储介质，能够解决解决实际场景中，由无线通信环境的动态变化导致的AI模型失效的问题。

第一方面，提供了一种AI模型的在线学习方法，该方法包括：第二设备为第一设备配置第一AI模型；第二设备为该第一设备配置上述第一AI模型的在线学习信息。

第二方面，提供了一种AI模型的在线学习装置，该装置包括：配置模块，其中：所述配置模块，用于第二设备为第一设备配置第一AI模型；所述配置模块，还用于所述第二设备为所述第一设备配置所述第一AI模型的在线学习信息。

第三方面，提供了一种AI模型的在线学习方法，该方法包括：获取模块和执行模块，其中：所述获取模块，用于所述第一设备获取第一AI模型；所述执行模块，用于所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

第四方面，提供了一种AI模型的在线学习装置，该装置包括：第一设备获取第一AI模型；所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

第五方面，提供了一种通信设备，该通信设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第六方面，提供了一种通信设备，包括处理器及通信接口，其中，所述处理器用于为第一设备配置第一AI模型；以及为该第一设备配置上述第一AI模型的在线学习信息。

第七方面，提供了一种通信设备，该通信设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第八方面，提供了一种网络侧设备，包括处理器及通信接口，其中，上述处理器用于获取第一AI模型，基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

第九方面，提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤，或者实现如第三方面所述的方法的步骤。

第十方面，提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法，或实现如第三方面所述的方法。

第十一方面，提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面，或实现如第三方面所述的AI模型的在线学习方法的步骤。

在本申请实施例中，第一设备获取第一AI模型，并基于该第一AI模型的在线学习信息对该第一AI模型进行在线学习。通过该方法，通过在第一设备侧部署第一AI模型，并对该第一模型配置在线学习所需的参数，使得可以在第一设备侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证第一设备的服务质量。

附图说明

图1是本申请实施例提供的无线通信***的框图；

图2是本申请实施例提供的AI模型的在线学习方法的流程示意图之一；

图3是本申请实施例提供的AI模型的在线学习方法的流程示意图之二；

图4是本申请实施例提供的AI模型的在线学习装置的结构示意图之一；

图5是本申请实施例提供的AI模型的在线学习装置的结构示意图之二；

图6是本申请实施例提供通信设备的结构示意图；

图7是本申请实施例提供的终端的硬件结构示意图；

图8是本申请实施例提供的网络侧设备的硬件结构示意图之一；

图9是本申请实施例提供的网络侧设备的硬件结构示意图之二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。

值得指出的是，本申请实施例所描述的技术不限于长期演进型(Long TermEvolution，LTE)/LTE的演进(LTE-Advanced，LTE-A)***，还可用于其他无线通信***，诸如码分多址(Code Division Multiple Access，CDMA)、时分多址(Time DivisionMultiple Access，TDMA)、频分多址(Frequency Division Multiple Access，FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access，OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access，SC-FDMA)和其他***。本申请实施例中的术语“***”和“网络”常被可互换地使用，所描述的技术既可用于以上提及的***和无线电技术，也可用于其他***和无线电技术。以下描述出于示例目的描述了新空口(New Radio，NR)***，并且在以下大部分描述中使用NR术语，但是这些技术也可应用于NR***应用以外的应用，如第6代(6^th Generation，6G)通信***。

图1示出本申请实施例可应用的一种无线通信***的框图。无线通信***包括终端11和网络侧设备12。其中，终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal DigitalAssistant，PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personalcomputer，UMPC)、移动上网装置(Mobile Internet Device，MID)、增强现实(augmentedreality，AR)/虚拟现实(virtual reality，VR)设备、机器人、可穿戴式设备(WearableDevice)、车载设备(VUE)、行人终端(PUE)、智能家居(具有无线通信功能的家居设备，如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer，PC)、柜员机或者自助机等终端侧设备，可穿戴式设备包括：智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是，在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备或核心网设备，其中，接入网设备12也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备12可以包括基站、WLAN接入点或WiFi节点等，基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station，BTS)、无线电基站、无线电收发机、基本服务集(BasicService Set，BSS)、扩展服务集(Extended Service Set，ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point，TRP)或所述领域中其他某个合适的术语，只要达到相同的技术效果，所述基站不限于特定技术词汇，需要说明的是，在本申请实施例中仅以NR***中的基站为例进行介绍，并不限定基站的具体类型。核心网设备可以包含但不限于如下至少一项：核心网节点、核心网功能、移动管理实体(Mobility ManagementEntity，MME)、接入移动管理功能(Access and Mobility Management Function，AMF)、会话管理功能(Session Management Function，SMF)、用户平面功能(User Plane Function，UPF)、策略控制功能(Policy Control Function，PCF)、策略与计费规则功能单元(Policyand Charging Rules Function，PCRF)、边缘应用服务发现功能(Edge ApplicationServer Discovery Function，EASDF)、统一数据管理(Unified Data Management，UDM)，统一数据仓储(Unified Data Repository，UDR)、归属用户服务器(Home SubscriberServer，HSS)、集中式网络配置(Centralized network configuration，CNC)、网络存储功能(Network Repository Function，NRF)，网络开放功能(Network Exposure Function，NEF)、本地NEF(Local NEF，或L-NEF)、绑定支持功能(Binding Support Function，BSF)、应用功能(Application Function，AF)等。需要说明的是，在本申请实施例中仅以NR***中的核心网设备为例进行介绍，并不限定核心网设备的具体类型。

下面对本发明实施例中所涉及的部分术语进行解释：

(1)人工智能(Artificial Intelligence，AI)：人工智能是包括十分广泛的科学，它由不同的领域组成，如机器学习，计算机视觉等等。

(2)机器学习(Machine Learning，ML)：机器学习是人工智能的一个重要分支，主要研究如何让计算机具有能够自我学习的能力。机器学习的算法包括神经网络(neuralnetwork，NN)决策树(decision tree，DT)、支持向量机(support vector machine，SVM)、遗传算法(genetic algorithm，GA)等等。

(3)神经网络：神经网络由大量节点组成，这些节点称为神经元。其中，神经元的构成信息包括：输入(a1,a2,…aK)权值/乘性系数(w)，为偏置/加性系数(b)，激活函数(σ(.))。常见的激活函数包括Sigmoid、tanh、ReLU(Rectified Linear Unit)，线性整流函数，修正线性单元)等等。

进一步地，神经网络的参数可以通过梯度优化算法进行优化。梯度优化算法是一类最小化或者最大化目标函数(有时候也叫损失函数)的算法，而目标函数往往是模型参数和数据的数学组合。例如给定数据X和其对应的标签Y，在构建一个神经网络模型f(.)，有了模型后，根据输入x就可以得到预测输出f(x)，并且可以计算出预测值和真实值之间的差距(f(x)-Y)，即损失函数。若找到合适的W,b使上述的损失函数的值达到最小，损失值越小，则说明模型越接近于真实情况。

示例地，目前常见的优化算法，通常都是基于BP(error Back Propagation，误差反向传播)算法。BP算法的基本思想是，学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时，输入样本从输入层传入，经各隐层逐层处理后，传向输出层。若输出层的实际输出与期望的输出不符，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。这种信号正向传播与误差反向传播的各层权值调整过程，是周而复始地进行的。权值不断调整的过程，也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度，或进行到预先设定的学习次数为止。

示例地，常见的优化算法有梯度下降(Gradient Descent)、随机梯度下降(Stochastic Gradient Descent，SGD)、小批量梯度下降(mini-batch gradientdescent)、动量法(Momentum)、带动量的随机梯度下降(Nesterov)、自适应梯度下降(ADAptive GRADient descent，Adagrad)、Adadelta、均方根误差降速(root mean squareprop，RMSprop)、自适应动量估计(Adaptive Moment Estimation，Adam)等。

示例地，以上优化算法在误差反向传播时，都是根据损失函数得到的误差/损失，对当前神经元求导数/偏导，加上学习速率、之前的梯度/导数/偏导等影响，得到梯度，将梯度传给上一层。

下面结合附图，通过一些实施例及其应用场景对本申请实施例提供的在线学习方法进行详细地说明。

当前无线通信领域对的AI研究主要集中来离线学习和部署，而由于无线环境是不断变化的，通过离线训练得到的固定AI模型会在动态环境中逐渐失效，如何提升模型在变化的新的环境之中的适应能力，成为亟待解决的问题。

本申请为例解决上述问题，提出一种AI模型的在线学习方法。进一步地，实现在线学习有以下难点：1)受限于设备的存储能力和数据收集能力(如，收集数据的时间成本和硬件成本比较高)，通常难以获取足够大量的数据集进行在线训练；2)受限于设备的计算能力和有限的数据集，可能无法进行多轮的模型微调或经过多轮模型微调后会导致过拟合；3)对于无线通信，还存在通信时延限制以及通信的连续性的问题，这对第一设备数据采集的时间和在线学习的时间提出了要求。

图2示出了本申请实施例提供的一种AI模型的在线学习方法的流程图。如图2所示，本申请实施例提供的AI模型的在线学习方法可以包括如下步骤201和步骤202：

步骤201：第二设备为第一设备配置第一AI模型。

在本申请实施例中，上述第二设备可以包括以下至少之一：核心网设备，接入网设备，终端；上述第一设备可以包括以下至少之一：核心网设备，接入网设备，终端。

示例性地，第二设备为核心网设备，相应的，第一设备可以为接入网设备或终端。

示例性地，第二设备为接入网设备，相应的，第一设备可以为核心网设备或终端。

示例性地，第二设备为终端，相应的，第一设备可以为核心网设备或接入网设备。

在本申请实施例中，上述第一AI模型为在第二设备侧离线训练得到的AI模型。

可选地，在本申请实施例中，上述第一AI模型的算法可以包括以下至少之一：神经网络、决策树、支持向量机、贝叶斯分类器。

可选地，在本申请实施例中，上述第一AI模型可以为用于终端定位、网络优化、大型输入数据集处理、以及为用户进行网络推荐的AI模型。

可选地，在本申请实施例中，第二设备可以基于预设的学习框架对AI模型进行训练，以得到上述第一AI模型。示例性地，以第一AI模型为神经网络模型为例。第二设备可以基于预设的学习框架对神经网络模型进行训练，以得到第一神经网络模型。

可选地，在本申请实施例中，第二设备可以将训练得到的第一AI模型发送至第一设备，并在第一设备侧部署该第一AI模型。

步骤202：第二设备为第一设备配置第一AI模型的在线学习信息。

在本申请实施例中，第二设备可以将第一AI模型在线学习所需的信息发送至第一设备，第一设备在接收到第二设备发送的在线学习信息的情况下，可以基于该在线学习信息对第一AI模型进行在线学习。

在本申请实施例中，所述在线学习信息为网络设备配置的，或者由第二设备自主确定的。

可选地，在本申请实施例中，上述第一设备可以为终端，第二设备可以为核心网设备。

示例性地，核心网设备将第一AI模型发送至终端，以及将第一AI模型的在线学习信息发送至终端，终端接收核心网设备发送的第一AI模型，以及第一AI模型的在线学习信息。

在本申请实施例提供的在线学习方法中，第二设备为第一设备配置第一AI模型，以及为该第一设备配置上述第一AI模型的在线学习信息。通过该方法，通过在第一设备侧部署第一AI模型，并对该第一模型配置在线学习所需的参数，使得可以在第一设备侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证第一设备的服务质量。

可选地，在本申请实施例中，上述在线学习信息包括以下至少之一：

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

示例性地，上述触发方式与第一设备的状态信息以及第一设备相关信道的信道信息相关。例如，在第一设备的移动速度较快的情况下，或者在第一设备工作信道的信道环境发生变化的情况下，可以触发对第一AI模型进行在线学习，以使得第一AI模型不断适应变化的环境。

示例性地，第一设备可以在第一AI模型的在线学习次数大于预设迭代次数的情况下，中止对第一AI模型进行在线学习；或者，在第一AI模型达到预设精度的情况下，中止对第一AI模型进行在线学习；或者，在第一AI模型的输出结果的误差信息较小的情况下，中止对第一AI模型进行在线学习。由于第一AI模型的在线学习次数大于预设迭代次数，或者第一AI模型的精度达到预设精度，表征当前的第一AI模型具备有效性，则可以终止对第一AI模型的在线学习，以节省功耗。

可选地，在本申请实施例中，上述触发方式对应的触发条件包括以下至少之一：

上述第一设备的状态信息满足第一预设条件；

上述第一设备采集到的数据量大于第一阈值；

上述第一设备的测量信息满足第二预设条件；

上述第一AI模型的输出结果的误差信息大于第二阈值；

上述第一AI模型对应的第一信息的统计信息满足第三预设条件；

上述第一设备的测量信息的统计信息满足第四预设条件；

可选地，上述状态信息包括以下至少一项：移动速度、波束切换信息、小区切换信息。

可选地，上述第一设备采集到的数据量可以为第一设备在线数据采集数量，如，第一设备实时采集到的信道信息。

示例性地，在第一设备快速移动的情况下，触发第一设备对第一AI模型进行在线学习；或者，在第一设备采集的数据量较大的情况下，触发第一设备对第一AI模型进行在线学习；或者，在第一设备的测量信息指示当前信道的信道环境发生变化的情况下，触发第一设备对第一AI模型进行在线学习；或者，在第一AI模型的输出结果的误差较大或者第一AI模型的精度较低的情况下，触发第一设备对第一AI模型进行在线学习。由于终端快速移动或者信道环境发生变化时，可能会导致第一AI模型失效。如此，使得第一设备可以基于自身的移动速度、相关信道的信道环境以及AI模型的精度值等信息，在第一AI模型失效的情况下对该第一AI模型进行在线学习，从而提高第一AI模型的预测精度。

示例性地，上述信道信息可以包括以下至少之一：信号的发射角角度信息，信号的到达角角度信息，信道中信号的时延信息，信道中的信号质量等等。

可选地，上述第一阈值可以为3000，5000或者7000等等。

可选地，上述测量信息包括以下至少之一：上述第一设备接收的参考信号的第一测量信息，上述第一设备的传感器采集的第二测量信息。示例性地，上述第一测量信息包括以下至少之一：参考信号的瞬时测量信息，参考信号的统计测量信息。示例性地，上述参考信号的瞬时测量信息可以为：在某一特定时刻的参考信号的测量信息；上述参考信号的统计测量信息可以为：在一段时间内的参考信号的测量信息。

示例性地，上述参考信号包括以下至少之一：同步信号块SSB、CSI参考信号CSI-RS、探测参考信号SRS、定位参考信号PRS。可选地，上述传感器可以包括以下至少之一：视觉传感器、雷达传感器、位置传感器等等。

可选地，上述第一信息包括以下至少之一：上述第一AI模型的输入信息，上述第一AI模型的输出信息。

示例性地，以第一设备为终端为例，在第一信息包括第一AI模型的输入信息的情况下，该第一信息可以为终端的工作信道或者周边信道的信道信息，在第一信息包括第一AI模型的输出信息的情况下，上述第一信息可以为终端的位置信息。

可选地，在本申请实施例中，上述第一信息的统计信息包括以下至少之一：

第一时间窗内上述第一信息的第一统计量，至少两个连续的第二时间窗内上述第一信息对应的第二统计量，第一小区下的至少两个终端在第一时刻的第一信息的统计信息，以及，上述第一信息的相关性信息。

其中，上述第二统计量是基于各个第二时间窗内的统计量计算出的。

可选地，上述统计信息可以包括以下至少之一；均值，方差等等。

可选地，上述统计信息可以包括时间上的统计信息和空间上的统计信息。例如，时间上的统计信息可以为：同一终端在一段连续时间内的信道的统计信息，空间上的统计信息可以为一个小区下多个不同终端的信道的统计信息。

示例性地，上述第一信息的统计信息用于表征第一AI模型的作用区域内的无线网络环境是否发生变化。

示例性地，以第一信息为信道信息为例。在某一连续时间窗内针对信道信息的均值小于某一阈值，或者在两个时间窗内的信道信息的相关性指标低于某一阈值，或者，当前时间窗内的前后数据相关性低于某一阈值的情况下，表征第一设备相关信道的信道环境发生变化，则可以触发第一设备对第一AI模型进行在线学习，以适应当前的信道环境，从而提升第一AI模型的预测精度。

以下以第一信息为信道信息为例，对上述第一信息的统计信息进行解释说明。

示例性地，在第一信息的统计信息包括第一时间窗内上述第一信息的第一统计量的情况下，上述第一信息的统计信息可以为：同一终端在某一连续时间窗内的信道信息的均值或者方差。

示例性地，在第一信息的统计信息包括至少两个连续的第二时间窗内上述第一信息对应的第二统计量的情况下，上述第一信息的统计信息可以为：基于终端在多个连续时间窗内的每个连续时间窗内信道信息的均值确定的均值，如，时间窗1内信道信息的均值为a，时间窗2内信道信息的均值为b，时间窗3内信道信息的均值为c，则信道信息的统计信息为a，b和c的均值。

示例性地，在第一信息的统计信息包括第一小区下的至少两个终端在第一时刻的第一信息的统计信息的情况下，上述第一信息的统计信息可以为：一个小区下多个不同终端在某一时刻的信道信息的均值，如，同一小区下的终端A，终端B和终端C在时刻1的信道信息的均值分别为d，e和f，则信道信息的统计信息为d，e和f的均值。

示例性地，在第一信息的统计信息包括第一信息的相关性信息的情况下，上述第一信息的统计信息可以为：两个时间窗的信道信息的相关性指标低于某一阈值，如，当前时间窗内的前后数据之间的距离小于某一阈值。

可选地，在本申请实施例中，上述第一设备的测量信息的统计信息包括以下至少之一：

在第三时间窗内针对上述测量信息的第三统计量，上述测量信息在至少两个连续的第四时间窗对应的第四统计量，以及，上述测量信息的相关性信息。

其中，上述第四统计量是基于各个第四时间窗内的统计量计算出的。

可选地，上述相关性信息包括以下至少之一：数据之间的距离，协方差，相关系数。

示例性地，以测量信息为第一设备接收的参考信号的信道测量信息为例。上述测量信息的统计信息可以为：信道测量信息在某一连续时间窗内的方差，或者，两个连续的时间窗内的信道测量信息的均值的均值，或者为当前时间窗内的信道测量信息的数据之间的距离。

示例性地，上述测量信息的统计信息用于表征第一AI模型的作用区域内的无线网络环境是否发生变化。

示例性地，以测量信息为信道信息为例。在某一连续时间窗内针对测量信息的均值小于某一阈值，或者在两个时间窗内的测量信息的相关性指标低于某一阈值，或者，当前时间窗内的前后数据相关性低于某一阈值的情况下，表征第一AI模型作用的无线环境发生变化，则可以触发第一设备对第一AI模型进行在线学习，以适应当前的无线环境，从而提升第一AI模型的预测精度。

进一步可选地，在本申请实施例中，上述触发条件包括：上述第一设备的状态信息满足第一预设条件；上述满足第一预设条件包括以下至少之一：

上述第一设备的移动速度大于第三阈值；

上述波束切换信息指示第一设备发生波束切换、且波束切换频率大于第四阈值；

上述小区切换信息指示第一设备发生小区切换。

示例性地，上述第三阈值可以为60km/h，80km/h，100km/等等。

进一步可选地，在本申请实施例中，上述触发条件包括：上述第一设备的测量信息满足第二预设条件；可选地，上述满足第二预设条件包括：第一设备的测量信息指示第一设备的相关信道的信道环境发生变化。

示例性地，以测量信息为第一设备接收的参考信号为例。上述第二预设条件可以为：第一设备根据CSI-RS的测量估计下行信道，检测到信道环境发生变化，如由视距(lineof sight，LOS)环境变成非视距(not line of sight，NLOS)环境，如信噪比SINR低于一定阈值等等。

示例性地，以测量信息为第一设备的传感器采集的测量信息为例。上述第二预设条件可以为：通过视觉传感器得到测量信息指示第一设备处于LOS环境下。

进一步可选地，在本申请实施例中，上述触发条件包括：上述第一AI模型对应的第一信息的统计信息满足第三预设条件；上述满足第三预设条件包括以下至少之一：

上述第一统计量大于第一阈值区间的最大值；

上述第二统计量大于第二阈值区间的最大值；

在至少两个时间窗内采集的第一信息的相关性信息满足第一条件；

在当前时间窗内采集的不同第一信息之间的相关性信息满足第二条件。

示例性地，以第一统计量为终端在某一连续时间窗内的信道信息的均值为例。上述第三预设条件可以为：第一设备检测到某一连续时间窗内的信道信息的统计量超过某一阈值区间的最大值。

示例性地，以第二统计量为终端在多个连续时间窗内的信道信息的均值的均值为例。上述第三预设条件可以为：第一设备检测到多个连续时间窗内信道信息的均值的均值超过某一阈值区间的最大值。

示例性地，以第一信息为信道信息为例。上述第三预设条件可以为：两个时间窗内的信道信息的相关性指标低于某一阈值，或者，当前时间窗内的前后数据相关性低于某一阈值。

进一步可选地，在本申请实施例中，上述触发条件包括：上述第一设备的测量信息的统计信息满足第四预设条件；上述满足第四预设条件包括以下至少之一：

上述第三统计量大于第三阈值区间的最大值；

上述第四统计量大于第四阈值区间的最大值；

在至少两个时间窗内采集的测量信息的相关性信息满足第三条件；

在当前时间窗内采集的不同测量信息之间的相关性信息满足第四条件；

上述测量信息的分布与基准分布的差异大于第五阈值，上述基准分布为第二设备为第一设备配置的信息。

示例性地，在第三统计量为信道测量信息在某一连续时间窗内的均值的情况下，上述第四预设条件可以为：信道测量信息在某一连续时间窗内的均值超过某一阈值区间的最大值。

示例性地，在第四统计量为基于各个第四时间窗内信道测量信息的均值计算得到的均值的情况下，上述第四预设条件可以为：基于各个第四时间窗内信道测量信息的均值计算得到的均值超过某一阈值区间的最大值。

示例性地，上述第三条件可以为：在至少两个时间窗内分别采集的测量信息的数据的协方差小于某一阈值。

示例性地，上述第四条件可以为：在当前时间窗内采集的测量信息的不同数据之间的距离小于某一阈值。

示例性地，上述测量信息的分布为测量信息的统计分布。示例性地，上述基准分布为第一AI模型的统计分布。可以理解的是，第一AI模型离线训练时的训练集服从基准分布，第一AI模型在测量信息服从基准分布的时候性能最好。

示例性地，描述上述测量信息的分布与基准分布的差异的指标可以包括以下至少之一：Wasserstein距离；Kullback-Leibler散度；Hellinger距离等。

可选地，在本申请实施例中，所述触发方式的触发条件包括以下至少之一：

第二设备指示第一设备进行在线学习；

第一AI模型的输出精度小于或者等于第六阈值。

进一步可选地，在本申请实施例中，上述第二设备指示第一设备进行在线学习，包括以下至少之一：

第二设备指示第一设备周期性进行在线学习；

第二设备指示第一设备半周期性进行在线学习；

第二设备指示所述第一设备非周期性进行在线学习。

其中，上述第一设备周期性或半周期性进行在线学习时采用的周期为：上述第二设备预配置的周期，或者，上述第一设备自主配置的周期。

进一步可选地，上述第二设备指示第一设备半周期性进行在线学习，包括：

上述第二设备通过第一信令指示第一设备半周期性进行在线学习，上述第一信令包括以下至少之一：媒体接入控制-控制单元MAC-CE，下行控制信息DCI。

可选地，在本申请实施例中，上述中止条件包括以下至少之一：

第一AI模型的在线学习次数大于预设迭代次数；

第一AI模型达到预设精度；

第一AI模型的输出结果的误差信息小于第七阈值；

第二设备突发性指示所述第一设备结束当前在线学习过程；

与第一AI模型关联的目标任务中止；

第一设备的测量信息分布与基准分布的差异信息小于第八阈值。

示例性地，上述与第一AI模型关联的目标任务可以为第一AI模型当前执行的任务，如对终端进行定位，为用户进行网络推荐等。

可选地，在本申请实施例中，上述参数配置信息包括以下至少之一：

第一AI模型的在线学习模式；

第一AI模型的样本批量的大小；

第一AI模型的优化器的状态；

第一AI模型的第一数据集的划分方式；

第一AI模型的第一数据集的构成信息；

第一AI模型的第一数据集对第一AI模型更新的贡献权重；

与第一信息关联的AI模型标识；

所述第一AI模型的基准分布；

其中，上述第一数据集以下至少之一：上述第一AI模型所使用的原始数据集，上述第一AI模型新采集的数据集；上述基准分布的参数信息包括以下至少之一：方差，均值，标准差；上述样本批量的大小是指一个样本批量(Batch)中包括的样本数量的大小。

可选地，上述原始数据集为：在对第一AI模型进行离线训练使用的数据集(即旧数据集)，上述新采集的数据集为：在第一设备侧在线部署第一AI模型，即为第一设备配置第一AI模型之后，在新环境下第一设备采集的数据集(即新数据集)。

可选地，上述在线学习模式包括以下任意一项：瞬时训练模式(即One-shot模式)，连续学习模式。示例性地，在One-shot模式下，第一设备在采集的数据达到指定数量的情况下进行在线学习；在连续学习模式下，第一设备随着采集的数据的数量的增加不断进行在线学习。

示例性地，上述批量(Batch)大小为N，且N为正整数。

示例性地，上述第一AI模型的优化器的状态可以包括损失函数，学习率等。

示例性地，第一数据集划分方式可以包括训练集、验证集和测试集划分比例等。

示例性地，上述数据集的构成信息，包括原始数据集的数量与新采集的数据集的数量之间的比例。需要说明是，本申请实施例中采用训练时的原始数据集可以有效防止在线学习过程中，对新采集的数据的过拟合，从而有效提升AI模型的性能。

示例性地，第一数据集对第一AI模型更新的贡献权重可以为：旧数据集和新数据集对上述第一AI模型更新的贡献权重，如在第一AI模型进行在线学习时，可以对原始数据集分配较小的权重，对新数据集分配较大的权重。

进一步可选地，在本申请实施例中，上述参数配置信息包括第一AI模型的在线学习模式、且在线学习模式为瞬时训练模式，上述参数配置信息还包括以下至少之一：上述第一设备所采集的数据量，上述数据量的采集时间长度。

进一步可选地，在本申请实施例中，上述参数配置信息包括上述第一AI模型的在线学习模式、且上述在线学习模式为连续学习模式，上述参数配置信息还包括以下至少之一：相邻两次在线学习的时间间隔，相邻两次在线学习的数据量间隔。

示例性地，上述相邻两次在线学习的数据量间隔可以为100，如每采集100组数据进行一次在线训练。

图3示出了本申请实施例提供的一种AI模型的在线学习方法的流程图。如图3所示，本申请实施例提供的AI模型的在线学习方法可以包括如下步骤301和步骤302：

步骤301：第一设备获取第一AI模型。

步骤302：第一设备基于第一AI模型的在线学习信息，对第一AI模型进行在线学习。

在本申请实施例中，第一设备可以基于第一AI模型的在线学习信息，对离线训练得到的第一AI模型进行在线学习，并得到参数调整后的第一AI模型。

在本申请实施例中，上述在线学习信息是由所述第一设备确定的信息。

在本申请实施例提供的AI模型的在线学习方法中，第一设备获取第一AI模型，并基于该第一AI模型的在线学习信息对该第一AI模型进行在线学习。通过该方法，通过在第一设备侧部署第一AI模型，并对该第一模型配置在线学习所需的参数，使得可以在第一设备侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证第一设备的服务质量。

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

可选地，在本申请实施例中，上述步骤301可以包括如下步骤301a：

步骤301a：第一设备接收第二设备配置的第一AI模型。

可选地，在本申请实施例中，上述第二设备包括以下至少一项：核心网设备，接入网设备，以及终端；上述第一设备包括以下至少一项：核心网设备，接入网设备，以及终端。

可选地，第二设备可以将离线训练得到的第一AI模型发送至第一设备，第一设备可以接收第二设备发送的该第一AI模型。

可选地，在本申请实施例中，上述步骤302之前，本申请实施例提供的在线学习方法还包括如下步骤A1：

步骤A1：第一设备从第二设备获取第一AI模型的在线学习信息。

可选地，在第二设备可以将第一AI模型在线学习所需的信息发送至第一设备的情况下，第一设备可以接收第二设备发送的在线学习信息，可以基于该在线学习信息对第一AI模型进行在线学习。

可选地，上述第一设备可以为终端，第二设备可以为核心网设备。

如此，通过第二设备为第一设备配置第一AI模型，以及配置该第一AI模型在线学习所需的参数，使得可以在第一设备侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证第一设备的服务质量。

可选地，在本申请实施例中，本申请实施例提供的在线学习方法还包括如下步骤303：

步骤303：第一设备为第三设备配置第一AI模型的在线学习信息。

可选地，第三设备包括以下至少一项：核心网设备，接入网设备，以及终端。

可选地，上述第一设备可以为核心网设备，第三设备可以为终端。

可选地，上述第二设备可以自主执行AI模型的在线学习方法，或者，第二设备可以将AI模型部署至第一设备，并为第一设备配置该AI模型在线学习所需的信息，由第一设备执行AI模型的在线学习，或者，第一设备可以将AI模型部署至第三设备，并为第一设备配置该AI模型在线学习所需的信息，由第三设备执行AI模型的在线学习。

第一设备的状态信息满足第一预设条件；

第一设备采集到的数据量大于第一阈值；

第一设备的测量信息满足第二预设条件；

第一AI模型的输出结果的误差信息大于第二阈值；

第一AI模型对应的第一信息的统计信息满足第三预设条件；

第一设备的测量信息的统计信息满足第四预设条件；

其中，上述状态信息包括以下至少一项：移动速度、波束切换信息、小区切换信息。

示例性地，上述信道信息可以包括以下至少之一：信号的发射角角度信息，信道中信号的时延信息，信道中的信号质量等等。

可选地，上述第一阈值可以为3000，5000或者7000等等。

示例性地，第一设备可以实时或者周期性获取状态信息，并在状态信息满足第一预设条件的情况下，对第一AI模型进行在线学习。

示例性地，在第一AI模型的计算过程中，第一设备可以实时或者周期性获取第一AI模型的输出结果的误差信息，或者第一AI模型的预测精度，并在误差信息大于第二阈值的情况下，对第一AI模型进行在线学习。

示例性地，第一设备可以统计第一AI模型的输入信息和输出信息，并在输入信息或者输出信息的统计信息满足第三预设条件的情况下，对第一AI模型进行在线学习。

示例性地，第一设备可以检测参考信号或者传感器采集的测量信息，并在测量信息满足第二预设条件，和/或，测量信息的统计信息满足第四预设条件的情况下，对第一AI模型进行在线学习。

可选地，在本申请实施例中，上述第一信息的统计信息包括以下至少之一：第一时间窗内第一信息的第一统计量，至少两个连续的第二时间窗内第一信息对应的第二统计量，第一小区下的至少两个终端在第一时刻的第一信息的统计信息，第一信息的相关性信息。

以下以第一信息为信道信息对上述第一信息的统计信息进行解释说明。

示例性地，在第一信息的统计信息包括至少两个连续的第二时间窗内上述第一信息对应的第二统计量的情况下，上述第一信息的统计信息可以为：终端在多个连续时间窗内的信道信息的均值的均值，如，时间窗1内信道信息的均值为a，时间窗2内信道信息的均值为b，时间窗3内信道信息的均值为c，则信道信息的统计信息为a，b和c的均值。

可选地，在本申请实施例中，上述第一设备的测量信息的统计信息包括以下至少之一：第三时间窗内针对上述测量信息的第三统计量，上述测量信息在至少两个连续的第四时间窗对应的第四统计量，上述测量信息的相关性信息。

上述第一设备的移动速度大于第三阈值；

上述小区切换信息指示第一设备发生小区切换。

示例性地，上述第三阈值可以为60km/h，80km/h，100km/等等。

进一步可选地，在本申请实施例中，上述触发条件包括：上述第一设备的测量信息满足第二预设条件；上述满足第二预设条件包括：第一设备的测量信息指示第一设备的相关信道的信道环境发生变化。

其中，上述测量信息包括以下至少之一：第一设备接收的参考信号的第一测量信息，第一设备的传感器采集的第二测量信息；可选地，上述第一测量信息包括以下至少之一：参考信号的瞬时测量信息，参考信号的统计测量信息；

其中，上述参考信号包括以下至少之一：同步信号块SSB、CSI参考信号CSI-RS、探测参考信号SRS、定位参考信号PRS。

进一步可选地，在本申请实施例中，上述触发条件包括：上述第一AI模型对应的第二信息的统计信息满足第三预设条件；上述满足第三预设条件包括以下至少之一：

上述第一统计量大于第一阈值区间的最大值；

上述第二统计量大于第二阈值区间的最大值；

上述第三统计量大于第三阈值区间的最大值；

上述第四统计量大于第四阈值区间的最大值；

在当前时间窗内采集的不同所述测量信息之间的相关性信息满足第四条件；

测量信息的分布与基准分布的差异大于第五阈值，上述基准分布为第二设备为第一设备配置的信息。

可选地，在本申请实施例中，上述触发方式的触发条件包括以下至少之一：

第二设备指示第一设备进行在线学习；

第一AI模型的输出精度小于或者等于第六阈值。

第二设备指示第一设备周期性进行在线学习；

第二设备指示第一设备半周期性进行在线学习；

第二设备指示第一设备非周期性进行在线学习。

其中，上述第一设备周期性或半周期性进行在线学习时采用的周期为：第二设备预配置的周期，或者，第一设备自主配置的周期。

进一步可选地，第二设备指示第一设备半周期性进行在线学习，包括：

第二设备通过第一信令指示第一设备半周期性进行在线学习，上述第一信令包括以下至少之一：媒体接入控制-控制单元MAC-CE，下行控制信息DCI。

第一AI模型的在线学习次数大于预设迭代次数；

第一AI模型达到预设精度；

第一AI模型的输出结果的误差信息小于第七阈值；

第二设备突发性指示第一设备结束当前在线学习过程；

与第一AI模型关联的目标任务中止；

示例性地，在对第一AI模型进行在线学习的过程中，第一设备可以实时或者周期性检测是否满足中止条件，并在满足中止条件的情况下，中止第一AI模型的在线学习。

示例性地，上述与第一AI模型关联的目标任务可以为第一AI模型当前执行的任务，如对终端进行定位，为用户进行网络推荐等等。

在一种示例中，第一设备可以在检测到第一AI模型的迭代次数大于预设迭代次数(如10000次)的情况下，中止第一AI模型的在线学习。在另一种示例中，第二设备可以在检测到第一AI模型的精度值达到预设精度的情况下，中止第一AI模型的在线学习。在又一种示例中，第二设备可以在检测到第一AI模型的输出结果的误差小于预设误差值的情况下，中止第一AI模型的在线学习。如此，第一设备可以基于上述AI模型的在线学习次数、达到的精度、输出结果的误差、以及与基准分布的差异满足条件的情况下，中止AI模型的在线学习，从而在提升模型预测精度的情况下，节省功耗。

需要说明的是，中止第一AI模型的在线学习可以为暂时停止第一AI模型的在线学习，或者结束第一AI模型的在线学习。

第一AI模型的在线学习模式；

第一AI模型的样本批量的大小；

第一AI模型的优化器的状态；

第一AI模型的第一数据集的划分方式；

第一AI模型的第一数据集的构成信息；

第一AI模型的第一数据集对所述AI模型更新的贡献权重；

与在线学习信息关联的AI模型标识；

第一AI模型的基准分布；

其中，上述第一数据集以下至少之一：第一AI模型所使用的原始数据集，第一AI模型新采集的数据集。上述基准分布的参数信息包括以下至少之一：方差，均值，标准差。

可选地，上述原始数据集为：在对第一AI模型进行离线训练使用的数据集(即旧数据集)，上述新采集的数据集为：在第一设备侧在线部署，即为第一设备配置第一AI模型之后，在新环境下第一设备采集的数据集(即新数据集)。

示例性地，上述批量(Batch)大小为N，且N为正整数。

示例性地，第一设备可以获取第一AI模型的参数配置信息，并基于该参数配置信息对该第一AI模型进行在线学习，从而保证该AI模型在变化的环境中的预测精度。

进一步可选地，在本申请实施例中，上述参数配置信息包括第一AI模型的在线学习模式、且在线学习模式为瞬时训练模式，上述参数配置信息还包括以下至少之一：第一设备所采集的数据量，数据量的采集时间长度。

进一步可选地，在本申请实施例中，上述参数配置信息包括第一AI模型的在线学习模式、且在线学习模式为连续学习模式，上述参数配置信息还包括以下至少之一：相邻两次在线学习的时间间隔，相邻两次在线学习的数据量间隔。

本申请实施例提供的AI模型的在线学习方法，执行主体可以为AI模型的在线学习装置。本申请实施例中以AI模型的在线装置执行AI模型的在线方法为例，说明本申请实施例提供的AI模型的在线学习装置。

本申请实施例提供一种AI模型的在线学习装置400，如图4所示，该AI模型的在线学习装置400包括：配置模块401，其中：所述配置模块401，用于第二设备为第一设备部署第一AI模型；所述配置401，还用于所述第二设备为所述第一设备配置所述第一AI模型的在线学习信息。

可选地，在本申请实施例中，所述在线学习信息包括以下至少之一：

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

可选地，在本申请实施例中，

所述触发方式对应的触发条件包括以下至少之一：

所述第一设备的状态信息满足第一预设条件；

所述第一设备采集到的数据量大于第一阈值；

所述第一设备的测量信息满足第二预设条件；

所述第一AI模型的输出结果的误差信息大于第二阈值；

所述第一AI模型对应的第一信息的统计信息满足第三预设条件；

所述第一设备的测量信息的统计信息满足第四预设条件；

其中，所述状态信息包括以下至少一项：移动速度、波束切换信息、小区切换信息；

所述第一信息包括以下至少之一：所述第一AI模型的输入信息，所述第一AI模型的输出信息。

可选地，在本申请实施例中，所述第一信息的统计信息包括以下至少之一：第一时间窗内所述第一信息的第一统计量，至少两个连续的第二时间窗内所述第一信息对应的第二统计量，第一小区下的至少两个终端在第一时刻的第一信息的统计信息，所述第一信息的相关性信息；

所述第二统计量是基于各个所述第二时间窗内的统计量计算出的；

所述第一设备的测量信息的统计信息包括以下至少之一：在第三时间窗内针对上述测量信息的第三统计量，所述测量信息在至少两个连续的第四时间窗对应的第四统计量，所述测量信息的相关性信息；

所述第四统计量是基于各个所述第四时间窗内的统计量计算出的；

所述相关性信息包括以下至少之一：数据之间的距离，协方差，相关系数。

可选地，在本申请实施例中，所述触发条件包括：所述第一设备的状态信息满足第一预设条件；

所述满足第一预设条件包括以下至少之一：

所述第一设备的移动速度大于第三阈值；

所述波束切换信息指示所述第一设备发生波束切换、且波束切换频率大于第四阈值；

所述小区切换信息指示所述第一设备发生小区切换。

可选地，在本申请实施例中，所述触发条件包括：所述第一设备接收的参考信号的测量信息满足第二预设条件；

所述满足第二预设条件包括：所述参考信号的测量信息指示所述第一设备的相关信道的信道环境发生变化；

其中，所述测量信息包括以下至少之一：所述第一设备接收的参考信号的第一测量信息，所述第一设备的传感器采集的第二测量信息；

所述第一测量信息包括以下至少之一：所述参考信号的瞬时测量信息，所述参考信号的统计测量信息；

所述参考信号包括以下至少之一：同步信号块SSB、CSI参考信号CSI-RS、探测参考信号SRS、定位参考信号PRS。

可选地，在本申请实施例中，所述触发条件包括：所述第一AI模型对应的第一信息的统计信息满足第三预设条件；

所述满足第三预设条件包括以下至少之一：

所述第一统计量大于第一阈值区间的最大值；

所述第二统计量大于第二阈值区间的最大值；

在至少两个时间窗内采集的所述第一信息的相关性信息满足第一条件；

在当前时间窗内采集的不同所述第一信息之间的相关性信息满足第二条件。

可选地，在本申请实施例中，所述触发条件包括：所述第一设备的测量信息的统计信息满足第四预设条件；

所述满足第四预设条件包括以下至少之一：

所述第三统计量大于第三阈值区间的最大值；

所述第四统计量大于第四阈值区间的最大值；

在至少两个时间窗内采集的所述测量信息的相关性信息满足第三条件；

所述测量信息的分布与基准分布的差异大于第五阈值，所述基准分布为所述第二设备为所述第一设备配置的信息。

可选地，在本申请实施例中，

所述触发方式的触发条件包括以下至少之一：

所述第二设备指示所述第一设备进行在线学习；

所述第一AI模型的输出精度小于或者等于第六阈值。

可选地，在本申请实施例中，所述第二设备指示所述第一设备进行在线学习，包括以下至少之一：

所述第二设备指示所述第一设备周期性进行在线学习；

所述第二设备指示所述第一设备半周期性进行在线学习；

所述第二设备指示所述第一设备非周期性进行在线学习。

其中，所述第一设备周期性或半周期性进行在线学习时采用的周期为：所述第二设备预配置的周期，或者，所述第一设备自主配置的周期。

可选地，在本申请实施例中，所述第二设备指示所述第一设备半周期性进行在线学习，包括：

所述第二设备通过第一信令指示所述第一设备半周期性进行在线学习，所述第一信令包括以下至少之一：媒体接入控制-控制单元MAC-CE，下行控制信息DCI。

可选地，在本申请实施例中，所述中止条件包括以下至少之一：

所述第一AI模型的在线学习次数大于预设迭代次数；

所述第一AI模型达到预设精度；

所述第一AI模型的输出结果的误差信息小于第七阈值；

所述第二设备突发性指示所述第一设备结束当前在线学习过程；

与所述第一AI模型关联的目标任务中止；

所述第一设备的测量信息分布与基准分布的差异信息小于第八阈值。

可选地，在本申请实施例中，所述参数配置信息包括以下至少之一：

所述AI模型的在线学习模式；

所述AI模型的样本批量的大小；

所述AI模型的优化器的状态；

所述AI模型的第一数据集的划分方式；

所述AI模型的第一数据集的构成信息；

所述AI模型的第一数据集对所述AI模型更新的贡献权重；

与所述第一信息关联的AI模型标识；

所述第一AI模型的基准分布；

其中，所述第一数据集以下至少之一：所述第一AI模型所使用的原始数据集，所述第一AI模型新采集的数据集；

所述基准分布的参数信息包括以下至少之一：方差，均值，标准差。

可选地，在本申请实施例中，所述参数配置信息包括所述第一AI模型的在线学习模式、且所述在线学习模式为瞬时训练模式，所述参数配置信息还包括以下至少之一：所述第一设备所采集的数据量，所述数据量的采集时间长度。

可选地，在本申请实施例中，所述参数配置信息包括所述第一AI模型的在线学习模式、且所述在线学习模式为连续学习模式，所述参数配置信息还包括以下至少之一：相邻两次在线学习的时间间隔，相邻两次在线学习的数据量间隔。

可选地，在本申请实施例中，所述第二设备包括以下至少一项：核心网设备，接入网设备，终端；所述第一设备包括以下至少一项：核心网设备，接入网设备，终端。

在本申请实施例提供的AI模型的在线学习装置中，第二设备为第一设备配置第一AI模型，以及为该第一设备配置上述第一AI模型的在线学习信息。通过该方法，通过在第一设备侧部署第一AI模型，并对该第一模型配置在线学习所需的参数，使得可以在第一设备侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证第一设备的服务质量。

本申请实施例提供一种AI模型的在线学习装置500，如图5所示，该AI模型的在线学习装置500包括：获取模块501和执行模块502，其中：所述获取模块501，用于所述第一设备获取第一AI模型；所述执行模块502，用于所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

可选地，在本申请实施例中，所述第一设备获取第一AI模型，包括：

第一设备接收第二设备配置的第一AI模型。

可选地，在本申请实施例中，所述获取模块，具体用于

从所述第二设备获取所述第一AI模型的在线学习信息。

可选地，在本申请实施例中，所述装置还包括：配置模块，所述配置模块用于为第三设备配置所述第一AI模型的在线学习信息。

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

可选地，在本申请实施例中，所述触发方式对应的触发条件包括以下至少之一：

所述第一设备的状态信息满足第一预设条件；

所述第一设备采集到的数据量大于第一阈值；

所述第一设备的测量信息满足第二预设条件；

所述第一AI模型的输出结果的误差信息大于第二阈值；

所述第一设备的测量信息的统计信息满足第四预设条件；

所述满足第一预设条件包括以下至少之一：

所述第一设备的移动速度大于第三阈值；

所述小区切换信息指示所述第一设备发生小区切换。

可选地，在本申请实施例中，所述触发条件包括：所述第一AI模型对应的第二信息的统计信息满足第三预设条件；

所述满足第三预设条件包括以下至少之一：

所述第一统计量大于第一阈值区间的最大值；

所述第二统计量大于第二阈值区间的最大值；

所述满足第四预设条件包括以下至少之一：

所述第三统计量大于第三阈值区间的最大值；

所述第四统计量大于第四阈值区间的最大值；

所述第二设备指示所述第一设备进行在线学习；

所述第一AI模型的输出精度小于或者等于第六阈值。

所述第二设备指示所述第一设备周期性进行在线学习；

所述第二设备指示所述第一设备半周期性进行在线学习；

所述第二设备指示所述第一设备非周期性进行在线学习。

所述第一AI模型的在线学习次数大于预设迭代次数；

所述第一AI模型达到预设精度；

所述第一AI模型的输出结果的误差信息小于第七阈值；

与所述第一AI模型关联的目标任务中止；

所述AI模型的在线学习模式；

所述AI模型的样本批量的大小；

所述AI模型的优化器的状态；

所述AI模型的第一数据集的划分方式；

所述AI模型的第一数据集的构成信息；

所述AI模型的第一数据集对所述AI模型更新的贡献权重；

与所述第一信息关联的AI模型标识；

所述第一AI模型的基准分布；

可选地，在本申请实施例中，所述第二设备、第一设备以及第三设备包括以下至少一项：核心网设备，接入网设备，以及终端。

在本申请实施例提供的AI模型的在线学习装置中，第一设备获取第一AI模型，并基于该第一AI模型的在线学习信息对该第一AI模型进行在线学习。通过该方法，通过在第一设备侧部署第一AI模型，并对该第一模型配置在线学习所需的参数，使得可以在第一设备侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证第一设备的服务质量。

本申请实施例中的AI模型的在线学习装置可以是电子设备，例如具有操作***的电子设备，也可以是电子设备中的部件，例如集成电路或芯片。该电子设备可以是终端，也可以为除终端之外的其他设备。示例性的，终端可以包括但不限于上述所列举的终端11的类型，其他设备可以为服务器、网络附属存储器(Network Attached Storage，NAS)等，本申请实施例不作具体限定。

本申请实施例提供的AI模型的在线学习装置能够实现图1至图3的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

可选的，如图6所示，本申请实施例还提供一种通信设备600，包括处理器601和存储器602，存储器602上存储有可在所述处理器601上运行的程序或指令，例如，该通信设备600为终端时，该程序或指令被处理器601执行时实现上述AI模型的在线学习方法实施例的各个步骤，且能达到相同的技术效果。该通信设备600为网络侧设备时，该程序或指令被处理器601执行时实现上述AI模型的在线学习方法实施例的各个步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

以第一设备为终端为例。

本申请实施例还提供一种终端，包括处理器和通信接口，处理器用于获取第一AI模型，基于第一AI模型的在线学习信息，对第一AI模型进行在线学习。该终端实施例与上述终端侧方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中，且能达到相同的技术效果。具体地，图7为实现本申请实施例的一种终端的硬件结构示意图。

该终端700包括但不限于：射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709以及处理器710等中的至少部分部件。

本领域技术人员可以理解，终端700还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理***与处理器710逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图7中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

应理解的是，本申请实施例中，输入单元704可以包括图形处理单元(GraphicsProcessing Unit，GPU)7041和麦克风7042，图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072中的至少一种。触控面板7071，也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

本申请实施例中，射频单元701接收来自网络侧设备的下行数据后，可以传输给处理器710进行处理；另外，射频单元701可以向网络侧设备发送上行数据。通常，射频单元701包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。

存储器709可用于存储软件程序或指令以及各种数据。存储器709可主要包括存储程序或指令的第一存储区和存储数据的第二存储区，其中，第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外，存储器709可以包括易失性存储器或非易失性存储器，或者，存储器709可以包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(SynchronousDRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM，DRRAM)。本申请实施例中的存储器709包括但不限于这些和任意其它适合类型的存储器。

处理器710可包括一个或多个处理单元；可选的，处理器710集成应用处理器和调制解调处理器，其中，应用处理器主要处理涉及操作***、用户界面和应用程序等的操作，调制解调处理器主要处理无线通信信号，如基带处理器。可以理解的是，上述调制解调处理器也可以不集成到处理器710中。

其中，所述处理器710用于所述第一设备获取第一AI模型，所述处理器710，还用于所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

可选地，在本申请实施例中，所述射频单元701，用于接收第二设备配置的第一AI模型。

可选地，在本申请实施例中，所述处理器710，具体用于从所述第二设备获取所述第一AI模型的在线学习信息。

可选地，在本申请实施例中，所述处理器710，还用于为第三设备配置所述第一AI模型的在线学习信息。

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

所述第一设备的状态信息满足第一预设条件；

所述第一设备采集到的数据量大于第一阈值；

所述第一设备的测量信息满足第二预设条件；

所述第一AI模型的输出结果的误差信息大于第二阈值；

所述第一设备的测量信息的统计信息满足第四预设条件；

所述满足第一预设条件包括以下至少之一：

所述第一设备的移动速度大于第三阈值；

所述小区切换信息指示所述第一设备发生小区切换。

所述满足第三预设条件包括以下至少之一：

所述第一统计量大于第一阈值区间的最大值；

所述第二统计量大于第二阈值区间的最大值；

所述满足第四预设条件包括以下至少之一：

所述第三统计量大于第三阈值区间的最大值；

所述第四统计量大于第四阈值区间的最大值；

所述第二设备指示所述第一设备进行在线学习；

所述第一AI模型的输出精度小于或者等于第六阈值。

所述第二设备指示所述第一设备周期性进行在线学习；

所述第二设备指示所述第一设备半周期性进行在线学习；

所述第二设备指示所述第一设备非周期性进行在线学习。

所述第一AI模型的在线学习次数大于预设迭代次数；

所述第一AI模型达到预设精度；

所述第一AI模型的输出结果的误差信息小于第七阈值；

与所述第一AI模型关联的目标任务中止；

所述AI模型的在线学习模式；

所述AI模型的样本批量的大小；

所述AI模型的优化器的状态；

所述AI模型的第一数据集的划分方式；

所述AI模型的第一数据集的构成信息；

所述AI模型的第一数据集对所述AI模型更新的贡献权重；

与所述第一信息关联的AI模型标识；

所述第一AI模型的基准分布；

在本申请实施例提供的终端中，终端获取第一AI模型，并基于该第一AI模型的在线学习信息对该第一AI模型进行在线学习。通过该方法，通过在终端侧部署第一AI模型，并对该第一模型配置在线学习所需的参数，使得可以在终端侧对该第一AI模型进行连续在线调整，从而维持第一AI模型的预测性能，进而保证终端的服务质量。

以第二设备为网络侧设备为例。

本申请实施例还提供一种网络侧设备，包括处理器和通信接口，处理器用于为第一设备配置第一AI模型；以及为该第一设备配置上述第一AI模型的在线学习信息。该网络侧设备实施例与上述网络侧设备方法实施例对应，上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中，且能达到相同的技术效果。

具体地，本申请实施例还提供了一种网络侧设备。如图8所示，该网络侧设备800包括：天线81、射频装置82、基带装置83、处理器84和存储器85。天线81与射频装置82连接。在上行方向上，射频装置82通过天线81接收信息，将接收的信息发送给基带装置83进行处理。在下行方向上，基带装置83对要发送的信息进行处理，并发送给射频装置82，射频装置82对收到的信息进行处理后经过天线81发送出去。

以上实施例中网络侧设备执行的方法可以在基带装置83中实现，该基带装置83包括基带处理器。

基带装置83例如可以包括至少一个基带板，该基带板上设置有多个芯片，如图8所示，其中一个芯片例如为基带处理器，通过总线接口与存储器85连接，以调用存储器85中的程序，执行以上方法实施例中所示的网络设备操作。

该网络侧设备还可以包括网络接口86，该接口例如为通用公共无线接口(commonpublic radio interface，CPRI)。

具体地，本发明实施例的网络侧设备800还包括：存储在存储器85上并可在处理器84上运行的指令或程序，处理器84调用存储器85中的指令或程序执行图4所示各模块执行的方法，并达到相同的技术效果，为避免重复，故不在此赘述。

具体地，本申请实施例还提供了一种网络侧设备。如图9所示，该网络侧设备900包括：处理器901、网络接口902和存储器903。其中，网络接口902例如为通用公共无线接口(common public radio interface，CPRI)。

具体地，本发明实施例的网络侧设备900还包括：存储在存储器903上并可在处理器901上运行的指令或程序，处理器901调用存储器903中的指令或程序执行图4所示各模块执行的方法，并达到相同的技术效果，为避免重复，故不在此赘述。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述AI模型的在线学习方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现上AI模型的在线学习方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为***级芯片，***芯片，芯片***或片上***芯片等。

本申请实施例另提供了一种计算机程序/程序产品，所述计算机程序/程序产品被存储在存储介质中，所述计算机程序/程序产品被至少一个处理器执行以实现上述AI模型的在线学习方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供了一种通信***，包括：终端及网络侧设备，所述终端可用于执行如上所述的AI模型的在线学习方法的步骤，所述网络侧设备可用于执行如上所述的AI模型的在线学习方法的步骤。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种人工智能AI模型的在线学习方法，其特征在于，所述方法包括：

第一设备获取第一AI模型；

所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

2.根据权利要求1所述的方法，其特征在于，所述第一设备获取第一AI模型，包括：

第一设备接收第二设备配置的第一AI模型。

3.根据权利要求1或2所述的方法，其特征在于，所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习之前，所述方法还包括：

所述第一设备从所述第二设备获取所述第一AI模型的在线学习信息。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

所述第一设备为第三设备配置所述第一AI模型的在线学习信息。

5.根据权利要求1所述的方法，其特征在于，所述在线学习信息包括以下至少之一：

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

6.根据权利要求5所述的方法，其特征在于，

所述触发方式对应的触发条件包括以下至少之一：

所述第一设备的状态信息满足第一预设条件；

所述第一设备采集到的数据量大于第一阈值；

所述第一设备的测量信息满足第二预设条件；

所述第一AI模型的输出结果的误差信息大于第二阈值；

所述第一设备的测量信息的统计信息满足第四预设条件；

7.根据权利要求6所述的方法，其特征在于，

所述第一信息的统计信息包括以下至少之一：第一时间窗内所述第一信息的第一统计量，至少两个连续的第二时间窗内所述第一信息对应的第二统计量，第一小区下的至少两个终端在第一时刻的第一信息的统计信息，所述第一信息的相关性信息；

所述第二统计量是基于各个所述第二时间窗内的统计量计算出的。

8.根据权利要求7所述的方法，其特征在于，所述第三预设条件包括以下至少之一：

所述第一统计量大于第一阈值区间的最大值；

所述第二统计量大于第二阈值区间的最大值；

9.根据权利要求6所述的方法，其特征在于，

所述第一设备的测量信息的统计信息包括以下至少之一：在第三时间窗内针对所述测量信息的第三统计量，所述测量信息在至少两个连续的第四时间窗对应的第四统计量，所述测量信息的相关性信息；

10.根据权利要求9所述的方法，其特征在于，所述满足第四预设条件包括以下至少之一：

所述第三统计量大于第三阈值区间的最大值；

所述第四统计量大于第四阈值区间的最大值；

11.根据权利要求6所述的方法，其特征在于，所述触发条件包括：所述第一设备的状态信息满足第一预设条件；

所述满足第一预设条件包括以下至少之一：

所述第一设备的移动速度大于第三阈值；

所述小区切换信息指示所述第一设备发生小区切换。

12.根据权利要求6所述的方法，其特征在于，所述触发条件包括：所述第一设备的测量信息满足第二预设条件；

所述满足第二预设条件包括：所述测量信息指示所述第一设备的相关信道的信道环境发生变化；

13.根据权利要求5所述的方法，其特征在于，

所述触发方式的触发条件包括以下至少之一：

所述第二设备指示所述第一设备进行在线学习；

所述第一AI模型的输出精度小于或者等于第六阈值。

14.根据权利要求13所述的方法，其特征在于，

所述第二设备指示所述第一设备进行在线学习，包括以下至少之一：

所述第二设备指示所述第一设备周期性进行在线学习；

所述第二设备指示所述第一设备半周期性进行在线学习；

所述第二设备指示所述第一设备非周期性进行在线学习；

15.根据权利要求5所述的方法，其特征在于，所述中止条件包括以下至少之一：

所述第一AI模型的在线学习次数大于预设迭代次数；

所述第一AI模型达到预设精度；

所述第一AI模型的输出结果的误差信息小于第七阈值；

与所述第一AI模型关联的目标任务中止；

16.根据权利要求5所述的方法，其特征在于，所述参数配置信息包括以下至少之一：

所述第一AI模型的在线学习模式；

所述第一AI模型的样本批量的大小；

所述第一AI模型的优化器的状态；

所述第一AI模型的第一数据集的划分方式；

所述第一AI模型的第一数据集的构成信息；

所述第一AI模型的第一数据集对所述第一AI模型更新的贡献权重；

与所述在线学习信息关联的AI模型标识；

所述第一AI模型的基准分布；

17.根据权利要求16所述的方法，其特征在于，所述参数配置信息包括所述第一AI模型的在线学习模式、且所述在线学习模式为瞬时训练模式，所述参数配置信息还包括以下至少之一：所述第一设备所采集的数据量，所述数据量的采集时间长度。

18.根据权利要求16所述的方法，其特征在于，所述参数配置信息包括所述第一AI模型的在线学习模式、且所述在线学习模式为连续学习模式，所述参数配置信息还包括以下至少之一：相邻两次在线学习的时间间隔，相邻两次在线学习的数据量间隔。

19.根据权利要求1所述的方法，其特征在于，所述第二设备、第一设备以及第三设备包括以下至少一项：核心网设备，接入网设备，以及终端。

20.一种人工智能AI模型的在线学习方法，其特征在于，所述方法包括：

第二设备为第一设备配置第一AI模型；

所述第二设备为所述第一设备配置所述第一AI模型的在线学习信息。

21.根据权利要求20所述的方法，其特征在于，所述在线学习信息包括以下至少之一：

在线学习的触发方式；

在线学习的中止条件；

在线学习的参数配置信息；

在线学习的数据集。

22.根据权利要求21所述的方法，其特征在于，

所述触发方式对应的触发条件包括以下至少之一：

所述第一设备的状态信息满足第一预设条件；

所述第一设备采集到的数据量大于第一阈值；

所述第一设备的测量信息满足第二预设条件；

所述第一AI模型的输出结果的误差信息大于第二阈值；

所述第一设备的测量信息的统计信息满足第四预设条件；

23.根据权利要求22所述的方法，其特征在于，

24.根据权利要求23所述的方法，其特征在于，所述第三预设条件包括以下至少之一：

所述第一统计量大于第一阈值区间的最大值；

所述第二统计量大于第二阈值区间的最大值；

25.根据权利要求22所述的方法，其特征在于，

26.根据权利要求25所述的方法，其特征在于，所述满足第四预设条件包括以下至少之一：

所述第三统计量大于第三阈值区间的最大值；

所述第四统计量大于第四阈值区间的最大值；

27.根据权利要求22所述的方法，其特征在于，所述触发条件包括：所述第一设备的状态信息满足第一预设条件；

所述满足第一预设条件包括以下至少之一：

所述第一设备的移动速度大于第三阈值；

所述小区切换信息指示所述第一设备发生小区切换。

28.根据权利要求22所述的方法，其特征在于，所述触发条件包括：所述第一设备的测量信息满足第二预设条件；

29.根据权利要求21所述的方法，其特征在于，

所述触发方式的触发条件包括以下至少之一：

所述第二设备指示所述第一设备进行在线学习；

所述第一AI模型的输出精度小于或者等于第六阈值。

30.根据权利要求29所述的方法，其特征在于，

所述第二设备指示所述第一设备周期性进行在线学习；

所述第二设备指示所述第一设备半周期性进行在线学习；

所述第二设备指示所述第一设备非周期性进行在线学习；

31.根据权利要求21所述的方法，其特征在于，所述中止条件包括以下至少之一：

所述第一AI模型的在线学习次数大于预设迭代次数；

所述第一AI模型达到预设精度；

所述第一AI模型的输出结果的误差信息小于第七阈值；

与所述第一AI模型关联的目标任务中止；

32.根据权利要求21所述的方法，其特征在于，所述参数配置信息包括以下至少之一：

所述第一AI模型的在线学习模式；

所述第一AI模型的样本批量的大小；

所述第一AI模型的优化器的状态；

所述第一AI模型的第一数据集的划分方式；

所述第一AI模型的第一数据集的构成信息；

所述第一AI模型的第一数据集对所述AI模型更新的贡献权重；

与所述在线学习信息关联的AI模型标识；

所述第一AI模型的基准分布；

33.根据权利要求32所述的方法，其特征在于，所述参数配置信息包括所述第一AI模型的在线学习模式、且所述在线学习模式为瞬时训练模式，所述参数配置信息还包括以下至少之一：所述第一设备所采集的数据量，所述数据量的采集时间长度。

34.根据权利要求33所述的方法，其特征在于，所述参数配置信息包括所述第一AI模型的在线学习模式、且所述在线学习模式为连续学习模式，所述参数配置信息还包括以下至少之一：相邻两次在线学习的时间间隔，相邻两次在线学习的数据量间隔。

35.根据权利要求20所述的方法，其特征在于，所述第二设备包括以下至少一项：核心网设备，接入网设备，终端；所述第一设备包括以下至少一项：核心网设备，接入网设备，终端。

36.一种AI模型的在线学习装置，其特征在于，所述装置包括：配置模块，其中：

所述配置模块，用于第二设备为第一设备配置第一AI模型；

所述配置模块，还用于所述第二设备为所述第一设备配置所述第一AI模型的在线学习信息。

37.一种人工智能AI模型的在线学习装置，其特征在于，所述装置包括：获取模块和执行模块，其中：

所述获取模块，用于所述第一设备获取第一AI模型；

所述执行模块，用于所述第一设备基于所述第一AI模型的在线学习信息，对所述第一AI模型进行在线学习。

38.一种通信设备，其特征在于，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至19任一项所述的AI模型的在线学习方法的步骤。

39.一种通信设备，其特征在于，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求20至35任一项所述的AI模型的在线学习方法的步骤。

40.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-19任一项所述的AI模型的在线学习方法，或者实现如权利要求20至35任一项所述的AI模型的在线学习方法的步骤。