CN117835405A - 人工智能ai模型传输方法、装置、终端及介质 - Google Patents

人工智能ai模型传输方法、装置、终端及介质 Download PDF

Info

Publication number
CN117835405A
CN117835405A CN202211167997.0A CN202211167997A CN117835405A CN 117835405 A CN117835405 A CN 117835405A CN 202211167997 A CN202211167997 A CN 202211167997A CN 117835405 A CN117835405 A CN 117835405A
Authority
CN
China
Prior art keywords
model
target
transmission mode
information
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211167997.0A
Other languages
English (en)
Inventor
杨昂
孙鹏
吴昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202211167997.0A priority Critical patent/CN117835405A/zh
Priority to PCT/CN2023/120138 priority patent/WO2024061287A1/zh
Publication of CN117835405A publication Critical patent/CN117835405A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • H04W72/046Wireless resource allocation based on the type of the allocated resource the resource being in the space domain, e.g. beams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0619Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal using feedback from receiving side
    • H04B7/0621Feedback content
    • H04B7/0626Channel coefficients, e.g. channel state information [CSI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0619Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal using feedback from receiving side
    • H04B7/0621Feedback content
    • H04B7/0632Channel quality parameters, e.g. channel quality indicator [CQI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0619Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal using feedback from receiving side
    • H04B7/0636Feedback format
    • H04B7/0639Using selective indices, e.g. of a codebook, e.g. pre-distortion matrix index [PMI] or for beam selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L5/00Arrangements affording multiple use of the transmission path
    • H04L5/003Arrangements for allocating sub-channels of the transmission path
    • H04L5/0048Allocation of pilot signals, i.e. of signals known to the receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W16/00Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
    • H04W16/24Cell structures
    • H04W16/28Cell structures using beam steering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/04Wireless resource allocation
    • H04W72/044Wireless resource allocation based on the type of the allocated resource
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/50Allocation or scheduling criteria for wireless resources
    • H04W72/56Allocation or scheduling criteria for wireless resources based on priority criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请公开了一种人工智能AI模型传输方法、装置、终端及介质,属于通信技术领域,本申请实施例的AI模型传输方法包括:第一设备从第二设备接收目标AI模型的目标模型信息;第一设备根据目标模型信息,得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式。

Description

人工智能AI模型传输方法、装置、终端及介质
技术领域
本申请属于通信技术领域,具体涉及一种AI模型传输方法、装置、终端及介质。
背景技术
目前,在无线通信网络中,终端设备可以从其他设备接收训练好的人工智能(Artificial Intelligence,AI)模型,并使用训练好的AI模型进行通信,从而可以提升通信的吞吐量,且降低通信的时延。
但是,由于可能会出现终端设备无法应用从其他设备接收的训练好的AI模型的情况,此时,终端设备可能需要与其他设备进行多次传输,才可以得到终端设备能够应用的训练好的AI模型,以使用训练好的AI模型进行通信。
因此,可能会导致传输资源的浪费。
发明内容
本申请实施例提供一种AI模型传输方法、装置、终端及介质,能够解决传输资源浪费的问题。
第一方面,提供了一种AI模型传输方法,应用于第一设备,该方法包括:第一设备从第二设备接收目标AI模型的目标模型信息;第一设备根据目标模型信息,得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
第二方面,提供了一种AI模型传输装置,该AI模型传输装置为第一AI模型传输装置,该第一AI模型传输装置包括:接收模块。其中,接收模块,用于从第二AI模型传输装置接收目标AI模型的目标模型信息;第一AI模型传输装置根据目标模型信息,得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一AI模型传输装置向第二AI模型传输装置发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
第三方面,提供了一种AI模型传输方法,应用于第二设备,该方法包括:第二设备向第一设备发送目标AI模型的目标模型信息;该目标模型信息用于第一设备得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
第四方面,提供了一种AI模型传输装置,该AI模型传输装置为第二AI模型传输装置,该第二AI模型传输装置包括:发送模块。其中,发送模块,用于向第一AI模型传输装置发送目标AI模型的目标模型信息;该目标模型信息用于第一设备得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一AI模型传输装置向第二AI模型传输装置发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
第五方面,提供了一种终端,该终端包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤,或实现如第三方面所述的方法的步骤。
第六方面,提供了一种终端,包括处理器及通信接口,其中,该通信接口用于从第二设备接收目标AI模型的目标模型信息,该处理器用于根据目标模型信息,得到目标AI模型;或者,该通信结构用于向第一设备发送目标AI模型的目标模型信息,该目标AI模型用于第一设备得到目标AI模型。其中,该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一AI模型传输装置向第二AI模型传输装置发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
第七方面,提供了一种网络侧设备,该网络侧设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤,或实现如第三方面所述的方法的步骤。
第八方面,提供了一种网络侧设备,包括处理器及通信接口,其中,该通信接口用于从第二设备接收目标AI模型的目标模型信息,该处理器用于根据目标模型信息,得到目标AI模型;或者,该通信结构用于向第一设备发送目标AI模型的目标模型信息,该目标AI模型用于第一设备得到目标AI模型。其中,该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一AI模型传输装置向第二AI模型传输装置发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
第九方面,提供了一种AI模型传输***,包括:第一终端及第二终端,该第一终端可用于执行如第一方面所述的方法的步骤,该第二终端可用于执行如第三方面所述的方法的步骤。
第十方面,提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤,或者实现如第三方面所述的方法的步骤。
第十一方面,提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法的步骤,或实现如第三方面所述的方法的步骤。
第十二方面,提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现如第一方面所述的方法的步骤,或实现如第三方面所述的方法的步骤。
在本申请实施例中,第一设备可以从第二设备接收目标AI模型的目标模型信息,并根据目标模型信息,得到目标AI模型,该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况;其中,上述目标传输模式包括第一传输模式和第二传输模式中的任一个;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。由于目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的,因此,可以避免因第一设备不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一设备向第二设备发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二设备可以直接根据目标反馈事件,向第一设备发送第一设备能够应用的AI模型,而无需第一设备与第二设备进行多次传输。从而可以减少在得到目标AI模型的过程中,第一设备与第二设备进行传输的次数,如此,可以节省传输资源。
附图说明
图1是本申请实施例提供的一种无线通信***的框图;
图2是本申请实施例提供的AI模型传输方法的流程示意图之一;
图3是本申请实施例提供的AI模型传输方法的流程示意图之二;
图4是本申请实施例提供的AI模型传输方法的流程示意图之三;
图5是本申请实施例提供的AI模型传输方法的流程示意图之四;
图6是本申请实施例提供的AI模型传输方法的流程示意图之五;
图7是本申请实施例提供的第一AI模型传输装置的结构示意图;
图8是本申请实施例提供的第二AI模型传输装置的结构示意图;
图9是本申请实施例提供的通信设备的结构示意图;
图10是本申请实施例提供的终端的硬件结构示意图;
图11是本申请实施例提供的网络侧设备的硬件结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
以下将对本申请实施例涉及的术语进行说明。
1、AI模型
目前,AI模型已经在各个领域得到了广泛的应用。通常,可以采用训练样本对AI模型进行训练,以得到训练好的AI模型,从而可以使用训练好的AI模型进行通信,以提升通信的吞吐量,且降低通信的时延。
其中,AI模型可以包括以下至少一项:神经网络模型、决策树模型、支持向量机模型、贝叶斯分类器模型等。
2、其他术语
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
值得指出的是,本申请实施例所描述的技术不限于长期演进型(Long TermEvolution,LTE)/LTE的演进(LTE-Advanced,LTE-A)***,还可用于其他无线通信***,诸如码分多址(Code Division Multiple Access,CDMA)、时分多址(Time DivisionMultiple Access,TDMA)、频分多址(Frequency Division Multiple Access,FDMA)、正交频分多址(Orthogonal Frequency Division Multiple Access,OFDMA)、单载波频分多址(Single-carrier Frequency Division Multiple Access,SC-FDMA)和其他***。本申请实施例中的术语“***”和“网络”常被可互换地使用,所描述的技术既可用于以上提及的***和无线电技术,也可用于其他***和无线电技术。以下描述出于示例目的描述了新空口(New Radio,NR)***,并且在以下大部分描述中使用NR术语,但是这些技术也可应用于NR***应用以外的应用,如第6代(6th Generation,6G)通信***。
图1示出本申请实施例可应用的一种无线通信***的框图。无线通信***包括终端11和网络侧设备12。其中,终端11可以是手机、平板电脑(Tablet Personal Computer)、膝上型电脑(Laptop Computer)或称为笔记本电脑、个人数字助理(Personal DigitalAssistant,PDA)、掌上电脑、上网本、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、移动上网装置(Mobile Internet Device,MID)、增强现实(augmentedreality,AR)/虚拟现实(virtual reality,VR)设备、机器人、可穿戴式设备(WearableDevice)、车载设备(VUE)、行人终端(PUE)、智能家居(具有无线通信功能的家居设备,如冰箱、电视、洗衣机或者家具等)、游戏机、个人计算机(personal computer,PC)、柜员机或者自助机等终端侧设备,可穿戴式设备包括:智能手表、智能手环、智能耳机、智能眼镜、智能首饰(智能手镯、智能手链、智能戒指、智能项链、智能脚镯、智能脚链等)、智能腕带、智能服装等。需要说明的是,在本申请实施例并不限定终端11的具体类型。网络侧设备12可以包括接入网设备或核心网设备,其中,接入网设备12也可以称为无线接入网设备、无线接入网(Radio Access Network,RAN)、无线接入网功能或无线接入网单元。接入网设备12可以包括基站、WLAN接入点或WiFi节点等,基站可被称为节点B、演进节点B(eNB)、接入点、基收发机站(Base Transceiver Station,BTS)、无线电基站、无线电收发机、基本服务集(BasicService Set,BSS)、扩展服务集(Extended Service Set,ESS)、家用B节点、家用演进型B节点、发送接收点(Transmitting Receiving Point,TRP)或所述领域中其他某个合适的术语,只要达到相同的技术效果,所述基站不限于特定技术词汇,需要说明的是,在本申请实施例中仅以NR***中的基站为例进行介绍,并不限定基站的具体类型。
下面结合附图,通过一些实施例及其应用场景对本申请实施例提供的AI模型传输方法、装置、终端及介质进行详细地说明。
图2示出了本申请实施例提供的一种AI模型传输方法的流程图。如图2所示,本申请实施例提供的AI模型传输方法可以包括下述的步骤101和步骤102。
步骤101、第一设备从第二设备接收目标AI模型的目标模型信息。
可选地,本申请实施例中,上述第一设备可以为以下任一项:用户设备(UserEquipment,UE)、网络侧设备。上述第二设备可以为以下任一项:UE、网络侧设备。
在一种示例中,第一设备可以为UE,且第二设备可以为网络侧设备。
在另一种示例中,第一设备可以为网络侧设备,第二设备可以为UE。
在又一种示例中,第一设备和第二设备均为UE。
在又一种示例中,第一设备和第二设备均为网络侧设备。例如,第一设备和第二设备可以为网络侧的不同节点;或者,第一设备和第二设备可以为网络侧的不同终端节点。
可选地,本申请实施例中,上述目标AI模型可以为以下任一项:神经网络模型、决策树模型、支持向量机模型、贝叶斯分类器模型等。
可选地,本申请实施例中,目标模型信息可以包括以下至少一项:目标AI模型的模型结构信息、目标AI模型的模型参数信息。
其中,上述目标AI模型的模型结构信息用于指示目标AI模型的模型结构。上述目标AI模型的模型参数信息可以为AI模型的权重值。
示例性地,假设目标AI模型为神经网络模型,则目标AI模型的模型参数信息可以为该神经网络模型的至少部分神经元的权重值。这里,神经元的权重值可以包括以下任一项:权值系数、乘性系数、偏置系数、加性系数、激活函数的类型、激活函数的系数。
本申请实施例中,上述目标AI模型满足以下至少一项:
目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;
目标AI模型的目标应用时间,是根据目标传输模式确定的;
目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。
本申请实施例中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
其中,第一传输模式为:传输AI模型的模型结构信息和模型参数信息的传输模式;该第二传输模式为:传输AI模型的模型参数信息的传输模式。
可以理解,在目标传输模式为第一传输模式的情况下,第一设备会从第二设备接收目标AI模型的模型结构信息和模型参数信息。在目标传输模式为第二传输模式的情况下,第一设备会从第二设备接收目标AI模型的模型参数信息。
其中,上述第一设备支持的AI模型传输模式的能力包括以下任一项:
支持第一传输模式;
支持第二传输模式;
支持第一传输模式和第二传输模式。
可选地,本申请实施例中,目标传输模式可以是第一设备根据第一设备支持的AI模型传输模式的能力确定的;或者,可以是第二设备根据第一设备支持的AI模型传输模式的能力确定的。
本申请实施例中,上述目标应用时间为目标AI模型的切换时间或生效时间。
需要说明的是,上述“目标AI模型的切换时间”可以理解为:第一设备将接收目标AI模型之前应用的AI模型去激活所需的时长。上述“目标AI模型的生效时间”可以理解为:第一设备将接收目标AI模型之前应用的AI模型去激活,且将目标AI模型激活所需的时长。
可选地,本申请实施例中,目标应用时间可以是第一设备根据目标传输模式确定的;或者,可以是第二设备根据目标传输模式确定的。
可选地,本申请实施例中,上述目标AI模型的应用情况可以包括以下至少一项:第一设备是否应用目标AI模型、第一设备对接收目标AI模型之前应用的AI模型的使用情况、目标AI模型的模型标识信息、第一设备未应用目标AI模型的原因。
步骤102、第一设备根据目标模型信息,得到目标AI模型。
可选地,本申请实施例中,在目标传输模式为第一传输模式的情况下,第一设备会从第二设备接收目标AI模型的模型结构信息和模型参数信息,从而第一设备可以先对目标AI模型的模型结构信息进行编译(或重编译),以确定目标AI模型的模型结构,再将目标AI模型的模型参数信息应用于目标AI模型的模型结构中,以得到目标AI模型。
在目标传输模式为第二传输模式的情况下,第一设备会从第二设备接收目标AI模型的模型参数信息,从而第一设备可以将目标AI模型的模型参数信息应用于第一设备中预存的模型结构中,以得到目标AI模型。这里,第一设备不需要先对目标AI模型的模型结构信息进行编译(或重编译)。
本申请实施例中,在第一设备得到目标AI模型之后,第一设备可以先确定是否可以应用目标AI模型,并根据不同的确定结果,执行不同的操作,以下将分别举例说明。
可选地,本申请实施例中,结合图2,如图3所示,在上述步骤102之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤201。
步骤201、第一设备采用目标AI模型,执行第一操作。
本申请实施例中,在第一设备确定可以应用目标AI模型的情况下,第一设备可以采用目标AI模型,执行第一操作。
本申请实施例中,上述第一操作包括以下至少一项:
信号处理操作;
信号传输操作;
信号解调操作;
信道状态信息获取操作;
波束管理操作;
信道预测操作;
干扰抑制操作;
定位操作;
高层业务的预测和管理操作;
高层参数的预测和管理操作;
控制信令解析操作。
需要说明的是,针对第一设备采用目标AI模型执行第一操作中的各个操作的描述,可以参考相关技术中的具体说明,本申请实施例在此不予赘述。
其中,上述信号处理操作包括以下至少一项:信号的检测操作、信号的滤波操作、信号的均衡操作。这里,该信号可以为以下任一项:解调参考信号(DemodulationReference Signal,DMRS)、探测参考信号(Sounding Reference Signal,SRS)、同步信号块(Synchronization Signal Block,SSB)、跟踪参考信号(Tracking Reference Signal,TRS)、相位跟踪参考信号(Phase Tracking Reference Signal,PTRS)、信道状态指示参考信号(Channel State nformation Reference Signal,CSI-RS)等。
其中,上述信号传输操作包括以下至少一项:信道的接收操作、信道的发送操作。这里,该信道可以为以下任一项:物理下行控制信道(Physical Downlink ControlChannel,PDCCH)、物理下行共享信道(Physical Downlink Share Channel,PDSCH)、物理上行控制信道(Physical Uplink Control Channel,PUCCH)、物理上行共享信道(PhysicalUplink Share Channel,PUSCH)、物理随机接入信道(Physical Random Access Channel,PRACH)、物理广播信道(Physical Broadcast Channel,PBCH)。
其中,信道状态信息获取操作包括以下至少一项:信道状态信息反馈、频分双工(Frequency Division Duplex,FDD)上下行部分互易性。这里,信道状态信息可以包括以下任一项:信道相关信息、信道矩阵相关信息、信道特征信息、信道矩阵特征信息、预编码矩阵指示符(Pre-coding Matrix Indicator,PMI)、秩指示(Rank Indication,RI)、CSI-RS资源指示符(CSI-RS Resource Indicator,CRI)、信道质量信息(Channel QualityInformation,CQI)、层指示(Layer Indicator,LI)。
在FDD***中,基于上下行部分互易性,第二设备可以根据上行信道,获取角度和时延信息,并通过CSI-RS预编码或者直接指示的方法,将角度信息和时延信息通知第一设备,从而第一设备可以根据第二设备的指示上报或者在基站的指示范围内选择并上报,从而减少第一设备的计算量和CSI上报的开销。
其中,波束管理操作可以包括以下至少一项:波束测量操作、波束上报操作、波束预测操作、波束失败检测操作、波束失败恢复操作、波束失败恢复中的新波束指示操作。
其中,信道预测操作可以包括以下至少一项:信道状态信息的预测操作、波束预测操作。
其中,干扰抑制操作可以包括以下至少一项:小区内干扰抑制操作、小区间干扰抑制操作、带外干扰抑制操作、交调干扰抑制操作。
其中,定位操作具体可以为:通过参考信号(例如SRS),估计出目标位置信息。这里,目标位置信息可以包括以下至少一项:第一设备的具***置信息(包括水平位置信息和垂直位置信息中的至少一个)、未来可能的位置信息、辅助位置估计的信息、轨迹估计的信息。
其中,高层业务的预测和管理操作和高层参数的预测和管理操作可以包括:吞吐量的预测和管理操作、所需数据包大小的预测和管理操作、业务需求的预测和管理操作、移动速度的预测和管理操作、噪声信息的预测和管理操作等。
其中,控制信令可以包括以下至少一项:功率控制的相关信令,波束管理的相关信令。
如此可知,由于第一设备可以采用目标AI模型,执行信号处理操作、信号传输操作、信道状态信息获取操作、波束管理操作、信道预测操作、干扰抑制操作、定位操作、高层业务的预测和管理操作、高层参数的预测和管理操作以及控制信令解析操作中的至少一个操作,因此,可以提升第一设备通信的吞吐量,且降低第一设备通信的时延。
可选地,本申请实施例中,结合图2,如图4所示,在上述步骤102之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤301。
步骤301、在目标AI模型与第一设备的能力不匹配的情况下,第一设备不应用目标AI模型。
本申请实施例中,在目标AI模型与第一设备的能力不匹配的情况下,第一设备确定不可以应用目标AI模型,从而第一设备不应用目标AI模型。
如此可知,由于在目标AI模型与第一设备的能力不匹配的情况下,第一设备可以不应用目标AI模型,因此,可以避免第一设备使用目标AI模型进行通信的过程中,第一设备发生卡顿的情况。
本申请实施例提供的AI模型传输方法,第一设备可以从第二设备接收目标AI模型的目标模型信息,并根据目标模型信息,得到目标AI模型,该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况;其中,上述目标传输模式包括第一传输模式和第二传输模式中的任一个;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。由于目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的,因此,可以避免因第一设备不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一设备向第二设备发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二设备可以直接根据目标反馈事件,向第一设备发送第一设备能够应用的AI模型,而无需第一设备与第二设备进行多次传输。从而可以减少在得到目标AI模型的过程中,第一设备与第二设备进行传输的次数,如此,可以节省传输资源。
下面将分别以目标AI模型满足不同的条件为例,进行具体的举例说明。
可选地,本申请实施例中,上述目标AI模型满足目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的。具体地,在上述步骤102之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤401。
步骤401、第一设备向第二设备发送目标信息。
本申请实施例中,上述目标信息用于指示第一设备支持的AI模型传输模式的能力。
可以理解,在第一设备向第二信息发送目标信息之后,第二设备可以根据第一设备支持的AI模型传输模式的能力,确定目标传输模式。
可选地,本申请实施例中,在第一设备支持的AI模型传输模式的能力为支持第一传输模式的情况下,目标传输模式具体可以为第一传输模式;在第一设备支持的AI模型传输模式的能力为支持第二传输模式的情况下,目标传输模式具体可以为第二传输模式;在第一设备支持的AI模型传输模式的能力为支持第一传输模式和第二传输模式,目标传输模式具体可以为第一传输模式或第二传输模式。
如此可知,由于第一设备可以向第二设备发送目标信息,以使得第二设备可以根据第一设备支持的AI模型传输模式的能力,确定目标传输模式,因此,可以避免因第一设备不支持第一传输模式或第二传输模式,而导致无法得到目标AI模型,进而导致无法应用目标AI模型的情况。
可选地,本申请实施例中,上述目标AI模型满足目标AI模型的目标应用时间,是根据目标传输模式确定的。具体地,在上述步骤102之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤402。
步骤402、第一设备根据目标传输模式,确定目标应用时间。
可选地,本申请实施例中,上述步骤402具体可以通过下述的步骤402a实现。
步骤402a、第一设备将目标传输模式对应的应用时间,确定为目标应用时间。
可选地,本申请实施例中,在第一设备中预存有多个对应关系,每个对应关系为一个传输模式和一个应用时间的对应关系,从而第一设备可以从多个传输模式中,确定与目标传输模式相同的一个传输模式,并将该一个传输模式对应的应用时间,确定为目标应用时间。
本申请实施例中,第一应用时间和第二应用时间之间满足以下至少一项:
第一应用时间大于第二应用时间;
第一应用时间大于或等于第三应用时间,该第三应用时间是根据第二应用时间和AI模型的编译时间确定的。
其中,上述第一应用时间为:第一传输模式对应的AI模型应用时间;上述第二应用时间为:第二传输模式对应的AI模型应用时间。
其中,上述第三应用时间具体可以是根据第二应用时间和AI模型的编译时间之和。
这里,AI模型的编译时间包括:第一编译时间和第二编译时间;其中,第一编译时间为:从第一设备的AI模型执行模块到第一设备的AI模型编译模块的时间,第二编译时间为:从第二设备的AI模型执行模块到第二设备的AI模型编译模块的时间。
如此可知,由于第一设备可以将目标传输模式对应的应用时间确定为目标应用时间;其中,第一应用时间大于第二应用时间、和/或第一应用时间大于或等于第三应用时间,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况。
可选地,本申请实施例中,上述步骤402具体可以通过下述的步骤402b实现。
步骤402b、在目标传输模式为第一传输模式的情况下,若目标AI模型和第一设备中的预存AI模型相匹配,则第一设备将第四应用时间确定为目标应用时间。
本申请实施例中,上述第四应用时间小于第一应用时间;该第一应用时间为:第一传输模式对应的AI模型应用时间。
需要说明的是,上述“目标AI模型和预存AI模型相匹配”可以理解为:目标AI模型和预存AI模型相同,或者,目标AI模型和预存AI模型的模型结构的相似度大于或等于预设门限。
其中,目标AI模型和预存AI模型相同具体可以为:目标AI模型和预存AI模型的模型层数相同,且目标AI模型和预存AI模型的每层神经元类型相同。
其中,目标AI模型和预存AI模型的模型结构的相似度大于或等于预设门限具体可以为以下任一项:预存AI模型的模型结构是目标AI模型的模型结构的子集或子模型、预存AI模型的模型结构包括了目标AI模型的模型结构、预存AI模型的模型结构包括了目标AI模型的模型结构的子集或子模型。
如此可知,由于在目标AI模型和预存AI模型相匹配的情况下,第一设备可以将较小的应用时间,确定为目标应用时间,因此,可以减少应用目标AI模型的时延。
可选地,本申请实施例中,上述目标AI模型满足目标AI模型触发第一设备向第二设备发送目标反馈事件。其中,上述目标反馈事件为以下任一项:第一反馈事件、第二反馈事件;该第一反馈事件用于反馈未应用目标AI模型;该第二反馈事件用于反馈已应用目标AI模型。
其中,上述第一反馈事件为以下任一项:
第一设备未应用目标AI模型;
第一设备未应用目标AI模型,且第一设备仍应用第一AI模型;
第一设备未应用目标AI模型,且第一设备不应用AI模型;
第一设备不支持第二设备通过目标传输模式发送的目标模型信息;
第三反馈事件;
第一设备不支持目标AI模型的第一模型信息。
这里,第一设备未应用目标AI模型可以理解为:目标AI模型未能激活,和/或未能生效,和/或未能切换。
这里,第一AI模型为:第一设备接收目标AI模型之前应用的AI模型。可以理解,第一设备仍应用旧的A模型。
这里,第一设备不应用AI模型可以理解为:第一设备使用非AI算法执行操作(例如第一操作)。
这里,第一设备不支持第二设备通过目标传输模式发送的目标模型信息具体可以为:第一设备不支持第二设备通过第一传输模式发送的目标模型信息。可以理解,第一设备不支持第二设备发送的目标AI模型的模型结构信息指示的模型结构,目标传输模式为第一传输模式。
这里,上述第三反馈事件为:第一设备不支持第二设备通过目标传输模式发送的目标模型信息;该第三反馈事件携带第一信息,该第一信息为目标AI模型中的第一设备不支持的模型结构的信息。可以理解,第一设备可以向第二设备反馈目标AI模型中的第一设备不支持的模型结构的信息,目标传输模式为第一传输模式。
示例性地,假设目标AI模型为神经网络模型,该神经网络模型的模型结构信息指示的模型结构为5层全连接层、2层卷积层以及1层长短期记忆网络(Long-Short-TermMemory,LSTM)层,第一设备不支持LSTM层,则第三反馈事件为第一设备不支持第二设备通过第一传输模式发送神经网络模型的模型结构信息,该第三反馈事件携带第一信息,该第一信息为LSTM层的信息。
这里,上述第一模型信息包括以下至少一项:模型大小、模型复杂度、模型操作数(例如浮点运算次数(Floating-point operations,FLOP))。
其中,上述第二反馈事件为以下任一项:
第一设备已应用目标AI模型;
第四反馈事件;
第一设备已应用目标AI模型,且已替换第一AI模型;
第一设备支持第二设备通过目标传输模式发送的目标模型信息;
第一设备已编译目标AI模型。
这里,第一设备已应用目标AI模型可以理解为:目标AI模型已经激活,和/或已经生效,和/或已经切换。
这里,上述第四反馈事件为:第一设备已应用目标AI模型;该第四反馈事件携带第二信息,该第二信息为目标AI模型的模型标识信息。可以理解,目标传输模式为第一传输模式。其中,模型标识信息具体可以为:模型身份标识(Identity,ID)。
这里,上述第一AI模型为:第一设备接收目标AI模型之前应用的AI模型。
这里,第一设备支持第二设备通过目标传输模式发送的目标模型信息可以理解为:第一设备支持第二设备通过第一传输模式发送的目标AI模型的模型结构信息指示的模型结构。
这里,第一设备已编译目标AI模型可以理解为:第一设备已编译好第二设备通过第一传输模式发送的目标AI模型的模型结构信息。从而在第一设备需求其他AI模型时,第二设备可以通过第二传输模式,传输其他AI模型的模型参数信息,以使得第一设备可以将该其他AI模型的模型参数信息,应用于目标AI模型的模型结构信息指示的模型结构,以得到该其他AI模型。
可以理解,后续若第二设备通过第二传输模式传输的模型参数信息,则第一设备可以认为第二设备要传输的AI模型的模型结构信息,与目标AI模型的模型结构信息相同。
当然,第一设备也可以向第二设备传输AI模型的模型信息,以使得第二设备可以按照第一设备传输的AI模型信息,向第一设备传输目标模型信息,以下将举例说明。
可选地,本申请实施例中,结合图2,如图5所示,在上述步骤101之前,本申请实施例提供的AI模型传输方法还可以包括下述的步骤501。
步骤501、第一设备按照第三传输模式,向第二设备发送第二AI模型的第二模型信息。
本申请实施例中,上述第三传输模式为第一传输模式或第四传输模式;在目标传输模式为第一传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息和模型参数信息;在目标传输模式为第四传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息;上述目标AI模型与第二AI模型的模型结构信息相匹配。
其中,第四传输模式为:传输AI模型的模型结构信息的传输模式。
需要说明的是,上述“目标AI模型与第二AI模型的模型结构信息相匹配”可以理解为:目标AI模型和第二AI模型的模型结构信息相同,或者,目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限。
其中,目标AI模型和第二AI模型的模型结构信息相同具体可以为:目标AI模型和第二AI模型的模型层数相同,且目标AI模型和第二AI模型的每层神经元类型相同。
其中,目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限具体可以为以下任一项:
第二AI模型的模型结构信息指示的模型结构是目标AI模型的模型结构信息指示的模型结构的子集或子模型;
第二AI模型的模型结构信息指示的模型结构包括了目标AI模型的模型结构信息指示的模型结构;
第二AI模型的模型结构信息指示的模型结构包括了目标AI模型的模型结构信息指示的模型结构的子集或子模型。
如此可知,由于目标AI模型和第二AI模型的模型结构信息相匹配,因此,第一设备可以直接从第二设备接收目标AI模型的模型参数信息,以得到目标AI模型,而无需重复接收目标AI模型的模型结构信息,如此,可以节省传输资源。
图6示出了本申请实施例提供的一种AI模型传输方法的流程图。如图6所示,本申请实施例提供的AI模型传输方法可以包括下述的步骤601。
步骤601、第二设备向第一设备发送目标AI模型的目标模型信息。
本申请实施例中,上述目标模型信息用于第一设备得到目标AI模型。
本申请实施例中,上述目标AI模型满足以下至少一项:
目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;
目标AI模型的目标应用时间,是根据目标传输模式确定的;
目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。
其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
可以理解,第一传输模式为:传输AI模型的模型结构信息和模型参数信息的传输模式;该第二传输模式为:传输AI模型的模型参数信息的传输模式。
本申请实施例提供的AI模型传输方法,第二设备可以向第一设备发送目标AI模型的目标模型信息,该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况;其中,上述目标传输模式包括第一传输模式和第二传输模式中的任一个;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。由于目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的,因此,可以避免因第一设备不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一设备向第二设备发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二设备可以直接根据目标反馈事件,向第一设备发送第一设备能够应用的AI模型,而无需第一设备与第二设备进行多次传输。从而可以减少在得到目标AI模型的过程中,第一设备与第二设备进行传输的次数,如此,可以节省传输资源。
可选地,本申请实施例中,上述目标AI模型满足目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的。具体地,在上述步骤601之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤701至步骤703。
步骤701、第二设备从第一设备接收目标信息。
本申请实施例中,上述目标信息用于指示第一设备支持的AI模型传输模式的能力。
步骤702、第二设备根据目标信息,确定目标传输模式。
可选地,本申请实施例中,在第一设备支持的AI模型传输模式的能力为支持第一传输模式的情况下,第二设备可以将第一传输模式确定为目标传输模式;在第一设备支持的AI模型传输模式的能力为支持第二传输模式的情况下,第二设备可以将第二传输模式确定为目标传输模式;在第一设备支持的AI模型传输模式的能力为支持第一传输模式和第二传输模式,第二设备可以将第一传输模式或第二传输模式确定为目标传输模式。
步骤703、第二设备基于目标传输模式,向第一设备发送目标模型信息。
可选地,本申请实施例中,在目标传输模式为第一传输模式的情况下,第二设备可以向第一设备发送目标AI模型的模型结构信息和模型参数信息,以使得第一设备可以得到目标AI模型;在目标传输模式为第二传输模式的情况下,第二设备可以向第一设备发送目标AI模型的模型参数信息,以使得第一设备可以得到目标AI模型。
如此可知,由于第二设备可以从第一设备接收目标信息,并根据目标信息,确定目标传输模式,以按照目标传输模式向第一设备发送目标模型信息,因此,可以避免因第一设备不支持第一传输模式或第二传输模式,而导致第一设备无法得到目标AI模型的情况,进而导致无法应用目标AI模型的情况。
可选地,本申请实施例中,上述目标传输模式为第一传输模式。具体地,在上述步骤601之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤801和步骤802。
步骤801、第二设备确定目标AI模型和第一设备中的预存AI模型是否相匹配。
可选地,本申请实施例中,第二设备可以从第一设备接收第一设备中的预存AI模型的模型标识信息,并根据该模型标识信息,确定预存AI模型,从而第二设备可以确定目标AI模型和预存AI模型是否相匹配。
步骤802、若目标AI模型和预存AI模型相匹配,则第二设备按照第四传输模式,向第一设备发送目标模型信息。
本申请实施例中,上述第四传输模式为以下任一项:第二传输模式、第五传输模式;在第四传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息;在第四传输模式为第五传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;该第五传输模式对应的AI模型应用时间小于第一传输模式对应的AI模型应用时间
可以理解,第二传输模式为:传输AI模型的模型参数信息的传输模式;该第五传输模式为:传输AI模型的模型结构信息和模型参数信息的传输模式。该第五传输模式可以理解为简化的第一传输模式。
如此可知,由于在目标AI模型和第一设备中的预存AI模型相匹配的情况下,第二设备可以按照第二传输模式向第一设备发送目标模型信息,即向第一设备发送目标AI模型的模型参数信息,而无需重复发送目标AI模型的模型结构信息,因此,可以节省传输资源;或者,第二设备可以按照第五传输模式向第一设备发送目标模型信息,以使得第一设备可以将较小的应用时间,确定为目标应用时间,因此,可以减少应用目标AI模型的时延。
可选地,本申请实施例中,在上述步骤601之后,本申请实施例提供的AI模型传输方法还可以包括下述的步骤803。
步骤803、第二设备从第一设备接收目标反馈事件。
本申请实施例中,上述目标反馈事件用于反馈目标AI模型的应用情况。
需要说明的是,针对目标反馈事件的说明,可以参考上述实施例中的具体描述,本申请实施例在此不再赘述。
如此可知,由于第二设备可以从第一设备接收用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二设备可以直接根据目标反馈事件,向第一设备发送第一设备能够应用的AI模型的模型信息,而无需第一设备与第二设备进行多次传输。
可选地,本申请实施例中,在上述步骤601之前,本申请实施例提供的AI模型传输方法还可以包括下述的步骤901和步骤902。
步骤901、第二设备从第一设备接收第二AI模型的第二模型信息。
本申请实施例中,上述第二模型信息是第一设备按照第三传输模式发送的。
本申请实施例中,第三传输模式为所述第一传输模式或第四传输模式;在目标传输模式为第一传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息和模型参数信息;在目标传输模式为所述第四传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息。
可以理解,第四传输模式为:传输AI模型的模型结构信息的传输模式。
步骤902、第二设备将与第二AI模型的模型结构信息相匹配的模型结构信息,确定为目标AI模型的模型结构信息。
可选地,本申请实施例中,上述步骤902可以通过下述的步骤902a或步骤902b实现。
步骤902a、第二设备将与第二AI模型的模型结构信息相同的模型结构,确定为目标AI模型的模型结构信息。
其中,目标AI模型和第二AI模型的结构信息相同具体可以为:目标AI模型和第二AI模型的模型层数相同,且目标AI模型和第二AI模型的每层神经元类型相同。
步骤902b、第二设备将与第二AI模型的模型结构信息的相似度大于或等于预设门限的模型结构,确定为目标AI模型的模型结构信息。
其中,目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限具体可以为以下任一项:
第二AI模型的模型结构信息指示的模型结构是目标AI模型的模型结构信息指示的模型结构的子集或子模型;
第二AI模型的模型结构信息指示的模型结构包括了目标AI模型的模型结构信息指示的模型结构;
预存AI模型的模型结构包括了目标AI模型的模型结构信息指示的模型结构的子集或子模型。
示例性地,假设第二AI模型的模型结构信息指示的模型结构为5层全连接层和2层卷积层,目标AI模型的模型结构信息指示的模型结构为4层权连接层和2层卷积层,即第二AI模型的模型结构信息指示的模型结构是目标AI模型的模型结构信息指示的模型结构的子集,则可以认为目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限,即目标AI模型和第二AI模型相匹配。
又示例性地,假设第二AI模型的模型结构信息指示的模型结构为5层全连接层和2层卷积层,目标AI模型的模型结构信息指示的模型结构为4层权连接层和,即第二AI模型的模型结构信息指示的模型结构是目标AI模型的模型结构信息指示的模型结构的子模型,则可以认为目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限,即目标AI模型和第二AI模型相匹配。
又示例性地,假设第二AI模型的模型结构信息指示的模型结构为6层全连接层和3层卷积层,目标AI模型的模型结构信息指示的模型结构为5层连接层和2层卷积层,即第二AI模型的模型结构信息指示的模型结构包括了目标AI模型的模型结构信息指示的模型结构,则可以认为目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限,即目标AI模型和第二AI模型相匹配。
又示例性地,假设第二AI模型的模型结构信息指示的模型结构为5层全连接层、2层卷积层以及1层LSTM层,目标AI模型的模型结构信息指示的模型结构为5层全连接层和2层卷积层,即第二AI模型的模型结构信息指示的模型结构包括了目标AI模型的模型结构信息指示的模型结构,则可以认为目标AI模型和第二AI模型的模型结构信息的相似度大于或等于预设门限,即目标AI模型和第二AI模型相匹配。
如此可知,由于目标AI模型和第二AI模型的模型结构信息相匹配,因此,第一设备可以直接从第二设备接收目标AI模型的模型参数信息,以得到目标AI模型,而无需重复接收目标AI模型的模型结构信息,如此,可以节省传输资源。
本申请实施例提供的AI模型传输方法,执行主体可以为AI模型传输装置。本申请实施例中以AI模型传输装置执行AI模型传输方法为例,说明本申请实施例提供的AI模型传输装置的。
图7示出了本申请实施例中涉及的AI模型传输装置的一种可能的结构示意图,该AI模型传输装置为第一AI模型传输装置。如图7所示,该第一AI模型传输装置60可以包括:接收模块61和处理模块62。
其中,接收模块61,用于从第二AI模型传输装置接收目标AI模型的目标模型信息。处理模块62,用于根据接收模块61接收的目标模型信息,得到目标AI模型。该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一AI模型传输装置60支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一AI模型传输装置60向第二AI模型传输装置发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
在一种可能的实现方式中,上述目标AI模型满足目标AI模型的目标传输模式,是根据第一AI模型传输装置60支持的AI模型传输模式的能力确定的;上述第一AI模型传输装置60还包括:发送模块。其中,发送模块,用于向第二AI模型传输装置发送目标信息,该目标信息用于指示第一AI模型传输装置60支持的AI模型传输模式的能力。
在一种可能的实现方式中,上述第一AI模型传输装置60支持的AI模型传输模式的能力包括以下任一项:支持第一传输模式;支持第二传输模式;支持第一传输模式和第二传输模式。
在一种可能的实现方式中,上述目标AI模型满足目标AI模型的目标应用时间,是根据目标传输模式确定的。本申请实施例提供的第一AI模型传输装置60还可以包括:确定模块。其中,确定模块,用于根据目标传输模式,确定目标应用时间。
在一种可能的实现方式中,上述确定模块,具体用于将目标传输模式对应的应用时间,确定为目标应用时间;第一应用时间和第二应用时间之间满足以下至少一项:第一应用时间大于第二应用时间;第一应用时间大于或等于第三应用时间,该第三应用时间是根据第二应用时间和AI模型的编译时间确定的。其中,上述第一应用时间为:第一传输模式对应的AI模型应用时间;上述第二应用时间为:第二传输模式对应的AI模型应用时间。
在一种可能的实现方式中,上述确定模块,具体用于在目标传输模式为第一传输模式的情况下,若目标AI模型和第一AI模型传输装置60中的预存AI模型相匹配,则将第四应用时间确定为目标应用时间。其中,上述第四应用时间小于第一应用时间;该第一应用时间为:第一传输模式对应的AI模型应用时间。
在一种可能的实现方式中,上述目标AI模型满足目标AI模型触发第一AI模型传输装置60向第二AI模型传输装置发送目标反馈事件;该目标反馈事件为以下任一项:第一反馈事件、第二反馈事件。其中,上述第一反馈事件用于反馈未应用目标AI模型;上述第二反馈事件用于反馈已应用目标AI模型。
在一种可能的实现方式中,上述第一反馈事件为以下任一项:第一AI模型传输装置60未应用目标AI模型;第一AI模型传输装置60未应用目标AI模型,且第一AI模型传输装置60仍应用第一AI模型;第一AI模型传输装置60未应用目标AI模型,且第一AI模型传输装置60不应用AI模型;第一AI模型传输装置60不支持第二AI模型传输装置通过目标传输模式发送的目标模型信息;第三反馈事件;第一AI模型传输装置60不支持目标AI模型的第一模型信息。其中,上述第一AI模型为:第一AI模型传输装置60接收目标AI模型之前应用的AI模型;上述第三反馈事件为:第一AI模型传输装置60不支持第二AI模型传输装置通过目标传输模式发送的目标模型信息;上述第三反馈事件携带第一信息,该第一信息为目标AI模型中的第一AI模型传输装置60不支持的模型结构的信息;上述第一模型信息包括以下至少一项:模型大小、模型复杂度、模型操作数。
在一种可能的实现方式中,上述第二反馈事件为以下任一项:第一AI模型传输装置60已应用目标AI模型;第四反馈事件;第一AI模型传输装置60已应用目标AI模型,且已替换第一AI模型;第一AI模型传输装置60支持第二AI模型传输装置通过目标传输模式发送的目标模型信息;第一AI模型传输装置60已编译目标AI模型。其中,上述第四反馈事件为:第一AI模型传输装置60已应用目标AI模型;上述第四反馈事件携带第二信息,该第二信息为目标AI模型的模型标识信息;上述第一AI模型为:第一AI模型传输装置60接收目标AI模型之前应用的AI模型。
在一种可能的实现方式中,本申请实施例提供的第一AI模型传输装置60还可以包括:处理模块。其中,处理模块,用于在目标AI模型与第一AI模型传输装置60的能力不匹配的情况下,不应用目标AI模型。
在一种可能的实现方式中,本申请实施例提供的第一AI模型传输装置60还可以包括:发送模块。其中,发送模块,用于按照第三传输模式,向第二AI模型传输装置发送第二AI模型的第二模型信息。其中,上述第三传输模式为第一传输模式或第四传输模式;在目标传输模式为第一传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息和模型参数信息;在目标传输模式为第四传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息;目标AI模型与第二AI模型的模型结构信息相匹配。
在一种可能的实现方式中,处理模块,还用于采用目标AI模型,执行第一操作。其中,上述第一操作包括以下至少一项:信号处理操作;信号传输操作;信号解调操作;信道状态信息获取操作;波束管理操作;信道预测操作;干扰抑制操作;定位操作;高层业务的预测和管理操作;高层参数的预测和管理操作;控制信令解析操作。
本申请实施例提供的AI模型传输装置,由于目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的,因此,可以避免因第一AI模型传输装置不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一AI模型传输装置向第二AI模型传输装置发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二AI模型传输装置可以直接根据目标反馈事件,向第一AI模型传输装置发送第一AI模型传输装置能够应用的AI模型,而无需第一AI模型传输装置与第二AI模型传输装置进行多次传输。从而可以减少在得到目标AI模型的过程中,第一AI模型传输装置与第二AI模型传输装置进行传输的次数,如此,可以节省传输资源。
本申请实施例中的AI模型传输装置可以是电子设备,例如具有操作***的电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性地,终端可以包括但不限于上述所列举的终端11的类型,其他设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)等,本申请实施例不作具体限定。
本申请实施例提供的AI模型传输装置能够实现图2至图5的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
图8示出了本申请实施例中涉及的AI模型传输装置的一种可能的结构示意图,该AI模型传输装置为第二AI模型传输装置。如图8所示,该第二AI模型传输装置70可以包括:发送模块71。
其中,发送模块71,用于向第一AI模型传输装置发送目标AI模型的目标模型信息;该目标模型信息用于第一AI模型传输装置得到所述目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一AI模型传输装置向第二AI模型传输装置70发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
在一种可能的实现方式中,上述目标AI模型满足目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的。本申请实施例提供的第二AI模型传输装置70还可以包括:接收模块和确定模块。其中,接收模块,用于从第一AI模型传输装置接收目标信息,该目标信息用于指示第一AI模型传输装置支持的AI模型传输模式的能力。确定模块,用于根据接收模块接收的目标信息,确定目标传输模式。上述发送模块71,还用于基于确定模块确定的目标传输模式,向第一AI模型传输装置发送目标模型信息。
在一种可能的实现方式中,上述目标传输模式为第一传输模式。上述确定模块,还用于确定目标AI模型和第一AI模型传输装置中的预存AI模型是否相匹配。上述发送模块71,还用于若确定模块确定目标AI模型和预存AI模型相匹配,则按照第四传输模式,向第一AI模型传输装置发送目标模型信息。其中,上述第四传输模式为以下任一项:第二传输模式、第五传输模式;在第四传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息;在第四传输模式为第五传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;该第五传输模式对应的AI模型应用时间小于第一传输模式对应的AI模型应用时间。
在一种可能的实现方式中,上述接收模块,还用于从第一AI模型传输装置接收目标反馈事件。其中,上述目标反馈事件用于反馈目标AI模型的应用情况。
在一种可能的实现方式中,上述接收模块,还用于从第一AI模型传输装置接收第二AI模型的第二模型信息,该第二模型信息是第一AI模型传输装置按照第三传输模式发送的。上述确定模块,还用于将与接收模块接收的第二AI模型的模型结构信息相匹配的模型结构信息,确定为目标AI模型的模型结构信息。其中,上述第三传输模式为第一传输模式或第四传输模式;在目标传输模式为第一传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息和模型参数信息;在目标传输模式为第四传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息。
在一种可能的实现方式中,上述确定模块,具体用于以下任一项:将与第二AI模型的模型结构信息相同的模型结构信息,确定为目标AI模型的模型结构信息;将与第二AI模型的模型结构信息的相似度大于或等于预设门限的模型结构,确定为目标AI模型的模型结构信息。
本申请实施例提供的AI模型传输装置,由于目标AI模型的目标传输模式,是根据第一AI模型传输装置支持的AI模型传输模式的能力确定的,因此,可以避免因第一AI模型传输装置不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一AI模型传输装置向第二AI模型传输装置发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二AI模型传输装置可以直接根据目标反馈事件,向第一AI模型传输装置发送第一AI模型传输装置能够应用的AI模型,而无需第一AI模型传输装置与第二AI模型传输装置进行多次传输。从而可以减少在得到目标AI模型的过程中,第一AI模型传输装置与第二AI模型传输装置进行传输的次数,如此,可以节省传输资源。
本申请实施例中的AI模型传输装置可以是电子设备,例如具有操作***的电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性地,终端可以包括但不限于上述所列举的终端11的类型,其他设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)等,本申请实施例不作具体限定。
本申请实施例提供的AI模型传输装置能够实现图6的方法实施例实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
可选地,本申请实施例中,如图9所示,本申请实施例还提供一种通信设备80,包括处理器81和存储器82,存储器82上存储有可在所述处理器81上运行的程序或指令,例如,该通信设备80为终端时,该程序或指令被处理器81执行时实现上述AI模型传输方法实施例的各个步骤,且能达到相同的技术效果。该通信设备80为网络侧设备时,该程序或指令被处理器81执行时实现上述AI模型传输方法实施例的各个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供一种终端,该终端为第一终端,该第一终端包括处理器和通信接口,通信接口用于从第二终端接收目标AI模型的目标模型信息,处理器用于根据目标模型信息,得到目标AI模型。该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一终端向第二终端发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。该终端实施例与上述终端侧方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中,且能达到相同的技术效果。具体地,图10为实现本申请实施例的一种终端的硬件结构示意图。
该终端800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809以及处理器810等中的至少部分部件。
本领域技术人员可以理解,终端800还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理***与处理器810逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图10中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元804可以包括图形处理单元(GraphicsProcessing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元806可包括显示面板8061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板8061。用户输入单元807包括触控面板8071以及其他输入设备8072中的至少一种。触控面板8071,也称为触摸屏。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元801接收来自网络侧设备的下行数据后,可以传输给处理器810进行处理;另外,射频单元801可以向网络侧设备发送上行数据。通常,射频单元801包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器809可用于存储软件程序或指令以及各种数据。存储器809可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器809可以包括易失性存储器或非易失性存储器,或者,存储器809可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本申请实施例中的存储器809包括但不限于这些和任意其它适合类型的存储器。
处理器810可包括一个或多个处理单元;可选的,处理器810集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作***、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
其中,射频单元801,用于从第二终端接收目标AI模型的目标模型信息。
上述目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一终端向第二终端发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。
其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
本申请实施例提供的终端,由于目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的,因此,可以避免因第一终端不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一终端向第二终端发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二终端可以直接根据目标反馈事件,向第一终端发送第一终端能够应用的AI模型,而无需第一终端与第二终端进行多次传输。从而可以减少在得到目标AI模型的过程中,第一终端与第二终端进行传输的次数,如此,可以节省传输资源。
可选地,本申请实施例中,上述目标AI模型满足目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的。
射频单元801,还用于向所述第二终端发送目标信息,所述目标信息用于指示所述第一终端支持的AI模型传输模式的能力。
如此可知,由于第一终端可以向第二终端发送目标信息,以使得第二终端可以根据第一终端支持的AI模型传输模式的能力,确定目标传输模式,因此,可以避免因第一终端不支持第一传输模式或第二传输模式,而导致第一终端无法得到目标AI模型的情况,进而导致无法应用目标AI模型的情况。
可选地,本申请实施例中,上述目标AI模型满足目标AI模型的目标应用时间,是根据目标传输模式确定的。
处理器810,用于根据目标传输模式,确定目标应用时间。
如此可知,由于第一终端可以将目标传输模式对应的应用时间确定为目标应用时间;其中,第一应用时间大于第二应用时间、和/或第一应用时间大于或等于第三应用时间,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况。
可选地,本申请实施例中,处理器810,具体用于将目标传输模式对应的应用时间,确定为目标应用时间。
第一应用时间和第二应用时间之间满足以下至少一项:第一应用时间大于第二应用时间;第一应用时间大于或等于第三应用时间,该第三应用时间是根据第二应用时间和AI模型的编译时间确定的。
其中,上述第一应用时间为:第一传输模式对应的AI模型应用时间;上述第二应用时间为:第二传输模式对应的AI模型应用时间。
如此可知,由于第一终端可以将目标传输模式对应的应用时间确定为目标应用时间;其中,第一应用时间大于第二应用时间、和/或第一应用时间大于或等于第三应用时间,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况。
可选地,本申请实施例中,处理器810,具体用于在目标传输模式为第一传输模式的情况下,若目标AI模型和第一终端中的预存AI模型相匹配,则将第四应用时间确定为目标应用时间。
其中,上述第四应用时间小于第一应用时间;该第一应用时间为:第一传输模式对应的AI模型应用时间。
如此可知,由于在目标AI模型和预存AI模型相匹配的情况下,第一终端可以将较小的应用时间,确定为目标应用时间,因此,可以减少应用目标AI模型的时延。
可选地,本申请实施例中,处理器810,还用于在目标AI模型与第一终端的能力不匹配的情况下,不应用目标AI模型。
如此可知,由于在目标AI模型与第一终端的能力不匹配的情况下,第一终端可以不应用目标AI模型,因此,可以避免第一终端使用目标AI模型进行通信的过程中,第一终端发生卡顿的情况。
可选地,本申请实施例中,射频单元801,还用于按照第三传输模式,向第二终端发送第二AI模型的第二模型信息。
其中,上述第三传输模式为第一传输模式或第四传输模式;在目标传输模式为第一传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息和模型参数信息;在目标传输模式为第四传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息;目标AI模型与第二AI模型的模型结构信息相匹配。
如此可知,由于目标AI模型和第二AI模型的模型结构信息相匹配,因此,第一终端可以直接从第二终端接收目标AI模型的模型参数信息,以得到目标AI模型,而无需重复接收目标AI模型的模型结构信息,如此,可以节省传输资源。
可选地,本申请实施例中,处理器810,还用于采用目标AI模型,执行第一操作。
其中,上述第一操作包括以下至少一项:信号处理操作;信号传输操作;信号解调操作;信道状态信息获取操作;波束管理操作;信道预测操作;干扰抑制操作;定位操作;高层业务的预测和管理操作;高层参数的预测和管理操作;控制信令解析操作。
如此可知,由于第一终端可以采用目标AI模型,执行信号处理操作、信号传输操作、信道状态信息获取操作、波束管理操作、信道预测操作、干扰抑制操作、定位操作、高层业务的预测和管理操作、高层参数的预测和管理操作以及控制信令解析操作中的至少一个操作,因此,可以提升第一终端通信的吞吐量,且降低第一终端通信的时延。
本申请实施例还提供一种终端,该终端为第二终端,该第二终端包括处理器和通信接口,通信接口用于向第一终端发送目标AI模型的目标模型信息。该目标模型信息用于第一终端得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一终端向第二终端发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。该终端实施例与上述终端侧方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该终端实施例中,且能达到相同的技术效果。具体地,图10为实现本申请实施例的一种终端的硬件结构示意图。
该终端800包括但不限于:射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809以及处理器810等中的至少部分部件。
本领域技术人员可以理解,终端800还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理***与处理器810逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。图10中示出的终端结构并不构成对终端的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
应理解的是,本申请实施例中,输入单元804可以包括图形处理单元(GraphicsProcessing Unit,GPU)8041和麦克风8042,图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元806可包括显示面板8061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板8061。用户输入单元807包括触控面板8071以及其他输入设备8072中的至少一种。触控面板8071,也称为触摸屏。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
本申请实施例中,射频单元801接收来自网络侧设备的下行数据后,可以传输给处理器810进行处理;另外,射频单元801可以向网络侧设备发送上行数据。通常,射频单元801包括但不限于天线、放大器、收发信机、耦合器、低噪声放大器、双工器等。
存储器809可用于存储软件程序或指令以及各种数据。存储器809可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作***、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器809可以包括易失性存储器或非易失性存储器,或者,存储器809可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(SynchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本申请实施例中的存储器809包括但不限于这些和任意其它适合类型的存储器。
处理器810可包括一个或多个处理单元;可选的,处理器810集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作***、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器810中。
其中,射频单元801,用于向第一终端发送目标AI模型的目标模型信息。
上述目标模型信息用于第一终端得到目标AI模型。
上述目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一终端向第二终端发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。
其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。
本申请实施例提供的终端,由于目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的,因此,可以避免因第一终端不支持第一传输模式或第二传输模式,而导致无法根据目标模型信息得到目标AI模型的情况,进而导致无法应用目标AI模型的情况;和/或,由于目标AI模型的目标应用时间,是根据目标传输模式确定的,因此,可以避免因目标AI模型的应用时间过大(或过小),而导致无法应用目标AI模型、或浪费等待时间的情况;和/或,由于目标AI模型可以触发第一终端向第二终端发送用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二终端可以直接根据目标反馈事件,向第一终端发送第一终端能够应用的AI模型,而无需第一终端与第二终端进行多次传输。从而可以减少在得到目标AI模型的过程中,第一终端与第二终端进行传输的次数,如此,可以节省传输资源。
在一种可能的实现方式中,上述目标AI模型满足目标AI模型的目标传输模式,是根据第一终端支持的AI模型传输模式的能力确定的。
射频单元801,还用于从第一终端接收目标信息,该目标信息用于指示第一终端支持的AI模型传输模式的能力。
处理器810,用于根据目标信息,确定目标传输模式。
射频单元801,还用于基于目标传输模式,向第一终端发送目标模型信息。
如此可知,由于第二终端可以从第一终端接收目标信息,并根据目标信息,确定目标传输模式,以按照目标传输模式向第一终端发送目标模型信息,因此,可以避免因第一终端不支持第一传输模式或第二传输模式,而导致第一设备无法得到目标AI模型的情况,进而导致无法应用目标AI模型的情况。
可选地,本申请实施例中,上述目标传输模式为第一传输模式。
处理器810,还用于确定目标AI模型和第一终端中的预存AI模型是否相匹配。
射频单元801,还用于若目标AI模型和预存AI模型相匹配,则按照第四传输模式,向第一终端发送目标模型信息。
其中,上述第四传输模式为以下任一项:第二传输模式、第五传输模式;在第四传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息;在第四传输模式为第五传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息,该第五传输模式对应的AI模型应用时间小于第一传输模式对应的AI模型应用时间。
如此可知,由于在目标AI模型和第一终端中的预存AI模型相匹配的情况下,第二终端可以按照第二传输模式向第一终端发送目标模型信息,即向第一终端发送目标AI模型的模型参数信息,而无需重复发送目标AI模型的模型结构信息,因此,可以节省传输资源;或者,第二终端可以按照第五传输模式向第一终端发送目标模型信息,以使得第一终端可以将较小的应用时间,确定为目标应用时间,因此,可以减少应用目标AI模型的时延。
可选地,本申请实施例中,射频单元801,还用于从第一终端接收目标反馈事件。
其中,上述目标反馈事件用于反馈目标AI模型的应用情况。
如此可知,由于第二终端可以从第一终端接收用于反馈目标AI模型的应用情况的目标反馈事件,因此,第二终端可以直接根据目标反馈事件,向第一终端发送第一终端能够应用的AI模型,而无需第一终端与第二终端进行多次传输。
可选地,本申请实施例中,射频单元801,还用于从第一终端接收第二AI模型的第二模型信息,该第二模型信息是第一终端按照第三传输模式发送的。
处理器810,还用于将与第二AI模型的模型结构信息相匹配的模型结构信息,确定为目标AI模型的模型结构信息。
其中,上述第三传输模式为第一传输模式或第四传输模式;在目标传输模式为第一传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息和模型参数信息;在目标传输模式为第四传输模式的情况下,第二模型信息包括第二AI模型的模型结构信息。
如此可知,由于目标AI模型和第二AI模型的模型结构信息相匹配,因此,第一终端可以直接从第二终端接收目标AI模型的模型参数信息,以接收目标AI模型,而无需重复接收目标AI模型的模型结构信息,如此,可以节省传输资源。
可选地,本申请实施例中,处理器810,具体用于以下任一项:
将与第二AI模型的模型结构信息相同的模型结构信息,确定为目标AI模型的模型结构信息;
将与第二AI模型的模型结构信息的相似度大于或等于预设门限的模型结构,确定为目标AI模型的模型结构信息。
本申请实施例还提供一种网络侧设备,包括处理器和通信接口,通信接口用于从第二设备接收目标AI模型的目标模型信息,处理器用于根据目标模型信息,得到目标AI模型;或者,用于向第一设备发送目标AI模型的目标模型信息;该目标模型信息用于第一设备得到目标AI模型;该目标AI模型满足以下至少一项:目标AI模型的目标传输模式,是根据第一设备支持的AI模型传输模式的能力确定的;目标AI模型的目标应用时间,是根据目标传输模式确定的;目标AI模型触发第一设备向第二设备发送目标反馈事件,该目标反馈事件用于反馈目标AI模型的应用情况。其中,上述目标传输模式包括以下任一项:第一传输模式、第二传输模式;在目标传输模式为第一传输模式的情况下,目标模型信息包括目标AI模型的模型结构信息和模型参数信息;在目标传输模式为第二传输模式的情况下,目标模型信息包括目标AI模型的模型参数信息。该网络侧设备实施例与上述网络侧设备方法实施例对应,上述方法实施例的各个实施过程和实现方式均可适用于该网络侧设备实施例中,且能达到相同的技术效果。
具体地,本申请实施例还提供了一种网络侧设备。如图11所示,该网络侧设备900包括:天线901、射频装置902、基带装置903、处理器904和存储器905。天线901与射频装置902连接。在上行方向上,射频装置902通过天线901接收信息,将接收的信息发送给基带装置903进行处理。在下行方向上,基带装置903对要发送的信息进行处理,并发送给射频装置902,射频装置902对收到的信息进行处理后经过天线901发送出去。
以上实施例中网络侧设备执行的方法可以在基带装置903中实现,该基带装置903包括基带处理器。
基带装置903例如可以包括至少一个基带板,该基带板上设置有多个芯片,如图11所示,其中一个芯片例如为基带处理器,通过总线接口与存储器905连接,以调用存储器905中的程序,执行以上方法实施例中所示的网络设备操作。
该网络侧设备还可以包括网络接口906,该接口例如为通用公共无线接口(commonpublic radio interface,CPRI)。
具体地,本申请实施例的网络侧设备900还包括:存储在存储器905上并可在处理器904上运行的指令或程序,处理器904调用存储器905中的指令或程序执行图11所示各模块执行的方法,并达到相同的技术效果,为避免重复,故不在此赘述。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述AI模型传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的终端中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述AI模型传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为***级芯片,***芯片,芯片***或片上***芯片等。
本申请实施例另提供了一种计算机程序/程序产品,所述计算机程序/程序产品被存储在存储介质中,所述计算机程序/程序产品被至少一个处理器执行以实现上述AI模型传输方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供了一种AI模型传输***,包括:第一设备及第二设备,该第一设备可用于执行如上所述的AI模型传输方法的步骤,该第二设备可用于执行如上所述的AI模型传输方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (39)

1.一种人工智能AI模型传输方法,其特征在于,包括:
第一设备从第二设备接收目标AI模型的目标模型信息;
所述第一设备根据所述目标模型信息,得到所述目标AI模型;
所述目标AI模型满足以下至少一项:
所述目标AI模型的目标传输模式,是根据所述第一设备支持的AI模型传输模式的能力确定的;
所述目标AI模型的目标应用时间,是根据所述目标传输模式确定的;
所述目标AI模型触发所述第一设备向所述第二设备发送目标反馈事件,所述目标反馈事件用于反馈所述目标AI模型的应用情况;
其中,所述目标传输模式包括以下任一项:第一传输模式、第二传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第二传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型参数信息。
2.根据权利要求1所述的方法,其特征在于,所述目标AI模型满足所述目标AI模型的目标传输模式,是根据所述第一设备支持的AI模型传输模式的能力确定的;所述方法还包括:
所述第一设备向所述第二设备发送目标信息,所述目标信息用于指示所述第一设备支持的AI模型传输模式的能力。
3.根据权利要求1或2所述的方法,其特征在于,所述第一设备支持的AI模型传输模式的能力包括以下任一项:
支持所述第一传输模式;
支持所述第二传输模式;
支持所述第一传输模式和所述第二传输模式。
4.根据权利要求1所述的方法,其特征在于,所述目标AI模型满足所述目标AI模型的目标应用时间,是根据所述目标传输模式确定的;所述方法还包括:
所述第一设备根据所述目标传输模式,确定所述目标应用时间。
5.根据权利要求4所述的方法,其特征在于,所述第一设备根据所述目标传输模式,确定所述目标应用时间,包括:
所述第一设备将所述目标传输模式对应的应用时间,确定为所述目标应用时间;
第一应用时间和第二应用时间之间满足以下至少一项:
所述第一应用时间大于所述第二应用时间;
所述第一应用时间大于或等于第三应用时间,所述第三应用时间是根据所述第二应用时间和AI模型的编译时间确定的;
其中,所述第一应用时间为:所述第一传输模式对应的AI模型应用时间;所述第二应用时间为:所述第二传输模式对应的AI模型应用时间。
6.根据权利要求4所述的方法,其特征在于,所述第一设备根据所述目标传输模式,确定所述目标应用时间,包括:
在所述目标传输模式为所述第一传输模式的情况下,若所述目标AI模型和所述第一设备中的预存AI模型相匹配,则所述第一设备将第四应用时间确定为所述目标应用时间;
其中,所述第四应用时间小于第一应用时间;所述第一应用时间为:所述第一传输模式对应的AI模型应用时间。
7.根据权利要求1所述的方法,其特征在于,所述目标AI模型满足所述目标AI模型触发所述第一设备向所述第二设备发送目标反馈事件;
所述目标反馈事件为以下任一项:第一反馈事件、第二反馈事件;
其中,所述第一反馈事件用于反馈未应用所述目标AI模型;所述第二反馈事件用于反馈已应用所述目标AI模型。
8.根据权利要求7所述的方法,其特征在于,所述第一反馈事件为以下任一项:
所述第一设备未应用所述目标AI模型;
所述第一设备未应用所述目标AI模型,且所述第一设备仍应用第一AI模型;
所述第一设备未应用所述目标AI模型,且所述第一设备不应用AI模型;
所述第一设备不支持所述第二设备通过所述目标传输模式发送的所述目标模型信息;
第三反馈事件;
所述第一设备不支持所述目标AI模型的第一模型信息;
其中,所述第一AI模型为:所述第一设备接收所述目标AI模型之前应用的AI模型;
所述第三反馈事件为:所述第一设备不支持所述第二设备通过所述目标传输模式发送的所述目标模型信息;所述第三反馈事件携带第一信息,所述第一信息为所述目标AI模型中的所述第一设备不支持的模型结构的信息;
所述第一模型信息包括以下至少一项:模型大小、模型复杂度、模型操作数。
9.根据权利要求7所述的方法,其特征在于,所述第二反馈事件为以下任一项:
所述第一设备已应用所述目标AI模型;
第四反馈事件;
所述第一设备已应用所述目标AI模型,且已替换第一AI模型;
所述第一设备支持所述第二设备通过所述目标传输模式发送的所述目标模型信息;
所述第一设备已编译所述目标AI模型;
其中,所述第四反馈事件为:所述第一设备已应用所述目标AI模型;所述第四反馈事件携带第二信息,所述第二信息为所述目标AI模型的模型标识信息;
所述第一AI模型为:所述第一设备接收所述目标AI模型之前应用的AI模型。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述目标AI模型与所述第一设备的能力不匹配的情况下,所述第一设备不应用所述目标AI模型。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述第一设备按照第三传输模式,向所述第二设备发送第二AI模型的第二模型信息;
其中,所述第三传输模式为所述第一传输模式或第四传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第四传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息;
所述目标AI模型与所述第二AI模型的模型结构信息相匹配。
12.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述第一设备采用所述目标AI模型,执行第一操作;
其中,所述第一操作包括以下至少一项:
信号处理操作;
信号传输操作;
信号解调操作;
信道状态信息获取操作;
波束管理操作;
信道预测操作;
干扰抑制操作;
定位操作;
高层业务的预测和管理操作;
高层参数的预测和管理操作;
控制信令解析操作。
13.一种AI模型传输方法,其特征在于,包括:
第二设备向第一设备发送目标AI模型的目标模型信息;
所述目标模型信息用于所述第一设备得到所述目标AI模型;
所述目标AI模型满足以下至少一项:
所述目标AI模型的目标传输模式,是根据所述第一设备支持的AI模型传输模式的能力确定的;
所述目标AI模型的目标应用时间,是根据所述目标传输模式确定的;
所述目标AI模型触发所述第一设备向所述第二设备发送目标反馈事件,所述目标反馈事件用于反馈所述目标AI模型的应用情况;
其中,所述目标传输模式包括以下任一项:第一传输模式、第二传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第二传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型参数信息。
14.根据权利要求13所述的方法,其特征在于,所述目标AI模型满足所述目标AI模型的目标传输模式,是根据所述第一设备支持的AI模型传输模式的能力确定的;所述方法还包括:
所述第二设备从所述第一设备接收目标信息,所述目标信息用于指示所述第一设备支持的AI模型传输模式的能力;
所述第二设备根据所述目标信息,确定目标传输模式;
所述第二设备基于所述目标传输模式,向所述第一设备发送所述目标模型信息。
15.根据权利要求14所述的方法,其特征在于,所述目标传输模式为所述第一传输模式;所述方法还包括:
所述第二设备确定所述目标AI模型和所述第一设备中的预存AI模型是否相匹配;
若所述目标AI模型和所述预存AI模型相匹配,则所述第二设备按照第四传输模式,向所述第一设备发送所述目标模型信息;
其中,所述第四传输模式为以下任一项:第二传输模式、第五传输模式;
在所述第四传输模式为所述第二传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型参数信息;在所述第四传输模式为所述第五传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型结构信息和模型参数信息;
所述第五传输模式对应的AI模型应用时间小于所述第一传输模式对应的AI模型应用时间。
16.根据权利要求14所述的方法,其特征在于,所述方法还包括:
所述第二设备从所述第一设备接收目标反馈事件;
其中,所述目标反馈事件用于反馈所述目标AI模型的应用情况。
17.根据权利要求14所述的方法,其特征在于,所述方法还包括:
所述第二设备从所述第一设备接收第二AI模型的第二模型信息,所述第二模型信息是所述第一设备按照第三传输模式发送的;
所述第二设备将与所述第二AI模型的模型结构信息相匹配的模型结构信息,确定为所述目标AI模型的模型结构信息;
其中,所述第三传输模式为所述第一传输模式或第四传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第四传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息。
18.根据权利要求17所述的方法,其特征在于,所述第二设备将与所述第二AI模型的模型结构信息相匹配的模型结构信息,确定为所述目标AI模型的模型结构信息,包括以下任一项:
所述第二设备将与所述第二AI模型的模型结构信息相同的模型结构信息,确定为所述目标AI模型的模型结构信息;
所述第二设备将与所述第二AI模型的模型结构信息的相似度大于或等于预设门限的模型结构信息,确定为所述目标AI模型的模型结构信息。
19.一种AI模型传输装置,其特征在于,所述AI模型传输装置为第一AI模型传输装置,所述第一AI模型传输装置包括:接收模块和处理模块;
所述接收模块,用于从第二AI模型传输装置接收目标AI模型的目标模型信息;
所述处理模块,用于根据所述接收模块接收的所述目标模型信息,得到所述目标AI模型;
所述目标AI模型满足以下至少一项:
所述目标AI模型的目标传输模式,是根据所述第一AI模型传输装置支持的AI模型传输模式的能力确定的;
所述目标AI模型的目标应用时间,是根据所述目标传输模式确定的;
所述目标AI模型触发所述第一AI模型传输装置向所述第二AI模型传输装置发送目标反馈事件,所述目标反馈事件用于反馈所述目标AI模型的应用情况;
其中,所述目标传输模式包括以下任一项:第一传输模式、第二传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第二传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型参数信息。
20.根据权利要求19所述的AI模型传输装置,其特征在于,所述目标AI模型满足所述目标AI模型的目标传输模式,是根据所述第一AI模型传输装置支持的AI模型传输模式的能力确定的;所述第一AI模型传输装置还包括:发送模块;
所述发送模块,用于向所述第二AI模型传输装置发送目标信息,所述目标信息用于指示所述第一AI模型传输装置支持的AI模型传输模式的能力。
21.根据权利要求19或20所述的AI模型传输装置,其特征在于,所述第一AI模型传输装置支持的AI模型传输模式的能力包括以下任一项:
支持所述第一传输模式;
支持所述第二传输模式;
支持所述第一传输模式和所述第二传输模式。
22.根据权利要求19所述的AI模型传输装置,其特征在于,所述目标AI模型满足所述目标AI模型的目标应用时间,是根据所述目标传输模式确定的;所述第一AI模型传输装置还包括:确定模块;
所述确定模块,用于根据所述目标传输模式,确定所述目标应用时间。
23.根据权利要求22所述的AI模型传输装置,其特征在于,
所述确定模块,具体用于将所述目标传输模式对应的应用时间,确定为所述目标应用时间;
第一应用时间和第二应用时间之间满足以下至少一项:
所述第一应用时间大于所述第二应用时间;
所述第一应用时间大于或等于第三应用时间,所述第三应用时间是根据所述第二应用时间和AI模型的编译时间确定的;
其中,所述第一应用时间为:所述第一传输模式对应的AI模型应用时间;所述第二应用时间为:所述第二传输模式对应的AI模型应用时间。
24.根据权利要求22所述的AI模型传输装置,其特征在于,
所述确定模块,具体用于在所述目标传输模式为所述第一传输模式的情况下,若所述目标AI模型和所述第一AI模型传输装置中的预存AI模型相匹配,则将第四应用时间确定为所述目标应用时间;
其中,所述第四应用时间小于第一应用时间;所述第一应用时间为:所述第一传输模式对应的AI模型应用时间。
25.根据权利要求19所述的AI模型传输装置,其特征在于,所述目标AI模型满足所述目标AI模型触发所述第一AI模型传输装置向所述第二AI模型传输装置发送目标反馈事件;
所述目标反馈事件为以下任一项:第一反馈事件、第二反馈事件;
其中,所述第一反馈事件用于反馈未应用所述目标AI模型;所述第二反馈事件用于反馈已应用所述目标AI模型。
26.根据权利要求25所述的AI模型传输装置,其特征在于,所述第一反馈事件为以下任一项:
所述第一AI模型传输装置未应用所述目标AI模型;
所述第一AI模型传输装置未应用所述目标AI模型,且所述第一AI模型传输装置仍应用第一AI模型;
所述第一AI模型传输装置未应用所述目标AI模型,且所述第一AI模型传输装置不应用AI模型;
所述第一AI模型传输装置不支持所述第二AI模型传输装置通过所述目标传输模式发送的所述目标模型信息;
第三反馈事件;
所述第一AI模型传输装置不支持所述目标AI模型的第一模型信息;
其中,所述第一AI模型为:所述第一AI模型传输装置接收所述目标AI模型之前应用的AI模型;
所述第三反馈事件为:所述第一AI模型传输装置不支持所述第二AI模型传输装置通过所述目标传输模式发送的所述目标模型信息;所述第三反馈事件携带第一信息,所述第一信息为所述目标AI模型中的所述第一AI模型传输装置不支持的模型结构的信息;
所述第一模型信息包括以下至少一项:模型大小、模型复杂度、模型操作数。
27.根据权利要求25所述的AI模型传输装置,其特征在于,所述第二反馈事件为以下任一项:
所述第一AI模型传输装置已应用所述目标AI模型;
第四反馈事件;
所述第一AI模型传输装置已应用所述目标AI模型,且已替换第一AI模型;
所述第一AI模型传输装置支持所述第二AI模型传输装置通过所述目标传输模式发送的所述目标模型信息;
所述第一AI模型传输装置已编译所述目标AI模型;
其中,所述第四反馈事件为:所述第一AI模型传输装置已应用所述目标AI模型;所述第四反馈事件携带第二信息,所述第二信息为所述目标AI模型的模型标识信息;
所述第一AI模型为:所述第一AI模型传输装置接收所述目标AI模型之前应用的AI模型。
28.根据权利要求19所述的AI模型传输装置,其特征在于,所述处理模块,还用于在所述目标AI模型与所述第一AI模型传输装置的能力不匹配的情况下,不应用所述目标AI模型。
29.根据权利要求19所述的AI模型传输装置,其特征在于,所述第一AI模型传输装置还包括:发送模块;
所述发送模块,用于按照第三传输模式,向所述第二AI模型传输装置发送第二AI模型的第二模型信息;
其中,所述第三传输模式为所述第一传输模式或第四传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第四传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息;
所述目标AI模型与所述第二AI模型的模型结构信息相匹配。
30.根据权利要求19所述的AI模型传输装置,其特征在于,所述处理模块,还用于采用所述目标AI模型,执行第一操作;
其中,所述第一操作包括以下至少一项:
信号处理操作;
信号传输操作;
信号解调操作;
信道状态信息获取操作;
波束管理操作;
信道预测操作;
干扰抑制操作;
定位操作;
高层业务的预测和管理操作;
高层参数的预测和管理操作;
控制信令解析操作。
31.一种AI模型传输装置,其特征在于,所述AI模型传输装置为第二AI模型传输装置,所述第二AI模型传输装置包括:发送模块;
所述发送模块,用于向第一AI模型传输装置发送目标AI模型的目标模型信息;
所述目标模型信息用于所述第一AI模型传输装置得到所述目标AI模型;
所述目标AI模型满足以下至少一项:
所述目标AI模型的目标传输模式,是根据所述第一AI模型传输装置支持的AI模型传输模式的能力确定的;
所述目标AI模型的目标应用时间,是根据所述目标传输模式确定的;
所述目标AI模型触发所述第一AI模型传输装置向所述第二AI模型传输装置发送目标反馈事件,所述目标反馈事件用于反馈所述目标AI模型的应用情况;
其中,所述目标传输模式包括以下任一项:第一传输模式、第二传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第二传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型参数信息。
32.根据权利要求31所述的AI模型传输装置,其特征在于,所述目标AI模型满足所述目标AI模型的目标传输模式,是根据所述第一AI模型传输装置支持的AI模型传输模式的能力确定的;所述第二AI模型传输装置还包括:接收模块和确定模块;
所述接收模块,用于从所述第一AI模型传输装置接收目标信息,所述目标信息用于指示所述第一AI模型传输装置支持的AI模型传输模式的能力;
所述确定模块,用于根据所述接收模块接收的所述目标信息,确定目标传输模式;
所述发送模块,还用于基于所述确定模块确定的所述目标传输模式,向所述第一AI模型传输装置发送所述目标模型信息。
33.根据权利要求32所述的AI模型传输装置,其特征在于,所述目标传输模式为第一传输模式;
所述确定模块,还用于确定所述目标AI模型和所述第一AI模型传输装置中的预存AI模型是否相匹配;
所述发送模块,还用于若所述确定模块确定所述目标AI模型和所述预存AI模型相匹配,则按照第四传输模式,向所述第一AI模型传输装置发送所述目标AI模型;
其中,所述第四传输模式为以下任一项:第二传输模式、第五传输模式;
在所述第四传输模式为所述第二传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型参数信息;在所述第四传输模式为所述第五传输模式的情况下,所述目标模型信息包括所述目标AI模型的模型结构信息和模型参数信息;
所述第五传输模式对应的AI模型应用时间小于所述第一传输模式对应的AI模型应用时间。
34.根据权利要求32所述的AI模型传输装置,其特征在于,
所述接收模块,还用于从所述第一AI模型传输装置接收目标反馈事件;
其中,所述目标反馈事件用于反馈所述目标AI模型的应用情况。
35.根据权利要求32所述的AI模型传输装置,其特征在于,
所述接收模块,还用于从所述第一AI模型传输装置接收第二AI模型的第二模型信息,所述第二模型信息是所述第一AI模型传输装置按照第三传输模式发送的;
所述确定模块,还用于将与所述接收模块接收的所述第二AI模型的模型结构信息相匹配的模型结构信息,确定为所述目标AI模型的模型结构信息;
其中,所述第三传输模式为所述第一传输模式或第四传输模式;
在所述目标传输模式为所述第一传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息和模型参数信息;在所述目标传输模式为所述第四传输模式的情况下,所述第二模型信息包括所述第二AI模型的模型结构信息。
36.根据权利要求35所述的AI模型传输装置,其特征在于,
所述确定模块,具体用于以下任一项:
将与所述第二AI模型的模型结构信息相同的模型结构信息,确定为所述目标AI模型的模型结构信息;
将与所述第二AI模型的模型结构信息的相似度大于或等于预设门限的模型结构信息,确定为所述目标AI模型的模型结构信息。
37.一种终端,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至18中任一项所述的AI模型传输方法的步骤。
38.一种网络侧设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至18中任一项所述的AI模型传输方法的步骤。
39.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至18中任一项所述的AI模型传输方法的步骤。
CN202211167997.0A 2022-09-23 2022-09-23 人工智能ai模型传输方法、装置、终端及介质 Pending CN117835405A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211167997.0A CN117835405A (zh) 2022-09-23 2022-09-23 人工智能ai模型传输方法、装置、终端及介质
PCT/CN2023/120138 WO2024061287A1 (zh) 2022-09-23 2023-09-20 人工智能ai模型传输方法、装置、终端及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211167997.0A CN117835405A (zh) 2022-09-23 2022-09-23 人工智能ai模型传输方法、装置、终端及介质

Publications (1)

Publication Number Publication Date
CN117835405A true CN117835405A (zh) 2024-04-05

Family

ID=90453866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211167997.0A Pending CN117835405A (zh) 2022-09-23 2022-09-23 人工智能ai模型传输方法、装置、终端及介质

Country Status (2)

Country Link
CN (1) CN117835405A (zh)
WO (1) WO2024061287A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598855B (zh) * 2019-09-23 2023-06-09 Oppo广东移动通信有限公司 深度学习模型生成方法、装置、设备及存储介质
WO2021120177A1 (zh) * 2019-12-20 2021-06-24 华为技术有限公司 编译神经网络模型的方法和装置
WO2022041285A1 (zh) * 2020-08-31 2022-03-03 华为技术有限公司 一种模型数据传输方法及通信装置
CN114399019A (zh) * 2021-12-30 2022-04-26 南京风兴科技有限公司 神经网络编译方法、***、计算机设备及存储介质

Also Published As

Publication number Publication date
WO2024061287A1 (zh) 2024-03-28

Similar Documents

Publication Publication Date Title
CN116266216A (zh) 客户端筛选方法及装置、客户端及中心设备
WO2023040887A1 (zh) 信息上报方法、装置、终端及可读存储介质
CN117835405A (zh) 人工智能ai模型传输方法、装置、终端及介质
WO2023160547A1 (zh) 信息响应方法、信息发送方法、终端及网络侧设备
WO2024041419A1 (zh) 信息传输方法、装置、终端及网络侧设备
WO2024041420A1 (zh) 测量反馈处理方法、装置、终端及网络侧设备
CN116707729A (zh) 信息响应方法、信息发送方法、终端及网络侧设备
WO2023098535A1 (zh) 信息交互方法、装置及通信设备
CN117692954A (zh) 测量反馈处理方法、装置、终端及网络侧设备
CN116634444A (zh) 信息激活方法、终端及网络侧设备
CN117835262A (zh) Ai模型的处理方法、装置及通信设备
CN117997457A (zh) 参考信号确定方法、终端及网络侧设备
CN117674915A (zh) 确定方法、设备及可读存储介质
CN116208484A (zh) 信息交互方法、装置及通信设备
CN116261152A (zh) 波束检测方法、终端及网络侧设备
CN116614871A (zh) 功率控制pc参数的确定方法、装置及终端
CN117676654A (zh) 接收方法、设备及可读存储介质
CN117879737A (zh) 信道预测方法、装置及通信设备
CN117176216A (zh) 信道状态信息csi的传输方法、装置及终端
CN117834427A (zh) 更新ai模型参数的方法、装置及通信设备
CN117060959A (zh) 信道特征信息的获取方法、终端及网络侧设备
CN116707726A (zh) 传输方法、终端及网络侧设备
CN118054829A (zh) 波束报告的发送方法、接收方法、装置及通信设备
CN116963093A (zh) 模型调整方法、信息传输方法、装置及相关设备
CN117639862A (zh) Csi预测处理方法、装置、通信设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination