CN115392332A - Ai模型部署方法、***及存储介质 - Google Patents

Ai模型部署方法、***及存储介质 Download PDF

Info

Publication number
CN115392332A
CN115392332A CN202110574310.4A CN202110574310A CN115392332A CN 115392332 A CN115392332 A CN 115392332A CN 202110574310 A CN202110574310 A CN 202110574310A CN 115392332 A CN115392332 A CN 115392332A
Authority
CN
China
Prior art keywords
model
target
identification information
issuing
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110574310.4A
Other languages
English (en)
Inventor
潘绪洋
阳慢情
李志强
赵丛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gongdadi Innovation Technology Shenzhen Co ltd
Original Assignee
Gongdadi Innovation Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gongdadi Innovation Technology Shenzhen Co ltd filed Critical Gongdadi Innovation Technology Shenzhen Co ltd
Priority to CN202110574310.4A priority Critical patent/CN115392332A/zh
Publication of CN115392332A publication Critical patent/CN115392332A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供一种AI模型部署方法、服务器、显示设备、***及存储介质,属于人工智能领域。该方法包括:获取训练数据集和待训练的初始AI模型;基于训练数据集对初始AI模型进行训练,以生成目标AI模型;接收显示设备发送的模型下发指令;对模型下发指令进行解析,以获取待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息;根据第一标识信息和第二标识信息,执行AI模型下发指令,以供目标终端设备接收并加载目标AI模型。通过AI模型下发页面将目标AI模型快速便捷地下发给目标终端设备,极大地提高了AI模型的部署灵活性和便利性,使得用户能够快速便捷地在终端上使用AI模型。

Description

AI模型部署方法、***及存储介质
技术领域
本发明涉及人工智能领域,尤其涉及一种AI模型部署方法、服务器、显示设备、***及存储介质。
背景技术
随着人工智能的快速发展,AI模型广泛应用于人脸识别、图像分类、物体检测、语音识别和自然语言处理等领域。目前,人们主要通过数据线或其他方式将AI模型烧写到终端设备中,使得终端设备能够运行AI模型来进行人脸识别、图像分类、物体检测、语音识别等,但常规的将AI模型烧录到终端设备的方法过于繁琐复杂,而且不利于对终端设备中的AI模型进行灵活更新和替换,用户体验不好。
发明内容
本发明实施例提供了一种AI模型部署方法、服务器、显示设备、***及存储介质,有助于提高终端设备中的AI模型的部署灵活性。
第一方面,本发明实施例提供一种AI模型部署方法,应用于服务器,所述方法包括:
获取训练数据集和待训练的初始AI模型;
基于所述训练数据集对所述初始AI模型进行训练,以生成目标AI模型;
接收显示设备发送的模型下发指令,其中,所述模型下发指令是所述显示设备根据用户对显示的AI模型下发页面的操作而生成的;
对所述模型下发指令进行解析,以获取待部署模型的目标终端设备的第一标识信息和待下发的所述目标AI模型的第二标识信息;
根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令,以供所述目标终端设备接收并加载所述目标AI模型。
第二方面,本发明实施例还提供了一种AI模型部署方法,应用于显示设备,所述方法包括:
显示AI模型下发页面;
响应用户对所述AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;
基于所述第一标识信息和所述第二标识信息生成模型下发指令;
向服务器发送所述模型下发指令,以供所述服务器执行所述模型下发指令,以将所述第二标识信息对应的目标AI模型下发给所述第一标识信息对应的目标终端设备,以使所述目标终端设备接收并加载所述目标AI模型。
第三方面,本发明实施例还提供一种服务器,所述服务器包括处理器、存储器以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的AI模型部署方法的步骤。
第四方面,本发明实施例还提供一种显示设备,所述显示设备包括显示装置、处理器、存储器以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的AI模型部署方法的步骤。
第五方面,本发明实施例还提供一种AI模型部署***,所述AI模型部署***包括终端设备、如上所述的服务器和如上所述的显示设备,所述服务器分别与所述显示设备和所述终端设备通信连接。
第六方面,本发明实施例还提供一种存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如本发明说明书提供的任一项AI模型部署的方法的步骤。
基于上述AI模型部署方法,服务器能够响应用户需求,根据用户提供的训练数据集对初始AI模型进行训练,以获取准确率较高且与用户需求相匹配的目标AI模型,用户可以通过显示设备显示的AI模型下发页面,一键触发模型下发指令,并由显示设备发送给服务器,再由服务器基于模型下发指令中的待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息,向目标终端设备下发目标AI模型,使得目标终端设备能够接收并加载目标AI模型。通过对初始AI模型进行自动化训练获得目标AI模型后,再通过AI模型下发页面将目标AI模型快速便捷地下发给目标终端设备,极大地提高了AI模型的部署灵活性和便利性,使得用户能够快速便捷地在终端上使用AI模型。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是实施本发明实施例提供的AI模型部署方法的一场景示意图;
图2是本发明实施例提供的一种AI模型部署方法的步骤流程示意图;
图3是本发明实施例中的模型下发页面的一示意图;
图4是本发明实施例中的模型下发子页面的另一示意图;
图5是本发明实施例中的模型下发子页面的另一示意图;
图6是本发明实施例中的模型下发子页面的另一示意图;
图7是本发明实施例中的模型下发子页面的另一示意图;
图8是本发明实施例提供的另一种AI模型部署方法的步骤流程示意图;
图9是本发明实施例提供的另一种AI模型部署方法的步骤流程示意图;
图10是本发明实施例提供的一种服务器的结构示意框图;
图11是本发明实施例提供的一种显示设备的结构示意框图;
图12是本发明实施例提供的一种AI模型部署***的结构示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
下面结合附图,对本发明的一些实施例作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
随着人工智能的快速发展,AI模型广泛应用于人脸识别、图像分类、物体检测、语音识别和自然语言处理等领域。目前,人们主要通过数据线或其他方式将AI模型烧写到终端设备中,使得终端设备能够运行AI模型来进行人脸识别、图像分类、物体检测、语音识别等,但终端设备中的AI模型无法灵活更新和替换,用户体验不好。
为解决上述问题,本发明实施例提供一种AI模型部署方法、服务器、显示设备、***及存储介质,基于该AI模型部署方法,服务器能够响应用户需求,根据用户提供的训练数据集对初始AI模型进行训练,以获取准确率较高且与用户需求相匹配的目标AI模型,之后用户可以通过显示设备显示的AI模型下发页面,一键触发模型下发指令,并由显示设备发送给服务器,再由服务器基于模型下发指令中的待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息,向目标终端设备下发目标AI模型,使得目标终端设备能够接收并加载目标AI模型,通过AI模型下发页面将目标AI模型快速便捷地下发给目标终端设备,极大地提高了AI模型的部署灵活性和便利性,使得用户能够快速便捷地在终端上使用AI模型。
请参阅图1,图1是实施本发明实施例提供的AI模型部署方法的一场景示意图。如图1所示,该场景包括服务器100、显示设备200和终端设备300,服务器100分别与显示设备200和终端设备300通信连接。其中,与服务器100连接的终端设备300可以为多个,服务器100可存储多个AI模型,多个AI模型可以包括人脸识别模型、图像分类模型、物体检测模型、高空抛物检测模型、语音识别模型和自然语言处理模型等。服务器100还可用于响应用户需求,根据用户提供的训练数据集对初始AI模型进行模型训练工作,以获取准确率较高且与用户需求相匹配的AI模型,该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。
在一实施例中,显示设备200包括显示装置,该显示装置用于显示服务器100的模型训练页面、模型下发页面,用户可通过在模型训练页面上的操作开展模型训练工作,以生成用户所需的目标AI模型,并能够通过在模型下发页面的操作将目标AI模型部署到对应的终端,其中,终端包含但不限于移动终端、边缘测设备等。需要说明的是,显示装置包括设置在显示设备200上的显示屏,该显示屏包括LED显示屏、OLED显示屏、LCD显示屏等等。其中,显示设备可以是智能手机、平板电脑、个人计算机、笔记本电脑等,或者也可以是带有显示屏的其他电子设备,本发明实施例对此不做具体限定。
在一实施例中,终端设备300包括图像采集装置,通过该图像采集装置可以扫描服务器100的连接建立页面,得到服务器100的IP地址,使得终端设备300能够基于该IP地址,向服务器100发送连接建立请求,服务器100基于终端设备300发送的连接建立请求,建立终端设备300与服务器100之间的通信连接。其中,该连接建立页面包括服务器的连接条码图像,该连接条码图像携带有服务器100的IP地址,该连接条码图像包括一维码图像或二维码图像,终端设备300可以是智能手机、平板电脑、个人计算机、笔记本电脑、数码相机、单反相机、行车记录仪、监控摄像头、穿戴式设备、家电设备等。
在一实施例中,显示设备200显示AI模型下发页面;显示设备200响应用户对AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;基于第一标识信息和第二标识信息生成模型下发指令;显示设备200向服务器100发送模型下发指令;服务器100获取显示设备100发送的模型下发指令,并从模型下发指令中获取待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息;服务器100基于第一标识信息和第二标识信息,执行AI模型下发指令,以供目标终端设备接收并加载目标AI模型。
以下,将结合图1中的场景对本发明的实施例提供的AI模型部署方法进行详细介绍。需知,图1中的场景仅用于解释本发明实施例提供的AI模型部署方法,但并不构成对本发明实施例提供的AI模型部署方法应用场景的限定。
请参阅图2,图2是本发明实施例提供的一种AI模型部署方法的步骤流程示意图。该AI模型部署方法应用于服务器。
如图2所示,该AI模型部署方法可以包括步骤S101至步骤S105。
步骤S101、获取训练数据集和待训练的初始AI模型。
其中,服务器可存储多个初始AI模型,多个初始AI模型可以包括人脸识别模型、图像分类模型、物体检测模型、语音识别模型和自然语言处理模型等。
在一实施例中,显示设备显示AI模型训练页面,并获取用户在该AI模型训练页面中输入的训练数据集的存储路径和待训练的初始AI模型的模型标识信息;将该模型标识信息和该存储路径下的训练数据集上传给服务器;服务器获取显示设备上传的训练数据集和模型标识信息,并将该模型标识信息对应的AI模型确定为待训练的初始AI模型。
示例性的,该AI模型训练页面包括数据上传按键、AI模型列表和确认按键;获取用户在该AI模型列表中选择的初始AI模型的模型标识信息;响应用户对该数据上传按键的触发操作,显示数据上传弹窗,并获取用户在该数据上传弹窗中输入的存储路径;响应用户对该确认按键的触发操作,将该模型标识信息和该存储路径下的训练数据集上传给服务器。
其中,待训练的初始AI模型还可以是服务器对上传的训练数据集进行任务判断分析,而从服务器中获得的。即是,用户无需输入待训练的初始AI模型,或者无需选择待训练的初始AI模型的模型标识信息,该模型标识信息对应的AI模型可被确定为待训练的初始AI模型。
步骤S102、基于训练数据集对初始AI模型进行训练,以生成目标AI模型。
示例性的,服务器中构建有自动化AI训练平台,该自动化AI训练平台能根据训练数据集对初始AI模型进行自动化训练,以获得效果较为理想的目标AI模型。
步骤S103、接收显示设备发送的模型下发指令。
其中,该模型下发指令是显示设备根据用户对显示的AI模型下发页面的操作生成的。示例性的,该模型下发指令是显示设备根据用户对显示的AI模型下发页面中的模型下发按键的触发操作生成的。该模型下发按键为虚拟按键。
在一实施例中,显示设备显示AI模型下发页面;响应用户对该AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;基于第一标识信息和第二标识信息生成模型下发指令,并向服务器发送模型下发指令。其中,AI模型下发页面包括模型下发按键,用户对该AI模型下发页面的触发操作包括用户对该模型下发按键的触发操作。
在一实施例中,模型下发页面包括AI模型信息栏和模型下发按键。可以理解的是,一个模型下发按键可以对应一个AI模型信息栏,也即一个模型下发按键对应下发一个AI模型,一个模型下发按键也可以对应多个AI模型信息栏,也即一个模型下发按键对应下发多个AI模型。其中,AI模型信息栏可以包括但不限于AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率、训练详情按键、模型预测按键、模型下发按键等。
示例性的,响应用户对该AI模型下发按键的触发操作,将与服务器连接的每个终端设备确定为待部署模型的目标终端设备,并将与AI模型下发按键对应的AI模型确定为待下发的目标AI模型;获取每个目标终端设备的第一标识信息和每个目标AI模型的第二标识信息。
例如,如图3所示,模型下发页面包括4个AI模型信息栏,分别为AI模型信息栏11、AI模型信息栏12、AI模型信息栏13和AI模型信息栏14,AI模型信息栏11对应的AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率分别为“2021-05-07-自动训练-安全帽佩戴数据集”、“训练成功”、“2021-5-7 11:23:52”、“安全帽佩戴数据集-v1”和91%。AI模型信息栏12对应的AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率分别为“2021-05-07-自动训练-安全帽佩戴数据集”、“训练成功”、“2021-5-7 10:21:00”、“安全帽佩戴数据集-v1”和89%。
AI模型信息栏13对应的AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率分别为“2021-04-30-自动训练-安全帽佩戴数据集”、“训练成功”、“2021-4-30 16:38:27”、“安全帽佩戴数据集-v1”和89%。AI模型信息栏14对应的AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率分别为“2021-04-30-自动训练-风扇-v1-模型”、“训练成功”、“2021-4-30 16:36:48”、“风扇-v1”和98%。若检测到用户对AI模型信息栏11中的模型下发按键的触发操作,则将AI模型信息栏11对应的AI模型确定为AI模型确定为待下发的目标AI模型。
在一实施例中,显示设备显示AI模型下发页面,其中,该AI模型下发页面包括AI模型信息栏和模型下发按键;响应用户对该模型下发按键的触发操作,显示被触发的模型下发按键对应的AI模型下发子页面;响应用户对AI模型下发子页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;基于第一标识信息和第二标识信息生成模型下发指令,并向服务器发送模型下发指令。
在一实施例中,AI模型下发子页面包括模型下发按键、至少一个终端信息栏、该终端信息栏对应的选择按键,响应用户对模型下发按键的触发操作,根据每个选择按键的状态信息,确定待部署模型的目标终端设备的第一标识信息;将与该AI模型下发按键对应的AI模型确定为待下发的目标AI模型,并获取每个目标AI模型的第二标识信息。其中,选择按键对应的状态信息包括第一状态信息或第二状态信息,第一状态信息用于表示选择按键处于开启状态,第二状态信息用于表示选择按键处于关闭状态。
其中,终端信息栏可以包括但不限于终端设备的设备ID、设备名、注册码有效期、设备状态信息,该设备状态信息包括离线状态信息或在线状态信息,该在线状态信息用于表示终端设备当前运行的应用程序为预设应用程序,终端设备处于在线状态,该离线状态信息用于表示终端设备当前运行的应用程序不为预设应用程序,终端设备处于离线状态。其中,预设应用程序用于实现服务器与终端设备之间的数据交互。
例如,如图4所示,模型下发按键位于模型下发子页面的右下角,取消按键位于模型下发子页面的左下角,模型下发子页面包括5个终端信息栏,5个终端信息栏对应的终端设备与服务器通信连接的终端设备,且这5个终端设备的设备ID分别为13:26:14:52:94:85、46:68:39:62:85:73、57:75:01:29:55:20、85:27:45:49:75:10、26:96:34:52:64:65,设备名分别为Terminal-101、Terminal-102、Terminal-103、Terminal-104、Terminal-105,注册码有效期均为2022-04-1619:52:58,设备状态分别为离线状态、在线状态、离线状态、在线状态、离线状态,对应的选择按键的状态分别为开启状态、开启状态、开启状态、关闭状态、关闭状态,通过图4中的每个选择按键的状态可知,用户选择了设备ID分别为13:26:14:52:94:85、46:68:39:62:85:73、57:75:01:29:55:20对应的终端设备,因此,在检测到用户对模型下发按键的触发操作时,可以将13:26:14:52:94:85、46:68:39:62:85:73、57:75:01:29:55:20作为待部署模型的目标终端设备的第一标识信息。
其中,注册码有效期为终端设备在服务器中注册账号时所确定的设备ID的有效期,用于管理终端设备的设备ID的有效期,也即终端设备的设备ID超过有效期后,需要终端设备重新向服务器注册新的设备ID,并确定新的注册码有效期。注册码有效期的长短可基于实际情况进行设置,本发明实施例对此不做具体限定。
在一实施例中,响应用户对选择按键的触发操作,切换被触发的选择按键的显示方式和更新被触发的选择按键对应的状态信息;响应用户对该AI模型下发按键的触发操作,根据更新后的每个选择按键对应的状态信息,确定待部署模型的目标终端设备的第一标识信息;将与该AI模型下发按键对应的AI模型确定为待下发的目标AI模型,并获取每个目标AI模型的第二标识信息。用户可以通过对选择或调整按键的触发操作来确定待部署模型的目标终端设备,提高了AI模型部署的便利性。
其中,选择按键的显示方式包括第一显示方式或第二显示方式,第一显示方式与第二显示方式不同,第一显示方式用于表示选择按键处于开启状态,即用户选中对应的终端设备作为待部署模型的目标终端设备,第二显示方式用于表示选择按键处于关闭状态,即用户未选中对应的终端设备作为待部署模型的目标终端设备。例如,第一显示方式为选择按键的显示颜色为黑色,第二显示方式为选择按键的显示颜色为白色。
示例性的,若检测到用户对设备ID为57:75:01:29:55:20对应的选择按键的触发操作,又检测到用户对设备ID为85:27:45:49:75:10对应的选择按键的触发操作,则更新后的模型下发子页面如图5所示,设备ID为57:75:01:29:55:20对应的选择按键的状态变为关闭状态,显示颜色为白色,设备ID为85:27:45:49:75:10对应的选择按键的状态变为开启状态,显示颜色为黑色,通过图4中的每个选择按键的状态和显示颜色可知,用户选择了设备ID分别为13:26:14:52:94:85、46:68:39:62:85:73和85:27:45:49:75:10对应的终端设备,因此,在检测到用户对模型下发按键的触发操作时,可以将13:26:14:52:94:85、46:68:39:62:85:73、85:27:45:49:75:10作为待部署模型的目标终端设备的第一标识信息。
在一实施例中,用户可以通过模型下发子页面配置终端信息栏对应的终端设备的待部署AI模型,可以给终端设备配置一个或多个待部署AI模型,具体为:显示设备响应用户对终端信息栏的触发操作,显示对应的终端设备的AI模型下拉菜单,AI模型下拉菜单包括AI模型删除按键和AI模型增加按键;响应用户对AI模型增加按键的触发操作,显示AI模型选择弹窗,该AI模型选择弹窗包括多个AI模型的模型ID和确认按键;获取用户在该AI模型选择弹窗中选择的目标模型ID,并在检测到用户对该确认按键的触发操作时,根据该目标模型ID,在该AI模型下拉菜单中新增对应的AI模型选项栏;响应用户对显示该AI模型下拉菜单的终端设备选项的触发操作,隐藏该AI模型下拉菜单,并生成对应终端设备的AI模型配置信息。
在一实施例中,获取待下发的AI模型的第二标识信息的方式可以为:根据更新后的每个选择按键对应的状态信息,确定待部署模型的目标终端设备的第一标识信息;获取第一标识信息对应的目标终端设备的AI模型配置信息,并从该AI模型配置信息中获取待下发的目标AI模型的第二标识信息。
示例性的,如图4所示,当用户通过手指或鼠标点击第二个终端信息栏时,显示的AI模型下拉菜单如图6所示,AI模型下拉菜单显示有一个AI模型选项栏,且该AI模型选项栏显示的模型ID、模型名、准确率分别为2M:58:D9:93、AI模型201和95%,AI模型删除按键21位于AI模型选项栏上,且位于右侧,AI模型增加按键22位于空白选项栏上。如图7所示,新增的AI模型选项栏显示的模型ID、模型名、准确率分别为52:4C:V5:96、AI模型205和92%,当用户通过手指或鼠标点击AI模型下拉菜单时,显示的模型下发页面由图7变化为图5。
步骤S104、对模型下发指令进行解析,以获取待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息。
其中,该模型下发指令可以包括一个目标终端设备的第一标识信息和一个目标AI模型的第二标识信息,或者也可以包括多个目标终端设备的第一标识信息和一个目标AI模型的第二标识信息,或者也可以包括多个目标终端设备的第一标识信息和多个目标AI模型的第二标识信息,或者也可以包括一个目标终端设备的第一标识信息和多个目标AI模型的第二标识信息,本发明实施例对此不做具体限定。
示例性的,第一标识信息用于唯一标识目标终端设备,第一标识信息可以包括目标终端设备的设备ID和/或设备名称,第二标识信息用于唯一标识目标AI模型,第二标识信息可以包括目标AI模型的模型ID和/或模型名称,第一标识信息或第二标识信息中的字符可以包括数字、大小字母、小写字母、和/或希腊字母,当然也可以包括其余的字符,本发明实施例对此不做具体限定。
步骤S105、根据第一标识信息和第二标识信息,执行AI模型下发指令,以供目标终端设备接收并加载目标AI模型。
示例性的,若第一标识信息为一个,且第二标识信息为一个,则将第二标识信息对应的目标AI模型下发给第一标识信息对应的目标终端设备。
若第一标识信息为多个,且第二标识信息为一个,则将第二标识信息对应的目标AI模型下发给每个第一标识信息对应的目标终端设备,即将一个目标AI模型下发给多个目标终端设备。
若第一标识信息为一个,且第二标识信息为多个,则将每个第二标识信息对应的目标AI模型全部下发给第一标识信息对应的目标终端设备,即将多个目标AI模型全部下发给一个目标终端设备。
在一实施例中,在向目标终端设备下发目标AI模型的过程中,服务器向目标终端设备发送目标AI模型的下载进度信息,目标终端设备显示目标AI模型的下载进度信息。其中,下载进度信息包括下载百分比和下载进度条。通过显示目标AI模型的下载进度信息,便于用户知晓目标AI模型的下载进度,提高用户体验。
在一实施例中,该模型下发指令携带有多个第一标识信息、多个第二标识信息、第一标识信息与第二标识信息之间的映射关系信息,因此,根据第一标识信息和第二标识信息,执行AI模型下发指令可以包括:根据该映射关系信息,从多个第二标识信息中确定每个第一标识信息对应的至少一个第二标识信息;根据每个第一标识信息对应的至少一个第二标识信息,向每个第一标识信息对应的目标终端设备下发对应的至少一个目标AI模型。通过上述方案,可以在不同的终端设备上部署相同或不同的AI模型,且一个终端设备可以部署一个或多个AI模型,使得终端设备可以运行一个或多个AI模型。
其中,每个第一标识信息对应的至少一个第二标识信息可以相同,也可以不同,该模型下发指令携带的多个第一标识信息、多个第二标识信息、第一标识信息与第二标识信息之间的映射关系信息是由用户通过模型下发页面进行配置的。例如,第一标识信息有3个,分别为13:26:14:52:94:85、46:68:39:62:85:73和57:75:01:29:55:20,第二标识信息有4个,分别为A1:48:B5:49、52:4C:V5:96、2M:58:D9:93和57:R5:5T:20,第一标识信息与第二标识信息之间的映射关系信息如下表1所示。
表1
第一标识信息 第二标识信息
13:26:14:52:94:85 A1:48:B5:49、57:R5:5T:20
46:68:39:62:85:73 52:4C:V5:96、2M:58:D9:93
57:75:01:29:55:20 2M:58:D9:93、52:4C:V5:96、A1:48:B5:49
如表1所示,13:26:14:52:94:85与A1:48:B5:49、57:R5:5T:20对应,46:68:39:62:85:73与52:4C:V5:96、2M:58:D9:93对应,57:75:01:29:55:20与2M:58:D9:93、52:4C:V5:96、A1:48:B5:49对应,因此,服务器将A1:48:B5:49对应的目标AI模型和57:R5:5T:20对应的目标AI模型下发给13:26:14:52:94:85对应的目标终端设备,将52:4C:V5:96对应的目标AI模型和2M:58:D9:93对应的目标AI模型下发给46:68:39:62:85:73对应的目标终端设备,将2M:58:D9:93对应的目标AI模型、52:4C:V5:96对应的目标AI模型和A1:48:B5:49对应的目标AI模型下发给57:75:01:29:55:20对应的目标终端设备。
在一实施例中,由于终端设备的计算能力有限,而一些AI模型对计算能力需求较高,在终端设备的计算能力较低的情况下,终端设备无法有效的部署与运行对计算能力需求高的AI模型,因此,确定第一标识信息对应的目标终端设备的计算能力指数;若确定的计算能力指数小于或等于预设的计算能力指数阈值,则对第二标识信息对应的目标AI模型进行压缩;将压缩后的目标AI模型下发给第一标识信息对应的目标终端设备,以供目标终端设备接收并加载压缩后的目标AI模型。通过对目标AI模型压缩之后,再下发给终端设备,便于终端设备运行部署的AI模型。
示例性的,对第二标识信息对应的目标AI模型进行压缩的方式可以为:根据目标终端设备的计算能力指数,确定目标AI模型的压缩策略,并按照确定的压缩策略对目标AI模型进行压缩。其中,服务器中存储有计算能力指数与压缩策略之间的映射关系,通过该映射关系和目标终端设备的计算能力指数,可以自适应的确定目标AI模型的压缩策略,使得按照确定的压缩策略进行压缩后的目标AI模型能够更好的适配目标终端设备,可以进一步的提高AI模型部署的灵活性,也便于终端设备运行部署的AI模型。
示例性的,确定第一标识信息对应的目标终端设备的计算能力指数的方式可以为:获取预存的标识信息与计算能力指数之前的映射关系,并根据该映射关系和该第一标识信息,确定第一标识信息对应的目标终端设备的计算能力指数。其中,终端设备的计算能力指数用于表征终端设备的计算能力,计算能力指数越高,则表示终端设备的计算能力越强,而技术能力指数越低,则表示终端设备的计算能力越弱。其中,预存的标识信息与计算能力指数之前的映射关系是根据与服务器建立通信连接的终端设备的芯片类型和标识信息确定的,预设的计算能力指数阈值可基于实际情况进行设置,本申请实施例对此不做具体限定。
在一实施例中,确定第一标识信息对应的目标终端设备的类型信息;根据该类型信息,确定目标AI模型的目标格式,并将第二标识信息对应的目标AI模型的格式转换该目标格式;将进行格式转换后的目标AI模型下发给第一标识信息对应的目标终端设备,以供目标终端设备接收并加载压缩后的目标AI模型。其中,服务器中存储有类型信息与格式之间的映射关系,通过该映射关系和目标终端设备的类型信息,可以确定目标AI模型的目标格式。通过基于终端设备的类型信息自适应转换AI模型的格式,便于终端设备运行部署的AI模型。
在一实施例中,获取第一标识信息对应的目标终端设备的模型加载列表,该模型加载列表包括目标终端设备已加载的AI模型的第三标识信息;若第二标识信息与第三标识信息不同,则将第二标识信息对应的目标AI模型下发给第一标识信息的对应的目标终端设备,以使目标终端设备接收并加载所述目标AI模型,以更新已加载的AI模型。通过上述方式,可以基于用户的需求更新终端设备中部署的AI模型,使得部署的AI模型更加贴合用户的需求。
在一实施例中,若第二标识信息与第三标识信息相同,则确定第二标识信息对应的目标AI模型的第二版本信息与模型加载列表中已加载的AI模型的第一版本信息是否不同;若第二版本信息与第一版本信息不同,将第二标识信息对应的目标AI模型下发给第一标识信息的对应的目标终端设备,以供目标终端设备接收并加载目标AI模型,以更新已加载的AI模型。通过上述方案,可以在服务器中的AI模型更新后,及时地更新终端设备中部署的AI模型。
在一实施例中,若第二版本信息与第一版本信息相同,则不向第一标识信息的对应的目标终端设备下发第二标识信息对应的目标AI模型。通过在下发的AI模型与终端设备中已加载的AI模型相同的情况下,不向终端设备下发相同的AI模型,避免在终端设备中重复部署相同的AI模型。在另一实施例中,终端设备在接收到服务器下发的目标AI模型时,若确定下发的目标AI模型与本地已加载的AI模型相同,则向服务器发送下发中断信息,服务器在接收到下发中断信息时,停止向终端设备下发目标AI模型。通过上述方案,可以避免在终端设备中重复部署相同的AI模型。
在一实施例中,显示终端设备与服务器之间的连接建立页面;终端设备扫描连接建立页面,得到服务器的IP地址,并根据该IP地址,生成连接建立请求,然后向服务器发送该连接建立请求;服务器获取终端设备发送的连接建立请求,根据该连接建立请求,建立终端设备与服务器之间的通信连接。通过终端设备扫描服务器的连接建立页面,可以便利的建立服务器与终端设备之间的通信连接,提高了用户体验。
其中,连接建立请求是终端设备扫描服务器的连接建立页面生成的,连接建立页面包括服务器的连接条码图像,该连接条码图像携带有服务器的IP地址,该连接条码图像包括一维码图像或二维码图像。示例性的,终端设备通过图像采集装置扫描该连接建立页面中的连接条码图像,得到服务器的IP地址,并根据该IP地址,向服务器发送连接建立请求。通过终端设备扫描服务器的一维码图像或二维码图像,可以便利的建立服务器与终端设备之间的通信连接,提高了用户体验。
在一实施例中,在终端设备与服务器建立通信连接后,服务器获取终端设备的属性信息,并根据该属性信息生成列表更新指令,然后向显示设备发送该列表更新指令;显示设备获取服务器发送的列表更新指令,并从该列表更新指令中获取与服务器建立连接的新的终端设备的属性信息,并根据该属性信息更新该终端设备连接列表。
其中,该属性信息包括终端设备的设备ID、设备名、注册码有效期、设备状态信息和终端上模型列表,在终端设备与服务器之间的通信连接建立好后,给终端设备分配设备ID和有效期,终端设备运行预设应用程序,并在运行的预设应用程序内,获取图像采集装置扫描该目标二维码得到的服务器的IP地址,从而根据该IP地址,向服务器发送连接建立请求。
在一实施例中,若目标AI模型为多个,则获取第一标识信息对应的目标终端设备的数据接收能力指数;根据数据能力接收指数和每个目标AI模型的数据量,确定每个目标AI模型的下发顺序;按照每个目标AI模型的下发顺序,将每个目标AI模型下发给第一标识信息对应的目标终端设备。其中,目标终端设备的数据接收能力指数用于表示目标终端设备能够接收数据的最大数据量,接收能力指数越高,则表示目标终端设备能够接收数据的最大数据量越多,接收能力指数越低,则表示目标终端设备能够接收数据的最大数据量越少。通过上述方案,可以减少服务器与目标终端设备之间的数据传输拥堵,极大的提高了数据传输效率,便于终端设备部署AI模型。
示例性的,根据数据能力接收指数和每个目标AI模型的数据量,确定每个目标AI模型的下发顺序的方式可以为:获取该数据能力接收指数对应的数据传输量;确定每个目标AI模型的数据量与该数据传输量的之间的比值;根据每个目标AI模型的数据量与该数据传输量的之间的比值,确定每个目标AI模型的下发顺序。例如,目标AI模型A、目标AI模型B和目标AI模型C的数据量与该数据传输量的之间的比值分别为0.4、0.5和0.9,则目标AI模型A、目标AI模型B和目标AI模型C的下方顺序为:先下发目标AI模型A、然后下发目标AI模型B,最后下发目标AI模型C,或者先同时下发目标AI模型A和目标AI模型,之后下发目标AI模型C,又或者,先下发目标AI模型C,之后同时下发目标AI模型A和目标AI模型。
在一实施例中,模型下发指令还携带有多个目标AI模型的调用顺序,因此,在目标终端设备接收并加载多个目标AI模型之后,可以基于多个目标AI模型的调用顺序,依次目标AI模型来执行多模型任务。例如,目标AI模型D、目标AI模型E和目标AI模型F的调用顺序为先调用目标AI模型E,然后调用目标AI模型F,最后调用目标AI模型D,因此,在目标终端设备接收并加载目标AI模型D、目标AI模型E和目标AI模型F之后,先调用目标AI模型E,然后调用目标AI模型F,最后调用目标AI模型D来完成多模型任务。
上述实施例提供的AI模型部署方法,服务器能够响应用户需求,根据用户提供的训练数据集对初始AI模型进行训练,以获取准确率较高且与用户需求相匹配的目标AI模型,之后用户可以通过显示设备显示的AI模型下发页面,一键触发模型下发指令,并由显示设备发送给服务器,再由服务器基于模型下发指令中的待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息,向目标终端设备下发目标AI模型,使得目标终端设备能够接收并加载目标AI模型,极大地提高了终端设备中的AI模型的部署灵活性和便利性,提高了用户体验。
请参阅图8,图8是本发明实施例提供的另一种AI模型部署方法的步骤流程示意图。该AI模型部署方法应用于显示设备。
如图8所示,该AI模型部署方法可以包括步骤S201至S204。
步骤S201、显示AI模型下发页面;
步骤S202、响应用户对AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;
其中,AI模型下发页面包括模型下发按键,用户对该AI模型下发页面的触发操作包括用户对该模型下发按键的触发操作。示例性的,响应用户对该AI模型下发按键的触发操作,将与服务器连接的每个终端设备确定为待部署模型的目标终端设备,并将与AI模型下发按键对应的AI模型确定为待下发的目标AI模型;获取每个目标终端设备的第一标识信息和每个目标AI模型的第二标识信息。
在一实施例中,模型下发页面包括AI模型信息栏和模型下发按键。可以理解的是,一个模型下发按键可以对应一个AI模型信息栏,也即一个模型下发按键对应下发一个AI模型,一个模型下发按键也可以对应多个AI模型信息栏,也即一个模型下发按键对应下发多个AI模型。其中,AI模型信息栏包括AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率、训练详情按键、模型预测按键、模型下发按键等。
在一实施例中,显示设备显示AI模型下发页面,其中,该AI模型下发页面包括AI模型信息栏和模型下发按键;响应用户对该模型下发按键的触发操作,显示被触发的模型下发按键对应的AI模型下发子页面;响应用户对AI模型下发子页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;基于第一标识信息和第二标识信息生成模型下发指令,并向服务器发送模型下发指令。
在一实施例中,AI模型下发子页面包括模型下发按键、至少一个终端信息栏、该终端信息栏对应的选择按键,响应用户对模型下发按键的触发操作,根据每个选择按键的状态信息,确定待部署模型的目标终端设备的第一标识信息;将与该AI模型下发按键对应的AI模型确定为待下发的目标AI模型,并获取每个目标AI模型的第二标识信息。其中,选择按键对应的状态信息包括第一状态信息或第二状态信息,第一状态信息用于表示选择按键处于开启状态,第二状态信息用于表示选择按键处于关闭状态。
在一实施例中,响应用户对选择按键的触发操作,切换被触发的选择按键的显示方式和更新被触发的选择按键对应的状态信息;响应用户对该AI模型下发按键的触发操作,根据更新后的每个选择按键对应的状态信息,确定待部署模型的目标终端设备的第一标识信息;将与该AI模型下发按键对应的AI模型确定为待下发的目标AI模型,并获取每个目标AI模型的第二标识信息。用户可以通过对选择或调整按键的触发操作来确定待部署模型的目标终端设备,提高了AI模型部署的便利性。
步骤S203、基于第一标识信息和第二标识信息,生成模型下发指令;
步骤S204、向服务器发送模型下发指令,以供服务器执行模型下发指令,以将第二标识信息对应的目标AI模型下发给第一标识信息对应的目标终端设备,以使目标终端设备接收并加载目标AI模型。
其中,该模型下发指令可以包括一个目标终端设备的第一标识信息和一个目标AI模型的第二标识信息,或者也可以包括多个目标终端设备的第一标识信息和一个目标AI模型的第二标识信息,或者也可以包括多个目标终端设备的第一标识信息和多个目标AI模型的第二标识信息,或者也可以包括一个目标终端设备的第一标识信息和多个目标AI模型的第二标识信息,本发明实施例对此不做具体限定。
在一实施例中,显示终端设备与服务器之间的连接建立页面,该终端设备在扫描连接建立页面后,生成连接建立请求,并向服务器发送所述连接建立请求;获取服务器发送的列表更新指令,该列表更新指令是服务器基于终端设备发送的连接建立请求,与新的终端设备建立连接后生成的;从列表更新指令中获取与新的终端设备的属性信息,并根据属性信息更新终端设备连接列表。其中,连接建立页面包括服务器的连接条码图像,该连接条码图像携带有服务器的IP地址,该连接条码图像包括一维码图像或二维码图像,终端设备连接列表包括与服务器连接的终端设备的属性信息,该属性信息包括终端设备的设备ID、设备名、注册码有效期、设备状态信息和终端上模型列表。通过终端设备扫描服务器的连接建立页面,可以便利的建立服务器与终端设备之间的通信连接,提高了用户体验。
上述实施例提供的AI模型部署方法,用户可以通过显示设备显示的AI模型下发页面,一键触发模型下发指令,并由显示设备发送给服务器,再由服务器基于模型下发指令中的待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息,向目标终端设备下发目标AI模型,使得目标终端设备能够接收并加载目标AI模型,极大地提高了终端设备中的AI模型的部署灵活性和便利性,提高了用户体验。
请参阅图9,图9是本发明实施例提供的另一种AI模型部署方法的步骤流程示意图。
如图9所示,该AI模型部署方法可以包括步骤S301至S305。
步骤S301、显示设备显示AI模型下发页面。
示例性的,模型下发页面包括AI模型信息栏和模型下发按键。可以理解的是,一个模型下发按键可以对应一个AI模型信息栏,也即一个模型下发按键对应下发一个AI模型,一个模型下发按键也可以对应多个AI模型信息栏,也即一个模型下发按键对应下发多个AI模型。其中,AI模型信息栏可以包括但不限于AI模型的模型名称、训练任务进度、更新时间、数据来源、准确率、训练详情按键、模型预测按键、模型下发按键等。
步骤S302、显示设备响应用户对AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息。
示例性的,响应用户对该AI模型下发按键的触发操作,将与服务器连接的每个终端设备确定为待部署模型的目标终端设备,并将与AI模型下发按键对应的AI模型确定为待下发的目标AI模型;获取每个目标终端设备的第一标识信息和每个目标AI模型的第二标识信息。
步骤S303、显示设备基于第一标识信息和第二标识信息生成模型下发指令,并向服务器发送模型下发指令。
其中,该模型下发指令可以包括一个目标终端设备的第一标识信息和一个目标AI模型的第二标识信息,或者也可以包括多个目标终端设备的第一标识信息和一个目标AI模型的第二标识信息,或者也可以包括多个目标终端设备的第一标识信息和多个目标AI模型的第二标识信息,或者也可以包括一个目标终端设备的第一标识信息和多个目标AI模型的第二标识信息,本发明实施例对此不做具体限定。
步骤S304、服务器接收显示设备发送的模型下发指令,并对模型下发指令进行解析,以获取待部署模型的目标终端设备的第一标识信息和待下发的目标AI模型的第二标识信息。
示例性的,第一标识信息用于唯一标识目标终端设备,第一标识信息可以包括目标终端设备的设备ID和/或设备名称,第二标识信息用于唯一标识目标AI模型,第二标识信息可以包括目标AI模型的模型ID和/或模型名称,第一标识信息或第二标识信息中的字符可以包括数字、大小字母、小写字母、和/或希腊字母,当然也可以包括其余的字符,本发明实施例对此不做具体限定。
步骤S305、服务器根据第一标识信息和第二标识信息,执行AI模型下发指令,以供目标终端设备接收并加载目标AI模型。
示例性的,若第一标识信息为一个,且第二标识信息为一个,则将第二标识信息对应的目标AI模型下发给第一标识信息对应的目标终端设备。若第一标识信息为多个,且第二标识信息为一个,则将第二标识信息对应的目标AI模型下发给每个第一标识信息对应的目标终端设备,即将一个目标AI模型下发给多个目标终端设备。若第一标识信息为一个,且第二标识信息为多个,则将每个第二标识信息对应的目标AI模型全部下发给第一标识信息对应的目标终端设备,即将多个目标AI模型全部下发给一个目标终端设备。若第一标识信息为多个,且第二标识信息为多个,则将每个第二标识信息对应的目标AI模型全部下发给每个第一标识信息对应的目标终端设备,即将多个目标AI模型全部下发给每个目标终端设备。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,本实施的具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。
请参阅图10,图10是本发明实施例提供的一种服务器的结构示意性框图。
如图10所示,服务器400包括处理器410和存储器420,处理器410和存储器420通过总线430连接,该总线比如为I2C(Inter-integrated Circuit)总线。
具体地,处理器410用于提供计算和控制能力,支撑整个服务器的运行。处理器410可以是中央处理单元(Central Processing Unit,CPU),该处理器410还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
具体地,存储器420可以是Flash芯片、只读存储器(ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明实施例方案相关的部分结构的框图,并不构成对本发明实施例方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,并在执行所述计算机程序时实现以下步骤:
获取训练数据集和待训练的初始AI模型;
基于所述训练数据集对所述初始AI模型进行训练,以生成目标AI模型;
接收显示设备发送的模型下发指令,其中,所述模型下发指令是所述显示设备根据用户对显示的AI模型下发页面的操作而生成的;
对所述模型下发指令进行解析,以获取待部署模型的目标终端设备的第一标识信息和待下发的所述目标AI模型的第二标识信息;
根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令,以供所述目标终端设备接收并加载所述目标AI模型。
在一实施例中,所述处理器在实现根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令时,用于实现:
获取所述第一标识信息对应的目标终端设备的模型加载列表,所述模型加载列表包括所述目标终端设备已加载的AI模型的第三标识信息;
若所述第二标识信息与所述第三标识信息不同,则将所述第二标识信息对应的目标AI模型下发给所述第一标识信息的对应的目标终端设备,以使所述目标终端设备接收并加载所述目标AI模型,以更新所述目标终端设备已加载的AI模型。
在一实施例中,所述模型加载列表还包括已加载的AI模型的第一版本信息,所述处理器还用于实现以下步骤:
若所述第二标识信息与所述第三标识信息相同,则确定所述第二标识信息对应的目标AI模型的第二版本信息与所述第一版本信息是否不同;
若所述第二版本信息与所述第一版本信息不同,将所述第二标识信息对应的目标AI模型下发给所述第一标识信息的对应的目标终端设备,以供所述目标终端设备接收并加载所述目标AI模型,以更新所述目标终端设备已加载的AI模型;
若所述第二版本信息与所述第一版本信息相同,则不向所述第一标识信息的对应的目标终端设备下发所述第二标识信息对应的目标AI模型。
在一实施例中,所述处理器还用于实现以下步骤:
获取终端设备发送的连接建立请求,其中,所述连接建立请求是所述终端设备扫描所述服务器的连接建立页面生成的;
根据所述连接建立请求,建立所述终端设备与所述服务器之间的通信连接。
在一实施例中,所述处理器在实现根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令时,用于实现:
确定所述第一标识信息对应的目标终端设备的计算能力指数;
若所述计算能力指数小于或等于预设的计算能力指数阈值,则对所述第二标识信息对应的目标AI模型进行压缩;
将压缩后的目标AI模型下发给所述第一标识信息对应的目标终端设备,以供所述目标终端设备接收并加载压缩后的目标AI模型。
在一实施例中,所述目标AI模型为多个,所述处理器还用于实现以下步骤:
获取所述第一标识信息对应的目标终端设备的数据接收能力指数;
根据所述数据能力接收指数和每个所述目标AI模型的数据量,确定每个所述目标AI模型的下发顺序;
按照每个所述目标AI模型的下发顺序,将每个所述目标AI模型下发给所述第一标识信息对应的目标终端设备。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的服务器的具体工作过程,可以参考前述AI模型部署方法实施例中的对应过程,在此不再赘述。
请参阅图11,图11是本发明实施例提供的一种显示设备的结构示意性框图。
如图11所示,显示设备500包括显示装置510、处理器520和存储器530,显示装置510、处理器520和存储器530通过总线540连接,该总线540比如为I2C(Inter-integratedCircuit)总线。
具体地,处理器520用于提供计算和控制能力,支撑整个服务器的运行。处理器520可以是中央处理单元(Central Processing Unit,CPU),该处理器520还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
具体地,存储器530可以是Flash芯片、只读存储器(ROM,Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明实施例方案相关的部分结构的框图,并不构成对本发明实施例方案所应用于其上的显示设备的限定,具体的显示设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一实施例中,所述处理器用于运行存储在存储器中的计算机程序,并在执行所述计算机程序时实现以下步骤:
通过显示装置显示AI模型下发页面;
响应用户对所述AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;
基于所述第一标识信息和所述第二标识信息生成模型下发指令;
向服务器发送所述模型下发指令,以供所述服务器执行所述模型下发指令,以将所述第二标识信息对应的目标AI模型下发给所述第一标识信息对应的目标终端设备,以使所述目标终端设备接收并加载所述目标AI模型。
在一实施例中,所述AI模型下发页面包括模型下发按键,所述处理器在实现响应用户对所述AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息时,用于实现:
响应用户对所述模型下发按键的触发操作,将与所述服务器连接的每个终端设备确定为待部署模型的目标终端设备;
将与被触发的所述AI模型下发按键对应的AI模型确定为待下发的目标AI模型;
获取每个所述目标终端设备的第一标识信息和每个所述目标AI模型的第二标识信息。
在一实施例中,所述处理器还用于实现以下步骤:
通过显示装置显示终端设备与服务器之间的连接建立页面,所述终端设备在扫描所述连接建立页面后,生成连接建立请求,并向所述服务器发送所述连接建立请求;
获取所述服务器发送的列表更新指令,所述列表更新指令是所述服务器基于所述连接建立请求,与新的终端设备建立通信连接后生成的;
从所述列表更新指令中获取所述新的终端设备的属性信息,并根据所述属性信息更新所述终端设备连接列表。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的显示设备的具体工作过程,可以参考前述AI模型部署方法实施例中的对应过程,在此不再赘述。
请参阅图12,图12是本发明实施例提供的一种AI模型部署***的结构示意性框图。
如图12所示,AI模型部署***600包括服务器610、显示设备620和终端设备630,服务器610分别与显示设备620和终端设备630通信连接。其中,服务器610可以为图10所示的服务器400,显示设备620可以为如图11所示的显示设备500。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的AI模型部署***的具体工作过程,可以参考前述AI模型部署方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供一种存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如本发明实施例说明书提供的任一项AI模型部署的方法的步骤。
其中,所述存储介质可以是前述实施例所述的服务器、显示设备或终端设备的内部存储单元,例如所述服务器、显示设备或终端设备的硬盘或内存。所述存储介质也可以是所述服务器、显示设备或终端设备的外部存储设备,例如所述服务器、显示设备或终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、***、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施例中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本发明的具体实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种AI模型部署方法,其特征在于,应用于服务器,所述方法包括:
获取训练数据集和待训练的初始AI模型;
基于所述训练数据集对所述初始AI模型进行训练,以生成目标AI模型;
接收显示设备发送的模型下发指令,其中,所述模型下发指令是所述显示设备根据用户对显示的AI模型下发页面的操作而生成的;
对所述模型下发指令进行解析,以获取待部署模型的目标终端设备的第一标识信息和待下发的所述目标AI模型的第二标识信息;
根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令,以供所述目标终端设备接收并加载所述目标AI模型。
2.根据权利要求1所述的AI模型部署方法,其特征在于,所述根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令,包括:
获取所述第一标识信息对应的目标终端设备的模型加载列表,所述模型加载列表包括所述目标终端设备已加载的AI模型的第三标识信息;
若所述第二标识信息与所述第三标识信息不同,则将所述第二标识信息对应的目标AI模型下发给所述第一标识信息的对应的目标终端设备,以使所述目标终端设备接收并加载所述目标AI模型,以更新所述目标终端设备已加载的AI模型。
3.根据权利要求2所述的AI模型部署方法,其特征在于,所述模型加载列表还包括已加载的AI模型的第一版本信息,所述方法还包括:
若所述第二标识信息与所述第三标识信息相同,则确定所述第二标识信息对应的目标AI模型的第二版本信息与所述第一版本信息是否不同;
若所述第二版本信息与所述第一版本信息不同,将所述第二标识信息对应的目标AI模型下发给所述第一标识信息的对应的目标终端设备,以供所述目标终端设备接收并加载所述目标AI模型,以更新所述目标终端设备已加载的AI模型;
若所述第二版本信息与所述第一版本信息相同,则不向所述第一标识信息的对应的目标终端设备下发所述第二标识信息对应的目标AI模型。
4.根据权利要求1-3中任一项所述的AI模型部署方法,其特征在于,所述方法还包括:
获取终端设备发送的连接建立请求,其中,所述连接建立请求是所述终端设备扫描所述服务器的连接建立页面生成的;
根据所述连接建立请求,建立所述终端设备与所述服务器之间的通信连接。
5.根据权利要求1-3中任一项所述的AI模型部署方法,其特征在于,所述根据所述第一标识信息和所述第二标识信息,执行所述AI模型下发指令,包括:
确定所述第一标识信息对应的目标终端设备的计算能力指数;
若所述计算能力指数小于或等于预设的计算能力指数阈值,则对所述第二标识信息对应的目标AI模型进行压缩;
将压缩后的目标AI模型下发给所述第一标识信息对应的目标终端设备,以供所述目标终端设备接收并加载压缩后的目标AI模型。
6.根据权利要求1-3中任一项所述的AI模型部署方法,其特征在于,所述目标AI模型为多个,所述方法还包括:
获取所述第一标识信息对应的目标终端设备的数据接收能力指数;
根据所述数据能力接收指数和每个所述目标AI模型的数据量,确定每个所述目标AI模型的下发顺序;
按照每个所述目标AI模型的下发顺序,将每个所述目标AI模型下发给所述第一标识信息对应的目标终端设备。
7.一种AI模型部署方法,其特征在于,应用于显示设备,所述方法包括:
显示AI模型下发页面;
响应用户对所述AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息;
基于所述第一标识信息和所述第二标识信息生成模型下发指令;
向服务器发送所述模型下发指令,以供所述服务器执行所述模型下发指令,将所述第二标识信息对应的目标AI模型下发给所述第一标识信息对应的目标终端设备,以使所述目标终端设备接收并加载所述目标AI模型。
8.根据权利要求7所述的AI模型部署方法,其特征在于,所述AI模型下发页面包括模型下发按键,所述响应用户对所述AI模型下发页面的触发操作,获取待部署模型的目标终端设备的第一标识信息,并获取待下发的目标AI模型的第二标识信息,包括:
响应用户对所述模型下发按键的触发操作,将与所述服务器连接的每个终端设备确定为待部署模型的目标终端设备;
将与被触发的所述AI模型下发按键对应的AI模型确定为待下发的目标AI模型;
获取每个所述目标终端设备的第一标识信息和每个所述目标AI模型的第二标识信息。
9.根据权利要求7所述的AI模型部署方法,其特征在于,所述方法还包括:
显示终端设备与服务器之间的连接建立页面,所述终端设备在扫描所述连接建立页面后,生成连接建立请求,并向所述服务器发送所述连接建立请求;
获取所述服务器发送的列表更新指令,所述列表更新指令是所述服务器基于所述连接建立请求,与新的终端设备建立通信连接后生成的;
从所述列表更新指令中获取所述新的终端设备的属性信息,并根据所述属性信息更新所述终端设备连接列表。
10.一种服务器,其特征在于,所述服务器包括处理器、存储器以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现权利要求1至6中任一项所述的AI模型部署方法的步骤。
11.一种显示设备,其特征在于,所述显示设备包括显示装置、处理器、存储器以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现权利要求7至9中任一项所述的AI模型部署方法的步骤。
12.一种AI模型部署***,其特征在于,所述AI模型部署***包括终端设备、权利要求10所述的服务器和权利要求11所述的显示设备,所述服务器分别与所述显示设备和所述终端设备通信连接。
13.一种存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至6或实现权利要求7至9中任一项所述的AI模型部署的方法的步骤。
CN202110574310.4A 2021-05-25 2021-05-25 Ai模型部署方法、***及存储介质 Pending CN115392332A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110574310.4A CN115392332A (zh) 2021-05-25 2021-05-25 Ai模型部署方法、***及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110574310.4A CN115392332A (zh) 2021-05-25 2021-05-25 Ai模型部署方法、***及存储介质

Publications (1)

Publication Number Publication Date
CN115392332A true CN115392332A (zh) 2022-11-25

Family

ID=84114726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110574310.4A Pending CN115392332A (zh) 2021-05-25 2021-05-25 Ai模型部署方法、***及存储介质

Country Status (1)

Country Link
CN (1) CN115392332A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024093151A1 (en) * 2023-04-14 2024-05-10 Lenovo (Beijing) Limited Terminal device, network device, and method for ai model transfer
WO2024120283A1 (zh) * 2022-12-07 2024-06-13 维沃移动通信有限公司 信息传输方法、信息传输装置和通信设备
WO2024130518A1 (zh) * 2022-12-19 2024-06-27 北京小米移动软件有限公司 模型管理方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024120283A1 (zh) * 2022-12-07 2024-06-13 维沃移动通信有限公司 信息传输方法、信息传输装置和通信设备
WO2024130518A1 (zh) * 2022-12-19 2024-06-27 北京小米移动软件有限公司 模型管理方法和装置
WO2024093151A1 (en) * 2023-04-14 2024-05-10 Lenovo (Beijing) Limited Terminal device, network device, and method for ai model transfer

Similar Documents

Publication Publication Date Title
CN115392332A (zh) Ai模型部署方法、***及存储介质
CN110083730B (zh) 使用语音标签管理图像的方法和装置
EP3399742B1 (en) Method for processing image and electronic device for supporting same
CN110347587B (zh) App兼容性测试方法、装置、计算机设备及存储介质
US10503390B2 (en) Electronic device and photographing method
CN115097981B (zh) 处理内容的方法及其电子设备
EP2996409A1 (en) Information processing method and electronic device supporting the same
CN104869305B (zh) 处理图像数据的方法及其装置
US20170161240A1 (en) Web page operation method and electronic device for supporting the same
KR20160026142A (ko) 스크랩 정보를 제공하는 전자 장치 및 그 제공 방법
US20160286132A1 (en) Electronic device and method for photographing
US20170277526A1 (en) Software categorization method and electronic device
DE202017007296U1 (de) Elektronische Vorrichtung, umfassend einen gebogenen Anzeigebereich
US10613724B2 (en) Control method for selecting and pasting content
US20170118401A1 (en) Electronic device and method for processing image
CN114286167A (zh) 跨设备的交互方法、装置、电子设备以及存储介质
CN110798824A (zh) 一种电子桌牌控制方法、智能终端及***
CN105813102B (zh) 一种自动测试***及方法
US10691318B2 (en) Electronic device and method for outputting thumbnail corresponding to user input
US9921728B2 (en) Service providing device, and method of providing a user interface
US20150310093A1 (en) Method of providing contents of an electronic device
CN110673737B (zh) 基于智能家居操作***的显示内容的调整方法及装置
US9912796B2 (en) Apparatus and method for correcting an input number
CN112130738A (zh) 截图处理方法、装置、电子设备及存储介质
CN112449227A (zh) 触屏应用兼容遥控器操作的交互方法、装置、智能电视以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination