CN111984364A - 一种面向5g时代的人工智能云平台 - Google Patents
一种面向5g时代的人工智能云平台 Download PDFInfo
- Publication number
- CN111984364A CN111984364A CN201910426197.8A CN201910426197A CN111984364A CN 111984364 A CN111984364 A CN 111984364A CN 201910426197 A CN201910426197 A CN 201910426197A CN 111984364 A CN111984364 A CN 111984364A
- Authority
- CN
- China
- Prior art keywords
- distributed
- cloud computing
- computing
- mobile
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C17/00—Arrangements for transmitting signals characterised by the use of a wireless electrical link
- G08C17/02—Arrangements for transmitting signals characterised by the use of a wireless electrical link using a radio link
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45595—Network integration; Enabling network access in virtual machine instances
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种面向5G时代的人工智能云平台,具体涉及人工智能、云计算、大数据领域,包括异构分布式云平台,所述异构分布式云平台以分布式移动云计算协同架构为基本架构;所述分布式移动云计算协同架构包括智能终端、移动网络、分布式移动云计算服务器、协同控制器和端到端‑终端计算卸载服务质量保证机制***。本发明建立面向5G的分布式移动云计算协同架构与端到端‑终端计算卸载服务质量保证机制,可以降低终端在计算卸载中的网络交互信令开销,以及终端驻留决策进程的CPU占用率与能耗;保证端到端服务质量,支持深度学***台,可以规避传统移动云计算给广域网带来的巨大负载量与能耗。
Description
技术领域
本发明涉及人工智能、云计算、大数据技术领域,更具体地说,本发明涉及一种面向5G时代的人工智能云平台。
背景技术
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用***的一门新的技术科学;
5G网络是第五代移动通信网络,其峰值理论传输速度可达每秒数1Gb,比4G网络的传输速度快数百倍,随着5G技术的诞生,用智能终端分享3D电影、游戏以及超高画质(UHD)节目的时代正向我们走来;
而5G带动下的万物互联时代将产生海量的数据,对云计算的需求将随之增加;5G边缘计算可以通过更靠近应用侧的数据处理能力,更好地实现物与物之间的传感、交互和控制,这给了云计算带来了巨大的增量空间。
当数据海啸式增长,对算力需求将极大增加,对***式信息增长和动态灵活的架构需求现在还没有一个很好的解决方案以及人工智能云平台。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种面向5G时代的人工智能云平台,通过自主研发面向5G时代的高性能异构分布式云平台,融合分布式移动云计算协同架构技术,建立面向5G的分布式移动云计算协同架构与端到端-终端计算卸载服务质量保证机制***,可以降低终端在计算卸载中的网络交互信令开销,以及终端驻留决策进程的CPU占用率与能耗;可以保证移动云计算的端到端服务质量,支持深度学***台,可以规避传统移动云计算给广域网带来的巨大负载量与能耗,通过5G网络和云端进行实时交互,提升数据处理能力,降低时延,融合5G技术突破AI传输技术的瓶颈,实现智慧赋能。
为实现上述目的,本发明提供如下技术方案:一种面向5G时代的人工智能云平台,包括异构分布式云平台,所述异构分布式云平台以分布式移动云计算协同架构为基本架构;
所述分布式移动云计算协同架构包括智能终端、移动网络、分布式移动云计算服务器、协同控制器和端到端-终端计算卸载服务质量保证机制***,所述分布式移动云计算服务器连接服务基站,所述协同控制器连接协同服务器;
所述智能终端作为移动云计算的发起端,周期地通过移动通信网络上传其自身状态感知信息,并接收协同控制器计算相关卸载分割决策;
所述移动网络为发起计算卸载请求的智能终端提供无线接入与传输;
所述分布式移动云计算服务器部署于移动接入网络侧的小型服务器或多小型服务器集群,其负载状态与虚拟机计算能力感知信息周期上传到协同服务器,并接收协同控制器决策信息为计算卸载任务预留虚拟机资源;
所述协同控制器用于收集智能终端、移动网络和分布式移动云计算服务器的感知信息,并生成计算卸载分割决策下发给智能终端,以及资源预留决策下发给服务基站与分布式移动云计算服务器;
所述端到端-终端计算卸载服务质量保证机制***包括分布式云计算感知模块和协同决策模块,所述分布式云计算感知模块分别在服务器层次和虚拟机层次进行工作,所述协同决策模块包括移动终端部分决策信息单元、移动通信网络部分决策信息单元和分布式云计算节点决策信息单元;
所述异构分布式云平台包括异构分布式人工智能云计算中心、分布式深度学***台以及异构基础算法库;
所述深度学习大规模训练***用于多机器多CPU-FPGA-GPU混合分布式深度学习模型训练,支持千亿级参数的模型,上亿类别的大规模分类;
所述异构超算平台用于多个计算集群、中央统一存储、轻量级虚拟化以及给研究人员提供源源不断的计算能力的支持;
所述异构基础算法库存储有深度神经网络在内的各种机器学习算法与数学和图像处理算法;
所述异构分布式人工智能云计算中心用于实现5G网络和云端的人工智能实时交互;
所述分布式深度学习平台用于支持深度学习模型与算法的定制扩展,支持CPU-GPU或者GPU-GPU或者CPU-FPGA-GPU混合分布式运算。
在一个优选地实施方式中,所述协同控制器的形式为运行于分布式云计算服务器中的实例或虚拟机或共存于运营商其他网元,具体为服务网关、分组数据网关与策略与资源管理模块。
在一个优选地实施方式中,所述智能终端通过本地网关连接移动性管理实体,所述移动性管理实体通过服务网关连接分组数据网关和策略与资源管理设备,所述分组数据网关和策略与资源管理设备连接,所述分组数据网关和策略与资源管理设备分别连接运行商业务终端和互联网,所述智能终端还通过本地网关连接分布式移动云计算服务器。
在一个优选地实施方式中,所述分布式云计算感知模块在服务器层次用于采集整个计算节点服务器或服务器集群的负载情况,具体包括服务器吞吐量、服务器并发通信状态、服务器计算资源使用情况、服务器存储资源占用率以及当计算节点为服务器集群且在集群内部采用了虚拟化技术实现整个集群的虚拟化资源池时,服务器层次感知信息应充分考虑虚拟资源池的整体情况。
在一个优选地实施方式中,所述分布式云计算感知模块在虚拟机层次用于对整个节点内虚拟机状态信息进行采集,信息包括:虚拟机的数量、各虚拟机所占有的计算与存储资源量、各虚拟机等效产生的吞吐量以及承载资源的相关状态信息。
在一个优选地实施方式中,所述协同控制器通过采集智能终端、移动通信网络和分布式移动云计算服务器的感知信息,充分掌握智能终端、移动网络以及各分布式云计算节点的状态信息,所述协同决策模块通过对掌握的信息综合分析,产生协同决策并分别下发至智能终端、移动网络网元以及分布式云计算节点,各部分按照决策执行各自相应的动作。
在一个优选地实施方式中,所述移动终端部分决策信息单元用于根据智能终端目前的电池、能耗及计算资源状态,决定相应移动应用的计算子任务划分,并进一步根据智能终端的无线带宽资源状态,规划本地计算任务及卸载计算任务,当终端接入多基站时,同时涉及对每个卸载计算子任务指定相应的接入基站,此时移动终端部分决策信息单元将乱序返回的计算子任务结果正确重组。
在一个优选地实施方式中,所述移动通信网络部分决策信息单元用于根据智能终端与各接入基站间的无线带宽状态,以及各基站的回传网络拥塞状态,为卸载计算任务数据及返回结果数据分配相应接入点完成接收与发送。
在一个优选地实施方式中,所述分布式云计算节点决策信息单元用于根据各分布式云计算节点的状态信息,为各卸载计算子任务指派相应分布式云计算节点完成计算承载任务;用于决策每个分布式云计算节点承载相应卸载计算子任务所需虚拟化资源,生成虚拟机完成计算任务;用于多个分布式云计算节点间的计算进程实现并行协同。
本发明的技术效果和优点:
1、本发明通过针对5G时代AI云计算服务***应用场景中对增强移动宽带、低时延高可靠和大连接低功耗的需求,对现有网络云计算服务平台在技术上架构的的不足之处进行改进,自主研发面向5G时代的高性能异构分布式云平台,融合分布式移动云计算协同架构技术,建立面向5G的分布式移动云计算协同架构与端到端-终端计算卸载服务质量保证机制***,可以降低终端在计算卸载中的网络交互信令开销,以及终端驻留决策进程的CPU占用率与能耗;可以保证移动云计算的端到端服务质量,支持深度学***台,可以规避传统移动云计算给广域网带来的巨大负载量与能耗;
2、面向5G时代,本发明采用高性能异构分布式云平台,结合深度学习大规模训练***,利用异构高性能计算中心与高性能异构基础算法库,为用户提供强大的面向5G智能时代的企业人工智能创新服务解决方案,充分利用5G高速率和低延时的特性,促进云端AI和终端侧AI的智能协作,通过5G网络和云端进行实时交互,提升数据处理能力,降低时延,融合5G技术突破AI传输技术的瓶颈,实现智慧赋能;
3、终端侧AI可快速响应用户需求,以低功耗、低成本方式向用户快速展示处理后的图像、视频、语音和文本信息,适合完成AI推理任务;5G技术的融入,使得云端AI与终端侧AI的智能协同创新融合成为可能,通过5G网络和云端进行实时交互,提升数据处理能力,降低时延;云端AI用于实现多终端数据汇聚,在数据吞吐量和处理速度等方面更具优势,适合完成大规模大数据量的AI模型训练任务。
附图说明
图1为本发明的整体结构框图。
图2为本发明的分布式移动云计算协同架构结构框图。
图3为本发明的分布式移动云计算协同架构拓扑图。
图4为本发明的端到端-终端计算卸载服务质量保证机制***拓扑图。
图5为本发明的分布式深度学习平台结构示意图。
图6为本发明的深度学习大规模训练***结构示意图。
图7为本发明的异构超算平台结构示意图。
图8为本发明的异构基础算法库结构示意图。
附图标记为:1异构分布式云平台、11异构分布式人工智能云计算中心、12分布式深度学***台、15异构基础算法库、2分布式移动云计算协同架构、21智能终端、22移动网络、23分布式移动云计算服务器、24协同控制器、25端到端-终端计算卸载服务质量保证机制***、3服务基站。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
根据图1-3所示的一种面向5G时代的人工智能云平台,包括异构分布式云平台1,所述异构分布式云平台1以分布式移动云计算协同架构2为基本架构;
移动云计算将终端计算任务卸载到云端,在降低终端能耗的同时,提供了在终端有限资源情况下实现大计算量移动应用能力,必将成为构建未来移动互联网创新服务的必不可少的关键技术;然而,目前移动云计算现阶段技术发展对于移动设备到云计算中心的端到端网络时延与带宽不稳定,以及影响移动云计算服务质量的主要因素的动态性等问题仍然缺乏有效的对抗手段,同时在计算卸载由终端感知与协商决策方面缺少有效的机制设计,因此本发明结合4G、5G网络无线接入网技术的特点,提出了一种分布式移动云计算协同架构2;
所述分布式移动云计算协同架构2包括智能终端21、移动网络22、分布式移动云计算服务器23、协同控制器24和端到端-终端计算卸载服务质量保证机制***25,所述分布式移动云计算服务器23连接服务基站3,所述协同控制器24连接协同服务器;
所述智能终端21作为移动云计算的发起端,周期地通过移动通信网络上传其自身状态感知信息,并接收协同控制器24计算相关卸载分割决策;
所述移动网络22为发起计算卸载请求的智能终端21提供无线接入与传输;
所述分布式移动云计算服务器23部署于移动接入网络侧的小型服务器或多小型服务器集群,其负载状态与虚拟机计算能力感知信息周期上传到协同服务器,并接收协同控制器24决策信息为计算卸载任务预留虚拟机资源;
所述协同控制器24用于收集智能终端21、移动网络22和分布式移动云计算服务器23的感知信息,并生成计算卸载分割决策下发给智能终端21,以及资源预留决策下发给服务基站3与分布式移动云计算服务器23;
所述协同控制器24的形式为运行于分布式云计算服务器中的实例或虚拟机或共存于运营商其他网元,具体为服务网关、分组数据网关与策略与资源管理模块;
所述智能终端21通过本地网关连接移动性管理实体,所述移动性管理实体通过服务网关连接分组数据网关和策略与资源管理设备,所述分组数据网关和策略与资源管理设备连接,所述分组数据网关和策略与资源管理设备分别连接运行商业务终端和互联网,所述智能终端21还通过本地网关连接分布式移动云计算服务器23;
实施方式具体为:通过融合分布式移动云计算协同架构2技术,建立面向5G的分布式移动云计算协同架构2与端到端-终端计算卸载服务质量保证机制***25,可以降低终端在计算卸载中的网络交互信令开销,以及终端驻留决策进程的CPU占用率与能耗;可以保证移动云计算的端到端服务质量;可以规避传统移动云计算给WAN带来的巨大负载量与能耗,
可以预见,在用户、智能设备商和移动网络22运营商的多方推动下,未来分布式移动云计算将成为4G与5G网络的主流技术之一,成为移动运营商的基础网络设施并为其提供新的业务增长点,为智能终端21应用提供更佳的用户体验。
尽管目前5G移动网络22技术仍处于预研过程中,但是,众多5G网络可以预见的潜在技术为上述提出的分布式移动云计算提供了有效的可行性支撑,潜在技术有:
a.超密集蜂部署
延续以提高网络覆盖质量与网络容量为目的的LTE4G网络微型基站部署的思路,如毫微微基站(Femtocell)基站与微微基站(Picocell)等。在5G网络微型基站的部署将更加密集,在同频干扰与无线资源复用问题有效解决的条件下,这种无线组网方式将能够承载更多的移动网络22传输,并且接入点与智能终端21间的无线传输平均距离的拉近,可以有效降低移动云计算中智能终端21无线数据传输的能耗与时延。
b.大规模MIMO
作为多输入多输出(MIMO)技术的衍生增强,大规模MIMO(MassiveMIMO)通过在发送端及/或接收端部署更大数量(几十甚至成百)的天线单元,从可实现通过简单的线性预编码算法,获得空间波束赋形增益的大幅度提升,显著增强点对点/多点链路的通信可靠性,链路吞吐量,频谱效率以及能量效率,从而能够以高速率承载更多的并发移动云计算传输。
c.毫米波回传
随着基站数量的激增,连接宏基站、微型基站与移动交换节点间的回传网络成为网络性能保证的关键。目前,业界已经开始将毫米波(包括71~76、81~86、92~95GHz频段等)作为4G回传网络的承载方式,其也必将在5G网络中进一步得到增强。微波回传将为5G网络中包括宏基站与微型基站的回传带宽与时延提供保证,特别是能够有效解决微型基站ADSL回传链路的时延抖动与拥塞问题,从而以低时延、高速率支撑分布式移动云计算协同结构中智能终端21与基站向协同控制器24的感知上传,以及协同控制器24向终端与基站的决策下发。
如图4所示,终端通过移动云计算卸载的计算任务最终需要在分布于移动接入网中的分布式云计算服务器中的虚拟机中完成的,因此,包括各分布式计算节点的负载,以及各节点内可承载的虚拟机数量以及各虚拟机的计算能力在内的分布式云计算感知,是选择计算卸载节点的重要依据,对移动云计算性能具有重要影响;
由上所述,所述端到端-终端计算卸载服务质量保证机制***25包括分布式云计算感知模块和协同决策模块,所述分布式云计算感知模块分别在服务器层次和虚拟机层次进行工作,所述协同决策模块包括移动终端部分决策信息单元、移动通信网络部分决策信息单元和分布式云计算节点决策信息单元;
所述分布式云计算感知模块在服务器层次用于采集整个计算节点服务器或服务器集群的负载情况,具体包括服务器吞吐量、服务器并发通信状态、服务器计算资源使用情况、服务器存储资源占用率以及当计算节点为服务器集群且在集群内部采用了虚拟化技术实现整个集群的虚拟化资源池时,服务器层次感知信息应充分考虑虚拟资源池的整体情况;
所述分布式云计算感知模块在虚拟机层次用于对整个节点内虚拟机状态信息进行采集,信息包括:虚拟机的数量、各虚拟机所占有的计算与存储资源量、各虚拟机等效产生的吞吐量以及承载资源的相关状态信息;
目前主流服务器产品均支持对上述信息的软件化采集与存储,通过高效的接口与信息共享机制,实现协作控制器的分布式云计算高效感知;
所述协同控制器24通过采集智能终端21、移动通信网络和分布式移动云计算服务器23的感知信息,充分掌握智能终端21、移动网络22(包括接入网与核心网)以及各分布式云计算节点的状态信息,所述协同决策模块通过对掌握的信息综合分析,产生协同决策并分别下发至智能终端21、移动网络22网元以及分布式云计算节点,各部分按照决策执行各自相应的动作,实现协同的分布式云计算,为终端应用提供用户体验保障;
所述移动终端部分决策信息单元用于根据智能终端21目前的电池、能耗及计算资源状态,决定相应移动应用的计算子任务划分,并进一步根据智能终端21的无线带宽资源状态,规划本地计算任务及卸载计算任务,当终端接入多基站时,同时涉及对每个卸载计算子任务指定相应的接入基站,此时移动终端部分决策信息单元将乱序返回的计算子任务结果正确重组;
所述移动通信网络部分决策信息单元用于根据智能终端21与各接入基站间的无线带宽状态,以及各基站的回传网络拥塞状态,为卸载计算任务数据及返回结果数据分配相应接入点完成接收与发送,具体包括:
当终端应用想远端发起计算卸载请求时,通知相应基站负责接收来自终端的包含相应远端计算子任务的空口数据;
当分布式云计算节点返回子计算任务结果时,指派相应基站向指定终端发送包含返回子计算任务结果的空口数据;
考虑到用户移动性,相同子计算任务的请求及结果的发送与接收基站需要分别动态指派;当卸载计算任务数据到达移动网络22核心网,根据核心网承载网络状态(拓扑、链路流量、节点负荷),为各卸载计算子任务数据选择路由,实现各卸载计算子任务数据到指定的分布式云计算节点的高效转发,降低核心网网络负荷及时延;
反之,当分布式云计算节点返回各卸载计算子任务结果时提供向指派接入网节点的路由转发;该过程可依托于软件定义网络技术实现路由转发面的动态适配;
所述分布式云计算节点决策信息单元用于根据各分布式云计算节点的状态信息,为各卸载计算子任务指派相应分布式云计算节点完成计算承载任务;用于决策每个分布式云计算节点承载相应卸载计算子任务所需虚拟化资源,生成虚拟机完成计算任务;用于多个分布式云计算节点间的计算进程实现并行协同。
如图5-8所示,所述异构分布式云平台1包括异构分布式人工智能云计算中心11、分布式深度学***台14以及异构基础算法库15;
所述异构分布式人工智能云计算中心11用于实现5G网络和云端的人工智能实时交互;所述分布式深度学习平台12用于支持深度学习模型与算法的定制扩展,支持CPU-GPU或者GPU-GPU或者CPU-FPGA-GPU混合分布式运算。
所述深度学习大规模训练***13用于多机器多CPU-FPGA-GPU混合分布式深度学习模型训练,支持千亿级参数的模型,上亿类别的大规模分类,行业领先的内存优化和通信优化技术,数百块CPU-FPGA-GPU混合分布式联合训练,极大提升了公司训练和迭代模型的速度,见图6所示;
所述异构超算平台14用于多个计算集群、中央统一存储、轻量级虚拟化以及给研究人员提供源源不断的计算能力的支持,见图7所示;
所述异构基础算法库15存储有深度神经网络在内的各种机器学***台库,带来2-5倍的性能提升。支持主流的云端、个人电脑、移动端和嵌入式端硬件平台,支持多种***平台,如Linux、Android、iOS和Windows等,见图8所示。
实施方式具体为:本发明异构分布式云平台1支持深度学***台12,可以规避传统移动云计算给广域网(WAN)带来的巨大负载量与能耗;
通过异构分布式人工智能云平台计算中心,实现5G技术的融入,使得远端AI与终端侧AI的智能协同创新融合成为可能,通过5G网络和云端进行实时交互,提升数据处理能力,降低时延,融合5G技术突破AI传输技术的瓶颈,实现智慧赋能;
面向5G时代,本发明采用高性能异构分布式云平台1,结合深度学习大规模训练***13,利用异构高性能计算中心与高性能异构基础算法库15,为用户提供强大的面向5G智能时代的企业人工智能创新服务解决方案。
最后应说明的几点是:首先,在本申请的描述中,需要说明的是,除非另有规定和限定,术语“安装”、“相连”、“连接”应做广义理解,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变,则相对位置关系可能发生改变;
其次:本发明公开实施例附图中,只涉及到与本公开实施例涉及到的结构,其他结构可参考通常设计,在不冲突情况下,本发明同一实施例及不同实施例可以相互组合;
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种面向5G时代的人工智能云平台,其特征在于:包括异构分布式云平台(1),所述异构分布式云平台(1)以分布式移动云计算协同架构(2)为基本架构;
所述分布式移动云计算协同架构(2)包括智能终端(21)、移动网络(22)、分布式移动云计算服务器(23)、协同控制器(24)和端到端-终端计算卸载服务质量保证机制***(25),所述分布式移动云计算服务器(23)连接服务基站(3),所述协同控制器(24)连接协同服务器;
所述智能终端(21)作为移动云计算的发起端,周期地通过移动通信网络上传其自身状态感知信息,并接收协同控制器(24)计算相关卸载分割决策;
所述移动网络(22)为发起计算卸载请求的智能终端(21)提供无线接入与传输;
所述分布式移动云计算服务器(23)部署于移动接入网络侧的小型服务器或多小型服务器集群,其负载状态与虚拟机计算能力感知信息周期上传到协同服务器,并接收协同控制器(24)决策信息为计算卸载任务预留虚拟机资源;
所述协同控制器(24)用于收集智能终端(21)、移动网络(22)和分布式移动云计算服务器(23)的感知信息,并生成计算卸载分割决策下发给智能终端(21),以及资源预留决策下发给服务基站(3)与分布式移动云计算服务器(23);
所述端到端-终端计算卸载服务质量保证机制***(25)包括分布式云计算感知模块和协同决策模块,所述分布式云计算感知模块分别在服务器层次和虚拟机层次进行工作,所述协同决策模块包括移动终端部分决策信息单元、移动通信网络部分决策信息单元和分布式云计算节点决策信息单元;
所述异构分布式云平台(1)包括异构分布式人工智能云计算中心(11)、分布式深度学***台(14)以及异构基础算法库(15);
所述深度学习大规模训练***(13)用于多机器多GPU分布式深度学习模型训练,支持千亿级参数的模型,上亿类别的大规模分类;
所述异构超算平台(14)用于多个计算集群、中央统一存储、轻量级虚拟化以及给研究人员提供源源不断的计算能力的支持;
所述异构基础算法库(15)存储有深度神经网络在内的各种机器学习算法与数学和图像处理算法;
所述异构分布式人工智能云计算中心(11)用于实现5G网络和云端的人工智能实时交互;
所述分布式深度学习平台(12)用于支持深度学习模型与算法的定制扩展,支持大量通用CPU、GPU或者CPU、GPU混合分布式运算。
2.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述协同控制器(24)的形式为运行于分布式云计算服务器中的实例或虚拟机或共存于运营商其他网元,具体为服务网关、分组数据网关与策略与资源管理模块。
3.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述智能终端(21)通过本地网关连接移动性管理实体,所述移动性管理实体通过服务网关连接分组数据网关和策略与资源管理设备,所述分组数据网关和策略与资源管理设备连接,所述分组数据网关和策略与资源管理设备分别连接运行商业务终端和互联网,所述智能终端(21)还通过本地网关连接分布式移动云计算服务器(23)。
4.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述分布式云计算感知模块在服务器层次用于采集整个计算节点服务器或服务器集群的负载情况,具体包括服务器吞吐量、服务器并发通信状态、服务器计算资源使用情况、服务器存储资源占用率以及当计算节点为服务器集群且在集群内部采用了虚拟化技术实现整个集群的虚拟化资源池时,服务器层次感知信息应充分考虑虚拟资源池的整体情况。
5.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述分布式云计算感知模块在虚拟机层次用于对整个节点内虚拟机状态信息进行采集,信息包括:虚拟机的数量、各虚拟机所占有的计算与存储资源量、各虚拟机等效产生的吞吐量以及承载资源的相关状态信息。
6.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述协同控制器(24)通过采集智能终端(21)、移动通信网络和分布式移动云计算服务器(23)的感知信息,充分掌握智能终端(21)、移动网络(22)以及各分布式云计算节点的状态信息,所述协同决策模块通过对掌握的信息综合分析,产生协同决策并分别下发至智能终端(21)、移动网络(22)网元以及分布式云计算节点,各部分按照决策执行各自相应的动作。
7.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述移动终端部分决策信息单元用于根据智能终端(21)目前的电池、能耗及计算资源状态,决定相应移动应用的计算子任务划分,并进一步根据智能终端(21)的无线带宽资源状态,规划本地计算任务及卸载计算任务,当终端接入多基站时,同时涉及对每个卸载计算子任务指定相应的接入基站,此时移动终端部分决策信息单元将乱序返回的计算子任务结果正确重组。
8.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述移动通信网络部分决策信息单元用于根据智能终端(21)与各接入基站间的无线带宽状态,以及各基站的回传网络拥塞状态,为卸载计算任务数据及返回结果数据分配相应接入点完成接收与发送。
9.根据权利要求1所述的一种面向5G时代的人工智能云平台,其特征在于:所述分布式云计算节点决策信息单元用于根据各分布式云计算节点的状态信息,为各卸载计算子任务指派相应分布式云计算节点完成计算承载任务;用于决策每个分布式云计算节点承载相应卸载计算子任务所需虚拟化资源,生成虚拟机完成计算任务;用于多个分布式云计算节点间的计算进程实现并行协同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910426197.8A CN111984364B (zh) | 2019-05-21 | 2019-05-21 | 一种面向5g时代的人工智能云平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910426197.8A CN111984364B (zh) | 2019-05-21 | 2019-05-21 | 一种面向5g时代的人工智能云平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111984364A true CN111984364A (zh) | 2020-11-24 |
CN111984364B CN111984364B (zh) | 2023-05-26 |
Family
ID=73436212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910426197.8A Active CN111984364B (zh) | 2019-05-21 | 2019-05-21 | 一种面向5g时代的人工智能云平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111984364B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112512069A (zh) * | 2021-02-02 | 2021-03-16 | 网络通信与安全紫金山实验室 | 基于信道波束图样的网络智能优化方法及装置 |
CN112637290A (zh) * | 2020-12-14 | 2021-04-09 | 厦门宏泰科技研究院有限公司 | 一种基于微基站及边缘计算的全球通信网络*** |
CN112804446A (zh) * | 2020-12-30 | 2021-05-14 | 江苏达科信息科技有限公司 | 基于云平台大数据的大数据处理方法及装置 |
CN113067873A (zh) * | 2021-03-19 | 2021-07-02 | 北京邮电大学 | 基于深度强化学习的边云协同优化方法 |
CN113222170A (zh) * | 2021-03-30 | 2021-08-06 | 新睿信智能物联研究院(南京)有限公司 | 一种用于物联网ai协同服务平台的智能算法和模型 |
CN113301141A (zh) * | 2021-05-20 | 2021-08-24 | 北京邮电大学 | 人工智能支持框架的部署方法和*** |
CN113316159A (zh) * | 2021-05-27 | 2021-08-27 | 北京邮电大学 | 基于异构物理层的5g网络*** |
CN113473449A (zh) * | 2021-07-02 | 2021-10-01 | 深圳市威宇智通科技有限公司 | 基于物联网终端的智能连接的*** |
CN115002038A (zh) * | 2022-08-04 | 2022-09-02 | 中国电子科技集团公司第十五研究所 | 一种基于云端分布式协调服务的智能调峰方法和*** |
CN115442202A (zh) * | 2022-08-15 | 2022-12-06 | 鞍钢集团北京研究院有限公司 | 一种5g网络云-端协同的虚拟plc控制方法及*** |
WO2023098665A1 (zh) * | 2021-11-30 | 2023-06-08 | 华为技术有限公司 | 任务处理方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102681899A (zh) * | 2011-03-14 | 2012-09-19 | 金剑 | 云计算服务平台的虚拟计算资源动态管理*** |
US20160283284A1 (en) * | 2015-03-27 | 2016-09-29 | Mingqiu Sun | Technologies for offloading and on-loading data for processor/coprocessor arrangements |
US20170230448A1 (en) * | 2016-02-05 | 2017-08-10 | International Business Machines Corporation | Context-aware task offloading among multiple devices |
US20180349168A1 (en) * | 2017-05-30 | 2018-12-06 | Magalix Corporation | Systems and methods for managing a cloud computing environment |
US20190095245A1 (en) * | 2017-09-22 | 2019-03-28 | CloudHealth Technologies, Inc. | System and Method for Apportioning Shared Computer Resources |
US20190121566A1 (en) * | 2017-10-19 | 2019-04-25 | Pure Storage, Inc. | Data transformation offloading in an artificial intelligence infrastructure |
-
2019
- 2019-05-21 CN CN201910426197.8A patent/CN111984364B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102681899A (zh) * | 2011-03-14 | 2012-09-19 | 金剑 | 云计算服务平台的虚拟计算资源动态管理*** |
US20160283284A1 (en) * | 2015-03-27 | 2016-09-29 | Mingqiu Sun | Technologies for offloading and on-loading data for processor/coprocessor arrangements |
US20170230448A1 (en) * | 2016-02-05 | 2017-08-10 | International Business Machines Corporation | Context-aware task offloading among multiple devices |
US20180349168A1 (en) * | 2017-05-30 | 2018-12-06 | Magalix Corporation | Systems and methods for managing a cloud computing environment |
US20190095245A1 (en) * | 2017-09-22 | 2019-03-28 | CloudHealth Technologies, Inc. | System and Method for Apportioning Shared Computer Resources |
US20190121566A1 (en) * | 2017-10-19 | 2019-04-25 | Pure Storage, Inc. | Data transformation offloading in an artificial intelligence infrastructure |
Non-Patent Citations (4)
Title |
---|
CHOY SHARON ET AL.: "A hybrid edge-cloud architecture for reducing on-demand gaming latency", MULTIMEDIA SYSTEMS * |
SAIYEDA, ANAM ET AL.: "Cloud computing for deep learning analytics: A survey of current trends and challenges", INTERNATIONAL JOURNAL OF ADVANCED RESEARCH IN COMPUTER SCIENCE * |
廉晓飞等: "基于安全保障的边缘计算卸载方案", 中兴通讯技术 * |
李宏佳;陈鑫;周旭;: "面向55G的分布式移动云计算协同架构与管理机制", 中兴通讯技术 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112637290A (zh) * | 2020-12-14 | 2021-04-09 | 厦门宏泰科技研究院有限公司 | 一种基于微基站及边缘计算的全球通信网络*** |
CN112637290B (zh) * | 2020-12-14 | 2024-03-19 | 厦门宏泰科技研究院有限公司 | 一种基于微基站及边缘计算的全球通信网络*** |
CN112804446A (zh) * | 2020-12-30 | 2021-05-14 | 江苏达科信息科技有限公司 | 基于云平台大数据的大数据处理方法及装置 |
CN112804446B (zh) * | 2020-12-30 | 2022-08-12 | 江苏达科信息科技有限公司 | 基于云平台大数据的大数据处理方法及装置 |
CN112512069A (zh) * | 2021-02-02 | 2021-03-16 | 网络通信与安全紫金山实验室 | 基于信道波束图样的网络智能优化方法及装置 |
CN112512069B (zh) * | 2021-02-02 | 2021-05-28 | 网络通信与安全紫金山实验室 | 基于信道波束图样的网络智能优化方法及装置 |
CN113067873A (zh) * | 2021-03-19 | 2021-07-02 | 北京邮电大学 | 基于深度强化学习的边云协同优化方法 |
CN113222170A (zh) * | 2021-03-30 | 2021-08-06 | 新睿信智能物联研究院(南京)有限公司 | 一种用于物联网ai协同服务平台的智能算法和模型 |
CN113222170B (zh) * | 2021-03-30 | 2024-04-23 | 新睿信智能物联研究院(南京)有限公司 | 一种用于物联网ai协同服务平台的智能算法和模型 |
CN113301141A (zh) * | 2021-05-20 | 2021-08-24 | 北京邮电大学 | 人工智能支持框架的部署方法和*** |
CN113301141B (zh) * | 2021-05-20 | 2022-06-17 | 北京邮电大学 | 人工智能支持框架的部署方法和*** |
CN113316159B (zh) * | 2021-05-27 | 2022-09-02 | 北京邮电大学 | 基于异构物理层的5g网络*** |
CN113316159A (zh) * | 2021-05-27 | 2021-08-27 | 北京邮电大学 | 基于异构物理层的5g网络*** |
CN113473449A (zh) * | 2021-07-02 | 2021-10-01 | 深圳市威宇智通科技有限公司 | 基于物联网终端的智能连接的*** |
CN113473449B (zh) * | 2021-07-02 | 2024-06-14 | 深圳市威宇智通科技有限公司 | 基于物联网终端的智能连接的*** |
WO2023098665A1 (zh) * | 2021-11-30 | 2023-06-08 | 华为技术有限公司 | 任务处理方法及装置 |
CN115002038A (zh) * | 2022-08-04 | 2022-09-02 | 中国电子科技集团公司第十五研究所 | 一种基于云端分布式协调服务的智能调峰方法和*** |
CN115442202A (zh) * | 2022-08-15 | 2022-12-06 | 鞍钢集团北京研究院有限公司 | 一种5g网络云-端协同的虚拟plc控制方法及*** |
CN115442202B (zh) * | 2022-08-15 | 2024-06-07 | 鞍钢集团北京研究院有限公司 | 一种5g网络云-端协同的虚拟plc控制方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN111984364B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111984364B (zh) | 一种面向5g时代的人工智能云平台 | |
Qiao et al. | Collaborative task offloading in vehicular edge multi-access networks | |
Islam et al. | A survey on task offloading in multi-access edge computing | |
Xiao et al. | Distributed optimization for energy-efficient fog computing in the tactile internet | |
Baccarelli et al. | Fog of everything: Energy-efficient networked computing architectures, research challenges, and a case study | |
Hu et al. | Ready player one: UAV-clustering-based multi-task offloading for vehicular VR/AR gaming | |
Xiao et al. | Dynamic network slicing for scalable fog computing systems with energy harvesting | |
CN112333717B (zh) | 计及电力多业务需求的5g接入网切片资源分配方法及装置 | |
Pooranian et al. | A novel distributed fog-based networked architecture to preserve energy in fog data centers | |
Alnoman et al. | Energy efficiency on fully cloudified mobile networks: Survey, challenges, and open issues | |
Maiti et al. | An effective approach of latency-aware fog smart gateways deployment for IoT services | |
US20230292387A1 (en) | Method and device for jointly serving user equipment by wireless access network nodes | |
Li et al. | K-means based edge server deployment algorithm for edge computing environments | |
Meng et al. | Integration application of 5g and smart grid | |
Haitao et al. | Multipath transmission workload balancing optimization scheme based on mobile edge computing in vehicular heterogeneous network | |
Wang et al. | Task allocation mechanism of power internet of things based on cooperative edge computing | |
Kuo et al. | An integrated edge and fog system for future communication networks | |
Li et al. | Deep reinforcement learning-based resource allocation and seamless handover in multi-access edge computing based on SDN | |
Ku et al. | Sustainable vehicular edge computing using local and solar-powered roadside unit resources | |
Sun et al. | Harmonizing artificial intelligence with radio access networks: Advances, case study, and open issues | |
Badshah et al. | Use of regional computing to minimize the social big data effects | |
Shukla et al. | Software-defined network based resource allocation in distributed servers for unmanned aerial vehicles | |
Chen et al. | An IoT edge computing system architecture and its application | |
Kavyashree et al. | Survey on computation offloading strategies in cellular networks with mobile edge computing | |
CN115955711A (zh) | 一种面向能效最优的空地6g网络资源分配方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |