CN110311948B - 容器/容器组间的通信方法及基于此的容器云网络*** - Google Patents

容器/容器组间的通信方法及基于此的容器云网络*** Download PDF

Info

Publication number
CN110311948B
CN110311948B CN201910415407.3A CN201910415407A CN110311948B CN 110311948 B CN110311948 B CN 110311948B CN 201910415407 A CN201910415407 A CN 201910415407A CN 110311948 B CN110311948 B CN 110311948B
Authority
CN
China
Prior art keywords
container
communication
rdma
network
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910415407.3A
Other languages
English (en)
Other versions
CN110311948A (zh
Inventor
张春海
孙夏
冉玫美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhixing Technology Co Ltd
Original Assignee
Shenzhen Zhixing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhixing Technology Co Ltd filed Critical Shenzhen Zhixing Technology Co Ltd
Priority to CN201910415407.3A priority Critical patent/CN110311948B/zh
Publication of CN110311948A publication Critical patent/CN110311948A/zh
Application granted granted Critical
Publication of CN110311948B publication Critical patent/CN110311948B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Small-Scale Networks (AREA)

Abstract

本发明提供一种容器/容器组间的通信方法及基于此的容器云网络***;通过其中的容器/容器组间的通信方法,实现了容器/容器组间的RDMA通信;并基于此设计了其中的容器云网络***和包括该多容器云网络***的容器集群及其部署方法;进而又在上述内容的基础上,提出一种在容器云平台部署的分布式训练任务的通信方法,通过在上述容器集群上运行分布式训练任务时使容器/容器组间的训练任务流量,使用RDMA网络,执行RDMA通信,大大提高了训练数据的通信效率,进而提升了分布式机器学习的训练效率。

Description

容器/容器组间的通信方法及基于此的容器云网络***
技术领域
本发明涉及容器云网络及RDMA通信领域;具体地,涉及一种容器/容器组间的通信方法及基于此的容器云网络***。
背景技术
在大多数场景下,当所有的业务应用都直接运行在物理主机上时,计算资源和存储资源都会变得难于增减,要么是一直不够用,要么是把过剩的资源浪费掉。于是,人们提出和设计了虚拟机技术方案,通过其合理调度,在很多场景下都提高了资源利用率。但是,虚拟机技术却也存在着虚拟化管理软件自身消耗资源的问题,而且虚拟机方案还需要在虚拟化管理软件之上运行独立的访客操作***,这显然不是一种轻量的解决方案。
作为一种轻量级的技术,容器技术则很好地避免了上述问题。容器技术通过容器引擎提供了一个在完全隔离的环境中打包和运行应用程序的能力,这个隔离的环境通常被称为容器。较之虚拟机技术,容器技术更为轻量,它可以保证程序运行环境的一致性,降低配置开发环境、生产环境的复杂度和成本和实现程序的快速部署。
容器引擎及容器内的应用程序均运行在操作***上,因此容器集群中容器/容器组(这里的容器/容器组是指容器集群在编排管理时最小单位;其中,这里的容器即在容器环境下运行独立应用的容器;而容器组,是指在容器环境下运行独立应用的“逻辑主机”,运行着一个或者多个紧密耦合的应用容器,如Kubernetes平台的Pod)间通信通常也是提供不同的方案利用主机终端的资源虚拟出网卡进行通信(这里可以是同一终端上容器间时有操作***虚拟出的网卡,也可以是跨终端时虚拟终端挂载的网卡资源),而这种容器/容器组的默认通信显然需要通过操作***内核协议栈。以Kubernetes平台(Kubernetes一种十分流行的容器编排管理工具,其支持自动化部署、大规模可伸缩、应用容器化管理)上的Pod(可视为前面述及的容器组的一种形式)间的通信为例,其中的一个Pod(即本端Pod)访问另一个Pod(对端Pod)时,通常会通过service服务进行通信;这种方式具体是通过iptables经由操作***的TCP/IP协议栈,实现访问对端Pod的。
然而,随着新的应用场景的出现,容器/容器组间的通信对带宽需求也急剧增加。例如在分布式机器学***台部署分布式训练任务,作为子任务训练节点的容器/容器组间的通信带宽需求可达10GB-100GB级。容器/容器组间的基于TCP/IP协议的默认网络通信却不能避免地需要操作***和协议栈的介入,占用大量的CPU资源,影响训练任务的效率。
发明内容
有鉴于此,本发明提供一种容器/容器组间的通信方法及基于此的容器云网络***。
一方面,本发明实施例提供一种容器/容器组间的通信方法,用于实现容器集群内各容器/容器组间的RDMA通信。
上述的容器/容器组间的通信方法,包括:
当容器集群中的第一容器/容器组需要与第二容器/容器组通信时,
获取第二容器/容器组挂载的虚拟RDMA网卡IP;
根据所述的第二容器/容器组虚拟RDMA网卡IP,通过第一容器/容器组虚拟RDMA网卡与第二容器/容器组虚拟RDMA网卡间的RDMA网络,执行RDMA通信。
另一方面,本发明实施例提供一种容器云网络***。
结合第一方面,上述的容器云网络***,包括:
第一子网络***和第二子网络***;其中,
第一子网络***,为默认网络,用于支持TCP/IP协议的网络通信;
第二子网络***,为RDMA网络,用于RDMA通信;
第二子网络中的容器/容器组间,能够依第一方面述及的容器/容器组间的通信方法进行RDMA通信。
再一方面,本发明实施例提供一种容器集群。
结合第二方面,上述的容器集群,包括:
第二方面述及的容器云网络***。
又一方面,本发明实施例提供一种部署容器集群的方法,用于部署第三方面述及的多子网络容器集群。
结合第二、三方面,上述的部署容器集群的方法,包括:
创建构成容器集群的为容器/容器组;
以及,
通过多网卡cni为容器/容器组提供不少于两个的虚拟网卡接口;其中,
第一网卡接口,用于挂载虚拟网卡;所述的容器/容器组通过挂载的虚拟网卡接入支持TCP/IP协议通信的默认网络;
第二网卡接口,用于挂载虚拟RDMA网卡;所述的容器/容器组通过挂载的虚拟RDMA网卡接入RDMA网络;
又一方面,本发明实施例提供一种在容器云平台部署的分布式训练任务的通信方法,用于提高训练数据的通信效率,进而提升分布式机器学习的训练效率。
结合第一、二、三、四方面,上述的通信方法,包括:
在第三方面述及的容器集群上运行分布式训练任务时,
容器/容器组间的管理任务流量,使用默认网络,进行支持TCP/IP协议的网络通信;
容器/容器组间的训练任务流量,使用RDMA网络,依第一方面述及的容器/容器组间的通信方法进行RDMA通信。
本发明实施例提供的容器/容器组间的通信方法,实现了容器/容器组间的RDMA通信;并基于此设计了一种多子网络容器云网络***和包括该多子网络容器云网络***的容器集群及其部署方法;进而又在上述内容的基础上,提出一种在容器云平台部署的分布式训练任务的通信方法,通过在上述容器集群上运行分布式训练任务时使容器/容器组间的训练任务流量,使用RDMA网络,执行RDMA通信,大大提高了训练数据的通信效率,进而提升了分布式机器学习的训练效率。
附图说明
为更加清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明中一部分实施例或现有技术描述中涉及的附图做简单介绍。
图1为本发明一些实施例提供的一种在Kubernetes平台上部署分布式训练任务时的训练集群中一个作为Parameter Server(PS)节点的Pod与另一个作为Worker节点的Pod间的网络示意图。
具体实施方式
下面结合本发明实施例的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下为本发明的一些优选实施例。其中,
上述优选实施例提供一种容器/容器组间的通信方法,用于实现容器集群内各容器/容器组(特别是跨物理节点间的容器/容器组)间的RDMA通信。该方法包括:
在容器集群中,
当一个容器/容器组(即本端容器/容器组)需要与另外的容器/容器组(即对端容器/容器组)通信时,
获取对端容器/容器组挂载的虚拟RDMA网卡IP;
根据对端容器/容器组的RDMA网卡IP,通过二者间(本端容器/容器组与对端容器/容器组)的RDMA网络,执行RDMA通信。
其中,上述的容器/容器组,是指容器集群在编排管理时最小单位;其中,这里的容器是指在容器环境下运行独立应用的容器;而这里的容器组,是指在容器环境下运行独立应用的“逻辑主机”,运行着一个或者多个紧密耦合的应用容器,如Kubernetes平台的Pod。根据容器集群编排管理平台的不同,可能是以容器为最小调度单位的,也可能是以各种形式的容器组为最小调度单位的;容器技术出现之初,容器间的通信需求非常简单,其实现也极为简陋;随着容器技术的推广使用和跨机容器集群的出现,最小调度单位间的通信需求也随之出现,这里即是以容器/容器组这样的最小调度单位间的通信为研究对象,提出上述解决方案的。此外,不同于基于TCP/IP协议的默认网络通信,根据RDMA通信语义的不同,在通信时,一个本端容器/容器组同时与之通信的对端容器/容器组可以是一个,但也可能是多个;在同时存在多个对端容器/容器组时,在通信过程中,分别获取它们各自的虚拟RDMA网卡IP进行通信。
具体地,这些实施例中的一些提供的容器/容器组间的通信方法中,通过sriov虚拟物理RDMA网卡(指任意一种支持RDMA协议的网卡),获得用于挂载的虚拟RDMA网卡;
对应地,通过sriov-cni为所述的容器/容器组提供虚拟RDMA网卡接口,进而挂载虚拟RDMA网卡。
具体地,这些实施例中的一些提供的容器/容器组间的通信方法中,获取的对端容器/容器组的虚拟RDMA网卡IP,是从各容器/容器组的共享存储查询获取的;而这些共享存储中的虚拟RDMA网卡IP,是各容器/容器组在被分配获得RDMA网络的IP后上报到共享存储中的;其中,这里的共享存储,可以是但不限于数据库、缓存、共享文件***等。
本发明的另一些优选实施例提供一种容器云网络***。该***包括:
第一子网络***和第二子网络***;其中,
第一子网络***,为默认网络,用于支持TCP/IP协议的网络通信;
第二子网络***,为RDMA网络,用于RDMA通信;
第二子网络中的容器/容器组间,能够根据上述任一优选实例述及的容器/容器组间的通信方法进行RDMA通信。
一般来说,第一子网络,即支持TCP/IP协议通信的子网络,通常作为容器集群的默认网络;在各类现有的容器管理编排平台上,通常都提供支持支持TCP/IP协议通信的子网络***;而第二子网络,即用于RDMA通信的RDMA网络,通常是指在为有RDMA通信需求的容器/容器组挂载虚拟RDMA网卡后在它们之间形成的RDMA网络。
本发明的再一些优选实施例提供一种容器集群。该容器集群包括上述任一优选实施例述及的容器云网络***。其中,该容器集群应该包括若干个(不少于2个)的容器/容器组,这些容器/容器组形成上述的多子网络容器云网络***,也即前面述及的第一子网络和第二子网络。
本发明的又一些优选实施例提供一种部署容器集群的方法,用于上述任一优选实施例述及的多子网络容器集群。该方法包括:
创建构成容器集群的为容器/容器组;
在创建过程中,
通过多网卡cni为容器/容器组提供不少于两个的虚拟网卡接口;其中,
一个网卡接口,用于挂载虚拟网卡;所述的容器/容器组通过各自挂载的虚拟网卡接入支持TCP/IP协议的网络通信的默认网络;
另一个网卡接口,用于挂载虚拟RDMA网卡;所述的容器/容器组通过挂各自载的虚拟RDMA网卡接入用于RDMA通信的RDMA网络。
根据容器集群中不同容器/容器组的业务需求,多网卡cni可以仅为有RDMA通信需求的容器/容器组提供多个(不少于两个)的虚拟网卡接口。
具体地,这些实施例中的一些提供的部署容器集群的方法,通过sriov-cni为所述的容器/容器组提供虚拟RDMA网卡接口,挂载虚拟RDMA网卡;对应地,通过sriov虚拟物理RDMA网卡(指任意一种支持RDMA协议的网卡),获得用于挂载的虚拟RDMA网卡。
这里以基于此方法在Kubernetes平台部署双子网络容器集群的过程为示例,进一步帮助理解上述优选实施例中的部署方法。其具体过程包括:
在Kubernetes平台创建构成容器集群的Pod;
通过multus-cni调用对应的cni插件(比如,支持默认网络(也即支持TCP/IP通信的网络)的flannel_cni等、以及支持RDMA通信的sriov_cni等)为Pod提供对应的网络接口;本示例中multus-cni调用通过调用flannel_cni为集群中的全部Pod提供了flannel网络接口,用于“挂载”分配到的虚拟网卡资源,这些Pod通过挂载的虚拟网卡加入默认网络,支持TCP/IP协议的通信;又通过sriov_cni,为需要RDMA通信的Pod提供了额外的sriov网络接口,用于“挂载”分配到的虚拟RDMA网卡资源(以sriov虚拟获得),而这部分Pod还通过挂载的虚拟RDMA网卡接入RDMA网络,支持RDMA通信。
本发明的又一些优选实施例提供一种在容器云平台部署的分布式训练任务的通信方法,用于提高训练数据的通信效率,进而提升分布式机器学习的训练效率。该方法包括:
在上述任一优选实施例述及的多子网络容器集群上运行分布式训练任务时,
容器/容器组间的管理任务流量,使用默认网络,进行支持TCP/IP协议的网络通信;
容器/容器组间的训练任务流量,使用RDMA网络,上述任一优选实施例述及的容器/容器组间的通信方法进行RDMA通信。
这里以基于该方法在Kubernetes平台部署的双子网络容器集群以及在其上部署和运行分布式训练时的通信过程为示例,进一步帮助理解上述优选实施例中的在容器云平台部署的分布式训练任务的通信方法。图1为一种在Kubernetes平台上部署分布式训练任务时的训练集群中一个作为Parameter Server(PS)节点的Pod与另一个作为Worker节点的Pod间的网络示意图。在执行分布式训练任务时,主要通信的是梯度数据传递,对网络需求极大,往往受制于传统TCP/IP通信。下面将以图1中PS-0Pod、Worker-0Pod间的通信为例,进行说明:
其中,当二者间的通信为管理业务流量时,即通过图1中的默认网络通信;
而当二者间的通信为训练业务流量时,如梯度数据时,则选择图1中的RDMA网络进行RDMA通信。
为了提高算力等资源利用率,在容器云平台部署分布式训练任务时,往往会先分解训练任务为若干个子任务和为每个子任务生成环境配置参数以保障任务间的依赖关系以控制任务间的数据一致性,然后再为每个任务创建对应的容器/容器组及连接访问服务,在执行训练任务时通过连接访问服务获得网络IP进而进行通信的。在默认网络条件下的Kubernetes平台部署分布式训练任务时,就采用了这样的方式。上述示例中在双子网络容器集群执行分布式训练时,则需要容器/容器组主动提供虚拟RDMA网卡IP才能实现Pod间梯度数据等训练任务流量的RDMA通信。
以上所述仅为本发明的具体实施方式,但本发明的保护范围并不局限于此。

Claims (8)

1.一种容器/容器组间的通信方法,其特征在于,所述通信方法用于传输分布式机器学习场景中容器/容器组间的管理任务流量和训练任务流量,包括:
当容器集群中的第一容器/容器组需要与第二容器/容器组通信时,
获取第二容器/容器组挂载的虚拟RDMA网卡IP;其中,获取对端容器/容器组的虚拟RDMA网卡IP,是从所述容器/容器组的共享存储查询获取的;所述的共享存储中的虚拟RDMA网卡IP,是容器/容器组在被分配获得RDMA网络的IP后主动上报到共享存储中的;
根据所述的第二容器/容器组虚拟RDMA网卡IP,
通过第一容器/容器组虚拟RDMA网卡与第二容器/容器组虚拟RDMA网卡间的RDMA网络,执行RDMA通信,用于传输分布式机器学习场景中容器/容器组间的训练任务流量,所述容器/容器组间的训练任务流量包括容器/容器组间的梯度数据;
所述容器/容器组间的通信方法还包括:
在容器/容器组间加入默认网络,支持TCP/IP协议的通信,用于传输分布式机器学习场景中容器/容器组间的管理任务流量;
所述默认网络与所述RDMA网络互相独立。
2.根据权利要求1所述的容器/容器组间的通信方法,其特征在于,
通过sriov虚拟物理RDMA网卡获得用于挂载的虚拟RDMA网卡;
对应地,通过sriov-cni为所述的容器/容器组提供虚拟RDMA网卡接口,以挂载所述虚拟RDMA网卡。
3.根据权利要求1所述的容器/容器组间的通信方法,其特征在于,
通信时,所述的第一容器/容器组同时仅存在一个所述第二容器/容器组与之通信。
4.根据权利要求1所述的容器/容器组间的通信方法,其特征在于,
通信时,所述的第一容器/容器组同时存在多个所述第二容器/容器组与之通信;
在通信过程中,即分别获取所述第二容器/容器组各自的虚拟RDMA网卡IP进行通信。
5.一种容器云网络***,其特征在于,包括:
第一子网络***和第二子网络***;其中,
第一子网络***,为默认网络,用于支持TCP/IP协议的网络通信;
第二子网络***,为RDMA网络,用于RDMA通信;
第二子网络中的容器/容器组间,能够依权利要求1-4任一所述的方法进行RDMA通信。
6.一种容器集群,其特征在于,包括:
权利要求5所述的容器云网络***。
7.一种部署容器集群的方法,其特征在于,包括:
创建构成容器集群的为容器/容器组;
以及,
通过多网卡cni为所述容器/容器组提供不少于两个的虚拟网卡接口;其中,
第一网卡接口,用于挂载虚拟网卡;所述的容器/容器组通过其接入默认网络;
第二网卡接口,用于挂载虚拟RDMA网卡;所述的容器/容器组通过其接入RDMA网络,并且通过其依权利要求1-4任一所述的方法进行RDMA通信。
8.根据权利要求7所述的部署容器集群的方法,其特征在于,包括:
通过sriov-cni为所述的容器/容器组提供虚拟RDMA网卡接口;
对应地,通过sriov虚拟物理RDMA网卡获得所述的虚拟RDMA网卡。
CN201910415407.3A 2019-05-17 2019-05-17 容器/容器组间的通信方法及基于此的容器云网络*** Active CN110311948B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910415407.3A CN110311948B (zh) 2019-05-17 2019-05-17 容器/容器组间的通信方法及基于此的容器云网络***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910415407.3A CN110311948B (zh) 2019-05-17 2019-05-17 容器/容器组间的通信方法及基于此的容器云网络***

Publications (2)

Publication Number Publication Date
CN110311948A CN110311948A (zh) 2019-10-08
CN110311948B true CN110311948B (zh) 2022-07-15

Family

ID=68074883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910415407.3A Active CN110311948B (zh) 2019-05-17 2019-05-17 容器/容器组间的通信方法及基于此的容器云网络***

Country Status (1)

Country Link
CN (1) CN110311948B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111314450B (zh) * 2020-02-06 2022-08-02 恒生电子股份有限公司 数据的传输方法、装置、电子设备和计算机存储介质
CN113296872B (zh) * 2020-04-13 2022-05-06 阿里巴巴集团控股有限公司 容器状态查询方法、装置、设备、存储介质和***
CN111966446B (zh) * 2020-07-06 2022-08-19 复旦大学 一种容器环境下rdma虚拟化方法
CN112398936B (zh) * 2020-11-06 2023-03-28 浪潮云信息技术股份公司 一种基于Kubernetes的多网卡容器实现方法及***
CN113162802A (zh) * 2021-04-02 2021-07-23 东云睿连(武汉)计算技术有限公司 基于InfiniBand的通信方法、设备及存储介质
CN114281478B (zh) * 2021-12-24 2023-04-18 北京百度网讯科技有限公司 容器运行方法、装置、电子设备及计算机存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107113298A (zh) * 2014-12-29 2017-08-29 Nicira股份有限公司 为rdma提供多租赁支持的方法
CN109639455A (zh) * 2018-11-09 2019-04-16 武汉烽火信息集成技术有限公司 一种容器云平台的网络管理方法及***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9483431B2 (en) * 2013-04-17 2016-11-01 Apeiron Data Systems Method and apparatus for accessing multiple storage devices from multiple hosts without use of remote direct memory access (RDMA)
US10721290B2 (en) * 2015-06-05 2020-07-21 Nutanix, Inc. Architecture for managing I/O and storage for a virtualization environment using executable containers and virtual machines
US9619270B2 (en) * 2015-06-27 2017-04-11 Vmware, Inc. Remote-direct-memory-access-based virtual machine live migration
US10423331B2 (en) * 2016-02-02 2019-09-24 Samsung Electronics Co., Ltd. Polymorphic storage devices
US20180150256A1 (en) * 2016-11-29 2018-05-31 Intel Corporation Technologies for data deduplication in disaggregated architectures
CN108287723B (zh) * 2016-12-30 2022-07-12 华为技术有限公司 一种应用交互方法、装置、物理机及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107113298A (zh) * 2014-12-29 2017-08-29 Nicira股份有限公司 为rdma提供多租赁支持的方法
CN109639455A (zh) * 2018-11-09 2019-04-16 武汉烽火信息集成技术有限公司 一种容器云平台的网络管理方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
远程直接内存访问与检查点相结合的容器迁移;赵倩等;《计算机科学与探索》;20190123(第12期);全文 *

Also Published As

Publication number Publication date
CN110311948A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN110311948B (zh) 容器/容器组间的通信方法及基于此的容器云网络***
US7620953B1 (en) System and method for allocating resources of a core space among a plurality of core virtual machines
CN111857873A (zh) 一种实现云原生容器网络的方法
CN109194502B (zh) 多租户容器云计算***的管理方法
CN110297670B (zh) 一种提高容器云上分布式任务训练效率的方法及***
CN113596110B (zh) 一种面向异构云的云原生微服务平台
CN110308987B (zh) 一种更新容器云上分布式训练任务连接参数的方法
CN108702316B (zh) 一种vnf的资源分配方法及装置
CN110308986B (zh) 基于优化调度的容器云上分布式训练数据通信的方法
CN103945000B (zh) 一种负载均衡方法及负载均衡器
CN110198364B (zh) 基于指定dns解析的容器云上分布式训练数据通信的方法
KR20140027518A (ko) 클라우드 환경 내 가상 자원들의 할당을 위한 방법 및 장치
CN112333017B (zh) 一种服务配置方法、装置、设备及存储介质
CN112416737B (zh) 一种容器的测试方法、装置、设备和存储介质
CN111245634B (zh) 一种虚拟化管理方法及装置
CN111527726A (zh) 网络服务管理方法、相关装置及***
CN110838939A (zh) 一种基于轻量级容器的调度方法及边缘物联管理平台
Benomar et al. Cloud-based enabling mechanisms for container deployment and migration at the network edge
Chun et al. Kubernetes enhancement for 5G NFV infrastructure
CN109525413B (zh) Cdn网络功能虚拟化的管理方法、装置及***
CN114528099A (zh) 一种gpu卡分配的方法、***、设备和存储介质
CN117076133B (zh) 云游戏平台异构资源分配方法、计算机装置及存储介质
CN116700985A (zh) 模型部署方法、***及存储介质
CN110300192B (zh) 一种根据ip分配表更新分布式训练任务连接参数的方法
US7669202B1 (en) Resource management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518000 a2405, building 9, zone 2, Shenzhen Bay science and technology ecological park, 3609 Baishi Road, community, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Zhixing Technology Co.,Ltd.

Address before: Room 408, Building 3, 4 Chegongzhuang Street, Xicheng District, Beijing 100044

Applicant before: BEIJING HANHAI CLUSTAR TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant