CN111538587B - 一种基于负载均衡的服务功能链重配置方法 - Google Patents

一种基于负载均衡的服务功能链重配置方法 Download PDF

Info

Publication number
CN111538587B
CN111538587B CN202010159485.4A CN202010159485A CN111538587B CN 111538587 B CN111538587 B CN 111538587B CN 202010159485 A CN202010159485 A CN 202010159485A CN 111538587 B CN111538587 B CN 111538587B
Authority
CN
China
Prior art keywords
sfc
value
state
network
vnf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010159485.4A
Other languages
English (en)
Other versions
CN111538587A (zh
Inventor
唐伦
王晓
贺小雨
陈前斌
刘占军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yuhang Huashu Technology Co ltd
Shenzhen Wanzhida Technology Transfer Center Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202010159485.4A priority Critical patent/CN111538587B/zh
Publication of CN111538587A publication Critical patent/CN111538587A/zh
Application granted granted Critical
Publication of CN111538587B publication Critical patent/CN111538587B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/74Address processing for routing
    • H04L45/745Address table lookup; Address filtering
    • H04L45/7453Address table lookup; Address filtering using hashing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种基于负载均衡的服务功能链重配置方法,属于移动通信技术领域。本方法针对网络功能虚拟化架构中由用户SFC无线速率需求发生变化引起的服务器负载不均问题,在保证各个服务器负载均衡以及用户请求性能的前提下,以小基站无线子载波资源容量、有限链路带宽资源容量为约束,优化虚拟网络功能实例的迁移开销,为已部署的服务功能链制定资源重配置和虚拟网络功能迁移策略。本方法基于Dueling Deep Q Network强化学习算法,保证了各个服务器的负载均衡以及用户请求的性能需求,提高了网络的稳定性,并节约了服务器资源。

Description

一种基于负载均衡的服务功能链重配置方法
技术领域
本发明属于移动通信技术领域,涉及一种基于负载均衡的服务功能链重配置方法。
背景技术
网络功能虚拟化(Network Functions Virtualization,NFV)技术通过云计算和虚拟化技术,将网络功能与专用的传统硬件设备解耦,通过软件化的形式,将网络功能部署在标准化的高性能服务器上,完成相应的网络服务。在NFV架构中,用户的服务请求由服务功能链(SFC)完成,一条服务功能链由多个虚拟网络功能(VNF)有序连接而成,数据流按照VNF 的顺序依次经过处理,最终为用户提供所需的数据流,多个相同业务类型的SFC组成一个网络切片。SFC如何在底层物理网络上的部署是NFV技术中的关键问题。SFC部署问题的实质是将VNF和连接VNF的虚拟链路分别在底层物理网络满足资源容量需求的服务器与物理链路上实例化,并将底层网络的物理资源(如计算资源,链路带宽资源)分配给SFC的各个组成部分(VNF,虚拟链路),形成一条端到端通路,完成相应的用户服务请求。当SFC在物理网络中部署好之后,会持续为用户提供数据服务,但当用户的服务需求发生变化时,当前的SFC 部署以及资源分配也会根据变化的需求进行重配置。SFC的重配置包括VNF实例(VNFInstance,VNFI)的迁移和资源重配置,如何在保证资源容量约束、用户请求性能以及服务器负载均衡等前提下,以最小的VNFI迁移开销完成SFC的重配置,从而满足动态变化的服务需求,是NFV技术中的热点问题。
现有的VNFI迁移及资源重配置方法主要针对于SFC在核心网中的部署,通常假设VNFI对资源的需求是动态变化的,为了达到服务的稳定或另外的优化目标,设计启发式算法对VNFI进行迁移。但针对于无线用户来说,SFC的服务性能与用户在无线端可达的无线速率密切相关。在传统SFC部署问题中,通常为一条SFC指定一个流速率,或者为SFC中的每个VNF和虚拟链路指定所需的资源消耗,但由于SFC在有线链路的流速率与最终用户可达的无线速率不匹配,导致核心网资源浪费。因此SFC的部署需要联合考虑无线接入端的资源分配,以完成完整的端到端服务。另外,现有的启发式VNFI迁移算法通常在单时隙中优化网络性能,面对复杂多变的网络环境,这样的启发式算法难以达到理想的优化效果。近年来,人工智能技术持续发展,越来越多的研究人员将机器学习等人工智能技术运用于通信网络中,使得网络控制更加智能、高效。
发明内容
有鉴于此,本发明的目的在于提供一种基于负载均衡的服务功能链重配置方法,该方法基于Dueling Deep Q Network(Dueling DQN)强化学习算法,在动态变化的SFC无线速率需求下,能在保证服务器负载均衡和服务请求性能的同时,优化VNFI的迁移开销,并提高网络的稳定性,减少服务器资源浪费。
为达到上述目的,本发明提供如下技术方案:
一种基于负载均衡的服务功能链重配置方法,该方法在每个离散时隙上,监测网络中已部署服务功能链(Service Function Chain,SFC)的无线速率需求变化,对其无线接入端的子载波资源、虚拟网络功能(Virtualized Network Function,VNF)实例上的计算资源以及有线链路带宽资源进行重配置,以达到新的速率需求;当服务器上分配的计算资源情况发生变化时,会引起服务器负载不均的问题,需要进行VNF迁移来使服务器的负载达到合理的范围内,该方法以最小化VNF迁移开销为目标,为SFC制定合适的VNF迁移策略,使网络中的服务器处于正常的负载状态,以保证网络整体的稳定性并可节约服务器资源,具体包括以下步骤:
S1:以用户可达的无线速率作为SFC资源分配的依据,即SFC各个VNF实例所需的处理速率和链路传输带宽与用户可达的无线速率一致,建立在动态的SFC无线速率需求下,以服务器负载均衡要求和SFC性能需求为约束的VNF迁移开销最小化模型;
S2:动态变化的SFC无线速率需求具有马尔科夫性,为在每个时隙寻找最佳的子载波资源重配置和VNF迁移策略,将上述优化模型转化为离散时间下的马尔科夫决策过程(Markov Decision Processes,MDP);
S3:建立基于Dueling DQN强化学习框架的SFC重配置方法解决上述MDP问题,从而针对每个时隙不同的SFC速率需求制定最佳的子载波资源重配置以及VNF迁移策略。
进一步,在所述步骤S1中,SFC的流速率是指VNF实例的处理速率和传输速率,以用户可达的无线速率作为SFC的流速率,对SFC中的VNF分配相应的计算资源和有线链路带宽资源;
当用户SFC的无线速率需求发生变化时,会对其无线子载波分配进行重配置,以达到新的无线速率需求,SFC的流速率与可达的无线速率一致,则该SFC中VNF所分配的计算资源也将随之变化,部署有上述VNF实例的服务器将会按照新的需求对VNF进行计算资源重配置,这将会引起服务器负载情况的变化:当服务器负载过低时,会造成服务器资源的浪费,当服务器负载过高时,会导致服务器性能下降,从而影响网络的稳定性。因此需要将上述负载不均的服务器上所部属的VNF实例进行迁移,维持各个服务器的负载均衡。
根据上述分析,建立在动态变化的SFC无线速率需求下的VNF迁移模型,在保证物理网络上各个服务器负载均衡以及服务请求性能需求的前提下,以小基站子载波资源容量、服务器计算资源容量以及链路带宽资源容量为约束,以最小化迁移开销为目标,寻找合适的子载波重配置和VNF迁移策略;所述的VNF迁移开销定义为VNF当前来处理流量与迁移跳数的乘积。
进一步,在所述步骤S2中,用户SFC的无线速率需求是动态变化的,且具有马尔科夫性,将该优化问题转化成一个离散时隙的MDP问题,从而利用强化学习算法框架求解,具体包括:
该MDP模型用一个四元组<S,A,Pr,r>表示,其中S表示状态空间,其状态由每个SFC 的速率需求组成,即st=(C1(t),C2(t),...,C|F|(t));A表示动作空间,其动作由子载波的重分配和VNF迁移变量组成,即
Figure RE-GDA0002564057900000031
其中W(t)表示子载波重配置矩阵,
Figure RE-GDA0002564057900000032
表示VNF迁移变量;Pr表示状态转移概率,本模型中的状态为每个SFC的速率需求,其状态转移概率不可预知,则将Pr视为未知量;r表示奖励函值,在一个状态执行某个动作,环境会进入下一个状态,并得到一个奖励值,智能体通过这样不断地与环境进行交互,从而学习获得最高奖励值的动作策略;本模型中的奖励值设为迁移开销的相反数,即rt=-Cm(t),其中Cm(t)为***在t时隙的总迁移开销。
进一步,在所述步骤S3中,根据步骤S2中建立的MDP模型,得到一个强化学习框架,其智能体在每个时隙开始时观察环境的状态st,并执行一个动作at,智能体会得到一个奖励值rt,强化学习的目标即为找到一个策略a=π(s),使得从当前状态采取某一动作后执行该策略得到的累计折扣奖励的期望值最大,该期望值被称为状态动作值函数Qπ(s,a),其表达式为:
Figure RE-GDA0002564057900000033
其中,λ∈(0,1)为权衡各个时刻奖励值的折扣因子;定义最优Q值为Q*(s,a)=maxπQπ(s,a),因此上述策略a=π(s)可表示为 a=argmaxa'Q(s,a')。
进一步,在本方法中,所用的Dueling DQN强化学习算法为深度Q网络(DQN)算法的改进,传统DQN中的Q值由输入为状态动作对(s,a),参数为θ的神经网络输出,但对于某些状态来说,无论采取什么样的动作,都不会对Q值产生明显的影响,因此这样的神经网络结构会影响学习的效率,在Dueling DQN中,神经网络Q值被定义为状态值函数Vπ(s)与优势函数Aπ(s,a)之和:Qπ(s,a)=Vπ(s)+Aπ(s,a),其中,状态值函数Vπ(s)为在状态s下执行策略π得到的累计折扣奖励的期望值,表示为Qπ(s,a)在动作空间A上的均值,即 Vπ(s)=Ea~π(s)[Qπ(s,a)],优势函数A(s,a)为Vπ(s)与Qπ(s,a)之差,其意义为某特定动作a 相对于状态s上的好坏程度,且易得A(s,a)在状态空间上的均值为0;这样将Q值设置为V 值与A值之和的好处在于,可以分别学习某一状态对于环境的影响和某个特定动作在某一状态下的相对优势,然而,用V值和A值直接相加的得到Q值有一个缺陷:给定一个Q值,无法得到唯一的V和A,就不能知道是状态的影响的还动作的影响,为解决这一缺陷,将A 值减去一个固定的常量,使之表示为一个相对的优势值,因此将最终的Q值改写为:
Figure RE-GDA0002564057900000041
Dueling DQN中神经网络的训练方式与DQN中相同,通过经验回放和固定目标网络输出损失函数,利用梯度下降法更新神经网络的参数;当训练完成后得到神经网络的参数,则可以根据当前状态得到最大Q值的SFC重配置策略,即a=argmaxa'Q(s,a')。
本发明的有益效果在于:在NFV环境下,联合考虑SFC编排与无线资源分配,针对SFC 的无线速率需求变化造成的网络服务器负载不均问题,提出了基于Dueling DQN强化学习算法的SFC重配置方法,有效优化了VNFI的迁移成本,保证了网络的稳定性,并节约了服务器资源。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为NFV/SDN环境下的SFC重配置及无线接入网场景图;
图2为Dueling DQN强化学习算法框架图;
图3为Dueling DQN神经网络结构图;
图4为本发明中基于负载均衡的服务功能链重配置方法流程图。
具体实施方式
下面结合附图对本发明的具体实施例进行详细说明。
在本发明的技术方案中,针对NFV环境下用户SFC动态变化的速率需求引起的服务器负载不均问题,联合考虑VNFI迁移与资源重配置,以最小化VNFI迁移开销为优化目标,利用Dueling DQN强化学习算法寻找合适的VNFI迁移与资源重配置策略。具体包括以下步骤:
S1:以用户可达的无线速率作为SFC资源分配的依据,即SFC各个VNF实例所需的处理速率和链路传输带宽与用户可达的无线速率一致,建立在动态的SFC无线速率需求下,以服务器负载均衡要求和SFC性能需求为约束的VNF迁移开销最小化模型;
S2:动态变化的SFC无线速率需求具有马尔科夫性,为在每个时隙寻找最佳的子载波资源重配置和VNF迁移策略,将上述优化模型转化为离散时间下的马尔科夫决策过程(Markov Decision Processes,MDP);
S3:建立基于Dueling DQN强化学习框架的SFC重配置方法解决上述MDP问题,从而针对每个时隙不同的SFC速率需求制定最佳的子载波资源重配置以及VNF迁移策略。
具体来说,在步骤S1中,底层物理网络由无向图G=(N,E)表示,其中N={n1,n2,...}表示物理节点集合,包括服务器节点集合Ns={s1,s2,...}和小基站(small basestation,SBS)集合Nr={r1,r2,...};E={(ni,nj)|ni,nj∈N,Bi,j>0}表示物理链路集合,其中Bi,j表示节点ni和nj间的链路带宽容量,若两点间无链路则为零,因此物理节点的关联矩阵可由B|N|×|N|=[Bi,j]表示。用
Figure RE-GDA0002564057900000051
表示服务器资源向量,其中ci表示服务器si的计算资源容量。用
Figure RE-GDA0002564057900000052
表示SBS子载波资源向量,其中Wi 0表示SBS ri的子载波个数。
在步骤S1中,SFC服务请求集合设为F={1,2,...,f,...},一个服务请求由一个五元组表示: f=<sfcf,Loadf,rf,Delayf,Cf>,其中sfcf为服务请求f的SFC逻辑链路,表示为一个无向图Gf=(Nf,Ef),Loadf表示f的数据量,rf表示发起该服务请求的用户所关联的SBS,Delayf表示f的时延要求,Cf表示f的无线速率要求。
Figure RE-GDA0002564057900000053
为sfcf的VNF虚拟节点集合,其元素为完成该服务请求所需的VNF,任一条SFC的最后一个VNF
Figure RE-GDA0002564057900000054
均为“无线发送功能”,且必须将其映射到该服务指定的SBS rf上,定义二进制变量
Figure RE-GDA0002564057900000055
为服务请求与SBS的关联变量,当服务请求f关联到SBS ri上时,
Figure RE-GDA0002564057900000056
否则为0;
Figure RE-GDA0002564057900000057
为服务请求f的虚拟链路集合,其中
Figure RE-GDA0002564057900000058
是VNF
Figure RE-GDA0002564057900000059
和VNF
Figure RE-GDA00025640579000000510
间的虚拟链路。用矩阵W(t)=[Wi,f(t)]表示SBS子载波分配矩阵,其中Wi,f(t)表示ri分配给服务请求f的子载波数量。用cpuf(t)表示t时隙分配给sfcf中的VNF的计算资源,用Bf(t)表示分配给sfcf的链路带宽资源。假设t时隙节点处理速率
Figure RE-GDA00025640579000000511
与所分配的计算资源cpuf(t)成正比:
Figure RE-GDA0002564057900000061
其中
Figure RE-GDA0002564057900000062
为转化因子。本发明中,节点处理速率
Figure RE-GDA0002564057900000063
和链路带宽Bf(t)应与用户可达的无线速率Cf(t)一致,即
Figure RE-GDA0002564057900000064
Bf(t)=Cf(t),则可得计算资源的需求量为:
Figure RE-GDA0002564057900000065
其中
Figure RE-GDA0002564057900000066
本发明中,以用户可达的无线速率作为SFC的流速率,以此为依据来分配VNFI的计算资源与链路带宽资源。在下行链路中,对无线用户进行子载波资源分配,得到用户可达的无线速率Cf(t),即:
Figure RE-GDA0002564057900000067
其中,B为单个子载波带宽,γi,f为服务请求f在下行链路的信干噪比。
在步骤S1中,假设服务请求的速率需求是动态变化的,当用户的无线速率需求Cf发生变化时,无线端会对用户的子载波资源进行重配置来达到新的需求,进而会引起该服务请求f 的SFC流速率和对其VNFI所分配的计算资源发生变化,并导致服务器节点负载改变,出现低载或过载等负载不均的情况。若负载过低会造成服务器资源的浪费,若服务器负载过高会使服务器性能下降,影响网络的稳定性,因此需要进行SFC的重配置来使服务器负载均衡,SFC的重配置包括VNF的迁移和资源重配置。服务器节点的负载由为节点的计算资源利用率,表示为:
Figure RE-GDA0002564057900000068
设置两个资源利用率阈值umin和umax,当ui小于umin时,该物理节点资源利用率过低,则需将部署在该节点上的VNF实例迁移至其他节点,使该物理节点进入待机状态,从而减少网络能耗;当ui大于umax时,该物理节点处于过载状态,需要将部署在该节点上的VNF实例迁移至其他负载较低的物理节点上,降低该服务器的负载,提高网络的稳定性。定义一个二进制变量
Figure RE-GDA0002564057900000069
当服务请求f的VNFI
Figure RE-GDA00025640579000000610
在t时隙迁移到服务器sj上时,有
Figure RE-GDA00025640579000000611
否则为0。本发明将单个VNFI的迁移开销定义为该VNFI的流速率与迁移跳数的乘积,则服务请求f中的VNFI
Figure RE-GDA00025640579000000612
由原服务器迁移到服务器sj的迁移开销可表示为:
Figure RE-GDA00025640579000000613
其中hk,j为服务器sk和sj间的最短跳数。
因此,优化问题可描述为,用户SFC动态变化的无线速率需求会造成VNFI对服务器计算资源需求的改变,从而会导致服务器出现低载或过载的情况,为了解决服务器负载不均引起的资源浪费和性能不稳定等问题,制定一种VNFI迁移策略和资源重配置,在服务器负载和SFC性能(包括无线速率和时延)的约束下,优化VNFI的迁移开销,在尽可能低的迁移开销下,实现网络的负载均衡。上述优化问题可公式化为:
Figure RE-GDA0002564057900000071
该优化问题主要有约束条件有:1)各个服务器需要满足umin<ui<umax的负载均衡条件;2)在完成重配置后需要满足SFC的无线速率需求Cf(t)>Cf;3)在完成重配置后需要满足SFC端到端时延要求:Df,a(t)>Delayf;4)链路带宽资源分配需要满足带宽资源容量约束:
Figure RE-GDA0002564057900000072
5)子载波资源分配需要满足SBS子载波容量约束:
Figure RE-GDA0002564057900000073
在步骤S2中,将上述优化问题转化成一个离散时间的马尔科夫决策过程<S,A,Pr,r>,其中S为状态空间,A为动作空间,Pr为状态转移概率,r为奖励函数。st∈S为t时隙的环境状态,表示为st=(C1(t),C2(t),...,C|F|(t)),其中Cf(t)是t时隙SFC f的无线速率需求;at∈A 为t时隙执行的动作,表示为:
Figure RE-GDA0002564057900000074
其中W(t)为子载波重配置变量,
Figure RE-GDA0002564057900000075
表示VNFI迁移变量;状态转移概率Pr可表示为Pr(st+1|st,at)=∫Sf(st,at,s)ds,其中f()为状态转移概率密度函数,但本模型中的环境状态为SFC的无线速率需求,因此无法得知该概率密度函数,因此将状态转移概率视为未知量;rt表示在环境状态为st时执行动作at得到的及时奖励,表示为:rt=-Cm(t),其中Cm(t)为t时隙***的总VNFI迁移开销。定义在策略 a=π(s)下的状态动作值函数Qπ(s,a)为从当前状态采取某一动作后执行该策略得到的累计折扣奖励的期望值:
Figure RE-GDA0002564057900000076
其中λ∈(0,1)为权衡各个时刻奖励值的折扣因子。因此,该MDP模型的目标即为,找到一个SFC重配置策略a=π(s),使上述 Q值最大,即a=argmaxa'Q(s,a')。
在步骤S3中,利用Dueling DQN算法来求解上述MDP问题。Dueling DQN基于DQN 算法框架,用神经网络来对Q值进行近似,其输出可表示为Q(s,a;θ),其中θ为神经网络的参数。在DQN架构中,智能体包含两个结构相同的神经网络,分别为估值Q网络和目标Q 网络,其中估值Q网络用于估计Q值,其参数在一定迭代次数内保持不变,经过指定迭代次数后用当前估值Q网络的参数替换目标Q网络的参数,目标Q网络用于输出目标Q值,两者之差被称为时间差分(TD)误差,神经网络将TD误差的均方值作为损失函数,使用梯度下降法进行训练并更新估值Q网络的参数。第t次迭代的损失函数表达式为:
Ltt)=E(s,a,r,s')~D[(yt-Q(s,a;θt))2]
其中,θt为第t次迭代时估值Q网络的参数,D表示经验池,yt表示目标Q网络的输出。经验池D是指一个存放状态转移过程<st,at,rt,st+1>的经验池,每次训练时从该经验池中随机抽取小批量状态转移过程进行学习,其目的是为了打破学习样本中数据间的时间相关性,这样网络可以从过去更广泛的经验中进行学习而不仅仅局限于当前环境。在DuelingDQN中,以DQN为基础,将神经网络的输出Q值改进为:Q(s,a;θ,α,β)=V(s;θ,β)+A(s,a;θ,α),其中V值表示状态值函数,A值表示动作a相对于状态s的优势函数,α和β分别为A值和V值的神经网络参数,这样做的目的是可以分别学习某一状态对于环境的影响和某个特定动作在某一状态下的相对优势。然而,这样用V值和A值直接相加的方式由一个缺陷:给定一个Q值,无法得到唯一的V和A,从而无法得知是状态的影响还是动作的影响。为解决这一问题,可将A值减去一个固定的常量,使之表示为一个动作相对的优势值,因此将最终的Q值改写为:
Figure RE-GDA0002564057900000081
然后通过这种方式得到的Q值,进行损失函数的计算和神经网络的训练,最终获得最优的SFC重配置,即子载波重配置与VNFI迁移决策a=argmaxa'Q(s,a')。
参见图1,图1为NFV/SDN环境下的SFC重配置及无线接入网场景图。在该场景中,控制面与数据面分离,采用集中式的控制面NFV管理编排器(NFV-MANO)对部署在物理网络中的SFC进行重配置,主要包括负载均衡、VNF迁移与资源重配置等功能。数据面中的 NFV基础设施(NFVI)主要包括服务器节点与物理链路等底层物理网络设施,以及无线接入网。其中服务器节点负责VNF的实例化完成相应的网络功能,无线接入网无责与用户的无线传输。本发明中SFC的流速率与用户可达的无线速率一致,即每个VNFI所需的处理速率和链路传输所需的带宽与用户可达的无线速率一致。因此,当用户的无线速率需求发生改变时,需要改变无线接入网中的子载波分配,以达到新的速率需求,其SFC上的VNFI所需的计算资源也随之改变。这样的资源重配置会导致服务器节点上负载的波动,出现负载不均的情况:当服务器负载过低时,会导致服务器资源的浪费;当负载过高时,服务器性能会下降,导致网络的不稳定。因此,需要制定合适的VNFI迁移策略,将负载不均服务器上的VNFI迁移到其他服务器上,来解决网络负载均衡的问题。本发明在服务器负载均衡与用户SFC性能等约束下,以最小化VNFI迁移成本为目标,制定SFC重配置策略,以减少服务器资源的浪费并维持网络稳定。
图2为Dueling DQN强化学习算法框架图。DQN智能体在时隙开始时观测环境状态st,即网络中SFC的无线速率需求,并执行动作at,智能体会得到一个即时奖励rt,环境会进入下一状态st+1,经验回放机制将上述状态转移过程<st,at,rt,st+1>存储到经验池中,为智能体提供学习样本。在每次迭代中,从经验池D中抽取一定数量的状态转移样本,作为神经网络的输入进行训练,从估值Q网络中获得估计Q值Q(s,a;θt),从目标Q网络中获得目标Q值yt,从而获得损失函数Ltt)=E(s,a,r,s')~D[(yt-Q(s,a;θt))2],在通过梯度下降法更新估值Q网络中的参数θ:
Figure RE-GDA0002564057900000091
图3为Dueling DQN中神经网络的结构图。该神经网络以状态动作对(s,a)为输入,隐藏层1是卷积网络层,参数为θ;隐藏层2中包含两条分离的流,左边部分的参数为β,输出为状态值函数V(s;θ,β),它代表状态s对于环境奖励的影响,右边部分的参数为α,输出为优势函数A(s,a;θ,α),它表示各个动作在状态s下的相对优势;输出层整合了隐藏层2中两条流的输出结果,作为整个神经网络的输出,表示为:
Figure RE-GDA0002564057900000092
其中,将A值减去其平均值的目的是为了能够分配判定环境和动作分贝对Q值的影响,而不出现V(s;θ,β)=0,Q(s,a;θ,α,β)=A(s,a;θ,α)的情况。
参见图4,图4为本发明中基于负载均衡的服务功能链重配置方法流程图。步骤如下:
步骤401:初始化t=0时的网络环境,生成当前SFC部署情况;
步骤402:监测用户的SFC无线速率需求是否变化;
步骤403:通过Dueling DQN算法为无线速率需求变化的SFC进行子载波资源重配置决策,以达到新的无线速率需求,并以该无线速率作为SFC的流速率;
步骤404:以步骤403中所得的新的SFC流速率,使VNFI所需的处理速率和链路传输带宽与该流速率一致,重新分配VNFI计算资源与链路带宽资源;
步骤405:判断网络中各个服务器节点si的负载ui是否在正常范围内:umin<ui<umax,若不是,则存在负载不均问题,进行下一步;若不存在负载不均,则返回步骤402;
步骤406:通过Dueling DQN算法对负载不均的服务器上的VNFI进行迁移决策;
步骤407:判断迁移后的SFC是否达到用户的时延要求,若是,进行下一步;若否,返回步骤406;
步骤408:判断训练过程是否达到预定迭代次数,若是,进行下一步;若否,返回步骤402;
步骤409:当迭代结束时,则可根据训练好的神经网络输出SFC重配置决策。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种基于负载均衡的服务功能链重配置方法,其特征在于:该方法在每个离散时隙上,监测网络中已部署服务功能链SFC的无线速率需求变化,对其无线接入端的子载波资源、虚拟网络功能VNF实例上的计算资源以及有线链路带宽资源进行重配置,以达到新的速率需求;该方法以最小化VNF迁移开销为目标,为SFC制定合适的VNF迁移策略,使网络中的服务器处于正常的负载状态,以保证网络整体的稳定性并可节约服务器资源,具体包括以下步骤:
S1:以用户可达的无线速率作为SFC资源分配的依据,即SFC各个VNF实例所需的处理速率和链路传输带宽与用户可达的无线速率一致,建立在动态的SFC无线速率需求下,以服务器负载均衡要求和SFC性能需求为约束的VNF迁移开销最小化模型;
S2:动态变化的SFC无线速率需求具有马尔科夫性,为在每个时隙寻找最佳的子载波资源重配置和VNF迁移策略,将优化模型转化为离散时间下的马尔科夫决策过程MDP;
S3:建立基于DuelingDQN强化学习框架的SFC重配置方法解决MDP问题,从而针对每个时隙不同的SFC速率需求制定最佳的子载波资源重配置以及VNF迁移策略;
在所述步骤S2中,用户SFC的无线速率需求是动态变化的,且具有马尔科夫性,将优化问题转化成一个离散时隙的MDP问题,从而利用强化学习算法框架求解,具体包括:
MDP模型用一个四元组<S,A,Pr,r>表示,其中S表示状态空间,其状态由每个SFC的速率需求组成,即st=(C1(t),C2(t),...,C|F|(t));A表示动作空间,其动作由子载波的重分配和VNF迁移变量组成,即
Figure FDA0003534299170000011
其中W(t)表示子载波重配置矩阵,
Figure FDA0003534299170000012
表示VNF迁移变量;Pr表示状态转移概率,本模型中的状态为每个SFC的速率需求,其状态转移概率不可预知,则将Pr视为未知量;r表示奖励函值,在一个状态执行某个动作,环境会进入下一个状态,并得到一个奖励值,智能体通过这样不断地与环境进行交互,从而学习获得最高奖励值的动作策略;本模型中的奖励值设为迁移开销的相反数,即rt=-Cm(t),其中Cm(t)为***在t时隙的总迁移开销;
在所述步骤S3中,根据步骤S2中建立的MDP模型,得到一个强化学习框架,其智能体在每个时隙开始时观察环境的状态st,并执行一个动作at,智能体会得到一个奖励值rt,强化学习的目标即为找到一个策略a=π(s),使得从当前状态采取某一动作后执行该策略得到的累计折扣奖励的期望值最大,该期望值被称为状态动作值函数Qπ(s,a),其表达式为:
Figure FDA0003534299170000013
其中,λ∈(0,1)为权衡各个时刻奖励值的折扣因子;定义最优Q值为Q*(s,a)=maxπQπ(s,a),策略a=π(s)表示为a=argmaxa'Q(s,a');
在本方法中,所用的DuelingDQN强化学习算法为深度Q网络DQN算法的改进,在DuelingDQN中,神经网络Q值被定义为状态值函数Vπ(s)与优势函数Aπ(s,a)之和:Qπ(s,a)=Vπ(s)+Aπ(s,a),其中,状态值函数Vπ(s)为在状态s下执行策略π得到的累计折扣奖励的期望值,表示为Qπ(s,a)在动作空间A上的均值,即Vπ(s)=Ea~π(s)[Qπ(s,a)],优势函数A(s,a)为Vπ(s)与Qπ(s,a)之差,其意义为某特定动作a相对于状态s上的好坏程度,且易得A(s,a)在状态空间上的均值为0;这样将Q值设置为V值与A值之和的好处在于,分别学习某一状态对于环境的影响和某个特定动作在某一状态下的相对优势,然而,用V值和A值直接相加的得到Q值有一个缺陷:给定一个Q值,无法得到唯一的V和A,就不能知道是状态的影响,还是动作的影响,为解决这一缺陷,将A值减去一个固定的常量,使之表示为一个相对的优势值,将最终的Q值改写为:
Figure FDA0003534299170000021
Dueling DQN中神经网络的训练方式与DQN中相同,通过经验回放和固定目标网络输出损失函数,利用梯度下降法更新神经网络的参数;当训练完成后得到神经网络的参数,则根据当前状态得到最大Q值的SFC重配置策略,即a=argmaxa'Q(s,a')。
2.根据权利要求1所述的一种基于负载均衡的服务功能链重配置方法,其特征在于:在所述步骤S1中,SFC的流速率是指VNF实例的处理速率和传输速率,以用户可达的无线速率作为SFC的流速率,对SFC中的VNF分配相应的计算资源和有线链路带宽资源;
建立在动态变化的SFC无线速率需求下的VNF迁移模型,在保证物理网络上各个服务器负载均衡以及服务请求性能需求的前提下,以小基站子载波资源容量、服务器计算资源容量以及链路带宽资源容量为约束,以最小化迁移开销为目标,寻找合适的子载波重配置和VNF迁移策略;所述的VNF迁移开销定义为VNF当前来处理流量与迁移跳数的乘积。
CN202010159485.4A 2020-03-06 2020-03-06 一种基于负载均衡的服务功能链重配置方法 Active CN111538587B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010159485.4A CN111538587B (zh) 2020-03-06 2020-03-06 一种基于负载均衡的服务功能链重配置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010159485.4A CN111538587B (zh) 2020-03-06 2020-03-06 一种基于负载均衡的服务功能链重配置方法

Publications (2)

Publication Number Publication Date
CN111538587A CN111538587A (zh) 2020-08-14
CN111538587B true CN111538587B (zh) 2022-04-29

Family

ID=71952157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010159485.4A Active CN111538587B (zh) 2020-03-06 2020-03-06 一种基于负载均衡的服务功能链重配置方法

Country Status (1)

Country Link
CN (1) CN111538587B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112631717B (zh) * 2020-12-21 2023-09-05 重庆大学 基于异步强化学习的网络服务功能链动态部署***及方法
CN112702097A (zh) * 2020-12-24 2021-04-23 北京工业大学 一种用于uav辅助蜂窝网络的联合波束成形和功率控制方法
CN113015196B (zh) * 2021-02-23 2022-05-06 重庆邮电大学 一种基于状态感知的网络切片故障愈合方法
CN113411819B (zh) * 2021-05-30 2022-07-12 西安电子科技大学 一种5g nfv切片重配方法、***、无线通信***
CN113256128A (zh) * 2021-05-31 2021-08-13 国网江苏省电力有限公司信息通信分公司 电力物联网中使用强化学习均衡资源使用的任务调度方法
CN113556288B (zh) * 2021-07-23 2022-10-28 中国科学技术大学苏州高等研究院 多租户云中服务功能链路由更新装置和方法
CN114531731B (zh) * 2021-12-20 2024-03-26 国网江苏省电力有限公司电力科学研究院 一种虚拟化无线传感器网络的能耗与时延优化方法
CN114172937B (zh) * 2022-01-19 2023-12-29 广州市宝思信息科技有限公司 基于深度强化学习的动态服务功能链编排方法及***
CN114710196B (zh) * 2022-03-24 2023-07-18 重庆邮电大学 一种软件定义卫星网络虚拟网络功能迁移方法
CN115086324B (zh) * 2022-06-27 2024-07-09 中国电信股份有限公司 服务链分配方法和***、计算机设备和存储介质
CN115622889B (zh) * 2022-12-19 2023-05-09 湖北省楚天云有限公司 一种容器化网络架构及网络功能部署方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062668A (zh) * 2018-08-01 2018-12-21 重庆邮电大学 一种基于5g接入网络的多优先级的虚拟网络功能迁移方法
CN109358971A (zh) * 2018-10-30 2019-02-19 电子科技大学 动态网络环境中快速且负载均衡的服务功能链部署方法
CN109981438A (zh) * 2019-03-22 2019-07-05 大连大学 一种面向sdn和nfv协同部署框架的卫星网络负载均衡方法
CN110275758A (zh) * 2019-05-09 2019-09-24 重庆邮电大学 一种虚拟网络功能智能迁移方法
CN110505099A (zh) * 2019-08-28 2019-11-26 重庆邮电大学 一种基于迁移a-c学习的服务功能链部署方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10372859B2 (en) * 2017-03-09 2019-08-06 Alphaics Corporation System and method for designing system on chip (SoC) circuits using single instruction multiple agent (SIMA) instructions
US11010205B2 (en) * 2017-05-30 2021-05-18 Hewlett Packard Enterprise Development Lp Virtual network function resource allocation
US11063847B2 (en) * 2018-08-21 2021-07-13 Fujitsu Limited Service function chain mapping using multiple parallel microservices instances

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062668A (zh) * 2018-08-01 2018-12-21 重庆邮电大学 一种基于5g接入网络的多优先级的虚拟网络功能迁移方法
CN109358971A (zh) * 2018-10-30 2019-02-19 电子科技大学 动态网络环境中快速且负载均衡的服务功能链部署方法
CN109981438A (zh) * 2019-03-22 2019-07-05 大连大学 一种面向sdn和nfv协同部署框架的卫星网络负载均衡方法
CN110275758A (zh) * 2019-05-09 2019-09-24 重庆邮电大学 一种虚拟网络功能智能迁移方法
CN110505099A (zh) * 2019-08-28 2019-11-26 重庆邮电大学 一种基于迁移a-c学习的服务功能链部署方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
《基于深度强化学习的服务功能链映射算法》;金明等;《计算机应用研究》;20200109;第37卷(第11期);第3456-3460、3466页 *
A Survey of Actor-Critic Reinforcement Learning: Standard and Natural Policy Gradients;I. Grondman等;《IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews)》;20121221;第42卷(第6期);第1291-1307页 *
ARMA-Prediction-Based Online Adaptive Dynamic Resource Allocation in Wireless Virtualized Network;L. Tang等;《IEEE Access》;20190911;第7卷;第130438-130450页 *
Efficient Provision of Service Function Chains in Overlay Networks using Reinforcement Learning;G. Li等;《IEEE Transactions on Cloud Computing》;20191223;第1-13页 *
MSDF: A Deep Reinforcement Learning Framework for Service Function Chain Migration;R. Chen等;《2020 IEEE Wireless Communications and Networking Conference (WCNC)》;20200619;第1-6页 *
基于随机学习的接入网服务功能链部署算法;陈前斌等;《电子与信息学报》;20180913;第41卷(第02期);第417-423页 *
多虚拟机动态迁移情景下的服务功能链调整方法;古英汉等;《小型微型计算机***》;20170515;第38卷(第05期);第1022-1027页 *

Also Published As

Publication number Publication date
CN111538587A (zh) 2020-08-14

Similar Documents

Publication Publication Date Title
CN111538587B (zh) 一种基于负载均衡的服务功能链重配置方法
CN111093203B (zh) 一种基于环境感知的服务功能链低成本智能部署方法
Zhao et al. Energy-saving offloading by jointly allocating radio and computational resources for mobile edge computing
CN111953758B (zh) 一种边缘网络计算卸载和任务迁移方法及装置
CN109684075B (zh) 一种基于边缘计算和云计算协同进行计算任务卸载的方法
CN108809695B (zh) 一种面向移动边缘计算的分布上行链路卸载策略
Sun et al. Autonomous resource slicing for virtualized vehicular networks with D2D communications based on deep reinforcement learning
CN112600921B (zh) 一种面向异构移动边缘网络的动态任务卸载方法
CN112039965B (zh) 一种时间敏感网络中的多任务卸载方法及***
CN110234127B (zh) 一种基于sdn的雾网络任务卸载方法
CN111475274B (zh) 云协同多任务调度方法及装置
WO2023040022A1 (zh) 一种在随机网络中基于算网协同的分布式计算卸载方法
Shan et al. “DRL+ FL”: An intelligent resource allocation model based on deep reinforcement learning for mobile edge computing
CN109714382B (zh) 一种非平衡边缘云mec***的多用户多任务迁移决策方法
WO2023024219A1 (zh) 云边协同网络中时延和频谱占用联合优化方法及***
Li et al. Distributed task offloading strategy to low load base stations in mobile edge computing environment
CN112650581A (zh) 一种面向智能楼宇的云边协同任务调度方法
CN109743217B (zh) 一种基于svra算法的自适应资源调节方法
Jiang et al. A Q-learning based method for energy-efficient computation offloading in mobile edge computing
CN110519776A (zh) 一种雾计算***中的均衡聚类和联合资源分配方法
Khumalo et al. Reinforcement learning-based computation resource allocation scheme for 5G fog-radio access network
Wang et al. Task allocation mechanism of power internet of things based on cooperative edge computing
Yu et al. Collaborative computation offloading for multi-access edge computing
Zu et al. SMETO: Stable matching for energy-minimized task offloading in cloud-fog networks
Zhang et al. Effect: Energy-efficient fog computing framework for real-time video processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230825

Address after: Level 3, Building A18 and A19, Phase 1, Zhejiang University Alumni Enterprise Headquarters Economic Park, No. 397 Cangxing Street, Cangqian Street, Yuhang District, Hangzhou City, Zhejiang Province, 310000

Patentee after: Hangzhou Yuhang Huashu Technology Co.,Ltd.

Address before: 1003, Building A, Zhiyun Industrial Park, No. 13 Huaxing Road, Henglang Community, Dalang Street, Longhua District, Shenzhen City, Guangdong Province, 518000

Patentee before: Shenzhen Wanzhida Technology Transfer Center Co.,Ltd.

Effective date of registration: 20230825

Address after: 1003, Building A, Zhiyun Industrial Park, No. 13 Huaxing Road, Henglang Community, Dalang Street, Longhua District, Shenzhen City, Guangdong Province, 518000

Patentee after: Shenzhen Wanzhida Technology Transfer Center Co.,Ltd.

Address before: 400065 Chongqing Nan'an District huangjuezhen pass Chongwen Road No. 2

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS