CN115659803A - 一种无人机孪生网络映射误差情况下计算任务智能卸载方法 - Google Patents

一种无人机孪生网络映射误差情况下计算任务智能卸载方法 Download PDF

Info

Publication number
CN115659803A
CN115659803A CN202211311838.3A CN202211311838A CN115659803A CN 115659803 A CN115659803 A CN 115659803A CN 202211311838 A CN202211311838 A CN 202211311838A CN 115659803 A CN115659803 A CN 115659803A
Authority
CN
China
Prior art keywords
unmanned aerial
aerial vehicle
intelligent terminal
twin
unloading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211311838.3A
Other languages
English (en)
Inventor
蒋丽
缪家辉
谢正昊
赖健鑫
李嘉柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN202211311838.3A priority Critical patent/CN115659803A/zh
Publication of CN115659803A publication Critical patent/CN115659803A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明公开了一种无人机孪生网络映射误差情况下计算任务智能卸载方法,***及计算机可读存储介质,包括以下步骤:S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。本发明减轻终端用户和边缘服务器之间不可靠的远程通信,降低***延迟,增强数据的实用性。

Description

一种无人机孪生网络映射误差情况下计算任务智能卸载方法
技术领域
本发明涉及无人机技术领域,更具体地,涉及一种无人机孪生网络映射误差情况下计算任务智能卸载方法、***及计算机可读存储介质。
背景技术
物联网设备及其应用日益普及,越来越多的需要资源的应用和新颖的大数据服务正在发展,并在我们的日常生活中发挥作用。然而,由于物理尺寸、电池容量和计算资源有限等原因,终端设备在服务延迟敏感和计算密集型应用方面存在困难。移动边缘计算(Mobile edge computing,MEC)最近被认为是一种很有前景的技术,可以在无线网络边缘为资源有限的终端提供服务。终端通过计算卸载服务,将其计算密集型任务卸载到MEC服务器执行。因此,任务执行的大部分能耗从资源有限的终端转移到资源丰富的MEC服务器上。从而减少任务的计算延迟和能耗,延长整个网络的寿命并且提高网络的服务质量。但是,当大量的任务同时被卸载给MEC服务器时,MEC服务器上可能会发生激烈的资源竞争,导致网络拥塞和性能下降。而端到端(Device-to-device,D2D)协作被认为是一种潜在的资源短缺问题的解决方案,由空闲的移动用户、终端设备提供空闲的计算资源,进行卸载任务的计算,可以有效降低延迟。但是,上述MEC技术不支持灵活部署,在一些通信基础设施分布稀疏,通信条件较差的环境中,如高原、森林等地区,终端还是难以获得可靠的计算服务。
随着无人机技术的不断发展和成熟,以及无人机的灵活部署、工作效率高等优点,工业级的无人机被广泛应用,比如应用在救灾、电力、航测等。同时无人机已被提出作为5G及5G之后的飞行MEC服务器,以扩展无线覆盖范围,并服务于不确定和极端环境下的终端,以较低的网络开销和执行延迟提供计算卸载服务。要进行有效、可靠的计算卸载服务,提供无处不在的通信和计算支持,无人机网络边缘计算需要对计算任务卸载、本地计算、无人机部署以及无人机飞行轨迹的联合优化。传统的优化方法依靠人类经验进行优化决策,人力成本较高。随着近年来人工智能技术在各行业的大量应用,在移动网络优化领域应用的机器学习和人工智能算法也在激增,如利用多目标优化模型优化网络容量和覆盖率,利用神经网络在移动性管理中预测用户的目标位置,用深度神经网络(Deep Neural Network,DNN)实现的近实时资源分配。然而,这些方法不能适应高维网络状态的动态变化,结果往往是次优的。因此,一些研究采用强化学习(Reinforcement Learning,RL)来解决这一问题。强化学习基于***状态转移和动作后的反馈奖励,学习在未知环境下的最优决策。它可以与复杂和动态的环境交互,以优化难以建模的学习目标。然而,训练样本的获取难度和时间成本是一个很大的挑战。为了做到这一点,这些算法在探索过程中直接与物理网络交互,这意味着它们将当前未经训练的策略产生的动作直接施加到网络中,以获得训练样本。这是特别危险的,因为当前的次优行动甚至是较差行动可能会恶化网络性能,在无人机网络中可能造成难以挽回的巨大损失。
现有技术中公开了一种基于数字孪生的无人机集群轨迹优化和任务卸载方法,包括:构建无人机集群辅助边缘计算模型;构建物理实体网络;构建物理实体网络的数字孪生网络,拟合用户设备和无人机的地理位置、资源状态信息;构建无人机轨迹、用户设备卸载决策和计算资源分配的优化模型;求解无人机轨迹和用户设备、无人机的计算资源分配策略;获取用户设备的卸载决策;获得无人机的轨迹,用户设备和无人机的计算资源最优分配策略,以及获得用户设备的计算任务最优卸载决策。该方案中采用两个算法进行优化,复杂度较高,稳定性不佳。
为了解决上述问题,本发明提出了一种无人机孪生网络映射误差情况下计算任务智能卸载方法、***及计算机可读存储介质。
发明内容
本发明提供一种无人机孪生网络映射误差情况下计算任务智能卸载方法、***及计算机可读存储介质,能够减轻终端用户和边缘服务器之间不可靠的远程通信,降低***延迟,增强数据的实用性。
本发明的首要目的是为解决上述技术问题,本发明的技术方案如下:
本发明第一方面提供了一种无人机孪生网络映射误差情况下计算任务智能卸载方法,包括以下步骤:一种无人机孪生网络映射误差情况下计算任务智能卸载方法,包括以下步骤:
S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;
S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;
S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;
S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。
进一步的,智能终端的数字孪生模型表达式为:
DTi={Mi,Di,si(t),si(t+1)} (1)
其中,Mi分别表示智能终端的行为模型,si(t)分别表示智能终端实时状态,si(t+1)表示智能终端的更新状态。
进一步的,无人机的孪生模型表达式为:
DTj={Mj,Dj,sj(t),sj(t+1)} (2)
其中,Mj表示无人机的行为模型,sj(t)表示无人机的实时状态,sj(t+1)表示无人机的更新状态。
进一步的,构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标包括:定义场景、定义通信通信模型、定义计算卸载模型;
定义场景:
设定有随机分布的I个智能终端,记作U={1,2,…,I},每个智能终端既能在本地执行计算任务,也能将计算任务卸载到携带边缘服务器的无人机执行,设定无人机从当前位置飞行到指定的悬停点执行计算任务,并且在同一时间无人机只服务一个智能终端,设无人机的最大服务时长为T,在提供计算服务过程中,无人机处在高度为H的水平面上,在第t时刻,t∈{0,1,2,...,T},无人机选择第k个悬停点的决策变量为ak,其中,k∈{0,1,2,...,K},当ak=1时,表示无人机选择第k个悬停点,此时,无人机的位置表示为
Figure BDA0003908206820000031
反之,ak=0表示无人机停留在当前位置,地面智能终端i的位置用wi=(xi,yi)表示;
定义通信模型:
在第t时刻,无人机悬停在第k个悬停点,定义信道带宽为B,地面智能设备轮流卸载计算任务到无人机,第i个智能设备与在第k个悬停点的无人机的通信速率表示为:
Figure BDA0003908206820000032
其中pi为第i个智能设备的传输功率,σ表示噪声功率,
Figure BDA0003908206820000041
表示第i个智能终端与无人机之间的信道增益,其中β是固定传输损耗,m表示路径损耗因子,di,k表示无人机的第k个悬停点到用户i的通信距离;
定义计算卸载模型:
定义第i个智能设备的本地计算时延为
Figure BDA0003908206820000042
如果第i个智能设备将计算任务卸载到无人机,定义计算卸载时延为:
Figure BDA0003908206820000043
其中
Figure BDA0003908206820000044
表示数据传输时延,
Figure BDA0003908206820000045
表示计算时延,fi,k为无人机分配给智能设备i的计算资源,定义ai,k为卸载决策,当ai.k=1时,表示第i个智能设备将计算任务卸载到悬停在第k个悬停点的无人机,反之ai.k=0时,表示第i个智能设备将在本地进行任务计算,由于无人机采用悬停方式执行卸载任务计算,因此无人机的悬停时间和计算卸载时延相等,即无人机在悬停点k的悬停时间表示为:
Figure BDA0003908206820000046
无人机在水平方向上需要从悬停点k'推进到当前悬停点k的位置,因此无人机的飞行能耗表示为:
Figure BDA0003908206820000047
其中P1为推进功率,V为无人机的飞行速度,据公式(5),无人机在第k个悬停点的悬停能耗表示为:
Eh(t)=P2Tk (7)
式中P2为无人机悬停功率,Tk为悬停时间,无人机执行卸载任务计算的能耗表示为:
Figure BDA0003908206820000048
综上所述,根据公式(6),(7)和(8),无人机在计算卸载过程中的总能耗表示为:
Figure BDA0003908206820000049
将无人机计算处理任务Ri的效用函数定义为:
Figure BDA0003908206820000051
其中ai表示无人机计算处理大小为Hi(t)任务的单位价格,bi表示无人机单位计算资源价格,u表示无人机单位***格,则,以最大化无人机效用函数作为优化目标表示如下:
Figure BDA0003908206820000052
Figure BDA0003908206820000053
C2:Ef(t)+Eh(t)+Ec(t)<RE(t-1),
C3:ak∈(0,1),ai,k∈(0,1),
Figure BDA0003908206820000054
C5:0≤fi,k≤fmax,
Figure BDA0003908206820000055
其中C1表示无人机在计算卸载过程中的总能耗不能超过自身电池最大能量Ed;C2表示无人机当前时刻计算卸载总能耗小于上一时刻的无人机电池剩余能量RE(t-1);C3表示无人机的悬停决策以及地面智能终端i的卸载决策;C4表示地面智能终端i只能将任务卸载给一个无人机;同一时刻每个无人机只能为一个地面智能终端提供计算卸载服务;C5表示无人机分配给地面智能终端i的计算资源不能超过自身最大计算资源fmax;C6表示智能终端i计算任务时延不超过最大容忍时延。
进一步的,利用竞争近端策略优化方法将优化目标构造成马尔可夫决策过程包括:定义状态空间、动作空间和奖励函数,
状态空间:在决策时刻t,t∈{0,1,…,T},本地基站的孪生体状态空间定义为:
Figure BDA0003908206820000056
其中
Figure BDA0003908206820000061
表示无人机位置,RE(t)表示无人机剩余能量,wi(t)表示地面智能终端i的位置,Ri(t)表示地面智能终端i的计算任务,hi,k(t)表示地面智能终端i和悬停在第k个悬停点无人机之间的信道增益,其中,i∈{1,2,…,I},k∈{0,1,...,K}
动作空间:在决策时刻t,优化无人机效用的动作空间表示为:
t={ak,ai,k,fi,k} (13)
其中ak表示无人机在第t时刻选择第k个悬停点的决策,ai,k表示地面智能终端i的卸载决策,fi,k无人机分配给地面智能终端i的计算资源;
奖励函数:在近端策略优化算法执行过程中,需要检验约束C1-C6是否成立,因此,设计如下即时奖励函数rt
Figure BDA0003908206820000062
如果限制条件C1-C6不能被满足,则表明当前优化决策的性能较差,在这种情况下,将即时奖励置为0,以避免无效的决策;在算法训练过程中,本地基站BS从维护的孪生模型中获取初始状态,生成随机策略,通过与孪生模型交互,获取新的状态和动作转移序列,同时,调节各自的Actor-Critic网络参数得到最优策略。Actor网络参数更新过程的损失函数表示为:
Figure BDA0003908206820000063
其中概率比
Figure BDA0003908206820000064
表示网络参数更新幅度,
Figure BDA0003908206820000065
表示优势函数反应了动作的价值,∈为裁剪率,clip函数的目的是将概率比rt(θ)限制在区间[1-∈,1+∈],在式(1-3)中,当优势函数
Figure BDA0003908206820000066
时,rt(θ)超过1+∈则停止更新,当
Figure BDA0003908206820000067
时,rt(θ)小于1-∈停止更新,目的是防止更新的网络和旧的网络差异过大,从而做到小步幅更新。
进一步的,优势函数的定义如下所示:
Figure BDA0003908206820000068
δt=rt+V(st+1)-V(st) (16)
其中,
Figure BDA0003908206820000069
表示优势函数,δt表示单步时间误差,γ∈(0,1)表示折扣系数,V(st+1)表示状态st+1的估计价值,V(st)表示状态st的估计价值。
进一步的,Critic网络采用子网络输出的动作价值计算状态价值,具体表达式如下:
V(st)=Q(st,a)TP(st,a) (17)
其中,P(st,a)=[p1,p1,…pK],分别为采取动作p1,p1,…pK的概率,P(st,a)由actor网络输出得到,同时,Critic网络将δt的均方差作为损失函数,使用梯度下降法最小化损失函数,更新网络参数。
本发明第二方面提供了一种无人机孪生网络映射误差情况下计算任务智能卸载***,该***包括:存储器、处理器,所述存储器中包括一种无人机孪生网络映射误差情况下计算任务智能卸载方法程序,所述一种无人机孪生网络映射误差情况下计算任务智能卸载方法程序被所述处理器执行时实现如下步骤:
S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;
S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;
S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;
S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。
进一步的,智能终端的数字孪生模型表达式为:
DTi={Mi,Di,si(t),si(t+1)}
其中,Mi分别表示智能终端的行为模型,si(t)分别表示智能终端实时状态,si(t+1)表示智能终端的更新状态。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括无人机孪生网络映射误差情况下计算任务智能卸载方法程序,所述无人机孪生网络映射误差情况下计算任务智能卸载方法程序被处理器执行时,实现所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法的步骤。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过构建智能终端和无人机的数字孪生模型,将无人机网络在本地BS中以数字孪生的形式展现出来,将模拟和仿真并生成孪生数据与竞争近端策略结合得到竞争网络,得到更少的能耗和计算资源得到最优的任务卸载和资源分配策略,提升网络整体的效用,同时本发明将竞争网络与近端策略优化算法结合,可以更好的适应数字孪生模型的错误与信息传输过程的偏差,减轻终端用户和边缘服务器之间不可靠的远程通信,降低***延迟,增强数据的实用性。
附图说明
图1为本发明实施例提供的基于数字孪生的无人机边缘卸载场景图。
图2为本发明提供的一种无人机孪生网络映射误差情况下计算任务智能卸载方法流程图。
图3为本发明提供的一种无人机孪生网络映射误差情况下计算任务智能卸载***框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例1
如图1所示为本发明实施例的一个场景,基站(BS)覆盖一定的范围,在覆盖范围内存在一定数量的用户,用户可以是移动设备、物联网设备等等。由于个人用户和物联网设备计算资源不足、能量不足等问题的存在,用户可以选择将自己的计算任务在本地计算或者请求无人机进行计算卸载。因为直接传输数据给基站可能会导致基站过载,交由无人机进行辅助任务卸载,本发明使用竞争-近端策略优化算法训练得到最优决策。由于卸载决策需要不断测试,在物理环境中测试存在风险,于是本发明结合数字孪生技术,每个用户、无人机都将生成自身的数字孪生体,基站负责维护这些数字孪生体并构成数字孪生网络,近端策略优化算法在数字孪生网络中训练并测试,直至收敛后作用于真实的无人机网络。根据上述过程,本发明可以在孪生网络中做出最优决策,从而降低无人机网络的计算任务的时延,减少***能耗,提升网络的整体效用。
如图2所示,本发明第一方面提供了一种无人机孪生网络映射误差情况下计算任务智能卸载方法,包括以下步骤:
S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;
需要说明的是,本发明中无线数字孪生网络***分为无线接入层(即终端层)和数字孪生层(即边缘层)。无线接入层由计算和存储资源有限的终端设备和无人机等实体组成。通过无线通信,这些实体连接到附近的基站构建数字孪生体。在数字孪生层中,基站配备MEC服务器连续地采集服务区域内智能终端和无人机的数据,并且计算和分析智能终端和无人机的行为特征,以构建服务区域内智能终端、无人机、网络拓扑关系及环境的孪生模型。物联网设备的数字孪生体是物理设备的完整副本,包括硬件配置信息、历史运行数据和实时状态。
智能终端的数字孪生模型表达式为:
DTi={Mi,Di,si(t),si(t+1)} (1)
其中,Mi分别表示智能终端的行为模型,si(t)分别表示智能终端实时状态,si(t+1)表示智能终端的更新状态。
无人机的孪生模型表达式为:
DTj={Mj,Dj,sj(t),sj(t+1)} (2)
其中,Mj表示无人机的行为模型,sj(t)表示无人机的实时状态,sj(t+1)表示无人机的更新状态。
通过上述孪生模型对服务区域内的智能终端、无人机等的运行状态进行模拟和仿真并生成孪生数据。
S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;
具体包括:定义场景、定义通信通信模型、定义计算卸载模型;
定义场景:
设定有随机分布的I个智能终端,记作U={1,2,…,I},每个智能终端既能在本地执行计算任务,也能将计算任务卸载到携带边缘服务器的无人机执行,设定无人机从当前位置飞行到指定的悬停点执行计算任务,并且在同一时间无人机只服务一个智能终端,设无人机的最大服务时长为T,在提供计算服务过程中,无人机处在高度为H的水平面上,在第t时刻,t∈{0,1,2,...,T},无人机选择第k个悬停点的决策变量为ak,其中,k∈{0,1,2,...,K},当ak=1时,表示无人机选择第k个悬停点,此时,无人机的位置表示为
Figure BDA0003908206820000091
反之,ak=0表示无人机停留在当前位置,地面智能终端i的位置用wi=(xi,yi)表示;
定义通信模型:
在第t时刻,无人机悬停在第k个悬停点,定义信道带宽为B,地面智能设备轮流卸载计算任务到无人机,第i个智能设备与在第k个悬停点的无人机的通信速率表示为:
Figure BDA0003908206820000101
其中pi为第i个智能设备的传输功率,σ表示噪声功率,
Figure BDA0003908206820000102
表示第i个智能终端与无人机之间的信道增益,其中β是固定传输损耗,m表示路径损耗因子,di,k表示无人机的第k个悬停点到用户i的通信距离;
定义计算卸载模型:
定义第i个智能设备的本地计算时延为
Figure BDA0003908206820000103
如果第i个智能设备将计算任务卸载到无人机,定义计算卸载时延为:
Figure BDA0003908206820000104
其中
Figure BDA0003908206820000105
表示数据传输时延,
Figure BDA0003908206820000106
表示计算时延,fi,k为无人机分配给智能设备i的计算资源,定义ai,k为卸载决策,当ai.k=1时,表示第i个智能设备将计算任务卸载到悬停在第k个悬停点的无人机,反之ai.k=0时,表示第i个智能设备将在本地进行任务计算,由于无人机采用悬停方式执行卸载任务计算,因此无人机的悬停时间和计算卸载时延相等,即无人机在悬停点k的悬停时间表示为:
Figure BDA0003908206820000107
无人机在水平方向上需要从悬停点k'推进到当前悬停点k的位置,因此无人机的飞行能耗表示为:
Figure BDA0003908206820000108
其中P1为推进功率,V为无人机的飞行速度,据公式(5),无人机在第k个悬停点的悬停能耗表示为:
Eh(t)=P2Tk (7)
式中P2为无人机悬停功率,Tk为悬停时间,无人机执行卸载任务计算的能耗表示为:
Figure BDA0003908206820000111
综上所述,根据公式(6),(7)和(8),无人机在计算卸载过程中的总能耗表示为:
Figure BDA0003908206820000112
将无人机计算处理任务Ri的效用函数定义为:
Figure BDA0003908206820000113
其中ai表示无人机计算处理大小为Hi(t)任务的单位价格,bi表示无人机单位计算资源价格,u表示无人机单位***格,则以最大化无人机效用函数作为优化目标表示如下:
Figure BDA0003908206820000114
Figure BDA0003908206820000115
C2:Ef(t)+Eh(t)+Ec(t)<RE(t-1),
C3:ak∈(0,1),ai,k∈(0,1),
Figure BDA0003908206820000116
C5:0≤fi,k≤fmax,
Figure BDA0003908206820000117
其中C1表示无人机在计算卸载过程中的总能耗不能超过自身电池最大能量Ed;C2表示无人机当前时刻计算卸载总能耗小于上一时刻的无人机电池剩余能量RE(t-1);C3表示无人机的悬停决策以及地面智能终端i的卸载决策;C4表示地面智能终端i只能将任务卸载给一个无人机;同一时刻每个无人机只能为一个地面智能终端提供计算卸载服务;C5表示无人机分配给地面智能终端i的计算资源不能超过自身最大计算资源fmax;C6表示智能终端i计算任务时延不超过最大容忍时延。
S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;
为了得到优化问题的最优解,本发明将竞争网络和近端策略优化算法结合,提出基于孪生模型的竞争-近端策略优化算法。将优化问题(11)构造成马尔可夫决策过程,其中状态空间、动作空间和奖励函数的定义分别如下:
状态空间:在决策时刻t,t∈{0,1,…,T},本地基站的孪生体状态空间定义为:
Figure BDA0003908206820000121
其中
Figure BDA0003908206820000122
表示无人机位置,RE(t)表示无人机剩余能量,wi(t)表示地面智能终端i的位置,Ri(t)表示地面智能终端i的计算任务,hi,k(t)表示地面智能终端i和悬停在第k个悬停点无人机之间的信道增益,其中,i∈{1,2,…,I},k∈{0,1,...,K}
动作空间:在决策时刻t,优化无人机效用的动作空间表示为:
t={ak,ai,k,fi,k} (13)
其中ak表示无人机在第t时刻选择第k个悬停点的决策,ai,k表示地面智能终端i的卸载决策,fi,k无人机分配给地面智能终端i的计算资源;
奖励函数:在近端策略优化算法执行过程中,需要检验约束C1-C6是否成立,因此,设计如下即时奖励函数rt
Figure BDA0003908206820000123
如果限制条件C1-C6不能被满足,则表明当前优化决策的性能较差,在这种情况下,将即时奖励置为0,以避免无效的决策;在算法训练过程中,本地基站BS从维护的孪生模型中获取初始状态,生成随机策略,通过与孪生模型交互,获取新的状态和动作转移序列,同时,调节各自的Actor-Critic网络参数得到最优策略。Actor网络参数更新过程的损失函数表示为:
Figure BDA0003908206820000124
其中概率比
Figure BDA0003908206820000125
表示网络参数更新幅度,
Figure BDA0003908206820000126
表示优势函数反应了动作的价值,∈为裁剪率,clip函数的目的是将概率比rt(θ)限制在区间[1-∈,1+∈],在式(1-3)中,当优势函数
Figure BDA0003908206820000127
时,rt(θ)超过1+∈则停止更新,当
Figure BDA0003908206820000128
时,rt(θ)小于1-∈停止更新,目的是防止更新的网络和旧的网络差异过大,从而做到小步幅更新。
进一步的,优势函数的定义如下所示:
Figure BDA0003908206820000131
δt=rt+V(st+1)-V(st) (16)
其中,其中,
Figure BDA0003908206820000132
表示优势函数,δt表示单步时间误差,γ∈(0,1)表示折扣系数,V(st+1)表示状态st+1的估计价值,V(st)表示状态st的估计价值。
竞争网络通过在DQN网络后面添加两个子网络来更准确地估计动作价值函数,以状态作为竞争网络的输入,神经网络N1提取特征信息,然后将该输出分别作为网络N2和N3的输入,并分别输出状态价值V(s)以及各动作的优势值A(s,a),两者相加可得到各个动作的动作价值Q(s,a),通过将对动作价值的观测拆分为对状态价值和对动作优势值的观测,Q网络获得了更有效率的更新,为防止动作优势值A(s,a)在更新过程中补偿动作价值Q(s,a)的变化,应使动作优势值减去其平均值。
S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。
需要说明的是,本发明利用竞争近端策略优化方法基于Actor-Critic框架,Actor网络的更新目标与近端策略优化算法相同,根据式(15)最小化损失函数以优化网络参数。而Critic网络采用上图1所示的竞争网络结构,由于子网络输出的优势函数值和状态价值的准确度都相对较低,故需要用输出的动作价值计算状态价值,如下式所示:
V(st)=Q(st,a)TP(st,a) (17)
其中P(st,a)=[p1,p1,…pK],分别为采取动作p1,p1,…pK的概率。P(st,a)可由actor网络输出得到。同时,Critic网络将δt的均方差作为损失函数,使用梯度下降法最小化损失函数,更新网络参数。不断重复迭代训练过程,直至学习到最优策略,根据最后的决策动作进行飞行轨迹制定、计算卸载及其资源的分配在孪生网络中检验,通过后将决策作用于物理实体。
本发明第二方面提供了一种无人机孪生网络映射误差情况下计算任务智能卸载***,该***包括:存储器、处理器,所述存储器中包括一种无人机孪生网络映射误差情况下计算任务智能卸载方法程序,所述一种无人机孪生网络映射误差情况下计算任务智能卸载方法程序被所述处理器执行时实现如下步骤:
S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;
S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;
S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;
S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。
进一步的,智能终端的数字孪生模型表达式为:
DTi={Mi,Di,si(t),si(t+1)}
其中,Mi分别表示智能终端的行为模型,si(t)分别表示智能终端实时状态,si(t+1)表示智能终端的更新状态。
本发明第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中包括无人机孪生网络映射误差情况下计算任务智能卸载方法程序,所述无人机孪生网络映射误差情况下计算任务智能卸载方法程序被处理器执行时,实现所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法的步骤。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,包括以下步骤:
S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;
S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;
S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;
S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。
2.根据权利要求1所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,智能终端的数字孪生模型表达式为:
DTi={Mi,Di,si(t),si(t+1)} (1)
其中,Mi分别表示智能终端的行为模型,si(t)分别表示智能终端实时状态,si(t+1)表示智能终端的更新状态。
3.根据权利要求1所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,无人机的孪生模型表达式为:
DTj={Mj,Dj,sj(t),sj(t+1)} (2)
其中,Mj表示无人机的行为模型,sj(t)表示无人机的实时状态,sj(t+1)表示无人机的更新状态。
4.根据权利要求1所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标包括:定义场景、定义通信通信模型、定义计算卸载模型;
定义场景:
设定有随机分布的I个智能终端,记作U={1,2,…,I},每个智能终端既能在本地执行计算任务,也能将计算任务卸载到携带边缘服务器的无人机执行,设定无人机从当前位置飞行到指定的悬停点执行计算任务,并且在同一时间无人机只服务一个智能终端,设无人机的最大服务时长为T,在提供计算服务过程中,无人机处在高度为H的水平面上,在第t时刻,t∈{0,1,2,...,T},无人机选择第k个悬停点的决策变量为ak,其中,k∈{0,1,2,...,K},当ak=1时,表示无人机选择第k个悬停点,此时,无人机的位置表示为
Figure FDA0003908206810000021
反之,ak=0表示无人机停留在当前位置,地面智能终端i的位置用wi=(xi,yi)表示;
定义通信模型:
在第t时刻,无人机悬停在第k个悬停点,定义信道带宽为B,地面智能设备轮流卸载计算任务到无人机,第i个智能设备与在第k个悬停点的无人机的通信速率表示为:
Figure FDA0003908206810000022
其中pi为第i个智能设备的传输功率,σ表示噪声功率,
Figure FDA0003908206810000023
表示第i个智能终端与无人机之间的信道增益,其中β是固定传输损耗,m表示路径损耗因子,di,k表示无人机的第k个悬停点到用户i的通信距离;
定义计算卸载模型:
定义第i个智能设备的本地计算时延为
Figure FDA0003908206810000024
如果第i个智能设备将计算任务卸载到无人机,定义计算卸载时延为:
Figure FDA0003908206810000025
其中
Figure FDA0003908206810000026
表示数据传输时延,
Figure FDA0003908206810000027
表示计算时延,fi,k为无人机分配给智能设备i的计算资源,定义ai,k为卸载决策,当ai.k=1时,表示第i个智能设备将计算任务卸载到悬停在第k个悬停点的无人机,反之ai.k=0时,表示第i个智能设备将在本地进行任务计算,由于无人机采用悬停方式执行卸载任务计算,因此无人机的悬停时间和计算卸载时延相等,即无人机在悬停点k的悬停时间表示为:
Figure FDA0003908206810000028
无人机在水平方向上需要从悬停点k'推进到当前悬停点k的位置,因此无人机的飞行能耗表示为:
Figure FDA0003908206810000029
其中P1为推进功率,V为无人机的飞行速度,据公式(5),无人机在第k个悬停点的悬停能耗表示为:
Eh(t)=P2Tk (7)
式中P2为无人机悬停功率,Tk为悬停时间,无人机执行卸载任务计算的能耗表示为:
Figure FDA0003908206810000031
综上所述,根据公式(6),(7)和(8),无人机在计算卸载过程中的总能耗表示为:
Figure FDA0003908206810000032
将无人机计算处理任务Ri的效用函数定义为:
Figure FDA0003908206810000033
其中ai表示无人机计算处理大小为Hi(t)任务的单位价格,bi表示无人机单位计算资源价格,u表示无人机单位***格,则,以最大化无人机效用函数作为优化目标表示如下:
Figure FDA0003908206810000034
Figure FDA0003908206810000035
C2:Ef(t)+Eh(t)+Ec(t)<RE(t-1),
C3:ak∈(0,1),ai,k∈(0,1),
Figure FDA0003908206810000036
C5:0≤fi,k≤fmax,
Figure FDA0003908206810000037
其中C1表示无人机在计算卸载过程中的总能耗不能超过自身电池最大能量Ed;C2表示无人机当前时刻计算卸载总能耗小于上一时刻的无人机电池剩余能量RE(t-1);C3表示无人机的悬停决策以及地面智能终端i的卸载决策;C4表示地面智能终端i只能将任务卸载给一个无人机;同一时刻每个无人机只能为一个地面智能终端提供计算卸载服务;C5表示无人机分配给地面智能终端i的计算资源不能超过自身最大计算资源fmax;C6表示智能终端i计算任务时延不超过最大容忍时延。
5.根据权利要求1所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,利用竞争近端策略优化方法将优化目标构造成马尔可夫决策过程包括:定义状态空间、动作空间和奖励函数,
状态空间:在决策时刻t,t∈{0,1,…,T},本地基站的孪生体状态空间定义为:
Figure FDA0003908206810000041
其中
Figure FDA0003908206810000042
表示无人机位置,RE(t)表示无人机剩余能量,wi(t)表示地面智能终端i的位置,Ri(t)表示地面智能终端i的计算任务,hi,k(t)表示地面智能终端i和悬停在第k个悬停点无人机之间的信道增益,其中,i∈{1,2,…,I},k∈{0,1,...,K}
动作空间:在决策时刻t,优化无人机效用的动作空间表示为:
t={ak,ai,k,fi,k} (13)
其中ak表示无人机在第t时刻选择第k个悬停点的决策,ai,k表示地面智能终端i的卸载决策,fi,k无人机分配给地面智能终端i的计算资源;
奖励函数:在近端策略优化算法执行过程中,需要检验约束C1-C6是否成立,因此,设计如下即时奖励函数rt
Figure FDA0003908206810000043
如果限制条件C1-C6不能被满足,则表明当前优化决策的性能较差,在这种情况下,将即时奖励置为0,以避免无效的决策;在算法训练过程中,本地基站BS从维护的孪生模型中获取初始状态,生成随机策略,通过与孪生模型交互,获取新的状态和动作转移序列,同时,调节各自的Actor-Critic网络参数得到最优策略;Actor网络参数更新过程的损失函数表示为:
Figure FDA0003908206810000044
其中概率比
Figure FDA0003908206810000045
表示网络参数更新幅度,
Figure FDA0003908206810000046
表示优势函数反应了动作的价值,∈为裁剪率,clip函数的目的是将概率比rt(θ)限制在区间[1-∈,1+∈],在式(1-3)中,当优势函数
Figure FDA0003908206810000051
时,rt(θ)超过1+∈则停止更新,当
Figure FDA0003908206810000052
时,rt(θ)小于1-∈停止更新,目的是防止更新的网络和旧的网络差异过大,从而做到小步幅更新。
6.根据权利要求5所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,优势函数的定义如下所示:
Figure FDA0003908206810000053
δt=rt+V(st+1)-V(st) (16)
其中,
Figure FDA0003908206810000054
表示优势函数,δt表示单步时间误差,γ∈(0,1)表示折扣系数,V(st+1)表示状态st+1的估计价值,V(st)表示状态st的估计价值。
7.根据权利要求5所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法,其特征在于,Critic网络采用子网络输出的动作价值计算状态价值,具体表达式如下:
V(st)=Q(st,a)TP(st,a) (17)
其中,P(st,a)=[p1,p1,…pK],分别为采取动作p1,p1,…pK的概率,P(st,a)由actor网络输出得到,同时,Critic网络将δt的均方差作为损失函数,使用梯度下降法最小化损失函数,更新网络参数。
8.一种无人机孪生网络映射误差情况下计算任务智能卸载***,其特征在于,该***包括:存储器、处理器,所述存储器中包括一种无人机孪生网络映射误差情况下计算任务智能卸载方法程序,所述一种无人机孪生网络映射误差情况下计算任务智能卸载方法程序被所述处理器执行时实现如下步骤:
S1:构建智能终端和无人机的数字孪生模型,利用所述孪生模型对基站服务区域内的智能终端、无人机的运行状态进行模拟和仿真并生成孪生数据;
S2:构建计算卸载和资源分配策略,将最大化无人机效用函数作为优化目标;
S3:将优化目标构造成马尔可夫决策过程,并利用孪生数据优化竞争近端策略,利用优化后的竞争近端策略求解马尔可夫决策过程;
S4:利用步骤S3输出的决策动作进行飞行轨迹制定、计算卸载及其资源的分配。
9.根据权利要求8所述的一种无人机孪生网络映射误差情况下计算任务智能卸载***,其特征在于,智能终端的数字孪生模型表达式为:
DTi={Mi,Di,si(t),si(t+1)}
其中,Mi分别表示智能终端的行为模型,si(t)分别表示智能终端实时状态,si(t+1)表示智能终端的更新状态。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括无人机孪生网络映射误差情况下计算任务智能卸载方法程序,所述无人机孪生网络映射误差情况下计算任务智能卸载方法程序被处理器执行时,实现如权利要求1至7中任一项所述的一种无人机孪生网络映射误差情况下计算任务智能卸载方法的步骤。
CN202211311838.3A 2022-10-25 2022-10-25 一种无人机孪生网络映射误差情况下计算任务智能卸载方法 Pending CN115659803A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211311838.3A CN115659803A (zh) 2022-10-25 2022-10-25 一种无人机孪生网络映射误差情况下计算任务智能卸载方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211311838.3A CN115659803A (zh) 2022-10-25 2022-10-25 一种无人机孪生网络映射误差情况下计算任务智能卸载方法

Publications (1)

Publication Number Publication Date
CN115659803A true CN115659803A (zh) 2023-01-31

Family

ID=84991257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211311838.3A Pending CN115659803A (zh) 2022-10-25 2022-10-25 一种无人机孪生网络映射误差情况下计算任务智能卸载方法

Country Status (1)

Country Link
CN (1) CN115659803A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116643581A (zh) * 2023-04-17 2023-08-25 重庆控环科技集团有限公司 考虑功耗故障的通信无人机路径规划和带宽分配方法
CN116860447A (zh) * 2023-07-10 2023-10-10 中国电信股份有限公司技术创新中心 任务缓存方法、装置、***、设备及介质
CN117971483A (zh) * 2024-02-02 2024-05-03 广州航海学院 基于数字孪生的车联网计算任务卸载方法
CN118075783A (zh) * 2024-04-18 2024-05-24 中国人民解放军32806部队 基于基站多用户无线通信自组网的鲁棒通信方法及***
US12027055B1 (en) * 2023-04-21 2024-07-02 Nanjing University Of Posts And Telecommunications Unmanned aerial vehicle assisted task offloading and resource allocation method based on service caching

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116643581A (zh) * 2023-04-17 2023-08-25 重庆控环科技集团有限公司 考虑功耗故障的通信无人机路径规划和带宽分配方法
US12027055B1 (en) * 2023-04-21 2024-07-02 Nanjing University Of Posts And Telecommunications Unmanned aerial vehicle assisted task offloading and resource allocation method based on service caching
CN116860447A (zh) * 2023-07-10 2023-10-10 中国电信股份有限公司技术创新中心 任务缓存方法、装置、***、设备及介质
CN117971483A (zh) * 2024-02-02 2024-05-03 广州航海学院 基于数字孪生的车联网计算任务卸载方法
CN118075783A (zh) * 2024-04-18 2024-05-24 中国人民解放军32806部队 基于基站多用户无线通信自组网的鲁棒通信方法及***

Similar Documents

Publication Publication Date Title
CN112351503B (zh) 基于任务预测的多无人机辅助边缘计算资源分配方法
CN115659803A (zh) 一种无人机孪生网络映射误差情况下计算任务智能卸载方法
CN111800828B (zh) 一种超密集网络的移动边缘计算资源分配方法
CN113395654A (zh) 一种边缘计算***的多无人机任务卸载和资源分配的方法
CN111813539B (zh) 一种基于优先级与协作的边缘计算资源分配方法
CN114051254B (zh) 一种基于星地融合网络的绿色云边协同计算卸载方法
CN111915142A (zh) 一种基于深度强化学习的无人机辅助资源分配方法
Ebrahim et al. A deep learning approach for task offloading in multi-UAV aided mobile edge computing
CN116546559B (zh) 分布式多目标空地联合轨迹规划和卸载调度方法及***
CN113254188A (zh) 调度优化方法和装置、电子设备及存储介质
Sha et al. DRL-based task offloading and resource allocation in multi-UAV-MEC network with SDN
CN115065678A (zh) 一种基于深度强化学习的多智能设备任务卸载决策方法
CN114626298A (zh) 无人机辅助车联网中高效缓存和任务卸载的状态更新方法
CN116321293A (zh) 基于多智能体强化学习的边缘计算卸载和资源分配方法
CN114025359B (zh) 基于深度强化学习的资源分配与计算卸载方法、***、设备及介质
CN113821346B (zh) 基于深度强化学习的边缘计算中计算卸载与资源管理方法
CN114219074A (zh) 一种按需动态调整的无线通信网络资源分配算法
CN111930435B (zh) 一种基于pd-bpso技术的任务卸载决策方法
CN116737391A (zh) 一种联邦模式下基于混合策略的边缘计算协作方法
CN114745386B (zh) 一种多用户边缘智能场景下的神经网络分割及卸载方法
Si et al. UAV-assisted Semantic Communication with Hybrid Action Reinforcement Learning
CN115955711A (zh) 一种面向能效最优的空地6g网络资源分配方法
Yuan et al. Joint Multi-Ground-User Edge Caching Resource Allocation for Cache-Enabled High-Low-Altitude-Platforms Integrated Network
CN112969157B (zh) 一种无人机网络负载均衡方法
CN115967430A (zh) 一种基于深度强化学习的成本最优空地网络任务卸载方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination