CN115052285A - 基于深度强化学习的无人机智能反射面安全传输方法 - Google Patents

基于深度强化学习的无人机智能反射面安全传输方法 Download PDF

Info

Publication number
CN115052285A
CN115052285A CN202210477440.0A CN202210477440A CN115052285A CN 115052285 A CN115052285 A CN 115052285A CN 202210477440 A CN202210477440 A CN 202210477440A CN 115052285 A CN115052285 A CN 115052285A
Authority
CN
China
Prior art keywords
aerial vehicle
unmanned aerial
uav
optimization
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210477440.0A
Other languages
English (en)
Inventor
东润泽
王布宏
曹堃锐
程天昊
刁丹玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Air Force Engineering University of PLA
Original Assignee
Air Force Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Air Force Engineering University of PLA filed Critical Air Force Engineering University of PLA
Priority to CN202210477440.0A priority Critical patent/CN115052285A/zh
Publication of CN115052285A publication Critical patent/CN115052285A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/04013Intelligent reflective surfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/02Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0617Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal for beam forming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及一种基于深度强化学***均保密速率。该优化问题是典型的非凸问题,难以用传统的优化方法进行求解,因而我们引入深度强化学习的方法对其进行求解。本发明考虑了无人机通信中的安全问题,通过网络参数的合理优化显著地提高了通信网络的安全性能。

Description

基于深度强化学习的无人机智能反射面安全传输方法
技术领域
本发明属于无线通信技术领域,具体涉及一种基于深度强化学习的无人机智能反射面通信网络面向安全传输的参数优化方法。
背景技术
第五代(the fifth-Generation,5G)通信网络对覆盖率和传输速率提出了更高的要求,无人机(Unmanned Aerial Vehicle,UAV)能够利用其强移动性为地面节点提供无处不在的可靠连接,而智能反射面(Reconfigurable Intelligence Surface,IRS)因其有效重构电磁波传播环境的能力也受到越来越广泛的关注,被认为是下一代通信网络中极具潜力的技术。UAV与IRS的结合能够为通信网络带来更高的容量和能量效率。此外,空地信道的强视距(Line-of-Sight,LoS)链路属性与IRS的三维波束形成能力还能够补偿毫米波传输的严重路径损耗,并缓解其敏感的堵塞效应。
然而,尽管UAV和IRS为通信网络带来了诸多优势,由于无线信道的广播特性,通信网络中的安全威胁成为亟待解决的问题。物理层安全技术利用通信媒介的随机性和互易性,通过信号处理、调制和编码的方法实现安全传输的目的,是上层基于密码学加密技术的有力补充。在UAV通信网络中应用物理层安全技术能够在保密传输与能量效率之间寻求最佳折中,这也与IRS的特点即无需额外的能量相统一。加强IRS辅助的UAV毫米波通信网络的物理层安全性能,关键在于UAV的波束形成向量与轨迹、IRS的相移矩阵的联合优化。传统方法一般是将这三个变量进行解耦然后分别优化,同时IRS相移矩阵的优化往往还需要半定松弛(Semidefinite Relaxation,SDR)、极大极小化(Minorization Maximization,MM)等近似,在解的精确性和算法复杂度方面难以满足现代通信网络高保密性和实时性的要求。因此,发明一种能够快速并有效优化通信网络参数以加强物理层安全性能的安全传输方法迫在眉睫。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种基于深度强化学习的无人机智能反射面安全传输方法。
技术方案
一种基于深度强化学习的无人机智能反射面安全传输方法,其特征在于步骤如下:
步骤1:假设UAV作为空中基站向地面的合法通信节点传输毫米波,同时地面还存在一个恶意的窃听者对保密链路进行窃听;其中,UAV装备多天线,地面节点均装备单天线;为了加强通信网络的安全性能,进一步在网络中部署一个智能发射面,通过其相位的灵活调控最大化保密信道与窃听信道之间的性能差异;当无人机执行其任务即为地面合法接收者提供服务时,将在一定时间段T内于固定高度飞行,为了提高通信网络的安全性能,需要对UAV的波束形成向量和轨迹、IRS的相移矩阵进行联合优化;
步骤2:由于连续的时间将使得优化难以进行,首先将飞行时间T进行离散化即T=NΔt,其中N为总时隙数,Δt为单个时隙的长度;这样,通信网络的安全性能增强问题就被归结为合法接收者的平均保密速率最大化问题,优化变量包括每个时隙n时的UAV的波束形成向量、位置以及IRS的相移矩阵;然而即使对时间进行了离散化,该最优化问题仍然是非凸的而难以直接进行求解;
步骤3:该最优化问题难以直接求解,因此提出一种基于DRL的算法对变量进行同时优化;DRL善于求解动态优化问题,能够获得在特定状态下采取某种动作的策略πθ;首先将平均保密速率最大化问题归结为一个马尔可夫决策过程,其中时隙n时的状态sn为合法用户及窃听者的CSI与UAV的位置,动作an为UAV的波束形成向量、位置以及IRS的相移矩阵,回报rn为取得的保密速率Rs[n];这种设置就能够使得代理的目标为最大化飞行时间内的平均保密速率;在此之后,利用DRL中的近端策略优化(Proximal Policy Optimization,PPO)算法对其进行求解,其中的策略网络用于根据当前状态输出要执行的动作,更新梯度为:
Figure BDA0003626420390000031
其中
Figure BDA0003626420390000032
用来衡量新旧策略之间的差异,
Figure BDA0003626420390000033
为优势函数∈为裁剪参数;价值网络则用于评估采用动作的预测价值与实际价值之间的差异,其更新的目标函数为:
Figure BDA0003626420390000034
其中
Figure BDA0003626420390000035
表示状态sn的价值;通过不断试错并对策略网络和价值网络进行训练就能获得最优的策略,并相应给出无人机智能反射面通信网络的安全传输方法。
一种计算机***,其特征在于包括:一个或多个处理器,计算机可读存储介质,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述的方法。
一种计算机可读存储介质,其特征在于存储有计算机可执行指令,所述指令在被执行时用于实现上述的方法。
一种计算机程序,其特征在于包括计算机可执行指令,所述指令在被执行时用于实现上述的方法。
有益效果
本发明提出的一种基于深度强化学习的无人机智能反射面安全传输方法,与传统不引入IRS并进行参数优化的传输方法相比,具有如下优点:
(1)提升了传输的安全性能。
通过引入额外的IRS并对其反射单元的相位进行灵活调控,最大限度地增强合法用户处的接收质量,并同时对无人机的发射波束形成向量与轨迹进行优化设计,最小化保密信号对窃听者的泄露,使得无人机在飞行过程中尽可能地靠近合法用户而远离窃听者,从而提升传输的平均保密速率。仿真实验表明本发明能够有效提升无人机智能反射面通信网络的安全性能。
(2)适合在线部署与迁移应用。
深度强化学***均保密速率最大化问题无需进行子问题的分解和复杂的凸近似,算法的复杂度更低,且在UAV天线数量,IRS反射单元数量及时隙数N等增大时优势更加明显。因此,在对网络参数进行优化时将耗费更少的时间。此外,训练好的策略网络还可以作为相似优化问题的初始模型,具有一定的迁移应用能力。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1是本发明所提出的智能反射面辅助的无人机毫米波通信网络模型图;
图2是在时隙数N=80条件下,本发明所提出的基于深度强化学习的安全传输方法与传统基于序列凸近似优化方法关于每个时隙保密速率的比较图;
图3是在时隙数N=80条件下,本发明所提出的基于深度强化学习的安全传输方法与传统基于序列凸近似优化方法关于无人机轨迹的比较图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
参照图1,UAV作为空中基站为地面的合法接收者(Bob)服务,同时地面还存在一个窃听者(Eve)。为了进一步加强安全传输,引入一个IRS。建立三维笛卡尔坐标系,Bob、Eve和IRS的坐标分别为cb=[xb,yb,0]T,ce=[xe,ye,0]T和cR=[0,yR,zR]T,IRS部署在y-o-z平面上。UAV装备Nt元均匀线阵,IRS的反射单元数目为M=My×Mz。UAV的轨迹序列可表示为cU[n]=[xU[n],yU[n],zU]T,n=0,1,...,N。这样,Bob和Eve在时隙n的接收信号可分别表示为:
Figure BDA0003626420390000051
Figure BDA0003626420390000052
其中时隙n为表达简便而略去,
Figure BDA0003626420390000053
为UAV到Bob(Eve)的信道向量,
Figure BDA0003626420390000054
为IRS到Bob(Eve)的信道向量。
Figure BDA0003626420390000055
为向量化后的IRS信道矩阵,
Figure BDA0003626420390000056
为UAV与IRS之间的信道矩阵,
Figure BDA0003626420390000057
和s分别为UAV处的发射波束形成向量和发射符号,s满足
Figure BDA0003626420390000058
nb和ne分别为Bob和Eve处的加性高斯白噪声,其均值为0,方差分别为
Figure BDA0003626420390000059
Figure BDA00036264203900000510
则Bob和Eve在时隙n的传输速率分别为:
Figure BDA00036264203900000511
Figure BDA00036264203900000512
保密速率则为Rsec[n]=[Rb[n]-Re[n]]+,[·]+表示取和0之间的最大值。接下来,平均保密速率最大化问题可表示为:
Figure BDA00036264203900000513
s.t.tr(f[n]fH[n])≤Pmax,
Figure BDA00036264203900000514
φm[n]∈[0,2π),
Figure BDA00036264203900000515
Figure BDA00036264203900000516
其中
Figure BDA00036264203900000517
Pmax为UAV的最大传输功率,c0为UAV的初始位置,Vmax为UAV的最大速度,δx[n]与δy[n]分别为UAV沿x轴与y轴的位移。然而,该优化问题的目标函数相对于变量是非凸的,IRS相移矩阵的恒模约束也是非凸的,这就为利用传统方法求解带来了困难。因此,我们基于PPO算法提出一种基于DRL的求解方法。
首先,我们将该平均保密速率最大化问题归纳为一个MDP。一般而言,MDP可由一个五元组<S,A,P,R,γ>表示,其中S为状态空间,A为动作空间,P为状态转移概率,R为回报,γ为折扣因子。从状态sn开始总的折扣回报为
Figure BDA0003626420390000061
则代理的目标就是通过优化策略π(a|s)最大化Gn的期望,即
Figure BDA0003626420390000062
对于考虑的平均保密速率最大化问题,代理为UAV与IRS组成的整体,网络的其它节点和传播环境共同组成与之交互的环境。将时隙n视为MDP的第n步,则平均保密速率最大化问题对应的MDP详细叙述如下:
1)状态空间S。由于网络的参数优化的基本依据是Bob和Eve的信道状态信息(Channel State Information,CSI),MDP的状态空间应当将这些信息纳入其中。为了简化S,进一步将UAV到IRS的信道与IRS到各个节点的信道进行级联,即
Figure BDA0003626420390000063
则第n步的状态可以表示为:
sn={hUB[n],hUE[n],HCB[n],HCE[n],cU[n]}
注意到CSI同时具有实部和虚部,为方便输入神经网络需要将实部与虚部分开。故sn的总维度为4Nt(M+1)+3。
2)动作空间A。代理的动作应当包含UAV的速度和波束形成向量f[n]以及IRS的相移矩阵Φ[n]。其中,f[n]的实部和虚部由策略网络输出之后再进行合并,Φ[n]则转化为相位以满足恒模约束,即
Figure BDA0003626420390000064
因此,第n步的动作可以表示为
Figure BDA0003626420390000075
其总的维度为2Nt+M+2。
3)状态转移概率P。MDP的状态转移概率定义为代理与状态sn采取动作an后转移到状态sn+1的概率,可表示为
Figure BDA0003626420390000071
显然,我们在这里不考虑电路与机械故障,因此忽略掉状态转移概率P。
4)回报R。由于我们的目标是最大化平均保密速率,第n步的回报Rn就可以直接等于时隙n的保密速率,即rn=Rsec[n]。
至此,MDP转化完毕。由于Clip版本的PPO算法性能更好且形式上更简单,我们根据Clip版本的PPO算法对原优化问题进行求解,并将提出的基于DRL的优化算法描述如下:
代理在第n步的状态为sn,采取动作an后到达状态sn+1并获得即时回报rn,在此过程中将sn,an,rn,sn+1储存到经验池中。在代理与环境交互了一定次数之后开始轮次为J的训练:先最大化以下目标函数更新策略网络θi
Figure BDA0003626420390000072
再最大化以下目标函数更新价值网络
Figure BDA0003626420390000073
Figure BDA0003626420390000074
到达一定迭代次数I后停止训练。
本发明的具体效果可通过下面仿真进一步说明:
IRS,Bob和Eve的坐标分别为[0,30,10]T,[50,50,0]T和[30,50,0]T,UAV的初始位置为c0=[0,0,20]T且飞行高度固定在20m。UAV装备4元均匀线阵,IRS的反射单元数目为4×4。UAV最大发射功率Pmax为30dBm,最大速度Vmax为10m/s。信道噪声的方差均为-100dBm,离散时间间隔Δt为0.25s。总的时隙数N为80,即总飞行时间为20s。PPO算法中总迭代次数I=500,训练轮数J=10,折扣因子γ=0.9。在仿真环境中进行实验,得到本发明所提方法与传统方法在各个时隙保密速率的值与UAV的具体轨迹,分别如图2与图3所示。
从图2可以看出,本发明所提基于DRL的优化方法仅在飞行开始的一小段时间保密速率略低于传统方法,其它时隙的Rsec相比传统方法具有明显优势。从UAV实际轨迹上看,两种方法都是先尽可能快飞到Bob附近,不同之处是所提方法能够主动地寻找更加有利于安全传输的位置,充分发挥了UAV高机动性的优势。综上所述,本发明所提的基于DRL的优化方法能够有效加强IRS辅助的UAV毫米波通信网络的安全传输。
综上所述,所提出的基于深度强化学习的无人机智能反射面安全传输方法可以具体描述为:为加强无人机通信网络的安全传输,在通信网络中额外引入一个IRS,并在无人机的飞行过程中对无人机的波束形成向量和轨迹以及IRS的相移矩阵进行优化,无人机首先尽快飞行到合法用户附近,然后再主动地寻找对安全有利的位置展开传输;在此过程中,将无人机发射波束的主瓣以及IRS的反射波束主瓣对准合法用户。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明公开的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (4)

1.一种基于深度强化学习的无人机智能反射面安全传输方法,其特征在于步骤如下:
步骤1:假设UAV作为空中基站向地面的合法通信节点传输毫米波,同时地面还存在一个恶意的窃听者对保密链路进行窃听;其中,UAV装备多天线,地面节点均装备单天线;为了加强通信网络的安全性能,进一步在网络中部署一个智能发射面,通过其相位的灵活调控最大化保密信道与窃听信道之间的性能差异;当无人机执行其任务即为地面合法接收者提供服务时,将在一定时间段T内于固定高度飞行,为了提高通信网络的安全性能,需要对UAV的波束形成向量和轨迹、IRS的相移矩阵进行联合优化;
步骤2:由于连续的时间将使得优化难以进行,首先将飞行时间T进行离散化即T=NΔt,其中N为总时隙数,Δt为单个时隙的长度;这样,通信网络的安全性能增强问题就被归结为合法接收者的平均保密速率最大化问题,优化变量包括每个时隙n时的UAV的波束形成向量、位置以及IRS的相移矩阵;然而即使对时间进行了离散化,最优化问题仍然是非凸的而难以直接进行求解;
步骤3:最优化问题难以直接求解,因此提出一种基于DRL的算法对变量进行同时优化;DRL善于求解动态优化问题,能够获得在特定状态下采取某种动作的策略πθ;首先将平均保密速率最大化问题归结为一个马尔可夫决策过程,其中时隙n时的状态sn为合法用户及窃听者的CSI与UAV的位置,动作an为UAV的波束形成向量、位置以及IRS的相移矩阵,回报rn为取得的保密速率Rs[n];这种设置就能够使得代理的目标为最大化飞行时间内的平均保密速率;在此之后,利用DRL中的近端策略优化算法对其进行求解,其中的策略网络用于根据当前状态输出要执行的动作,更新梯度为:
Figure FDA0003626420380000011
其中
Figure FDA0003626420380000012
用来衡量新旧策略之间的差异,
Figure FDA0003626420380000013
为优势函数∈为裁剪参数;价值网络则用于评估采用动作的预测价值与实际价值之间的差异,其更新的目标函数为:
Figure FDA0003626420380000021
其中
Figure FDA0003626420380000022
表示状态sn的价值;通过不断试错并对策略网络和价值网络进行训练就能获得最优的策略,并相应给出无人机智能反射面通信网络的安全传输方法。
2.一种计算机***,其特征在于包括:一个或多个处理器,计算机可读存储介质,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1所述的方法。
3.一种计算机可读存储介质,其特征在于存储有计算机可执行指令,所述指令在被执行时用于实现权利要求1所述的方法。
4.一种计算机程序,其特征在于包括计算机可执行指令,所述指令在被执行时用于实现权利要求1所述的方法。
CN202210477440.0A 2022-05-04 2022-05-04 基于深度强化学习的无人机智能反射面安全传输方法 Pending CN115052285A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210477440.0A CN115052285A (zh) 2022-05-04 2022-05-04 基于深度强化学习的无人机智能反射面安全传输方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210477440.0A CN115052285A (zh) 2022-05-04 2022-05-04 基于深度强化学习的无人机智能反射面安全传输方法

Publications (1)

Publication Number Publication Date
CN115052285A true CN115052285A (zh) 2022-09-13

Family

ID=83157197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210477440.0A Pending CN115052285A (zh) 2022-05-04 2022-05-04 基于深度强化学习的无人机智能反射面安全传输方法

Country Status (1)

Country Link
CN (1) CN115052285A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116614826A (zh) * 2023-05-24 2023-08-18 北京天坦智能科技有限责任公司 一种同时传输和反射表面网络的覆盖和容量优化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116614826A (zh) * 2023-05-24 2023-08-18 北京天坦智能科技有限责任公司 一种同时传输和反射表面网络的覆盖和容量优化方法
CN116614826B (zh) * 2023-05-24 2024-01-16 北京天坦智能科技有限责任公司 一种同时传输和反射表面网络的覆盖和容量优化方法

Similar Documents

Publication Publication Date Title
Guo et al. Learning-based robust and secure transmission for reconfigurable intelligent surface aided millimeter wave UAV communications
Sun et al. Intelligent reflecting surface and UAV assisted secrecy communication in millimeter-wave networks
Gao et al. Joint trajectory and power design for UAV-enabled secure communications with no-fly zone constraints
Zhang et al. Multi-agent deep reinforcement learning for secure UAV communications
Zhang et al. IRS empowered UAV wireless communication with resource allocation, reflecting design and trajectory optimization
Guo et al. Deep reinforcement learning and NOMA-based multi-objective RIS-assisted IS-UAV-TNs: Trajectory optimization and beamforming design
Li et al. Sum rate maximization via reconfigurable intelligent surface in UAV communication: Phase shift and trajectory optimization
Ji et al. Trajectory and transmit power optimization for IRS-assisted UAV communication under malicious jamming
Catak et al. Adversarial machine learning security problems for 6G: mmWave beam prediction use-case
CN115412159B (zh) 基于空中智能反射面辅助的安全通信方法
Hashemi et al. Deep reinforcement learning for practical phase-shift optimization in RIS-aided MISO URLLC systems
Koc et al. Swarm intelligence based power allocation in hybrid millimeter-wave massive MIMO systems
Tham et al. Deep reinforcement learning for secrecy energy-efficient uav communication with reconfigurable intelligent surface
Dong et al. Securing transmission for UAV swarm-enabled communication network
CN115052285A (zh) 基于深度强化学习的无人机智能反射面安全传输方法
Liu et al. Deep learning empowered trajectory and passive beamforming design in UAV-RIS enabled secure cognitive non-terrestrial networks
Huang et al. Task offloading in uav swarm-based edge computing: Grouping and role division
Dong et al. Deep reinforcement learning based uav for securing mmwave communications
Tang et al. Secure communication with UAV-enabled aerial RIS: Learning trajectory with reflection optimization
Dong et al. Secure Transmission Design of RIS Enabled UAV Communication Networks Exploiting Deep Reinforcement Learning
Liu et al. Joint information-theoretic secrecy and covertness for UAV-assisted wireless transmission with finite blocklength
Liu et al. UAV-aided secure communication with imperfect eavesdropper location: Robust design for jamming power and trajectory
Wu et al. Intelligent resource allocations for IRS-assisted OFDM communications: A hybrid MDQN-DDPG approach
Pang et al. Joint trajectory and beamforming optimization for secure UAV transmission aided by IRS
CN116669073A (zh) 基于智能反射面辅助无人机认知网络的资源分配和轨迹优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination