CN115378487A

CN115378487A - 基于电磁屏障的卫星通信动态频谱接入方法

Info

Publication number: CN115378487A
Application number: CN202210784510.7A
Authority: CN
Inventors: 储飞黄; 颜培杰; 贾录良; 方胜良; 王梦阳; 范有臣; 马淑丽; 董尧尧
Original assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Current assignee: Peoples Liberation Army Strategic Support Force Aerospace Engineering University
Priority date: 2022-07-05
Filing date: 2022-07-05
Publication date: 2022-11-22
Anticipated expiration: 2042-07-05
Also published as: CN115378487B

Abstract

本发明提供了基于电磁屏障的卫星通信动态频谱接入方法，包括以下步骤：步骤1：建立低轨道卫星对抗场景，在该对抗场景中包括蓝队和红队，分别用BT和RT表示，分析对抗场景中BT和RT受扰情况，并从吞吐量角度分析BT和RT的优化目标；步骤2：基于步骤1的分析，运用博弈论方法将优化目标转化为效用函数，并将BT和RT的通信对抗过程建模为Stackelberg博弈框架，证明在Stackelberg博弈框架内的两个子博弈都是精确的势博弈，并且存在Stackelberg均衡解；步骤3：利用分布式分层对抗信道选择算法求解Stackelberg均衡解，在求解过程中BT和RT找到各自的最大效用，实现信道通信选择。

Description

基于电磁屏障的卫星通信动态频谱接入方法

技术领域

本发明属于信道选择技术领域，具体涉及基于电磁屏障的卫星通信动态频谱接入方法。

背景技术

卫星互联网从20世纪80年代开始发展，至今已有40多年的历史。近年来，随着以Starlink为代表的巨型星座的迅速崛起，卫星互联网迎来了新一轮的发展热潮。然而，由于卫星互联网的天然开放性，它很容易受到攻击。因此，针对空间作战的战场需求，开展卫星互联网对抗的研究迫在眉睫。

在通信干扰方面，文献[Adversarial Jamming Attacks on Deep ReinforcementLearning Based Dynamic Multichannel Access]提出了两种基于AC的攻击策略。一种是基于前馈神经网络(FNN)的，另一种是基于深度强化学习(DRL)策略的，这会降低DRL用户进行动态多信道接入的精确度。在文献[Reinforcement Learning Based BeamformingJammer for Unknown Wireless Networks]中，作者提出了一种基于MAB的干扰策略，该策略可以在不知道敌方网络拓扑和信道信息的情况下找到最佳干扰波束宽度和方向。在通信抗干扰方面，文献[A Game-Theoretic Learning Approach for Anti-Jamming DynamicSpectrum Access in Dense Wireless Networks]中的工作研究了基于干扰抑制(IM)的密集无线网络的抗干扰信道选择问题。为了优化无人机的信道选择，提出了一种基于局部利他的协同抗干扰方法。以上研究旨在解决地面通信对抗问题。然而，基于卫星互联网的通信对抗受到的关注较少。在地面通信对抗技术的基础上研究卫星互联网的通信对抗是一个很好的思路。

博弈论能够很好地描述冲突、对抗或竞争关系，被广泛应用于通信对抗问题的建模。其中，Stackelberg博弈常被用来描述非合作博弈的分层问题。文献[A HierarchicalLearning Solution for Anti-jamming Stackelberg Game with Discrete PowerStrategies]研究了离散功率策略的抗干扰问题。然后建立Stackelberg博弈模型来模拟用户和***之间的竞争交互。作者在文献[Anti-Jamming Routing For Internet ofSatellites:a Reinforcement Learning Approach]中考虑了诸如未知中断、意外拥塞和智能干扰等因素。针对能够根据干扰效果自动改变干扰策略的智能干扰问题。路由抗干扰问题被描述为一个分层Stackelberg博弈。此外，布洛托上校游戏、图形化游戏等游戏模型也广泛应用于通信对抗中。

在基于频谱接入的研究中，协调能力、防御能力和攻击能力是双方在通信对抗中关注的三个关键能力。准确地说，(1)协调通信设备，减少我队内不同用户之间的干扰；同时，防止敌方通信用户的干扰，即最大限度地减少队内互扰和队外互扰。(2)保护对方通信设备的使用效率不受敌方恶意干扰，即提高抗干扰水平。(3)对敌实施恶意干扰，削弱敌通信设备效能，即提高干扰能力。

目前，大多数文献将独立研究的三种能力分开。然而，单一的对抗模式不足以满足复杂战场形势的需要。因此，要建立完善的攻防通信对抗体系，必须将这三种能力有机结合起来。

本发明以低轨卫星互联网为背景，研究通信对抗中的信道选择问题。

发明内容

针对上述问题，本发明提供了基于电磁屏障的卫星通信动态频谱接入方法。

本发明采用的技术方案为：

基于电磁屏障的卫星通信动态频谱接入方法，其特征在于，包括以下步骤：

步骤1：建立低轨道卫星对抗场景，在该对抗场景中包括蓝队和红队，分别用BT和RT表示，分析对抗场景中BT和RT受扰情况，并从吞吐量角度分析BT和RT的优化目标；

步骤2：基于步骤1的分析，运用博弈论方法将优化目标转化为效用函数，并将BT和RT的通信对抗过程建模为Stackelberg博弈框架，在Stackelberg博弈框架内的两个子博弈都是精确的势博弈，并且存在Stackelberg均衡解；

步骤3：利用分布式分层对抗信道选择算法求解Stackelberg均衡解，在求解过程中BT和RT找到各自的最大效用，实现信道通信选择。

优选的，步骤1的具体过程如下：

(1)在低轨道卫星对抗场景中，BT成员表示为N_b＝{1，2，…N，N+1}，其中，第N+1个索引表示干扰卫星，BT的卫星用户每一时隙只能选择一个信道进行通信，他们选择的信道集表示为A_b，即

其中

表示BT干扰卫星选择的信道集合，电磁屏障干扰卫星每一时隙可以选择多个信道，干扰信道集表示为

RT成员表示为M_r，其中，M_r＝{1，2，…M}，RT卫星用户每个时隙只能选择一个信道，他们选择的信道集合表示为A_r，即A_r＝{a₁，a₂，…，a_m}；BT和RT的可用信道分别为C_b和C_r，假设C_b＝C_r＝C，则BT和RT会采取有利的信道选择策略来减少干扰；

(2)分析BT和RT的受扰情况，其中，BT受到BT其他成员的队内互扰和RT的队外互扰；RT受到RT其他成员的队内互扰、BT的队外互扰和BT的电磁屏障的恶意干扰，这三种干扰均为同信道干扰；

考虑低轨卫星的通信场景，节点和节点之间的信道增益考虑自由空间路径损耗，具体来说

其中，d_x，y表示是x到y节点的距离，f表示频率，c表示光速，α表示路径损耗系数，

表示衰落系数；

(3)从吞吐量的角度出发分析单个成员的优化目标

BT的优化目标

BT中某用户n的吞吐量表示为

T(n)＝B·log₂(1+SINR(n)) (2)

其中，B表示带宽，SINR(n)表示用户n的信干噪比，具体可以表示为：

σ是高斯噪声，D(n)是用户n受到的加权聚合和干扰，其表达为

其中，{N_b|n}表示从N_b中移除n，P_s表示中BT中用户s的传输功率，P_m是RT中某用户m的发射功率，f(a_x，a_y)表示节点x和y是否在相同的时隙中选择相同的信道，表示为

则BT中用户受到的期望加权聚合干扰表示为U_n，

其中，P_n表示权重；

通过最小化期望加权聚合干扰来实现有效的频谱接入，则BT的优化目标可以表示为

RT的优化目标

与BT类似，RT中用户m的吞吐量表示为

T(m)＝B·log₂(1+SINR(m)) (7)

其中，SINR(m)具体可以表示为

由于RT中每个用户会受到三方面的干扰威胁，则用户m受到的加权聚合和干扰为

其中，P_v表示卫星v的发射功率，P_N+1表示BT电磁屏障干扰机的干扰功率；

则RT中用户受到的期望加权聚合干扰表示为，其表示为U_m

其中，P_m表示权重；

RT的优化目标表示为

优选的，将BT和RT之间的博弈描述为

G＝{N_b，M_r，A_b，A_r，u_n，u_m} (11)

其中，A_b和A_r分别表示BT和RT选择的信道集；N_b和M_r分别为BT和RT的卫星通信对和干扰卫星的索引集；u_n和u_m分别表示BT和RT的效用函数；

BT的效用函数描述

以队内互扰和队外互扰的负值和电磁屏障干扰的正值作为目标函数，BT的效用函数表示为

RT的效用函数描述

RT的每个卫星用户都会受到来自BT的电磁屏障干扰卫星的队内互扰、队外互扰和恶意干扰三个方面的干扰，RT的效用函数表示为

其中，L_m和L_n是正数；

则BT侧的优化问题表示为

类似的，RT成员端的优化问题是

BT和RT的决定是相互影响的，由于BT强大的电磁屏障干扰，所以假设BT首先采取行动，RT跟随BT，从而推动了一个回合对抗过程，时间充裕，则本回合双方可以达到一个Stackelberg均衡，下面分别对BT和RT的子博弈模型进行描述：

(1)在红蓝双方的Stackelberg博弈中，BT作为领导者，其子博弈可以表达为

G_b＝{N_b，A_b，u_n(a_n，α_-n)} (16)

其中，α_-n＝[a₁，a₂，…a_n-1，a_n+1，…a_N]表示除了卫星用户n其他BT成员选择的信道集合，证明领导者子博弈是一个精确的势博弈，至少有一个纯策略纳什均衡点；

(2)RT作为跟随者，其子博弈可以表示为

G_r＝{M_r，A_r，u_m(a_m，α_-m)} (17)

其中，α_-m＝[a₁，a₂，…a_m-1，a_m+1，…a_M，a_M+1]表示出了卫星用户m其他RT成员选择的信道集合，证明跟随者子博弈是一个精确的势博弈，至少有一个纯策略纳什均衡点；

(3)若

和

分别为G_b和G_r的纳什均衡解，根据Stackelberg均衡定义，则定义了一个分层Stackelberg均衡解

在该解下，如果一个参与者单方面偏离，则

公式(18)和(19)表明，在Stackelberg均衡解下，没有一个参与者愿意单方面改变其频谱接入策略，则

构成稳定解，构成Stackelberg均衡。

优选的，在步骤3中，提出了分布式分层对抗信道选择算法来求解Stackelberg均衡解，在BT和RT之间的沟通对抗中，领导者和追随者使用分布式分层对抗信道选择算法来最大化各自的效用；

作为领导者，BT首先对RT发动电磁屏障干扰攻击，在第k个时隙中，电磁屏障干扰机阻塞了J_b通道，其中J_b≤C，RT用户只能在剩余的(C-J_b)信道中根据上述算法选择合适的信道通信，由于电磁屏障，信道集J_b对BT成员是安全的，其他信道(C-J_b)存在受RT的干扰影响，则BT成员将选择信道集合J_b，其次，BT将基于上述算法选择(C-J_b)与RT成员竞争信道资源；

具体过程如下所示：

初始化：设置可用信道C；最小迭代次数T；电磁屏障干扰信道数J_b；

For J_b＝1：C

m位RT成员随机初始化他们的信道选择：A_r＝{a₁，a₂，…，a_m}；

For k＝1：T

Step1：n位BT成员更新他们的信道选择概率θ_n(0)＝1/|C_b|，

Step2:第k时隙,每位BT成员根据策略θ_n(k)选择信道a_n(k)；

Step3:每个时隙k,每位BT成员学习过程如下:

(1)BT成员根据公式(12)计算其效用函数u_n(k)；

(2)蓝队成员根据更新公式(20)，更新其策略选择；

θ_n(k+1)＝θ_n(k)+b_n·u′_n(k)(1-θ_n(k)) (20)

上式中b_n是学习步长且0＜bn_＜1.

End

For k＝1:T

Step1：m位红队成员更新他们的信道选择概率θ_m(0)＝1/|C_r|，

Step2：第k时隙,每位RT用户根据策略θ_m(k)选择信道a_m(k)；

Step3:每个时隙k,每位红队用户学习过程如下：

(1)RT用户根据公式(13)计算其效用函数u_m(k)；

(2)BT成员根据更新公式(21)，更新其策略选择；

θ_m(k+1)＝θ_m(k)+b_m·u′_m(k)(1-θ_m(k)) (21)

上式中b_m是学习步长且0＜b_m＜1.

End

本发明的有益效果：

本发明提出了一种电磁屏障攻击策略，在保护我通信质量的同时，大大削弱了敌方的通信能力，在此基础上上，并采用设计的分布式分层对抗信道选择算法进行信道选择，两个团队都可以收敛到更好的效用，因为电磁屏障干扰卫星帮助BT抢占J_b通道，保证我队的通信质量，对RT造成干扰，削弱了RT的通信能力，则BT比RT收敛更快。并利用吞吐量验证效用函数设置的准确性，证明本发明设计思路的合理性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为低轨道卫星对抗场景示意图。

图2为BT和RT受扰情况分析图。

图3为卫星互联网场景。

图4为BT信道选择概率。

图5为RT信道选择概率。

图6为BT和RT的网络效用。

图7为J_b对BT网络总效用的影响。

图8为J_b对RT网络总效用的影响。

图9为J_b对BT总吞吐量的影响。

图10为_Jb对RT总吞吐量的影响。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本发明提供了基于电磁屏障的卫星通信动态频谱接入方法，包括以下步骤：

步骤2：基于步骤1的分析，运用博弈论方法将优化目标转化为效用函数，并将BT和RT的通信对抗过程建模为Stackelberg博弈框架，证明在Stackelberg博弈框架内的两个子博弈都是精确的势博弈，并且存在Stackelberg均衡解；

步骤1的具体过程如下：

(1)我们建立了一个相对的低轨道卫星对抗场景，将自己和敌人分成两队，即蓝队(我方，用BT表示)和红队(敌方，用RT表示)，如图1所示。

在低轨道卫星对抗场景中，BT成员表示为N_b＝{1，2，…N，N+1}，其中，第N+1个索引表示干扰卫星，BT的卫星用户每一时隙只能选择一个信道进行通信，他们选择的信道集表示为A_b，即

其中

RT成员表示为M_r，其中，M_r＝{1，2，…M}，RT卫星用户每个时隙只能选择一个信道，他们选择的信道集合表示为A_r，即A_r＝{a₁，a₂，…，a_m}；BT和RT的可用信道分别为C_b和C_r，假设C_b＝C_r＝C，则BT和RT会采取有利的信道选择策略来减少干扰。

(2)分析BT和RT的受扰情况，其中，BT受到BT其他成员的队内互扰和RT的队外互扰；RT受到RT其他成员的队内互扰、BT的队外互扰和BT的电磁屏障的恶意干扰，这三种干扰均为通信道干扰。

“电磁屏障”干扰卫星有两个作用，第一，对RT发动恶意干扰攻击，从而，降低RT的通信质量。具体来说，如果在同一时刻，RT的卫星用户与BT的“电磁屏障”干扰卫星选择相同的信道，那么，这个RT的卫星用户的通信质量将会受到极大影响。第二，BT的“电磁屏障”干扰卫星作为一个屏障，保护BT用户的通信能力。具体来说，BT的“电磁屏障”干扰卫星不会对其他BT成员产生影响，并且，BT成员可以利用“电磁屏障”抢占的信道进行通信；此外，BT的每个卫星用户都将受到来自队内互扰和队外互扰两方面的干扰威胁。首先，卫星用户需要争夺频谱资源才能获得良好的通信质量。然而，如果BT中的两个卫星用户在某个时刻选择相同的信道，则会出现队内互扰，即同频干扰，这将影响他们的通信质量。其次，如果RT用户和BT用户在某个时隙选择相同的信道进行通信，RT用户也会对BT用户造成队外互扰。因此，BT用户应制定合理的频谱接入策略，以减少这两类干扰对通信质量的影响，并利用“电磁屏障”来提高通信水平。

考虑低轨卫星的通信场景，则节点和节点之间的信道增益考虑自由空间路径损耗，具体来说

表示衰落系数。

(3)从吞吐量的角度出发分析单个成员的优化目标

BT的优化目标

BT中某用户n的吞吐量表示为

T(n)＝B·log₂(1+SINR(n)) (2)

σ是高斯噪声，D(n)是用户n受到的加权聚合和干扰，其表达为：

则BT中用户受到的期望加权聚合干扰表示为U_n，其表示为

其中，P_n表示权重；

RT的优化目标

与BT类似，RT中用户m的吞吐量表示为

T(m)＝B·log₂(1+SINR(m)) (7)

其中，SINR(m)具体可以表示为

则RT中用户受到的期望加权聚合干扰表示为，其表示为U_m

其中，P_m表示权重；

RT的优化目标表示为

在步骤2中，为了描述对抗模式，将其对抗描述为：

G＝{N_b，M_r，A_b，A_r，u_n，u_m} (11)

其中，，N_b和M_r分别为BT和RT的卫星通信对和干扰卫星的索引集；u_n和u_m分别表示BT和RT的效用函数。

BT的效用函数描述

以队内互扰和队外互扰的负值和“电磁屏障”干扰的正值作为目标函数，BT的效用函数表示为

RT的效用函数描述

其中，L_m和L_n是正数；

则BT侧的优化问题表示为

类似的，RT成员端的优化问题是

BT和RT的决定是相互影响的，具体地说，由于BT强大的“电磁屏障”干扰，可以合理地假设BT首先采取行动，RT跟随BT，从而推动了一个等级对抗过程。如果允许足够的运行时间，在对抗回合中可以达到Stackelberg均衡。其次，下面详细地给出了分层博弈模型的公式，并分析了Stackelberg均衡的存在性。

(1)BT动态频谱接入子博弈中BT作为领导者，其子博弈可以表达为

G_b＝{N_b，A_b，u_n(α_n，α_-n)} (16)

其中，α_-n＝[a₁，a₂，…a_n-1,a_n+1，…a_N]表示除了卫星用户n其他BT成员选择的信道集合。

命题1：领导者子博弈是一个精确的势博弈，至少有一个纯策略纳什均衡(NE)点。

证明：在BT效用函数的基础上，势函数可以设计为

Φ_b＝Φ_b，1+Φ_b，2 (22)

其中，

对(23)进行分解如式(25)

此外，我们提出与n无关的项W_b，

因为，

结合(25)、(26)、(27)可得

最后，通过化简，BT的势函数为

Φ_b＝Φ_b，1+Φ_b，2＝u_n+W_b (29)

根据精确势博弈的定义，如果蓝队中的一个任意玩家，例如玩家n，单方面将其信道选择从a_n改变为a_n′，则势函数的变化等于玩家n的效用的变化，如(30)所示。

Φ_b(n′)-Φ_b(n)

＝(Φ_b，1(n′)+Φ_b，2(n′))-(Φ_b，1(n)+Φ_b，2(n))

＝(u_n(n′)+W_b)-(u_n(n)+W_b)

＝u_n(n′)-u_n(n). (30)

由于方程(30)符合精确势博弈的定义，所以领导者子博弈是精确势博弈。注意，每个精确势对策至少有一个纯策略NE点，证明了命题1。

(2)RT动态频谱接入子博弈中，RT作为跟随者，其子博弈可以表示为

G_r＝{M_r，A_r，u_m(a_m，α_-m)} (17)

其中，α_-m＝[a₁，a₂，…a_m-1，a_m+1，…a_M，a_M+1]表示出了卫星用户m其他RT成员选择的信道集合。

命题2：跟随者子博弈是一个精确的势博弈，至少有一个纯策略纳什均衡(NE)点。

证明：在RT效用函数的基础上，势函数可以设计为

此外，我们提出与m无关的项W_r，

因为

结合(31),(32)和(33),我们可以得到式(34)

根据精确势博弈的定义。如果红队中的一个任意玩家，例如玩家m，单方面将其信道选择从a_m改变为a_m′，则势函数的变化等于玩家m的效用的变化，如(35)所示：

Φ_r(m′)-Φ_r(m)

＝(u_m(m′)+W_r)-(u_m(m)+W_r)

＝u_m(m′)-u_m(m). (35)

由于方程(28)符合精确势博弈的定义，所以领导者子博弈是精确势博弈。注意，每个精确势对策至少有一个纯策略NE点，证明了命题2。

(3)Stackelberg均衡分析

假设

和

在该解下，如果一个参与者单方面偏离，则

构成稳定解，对于Stackelberg均衡，我们给出以下推论：

命题3：存在领导者的NE解和追随者的NE解，构成Stackelberg均衡。

证明：根据命题2，(35)中给出的跟随子博弈是一个精确的势博弈，并且存在一个平衡解，记为

在这个基础上，我们考虑BT的策略，以下几点是成立的：

上式也适用于

的情况，那就是式(19)。

在类似的分析之后，也可以证明式(18)。

因此，命题3得到证明。

在步骤3中，提出了分布式分层对抗信道选择算法(DHCCSA)来求解Stackelberg均衡解，在BT和RT之间的沟通对抗中，为了突出对抗策略，领导者和追随者使用分布式分层对抗信道选择算法来最大化各自的效用；

作为领导者，BT首先对RT发动电磁屏障干扰攻击，在第k个时隙中，电磁屏障干扰机阻塞了J_b通道，其中J_b≤C，RT用户只能在剩余的(C-J_b)信道中根据上述算法选择合适的信道通信，以避免恶意干扰，此时，由于电磁屏障，信道集J_b对BT成员是安全的，其他信道(C-J_b)可能会受到RT的干扰，则BT成员将优先选择信道集合J_b，其次，BT将基于上述算法选择(C-J_b)与RT成员竞争信道资源；

具体过程如下所示：

初始化：设置可用信道C；最小迭代次数T；“电磁屏障”干扰信道数J_b；

For J_b＝1：C

For k＝1：T

Step1：n位BT成员更新他们的信道选择概率θ_n(0)＝1/|C_b|，

Step2:第k时隙,每位BT成员根据策略θ_n(k)选择信道a_n(k)；

Step3:每个时隙k,每位BT成员学习过程如下:

(1)BT成员根据公式(12)计算其效用函数u_n(k)；

(2)蓝队成员根据更新公式(20)，更新其策略选择；

θ_n(k+1)＝θ_n(k)+b_n·u′_n(k)(1-θ_n(k)) (20)

上式中b_n是学习步长且0＜b_n＜1.

End

For k＝1:T

Step1：m位红队成员更新他们的信道选择概率θ_m(0)＝1/|C_r|，

Step2：第k时隙,每位RT用户根据策略θ_m(k)选择信道a_m(k)；

Step3:每个时隙k,每位红队用户学习过程如下：

(1)RT用户根据公式(13)计算其效用函数u_m(k)；

(2)BT成员根据更新公式(21)，更新其策略选择；

θ_m(k+1)＝θ_m(k)+b_m·u′_m(k)(1-θ_m(k)) (21)

上式中b_m是学习步长且0＜b_m＜1.

End

仿真结果和讨论

通过仿真BT和RT的信道选择概率，验证了算法的收敛性。此外，我们还研究了BT的“电磁屏障”对两个团队的效用函数和网络吞吐量造成的信道数Jb的干扰。数值结果表明，该算法具有较好的收敛性，且BT比RT收敛速度快。

考虑到低轨道卫星场景，卫星之间的距离比较长，所以我们把通信距离设为几十公里，卫星通信对抗场景如图3所示。另外，BT和RT分别建立四对通信用户(即S_i-D_i)。在一定的时隙内，蓝队的“电磁屏障”干扰卫星可以实现多通道干扰。我们在频域中设置了可用信道的数量，并以8个信道为例进行了分析。BT和RT都根据DHCCSA算法选择合适的信道，以最大化各自的效用。

收敛和性能分析

首先，我们确定了被BT的“电磁屏障”干扰的通道数，并假设“电磁屏障”***将干扰4个通道(即J_b＝4)。我们分别研究了BT和RT单个用户的信道选择概率的收敛，仿真结果如图4和图5所示。通过比较图4和图5，我们发现BT和RT用户最终都实现了收敛，但是BT用户比RT用户收敛得更快。这一现象表明，所提出的算法能够学习收敛，并且BT比RT收敛得更快。原因是BT用户受到“电磁屏障”的保护，“电磁屏障”相当于比RT用户更多的可用信道，因此可以更快收敛。RT用户受到“电磁屏障”的干扰，因此，收敛速度较慢。

此外，我们还对BT和RT的总网络效用进行了比较分析，如图6所示。BT和RT都有很好的性能，BT的收敛时间比RT快。当J_b＝4时，四对智能BT成员将首先选择信道J_b进行通信，然后与其他四对红色团队成员竞争频谱资源(C-J_b)。此时，频谱资源满足了红蓝两队的需求。因此，基于DHCCSA的两个团队都可以收敛到更好的效用。因为“电磁屏障”干扰卫星帮助BT抢占J_b信道，保证了我们的通信质量；对RT造成干扰，削弱了RT的通信能力。因此，BT比RT收敛得更快。

总效用函数分析

与前面不同的是，本节中，将“电磁屏障”***的干扰通道数设置为不断变化，让J_b∈[0，8]，从图7可以看出，随着J_b的增加，BT网络的总效用基本上保持在最优NE和最差NE之间。

此外，该算法的总效用远高于随机算法。然而，如图8所示，随着J_b的增加，RT的总效用呈现下降趋势，当J_b＞5时，由于频谱资源不足，RT的总效用迅速下降。当J_b＝8时，即全频带干扰时，RT的总利用率下降到0。此外，随机算法整体上也呈现下降趋势。

然而，该算法的总效用仍然远远高于随机算法，这也表明DHCCSA算法具有很好的优势。

网络总吞吐量分析

如图(9)所示，BT的总网络吞吐量不受J_b的影响，所提出的算法非常接近最佳NE。BT成员受到其他BT成员队内互扰和RT队外互扰的影响。此外，对于DHCCSA，即使是最差NE也具有比随机算法更高的网络总吞吐量，体现了该算法的优越性。

如图(10)所示，RT的总吞吐量总体上呈下降趋势。除了协调内部和外部的干扰，RT的成员还必须应对来自BT的强大的“电磁屏障”干扰。随着J_b的增加，RT的总网络吞吐量不断下降。当J_b＝8时，红队受到全频段的恶意干扰，红队的总网络吞吐量降为0。

前面分别从效用函数和吞吐量的角度分析了J_b对BT和RT的影响。他们的仿真结果有相似的趋势，也就是说，在低信干噪比的情况下，聚合干扰的最大化确实产生了求和速率最大化的近似最优解。侧面说明了仿真的合理性。

以上所述，仅用以说明本发明的技术方案而非限制，本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换，只要不脱离本发明技术方案的精神和范围，均应涵盖在本发明的权利要求范围当中。

Claims

1.基于电磁屏障的卫星通信动态频谱接入方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于电磁屏障的卫星通信动态频谱接入方法，其特征在于，步骤1的具体过程如下：

其中

表示衰落系数；

(3)从吞吐量的角度出发分析单个成员的优化目标

BT的优化目标

BT中某用户n的吞吐量表示为

T(n)＝B·log₂(1+SINR(n)) (2)

σ是高斯噪声，D(n)是用户n受到的加权聚合和干扰，其表达为

则BT中用户受到的期望加权聚合干扰表示为U_n，

其中，P_n表示权重；

P1：

RT的优化目标

与BT类似，RT中用户m的吞吐量表示为

T(m)＝B·log₂(1+SINR(m)) (7)

其中，SINR(m)具体可以表示为

则RT中用户受到的期望加权聚合干扰表示为，其表示为U_m

其中，P_m表示权重；

RT的优化目标表示为

P2：

3.根据权利要求2所述的基于电磁屏障的卫星通信动态频谱接入方法，其特征在于，将BT和RT之间的博弈描述为

G＝{N_b，M_r，A_b，A_r，u_n，u_m} (11)

BT的效用函数描述

RT的效用函数描述

其中，L_m和L_n是正数；

则BT侧的优化问题表示为

类似的，RT成员端的优化问题是

BT和RT的决定是相互影响的，由于BT强大的电磁屏障干扰，所以假设BT 首先采取行动，RT跟随BT，从而推动了一个回合对抗过程，时间充裕，则本回合双方可以达到一个Stackelberg均衡，下面分别对BT和RT的子博弈模型进行描述：

G_b＝{N_b，A_b，u_n(a_n，α_-n)} (16)

(2)RT作为跟随者，其子博弈可以表示为

G_r＝{M_r，A_r，u_m(a_m，α_-m)} (17)

(3)若

和

在该解下，如果一个参与者单方面偏离，则

构成稳定解，构成Stackelberg均衡。

4.根据权利要求3所述的基于电磁屏障的卫星通信动态频谱接入方法，其特征在于，在步骤3中，提出了分布式分层对抗信道选择算法来求解Stackelberg 均衡解，在BT和RT之间的分层对抗中，领导者和追随者使用分布式分层对抗信道选择算法来最大化各自的效用；

具体过程如下所示：

For J_b＝1：C

For k＝1：T

Step1：n位BT成员更新他们的信道选择概率

Step2:第k时隙,每位BT成员根据策略θ_n(k)选择信道a_n(k)；

Step3:每个时隙k,每位BT成员学习过程如下:

(1)BT成员根据公式(12)计算其效用函数u_n(k)；

(2)蓝队成员根据更新公式(20)，更新其策略选择；

θ_n(k+1)＝θ_n(k)+b_n·u′_n(k)(1-θ_n(k)) (20)

上式中b_n是学习步长且0＜b_n＜1.

End

For k＝1:T

Step1：m位红队成员更新他们的信道选择概率

Step2：第k时隙,每位RT用户根据策略θ_m(k)选择信道a_m(k)；

Step3:每个时隙k,每位红队用户学习过程如下：

(1)RT用户根据公式(13)计算其效用函数u_m(k)；

(2)BT成员根据更新公式(21)，更新其策略选择；

θ_m(k+1)＝θ_m(k)+b_m·u′_m(k)(1-θ_m(k)) (21)

上式中b_m是学习步长且0＜b_m＜1.

End

End。