CN108616916B - 一种基于合作抗干扰分层博弈模型的抗干扰学习方法 - Google Patents

一种基于合作抗干扰分层博弈模型的抗干扰学习方法 Download PDF

Info

Publication number
CN108616916B
CN108616916B CN201810396863.3A CN201810396863A CN108616916B CN 108616916 B CN108616916 B CN 108616916B CN 201810396863 A CN201810396863 A CN 201810396863A CN 108616916 B CN108616916 B CN 108616916B
Authority
CN
China
Prior art keywords
interference
user
strategy
users
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810396863.3A
Other languages
English (en)
Other versions
CN108616916A (zh
Inventor
王金龙
陈瑾
张玉立
任国春
徐煜华
孔利君
李文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN201810396863.3A priority Critical patent/CN108616916B/zh
Publication of CN108616916A publication Critical patent/CN108616916A/zh
Application granted granted Critical
Publication of CN108616916B publication Critical patent/CN108616916B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • H04B17/3911Fading models or fading generators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • H04B17/3912Simulation models, e.g. distribution of spectral power density or received signal strength indicator [RSSI] for a given geographic region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC
    • H04W52/18TPC being performed according to specific parameters
    • H04W52/24TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters
    • H04W52/243TPC being performed according to specific parameters using SIR [Signal to Interference Ratio] or other wireless path parameters taking into account interferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W72/00Local resource management
    • H04W72/50Allocation or scheduling criteria for wireless resources
    • H04W72/54Allocation or scheduling criteria for wireless resources based on quality criteria
    • H04W72/541Allocation or scheduling criteria for wireless resources based on quality criteria using the level of interference

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Electromagnetism (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种合作抗干扰分层博弈模型及抗干扰学习算法。该模型为:将用户建模为领导者,干扰建模为跟随者,干扰始终以最大化降低***的吞吐量为优化目标,用户利用抗干扰学习算法,不断调整抗干扰策略,最大化***整体吞吐量。算法为:首先构建Stackelberg博弈模型,参与者是所有用户和干扰;所有用户随机生成初始的抗干扰策略,干扰根据用户的抗干扰策略进行干扰策略选择;然后用户随机选择一个抗干扰策略,计算相应的效用函数并比较,干扰随用户动作改变而更新干扰策略;循环迭代,直至所有用户抗干扰策略实现收敛或者达到设定的迭代次数;最后计算全网吞吐量和干扰效用函数。本发明利用用户间的合作关系,提升了***抗干扰能力。

Description

一种基于合作抗干扰分层博弈模型的抗干扰学习方法
技术领域
本发明属于无线通信技术领域,特别是一种基于合作抗干扰分层博弈模型的抗干扰学习方法。
背景技术
随者无线技术的发展,用户通信需求呈现出指数型的爆发趋势,这使得如何减少恶意干扰对用户通信质量影响的研究越来越重要。针对这个问题,有人提出了一种通过跳频方式避免干扰的抗干扰策略(Liang Xiao,Tianhua Chen,Jinliang Liu,Huaiyu Dai,``Anti-Jamming Transmission Stackelberg Game With Observation Errors”,IEEECommunications Letters,vol.19,no.6,pp.949-952,2015.);有人提出了通过调整发射功率从而增大信噪比的抗干扰策略(Luliang Jia,Fuqiang Yao,Youming Sun,YingtaoNiu,Yonggang Zhu,``Bayesian Stackelberg Game for Antijamming Transmission WithIncomplete Information”,IEEE Communications Letters,vol.20,no.10,pp.1991-1994,2016.)。然而,大部分研究都只是假设了一种简单的干扰样式,并没有考虑智能干扰对抗干扰策略的影响,而且研究集中于单用户单干扰的场景,对更为常见的多用户场景较少涉及。
Stackelberg博弈主要刻画的是分层决策的相互影响关系;抗干扰博弈模型(Luliang Jia,Fuqiang Yao,Youming Sun,Yuhua Xu,Shuo Feng,AlaganAnpalagan,``AHierarchical Learning Solution for Anti-jamming Stackelberg Game withDiscrete Power Strategies”IEEE Wireless Communications Letters,vol.6,no.6,pp.818-821,2017.)中,构建了一个单领导者单跟随者的Stackelberg博弈模型,将干扰定位为领导者,用户通信对定位为跟随者,研究了一种带有观测误差的抗干扰模型,通过构建贝叶斯-Stackelberg博弈进行了求解,但是它仅考虑了单用户的场景,而且抗干扰策略为调整发射功率,并没有考虑多用户多信道***模型。
发明内容
本发明的目的在于提供一种能够提高***吞吐量、降低干扰影响的基于合作抗干扰分层博弈模型的抗干扰学习方法。
实现本发明目的的技术解决方案为:
一种基于合作抗干扰分层博弈模型的抗干扰学习方法,包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,博弈的参与者是***内的所有用户和干扰;
步骤2,所有用户随机生成初始的抗干扰策略,包括信道选择与功率配置,干扰则根据用户的抗干扰策略进行干扰信道选择,定义干扰的效用函数为***通信用户策略保持不变时干扰存在与否对***整体吞吐量的影响,定义用户的效用函数为干扰条件下的全网吞吐量与自身的功率消耗开销,引入势能博弈模型;
步骤3,随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略;
步骤4,循环步骤3,用户通过探索学习进行策略选择,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数。
进一步地,步骤1所述的将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,该博弈模型定义为:
G=[{N,J},{A,aj},{un,uj}]
该博弈模型G中包含三个组成部分,其中,{N,J}为参与博弈的用户和干扰集合,{A,aj}为用户的策略空间和干扰的策略空间,{un,uj}为用户n的效用函数和干扰j的效用函数。
进一步地,,步骤2所述的引入势能博弈模型,具体如下:
定义用户间势能函数为:
Figure GDA0003056610140000021
在干扰存在条件下,领导者的博弈模型构成一个势能博弈,至少存在一个纯策略纳什均衡解;由于干扰始终存在且优化其干扰效用,所以Stackelberg博弈模型也存在相应的Stackelberg均衡解;证明过程如下:
Figure GDA0003056610140000022
其中an为用户n的信道接入和功率配置策略,a-n为其余用户的策略,aj为干扰的干扰策略;rn为用户n的吞吐量,βi是用户i的功率消耗单位代价,cn1,2为用户n的信道策略,
Figure GDA0003056610140000031
为对应信道的功率配置。
进一步地,步骤3所述的随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略,具体如下:
设定***中共有M信道和N个用户,所有用户随机分布于某个区域内,用户n的发送端到用户m的接收端距离为dnm,用户n的策略为
Figure GDA0003056610140000032
其中cn1,2为用户的信道选择,
Figure GDA0003056610140000033
为对应信道配置的功率,则用户n在信道cn1上受到的干扰为:
Figure GDA0003056610140000034
其中α为信道衰落系数,若cxk=cni,则δ(cxk,cni)=1,表明用户该信道被干扰,反之δ(cxk,cni)=0,即用户没有收到干扰;
根据Shannon公式进行计算,得用户n在信道cn1上的吞吐量为:
Figure GDA0003056610140000035
其中,N0为噪声功率,α为信道衰落系数,1-δ(cni,aj)来表明该信道有没有收到干扰;
其中干扰的策略为aj,干扰的效用函数为:
Figure GDA0003056610140000036
其中,aN为全体用户的策略集合,aj=0表明干扰不对任何信道进行干扰;上式物理意义为施加干扰时,全***吞吐量降低的性能即为干扰的效用;
在干扰条件下,用户的效用函数un为:
Figure GDA0003056610140000037
其中,βn为功率消耗代价;
博弈的优化目标:用户和干扰分别以自身效用函数为优化目标,即用户通过调整抗干扰策略,综合优化***吞吐量和自身功率开销,干扰则通过选择信道进行干扰策略更新,使得干扰效用函数最大化:
Figure GDA0003056610140000041
即用户和干扰通过分别调整策略,使得自己的效用函数最大化。
进一步地,步骤4所述的循环步骤3,用户通过探索学习进行合作抗干扰,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数,具体如下:
(4.1)所有的用户进行信息交互;
(4.2)每次迭代都随机选择一个用户n进行操作;
(4.3)其他所有的用户重复之前的抗干扰策略选择,即a-n(k+1)=a-n(k);
对于选中的次级用户n,首先计算它选择不同抗干扰策略的效用函数值,用户n根据如下抗干扰策略更新准则进行抗干扰策略更新,即当新生成的策略能够带来更高的效用函数收益时,采用新生成的策略,an(k)表示用户n在第k时刻的策略;
Figure GDA0003056610140000042
干扰的策略更新规则为:
Figure GDA0003056610140000043
本发明与现有技术相比,其显著优点在于:(1)充分考虑了多用户合作抗干扰的问题,提出了多领导者单跟随者的Stackelberg博弈模型,同时将抗干扰策略由单一的调整功率扩展到信道选择与功率配置相结合,考虑了功率压制机制下的智能干扰模型;(2)通过引入势能博弈模型,利用势能博弈证明了该Stackelberg博弈模型存在Stackelberg均衡,并且是可以求解的,为算法的设计提供了理论支持;(3)提出的合作抗干扰学习算法,通过信息交互,探测并达到全局最优,避免了在计算全局最优中存在的不收敛问题。
附图说明
图1是本发明合作抗干扰的Stackelberg博弈模型中的多用户单干扰网络示意图。
图2是本发明方法与随机抗干扰、非合作抗干扰算法性能对比图。
图3是本发明方法在信道数目改变时全局吞吐量和干扰效果对比图。
具体实施方式
结合图1,本发明合作抗干扰的Stackelberg博弈模型,5个用户对随机分布,共有3个信道可供选择,例如,用户对1选择了信道1和信道2进行通信,而用户对2选择了信道1进行通信。干扰通过对用户策略进行感知,最终选择了对信道1进行干扰。对于用户而言,当干扰选择信道1进行干扰时,其余使用信道2和信道3的用户性能得到了保证。而用户的优化目标为全网吞吐量与自身功率消耗,若此时被干扰的用户效用函数也达到了最大,那么图中所示策略即为均衡解。
本发明合作抗干扰Stackelber博弈模型,将用户建模为领导者,干扰建模为跟随者,干扰始终以最大化降低多用户***的吞吐量为优化目标,用户利用抗干扰学习算法,不断调整信道选择与功率配置,在干扰跟随用户的决策始终以最大化其干扰效用为目标的前提下,最大化***整体吞吐量。
本发明基于和网络全局效用的关系,通过势能博弈证明纳什均衡的存在性,证明Stackelberg均衡的存在性,通过将势能博弈的有限递进提醒,利用势能函数达到最大化全局性能的目的。
本发明基于合作抗干扰分层博弈模型的抗干扰学习方法,包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,博弈的参与者是***内的所有用户和干扰;
步骤2,所有用户随机生成初始的抗干扰策略,包括信道选择与功率配置,干扰则根据用户的抗干扰策略进行干扰信道选择,定义干扰的效用函数为***通信用户策略保持不变时干扰存在与否对***整体吞吐量的影响,定义用户的效用函数为干扰条件下的全网吞吐量与自身的功率消耗开销,引入势能博弈模型;
步骤3,随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略;
步骤4,循环步骤3,用户通过探索学习进行策略选择,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数。
本发明的具体实施如下:
一、步骤1将用户合作抗干扰问题建模为Stackelberg博弈模型,该博弈模型定义为:
G=[{N,J},{A,aj},{un,uj}]
该博弈模型G中包含三个组成部分,其中,{N,J}为参与博弈的用户和干扰集合,{A,aj}为用户的策略空间和干扰的策略空间,{un,uj}为用户n的效用函数和干扰j的效用函数。
二、步骤2所述的引入势能博弈模型,具体如下:
定义用户间势能函数为:
Figure GDA0003056610140000061
在干扰存在条件下,领导者的博弈模型构成一个势能博弈,至少存在一个纯策略纳什均衡解;由于干扰始终存在且优化其干扰效用,所以Stackelberg博弈模型也存在相应的Stackelberg均衡解;证明过程如下:
Figure GDA0003056610140000062
其中an为用户n的信道接入和功率配置策略,a-n为其余用户的策略,aj为干扰的干扰策略;rn为用户n的吞吐量,βi是用户i的功率消耗单位代价,cn1,2为用户n的信道策略,
Figure GDA0003056610140000063
为对应信道的功率配置。
三、步骤3所述的随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略,具体如下:
设定***中共有M信道和N个用户,所有用户随机分布于某个区域内,用户n的发送端到用户m的接收端距离为dnm,用户n的策略为
Figure GDA0003056610140000064
其中cn1,2为用户的信道选择,
Figure GDA0003056610140000065
为对应信道配置的功率,则用户n在信道cn1上受到的干扰为:
Figure GDA0003056610140000066
其中α为信道衰落系数,若cxk=cni,则δ(cxk,cni)=1,表明用户该信道被干扰,反之δ(cxk,cni)=0,即用户没有收到干扰;
根据Shannon公式进行计算,得用户n在信道cn1上的吞吐量为:
Figure GDA0003056610140000067
其中,N0为噪声功率,α为信道衰落系数,1-δ(cni,aj)来表明该信道有没有收到干扰;
其中干扰的策略为aj,考虑干扰对所选择的信道具有功率压制的效用,即该信道上其他的用户无法继续正常通信,干扰的效用函数为:
Figure GDA0003056610140000071
其中,aN为全体用户的策略集合,aj=0表明干扰不对任何信道进行干扰;上式物理意义为施加干扰时,全***吞吐量降低的性能即为干扰的效用;
在干扰条件下,用户的效用函数un为:
Figure GDA0003056610140000072
其中,βn为功率消耗代价。
四、博弈的优化目标:用户和干扰分别以自身效用函数为优化目标,即用户通过调整抗干扰策略,综合优化***吞吐量和自身功率开销,干扰则通过选择信道进行干扰策略更新,使得干扰效用函数最大化:
Figure GDA0003056610140000073
即用户和干扰通过分别调整策略,使得自己的效用函数最大化。
五、步骤4所述循环步骤3,用户通过探索学习进行合作抗干扰,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数,具体如下:
(4.1)所有的用户进行信息交互;
(4.2)每次迭代都随机选择一个用户n进行操作;
(4.3)其他所有的用户重复之前的抗干扰策略选择,即a-n(k+1)=a-n(k);
对于选中的次级用户n,首先利用公式(3)计算它选择不同抗干扰策略的效用函数值,用户n根据如下抗干扰策略更新准则进行抗干扰策略更新,即当新生成的策略能够带来更高的效用函数收益时,采用新生成的策略,an(k)表示用户n在第k时刻的策略;
Figure GDA0003056610140000074
干扰的策略更新规则为:
Figure GDA0003056610140000081
实施例1
本发明的一个实施例如下描述:***仿真采用Matlab软件,参数设定不影响一般性;N个用户对随机布设在一个200m×200m的网络场景中,考虑M=5个信道,设用户可以将2个连续的信道进行绑定后发送数据,每个用户有一个发送功率上限0.1W,用户在信道选择之后,对发送功率进行合理配置,假设用户对的发送端和接收端距离范围为[35-50],路径衰落为-3,单位功率消耗代价为20。
本发明基于合作抗干扰的Stackelberg博弈模型的抗干扰学习方法,具体过程如下:
步骤1:初始化,设置迭代次数j=0,每个用户n∈N随机生成信道选择和功率配置,干扰根据用户的策略生成干扰策略:
Figure GDA0003056610140000082
步骤2:用户策略和干扰策略更新(循环):
①所有的用户进行信息交互。
②每次迭代都随机选择一个次级用户n进行操作。
③其他所有的用户保持之前策略不变,即a-n(k+1)=a-n(k)。对于选中的用户n,随机生成一个抗干扰策略a'n,计算相应效用值,然后用户依据下式更新它的选择抗干扰策略:
Figure GDA0003056610140000083
干扰的策略更新规则为:
Figure GDA0003056610140000084
步骤3:当所有用户的抗干扰策略选择实现收敛,或者达到一定的迭代次数时,循环结束。
步骤4:根据收敛后的抗干扰策略和干扰策略,计算全网吞吐量和干扰效用函数。
结合图2,为随着用户数目的变化,全网吞吐量和干扰效用函数变化情况,对比算法为随机抗干扰方法和非合作的抗干扰方法。由图可知,采用本发明所提的合作抗干扰方法取得的全网吞吐量性能远高于随机和非合作的抗干扰方法。随用户数目增加,全网吞吐量性能也呈逐步增加趋势。
结合图3,当信道数目为4和6个两种情况时,用户不同的信道绑定策略下,全网吞吐量性能和干扰效用函数的比较。由图3可知,信道数越大,吞吐量性能越高,干扰损失越小,信道绑定数目增加也会使得吞吐量性能增加。
综上,本发明提出的基于合作抗干扰的Stackelberg博弈模型的抗干扰学***。通过与随机抗干扰方法和非合作抗干扰方法的对比,证明所提合作抗干扰策略能够在降低干扰影响的情况下,提高全网吞吐量。算法仿真结果也表明了所提模型及方法的有效性,验证了理论的正确性。

Claims (2)

1.一种基于合作抗干扰分层博弈模型的抗干扰学习方法,其特征在于,包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,博弈的参与者是***内的所有用户和干扰;
步骤2,所有用户随机生成初始的抗干扰策略,包括信道选择与功率配置,干扰则根据用户的抗干扰策略进行干扰信道选择,定义干扰的效用函数为***通信用户策略保持不变时干扰存在与否对***整体吞吐量的影响,定义用户的效用函数为干扰条件下的全网吞吐量与自身的功率消耗开销,引入势能博弈模型;
步骤3,随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略;
步骤4,循环步骤3,用户通过探索学习进行策略选择,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数;
步骤1所述的将多用户单干扰场景下的合作抗干扰问题,建模为多领导者单跟随者的Stackelberg博弈模型,该博弈模型定义为:
G=[{N,J},{A,aj},{un,uj}]
该博弈模型G中包含三个组成部分,其中,{N,J}为参与博弈的用户和干扰集合,{A,aj}为用户的策略空间和干扰的策略空间,{un,uj}为用户n的效用函数和干扰j的效用函数;
步骤2所述的引入势能博弈模型,具体如下:
定义用户间势能函数为:
Figure FDA0002965023390000011
在干扰存在条件下,领导者的博弈模型构成一个势能博弈,至少存在一个纯策略纳什均衡解;由于干扰始终存在且优化其干扰效用,所以Stackelberg博弈模型也存在相应的Stackelberg均衡解;βi是用户i的功率消耗单位代价,cn1、cn2为用户n的信道策略,
Figure FDA0002965023390000012
Figure FDA0002965023390000013
为对应信道的功率配置;
步骤3所述的随机选择一个用户,根据此时其余用户的抗干扰策略和干扰效用函数的特性,通过调整自身的抗干扰策略,在干扰跟随变化的情况下,比较新旧两种策略下自身效用函数的高低,选择自身效用函数高的抗干扰策略,具体如下:
设定***中共有M信道和N个用户,所有用户随机分布于某个区域内,用户n的发送端到用户m的接收端距离为dnm,用户n的策略为
Figure FDA0002965023390000021
其中cn1、cn2为用户的信道选择,
Figure FDA0002965023390000022
为对应信道配置的功率,则用户n在信道cn1上受到的干扰为:
Figure FDA0002965023390000023
其中α为信道衰落系数,若cxk=cni,则δ(cxk,cni)=1,表明用户该信道被干扰,反之δ(cxk,cni)=0,即用户没有收到干扰;
根据Shannon公式进行计算,得用户n在信道cn1上的吞吐量为:
Figure FDA0002965023390000024
其中,an为用户n的信道接入和功率配置策略,a-n为其余用户的策略,aj为干扰的干扰策略;rn为用户n的吞吐量,N0为噪声功率,α为信道衰落系数,1-δ(cni,aj)来表明该信道有没有收到干扰;
其中干扰的策略为aj,干扰的效用函数为:
Figure FDA0002965023390000025
其中,aN为全体用户的策略集合,aj=0表明干扰不对任何信道进行干扰;上式物理意义为施加干扰时,全***吞吐量降低的性能即为干扰的效用;
在干扰条件下,用户的效用函数un为:
Figure FDA0002965023390000026
其中,βn为功率消耗代价;
博弈的优化目标:用户和干扰分别以自身效用函数为优化目标,即用户通过调整抗干扰策略,综合优化***吞吐量和自身功率开销,干扰则通过选择信道进行干扰策略更新,使得干扰效用函数最大化:
Figure FDA0002965023390000027
即用户和干扰通过分别调整策略,使得自己的效用函数最大化。
2.根据权利要求1所述的基于合作抗干扰分层博弈模型的抗干扰学习方法,其特征在于,步骤4所述的循环步骤3,用户通过探索学习进行合作抗干扰,直至所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数,具体如下:
(4.1)所有的用户进行信息交互;
(4.2)每次迭代都随机选择一个用户n进行操作;
(4.3)其他所有的用户重复之前的抗干扰策略选择,即a-n(k+1)=a-n(k);
对于选中的次级用户n,首先计算它选择不同抗干扰策略的效用函数值,用户n根据如下抗干扰策略更新准则进行抗干扰策略更新,即当新生成的策略能够带来更高的效用函数收益时,采用新生成的策略,an(k)表示用户n在第k时刻的策略;
Figure FDA0002965023390000031
干扰的策略更新规则为:
Figure FDA0002965023390000032
CN201810396863.3A 2018-04-28 2018-04-28 一种基于合作抗干扰分层博弈模型的抗干扰学习方法 Active CN108616916B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810396863.3A CN108616916B (zh) 2018-04-28 2018-04-28 一种基于合作抗干扰分层博弈模型的抗干扰学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810396863.3A CN108616916B (zh) 2018-04-28 2018-04-28 一种基于合作抗干扰分层博弈模型的抗干扰学习方法

Publications (2)

Publication Number Publication Date
CN108616916A CN108616916A (zh) 2018-10-02
CN108616916B true CN108616916B (zh) 2021-07-13

Family

ID=63661234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810396863.3A Active CN108616916B (zh) 2018-04-28 2018-04-28 一种基于合作抗干扰分层博弈模型的抗干扰学习方法

Country Status (1)

Country Link
CN (1) CN108616916B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109639374B (zh) * 2018-12-29 2021-05-14 北京工业大学 一种基于强化学习算法的认知抗干扰通信方法
CN109743780B (zh) * 2019-01-31 2020-11-27 中国人民解放军陆军工程大学 信道选择和传输时间联合优化的分层强化学习抗干扰算法
CN110891276B (zh) * 2019-10-30 2021-03-26 中国人民解放军陆军工程大学 多用户抗干扰信道接入***及动态频谱协同抗干扰方法
CN111148254B (zh) * 2019-12-31 2023-04-07 中国人民解放军军事科学院国防科技创新研究院 一种基于补偿机制的合作抗干扰分层博弈模型及方法
CN111726192B (zh) * 2020-06-12 2021-10-26 南京航空航天大学 基于对数线性算法的通信对抗中用频决策优化方法
CN111800185A (zh) * 2020-07-06 2020-10-20 中国人民解放军陆军工程大学 一种无人机辅助通信中的分布式空地联合部署方法
CN111800422B (zh) * 2020-07-06 2022-05-17 中国人民公安大学 扭曲信息的干预方法、装置及电子设备
CN112243281B (zh) * 2020-10-15 2022-06-21 广州大学 基于可充电无线传感器网络的贝叶斯博弈路由设计方法
CN112333767B (zh) * 2020-11-16 2022-08-26 南京邮电大学 一种在灾后地区部署无人机应急通信***的方法
CN112423234B (zh) * 2020-11-20 2022-07-08 华侨大学 基于强化学习的无人机辅助物联网抗敌意干扰方法和***
CN113453239B (zh) * 2021-06-17 2022-10-28 西安电子科技大学 信道资源分配方法及***、存储介质、电子设备
CN113613337B (zh) * 2021-08-05 2023-06-20 中国人民解放军陆军工程大学 一种面向波束成形通信的用户协作抗干扰方法
CN114698128B (zh) * 2022-05-17 2022-09-13 中国人民解放军战略支援部队航天工程大学 一种认知星地网络的抗干扰信道选择方法和***
CN115378487B (zh) * 2022-07-05 2023-12-01 中国人民解放军战略支援部队航天工程大学 基于电磁屏障的卫星通信动态频谱接入方法
CN115022952B (zh) * 2022-08-09 2022-10-25 中国人民解放军国防科技大学 一种对抗条件下的卫星通信功率资源分配方法
CN116073924B (zh) * 2023-03-07 2023-05-30 中国人民解放军军事科学院国防科技创新研究院 基于Stackelberg博弈的抗干扰信道分配方法及***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102448159B (zh) * 2011-09-30 2013-12-04 南京邮电大学 基于干扰管理的功率速率联合控制博弈方法
US9578514B2 (en) * 2012-05-10 2017-02-21 Nokia Technologies Oy Method, apparatus, and computer program product for enablement
CN102695131B (zh) * 2012-05-18 2014-12-10 上海交通大学 认知网络中基于合作博弈的分布式功率控制方法
CN103313251A (zh) * 2013-06-04 2013-09-18 北京邮电大学 一种基于势博弈理论的多小区协作资源分配方法
CN105848274B (zh) * 2016-03-25 2019-05-07 山东大学 一种两层异构网络中基于斯坦伯格博弈论的非统一定价的功率控制方法
CN107708156A (zh) * 2017-10-27 2018-02-16 中国人民解放军陆军工程大学 一种具有预判的异构蜂窝网络负载均衡方法

Also Published As

Publication number Publication date
CN108616916A (zh) 2018-10-02

Similar Documents

Publication Publication Date Title
CN108616916B (zh) 一种基于合作抗干扰分层博弈模型的抗干扰学习方法
Al-Eryani et al. Multiple access in cell-free networks: Outage performance, dynamic clustering, and deep reinforcement learning-based design
CN109729528B (zh) 一种基于多智能体深度强化学习的d2d资源分配方法
Wang et al. Joint interference alignment and power control for dense networks via deep reinforcement learning
CN108712748B (zh) 一种基于强化学习的认知无线电抗干扰智能决策的方法
CN109586820A (zh) 衰落环境中的动态频谱抗干扰模型及强化学习抗干扰算法
Liu et al. Max-min energy balance in wireless-powered hierarchical fog-cloud computing networks
CN107426773B (zh) 无线异构网络中面向能效的分布式资源分配方法和装置
CN112566253B (zh) 一种无线资源分配联合优化方法及装置
CN108712746B (zh) 一种部分重叠信道聚合博弈模型及学习方法
CN112188504A (zh) 多用户协同抗干扰***及动态频谱协同抗干扰方法
CN116744311B (zh) 基于per-ddqn的用户组频谱接入方法
CN104038945A (zh) 一种基于独立集的异构蜂窝网络能效优化方法
Han et al. Joint resource allocation in underwater acoustic communication networks: A game-based hierarchical adversarial multiplayer multiarmed bandit algorithm
CN107864507B (zh) 基于量子猴群搜索机制的认知无线电功率控制方法
CN113795049A (zh) 一种基于深度强化学习的Femtocell异构网络功率自适应优化方法
CN105101383B (zh) 基于频谱共享能效最大的功率分配方法
CN111212438A (zh) 一种无线携能通信技术的资源分配方法
CN105282746A (zh) 基于嵌入式粒子群博弈的认知无线网络频谱分配方法
Zhai et al. A Q-learning-based resource allocation for downlink non-orthogonal multiple access systems considering QoS
CN107071881A (zh) 一种基于博弈论的小蜂窝网络分布式能量分配方法
WO2013104120A1 (zh) 动态频谱环境中基于多智能体强化学习的频率功率联合分配方法
Yu et al. Energy efficiency tradeoff in interference channels
CN111741520A (zh) 一种基于粒子群的认知水声通信***功率分配方法
Zeydan et al. Joint iterative beamforming and power adaptation for MIMO ad hoc networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant