CN113613337B - 一种面向波束成形通信的用户协作抗干扰方法 - Google Patents
一种面向波束成形通信的用户协作抗干扰方法 Download PDFInfo
- Publication number
- CN113613337B CN113613337B CN202110896542.1A CN202110896542A CN113613337B CN 113613337 B CN113613337 B CN 113613337B CN 202110896542 A CN202110896542 A CN 202110896542A CN 113613337 B CN113613337 B CN 113613337B
- Authority
- CN
- China
- Prior art keywords
- user
- interference
- users
- strategy
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004891 communication Methods 0.000 title claims abstract description 12
- 238000005381 potential energy Methods 0.000 claims abstract description 17
- 230000006870 function Effects 0.000 claims description 24
- 230000008859 change Effects 0.000 claims description 8
- 230000008901 benefit Effects 0.000 claims description 5
- 230000001351 cycling effect Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 claims 2
- 230000008485 antagonism Effects 0.000 abstract description 5
- 230000006399 behavior Effects 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 abstract 1
- 238000005457 optimization Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W72/00—Local resource management
- H04W72/50—Allocation or scheduling criteria for wireless resources
- H04W72/54—Allocation or scheduling criteria for wireless resources based on quality criteria
- H04W72/541—Allocation or scheduling criteria for wireless resources based on quality criteria using the level of interference
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种面向波束成形通信的用户协作抗干扰方法,将多用户与干扰的对抗关系建模;干扰为领导者,用户为追随者;不断调整干扰策略以保证其干扰效用最大;将用户间的协作抗干扰行为建模为势能博弈。首先初始化用户与干扰的策略,即随机选择通信/干扰信道,并将每个用户标志位设为0;然后所有用户同时执行信道探测或信道更新操作,尔后计算相应的效用并在领居间交互用户体验质量满意度,根据所选策略更新标志位;循环迭代,直至所有用户抗干扰策略收敛;更新Q表,调整策略;直至干扰的策略收敛。本发明通过为不同用户设置不同的学习参数提高了收敛速度,通过用户间信息层面的协作,提高了网络的抗干扰效能。
Description
技术领域
本发明属于无线通信技术领域,特别是一种面向波束成形通信的用户协作抗干扰方法。
背景技术
随者无线技术的发展,全球通信业务呈现出指数型爆发增长,在热点地区,用户通常呈现超密集分布,给用户协调用频和抗恶意干扰攻击带来了较大困难。针对此问题,前人提出采用跳频方式躲避干扰攻击(F.Yao and L.Jia,A Collaborative Multi-AgentReinforcement Learning Anti-Jamming Algorithm in Wireless Networks,IEEEWireless Communications Letters,vol.8,no.4,pp.1024-1027,Aug.2019.);但是,之前的大部分研究都只是单纯的将最大化全网吞吐量作为优化目标,没有考虑用户实际的业务需求,没有将用户需求考虑进决策闭环之中。此类方法往往会遇到优化目标与用户需求不能够完全匹配的情况,从而造成资源的浪费。
此外,现有的抗干扰算法还普遍存在以下两点问题:(1)缺乏用户间协作机制,抗干扰方法还偏向于独立对抗,没有发挥出群智效能。(2)异步更新算法居多,即每次迭代只有一个用户更新策略,导致算法收敛速度较慢。
发明内容
本发明的目的在于提供一种能够提高用户体验质量(QoE)、降低干扰影响的协作抗干扰模型及相应的抗干扰学习算法。
实现本发明目的的技术解决方案为:考虑恶意用户能够根据通信用户的用频状况自适应地调整干扰策略,使其干扰效用最大化。首先,将用户和干扰之间的对抗关系建模为一个Stackelberg博弈。此外,在用户关系建模方面,考虑空分多址条件下用户间互扰非对称这一特点,提出了一种具有局部利他特性的非合作博弈模型。其次,为了克服盲目地提升吞吐量所造成资源的浪费,提出了基于平均评估分值MOS(Mean Opinion Score)的用户体验质量模型,用QoE等级来量化用户效用。接着,证明了用户间局部利他博弈是一个精确势能博弈,进而证明了用户的全网最优策略是该博弈的一个纯策略纳什均衡。最后,设计了一种只需要局部信息即可实现全网最优的用户协作抗干扰算法。
一种抗干扰算法,包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为单领导者多跟随者的Stackelberg博弈模型,博弈的参与者是***内的所有用户和干扰;
步骤2,干扰随机选择一个信道进行干扰,定义干扰的效用函数为干扰机给共信道的所有用户施加的干扰功率之和。用户根据干扰策略进行抗干扰信道选择,为了能够在此过程中降低用户间互扰,我们考虑了局部合作模型,并利用势能博弈框架对用户间协作进行分析,每个用户需要考虑邻居用户的收益。因此,用户的效用函数被定义为用户自身与邻居用户的QoE满意度总和。
步骤3,所有用户同时进行抗干扰策略调整,用户根据当前标志位以及前两个时隙的策略与回报进行信道选择。根据用户对网络的不同影响程度,本发明为每个用户设置了不同的学习参数,以此来提高算法收敛速度。
步骤4,循环至步骤3,用户通过探索学习进行策略选择,直至干扰策略和所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数。
步骤5,干扰评估其效用uj(k)并更新Q表。
步骤6,干扰更新策略,并循环至步骤3,直至到达最大循环次数。
进一步地,步骤1所述的多用户单干扰场景下的合作抗干扰问题,被建模为单领导者多追随者的Stackelberg博弈,表示为:
进一步地,步骤2所述的用户间局部合作模型被建模为精确势能博弈,具体如下:定义用户间势能函数为:
该势能博弈证明过程如下:
此外,用户n单方面改变其策略选择造成势能函数的变化为:
进一步将得到以下结论:
因此用户间局部合作模型是一个势能博弈。
进一步地,步骤3所述的所有用户同时进行抗干扰策略调整,用户根据当前标志位以及前两个时隙的策略与回报进行信道选择。具体操作如下:
若标志位Yn(t-1)=0,用户n根据以下规则更新信道:
若标志位Yn(t-1)=1,用户n根据以下规则更新信道:
其中,β为学习速率;un(t-1)和un(t-2)分别为用户n在t-1和t-2时隙的效用。更新完成后设置标志位Yn(t)=0。
xn(t)=Γn·ε(t)
进一步地,步骤5所述的干扰评估其效用uj(k)并更新Q表。具体如下:
干扰评估当前效用uj:
更新Q表:
Qk+1(cj(k))=(1-λ)Qk(cj(k))+λuj(k),
其中,Qk+1为干扰机k+1时期的Q值;cj(k)为干扰机在k时期所选的干扰信道;Qk为干扰机k时期的Q值;uj(k)为干扰机在k时期的效用;λ∈(0,1)表示学习速率,用于控制Q学习收敛速度。
进一步地,步骤6所述的干扰策略更新方式为:
采用玻尔兹曼函数更新自身的信道选择策略:
本发明与现有技术相比,其显著优点在于:(1)为多用户抗干扰问题提供了一种建模用户与干扰强对抗关系以及用户间协作关系的架构。(2)考虑了用户的多样化业务需求,同时为了克服用户盲目的提升吞吐量而造成的资源浪费,提出了基于MOS的QoE模型和以用户需求为中心的优化机制,用QoE等级来量化用户效用,利用用户需求分集提升***性能。(3)通过势能博弈的有限改进性,设计了多用户同步抗干扰算法,并利用各用户对网络整体的影响程度不同的特点,通过为不同的用户设置不同的学习参数来提升算法的收敛速度。
附图说明
图1是本发明面向异构业务需求的分层抗干扰模型中的多用户单干扰网络示意图。
图2是本发明算法与现有的异步学习算法的收敛情况对比图。
图3是本发明算法在干扰功率变化时的抗干扰效果示意图。
具体实施方式
结合图1,本发明面向多用户业务需求的分层抗干扰模型,***中共有两个毫米波微微蜂窝基站,两基站间的距离为50m,用户随机分布在以基站为中心的半径为100m的圆内。同时,干扰分布在距离两基站大约100-200m的范围内。此外,可用信道数设置为M=4,信道带宽B=1MHz,噪声功率谱密度N0=-130dB/Hz。
本发明面向多用户业务需求的分层抗干扰模型,将干扰建模为领导者,将用户建模为跟随者。将干扰与用户的对抗关系建模为Stackelberg博弈,寻求能够躲避干扰的方法。将用户间协作关系建模为势能博弈,寻求能够消除同信道互扰的方法。此外,本发明所提的用户间协作,是信息层面的协作,指相邻用户间交互QoE满意度。
本发明基于全网QoE满意度与用户策略的关系,通过证明纳什均衡与Stackelberg均衡的存在性,准确地将用户行为映射到了***性能上,为进一步提出相应的抗干扰算法提供了理论指导。
本发明面向异构业务需求的分层抗干扰模型的用户协作抗干扰算法,包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为单领导者多跟随者的Stackelberg博弈模型,博弈的参与者是***内的所有用户和干扰;
步骤2,干扰随机选择一个信道进行干扰,定义干扰的效用函数为干扰机给同信道的所有用户施加的干扰功率之和。用户根据干扰策略进行抗干扰信道选择,为了能够在此过程中降低用户间互扰,我们考虑了局部合作模型,并利用势能博弈框架对用户间协作进行分析,每个用户需要考虑邻居用户的收益。因此,用户的效用函数被定义为用户自身与邻居用户的QoE满意度总和。
步骤3,所有用户同时进行抗干扰策略调整,用户根据当前标志位以及前两个时隙的策略与回报进行信道选择。根据用户对网络整体的影响程度不同,为每个用户设置了不同的学习参数,以此来提高算法收敛速度。
步骤4,循环至步骤3,用户通过探索学习进行策略选择,直至干扰策略和所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数。
步骤5,干扰评估其效用uj(k)并更新Q表。
步骤6,干扰更新策略,并循环至步骤3,直至到达最大循环次数。
本发明的具体实施方案如下:
2、考虑用户存在多种业务,因此对吞吐量要求也不同。换句话说,同一吞吐量在不同业务下可能会对应到不同的QoE满意度。具体的QoE满意度计算过程为:
用户n每次只能接入一个基站,我们将用户n所接入的基站表示为Sn。基站Sn和用户n之间的距离表示为基站Sn到用户n的方向角表示为/>我们可以得到基站Sn利用波束成形技术服务用户n时在用户m所在方向上的方向增益为:
其中,θn为基站Sn服务用户n时波束的主瓣宽度。
利用通信链路方向角,定义服务用户n的波束覆盖区域为:
其中,θn为基站Sn服务用户n时波束的主瓣宽度。
进一步,定义受到用户n干扰的***集为:
定义对用户n造成干扰的***集为:
因此,用户n所受的外部恶意干扰和用户间互扰之和表示为:
其中,为干扰频率;/>为信道am所在频率;am,an和cj分别为用户m、用户n和干扰机所选信道;gmn为Sm利用波束成形技术服务用户m时在用户n所在方向上的方向增益;为用户m所在信道的信道增益;/>为干扰机所在信道的信道增益。pm为用户m的发射功率,djn为干扰机到用户n的距离。pj为干扰功率。δ(x,y)为指示函数,定义为
所以,用户n的通信速率表示为:
将MOS函数定义为:
MOS=εlog10(R/γ),
其中R为用户的吞吐量;ε和γ为常数,其大小根据用户的最大和最小吞吐量需求确定,由于用户的业务需求不同,该常数值大小也不尽相同。MOS值与五个级别的映射关系如表1所示。
表1:平均意见得分(MOS)
基于上述分析,优化目标被表示为全网的QoE回报(即用户满意度之和)最大,即:
基于以上分析,用户n的效用函数表示为:
用户n的优化问题可表示为:
进一步,所有用户构成一个下层子博弈,表示为:
对干扰来说,其目标是给所有用户造成最大程度的累计干扰,其效用函数定义为:
我们将干扰的决策优化问题表示为:
故上层子博弈表示为:
3、每个用户的信道选择过程如下:
(2)信道探测:若Yn(t-1)=0,用户n根据以下规则更新信道:
(3)更新信道:若Yn(t-1)=1,用户n根据以下规则更新信道:
其中,β为学习参数;un(t-1)和un(t-2)分别为用户n在t-1和t-2时隙的用户效用。更新完成后设置标志位Yn(t)=0。
4、循环步骤1至步骤3,所有用户同时进行探索学习与信道接入,直至所有用户的信道接入选择实现收敛,或者达到设定的迭代次数。
对于局部合作模型,可以证明其为势能博弈,至少存在一个纳什均衡解。且利用势能博弈的有限改进性质,可以设计相应的抗干扰算法。
5、干扰评估其效用uj(k);干扰按照下式更新Q值
Qk+1(cj(k))=(1-λ)Qk(cj(k))+λuj(k), (6-25)
其中,λ∈(0,1)表示学习速率,用于控制Q学习收敛速度。
与用户类似,干扰也采用玻尔兹曼函数更新自身的信道选择策略:
其中,τ为温度系数,体现探索与利用的折中。
6、循环至步骤3,直至到达最大循环次数。
实施例1
本发明的一个实施例如下描述:***仿真采用Matlab软件,参数设定不影响一般性;***共有两个毫米波微微蜂窝基站,两基站间的距离为50m,用户随机分布在以基站为中心的半径为100m的圆内。同时,干扰分布在距离两基站大约100-200m的范围内。此外,可用信道数设置为M=4,信道带宽B=1MHz,噪声功率谱密度N0=-130dB/Hz,学习参数β=t/2500。干扰的学习速率λ=0.1,温度系数其中K为总的仿真时期,k为当前仿真时期。
本发明用户协作抗干扰算法,具体过程如下:
在该时期内,所有用户同时执行以下过程:
循环t=1,2,…:
信道探测:
若Yn(t-1)=0,用户n根据以下规则更新信道:
更新信道:
若Yn(t-1)=1,用户n根据以下规则更新信道:
其中,β为学习参数;un(t-1)和un(t-2)分别为用户n在t-1和t-2时隙的效用。更新完成后设置标志位Yn(t)=0
步骤3:干扰获得效用uj(k);
步骤4:干扰按照下式更新Q值:
Qk+1(cj(k))=(1-λ)Qk(cj(k))+λuj(k),
其中,λ∈(0,1)表示学习速率,用于控制Q学习收敛速度。
与用户类似,干扰也采用玻尔兹曼函数更新自身的信道选择策略:
其中,τ为温度系数,体现探索与利用的折中。
步骤5:更新k=k+1,转到步骤2。直至到达最大循环次数
结合图2,为协作抗干扰算法收敛情况,对比算法为异步学习算法,即,每次迭代只有一个用户进行策略更新。由图可知,采用本发明所提的同步学习算法,能够明显提高学习速度。
结合图3,在不同用户数下干扰功率对网络满意率的影响。由图可知,网络满意率基本不随用户功率的增加而变化,说明本发明所提方法能够帮助用户成功避开干扰信道,有较好的抗干扰效果。
综上,本发明提出的面向多用户业务需求的分层抗干扰模型及用户协作抗干扰算法,考虑恶意用户能够根据通信用户的用频状况自适应地调整干扰策略,使其干扰效用最大化。提出了将用户和干扰之间的对抗关系建模为一个Stackelberg博弈的思路。此外,考虑空分多址条件下用户间互扰非对称这一特点,提出了一种用户协作抗干扰算法,有效地提高了网络满意率。通过与异步学习算法进行对比,证明了所提算法对收敛速度的显著改善。并通过不同干扰功率下的性能对比证明了本发明所提抗干扰算法的有效性。
Claims (1)
1.一种面向波束成形通信的用户协作抗干扰方法,其特征在于,将干扰建模为领导者,用户建模为追随者,干扰始终以给用户造成最大和干扰为目标;用户需要结合自身业务需求,利用抗干扰算法,最大化全网的用户满意度,即网络满意率;包括以下步骤:
步骤1,将多用户单干扰场景下的合作抗干扰问题,建模为单领导者多跟随者的Stackelberg博弈模型,博弈的参与者是***内的所有用户和干扰;
所述的多用户单干扰场景下的合作抗干扰问题,建模为单领导者多追随者的Stackelberg博弈模型,表示为:
步骤2,随机选择一个信道进行干扰,定义干扰的效用函数为干扰机给同信道的所有用户施加的干扰功率之和;用户根据干扰策略进行抗干扰信道选择,利用势能博弈框架对用户间协作进行分析,每个用户需要考虑邻居用户的收益;用户的效用函数被定义为用户自身与邻居用户的QoE满意度总和;
局部合作模型中用户的效用函数un被定义为用户自身与邻居用户的QoE满意度总和,表示为:
其中an为用户n的信道接入策略,cj为干扰的信道选择;为受用户n干扰的用户集,/>为对用户n造成干扰的用户集;/>为对用户k造成干扰的用户集;/>为用户集/>中所有用户的信道选择;/>为用户集/>中所有用户的信道选择;qn为用户n的QoE满意度;qk为用户k的QoE满意度;
将MOS函数定义为:
MOS=εlog10(R/γ), (6-3)
其中R为用户的吞吐量;ε和γ为常数,大小根据用户的最大和最小吞吐量需求确定,由于用户的业务需求不同,该常数值大小也不尽相同;
用户n在不同QoE等级下的满意度被表示为:
所述的局部合作模型被证明是一个精确势能博弈,其证明如下:
势能函数表示为:
其中an为用户n的原信道接入策略,为用户n的改变后的信道接入策略;/>为用户n策略变化为/>后,用户集/>中所有用户的信道选择;a-n为其余用户的信道接入,cj为干扰的信道选择;/>为受用户n干扰的用户集,/>为对用户n造成干扰的用户集,/>表示在集合/>中删除集合/>
步骤3,所有用户同时进行抗干扰策略调整,用户根据当前标志位以及前两个时隙的策略与回报进行信道选择;根据用户对网络整体的不同影响程度,为每个用户设置了不同的学习参数,提高算法收敛速度;
所述的根据用户对网络的不同影响程度,为每个用户设置了不同的学习参数,具体如下:
步骤4,循环步骤1至步骤3,用户通过探索学习进行策略选择,直至干扰策略和所有用户的抗干扰策略实现收敛,或者达到设定的迭代次数;
步骤5,干扰评估效用uj(k)并更新Q表;具体如下:
干扰评估当前效用uj:
其中,pj为干扰功率;fcj为干扰频率;djn为干扰机与用户n之间的距离;H(fcj,djn)为信道增益,与干扰频率以及干扰距离有关;
更新Q表:
Qk+1(cj(k))=(1-λ)Qk(cj(k))+λuj(k),
其中,Qk+1为干扰机k+1时期的Q值;cj(k)为干扰机在k时期所选的干扰信道;Qk为干扰机k时期的Q值;uj(k)为干扰机在k时期的效用;λ∈(0,1)表示学习速率,用于控制Q学习收敛速度;
步骤6,干扰更新策略,循环至步骤3,直至到达最大循环次数;
所述的干扰策略更新方式为:
采用玻尔兹曼函数更新自身的信道选择策略:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110896542.1A CN113613337B (zh) | 2021-08-05 | 2021-08-05 | 一种面向波束成形通信的用户协作抗干扰方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110896542.1A CN113613337B (zh) | 2021-08-05 | 2021-08-05 | 一种面向波束成形通信的用户协作抗干扰方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113613337A CN113613337A (zh) | 2021-11-05 |
CN113613337B true CN113613337B (zh) | 2023-06-20 |
Family
ID=78307112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110896542.1A Active CN113613337B (zh) | 2021-08-05 | 2021-08-05 | 一种面向波束成形通信的用户协作抗干扰方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113613337B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114698128B (zh) * | 2022-05-17 | 2022-09-13 | 中国人民解放军战略支援部队航天工程大学 | 一种认知星地网络的抗干扰信道选择方法和*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108616916A (zh) * | 2018-04-28 | 2018-10-02 | 中国人民解放军陆军工程大学 | 一种合作抗干扰分层博弈模型及抗干扰学习算法 |
CN112188504A (zh) * | 2020-09-30 | 2021-01-05 | 中国人民解放军陆军工程大学 | 多用户协同抗干扰***及动态频谱协同抗干扰方法 |
-
2021
- 2021-08-05 CN CN202110896542.1A patent/CN113613337B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108616916A (zh) * | 2018-04-28 | 2018-10-02 | 中国人民解放军陆军工程大学 | 一种合作抗干扰分层博弈模型及抗干扰学习算法 |
CN112188504A (zh) * | 2020-09-30 | 2021-01-05 | 中国人民解放军陆军工程大学 | 多用户协同抗干扰***及动态频谱协同抗干扰方法 |
Non-Patent Citations (1)
Title |
---|
An Anti-Jamming Hierachical Optimization Approach in Relay Communication System via Stackelberg Game;Zhibin Feng, etc.;《MDPI》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113613337A (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tan et al. | Deep reinforcement learning for joint channel selection and power control in D2D networks | |
Zhang et al. | Intelligent user association for symbiotic radio networks using deep reinforcement learning | |
Lu et al. | A cross-layer resource allocation scheme for ICIC in LTE-Advanced | |
CN107466099A (zh) | 一种基于非正交多址接入的干扰管理自优化方法 | |
CN113316154A (zh) | 一种授权和免授权d2d通信资源联合智能分配方法 | |
Yao et al. | Distributed ABS-slot access in dense heterogeneous networks: A potential game approach with generalized interference model | |
Wang et al. | User association in non-orthogonal multiple access networks | |
CN113613337B (zh) | 一种面向波束成形通信的用户协作抗干扰方法 | |
Xu et al. | Distributed-training-and-execution multi-agent reinforcement learning for power control in HetNet | |
Benamor et al. | Mean field game-theoretic framework for distributed power control in hybrid noma | |
Li et al. | Reinforcement Learning-Based Resource Allocation for Coverage Continuity in High Dynamic UAV Communication Networks | |
Chen et al. | Intelligent control of cognitive radio parameter adaption: Using evolutionary multi-objective algorithm based on user preference | |
Sroka et al. | Distributed interference mitigation in two-tier wireless networks using correlated equilibrium and regret-matching learning | |
Wang et al. | Intelligent user-centric networks: Learning-based Downlink CoMP region breathing | |
Huang et al. | Joint AMC and resource allocation for mobile wireless networks based on distributed MARL | |
Chai et al. | A user-selected uplink power control algorithm in the two-tier femtocell network | |
CN107919931A (zh) | 认知网中一种基于隐马尔可夫的多信道功率控制机制 | |
Chen et al. | Beamforming in multi-user MISO cellular networks with deep reinforcement learning | |
CN107046690A (zh) | 一种认知Femtocell网络混合频谱接入方法 | |
Adeel et al. | Random neural network based power controller for inter-cell interference coordination in lte-ul | |
Sheu et al. | Joint Beamforming, Power Control, and Interference Coordination: A Reinforcement Learning Approach Replacing Rewards with Examples | |
Maaz et al. | Inter-cell interference coordination based on power control for self-organized 4G systems | |
CN113472472B (zh) | 基于分布式强化学习的多小区协同波束赋形方法 | |
Mohamed et al. | Spectral Efficiency Improvement in Downlink Fog Radio Access Network With Deep-Reinforcement-Learning-Enabled Power Control | |
Zhou | Deep Reinforcement Learning for Channel Selection and Power Allocation in D2D Communications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |