CN111182571B - 基站激活控制和波束赋形的长期联合优化方法 - Google Patents

基站激活控制和波束赋形的长期联合优化方法 Download PDF

Info

Publication number
CN111182571B
CN111182571B CN202010031744.5A CN202010031744A CN111182571B CN 111182571 B CN111182571 B CN 111182571B CN 202010031744 A CN202010031744 A CN 202010031744A CN 111182571 B CN111182571 B CN 111182571B
Authority
CN
China
Prior art keywords
base station
network
processing unit
updating
auxiliary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010031744.5A
Other languages
English (en)
Other versions
CN111182571A (zh
Inventor
马孟园
林静然
杨健
利强
邵怀宗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010031744.5A priority Critical patent/CN111182571B/zh
Publication of CN111182571A publication Critical patent/CN111182571A/zh
Application granted granted Critical
Publication of CN111182571B publication Critical patent/CN111182571B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/06Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station
    • H04B7/0613Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission
    • H04B7/0615Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal
    • H04B7/0617Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the transmitting station using simultaneous transmission of weighted versions of same signal for beam forming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/02Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas
    • H04B7/04Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas
    • H04B7/08Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the receiving station
    • H04B7/0837Diversity systems; Multi-antenna system, i.e. transmission or reception using multiple antennas using two or more spaced independent antennas at the receiving station using pre-detection combining
    • H04B7/0842Weighted combining
    • H04B7/086Weighted combining using weights depending on external parameters, e.g. direction of arrival [DOA], predetermined weights or beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基站激活控制和波束赋形的长期联合优化方法,该方法包括:初始化MISO网络中的中枢处理单元、网络控制单元和辅助处理单元,网络控制单元收集并处理网络内信道和基站服务状态等信息,中枢处理单元根据收到的当前环境信息作相应分析,网络控制单元将指定基站打开或关闭,然后结合信道信息计算并配置赋形波束,同时反馈功率消耗指示量,辅助处理单元接收和保存***运行的历史数据,利用辅助处理单元保存的数据协助中枢处理单元更新神经网络权重,辅助***正常运行。本发明提供了一种自适应的线上解决方案,降低了网络功率解决了现有技术存在的环境适应性低、操作复杂、实用性差、运维成本高以及资金投入大的问题。

Description

基站激活控制和波束赋形的长期联合优化方法
技术领域
本发明属于无线通信技术领域,具体涉及基站激活控制和波束赋形的长期联合优化方法。
背景技术
在异构网络的背景下,小区内经常布置很多不同类型的基站,而维持这些基站的运行将消耗大量的能量。基站激活控制通过关闭小区内服务冗余的运行基站降低网络能量消耗,这项技术在近几十年来受到极大的关注。通常基站激活控制和波束成形一起工作促使网络在QoS可接受范围内尽量服务更多的用户。由于这些问题是NP难的(NP难问题是指不存在一个解决这个问题的具有多项式时间的算法)混合整型规划问题,研究者多采用凸区间松弛或者施加稀疏限制来达到目的,以实现复杂度可以接受的处理。
尽管已有的各个方案在公式推导和算法设计各有差异,但是过往的研究都是基于即时的信道状态信息(CSI)来激活和关闭基站的,因此现有技术存在如下问题:
(1)由于基站运行状态可以随时改变,实际操作中网络的管理趋于复杂,导致了激活控制技术的实用性低;
(2)***出于管理的负担开销很重,***的运维成本高,资金投入大。
发明内容
针对现有技术中的上述不足,本发明提供了一种操作简便、降低运维成本和节约资金投入的基站激活控制和波束赋形的长期联合优化方法,考虑一段时间内的基站激活控制,控制基站的运行状态切换频率,以到达在维持基站激活的灵活性同时保持基站运行状态的一定程度的稳定性,从而提高了实用性,解决了现有技术存在的环境适应性低、操作复杂、实用性低、运维成本高以及资金投入大的问题。
为了达到上述发明目的,本发明采用的技术方案为:
一种基站激活控制和波束赋形的长期联合优化方法,包括以下步骤:
S1、初始化MISO网络中的中枢处理单元、网络控制单元和辅助处理单元的参数和配置;
S2、利用网络控制单元收集并处理网络内信道和基站服务状态信息,处理后输出到中枢处理单元;
S3、利用中枢处理单元根据收到的当前环境信息进行分析,并将基站激活和关闭方案返回到网络控制单元;
S4、利用网络控制单元根据接收到的方案将指定基站打开或关闭,然后结合信道信息计算并配置赋形波束,同时反馈网络中功率消耗指示量;
S5、利用辅助处理单元接收和保存***运行的历史数据,包括环境信息、基站配置方案、功率消耗指示量;
S6、利用辅助处理单元保存的数据协助中枢处理单元更新神经网络权重,辅助***正常运行;
S7、判断网络服务是否结束,若没有结束则返回步骤S2,否则结束流程。
进一步地,所述步骤S1中,初始化MISO网络中的中枢处理单元、网络控制单元和辅助处理单元的参数和配置包括:
设定网络中基站数K、发射端天线数M、下行用户数I以及划分时隙数T;
设定基站最大运行功率Pmax、噪声功率σ2、用户链路最低信噪比γ、维持基站运行开销控制量λ1,基站工作状态切换控制量λ2
设定中枢处理单元的神经网络结构,初始化网络权重θ和控制参数α、Xf,初始化辅助处理单元内存上限D和辅助控制参数Xb
进一步地,所述步骤S2中,利用网络控制单元收集并处理网络内当前信道和上一时刻的基站服务状态信息,处理后输出到中枢处理单元,表示为:
st=φ(Htt-1)
其中,st为处理后的当前环境信息;Htt-1分别为网络中当前信道信息和上一时刻基站服务状态信息,φ(·)为网络控制单元内的映射函数。
进一步地,所述步骤S4中,利用网络控制单元根据接收到的方案将指定基站打开或关闭,然后结合信道信息Ht计算并配置赋形波束Wt,同时反馈网络中功率消耗指示量rt,包括以下分步骤:
S4-1、设定辅助变量和中间参量;
S4-2、初始化迭代控制参数;
S4-3、更新当前目标函数值,更新公式为:
Figure BDA0002364565660000031
其中,
Figure BDA0002364565660000032
为更新的目标函数值,
Figure BDA0002364565660000033
为下一代目标函数值,n为迭代次数指示量;
S4-4、根据辅助变量和中间参量计算下一代波束赋形矩阵,并更新辅助变量和中间参量;
S4-5、计算下一代目标函数值,更新内层迭代参数,并根据下一代目标函数值、当前目标函数值以及内层迭代次数指示量判断是否符合要求,若是则输出波束赋形矩阵进入步骤S4-6,否则进入步骤S4-3;
S4-6、根据计算出的束赋形矩阵Wt、上一时刻基站服务状态指示量αt-1和当前基站服务状态指示量αt,输出网络中功率消耗指示量rt
进一步地,所述步骤S4-4中,根据辅助变量和中间参量计算下一代波束赋形矩阵,并更新辅助变量和中间参量,包括以下分步骤:
S4-4-1、根据当前辅助变量和当前中间参量计算内层下一代波束赋形矩阵,计算公式为:
Figure BDA0002364565660000041
其中,Wk为基站K对网络内用户的波束赋形矩阵;
S4-4-2、更新辅助变量F,更新公式为:
定义
Figure BDA0002364565660000042
Figure BDA0002364565660000043
其中,fi为F的第i行,
Figure BDA0002364565660000044
为fi的第i个元素,
Figure BDA0002364565660000045
为fi去除
Figure BDA0002364565660000046
剩余的元素组成的向量,yi为Y的第i行,
Figure BDA0002364565660000047
为yi的第i个元素,
Figure BDA0002364565660000048
为yi去除
Figure BDA0002364565660000049
剩余的元素组成的向量,β为满足约束条件的参量,[·]+为取非负值,1为元素全为1的列向量;
S4-4-3、更新辅助变量U,更新公式为:
Figure BDA0002364565660000051
其中,Fu和Φu分别是Fn+1和Φn去掉最后一列的左子矩阵;
S4-4-4、更新中间参量{Ψ,Φ},更新公式为:
Figure BDA0002364565660000052
进一步地,所述步骤S4-5中,根据下一代目标函数值、当前目标函数值以及内层迭代次数指示量判断是否符合要求的判断公式为:
Figure BDA0002364565660000053
其中,
Figure BDA0002364565660000054
为更新的目标函数值,
Figure BDA0002364565660000055
为下一代目标函数值,n为迭代次数指示量,N为最大迭代次数,err为迭代前后目标函数的差值。
进一步地,所述步骤S4-6中,根据计算出的束赋形矩阵Wt、上一时刻基站服务状态指示量αt-1和当前基站服务状态指示量αt,输出网络中功率消耗指示量rt的计算公式为:
Figure BDA0002364565660000056
Δ=max(0,γ-γmm)
Pall(t)=Pt(t)+λ1Pm(t)+λ2Ps(t)
其中,C1为反馈量幅度控制因子,C2为违反用户链路服务质量要求的惩罚因子,Pt(t),Pm(t),Ps(t)分别为时隙t网络中基站的总发射功率、维持基站运行功率和基站状态切换功率,λ12分别为维持基站运行开销控制量和基站工作状态切换控制量,γ为预设的用户服务质量下限,γmm为时隙t采取决策a时网络中用户服务质量上限值。
进一步地,所述步骤S5中,利用辅助处理单元接收和保存***运行的历史数据具体为:
每次将环境信息、基站配置方案、功率消耗指示量及下一时刻环境信息作为一个元组记录在辅助处理单元内存中。
进一步地,所述步骤S6中,利用辅助处理单元保存的数据协助中枢处理单元更新神经网络权重,辅助***正常运行,具体包括以下分步骤:
S6-1、利用辅助处理单元从内存中均匀抽样Xb个经验条元组(s,a,r,s′),输出到中枢处理单元;
S6-2、制作标签,表示为:
Figure BDA0002364565660000061
S6-3、定义损失函数loss=||z-B(s|θ)||2,根据损失函数更新待估计神经网络B(s|θ)权重,表示为:
Figure BDA0002364565660000062
S6-4、中枢处理单元每间隔Xf步更新步骤,将目标神经网络B-(s|θ-)权重更新为待估计神经网络B(s|θ)权重θ-←θ。
本发明具有以下有益效果:
(1)本发明在网络中基站管理控制和通信链路切换方面具有明显的优势,保证了QoS情况下,同时降低了***开销和额外的资源花费,降低了***的运维成本,节约了资金投入;
(2)本发明将一段时期划分为多个时隙,将信道建模为块衰落信道,在时隙内部信道近似为平坦衰落信道,使得后续问题的处理大大简化,进一步的降低了操作复杂度,提高了实用性。
附图说明
图1是本发明的基站激活控制和波束赋形的长期联合优化方法流程示意图;
图2是本发明的总体设计示意图;
图3是本发明和传统方案功率消耗仿真结果对比图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1和图2所示,本发明实施例提供了一种基站激活控制和波束赋形的长期联合优化方法,包括以下步骤S1至S7:
S1、初始化MISO网络中的中枢处理单元、网络控制单元和辅助处理单元的参数和配置;
在本实施例中,本发明初始化MISO(multiple-input-single-output,多输入单输出)网络中的中枢处理单元(central process unit,CPU)、网络控制单元(networkcontrol unit,NCU)和辅助处理单元(auxiliary process unit,APU)的参数和配置包括:
设定网络中基站数K、发射端天线数M、下行用户数I以及划分时隙数T;
设定基站最大运行功率Pmax、噪声功率σ2、用户链路最低信噪比γ、维持基站运行开销控制量λ1,基站工作状态切换控制量λ2
设定中枢处理单元的神经网络结构,初始化网络权重θ和控制参数α、Xf,初始化辅助处理单元内存上限D和辅助控制参数Xb
S2、利用网络控制单元收集并处理网络内信道和基站服务状态信息,处理后输出到中枢处理单元;
在本实施例中,本发明利用网络控制单元收集并处理网络内当前信道和上一时刻的基站服务状态信息,处理后输出到中枢处理单元,表示为:
st=φ(Htt-1)
其中,st为处理后的当前环境信息;Htt-1分别为网络中当前信道信息和上一时刻基站服务状态信息,φ(·)为网络控制单元内的映射函数。
S3、利用中枢处理单元根据收到的当前环境信息进行分析,并将基站激活和关闭方案返回到网络控制单元;
在本实施例中,本发明所指的基站激活和关闭方案即为基站状态指示向量αt,基站状态指示向量αt的元素为0或1,表示对应基站激活或关闭。
S4、利用网络控制单元根据接收到的方案将指定基站打开或关闭,然后结合信道信息计算并配置赋形波束,同时反馈网络中功率消耗指示量;
在本实施例中,本发明利用网络控制单元根据接收到的方案将指定基站打开或关闭,然后结合信道信息Ht计算并配置赋形波束Wt,同时反馈网络中功率消耗指示量rt,进一步包括以下分步骤:
S4-1、设定辅助变量和中间参量;
S4-2、初始化迭代控制参数;
S4-3、更新当前目标函数值,更新公式为:
Figure BDA0002364565660000081
其中,
Figure BDA0002364565660000082
为更新的目标函数值,
Figure BDA0002364565660000083
为下一代目标函数值,n为迭代次数指示量;
S4-4、根据辅助变量和中间参量计算下一代波束赋形矩阵,并更新辅助变量和中间参量,包括以下分步骤:
S4-4-1、根据当前辅助变量和当前中间参量计算内层下一代波束赋形矩阵,计算公式为:
Figure BDA0002364565660000091
其中,Wk为基站K对网络内用户的波束赋形矩阵,CM×I表示M×I的复矩阵,其计算公式为
Figure BDA0002364565660000092
其中,Uk和Ψk为中间参量,δ为满足约束条件的参量,ρ为迭代收敛速率控制量。
Figure BDA0002364565660000093
则δ=0;
否则用二分法寻找δ>0满足
Figure BDA0002364565660000094
S4-4-2、更新辅助变量F,更新公式为:
定义
Figure BDA0002364565660000095
Figure BDA0002364565660000096
其中,fi为F的第i行,
Figure BDA0002364565660000101
为fi的第i个元素,
Figure BDA0002364565660000102
为fi去除
Figure BDA0002364565660000103
剩余的元素组成的向量,yi为Y的第i行,
Figure BDA0002364565660000104
为yi的第i个元素,
Figure BDA0002364565660000105
为yi去除
Figure BDA0002364565660000106
剩余的元素组成的向量,β为满足约束条件的参量,[·]+为取非负值,1为元素全为1的列向量;
S4-4-3、更新辅助变量U,更新公式为:
Figure BDA0002364565660000107
其中,Fu和Φu分别是Fn+1和Φn去掉最后一列的左子矩阵;
S4-4-4、更新中间参量{Ψ,Φ},更新公式为:
Figure BDA0002364565660000108
S4-5、计算下一代目标函数值,更新内层迭代参数,并根据下一代目标函数值、当前目标函数值以及内层迭代次数指示量判断是否符合要求,判断公式为:
Figure BDA0002364565660000109
其中,
Figure BDA00023645656600001010
为更新的目标函数值,
Figure BDA00023645656600001011
为下一代目标函数值,n为迭代次数指示量,N为最大迭代次数,err为迭代前后目标函数的差值。
若是则输出波束赋形矩阵进入步骤S4-6,否则进入步骤S4-3;
S4-6、根据计算出的束赋形矩阵Wt、上一时刻基站服务状态指示量αt-1和当前基站服务状态指示量αt,输出网络中功率消耗指示量rt,计算公式为:
Figure BDA00023645656600001012
Δ=max(0,γ-γmm)
Pall(t)=Pt(t)+λ1Pm(t)+λ2Ps(t)
其中,C1为反馈量幅度控制因子,C2为违反用户链路服务质量要求的惩罚因子,Pt(t),Pm(t),Ps(t)分别为时隙t网络中基站的总发射功率、维持基站运行功率和基站状态切换功率,λ12分别为维持基站运行开销控制量和基站工作状态切换控制量,γ为预设的用户服务质量下限,γmm为时隙t采取决策a时网络中用户服务质量上限值,可用二分法求出,表示为
Pm(t)=pm||at||1
Ps(t)=ps||at-at-1||1
Figure BDA0002364565660000111
其中,pm和ps分别表示维持基站运行消耗的功率和基站服务状态切换消耗的功率,设置为某一合适正常数。
S5、利用辅助处理单元接收和保存***运行的历史数据,包括环境信息、基站配置方案、功率消耗指示量;
在本实施例中,本发明每次将环境信息st、基站配置方案at-1、功率消耗指示量rt及下一时刻环境信息st+1作为一个元组记录在辅助处理单元内存中。
S6、利用辅助处理单元保存的数据协助中枢处理单元更新神经网络权重,辅助***正常运行;
在本实施例中,本发明利用辅助处理单元保存的数据协助中枢处理单元更新神经网络权重,辅助***正常运行,具体包括以下分步骤:
S6-1、利用辅助处理单元从内存中均匀抽样Xb个经验条元组(s,a,r,s′),这里s,a,r,s′分别表示任意t的st、at-1、rt、st+1,输出到中枢处理单元;
S6-2、制作标签,表示为:
Figure BDA0002364565660000121
其中,z表示标签,a′表示在st+1时的基站配置方案;
S6-3、定义损失函数loss=||z-B(s|θ)||2,根据损失函数更新待估计神经网络B(s|θ)权重,表示为:
Figure BDA0002364565660000122
S6-4、中枢处理单元每间隔Xf步更新步骤,将目标神经网络B-(s|θ-)权重更新为待估计神经网络B(s|θ)权重θ-←θ。
其中,v=B(s|θ)为待估计网络;v-=B-(s|θ-)为目标网络;va=B(s,a|θ)表示选择基站配置方案a对应的值va;其中θ和θ-表示神经网络权重参数;
Figure BDA0002364565660000123
表示2K个基站配置方案对应的价值向量;θ和目标θ-表示网络权重参数。
S7、判断网络服务是否结束,若没有结束则返回步骤S2,否则结束流程。
本发明实施例中,考虑一个有5个4天线基站BS和5个单天线用户的小区,K=5,I=5,用户随机分布在半径为1km的六边形小区内,基站位于小区中心。假设某个传输过程划分为10个传输时隙,T=10;在具体实施过程中,利用标准复高斯产生信道矩阵H,其方差服从小区与用户的概率分布模型,设置λ2=50、用户信噪比最低门限γ=1、发射功率ps=1、噪声方差σ2=1、基站运行维持功率pm=1、基站服务状态切换功率ps=1、反馈量幅度控制因子C1=103、违反用户链路服务质量要求的惩罚因子C2=106、CPU控制参数α=0.3,Xf=5,APU内存上限D=10,辅助控制参数Xb=10;
每个时隙计算各个基站的波束赋形矩阵Wk,迭代次数指示量n=0、迭代收敛速率控制量ρ=10,迭代前后目标值的最小差值err=10-2,最大迭代次数N=100。本发明和传统的方案仿真性能在改变控制量λ1值下进行比较,两种算法仿真结果如图3所示。
本发明提供的一种操作简便、降低运维成本和节约资金投入的基站激活控制和波束赋形的长期联合优化方法,提高了实用性,解决了现有技术存在的环境适应性低、操作复杂、实用性低、运维成本高以及资金投入大的问题。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (3)

1.一种基站激活控制和波束赋形的长期联合优化方法,其特征在于,包括以下步骤:
S1、初始化MISO网络中的中枢处理单元、网络控制单元和辅助处理单元的参数和配置,包括:
设定网络中基站数K、发射端天线数M、下行用户数I以及划分时隙数T;
设定基站最大运行功率Pmax、噪声功率σ2、用户链路最低信噪比γ、维持基站运行开销控制量λ1,基站工作状态切换控制量λ2
设定中枢处理单元的神经网络结构,初始化网络权重θ和控制参数α、Xf,初始化辅助处理单元内存上限D和辅助控制参数Xb
S2、利用网络控制单元收集并处理网络内信道和基站服务状态信息,处理后输出到中枢处理单元,表示为:
st=φ(Htt-1)
其中,st为处理后的当前环境信息;Htt-1分别为网络中当前信道信息和上一时刻基站服务状态信息,φ(·)为网络控制单元内的映射函数;
S3、利用中枢处理单元根据收到的当前环境信息进行分析,并将基站激活和关闭方案返回到网络控制单元;其中基站激活和关闭方案即为基站状态指示向量αt,基站状态指示向量αt的元素为0或1,表示对应基站激活或关闭;
S4、利用网络控制单元根据接收到的方案将指定基站打开或关闭,然后结合信道信息计算并配置赋形波束,同时反馈网络中功率消耗指示量,包括以下分步骤:
S4-1、设定辅助变量和中间参量;
S4-2、初始化迭代控制参数;
S4-3、更新当前目标函数值,更新公式为:
Figure FDA0002841030640000021
其中,
Figure FDA0002841030640000022
为更新的目标函数值,
Figure FDA0002841030640000023
为下一代目标函数值,n为迭代次数指示量;
S4-4、根据辅助变量和中间参量计算下一代波束赋形矩阵,并更新辅助变量和中间参量,包括以下分步骤:
S4-4-1、根据当前辅助变量和当前中间参量计算内层下一代波束赋形矩阵,计算公式为:
Figure FDA0002841030640000024
其中,Wk为基站K对网络内用户的波束赋形矩阵;
S4-4-2、更新辅助变量F,更新公式为:
定义
Figure FDA0002841030640000025
Figure FDA0002841030640000026
其中,fi为F的第i行,fi i为fi的第i个元素,
Figure FDA0002841030640000027
为fi去除fi i剩余的元素组成的向量,yi为Y的第i行,
Figure FDA0002841030640000028
为yi的第i个元素,
Figure FDA0002841030640000029
为yi去除
Figure FDA00028410306400000210
剩余的元素组成的向量,β为满足约束条件的参量,[·]+为取非负值,1为元素全为1的列向量;
S4-4-3、更新辅助变量U,更新公式为:
Figure FDA00028410306400000211
其中,Fu和Φu分别是Fn+1和Φn去掉最后一列的左子矩阵;
S4-4-4、更新中间参量{Ψ,Φ},更新公式为:
Figure FDA0002841030640000031
S4-5、计算下一代目标函数值,更新内层迭代参数,并根据下一代目标函数值、当前目标函数值以及内层迭代次数指示量判断是否符合要求,若是则输出波束赋形矩阵进入步骤S4-6,否则进入步骤S4-3;
S4-6、根据计算出的束赋形矩阵Wt、上一时刻基站服务状态指示量αt-1和当前基站服务状态指示量αt,输出网络中功率消耗指示量rt
S5、利用辅助处理单元接收和保存***运行的历史数据,包括环境信息、基站配置方案、功率消耗指示量,具体为:
每次将环境信息、基站配置方案、功率消耗指示量及下一时刻环境信息作为一个元组记录在辅助处理单元内存中;
S6、利用辅助处理单元保存的数据协助中枢处理单元更新神经网络权重,辅助***正常运行,具体包括以下分步骤:
S6-1、利用辅助处理单元从内存中均匀抽样Xb个经验条元组(s,a,r,s′),输出到中枢处理单元;其中s,a,r,s′分别表示任意t的st、at-1、rt、st+1
S6-2、制作标签,表示为:
Figure FDA0002841030640000032
S6-3、定义损失函数loss=||z-B(s|θ)||2,根据损失函数更新待估计神经网络B(s|θ)权重,表示为:
Figure FDA0002841030640000033
S6-4、中枢处理单元每间隔Xf步更新步骤,将目标神经网络B-(s|θ-)权重更新为待估计神经网络B(s|θ)权重θ-←θ;
S7、判断网络服务是否结束,若没有结束则返回步骤S2,否则结束流程。
2.如权利要求1所述的基站激活控制和波束赋形的长期联合优化方法,其特征在于,所述步骤S4-5中,根据下一代目标函数值、当前目标函数值以及内层迭代次数指示量判断是否符合要求的判断公式为:
Figure FDA0002841030640000041
其中,
Figure FDA0002841030640000042
为更新的目标函数值,
Figure FDA0002841030640000043
为下一代目标函数值,n为迭代次数指示量,N为最大迭代次数,err为迭代前后目标函数的差值。
3.如权利要求1所述的基站激活控制和波束赋形的长期联合优化方法,其特征在于,所述步骤S4-6中,根据计算出的束赋形矩阵Wt、上一时刻基站服务状态指示量αt-1和当前基站服务状态指示量αt,输出网络中功率消耗指示量rt的计算公式为:
Figure FDA0002841030640000044
Δ=max(0,γ-γmm)
Pall(t)=Pt(t)+λ1Pm(t)+λ2Ps(t)
其中,C1为反馈量幅度控制因子,C2为违反用户链路服务质量要求的惩罚因子,Pt(t),Pm(t),Ps(t)分别为时隙t网络中基站的总发射功率、维持基站运行功率和基站状态切换功率,λ12分别为维持基站运行开销控制量和基站工作状态切换控制量,γ为预设的用户服务质量下限,γmm为时隙t采取决策a时网络中用户服务质量上限值。
CN202010031744.5A 2020-01-13 2020-01-13 基站激活控制和波束赋形的长期联合优化方法 Active CN111182571B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010031744.5A CN111182571B (zh) 2020-01-13 2020-01-13 基站激活控制和波束赋形的长期联合优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010031744.5A CN111182571B (zh) 2020-01-13 2020-01-13 基站激活控制和波束赋形的长期联合优化方法

Publications (2)

Publication Number Publication Date
CN111182571A CN111182571A (zh) 2020-05-19
CN111182571B true CN111182571B (zh) 2021-02-02

Family

ID=70656432

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010031744.5A Active CN111182571B (zh) 2020-01-13 2020-01-13 基站激活控制和波束赋形的长期联合优化方法

Country Status (1)

Country Link
CN (1) CN111182571B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112996090B (zh) * 2021-01-21 2022-08-23 西藏先锋绿能环保科技股份有限公司 一种节能管理***及方法
CN113489521B (zh) * 2021-05-26 2023-05-09 电子科技大学 反射面辅助无小区大规模mimo网络联合波束赋形方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581905A (zh) * 2014-12-31 2015-04-29 华中科技大学 一种协作HetNet中小基站激活的方法
CN104581780A (zh) * 2014-12-18 2015-04-29 哈尔滨工业大学 一种基于预处理的分枝剪枝联合网络优化和波束成形方法
CN106211199A (zh) * 2016-07-20 2016-12-07 电子科技大学 用于miso无线网络的基站激活与用户接入联合控制方法
CN107087279A (zh) * 2017-06-13 2017-08-22 电子科技大学 一种基于稳定接入关系的基站激活和波束成形方法
EP3413616A1 (en) * 2016-02-04 2018-12-12 Ntt Docomo, Inc. User device, base station, channel identification method, and identifier transmission method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180227772A1 (en) * 2017-02-06 2018-08-09 Mediatek Inc. Mechanism for Beam Reciprocity Determination and Uplink Beam Management
WO2019161786A1 (en) * 2018-02-23 2019-08-29 Mediatek Inc. Default beam for uplink transmission after beam failure recovery
CN109743268B (zh) * 2018-12-06 2022-02-15 东南大学 基于深度神经网络的毫米波信道估计和压缩方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104581780A (zh) * 2014-12-18 2015-04-29 哈尔滨工业大学 一种基于预处理的分枝剪枝联合网络优化和波束成形方法
CN104581905A (zh) * 2014-12-31 2015-04-29 华中科技大学 一种协作HetNet中小基站激活的方法
EP3413616A1 (en) * 2016-02-04 2018-12-12 Ntt Docomo, Inc. User device, base station, channel identification method, and identifier transmission method
CN106211199A (zh) * 2016-07-20 2016-12-07 电子科技大学 用于miso无线网络的基站激活与用户接入联合控制方法
CN107087279A (zh) * 2017-06-13 2017-08-22 电子科技大学 一种基于稳定接入关系的基站激活和波束成形方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Joint Long-Term Admission Control and Beamforming in Downlink MISO Networks;Jingran Lin 等;《2018 26th European Signal Processing Conference(EUSIPCO)》;20180907;全文 *

Also Published As

Publication number Publication date
CN111182571A (zh) 2020-05-19

Similar Documents

Publication Publication Date Title
CN109729528B (zh) 一种基于多智能体深度强化学习的d2d资源分配方法
Chu et al. Power control in energy harvesting multiple access system with reinforcement learning
CN111182571B (zh) 基站激活控制和波束赋形的长期联合优化方法
CN107070534B (zh) 一种中继卫星负载均衡的动态抢占式任务调度方法及***
Li et al. Energy-efficient task offloading, load balancing, and resource allocation in mobile edge computing enabled IoT networks
Van Huynh et al. Digital twin empowered ultra-reliable and low-latency communications-based edge networks in industrial IoT environment
CN110300417B (zh) 无人机通信网络的能量效率优化方法和装置
Tham et al. Deep reinforcement learning for resource allocation in 5G communications
Zhao et al. Context-aware TDD configuration and resource allocation for mobile edge computing
Liu et al. Energy-efficient on-demand resource provisioning in cloud radio access networks
Fourati et al. An efficient energy-saving scheme using genetic algorithm for 5G heterogeneous networks
Li et al. Throughput maximization by deep reinforcement learning with energy cooperation for renewable ultradense IoT networks
Li et al. Parallel deep reinforcement learning based online user association optimization in heterogeneous networks
Lei et al. Efficient minimum-energy scheduling with machine-learning based predictions for multiuser MISO systems
Xiao et al. Towards energy efficient resource allocation: When green mobile edge computing meets multi-agent deep reinforcement learning
Azizi et al. MIX-MAB: Reinforcement learning-based resource allocation algorithm for LoRaWAN
CN109089307B (zh) 一种基于异步优势行动者评论家算法的集能型无线中继网络吞吐量最大化方法
Lu et al. Joint beamforming and power control for MIMO-NOMA with deep reinforcement learning
CN114521023A (zh) Swipt辅助noma-mec***资源分配建模方法
Wang et al. Sequential offloading for distributed DNN computation in multiuser MEC systems
CN107995034B (zh) 一种密集蜂窝网络能量与业务协作方法
CN116074974A (zh) 一种分层架构下的多无人机群通道接入控制方法
Chen et al. Adaptive multi-objective reinforcement learning for pareto frontier approximation: A case study of resource allocation network in massive mimo
CN114364034A (zh) 基于drl的ris辅助用户中心化去蜂窝***中资源管理半并行方法
Lei et al. Sparsification and optimization for energy-efficient federated learning in wireless edge networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant