CN112911613A - 一种用于noma-mec网络的基于drl的流量卸载算法及实现装置 - Google Patents
一种用于noma-mec网络的基于drl的流量卸载算法及实现装置 Download PDFInfo
- Publication number
- CN112911613A CN112911613A CN202011349607.2A CN202011349607A CN112911613A CN 112911613 A CN112911613 A CN 112911613A CN 202011349607 A CN202011349607 A CN 202011349607A CN 112911613 A CN112911613 A CN 112911613A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- strategy
- network
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010042135 Stomatitis necrotising Diseases 0.000 title claims abstract description 6
- 201000008585 noma Diseases 0.000 title claims abstract description 6
- 230000005540 biological transmission Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 17
- 238000005265 energy consumption Methods 0.000 claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims abstract 4
- 238000013507 mapping Methods 0.000 claims abstract 2
- 238000012545 processing Methods 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 6
- 230000002787 reinforcement Effects 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/06—Testing, supervising or monitoring using simulated traffic
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种用于NOMA‑MEC网络的基于DRL的流量卸载算法及实现装置,用于自适应更新MEC中用户的数据缓存策略。该算法利用深度神经网络,基于用户不同时隙的信道特性,学习得到使网络总能耗最低的卸载策略。针对选择将数据卸载至MEC服务器的用户集合,本发明采用一种循环非正交多址方案将数据传输至服务器进一步降低传输时延。考虑到卸载策略的二值性,本发明将神经网络的实际输出基于不同的映射量化为多组实际可行策略,选择能效性能最好的解作为最优解,并通过训练使网络输出和最优解之间的交叉熵渐近收敛。
Description
技术领域
本发明涉及无线通信技术领域,将非正交多址(NOMA)技术应用于移动边缘计算(MEC)中,并进一步利用深度强化学习(DRL)高效自适应地得到用户的数据卸载策略以降低***时延和能量消耗。
背景技术
移动边缘计算(MEC)技术通过将IT服务环境和云计算技术在网络边缘相结合,有效提高边缘网络的计算和存储能力,进一步减少网络操作和服务交付时延,提升用户服务质量体验,在5G移动网络中得到了广泛的研究。通过将计算和存储能力“下沉”到网络边缘,用户请求不再需要经过漫长的传输网络到达遥远的核心网被处理,而是由部署在本地的MEC服务器将一部分流量进行卸载,直接处理并响应用户,进而大大降低通信时延。基于传统正交多址(OMA)方案(以TDMA为例)实现数据卸载时,单个时隙仅分配给唯一一个用户用于上行数据传输,大大限制了由MEC带来的时延性能的提升。
为解决OMA方案的不足,非正交多址(NOMA)技术通过非正交传输方式,在MEC服务器采用串行干扰消除(SIC,successive interference cancellation)技术实现解调,从而将同一信道分配给多个用户。利用NOMA部署缓存,可以有效提升网络的传输效率,并进一步降低网络能耗。然而NOMA以人工引入干扰为代价实现频谱效率的提升,其带来增益的大小和复用用户的信道条件息息相关。针对采用NOMA进行数据卸载的MEC网络,如何选择最优复用用户以提升网络缓存性能为本发明主要解决的问题。
发明内容
本发明针对NOMA-MEC网络提出了一种基于DRL的用户数据卸载算法。该算法基于深度强化学习,利用观测得到的用户信道状态,快速自适应地决定用户的数据卸载策略。基于该算法得到的策略,可有效降低***的能耗和时延,并对移动用户具有较好的鲁棒性。
本发明的具体实现过程如下:
步骤1:***模型
考虑上行多用户场景,假定每一用户有L bits数据等待处理,任一用户的数据可选择通过本地计算或基于NOMA缓存至MEC服务器处理。变量λi表示第i个用户处理方案,其中λi=0对应本地计算,λi=1表示缓存至MEC服务器。假定编号大的用户对应的信道增益更强,即|hi|≤|hj|,其中K表示总用户数。UN={i(1),i(2),...,i(N)}表示通过NOMA缓存数据的用户集合,i(k)表示第k个NOMA用户的编号,根据前文有λi(k)=1,考虑NOMA的实际实现,假定i(1)<i(2)<...<i(N)。
本发明实现NOMA时,仅考虑簇容量为2的情况,即单个时隙仅复用两个用户。基于前文假设,UN中的用户按信道增益升序排列。基于排好的序列,***依次调度两个用户利用NOMA实现数据缓存。首先将用户i(1)和用户i(2)的数据利用非正交方式传输给服务器。在服务器端,基于SIC技术准则,上行接收应先解码信道状况较好的用户的信号,即i(2)的信号。此时i(1)用户的速率等效于基于OMA传输时的速率,具体可表示为:
其中B表示传输带宽,pi(1)、hi(1)分别表示用户i(1)的传输功率和信道增益,σ2表示噪声功率。用户i(1)的传输时间Ti(1)可相应的表示为:
在此期间,由于服务器解码i(2)时将i(1)的信号视为噪声,i(2)的实际速率远小于其基于OMA传输时的速率。因此,在Ti(1)时间内,用户i(2)的实际传输比特可能远小于Lbits。因此在Ti(1)后,***引入用户i(3)并将i(2)和i(3)复用继续传输数据。用户i(2)的传输因此可分为两部分,分别与i(1)和i(3)复用。与i(1)复用时,传输速率可表示为:
其中pi(2)、hi(2)分别表示用户i(2)的传输功率和信道增益。与i(3)复用时,由于i(3)的信道增益更大,i(3)的数据先被解调,此时i(2)的速率等效于OMA场景,具体表示为:
基于上述方案,任一复用用户i(k),(1<k<N)的传输均可划分为两个阶段,分别与i(k-1)和i(k+1)复用,其传输时间Ti(k)可表示为:
Ti(k)=Ti(k),1+Ti(k),2 (5)
li(k),1=Ri(k),1Ti(k),1 (7)
其中Ti(k),j、li(k),j,(j=1,2)分别表示用户i(k)在第j个阶段消耗的时间和实际传输的比特数,Ri(k),j,(j=1,2)表示用户i(k)在第j个阶段的实际速率。基于上文,NOMA的总时延TNOMA和总消耗能量ENOMA可分别表示为:
考虑本地处理的用户i∈{1,2,...,K}\UN(全部K个用户去除利用NOMA缓存数据的用户后的用户集合),其处理L bits数据消耗的时间可表示为:
其中φ表示处理1bit数据所需CPU周期,fi表示用户i的CPU频率,其与用户功率的关系可表示为:
afi 3≤pi (12)
a表示能量系数。本地处理的总时延Tlocal及消耗的能量Elocal可分别表示为:
考虑到MEC服务器的发射功率远高于功率受限的用户的发射功率,本发明中,MEC服务器数据处理及反馈回传的时间可忽略不计。针对能量受限的用户,本发明通过为其设计合理的数据处理方案,即λi,进一步提升NOMA-MEC网络的能量效率并降低传输时延。
步骤2:基于DRL的数据卸载策略
针对多用户场景,可能的传输方案共有2K种,遍历所有可行解的时间复杂度不可接受。本发明利用深度学习的思想,基于观测到的用户信道增益,利用DNN为λi输出一个近似解ai,其中ai为[0,1]范围内的实数。利用近似解进一步量化得到M个实际可行解,并基于每一个可行解计算***实际消耗能量Etotal=Elocal+ENOMA。选择能量最小的解作为最终解,并将其与信道观测向量一同存入内存中用于后续训练。实际训练过程采用经验回放技术。通过从内存中抽取不同时隙下的信道观测向量及对应的最优量化解作为mini-batch,利用Adam优化器使网络输出的近似解和最优量化解之间的交叉熵最小。
(1)第一个实际二进制可行解可表示为
具体实施例
下面是具体实施例的仿真参数:
仿真结果如图2,3,4所示。从图2可以看出,交叉熵损失函数随训练过程迅速收敛。当仿真时隙数超过3000时,损失值稳定在0.05左右,意味着此时输出近似解近似等于量化最优解。图3描述了基于不同策略,***的总消耗能量随训练过程的变化。Best Action描述量化得到的M个解中的最优解的性能,从图中可知,量化解中的最优解的能效性能较为稳定。Relaxed Action描述第一个量化解,即同DNN实际输出耦合最紧密的可行解的能效性能。由图3可知,随着训练过程的继续,第一个量化解的性能无限趋近于量化最优解,意味着网络渐渐具备利用用户的信道特征输出最优缓存策略的能力。图4描述不同策略下***的时延特性。由图可得,基于NOMA的策略相较于传统的TDMA方案,能够进一步降低***时延。当用户采用本地计算策略时,其消耗的时间仅受限于用户自身的功率,因此在多个训练时隙中,基于本地计算的***时延保持恒定。类似的,随着训练时隙的不断扩大,第一个量化解的性能无限趋近于量化最优解,意味着网络已具备自适应输出策略的能力。
总之,经上述仿真验证,本发明是成功的、可信的。
附图说明
图1是基于深度强化学习的数据卸载装置示意图;
图2是交叉熵损失函数随训练时隙的变化示意图;
图3是不同策略下***的总消耗功率随训练时隙的变化示意图;
图4是不同策略下***的总时延随训练时隙的变化示意图。
Claims (4)
1.一种针对NOMA-MEC网络,基于深度强化学习的用户数据卸载算法及实现装置,其特征在于,首先根据用户信道特性,利用深度神经网络学习得到用户最优卸载策略;在此基础上,针对将数据卸载至MEC服务器上处理的用户,采用非正交多址方式实现信道复用以进一步降低***时延。
2.根据权利要求1所述的方法,其特征在于,基于深度神经网络,利用K个用户在时隙t下的信道状态信息输出一个卸载策略的近似解其中ak(t)对应用户k在第t个时隙内的卸载策略λk(t)的近似解。λk(t)为二进制变量,λk(t)=1表示用户k将数据卸载至MEC服务器处理,λk(t)=0对应本地处理;为得到实际卸载策略,需要进一步将a(t)基于不同映射量化为多组二进制可行解,并根据不同可行解的能耗性能得到最优解;具体产生M组二进制可行解的方法可表示为:
(1)第一组实际二进制可行解可表示为
3.根据权利要求2所述的方法,其特征在于,求解任一可行策略{λm,i}下***的实际能耗时,首先根据策略得到将数据卸载至MEC服务器的用户集合并将UN中的用户按信道增益升序排列,然后依次以非正交多址方式调度用户进行数据传输;本发明仅考虑用户簇为2的情况,当其中一个用户完成数据传输时,***自动调度UN中的下一个用户跟当前数据未传完用户复用,即UN中的每个用户分别和前后两个用户复用;基于上述调度方式,UN中第k个用户的传输时延可表示为:
lk,1(t)=Rk,1(t)Tk,1(t) (6)
其中L表示每个用户待传输数据的总比特数,R1(t)表示UN中第一个用户的传输速率,B表示***带宽,p1(t)、h1(t)分别表示第一个用户在时隙t内的传输功率和信道增益,σ2表示噪声功率。Tk,j(t)、lk,j(t),(j=1,2)分别表示第k个用户同其前后两个用户复用时的传输时延和传输比特数;Rk,j(t),(j=1,2)表示第k个用户同其前后两个用户复用时的实际速率,具体可表示为:
其中pk(t)、hk(t)分别表示UN中第k个用户在时隙t内的传输功率和信道增益;UN中用户消耗的能量ENOMA可表示为:
采用本地模式工作的用户的消耗时延Tlocal和能量Elocal可分别表示为:
其中φ表示用户处理1bit数据所需CPU周期,a表示能量系数,pi(t)表示在本地工作模式下的用户i在时隙t内的传输功率;此时***的总能耗可表示为:
Etotal=Elocal+ENOMA (12)
针对权利要求2中生成的M组实际可行解,采用上述方法分别计算每一组解对应的***总能耗,然后选择总能耗最小的解作为该时隙的数据卸载方案;将每个时隙的信道观测向量和对应的卸载方案存储到内存中供训练使用;实际训练过程中,通过从内存中抽取不同时隙下的信道观测向量及对应的最优量化解作为mini-batch,利用Adam优化器使网络输出的近似解和最优量化解之间的交叉熵最小。
4.一种基于深度强化学习的数据卸载策略算法实现装置,可灵活决定用户数据的处理方式,其特征在于包括:
学习模块:根据权利要求2所述的方法,利用多用户某一时隙的信道状态信息学习得到多用户数据卸载近似策略;
量化模块:基于学习得到的近似策略,根据权利要求2所述的方法,量化得到M个可行策略;
求解模块:根据权利要求3所述的方法,求解在M个可行策略下***的总能耗,然后选取总能耗最小的量化策略作为最优策略;
存储模块:根据权利要求3所述的方法,将用户的信道状态信息作为输入,基于求解模块得到的最优策略作为标签,把输入和标签整体存储在内存中,供后续训练使用;
训练模块:根据权利要求3所述的方法,利用Adam优化器,通过最小化网络输出和标签之间的交叉熵损失函数,提高网络的学习能力。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011349607.2A CN112911613A (zh) | 2020-11-26 | 2020-11-26 | 一种用于noma-mec网络的基于drl的流量卸载算法及实现装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011349607.2A CN112911613A (zh) | 2020-11-26 | 2020-11-26 | 一种用于noma-mec网络的基于drl的流量卸载算法及实现装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112911613A true CN112911613A (zh) | 2021-06-04 |
Family
ID=76111332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011349607.2A Pending CN112911613A (zh) | 2020-11-26 | 2020-11-26 | 一种用于noma-mec网络的基于drl的流量卸载算法及实现装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112911613A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114973673A (zh) * | 2022-05-24 | 2022-08-30 | 华南理工大学 | 车路协同***中结合noma和内容缓存的任务卸载方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109068391A (zh) * | 2018-09-27 | 2018-12-21 | 青岛智能产业技术研究院 | 基于边缘计算和Actor-Critic算法的车联网通信优化算法 |
CN109688596A (zh) * | 2018-12-07 | 2019-04-26 | 南京邮电大学 | 一种基于noma的移动边缘计算***构建方法 |
CN110113190A (zh) * | 2019-04-24 | 2019-08-09 | 西北工业大学 | 一种移动边缘计算场景中卸载时延优化方法 |
US20190356446A1 (en) * | 2017-01-06 | 2019-11-21 | Electronics And Telecommunications Research Institute | Uplink control information transmission method and device |
US20190372644A1 (en) * | 2018-06-01 | 2019-12-05 | Samsung Electronics Co., Ltd. | Method and apparatus for machine learning based wide beam optimization in cellular network |
CN111245539A (zh) * | 2020-01-07 | 2020-06-05 | 南京邮电大学 | 一种基于noma的移动边缘计算网络高效资源分配方法 |
CN111818130A (zh) * | 2020-06-17 | 2020-10-23 | 华北电力大学(保定) | 基于强化学习缓存与计算的联合优化 |
-
2020
- 2020-11-26 CN CN202011349607.2A patent/CN112911613A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190356446A1 (en) * | 2017-01-06 | 2019-11-21 | Electronics And Telecommunications Research Institute | Uplink control information transmission method and device |
US20190372644A1 (en) * | 2018-06-01 | 2019-12-05 | Samsung Electronics Co., Ltd. | Method and apparatus for machine learning based wide beam optimization in cellular network |
CN109068391A (zh) * | 2018-09-27 | 2018-12-21 | 青岛智能产业技术研究院 | 基于边缘计算和Actor-Critic算法的车联网通信优化算法 |
CN109688596A (zh) * | 2018-12-07 | 2019-04-26 | 南京邮电大学 | 一种基于noma的移动边缘计算***构建方法 |
CN110113190A (zh) * | 2019-04-24 | 2019-08-09 | 西北工业大学 | 一种移动边缘计算场景中卸载时延优化方法 |
CN111245539A (zh) * | 2020-01-07 | 2020-06-05 | 南京邮电大学 | 一种基于noma的移动边缘计算网络高效资源分配方法 |
CN111818130A (zh) * | 2020-06-17 | 2020-10-23 | 华北电力大学(保定) | 基于强化学习缓存与计算的联合优化 |
Non-Patent Citations (4)
Title |
---|
DONGYU WANG: "Reinforcement Learning-Based Joint Task Offloading and Migration Schemes Optimization in Mobility-Aware MEC Network", 《中国通信》 * |
PEIRAN DONG: "NOMA-based energy-efficient task scheduling in vehicular edge computing networks: A self-imitation learning-based approach", 《CHINA COMMUNICATIONS》 * |
YAFENG WANG: "Bounded UDE-Based Control for a SLAM Equipped Quadrotor with Input Constraints", 《2019 AMERICAN CONTROL CONFERENCE (ACC)》 * |
卢海峰;顾春华;罗飞;丁炜超;杨婷;郑帅;: "基于深度强化学习的移动边缘计算任务卸载研究", 计算机研究与发展, no. 07 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114973673A (zh) * | 2022-05-24 | 2022-08-30 | 华南理工大学 | 车路协同***中结合noma和内容缓存的任务卸载方法 |
CN114973673B (zh) * | 2022-05-24 | 2023-07-18 | 华南理工大学 | 车路协同***中结合noma和内容缓存的任务卸载方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Deep reinforcement learning based dynamic channel allocation algorithm in multibeam satellite systems | |
Sun et al. | Adaptive federated learning with gradient compression in uplink NOMA | |
CN113222179B (zh) | 一种基于模型稀疏化与权重量化的联邦学习模型压缩方法 | |
US11671151B2 (en) | Efficient peak-to-average-power reduction for OFDM and MIMO-OFDM | |
CN113590279B (zh) | 一种面向多核边缘计算服务器的任务调度和资源分配方法 | |
CN114697333B (zh) | 一种能量队列均衡的边缘计算方法 | |
CN113727362B (zh) | 一种基于深度强化学习的无线供电***的卸载策略方法 | |
Zhu et al. | A novel cross entropy approach for offloading learning in mobile edge computing | |
CN114866133B (zh) | 一种卫星云边协同计算的计算卸载方法 | |
Padakandla et al. | Energy sharing for multiple sensor nodes with finite buffers | |
Abdi et al. | Analog compression and communication for federated learning over wireless MAC | |
CN114513855A (zh) | 基于无线携能通信的边缘计算卸载决策与资源分配方法 | |
CN112911613A (zh) | 一种用于noma-mec网络的基于drl的流量卸载算法及实现装置 | |
Binucci et al. | Dynamic resource allocation for multi-user goal-oriented communications at the wireless edge | |
Ouyang | Task offloading algorithm of vehicle edge computing environment based on Dueling-DQN | |
Nie et al. | Cooperative edge caching in small cell networks with heterogeneous channel qualities | |
CN113490239B (zh) | 基于自适应网络编码的异构无线链路并发传输控制方法 | |
WO2023236609A1 (zh) | 一种自动混合精度量化方法及装置 | |
Nicopolitidis et al. | Continuous flow wireless data broadcasting for high-speed environments | |
CN115914230A (zh) | 一种自适应移动边缘计算卸载和资源分配方法 | |
CN115460710A (zh) | 基于深度强化学习的车辆边缘计算场景中的智能计算卸载方法 | |
CN108738048B (zh) | 一种基于遗传算法的最大化公平性基站主动存储方法 | |
CN112202538A (zh) | 一种保障公平度阈值的人工蜂群ofdma资源分配方法 | |
Tan et al. | Joint offloading and resource allocation of uav-assisted mobile edge computing with delay constraints | |
Chang et al. | Cache-aided content delivery in fog-RAN systems with topological information and no CSI |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210604 |