CN108040353A - 一种q学习的无人机集群智能地理路由方法 - Google Patents

一种q学习的无人机集群智能地理路由方法 Download PDF

Info

Publication number
CN108040353A
CN108040353A CN201711369034.8A CN201711369034A CN108040353A CN 108040353 A CN108040353 A CN 108040353A CN 201711369034 A CN201711369034 A CN 201711369034A CN 108040353 A CN108040353 A CN 108040353A
Authority
CN
China
Prior art keywords
node
uav
tables
unmanned plane
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711369034.8A
Other languages
English (en)
Inventor
黎海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201711369034.8A priority Critical patent/CN108040353A/zh
Publication of CN108040353A publication Critical patent/CN108040353A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/02Communication route or path selection, e.g. power-based or shortest path routing
    • H04W40/04Communication route or path selection, e.g. power-based or shortest path routing based on wireless node resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W40/00Communication routing or communication path finding
    • H04W40/24Connectivity information management, e.g. connectivity discovery or connectivity update
    • H04W40/248Connectivity information update

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种Q学习的无人机集群智能地理路由方法,利用Q学习算法不断与周围环境交换信息能获得最优解的优势,把自主学习任务分配给每个网络节点,且同时考虑到链路质量状态和传输距离对分组传输性能的影响,利用有效分组转发速率来计算Q学习算法中的奖赏函数,各个节点通过周期地与邻居节点交换信息动态调整来寻找到最优路由路径达,有效解决了UAV集群网络中由于拓扑变化带来的路径不可靠的问题。

Description

一种Q学习的无人机集群智能地理路由方法
技术领域
本发明属于无人机集群组网领域,尤其涉及一种Q学习的无人机集群智能地理路由方法。
背景技术
无人机(UAV)具有多用途、灵活性强和低成本等优势,所以在军用、民用领域受到广泛关注。多无人机协同应用比单无人机具备可生存性更强、扩展性更高等优势,但同时也带来多无人机间的协同通信较为的实际问题。因此,需要设计适应未来发展需求的多无人机通信网络。作为无人机集群化、网络化、智能化的重要发展方向,无人机自组网是新兴的无人机集群应用模式。
无人机自组网采用动态网络完成机群内部成员的互相联通,具有自我智能组织、自动愈合以及高性能低延时的组网优点,适用于无人机集群在特殊场景下的需要。无人机集群内部每个成员都具备路由和转发能力,成员间均可互相传送各类数据,构成一个可自动连接的移动Ad hoc网络。
无人机自组网是网络拓扑结构迅速变化的网络,网络内部成员以较高的速率运动导致网络拓扑结构的迅速改变,从而使传统的主动路由和按需路由协议不能适用于无人机自组网。人们相继提出了以地理位置信息为决策依据的路由协议,如贪婪周边无状态路由协议(GPSR),其性能高于主动和按需路由,在节点密度较大的无人机组网中具有良好的性能。
一般基于位置的路由协议是以最大化分组传输距离为目标,缺乏对网络动态时变行为的理解,选择转发节点时未考虑到链路状态或位置误差等因素的影响,其所产生的干扰/阻碍导致频繁重传。为了支持UAV快速、可靠传输,结合Q学习在复杂、未知网络环境下能自主学习到性能良好动作策略的优势,本发明提出一种Q学习的无人机集群智能地理路由方法。
发明内容
本发明提供一种Q学习的无人机集群智能地理路由方法,利用Q学习算法不断与周围环境交换信息能获得最优解的优势,把自主学习任务分配给每个网络节点,各个节点通过周期地与邻居节点交换信息,动态调整奖赏函数值来寻找到最优路由路径,有效的解决了UAV集群网络中由于拓扑变化带来的路径不可靠的问题。
本发明一种的Q学习的无人机集群智能地理路由方法,实现步骤如下:
步骤(1):UAV集群网络内每个节点设置初始时间t0=0,Q值函数Q(si,ai)=0,其中si为每个节点i下一跳所选择的邻居节点,ai为根据该状态执行路由选择的动作,它们构成状态—动作集{si,ai}。
步骤(2):更新时间t=t0+1。
步骤(3):UAV节点利用GPS估计出当前位置,并对Hello消息中的节点位置信息进行更新。
步骤(4):UAV节点通过信标机制将自身标识ID和地理位置信息以广播的形式发送,使得网内各成员可获取下一跳邻居节点及目的节点的地址信息。
步骤(5):UAV网内各节点估计出与邻居节点之间传输链路的误分组率PER,作为评价链路质量的指标。
步骤(6):利用误分组率等计算UAV相邻节点之间分组传输时间T。
步骤(7):利用分组传输时间计算UAV相邻节点之间有效分组转发速率Reff
步骤(8):利用有效分组转发速率计算Q学习算法中的奖赏函数r(st,at)。
步骤(9):UAV网络节点根据t时刻执行动作at获得的奖赏函数值r、学习速率αtt<1)、折扣因子γ(γ<1)来更新Q表中Q值。
步骤(10):重复步骤(2)至步骤(9),直到Q表中Q值接近于收敛状态,即达到稳定状态。
步骤(11):从发送节点到目的节点的路径中,找出具有最大Q值的节点所组成的路径即为最佳路径,从而完成路由建立过程。
步骤(12):UAV节点间通过周期性的交换Hello消息数据来更新Q表的值、节点位置信息、链路质量等,完成路由维护过程。
有益效果
提出的Q学习智能地理路由技术,同时考虑到链路质量状态和传输距离对分组传输的影响,提出了利用有效分组转发速率来计算Q学习算法中的奖赏函数,提高了在高移动环境下路由的鲁棒性。
附图说明
图1为本发明所涉及方法的流程图;
图2为Q学习后的网络拓扑。
具体实施方式
下面结合附图和实施步骤对本发明做进一步说明。
如图1所示,本发明提供一种Q学习的无人机集群智能地理路由方法,包括以下步骤:
步骤(1):UAV集群网络内每个节点设置初始时间t=0,Q值函数Q(si,ai)=0,其中si为每个节点i下一跳所选择的邻居节点,ai为根据该状态执行路由选择的动作,它们构成状态—动作集{si,ai}。
步骤(2):更新时间t=t+1。
步骤(3):UAV节点利用所安装的GPS报告当前位置,并对Hello消息中的节点位置信息进行更新。
步骤(4):UAV节点通过信标机制将自身标识ID和地址位置信息以广播的形式发送,使得网内各成员可获取一跳邻节点及目的节点的地址信息。
步骤(5):UAV网内各节点估计出与邻居节点之间传输链路的误分组率PER,作为评价链路质量的指标。
误分组率的计算公式为其中Ne为接收的错误分组数,NT发送的总分组数。
步骤(6):计算UAV相邻节点之间分组传输时间T。
UAV节点i和邻居节点j之间的传输时间计算公式为:其中Ovh为信道接入开销,L为分组长度,R是数据传输速率。
步骤(7):计算UAV相邻节点之间有效分组转发速率Reff
UAV节点i和邻居节点j之间的有效分组转发速率的计算公式为:其中dij为节点i、j到目的节点的距离之差。
步骤(8):计算Q值更新算法中的奖赏函数r(st,at)。
若当前节点的下一跳节点为目的节点时,最大奖赏设定为Rmax=Reff/(1-PER),否则设定奖赏为Reff,即
步骤(9):UAV网络节点根据t时刻执行动作at获得的奖赏函数值r、的学习速率αtt<1)、折扣因子γ(γ<1)来更新Q值。更新Q值的计算公式为
Q(st,at)←Q(st,at)+αt(r(st,at)+γmaxQ-Q(st,at))
Q学习算法中,折扣因子代表未来Q值期望和状态转移的稳定性,高折扣因子表明未来状态转移稳定。一般Q学习算法中折扣因子为常数,本发明的目的是选择高概率连接到邻居节点的可靠链路。为了反映动态移动环境,根据距离和相邻节点移动方式选择动态折扣因子,若相邻节点距离E[dij]在下一个HELLO时间间隔内小于该节点的通信dcomm时,设定折扣因子γ=0.6,否则减小折扣因子。
步骤(10):重复步骤(2)至步骤(9),直到Q表接近于收敛状态。然后根据不同邻居—目的节点之间Q值建立Q表。
Q表是一个二维表,其大小由邻居节点以及目的节点的数量来决定。其中第一行代表所有可能到达的目的节点ID,在这里用Di表示。第一列表示与其相邻的一跳邻居节点ID,在这里用Ni表示。Q表中Q(Di,Ni)表示本节点到达目的节点Di时与邻居节点Ni之间的Q值。节点间通过周期性的交换信标数据包来更新Q表的值,若某一目的节点不可达,则删除对应的表项。
步骤(11):若经过Q学习后,网络拓扑的Q值如图2,即从发送节点A到目的节点F的路径中,找出具有最大Q值的节点所组成的路径即为最佳路径,即A→C→E→F,从而完成路由建立过程。
步骤(12):UAV节点间通过周期性的交换Hello消息数据来更新Q表的值、节点位置信息、链路质量等,完成路由维护过程。

Claims (2)

1.一种Q学习的无人机集群智能地理路由方法,其特征在于,包括以下步骤:
步骤(1):UAV集群网络内每个节点设置初始时间t0=0,Q值函数Q(si,ai)=0,其中si为每个节点i下一跳所选择的邻居节点,ai为根据该状态执行路由选择的动作,它们构成状态—动作集{si,ai};
步骤(2):更新时间t=t0+1;
步骤(3):UAV节点利用GPS估计出当前位置,并对Hello消息中的节点位置信息进行更新;
步骤(4):UAV节点通过信标机制将自身标识ID和地理位置信息以广播的形式发送,使得网内各成员可获取下一跳邻居节点及目的节点的地址信息;
步骤(5):UAV网内各节点估计出与邻居节点之间传输链路的误分组率PER,作为评价链路质量的指标;
步骤(6):利用误分组率等计算UAV相邻节点之间分组传输时间T;
步骤(7):利用分组传输时间计算UAV相邻节点之间有效分组转发速率Reff
步骤(8):利用有效分组转发速率计算Q学习算法中的奖赏函数r(st,at);
步骤(9):UAV网络节点根据t时刻执行动作at获得的奖赏函数值r、学习速率αtt<1)、折扣因子γ(γ<1)来更新Q表中Q值;
步骤(10):重复步骤(2)至步骤(9),直到Q表中Q值接近于收敛状态,即达到稳定状态;
步骤(11):从发送节点到目的节点的路径中,找出具有最大Q值的节点所组成的路径即为最佳路径,从而完成路由建立过程;
步骤(12):UAV节点间通过周期性的交换Hello消息数据来更新Q表的值、节点位置信息、链路质量等,完成路由维护过程。
2.如权利要求1所述的Q学习的无人机集群智能地理路由方法,其特征在于,所述Q表是一个二维表,其大小由邻居节点以及目的节点的数量来决定,其中,第一行代表所有可能到达的目的节点ID,采用Di表示,第一列表示与其相邻的一跳邻居节点ID,采用Ni表示,Q表中Q(Di,Ni)表示本节点到达目的节点Di时与邻居节点Ni之间的Q值,节点间通过周期性的交换信标数据包来更新Q表的值,若某一目的节点不可达,则删除对应的表项。
CN201711369034.8A 2017-12-18 2017-12-18 一种q学习的无人机集群智能地理路由方法 Pending CN108040353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711369034.8A CN108040353A (zh) 2017-12-18 2017-12-18 一种q学习的无人机集群智能地理路由方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711369034.8A CN108040353A (zh) 2017-12-18 2017-12-18 一种q学习的无人机集群智能地理路由方法

Publications (1)

Publication Number Publication Date
CN108040353A true CN108040353A (zh) 2018-05-15

Family

ID=62099621

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711369034.8A Pending CN108040353A (zh) 2017-12-18 2017-12-18 一种q学习的无人机集群智能地理路由方法

Country Status (1)

Country Link
CN (1) CN108040353A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587751A (zh) * 2019-01-07 2019-04-05 中国科学院计算技术研究所 无人机自组网自适应路由方法和***
CN110554707A (zh) * 2019-10-17 2019-12-10 陕西师范大学 一种飞行器姿态控制回路的q学习自动调参方法
CN111065105A (zh) * 2019-12-30 2020-04-24 电子科技大学 一种面向无人机网络切片的分布式智能路由方法
CN111736461A (zh) * 2020-06-30 2020-10-02 西安电子科技大学 基于q学习的无人机任务协同分配方法
CN112804726A (zh) * 2021-01-06 2021-05-14 南京理工大学 一种基于地理位置的多智能体强化学习路由算法
CN112822745A (zh) * 2020-12-31 2021-05-18 南京航空航天大学 一种面向无人机自组网的自适应路由方法
CN113098771A (zh) * 2021-03-26 2021-07-09 哈尔滨工业大学 基于Q学习的分布式自适应QoS路由方法
CN113286314A (zh) * 2021-05-25 2021-08-20 重庆邮电大学 一种基于q学习算法的无人机基站部署及用户关联方法
CN113438620A (zh) * 2021-05-27 2021-09-24 西安工业大学 一种无人机集群中心节点最优选择方法
CN113543068A (zh) * 2021-06-07 2021-10-22 北京邮电大学 一种基于层次化分簇的林区无人机网络部署方法与***
CN114143852A (zh) * 2021-11-06 2022-03-04 中国电子科技集团公司第五十四研究所 一种应用于无人机集群的抗干扰通信链路选择方法
CN114499648A (zh) * 2022-03-10 2022-05-13 南京理工大学 基于多智能体协作的无人机集群网络智能多跳路由方法
CN114710819A (zh) * 2022-06-06 2022-07-05 天津讯联科技有限公司 一种无人机集群组网的路由规划方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104640168A (zh) * 2014-12-04 2015-05-20 北京理工大学 基于q学习的车载自组织网络路由方法
CN105208616A (zh) * 2015-06-17 2015-12-30 重庆邮电大学 车载自组织网络中基于道路拓扑的自适应多副本路由方法
CN107104899A (zh) * 2017-06-09 2017-08-29 中山大学 一种应用于车载自组织网络中的基于蚁群算法的路由方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104640168A (zh) * 2014-12-04 2015-05-20 北京理工大学 基于q学习的车载自组织网络路由方法
CN105208616A (zh) * 2015-06-17 2015-12-30 重庆邮电大学 车载自组织网络中基于道路拓扑的自适应多副本路由方法
CN107104899A (zh) * 2017-06-09 2017-08-29 中山大学 一种应用于车载自组织网络中的基于蚁群算法的路由方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
WOO-SUNG JUNG等: "QGeo: Q-Learning-Based Geographic Ad Hoc Routing Protocol for Unmanned Robotic Networks", 《IEEE COMMUNICATIONS LETTERS》 *
乔阳等: "一种基于多Agent强化学习的无线传感器网络多路径路由协议", 《合肥工业大学学报(自然科学版)》 *
张晶晶等: "一种基于强化学习的UAV目标搜索算法", 《计算机应用研究》 *
李荥等: "一种基于Q学习的无线传感网络路由方法", 《计算技术与自动化》 *
贾旭峰等: "无人机集群网络中一种基于链路质量预测的按需路由算法", 《空军工程大学学报(自然科学版)》 *
迟凯: "基于认知的Ad Hoc网络路由技术的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑 第2013年第5期》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587751A (zh) * 2019-01-07 2019-04-05 中国科学院计算技术研究所 无人机自组网自适应路由方法和***
CN110554707B (zh) * 2019-10-17 2022-09-30 陕西师范大学 一种飞行器姿态控制回路的q学习自动调参方法
CN110554707A (zh) * 2019-10-17 2019-12-10 陕西师范大学 一种飞行器姿态控制回路的q学习自动调参方法
CN111065105A (zh) * 2019-12-30 2020-04-24 电子科技大学 一种面向无人机网络切片的分布式智能路由方法
CN111736461A (zh) * 2020-06-30 2020-10-02 西安电子科技大学 基于q学习的无人机任务协同分配方法
CN111736461B (zh) * 2020-06-30 2021-05-04 西安电子科技大学 基于q学习的无人机任务协同分配方法
CN112822745A (zh) * 2020-12-31 2021-05-18 南京航空航天大学 一种面向无人机自组网的自适应路由方法
CN112822745B (zh) * 2020-12-31 2023-03-14 南京航空航天大学 一种面向无人机自组网的自适应路由方法
CN112804726A (zh) * 2021-01-06 2021-05-14 南京理工大学 一种基于地理位置的多智能体强化学习路由算法
CN113098771A (zh) * 2021-03-26 2021-07-09 哈尔滨工业大学 基于Q学习的分布式自适应QoS路由方法
CN113286314B (zh) * 2021-05-25 2022-03-08 重庆邮电大学 一种基于q学习算法的无人机基站部署及用户关联方法
CN113286314A (zh) * 2021-05-25 2021-08-20 重庆邮电大学 一种基于q学习算法的无人机基站部署及用户关联方法
CN113438620A (zh) * 2021-05-27 2021-09-24 西安工业大学 一种无人机集群中心节点最优选择方法
CN113438620B (zh) * 2021-05-27 2024-04-19 西安工业大学 一种无人机集群中心节点最优选择方法
CN113543068A (zh) * 2021-06-07 2021-10-22 北京邮电大学 一种基于层次化分簇的林区无人机网络部署方法与***
CN113543068B (zh) * 2021-06-07 2024-02-02 北京邮电大学 一种基于层次化分簇的林区无人机网络部署方法与***
CN114143852A (zh) * 2021-11-06 2022-03-04 中国电子科技集团公司第五十四研究所 一种应用于无人机集群的抗干扰通信链路选择方法
CN114499648A (zh) * 2022-03-10 2022-05-13 南京理工大学 基于多智能体协作的无人机集群网络智能多跳路由方法
CN114499648B (zh) * 2022-03-10 2024-05-24 南京理工大学 基于多智能体协作的无人机集群网络智能多跳路由方法
CN114710819A (zh) * 2022-06-06 2022-07-05 天津讯联科技有限公司 一种无人机集群组网的路由规划方法

Similar Documents

Publication Publication Date Title
CN108040353A (zh) 一种q学习的无人机集群智能地理路由方法
CN105722176B (zh) 城市场景中有基础设施的车联网大规模异构网络的连通性方法
CN108600942A (zh) 一种无人机自组网的路由方法
Hyeon et al. A new geographic routing protocol for aircraft ad hoc networks
Li et al. Adaptive vehicular routing protocol based on ant colony optimization
CN110191413B (zh) 一种基于贪婪蚁群算法在移动自组网中进行广播的方法及***
Toorchi et al. Skeleton-based swarm routing (SSR): Intelligent smooth routing for dynamic UAV networks
CN104202724B (zh) 一种基于地理位置信息的aanet联合路由算法
CN104539542A (zh) 一种基于移动Sink数据收集的低能耗路由树枝剪方法
CN110995333A (zh) 一种分簇QoS路由设计方法
CN106941447A (zh) 基于蚁群模型的自由空间光网络路由方法
Li et al. Ant-based on-demand clustering routing protocol for mobile ad-hoc networks
CN103260206A (zh) 一种基于影响度因子的混合动态无线路由有效搜索收敛方法
Alomari et al. A scheme for using closest rendezvous points and Mobile Elements for data gathering in wireless sensor networks
CN109803342A (zh) 一种面向能量均衡高可靠传输的无人机自组织网络路由方法
CN103945483B (zh) 一种基于消息摆渡的机会网络全覆盖低时延路由方法
Li et al. A delay-sensitive vehicular routing protocol using ant colony optimization
CN110121185B (zh) 一种配电通信网络路由优化方法
Faheem et al. SN-MPR: A multi-point relay based routing protocol for wireless sensor networks
Hamatta et al. Protocols in mobile ad-hoc networks: a review
Shaochuan et al. AOHR: AODV and OLSR hybrid routing protocol for mobile ad hoc networks
Shenbagalakshmi et al. RETRACTED ARTICLE: Enhanced route discovery using connected dominating set and 2-hop repair in wireless ad hoc networks
Gujar et al. Bio-inspired routing protocol for vehicular ad hoc networks
CN113810852B (zh) 一种应用于共享无线可充电网络的自适应充电调度方法
Kardoust et al. Introducing a method for improving the performance of routing algorithms in unmanned aeronautical ad-hoc networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180515

RJ01 Rejection of invention patent application after publication