CN108319293B - 一种基于lstm网络的uuv实时避碰规划方法 - Google Patents

一种基于lstm网络的uuv实时避碰规划方法 Download PDF

Info

Publication number
CN108319293B
CN108319293B CN201810043820.7A CN201810043820A CN108319293B CN 108319293 B CN108319293 B CN 108319293B CN 201810043820 A CN201810043820 A CN 201810043820A CN 108319293 B CN108319293 B CN 108319293B
Authority
CN
China
Prior art keywords
uuv
real
lstm network
time
collision avoidance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810043820.7A
Other languages
English (en)
Other versions
CN108319293A (zh
Inventor
王宏健
张雪莲
吕洪莉
郭峰
陈涛
林常见
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201810043820.7A priority Critical patent/CN108319293B/zh
Publication of CN108319293A publication Critical patent/CN108319293A/zh
Application granted granted Critical
Publication of CN108319293B publication Critical patent/CN108319293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/10Simultaneous control of position or course in three dimensions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S15/00Systems using the reflection or reradiation of acoustic waves, e.g. sonar systems
    • G01S15/88Sonar systems specially adapted for specific applications
    • G01S15/93Sonar systems specially adapted for specific applications for anti-collision purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于LSTM网络的UUV实时避碰规划方法属于神经网络技术领域和实时避障技术领域。包括步骤:构建全局坐标系和局部坐标系,建立声纳仿真模型;设计用于实时避碰规划的LSTM网络;构建数据集;利用训练集中数据训练LSTM网络,得到基于LSTM网络的实时避碰规划器;将声纳探测信息及目标点信息输入至基于LSTM网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。本发明设计的用于UUV实时避碰规划的LSTM网络,不仅有强大的学习能力,同时还具有非常强的泛化能力,这使得所实现的实时避碰规划器适用于各种复杂的环境;同时,该避碰规划器满足实时性的要求,并且所规划的路径满足UUV运动特性的要求。

Description

一种基于LSTM网络的UUV实时避碰规划方法
技术领域
本发明属于神经网络技术领域和实时避障技术领域,具体涉及一种基于LSTM网络的UUV实时避碰规划方法。
背景技术
随着国家海洋战略的不断推进,海洋开发技术成为了研究的热点,各种海洋装备的应用也越来越广泛。作为完成海底考察、数据收集、铺设管线、钻井支援、海底施工、侦查、布雷、扫雷、援潜和救生等各种水下任务的重要工具,UUV的实时避碰规划能力是保证其安全航行的关键技术,是UUV完成各种任务的基础。这就要求UUV在航行过程中根据传感器探测到的已知的环境信息找到一条从起点到终点的无碰撞安全路径。常用的传统的实时避碰规划方法包括蚁群算法、粒子群优化算法、人工免疫算法、遗传算法、A*算法、人工势场法、Dijkstra算法等。对于实时避碰规划问题,除了考虑安全性和避碰运动平滑性等,***的实时性也是重要的指标,然而基于上述传统算法的实时避碰规划***,存在避碰的实时性与避碰精度相互矛盾的问题。而且由于水下感知设备的限制,常常需要复杂的计算来分析处理探测数据,这也大大影响了规划的实时性和精度。深度学习是目前最具潜力的人工智能算法,其强大的非线性拟合能力可以为UUV提供一套简单、高效、易于实现的实时避碰规划***。这使得UUV具有了一定的自主学习的能力,从而减少了其对感知设备的依赖,增强了其在避碰过程中的灵活度。实时避碰规划***的规划能力随着UUV在运动的过程中的不断学习而逐步提高。即使训练集中只包含简单环境下的避碰规划样本,训练完成后的基于LSTM网络的UUV实时避碰规划器也可以灵活处理复杂多变环境下的避碰规划问题。
CN107368076A公开了一种智能环境下机器人运动路径深度学习控制规划方法,该方法使用深度学习DBN网络解决运载机器人全局路径规划问题。所提深度学习DBN网络包括一层输入层、三层隐藏层以及一层输出层,其中可视层与第一隐藏层构成第一层限制玻尔兹曼机RBM,第一隐藏层与第二隐藏层构成第二层限制玻尔兹曼机RBM,第二隐藏层与第三隐藏层构成BP网络层。该专利采用逐层训练的方法依次对两层限制玻尔兹曼机RBM和BP网络层进行训练。与全局路径规划不同,避碰规划器需要根据过去一段时间内的环境障碍信息实时输出规划结果。相较于限制玻尔兹曼机RBM,LSTM网络具有处理较长时间序列的能力,且更适用于复杂的规划问题。
发明内容
本发明的目的在于提供解决了UUV实时避碰规划的问题,克服了现有的实时避碰规划方法存在环境模型的精度与规划的实时性之间的矛盾的一种基于LSTM网络的UUV实时避碰规划方法。
本发明的目的通过如下技术方案来实现:
一种基于LSTM网络的UUV实时避碰规划方法,包括以下步骤:
步骤1:构建全局坐标系和局部坐标系,建立声纳仿真模型;
全局坐标系采用北东坐标系,地图左下角为原点,正北方向为X轴,正东方向为Y轴;
局部坐标系原点选在UUV重心处,X轴取在UUV纵向剖面内,指向UUV艏端,Y轴与纵剖面垂直,指向右舷;
二维多波束声纳仿真模型水平开角为120°,最大探测半径为120m,共80个波束,波束角为1.5°,每个波束上探测噪声为±1%;
步骤2:设计用于实时避碰规划的LSTM网络;
所设计的LSTM网络为端对端模型,可以直接根据传感器探测信息得出规划结果,该网络模型包含四层,分别为输入层、隐藏层、中间层以及输出层;
步骤3:构建数据集;
数据集包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;
构建训练集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为训练样本,将实时路径中UUV艏向调整的角度(转艏)及速度作为训练标签;
构建测试集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为测试样本,将实时路径中UUV转艏及速度作为测试标签;
步骤4:利用训练集中数据训练LSTM网络,得到基于LSTM网络的实时避碰规划器;
将训练数据中的声纳信息作为输入数据,将训练集中相对应的标签作为输出数据,对LSTM网络进行训练,从而获得基于LSTM网络的实时避碰规划器;
损失函数为均方差函数;
在训练过程中,采用小批量梯度下降误差反向传播算法优化LSTM网络的权值;
步骤5:将声纳探测信息及目标点信息输入至基于LSTM网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令;
LSTM网络具体结构为:
输入层由81个单元组成,其中前80个单元分别对应仿真声纳的80个波束中包含的距离信息,第81个单元对应UUV当前位置与目标点之间的夹角;
隐藏层由45个LSTM模块组成,每个LSTM模块都包含输入单元、输出单元、输入门、输出门、遗忘门等结构;
序列长度为10,上一时刻的隐藏层的输出反馈到下一时刻的模块中;
中间层由23个单元组成;
输出层由2个单元组成,分别对应所规划的下一时刻UUV的转艏和速度;
输入层与隐藏层、隐藏层与中间层、中间层与输出层间的连接方式为全连接。
LSTM记忆模块输出计算方式为:
it=σ(Wxixt+Whiht-1+bi)
ft=σ(Wxfxt+Whfht-1+bf)
ct=ft·ct-1+it·tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+bo)
ht=ot·tanh(ct)
其中it、ft、ct、ot和ht分别为t时刻输入门、遗忘门、记忆单元、输出门和记忆模块的输出;xt为t时刻记忆模块的输入向量;ht-1为t-1时刻记忆模块的输出向量;Wxi、Wxf、Wxc和Wxo分别为模块输入与输入门、遗忘门、记忆单元和输出门间的权重矩阵;Whi、Whf、Whc和Who分别为t-1时刻记忆模块的输出与输入门、遗忘门、记忆单元和输出门间的权重矩阵;bi、bf、bc和bo分别为输入门、遗忘门、记忆单元和输出门的偏置;σ(·)表示逻辑sigmoid函数,其为门单元的激活函数;·表示对应元素相乘。
数据集中数据具体为:
仿真声纳探测到的距离信息为
Figure BDA0001550267550000031
其中
Figure BDA0001550267550000032
为当前时刻第i个波束探测到的距离信息,当第i个波束未探测到障碍时,
Figure BDA0001550267550000033
为了简化输入信息,将t时刻声纳探测到的距离信息做如下处理:
Figure BDA0001550267550000034
将t时刻UUV所在位置与目标点形成的角度表示为
Figure BDA0001550267550000035
则t时刻LSTM网络的输入向量
Figure BDA0001550267550000036
t时刻LSTM网络的标签lt=[Δθt,vt],其中Δθt和vt分别表示期望的UUV转艏和速度的调整指令。
在训练开始前对数据集中数据做如下预处理:
将数据集中数据分为n个批量;
数据集的归一化方法为减去列最小值后除以列最大值和列最小值的差。
在训练过程中输入数据和标签对应关系为:
若时刻t<10,则[x1,L,xt]对应标签lt,若t310,则[xt-9,L,xt]对应标签lt
LSTM网络的训练过程可表述为:
1)初始化LSTM网络各层权重,令i=0;
2)令k=0;
3)取第k个批量的数据作为本次训练集,并令t=0;
4)将本次训练集中的输入数据[xt-9,L,xt]输入到网络,经过LSTM网络的前向传播过程得到对应输出yt
5)计算网络输出yt与对应标签lt的误差;
6)判断是否完成该批量计算,若是,执行7),否则t=t+1,并返回4);
7)利用小批量梯度下降误差反向传播算法更新LSTM网络权重;
8)判断是否所有批量数据均完成训练,若是,执行9),否则k=k+1,并返回3);
9)i=i+1,并判断iMOD 500是否为零,若是,执行10),否则返回2);
10)在测试集中随机选取50个序列,使用当前网络进行测试,计算均方误差;
11)若测试集中均方误差连续10次没有减小,则停止训练,否则返回2)。
基于LSTM网络的UUV实时避碰规划其工作过程为:
1)将UUV布放在起始位置;
2)仿真声纳开始获取UUV当前位置的环境信息xt
3)将仿真声纳获取的环境信息[xt-9,L,xt]输入到LSTM网络,获得下一时刻UUV转艏及速度的调整指令;
4)UUV执行运动指令,到达下一路径点;
5)判断UUV是否到达目标点,若是,避碰规划器停止工作,否则返回2);
本发明的有益效果在于:
该方法利用了LSTM在长时间序列上强大的非线性拟合能力,实现了一个端到端的简单高效的实时避碰规划器。本发明设计的用于UUV实时避碰规划的LSTM网络,不仅有强大的学习能力,同时还具有非常强的泛化能力,这使得所实现的实时避碰规划器适用于各种复杂的环境;同时,该避碰规划器满足实时性的要求,并且所规划的路径满足UUV运动特性的要求。
附图说明
图1是本发明的仿真声纳示意图;
图2是本发明的LSTM网络结构图;
图3是本发明的角度示意图;
图4是本发明的仿真效果图;
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
一种基于LSTM网络的UUV实时避碰规划方法,其特征在于,包含如下步骤:
(1)构建全局坐标系和局部坐标系,建立声纳仿真模型;
(2)设计用于实时避碰规划的LSTM网络;
(3)构建数据集;
(4)利用训练集中数据训练LSTM网络,得到基于LSTM网络的实时避碰规划器;
(5)将声纳探测信息及目标点信息输入至基于LSTM网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令。
所述的步骤(1)具体为:
全局坐标系采用北东坐标系,地图左下角为原点,正北方向为X轴,正东方向为Y轴;
局部坐标系原点选在UUV重心处,X轴取在UUV纵向剖面内,指向UUV艏端,Y轴与纵剖面垂直,指向右舷;
二维多波束声纳仿真模型水平开角为120°,最大探测半径为120m,共80个波束,波束角为1.5°,每个波束上探测噪声为±1%。
所述的步骤(2)具体为:
如图(2)所设计的LSTM网络为端对端模型,该网络模型包含四层,分别为输入层、隐藏层、中间层以及输出层;
输入层由81个单元组成,其中前80个单元分别对应仿真声纳的80个波束中包含的距离信息,第81个单元对应UUV当前位置与目标点之间的夹角;
隐藏层由45个LSTM记忆模块组成,每个LSTM模块都包含输入单元、输出单元、输入门、输出门、遗忘门;
序列长度为10,上一时刻的隐藏层的输出反馈到下一时刻的模块中;
中间层由23个单元组成;
输出层由2个单元组成,分别对应所规划的下一时刻UUV的转艏和速度;
输入层与隐藏层、隐藏层与中间层、中间层与输出层间的连接方式为全连接。
所述的LSTM记忆模块输出计算方式为:
it=σ(Wxixt+Whiht-1+bi)
ft=σ(Wxfxt+Whfht-1+bf)
ct=ft·ct-1+it·tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+bo)
ht=ot·tanh(ct)
其中it、ft、ct、ot和ht分别为t时刻输入门、遗忘门、记忆单元、输出门和记忆模块的输出;xt为t时刻记忆模块的输入向量;ht-1为t-1时刻记忆模块的输出向量;Wxi、Wxf、Wxc和Wxo分别为模块输入与输入门、遗忘门、记忆单元和输出门间的权重矩阵;Whi、Whf、Whc和Who分别为t-1时刻记忆模块的输出与输入门、遗忘门、记忆单元和输出门间的权重矩阵;bi、bf、bc和bo分别为输入门、遗忘门、记忆单元和输出门的偏置;σ(·)表示逻辑sigmoid函数,其为门单元的激活函数;·表示对应元素相乘。
所述的步骤(3)具体为:
数据集包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;
构建训练集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为训练样本,将实时路径中UUV艏向调整的角度及速度作为训练标签;
构建测试集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为测试样本,将实时路径中UUV艏向调整的角度及速度作为测试标签。
所述的步骤(4)具体为:
(4.1)收集数据
仿真声纳探测到的距离信息为
Figure BDA0001550267550000061
其中
Figure BDA0001550267550000062
为当前时刻第i个波束探测到的距离信息,当第i个波束未探测到障碍时,
Figure BDA0001550267550000063
将t时刻声纳探测到的距离信息做如下处理:
Figure BDA0001550267550000064
将t时刻UUV所在位置与目标点形成的角度表示为
Figure BDA0001550267550000065
则t时刻LSTM网络的输入向量
Figure BDA0001550267550000066
t时刻LSTM网络的标签lt=[Δθt,vt],其中Δθt和vt分别表示期望的UUV转艏和速度的调整指令;
(4.2)数据预处理
将数据集中数据分为n个批量;
数据集的归一化方法为减去列最小值后除以列最大值和列最小值的差。
在训练过程中输入数据和标签对应关系为:
若时刻t<10,则[x1,L,xt]对应标签lt,若t310,则[xt-9,L,xt]对应标签lt
(4.3)训练LSTM网络
1)初始化LSTM网络各层权重,令i=0;
2)令k=0;
3)取第k个批量的数据作为本次训练集,并令t=0;
4)将本次训练集中的输入数据[xt-9,L,xt]输入到网络,经过LSTM网络的前向传播过程得到对应输出yt
5)计算网络输出yt与对应标签lt的误差;
6)判断是否完成该批量计算,若是,执行7),否则t=t+1,并返回4);
7)利用小批量梯度下降误差反向传播算法更新LSTM网络权重;
8)判断是否所有批量数据均完成训练,若是,执行9),否则k=k+1,并返回3);
9)i=i+1,并判断iMOD 500是否为零,若是,执行10),否则返回2);
10)在测试集中随机选取50个序列,使用当前网络进行测试,计算均方误差;
11)若测试集中均方误差连续10次没有减小,则停止训练,否则返回2)。
所述的步骤(5)具体为:
1)将UUV布放在起始位置;
2)仿真声纳开始获取UUV当前位置的环境信息xt
3)将仿真声纳获取的环境信息[xt-9,L,xt]输入到LSTM网络,获得下一时刻UUV转艏及速度的调整指令;
4)UUV执行运动指令,到达下一路径点;
5)判断UUV是否到达目标点,若是,避碰规划器停止工作,否则返回2)。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于LSTM网络的UUV实时避碰规划方法,其特征在于,包含如下步骤:
(1)构建全局坐标系和局部坐标系,建立声纳仿真模型;
(2)设计用于实时避碰规划的LSTM网络;
(3)构建数据集;
(4)利用训练集中数据训练LSTM网络,得到基于LSTM网络的实时避碰规划器;
(5)将声纳探测信息及目标点信息输入至基于LSTM网络的避碰规划器,获得UUV下一时刻的转艏及速度的调整指令;
所述的步骤(1)具体为:
全局坐标系采用北东坐标系,地图左下角为原点,正北方向为X轴,正东方向为Y轴;
局部坐标系原点选在UUV重心处,X轴取在UUV纵向剖面内,指向UUV艏端,Y轴与纵剖面垂直,指向右舷;
二维多波束声纳仿真模型水平开角为120°,最大探测半径为120m,共80个波束,波束角为1.5°,每个波束上探测噪声为±1%;
所述的步骤(2)具体为:
所设计的LSTM网络为端对端模型,该网络模型包含四层,分别为输入层、隐藏层、中间层以及输出层;
输入层由81个单元组成,其中前80个单元分别对应仿真声纳的80个波束中包含的距离信息,第81个单元对应UUV当前位置与目标点之间的夹角;
隐藏层由45个LSTM记忆模块组成,每个LSTM模块都包含输入单元、输出单元、输入门、输出门、遗忘门;
序列长度为10,上一时刻的隐藏层的输出反馈到下一时刻的模块中;
中间层由23个单元组成;
输出层由2个单元组成,分别对应所规划的下一时刻UUV的转艏和速度;
输入层与隐藏层、隐藏层与中间层、中间层与输出层间的连接方式为全连接;
所述的LSTM记忆模块输出计算方式为:
it=σ(Wxixt+Whiht-1+bi)
ft=σ(Wxfxt+Whfht-1+bf)
ct=ft·ct-1+it·tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+bo)
ht=ot·tanh(ct)
其中it、ft、ct、ot和ht分别为t时刻输入门、遗忘门、记忆单元、输出门和记忆模块的输出;xt为t时刻记忆模块的输入向量;ht-1为t-1时刻记忆模块的输出向量;Wxi、Wxf、Wxc和Wxo分别为模块输入与输入门、遗忘门、记忆单元和输出门间的权重矩阵;Whi、Whf、Whc和Who分别为t-1时刻记忆模块的输出与输入门、遗忘门、记忆单元和输出门间的权重矩阵;bi、bf、bc和bo分别为输入门、遗忘门、记忆单元和输出门的偏置;σ(·)表示逻辑sigmoid函数,其为门单元的激活函数;·表示对应元素相乘。
2.根据权利要求1所述的一种基于LSTM网络的UUV实时避碰规划方法,其特征在于,所述的步骤(3)具体为:
数据集包括训练集和测试集,分别用于神经网络的训练阶段和测试阶段;
构建训练集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为训练样本,将实时路径中UUV艏向调整的角度及速度作为训练标签;
构建测试集时,在全局坐标系中生成若干组随机地图及实时路径,并在每个路径节点采集声纳信息,所采集的信息为测试样本,将实时路径中UUV艏向调整的角度及速度作为测试标签。
3.根据权利要求1所述的一种基于LSTM网络的UUV实时避碰规划方法,其特征在于,所述的步骤(4)具体为:
(4.1)收集数据
仿真声纳探测到的距离信息为
Figure FDA0002662290570000021
其中
Figure FDA0002662290570000022
为当前时刻第i个波束探测到的距离信息,当第i个波束未探测到障碍时,
Figure FDA0002662290570000023
将t时刻声纳探测到的距离信息做如下处理:
Figure FDA0002662290570000024
将t时刻UUV所在位置与目标点形成的角度表示为
Figure FDA0002662290570000025
则t时刻LSTM网络的输入向量
Figure FDA0002662290570000026
t时刻LSTM网络的标签lt=[Δθt,vt],其中Δθt和vt分别表示期望的UUV转艏和速度的调整指令;
(4.2)数据预处理
将数据集中数据分为n个批量;
数据集的归一化方法为减去列最小值后除以列最大值和列最小值的差;
在训练过程中输入数据和标签对应关系为:
若时刻t<10,则[x1,…,xt]对应标签lt,若t≥10,则[xt-9,…,xt]对应标签lt
(4.3)训练LSTM网络
1)初始化LSTM网络各层权重,令i=0;
2)令k=0;
3)取第k个批量的数据作为本次训练集,并令t=0;
4)将本次训练集中的输入数据[xt-9,…,xt]输入到网络,经过LSTM网络的前向传播过程得到对应输出yt
5)计算网络输出yt与对应标签lt的误差;
6)判断是否完成该批量计算,若是,执行7),否则t=t+1,并返回4);
7)利用小批量梯度下降误差反向传播算法更新LSTM网络权重;
8)判断是否所有批量数据均完成训练,若是,执行9),否则k=k+1,并返回3);
9)i=i+1,并判断iMOD500是否为零,若是,执行10),否则返回2);
10)在测试集中随机选取50个序列,使用当前网络进行测试,计算均方误差;
11)若测试集中均方误差连续10次没有减小,则停止训练,否则返回2)。
4.根据权利要求1所述的一种基于LSTM网络的UUV实时避碰规划方法,其特征在于,所述的步骤(5)具体为:
1)将UUV布放在起始位置;
2)仿真声纳开始获取UUV当前位置的环境信息xt
3)将仿真声纳获取的环境信息[xt-9,…,xt]输入到LSTM网络,获得下一时刻UUV转艏及速度的调整指令;
4)UUV执行运动指令,到达下一路径点;
5)判断UUV是否到达目标点,若是,避碰规划器停止工作,否则返回2)。
CN201810043820.7A 2018-01-17 2018-01-17 一种基于lstm网络的uuv实时避碰规划方法 Active CN108319293B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810043820.7A CN108319293B (zh) 2018-01-17 2018-01-17 一种基于lstm网络的uuv实时避碰规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810043820.7A CN108319293B (zh) 2018-01-17 2018-01-17 一种基于lstm网络的uuv实时避碰规划方法

Publications (2)

Publication Number Publication Date
CN108319293A CN108319293A (zh) 2018-07-24
CN108319293B true CN108319293B (zh) 2021-01-12

Family

ID=62895072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810043820.7A Active CN108319293B (zh) 2018-01-17 2018-01-17 一种基于lstm网络的uuv实时避碰规划方法

Country Status (1)

Country Link
CN (1) CN108319293B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109188420B (zh) * 2018-08-27 2023-04-07 西安电子科技大学 基于深度长短期记忆网络的窄带雷达目标跟踪方法
CN109409200A (zh) * 2018-09-01 2019-03-01 哈尔滨工程大学 一种基于sgru神经网络的uuv集群行为识别技术
CN109164815A (zh) * 2018-09-06 2019-01-08 中国计量大学 一种基于改进蚁群算法的自主水下航行器路径规划方法
CN109298712A (zh) * 2018-10-19 2019-02-01 大连海事大学 一种基于自适应航行态势学习的无人驾驶船舶自主避碰决策方法
CN109765929B (zh) * 2019-01-14 2022-04-05 哈尔滨工程大学 一种基于改进rnn的uuv实时避障规划方法
CN110737267A (zh) * 2019-09-30 2020-01-31 智慧航海(青岛)科技有限公司 一种无人船多目标优化方法及无人船智能综合管控***
CN110631592B (zh) * 2019-10-28 2022-03-29 华南理工大学 基于lstm模型的室内自主导航agv运动轨迹融合方法
CN111459168B (zh) * 2020-04-23 2021-12-10 上海交通大学 一种融合的自动驾驶汽车过街行人轨迹预测方法及***
CN112052984B (zh) * 2020-08-07 2024-06-14 智慧航海(青岛)科技有限公司 一种智能船舶避碰方法及***
CN112389436B (zh) * 2020-11-25 2022-11-15 中汽院智能网联科技有限公司 基于改进lstm神经网络的安全性自动驾驶换道轨迹规划方法
CN113255620B (zh) * 2021-07-12 2021-10-19 杭州远眺科技有限公司 一种基于视频中车辆群体轨迹分析的异常事件检测方法
CN113840231B (zh) * 2021-10-11 2022-07-26 中山大学 一种用于分布式大规模多天线***的多网络辅助定位方法
CN115906928B (zh) * 2022-11-25 2023-05-16 中国矿业大学 一种基于双通道自注意力的Transformer UUV三维自主避碰规划方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722177A (zh) * 2012-06-27 2012-10-10 哈尔滨工程大学 具有pid反馈增益的自主水下航行器三维直线路径跟踪控制方法
CN103777639A (zh) * 2014-01-10 2014-05-07 哈尔滨工程大学 运动障碍环境中uuv三维航路规划方法
CN107092254A (zh) * 2017-04-27 2017-08-25 北京航空航天大学 一种基于深度增强学习的家用扫地机器人的设计方法
CN107368076A (zh) * 2017-07-31 2017-11-21 中南大学 一种智能环境下机器人运动路径深度学习控制规划方法
CN107450593A (zh) * 2017-08-30 2017-12-08 清华大学 一种无人机自主导航方法和***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722177A (zh) * 2012-06-27 2012-10-10 哈尔滨工程大学 具有pid反馈增益的自主水下航行器三维直线路径跟踪控制方法
CN103777639A (zh) * 2014-01-10 2014-05-07 哈尔滨工程大学 运动障碍环境中uuv三维航路规划方法
CN107092254A (zh) * 2017-04-27 2017-08-25 北京航空航天大学 一种基于深度增强学习的家用扫地机器人的设计方法
CN107368076A (zh) * 2017-07-31 2017-11-21 中南大学 一种智能环境下机器人运动路径深度学习控制规划方法
CN107450593A (zh) * 2017-08-30 2017-12-08 清华大学 一种无人机自主导航方法和***

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Robot Path Training and Planning Using LSTM Network;Takeshi Nishida;《ResearchGate》;20171130;第1-12页 *
Spatial-temporal Data Modeling and Visualizing Method for UUV Environmental Perception;WANG Hongjian,等;《IEEE》;20161231;第5395-5402页 *
UUV Dynamic Path Planning and Trap Escape Strategies in Unknown Environment;ZHANG Xuelian,等;《Proceedings of the 35th Chinese Control Conference》;20160729;第6988-6992页 *
一种基于导航误差空间的无人水下航行器路径规划方法;严浙平,等;《兵工学报》;20140831;第35卷(第8期);第1243-1250页 *
基于几何覆盖率算法的传感器覆盖优化策略;王宏健,张雪莲,吕洪莉;《计算机应用研究》;20170831;第34卷(第8期);第2478-2482页 *

Also Published As

Publication number Publication date
CN108319293A (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
CN108319293B (zh) 一种基于lstm网络的uuv实时避碰规划方法
CN108334677B (zh) 一种基于gru网络的uuv实时避碰规划方法
Li et al. Path planning technologies for autonomous underwater vehicles-a review
CN112241176B (zh) 一种水下自主航行器在大尺度连续性障碍物环境中路径规划避障控制方法
CN110333739B (zh) 一种基于强化学习的auv行为规划及动作控制方法
CN108803321B (zh) 基于深度强化学习的自主水下航行器轨迹跟踪控制方法
CN108279692B (zh) 一种基于lstm-rnn的uuv动态规划方法
Cao et al. Target search control of AUV in underwater environment with deep reinforcement learning
CN109765929B (zh) 一种基于改进rnn的uuv实时避障规划方法
Guo et al. Research progress of path planning methods for autonomous underwater vehicle
CN108320051B (zh) 一种基于gru网络模型的移动机器人动态避碰规划方法
CN110362089A (zh) 一种基于深度强化学习和遗传算法的无人船自主导航的方法
CN112925319B (zh) 一种基于深度强化学习的水下自主航行器动态避障方法
CN113848974B (zh) 一种基于深度强化学习的飞行器轨迹规划方法及***
CN113268074B (zh) 一种基于联合优化的无人机航迹规划方法
CN110471426A (zh) 基于量子狼群算法的无人驾驶智能车自动避碰方法
CN111240345A (zh) 一种基于双bp网络增强学习框架的水下机器人轨迹跟踪方法
CN115143970B (zh) 一种基于威胁度评估的水下航行器避障方法和***
CN113110455A (zh) 一种未知初始状态的多机器人协同探索方法、装置及***
CN112612290A (zh) 一种考虑洋流的水下航行器三维多任务路径规划方法
Ma et al. Multi-AUV collaborative operation based on time-varying navigation map and dynamic grid model
CN112857370A (zh) 一种基于时序信息建模的机器人无地图导航方法
CN108459614B (zh) 一种基于cw-rnn网络的uuv实时避碰规划方法
CN112215395B (zh) 一种基于海洋大数据的水下装备适应性信息保障***
Wu et al. Multi-objective reinforcement learning for autonomous drone navigation in urban areas with wind zones

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant