CN116858253A - 一种适用室内环境的轻量性预测式导航方法及*** - Google Patents
一种适用室内环境的轻量性预测式导航方法及*** Download PDFInfo
- Publication number
- CN116858253A CN116858253A CN202310965884.3A CN202310965884A CN116858253A CN 116858253 A CN116858253 A CN 116858253A CN 202310965884 A CN202310965884 A CN 202310965884A CN 116858253 A CN116858253 A CN 116858253A
- Authority
- CN
- China
- Prior art keywords
- dynamic
- future
- static
- constraint
- environment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000003068 static effect Effects 0.000 claims abstract description 50
- 238000005457 optimization Methods 0.000 claims abstract description 33
- 230000007613 environmental effect Effects 0.000 claims abstract description 14
- 230000009466 transformation Effects 0.000 claims abstract description 9
- 230000004888 barrier function Effects 0.000 claims description 24
- 238000005070 sampling Methods 0.000 claims description 24
- 230000001133 acceleration Effects 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000012512 characterization method Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 12
- 238000005259 measurement Methods 0.000 claims description 11
- 238000009826 distribution Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 abstract description 4
- 230000008447 perception Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 3
- 239000003795 chemical substances by application Substances 0.000 description 47
- 238000012549 training Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004088 simulation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000004540 process dynamic Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
- G01C21/206—Instruments for performing navigational calculations specially adapted for indoor navigation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Automation & Control Theory (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种适用室内环境的轻量性预测式导航方法及***,环境预测将所获得的感知信息与运动信息相结合,能够生成未来的环境预测和映射,表示为占据栅格图序列;运动规划将具有时间属性的网格序列作为搜索空间,并将轨迹解公式化为非线性优化问题,解算非线性优化问题得到轨迹;在统一的环境表征形式下,获取感知数据和车辆自身运动数据(速度,坐标)部分解耦动静态环境,静态环境通过坐标变换与映射得到未来位置,动态环境通过提取场景运动特征信息,预测未来若干步长的栅格地图,然后直接利用未来栅格,同时处理动静态障碍物,提升轨迹优化的效率和有效性;本发明提出的方法可以提高实时性能和安全性,同时降低计算需求。
Description
技术领域
本发明属于智能体导航技术领域,具体涉及一种适用室内环境的轻量性预测式导航方法及***。
背景技术
为了完成特定的任务,机器人需要精确而安全的导航才能在不发生碰撞的情况下到达目的地。这种导航是通过实现导航算法来实现的。在动态环境中,该算法包括两个主要组成部分:预测和规划。预测组件提供关于局部障碍物分布的信息,而规划组件基于预测信息生成安全且无缝的轨迹以适应动态变化。尽管研究人员研究了这两种功能的单独实现,但发现它们在轻量级、非结构化的室内动态环境中的性能不足。由于空间拥挤,障碍物密度高,体积小,缺乏统一的表示形式,导致障碍物信息丢失。此外,有限的空间限制了智能体,其较差的实时性能使其无法及时进行规避机动,从而导致碰撞。
多数现存的方法对传感器***要求高,耗时长,难以满足智能体规划实时性的要求。另外,这些方法采用物体跟踪来获取动态障碍物的未来轨迹,然后将其用作规划模块的输入。然而,许多方法依赖于大规模模型,导致实时性能较差。这可归因于机器人在成本和尺寸方面的限制,使得实现需要过多资源的预测方法具有挑战性。此外,预测和规划之间缺乏统一的表示,导致在多种输入和输出格式的转换过程中丢失了基本信息。此外,规划算法往往对障碍物的未来行为缺乏远见,这可能导致规划算法陷入困境,导致轨迹偏差或不连续。大多数现有的预测方法在很大程度上依赖于多线激光雷达,这是昂贵的,并且会生成大规模的点云,给室内代理导航增加了额外的计算负担。传统的规划算法需要高质量的预测信息,但鲁棒性较低,导致实际适用性有限。
发明内容
为了解决现有技术中存在的问题,本发明提供一种适用室内环境的轻量性预测式导航方法采用分层的预测-规划方法,在统一的环境表征形式下,获取感知数据和车辆自身运动数据(速度,坐标)部分解耦动静态环境,静态环境通过坐标变换与映射得到未来位置,动态环境通过提取场景运动特征信息,预测未来若干步长的栅格地图,然后直接利用未来栅格,同时处理动静态障碍物,提升轨迹优化的效率和有效性。
为了实现上述目的,本发明采用的技术方案是:一种适用室内环境的轻量性预测式导航方法,包括以下步骤:
通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下;
考虑环境变量在未来智能体所处的坐标系下,动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征;
采用变分自动编码器构建OGM占据栅格图预测生成模块,将未来概率占据栅格图的潜在变量特征作为输入,解码器输出预测的占用栅格图序列;
将每个栅格图顺序地用作采样候选轨迹的可行空间;
在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹;
采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹。
进一步的,通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下包括:
首先根据激光雷达的测量值计算出当前的障碍物占据位置,获取在当前智能体所处的坐标系下的障碍物占据位置;
根据智能体当前和下一刻位姿之间的转化关系以及智能体当前位姿信息推断出下一时刻的智能***姿;将当前障碍物分布投影到经历设定时长后的智能体所处位姿的坐标系,得到环境变量在未来智能体所处的坐标系下的投影。
进一步的,考虑动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征具体包括以下步骤:
将整个网格地图信息馈送到卷积长短时间记忆网络模块中,卷积长短时间记忆网络模块将一维占据栅格图作为输入,并使用大小为3的卷积核生成动态网格特征;
采用贝叶斯生成方法预测未来静态障碍物的局部地图,同时过滤掉动态信息,得到静态障碍物的局部地图信息;
将提取的动态网格特征和静态障碍物的局部地图信息作为OGM占据栅格图预测生成模块的输入。
进一步的,所述OGM占据栅格图预测生成模块包括编码器和解码器,编码器由两层卷积层和两层残差层构成,两层残差层参数一致;解码器由两个残差层和两个反卷积层组成,残差层结构与编码器中的结构一致。
进一步的,将每个栅格图顺序地用作采样候选轨迹的可行空间时,具体的,基于占用栅格图的扩展序列,通过位置变换关系导出预测序列中的占用空间,在设定时间段内,智能体均匀运动,质心是圆心,通过智能体能到达的区域得到每帧的可行空间表示,可行区间内的状态遵守严格速度区间约束和碰撞约束。
进一步的,在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹时,采用随机抽样方法在可行空间内选择帧,单独逐个采样栅格图序列,采样的空间表示每个图中未占用的区域,采样时在满足智能体的运动学约束和确保可达性的基础上,得到搜索空间;在采样时,如果相邻帧之间的采样点能在没有任何碰撞的情况下连接,并判断连接后的边是否满足智能体的动力学约束与运动学约束,若满足则将采样点连接在一起以形成边;遍历节点列表以识别成本最低的节点,并启动回溯过程以获得满足运动学约束和障碍物约束的初始轨迹。
进一步的,采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹包括:
将使用图优化方法生成更平滑和更安全的轨迹公式化为一个非线性优化问题:
其中,L({Pt}|{mt:t+β})表示优化目标,{mt:t+β}表示栅格图序列,Cego表示自车外轮廓,Cobs表示障碍物外轮廓,表示所能达到的最大速度和最小速度,ωmin,ω{max}表示所能达到的最大角速度和最小角速度,|av|≤a{max},表示线加速度小于最大线加速度, 表示角加速度小于最大角加速度;
将硬约束转换为目标函数内的惩罚,将硬约束视为软约束;循环迭代优化直至优化的轨迹满足运动学约束和障碍物约束或达到迭代的上限,解算得到最终规划路径。
基于所述方法的技术构思,本发明还提供一种适用室内环境的轻量性预测式导航***,包括位姿预测模块、动静态特征提取模块、占用栅格图序列预测模块、可行空间获取模块、初始轨迹获取模块以及轨迹优化模块;
位姿预测模块通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下;
动静态特征提取模块用于考虑环境变量在未来智能体所处的坐标系下,动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征;
占用栅格图序列预测模块采用变分自动编码器构建OGM占据栅格图预测生成模块,将未来概率占据栅格图的潜在变量特征作为输入,解码器输出预测的占用栅格图序列;
可行空间获取模块用于将每个栅格图顺序地用作采样候选轨迹的可行空间;
初始轨迹获取模块用于在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹;
轨迹优化模块采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹。
另外提供一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,所述处理器执行程序时能实现本发明所述的适用室内环境的轻量性预测式导航方法。
本发明同时提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的适用室内环境的轻量性预测式导航方法。
与现有技术相比,本发明至少具有以下有益效果:
本发明基于深度学习进行环境预测,利于自制数据集,适用于不同种类的室内环境。随着所处环境的收集数据增加,可以获得更好的预测效果;提出了一个轻量快速通用的框架,在室内移动机器人和无人驾驶车辆上都能有良好的应用,资源消耗小,实时性高,解决了单线激光的预测问题;预测工作中考虑到了智能体的运动,这种运动信息是必要的,有助于区分动静态障碍物,提供先验信息;动态障碍物由时序栅格的占用状态表示,规划可以同时处理动态和静态障碍物,保证轨迹在多障碍物的情况下安全通行。
附图说明
图1为本发明的技术框架图。
图2为预测部分框架图。
图3为用于预测的变分自动编码器网络结构图。
图4为规划部分框架图。
具体实施方式
下面结合附图和具体实施对本申请的示范性实例进行详细阐明,其中包括本申请实施例的各种细节以助于理解。应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
实时导航是智能体在复杂动态环境中安全驾驶能力的重要组成部分,包括预测和运动规划。然而,现有的大多数方法都需要高质量的传感器***和巨大的计算消耗,这与实时性要求背道而驰。此外,这些方法缺乏用于预测和规划的统一表示框架,导致表示转换过程中的准确性损失。本发明提出了一个基于占用网格图的预测规划框架。预测模块将感知信息和运动信息相结合,以处理动态和静态障碍物,并生成占用网格图序列。规划模块对候选轨迹进行采样、选择和优化。在多个场景中的实验结果表明,与常规方法相比,所提出的框架可以提高实时性能和安全性,同时降低计算需求。
图1是本发明基于深度学习的预测式导航方法流程示意图,本发明适用于复杂动态的环境,对于室内室外环境具有通用性。本发明的目的是从传感器获得的测量值为智能代理生成一系列未来包含位姿与速度信息的状态。本发明将传感器对于当前环境的表征和下一时间步长的预期姿态作为输入,包括初始环境信息和潜在的运动变量,期望的输出是可行的运动轨迹。本发明分为两个相互关联的部分:环境预测和运动规划。环境预测将所获得的感知信息与运动信息相结合,能够生成未来的环境预测和映射,表示为占据栅格图序列;运动规划将具有时间属性的网格序列作为搜索空间,并将轨迹解公式化为非线性优化问题,解算非线性优化问题得到轨迹。本发明的细节如下:
步骤1:在实际的智能体运行过程中,采集的激光雷达数据所在的局部坐标系会随着智能体的运动而不断变化,这会对占据栅格图的预测造成影响。运动补偿分为两步,分别是智能***姿预测以及坐标转换。位姿预测的过程中,通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下,具体细节如下:
本发明可以使用任何可以构建概率栅格图的传感器,作为示例,以单线激光这种低成本的传感器进行说明。假定激光雷达的测量值为M=[dt,kt*δ],其中dt是t时刻激光雷达测量出的距离,kt是激光雷达的测距顺序,δ是激光雷达的分辨率,用角度表示。
(1)首先根据激光雷达的测量值计算出当前的障碍物占据位置,在当前智能体所处的坐标系下,障碍物占据位置为:
[x,y]=dt[cos(kt*δ),sin(kt*δ)]T
而根据惯性测量单元可以获得智能体t时刻的线速度Vt、角速度ωt,线加速度avt,角加速度aωt。
(2)根据定位模块所给出的智能体当前位姿信息[xego,yego,θ1],本发明假定在0.1s的时间间隔Δt内智能体进行匀速直线运动,可以推断出下一时刻的智能***姿[x′ego,y′ego,θ2]。其中x,y,θ分别表示智能体所处位置的横纵坐标与朝向。
智能体当前和下一刻位姿之间的转化关系可以表示如下:
将当前障碍物分布投影到经历Δt时长后的智能体所处位姿的坐标系中,可以获得障碍物占据点的对应坐标[x′,y′],其计算方法如下:
其中,[x′,y′]是经历Δt时长后的智能体所处位姿的坐标系中,可以获得障碍物占据点的对应坐标,[xego,yego]是当前全局坐标系下智能体所处位置,θ1为朝向,[x′ ego,y′ ego]是经历Δt时长后全局坐标系下智能体所处位置,θ2为朝向;进而得到环境变量在未来智能体所处的坐标系下的投影。
步骤2:提取动静态特征信息。提取动静态特征信息过程同时考虑动态障碍物的自行和静态障碍物在环境中的占用,隐含地捕捉两者之间的相互作用,并且将动态和静态分量部分解耦,以提取未来概率占据栅格图的潜在变量特征。
(1)为了预测动态网格信息,将整个网格地图信息馈送到卷积长短时间记忆网络模块中。卷积长短时间记忆网络模块将一维占据栅格图作为输入,并使用大小为3的卷积核生成32维动态网格特征。
(2)关于静态障碍物信息,采用贝叶斯生成方法预测未来静态障碍物的局部地图,同时过滤掉动态信息,得到静态障碍物的局部地图信息。这种方法允许动态和静态信息的成功解耦和特征提取。
(3)将提取的动态网格特征和静态障碍物的局部地图信息输入到占据栅格图预测生成模块。
步骤3:本发明采用变分自动编码器(VAE)构建OGM占据栅格图预测生成模块,模块通过提取到的动态栅格特征和局部地图,通过模型训练得到预训练好的网络参数,预测未来时刻的栅格图序列,表征环境分布。参考图2和图3。
(1)编码器:编码器部分由两层卷积层和两层残差层构成。第一层卷积输入维度为32的特征M,输出维度为64的特征,卷积核大小为4,步长为2,padding值为1。第二层卷积输入维度为64的特征,输出维度为128的特征,卷积核大小为4,步长为2,padding值为1。两层残差层参数一致,每个残差层输入维度为128维的特征X,特征X经过两层卷积处理得到X2,残差层的输出为X+X2;第一层卷积输入128维,输出64维,卷积核大小为3,步长为1。第二层卷积输入64维,输出128维,卷积核大小为1,步长为1。然后将残差层的输出经过两个结构相同卷积块(输入维度128,输出维度2)编码得到μ和σ。
(2)将μ和σ(维度为16*16*2)重构(reshape)为512维向量,然后生成分布q(z|x):N(z|mu,z_var)和p(z):N(z|0,I),对分布q(z|x)进行采样得到变分自动编码器中的隐向量Z。
(3)解码器:解码器部分将正态分布采样得到的Z通过反卷积模块(输入维度为2,输出维度为128)生成维度为128维的特征,然后输入到VAE解码器中。解码器由两个残差层和两个反卷积层组成,残差层结构与编码器中的结构一致,输入128维特征,输出128维特征。然后经过第一个卷积层,输出维度64的特征,卷积核大小为4,步长为2。之后输入第二个卷积层,输出维度为64的特征Q,卷积核大小为4,步长为2。
(4)Q输入到输出卷积层(卷积核大小为3,步长为1)中,输出维度为1的预测的占用栅格图序列,交给运动规划模块进行处理。
基于上述网络结构,本发明在应用整个训练集进行模型的训练,基于KL散度和交叉熵混合损失函数:
N是样本的数量,C是分类数量,yij指示第i个样本的真实标签是否是第j个类(如果是1,如果不是0),pij表示第i个样本属于第j类的预测概率。本发明进行了60轮的训练,每一轮均对整个训练集进行遍历。梯度下降方法选用Adam,batch_size设为64,学习率设置为随训练轮数的增加不断减小。经过60轮的训练,损失函数逐渐下降并趋于稳定。
步骤4:本发明在获得预测的占用栅格图序列后,将每个栅格图顺序地用作采样候选轨迹的可行空间。建立一个可行的空间序列,该所述空间序列将时间信息合并在智能体的局部坐标系内。本发明将规划问题定义为优化问题,可以通过获得初始解并迭代优化来解决,可以参考图4。
为了简化计算,以智能体半径为膨胀半径对障碍物进行膨胀,将智能代理转换为质点,目的是计算碰撞和确定代理的轨迹。
通过获得占用栅格图的扩展序列,可以通过位置变换关系导出预测序列中的占用空间,所述位置变换关系如下式所示:
在短时间间隔内,智能体可以被认为是均匀运动的,质心是圆心,[VmaxΔt,VminΔt]作为半径是智能体可以到达的区域。因此,每帧的可行空间表示可以表示如下: 可行区间内的状态必须遵守严格速度区间约束和碰撞约束,最终采样的轨迹也必须保持在可行空间内。Vmax和Vmin分别表示智能体的最大最小速度,表征以最大速度行驶Δt时间所能达到的空间范围,/>表征以最小速度行驶Δt时间所能达到的空间范围,Cobs表示未被障碍物占据的空间。
步骤5:获得可行空间后,就在其中进行候选轨迹生成。本发明采用随机抽样方法在可行空间内选择帧。本发明单独逐个采样步骤4中膨胀后的栅格图序列,采样的空间表示每个图中未占用的区域。在对后续地图进行采样时,评估未占用栅格的可达性,以确保可达性,为了满足智能体的运动学约束,搜索空间描述如下:
如果相邻帧之间的采样点可以在没有任何碰撞的情况下连接,并且满足构造条件:连接的边没有落在可行空间外、两点间满足动力学约束与运动学约束,则将符合要求的相邻帧之间的采样点连接在一起以形成边。如果采样点不符合这些构造条件,则会将其丢弃,然后遍历采样点列表以识别成本最低的节点,并启动回溯过程以获得初始轨迹作为初始解。
步骤6:获得同时满足运动学约束和障碍物约束的初始轨迹后,就通过使用图优化方法生成更平滑、更安全的轨迹。智能体在任何给定时间的状态转换满足以下条件:
要优化的评估函数包括与参考轨迹间的横向和纵向距离偏差、方向偏差、线速度偏差与角速度偏差。优化评价指标L({Pt})由两部分组成:第一部分表示与全局路径所得到的参考轨迹{Pref}的偏差,而第二部分反映当前路径的平滑度:L({Pt})=Loffset({Pt};{Pref})+Lsmooth({Pt})。其中L({Pt})表示当前路径的代价,Loffset({Pt};{Pref})表示与参考轨迹{Pref}的偏移量,而Lsmooth({Pt})表示轨迹的平滑程度。
动态约束可以表示为确保智能体的加速度和速度遵守特定的限制,最终,该路径规划问题被公式化为一个非线性优化问题:
其中,L({Pt}|{mt:t+β})表示优化目标,{mt:t+β}表示栅格图序列,Cego表示自车外轮廓,Cobs表示障碍物外轮廓,表示所能达到的最大速度和最小速度,ωmin,ω{max}表示所能达到的最大角速度和最小角速度,|av|≤a{max},表示线加速度小于最大线加速度, 表示角加速度小于最大角加速度。
考虑到与解决非凸约束问题相关的挑战,通过将硬约束转换为目标函数内的惩罚,而将硬约束视为软约束。如果优化的轨迹不能满足运动学约束和障碍物约束,则重复执行本步骤优化过程进行进一步的优化,直到达到迭代的上限,则结束该求解过程,输出最终的规划路径。
本发明在基于Gazebo软件的仿真平台上进行验证,为与多类室内环境进行对应,本发明使用了Gazebo软件进行仿真环境的搭建,构建包含走廊、桌子、椅子的室内环境仿真平台。每一轮测试采用随机的起终点,和运动速度,起始位置随机分布在智能体周围0.5m外的障碍物,障碍物的数量、最大最小速度可以进行设置,当障碍物与智能体的距离小于0.05m,则视为发生碰撞,若发生碰撞,当前智能体测试轮次视为结束。若正常到达终点,当前智能体测试轮次视为结束。
基于以上测试要求,本发明采用的测试参数如下表所示:
最终的测试结果如下表所示:
基于本发明所述方法的构思,还提供一种适用室内环境的轻量性预测式导航***,包括位姿预测模块、动静态特征提取模块、占用栅格图序列预测模块、可行空间获取模块、初始轨迹获取模块以及轨迹优化模块;
位姿预测模块通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下;
动静态特征提取模块用于考虑环境变量在未来智能体所处的坐标系下,动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征;
占用栅格图序列预测模块采用变分自动编码器构建OGM占据栅格图预测生成模块,将未来概率占据栅格图的潜在变量特征作为输入,解码器输出预测的占用栅格图序列;
可行空间获取模块用于将每个栅格图顺序地用作采样候选轨迹的可行空间;
初始轨迹获取模块用于在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹;
轨迹优化模块采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹。
另一方面,本发明还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的适用室内环境的轻量性预测式导航方法。
所述计算机设备可以采用笔记本电脑、桌面型计算机、工作站或车载计算机。
对于本发明所述处理器,可以是中央处理器(CPU)、图形处理器(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)或现成可编程门阵列(FPGA)。
对于本发明所述存储器,可以是笔记本电脑、桌面型计算机、工作站或车载计算机的内部存储单元,如内存、硬盘;也可以采用外部存储单元,如移动硬盘、闪存卡。
本发明还可以提供一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算机可执行程序时能实现本发明所述的适用室内环境的轻量性预测式导航方法。
计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance Random Access Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。
综上所述,本发明提供一种适用室内环境的轻量性预测式导航方法采用分层的预测-规划方法,在统一的环境表征形式下,获取感知数据和车辆自身运动数据(速度,坐标)部分解耦动、静态环境,静态环境通过坐标变换与映射得到未来位置,动态环境通过提取场景运动特征信息,预测未来若干步长的栅格地图,然后直接利用未来栅格,同时处理动静态障碍物,提升轨迹优化的效率和有效性。
本发明所述方法能够在一个统一的表征形式下进行智能体的长时运动规划是一项有难度的任务。栅格地图是一种精简的,常见的环境表征方法,其具有与俯视图下类似的表征,适用于非结构化环境。栅格地图可以表征规划所需的可行空间,并具有抽象性、高复用性,可以直接为规划所利用。占用网格图的好处是能够表示任意形状的物体,并且能够估计物体的运动而不需要明确的数据关联。本发明所述方法用概率占据栅格图作为一种全面的表示,以防止转换过程中的信息丢失。本发明按时间顺序组织预测的占据栅格图序列以生成轨迹,从而减轻了规划过程对先前预测信息的依赖。关于预测方面,通过利用单线激光雷达进行感知,并结合运动信息,解决了实时性较差和预测结果不准确的挑战,此外,还采用了轻型结构来加快计算速度。关于规划问题,基于占据栅格图序列生成可行轨迹,同时考虑障碍物的未来分布,从而解决短期规划问题。此外,对所获得的轨迹进行优化,以确保平滑并减少轨迹的不连续性。
最后说明的是,以上所述,仅为说明本发明的具体实施方式,但本发明创造的保护范围并不局限于此,熟悉本技术领域的技术人员应该明白,在本发明技术方案的基础上,根据本发明创造的技术方案及其发明构思做出的修改或变形,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种适用室内环境的轻量性预测式导航方法,其特征在于,包括以下步骤:
通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下;
考虑环境变量在未来智能体所处的坐标系下,动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征;
采用变分自动编码器构建OGM占据栅格图预测生成模块,将未来概率占据栅格图的潜在变量特征作为输入,解码器输出预测的占用栅格图序列;
将每个栅格图顺序地用作采样候选轨迹的可行空间;
在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹;
采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹。
2.根据权利要求1所述的适用室内环境的轻量性预测式导航方法,其特征在于,通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下包括:
首先根据激光雷达的测量值计算出当前的障碍物占据位置,获取在当前智能体所处的坐标系下的障碍物占据位置;
根据智能体当前和下一刻位姿之间的转化关系以及智能体当前位姿信息推断出下一时刻的智能***姿;将当前障碍物分布投影到经历设定时长后的智能体所处位姿的坐标系,得到环境变量在未来智能体所处的坐标系下的投影。
3.根据权利要求1所述的适用室内环境的轻量性预测式导航方法,其特征在于,考虑动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征具体包括以下步骤:
将整个网格地图信息馈送到卷积长短时间记忆网络模块中,卷积长短时间记忆网络模块将一维占据栅格图作为输入,并使用大小为3的卷积核生成动态网格特征;
采用贝叶斯生成方法预测未来静态障碍物的局部地图,同时过滤掉动态信息,得到静态障碍物的局部地图信息;
将提取的动态网格特征和静态障碍物的局部地图信息作为OGM占据栅格图预测生成模块的输入。
4.根据权利要求1所述的适用室内环境的轻量性预测式导航方法,其特征在于,所述OGM占据栅格图预测生成模块包括编码器和解码器,编码器由两层卷积层和两层残差层构成,两层残差层参数一致;解码器由两个残差层和两个反卷积层组成,残差层结构与编码器中的结构一致。
5.根据权利要求1所述的适用室内环境的轻量性预测式导航方法,其特征在于,将每个栅格图顺序地用作采样候选轨迹的可行空间时,具体的,基于占用栅格图的扩展序列,通过位置变换关系导出预测序列中的占用空间,在设定时间段内,智能体均匀运动,质心是圆心,通过智能体能到达的区域得到每帧的可行空间表示,可行区间内的状态遵守严格速度区间约束和碰撞约束。
6.根据权利要求1所述的适用室内环境的轻量性预测式导航方法,其特征在于,在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹时,采用随机抽样方法在可行空间内选择帧,单独逐个采样栅格图序列,采样的空间表示每个图中未占用的区域,采样时在满足智能体的运动学约束和确保可达性的基础上,得到搜索空间;在采样时,如果相邻帧之间的采样点能在没有任何碰撞的情况下连接,并判断连接后的边是否满足智能体的动力学约束与运动学约束,若满足则将采样点连接在一起以形成边;遍历节点列表以识别成本最低的节点,并启动回溯过程以获得满足运动学约束和障碍物约束的初始轨迹。
7.根据权利要求1所述的适用室内环境的轻量性预测式导航方法,其特征在于,采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹包括:
将使用图优化方法生成更平滑和更安全的轨迹公式化为一个非线性优化问题:
其中,L({Pt}|{mt:t+β})表示优化目标,{mt:t+β}表示栅格图序列,Cego表示自车外轮廓,Cobs表示障碍物外轮廓,表示所能达到的最大速度和最小速度,ωmin,ω{max}表示所能达到的最大角速度和最小角速度,|av|≤a{max},表示线加速度小于最大线加速度, 表示角加速度小于最大角加速度;
将硬约束转换为目标函数内的惩罚,将硬约束视为软约束;循环迭代优化直至优化的轨迹满足运动学约束和障碍物约束或达到迭代的上限,解算得到最终规划路径。
8.一种适用室内环境的轻量性预测式导航***,其特征在于,包括位姿预测模块、动静态特征提取模块、占用栅格图序列预测模块、可行空间获取模块、初始轨迹获取模块以及轨迹优化模块;
位姿预测模块通过对多传感器***所获得智能***姿信息、速度信息与环境表征进行传感测量值的坐标转换,将环境变量投影到未来智能体所处的坐标系下;
动静态特征提取模块用于考考虑环境变量在未来智能体所处的坐标系下,动态障碍物的自行和静态障碍物在环境中的占用,捕捉两者之间的相互作用,并且将动态分量和静态分量解耦,提取未来概率占据栅格图的潜在变量特征;
占用栅格图序列预测模块采用变分自动编码器构建OGM占据栅格图预测生成模块,将未来概率占据栅格图的潜在变量特征作为输入,解码器输出预测的占用栅格图序列;
可行空间获取模块用于将每个栅格图顺序地用作采样候选轨迹的可行空间;
初始轨迹获取模块用于在所述可行空间中生成候选轨迹,获取满足运动学约束和障碍物约束的初始轨迹;
轨迹优化模块采用图优化方法基于所述初始轨迹生成更平滑、更安全的轨迹。
9.一种计算机设备,其特征在于,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,所述处理器执行程序时能实现权利要求1-7任一项所述的适用室内环境的轻量性预测式导航方法。
10.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现权利要求1-7任一项所述的适用室内环境的轻量性预测式导航方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310965884.3A CN116858253A (zh) | 2023-08-02 | 2023-08-02 | 一种适用室内环境的轻量性预测式导航方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310965884.3A CN116858253A (zh) | 2023-08-02 | 2023-08-02 | 一种适用室内环境的轻量性预测式导航方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116858253A true CN116858253A (zh) | 2023-10-10 |
Family
ID=88227022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310965884.3A Pending CN116858253A (zh) | 2023-08-02 | 2023-08-02 | 一种适用室内环境的轻量性预测式导航方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116858253A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349545A (zh) * | 2023-12-04 | 2024-01-05 | 中国电子科技集团公司第五十四研究所 | 一种基于环境约束栅格的目标时空分布预测方法 |
-
2023
- 2023-08-02 CN CN202310965884.3A patent/CN116858253A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117349545A (zh) * | 2023-12-04 | 2024-01-05 | 中国电子科技集团公司第五十四研究所 | 一种基于环境约束栅格的目标时空分布预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11970161B2 (en) | Apparatus, method and article to facilitate motion planning of an autonomous vehicle in an environment having dynamic objects | |
CN109782763B (zh) | 一种动态环境下的移动机器人路径规划方法 | |
CN114384920B (zh) | 一种基于局部栅格地图实时构建的动态避障方法 | |
JP7086111B2 (ja) | 自動運転車のlidar測位に用いられるディープラーニングに基づく特徴抽出方法 | |
CN111142557B (zh) | 无人机路径规划方法、***、计算机设备及可读存储介质 | |
US20220057803A1 (en) | Apparatus, method and article to facilitate motion planning in an environment having dynamic objects | |
JP2021515724A (ja) | 自動運転車において3dcnnネットワークを用いてソリューション推断を行うlidar測位 | |
CN112015847A (zh) | 一种障碍物的轨迹预测方法、装置、存储介质及电子设备 | |
CN107610235B (zh) | 一种基于深度学***台导航方法和装置 | |
CN116858253A (zh) | 一种适用室内环境的轻量性预测式导航方法及*** | |
CN113515131B (zh) | 基于条件变分自动编码器的移动机器人避障方法及*** | |
CN116628448B (zh) | 扩展目标中基于深度强化学习的传感器管理方法 | |
Srinivasan et al. | Beyond RMSE: Do machine-learned models of road user interaction produce human-like behavior? | |
CN114326810A (zh) | 一种无人机在复杂动态环境下的避障方法 | |
CN114241448A (zh) | 障碍物航向角的获取方法、装置、电子设备及车辆 | |
CN116448134B (zh) | 基于风险场与不确定分析的车辆路径规划方法及装置 | |
Doellinger et al. | Environment-aware multi-target tracking of pedestrians | |
CN117232522A (zh) | 基于时空交互图和危险区域的机器人人群导航方法及*** | |
WO2023242223A1 (en) | Motion prediction for mobile agents | |
CN113885567B (zh) | 一种基于冲突搜索的多无人机的协同路径规划方法 | |
Neloy et al. | Alpha-N-V2: Shortest path finder automated delivery robot with obstacle detection and avoiding system | |
WO2022099526A1 (zh) | 变道预测回归模型训练方法、变道预测方法和装置 | |
CN115903773A (zh) | 移动体控制装置、移动体、学习装置及方法、及存储介质 | |
EP4339051A1 (en) | Driving strategy determination method and apparatus, device, and vehicle | |
JP2023066619A (ja) | 制御装置、制御方法、および制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |