CN115861619A - 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与*** - Google Patents

一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与*** Download PDF

Info

Publication number
CN115861619A
CN115861619A CN202211639217.8A CN202211639217A CN115861619A CN 115861619 A CN115861619 A CN 115861619A CN 202211639217 A CN202211639217 A CN 202211639217A CN 115861619 A CN115861619 A CN 115861619A
Authority
CN
China
Prior art keywords
point cloud
attention
kernel
point
semantic segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211639217.8A
Other languages
English (en)
Inventor
罗甫林
曾涛
舒文强
郭坦
马泽忠
罗鼎
李朋龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202211639217.8A priority Critical patent/CN115861619A/zh
Publication of CN115861619A publication Critical patent/CN115861619A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***,属于计算机视觉技术领域,该方法包括以下步骤:S1:获取目标区域点云;S2:对获取的目标区域点云进行预处理,获得训练样本数据和测试样本数据;S3:将带标记的训练样本输入递归残差双注意力核点卷积网络进行训练;S4:训练完成后对测试样本进行语义分割并获得结果。本发明所述方法和***的性能优于其他的机载LiDAR城市点云语义分割方法,本方法和***可以更好地获得和分析机载LiDAR城市点云,并且在分割类别非平衡点云方面比其他方法具有优势。

Description

一种递归残差双注意力核点卷积网络的机载LiDAR城市点云 语义分割方法与***
技术领域
本发明属于计算机视觉技术领域,涉及一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***。
背景技术
激光雷达(Light Detection And Ranging,简称LiDAR)作为一种新兴的三维遥感观测技术,可提供反映地物三维结构信息的点云数据,且不受光照阴影的影响,在地物识别方面很有优势。通过将激光雷达设备搭载在有人机或无人机上进行航空扫描作业,可获得覆盖大范围地区的机载LiDAR点云数据。此外,机载LiDAR城市点云蕴含着大量且丰富的人文及自然相关的高价值目标信息,对其进行语义分割是后续进行城市三维建模和高精度地图绘制等一系列重要应用的基础和关键。然而,由于LiDAR数据的数据量很大,城市区域复杂,地物的几何属性也较为多变,导致现有的算法很难实现地物语义分割的精细提取。
传统的点云处理方法大多是通过对点云数据进行特定人为定义方式得到特征,再结合随机森林、支持向量机和和高斯混合模型等分类器,通过训练一组特征分类器来完成散乱点云数据的语义分割任务。显然,这类方法的性能很大程度上要依赖专家经验和分类算法。虽然国内外很多学者基于各种应用场景提出了些生成三维全局描述符的方法,如自旋图像、快速点特征直方图(FPFH)、热核签名(HKS)和直方图定位签名(SHOT)等。然而,这些方法独立估计每个点的局部特征,并预测每个标签,而不考虑相邻点之间的一致性。因此,分割结果经常受到噪声和标签不一致的影响,无法完全适用于所有语义分割场景。
目前,得益于深度学***面,转换为图像分割任务来处理,典型的代表有SnapNet。但通过投影降维的方法以在一定程度上损失空间信息,特别在复杂的空间分布下,会更容易得到一个很糟糕的结果;或是将像素概念扩展到三维空间,以体素化来组织空间点间的拓扑关系,然后再输入深度学习模型,如SEGCloud。然而这种方法是以消耗过多的内存为代价的,并且很难捕获高分辨率和细粒度的特征。为了避免以上多方位投影和体素构造的繁琐过程,PointNet开创了一种直接应用于点的深度学习体系结构,它使用共享的多层感知器和变换网络来独立的学习每个点的特征,并以一个简单的聚合操作来提取全局表示;PointNet++考虑了点云的局部结构,它以分层的方式处理一组点,然后将得到的局部特征进行聚合操作,生成更高层次的特征。然而以上基于离散卷积的方法在机载LiDAR城市点云上并没有取得明显的效果。
基于连续卷积算子的三维点云语义分割的方法中,定义了一个连续空间中的卷积运算,其中近邻的权重与每个中心点的空间分布有关。研究者们提出了核点连续卷积网络KPConv,然而,该网络对每个下采样层只包含一个核点卷积(KPConv),不能对不同密度的点云实现高鲁棒的多层次特征提取;进一步提出了一个局部和全局编码器网络(LGENet),用于机载LiDAR城市点云数据的语义分割。该方法首先通过二维和三维核点连续卷积提取特征,以学***衡性和稀疏性,以及如何进行多层次特征学习,因而无法充分识别细粒度点云语义特征。
综上所述,现有技术在机载LiDAR城市点云语义分割中均未充分考虑局部和全局的多层次的特征学***衡性。因此,提出一种能够对全局和局部特征多层次表征的机载LiDAR城市点云语义分割深度学习方法,达到提升语义分割精度效果是一件具有重要意义的研究。
发明内容
有鉴于此,本发明的目的在于提供一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***,首先该方法与***提出了注意力核点卷积(AKPConv)模块,通过使用批量归一化比例因子对通道信息进行加权,该因子利用标准偏差来表征通道权重的重要性,增强了点云的局部特征表示;基于AKPConv模块,提出了递归残差核点注意模块(RRKA),通过迭代累积学***衡点云方面比其他方法具有优势。
为达到上述目的,本发明提供如下技术方案:
一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,该方法包括以下步骤:S1:获取目标区域点云;S2:对获取的目标区域点云进行预处理,获得训练样本数据和测试样本数据;S3:将部分标记样本输入递归残差双注意力核点卷积网络进行训练;S4:训练完成后对测试样本进行语义分割并获得结果。
进一步,在步骤S1中,采用基于搭载LiDAR的无人机或者有人机平台来实现对城市点云数据的采集,具体包括:S11、依据城市点云语义分割的任务需求,选定待分割的目标区域,设置机载平台的飞行参数,包括但不限于飞行高度,速度,规划好飞行路线,采用“Z”字形飞行路线;S12、设置LiDAR的扫描参数,考虑点云的重合率,保证点云扫描精准度,选取基于非重复扫描的激光雷达,FOV为70.4°×77.2°,测距精度为3cm~1000cm,多回波最大为480000点/秒;S13、具体采集时,利用机载平台搭载LiDAR,按设定的扫描航线飞行,获取目标区域的点云数据。
进一步,在步骤S2中,对获取的目标区域点云进行预处理,主要包括点云配准,噪声去除,辐射校正,之后在点云数据中分块提取训练样本和测试样本,并标记训练样本的语义标签;特别的,为了减少点云数据回波强度长尾分布的影响,利用伽马变换将点云回波强度数据修正为正态分布来提高网络的稳健性,公式如下:
Figure BDA0004007980020000031
/>
其中,I为采集的回波强度;Iγ为伽马校正后的回波强度,其范围为0到255;γ为参数,其取值范围为0≤γ≤1;通过该公式,可以把原始的回波强度映射到图像空间。
进一步,在步骤S3中,将伽马校正后的点云训练数据输入注意力核点卷积块(AKPConv),对点云特征进行学习,得到注意力核点卷积特征;在下采样中利用AKPConv模块可对点云的点数进行下采样;具体的,先采用样本归一化层中的比例因子获取注意力权重,得到通道注意力特征fc,如下:
Figure BDA0004007980020000032
其中,fin为输入点云样本特征;μB为fin的均值,σB为fin的方差;ε为一个小常数,避免分母为0,设置为1×10-5;fout为归一化点云样本特征;
Figure BDA0004007980020000033
为元素乘积;sigmoid()为sigmoid函数,即为sigmoid(x)=1/(1+e-x);然后,把注意力特征输入到核点卷积公式中,得到特征F1,其公式如下:
F1=Conv1×1(KPConv(fc))
其中,Conv1×1表示的1×1卷积,KPConv(fc)表示的是核点卷积运算,其具体公式如下:
Figure BDA0004007980020000041
其中,
Figure BDA0004007980020000042
是点x在固定半径r(r∈R)的邻域集合,即Nx={xi∈x|||xi-x||≤r},xi是属于点x的任意子集,fi是点云子集xi对应的特征,核函数κ(·)的公式如下:
Figure BDA0004007980020000043
其中,
Figure BDA0004007980020000044
表示球形核点在3D空间中的位置,nk表示核函数κ(·)的核点个数,Wk是对应核点的权重矩阵;相关函数/>
Figure BDA0004007980020000045
σ为一个超参数,用于控制核点距离的影响;为保留输入特征,在AKPConv块中加入了跳跃连接;对于跳过连接,Maxpooling()是一个可选的最大池化操作,当Din=2D时,它将被使用,该操作可以表示为:
Figure BDA0004007980020000046
最后,AKPConv的输出特征FAKPConv可以表示为:
FAKPConv=ReLU(F1+F2)
其中,ReLU(x)=max(0,x)表示激活函数。
进一步,为了累积聚合局部特征,生成多样化的特征,由AKPConv构成的递归点卷积块(RPConv)和单个隐层的多层感知(MLP)组成了递归残差核点注意模块(RRKA);递归点卷积(RPConv)块主要用来学习点云的累积邻域特征,其公式表达如下:
Figure BDA0004007980020000047
其中
Figure BDA0004007980020000048
为l层T次递归的RPConv输入,t=1,2.3,...,T;AKPConv()表示为注意力核点卷积操作,/>
Figure BDA0004007980020000049
为RPConv在t次的输入,/>
Figure BDA00040079800200000410
为第t-1次递归输出;为满足RPConv的计算效率,在使用RPConv之前,首先采用MLP来压缩特征的维度,然后用MLP来恢复特征的维度;因此,构建了一个基于RPConv和MLP的压缩循环块(CRB)来提高计算效率,其公式表示如下:
xcout=ReLU(BN(W2*RPConv(BN(W1*xcin))))
其中,W1和W2为MLP的可学习参数,PRConv()为递归点卷积运算,BN()为批量归一化运算;在CRB的基础上,开发了带有残差连接的残差递归核注意力(RRKA)模块,该模块能有效地实现对局部特征的重复运算,增强了点云特征的多样性表示能力,RRKA输出可表示为:
xout=CRB(CRB(W0*xin))+xin
其中,其中W0为MLP的权重学习参数,xin为输入点云特征,CRB()为CRB运算。
进一步,经过五层上述编码模块后进行解码操作,在低级和高级特征的拼接之后,对特征张量利用全局-局部通道注意力模块(GLCA);首先采用全连接的方式来实现全局空间下的低级和高级特征的通道信息融合,其公式xg如下:
xg=BN(Wg*xin)
其中,该模块的输入为
Figure BDA0004007980020000051
N和C是上采样点云的数量和特征的维度,Wg为融合低层和高层特征的全连接权重;在局部特征运算中,使用平均池化和一维卷积得到注意力权重:
ω=sigmoid(Wk*(avgpooling(xg)))
其中,
Figure BDA0004007980020000052
为通道的平均池化操作,Wk是可学习的局部一维核卷积权重,其大小为k=5,公式表示如下:
Figure BDA0004007980020000053
根据注意力权重ω,可以得到如下局部注意特征xl(⊙表示逐元素相乘),公式如下:
Figure BDA0004007980020000054
全局-局部跨层信息交互模块GLCA的输出结果xout表示为:
xout=xg+xl
进一步,将该特征张量经过两层全连接层,经Sigmoid激活函数得到的语义分割结果,为了解决数据的不平衡问题,引入了焦点损失函数,损失函数设置如下:
Figure BDA0004007980020000055
其中,λ一般设置为2,αt表示类别权重参数,N表示点云的数量,ρjc表示第j个样本归入c类别的概率;根据所述焦点损失函数利用随机梯度下降法优化所述语义分割框架的模型参数,训练完成后,获得训练好的语义分割框架;通过训练好的语义分割框架对输入测试样本进行判别,输出语义分割结果。
本发明的有益效果在于:
本发明所提出的注意力核点卷积表示模块可以有效学***衡的机载LiDAR城市点云具有较强表征能力。在二个机载LiDAR城市点云数据集上的实验结果表明,所提出的RRDAN的性能优于目前最先进的机载LiDAR城市点云语义分割方法。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明方法流程图;
图2为机载平台采集点云示意图;
图3为用于机载LiDAR城市点云语义分割的递归残差双注意力核点卷积网络(RRDAN)图;
图4为本发明的注意力核点卷积模块AKPConv的结构图;
图5为本发明的递归残差核点注意模块RRKA的结构图;
图6为本发明的全局-局部通道注意力交互模块GLCA的结构图;
图7为本发明RRDAN网络的实验结果图;
图8为本发明RRDAN网络的实验结果误差图。
具体实施方式
下面结合附图对本发明技术方案进行详细说明。
图1为本发明方法流程图,本发明提供一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***,如图所示,在点云获取阶段,采用无人机或者有人机搭载LiDAR,可以快速获取空间遥感信息,包括地理位置、反射强度等信息,完成目标区域点云数据的采集。用于语义分割的深度学习网络如图3所示,它可以从机载点云中学习到精细的、具有代表性的地物特征。网络由注意力核点卷积模块(AKPConv)、递归残差核点注意模块(RRKA)和全局-局部通道注意力交互模块(GLCA)组成。首先,反射强度伽马校正后的点云数据通过三层注意力核点卷积模块获得局部特征,之后,通过RRKA模块从这些局部特征中获取并累积学习具有多层次精细表示能力的语义特征。然后,低级和高级特征的拼接之后,对特征张量应用全局-局部通道注意力模块(GLCA)学习融合后的语义信息。本发明设计的注意力核点卷积模块(AKPConv)用来提取点云邻域的局部特征,其中嵌入了注意力机制来加权通道特征,并添加了跳跃连接来融合上下文信息。本发明所提出递归残差核点注意模块(RRKA)可以通过迭代累积学习的方式聚合邻域点的多样化特征。通过网络的双注意力机制,可以增强细微的特征表示以提高分割性能。本发明提出了以关键信息递归累积学习为重点的多层次双注意核点卷积网络以挖掘类别分布不均衡机载点云的内在信息,生成具有鉴别力的高层语义特征。
具体来说,本发明技术方案包括以下内容:
1.数据获取:城市点云数据采集是基于搭载LiDAR的无人机或者有人机平台来实现的。首先依据城市点云语义分割任务需求,选定待分割的目标区域,设置机载平台的飞行参数,包括飞行高度,速度等,规划好飞行路线,一般采用“Z”字形飞行路线。然后,设置好LiDAR的扫描参数,考虑点云密度的分辨率,保证扫描精准度,这里选取基于非重复扫描的激光雷达,FOV为70.4°×77.2°,测距精度为3cm~1000cm,多回波最大为480000点/秒。具体采集时,利用机载平台搭载LiDAR,按设定的扫描航线飞行,获取目标区域点云数据,示意图如图2。
2.数据预处理:对获取的目标区域点云进行预处理,主要包括点云配准,噪声去除,辐射校正,之后在点云数据中分块提取训练样本和测试样本,并标记训练样本的语义标签。特别的,为了减少点云数据回波强度长尾分布的影响,利用伽马变换将点云回波强度数据修正为正态分布来提高网络的稳健性,公式如下:
Figure BDA0004007980020000071
其中,I为采集的回波强度;Iγ为伽马校正后的回波强度,其范围为0到255;γ为参数,其取值范围为0≤γ≤1;通过该公式,可以把原始的回波强度映射到图像空间。
3.将伽马校正后的点云训练数据输入注意力核点卷积块(AKPConv),如图4所示。对点云特征进行学习,得到注意力核点卷积特征;在下采样中利用AKPConv模块可对点云的点数进行下采样。具体的,先采用样本归一化层中的比例因子获取注意力权重,得到通道注意力特征fc,如下:
Figure BDA0004007980020000081
/>
其中,fin为输入点云样本特征;μB为fin的均值,σB为fin的方差;ε为一个小常数,避免分母为0,设置为1×10-5;fout为归一化点云样本特征;
Figure BDA0004007980020000082
为元素乘积;sigmoid()为sigmoid函数,即为sigmoid(x)=1/(1+e-x)。
然后,把注意力特征输入到核点卷积公式中,得到特征F1,如下:
F1=Conv1×1(KPConv(fc))
其中,Conv1×1表示的1×1卷积,KPConv()表示的是核点卷积运算,其具体公式如下:
Figure BDA0004007980020000083
其中,
Figure BDA0004007980020000084
是点x在固定半径r(r∈R)的邻域集合,即Nx={xi∈x|||xi-x||≤r},xi是属于点x的任意子集,fi是点云子集xi对应的特征,核函数κ(·)的公式如下:
Figure BDA0004007980020000085
其中,
Figure BDA0004007980020000086
表示球形核点在3D空间中的位置,nk表示核函数κ(·)的核点个数,Wk是对应核点的权重矩阵;相关函数/>
Figure BDA0004007980020000087
σ为一个超参数,用于控制核点距离的影响。
为保留输入特征,在AKPConv块中加入了跳跃连接;对于跳过连接,Maxpooling()是一个可选的最大池化操作。当Din=2D时,它将被使用,该操作可以表示为:
Figure BDA0004007980020000088
最后,AKPConv的输出特征FAKPConv可以表示为:
FAKPConv=ReLU(F1+F2)
其中,ReLU(x)=max(0,x)表示激活函数。
4.为了累积聚合局部特征,生成多样化的特征,由AKPConv构成的递归点卷积块(RPConv)和单个隐层的多层感知(MLP)组成了递归残差核点注意模块(RRKA),如图5所示。递归点卷积(RPConv)块主要用来学习点云的累积邻域特征,其公式表达如下:
Figure BDA0004007980020000091
其中
Figure BDA0004007980020000092
为l层T次递归的RPConv输入,t=1,2,3,...,T;AKPConv()表示为注意力核点卷积操作,/>
Figure BDA0004007980020000093
为RPConv在t次的输入,/>
Figure BDA0004007980020000094
为第t-1次递归输出。
为满足RPConv的计算效率,在使用RPConv之前,首先采用MLP来压缩特征的维度,然后用MLP来恢复特征的维度。因此,构建了一个基于RPConv和MLP的压缩循环块(CRB)来提高计算效率,其公式表示如下:
xcout=ReLU(BN(W2*RPConv(BN(W1*xcin))))
其中,W1和W2为MLP的可学习参数,PRConv()为递归点卷积运算,BN()为批量归一化运算。
在CRB的基础上,开发了带有残差连接的残差递归核注意力(RRKA)模块,该模块能有效地实现对局部特征的重复运算,增强了点云特征的多样性表示能力,RRKA输出可表示为:
xout=CRB(CRB(W0*xin))+xin
其中,其中W0为MLP的权重学习参数,xin为输入点云特征,CRB()为CRB运算。
5.经过五层上述编码模块后进行解码操作,在低级和高级特征的拼接之后,对特征张量利用全局-局部通道注意力模块(GLCA),如图6所示。
采用全连接的方式来实现全局空间下的低级和高级特征的通道信息融合,其公式xg如下:
xg=BN(Wg*xin)
其中,该模块的输入为
Figure BDA0004007980020000095
N和C是上采样点云的数量和特征的维度,Wg为融合低层和高层特征的全连接权重。
在局部特征运算中,使用平均池化和一维卷积得到注意力权重:
ω=sigmoid(Wk*(avgpooling(xg)))
其中,
Figure BDA0004007980020000096
为通道的平均池化操作,Wk是可学习的局部一维核卷积权重,其大小为k=5,其公式表示如下:
Figure BDA0004007980020000097
根据注意力权重ω,可以得到如下局部注意特征xl(⊙表示逐元素相乘),公式如下:
xl=BN(ω⊙xg)
全局-局部跨层信息交互模块GLCA的输出结果xout表示为:
xout=xg+xl
6.将该特征张量经过两层全连接层,经Sigmoid激活函数得到的语义分割结果,为了解决数据的不平衡问题,引入了焦点损失函数,损失函数设置如下:
Figure BDA0004007980020000101
其中,其中λ一般设置为2,αt表示类别权重参数,N表示点云的数量,ρjc表示第j个样本归入c类别的概率。根据所述焦点损失函数利用随机梯度下降法优化所述语义分割框架的模型参数,训练完成后,获得训练好的语义分割框架;通过训练好的语义分割框架对输入测试样本进行判别,输出语义分割结果。
如图7是本发明所述的RRDAN语义分割网络在一个开源机载城市点云数据集ISPRS上的实验结果,图8是误差图,可以看到,测试区域中的9个类别被很好地分割出来。本发明的分割效果还可以通过对比实验进一步说明。在ISPRS数据集上采用本发明方法和其他现有方法LUH、RIT_1、alsNet、KPConv、DPE、GANet、DANCE-NET、D-FCN、RandLANet、GraNet、LGENet方法进行对比,如表1所示,分别计算总体精度Overall Accuracy(OA)、平均F1指数Avg.F1,其中,总体精度OA越大,说明所有被预测为正确的结果中正确的比例越高;平均F1指数Avg.F1越大,说明结果的综合评价越好。表l给出了不同方法检测结果的各项指标值。
表l RRADN与各种方法在ISPRS数据集上的比较
Figure BDA0004007980020000102
可以看出,本发明方法在该数据集上取得了最佳的OA和Avg.F1。同时,本发明所述方法的性能优于其他的机载LiDAR城市点云语义分割方法。本发明提出的方法可以获得更好的效果,并且在类别为汽车、屋顶、立面、低矮灌木、树木方面比其他方法具有优势。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:该方法包括以下步骤:
S1:获取目标区域点云;
S2:对获取的目标区域点云进行预处理,获得训练样本数据和测试样本数据;
S3:将部分标记样本输入递归残差双注意力核点卷积网络进行训练;
S4:训练完成后对测试样本进行语义分割并获得结果。
2.根据权利要求1所述的一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:在步骤S1中,采用基于搭载LiDAR的无人机或者有人机平台来实现对城市点云数据的采集,具体包括:S11、依据城市点云语义分割的任务需求,选定待分割的目标区域,设置机载平台的飞行参数,包括但不限于飞行高度,速度,规划好飞行路线,采用“Z”字形飞行路线;S12、设置LiDAR的扫描参数,考虑点云的重合率,保证点云扫描精准度,选取基于非重复扫描的激光雷达,FOV为70.4°×77.2°,测距精度为3cm~1000cm,多回波最大为480000点/秒;S13、具体采集时,利用机载平台搭载LiDAR,按设定的扫描航线飞行,获取目标区域的点云数据。
3.根据权利要求2所述的一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:在步骤S2中,对获取的目标区域点云进行预处理,主要包括点云配准,噪声去除,辐射校正,之后在点云数据中分块提取训练样本和测试样本,并标记训练样本的语义标签;特别的,为了减少点云数据回波强度长尾分布的影响,利用伽马变换将点云回波强度数据修正为正态分布来提高网络的稳健性,公式如下:
Figure QLYQS_1
其中,I为采集的回波强度;Iγ为伽马校正后的回波强度,其范围为0到255;γ为参数,其取值范围为0≤γ≤1;通过该公式,可以把原始的回波强度映射到图像空间。
4.根据权利要求3所述的一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:在步骤S3中,将伽马校正后的点云训练数据输入注意力核点卷积块(AKPConv),对点云特征进行学习,得到注意力核点卷积特征;在下采样中利用AKPConv模块可对点云的点数进行下采样;具体的,先采用样本归一化层中的比例因子获取注意力权重,得到通道注意力特征fc,如下:
Figure QLYQS_2
其中,fin为输入点云样本特征;
Figure QLYQS_3
为fin的均值,/>
Figure QLYQS_4
为fin的方差;ε为一个小常数,避免分母为0,设置为1×10-5;fout为归一化点云样本特征;/>
Figure QLYQS_5
为元素乘积;sigmoid()为sigmoid函数,即为sigmoid(x)=1/(1+e-x);然后,把注意力特征输入到核点卷积公式中,得到特征F1,其公式如下:/>
F1=Conv1×1(KPConv(fc))
其中,Conv1×1表示的1×1卷积,KPConv()表示的是核点卷积运算,其具体公式如下:
Figure QLYQS_6
其中,
Figure QLYQS_7
是点x在固定半径r(r∈R)的邻域集合,即Nx={xi∈x∣||xi-x||≤r},xi是属于点x的任意子集,fi是点云子集xi对应的特征,核函数κ(·)的公式如下:
Figure QLYQS_8
其中,
Figure QLYQS_9
表示球形核点在3D空间中的位置,nk表示核函数κ(·)的核点个数,Wk是对应核点的权重矩阵;相关函数/>
Figure QLYQS_10
σ为一个超参数,用于控制核点距离的影响;为保留输入特征,在AKPConv块中加入了跳跃连接;对于跳过连接,Maxpooling()是一个可选的最大池化操作,当Din=2D时,它将被使用,该操作可以表示为:
Figure QLYQS_11
最后,AKPConv的输出特征FAKPConv可以表示为:
FAKPConv=ReLU(F1+F2)
其中,ReLU(x)=max(0,x)表示激活函数。
5.根据权利要求4所述的一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:为了累积聚合局部特征,生成多样化的特征,由AKPConv构成的递归点卷积块(RPConv)和单个隐层的多层感知(MLP)组成了递归残差核点注意模块(RRKA);递归点卷积(RPConv)块主要用来学习点云的累积邻域特征,其公式表达如下:
Figure QLYQS_12
其中
Figure QLYQS_13
为l层T次递归的RPConv输入,t=1,2,3,…,T;AKPConv()表示为注意力核点卷积操作,/>
Figure QLYQS_14
为RPConv在t次的输入,/>
Figure QLYQS_15
为第t-1次递归输出;为满足RPConv的计算效率,在使用RPConv之前,首先采用MLP来压缩特征的维度,然后用MLP来恢复特征的维度;因此,构建了一个基于RPConv和MLP的压缩循环块(CRB)来提高计算效率,其公式表示如下:
xcout=ReLU(BN(W2*RPConv(BN(W1*xcin))))
其中,W1和W2为MLP的可学习参数,PRConv()为递归点卷积运算,BN()为批量归一化运算;在CRB的基础上,开发了带有残差连接的残差递归核注意力(RRKA)模块,该模块能有效地实现对局部特征的重复运算,增强了点云特征的多样性表示能力,RRKA输出可表示为:
xout=CRB(CRB(W0*xin))+xin
其中,其中W0为MLP的权重学习参数,xin为输入点云特征,CRB()为CRB运算。
6.根据权利要求5所述的一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:经过五层上述编码模块后进行解码操作,在低级和高级特征的拼接之后,对特征张量利用全局-局部通道注意力模块(GLCA);首先采用全连接的方式来实现全局空间下的低级和高级特征的通道信息融合,其公式xg如下:
xg=BN(Wg*xin)
其中,该模块的输入为
Figure QLYQS_16
N和C是上采样点云的数量和特征的维度,Wg为融合低层和高层特征的全连接权重;在局部特征运算中,使用平均池化和一维卷积得到注意力权重:
ω=sigmoid(Wk*(avgpooling(xg)))
其中,
Figure QLYQS_17
为通道的平均池化操作,Wk是可学习的局部一维核卷积权重,其大小为k=5,公式表示如下:
Figure QLYQS_18
根据注意力权重ω,可以得到如下局部注意特征xl(⊙表示逐元素相乘),公式如下:
xl=BN(ω⊙xg)
全局-局部跨层信息交互模块GLCA的输出结果xout表示为:
xout=xg+xl。
7.根据权利要求6所述的一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法,其特征在于:将该特征张量经过两层全连接层,经Sigmoid激活函数得到的语义分割结果,为了解决数据的不平衡问题,引入了焦点损失函数,损失函数设置如下:
Figure QLYQS_19
其中,λ一般设置为2,αt表示类别权重参数,N表示点云的数量,ρjc表示第j个样本归入c类别的概率;根据所述焦点损失函数利用随机梯度下降法优化所述语义分割框架的模型参数,训练完成后,获得训练好的语义分割框架;通过训练好的语义分割框架对输入测试样本进行判别,输出语义分割结果。
8.一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割***,其特征在于:该***采用权利要求1至8中任一项所述方法。
CN202211639217.8A 2022-12-20 2022-12-20 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与*** Pending CN115861619A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211639217.8A CN115861619A (zh) 2022-12-20 2022-12-20 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211639217.8A CN115861619A (zh) 2022-12-20 2022-12-20 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***

Publications (1)

Publication Number Publication Date
CN115861619A true CN115861619A (zh) 2023-03-28

Family

ID=85674419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211639217.8A Pending CN115861619A (zh) 2022-12-20 2022-12-20 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***

Country Status (1)

Country Link
CN (1) CN115861619A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116413740A (zh) * 2023-06-09 2023-07-11 广汽埃安新能源汽车股份有限公司 一种激光雷达点云地面检测方法及装置
CN116468892A (zh) * 2023-04-24 2023-07-21 北京中科睿途科技有限公司 三维点云的语义分割方法、装置、电子设备和存储介质
CN116958557A (zh) * 2023-08-11 2023-10-27 安徽大学 一种基于残差脉冲神经网络的三维室内场景语义分割方法
CN117541799A (zh) * 2024-01-09 2024-02-09 四川大学 基于在线随机森林模型复用的大规模点云语义分割方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116468892A (zh) * 2023-04-24 2023-07-21 北京中科睿途科技有限公司 三维点云的语义分割方法、装置、电子设备和存储介质
CN116413740A (zh) * 2023-06-09 2023-07-11 广汽埃安新能源汽车股份有限公司 一种激光雷达点云地面检测方法及装置
CN116413740B (zh) * 2023-06-09 2023-09-05 广汽埃安新能源汽车股份有限公司 一种激光雷达点云地面检测方法及装置
CN116958557A (zh) * 2023-08-11 2023-10-27 安徽大学 一种基于残差脉冲神经网络的三维室内场景语义分割方法
CN117541799A (zh) * 2024-01-09 2024-02-09 四川大学 基于在线随机森林模型复用的大规模点云语义分割方法
CN117541799B (zh) * 2024-01-09 2024-03-08 四川大学 基于在线随机森林模型复用的大规模点云语义分割方法

Similar Documents

Publication Publication Date Title
CN107609601B (zh) 一种基于多层卷积神经网络的舰船目标识别方法
CN108573276B (zh) 一种基于高分辨率遥感影像的变化检测方法
CN115861619A (zh) 一种递归残差双注意力核点卷积网络的机载LiDAR城市点云语义分割方法与***
CN111899172A (zh) 一种面向遥感应用场景的车辆目标检测方法
Huang et al. GraNet: Global relation-aware attentional network for semantic segmentation of ALS point clouds
CN110222767B (zh) 基于嵌套神经网络和栅格地图的三维点云分类方法
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN113420607A (zh) 无人机多尺度目标检测识别方法
CN110287798B (zh) 基于特征模块化和上下文融合的矢量网络行人检测方法
CN109919223B (zh) 基于深度神经网络的目标检测方法及装置
CN113706480A (zh) 一种基于关键点多尺度特征融合的点云3d目标检测方法
WO2023030182A1 (zh) 图像生成方法及装置
CN113870160B (zh) 一种基于变换器神经网络的点云数据处理方法
Liu et al. Survey of road extraction methods in remote sensing images based on deep learning
CN114049572A (zh) 识别小目标的检测方法
CN116385958A (zh) 一种用于电网巡检和监控的边缘智能检测方法
CN116824585A (zh) 一种基于多级上下文特征融合网络的航空激光点云语义分割方法与装置
CN117079163A (zh) 一种基于改进yolox-s的航拍图像小目标检测方法
Liao et al. Lr-cnn: Local-aware region cnn for vehicle detection in aerial imagery
CN112668662B (zh) 基于改进YOLOv3网络的野外山林环境目标检测方法
Wang et al. Based on the improved YOLOV3 small target detection algorithm
CN114283326A (zh) 一种结合局部感知和高阶特征重构的水下目标重识别方法
CN114187506A (zh) 视点意识的动态路由胶囊网络的遥感图像场景分类方法
CN114550023A (zh) 一种交通目标静态信息提取装置
CN117788810A (zh) 一种无监督语义分割的学习***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination