CN113096126B - 基于图像识别深度学习的道路病害检测***及方法 - Google Patents
基于图像识别深度学习的道路病害检测***及方法 Download PDFInfo
- Publication number
- CN113096126B CN113096126B CN202110616773.2A CN202110616773A CN113096126B CN 113096126 B CN113096126 B CN 113096126B CN 202110616773 A CN202110616773 A CN 202110616773A CN 113096126 B CN113096126 B CN 113096126B
- Authority
- CN
- China
- Prior art keywords
- network
- image
- data
- road
- batch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30132—Masonry; Concrete
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明属于智能交通技术领域,具体涉及一种基于图像识别深度学习的道路病害检测***及方法,***包括图像处理模块、图像检测模块、图像分割模块以及图像分类模块,方法包括样本图像采集步骤、样本图像预处理步骤、样本标注步骤、模型训练步骤和道路病害检测步骤,是一种基于深度学习,对道路图像进行检测、分类、分割的道路病害检测技术。
Description
技术领域
本发明属于智能交通技术领域,具体涉及一种基于图像识别深度学习的道路病害检测***及方法。
背景技术
公路结构层可分为面层、基层和土基,基层又可分为垫层(底基层)、基层;路基的主要作用是承受公路结构层重量和荷载路面,是土层;垫层是路面的最底层,起排水、扩散基层应力并将应力传到路基;基层主要是承重,并将面层应力扩散到垫层;面层主要是改善行车条件,保护路面基层。即,路基是在天然地表面按照道路的设计线形(位置)和设计横断面(几何尺寸)的要求开挖或堆填而成的岩土结构物,路面是在路基顶面的行车部分用各种混合料铺筑而成的层状结构物
因此,对于公路来说最重要的组成部分便是路基路面,这是公路养护的重点内容和部位,但是由于病害(裂隙、坑洞等)时有发生,这对于公路的使用产生了直接的影响,对于相关病害的处置约占养护费用的80%以上,因此对于道路病害需要进行相关的检测,以便进行相关的公路养护以及相关事故的提前预防。
在传统的道路病害检测中主要是以传统LBP(Local Binary Patter,局部二值模式)算子以及Gabor滤波算子来对被检测道路的图像进行纹理特征提取,通过提取到的特征来分辨哪些是道路损坏的地方。其中LBP算子在处理图像特征方面具有旋转不变性以及灰度不变性等显著特征,这对于提取相关特征有较好作用;而Gabor滤波算子的两个优势在于一方面满足“测不准原理”所确定的有效持续时间和有效频率带宽乘积的下限,这意味着它可以同时在时域和频域获得较佳的局部化,且它是带通的,这与人类视觉接收场模型相吻合。
但是这两个方式存在着一些问题:首先这两种方式在处理实际路面特征时由于算法的处理逻辑并不完善,因此往往在实际表现中检测效果不佳;其次,LBP算子在平坦图像区域上不太稳健,受到图像噪声的影响较高;再者,Gabor算子则是在提取图像特征时存在计算量过大的情况。
发明内容
为了克服上述现有技术中存在的问题和不足,本发明旨在于提出一种基于深度学习,对道路图像进行检测、分类、分割的道路病害检测***及方法。
本发明的目的是通过以下技术方案实现的:
基于图像识别深度学习的道路病害检测***,包括图像处理模块、图像检测模块、图像分割模块以及图像分类模块;
所述图像处理模块用于对采集到的待检测道路的图像进行预处理,待检测道路的图像中包含路面的道路病害图片以及相关道路病害的标签数据,将经过预处理的图像传送至所述图像检测模块中;
所述图像检测模块通过Labelme标注工具、根据道路左右两边终止实线为划分、从所述图像处理模块预处理的图像中提取出属于道路路面的部分,并发送给所述图像分割模块以及图像分类模块,用于后续进行病害形态的分割以及病害类别的分类;
所述图像分割模块通过经训练学习的目标分割网络,从所述图像检测模块中提取出的属于道路路面的部分中以像素级的细粒度的进行路面病害部分分割,用以刻画路面病害的形态;像素级的细粒度指的就是图片的最低分割单位,也即一个像素点一个像素点的进行分割,具体的就是通过训练出相应的目标分割网络,基于这个分割网络进行像素级分割;
所述图像分类模块根据先验阈值,将所述图像检测模块中提取出的属于道路路面的部分,按照不同的道路病害类别和等级进行聚类分类;所述先验阈值,可以根据管理要求进行配置,比如《水泥混凝土路面病害明细表》等相关文档进行等级和类别的划分。
对应的,本发明还提供了一种基于图像识别深度学习的道路病害检测方法,包括以下步骤:
样本图像采集步骤,采集若干不同道路、包含各种道路病害的路面情况图像,形成样本图像集,即建立一个明确了道路病害位置、类型等具体情况的图集作为标准数据库;
优选地,所述路面情况图像的原始图片大小为608x608像素。
样本图像预处理步骤,对所述样本图像集中包含的不同道路及各种道路病害的路面情况图像进行裁切、翻转以及亮度/对比度/色调变换处理;
进一步的,所述裁切,是在路面情况图像的原始图片上,以区域随机的方式对图片进行裁切。
而所述翻转,是在路面情况图像的原始图片上,以图片横向的中心线和纵向的中心线为翻转中心线分别进行上下翻转和左右翻转。
所述亮度/对比度/色调变换,是基于路面情况图像的原始图片,在原始图片的HSV颜色空间中对色调(H)、饱和度(S)、亮度(V)三个数值分别以随机的方式各自进行数值调整。
裁切就是指的对标注了的图形随机切分出图形的一部分,需要注意的是随机切分是深度学***和垂直翻转;亮度调节指的是随机的设定图形的亮度,相应对比度改变和色调也是一样的操作方式。
样本标注步骤,通过标注工具Labelme,在经过所述样本图像预处理步骤处理后的路面情况图像上标出病害的区域,得到病害区域的范围坐标,并按照分类类别和分割标签对病害的区域进行样本标注,将样本中明确的道路病害位置、类型等具体情况进行标签化处理。
模型训练步骤,选择经过所述样本标注步骤标注过的路面情况图像作为网络模型的训练数据集,对网络模型进行训练;
优选地,鉴于本发明的目标是要对图像中病害部分进行分类/分割和检测,因此考虑使用maskrcnn网络作为训练和预测用的网络模型,该网络模型能够满足对目标的检测、分割和分类的需求。
具体的,所述模型训练步骤中,对样本图像集中所有经过样本标注步骤标注的路面情况图像进行划分,比如,按照85%、10%、5%的比例将划分为训练集、交叉验证集和测试集;所述训练集,并非是一次性全部传入到模型中进行训练的,而是以若干个batch批次进行训练的,每个batch批次的选择是以2的次方进行选择最佳,例如:16、32、64、128、256等等,这样,每一个batch批次的数据量在显卡中能够更好的被利用,也能加快模型的更新迭代,在本方案中,根据显卡的算力和显存的大小,优选地选择128张图片为一个batch批次,对模型训练的结果更优秀。
更具体的,所述模型训练步骤中,对网络模型进行训练,具体的,是使用maskrcnn网络作为训练和预测用的网络模型,每次将训练集中的一个batch批次的数据传入到maskrcnn网络中,首先经过用于对数据进行特征提取的卷积神经网络模块,卷积神经网络模块对应路面情况图像的CNN骨干网络(Convolutional Backbone),其中CNN骨干网络具有多种选择,CNN骨干网络指的是具有卷积结构的网络,是本身存在与图像类算法中的,任何图像类算法都是包含了CNN骨干网络这个部分,任何具有卷积结构的网络都可以作为CNN骨干网络,比如本方案中的CNN骨干网络选择的就是ResNet101网络作为主干特征提取网络,经过主干特征提取网络之后得到若干种尺寸的特征图。
然后,将卷积神经网络模块提取的这若干种尺寸的特征图分别输送到网络模型的RPN网络中进行处理得到RPN网络特征图,所述RPN网络特征图会得到与特征对应的粗略的目标检测框,以待后续对进行检测框坐标进行精修。
接着,将若干种尺寸的特征图以及经过所述RPN网络处理后的RPN网络特征图输入到网络模型的ROI Align模块中进行缩放,得到固定大小的特征图;
优选地,所述ROI Align模块对于各种不同尺寸的特征图进行尺寸缩放,具体的,是对于输入的不同尺寸的特征图,分别将其划分为7*7大小的区域,接着对每个区域进行双线性插值,得到4个点,通过插完值之后再进行最大池化(max pooling)处理得到最终的7*7大小的ROI感兴趣区域,使得不同大小的特征图经过这个模块之后得到大小相同的特征图;
得到固定大小的特征图之后,将maskrcnn网络划分为两个分支,其中一个分支将特征图拉伸为固定长度为1024的向量,传入到maskrcnn网络的全连接神经网络中,全连接神经网络同样是属于maskrcnn的一个子模块,这个子模块在很多的图像算法中都是存在的,这个子模块用来将抽取到的特征图数据转换为一维向量数据,这个全连接神经网络连接着maskrcnn网络的box regression模块和classfication模块,其中box regression模块用来得到输入图像的预测边界框坐标,针对前面在RPN网络中得到的目标检测框进行框的坐标的精修工作,而classfication模块则是对目标检测框框定的图片区域进行类别预测;而另一个分支是将特征图传入到maskrcnn网络的FCN(Fully Convolution Network)网络进行目标区域分割。
进一步的,还包括调参阶段,在调参阶段,最重要的就是根据损失函数的损失值的变化情况来对参数进行调整,其中损失函数为:
其中,Pi和Pi *是输入到模型的图片的真实类别标签以及模型对其的预测类别标签,ti和ti *是输入到模型的图片中待检测物体的真实坐标值和模型对其的预测坐标值,Ncls指的是类别标签的数目,Nreg指的是检测任务中需要回归的数目,Lcls(Pi,Pi *)是分类任务的损失函数,Lreg(ti,ti *)是坐标回归任务的损伤函数,λ是权重系数、是为了调整回归任务的损失函数在总的损失函数中的比重。
即,根据损失函数L(Pi,ti)是否在下降,以及下降的幅度来进行参数调整,调整的参数是通过SGD优化器中的学习率以及神经网络的层数等参数,当损失值基本不下降了的时候就停止训练,模型训练完毕。
优选地,所述调参阶段,选择的优化器为SGD优化器对网络模型训练和进行参数调整,SGD优化器的运算公式如下:
其中,x即在处理的图像数据、y是该图像数据对应的标签,i代表的是第i个数据,n
代表的是每个batch批次包含的数据量,是神经网络中的权重参数;α是学习率,控制着模
型更新权重参数的步伐是多大,选择的范围是在[0.01,0.1]之间,间隔一般选择0.01,
就是对损失函数进行求导得到的导数。
进一步的,所述模型训练步骤中,每次将训练集中的一个batch批次的数据传入到
maskrcnn网络中后,在经过卷积神经网络模块对数据进行特征提取前还要先采用Batch_
Norm批量归一化方法对每一个batch批次的数据进行归一化处理,以避免训练结果发散,对
于一个batch批次的图片数据B={x1,x2,...,xm}进行归一化处理得到微调的数据,其中,γ和β是maskrcnn网络中、在模型训练步骤过程中随着训练过
程不断地进行调整的两个常数变量,yi是在新的数据上经过线性变换进行微调的数据,用
于传入神经网络中新一层的神经元,而是经过运算之后得到的新的数据,是普朗克常量,代表一个很小的常数,避免分母出现0的情况;则是传入的数据与其均
值的方差,;是一个batch批次的数据的均值,,
其中m是一个batch批次中图片的数目,xi就是我们传入到模型进行训练的数据。
道路病害检测步骤,将待检测的道路图片输入到所述模型训练步骤中训练完成的网络模型中得到实际的道路病害情况,如果输入的图片被预测为存在道路病害,则确认采集的图像所对应的路段位置信息,生成相关的路段位置信息并提供给检测的终端。
有益效果:
与现有技术方案相比,本发明所提供的这种技术方案的有益效果如下:
1、基于目标检测+分割+分类的方式,本发明能够应对各种不同道路情况下的各种不同的道路病害情况,大大覆盖了病害会出现的各种场景,并且分割的方式能够比较好的刻画病害形态,而分类的方式则能对不同的病害进行详细的类别分类;
2、该发明基于深度学习能够有较高的精度,并且模型训练完毕之后不需要再进行训练,可直接进行预测使用,保证了在使用阶段的计算量很小,预测精度和效率更高;
3、该发明基于深度学习,该发明在处理病害问题上有较好的泛化能力,针对各种不同的路面场景都能够很好的进行结果预测,相比传统方法,受到拍摄的路面图片的影响更小。
附图说明
本发明的前述和下文具体描述在结合以下附图阅读时变得更清楚,附图中:
图1为本发明地磁传感式道钉的分布示意图。
具体实施方式
下面通过几个具体的实施例来进一步说明实现本发明目的技术方案,需要说明的是,本发明要求保护的技术方案包括但不限于以下实施例。
实施例1
作为本发明基于图像识别深度学习的道路病害检测***一种具体的实施方案,公开了的***包括图像处理模块、图像检测模块、图像分割模块以及图像分类模块,具体的,所述图像处理模块用于对采集到的待检测道路的图像进行预处理,待检测道路的图像中包含路面的道路病害图片以及相关道路病害的标签数据,将经过预处理的图像传送至所述图像检测模块中。
而所述图像检测模块通过Labelme标注工具、根据道路左右两边终止实线为划分、从所述图像处理模块预处理的图像中提取出属于道路路面的部分,并发送给所述图像分割模块以及图像分类模块,用于后续进行病害形态的分割以及病害类别的分类。
所述图像分割模块通过经训练学习的目标分割网络,从所述图像检测模块中提取出的属于道路路面的部分中以像素级的细粒度的进行路面病害部分分割,用以刻画路面病害的形态;像素级的细粒度指的就是图片的最低分割单位,也即一个像素点一个像素点的进行分割,具体的就是通过训练出相应的目标分割网络,基于这个分割网络进行像素级分割。
所述图像分类模块根据先验阈值,将所述图像检测模块中提取出的属于道路路面的部分,按照不同的道路病害类别和等级进行聚类分类;所述先验阈值,可以根据管理要求进行配置,比如《水泥混凝土路面病害明细表》等相关文档进行等级和类别的划分。
实施例2
作为本发明基于图像识别深度学习的道路病害检测方法一种具体的实施方案,如图1,公开的道路病害检测方法包括样本图像采集步骤、样本图像预处理步骤、样本标注步骤、模型训练步骤和道路病害检测步骤。
具体的,所述样本图像采集步骤,采集若干不同道路、包含各种道路病害的路面情况图像,形成样本图像集,即建立一个明确了道路病害位置、类型等具体情况的图集作为标准数据库;优选地,所述路面情况图像的原始图片大小为608x608像素。
所述样本图像预处理步骤,对所述样本图像集中包含的不同道路及各种道路病害的路面情况图像进行裁切、翻转以及亮度/对比度/色调变换处理;所述裁切,是在路面情况图像的原始图片上,以区域随机的方式对图片进行裁切;而所述翻转,是在路面情况图像的原始图片上,以图片横向的中心线和纵向的中心线为翻转中心线分别进行上下翻转和左右翻转;所述亮度/对比度/色调变换,是基于路面情况图像的原始图片,在原始图片的HSV颜色空间中对色调(H)、饱和度(S)、亮度(V)三个数值分别以随机的方式各自进行数值调整。裁切就是指的对标注了的图形随机切分出图形的一部分,需要注意的是随机切分是深度学***和垂直翻转;亮度调节指的是随机的设定图形的亮度,相应对比度改变和色调也是一样的操作方式。
所述样本标注步骤,是通过标注工具Labelme,在经过所述样本图像预处理步骤处理后的路面情况图像上标出病害的区域,得到病害区域的范围坐标,并按照分类类别和分割标签对病害的区域进行样本标注,将样本中明确的道路病害位置、类型等具体情况进行标签化处理。
所述模型训练步骤,选择经过所述样本标注步骤标注过的路面情况图像作为网络模型的训练数据集,对网络模型进行训练。优选地,鉴于本发明的目标是要对图像中病害部分进行分类/分割和检测,因此考虑使用maskrcnn网络作为训练和预测用的网络模型,该网络模型能够满足对目标的检测、分割和分类的需求。
具体的,所述模型训练步骤中,对样本图像集中所有经过样本标注步骤标注的路面情况图像进行划分,比如,按照85%、10%、5%的比例将划分为训练集、交叉验证集和测试集;所述训练集,并非是一次性全部传入到模型中进行训练的,而是以若干个batch批次进行训练的,每个batch批次的选择是以2的次方进行选择最佳,例如:16、32、64、128、256等等,这样,每一个batch批次的数据量在显卡中能够更好的被利用,也能加快模型的更新迭代,在本方案中,根据显卡的算力和显存的大小,优选地选择128张图片为一个batch批次,对模型训练的结果更优秀。
更具体的,所述模型训练步骤中,对网络模型进行训练,具体的,是使用maskrcnn网络作为训练和预测用的网络模型,每次将训练集中的一个batch批次的数据传入到maskrcnn网络中,首先经过用于对数据进行特征提取的卷积神经网络模块,卷积神经网络模块对应路面情况图像的CNN骨干网络(Convolutional Backbone),其中CNN骨干网络具有多种选择,CNN骨干网络指的是具有卷积结构的网络,是本身存在与图像类算法中的,任何图像类算法都是包含了CNN骨干网络这个部分,任何具有卷积结构的网络都可以作为CNN骨干网络,比如本方案中的CNN骨干网络选择的就是ResNet101网络作为主干特征提取网络,经过主干特征提取网络之后得到5种尺寸的特征图:(16,16,256)、(32,32,256)、(64,64,256)、(128,128,256)、(256,256,256);
然后,将卷积神经网络模块提取的这5种尺寸的特征图分别输送到网络模型的RPN网络中进行处理得到RPN网络特征图,所述RPN网络特征图会得到与特征对应的粗略的目标检测框,以待后续对进行检测框坐标进行精修。
接着,将5种尺寸的特征图以及经过所述RPN网络处理后的RPN网络特征图输入到网络模型的ROI Align模块中进行缩放,得到固定大小的特征图;
优选地,所述ROI Align模块对于各种不同尺寸的特征图进行尺寸缩放,具体的,是对于输入的不同尺寸的特征图,分别将其划分为7*7大小的区域,接着对每个区域进行双线性插值,得到4个点,通过插完值之后再进行最大池化(max pooling)处理得到最终的7*7大小的ROI感兴趣区域,使得不同大小的特征图经过这个模块之后得到大小相同的特征图;
得到固定大小的特征图之后,将maskrcnn网络划分为两个分支,其中一个分支将特征图拉伸为固定长度为1024的向量,传入到maskrcnn网络的全连接神经网络中,全连接神经网络同样是属于maskrcnn的一个子模块,这个子模块在很多的图像算法中都是存在的,这个子模块用来将抽取到的特征图数据转换为一维向量数据,这个全连接神经网络连接着maskrcnn网络的box regression模块和classfication模块,其中box regression模块用来得到输入图像的预测边界框坐标,针对前面在RPN网络中得到的目标检测框进行框的坐标的精修工作,而classfication模块则是对目标检测框框定的图片区域进行类别预测;而另一个分支是将特征图传入到maskrcnn网络的FCN(Fully Convolution Network)网络进行目标区域分割。
进一步的,还包括调参阶段,在调参阶段,最重要的就是根据损失函数的损失值的变化情况来对参数进行调整,其中损失函数为:
其中,Pi和Pi *是输入到模型的图片的真实类别标签以及模型对其的预测类别标签,ti和ti *是输入到模型的图片中待检测物体的真实坐标值和模型对其的预测坐标值,Ncls指的是类别标签的数目,Nreg指的是检测任务中需要回归的数目,Lcls(Pi,Pi *)是分类任务的损失函数,Lreg(ti,ti *)是坐标回归任务的损伤函数,λ是权重系数、是为了调整回归任务的损失函数在总的损失函数中的比重;
即,根据损失函数L(Pi,ti)是否在下降,以及下降的幅度来进行参数调整,调整的参数是通过SGD优化器中的学习率以及神经网络的层数等参数,当损失值基本不下降了的时候就停止训练,模型训练完毕。
优选地,所述调参阶段,选择的优化器为SGD优化器对网络模型训练和进行参数调整,SGD优化器的运算公式如下:
其中,x即在处理的图像数据、y是该图像数据对应的标签,i代表的是第i个数据,n
代表的是每个batch批次包含的数据量,是神经网络中的权重参数;α是学习率,控制着模
型更新权重参数的步伐是多大,选择的范围是在[0.01,0.1]之间,间隔一般选择0.01,
就是对损失函数进行求导得到的导数。
进一步的,所述模型训练步骤中,每次将训练集中的一个batch批次的数据传入到
maskrcnn网络中后,在经过卷积神经网络模块对数据进行特征提取前还要先采用Batch_
Norm批量归一化方法对每一个batch批次的数据进行归一化处理,以避免训练结果发散,对
于一个batch批次的图片数据B={x1,x2,...,xm}进行归一化处理得到微调的数据,其中,γ和β是maskrcnn网络中、在模型训练步骤过程中随着训练
过程不断地进行调整的两个常数变量,yi是在新的数据上经过线性变换进行微调的数据,
用于传入神经网络中新一层的神经元,而是经过运算之后得到的新的数据,是普朗克常量,代表一个很小的常数,避免分母出现0的情况;则是传
入的数据与其均值的方差,;是一个batch批次的数据的均值,,其中m是一个batch批次中图片的数目,xi就是我们传入到模型进行训练
的数据。
所述道路病害检测步骤,将待检测的道路图片输入到所述模型训练步骤中训练完成的网络模型中得到实际的道路病害情况,如果输入的图片被预测为存在道路病害,则确认采集的图像所对应的路段位置信息,生成相关的路段位置信息并提供给检测的终端。
Claims (5)
1.基于图像识别深度学习的道路病害检测***,其特征在于:包括图像处理模块、图像检测模块、图像分割模块以及图像分类模块;
所述图像处理模块用于对采集到的若干不同待检测道路的图像进行预处理,待检测道路的图像,对待检测道路的图像进行裁切、翻转以及亮度/对比度/色调变换处理,所述翻转,是在路面情况图像的原始图片上,以图片横向的中心线和纵向的中心线为翻转中心线分别进行上下翻转和左右翻转,所述亮度/对比度/色调变换,是基于路面情况图像的原始图片,在原始图片的HSV颜色空间中对色调(H)、饱和度(S)、亮度(V)三个数值分别以随机的方式各自进行数值调整;待检测道路的图像中包含各种道路病害的路面情况图像、以及相关道路病害的标签数据,所述标签数据明确了道路病害位置、类型具体情况,形成样本图像集,即建立一个明确了道路病害位置、类型具体情况的图集作为标准数据库,将经过预处理的图像传送至所述图像检测模块中;对样本图像集中所有经过样本标注步骤标注的路面情况图像进行划分,按照85%、10%、5%的比例将划分为训练集、交叉验证集和测试集,对网络模型进行训练,所述训练集,是以若干个batch批次进行训练的,每个batch批次的选择是以2的次方进行选择;
所述图像检测模块通过Labelme标注工具、根据道路左右两边终止实线为划分、从所述图像处理模块预处理的图像中提取出属于道路路面的部分,并发送给所述图像分割模块以及图像分类模块;
所述图像分割模块通过经训练学习的目标分割网络,从所述图像检测模块中提取出的属于道路路面的部分中以像素级的细粒度的进行路面病害部分分割,用以刻画路面病害的形态;所述经训练学习的目标分割网络是使用maskrcnn网络作为训练和预测用的网络模型,每次将训练集中的一个batch批次的数据传入到maskrcnn网络中,具体的,首先,经过用于对batch批次的数据进行特征提取的卷积神经网络模块,卷积神经网络模块对应路面情况图像的CNN骨干网络对batch批次的数据进行主干特征提取,到若干种尺寸的特征图;然后,将卷积神经网络模块提取的这若干种尺寸的特征图分别输送到网络模型的RPN网络中进行处理得到RPN网络特征图,所述RPN网络特征图会得到与特征对应的、用于进行检测框坐标精修的目标检测框;接着,将若干种尺寸的特征图以及经过所述RPN网络处理后的RPN网络特征图输入到网络模型的ROI Align模块中进行缩放,得到固定大小的特征图;得到固定大小的特征图之后,将maskrcnn网络划分为两个分支,其中一个分支将特征图拉伸为固定长度为1024的向量,传入到maskrcnn网络的全连接神经网络中进行目标检测框的坐标精修以及对目标检测框中框定的图片区域进行类别预测,而另一个分支是将特征图传入到maskrcnn网络的FCN网络进行目标区域分割;
还包括调参阶段,在调参阶段,根据损失函数的损失值的变化情况来对参数进行调整,选择的优化器为SGD优化器对网络模型训练和进行参数调整,调整的参数是通过SGD优化器中的学习率以及神经网络的层数参数,SGD优化器的运算公式如下:,其中,x即在处理的图像数据、y是该图像数据对应的标签,i代表的是第i个数据,n代表的是每个batch批次包含的数据量,是神经网络中的权重参数;α是学习率,控制着模型更新权重参数的步伐是多大,选择的范围是在[0.01,0.1]之间,间隔选择0.01, 就是对损失函数进行求导得到的导数,每次将训练集中的一个batch批次的数据传入到maskrcnn网络中后,在经过卷积神经网络模块对数据进行特征提取前还要先采用Batch_Norm批量归一化方法对每一个batch批次的数据进行归一化处理,以避免训练结果发散,对于一个batch批次的图片数据B={x1,x2,...,xm}进行归一化处理得到微调的数据,其中,γ和β是maskrcnn网络中、在模型训练步骤过程中随着训练过程不断地进行调整的两个常数变量,yi是在新的数据上经过线性变换进行微调的数据,用于传入神经网络中新一层的神经元,而是经过运算之后得到的新的数据,是普朗克常量,代表一个很小的常数,避免分母出现0的情况;则是传入的数据与其均值的方差,;是一个batch批次的数据的均值,,其中m是一个batch批次中图片的数目,xi就是我们传入到模型进行训练的数据,当损失值基本不下降了的时候就停止训练,模型训练完毕;
所述图像分类模块根据先验阈值,将所述图像检测模块中提取出的属于道路路面的部分,按照不同的道路病害类别和等级进行聚类分类。
2.基于图像识别深度学习的道路病害检测方法,其特征在于,包括以下步骤:
样本图像采集步骤,采集若干不同道路、包含各种道路病害的路面情况图像,形成样本图像集;
样本图像预处理步骤,对所述样本图像集中包含的不同道路及各种道路病害的路面情况图像进行裁切、翻转以及亮度/对比度/色调变换处理;所述裁切,是在路面情况图像的原始图片上,以区域随机的方式对图片进行裁切;所述翻转,是在路面情况图像的原始图片上,以图片横向的中心线和纵向的中心线为翻转中心线分别进行上下翻转和左右翻转;所述亮度/对比度/色调变换,是基于路面情况图像的原始图片,在原始图片的HSV颜色空间中对色调、饱和度、亮度三个数值分别以随机的方式各自进行数值调整;
样本标注步骤,通过标注工具Labelme,在经过所述样本图像预处理步骤处理后的路面情况图像上标出病害的区域,得到病害区域的范围坐标,并按照分类类别和分割标签对病害的区域进行样本标注;
模型训练步骤,选择经过所述样本标注步骤标注过的路面情况图像作为网络模型的训练数据集,对样本图像集中所有经过样本标注步骤标注的路面情况图像进行划分,按照85%、10%、5%的比例将划分为训练集、交叉验证集和测试集,对网络模型进行训练,所述训练集,是以若干个batch批次进行训练的,每个batch批次的选择是以2的次方进行选择;
使用maskrcnn网络作为训练和预测用的网络模型,每次将训练集中的一个batch批次的数据传入到maskrcnn网络中,具体的,首先,经过用于对batch批次的数据进行特征提取的卷积神经网络模块,卷积神经网络模块对应路面情况图像的CNN骨干网络对batch批次的数据进行主干特征提取,到若干种尺寸的特征图;然后,将卷积神经网络模块提取的这若干种尺寸的特征图分别输送到网络模型的RPN网络中进行处理得到RPN网络特征图,所述RPN网络特征图会得到与特征对应的、用于进行检测框坐标精修的目标检测框;接着,将若干种尺寸的特征图以及经过所述RPN网络处理后的RPN网络特征图输入到网络模型的ROI Align模块中进行缩放,得到固定大小的特征图;得到固定大小的特征图之后,将maskrcnn网络划分为两个分支,其中一个分支将特征图拉伸为固定长度为1024的向量,传入到maskrcnn网络的全连接神经网络中进行目标检测框的坐标精修以及对目标检测框中框定的图片区域进行类别预测,而另一个分支是将特征图传入到maskrcnn网络的FCN网络进行目标区域分割;
还包括调参阶段,在调参阶段,根据损失函数的损失值的变化情况来对参数进行调整,选择的优化器为SGD优化器对网络模型训练和进行参数调整,调整的参数是通过SGD优化器中的学习率以及神经网络的层数参数,SGD优化器的运算公式如下:,其中,x即在处理的图像数据、y是该图像数据对应的标签,i代表的是第i个数据,n代表的是每个batch批次包含的数据量,是神经网络中的权重参数;α是学习率,控制着模型更新权重参数的步伐是多大,选择的范围是在[0.01,0.1]之间,间隔选择0.01,就是对损失函数进行求导得到的导数,每次将训练集中的一个batch批次的数据传入到maskrcnn网络中后,在经过卷积神经网络模块对数据进行特征提取前还要先采用Batch_Norm批量归一化方法对每一个batch批次的数据进行归一化处理,以避免训练结果发散,对于一个batch批次的图片数据B={x1,x2,...,xm}进行归一化处理得到微调的数据,其中,γ和β是maskrcnn网络中、在模型训练步骤过程中随着训练过程不断地进行调整的两个常数变量,yi是在新的数据上经过线性变换进行微调的数据,用于传入神经网络中新一层的神经元,而是经过运算之后得到的新的数据,是普朗克常量,代表一个很小的常数,避免分母出现0的情况;则是传入的数据与其均值的方差,;是一个batch批次的数据的均值,,其中m是一个batch批次中图片的数目,xi就是我们传入到模型进行训练的数据,当损失值基本不下降了的时候就停止训练,模型训练完毕;
道路病害检测步骤,将待检测的道路图片输入到所述模型训练步骤中训练完成的网络模型中得到实际的道路病害情况,如果输入的图片被预测为存在道路病害,则确认采集的图像所对应的路段位置信息,生成相关的路段位置信息并提供给检测的终端。
3.如权利要求2所述的基于图像识别深度学习的道路病害检测方法,其特征在于:所述全连接神经网络连接着maskrcnn网络的boxregression模块和classfication模块;其中,所述boxregression模块用于得到输入图像的预测边界框坐标,并对在RPN网络中得到的目标检测框进行框定坐标的精修;而所述classfication模块则是用于对目标检测框框定出的图片区域进行类别预测。
4.如权利要求2所述的基于图像识别深度学习的道路病害检测方法,其特征在于:所述ROIAlign模块对于各种不同尺寸的特征图进行尺寸缩放,具体的,是对于输入的不同尺寸的特征图,分别将其划分为7*7大小的区域,接着对每个区域进行双线性插值,得到4个点,通过插完值之后再进行最大池化处理得到最终的7*7大小的ROI感兴趣区域,使得不同大小的特征图经过这个模块之后得到大小相同的特征图。
5.如权利要求2所述的基于图像识别深度学习的道路病害检测方法,其特征在于,所述调参阶段,是根据损失函数的损失值的变化情况来对参数进行调整,所述损失函数为:
其中,Pi和Pi *是输入到模型的图片的真实类别标签以及模型对其的预测类别标签,ti和ti *是输入到网络模型的图片中待检测物体的真实坐标值和模型对其的预测坐标值;Ncls指的是类别标签的数目,Nreg指的是检测任务中需要回归的数目;Lcls(Pi,Pi *)是分类任务的损失函数,Lreg(ti,ti *)是坐标回归任务的损伤函数,λ是权重系数、是为了调整回归任务的损失函数在总的损失函数中的比重;
根据损失函数是否在下降,以及下降的幅度来进行参数调整,调整的参数是通过SGD优化器中的学习率以及神经网络的层数参数,当损失值基本不下降了的时候就停止训练,模型训练完毕。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110616773.2A CN113096126B (zh) | 2021-06-03 | 2021-06-03 | 基于图像识别深度学习的道路病害检测***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110616773.2A CN113096126B (zh) | 2021-06-03 | 2021-06-03 | 基于图像识别深度学习的道路病害检测***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113096126A CN113096126A (zh) | 2021-07-09 |
CN113096126B true CN113096126B (zh) | 2021-09-24 |
Family
ID=76664552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110616773.2A Active CN113096126B (zh) | 2021-06-03 | 2021-06-03 | 基于图像识别深度学习的道路病害检测***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113096126B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113537037A (zh) * | 2021-07-12 | 2021-10-22 | 北京洞微科技发展有限公司 | 路面病害识别方法、***、电子设备及存储介质 |
CN113269161A (zh) * | 2021-07-16 | 2021-08-17 | 四川九通智路科技有限公司 | 一种基于深度学习的交通标识牌检测方法 |
CN113674216A (zh) * | 2021-07-27 | 2021-11-19 | 南京航空航天大学 | 一种基于深度学习的地铁隧道病害检测方法 |
CN114120086A (zh) * | 2021-10-29 | 2022-03-01 | 北京百度网讯科技有限公司 | 路面病害识别、图像处理模型训练方法、装置及电子设备 |
CN114022848B (zh) * | 2022-01-04 | 2022-04-12 | 四川九通智路科技有限公司 | 一种隧道自动照明的控制方法及*** |
CN115063525B (zh) * | 2022-04-06 | 2023-04-07 | 广州易探科技有限公司 | 一种城市道路路基及管道的三维成图方法及装置 |
US11978221B2 (en) * | 2022-06-30 | 2024-05-07 | Metrostudy, Inc. | Construction detection using satellite or aerial imagery |
CN115830032B (zh) * | 2023-02-13 | 2023-05-26 | 杭州闪马智擎科技有限公司 | 基于旧有设施的道路伸缩缝病变识别方法及装置 |
CN117058536B (zh) * | 2023-07-19 | 2024-04-30 | 中公高科养护科技股份有限公司 | 一种基于双分支网络的路面病害识别方法、装置及介质 |
CN116844057B (zh) * | 2023-08-28 | 2023-12-08 | 福建智涵信息科技有限公司 | 一种路面病害图像处理方法及车载检测装置 |
CN117893988B (zh) * | 2024-01-19 | 2024-06-18 | 元橡科技(北京)有限公司 | 一种全地形场景路面识别方法及训练方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509839A (zh) * | 2018-02-02 | 2018-09-07 | 东华大学 | 一种基于区域卷积神经网络高效的手势检测识别方法 |
CN109584209A (zh) * | 2018-10-29 | 2019-04-05 | 深圳先进技术研究院 | 血管壁斑块识别设备、***、方法及存储介质 |
CN110110599A (zh) * | 2019-04-03 | 2019-08-09 | 天津大学 | 一种基于多尺度特征融合的遥感图像目标检测方法 |
CN111310558A (zh) * | 2019-12-28 | 2020-06-19 | 北京工业大学 | 一种基于深度学习和图像处理法的路面病害智能提取方法 |
CN112258529A (zh) * | 2020-11-02 | 2021-01-22 | 郑州大学 | 一种基于实例分割算法的路面裂缝像素级别检测方法 |
CN112598672A (zh) * | 2020-11-02 | 2021-04-02 | 坝道工程医院(平舆) | 一种基于深度学习的路面病害图像分割方法和*** |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108520278A (zh) * | 2018-04-10 | 2018-09-11 | 陕西师范大学 | 一种基于随机森林的路面裂缝检测方法及其评价方法 |
US10846817B2 (en) * | 2018-11-15 | 2020-11-24 | Toyota Research Institute, Inc. | Systems and methods for registering 3D data with 2D image data |
US10846818B2 (en) * | 2018-11-15 | 2020-11-24 | Toyota Research Institute, Inc. | Systems and methods for registering 3D data with 2D image data |
CN109801292A (zh) * | 2018-12-11 | 2019-05-24 | 西南交通大学 | 一种基于生成对抗网络的沥青公路裂缝图像分割方法 |
CN109685124A (zh) * | 2018-12-14 | 2019-04-26 | 斑马网络技术有限公司 | 基于神经网络的道路病害识别方法及装置 |
CN112686217A (zh) * | 2020-11-02 | 2021-04-20 | 坝道工程医院(平舆) | 一种基于Mask R-CNN的地下排水管道病害像素级别的检测方法 |
-
2021
- 2021-06-03 CN CN202110616773.2A patent/CN113096126B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108509839A (zh) * | 2018-02-02 | 2018-09-07 | 东华大学 | 一种基于区域卷积神经网络高效的手势检测识别方法 |
CN109584209A (zh) * | 2018-10-29 | 2019-04-05 | 深圳先进技术研究院 | 血管壁斑块识别设备、***、方法及存储介质 |
CN110110599A (zh) * | 2019-04-03 | 2019-08-09 | 天津大学 | 一种基于多尺度特征融合的遥感图像目标检测方法 |
CN111310558A (zh) * | 2019-12-28 | 2020-06-19 | 北京工业大学 | 一种基于深度学习和图像处理法的路面病害智能提取方法 |
CN112258529A (zh) * | 2020-11-02 | 2021-01-22 | 郑州大学 | 一种基于实例分割算法的路面裂缝像素级别检测方法 |
CN112598672A (zh) * | 2020-11-02 | 2021-04-02 | 坝道工程医院(平舆) | 一种基于深度学习的路面病害图像分割方法和*** |
Non-Patent Citations (1)
Title |
---|
基于Mask R-CNN的回环检测算法;林钊浩等;《电子技术与软件工程》;20210531(第5期);71-73 * |
Also Published As
Publication number | Publication date |
---|---|
CN113096126A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113096126B (zh) | 基于图像识别深度学习的道路病害检测***及方法 | |
CN107862667B (zh) | 一种基于高分辨率遥感影像的城市阴影检测与去除方法 | |
CN103049763B (zh) | 一种基于上下文约束的目标识别方法 | |
CN111310558A (zh) | 一种基于深度学习和图像处理法的路面病害智能提取方法 | |
CN104463877B (zh) | 一种基于雷达影像与电子海图信息的岸线配准方法 | |
Chen et al. | An improved license plate location method based on edge detection | |
CN106651872A (zh) | 基于Prewitt算子的路面裂缝识别方法及*** | |
CN104732211B (zh) | 一种基于自适应阈值的交通标志检测方法 | |
CN108985170A (zh) | 基于三帧差分法及深度学习的输电线路悬挂物识别方法 | |
CN108038416A (zh) | 车道线检测方法及*** | |
CN103971126A (zh) | 一种交通标志识别方法和装置 | |
CN109740572A (zh) | 一种基于局部彩色纹理特征的人脸活体检测方法 | |
CN110766016B (zh) | 一种基于概率神经网络的喷码字符识别方法 | |
CN109870458B (zh) | 一种基于三维激光传感器及包围盒的路面裂缝检测与分类方法 | |
CN113221881B (zh) | 一种多层级的智能手机屏幕缺陷检测方法 | |
CN114863493B (zh) | 一种低质量指纹图像和非指纹图像的检测方法及检测装置 | |
CN108171157A (zh) | 基于多尺度局部块LBP直方图特征与Co-HOG特征相结合的人眼检测算法 | |
CN106157266A (zh) | 一种果园果实图像获取方法 | |
Ko et al. | License plate surveillance system using weighted template matching | |
CN111652033A (zh) | 基于OpenCV的车道线检测方法 | |
Wang et al. | Unstructured road detection using hybrid features | |
CN115984806B (zh) | 道路标线破损动态检测*** | |
CN110349415B (zh) | 一种基于多尺度变换的行车速度测量方法 | |
CN107122757A (zh) | 一种实时鲁棒的非结构化道路检测方法 | |
Jin et al. | Automated road pavement marking detection from high resolution aerial images based on multi-resolution image analysis and anisotropic Gaussian filtering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |