CN112766260B - 铁路列车加速缓解风缸定位的图像识别方法及*** - Google Patents

铁路列车加速缓解风缸定位的图像识别方法及*** Download PDF

Info

Publication number
CN112766260B
CN112766260B CN202110056516.8A CN202110056516A CN112766260B CN 112766260 B CN112766260 B CN 112766260B CN 202110056516 A CN202110056516 A CN 202110056516A CN 112766260 B CN112766260 B CN 112766260B
Authority
CN
China
Prior art keywords
accelerated release
release reservoir
positioning
frame
reservoir
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110056516.8A
Other languages
English (en)
Other versions
CN112766260A (zh
Inventor
于婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Kejia General Mechanical and Electrical Co Ltd
Original Assignee
Harbin Kejia General Mechanical and Electrical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Kejia General Mechanical and Electrical Co Ltd filed Critical Harbin Kejia General Mechanical and Electrical Co Ltd
Priority to CN202110056516.8A priority Critical patent/CN112766260B/zh
Publication of CN112766260A publication Critical patent/CN112766260A/zh
Application granted granted Critical
Publication of CN112766260B publication Critical patent/CN112766260B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了一种铁路列车加速缓解风缸定位的图像识别方法及***,解决了现有人工检测效率低稳定性差的技术问题,属于图像识别技术领域,其中,该方法包括:构建加速缓解风缸的样本数据集;利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。该方法一方面相较于人工检修可提高检测效率和稳定性,另一方面可以提高检测的准确率。

Description

铁路列车加速缓解风缸定位的图像识别方法及***
技术领域
本发明涉及图像识别技术领域,特别涉及一种铁路列车加速缓解风缸定位的图像识别方法及***。
背景技术
目前对加速缓解风缸的定位还是以人工查看图像或实地检查为主,这种方式效率低下,容易造成故障的遗漏,进而容易造成重大铁路交通事故。因此,亟待一种图像自动识别方式对加速缓解风缸进行故障检测,但由于不同车型的加速缓解风缸在车体上的位置不同,因此,需要一种图像自动识别的方式首先对加速缓解风缸的位置进行定位,然后才能进一步进行后续的故障检测。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种铁路列车加速缓解风缸定位的图像识别方法,该方法提高了检测效率、稳定性以及准确率。
本发明的另一个目的在于提出一种铁路列车加速缓解风缸定位的图像识别***。
为达到上述目的,本发明一方面实施例提出了铁路列车加速缓解风缸定位的图像识别方法,包括以下步骤:步骤S1,构建加速缓解风缸的样本数据集;步骤S2,利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;步骤S3,采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。
本发明实施例的铁路列车加速缓解风缸定位的图像识别方法,采用图像自动识别的方式定位加速缓解风缸的位置,一方面相较于人工检修可提高检测效率和稳定性,另一方面随着深度学习和人工智能技术的不断成熟,可以提高检测的准确率,同时,通过改进SSD算法匹配策略,每个真实边框ground truth box会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。
另外,根据本发明上述实施例的铁路列车加速缓解风缸定位的图像识别方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,步骤S1具体包括:获取多个加速缓解风缸的粗定位图像作为原始图像集;标记原始图像集中加速缓解风缸所在区域,作为标记信息集,其中,原始图像集与标记信息集一一对应;利用扩增算法对原始图像集和标记信息集进行扩增,得到样本数据集。
进一步地,在本发明的一个实施例中,步骤S2具体包括:将样本数据集输入改进的SSD网络中,得到5层特征图;在5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;利用回归预测器和多分类预测器在预设特征图上对每个位置的anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对输出预测进行筛选,得到输出框;通过随机采样或困难采样方法取样输出框,以进行损失函数计算,并计算损失函数的梯度值,根据梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到加速缓解风缸定位模型。
进一步地,在本发明的一个实施例中,将每个真实边框ground truth box对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框ground truth box匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框对应的IOU集合,参数N;改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框的索引。
进一步地,在本发明的一个实施例中,步骤S3具体包括:采集实际图像;将实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出加速缓解风缸位置信息。
为达到上述目的,本发明另一方面实施例提出了铁路列车加速缓解风缸定位的图像识别***,包括:构建模块,用于构建加速缓解风缸的样本数据集;训练模块,用于利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2;获取模块,用于采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。
本发明实施例的铁路列车加速缓解风缸定位的图像识别***,采用图像自动识别的方式定位加速缓解风缸的位置,一方面相较于人工检修可提高检测效率和稳定性,另一方面随着深度学习和人工智能技术的不断成熟,可以提高检测的准确率,同时,通过改进SSD算法匹配策略,每个真实边框ground truth box会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。
另外,根据本发明上述实施例的铁路列车加速缓解风缸定位的图像识别***还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,构建模块包括:获取单元,用于获取多个加速缓解风缸的粗定位图像作为原始图像集;标记单元,用于标记原始图像集中加速缓解风缸所在区域,作为标记信息集,其中,原始图像集与标记信息集一一对应;扩增单元,用于利用扩增算法对原始图像集和标记信息集进行扩增,得到样本数据集。
进一步地,在本发明的一个实施例中,训练模块包括:输入单元,用于将样本数据集输入改进的SSD网络中,得到5层特征图;构建单元,用于在5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;预测和筛选单元,用于利用回归预测器和多分类预测器在预设特征图上对每个位置的预测边框anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对输出预测进行筛选,得到输出框;迭代单元,用于通过随机采样或困难采样方法取样输出框,以进行损失函数计算,并计算损失函数的梯度值,根据梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到加速缓解风缸定位模型。
进一步地,在本发明的一个实施例中,改进的SSD网络中的算法匹配策略为:将每个真实边框ground truth box对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框ground truth box匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框ground truth box对应的IOU集合,参数N;改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框ground truthbox的索引。
进一步地,在本发明的一个实施例中,获取模块包括:采集单元,用于采集实际图像;定位和输出单元,用于将实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出加速缓解风缸位置信息。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一个实施例的铁路列车加速缓解风缸定位的图像识别方法的流程图;
图2是本发明的一个具体地加速缓解风缸定位识别流程图;
图3是本发明一个实施例的铁路列车加速缓解风缸定位的图像识别***的结构示意图。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参照附图描述根据本发明实施例提出的铁路列车加速缓解风缸定位的图像识别方法及***。
图1是本发明一个实施例的铁路列车加速缓解风缸定位的图像识别方法的流程图。
如图1所示,该铁路列车加速缓解风缸定位的图像识别方法包括以下步骤:
在步骤S1中,构建加速缓解风缸的样本数据集。
具体地,如图2所示,可通过列车轨道周围搭建的高清成像设备,获取列车的高清图像。可以理解的是,由于不同车型加速缓解风缸的形态位置不固定,需要取车中间部图像进行定位,将定位的加速缓解风缸进一步取子图。由于不同站点的拍摄条件不同,设备拍摄的图像存在差异,相机可能受到雨水、泥渍等自然条件影响,导致获取的加速缓解风缸图像也存在差异。为了保证数据集的多样性,需要将各站点在不同条件下拍摄的不同车型的加速缓解风缸图像全部采集,即将多个加速缓解风缸的粗定位图像作为原始图像集。
在获取原始图像集后,手动标记原始图像集中加速缓解风缸所在区域,作为标记信息集,即标记信息集为目标区域的矩形框的信息。其中,需使原始图像集与标记信息集一一对应。
为了提高算法的稳定性和适应***移、缩放、镜像和亮度调整等等。其中,每种操作随机进行,最大程度的保证样本的多样性,扩增后将原始图像集和标记信息集构成加速缓解风缸的样本数据集。
在步骤S2中,利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2。
具体地,将含有加速缓解风缸的车底部图像输入到网络中,首先选取resnet50作为主干网络代替原有的VGG级联网络,删掉顶层的BN层,池化层和分类输出层,再额外增加两层卷积层,其中卷积核大小为3*3,步长为2。由resnet得到的3层特征图再加上扩展的两层特征图构成了所有特征图。上述网络顶端的5层残差块或卷积层的输出作为SSD模型使用的特征图。然后在5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器。这两个卷积核在特定的特征图上对每个位置的预测边框anchor进行预测,从而得到固定数目的预测,进一步采用非极大值抑制(NMS)和top_k阈值对这些输出预测做筛选,得到目标检测模型最终的输出框。然后通过随机采样或困难采样方法取样输出框用于损失函数计算,其中分类损失和位置损失需要分别计算,再计算损失函数的梯度值,根据梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到加速缓解风缸定位模型。
需要说明的是,现有的模型匹配过程是首先每一个真实边框ground truth box都会选择一个与其IOU(预测边框与真实边框的交并比)最大的预测边框anchor进行匹配,从而保证每个真实边框ground truth box至少匹配到一个预测边框anchor,然后在预测边框anchor与真实边框ground truth box所有的IOU中,挑选出阈值大于0.5的部分用于后续的预测环节,同时将这个预测边框anchor匹配到其最大IOU对应的物体上。但这种匹配策略,对于较小或较大的物体,其匹配到的正样本数量非常有限,大大少于中等大小物体匹配到的样本数量。样本数量差异过大不利于训练过程中损失函数的收敛,对检测效果有一定的影响。
因此,本发明对SSD算法进行改进,具体地,由于加速缓解风缸在整个车体底部占比较小,为了改进SSD对小目标的检测效果,本发明选择了一种新的算法匹配策略:将每个真实边框ground truth box对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次匹配机会,M为正整数。该匹配机制输入为:每个预测边框anchor与真实边框ground truth box对应的IOU集合,参数N。该匹配机制输出为每个预测边框anchor所匹配得到的真实边框ground truth box的索引。训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。通过改进的算法匹配策略,每个真实边框ground truth box会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。
在步骤S3中,采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。
具体地,如图2所示,采集站点过车的实际图像,将实际图像缩放至1600*256大小,输入到训练好的定位网络中进行加速缓解风缸的定位检测,对输出结果进行判断,若位置框的长宽比大于0.8,小于1.2,且类别为加速缓解风缸,则认为定位到的缸为加速缓解风缸,进一步输出加速缓解风缸部分子图和加速缓解风缸在车底部的位置信息。
根据本发明实施例提出的铁路列车加速缓解风缸定位的图像识别方法,采用图像自动识别的方式定位加速缓解风缸的位置,一方面相较于人工检修可提高检测效率和稳定性,另一方面随着深度学习和人工智能技术的不断成熟,可以提高检测的准确率,同时,通过改进SSD算法匹配策略,每个真实边框ground truth box会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。
其次参照附图描述根据本发明实施例提出的铁路列车加速缓解风缸定位的图像识别***。
图3是本发明一个实施例的铁路列车加速缓解风缸定位的图像识别***的结构示意图。
如图3所示,该***10包括:构建模块100、训练模块200和获取模块300。
其中,构建模块100用于构建加速缓解风缸的样本数据集。训练模块200用于利用样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2。获取模块300用于采集实际图像,输入至加速缓解风缸定位模型中,获得加速缓解风缸位置信息。
进一步地,在本发明的一个实施例中,构建模块100包括:获取单元101,用于获取多个加速缓解风缸的粗定位图像作为原始图像集;标记单元102,用于标记原始图像集中加速缓解风缸所在区域,作为标记信息集,其中,原始图像集与标记信息集一一对应;扩增单元103,用于利用扩增算法对原始图像集和标记信息集进行扩增,得到样本数据集。
进一步地,在本发明的一个实施例中,训练模块200包括:输入单元201,用于将样本数据集输入改进的SSD网络中,得到5层特征图;构建单元202,用于在5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;预测和筛选单元203,用于利用回归预测器和多分类预测器在预设特征图上对每个位置的预测边框anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对输出预测进行筛选,得到输出框;迭代单元204,用于通过随机采样或困难采样方法取样输出框,以进行损失函数计算,并计算损失函数的梯度值,根据梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到加速缓解风缸定位模型。
进一步地,在本发明的一个实施例中,将每个真实边框ground truth box对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框ground truth box匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框ground truth box对应的IOU集合,参数N;改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框ground truth box的索引。
进一步地,在本发明的一个实施例中,获取模块300包括:采集单元301,用于采集实际图像;定位和输出单元302,用于将实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出加速缓解风缸位置信息。
需要说明的是,前述对铁路列车加速缓解风缸定位的图像识别方法的实施例的解释说明也适用于该***,此处不再赘述。
根据本发明实施例提出的铁路列车加速缓解风缸定位的图像识别***,采用图像自动识别的方式定位加速缓解风缸的位置,一方面相较于人工检修可提高检测效率和稳定性,另一方面随着深度学习和人工智能技术的不断成熟,可以提高检测的准确率,同时,通过改进SSD算法匹配策略,每个真实边框ground truth box会得到等数量的预测边框anchor,解决了正负样本不均衡的问题,加快了训练过程中损失函数的收敛,也提升了算法对于较小的加速缓解风缸的定位的准确率。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (6)

1.一种铁路列车加速缓解风缸定位的图像识别方法,其特征在于,包括以下步骤:
步骤S1,构建加速缓解风缸的样本数据集;
步骤S2,利用所述样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,所述改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2,
所述步骤S2具体包括:
将所述样本数据集输入所述改进的SSD网络中,得到5层特征图;
在所述5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;
利用所述回归预测器和所述多分类预测器在预设特征图上对每个位置的预测边框anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对所述输出预测进行筛选,得到输出框;
通过随机采样或困难采样方法取样所述输出框,以进行损失函数计算,并计算损失函数的梯度值,根据所述梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到所述加速缓解风缸定位模型;
所述改进的SSD网络中的算法匹配策略为:将每个真实边框ground truth box对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框ground truth box匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,所述改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框ground truth box对应的IOU集合,参数N;所述改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框ground truth box的索引;
步骤S3,采集实际图像,输入至所述加速缓解风缸定位模型中,获得加速缓解风缸位置信息。
2.根据权利要求1所述的铁路列车加速缓解风缸定位的图像识别方法,其特征在于,所述步骤S1具体包括:
获取多个加速缓解风缸的粗定位图像作为原始图像集;
标记所述原始图像集中所述加速缓解风缸所在区域,作为标记信息集,其中,所述原始图像集与所述标记信息集一一对应;
利用扩增算法对所述原始图像集和所述标记信息集进行扩增,得到所述样本数据集。
3.根据权利要求1所述的铁路列车加速缓解风缸定位的图像识别方法,其特征在于,所述步骤S3具体包括:
采集所述实际图像;
将所述实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至所述加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出所述加速缓解风缸位置信息。
4.一种铁路列车加速缓解风缸定位的图像识别***,其特征在于,包括:
构建模块,用于构建加速缓解风缸的样本数据集;
训练模块,用于利用所述样本数据集对改进的SSD网络进行训练,得到加速缓解风缸定位模型,其中,所述改进的SSD模型的结构为:resnet50作为主干网络,删除顶层的BN层、池化层和分类输出层,额外增加两层卷积层,卷积核大小为3*3,步长为2,
所述训练模块包括:
输入单元,用于将所述样本数据集输入所述改进的SSD网络中,得到5层特征图;
构建单元,用于在所述5层特征图上分别构建两个大小为3*3的卷积核作为回归预测器和多分类预测器;
预测和筛选单元,用于利用所述回归预测器和所述多分类预测器在预设特征图上对每个位置的预测边框anchor进行预测,利用默认框生成规则,为每个特征图生成默认框,得到固定数目的输出预测,并采用非极大值抑制NMS和top_k阈值对所述输出预测进行筛选,得到输出框;
迭代单元,用于通过随机采样或困难采样方法取样所述输出框,以进行损失函数计算,并计算损失函数的梯度值,根据所述梯度值对参数进行更新,迭代训练,直至达到最大迭代次数,得到所述加速缓解风缸定位模型;
所述改进的SSD网络中的算法匹配策略为:将每个真实边框ground truth box对应的IOU进行降序,然后取前M个IOU对应的预测边框anchor作为样本,每个预测边框anchor有且仅有一次与真实边框ground truth box匹配的机会,M为正整数,IOU为预测边框与真实边框的交并比,其中,所述改进的SSD网络的匹配机制输入为:每个预测边框anchor与真实边框ground truth box对应的IOU集合,参数N;所述改进的SSD网络的匹配机制输出为:每个预测边框anchor所匹配得到的真实边框ground truth box的索引;
获取模块,用于采集实际图像,输入至所述加速缓解风缸定位模型中,获得加速缓解风缸位置信息。
5.根据权利要求4所述的铁路列车加速缓解风缸定位的图像识别***,其特征在于,所述构建模块包括:
获取单元,用于获取多个加速缓解风缸的粗定位图像作为原始图像集;
标记单元,用于标记所述原始图像集中所述加速缓解风缸所在区域,作为标记信息集,其中,所述原始图像集与所述标记信息集一一对应;
扩增单元,用于利用扩增算法对所述原始图像集和所述标记信息集进行扩增,得到所述样本数据集。
6.根据权利要求4所述的铁路列车加速缓解风缸定位的图像识别***,其特征在于,所述获取模块包括:
采集单元,用于采集所述实际图像;
定位和输出单元,用于将所述实际图像缩放为尺寸1600*256的图像,并将缩放后的图像输入至所述加速缓解风缸定位模型中进行加速缓解风缸的定位检测,对输出结果进行阈值判断,若位置框的长宽比大于0.8,小于1.2,则认为定位到的缸为加速缓解风缸,进一步输出所述加速缓解风缸位置信息。
CN202110056516.8A 2021-01-15 2021-01-15 铁路列车加速缓解风缸定位的图像识别方法及*** Active CN112766260B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110056516.8A CN112766260B (zh) 2021-01-15 2021-01-15 铁路列车加速缓解风缸定位的图像识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110056516.8A CN112766260B (zh) 2021-01-15 2021-01-15 铁路列车加速缓解风缸定位的图像识别方法及***

Publications (2)

Publication Number Publication Date
CN112766260A CN112766260A (zh) 2021-05-07
CN112766260B true CN112766260B (zh) 2021-09-14

Family

ID=75701955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110056516.8A Active CN112766260B (zh) 2021-01-15 2021-01-15 铁路列车加速缓解风缸定位的图像识别方法及***

Country Status (1)

Country Link
CN (1) CN112766260B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300114A (zh) * 2018-08-30 2019-02-01 西南交通大学 高铁接触网支撑装置极小目标零部件顶紧缺失检测方法
CN110197113A (zh) * 2019-03-28 2019-09-03 杰创智能科技股份有限公司 一种高精度锚点匹配策略的人脸检测方法
CN110796643A (zh) * 2019-10-18 2020-02-14 四川大学 一种铁轨扣件缺陷检测方法和***
CN111027260A (zh) * 2019-12-24 2020-04-17 大连圣力来监测技术有限公司 一种基于神经网络的往复式压缩机故障诊断方法
CN111080608A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 铁路货车脱轨自动制动阀塞门手把关闭故障图像识别方法
CN111079819A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 基于图像识别与深度学习的铁路货车钩舌销的状态判断方法
CN111079627A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 一种铁路货车制动梁梁体折断故障图像识别方法
CN111079746A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 铁路货车轴箱弹簧故障图像识别方法
CN111091551A (zh) * 2019-12-12 2020-05-01 哈尔滨市科佳通用机电股份有限公司 一种铁路货车制动梁支柱开口销丢失故障检测方法
CN111126472A (zh) * 2019-12-18 2020-05-08 南京信息工程大学 一种基于ssd改进的目标检测方法
CN111860623A (zh) * 2020-07-03 2020-10-30 北京林业大学 基于改进ssd神经网络的统计树木数量的方法及***
US20200393435A1 (en) * 2018-10-19 2020-12-17 The Climate Corporation Detecting infection of plant diseases by classifying plant photos

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300114A (zh) * 2018-08-30 2019-02-01 西南交通大学 高铁接触网支撑装置极小目标零部件顶紧缺失检测方法
US20200393435A1 (en) * 2018-10-19 2020-12-17 The Climate Corporation Detecting infection of plant diseases by classifying plant photos
CN110197113A (zh) * 2019-03-28 2019-09-03 杰创智能科技股份有限公司 一种高精度锚点匹配策略的人脸检测方法
CN110796643A (zh) * 2019-10-18 2020-02-14 四川大学 一种铁轨扣件缺陷检测方法和***
CN111080608A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 铁路货车脱轨自动制动阀塞门手把关闭故障图像识别方法
CN111079819A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 基于图像识别与深度学习的铁路货车钩舌销的状态判断方法
CN111079627A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 一种铁路货车制动梁梁体折断故障图像识别方法
CN111079746A (zh) * 2019-12-12 2020-04-28 哈尔滨市科佳通用机电股份有限公司 铁路货车轴箱弹簧故障图像识别方法
CN111091551A (zh) * 2019-12-12 2020-05-01 哈尔滨市科佳通用机电股份有限公司 一种铁路货车制动梁支柱开口销丢失故障检测方法
CN111126472A (zh) * 2019-12-18 2020-05-08 南京信息工程大学 一种基于ssd改进的目标检测方法
CN111027260A (zh) * 2019-12-24 2020-04-17 大连圣力来监测技术有限公司 一种基于神经网络的往复式压缩机故障诊断方法
CN111860623A (zh) * 2020-07-03 2020-10-30 北京林业大学 基于改进ssd神经网络的统计树木数量的方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SSD: Single Shot MultiBox Detector;Wei Liu et al.;《https://arxiv.org/abs/1512.02325》;20161229;1-17 *
基于深度学习的铁路列车关键零部件图像故障检测;李萍 等;《铁道科学与工程学报》;20191231;第16卷(第12期);1-7 *

Also Published As

Publication number Publication date
CN112766260A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN110827251B (zh) 一种基于航拍图像的输电线路锁紧销缺陷检测方法
CN109147254B (zh) 一种基于卷积神经网络的视频野外火灾烟雾实时检测方法
CN111353413B (zh) 一种输电设备低漏报率缺陷识别方法
CN108647655B (zh) 基于轻型卷积神经网络的低空航拍影像电力线异物检测方法
CN109977812B (zh) 一种基于深度学习的车载视频目标检测方法
CN107609525B (zh) 基于剪枝策略构建卷积神经网络的遥感图像目标检测方法
CN109559302A (zh) 基于卷积神经网络的管道视频缺陷检测方法
CN109934163A (zh) 一种基于场景先验和特征再融合的航空图像车辆检测方法
CN108921875A (zh) 一种基于航拍数据的实时车流检测与追踪方法
CN108039044B (zh) 基于多尺度卷积神经网络的车辆智能排队的***及方法
CN110163213B (zh) 基于视差图和多尺度深度网络模型的遥感图像分割方法
CN109214308A (zh) 一种基于焦点损失函数的交通异常图片识别方法
CN113160062B (zh) 一种红外图像目标检测方法、装置、设备及存储介质
CN108648210B (zh) 一种静态复杂场景下快速多目标检测方法及装置
CN112232351A (zh) 一种基于深度神经网络的车牌识别***
CN111091551A (zh) 一种铁路货车制动梁支柱开口销丢失故障检测方法
CN116342894A (zh) 基于改进YOLOv5的GIS红外特征识别***及方法
CN112800934A (zh) 一种多类别工程车的行为识别方法及装置
CN115719475A (zh) 一种基于深度学习的三阶段轨旁设备故障自动检测方法
CN103605960B (zh) 一种基于不同焦距视频图像融合的交通状态识别方法
CN112766260B (zh) 铁路列车加速缓解风缸定位的图像识别方法及***
CN112132088A (zh) 一种巡检点位漏巡识别方法
CN110163081A (zh) 基于ssd的实时区域入侵检测方法、***及存储介质
CN112489040A (zh) 一种货车副风缸脱落故障识别方法
CN112686139B (zh) 基于跨阶段局部多尺度密集连接的遥感图像目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant