CN109635813A

CN109635813A - 一种钢轨区域图像分割方法及装置

Info

Publication number: CN109635813A
Application number: CN201811523003.8A
Authority: CN
Inventors: 黄永祯; 曹春水; 杨家辉; 张俊峰
Original assignee: Watrix Technology Beijing Co Ltd
Current assignee: Watrix Technology Beijing Co Ltd
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2019-04-16
Anticipated expiration: 2038-12-13
Also published as: CN109635813B

Abstract

本发明公开一种钢轨区域图像分割方法及装置，方法包括：选择钢轨样本图像中的一张输入第一自动编码器，用于表达样本图像模式特征并输出选择的钢轨样本图像钢轨区域的分割图；获取一个测试钢轨图像输入第二自动编码器，用于表达测试图像模式特征并输出测试钢轨图像钢轨区域的分割图；利用比对编码器将选择的钢轨样本图像与测试钢轨图像比对，获取两张图像中钢轨区域的分割图，其中比对编码器各特征层的输入是按照预设融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入测试钢轨图像的第二自动编码器的对应特征层的输出；比对编码器解码器部分与第一、二自动编码器解码部分均共享参数。能实现图片中高精度、强鲁棒的钢轨区域的提取。

Description

一种钢轨区域图像分割方法及装置

技术领域

本发明实施例涉及计算机视觉技术领域，具体涉及一种钢轨区域图像分割方法及装置。

背景技术

近年来，轨道交通因其具有大运量和快速安全等诸多优点得到了速猛的发展，给人们的生产生活带来极大便利。

在轨道交通领域，钢轨表面损伤分析具有重要意义，因而在图片中分割出钢轨表面区域具有重要应用价值。

鉴于此，如何实现图片中高精度、强鲁棒的钢轨区域的提取成为目前需要解决的技术问题。

发明内容

由于现有方法存在上述问题，本发明实施例提出一种钢轨区域图像分割方法及装置。

第一方面，本发明实施例提出一种钢轨区域图像分割方法，包括：

选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图；

获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图；

利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；

其中，所述比对编码器的解码器部分与所述第一自动编码器和第二自动编码器的解码部分均共享参数。

第二方面，本发明实施例还提出一种钢轨区域图像分割装置，包括：

第一输入模块，用于选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图；

第二输入模块，用于获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图；

输出模块，用于利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；

第三方面，本发明实施例提供一种电子设备，包括：处理器、存储器、总线及存储在存储器上并可在第处理器上运行的计算机程序；

其中，所述处理器，存储器通过所述总线完成相互间的通信；

所述处理器执行所述计算机程序时实现上述方法。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，所述存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述方法。

由上述技术方案可知，本发明实施例提供的一种钢轨区域图像分割方法及装置，通过选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征并输出所选择的钢轨样本图像的钢轨区域的分割图，获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征并输出所述测试钢轨图像的钢轨区域的分割图，利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，比对编码器各特征层的输入是按照预设融合方式整合了已输入所选择的钢轨样本图像的第一自动编码器和已输入所获取的一个测试钢轨图像的第二自动编码器的对应特征层的输出；所述比对编码器的解码器部分与所述第一自动编码器和第二自动编码器的解码部分均共享参数，由此，能够实现图片中高精度、强鲁棒的钢轨区域的提取，速度快，适应能力强。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些图获得其他的附图。

图1为本发明一实施例提供的一种钢轨区域图像分割方法的流程示意图；

图2为本发明实施例提供的比对编码器的原理示意图；

图3为本发明一实施例提供的一种钢轨区域图像分割装置的结构示意图；

图4为本发明一实施例提供的电子设备的实体结构示意图。

具体实施方式

下面结合附图，对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

图1示出了本发明一实施例提供的一种钢轨区域图像分割方法的流程示意图，如图1所示，本实施例的钢轨区域图像分割方法，包括：

S1、选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图。

S2、获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图。

S3、利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；

在具体应用中，所述第一自动编码器和所述第二自动编码器均是基于样本图像对深度神经网络进行训练后得到的；所述样本图像是通过获取钢轨样本图像，对钢轨样本图像进行人工标注分割后得到的标注有钢轨区域的分割图。

可以理解的是，由于钢轨区域成像图片上具有结构相似的共性，都是竖条状区域，因此本实施例可通过预先让所述比对编码器学会对比图像内容，找出相似的竖条状区域从而实现钢轨区域的提取。

本发明实施例提供的钢轨区域图像分割方法，通过选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征并输出所选择的钢轨样本图像的钢轨区域的分割图，获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征并输出所述测试钢轨图像的钢轨区域的分割图，利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，比对编码器各特征层的输入是按照预设融合方式整合了已输入所选择的钢轨样本图像的第一自动编码器和已输入所获取的一个测试钢轨图像的第二自动编码器的对应特征层的输出；所述比对编码器的解码器部分与所述第一自动编码器和第二自动编码器的解码部分均共享参数，由此，能够实现图片中高精度、强鲁棒的钢轨区域的提取，速度快，适应能力强。

进一步地，在具体应用中，可参考图2，所述已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出，与所述比对编码器相应特征层的输出，以通道并联的方式形成所述比对编码器下一特征层的输入。

进一步地，在具体应用中，所述预设融合方式可以为：(比对编码器的输出-第一自动编码器的输出)++第二自动编码器的输出，其中，++为或操作。

由此，所述比对编码器能够学会对比图像内容，找出相似的竖条状区域从而实现钢轨区域的提取。

进一步地，在上述实施例的基础上，在所述步骤S1之前，本实施例所述方法还可以包括图中未示出的步骤S0：

S0、获取样本图像，根据所述样本图像，对深度神经网络进行训练，获得训练好的第一自动编码器，所述第一自动编码器的解码器部分输出一个通道，负责钢轨区域的分割。

由此，本实施例能够获得训练好的第一自动编码器。

进一步地，在上述实施例的基础上，在所述步骤S2之前，本实施例所述方法还可以包括图中未示出的步骤P1：

获取样本图像，根据所述样本图像，对深度神经网络进行训练，获得训练好的第二自动编码器，所述第二自动编码器的解码器部分输出一个通道，负责钢轨区域的分割；

其中，所述第二自动编码器与所述第一自动编码器的参数是共享的。

可以理解的是，本实施例的所述第一自动编码器和所述第二自动编码器的实现方式不唯一，通常可以使用各种深度神经网络来实现，举例来说，本实施例中的深度神经网络可以包括：u-net，反卷积神经网络等。

由此，本实施例能够获得训练好的第二自动编码器。

本发明实施例提供的钢轨区域图像分割方法，充分利用了钢轨表面的纹理相似性和整体钢轨形态的一致性特点，通过预先让比对编码器学会对比图像内容，能够实现图片中高精度、强鲁棒的钢轨区域的提取，速度快，适应能力强。

图3示出了本发明一实施例提供的一种钢轨区域图像分割装置的结构示意图，如图3所示，本实施例的钢轨区域图像分割装置，包括：第一输入模块31、第二输入模块32和输出模块33；其中：

所述第一输入模块31，用于择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图；

所述第二输入模块32，用于获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图；

所述输出模块33，用于利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；

具体地，所述第一输入模块31择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图；所述第二输入模块32获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图；所述输出模块33利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；其中，所述比对编码器的解码器部分与所述第一自动编码器和第二自动编码器的解码部分均共享参数。

本发明实施例提供的钢轨区域图像分割装置，能够实现图片中高精度、强鲁棒的钢轨区域的提取，速度快，适应能力强。

进一步地，在上述实施例的基础上，本实施例所述装置还可以包括图中未示出的：

第一训练模块，用于获取样本图像，根据所述样本图像，对深度神经网络进行训练，获得训练好的第一自动编码器，所述第一自动编码器的解码器部分输出一个通道，负责钢轨区域的分割。

由此，本实施例能够获得训练好的第一自动编码器。

第二训练模块，用于获取样本图像，根据所述样本图像，对深度神经网络进行训练，获得训练好的第二自动编码器，所述第二自动编码器的解码器部分输出一个通道，负责钢轨区域的分割；

由此，本实施例能够获得训练好的第二自动编码器。

本发明实施例提供的钢轨区域图像分割装置，充分利用了钢轨表面的纹理相似性和整体钢轨形态的一致性特点，通过预先让比对编码器学会对比图像内容，能够实现图片中高精度、强鲁棒的钢轨区域的提取，速度快，适应能力强。

本实施例的钢轨区域图像分割装置，可以用于执行前述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图4示出了本发明一实施例提供的一种电子设备的实体结构示意图，如图4所示，该电子设备可以包括：处理器401、存储器402、总线403及存储在存储器402上并可在处理器401上运行的计算机程序；

其中，所述处理器401和存储器402通过所述总线403完成相互间的通信；

所述处理器401执行所述计算机程序时实现上述方法实施例所提供的方法，例如包括：选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图；获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图；利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；其中，所述比对编码器的解码器部分与所述第一自动编码器和第二自动编码器的解码部分均共享参数。

本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述方法实施例所提供的方法，例如包括：选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器，所述第一自动编码器用于表达样本图像的模式特征，并输出所选择的钢轨样本图像的钢轨区域的分割图；获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器，所述第二自动编码器用于表达测试图像的模式特征，并输出所述测试钢轨图像的钢轨区域的分割图；利用比对编码器将所选择的钢轨样本图像与所获取的一个测试钢轨图像进行比对，获取两张图像中钢轨区域的分割图，其中，所述比对编码器各特征层的输入，是按照预设的融合方式整合了已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出；其中，所述比对编码器的解码器部分与所述第一自动编码器和第二自动编码器的解码部分均共享参数。

本领域内的技术人员应明白，本申请的实施例可提供为方法、装置、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、装置、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置/***。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

本发明的说明书中，说明了大量具体细节。然而能够理解的是，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。类似地，应当理解，为了精简本发明公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释呈反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面，也不局限于任何单一的实施例，也不局限于这些方面和/或实施例的任意组合和/或置换。而且，可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种钢轨区域图像分割方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一自动编码器和所述第二自动编码器均是基于样本图像对深度神经网络进行训练后得到的；

所述样本图像是通过获取钢轨样本图像，对钢轨样本图像进行人工标注分割后得到的标注有钢轨区域的分割图。

3.根据权利要求1所述的方法，其特征在于，所述已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出，与所述比对编码器相应特征层的输出，以通道并联的方式形成所述比对编码器下一特征层的输入。

4.根据权利要求1所述的方法，其特征在于，所述预设融合方式为：(比对编码器的输出-第一自动编码器的输出)++第二自动编码器的输出，其中，++为或操作。

5.根据权利要求1所述的方法，其特征在于，在选择钢轨样本图像中的一张，将所选择的钢轨样本图像输入第一自动编码器之前，所述方法还包括：

获取样本图像，根据所述样本图像，对深度神经网络进行训练，获得训练好的第一自动编码器，所述第一自动编码器的解码器部分输出一个通道，负责钢轨区域的分割。

6.根据权利要求5所述的方法，其特征在于，在获取一个测试钢轨图像，将所述测试钢轨图像输入第二自动编码器之前，所述方法还包括：

7.一种钢轨区域图像分割装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述已输入所述钢轨样本图像的第一自动编码器和已输入所述测试钢轨图像的第二自动编码器的对应特征层的输出，与所述比对编码器相应特征层的输出，以通道并联的方式形成所述比对编码器下一特征层的输入。

9.一种电子设备，其特征在于，包括：处理器、存储器、总线及存储在存储器上并可在第处理器上运行的计算机程序；

所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的方法。

10.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。