CN117523573A

CN117523573A - 基于多阶段视觉检测融合故障预警的水表读数方法、***

Info

Publication number: CN117523573A
Application number: CN202311637194.1A
Authority: CN
Inventors: 李西明; 薛振豪; 王蔗; 谢晓生; 张越; 郭玉彬; 高月芳
Original assignee: South China Agricultural University
Current assignee: South China Agricultural University
Priority date: 2023-12-01
Filing date: 2023-12-01
Publication date: 2024-02-06

Abstract

本发明公开了一种基于多阶段视觉检测融合故障预警的水表读数方法、***，包括S1：采集水表图像，其中水表图像为字轮式水表图像；S2：对水表图像进行计数器框的检测，以得到计数器框图像；S3：对计数器框图像进行角点检测，以得到计数器框图像的角点位置；S4：利用角点位置对计数器框图像进行矫正；S5：利用目标检测网络对计数器框图像进行字符识别，以得到水表读数。本发明能够提高水表读数的工作效率、减少人工成本；能够对旋转、畸变表盘进行矫正，以对后续的字符识别提供帮助，实现更稳定的读数，且能筛选出不可读的水表避免进入字符检测阶段，从而节省识别时间；采用动态优化策略改善字轮式水表字符识别容易出现的半字符识别问题。

Description

基于多阶段视觉检测融合故障预警的水表读数方法、***

技术领域

本发明涉及水表读数技术领域，具体为一种基于多阶段视觉检测融合故障预警的水表读数方法、***。

背景技术

水表读数识别是城市水务管理过程中的重要环节，随着城市规模的不断扩大，城市管理的信息量也越来越大，此时就需要城市信息管理的智能化程度的不断提高，而且无论是城市信息管理还是居民智能化生活，都离不开水资源的管理和利用。水资源的智能化管理离不开水表的智能化管理。水表在水资源管理方面具有必不可少的作用；并且在整个数字化城市发展过程中扮演重要角色。水表在工业、生活等领域都有着广泛的应用。其中，当前对于字轮式水表的读数抄表存在着较多问题，如传统的水表抄表往往依靠人工读取，人工抄表方式工作量大，效率低、耗时长且人工成本高，并且工作人员在处理大量的数据时容易出错。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种基于多阶段视觉检测融合故障预警的水表读数方法、***，能够解决上述技术问题。

(二)技术方案

为解决上述技术问题，本发明提供如下一技术方案：一种基于多阶段视觉检测融合故障预警的水表读数方法，包括以下步骤：

S1：采集水表图像，其中水表图像为字轮式水表图像；

S2：对水表图像进行计数器框的检测，以得到计数器框图像；

S3：对计数器框图像进行角点检测，以得到计数器框图像的角点位置；

S4：利用角点位置对计数器框图像进行矫正；

S5：利用目标检测网络对计数器框图像进行字符识别，以得到水表读数。

优选的，在步骤S2之前还包括：对水表图像进行预处理。

优选的，步骤S2中，在得到计数器框图像之后，进一步对计数器框图像进行边缘填充。

优选的，步骤S3还包括：对计数器框图像进行可读/不可读分类，以实现水表的故障预警。

优选的，计数器框图像包括四个角点：左上角、左下角、右上角以及右下角。

优选的，在步骤S5中，当识别到计数器框图像的同一个字轮框内出现两个字符时，分别计算两个字符的面积，当其中一个字符的面积占比超过预设阈值时则其为当前字轮框的字符读数。

优选的，在步骤S5中，当两个字符的面积占比均没有超过预设阈值时，则进一步根据后一个量程的字轮框的字符读数进行调整：如果后一个量程的字轮框的字符读数为9，则当前字轮框的字符读数为两个字符中的上方字符；如果后一个量程的字轮框的字符读数为0，则当前字轮框的字符读数为两个字符中的下方字符。

优选的，在步骤S5之后还包括：输出水表读数以及计数器框图像。

为解决上述技术问题，本发明提供如下另一技术方案：一种基于多阶段视觉检测融合故障预警的水表读数***，包括：

图像采集模块：用于采集水表图像，其中水表图像为字轮式水表图像；

计数器框检测模块：用于对水表图像进行计数器框的检测，以得到计数器框图像；

角点检测模块：用于对计数器框图像进行角点检测，以得到计数器框图像的角点位置；

图像矫正模块：用于利用角点位置对计数器框图像进行矫正；

字符识别模块：用于利用目标检测网络对计数器框图像进行字符识别，以得到水表读数。

优选的，图像采集模块具体包括控制器、远传模块以及摄像模块，控制器分别与远传模块、摄像模块连接。

(三)有益效果

与现有技术相比，本发明提供了一种基于多阶段视觉检测融合故障预警的水表读数方法、***，具备以下有益效果：(1)本发明利用目标检测网络对计数器框图像进行字符识别，实现水表的自动读数，相比于传统的人工抄表方式能够提高工作效率、减少人工成本，更好地避免由于人为因素导致水表读数出错；(2)通过对水表图像进行计数器框的检测以得到计数器框图像，即对所采集水表图像进行特征提取，使得能够更好地适应不同拍摄场景的变化，同时能够提高对于水表图像的字符识别效率；(3)通过对计数器框图像进行矫正，能够对后续的字符识别提供帮助，实现更稳定的读数。

附图说明

图1为本发明基于多阶段视觉检测融合故障预警的水表读数方法的步骤流程图；

图2为本发明基于多阶段视觉检测融合故障预警的水表读数***的原理框图；

图3为本发明改进的YOL0v7模型的网络结构图；

图4为本发明用于角点检测及故障预警的多任务网络的结构图；

图5为本发明将预测的角点进行透射变换矫正的示意图；

图6为本发明计数器框图像的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供一种基于多阶段视觉检测融合故障预警的水表读数方法，包括以下步骤：

S1：采集水表图像，其中水表图像为字轮式水表图像，一张水表图像对应一个字轮式水表，水表图像上包括有用于表示水表读数的计数器，一个计数器包括有多个不同量程的字轮框。

S2：对水表图像进行计数器框的检测，以得到计数器框图像，应理解，计数器框图像上包括有用于表示水表读数的计数器。

优选的，在步骤S2之前还包括：对水表图像进行预处理，筛选出图像质量良好，计数器清晰可见，并且尽可能覆盖不同的角度、光照条件和环境背景。进一步的，可使用图像标注工具，对采集到的水表图像进行标注，将每个计数器的位置用框标注出来，确保框紧密围绕着计数器。接着，对标注的图像进行数据增强，以扩充数据集，采用旋转、平移、缩放、翻转等操作增加数据的多样性和鲁棒性。同时还考虑使用模糊、亮度调整等操作模拟不同环境条件下的变化。最后，可按照7∶2∶1的比例将数据集划分为训练集、验证集、测试集。进一步可利用上述数据集对计数器框检测模型进行训练，从而利用训练得到的计数器框检测模型对水表图像进行计数器框的检测。

优选的，本发明采用的计数器框检测模型为改进的YOLOv7模型，如图3所示，该模型使用了E-ELAN(扩展的高效层聚合网络)、基于连接的模型缩放以及重参数化，以在检测效率和精度之间取得有利的平衡。上述改进的YOLOv7模型在输入的预处理部分采用了Mosaic和混合数据增强技术，并将图像统一缩放到640x640的尺寸输入主干网络。主干网络由CBS、E-ELAN和MP1三个主要组件组成，并在主干网络和头网络中引入CBAM注意力机制，捕捉空间和通道相关性，提升网络特征提取能力，避免其他背景特征的干扰；回归预测采用IoU Loss，分类预测采用BCE Loss对网络进行训练，生成相应的权重文件，其中IoU为预测框和真实框的交并比，BCE Loss(Binary Cross-Entropy Loss)损失函数如下式所示：

BCE Loss＝-(y_true*log(y_pred)+(1-y_true)*log(1-y_Pred))

在上式中，y_true表示真实的标签，y_pred表示模型预测的输出，log表示自然对数函数，*表示元素之间的逐元素乘法。

应理解，水表图像经过上述步骤S2之后可以识别检测出水表的计数器在图片中准确的位置坐标，以在水表图像中裁剪出计数器的图像：计数器框图像。优选的，步骤S2中，在得到计数器框图像之后，进一步对计数器框图像进行边缘填充：采用零填充的方式将计数器框图像的边框扩大10％，方便后续进行角点检测。

S3：对计数器框图像进行角点检测，以得到计数器框图像的角点位置。

具体的，计数器框图像包括四个角点：左上角、左下角、右上角以及右下角。

此外，步骤S3还包括：对计数器框图像进行可读/不可读分类，以实现水表的故障预警。

具体的，在步骤S3中，可通过一个多任务网络，分析计数器框图像并预测出9个输出：分别为八个浮点数以表示四个角点位置，以及一个包含两个浮点数的数组以表示计数器框可读/不可读的概率，多任务网络结构如图4所示，在图4中，conv表示卷积，max即maxpooling表示最大池化。

S4：利用角点位置对计数器框图像进行矫正。

在经过上述步骤S3预测出角点位置后，通过计算坐标和透射变换可以对计数器框图像进行矫正：首先，确定角点坐标后，将计数器框图像进行矫正前的四个角点称为p₁…p₄(即上述子步骤S32所得到的角点位置)，将计数器框图像进行矫正后的四个角点称为p′₁…p′₄，每个角点具有相应的x和y坐标即角点位置，如图5所示，将预测的角点映射到矫正之后的坐标空间，会假设矫正后的图像具有固定的大小，p′₁和p′₂分别位于矫正后图像的左上角和右上角的角点位置，即可以提前计算出p′₁和p′₂的值：比如，对于大小为320x320的图像，假设矫正后图像的大小不会发生变化，则p′₁和p′₂的位置则是(10，10)和(310，10)，这里预留一定数量的像素点目的是为了避免在变换时图像边缘的信息丢失影响矫正结果；进一步的，考虑宽高的比例可以通过以下公式确定p′₃的坐标：

x′₃＝x′₁

上式中，[p_m，p_n]_dist是p_m，p_n之间的欧氏距离，Wrct表示矫正后的计数器框图像的宽度，即p′₁和p′₂在x轴上的距离。最后通过x′₄＝x′₂和y′₄＝y′₃来确定p′₄。

此外，对计数器框图像进行可读/不可读分类：可具体通过softmax激活函数预测出由两个浮点数组成的数组，表示可读或不可读水表的相对概率大小，两个浮点数的和为1；通过为概率设置阈值，实现水表的故障预警，例如不可读的概率超过预设的阈值，则计数器框图像对应为不可读，以筛选出不可读的计数器框图像避免进入后续的字符识别阶段，从而节省识别时间。具体的，在数据集图像样本中除了上述角点的坐标外，还添加了可读、不可读的分类标签，以区分正常的水表图像以及受遮挡等不可读的水表图像，上述的多任务网络在训练过程中学习到不同计数器框样本的特征和模式，可以给出每个计数器框样本的可读和不可读的概率值；在图4的多任务网络中，对于每个输出有两个非共享的全连接层，在第二个非共享全连接层中，有两个单元用于预测计数器框的可读性，并使用softmax激活函数将预测结果的输出进行归一化，将其转化为(0，1)之间的数值作为可读/不可读的概率分布，并且两个数值之和为1，确保概率之和为1。对于每一个计数器框图像样本，如果可读性单元输出概率较高，则表示多任务网络认为计数器框是可读的，反之，则表示计数器框是不可读的，从而实现计数器框可读/不可读的分类任务。

优选的，步骤S5具体可采用与上述步骤S2同样的改进的YOLOv7模型进行字符识别，识别检测的对象为从0到9的字轮式数字字符。

此外，在步骤S5中，当识别到计数器框图像的同一个字轮框内出现两个字符时，即同一个字轮框内上下方各有一个字符(两个不完整的字符，也就是出现字轮式字符常见的半字符问题)，采用动态优化策略调整识别字符读数：此时分别计算两个字符的面积(具体为两个字符各自的边界框面积)，当其中一个字符在字轮框内的面积占比超过预设阈值时则其为当前字轮框的字符读数：例如图6所示，从左往右数第5个字轮框内出现两个字符：上方字符9、下方字符0，此时假设下方字符0在第5个字轮框内的面积占比超过预设阈值70％，则当前字轮框(第5个字轮框)的字符读数对应为0。

此外，在步骤S5中，当两个字符在字轮框内的面积占比均没有超过预设阈值(例如上方字符在字轮框内的面积占比为40％，下方字符在字轮框内的面积占比为60％，而预设阈值为70％)时，则进一步根据后一个量程的字轮框的字符读数进行调整：如果后一个量程的字轮框的字符读数为9，则当前字轮框的字符读数为两个字符中的上方字符；如果后一个量程的字轮框的字符读数为0，则当前字轮框的字符读数为两个字符中的下方字符。例如图6所示，从左往右数第4个字轮框内出现两个字符：上方字符5、下方字符6，而后一个量程的字轮框(即上述第5个字轮框)的字符读数为0，则当前字轮框(第4个字轮框)的字符读数为两个字符中的下方字符：6。

本发明还提供一种基于多阶段视觉检测融合故障预警的水表读数***，包括：

图像采集模块11：用于采集水表图像，其中水表图像为字轮式水表图像。优选的，图像采集模块11具体包括控制器、远传模块以及摄像模块，控制器分别与远传模块、摄像模块连接，应理解，图像采集模块11安装于水表端，控制器控制远传模块将摄像模块所采集的水表图像上传至计数器框检测模块；为了在功耗、成本以及图像质量上取得平衡，可使用低分辨率的摄像模块和采用图像压缩算法，采集水表图像进行压缩和上传。

计数器框检测模块12：用于对水表图像进行计数器框的检测，以得到计数器框图像；

角点检测模块13：用于对计数器框图像进行角点检测，以得到计数器框图像的角点位置；

图像矫正模块14：用于利用角点位置对计数器框图像进行矫正；

字符识别模块15：用于利用目标检测网络对计数器框图像进行字符识别，以得到水表读数。

与现有技术相比，本发明提供了一种基于多阶段视觉检测融合故障预警的水表读数方法、***，具备以下有益效果：(1)本发明利用目标检测网络对计数器框图像进行字符识别，实现水表的自动读数，相比于传统的人工抄表方式能够提高工作效率、减少人工成本，更好地避免由于人为因素导致水表读数出错；(2)通过对水表图像进行计数器框的检测以得到计数器框图像，即对所采集水表图像进行特征提取，使得能够更好地适应不同拍摄场景的变化，同时能够提高对于水表图像的字符识别效率；(3)通过多任务网络完成角点检测和故障预警任务，能够对旋转、畸变表盘进行矫正，能够对后续的字符识别提供帮助，实现更稳定的读数，且能筛选出不可读的水表避免进入字符检测阶段，从而节省识别时间；(4)相比于使用手机、抄表机进行拍照识别水表读数，本发明通过简单的控制器、摄像模块和远传模块可以完成定时拍照上传，且安装不需要断水，安装成本低，更适合城市地区推广使用；(5)本发明可部署于云端服务器使用，相比于部署在表端控制器，可以运用更多的算力，且表端控制器功耗可以更低，更耐用；(6)本发明采用动态优化策略改善字轮式水表字符识别容易出现的半字符识别问题，从而保证水表读数的准确性。

需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于，包括以下步骤：

S1：采集水表图像，其中所述水表图像为字轮式水表图像；

S2：对所述水表图像进行计数器框的检测，以得到计数器框图像；

S3：对所述计数器框图像进行角点检测，以得到所述计数器框图像的角点位置；

S4：利用所述角点位置对所述计数器框图像进行矫正；

S5：利用目标检测网络对所述计数器框图像进行字符识别，以得到水表读数。

2.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：在所述步骤S2之前还包括：对所述水表图像进行预处理。

3.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：所述步骤S2中，在得到所述计数器框图像之后，进一步对所述计数器框图像进行边缘填充。

4.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：所述步骤S3还包括：对所述计数器框图像进行可读/不可读分类，以实现水表的故障预警。

5.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：所述计数器框图像包括四个角点：左上角、左下角、右上角以及右下角。

6.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：在所述步骤S5中，当识别到所述计数器框图像的同一个字轮框内出现两个字符时，分别计算两个字符的面积，当其中一个字符的面积占比超过预设阈值时则其为当前字轮框的字符读数。

7.根据权利要求6所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：在所述步骤S5中，当所述两个字符的面积占比均没有超过预设阈值时，则进一步根据后一个量程的字轮框的字符读数进行调整：如果后一个量程的字轮框的字符读数为9，则所述当前字轮框的字符读数为所述两个字符中的上方字符；如果后一个量程的字轮框的字符读数为0，则所述当前字轮框的字符读数为所述两个字符中的下方字符。

8.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法，其特征在于：在所述步骤S5之后还包括：输出所述水表读数以及所述计数器框图像。

9.一种基于多阶段视觉检测融合故障预警的水表读数***，其特征在于，包括：

图像采集模块：用于采集水表图像，其中所述水表图像为字轮式水表图像；

计数器框检测模块：用于对所述水表图像进行计数器框的检测，以得到计数器框图像；

角点检测模块：用于对所述计数器框图像进行角点检测，以得到所述计数器框图像的角点位置；

图像矫正模块：用于利用所述角点位置对所述计数器框图像进行矫正；

字符识别模块：用于利用目标检测网络对所述计数器框图像进行字符识别，以得到水表读数。

10.根据权利要求9所述的基于多阶段视觉检测融合故障预警的水表读数***，其特征在于：所述图像采集模块具体包括控制器、远传模块以及摄像模块，所述控制器分别与所述远传模块、所述摄像模块连接。