CN117315670B

CN117315670B - 一种基于计算机视觉的水表读数区域检测方法

Info

Publication number: CN117315670B
Application number: CN202311243717.4A
Authority: CN
Inventors: 王绥霞; 蔡松; ***; 马怀; 袁东平
Original assignee: Tianjin Kingleed Valve Co ltd
Current assignee: Tianjin Kingleed Valve Co ltd
Priority date: 2023-09-26
Filing date: 2023-09-26
Publication date: 2024-07-05
Anticipated expiration: 2043-09-26
Also published as: CN117315670A

Abstract

本发明涉及一种基于计算机视觉的水表读数区域检测方法，属于图像处理和模式识别技术领域，对完整的水表图像进行图像预处理操作，对倾斜的水表图像进行角度校正；利用差分算法算法将完整水表图像中的读数区域分割出来；在读数区域中划分网格，用来检测目标；对每个目标数字的网格进行识别，将得到的识别框与真实框进行对比，调整识别模型，通过调整后的识别模型对分割后的读数区域进行读数检测，得到水表读数。

Description

一种基于计算机视觉的水表读数区域检测方法

技术领域

本发明属于图像处理和模式识别技术领域，更具体地，涉及一种基于计算机视觉的水表读数区域检测方法。

背景技术

人工统计水表读数的方式有抄表工作量大、工作效率低、经费花费大等缺点。随着计算机视觉技术以及深度学习领域研究取得突破性进展，可以先通过专门的图像采集设备采集水表表盘实时监测图像，然后通过网络将采集到的图像传输至后台，利用数字图像处理技术对采集到的水表图像进行相关预处理操作后，通过深度学习目标检测技术对图像中的数字字符进行识别得出读数结果，再以文本的形式进行储存，这样就完成了居民水表读数的远程抄送。自动化抄表过程相比于之前人工抄表的方式，不仅快速高效，利用大数据，技术人员还可以对采集到的用水数据进行统计分析，从而优化后续供水方案。

发明内容

为了解决上述技术问题，本发明提出了一种基于计算机视觉的水表读数区域检测方法，包括如下步骤：

S1、对完整的水表图像进行图像预处理操作，对预处理之后得到的水表图像进行倾斜校正；

S2、通过训练好的识别模型对倾斜校正后的完整水表图像中读数区域进行分割；将目标区域框嵌入到所述识别模型中，输出目标区域框中心点坐标的调整参数，根据调整参数调整目标区域框位置，将完整水表图像中的读数区域分割出来；

S3、对分割后的读数区域进行读数检测，得到水表读数；在读数区域中划分网格，每个网格都预设多个不同宽高比的锚框，用来检测目标；对每个目标数字的网格进行识别，将得到的识别框与真实框进行对比，调整识别模型。

进一步地，步骤S3中，当目标数字的中心点落在一个网格中，靠近目标数字的中心点的两个网格中的锚框也参与检测目标，

b_x=2t_x-0.5+c_x；

b_y=2t_y-0.5+c_y；

b_w=p_w×(2t_w)²；

b_h=p_h×(2t_h)²；

其中b_x、b_y分别表示目标数字的中心点坐标，b_w、b_h表分别示目标数字的宽度和高度，c_x、c_y分别表示目标数字中心点所在网格的左上角坐标，t_x、t_y分别表示目标数字的中心点相对于网格左上角坐标的偏移量大小，t_w、t_h分别表示目标数字的宽高相对于锚框宽高的缩放比例，p_w、p_h分别表示先验锚框的宽和高。

进一步地，步骤S3中，

采用对比检测函数将得到的识别框与真实框进行对比，衡量识别信息和真实信息之间的差距；

对比检测函数包含：矩形框对比检测函数J_b、分类对比检测函数J_c、准确度对比检测函数J_o，具体公式如下：

J＝b_g×J_b+c_g×J_c+o_g×J_o；

其中b_g为矩形框对比检测函数的权重系数，c_g为分类对比检测函数的权重系数，o_g为准确度对比检测函数的权重系数。

进一步地，矩形框对比检测函数J_b公式如下：

；

其中b和b^g分别表示识别框与真实框的中心点，表示两个中心点之间的欧式距离，c表示识别框与真实框的最小闭包区域的对角线距离，是权重参数，v用来衡量识别框宽w^g、高h^g与真实框宽w、高h的比的相似度，U为识别框与真实框的重叠度。

进一步地，分类对比检测函数J_c公式如下：

；

其中y为输入样本对应的类别标签,p为输入样本为正样本的概率。

进一步地，准确度对比检测函数J_o公式如下：

；

其中Y为准确度标签矩阵，P为预测准确度矩阵。

进一步地，用差分算法获取完整水表图像中的读数区域边界，提取每帧读数区域中的差分算法，包含分别检测水平边界差分算法和垂直边界的两个差分算法：

；

其中，F表示在边界像素点的灰度值；X,Y表示边界像素点的横纵坐标；表示该边界像素点经边界检测后在横坐标方向的灰度值；表示该边界像素点经边界检测后在纵坐标方向的灰度值；

对灰度化处理后区域上的每个边界像素点取水平方向和垂直方向的灰度值的卷积最大值，作为所述边界像素点的输出值，从而得到边界线。

进一步地，步骤S1中，利用双线性插值法实现图像的缩放，已知A₁₁(x₁,y₁)，A₁₂(x₂,y₁)，A₂₁(x₁,y₂)，A₂₂(x₂,y₂)为点A₁₁，A₁₂，A₂₁，A₂₂的坐标值，B点处于四个已知坐标点的中心，假设B点坐标为(x,y)，通过对横轴X轴进行线性插值，得出下式：

；

式中的M₁，M₂表示A₁₁，A₁₂，A₂₁，A₂₂的中间插值点，假设B点横坐标不变，对横轴X轴进行线性插值的结果为f(M₁)与f(M₂)，然后对纵轴Y轴进行线性插值，得到下式：

；

双线性插值的结果表示为下式：

。

相比于现有技术，本发明具有如下有益技术效果：

对完整的水表图像进行图像预处理操作，减少了外界因素对识别过程的干扰；对预处理之后得到的水表图像进行倾斜校正，能够更加精确地进行后续识别工作；通过训练好的识别模型对倾斜校正后的完整水表图像中读数区域进行分割；对分割后的读数区域进行读数检测，得到水表读数，本发明能排除光照、污渍以及黑色的背景等干扰，准确的识别出目标区域。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的基于计算机视觉的水表读数区域检测方法的流程图；

图2为本发明的双线性插值法实现图像的缩放的示意图；

图3为水表整字符示意图；

图4为水表半字符示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本发明的具体实施例附图中，为了更好、更清楚的描述***中的各元件的工作原理，表现所述装置中各部分的连接关系，只是明显区分了各元件之间的相对位置关系，并不能构成对元件或结构内的信号传输方向、连接顺序及各部分结构大小、尺寸、形状的限定。

如图1所示，为本发明的一种基于计算机视觉的水表读数区域检测方法的流程图，该检测方法包括以下步骤：

S1、对完整的水表图像进行图像预处理操作，对预处理之后得到的水表图像进行倾斜校正。

为了减少外界因素对识别过程的干扰，在保留图像中感兴趣的图像信息的同时，需要尽量滤除图像中的无效信息，以提高后续的检测与识别的准确率。

本发明采用图像预处理技术对采集的水表字轮区域图像进行图像效果增强。首先对输入图像进行归一化处理，统一调整为固定尺寸大小的图片；然后对图像进行滤波操作，去除图像中的噪声；其次对滤波后的图像进行均衡化操作，完成图像增强。

S11、图像归一化处理。

图像归一化技术通过一系列变换，将原始图像转化为对应的唯一标准形式。本实施例采用图像缩放的方式对水表图像原图进行归一化处理，得到统一像素大小为440×150的图像。

优选地利用双线性插值法来实现图像的缩放。如图2所示，已知A₁₁(x₁,y₁)，A₁₂(x₂,y₁)，A₂₁(x₁,y₂)，A₂₂(x₂,y₂)为点A₁₁，A₁₂，A₂₁，A₂₂的坐标值，它们在二维坐标中的分布情况如图2所示。

双线性插值算法先在一个方向上进行线性插值，在图中，B点处于四个已知坐标点的中心，假设B点坐标为(x,y)，通过对横轴X轴进行线性插值，可以得出下式：

；

式中的M₁，M₂表示A₁₁，A₁₂，A₂₁，A₂₂的中间插值点，假设B点横坐标不变，对横轴X轴进行线性插值的结果为f(M₁)与f(M₂)，然后对纵轴Y轴进行线性插值，可以得到下式：

；

综合上面两个公式，双线性插值的结果可以表示为下式：

；

在图像实际计算中，当单个像素取1时，上述公式的分母都变成1，再根据所求像素点的已知邻近坐标信息，能够计算出所求像素点的信息。

S12、图像中值滤波处理。

采集到的水表图像常常存在噪声，如果不对其进行处理，就执行后续图像处理操作，极大可能无法达到理想的效果，所以需要利用图像滤波技术对采集到的水表图像进行预处理，去除图像中的噪声，从而提高原始图像质量。中值滤波是非线性滤波方法，可以保证在一定条件下过滤掉图像中噪声的同时保留图像的边界信息。

依据固定大小的模板框对目标像素点周围的像素值进行统计，并根据它们灰度值大小进行排序，使用排序后得到的中值替换目标像素点的像素值。

假设存在一个数字信号序列，对该序列进行中值滤波操作，首先定义一个长度为奇数的模板n，然后从序列中抽出n个样本，其中i为样本个数中值，最后按照从大到小或者从小到大的顺序将抽出的样本值进行排序，那么排序后的中值g_i就是中值滤波的输出值，其数学表达式如下：

；

S13、图像均衡化处理

在不同光照强度下，同一目标图像的亮度和清晰度存在很大的差异，因此必须采用图像增强技术进行解决。本实施例采用直方图均衡化的方法为把原始图像的均衡化，从而增加像素之间灰度值差异的动态范围，同时增强图像对比度。

S2、对预处理之后得到的水表图像进行倾斜校正，以便更加精确地进行后续识别工作。

找到表盘中可作为水平基准的特征，再根据这些特征相应地旋转图片，得到表盘端正水平的图像。通过观察数字式水表图像的结构，可以发现在表盘上面有两个固定的标记字符，分别位于负责数字记录的字轮区域左右两边，左边为英文字符“H”，右边为单位符号“m³”。根据这一特点，本发明采用模板匹配的方法首先对这两个位置固定不变的标记字符进行识别，然后对图像进行校正。

具体的校正步骤如下：

S21、创建包含标记字符“H”和“m³”灰度值特征的参考模板，参照创建好的参考模板在待检测的水表图像中搜索该模板的匹配项。

计算待检测水表图像区域与参考模板的匹配分数，找到分数最高的匹配对象，分数越高，匹配程度也就越高。

计算匹配成功的对象的几何中心坐标，测量两个标记字符的几何中心连线与水平线的夹角。

S22、根据测量的夹角角度，使用几何变换对倾斜的水表图像进行角度校正，使其字轮区域呈现水平状态，按照测量角度对图像进行整体旋转，同时按照此测量角度将中心连线旋转。

重新进行步骤S21，测量两个标记字符的几何中心连线与水平线的夹角，设定夹角阈值A_T，在优选实施例中，将夹角阈值A_T赋值为5，如果重新测量的夹角在[-5,+5]内，则代表校正完成。

S3、通过训练好的识别模型对校正后的水表图像中读数区域进行分割。识别模型在识别读数区域上有显著的效果，能排除光照、污渍以及黑色的背景等干扰，准确的识别出目标区域。

将目标区域框嵌入到识别模型中，形成差值调整单元，该差值调整单元包括5个调整块。输入特征图x，经过(1×1，1)与(3×3，1)的两个2倍下采样卷积层后输出特征图f，该输出特征图f经过由注意力模块后得到的差值输出再与输出特征图f进行加权相乘，加权结果再与输入特征图x进行叠加，5个调整块的重复次数依次为1、2、8、8、4；将最后一个调整块的输出与可变形卷积层的输出相连，将识别模型中第3、4个调整块与可变形卷积层的输出进行特征融合，产生52×52、26×26、13×13三个不同尺度的特征图，分别在这三个特征图上预测输出目标区域框中心点坐标(x，y)的调整参数，根据调整参数调整目标区域框位置，从而将完整水表图像中的读数区域分割出来。

用差分算法获取完整水表图像中的读数区域边界，差分算法可以根据像素点上下、左右邻点灰度加权差，在边界处达到极值这一现象检测边界。对噪声具有平滑作用，提供较为精确的边界方向信息。

提取每帧读数区域中的差分算法，包含分别检测水平边界和垂直边界的两个差分算法，其对像素的位置影响做加权平均然后进行微分运算，降低边界的模糊程度。水平方向和垂直方向的灰度值分别计算如下：

；

其中，F表示在边界像素点的灰度值；X,Y表示边界像素点的横纵坐标；表示该边界像素点经边界检测后在横坐标方向的灰度值；表示该边界像素点经边界检测后在纵坐标方向的灰度值。

基于上述两个差分算法的计算结果，对灰度化处理后区域上的每个边界像素点取水平方向和垂直方向的灰度值的卷积最大值，作为所述边界像素点的输出值，从而得到边界线。

S4、对分割后的读数区域进行读数检测，得到水表读数。具体如下：

S41、识别模型的检测函数在读数区域中划分网格，每个网格都预设多个不同宽高比的锚框，用来检测目标。

当目标数字的中心点落在其中一个网格中，除了中心点所在的网格之外，其左、上、右、下4个邻域的网格中，靠近目标数字的中心点的两个网格中的锚框也会参与检测目标，具体公式如下所示：

b_x=2t_x-0.5+c_x；

b_y=2t_y-0.5+c_y；

b_w=p_w×(2t_w)²；

b_h=p_h×(2t_h)²；

S42、对每个目标数字的网格进行识别之后，将得到的识别框与真实框进行对比，从而调整识别模型的改进方向。

本实施例中采用对比检测函数将得到的识别框与真实框进行对比，对比检测函数可以衡量识别信息和真实信息之间的差距，若识别信息越接近真实信息，则对比检测函数值J的结果越小。

本发明的对比检测函数主要包含三个方面：矩形框对比检测函数J_b、分类对比检测函数J_c、准确度对比检测函数J_o具体公式如下：

J＝b_g×J_b+c_g×J_c+o_g×J_o ；

其中b_g为矩形框对比检测函数的权重系数，本发明设置为0.05，c_g为分类对比检测函数的权重系数，本发明设置为0.5，o_g为准确度对比检测函数的权重系数，本发明设置为1.0。

对于矩形框对比检测函数，使用基于重叠度进行衡量。重叠度可以衡量识别框与真实框的重叠程度，若识别框为A，真实框为B，则重叠度U的具体公式如下：

；

矩形框对比检测函数J_b公式如下：

；

其中b和b^g分别表示识别框与真实框的中心点，表示两个中心点之间的欧式距离，c表示识别框与真实框的最小闭包区域的对角线距离，是权重参数，v用来衡量识别框宽w^g、高h^g与真实框宽w、高h的比的相似度，具体公式如下：

；

对于分类对比检测函数J_c公式如下：

；

其中y为输入样本对应的类别标签,正样本为1，负样本为0，p为该输入样本为正样本的概率。

准确度对比检测函数J_o公式如下：

；

其中Y为准确度标签矩阵，P为预测准确度矩阵。

在实际应用过程中，水表分为电子数字型水表和字轮型水表。电子数字型水表字轮区域图像内的数字字符的一共0-9十个类别，将处理好图像输入到识别模型中学习1-9十个类别，即0-9十个数字字符，然后根据模型预测的结果与预测出的位置大小进行排序，最后输出对水表图像字轮区域内数字字符的识别结果，从而完成整个水表图像的读数识别任务。

字轮型水表字轮即数字齿轮计数器，机械齿轮以旋转的方式进位。根据机械字轮的旋转特性，将字轮字符分成整字符和半字符两种情况，每种情况各分成10类，如图3所示整字符分别是“0”、“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”、“9”种，如图4所示半字符“0-1”、“1-2”、“2-3”、“3-4”、“4-5”、“5-6”、“6-7”、“7-8”、“8-9”、“9-0”种，整字符检测识别与电子数字型水表相同。

结合半字符识别程序和完整字符识别程序，根据模型预测的结果与预测出的位置大小进行排序，最终得到完整的字轮读数。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者通过所述计算机可读存储介质进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如，固态硬盘(solid state disk，SSD))等。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于计算机视觉的水表读数区域检测方法，其特征在于，包括如下步骤：

S1、对完整的水表图像进行图像预处理操作；

S2、选择表盘上的两个标记字符作为参考模版，计算预处理后的水表图像中的匹配成功的两个对象的几何中心坐标，测量两个对象的几何中心连线与水平线的夹角，根据测量的夹角角度，对倾斜的水表图像进行角度校正；

S3、通过训练好的识别模型对倾斜校正后的完整水表图像中读数区域进行分割；将目标区域框嵌入到所述识别模型中，输出目标区域框中心点坐标的调整参数，根据调整参数调整目标区域框位置，利用差分算法将完整水表图像中的读数区域分割出来；

将目标区域框嵌入到识别模型中，形成差值调整单元，所述差值调整单元包括5个调整块；

输入特征图A，经过(1×1，1)与(3×3，1)的两个2倍下采样卷积层后输出特征图f，所述输出特征图f经过由注意力模块后得到的差值输出再与输出特征图f进行加权相乘，加权结果再与输入特征图A进行叠加，5个调整块的重复次数依次为1、2、8、8、4；将最后一个调整块的输出与可变形卷积层的输出相连，将识别模型中第3、4个调整块与可变形卷积层的输出进行特征融合，产生52×52、26×26、13×13三个不同尺度的特征图，分别在三个特征图上预测输出目标区域框中心点坐标(x，y)的调整参数，根据所述调整参数调整目标区域框位置，将完整水表图像中的读数区域分割出来；

用差分算法获取完整水表图像中的读数区域边界，提取读数区域边界的差分算法，包含分别检测水平边界和垂直边界的两个差分算法：

；

对灰度化处理后区域上的每个边界像素点取水平方向和垂直方向的灰度值的卷积最大值，作为所述边界像素点的输出值，从而得到边界线；

S4、在读数区域中划分网格，每个网格都预设多个不同宽高比的锚框，用来检测目标；对每个目标数字的网格进行识别，将得到的识别框与真实框进行对比，调整识别模型，通过调整后的识别模型对分割后的读数区域进行读数检测，得到水表读数。

2.根据权利要求1所述的水表读数区域检测方法，其特征在于，步骤S2中，测量两个标记字符的几何中心连线与水平线的夹角，设定夹角阈值A_T为5，如果重新测量的夹角在[-5,+5]内，则代表校正完成。