CN117523573A - 基于多阶段视觉检测融合故障预警的水表读数方法、*** - Google Patents

基于多阶段视觉检测融合故障预警的水表读数方法、*** Download PDF

Info

Publication number
CN117523573A
CN117523573A CN202311637194.1A CN202311637194A CN117523573A CN 117523573 A CN117523573 A CN 117523573A CN 202311637194 A CN202311637194 A CN 202311637194A CN 117523573 A CN117523573 A CN 117523573A
Authority
CN
China
Prior art keywords
water meter
image
character
reading
counter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311637194.1A
Other languages
English (en)
Inventor
李西明
薛振豪
王蔗
谢晓生
张越
郭玉彬
高月芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN202311637194.1A priority Critical patent/CN117523573A/zh
Publication of CN117523573A publication Critical patent/CN117523573A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1463Orientation detection or correction, e.g. rotation of multiples of 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/1607Correcting image deformation, e.g. trapezoidal deformation caused by perspective
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1916Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/02Recognising information on displays, dials, clocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Arrangements For Transmission Of Measured Signals (AREA)

Abstract

本发明公开了一种基于多阶段视觉检测融合故障预警的水表读数方法、***,包括S1:采集水表图像,其中水表图像为字轮式水表图像;S2:对水表图像进行计数器框的检测,以得到计数器框图像;S3:对计数器框图像进行角点检测,以得到计数器框图像的角点位置;S4:利用角点位置对计数器框图像进行矫正;S5:利用目标检测网络对计数器框图像进行字符识别,以得到水表读数。本发明能够提高水表读数的工作效率、减少人工成本;能够对旋转、畸变表盘进行矫正,以对后续的字符识别提供帮助,实现更稳定的读数,且能筛选出不可读的水表避免进入字符检测阶段,从而节省识别时间;采用动态优化策略改善字轮式水表字符识别容易出现的半字符识别问题。

Description

基于多阶段视觉检测融合故障预警的水表读数方法、***
技术领域
本发明涉及水表读数技术领域,具体为一种基于多阶段视觉检测融合故障预警的水表读数方法、***。
背景技术
水表读数识别是城市水务管理过程中的重要环节,随着城市规模的不断扩大,城市管理的信息量也越来越大,此时就需要城市信息管理的智能化程度的不断提高,而且无论是城市信息管理还是居民智能化生活,都离不开水资源的管理和利用。水资源的智能化管理离不开水表的智能化管理。水表在水资源管理方面具有必不可少的作用;并且在整个数字化城市发展过程中扮演重要角色。水表在工业、生活等领域都有着广泛的应用。其中,当前对于字轮式水表的读数抄表存在着较多问题,如传统的水表抄表往往依靠人工读取,人工抄表方式工作量大,效率低、耗时长且人工成本高,并且工作人员在处理大量的数据时容易出错。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于多阶段视觉检测融合故障预警的水表读数方法、***,能够解决上述技术问题。
(二)技术方案
为解决上述技术问题,本发明提供如下一技术方案:一种基于多阶段视觉检测融合故障预警的水表读数方法,包括以下步骤:
S1:采集水表图像,其中水表图像为字轮式水表图像;
S2:对水表图像进行计数器框的检测,以得到计数器框图像;
S3:对计数器框图像进行角点检测,以得到计数器框图像的角点位置;
S4:利用角点位置对计数器框图像进行矫正;
S5:利用目标检测网络对计数器框图像进行字符识别,以得到水表读数。
优选的,在步骤S2之前还包括:对水表图像进行预处理。
优选的,步骤S2中,在得到计数器框图像之后,进一步对计数器框图像进行边缘填充。
优选的,步骤S3还包括:对计数器框图像进行可读/不可读分类,以实现水表的故障预警。
优选的,计数器框图像包括四个角点:左上角、左下角、右上角以及右下角。
优选的,在步骤S5中,当识别到计数器框图像的同一个字轮框内出现两个字符时,分别计算两个字符的面积,当其中一个字符的面积占比超过预设阈值时则其为当前字轮框的字符读数。
优选的,在步骤S5中,当两个字符的面积占比均没有超过预设阈值时,则进一步根据后一个量程的字轮框的字符读数进行调整:如果后一个量程的字轮框的字符读数为9,则当前字轮框的字符读数为两个字符中的上方字符;如果后一个量程的字轮框的字符读数为0,则当前字轮框的字符读数为两个字符中的下方字符。
优选的,在步骤S5之后还包括:输出水表读数以及计数器框图像。
为解决上述技术问题,本发明提供如下另一技术方案:一种基于多阶段视觉检测融合故障预警的水表读数***,包括:
图像采集模块:用于采集水表图像,其中水表图像为字轮式水表图像;
计数器框检测模块:用于对水表图像进行计数器框的检测,以得到计数器框图像;
角点检测模块:用于对计数器框图像进行角点检测,以得到计数器框图像的角点位置;
图像矫正模块:用于利用角点位置对计数器框图像进行矫正;
字符识别模块:用于利用目标检测网络对计数器框图像进行字符识别,以得到水表读数。
优选的,图像采集模块具体包括控制器、远传模块以及摄像模块,控制器分别与远传模块、摄像模块连接。
(三)有益效果
与现有技术相比,本发明提供了一种基于多阶段视觉检测融合故障预警的水表读数方法、***,具备以下有益效果:(1)本发明利用目标检测网络对计数器框图像进行字符识别,实现水表的自动读数,相比于传统的人工抄表方式能够提高工作效率、减少人工成本,更好地避免由于人为因素导致水表读数出错;(2)通过对水表图像进行计数器框的检测以得到计数器框图像,即对所采集水表图像进行特征提取,使得能够更好地适应不同拍摄场景的变化,同时能够提高对于水表图像的字符识别效率;(3)通过对计数器框图像进行矫正,能够对后续的字符识别提供帮助,实现更稳定的读数。
附图说明
图1为本发明基于多阶段视觉检测融合故障预警的水表读数方法的步骤流程图;
图2为本发明基于多阶段视觉检测融合故障预警的水表读数***的原理框图;
图3为本发明改进的YOL0v7模型的网络结构图;
图4为本发明用于角点检测及故障预警的多任务网络的结构图;
图5为本发明将预测的角点进行透射变换矫正的示意图;
图6为本发明计数器框图像的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于多阶段视觉检测融合故障预警的水表读数方法,包括以下步骤:
S1:采集水表图像,其中水表图像为字轮式水表图像,一张水表图像对应一个字轮式水表,水表图像上包括有用于表示水表读数的计数器,一个计数器包括有多个不同量程的字轮框。
S2:对水表图像进行计数器框的检测,以得到计数器框图像,应理解,计数器框图像上包括有用于表示水表读数的计数器。
优选的,在步骤S2之前还包括:对水表图像进行预处理,筛选出图像质量良好,计数器清晰可见,并且尽可能覆盖不同的角度、光照条件和环境背景。进一步的,可使用图像标注工具,对采集到的水表图像进行标注,将每个计数器的位置用框标注出来,确保框紧密围绕着计数器。接着,对标注的图像进行数据增强,以扩充数据集,采用旋转、平移、缩放、翻转等操作增加数据的多样性和鲁棒性。同时还考虑使用模糊、亮度调整等操作模拟不同环境条件下的变化。最后,可按照7∶2∶1的比例将数据集划分为训练集、验证集、测试集。进一步可利用上述数据集对计数器框检测模型进行训练,从而利用训练得到的计数器框检测模型对水表图像进行计数器框的检测。
优选的,本发明采用的计数器框检测模型为改进的YOLOv7模型,如图3所示,该模型使用了E-ELAN(扩展的高效层聚合网络)、基于连接的模型缩放以及重参数化,以在检测效率和精度之间取得有利的平衡。上述改进的YOLOv7模型在输入的预处理部分采用了Mosaic和混合数据增强技术,并将图像统一缩放到640x640的尺寸输入主干网络。主干网络由CBS、E-ELAN和MP1三个主要组件组成,并在主干网络和头网络中引入CBAM注意力机制,捕捉空间和通道相关性,提升网络特征提取能力,避免其他背景特征的干扰;回归预测采用IoU Loss,分类预测采用BCE Loss对网络进行训练,生成相应的权重文件,其中IoU为预测框和真实框的交并比,BCE Loss(Binary Cross-Entropy Loss)损失函数如下式所示:
BCE Loss=-(y_true*log(y_pred)+(1-y_true)*log(1-y_Pred))
在上式中,y_true表示真实的标签,y_pred表示模型预测的输出,log表示自然对数函数,*表示元素之间的逐元素乘法。
应理解,水表图像经过上述步骤S2之后可以识别检测出水表的计数器在图片中准确的位置坐标,以在水表图像中裁剪出计数器的图像:计数器框图像。优选的,步骤S2中,在得到计数器框图像之后,进一步对计数器框图像进行边缘填充:采用零填充的方式将计数器框图像的边框扩大10%,方便后续进行角点检测。
S3:对计数器框图像进行角点检测,以得到计数器框图像的角点位置。
具体的,计数器框图像包括四个角点:左上角、左下角、右上角以及右下角。
此外,步骤S3还包括:对计数器框图像进行可读/不可读分类,以实现水表的故障预警。
具体的,在步骤S3中,可通过一个多任务网络,分析计数器框图像并预测出9个输出:分别为八个浮点数以表示四个角点位置,以及一个包含两个浮点数的数组以表示计数器框可读/不可读的概率,多任务网络结构如图4所示,在图4中,conv表示卷积,max即maxpooling表示最大池化。
S4:利用角点位置对计数器框图像进行矫正。
在经过上述步骤S3预测出角点位置后,通过计算坐标和透射变换可以对计数器框图像进行矫正:首先,确定角点坐标后,将计数器框图像进行矫正前的四个角点称为p1…p4(即上述子步骤S32所得到的角点位置),将计数器框图像进行矫正后的四个角点称为p′1…p′4,每个角点具有相应的x和y坐标即角点位置,如图5所示,将预测的角点映射到矫正之后的坐标空间,会假设矫正后的图像具有固定的大小,p′1和p′2分别位于矫正后图像的左上角和右上角的角点位置,即可以提前计算出p′1和p′2的值:比如,对于大小为320x320的图像,假设矫正后图像的大小不会发生变化,则p′1和p′2的位置则是(10,10)和(310,10),这里预留一定数量的像素点目的是为了避免在变换时图像边缘的信息丢失影响矫正结果;进一步的,考虑宽高的比例可以通过以下公式确定p′3的坐标:
x′3=x′1
上式中,[pm,pn]dist是pm,pn之间的欧氏距离,Wrct表示矫正后的计数器框图像的宽度,即p′1和p′2在x轴上的距离。最后通过x′4=x′2和y′4=y′3来确定p′4
此外,对计数器框图像进行可读/不可读分类:可具体通过softmax激活函数预测出由两个浮点数组成的数组,表示可读或不可读水表的相对概率大小,两个浮点数的和为1;通过为概率设置阈值,实现水表的故障预警,例如不可读的概率超过预设的阈值,则计数器框图像对应为不可读,以筛选出不可读的计数器框图像避免进入后续的字符识别阶段,从而节省识别时间。具体的,在数据集图像样本中除了上述角点的坐标外,还添加了可读、不可读的分类标签,以区分正常的水表图像以及受遮挡等不可读的水表图像,上述的多任务网络在训练过程中学习到不同计数器框样本的特征和模式,可以给出每个计数器框样本的可读和不可读的概率值;在图4的多任务网络中,对于每个输出有两个非共享的全连接层,在第二个非共享全连接层中,有两个单元用于预测计数器框的可读性,并使用softmax激活函数将预测结果的输出进行归一化,将其转化为(0,1)之间的数值作为可读/不可读的概率分布,并且两个数值之和为1,确保概率之和为1。对于每一个计数器框图像样本,如果可读性单元输出概率较高,则表示多任务网络认为计数器框是可读的,反之,则表示计数器框是不可读的,从而实现计数器框可读/不可读的分类任务。
S5:利用目标检测网络对计数器框图像进行字符识别,以得到水表读数。
优选的,步骤S5具体可采用与上述步骤S2同样的改进的YOLOv7模型进行字符识别,识别检测的对象为从0到9的字轮式数字字符。
此外,在步骤S5中,当识别到计数器框图像的同一个字轮框内出现两个字符时,即同一个字轮框内上下方各有一个字符(两个不完整的字符,也就是出现字轮式字符常见的半字符问题),采用动态优化策略调整识别字符读数:此时分别计算两个字符的面积(具体为两个字符各自的边界框面积),当其中一个字符在字轮框内的面积占比超过预设阈值时则其为当前字轮框的字符读数:例如图6所示,从左往右数第5个字轮框内出现两个字符:上方字符9、下方字符0,此时假设下方字符0在第5个字轮框内的面积占比超过预设阈值70%,则当前字轮框(第5个字轮框)的字符读数对应为0。
此外,在步骤S5中,当两个字符在字轮框内的面积占比均没有超过预设阈值(例如上方字符在字轮框内的面积占比为40%,下方字符在字轮框内的面积占比为60%,而预设阈值为70%)时,则进一步根据后一个量程的字轮框的字符读数进行调整:如果后一个量程的字轮框的字符读数为9,则当前字轮框的字符读数为两个字符中的上方字符;如果后一个量程的字轮框的字符读数为0,则当前字轮框的字符读数为两个字符中的下方字符。例如图6所示,从左往右数第4个字轮框内出现两个字符:上方字符5、下方字符6,而后一个量程的字轮框(即上述第5个字轮框)的字符读数为0,则当前字轮框(第4个字轮框)的字符读数为两个字符中的下方字符:6。
优选的,在步骤S5之后还包括:输出水表读数以及计数器框图像。
本发明还提供一种基于多阶段视觉检测融合故障预警的水表读数***,包括:
图像采集模块11:用于采集水表图像,其中水表图像为字轮式水表图像。优选的,图像采集模块11具体包括控制器、远传模块以及摄像模块,控制器分别与远传模块、摄像模块连接,应理解,图像采集模块11安装于水表端,控制器控制远传模块将摄像模块所采集的水表图像上传至计数器框检测模块;为了在功耗、成本以及图像质量上取得平衡,可使用低分辨率的摄像模块和采用图像压缩算法,采集水表图像进行压缩和上传。
计数器框检测模块12:用于对水表图像进行计数器框的检测,以得到计数器框图像;
角点检测模块13:用于对计数器框图像进行角点检测,以得到计数器框图像的角点位置;
图像矫正模块14:用于利用角点位置对计数器框图像进行矫正;
字符识别模块15:用于利用目标检测网络对计数器框图像进行字符识别,以得到水表读数。
与现有技术相比,本发明提供了一种基于多阶段视觉检测融合故障预警的水表读数方法、***,具备以下有益效果:(1)本发明利用目标检测网络对计数器框图像进行字符识别,实现水表的自动读数,相比于传统的人工抄表方式能够提高工作效率、减少人工成本,更好地避免由于人为因素导致水表读数出错;(2)通过对水表图像进行计数器框的检测以得到计数器框图像,即对所采集水表图像进行特征提取,使得能够更好地适应不同拍摄场景的变化,同时能够提高对于水表图像的字符识别效率;(3)通过多任务网络完成角点检测和故障预警任务,能够对旋转、畸变表盘进行矫正,能够对后续的字符识别提供帮助,实现更稳定的读数,且能筛选出不可读的水表避免进入字符检测阶段,从而节省识别时间;(4)相比于使用手机、抄表机进行拍照识别水表读数,本发明通过简单的控制器、摄像模块和远传模块可以完成定时拍照上传,且安装不需要断水,安装成本低,更适合城市地区推广使用;(5)本发明可部署于云端服务器使用,相比于部署在表端控制器,可以运用更多的算力,且表端控制器功耗可以更低,更耐用;(6)本发明采用动态优化策略改善字轮式水表字符识别容易出现的半字符识别问题,从而保证水表读数的准确性。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于,包括以下步骤:
S1:采集水表图像,其中所述水表图像为字轮式水表图像;
S2:对所述水表图像进行计数器框的检测,以得到计数器框图像;
S3:对所述计数器框图像进行角点检测,以得到所述计数器框图像的角点位置;
S4:利用所述角点位置对所述计数器框图像进行矫正;
S5:利用目标检测网络对所述计数器框图像进行字符识别,以得到水表读数。
2.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:在所述步骤S2之前还包括:对所述水表图像进行预处理。
3.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:所述步骤S2中,在得到所述计数器框图像之后,进一步对所述计数器框图像进行边缘填充。
4.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:所述步骤S3还包括:对所述计数器框图像进行可读/不可读分类,以实现水表的故障预警。
5.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:所述计数器框图像包括四个角点:左上角、左下角、右上角以及右下角。
6.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:在所述步骤S5中,当识别到所述计数器框图像的同一个字轮框内出现两个字符时,分别计算两个字符的面积,当其中一个字符的面积占比超过预设阈值时则其为当前字轮框的字符读数。
7.根据权利要求6所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:在所述步骤S5中,当所述两个字符的面积占比均没有超过预设阈值时,则进一步根据后一个量程的字轮框的字符读数进行调整:如果后一个量程的字轮框的字符读数为9,则所述当前字轮框的字符读数为所述两个字符中的上方字符;如果后一个量程的字轮框的字符读数为0,则所述当前字轮框的字符读数为所述两个字符中的下方字符。
8.根据权利要求1所述的基于多阶段视觉检测融合故障预警的水表读数方法,其特征在于:在所述步骤S5之后还包括:输出所述水表读数以及所述计数器框图像。
9.一种基于多阶段视觉检测融合故障预警的水表读数***,其特征在于,包括:
图像采集模块:用于采集水表图像,其中所述水表图像为字轮式水表图像;
计数器框检测模块:用于对所述水表图像进行计数器框的检测,以得到计数器框图像;
角点检测模块:用于对所述计数器框图像进行角点检测,以得到所述计数器框图像的角点位置;
图像矫正模块:用于利用所述角点位置对所述计数器框图像进行矫正;
字符识别模块:用于利用目标检测网络对所述计数器框图像进行字符识别,以得到水表读数。
10.根据权利要求9所述的基于多阶段视觉检测融合故障预警的水表读数***,其特征在于:所述图像采集模块具体包括控制器、远传模块以及摄像模块,所述控制器分别与所述远传模块、所述摄像模块连接。
CN202311637194.1A 2023-12-01 2023-12-01 基于多阶段视觉检测融合故障预警的水表读数方法、*** Pending CN117523573A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311637194.1A CN117523573A (zh) 2023-12-01 2023-12-01 基于多阶段视觉检测融合故障预警的水表读数方法、***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311637194.1A CN117523573A (zh) 2023-12-01 2023-12-01 基于多阶段视觉检测融合故障预警的水表读数方法、***

Publications (1)

Publication Number Publication Date
CN117523573A true CN117523573A (zh) 2024-02-06

Family

ID=89760713

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311637194.1A Pending CN117523573A (zh) 2023-12-01 2023-12-01 基于多阶段视觉检测融合故障预警的水表读数方法、***

Country Status (1)

Country Link
CN (1) CN117523573A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576677A (zh) * 2023-12-01 2024-02-20 广州柏诚智能科技有限公司 一种水表读数识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117576677A (zh) * 2023-12-01 2024-02-20 广州柏诚智能科技有限公司 一种水表读数识别方法

Similar Documents

Publication Publication Date Title
CN111950330B (zh) 一种基于目标检测的指针式仪表示数检测方法
CN109460753B (zh) 一种检测水上漂浮物的方法
CN109145830B (zh) 一种智能水尺识别方法
CN101751572A (zh) 一种图案检测方法、装置、设备及***
CN117523573A (zh) 基于多阶段视觉检测融合故障预警的水表读数方法、***
CN115719338A (zh) 一种基于改进YOLOv5的PCB板表面缺陷检测方法
CN111914767B (zh) 一种基于多源遥感数据的散乱污企业检测方法及***
CN112802016A (zh) 基于深度学习的实时布匹缺陷检测方法及***
CN112906689B (zh) 一种基于缺陷检测与分割深度卷积神经网络的图像检测方法
CN116863274A (zh) 一种基于半监督学习的钢板表面缺陷检测方法及***
CN113255590A (zh) 一种缺陷检测模型训练方法、缺陷检测方法、装置及***
CN115775236A (zh) 基于多尺度特征融合的表面微小缺陷视觉检测方法及***
CN114022774A (zh) 一种基于雷达影像的海洋中尺度涡监测方法和装置
CN115409814A (zh) 一种基于融合图像的光伏组件热斑检测方法及***
CN114627461A (zh) 一种基于人工智能高精度识别水尺数据的方法及***
CN113284185B (zh) 用于遥感目标检测的旋转目标检测方法
CN113628180A (zh) 一种基于语义分割网络的遥感建筑物检测方法及***
CN117496426A (zh) 基于互学习的预制梁工序识别方法及装置
CN112381794A (zh) 一种基于深度卷积生成网络的印刷缺陷检测方法
CN111627018A (zh) 一种基于双流神经网络模型的钢板表面缺陷分类方法
CN115908344A (zh) 一种基于MLCT-YOLO的Micro LED芯片缺陷检测方法
CN117576677A (zh) 一种水表读数识别方法
CN113298755B (zh) 基于时序影像的生态环境变化斑块快速检测方法和装置
CN112927222B (zh) 一种基于混合改进Faster R-CNN实现多种类光伏阵列热斑检测方法
CN115330705A (zh) 一种基于自适应加权模板ncc的蒙皮漆面缺陷检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination