CN112308054B - 基于目标检测算法的多功能数字表自动读数方法 - Google Patents
基于目标检测算法的多功能数字表自动读数方法 Download PDFInfo
- Publication number
- CN112308054B CN112308054B CN202011585525.8A CN202011585525A CN112308054B CN 112308054 B CN112308054 B CN 112308054B CN 202011585525 A CN202011585525 A CN 202011585525A CN 112308054 B CN112308054 B CN 112308054B
- Authority
- CN
- China
- Prior art keywords
- yolov4
- digital
- multifunctional digital
- switch cabinet
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/02—Recognising information on displays, dials, clocks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于目标检测算法的多功能数字表自动读数方法,包括以下步骤:步骤S1,对YOLOv4网络模型进行轻量化改进,得到YOLOv4轻量化网络模型;步骤S2,对多功能数字表图片进行采集并对多功能数字表图片上的数字进行位置标定和类别标定;步骤S3,使用经过步骤S2标定后的多功能数字表图片及其标定信息对YOLOv4轻量化网络模型进行训练,得到YOLOv4轻量化数字检测模型。所述基于目标检测算法的多功能数字表自动读数方法识别速度快、识别准确率高,稳定性好,解决了现有数字表自动读数方法容易受外界环境变化和图像成像质量好坏的影响,缺乏数字识别的稳定性、准确性的问题。
Description
技术领域
本发明涉及多功能数字表读数技术领域,尤其涉及一种基于目标检测算法的多功能数字表自动读数方法。
背景技术
多功能数字表由于其显示直观,具有多功能和高性价比等优点,在配电房中广泛使用,多功能数字表可以通过简单的设置实现不同单位电流和电压的显示,多功能数字表一般以三行四列形式显示,即可同时显示三个读数,每个读数由四个数字和小数点组装而成,每个数字和小数点都由红色发光二极管表示(如图1所示)。在配电房的日常巡检中,需要专业工作人员通过人眼观看并记录数字表的读数,巡检效率低,读数容易出错。
目前的数字表自动读数方法基本上都是分两步来实现的,即第一步用目标检测算法(比如Faster-rcnn、SSD或者YOLO等)确定整个数字表位置或者表盘中数字显示区域的位置;第二步结合基本的图像处理算法在第一步的基础上实现单个数字提取分割,最后通过模板匹配或者分类器实现数字识别,或者在第一步的基础上用文本识别的方法实现数字的识别。这些方法在第二步中均以传统的图像算法来实现数字的识别,容易受外界环境变化和图像成像质量好坏的影响,缺乏数字识别的稳定性、准确性,不能满足巡检机器人的运动特性和识别精度要求。
发明内容
针对背景技术提出的问题,本发明的目的在于提出一种基于目标检测算法的多功能数字表自动读数方法,识别速度快、识别准确率高,稳定性好,解决了现有数字表自动读数方法容易受外界环境变化和图像成像质量好坏的影响,缺乏数字识别的稳定性、准确性的问题。
为达此目的,本发明采用以下技术方案:
一种基于目标检测算法的多功能数字表自动读数方法,包括以下步骤:
步骤S1,对YOLOv4网络模型进行轻量化改进,得到YOLOv4轻量化网络模型;
步骤S2,对多功能数字表图片进行采集并对多功能数字表图片上的数字进行位置标定和类别标定;
步骤S3,使用经过步骤S2标定后的多功能数字表图片及其标定信息对YOLOv4轻量化网络模型进行训练,得到YOLOv4轻量化数字检测模型;
步骤S4,使用步骤S3得到的YOLOv4轻量化数字检测模型对多功能数字表图片进行数字检测识别,返回检测到的每个数字的信息;
其中,所述多功能数字表图片由YOLOv4开关柜器件检测模型对巡检机器人拍摄的图片进行检测得到;
步骤S5,根据返回的每个数字的信息对每个数字进行排序重组,得到正确的数字排列顺序,获得正确的读数;
步骤S6,根据预先设置的小数位数对读数进行小数点添加,得到最终读数。
更进一步说明,所述YOLOv4开关柜器件检测模型为经过训练的检测模型,所述YOLOv4开关柜器件检测模型的训练包括以下步骤:
(1)建立训练集:将巡检机器人多次巡检拍摄的多张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立得到训练集;
(2)建立测试集:将没有参与训练的多张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立得到测试集;
(3)在训练集上训练原始YOLOv4目标检测网络模型,迭代训练后得到YOLOv4开关柜器件检测模型;
(4)在测试集上测试YOLOv4开关柜器件检测模型的检测性能。
更进一步说明,所述步骤S1中,具体包括以下步骤:
步骤S10,采用轻量化网络结构MobileNetV3替换原YOLOv4网络模型中的CSPDarknet53网络结构并作为骨干网络;
步骤S11,删除原YOLOv4网络模型中的后面两个Yolov3 head结构,只保留一个Yolov3 head结构,并减少锚点数目;
步骤S12,将网络输入从416*416缩小为192*256。
更进一步说明,所述步骤S2中,具体包括以下步骤:
步骤S20,从巡检机器人在巡检过程中拍摄的大量开关柜图片中筛选出含有多功能数字表的图片,并人工框选出多功能数字表区域的位置;
步骤S21,根据人工框选的位置矩形框从开关柜图片中裁剪出单个多功能表数字表图片并保存;
步骤S22,用标注软件对保存的每张多功能数字表图片上的数字进行位置标定和类别标定,将标注信息保存在XML文件中。
更进一步说明,所述步骤S3具体为:使用经过所述步骤S2标定后的多功能数字表图片和对应的XML文件对YOLOv4轻量化网络模型进行训练,迭代训练后得到YOLOv4轻量化数字检测模型。
更进一步说明,所述步骤S4中,具体包括以下步骤:
步骤S40,用YOLOv4开关柜器件检测模型对巡检机器人拍摄的图片进行检测得出多功能数字表,并根据检测矩形框从开关柜图片中裁剪得到多功能数字表图片;
步骤S41,将裁剪得到的多功能数字表图片输入到YOLOv4轻量化数字检测模型中进行数字检测,返回每个数字的位置矩形框信息和类别信息。
更进一步说明,所述步骤S5中,具体包括以下步骤:
步骤S50,根据YOLOv4轻量化数字检测模型返回每个数字的位置矩形框信息和类别信息,按照位置矩形框的左上顶点纵坐标的大小对每个数字进行排序,将识别到的数字分成上、中、下三行;
步骤S51,对属于同一行的数字检测结果根据其位置矩形框左上顶点横坐标的大小从左到右进行排序,完成排序重组,得到正确的数字排列顺序,获得正确的读数。
更进一步说明,所述步骤S6中,具体包括以下步骤:
步骤S60,在巡检机器人正式对配电房开关柜巡检之前,工作人员通过控制机器人运动的Qt上位机界面进行机器人运动路径的踩点规划;
步骤S61,在巡检机器人运动踩点时,若该拍摄点有多功能数字表,即在Qt界面的小数点添加栏里输入小数点位数。
与现有技术相比,本发明具有以下有益效果:
1、通过对YOLOv4原网络模型进行了轻量化改进,降低了算法的硬件运行成本,提升了数字检测识别速度,每个数字表识别时间只要6.2ms。基于Darknet框架训练,可以方便支持Windows和Linux不同***部署,具有识别速度快,部署方便的特点;
2、通过使用具有强大学***均数字识别准确率在99.7%,具有更高的识别准确率,且稳定性好,应用于配电房巡检机器人***中,具有高效、准确、稳定的识别特点;
3、通过人工框选出多功能数字表区域,然后对保存的每张多功能数字表图片上的数字进行位置标定和类别标定,标注准确率高,确保后面对YOLOv4轻量化网络模型进行训练的准确率,从而保证YOLOv4轻量化数字检测模型的识别准确率。
附图说明
附图对本发明做进一步说明,但附图中的内容不构成对本发明的任何限制。
图1是本发明一个实施例的多功能数字表的示意图;
图2是本发明一个实施例的基于目标检测算法的多功能数字表自动读数方法的流程图;
图3是本发明一个实施例的开关柜图片的示意图;
图4是本发明一个实施例从开关柜图片中裁剪出的部分器件的示意图,其中(a)为温湿度控制器、(b)为电压转换开关、(c)为多功能数字表、(d)为跳闸连接片、(e)为带电指示、(f)为接地故障指示;
图5是本发明一个实施例由YOLOv4轻量化数字检测模型得到的原始检测结果的示意图;
图6是本发明一个实施例经排序重组后的顺序读数结果的示意图;
图7是本发明一个实施例经排序重组后的矩形框内数字识别结果的示意图。
具体实施方式
一种基于目标检测算法的多功能数字表自动读数方法,包括以下步骤:
步骤S1,对YOLOv4网络模型进行轻量化改进,得到YOLOv4轻量化网络模型;
步骤S2,对多功能数字表图片进行采集并对多功能数字表图片上的数字进行位置标定和类别标定;
步骤S3,使用经过步骤S2标定后的多功能数字表图片及其标定信息对YOLOv4轻量化网络模型进行训练,得到YOLOv4轻量化数字检测模型;
步骤S4,使用步骤S3得到的YOLOv4轻量化数字检测模型对多功能数字表图片进行数字检测识别,返回检测到的每个数字的信息;
其中,所述多功能数字表图片由YOLOv4开关柜器件检测模型对巡检机器人拍摄的图片进行检测得到;
步骤S5,根据返回的每个数字的信息对每个数字进行排序重组,得到正确的数字排列顺序,获得正确的读数;
步骤S6,根据预先设置的小数位数对读数进行小数点添加,得到最终读数。
具体地,本基于目标检测算法的多功能数字表自动读数方法应用于配电房巡检机器人***中。
本方法具体分两步实现多功能数字表的自动读数,即先用YOLOv4开关柜器件检测模型对巡检机器人拍摄的柜面图片进行检测得到多功能数字表图片,然后采用经过轻量化改进的YOLOv4轻量化数字检测模型直接实现对数字表中每个数字的检测识别;
本方法通过对YOLOv4原网络模型进行了轻量化改进,降低了算法的硬件运行成本,提升了数字检测识别速度,每个数字表识别时间只要6.2ms。基于Darknet框架训练,可以方便支持Windows和Linux不同***部署,具有识别速度快,部署方便的特点;
此外,通过使用具有强大学***均数字识别准确率在99.7%,具有更高的识别准确率,且稳定性好,应用于配电房巡检机器人***中,具有高效、准确、稳定的识别特点。
更进一步说明,所述YOLOv4开关柜器件检测模型为经过训练的检测模型,所述YOLOv4开关柜器件检测模型的训练包括以下步骤:
(1)建立训练集:将巡检机器人多次巡检拍摄的多张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立得到训练集;
(2)建立测试集:将没有参与训练的多张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立得到测试集;
(3)在训练集上训练原始YOLOv4目标检测网络模型,迭代训练后得到YOLOv4开关柜器件检测模型;
(4)在测试集上测试YOLOv4开关柜器件检测模型的检测性能。
由于巡检机器人在不同巡检点拍摄的开关柜图片中会存在多种仪表器件,如图3所示,开关柜图片中除了有多功能数字外,还有指示灯、大开关和温湿度控制器等器件,本方法先训练原始YOLOv4目标检测网络模型,得到YOLOv4开关柜器件检测模型,然后再用YOLOv4开关柜器件检测模型(Object_Detector)检测出开关柜图片上的多功能数字表和其他机器,得出每个器件的位置框和器件的类型,然后根据每个器件的位置框从开关柜图片中裁剪出该器件,如图4所示,并根据该器件的类型调用对应的接口功能进行工作状态的识别,检测得到多功能数字表图片,检测准确率高,检测效率高。
更进一步说明,所述步骤S1中,具体包括以下步骤:
步骤S10,采用轻量化网络结构MobileNetV3替换原YOLOv4网络模型中的CSPDarknet53网络结构并作为骨干网络;
步骤S11,删除原YOLOv4网络模型中的后面两个Yolov3 head结构,只保留一个Yolov3 head结构,并减少锚点数目;
步骤S12,将网络输入从416*416缩小为192*256。
通过对原YOLOv4网络模型进行轻量化改进,能够有效减少模型计算量,降低了算法的硬件运行成本,在保证数字检测识别准确率的同时,能够有效提升数字检测识别速度,从而提高巡检机器人的工作效率。
更进一步说明,所述步骤S2中,具体包括以下步骤:
步骤S20,从巡检机器人在巡检过程中拍摄的大量开关柜图片中筛选出含有多功能数字表的图片,并人工框选出多功能数字表区域的位置;
步骤S21,根据人工框选的位置矩形框从开关柜图片中裁剪出单个多功能表数字表图片并保存;
步骤S22,用标注软件对保存的每张多功能数字表图片上的数字进行位置标定和类别标定,将标注信息保存在XML文件中。
通过人工框选出多功能数字表区域,然后对保存的每张多功能数字表图片上的数字进行位置标定和类别标定,标注准确率高,确保后面对YOLOv4轻量化网络模型进行训练的准确率,从而保证YOLOv4轻量化数字检测模型的识别准确率。
更进一步说明,所述步骤S3具体为:使用经过所述步骤S2标定后的多功能数字表图片和对应的XML文件对YOLOv4轻量化网络模型进行训练,迭代训练后得到YOLOv4轻量化数字检测模型。
通过使用经过所述步骤S2标定后的多功能数字表图片和对应的XML文件对YOLOv4轻量化网络模型进行训练,得到的YOLOv4轻量化数字检测模型能够对多功能数字表中的每个数字的位置和类别进行识别,识别准确率高,稳定性好,不易受外界环境变化和图像成像质量好坏的影响。
更进一步说明,所述步骤S4中,具体包括以下步骤:
步骤S40,用YOLOv4开关柜器件检测模型对巡检机器人拍摄的图片进行检测得出多功能数字表,并根据检测矩形框从开关柜图片中裁剪得到多功能数字表图片;
步骤S41,将裁剪得到的多功能数字表图片输入到YOLOv4轻量化数字检测模型中进行数字检测,返回每个数字的位置矩形框信息和类别信息。
通过将裁剪得到的多功能数字表图片输入到YOLOv4轻量化数字检测模型中进行数字检测,检测返回每个数字的位置矩形框信息和类别信息的准确率高,且方便后面根据矩形框信息的结果进行排序重组,排序准确率高。
更进一步说明,所述步骤S5中,具体包括以下步骤:
步骤S50,根据YOLOv4轻量化数字检测模型返回每个数字的位置矩形框信息和类别信息,按照位置矩形框的左上顶点纵坐标的大小对每个数字进行排序,将识别到的数字分成上、中、下三行;
步骤S51,对属于同一行的数字检测结果根据其位置矩形框左上顶点横坐标的大小从左到右进行排序,完成排序重组,得到正确的数字排列顺序,获得正确的读数。
按照位置矩形框的左上顶点纵坐标的大小对每个数字进行排序,并对属于同一行的数字检测结果根据其位置矩形框左上顶点横坐标的大小从左到右进行排序,完成排序重组,排序重组方法简单,排序效率高。
更进一步说明,所述步骤S6中,具体包括以下步骤:
步骤S60,在巡检机器人正式对配电房开关柜巡检之前,工作人员通过控制机器人运动的Qt上位机界面进行机器人运动路径的踩点规划;
步骤S61,在巡检机器人运动踩点时,若该拍摄点有多功能数字表,即在Qt界面的小数点添加栏里输入小数点位数。
经过所述步骤S5进行排序重组后得到的读数不含小数点,由于机器人摄像头离开关柜比较远,加之机器人的运动特性和多功能数字表的显示特性,通过图像处理算法确定多功能数字表中每一行读数的小数点位置难度很大,导致准确性和稳定性很低,导致读数存在十倍或者千倍的巨大差距,本方法对多开关柜上每一个多功能数字的小数位数进行人工确定,根据人工设置的小数位数对读数进行小数点添加,得到数字表最终读数,使得获得的最终读数的准确率高,稳定性好。
下面详细描述本发明的实施方式,实施方式的示例在附图中示出,其中,相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
如图2所示,一种基于目标检测算法的多功能数字表自动读数方法,包括以下步骤:
步骤S1,对YOLOv4网络模型进行轻量化改进,得到YOLOv4轻量化网络模型,具体包括以下步骤:
步骤S10,采用轻量化网络结构MobileNetV3替换原YOLOv4网络模型中的CSPDarknet53网络结构并作为骨干网络;
步骤S11,删除原YOLOv4网络模型中的后面两个Yolov3 head结构,只保留一个Yolov3 head结构,并将锚点数目 (anchors)由18个减少到10个;
步骤S12,将网络输入从416*416缩小为192*256。
步骤S2,对多功能数字表图片进行采集并对多功能数字表图片上的数字进行位置标定和类别标定,具体包括以下步骤:
步骤S20,从巡检机器人在巡检过程中拍摄的大量开关柜图片中筛选出含有多功能数字表的图片,并人工框选出多功能数字表区域的位置;
步骤S21,根据人工框选的位置矩形框从开关柜图片中裁剪出6000张单个多功能表数字表图片,并保存到本地磁盘;
步骤S22,用标注软件(具体采用LabelImage标注软件)对保存的每张多功能数字表图片上的数字进行位置标定和类别标定,将标注信息保存在XML文件中。
步骤S3,使用经过所述步骤S2标定后的6000张多功能数字表图片和对应的XML文件对YOLOv4轻量化网络模型进行训练,迭代5万次后训练得到YOLOv4轻量化数字检测模型(Number_detector);
步骤S4,使用步骤S3得到的YOLOv4轻量化数字检测模型(Number_detector)对多功能数字表图片进行数字检测识别,返回检测到的每个数字的信息,具体包括以下步骤:
步骤S40,用YOLOv4开关柜器件检测模型(Object_Detector)对巡检机器人拍摄的图片进行检测得出多功能数字表,并根据检测矩形框从开关柜图片中裁剪得到多功能数字表图片;
步骤S41,将裁剪得到的多功能数字表图片输入到YOLOv4轻量化数字检测模型中进行数字检测,返回每个数字的位置矩形框信息和类别信息;
具体地,位置矩形框信息为(x,y,w,h),其中,x表示左顶点横坐标, y表示左顶点纵坐标,w表示矩形宽的宽, h表示矩形框的高,类别信息为0,1,2,3,4,5,6,7,8,9中的某一个数字;
其中,所述多功能数字表图片由YOLOv4开关柜器件检测模型(Object_Detector)对巡检机器人拍摄的图片进行检测得到,YOLOv4开关柜器件检测模型(Object_Detector)为经过训练的检测模型,YOLOv4开关柜器件检测模型的训练包括以下步骤:
(1)建立训练集:将巡检机器人多次巡检拍摄的5000张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立一个由5000张图片和5000个XML文件组成的训练集;
(2)建立测试集:将没有参与训练的1000张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立一个由1000张图片和1000个XML文件组成的测试集;
(3)在训练集上训练原始YOLOv4目标检测网络模型,迭代训练48000次后得到YOLOv4开关柜器件检测模型(Object_Detector);
(4)在测试集上测试YOLOv4开关柜器件检测模型的检测性能。
由于巡检机器人在不同巡检点拍摄的开关柜图片中会存在多种仪表器件,如图3所示,开关柜图片中除了有多功能数字外,还有指示灯、大开关和温湿度控制器等器件,本方法先训练原始YOLOv4目标检测网络模型,得到YOLOv4开关柜器件检测模型,然后再用YOLOv4开关柜器件检测模型(Object_Detector)检测出开关柜图片上的多功能数字表和其他机器,得出每个器件的位置框和器件的类型,然后根据每个器件的位置框从开关柜图片中裁剪出该器件,如图4所示,并根据该器件的类型调用对应的接口功能进行工作状态的识别,检测得到多功能数字表图片,检测准确率高,检测效率高。
步骤S5,根据返回的每个数字的信息对每个数字进行排序重组,得到正确的数字排列顺序,获得正确的读数,具体包括以下步骤:
步骤S50,根据YOLOv4轻量化数字检测模型返回每个数字的位置矩形框信息和类别信息,按照位置矩形框的左上顶点纵坐标的大小对每个数字进行排序,将识别到的数字分成上、中、下三行;
具体地,YOLOv4轻量化数字检测模型对多功能数字表检测后会返回每个数字的位置矩形框信息和类别信息,可以表示为{(x1,y1,w1,h1,lable1,score1), (x2,y2,w2,h2,lable2,score2),……,(x12,y12,w12,h12,lable12,score12)},其中(x1,y1,w1,h1,lable1,score1)表示第一个被检测出来的数字的位置矩形框和类别信息,x1和y1分别表示位置矩形框左上角顶点的横坐标和纵坐标,w1和h1分别表示位置矩形框的宽和高,lable1表示该数字的类别,score1表示该数字属于某个类别的概率值,(x2,y2,w2,h2,lable2,score2)表示第二个被检测数字的矩形框和类别信息,依此类推,一共有12个被检测出的数字;
更进一步说明,YOLOv4轻量化数字检测模型对多功能数字表图片上的12个数字的检测顺序是随机的,而不是按照多功能数字表正确的数字显示顺序(读数分为上、中、下三行,每一行的4个数字从左往右依次排列),如图5所示,图5为由YOLOv4轻量化数字检测模型得到的原始检测结果的示意图,矩形框表示YOLOv4轻量化数字检测模型针对数字表中每个数字检测到的位置矩形框,矩形框左顶点的数字表示YOLOv4轻量化数字检测模型在检测12个数字时的先后顺序,比如矩形框左顶点的数字数字0表示最后一行读数的第3个数字3是第一个被检测到的;
更进一步说明,按照位置矩形框的左上顶点纵坐标的大小对每个数字进行排序,将识别到的数字分成上、中、下三行,具体为根据12个矩形框左上顶点纵坐标y的大小对每个数字的检测结果(x,y,w,h,lable,score)进行排序。y值从小变大,12个数字的检测结果也按y值从小到大的顺序进行位置重新排序,得到12个升序的数字检测结果:
new_result={R1,R2,R3,R4,R5,R6,R7,R8,R9,R10,R11,R12};
其中R1=(x1,y1,w1,h1,lable1,score1),由于属于同一行的4个数字位置框的y值大小相差很小,所以直接将new_result均分成3部分就能得到数字表中读数对应的上、中、下三行,上行包含R1,R2,R3和R4四个数字检测结果,中行包含R5,R6,R7和R8,下行包含R9,R10,R11和R12。
步骤S51,对属于同一行的数字检测结果根据其位置矩形框左上顶点横坐标的大小从左到右进行排序,完成排序重组,得到正确的数字排列顺序,获得正确的读数。
更进一步说明,具体为对属于同一行的4个数字检测结果根据其位置矩形框左上顶点横坐标x值的大小从左到右进行排序,比如对于属于第一行的4个数字检测结果first_line=(R1,R2,R3,R4),先对R1,R2,R3和R4中的x值从小到大进行排序,然后R1,R2,R3和R4也根据其x值的排列顺序进行位置调整,从而完成4个数字检测结果的从左到右排序。
经过步骤S50和S51后,数字检测结果完成了排序重组,如图6所示,数字表读数被成功分成了三行,每一行由4个数字组成,分别用序号0,1,2,3(矩形框左上角数字)表示每个数字的位置,如图7所示,矩形框左上角的数字表示该矩形框内数字的识别结果。
步骤S6,根据预先设置的小数位数对读数进行小数点添加,得到最终读数。
更进一步说明,经过步骤S5重新排序后得到的读数只是含有4位数的整数读数,比如1430、1431和1430,但是多功能表真正的读数是14.30、14.31和14.30,由于机器人摄像头离开关柜比较远,加之机器人的运动特性和多功能数字表的显示特性,通过图像处理算法确定多功能数字表每一行读数的小数点位置难度很大,导致准确性和稳定性很低,导致读数存在十倍或者千倍的巨大差距。所以本方法多开关柜上每一个多功能数字的小数位数进行人工确定,具体包括以下步骤:
步骤S60,在巡检机器人正式对配电房开关柜巡检之前,工作人员通过控制机器人运动的Qt上位机界面进行机器人运动路径的踩点规划,即控制巡检机器人对开关柜进行有先后顺序的拍照识别;
步骤S61,在巡检机器人运动踩点时,若该拍摄点有多功能数字表,即在Qt界面的小数点添加栏里输入小数点位数,比如该拍摄点拍摄的图片中有3个多功能数字表,每个表的读数都含有2位小数,就输入“2,2,2”,如果该拍摄点拍摄的3个多功能表中的前两个表的读数含有3位小数,最后一个表读数含有2位小数,就输入“3,3,2”。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (3)
1.一种基于目标检测算法的多功能数字表自动读数方法,其特征在于,包括以下步骤:
步骤S1,对YOLOv4网络模型进行轻量化改进,得到YOLOv4轻量化网络模型,具体包括以下步骤:
步骤S10,采用轻量化网络结构MobileNetV3替换原YOLOv4网络模型中的CSPDarknet53网络结构并作为骨干网络;
步骤S11,删除原YOLOv4网络模型中的后面两个Yolov3 head结构,只保留一个Yolov3head结构,并减少锚点数目;
步骤S12,将网络输入从416*416缩小为192*256;
步骤S2,对多功能数字表图片进行采集并对多功能数字表图片上的数字进行位置标定和类别标定;
所述步骤S2中,具体包括以下步骤:
步骤S20,从巡检机器人在巡检过程中拍摄的大量开关柜图片中筛选出含有多功能数字表的图片,并人工框选出多功能数字表区域的位置;
步骤S21,根据人工框选的位置矩形框从开关柜图片中裁剪出单个多功能数字表图片并保存;
步骤S22,用标注软件对保存的每张多功能数字表图片上的数字进行位置标定和类别标定,将标注信息保存在XML文件中;
步骤S3,使用经过步骤S2标定后的多功能数字表图片及其标定信息对YOLOv4轻量化网络模型进行训练,得到YOLOv4轻量化数字检测模型;
步骤S4,使用步骤S3得到的YOLOv4轻量化数字检测模型对多功能数字表图片进行数字检测识别,返回检测到的每个数字的信息,具体包括以下步骤:
步骤S40,用YOLOv4开关柜器件检测模型对巡检机器人拍摄的图片进行检测得出多功能数字表,并根据检测矩形框从开关柜图片中裁剪得到多功能数字表图片;其中,多功能数字表图片由YOLOv4开关柜器件检测模型对巡检机器人拍摄的图片进行检测得到;
步骤S41,将裁剪得到的多功能数字表图片输入到YOLOv4轻量化数字检测模型中进行数字检测,返回每个数字的位置矩形框信息和类别信息;
所述YOLOv4开关柜器件检测模型为经过训练的检测模型,所述YOLOv4开关柜器件检测模型的训练包括以下步骤:
(1)建立训练集:将巡检机器人多次巡检拍摄的多张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立得到训练集;
(2)建立测试集:将没有参与训练的多张开关柜图片用标注软件进行人工标注,将每张开关柜图片中的器件位置和器件类别信息保存在对应的XML文件中,建立得到测试集;
(3)在训练集上训练原始YOLOv4目标检测网络模型,迭代训练后得到YOLOv4开关柜器件检测模型;
(4)在测试集上测试YOLOv4开关柜器件检测模型的检测性能;
步骤S5,根据返回的每个数字的信息对每个数字进行排序重组,得到正确的数字排列顺序,获得正确的读数,具体包括以下步骤:
步骤S50,根据YOLOv4轻量化数字检测模型返回每个数字的位置矩形框信息和类别信息,按照位置矩形框的左上顶点纵坐标的大小对每个数字进行排序,将识别到的数字分成上、中、下三行;
步骤S51,对属于同一行的数字检测结果根据其位置矩形框左上顶点横坐标的大小从左到右进行排序,完成排序重组,得到正确的数字排列顺序,获得正确的读数;
步骤S6,根据预先设置的小数位数对读数进行小数点添加,得到最终读数。
2.根据权利要求1所述的基于目标检测算法的多功能数字表自动读数方法,其特征在于,所述步骤S3具体为:使用经过所述步骤S2标定后的多功能数字表图片和对应的XML文件对YOLOv4轻量化网络模型进行训练,迭代训练后得到YOLOv4轻量化数字检测模型。
3.根据权利要求1所述的基于目标检测算法的多功能数字表自动读数方法,其特征在于,所述步骤S6中,具体包括以下步骤:
步骤S60,在巡检机器人正式对配电房开关柜巡检之前,工作人员通过控制机器人运动的Qt上位机界面进行机器人运动路径的踩点规划;
步骤S61,在巡检机器人运动踩点时,若拍摄点有多功能数字表,即在Qt界面的小数点添加栏里输入小数点位数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011585525.8A CN112308054B (zh) | 2020-12-29 | 2020-12-29 | 基于目标检测算法的多功能数字表自动读数方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011585525.8A CN112308054B (zh) | 2020-12-29 | 2020-12-29 | 基于目标检测算法的多功能数字表自动读数方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112308054A CN112308054A (zh) | 2021-02-02 |
CN112308054B true CN112308054B (zh) | 2021-07-20 |
Family
ID=74487611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011585525.8A Active CN112308054B (zh) | 2020-12-29 | 2020-12-29 | 基于目标检测算法的多功能数字表自动读数方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112308054B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112560816A (zh) * | 2021-02-20 | 2021-03-26 | 北京蒙帕信创科技有限公司 | 一种基于YOLOv4的设备指示灯识别方法及*** |
CN113095127B (zh) * | 2021-03-01 | 2022-06-17 | 兰州大学 | 一种基于卫星图像的建筑震后定位与破坏状态评估方法 |
CN113065556B (zh) * | 2021-04-16 | 2024-04-02 | 西安交通大学 | 一种数字式仪表定位和数字识别方法、装置和计算机设备 |
CN112990131B (zh) * | 2021-04-27 | 2021-10-26 | 广东科凯达智能机器人有限公司 | 获取电压转换开关工作档位的方法、装置、设备及介质 |
CN113657422A (zh) * | 2021-06-25 | 2021-11-16 | 上海师范大学 | 基于自适应空间特征融合的排爆机器人危险品检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378420A (zh) * | 2019-07-19 | 2019-10-25 | Oppo广东移动通信有限公司 | 一种图像检测方法、装置及计算机可读存储介质 |
CN110837825A (zh) * | 2019-10-17 | 2020-02-25 | 天津大学 | 基于嵌入式的表计识别与读数*** |
CN111368906A (zh) * | 2020-02-29 | 2020-07-03 | 华南理工大学 | 一种基于深度学习的指针式油位计读数识别方法 |
CN211856402U (zh) * | 2020-03-13 | 2020-11-03 | 苏州鑫睿益荣信息技术有限公司 | 一种基于机器视觉的汽车仪表盘检测*** |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6250526B2 (ja) * | 2014-11-21 | 2017-12-20 | 三菱電機ビルテクノサービス株式会社 | 計量メータ読取装置及びプログラム |
WO2019223582A1 (en) * | 2018-05-24 | 2019-11-28 | Beijing Didi Infinity Technology And Development Co., Ltd. | Target detection method and system |
CN109344850A (zh) * | 2018-07-27 | 2019-02-15 | 华南理工大学 | 一种基于yolo的水表自动检测方法 |
CN110188662A (zh) * | 2019-05-28 | 2019-08-30 | 唐山海森电子股份有限公司 | 一种水表数字的ai智能识别方法 |
CN110659636B (zh) * | 2019-09-20 | 2022-05-13 | 随锐科技集团股份有限公司 | 基于深度学习的指针式仪表读数识别方法 |
CN111062282B (zh) * | 2019-12-05 | 2023-09-29 | 武汉科技大学 | 基于改进yolov3模型的变电站指针式仪表识别方法 |
CN111353502B (zh) * | 2020-02-25 | 2023-06-30 | 北京眸视科技有限公司 | 数字表识别方法、装置以及电子设备 |
CN112052826A (zh) * | 2020-09-18 | 2020-12-08 | 广州瀚信通信科技股份有限公司 | 基于YOLOv4算法的智慧执法多尺度目标检测方法、装置、***及存储介质 |
-
2020
- 2020-12-29 CN CN202011585525.8A patent/CN112308054B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378420A (zh) * | 2019-07-19 | 2019-10-25 | Oppo广东移动通信有限公司 | 一种图像检测方法、装置及计算机可读存储介质 |
CN110837825A (zh) * | 2019-10-17 | 2020-02-25 | 天津大学 | 基于嵌入式的表计识别与读数*** |
CN111368906A (zh) * | 2020-02-29 | 2020-07-03 | 华南理工大学 | 一种基于深度学习的指针式油位计读数识别方法 |
CN211856402U (zh) * | 2020-03-13 | 2020-11-03 | 苏州鑫睿益荣信息技术有限公司 | 一种基于机器视觉的汽车仪表盘检测*** |
Also Published As
Publication number | Publication date |
---|---|
CN112308054A (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112308054B (zh) | 基于目标检测算法的多功能数字表自动读数方法 | |
CN108686978B (zh) | 基于arm的水果类别和色泽的分拣方法及*** | |
CN103076589B (zh) | 一种数字万用表自动检定装置及其检定方法 | |
CN110991435A (zh) | 一种基于深度学习的快递运单关键信息定位方法和装置 | |
CN106022345B (zh) | 一种基于霍夫森林的高压隔离开关状态识别方法 | |
CN109819245B (zh) | 基于aoi平台的色度亮度数据的在线测量方法及装置 | |
CN109711377A (zh) | 标准化考场监控的单帧图像中考生定位和计数方法 | |
CN107229560A (zh) | 一种界面显示效果测试方法、图像样张获取方法及装置 | |
CN111738229B (zh) | 一种指针表盘刻度的自动读取方法 | |
CN112446437A (zh) | 一种基于机器视觉的货架商品规格识别方法 | |
CN108805825A (zh) | 一种重定位图像质量评价方法 | |
CN116256908B (zh) | 一种基于miniLED背光模组的校准方法 | |
CN111339902A (zh) | 一种数显仪表的液晶屏示数识别方法及装置 | |
CN110647941A (zh) | 基于卷积神经网络的蔬菜识别方法及设备 | |
CN105719236B (zh) | 生成完整的高分辨率植被盖度图像季节变化序列的方法 | |
CN113076730A (zh) | 一种试验报告智能管理方法、装置、***及存储介质 | |
CN101593479B (zh) | 一种航空电子显示器的测试方法 | |
CN104574455B (zh) | 图像重建方法及装置 | |
CN110941910A (zh) | 一种电网三维设计评审智能辅助方法及*** | |
CN114037993B (zh) | 变电站指针仪表读数方法、装置、存储介质以及电子设备 | |
CN105955918A (zh) | 一种实验万用仪*** | |
Tu et al. | 2D in situ method for measuring plant leaf area with camera correction and background color calibration | |
CN115922697A (zh) | 基于变电站数字孪生技术的智能化机器人自动巡检方法 | |
CN104880596A (zh) | 一种用于变电站站***调试的伏安向量无线测试方法 | |
CN110909653B (zh) | 一种室内机器人自动标定配电室屏柜的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Automatic reading method of multi-function digital meter based on target detection algorithm Effective date of registration: 20220527 Granted publication date: 20210720 Pledgee: Agricultural Bank of China Limited Shunde Daliang sub branch Pledgor: GUANGDONG KEYSTAR INTELLIGENCE ROBOT Co.,Ltd. Registration number: Y2022980006520 |