CN118097706B - 电网厂站接线图的图元检测方法、***、设备及介质 - Google Patents

电网厂站接线图的图元检测方法、***、设备及介质 Download PDF

Info

Publication number
CN118097706B
CN118097706B CN202410487385.2A CN202410487385A CN118097706B CN 118097706 B CN118097706 B CN 118097706B CN 202410487385 A CN202410487385 A CN 202410487385A CN 118097706 B CN118097706 B CN 118097706B
Authority
CN
China
Prior art keywords
network
training
generating
feature
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410487385.2A
Other languages
English (en)
Other versions
CN118097706A (zh
Inventor
李捷
冯宇
刘洪�
刘波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huayan Intelligent Technology Group Co ltd
Original Assignee
Huayan Intelligent Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huayan Intelligent Technology Group Co ltd filed Critical Huayan Intelligent Technology Group Co ltd
Priority to CN202410487385.2A priority Critical patent/CN118097706B/zh
Publication of CN118097706A publication Critical patent/CN118097706A/zh
Application granted granted Critical
Publication of CN118097706B publication Critical patent/CN118097706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种电网厂站接线图的图元检测方法、***、设备及介质。该方法包括:获取训练图片,基于训练图片的全标注框生成标注信息,对训练图片和标注信息进行格式转化,得到框标注和点标注;利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;基于优化主干网络提取训练图片中的特征图,根据特征图与点标注对PARPN网络进行训练,生成候选目标区域;根据优化主干网络、候选目标区域与框标注对识别网络进行训练,得到图元检测网络模型;获取识别数据,将识别数据输入至图元检测网络模型,生成图元检测结果。本申请设计一个专用于接线图图元的图元检测网络模型,提升了在接线图中对各个类别图元的检测和识别能力。

Description

电网厂站接线图的图元检测方法、***、设备及介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种电网厂站接线图的图元检测方法、***、设备及介质。
背景技术
接线图识别通常分为图元,文本和连接线检测和识别。***识别连线和文本时,需要基于检测出的图元框屏蔽在原图上的图元(图元置为背景色)。因此电网厂站接线图的图元检测作为接线图识别中的第一步也是最重要的一部,检测结果的好坏直接影响后续的文本和连接线检测。
通常接线图原始图片分辨大,图元在接线图中占比较极小,常用的基于深度学习的目标检测网络模型通常面临图元检测召回率(recall)低,以及检测框回归不准确的问题。在后续***识别文本和连接线时,由于文本框的漏检和回归不准确,也会进一步造成文本和连接线的漏检和误检。
发明内容
有鉴于此,本发明的目的是为了克服现有技术中的不足,提供一种电网厂站接线图的图元检测方法、***、设备及介质。
本发明提供如下技术方案:
第一方面,本公开实施例中提供了一种电网厂站接线图的图元检测方法,所述方法包括:
获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;
利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;
基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;
根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;
获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果。
进一步地,所述全标注框包括左上角横坐标、左上角纵坐标、右下角横坐标和右下角纵坐标,所述标注信息包括横坐标信息与纵坐标信息,所述基于所述训练图片的全标注框生成标注信息,包括:
基于所述左上角横坐标与所述右下角横坐标生成所述横坐标信息;
基于所述左上角纵坐标与所述右下角纵坐标生成所述纵坐标信息。
进一步地,所述主干特征提取网络为ResNet50卷积神经网络。
进一步地,所述利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络之后,还包括:
获取ImageNet数据集,并通过所述ImageNet数据集预先训练出初始化模型;
获取由所述ImageNet数据集预训练好的主干特征提取网络的模型参数,利用所述初始化模型对所述主干特征提取网络的模型参数进行初始化。
进一步地,所述根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域,包括:
根据所述特征图生成多个初始锚点框,使用softmax卷积分支网络从各所述初始锚点框中提取正例锚点框和负例锚点框,根据所述正例锚点框与所述负例锚点框生成概率分布特征矩阵;
利用回归卷积分支网络调整所述正例锚点框的偏移量,生成坐标回归特征矩阵;
根据所述点标注与所述特征图生成多个目标锚点框,基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域。
进一步地,所述根据所述点标注与所述特征图生成多个目标锚点框,包括:
基于所述训练图片的采样信息,将所述点标注投影至所述特征图上,生成多个目标点标注;
获取各所述目标点标注附近的多个目标特征点对应的锚点框,将各所述目标特征点对应的锚点框作为所述目标锚点框。
进一步地,所述基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域,包括:
基于所述坐标回归特征矩阵对各所述目标锚点框进行转化,生成多个提议框;
基于所述概率分布特征矩阵对各所述提议框按照概率从大到小进行排序,得到多个候选框;
对排序在前的预设数量个候选框进行非极大值抑制,并过滤重叠的候选框,生成多个所述候选目标区域。
第二方面,本公开实施例中提供了一种电网厂站接线图的图元检测***,所述***包括:
转化模块,用于获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;
第一训练模块,用于利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;
第二训练模块,用于基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;
第三训练模块,用于根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;
检测模块,用于获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果。
第三方面,本公开实施例中提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面中所述的电网厂站接线图的图元检测方法的步骤。
第四方面,本公开实施例中提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面中所述的电网厂站接线图的图元检测方法的步骤。
本申请的有益效果:
本申请实施例提供的电网厂站接线图的图元检测方法,方法包括:获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果。本申请结合点标注转换网络和通用深度学习目标检测网络设计了一个专用于接线图图元的图元检测网络模型,以提升在接线图中对各个类别图元的检测和识别能力。
为使本发明的上述目的、特征和优点能更明显和易懂,下文特举较佳实施例,并配合所附附图,做详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。在各个附图中,类似的构成部分采用类似的编号。
图1示出了本申请实施例提供的一种电网厂站接线图的图元检测方法的流程图;
图2示出了本申请实施例提供的另一种电网厂站接线图的图元检测方法的流程图;
图3示出了本申请实施例提供的一种PARPN网络的结构示意图;
图4示出了本申请实施例提供的一种电网厂站接线图的图元检测***的结构示意图;
图5示出了本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
实施例1
如图1所示,为本申请实施例中的一种电网厂站接线图的图元检测方法的流程图,本申请实施例提供的电网厂站接线图的图元检测方法包括以下步骤:
步骤S110,获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注。
在本实施例中,首先获取训练集中的训练图片,训练图片中的全标注框表示为,其中,/>为全标注框的左上角横坐标,/>为全标注框的左上角纵坐标,/>为全标注框的右下角横坐标,/>为全标注框的右下角纵坐标。基于左上角横坐标与右下角横坐标生成标注信息的横坐标信息/>,基于左上角纵坐标与右下角纵坐标生成标注信息的纵坐标信息/>,计算公式为:
上述方法将训练图片和标注信息转化为输入模型所需的格式,即为满足模型要求的框标注和对应的点标注。
步骤S120,利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络。
对于主干特征提取网络,本发明实施例选取ResNet50卷积神经网络,使用随机梯度下降(stochastic gradient descent,SGD)算法进行训练,得到训练后的优化主干网络。
可以理解的是,Resnet50网络中包含了49个卷积层、一个全连接层。Resnet50网络结构可以分成七个部分,第一部分不包含残差块,主要对输入进行卷积、正则化、激活函数、最大池化的计算。第二、三、四、五部分结构都包含了残差块。在Resnet50网络结构中,残差块都有三层卷积, 那网络总共有1+3×(3+4+6+3)=49个卷积层,加上最后的全连接层总共是50层,这也是Resnet50名称的由来。网络的输入为224×224×3,经过前五部分的卷积计算,输出为7×7×2048,池化层会将其转化成一个特征向量,最后分类器会对这个特征向量进行计算并输出类别概率。
进一步地,获取ImageNet数据集,并通过ImageNet数据集预先训练出初始化模型;获取由ImageNet数据集预训练好的主干特征提取网络的模型参数,利用初始化模型对主干特征提取网络的模型参数进行初始化,可以有效加速主干特征提取网络的训练过程。
步骤S130,基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域。
在本实施例中,PARPN网络(Point Annotation Region Proposal Network,点标注区域提议网络)主要功能为生成基于点标注的目标候选区域数据。
在一种可选的实施方式中,如图2所示,步骤S130还包括:
步骤S131,根据所述特征图生成多个初始锚点框,使用softmax卷积分支网络从各所述初始锚点框中提取正例锚点框和负例锚点框,根据所述正例锚点框与所述负例锚点框生成概率分布特征矩阵;
步骤S132,利用回归卷积分支网络调整所述正例锚点框的偏移量,生成坐标回归特征矩阵;
步骤S133,根据所述点标注与所述特征图生成多个目标锚点框,基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域。
具体地,如图3所示,首先根据优化主干网络输出的M×N大小的特征图上的每个特征点经由一个3×3卷积层生成k个不同大小、不同长宽比的初始锚点框(anchors),示例性的,可取k=9,缩放大小anchor scales=[8,16,32],长宽比ratios=[0.5,1,2]。
然后使用包含softmax分类器的softmax卷积分支网络(图3中的一个1×1卷积层)提取初始锚点框中的正例锚点框(positvie anchors)和负例锚点框(negative anchors),最终生成大小为M×N×2k的正/负分类的概率分布特征矩阵。利用回归卷积(bounding boxregression)分支网络(图3中的另一个1×1卷积层)调整正例锚点框的偏移量,生成大小为M×N×4k的坐标回归特征矩阵。
接着基于训练图片的采样信息,使用Proposal Layer层(提议候选框网络层)将点标注投影至M×N大小的特征图上,生成多个目标点标注,获取各目标点标注附近的n(例如8)个目标特征点对应的锚点框,将各目标特征点对应的锚点框作为Proposal Layer层的各组目标锚点框。
最后基于坐标回归特征矩阵对各目标锚点框进行转化,生成多个提议框,基于概率分布特征矩阵对各提议框按照概率从大到小进行排序,得到多个候选框。保留排序在前的预设数量preN个候选框,对排preN个候选框进行非极大值抑制,并过滤重叠的候选框,最后生成proN个候选目标区域,示例性的,本实施例取preN=600,proN=300。
上述方法只在目标区域中心点周围获取一组目标锚点框,极大减少了RPN网络训练的参数量,且只获取候选目标区域更易于提高后续提议框的回归质量,基于PARPN网络改进的图元检测网络模型在电网厂站接线图的图元检测的漏检率和框的回归质量相比于现有技术中的FasterRCNN网络有极大的改善。
步骤S140,根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型。
进一步地,根据优化主干网络、候选目标区域与框标注对识别网络进行训练,来完成目标的分类和位置定位,得到图元检测网络模型。
需要说明的是,根据训练过程中的验证结果,可以对图元检测网络模型的网络参数进行调整,以进一步提高检测的准确率。
步骤S150,获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果。
最后,获取测试集中的识别数据,使用识别数据对训练好的图元检测网络模型进行测试,生成图元检测结果,完成对图元目标的分类识别和定位。
本申请实施例提供的电网厂站接线图的图元检测方法,通过获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果。本申请结合点标注转换网络和通用深度学习目标检测网络设计了一个专用于接线图图元的图元检测网络模型,以提升在接线图中对各个类别图元的检测和识别能力。
实施例2
如图4所示,为本申请实施例中的一种电网厂站接线图的图元检测***400的结构示意图,其***包括:
转化模块410,用于获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;
第一训练模块420,用于利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;
第二训练模块430,用于基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;
第三训练模块440,用于根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;
检测模块450,用于获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果。
可选地,上述电网厂站接线图的图元检测***400还包括:
第一生成模块,用于基于所述左上角横坐标与所述右下角横坐标生成所述横坐标信息;
第二生成模块,用于基于所述左上角纵坐标与所述右下角纵坐标生成所述纵坐标信息。
可选地,上述电网厂站接线图的图元检测***400还包括:
预训练模块,用于获取ImageNet数据集,并通过所述ImageNet数据集预先训练出初始化模型;
初始化模块,用于获取由所述ImageNet数据集预训练好的主干特征提取网络的模型参数,利用所述初始化模型对所述主干特征提取网络的模型参数进行初始化。
可选地,上述电网厂站接线图的图元检测***400还包括:
提取模块,用于根据所述特征图生成多个初始锚点框,使用softmax卷积分支网络从各所述初始锚点框中提取正例锚点框和负例锚点框,根据所述正例锚点框与所述负例锚点框生成概率分布特征矩阵;
第三生成模块,用于利用回归卷积分支网络调整所述正例锚点框的偏移量,生成坐标回归特征矩阵;
第四生成模块,用于根据所述点标注与所述特征图生成多个目标锚点框,基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域。
可选地,上述电网厂站接线图的图元检测***400还包括:
投影模块,用于基于所述训练图片的采样信息,将所述点标注投影至所述特征图上,生成多个目标点标注;
获取模块,用于获取各所述目标点标注附近的多个目标特征点对应的锚点框,将各所述目标特征点对应的锚点框作为所述目标锚点框。
可选地,上述电网厂站接线图的图元检测***400还包括:
第五生成模块,用于基于所述坐标回归特征矩阵对各所述目标锚点框进行转化,生成多个提议框;
排序模块,用于基于所述概率分布特征矩阵对各所述提议框按照概率从大到小进行排序,得到多个候选框;
过滤模块,用于对排序在前的预设数量个候选框进行非极大值抑制,并过滤重叠的候选框,生成多个所述候选目标区域。
本申请实施例提供的电网厂站接线图的图元检测***,结合点标注转换网络和通用深度学习目标检测网络设计了一个专用于接线图图元的图元检测网络模型,以提升在接线图中对各个类别图元的检测和识别能力。
实施例3
本申请实施例还提供一种计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备5包括通过***总线相互通信连接存储器51、处理器52、网络接口53。需要指出的是,图中仅示出了具有存储器51、处理器52、网络接口53的计算机设备5,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D插槽兼容性测试存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器51可以是所述计算机设备5的内部存储单元,例如该计算机设备5的硬盘或内存。在另一些实施例中,所述存储器51也可以是所述计算机设备5的外部存储设备,例如该计算机设备5上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(SecureDigital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器51还可以既包括所述计算机设备5的内部存储单元也包括其外部存储设备。本实施例中,所述存储器51通常用于存储安装于所述计算机设备5的操作***和各类应用软件,例如插槽兼容性测试方法的计算机可读指令等。此外,所述存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器52在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他电网厂站接线图的图元检测芯片。该处理器52通常用于控制所述计算机设备5的总体操作。本实施例中,所述处理器52用于运行所述存储器51中存储的计算机可读指令或者处理数据,例如运行所述插槽兼容性测试方法的计算机可读指令。
所述网络接口53可包括无线网络接口或有线网络接口,该网络接口53通常用于在所述计算机设备5与其他电子设备之间建立通信连接。
本实施例中提供的计算机设备可以执行上述电网厂站接线图的图元检测方法。此处电网厂站接线图的图元检测方法可以是上述各个实施例的电网厂站接线图的图元检测方法。
实施例4
本实施例还提供一种计算机可读存储介质,计算机可读存储介质其上存储有计算机程序,计算机程序被处理器执行时实现实施例中电网厂站接线图的图元检测方法的步骤。
本实施例中,计算机可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,计算机可读存储介质可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,计算机可读存储介质也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(Smart Media Card,简称为SMC),安全数字(Secure Digital,简称为SD)卡,闪存卡(Flash Card)等。当然,计算机可读存储介质还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,计算机可读存储介质通常用于存储安装于计算机设备的操作***和各类应用软件。此外,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的各类数据。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质可以是非易失性存储介质,也可以是易失性存储介质,例如所述存储介质可以为:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种电网厂站接线图的图元检测方法,其特征在于,所述方法包括:
获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;
利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;
基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;
根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;
获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果;
其中,所述根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域,包括:
根据所述特征图生成多个初始锚点框,使用softmax卷积分支网络从各所述初始锚点框中提取正例锚点框和负例锚点框,根据所述正例锚点框与所述负例锚点框生成概率分布特征矩阵;
利用回归卷积分支网络调整所述正例锚点框的偏移量,生成坐标回归特征矩阵;
根据所述点标注与所述特征图生成多个目标锚点框,基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域。
2.根据权利要求1所述的电网厂站接线图的图元检测方法,其特征在于,所述全标注框包括左上角横坐标、左上角纵坐标、右下角横坐标和右下角纵坐标,所述标注信息包括横坐标信息与纵坐标信息,所述基于所述训练图片的全标注框生成标注信息,包括:
基于所述左上角横坐标与所述右下角横坐标生成所述横坐标信息;
基于所述左上角纵坐标与所述右下角纵坐标生成所述纵坐标信息。
3.根据权利要求1所述的电网厂站接线图的图元检测方法,其特征在于,所述主干特征提取网络为ResNet50卷积神经网络。
4.根据权利要求1所述的电网厂站接线图的图元检测方法,其特征在于,所述利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络之后,还包括:
获取ImageNet数据集,并通过所述ImageNet数据集预先训练出初始化模型;
获取由所述ImageNet数据集预训练好的主干特征提取网络的模型参数,利用所述初始化模型对所述主干特征提取网络的模型参数进行初始化。
5.根据权利要求1所述的电网厂站接线图的图元检测方法,其特征在于,所述根据所述点标注与所述特征图生成多个目标锚点框,包括:
基于所述训练图片的采样信息,将所述点标注投影至所述特征图上,生成多个目标点标注;
获取各所述目标点标注附近的多个目标特征点对应的锚点框,将各所述目标特征点对应的锚点框作为所述目标锚点框。
6.根据权利要求1所述的电网厂站接线图的图元检测方法,其特征在于,所述基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域,包括:
基于所述坐标回归特征矩阵对各所述目标锚点框进行转化,生成多个提议框;
基于所述概率分布特征矩阵对各所述提议框按照概率从大到小进行排序,得到多个候选框;
对排序在前的预设数量个候选框进行非极大值抑制,并过滤重叠的候选框,生成多个所述候选目标区域。
7.一种电网厂站接线图的图元检测***,其特征在于,所述***包括:
转化模块,用于获取训练图片,基于所述训练图片的全标注框生成标注信息,对所述训练图片和所述标注信息进行格式转化,得到框标注和点标注;
第一训练模块,用于利用随机梯度下降算法对主干特征提取网络进行训练,得到优化主干网络;
第二训练模块,用于基于所述优化主干网络提取所述训练图片中的特征图,根据所述特征图与所述点标注对PARPN网络进行训练,生成候选目标区域;
第三训练模块,用于根据所述优化主干网络、所述候选目标区域与所述框标注对识别网络进行训练,得到图元检测网络模型;
检测模块,用于获取识别数据,将所述识别数据输入至所述图元检测网络模型,生成图元检测结果;
其中,所述第二训练模块包括:
提取模块,用于根据所述特征图生成多个初始锚点框,使用softmax卷积分支网络从各所述初始锚点框中提取正例锚点框和负例锚点框,根据所述正例锚点框与所述负例锚点框生成概率分布特征矩阵;
第三生成模块,用于利用回归卷积分支网络调整所述正例锚点框的偏移量,生成坐标回归特征矩阵;
第四生成模块,用于根据所述点标注与所述特征图生成多个目标锚点框,基于所述概率分布特征矩阵与所述坐标回归特征矩阵对各所述目标锚点框进行处理,生成所述候选目标区域。
8.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的电网厂站接线图的图元检测方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的电网厂站接线图的图元检测方法的步骤。
CN202410487385.2A 2024-04-23 2024-04-23 电网厂站接线图的图元检测方法、***、设备及介质 Active CN118097706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410487385.2A CN118097706B (zh) 2024-04-23 2024-04-23 电网厂站接线图的图元检测方法、***、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410487385.2A CN118097706B (zh) 2024-04-23 2024-04-23 电网厂站接线图的图元检测方法、***、设备及介质

Publications (2)

Publication Number Publication Date
CN118097706A CN118097706A (zh) 2024-05-28
CN118097706B true CN118097706B (zh) 2024-06-25

Family

ID=91150941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410487385.2A Active CN118097706B (zh) 2024-04-23 2024-04-23 电网厂站接线图的图元检测方法、***、设备及介质

Country Status (1)

Country Link
CN (1) CN118097706B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310765A (zh) * 2023-05-23 2023-06-23 华雁智能科技(集团)股份有限公司 一种电气接线图图元识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10810468B2 (en) * 2019-01-30 2020-10-20 Mitsubishi Electric Research Laboratories, Inc. System for training descriptor with active sample selection
CN117277553B (zh) * 2023-08-24 2024-06-25 国网四川省电力公司天府新区供电公司 一种电网厂站监控信息智能处理方法
CN117392697A (zh) * 2023-10-20 2024-01-12 东南大学 基于yolo目标检测框架的图元符号检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116310765A (zh) * 2023-05-23 2023-06-23 华雁智能科技(集团)股份有限公司 一种电气接线图图元识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"An anchor-free region proposal network for Faster R-CNN-based text detection approaches";Zhuoyao Zhong 等;《 International Journal on Document Analysis and Recognition (IJDAR) 》;20190725;第22卷;第315–327页 *

Also Published As

Publication number Publication date
CN118097706A (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN108229509B (zh) 用于识别物体类别的方法及装置、电子设备
JP6926335B2 (ja) 深層学習における回転可変物体検出
US11157737B2 (en) Cultivated land recognition method in satellite image and computing device
CN112418216B (zh) 一种复杂自然场景图像中的文字检测方法
CN111523414A (zh) 人脸识别方法、装置、计算机设备和存储介质
CN112036292B (zh) 基于神经网络的文字识别方法、装置及可读存储介质
CN110781964A (zh) 一种基于视频图像的人体目标检测方法及***
CN113490947A (zh) 检测模型训练方法、装置、检测模型使用方法及存储介质
CN108021863B (zh) 电子装置、基于图像的年龄分类方法及存储介质
CN113592886A (zh) 建筑图纸的审图方法、装置、电子设备及介质
CN116168351B (zh) 电力设备巡检方法及装置
CN113705462A (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN111401322A (zh) 进出站识别方法、装置、终端及存储介质
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
CN114399729A (zh) 监控对象移动识别方法、***、终端及存储介质
CN117746015A (zh) 小目标检测模型训练方法、小目标检测方法及相关设备
CN111325106B (zh) 生成训练数据的方法及装置
CN118097706B (zh) 电网厂站接线图的图元检测方法、***、设备及介质
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN115271055A (zh) 一种神经网络软硬件协同检测方法、装置、设备及存储介质
CN115223157A (zh) 一种基于循环神经网络的电网设备铭牌光学字符识别方法
CN113792671A (zh) 人脸合成图像的检测方法、装置、电子设备及介质
CN115393838A (zh) 指针式仪表读数识别方法、装置、电子设备及存储介质
CN112308061A (zh) 一种车牌字符排序方法、识别方法及装置
JP4648084B2 (ja) 記号認識方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant