CN117373049A - 一种dcs逻辑图的识别方法及装置 - Google Patents

一种dcs逻辑图的识别方法及装置 Download PDF

Info

Publication number
CN117373049A
CN117373049A CN202311334028.4A CN202311334028A CN117373049A CN 117373049 A CN117373049 A CN 117373049A CN 202311334028 A CN202311334028 A CN 202311334028A CN 117373049 A CN117373049 A CN 117373049A
Authority
CN
China
Prior art keywords
information
logic diagram
algorithm
dcs logic
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311334028.4A
Other languages
English (en)
Inventor
马聪
潘海波
袁志胜
蒋心为
周明
杨景利
闵礼书
孙仲华
李波
杜亚龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Techenergy Co Ltd
Original Assignee
China Techenergy Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Techenergy Co Ltd filed Critical China Techenergy Co Ltd
Priority to CN202311334028.4A priority Critical patent/CN117373049A/zh
Publication of CN117373049A publication Critical patent/CN117373049A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1918Fusion techniques, i.e. combining data from various sources, e.g. sensor fusion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Character Input (AREA)

Abstract

本申请提供了一种DCS逻辑图的识别方法及装置,该方法包括:将PDF格式的原始DCS逻辑图转换为图片格式的待识别DCS逻辑图;根据线段识别算法获取待识别DCS逻辑图的线段信息;根据算法块识别模型获取待识别DCS逻辑图的算法块信息;根据文字识别算法获取待识别DCS逻辑图的文本信息;基于预设的融合规则将线段信息、算法块信息以及文本信息融合,以得到待识别DCS逻辑图的识别结果。本申请实施例能够自动解析DCS逻辑图中的线段信息、算法块信息以及文本信息,并将各类信息融合获得识别结果,该方法能够取代人工识图的过程,实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性。

Description

一种DCS逻辑图的识别方法及装置
技术领域
本申请涉及DCS工程设计技术领域,尤其涉及一种DCS逻辑图的识别方法及装置。
背景技术
核电站分散控制***(Distributed Control System,DCS)是随着现代大型工业生产自动化的不断兴起和过程控制要求的日益复杂应运而生的综合控制***,它是计算机技术、***控制技术、网络通讯技术和多媒体技术相结合的产物,可提供窗口友好的人机界面和强大的通讯功能。
由设计院提供的DCS逻辑图一般为PDF文件,PDF文件包含文本、图片、线段、图形等元素。现有技术在识图阶段,目前都是由人工进行识别,容易带来人为因素导致的失误,同时存在效率低下的问题,由于人工解析和组态,出现错误后容易导致设备误动,极端情况可能导致核电机组运行异常。
发明内容
有鉴于此,本申请提供了一种DCS逻辑图的识别方法及装置,用以实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性。
其技术方案如下:
第一方面,本申请实施例提供了一种DCS逻辑图的识别方法,所述方法包括:
将原始DCS逻辑图转换为待识别DCS逻辑图,所述原始DCS逻辑图包括PDF格式,所述待识别DCS逻辑图为图片格式;
根据线段识别算法获取所述待识别DCS逻辑图的线段信息;
根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息;
根据文字识别算法获取所述待识别DCS逻辑图的文本信息;
基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果。
可选的,所述将原始DCS逻辑图转换为待识别DCS逻辑图,包括:
在.NET环境下,利用PDFRender4NET算法将所述原始DCS逻辑图转换为所述待识别DCS逻辑图。
可选的,所述根据线段识别算法获取所述待识别DCS逻辑图的线段信息,包括:
根据快速线段检测FastLineDetector算法识别所述待识别DCS逻辑图,以获取所述线段信息,所述线段信息包括线段的起止点坐标信息以及拐点信息。
可选的,所述根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息,包括:
根据所述算法块识别模型识别所述待识别DCS逻辑图,以获得所述算法块信息,所述算法块信息包括:算法块算法类型、算法块位置信息以及算法块的尺寸信息。
可选的,所述算法块识别模型的训练过程包括:
获取DCS逻辑图标注训练集,所述DCS逻辑图标注训练集包括预先标注的算法块的算法类型、位置信息以及尺寸信息;
利用所述DCS逻辑图标注训练集对YOLO v5深度学习模型进行迭代训练,以得到所述算法块识别模型,所述算法块识别模型满足预设召回率要求以及识别准确率要求。
可选的,所述根据文字识别算法获取所述待识别DCS逻辑图的文本信息,包括:
根据光学字符识别OCR算法识别所述待识别DCS逻辑图,以获得所述文本信息,所述文本信息包括文本的内容信息以及文本的位置信息。
可选的,基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果,包括:
基于所述文本信息对所述算法块算法类型进行纠正,以得到纠正后的算法块算法类型;
对所述线段信息中不符合线段保留规则的信息进行剔除,得到有效线段信息,所述线段保留规则包括:有效线段长度规则以及有效线段位置规则;
根据所述文本信息以及所述算法块信息确定算法块的管脚信息、算法块的模块参数信息以及接口变量信息,所述管脚信息包括管脚名以及管脚位置信息;
根据所述有效线段信息以及所述算法块的管脚信息确定算法块的连接关系;
基于所述纠正后的算法块信息、所述算法块的连接关系、所述模块参数信息以及所述接口变量信息确定所述待识别DCS逻辑图的识别结果。
第二方面,本申请实施例提供了一种DCS逻辑图的识别装置,所述装置包括:
转换模块,用于将原始DCS逻辑图转换为待识别DCS逻辑图,所述原始DCS逻辑图包括PDF格式,所述待识别DCS逻辑图为图片格式;
线段识别模块,用于根据线段识别算法获取所述待识别DCS逻辑图的线段信息;
算法块识别模块,用于根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息;
文字识别模块,用于根据文字识别算法获取所述待识别DCS逻辑图的文本信息;
融合模块,用于基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果。
第三方面,本申请提供了一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面中所述的DCS逻辑图的识别方法。
第四方面,本申请提供了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如第一方面中所述的DCS逻辑图的识别方法。
上述技术方案具有如下有益效果:
本申请实施例提供的一种DCS逻辑图的识别方法,在执行所述方法时,将原始DCS逻辑图转换为待识别DCS逻辑图,所述原始DCS逻辑图包括PDF格式,所述待识别DCS逻辑图为图片格式;根据线段识别算法获取所述待识别DCS逻辑图的线段信息;根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息;根据文字识别算法获取所述待识别DCS逻辑图的文本信息;基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果。由此可见,本申请实施例能够自动解析DCS逻辑图中的线段信息、算法块信息以及文本信息,并将各类信息融合获得识别结果,该方法能够取代人工识图的过程,实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性。
本申请实施例还提供了与上述方法相对应的装置、电子设备以及计算机存储介质,具有与上述方法相同的有益效果。
附图说明
为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种DCS逻辑图的识别方法的流程示意图;
图2为本申请实施例提供的一种原始DCS逻辑图示意图;
图3为本申请实施例提供的一种DCS逻辑图的识别方法中线段识别结果示意图;
图4为本申请实施例提供的一种DCS逻辑图的识别方法中算法块信息识别结果示意图;
图5为本申请实施例提供的一种标注后的DCS逻辑图示意图;
图6为本申请实施例提供的一种DCS逻辑图的识别方法中文本信息识别结果示意图;
图7为本申请实施例提供的一种DCS逻辑图的识别装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性,本申请实施例提供了一种DCS逻辑图的识别方法,请参阅图1,该方法可以包括:
步骤S100:将原始DCS逻辑图转换为待识别DCS逻辑图,原始DCS逻辑图包括PDF格式,待识别DCS逻辑图为图片格式。
具体的,设计院提供的DCS逻辑图图纸一般都是PDF格式,PDF格式的文件可以包含文本、图片、图形等多种类型的内容,为了保证后续对DCS逻辑图识别的准确性和识别效率,本实施例将PDF格式的原始DCS逻辑图转换为图片格式的待识别DCS逻辑图。参见图2,示出了一张原始DCS逻辑图,图中包括接口信息、算法块信息、接口变量、连线信息等。
在一种可选的实现方式中,步骤S100具体包括:在.NET环境下,利用PDFRender4NET算法将原始DCS逻辑图转换为待识别DCS逻辑图。
其中,.NET环境是Net程序运行所需要的环境,本申请实施例中可以在.NET环境中使用PDFRender4NET算法,将读取到的PDF格式的原始DCS逻辑图,按照每个图页转换成指定分辨率的图片,并以图页号为文件名保存到本地,作为后续解析的数据源。作为一种可选项,分辨率可以指定为1852像素×1310像素。
步骤S200:根据线段识别算法获取待识别DCS逻辑图的线段信息。
具体的,可以使用Open CV的快速线段检测(FastLineDetector,FLD)算法识别待识别DCS逻辑图,以获取线段信息;其中,线段信息可以包括线段的起止点坐标信息、线段的拐点信息等,获得的线段信息可以缓存至本地数据库中。参见图3示出了线段识别结果示意图,图中的线段均被识别。
步骤S300:根据算法块识别模型获取待识别DCS逻辑图的算法块信息。
具体的,根据算法块识别模型识别待识别DCS逻辑图,以获得算法块信息;其中,算法块信息可以包括:算法块算法类型、算法块位置信息以及算法块的尺寸信息,获得的算法块信息可以缓存至本地数据库中。参见图4示出了算法块信息识别结果示意图,算法块均被识别和标注,并标注有识别结果置信度。
需要说明的是,算法块识别模型可以采用预先训练好的深度学习模型,在一种可选的实现方式中,本申请实施例中算法块识别模型的训练过程可以包括:获取DCS逻辑图标注训练集,DCS逻辑图标注训练集包括预先标注的算法块的算法类型、位置信息以及尺寸信息;利用DCS逻辑图标注训练集对YOLO v5深度学习模型进行迭代训练,以得到算法块识别模型,其中,算法块识别模型满足预设召回率要求以及识别准确率要求。
具体的,获取预先标注好的DCS逻辑图标注训练集,利用训练集对YOLO v5深度学习模型进行迭代训练,直至模型满足召回率要求和准确率要求,模型具体的训练流程可以参见现有技术,此处不展开论述。示例性的,本申请实施例中召回率要求可以预设为100%,识别准确率要求可以预设为95%,需要说明的是,模型参数以及训练要求均可以视场景及实际需求相应做出调整,本申请实施例中不做限定。
本申请实施例中算法块识别模型可以采用深度学习中的One Stage算法YOLO v5,具有识别精度高、速度快、占用资源小的特点,适用于大批量的DCS逻辑图的识别处理。
实际应用中,DCS逻辑图标注训练集可以通过手工标注或半自动标注的方式获取。手工标注可以通过如LabelImg软件进行标注;半自动标注可以将部分打完标签的数据集利用YOLO v5模型进行训练,利用训练好的权重进行未标注图像的自动打标签功能,标注错误或漏标的框可以人工在LabelImg软件中手动调整。手工标注适用于训练样本量较小的场景,半自动标注适用于训练样本量较大的场景。
参见图5,示出了通过LabelImg软件进行手工标注得到的标注后的DCS逻辑图,可作为训练集的一部分。图5中可以看出对DCS逻辑图中的算法块打上了标注框Box并为每个标注框设置了对应的标签Box Labels。
步骤S400:根据文字识别算法获取待识别DCS逻辑图的文本信息。
具体的,根据光学字符识别OCR算法识别待识别DCS逻辑图,以获得文本信息;其中,文本信息可以包括文本的内容信息以及文本的位置信息,获得的文本信息可以缓存至本地数据库中。参见图6,示出了文本信息识别结果示意图,文本信息均被识别和标注,并标注有识别结果置信度。
实际应用中,OCR算法具体可以选用PaddleOCR算法,由于待识别DCS逻辑图的尺寸较大,在使用PaddleOCR算法时,需要对算法的配置参数进行调试和测试,保证识别准确率大于99%。
需要说明的是,本申请实施例不对上述步骤S200、步骤S300以及步骤S400的执行顺序做限定,本领域技术人员可以按设定顺序执行也可以并行执行。
步骤S500:基于预设的融合规则将线段信息、算法块信息以及文本信息融合,以得到待识别DCS逻辑图的识别结果。
具体的,经过对待识别DCS逻辑图的解析和识别,获得的信息都是分散的,需要对这些信息进行融合,最终形成包含算法块信息、算法块连接关系信息、模块参数信息以及接口变量信息等的结构化数据。识别得到的结构化文件,为后续一系列工作奠定基础,例如进行图纸差异对比、对变更进行统计与评估、DCS/FD组态逻辑的自动实现等。
在一种可选的实现方式中,上述步骤S500可以包括如下步骤:
步骤S501:基于文本信息对算法块算法类型进行纠正,以得到纠正后的算法块算法类型。
由于部分算法类型特征区别不大,导致深度学习模型识别的算法块算法类型的准确率只能达到95%,因此,本申请进一步根据识别到的算法块区域内识别到的文本信息,再次确认算法块的类型,如果两者不一致,根据文本信息对算法块算法类型进行纠正,以文本信息确定的算法类型为准。
步骤S502:对线段信息中不符合线段保留规则的信息进行剔除,得到有效线段信息,线段保留规则包括:有效线段长度规则以及有效线段位置规则。
具体的,再次参见图3示出了线段识别结果示意图,图中的线段均被识别。然而,由于图纸中可能存在如边框、文本框可能造成线段识别结果中存在一些无用线段,这边的无用线段是指对后续算法块连接关系的构建中没有作用的线段,因此,本申请实施例预先设置对应的线段保留规则,对不符合线段保留规则的线段信息进行剔除。
需要说明的是,线段保留规则中包括有效线段长度规则以及有效线段位置规则,有效线段长度规则包括线段长度大于预设值的情况下线段属于无用线段,则不保留,例如图纸中的识别到的边框对应的线段。有效线段位置规则包括处在特定位置的线段属于无用线段,同样不保留,例如图纸右下角区域中存在文本框对应的线段、算法块以及算法块内的区域识别到线段同样不保留等。
步骤S503:根据文本信息以及算法块信息确定算法块的管脚信息、算法块的模块参数信息以及接口变量信息,管脚信息包括管脚名以及管脚位置信息。
具体的,文本信息包括:文本的内容信息以及文本的位置信息,算法块信息包括:算法块算法类型、算法块位置信息以及算法块的尺寸信息。
结合算法块位置信息、文本的内容信息以及文本的位置信息确定每个算法块的管脚信息,管脚信息包括管脚名以及管脚的位置信息。
结合算法块位置信息在算法块附件的区域寻找算法块的模块参数信息,需要说明的是,不同算法块对应的模块参数信息可能在不同区域,因此,可以针对不同算法块算法类型预先设置对应的模块参数信息存在的区域,便于后续获取模块参数信息。
结合算法块位置信息与文本的位置信息的对应关系可以获取接口变量信息,例如:Input与Output部分的接口,包括变量名称、变量描述、跳转页码等。
步骤S504:根据所述有效线段信息以及所述算法块的管脚信息确定算法块的连接关系。
步骤S505:基于纠正后的算法块信息、算法块的连接关系、模块参数信息以及接口变量信息确定待识别DCS逻辑图的识别结果。
最后,基于前述步骤S501至步骤S504获得的纠正后的算法块信息、算法块的连接关系、模块参数信息以及接口变量信息确定待识别DCS逻辑图的识别结果,由此实现将各类信息融合获得识别结果,该方法能够取代人工识图的过程,实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性。
综上所述,本申请实施例提供了一种DCS逻辑图的识别方法,执行所述方式时,将PDF格式的原始DCS逻辑图转换为图片格式的待识别DCS逻辑图;根据线段识别算法获取待识别DCS逻辑图的线段信息;根据算法块识别模型获取待识别DCS逻辑图的算法块信息;根据文字识别算法获取待识别DCS逻辑图的文本信息;基于预设的融合规则将线段信息、算法块信息以及文本信息融合,以得到待识别DCS逻辑图的识别结果。本申请实施例提供的DCS逻辑图的识别方法能够自动解析DCS逻辑图中的线段信息、算法块信息以及文本信息,并将各类信息融合获得识别结果,该方法能够取代人工识图的过程,实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性。
与上述方法相对应,本申请实施例还提供了一种DCS逻辑图的识别装置,请参阅图7,示出了该装置的结构示意图,该装置可以包括:
转换模块701,用于将原始DCS逻辑图转换为待识别DCS逻辑图,原始DCS逻辑图包括PDF格式,待识别DCS逻辑图为图片格式;
线段识别模块702,用于根据线段识别算法获取待识别DCS逻辑图的线段信息;
算法块识别模块703,用于根据算法块识别模型获取待识别DCS逻辑图的算法块信息;
文字识别模块704,用于根据文字识别算法获取待识别DCS逻辑图的文本信息;
融合模块705,用于基于预设的融合规则将线段信息、算法块信息以及文本信息融合,以得到待识别DCS逻辑图的识别结果。
在一种可选的实现方式中,所述转换模块701具体用于:在.NET环境下,利用PDFRender4NET算法将原始DCS逻辑图转换为待识别DCS逻辑图。
在一种可选的实现方式中,所述线段识别模块702具体用于:根据快速线段检测FastLineDetector算法识别待识别DCS逻辑图,以获取线段信息,线段信息包括线段的起止点坐标信息以及拐点信息。
在一种可选的实现方式中,所述算法块识别模块703具体用于:根据算法块识别模型识别待识别DCS逻辑图,以获得算法块信息,算法块信息包括:算法块算法类型、算法块位置信息以及算法块的尺寸信息。
在一种可选的实现方式中,所述文字识别模块704具体用于:根据光学字符识别OCR算法识别待识别DCS逻辑图,以获得文本信息,文本信息包括:文本的内容信息以及文本的位置信息。
在一种可选的实现方式中,所述融合模块705,具体包括:
类型纠正子模块,用于基于文本信息对算法块算法类型进行纠正,以得到纠正后的算法块算法类型;
线段剔除子模块,用于对线段信息中不符合线段保留规则的信息进行剔除,得到有效线段信息,线段保留规则包括:有效线段长度规则以及有效线段位置规则;
信息确定子模块,用于根据文本信息以及算法块信息确定算法块的管脚信息、算法块的模块参数信息以及接口变量信息,管脚信息包括管脚名以及管脚位置信息;
连接关系确定子模块,用于根据有效线段信息以及算法块的管脚信息确定算法块的连接关系;
识别结果确定子模块,用于基于纠正后的算法块信息、算法块的连接关系、模块参数信息以及接口变量信息确定待识别DCS逻辑图的识别结果。
需要说明的是,本申请实施例提供的一种DCS逻辑图的识别装置中各模块执行的步骤以及相关技术特征与申请实施例所提供方法相对应,装置部分的描述可以参见前述方法部分的实施例,此处不赘述。
综上所述,本申请实施例提供了一种DCS逻辑图的识别装置,该装置包括:转换模块,用于将原始DCS逻辑图转换为待识别DCS逻辑图,原始DCS逻辑图包括PDF格式,待识别DCS逻辑图为图片格式;线段识别模块,用于根据线段识别算法获取待识别DCS逻辑图的线段信息;算法块识别模块,用于根据算法块识别模型获取待识别DCS逻辑图的算法块信息;文字识别模块,用于根据文字识别算法获取待识别DCS逻辑图的文本信息;融合模块,用于基于预设的融合规则将线段信息、算法块信息以及文本信息融合,以得到待识别DCS逻辑图的识别结果。本申请实施例提供的DCS逻辑图的识别装置能够自动解析DCS逻辑图中的线段信息、算法块信息以及文本信息,并将各类信息融合获得识别结果,该方法能够取代人工识图的过程,实现DCS逻辑图的自动化识别,提高DCS逻辑图识别效率且能够保证识别准确性。
本申请另一实施例提供了一种电子设备,包括:
一个或多个处理器。
存储装置,其上存储有一个或多个程序。
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中任意一项所述的DCS逻辑图的识别方法。
本申请另一实施例提供了一种计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如上述实施例中任意一项所述的DCS逻辑图的识别方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本领域技术人员可以理解,图所示的流程图仅是本申请的实施方式可以在其中得以实现的一个示例,本申请实施方式的适用范围不受到该流程图任何方面的限制。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和设备,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种DCS逻辑图的识别方法,其特征在于,所述方法包括:
将原始DCS逻辑图转换为待识别DCS逻辑图,所述原始DCS逻辑图包括PDF格式,所述待识别DCS逻辑图为图片格式;
根据线段识别算法获取所述待识别DCS逻辑图的线段信息;
根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息;
根据文字识别算法获取所述待识别DCS逻辑图的文本信息;
基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将原始DCS逻辑图转换为待识别DCS逻辑图,包括:
在.NET环境下,利用PDFRender4NET算法将所述原始DCS逻辑图转换为所述待识别DCS逻辑图。
3.根据权利要求1-2中任一所述的方法,其特征在于,所述根据线段识别算法获取所述待识别DCS逻辑图的线段信息,包括:
根据快速线段检测FastLineDetector算法识别所述待识别DCS逻辑图,以获取所述线段信息,所述线段信息包括线段的起止点坐标信息以及拐点信息。
4.根据权利要求3所述的方法,其特征在于,所述根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息,包括:
根据所述算法块识别模型识别所述待识别DCS逻辑图,以获得所述算法块信息,所述算法块信息包括:算法块算法类型、算法块位置信息以及算法块的尺寸信息。
5.根据权利要求4所述的方法,其特征在于,所述算法块识别模型的训练过程包括:
获取DCS逻辑图标注训练集,所述DCS逻辑图标注训练集包括预先标注的算法块的算法类型、位置信息以及尺寸信息;
利用所述DCS逻辑图标注训练集对YOLO v5深度学习模型进行迭代训练,以得到所述算法块识别模型,所述算法块识别模型满足预设召回率要求以及识别准确率要求。
6.根据权利要求5所述的方法,其特征在于,所述根据文字识别算法获取所述待识别DCS逻辑图的文本信息,包括:
根据光学字符识别OCR算法识别所述待识别DCS逻辑图,以获得所述文本信息,所述文本信息包括:文本的内容信息以及文本的位置信息。
7.根据权利要求6所述的方法,其特征在于,基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果,包括:
基于所述文本信息对所述算法块算法类型进行纠正,以得到纠正后的算法块算法类型;
对所述线段信息中不符合线段保留规则的信息进行剔除,得到有效线段信息,所述线段保留规则包括:有效线段长度规则以及有效线段位置规则;
根据所述文本信息以及所述算法块信息确定算法块的管脚信息、算法块的模块参数信息以及接口变量信息,所述管脚信息包括管脚名以及管脚位置信息;
根据所述有效线段信息以及所述算法块的管脚信息确定算法块的连接关系;
基于所述纠正后的算法块信息、所述算法块的连接关系、所述模块参数信息以及所述接口变量信息确定所述待识别DCS逻辑图的识别结果。
8.一种DCS逻辑图的识别装置,其特征在于,所述装置包括:
转换模块,用于将原始DCS逻辑图转换为待识别DCS逻辑图,所述原始DCS逻辑图包括PDF格式,所述待识别DCS逻辑图为图片格式;
线段识别模块,用于根据线段识别算法获取所述待识别DCS逻辑图的线段信息;
算法块识别模块,用于根据算法块识别模型获取所述待识别DCS逻辑图的算法块信息;
文字识别模块,用于根据文字识别算法获取所述待识别DCS逻辑图的文本信息;
融合模块,用于基于预设的融合规则将所述线段信息、所述算法块信息以及所述文本信息融合,以得到所述待识别DCS逻辑图的识别结果。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的方法。
CN202311334028.4A 2023-10-16 2023-10-16 一种dcs逻辑图的识别方法及装置 Pending CN117373049A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311334028.4A CN117373049A (zh) 2023-10-16 2023-10-16 一种dcs逻辑图的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311334028.4A CN117373049A (zh) 2023-10-16 2023-10-16 一种dcs逻辑图的识别方法及装置

Publications (1)

Publication Number Publication Date
CN117373049A true CN117373049A (zh) 2024-01-09

Family

ID=89399723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311334028.4A Pending CN117373049A (zh) 2023-10-16 2023-10-16 一种dcs逻辑图的识别方法及装置

Country Status (1)

Country Link
CN (1) CN117373049A (zh)

Similar Documents

Publication Publication Date Title
CN111563509B (zh) 一种基于tesseract的变电站端子排识别方法及***
CN109670494B (zh) 一种附带识别置信度的文本检测方法及***
CN112232352B (zh) 一种智能识别pcb图纸自动计价***和方法
CN112527676A (zh) 模型自动化测试方法、装置及存储介质
CN111414907A (zh) 数据集标注方法、数据集标注装置和计算机可读存储介质
CN114429640A (zh) 图纸分割方法、装置及电子设备
CN111061901A (zh) 一种图像智能标注方法、***及图像标注质量分析方法
CN113887442A (zh) Ocr训练数据生成方法、装置、设备及介质
CN111898544B (zh) 文字图像匹配方法、装置和设备及计算机存储介质
CN117612195A (zh) 一种基于主接线图识别技术的图模生成方法和装置
CN110633251B (zh) 一种文件转换方法及设备
US11914567B2 (en) Text-based machine learning extraction of table data from a read-only document
CN112149506A (zh) 结合rpa和ai的图像中的表格生成方法、设备及存储介质
CN110968604A (zh) 一种自动检索互联网经营企业违规经营的方法
CN117373049A (zh) 一种dcs逻辑图的识别方法及装置
CN111079528A (zh) 一种基于深度学习的图元图纸校核方法及***
CN113283231A (zh) 获取签章位的方法、设置***、签章***及存储介质
CN114708582A (zh) 基于ai和rpa的电力数据智慧稽查方法及装置
CN112967166A (zh) 一种基于openCV的图片水印自动识别处理方法及***
Ondrejcek et al. Information extraction from scanned engineering drawings
EP2573694A1 (en) Conversion method and system
CN113177995B (zh) Cad图纸的文本重组方法和计算机可读存储介质
CN112801030B (zh) 一种目标文本区域的定位方法及装置
CN118379573A (zh) 数字仪表图像样本的生成方法、装置和电子设备
CN116882383A (zh) 基于文本分析的数字化智能校对***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination