CN113095524A - 电力设备检修工作单据智能生成方法、***及存储介质 - Google Patents
电力设备检修工作单据智能生成方法、***及存储介质 Download PDFInfo
- Publication number
- CN113095524A CN113095524A CN202110528152.9A CN202110528152A CN113095524A CN 113095524 A CN113095524 A CN 113095524A CN 202110528152 A CN202110528152 A CN 202110528152A CN 113095524 A CN113095524 A CN 113095524A
- Authority
- CN
- China
- Prior art keywords
- entity
- path
- work
- candidate
- power equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012423 maintenance Methods 0.000 title claims abstract description 37
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000010606 normalization Methods 0.000 claims abstract description 8
- 238000009826 distribution Methods 0.000 claims description 27
- 238000007689 inspection Methods 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 15
- 230000007547 defect Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 235000005770 birds nest Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000009415 formwork Methods 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000005765 wild carrot Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供电力设备检修工作单据智能生成方法、***及存储介质,该方法基于该***和存储介质进行实施和保存,该方法包括在工作任务单中提取关键词;对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据;提出了电力设备检修的知识图谱可以针对不同的电力场景通过梳理业务数据,利用知识图谱推理技术,实现知识驱动的可解释推理决策;经过推理和判断生成票单。辅助提高工作人员检修设备的工作效率,简化工作流程。
Description
技术领域
本发明涉及电力行业技术领域,具体为涉及一种知识引导的电力设备检修工作单据智能生成方法、***及存储介质。
背景技术
随着我国经济的快速发展,电能需求量不断提升,电网可靠性要求逐步提高。电力设备长期处于复杂恶劣的环境之中,承受雷电、强风、暴雨、高温等灾害气象的影响,成为了输电网络中最为薄弱的环节。我国幅员辽阔,气象灾害具有类型多、强度大、频率高等特点,且还具有时域和空域群发集聚特性。为了确保电能安全稳定地供应到用电客户,在电力设备检修中,电力设备检修工作单据的开票及派发是非常关键的一步。
电力设备检修任务涉及到三种单据:1)工作任务单,一线巡视人员通过对电力设备进行巡视、检测分析后会记录形成关于设备或部件缺陷状态描述文本的工作任务单,该单主要包括任务内容和编制人等信息。2)工作票,***会将工作任务单派发给所属地市编制部门的编制人,编制人根据人员分工、故障等级及紧急程度派发工作票,工作票包括工作内容、工作地点描述和工作负责人等信息,工作票明确描述了检修人员的责任内容及责任区域,这样不会导致缺陷设备无检修或同一子任务多派发的问题。3)修试记录,检修任务完成后,员工会根据任务完成度填写修试记录,修试记录包括设备名称、完成情况、验收意见和记录状态等信息。修试记录是对检修人员工作情况的描述,验收人将工作票任务和修试记录完成情况进行比对,确保工作任务完成,以免因未解除设备当前故障造成重大事故。
现阶段,通常由巡检人员撰写形成对相关电力设备故障、缺陷状态任务描述的工作任务单,而后由电力公司的巡检班组组长根据工作任务单的内容以及班组内检修人员的职责分工,以手抄票的形式进行任务的拆分、部署,形成分配到人的工作票。由于工作人员经验参差不齐、对知识储备的差异性等原因会导致其发现、分析和处理设备的准确度及效率低。
发明内容
为了解决上述问题,本申请提供一种力设备检修工作单据智能生成方法、***及存储介质,提出了电力设备检修的知识图谱可以针对不同的电力场景通过梳理业务数据,利用知识图谱推理技术,实现知识驱动的可解释推理决策;经过推理和判断生成票单。辅助提高工作人员检修设备的工作效率,简化工作流程。
本申请提供一种电力设备检修工作单据智能生成方法,包括:获取电力运检的工作任务单,在工作任务单中提取关键词;对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。
本申请实施例提供的电力设备检修工作单据智能生成方法,采用知识图谱支撑运检业务知识的积累传承。将设备部件或部位名称及其之间的关系、缺陷状态和缺陷等级以可视化的方式存储展示,便于理解和工程化应用。优选的,所述对实体提及进行归一化处理包括:将实体提及集合中的实体提及映射到同义词表中,将识别出的实体提及利用同义词表中该实体提及所对应的标准实体表示。
优选的,采用如下方法构建电力设备知识图谱:根据专家经验及检修标准文档的业务规则,采用自顶而下,构建知识图谱本体架构;在知识图谱本体架构下,对工作任务单、工作票及修试记录进行知识抽取,形成电力设备知识图谱知识库。
在本申请实施例提供的电力设备检修工作单据智能生成方法中,采用领域知识图谱优化运检领域知识管理,通过梳理现有输电架空线路业务数据、知识和专家经验,自上而下构建本体架构及知识图谱数据层,易于对知识体系进行全面把握和认知推理。
在上述任意一项实施例中优选的,还包括在进行实体链接之前,为每个待消歧的实体提及构建一个候选实体列表,消除歧义,并根据实体提及对应的候选实体情况判断候选实体是否为可链接。在本实施例提供的电力设备检修工作单据智能生成方法中,采用候选实体表来缩小实体链接的搜索空间,提高搜索效率。
在上述任意一项实施例中优选的,所述实体提及对应的候选实体情况包括以下三种:
Case1、该实体提及在候选实体列表中所对应的候选实体个数为0,候选实体不可链接;
Case2、该实体提及候选实体列表所对应的候选实体个数为1,存在唯一候选实体可连接;
Case3、该实体提及候选实体列表所对应的候选实体个数大于1时,存在多个候选实体可连接,则对可链接的候选实体进行排序。
在上述任意一项实施例中优选的,按照以下方法对所述对可链接候选实体进行排序:
通过eLDA概率模型在主题上的候选实体分布,得到每个候选实体的主题分布,根据LDA概率模型在主题上的文本分布,得到文本的主题分布,对文本中的每个实体提及,计算每个候选实体的主题分布与文本的主题分布的余弦相似度,根据余弦相似度值进行排序,则相似度最小的为最终链接的实体。
在上述任意一项实施例中优选的,在根据得出的实体链接进行路径搜索时,如图6所示,包括以下方法:
将知识图谱中所有节点分为三个子集合,所述子集合包括起点集、中点集和终点集;通过Dijkstra贪心算法依次求起点集到中间节点集之间的局部最优路径、中间节点集中所有节点的局部最优路径、中间节点集到终点集之间的局部最优路径,得出从起点出发经过指定的所有中间节点后到达终点的全局最优路径。所述起点集包含起点;所述中点集包含全部的需要经过的中间节点;所述终点集包含终点。
在上述任意一项实施例中优选的,在利用通过Dijkstra贪心算法求取最优路径前,从起点出发,深度优先遍历知识图谱的神经网络,对没有遍历到的节点,从知识图谱网络的原神经网络中删掉,形成新的神经网络,利用新的神经网络求取最优路径。
在本实施例中,通过删掉没有遍历到的节点,实现了在不影响求目标路径的情况下,通过减少网络中节点个数,来大幅提高算法的时间效率。
在上述任意一项实施例中优选的,在生成全局最优路径时,包括在中点集中,判断需要经过的指定中间节点中任意两个节点之间的连通情况,根据节点之间的连通情况判断是否存在满足条件的路径;当满足条件的路径存在时,对指定中间节点进行全排列,生成中间节点序列,计算中间节点序列中,起点到终点的第一路径;利用中间节点序列的起点和终点,分别计算目标原点到中间节点序列起点之间的第二路径以及目标终点到中间节点序列终点之间的第三路径;对第一路径、第二路径和第三路径按照顺序连接,得出全程最优路径。
本发明还提供一种电力设备检修工作单据智能生成***,包括
关键词提取模块,用于获取电力运检的工作任务单,在工作任务单中提取关键词;
实体抽取模块,用于对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;
路径搜索模块,用于利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;
工作票据输出模块,用于将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。
本发明还提供一种存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述电力设备检修工作单据智能生成方法的步骤。
本发明提供的电力设备检修工作单据智能生成***,提出电力设备检修知识图谱推广技术,实现知识驱动的可解释推理决策。将电力设备领域知识图谱应用到设备检修辅助决策场景中,将设备部件或部位名称及其之间的关系、缺陷状态和缺陷等级以可视化的方式存储展示,便于理解和工程化应用;提出基于电力设备知识图谱的最优路径搜索,通过实体链接技术将工作单中的实体提及与知识图谱中实体节点匹配,在匹配的节点约束下搜索工作票所需节点信息路径,并基于模板智能生成工作票,提高了电力设备维修的工作效率,辅助维修人员作出判断。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本申请提供一种电力设备检修工作单据智能生成方法的流程图;
图2为本申请提供的电力设备检修工作单据智能生成方法的技术路线总体框架图;
图3为本申请提供的电力设备检修工作单据智能生成方法的电力设备知识图谱的架构图;
图4为本申请提供的电力设备检修工作单据智能生成方法的电力设备知识图谱构建流程框图;
图5为本申请提供的电力设备检修工作单据智能生成方法中eLDA概率图模型;
图6为本申请提供的电力设备检修工作单据智能生成方法中路径搜索示意图;
图7为本申请提供的电力设备检修工作单据智能生成***的结构示意图。
具体实施方式
下面将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
以下详细说明均是示例性的说明,旨在对本发明提供进一步的详细说明。除非另有指明,本发明所采用的所有技术术语与本申请所属领域的一般技术人员的通常理解的含义相同。本发明所使用的术语仅是为了描述具体实施方式,而并非意图限制根据本发明的示例性实施方式。
如图1所示,本申请提供一种电力设备检修工作单据智能生成方法,包括:
S1、获取电力运检的工作任务单,在工作任务单中提取关键词;其中,在提取关键词时采用中国科学院计算技术研究所发布的汉语分词***对给定工作任务单中的文本进行分词和词性标注,根据输出的词性标注结果进行实体识别。
进一步,在本申请提供的一个实施例中,通过对电力设备进行巡视、检测分析后会形成关于设备或部件缺陷状态描述的文本故障标签信息,后台将故障标签信息以Excel分类汇总形成工作任务单。该工作任务单主要包括工单编号、任务内容、电站|线路、编制部门和编制人等信息,该工单描述了检修总任务和编制人的责任范围。***会将工作任务单派发给所属地市编制部门的编制人,编制人具有分工派遣包含工作任务单中的子任务给一线员工的权利。编制人根据人员分工、故障等级及紧急程度派发工作票,工作票包括票种类、工作内容、工作地点、工作地点描述、制票部门、运维单位、工作负责人、制票人等信息。工作负责人是对设备或部件检修的员工,制票人是派发工作票的班组长,工作票明确描述了检修人员的责任内容及责任区域,这样不会导致缺陷设备无检修或同一子任务多派发的问题。检修任务完成后,员工会根据任务完成度填写修试记录,修试记录包括设备地点、设备名称、工作内容、完成情况、验收意见和记录状态等信息。修试记录是对检修人员工作情况的描述,验收人将工作票任务和修试记录完成情况进行比对,确保工作任务完成,以免因设备未解除当前故障造成重大事故。下表1是同一个电力事件下工作任务单、工作票和修试记录的示例。
表1工作任务单、工作票及修试记录示例
S2、对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;为了提高实体识别结果的精确率和召回率,采用添加用户字典的方式,对实体识别的结果进行了修正。通过实体识别,可以得到文本中所有的实体提及集合M={m1,m2,…,mi},i为实体提及个数。
最初抽取出来的实体提及可能存在同义词、缩写错误或可能拥有几个不同名称等情形,故先对实体提及做描述形式上的归一化处理,即把初步的实体映射到一种标准的表达形式,本文通过构建同义词表解决该问题。具体地,本文在知识图谱中构造一个如表2的同义词表来解决实体描述的统一性问题。该同义词表存储的是实体到实体之间的映射,关键字(key)是文本中可能出现的各种不规则形式的实体(如简写、同义词等),而键值(value)则是关键字对应的实体的标准描述。
表2同义词表示意
S3、利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;
如图2-4所示,需要说明的是在S3中,采用如下方法构建电力设备知识图谱:
根据专家经验及检修标准文档的业务规则,采用自顶而下,构建知识图谱本体架构;在本申请的一个实施例中,电力运检业务中,使用电力工程台账、工单、工作票、修试记录等业务数据以及检修相关标准文档,根据一线检修人员的业务经验与标准文档中所述业务规则,可直接用来指导知识图谱本体的自顶向下的构建。电力设备知识图谱本体架构Schema覆盖了设备、部件、部位、缺陷、故障、描述、原因、解决方案、场/站/线、单位、人员、持票种类等信息在内的输电架空线路工程运检概念。按照梳理分类构建的本体如图3所示.
对于领域知识图谱数据层来说,需要在概念层的指导下抽取电力领域工作任务单、工作票及修试记录中涉及到的数据知识。知识抽取的过程是在多种数据形式下提炼并抽取出统一格式的数据。在输电架空线路运检工程中,主要有包含工单、工作票、标准及修试记录的半/非结构化电力运检文本数据和来自工作台账的结构化电力运检数据,半/非结构化数据会经过分词、词性标注及句法分析等处理,再通过实体、关系及属性抽取统一成结构化数据,以三元组的形式用neo4j图数据库存储下来,电力设备知识图谱构建流程如图4所示。
在知识图谱本体架构下,对工作任务单、工作票及修试记录进行知识抽取,形成电力设备知识图谱知识库。
在本申请实施例提供的电力设备检修工作单据智能生成方法中,采用领域知识图谱优化运检领域知识管理,通过梳理现有输电架空线路业务数据、知识和专家经验,自上而下构建本体架构及知识图谱数据层,易于对知识体系进行全面把握和认知推理。
还包括在进行实体链接之前,为每个待消歧的实体提及构建一个候选实体列表,消除歧义,并根据实体提及对应的候选实体情况判断候选实体是否为可链接。在本实施例提供的电力设备检修工作单据智能生成方法中,采用候选实体表来缩小实体链接的搜索空间,提高搜索效率。
本文在知识图谱中构建了一个候选实体列表(见表3),这个表存储的是实体(key)及其对应的无歧义实体列表(list),其中表示实体提及mi所对应的第k个候选实体对象。最终得到实体提及项集合M的初步候选实体对象集合。这个表的key就是实体的标准表达形式,即同义词表中对应的Value。
表3候选实体列表示意
所述实体提及对应的候选实体情况包括以下三种:
Case1、该实体提及在候选实体列表中所对应的候选实体个数为0,候选实体不可链接;
Case2、该实体提及候选实体列表所对应的候选实体个数为1,存在唯一候选实体可连接;
Case3、该实体提及候选实体列表所对应的候选实体个数大于1时,存在多个候选实体可连接,则对可链接的候选实体进行排序。
按照以下方法对所述对可链接候选实体进行排序:
通过eLDA概率模型在主题上的候选实体分布,得到每个候选实体的主题分布,根据LDA概率模型在主题上的文本分布,得到文本的主题分布,对文本中的每个实体提及,计算每个候选实体的主题分布与文本的主题分布的余弦相似度,根据余弦相似度值进行排序,则相似度最小的为最终链接的实体。
在本发明的一个实施例中,工作任务单中的实体提及所对应的候选实体有三种情况,当候选实体|ni|=0时,说明未在知识库中找到对应的实体,则实体mi被认为是不可链接的,返回标签Empty;当|ni|=1时,直接返回唯一的候选实体作为最终链接实体;当|ni|>1时,对候选实体进行排序。候选实体排序主要采用基于概率主题模型的语义主题建模方法。
对于给定一篇文档d,从表面上看d是由一些离散的单词w组成的,同时也可以认为是一组命名实体或实体提及e组成的。特别的,抽取词和抽取实体的两个过程相互独立,互不影响。不妨假设:既然得到的这两个集合w和e是出自同一篇文档,那么二者应该符合同一个语义主题分布。从词的角度,每个词会有自己的一个主题分布,实体亦是如此。根据不同实体的主题分布之间的相似性关系,可以解决实体歧义的问题。图5展示了对应于实体语义消歧的概率图模型Entity based Latent Dirichlet Allocation(eLDA)。
通过eLDA在主题上的实体分布Φe,可得到每个实体的主题分布Te,根据LDA由w能得到文本的主题分布Td,对M中的每个实体提及mi,计算其每个候选实体的主题分布与文档的主题分布的余弦相似度,最相近的那个便是最终要链接到的实体。
在根据得出的实体链接进行路径搜索时,包括以下方法:将知识图谱中所有节点分为三个子集合,所述子集合包括起点集、中点集和终点集;通过Dijkstra贪心算法依次求起点集到中间节点集之间的局部最优路径、中间节点集中所有节点的局部最优路径、中间节点集到终点集之间的局部最优路径,得出从起点出发经过指定的所有中间节点后到达终点的全局最优路径。所述起点集包含起点;所述中点集包含全部的需要经过的中间节点;所述终点集包含终点。
在本发明的一个实施例中,通过实体链接技术,可识别出工作任务单中工作内容涉及到的相关实体,例如对于“110kv双马一线47#杆塔塔身有鸟巢”这一工作内容,可链接到“110kv架空线路工程”、“双马一线”、“杆塔”、“有异物”等在知识图谱中的节点,但在生成工作票过程中仅这些节点信息是不够的,需要找到和这些节点相连的其它节点信息,例如“故障解决方案”、“运检班组”、“工作人员”等节点,这就涉及到有权重的有向图路径搜索技术。在该场景中,需要涉及到两条搜索路径,一条是以“110kv架空线路工程”为起始节点,通过实体链接中其它节点做为必经中间节点去寻找以“解决故障方案”为目标节点的路径,另外一条是以地点描述为起始点,通过必经实体链接节点寻找以工作人员为目标节点的路径。但是,在路径搜索过程中,目标节点的具体描述是不可知的,这就需要将节点标签做为目标节点信息去搜索路径。
Dijkstra算法只能解决最基本的在起点和终点之间求最优路径的问题,无法解决添加其他限制条件的路径问题。基于贪心算法,将原问题分解成几个易于用Dijkstra算法求解的子问题,先对各个子问题逐一求局部最优解,再在此基础上求全局最优解。
在利用通过Dijkstra贪心算法求取最优路径前,还包括以下几方面:
(1)知识图谱中的权重
采用基于专家经验和实际场景中用户点击率的混合权重赋值法。在知识图谱权重初始状态,会根据专家经验来给知识图谱中边的权重赋初始值,而后根据用户点击率或知识图谱中节点使用率更新边权重值,使用率越多,权重值更新后数值越大,最终知识图谱中权重值会趋于稳定。
(2)剪枝
从起点出发,深度优先遍历知识图谱的神经网络,对没有遍历到的节点,从知识图谱网络的原神经网络中删掉,形成新的神经网络,利用新的神经网络求取最优路径。在本实施例中,通过删掉没有遍历到的节点,实现了在不影响求目标路径的情况下,通过减少网络中节点个数,来大幅提高算法的时间效率。
具体方法为,从起点V begin出发,深度优先遍历该图,那些没有遍历到的节点肯定不会出现在目标路径上,就可以将它们从原网络图中“剪”掉。从而生成新的网络图G(V,E),替换原来的网络图Gold(V,E),剪枝的目的是在不影响求目标路径的情况下,通过减少网络中节点个数,来大幅提高算法的时间效率。
(3)搜索
在生成全局最优路径时,包括在中点集中,判断需要经过的指定中间节点中任意两个节点之间的连通情况,根据节点之间的连通情况判断是否存在满足条件的路径;当满足条件的路径存在时,对指定中间节点进行全排列,生成中间节点序列,计算中间节点序列中,起点到终点的第一路径;利用中间节点序列的起点和终点,分别计算目标原点到中间节点序列起点之间的第二路径以及目标终点到中间节点序列终点之间的第三路径;对第一路径、第二路径和第三路径按照顺序连接,得出全程最优路径。
具体为:1)假设需要经过的指定中间节点个数为n,先判断这n个节点之间的连通情况,若有任意俩节点不连通,则满足条件的路径不存在;反之,进入下一步。
判断是否连通的方法:在这n个节点中,任选一个为根节点,深度优先遍历该图,若其他的n-1个所有节点都遍历到了,则是连通的;反之,则为未连通的。
2)对这n个中间节点做全排列,生成一个中间节点序列。全排列的起点记为V1,终点记为Vn。计算V1和Vn之间的最优路径。
具体方法,对于一个中间节点序列,若任意俩相邻节点有边直接相连,则它们之间的距离为对应边的权重值,反之,使用Dijkstra算法求出它们之间的最优路径。若它们之间的路径经过了自由节点,则应将自由节点保存到该路径中。将所有相邻节点相连即得V1和Vn之间的最优路径。
3)求目标源点到V1的局部最优路径,即为单源点最优路径,直接使用Dijkstra算法即可。若目标源点和V1之间的路径经过了自由节点,则将经过的自由节点按序保存到该局部路径中。
4)求Vn到目标终点的局部最优路径,即为单源点最优路径,直接使用Dijkstra算法即可。若Vn和目标终点之间的路径经过了自由节点,则将经过的自由节点按序保存到该局部路径中。
5)将以上3条路径依序连接起来即得经过Smid中所有节点的全程最优路径。
S4、将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。
在得到两条路径节点后,工作票智能输出所需的节点信息也基本满足。采用基于模板的填槽式生成技术,将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。
本申请实施例提供的电力设备检修工作单据智能生成方法,采用知识图谱支撑运检业务知识的积累传承。将设备部件或部位名称及其之间的关系、缺陷状态和缺陷等级以可视化的方式存储展示,便于理解和工程化应用。所述对实体提及进行归一化处理包括:将实体提及集合中的实体提及映射到同义词表中,将识别出的实体提及利用同义词表中该实体提及所对应的标准实体表示。
本发明还提供一种电力设备检修工作单据智能生成***,如图7所示,用于实施上述方法,包括;
关键词提取模块1,用于获取电力运检的工作任务单,在工作任务单中提取关键词;具体参考上述方法中的步骤1,并在提取关键字及获取的工作任务单,参见上述方法对应的实施例,在此不再赘述。
实体抽取模块2,用于对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;具体参考上述方法中的步骤2,并参见上述方法对应的实施例,在此不再赘述。
路径搜索模块3,用于利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;具体参考上述方法中的步骤3,并参见上述方法对应的实施例,在此不再赘述。
工作票据输出模块4,用于将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。具体参考上述方法中的步骤4,并参见上述方法对应的实施例,在此不再赘述。
本发明还提供一种存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述电力设备检修工作单据智能生成方法的步骤。
本发明提供的电力设备检修工作单据智能生成***,提出电力设备检修知识图谱推广技术,实现知识驱动的可解释推理决策。将电力设备领域知识图谱应用到设备检修辅助决策场景中,将设备部件或部位名称及其之间的关系、缺陷状态和缺陷等级以可视化的方式存储展示,便于理解和工程化应用;提出基于电力设备知识图谱的最优路径搜索,通过实体链接技术将工作单中的实体提及与知识图谱中实体节点匹配,在匹配的节点约束下搜索工作票所需节点信息路径,并基于模板智能生成工作票,提高了电力设备维修的工作效率,辅助维修人员做出判断
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
Claims (10)
1.一种电力设备检修工作单据智能生成方法,其特征在于,包括:
获取电力运检的工作任务单,在工作任务单中提取关键词;
对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;
利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;
将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。
2.根据权利要求1所述的电力设备检修工作单据智能生成方法,其特征在于,采用如下方法构建电力设备知识图谱:
根据专家经验及检修标准文档的业务规则,采用自顶而下,构建知识图谱本体架构;
在知识图谱本体架构下,对工作任务单、工作票及修试记录进行知识抽取,形成电力设备知识图谱知识库。
3.根据权利要求1所述的电力设备检修工作单据智能生成方法,其特征在于,还包括在进行实体链接之前,为每个待消歧的实体提及构建一个候选实体列表,消除歧义,并根据实体提及对应的候选实体情况判断候选实体是否为可链接。
4.根据权利要求3所述的电力设备检修工作单据智能生成方法,其特征在于,所述实体提及对应的候选实体情况包括以下三种:
Case1、该实体提及在候选实体列表中所对应的候选实体个数为0,候选实体不可链接;
Case2、该实体提及候选实体列表所对应的候选实体个数为1,存在唯一候选实体可连接;
Case3、该实体提及候选实体列表所对应的候选实体个数大于1时,存在多个候选实体可连接,则对可链接的候选实体进行排序。
5.根据权利要求4所述的电力设备检修工作单据智能生成方法,其特征在于,按照以下方法对所述对可链接候选实体进行排序:
通过eLDA概率模型在主题上的候选实体分布,得到每个候选实体的主题分布,根据LDA概率模型在主题上的文本分布,得到文本的主题分布,对文本中的每个实体提及,计算每个候选实体的主题分布与文本的主题分布的余弦相似度,根据余弦相似度值进行排序,则相似度最小的为最终链接的实体。
6.根据权利要求1所述的电力设备检修工作单据智能生成方法,其特征在于,在根据得出的实体链接进行路径搜索时,包括以下方法:
将知识图谱中所有节点分为三个子集合,所述子集合包括起点集、中点集和终点集;
通过Dijkstra贪心算法依次求起点集到中间节点集之间的局部最优路径、中间节点集中所有节点的局部最优路径、中间节点集到终点集之间的局部最优路径,得出从起点出发经过指定的所有中间节点后到达终点的全局最优路径。
7.根据权利要求6所述的电力设备检修工作单据智能生成方法,其特征在于,在利用通过Dijkstra贪心算法求取最优路径前,从目标起点出发至目标终点,深度优先遍历知识图谱的神经网络,对没有遍历到的节点,从知识图谱网络的原神经网络中删掉,形成新的神经网络,利用新的神经网络求取最优路径。
8.根据权利要求6所述的电力设备检修工作单据智能生成方法,其特征在于,在生成全局最优路径时,包括:
在中点集中,判断需要经过的指定中间节点中任意两个节点之间的连通情况,根据节点之间的连通情况判断是否存在满足条件的路径;
当满足条件的路径存在时,对指定中间节点进行全排列,生成中间节点序列,计算中间节点序列中,起点到终点的第一路径;
利用中间节点序列的起点和终点,分别计算目标原点到中间节点序列起点之间的第二路径以及目标终点到中间节点序列终点之间的第三路径;
对第一路径、第二路径和第三路径按照顺序连接,得出全程最优路径。
9.一种电力设备检修工作单据智能生成***,其特征在于,包括
关键词提取模块,用于获取电力运检的工作任务单,在工作任务单中提取关键词;
实体抽取模块,用于对关键词进行实体识别,得到实体提及集合,对实体提及进行归一化处理,得到识别的实体;
路径搜索模块,用于利用构建的电力设备知识图谱,进行实体链接,并根据得出的实体链接进行路径搜索,得到路径节点信息;
工作票据输出模块,用于将路径节点信息按照预先规定的顺序和槽位填充后输出文本,形成电力检修工作票据。
10.一种存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述电力设备检修工作单据智能生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110528152.9A CN113095524A (zh) | 2021-05-14 | 2021-05-14 | 电力设备检修工作单据智能生成方法、***及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110528152.9A CN113095524A (zh) | 2021-05-14 | 2021-05-14 | 电力设备检修工作单据智能生成方法、***及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113095524A true CN113095524A (zh) | 2021-07-09 |
Family
ID=76665487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110528152.9A Pending CN113095524A (zh) | 2021-05-14 | 2021-05-14 | 电力设备检修工作单据智能生成方法、***及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113095524A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113656532A (zh) * | 2021-08-16 | 2021-11-16 | 雅砻江流域水电开发有限公司 | 工作票与操作票智能检索*** |
CN114237240A (zh) * | 2021-12-07 | 2022-03-25 | 内蒙古黄陶勒盖煤炭有限责任公司 | 智能清淤机器人及其行走控制方法 |
CN116719955A (zh) * | 2023-08-09 | 2023-09-08 | 北京国电通网络技术有限公司 | 标签标注信息生成方法、装置、电子设备和可读介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090091074A (ko) * | 2008-02-21 | 2009-08-26 | 가부시끼가이샤 도시바 | 최적 경로 탐색 장치, 방법 및 프로그램을 기록한 기록매체 |
CN109241294A (zh) * | 2018-08-29 | 2019-01-18 | 国信优易数据有限公司 | 一种实体链接方法及装置 |
CN110457447A (zh) * | 2019-05-15 | 2019-11-15 | 国网浙江省电力有限公司电力科学研究院 | 一种电网任务型对话*** |
CN111680804A (zh) * | 2020-06-02 | 2020-09-18 | 中国电力科学研究院有限公司 | 一种运检工作票生成方法、设备以及计算机可读介质 |
CN111949787A (zh) * | 2020-08-21 | 2020-11-17 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
CN112084781A (zh) * | 2020-09-10 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种标准术语确定方法、装置及存储介质 |
-
2021
- 2021-05-14 CN CN202110528152.9A patent/CN113095524A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090091074A (ko) * | 2008-02-21 | 2009-08-26 | 가부시끼가이샤 도시바 | 최적 경로 탐색 장치, 방법 및 프로그램을 기록한 기록매체 |
CN109241294A (zh) * | 2018-08-29 | 2019-01-18 | 国信优易数据有限公司 | 一种实体链接方法及装置 |
CN110457447A (zh) * | 2019-05-15 | 2019-11-15 | 国网浙江省电力有限公司电力科学研究院 | 一种电网任务型对话*** |
CN111680804A (zh) * | 2020-06-02 | 2020-09-18 | 中国电力科学研究院有限公司 | 一种运检工作票生成方法、设备以及计算机可读介质 |
CN111949787A (zh) * | 2020-08-21 | 2020-11-17 | 平安国际智慧城市科技股份有限公司 | 基于知识图谱的自动问答方法、装置、设备及存储介质 |
CN112084781A (zh) * | 2020-09-10 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种标准术语确定方法、装置及存储介质 |
Non-Patent Citations (3)
Title |
---|
乔骥 等: "面向电网调度故障处理的知识图谱框架与关键技术初探", 中国电机工程学报, vol. 40, no. 18, pages 1 - 2 * |
乔骥等: "面向电网调度故障处理的知识图谱框架与关键技术初探", 《中国电机工程学报》 * |
乔骥等: "面向电网调度故障处理的知识图谱框架与关键技术初探", 《中国电机工程学报》, vol. 40, no. 18, 20 September 2020 (2020-09-20), pages 1 - 2 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113656532A (zh) * | 2021-08-16 | 2021-11-16 | 雅砻江流域水电开发有限公司 | 工作票与操作票智能检索*** |
CN113656532B (zh) * | 2021-08-16 | 2024-05-07 | 雅砻江流域水电开发有限公司 | 工作票与操作票智能检索*** |
CN114237240A (zh) * | 2021-12-07 | 2022-03-25 | 内蒙古黄陶勒盖煤炭有限责任公司 | 智能清淤机器人及其行走控制方法 |
CN114237240B (zh) * | 2021-12-07 | 2023-10-27 | 内蒙古黄陶勒盖煤炭有限责任公司 | 智能清淤机器人及其行走控制方法 |
CN116719955A (zh) * | 2023-08-09 | 2023-09-08 | 北京国电通网络技术有限公司 | 标签标注信息生成方法、装置、电子设备和可读介质 |
CN116719955B (zh) * | 2023-08-09 | 2023-10-27 | 北京国电通网络技术有限公司 | 标签标注信息生成方法、装置、电子设备和可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112612902A (zh) | 一种电网主设备的知识图谱构建方法及设备 | |
CN111708773B (zh) | 一种多源科创资源数据融合方法 | |
CN113095524A (zh) | 电力设备检修工作单据智能生成方法、***及存储介质 | |
CN111985653B (zh) | 基于知识图谱的电网故障知识推荐与知识管理***及方法 | |
CN114579875A (zh) | 基于知识图谱的设备故障诊断与维修知识推荐*** | |
CN112685570B (zh) | 一种基于多标签图的电网网架知识图谱的构建方法 | |
CN112395424A (zh) | 一种复杂产品质量问题追溯方法及*** | |
CN105574675B (zh) | 基于计算规则库的建筑工程规划监督方法和*** | |
CN114077674A (zh) | 一种电网调度知识图谱数据优化方法及*** | |
CN114138759A (zh) | 基于知识图谱推理的二次设备故障处理推送方法及*** | |
CN116010570A (zh) | 基于知识图谱的电力数据的查询方法、装置及电子设备 | |
CN112084323B (zh) | 一种适航审定协同工作平台及方法 | |
CN113111659A (zh) | 电力巡检工作票生成方法、***、设备及存储介质 | |
CN117273133A (zh) | 配电网多源异构数据知识图谱的构建方法 | |
CN112668733A (zh) | 基于无监督学习的通信管理***缺陷故障派单方法及装置 | |
Kai et al. | Research on intelligent technology of dispatching and control to ensure power supply based on multivariate information | |
CN115827885A (zh) | 一种运维知识图谱的构建方法、装置及电子设备 | |
Si et al. | Research on comprehensive evaluation of distribution network based on Knowledge Graphs | |
CN114860891A (zh) | 一种智慧管网时空图谱构建的方法及装置 | |
CN112685608A (zh) | 一种基于cypher的电网调度领域知识属性图模型构建方法 | |
CN113987164A (zh) | 一种基于领域事件知识图谱的项目研判方法及装置 | |
CN112668836A (zh) | 一种面向风险图谱的关联风险证据高效挖掘与监控方法和装置 | |
CN116611793B (zh) | 一种基于特征分析的业务数据归纳方法及*** | |
CN117435777B (zh) | 一种产业链图谱自动构建方法与*** | |
An et al. | Intelligent filling method of power grid working ticket based on historical ticket knowledge base |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |