CN113886469B - 基于多源数据的配电网工程成效异常自动挖掘方法及*** - Google Patents
基于多源数据的配电网工程成效异常自动挖掘方法及*** Download PDFInfo
- Publication number
- CN113886469B CN113886469B CN202111461264.3A CN202111461264A CN113886469B CN 113886469 B CN113886469 B CN 113886469B CN 202111461264 A CN202111461264 A CN 202111461264A CN 113886469 B CN113886469 B CN 113886469B
- Authority
- CN
- China
- Prior art keywords
- project
- engineering
- equipment
- library
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000000694 effects Effects 0.000 title claims abstract description 25
- 238000005065 mining Methods 0.000 title claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 24
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 238000002372 labelling Methods 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims description 23
- 230000000875 corresponding effect Effects 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000011835 investigation Methods 0.000 claims description 6
- 238000011160 research Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000003058 natural language processing Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims description 3
- 230000001788 irregular Effects 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000013179 statistical model Methods 0.000 claims description 2
- 238000009412 basement excavation Methods 0.000 abstract description 2
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2468—Fuzzy queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于电力工程技术领域,涉及一种基于多源数据的配电网工程成效异常自动挖掘方法及***,包括收集配电网工程资料、设备台账信息以及问题事件;根据工程资料中的工程名称提取出设备信息,并与实际设备台账进行模糊匹配,以设备为纽带建立工程和问题的关联关系;建立工程类别和解决问题类型的映射关系,通过工程标签化实现具体工程和问题的一一对应,取工程实施前后发生的所有问题与存在对应关系问题的交集,获得工程实施前后的关联问题,计算问题变化量,研判成效异常的工程;将工程实施后的设备台账情况与工程量比对,研判工程投运情况;通过工程成效异常及投运情况研判实现了配电网工程成效异常自动挖掘。
Description
技术领域
本发明属于配用电技术领域,更具体地,涉及配电网工程建设成效后评价技术领域,特别涉及一种基于多源数据的配电网工程成效异常自动挖掘方法及***。
背景技术
配电网建设改造工程具有单体项目投资金额小、整体体量大的特点,实施后难以对全量工程建设成效进行评价,往往采用整体数据与典型项目评价结合的方式。但现有方法仅能在宏观上分析总体成效,在评价过程中无法找出成效异常的项目,导致仍然有很多工程建设成效未达到预期,造成投资的浪费。
现阶段,由于无法开展项目级配电网工程建设成效评价、主动发现工程实施问题,仍有部分工程存在施工工艺差、重复立项、虚假完工等现象,导致投资成效不达预期。而全量工程成效评价中主要的问题是数据来源复杂,人工收资的真实性、客观性难以保障,***数据不能互联互通,难以把各类数据对应到工程。
为改善配电网工程建设成效评价方式较为粗犷的现状,挖掘工程建设中存在的问题,有效指导下一步工作开展,减少低效投资,本发明提出的多源数据的配电网工程成效异常自动挖掘方法及***,基于各大业务***中存储的数据,利用大数据手段,通过对比工程实施前后的问题解决情况,挖掘建设过程中存在的问题,主动研判工程是否存在建设成效异常,实现对全量工程建设成效扫描。
发明内容
为了解决上述背景技术中的问题,本发明提出一种基于多源数据的配电网工程成效异常挖掘方法及***,无需人工线下填报,基于PMS2.0、配电自动化***、用电信息采集***、智能化供电服务指挥***等线上数据自动完成收资环节,利用大数据手段和自然语言处理技术进行多源非结构化数据处理及关联,主动研判工程建设后未解决问题、工程未完工投运等异常现象,实现工程实施成效异常的智能化、自动化挖掘。
本发明通过下述技术方案来实现。一种基于多源数据的配电网工程成效异常自动挖掘方法,包括以下具体步骤:
S1.数据获取:从配网工程管控***中获取计划下达项目资料,存储在项目库;从设备资产运维精益管理***中获取设备台账信息,从配电自动化***中获取线路开关台账和在线情况,从用电信息采集***中获取台区电压、电流数据,存储在设备库;从智能化供电服务指挥***中获取发生的问题事件,存储在问题库;
S2.基于设备的多源数据关联:从项目库中存储的工程名称字段,利用正则匹配法提取出设备名称,把工程分解到具体的10kV线路和台区;利用字符串模糊匹配方法将项目库中的设备名称与设备库的台账进行匹配,并将工程匹配成功的台账设备存入项目库;利用项目库中存储的台账设备关联到问题库中存储的问题事件,按照工程实施前一年、工程实施后一年分别统计问题类型s1、s2、s3... sj...sn和次数,其中n为问题类型总数量,sj为第j类问题类型,并存储到项目库;
S3.工程标签化:将所有工程按照新建改造设备类别进行分类,得到工程类别r1、r2、r3... ri...rm,m为工程类别总数量,ri为第i类工程类别,对每个工程类别建立对应的关键词序列,遍历项目库中所有工程,利用正则匹配方法对工程实施内容进行关键词检索,匹配到关键词则该项目对应工程类别ri的标签,则ri=1,否则ri=0,将每个工程中ri=1的工程类别ri的对应的工程类别标签存储在项目库;
S4.建立工程与问题映射关系:设置工程类别集{r1、r2、r3... ri...rm};将所有问题类型分类,得到问题类型集{s1、s2、s3...sj...sn};建立二维映射表,其中行标签为工程类别标签,列标签为问题类型标签,若工程类别ri对应的建设内容能够解决问题类型sj,则映射关系(ri,sj)=1,否则(ri,sj)=0;在步骤S2中已得到工程实施前后的所有问题,若工程实施前或实施后存在问题类型sj,即sj=1,则在该工程中保留问题类型标签,否则在该工程中删掉问题类型标签;在步骤S3中已得到工程类别标签,若第i类工程类别标签与第j类问题类型标签存在映射关系,即(ri,sj)=1,则保留问题类型sj,否则删除问题类型sj,遍历所有工程,并将计算得到的实施前后问题存入项目库;
S5.工程量分解:利用正则方法提取工程内容中的工程量,分解到线路、台区、开关,把工程量转化为结构化数据;将每个工程的工程量分解结果与设备库现状信息比对,研判设备投运结果,并存储在项目库;
S6.异常成效挖掘:在步骤S4中得到工程实施前、实施后存在的问题类型,假设实施前问题类型集为Σsi(i=1,2,…n1),n1为实施前问题类型总数量,实施后问题类型集为Σsj(j=1,2,…n2),n2为实施后问题类型总数量,则工程解决的问题类型集应为∆s=Σsi-Σsj,设工程解决的问题类型集∆s中存在的问题类型数量为a,若a>0,则工程具备成效,若a≤0,则工程成效异常;在步骤S5中得到设备投运研判结果,若研判结果为“是”,则设备正常投运,若研判结果为“否”,则设备疑似未投运;结合两项研判结果,分析工程成效异常原因,并反馈给业主单位校核。
进一步优选,步骤2具体过程如下:
S21.项目库数据规范化:项目库中存储了工程立项资料,对工程命名进行规范化处理,按照工程分类将命名不规范的字符替换为规范内容;
S22.项目库设备名称提取:从规范化的工程名称字段,通过第一个字符“线”把线路和台区部分分割,分别利用正则匹配法提取出设备名称,把工程分解到具体的10kV线路和台区,并存储在项目库中。
S23.项目库与设备库模糊匹配:按照县公司-线路-台区顺序将项目库中的设备名称与设备库的台账一一匹配;
S24.关联问题库:利用项目库中计算得到的线路、台区设备,与问题库关联,按设备统计问题库中的问题事件,统计工程实施前一年、工程实施后一年设备发生的所有问题类型和次数,存储到项目库。
进一步优选,步骤S23中,线路匹配过程如下:
S231.从项目库提取工程立项信息表,从设备库提取设备台账信息表,分别按县公司分组,并保留工程名称、线路、台区相关字段;
S232.对同一县公司的线路开展匹配,去掉工程立项信息表中线路名称的固定字符,仅保留直接描述对应设备的字符串,作为输入字符串xli,li是输入线路的索引,li∈L1,L1为工程立项信息表中该县公司分组下线路的集合;
S233.将设备库线路台账信息作为索引字符串ylj,遍历索引字符串ylj,lj是线路台账的索引,lj∈L2,L2为该县公司分组下线路台账信息的集合,计算xli和ylj之间的编辑距离,并根据编辑距离在输入字符串长度占比来计算匹配度得分,采用非完全匹配方式,即若xli∈ylj,则匹配度得分为100;
S234.根据实际匹配情况确定阈值k1,返回匹配得分clj最高的索引字符串ylj,若该字符串匹配得分clj≥k1,则完成线路匹配,返回ylj作为输入字符串xli的匹配结果;
S235.遍历所有县公司分组,返回全部工程的线路部分匹配结果,存储在项目库。
进一步优选,步骤S23中,台区匹配过程如下:
S236.若为台区工程,即工程信息中含有台区相关字段,则继续对已匹配到线路的台区进一步匹配,去掉工程立项信息表中台区名称的固定字符,仅保留直接描述对应设备的字符串,作为输入字符串qti,ti是输入台区的索引,ti∈T1,T1为工程立项信息表中该县公司分组下台区的集合;
S237.将设备库台区台账信息作为索引字符串wtj,tj是台区台账的索引,tj∈T2,T2为该县公司分组下台区台账信息的集合,当qti和wtj所属线路相同时,计算qti和wtj之间的编辑距离,并根据编辑距离在输入字符串长度占比来计算匹配度得分,采用非完全匹配方式,即若qti∈wtj,则匹配度得分为100;
S238.根据实际匹配情况确定阈值k2,返回匹配得分etj最高的索引字符串wtj,若该字符串匹配得分etj≥k2,则完成台区匹配,返回wtj作为输入字符串qti的匹配结果;
S239.遍历所有县公司分组,返回全部台区工程的匹配结果,存储在项目库。
本发明还提供了一种基于多源数据的配电网工程异常成效自动挖掘***:包括数据获取模块、项目库模块、问题库模块、设备库模块、结果输出模块;数据获取模块用于收集评价所需的工程信息、问题信息和设备台账信息,根据信息来源和类型,分别推送到项目库模块、问题库模块和设备库模块;问题库模块用于建立问题统计模型,对问题事件进行分类和统计;设备库模块用于建立设备匹配模型,匹配工程设备并通过设备将各类信息进行关联,将工程设备匹配结果和问题关联结果推送至项目库模块;项目库模块用于建立工程分析模型,通过工程名称、工程内容字段,利用自然语言处理方法分析工程设备和工程量,计算工程实施前后问题变化量,研判工程成效,研判工程真实投运情况;结果输出模块用于输出工程成效和投运情况研判结果。
本发明提出了一种基于多源数据的配电网工程成效异常自动挖掘方法及***,包括收集配电网工程资料、设备台账信息以及问题事件。根据工程资料中的工程名称提取出设备信息,将工程分解到10kV线路和台区,并与实际设备台账进行模糊匹配,以设备为纽带建立工程和问题的关联关系,统计工程实施前后问题的类型及数量;建立工程类别和解决问题类型的映射关系,通过工程标签化实现具体工程和问题的一一对应,取工程实施前后发生的所有问题与存在对应关系问题的交集,获得工程实施前后的关联问题,计算问题变化量,研判成效异常的工程;利用自然语言处理方法实现工程量的结构化分解,并将工程实施后的设备台账情况与工程量比对,研判工程投运情况;通过工程成效异常及投运情况研判实现了配电网工程成效异常自动挖掘。
本发明解决了配电网工程及问题等数据数出多源、无法关联的问题,把工程成效分析从线下转移到线上,确保数据的真实性、准确性、实时性,有益于减少人员填报表格的工作量,极大地提升了分析效率,实现了全量工程的成效分析。
附图说明
图1是基于多源数据的配电网工程成效异常挖掘方法流程图。
图2是基于多源数据的配电网工程成效异常挖掘***框架图。
图中:10-数据获取模块、20-项目库模块、30-设备库模块、40-问题库模块、50-结果输出模块。
具体实施方式
下面结合附图和实施例进一步详细阐明本发明。
一种基于多源数据的配电网工程成效异常自动挖掘方法,包括以下具体步骤:
S1.数据获取
S11.从配网工程管控***中获取评价对象的立项、投运资料,存储在项目库。
S12.从设备资产运维精益管理***(PMS2.0***)中获取10kV线路、配变及开关等主设备台账信息,从配电自动化***中获取线路DTU、FTU台账和在线情况,从用电信息采集***中获取台区电压、电流数据,存储在设备库。
S13.从智能化供电服务指挥***中获取线路跳闸、线路重过载、停电投诉、台区出口低电压、台区重过载、用户低电压、用户低电压投诉等问题事件,存储在问题库。
S2、基于设备的多源数据关联
S21.项目库数据规范化:项目库中存储了工程立项资料,规范命名通常为“10kVxx线新建(改造)工程”“10kVxx线xx支线新建(改造)工程”“10kVxx线xx台柱上开关新建(改造)工程”“10kVxx线xx台区新建(改造)工程”“10kVxx线xx台区低压线路新建(改造)工程”等,对工程命名进行规范化处理,按照工程分类将命名不规范的字符替换为规范内容。
S22.项目库设备名称提取:从规范化的工程名称字段,通过第一个字符“线”把线路和台区部分分割,分别利用正则匹配法提取出设备名称,把工程分解到10kVxx线和xx台区,并存储在项目库中。
S221.示例1:某规范化的工程名称为“10kV龚代一线板上台区低压线路改造工程”,通过第一个字符“线”把工程名称中的线路和台区部分分解出来,分别为“10kV龚代一线”和“板上台区低压线路改造工程”。对线路部分利用正则方法“10kV.*线”匹配得到线路名称“10kV龚代一线”,对台区部分利用正则方法“\D.*台区”匹配得到台区名称“板上台区”。
S222.示例2:某规范化的工程名称为“10kV城南线04B台区改造工程”,通过第一个字符“线”把工程名称中的线路和台区部分分解出来,分别为“10kV城南线”和“04B台区”。对线路部分利用正则方法“10kV.*线”匹配得到线路名称“10kV城南线”,对台区部分利用正则方法“线#\d.*台区”研判出首字符为数字,与工程名称匹配得到台区部分,并将台区部分与线路部分整合得到台区名称“10kV城南线04B台区”。
S23.项目库与设备库模糊匹配:按照县公司-线路-台区顺序将项目库中的设备名称与设备库的台账一一匹配。
线路匹配过程如下:
S231.从项目库提取工程立项信息表,从设备库提取设备台账信息表,分别按县公司分组,并保留工程名称、线路、台区相关字段;
S232.对同一县公司的线路开展匹配,去掉工程立项信息表中线路名称的“10kV”“线”等固定字符,仅保留直接描述对应设备的字符串,作为输入字符串xli,li是输入线路的索引,li∈L1,L1为工程立项信息表中该县公司分组下线路的集合;
S233.将设备库线路台账信息作为索引字符串ylj,遍历索引字符串ylj,lj是线路台账的索引,lj∈L2,L2为该县公司分组下线路台账信息的集合,计算xli和ylj之间的编辑距离,并根据编辑距离在输入字符串长度占比来计算匹配度得分,此处采用LevenshteinDistance计算编辑距离,过程中采用非完全匹配方式,即若xli∈ylj,则匹配度得分为100;
S234.根据实际匹配情况确定阈值k1,返回匹配得分clj最高的索引字符串ylj,若该字符串匹配得分clj≥k1,则完成线路匹配,返回ylj作为输入字符串xli的匹配结果;
S234.根据实际匹配情况确定阈值k1,返回匹配得分cj最高的索引字符串yj,若该字符串匹配得分cj≥k1,则完成线路匹配,返回yj作为输入字符串xi的匹配结果;
S235.遍历所有县公司分组,返回全部工程的线路部分匹配结果,存储在项目库。
台区匹配过程如下:
S236.若为台区工程,即工程信息中含有台区相关字段,则继续对已匹配到线路的台区进一步匹配,去掉工程立项信息表中台区名称的“台区”“配变”等固定字符,仅保留直接描述对应设备的字符串,作为输入字符串qti,ti是输入台区的索引,ti∈T1,T1为工程立项信息表中该县公司分组下台区的集合;
S237.将设备库台区台账信息作为索引字符串wtj,tj是台区台账的索引,tj∈T2,T2为该县公司分组下台区台账信息的集合,当qti和wtj所属线路相同时,计算qti和wtj之间的编辑距离,并根据编辑距离在输入字符串长度占比来计算匹配度得分,此处采用Levenshtein Distance计算编辑距离,过程中采用非完全匹配方式,即若qti∈wtj,则匹配度得分为100;
S238.根据实际匹配情况确定阈值k2,返回匹配得分etj最高的索引字符串wtj,若该字符串匹配得分etj≥k2,则完成台区匹配,返回wtj作为输入字符串qti的匹配结果;;
S239.遍历所有县公司分组,返回全部台区工程的匹配结果,存储在项目库。
S24.关联问题库:利用项目库中计算得到的线路、台区设备,与问题库关联,按设备统计问题库中的问题事件,统计工程实施前一年、工程实施后一年设备发生的所有问题类型s1、s2、s3... sj...sn和次数,其中n为问题类型总数量,sj为第j类问题类型,存储到项目库。
S3.工程标签化
S31.工程分类:将线路和台区工程分别按照新建改造设备类别分类,得到工程类别r1、r2、r3... ri...rm,m为工程类别总数量,ri为第i类工程类别。
S32.建立关键词序列:对每个工程类别建立对应的关键词序列,例如更换开关工程,关键词可设置为[‘新建/更换/改造’,‘(柱上)开关/(柱上)断路器/环网柜’]。
S33.关键词查找:遍历项目库中所有工程,取出工程立项资料中的项目内容,利用正则匹配方法对工程实施内容进行关键词检索,匹配到关键词则该项目对应工程类别ri的标签,则ri=1,否则ri=0,将每个工程中ri=1的工程类别ri的对应的工程类别标签存储在项目库。
示例:设置线路工程类别r1 =“更换开关”,工程1的项目内容为“新建改造10kV线路3km,更换柱上开关1台”,工程2的项目内容为“改造10kV线路1.2km,采用LGJ-70导线”,则工程1的标签匹配结果判断为r1=1,工程2的标签匹配结果判断为r1=0。
S34.典型线路工程类别有新建10kV架空线路、改造10kV架空线路、改造10kV电缆线路、新建开关、更换开关、新建环网柜、更换环网柜、更换避雷器等,典型台区工程类别有新建配变、更换配变、新建改造低压线路、更换低压电缆分支箱、迁移台区、更换JP柜等。
S35.完成全部工程的标签化,并将工程类别标签存入项目库。
S4.建立工程与问题映射关系
S41.工程和问题分类:建立工程类别集{r1、r2、r3... ri...rm},分类方式与工程标签化相同,典型分类为线路和台区工程如步骤S3所示;将问题库中的所有问题按照线路和台区分别分类,得到问题类型集{s1、s2、s3... sj...sn},其中n为问题类型总数量;典型的线路问题有主线跳闸、支线停运、频繁停电投诉、线路过载、线路重载等,典型的台区问题有配变出口低电压、高损配变、配变过载、配变重载、用户低电压、低电压投诉等。
S42.建立二维映射表,其中行标签为工程类别标签,列标签为问题类型标签,若第i类工程类别ri对应的建设内容能够解决对应第j类问题类型sj,则映射关系(ri,sj)=1,否则(ri,sj)=0。具体映射关系如表1和表2所示。
表1
表2
S43.在步骤S2中已得到工程实施前后的所有问题类型,若工程实施前或实施后存在问题类型sj,即sj=1,则在该工程中保留问题类型标签,否则在该工程中删掉问题类型标签;在步骤S3中已得到工程类别,第i类工程类别标签与第j类问题类型标签存在映射关系,即(ri,sj)=1,则保留问题类型sj,否则删除问题类型sj。
S44.遍历所有工程,并将计算得到的实施前后关联问题存入项目库。
S5.工程量分解
S51.确定需提取的工程量目标,例如线路、台区、开关、避雷器等主设备。
S52.针对提取目标中的每一类设备,建立描述该类设备的关键词集,利用正则方法匹配对应的关键词,并提取工程内容中属于该类设备的工程量,把工程量分解到设备,转化为结构化数据,存储在项目库。线路工程提取的工程量应包含线路型号及长度、开关台数、避雷器数量等,台区工程提取的工程量应包含配变型号及容量等。
S53.将每个工程的工程量分解结果与设备库中工程关联设备的现状信息比对,如一致则表明设备已投运并在***更新,研判设备投运结果为“是”,否则研判设备投运结果为“否”,并将研判结果存储在项目库。
S6.异常成效挖掘
S61.在步骤S4中得到工程实施前、实施后关联的问题类型,假设实施前问题集为Σsi(i=1,2,…n1),n1为实施前问题类型总数量,实施后问题集为Σsj(j=1,2,…n2),n2为实施后问题类型总数量,则工程解决的问题类型集为∆s=Σsi-Σsj,设工程解决的问题类型集∆s中存在的问题类型数量为a,若a>0,则工程具备成效,若a≤0,则工程成效异常。
S62.在步骤S5中得到设备投运研判结果,若研判结果为“是”,则设备正常投运,若研判结果为“否”,则设备疑似未投运。
S63.针对成效异常且投运研判结果为“否”的工程,说明工程未投运,导致成效差,应反馈给业主单位校核,并将结果作为评价施工单位依据;针对成效异常且投运研判结果为“是”的工程,说明工程实施质量较差或设计不合理,应反馈给业主单位校核,并将结果作为评价施工、设计单位依据;针对工程具备成效且投运研判结果为“否”的情况,应反馈给业主单位校核,并将结果作为评价施工单位依据;针对工程具备成效且投运研判结果为“是”的情况不需人工校核,可作为评价材料提供给业主单位。
为了实现上述方法,本发明提供了一种基于多源数据的配电网工程异常成效自动挖掘***,如图2所示,包括数据获取模块10、项目库模块20、设备库模块30、问题库模块40、结果输出模块50。
数据获取模块10用于收集评价所需的工程信息、问题信息和设备台账信息,根据信息来源和类型,分别推送到项目库模块20、问题库模块40和设备库模块30。
问题库模块40用于建立问题统计模型,对问题事件进行分类和统计。
项目库模块20基于工程名称,建立设备提取模型,将工程分解到线路和台区,结果输入到设备库模块30;在设备库中建立设备匹配模型,将输入设备与存储的设备台账信息进行模糊匹配,结果返回至项目库;利用设备匹配结果,关联到问题库模块40,统计工程实施前、实施后设备上的问题类型、次数等信息,结果存储在项目库。
项目库模块20建立工程-问题映射模型,对工程内容标签化后,把工程实施前后的所有问题投影到工程-问题映射模型中,得到与工程实施内容具有相关性的问题,进一步计算出工程实施对问题的解决情况,研判工程实施成效。
项目库模块20建立工程量分解模型,把工程内容转换成结构化工程量,与设备库模块30中现状设备台账进行比对,计算是否按照工程量完工投运,研判工程投运结果。
结果输出模块50用于输出工程成效和投运情况研判结果。
Claims (5)
1.一种基于多源数据的配电网工程成效异常自动挖掘方法,其特征在于,包括以下具体步骤:
S1.数据获取:从配网工程管控***中获取计划下达项目资料,存储在项目库;从设备资产运维精益管理***中获取设备台账信息,从配电自动化***中获取线路开关台账和在线情况,从用电信息采集***中获取台区电压、电流数据,存储在设备库;从智能化供电服务指挥***中获取发生的问题事件,存储在问题库;
S2.基于设备的多源数据关联:从项目库中存储的工程名称字段,利用正则匹配法提取出设备名称,把工程分解到具体的10kV线路和台区;利用字符串模糊匹配方法将项目库中的设备名称与设备库的台账进行匹配,并将工程匹配成功的台账设备存入项目库;利用项目库中存储的台账设备关联到问题库中存储的问题事件,按照工程实施前一年、工程实施后一年分别统计问题类型s1、s2、s3... sj...sn和次数,其中n为问题类型总数量,sj为第j类问题类型,并存储到项目库;
S3.工程标签化:将所有工程按照新建改造设备类别进行分类,得到工程类别r1、r2、r3... ri...rm,m为工程类别总数量,ri为第i类工程类别,对每个工程类别建立对应的关键词序列,遍历项目库中所有工程,利用正则匹配方法对工程实施内容进行关键词检索,匹配到关键词则该项目对应工程类别ri的标签,则ri=1,否则ri=0,将每个工程中ri=1的工程类别ri的对应的工程类别标签存储在项目库;
S4.建立工程与问题映射关系:设置工程类别集{r1、r2、r3... ri...rm};将所有问题类型分类,得到问题类型集{s1、s2、s3...sj...sn};建立二维映射表,其中行标签为工程类别标签,列标签为问题类型标签,若工程类别ri对应的建设内容能够解决问题类型sj,则映射关系(ri,sj)=1,否则(ri,sj)=0;在步骤S2中已得到工程实施前后的所有问题,若工程实施前或实施后存在问题类型sj,即sj=1,则在该工程中保留问题类型标签,否则在该工程中删掉问题类型标签;在步骤S3中已得到工程类别标签,若第i类工程类别标签与第j类问题类型标签存在映射关系,即(ri,sj)=1,则保留问题类型sj,否则删除问题类型sj,遍历所有工程,并将计算得到的实施前后问题存入项目库;
S5.工程量分解:利用正则方法提取工程内容中的工程量,分解到线路、台区、开关,把工程量转化为结构化数据;将每个工程的工程量分解结果与设备库现状信息比对,研判设备投运结果,并存储在项目库;
S6.异常成效挖掘:在步骤S4中得到工程实施前、实施后存在的问题类型,假设实施前问题类型集为Σsi(i=1,2,…n1),n1为实施前问题类型总数量,实施后问题类型集为Σsj(j=1,2,…n2),n2为实施后问题类型总数量,则工程解决的问题类型集应为∆s=Σsi-Σsj,设工程解决的问题类型集∆s中存在的问题类型数量为a,若a>0,则工程具备成效,若a≤0,则工程成效异常;在步骤S5中得到设备投运研判结果,若研判结果为“是”,则设备正常投运,若研判结果为“否”,则设备疑似未投运;结合两项研判结果,分析工程成效异常原因,并反馈给业主单位校核。
2.根据权利要求1所述的基于多源数据的配电网工程成效异常自动挖掘方法,其特征在于,步骤2具体过程如下:
S21.项目库数据规范化:项目库中存储了工程立项资料,对工程命名进行规范化处理,按照工程分类将命名不规范的字符替换为规范内容;
S22.项目库设备名称提取:从规范化的工程名称字段,通过第一个字符“线”把线路和台区部分分割,分别利用正则匹配法提取出设备名称,把工程分解到具体的10kV线路和台区,并存储在项目库中;
S23.项目库与设备库模糊匹配:按照县公司-线路-台区顺序将项目库中的设备名称与设备库的台账一一匹配;
S24.关联问题库:利用项目库中计算得到的线路、台区设备,与问题库关联,按设备统计问题库中的问题事件,统计工程实施前一年、工程实施后一年设备发生的所有问题类型和次数,存储到项目库。
3.根据权利要求2所述的基于多源数据的配电网工程成效异常自动挖掘方法,其特征在于,步骤S23中,线路匹配过程如下:
S231.从项目库提取工程立项信息表,从设备库提取设备台账信息表,分别按县公司分组,并保留工程名称、线路、台区相关字段;
S232.对同一县公司的线路开展匹配,去掉工程立项信息表中线路名称的固定字符,仅保留直接描述对应设备的字符串,作为输入字符串xli,li是输入线路的索引,li∈L1,L1为工程立项信息表中该县公司分组下线路的集合;
S233.将设备库线路台账信息作为索引字符串ylj,遍历索引字符串ylj,lj是线路台账的索引,lj∈L2,L2为该县公司分组下线路台账信息的集合,计算xli和ylj之间的编辑距离,并根据编辑距离在输入字符串长度占比来计算匹配度得分,采用非完全匹配方式,即若xli∈ylj,则匹配度得分为100;
S234.根据实际匹配情况确定阈值k1,返回匹配得分clj最高的索引字符串ylj,若该字符串匹配得分clj≥k1,则完成线路匹配,返回ylj作为输入字符串xli的匹配结果;
S235.遍历所有县公司分组,返回全部工程的线路部分匹配结果,存储在项目库。
4.根据权利要求3所述的基于多源数据的配电网工程成效异常自动挖掘方法,其特征在于,步骤S23中,台区匹配过程如下:
S236.若为台区工程,即工程信息中含有台区相关字段,则继续对已匹配到线路的台区进一步匹配,去掉工程立项信息表中台区名称的固定字符,仅保留直接描述对应设备的字符串,作为输入字符串qti,ti是输入台区的索引,ti∈T1,T1为工程立项信息表中该县公司分组下台区的集合;
S237.将设备库台区台账信息作为索引字符串wtj,tj是台区台账的索引,tj∈T2,T2为该县公司分组下台区台账信息的集合,当qti和wtj所属线路相同时,计算qti和wtj之间的编辑距离,并根据编辑距离在输入字符串长度占比来计算匹配度得分,采用非完全匹配方式,即若qti∈wtj,则匹配度得分为100;
S238.根据实际匹配情况确定阈值k2,返回匹配得分etj最高的索引字符串wtj,若该字符串匹配得分etj≥k2,则完成台区匹配,返回wtj作为输入字符串qti的匹配结果;
S239.遍历所有县公司分组,返回全部台区工程的匹配结果,存储在项目库。
5.一种用于实现权利要求1所述方法的基于多源数据的配电网工程异常成效自动挖掘***,其特征在于,包括数据获取模块、项目库模块、问题库模块、设备库模块、结果输出模块;数据获取模块用于收集评价所需的工程信息、问题信息和设备台账信息,根据信息来源和类型,分别推送到项目库模块、问题库模块和设备库模块;问题库模块用于建立问题统计模型,对问题事件进行分类和统计;设备库模块用于建立设备匹配模型,匹配工程设备并通过设备将各类信息进行关联,将工程设备匹配结果和问题关联结果推送至项目库模块;项目库模块用于建立工程分析模型,通过工程名称、工程内容字段,利用自然语言处理方法分析工程设备和工程量,计算工程实施前后问题变化量,研判工程成效,研判工程真实投运情况;结果输出模块用于输出工程成效和投运情况研判结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111461264.3A CN113886469B (zh) | 2021-12-03 | 2021-12-03 | 基于多源数据的配电网工程成效异常自动挖掘方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111461264.3A CN113886469B (zh) | 2021-12-03 | 2021-12-03 | 基于多源数据的配电网工程成效异常自动挖掘方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113886469A CN113886469A (zh) | 2022-01-04 |
CN113886469B true CN113886469B (zh) | 2022-04-12 |
Family
ID=79016302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111461264.3A Active CN113886469B (zh) | 2021-12-03 | 2021-12-03 | 基于多源数据的配电网工程成效异常自动挖掘方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113886469B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298056A (zh) * | 2019-03-27 | 2019-10-01 | 国网浙江海盐县供电有限公司 | 一种配电网联络有效性评估方法 |
CN112288240A (zh) * | 2020-10-15 | 2021-01-29 | 国网江西省电力有限公司电力科学研究院 | 一种配电网建设项目成效评价方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104820952B (zh) * | 2015-05-12 | 2018-06-15 | 国家电网公司 | 一种基于二型模糊理论的配电网投资成效前评估方法 |
US9785161B2 (en) * | 2015-08-24 | 2017-10-10 | University Of Rochester | Heterogeneous method for energy efficient distribution of on-chip power supplies and power network on-chip system for scalable power delivery |
US11275768B2 (en) * | 2018-05-25 | 2022-03-15 | Salesforce.Com, Inc. | Differential support for frequent pattern analysis |
CN110232490A (zh) * | 2019-03-07 | 2019-09-13 | 中国电力科学研究院有限公司 | 一种配电网工程投资成效的评估方法及*** |
-
2021
- 2021-12-03 CN CN202111461264.3A patent/CN113886469B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298056A (zh) * | 2019-03-27 | 2019-10-01 | 国网浙江海盐县供电有限公司 | 一种配电网联络有效性评估方法 |
CN112288240A (zh) * | 2020-10-15 | 2021-01-29 | 国网江西省电力有限公司电力科学研究院 | 一种配电网建设项目成效评价方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113886469A (zh) | 2022-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107402976B (zh) | 一种基于多元异构模型的电网多源数据融合方法及*** | |
CN106815373B (zh) | 基于bi分析的配网抢修大数据展示方法及*** | |
CN113159339A (zh) | 一种基于大数据的一台区一指标线损管理方法及*** | |
CN111832977A (zh) | 一种基于自然语言解析的检修申请自动成票方法 | |
CN114201844A (zh) | 一种基于iec61850标准的水电站全景建模方法 | |
CN113902583B (zh) | 利用低压网络设备数据的配网侧运维方法及*** | |
CN117614141B (zh) | 一种用于配电网的多电压层级协调管理方法 | |
CN111241488A (zh) | 一种基于全信息数据流的配网保护定值整定*** | |
CN107742162B (zh) | 一种基于配调监控信息的多维特征关联分析方法 | |
CN112257937B (zh) | 一种基于大数据技术的配电网故障预测***及方法 | |
CN113886469B (zh) | 基于多源数据的配电网工程成效异常自动挖掘方法及*** | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及*** | |
CN116826709A (zh) | 可调节负荷资源与调度主站模型的自动匹配方法、装置、存储介质 | |
CN115409264A (zh) | 基于馈线故障预测的配电网抢修驻点位置优化方法 | |
CN108335231A (zh) | 一种自动匹配的配电网数据诊断方法 | |
CN111858852B (zh) | 一种基于数据相似性的全防误点表校核方法 | |
CN114677112A (zh) | 一种基于大数据的配电网项目规模化评审方法及*** | |
Ya’An | Application of artificial intelligence in computer network technology in the era of big data | |
CN114662279A (zh) | 基于二次设备大数据平台的继电保护信息建模方法及*** | |
CN110298585B (zh) | 一种变电站设备监控信息分层分级自动审核方法 | |
CN102789603A (zh) | 一种计及负荷拉路模型的省级调度有功调整方法 | |
CN109767062B (zh) | 一种电网任务处置方案的动态生成方法 | |
CN114077835A (zh) | 一种市域电网调度操作票生成方法 | |
CN113158392A (zh) | 一种配电图形化监测计算*** | |
CN112052277A (zh) | 一种基于大数据的电压暂降严重度评估方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |