CN117290404A - 一种主配网故障处理方法快速检索实用方法及*** - Google Patents
一种主配网故障处理方法快速检索实用方法及*** Download PDFInfo
- Publication number
- CN117290404A CN117290404A CN202311107886.5A CN202311107886A CN117290404A CN 117290404 A CN117290404 A CN 117290404A CN 202311107886 A CN202311107886 A CN 202311107886A CN 117290404 A CN117290404 A CN 117290404A
- Authority
- CN
- China
- Prior art keywords
- processing
- database
- case
- vector
- distribution network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000009826 distribution Methods 0.000 title claims abstract description 37
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 83
- 230000000694 effects Effects 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 13
- 238000005457 optimization Methods 0.000 claims abstract description 11
- 238000012163 sequencing technique Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 71
- 238000011156 evaluation Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 230000007547 defect Effects 0.000 claims description 11
- 230000007246 mechanism Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- 238000011282 treatment Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 230000008092 positive effect Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 claims 1
- 230000004048 modification Effects 0.000 claims 1
- 230000006872 improvement Effects 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种主配网故障处理方法快速检索实用方法,涉及快速检索技术领域,包括采集历史问题处理记录,构建问题处理数据库;构建基于数据库的故障检索与匹配制度;输出匹配案例的分析过程和处理措施,作为当前故障的参考方案;进行处理结果反馈,并持续优化迭代。本发明能够加快故障处理速度、提供可靠的参考方案、提升处理方案的排序准确性、预测处理效果、提供多样化的处理方案,并通过持续优化和改进不断提高整个***的性能和实用性。
Description
技术领域
本发明涉及快速检索技术领域,特别是一种主配网故障处理方法快速检索实用方法及***。
背景技术
目前已经有一些企业或组织建立了主配网故障处理的数据库,收集了大量的历史问题处理记录并进行了整理,部分利用文本匹配、模式匹配等技术,根据用户输入的故障描述,从数据库中检索与之相似的案例,并进行匹配和推荐,还有一部分技术利用自然语言处理和文本分析等技术,对故障描述进行分析和处理,提取关键信息,辅助故障检索和匹配。
但由于数据库的建立过程可能涉及多个人的参与和数据收集的不一致性,导致数据库的质量问题,例如缺失关键信息、记录不准确等;且现有的故障检索与匹配方法可能存在精度不高的问题,无法准确地找到与当前故障相似且有效的处理方案,导致推荐的方案不够准确和可靠。因此快速检索主配网故障处理的发展取得了一定的进展,但仍然存在数据库质量、故障检索精度、信息提取完备性等方面的缺陷和挑战。
发明内容
鉴于上述的故障检索与匹配方法可能存在精度不高的问题,无法准确地找到与当前故障相似且有效的处理方案,导致推荐的方案不够准确和可靠中存在的问题,提出了本发明。
因此,本发明所要解决的问题在于如何提供一种加快故障处理速度、提供可靠的参考方案、提升处理方案的排序准确性、预测处理效果、提供多样化的处理方案的方法。
为解决上述技术问题,本发明提供如下技术方案:
第一方面,本发明实施例提供了一种主配网故障处理方法快速检索实用方法,其包括采集历史问题处理记录,构建问题处理数据库;构建基于数据库的故障检索与匹配制度;输出匹配案例的分析过程和处理措施,作为当前故障的参考方案;进行处理结果反馈,并持续优化迭代。
作为本发明所述主配网故障处理方法快速检索实用方法的一种优选方案,其中:所述构建问题处理数据库的过程如下:收集历史问题记录;文本关键信息提取;构建结构化数据库;评估知数据库质量;所述评估数据库质量的具体步骤如下:从数据库中随机抽取n条样本作为评估数据集,样本量n设置为100条或以上,在评估数据集上进行实体提取,并和人工标注的实体结果进行对比,以识别的实体中正确的比例作为准确率;基于提取的实体,使用模板自动生成结构化数据和人工标注结果对比,计算生成满足要求的数据占比作为填充满足率;若实体提取准确率低于设定值85%,则需要优化实体识别模型;若填充满足率低于设定值80%,则需要调整问题模板的结构。
作为本发明所述主配网故障处理方法快速检索实用方法的一种优选方案,其中:所述构建基于该数据库的故障检索与匹配制度的过程包括构建案例特征向量,并且输入查询向量化表示和进行向量相似度比对,并对相似案例进行排名;所述进行向量相似度比对包括,设输入查询向量为A,某个案例向量为B,则余弦相似度为:
Q=cos(θ)=AxB/(||A||*||B||)
其中,θ为两个向量间的角度,AxB为向量内积,||A||、||B||为向量长度,余弦值范围为[-1,1],值越大表示越相似;使用向量维度代表词向量的特征数量,维度越高,表征词语语义信息越丰富;将全集向量空间分割为M个区域,每个区域包含n个向量,其中,n<<N,选择一个向量作为根节点,计算其他向量与根节点的距离,距离大于中位数的在远端节点,小于中位数的在近端节点,递归构建子树,直到叶子节点;以根节点作为球心,以中位数距离划分超球体,近端子节点球体半径为中位数距离,远端子节点在较外层球体区域;计算查询向量与根节点距离d,若d小于中位数,则搜索近端子树,若d大于中位数,则搜索远端子树,逐层缩小搜索范围,直到叶子节点。
作为本发明所述主配网故障处理方法快速检索实用方法的一种优选方案,其中:所述对相似案例进行排名包括,采集已进行了处理效果的正负面标注的案例作为模型训练数据,将文本使用分词算法进行切分,获取文本中的全部词语,使用以下公式进行计算:
TF-IDF=TF*IDF
其中,TF为词在文本中出现次数/总词数;IDF为log文本总数/词出现文本数;设定词向量大小M,每个词对应一个长度为M的向量,将TF-IDF值作为词向量的一维采用前馈神经网络结构,输入层接受案例特征向量,隐藏层进行特征学习,提取排序相关隐特征;输出层设置一个节点表示排序分数,节点初始化为一个全连接结构;首要判断:是否线性输出,若需要,则使用ReLU激活函数进行非线性映射,若不需要,则保持线性输出;次要判断是否需要注意力机制,判断不同特征对排序的重要性是否不同,若不同,则加入注意力子网络重新加权特征,若相同,则直接全连接输出;模型输入案例特征,输出一个实数分数,通过设定范围和非线性函数,获得所需排序分数,分数越大表示与查询案例越相似。
作为本发明所述主配网故障处理方法快速检索实用方法的一种优选方案,其中:所述对相似案例进行排名还包括,在输出层增加一个神经元,使用sigmoid激活获取0~1预测概率,若大于等于0.5则预测正面效果,若小于0.5则预测负面效果。
作为本发明所述主配网故障处理方法快速检索实用方法的一种优选方案,其中:所述输出匹配案例的分析过程和处理措施包括,判断是否有与当前故障完全相同的案例,若有,则直接输出该案例的处理详情;若无绝对相同案例,则计算当前故障与数据库案例的近似程度,若近似度大于等于K,视为近似案例,若小于K,视为参考案例;在近似案例中选取近似度得分排名前5的案例,对这些相似案例的方案进行适当修改,生成新的处理方案,进行多方案结合或专家修正,处理不绝对相同的情况。
作为本发明所述主配网故障处理方法快速检索实用方法的一种优选方案,其中:所述持续优化迭代的过程包括,在给出处理方案时,同时定义客观的评估指标,所述评估指标基于状态检测获得,无需人工判断;在处理方案每实施一段时间T后,***自动收集定义的评估指标,将评估指标值与预定义的期望目标值进行对比;若偏差超出阈值,则判定为处理效果不佳,自动启动根因分析,分析产生偏差的原因,归纳出导致偏差的数据库缺陷或方案缺失,优化数据库中的案例特征提取和表示等环节,调整模型的打分机制,弥补生成方案的缺陷,重新训练模型并持续测试,至评估指标达标。
第二方面,本发明为进一步解决故障检索与匹配方法可能存在精度不高的问题,无法准确地找到与当前故障相似且有效的处理方案,导致推荐的方案不够准确和可靠中存在的问题,实施例提供了一种主配网故障处理方法快速检索实用***,包括问题处理数据库构建模块,用于收集并构建结构化的问题处理数据库;特征表达与向量化模块,用于实现案例的特征向量化表达;相似度计算与排序模块,用于实现案例间相似度计算和排序,并按相似度给案例排名,输出最匹配案例;处理方案生成模块,用于根据匹配案例给出处理方案;评估与优化模块,用于完成处理反馈,迭代优化***,并且提升***知识完善程度,匹配准确性。
第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的主配网故障处理方法快速检索实用方法的任一步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的主配网故障处理方法快速检索实用方法的任一步骤。
本发明有益效果为,本发明开发一种主配网故障及处理方法的检索工具,辅助运维人员处理问题,减少调度运维人员的工作量,提高了电网***的稳定性及可靠性;本发明工具为离线工具,不依赖网络和***,不存在安全问题且方便推广;本发明能够加快故障处理速度、提供可靠的参考方案、提升处理方案的排序准确性、预测处理效果、提供多样化的处理方案,并通过持续优化和改进不断提高整个***的性能和实用性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。其中:
图1为实施例1中主配网故障处理方法快速检索实用方法的流程图。
图2为实施例1中主配网故障处理方法快速检索实用方法的操作示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
实施例1
参照图1和图2,为本发明第一个实施例,该实施例提供了一种主配网故障处理方法快速检索实用方法,包括以下步骤:
S1:采集历史问题处理记录,构建问题处理数据库。
S1.1:收集历史问题记录。
进一步的,设置问题收集模板,包括问题描述、处理措施和处理效果等字段;导出历史问题记录,并区分不同问题类型,如软件故障、硬件故障或网络故障等。
S1.2:文本关键信息提取。
优选的,对问题描述文本进行分词、词性标注等预处理;使用命名实体识别,提取出问题相关的关键词和实体;判断并标注处理效果正面或负面。
S1.3:构建结构化数据库。
对不同关键词类型定义结构化模板,根据提取的信息填充模板的各字段;若某类型问题提取效果较差,则人工补充关键信息。
S1.4:评估数据库质量。
对数据库样本进行评估,计算实体提取准确率和填充满足率等指标;若指标低于阈值,则需要调整模板与提取算法;迭代优化数据库质量,达到应用要求。
进一步的,从数据库中随机抽取n条样本作为评估数据集,样本量n可设置为100条或以上,在评估数据集上进行实体提取,和人工标注的实体结果进行对比,计算识别的实体中正确的比例作为准确率;基于提取的实体,使用模板自动生成结构化数据和人工标注结果对比,计算生成满足要求的数据占比作为填充满足率;若实体提取准确率低于85%,则需要优化实体识别模型;若填充满足率低于80%,则需要调整问题模板的结构。
S2:构建基于该数据库的故障检索与匹配制度。
S2.1:构建案例特征向量,并且输入查询向量化表示。
为每个历史案例提取文本、代码、日志等信息,使用词向量等方式构建文本特质向量;对输入的问题描述文本进行分词和向量化。
S2.2:进行向量相似度比对。
优选的,利用向量空间模型,计算输入查询向量和案例向量之间的相似度,具体包括:设输入查询向量为A,某个案例向量为B,则余弦相似度为:
Q=cos(θ)=AxB/(||A||*||B||)
其中,θ为两个向量间的角度,AxB为向量内积,||A||、||B||为向量长度,余弦值范围为[-1,1],值越大表示越相似。
向量维度代表词向量的特征数量,维度越高,表征词语语义信息越丰富;如300维词向量可表示词语语义关系,比单纯词频统计更准确。
选用VP树索引构建,具体包括:将全集向量空间分割为M个区域,每个区域包含n个向量,其中,n<<N,选择一个向量作为根节点,计算其他向量与根节点的距离,距离大于中位数的在远端节点,小于中位数的在近端节点,递归构建子树,直到叶子节点;以根节点作为球心,以中位数距离划分超球体,近端子节点球体半径为中位数距离,远端子节点在较外层球体区域;计算查询向量与根节点距离d,若d小于中位数,搜索近端子树,若d大于中位数,搜索远端子树,逐层缩小搜索范围,直到叶子节点。
需要说明的是,利用向量距离比较逐步过滤分支,无须计算查询与全集向量的距离,只在相关分支上进行实际距离计算,降低了复杂度,达到加速搜索的目的。
S2.3:相似案例排名。
采集这些已进行了处理效果的正负面标注的案例作为模型训练数据,将文本使用分词算法进行切分,获取文本中的全部词语,使用以下公式进行计算:
TF-IDF=TF*IDF
其中,TF为词在文本中出现次数/总词数;IDF为log(文本总数/词出现文本数);设定词向量dimension大小,例如300,每个词对应一个长度为300的向量,将TF-IDF值作为词向量的一维,假设文本分词得到n个词,则每个词对应的词向量长度为300,拼接这n个词向量,得到长度为300*n的文本特征向量;采用前馈神经网络结构,输入层接受案例特征向量,隐藏层进行特征学习,提取排序相关隐特征。
进一步的,输出层设置一个节点表示排序分数,节点初始化为一个全连接结构,首要判断:是否线性输出,若需要,则使用ReLU激活函数进行非线性映射,若不需要,则保持线性输出;次要判断是否需要注意力机制,判断不同特征对排序的重要性是否不同,若不同,则加入注意力子网络重新加权特征,若相同,则直接全连接输出;模型输入案例特征,输出一个实数分数,通过设定范围和非线性函数,获得所需排序分数,分数越大表示与查询案例越相似。
更进一步的,在输出层增加一个神经元,使用sigmoid激活获取0~1预测概率,若大于等于0.5预测正面效果,若小于则预测负面效果。
S3:输出匹配案例的分析过程和处理措施,作为当前故障的参考方案。
优选的,判断是否有与当前故障完全相同的案例,若有,则直接输出该案例的处理详情;若无绝对相同案例,则计算当前故障与数据库案例的近似程度,若近似度大于等于85%,视为近似案例,若小于85%,视为参考案例;
在近似案例中选取近似度得分排名前5的案例,对这些相似案例的方案进行适当修改,生成新的处理方案,可能需要多方案结合,或专家修正,处理不绝对相同的情况。
S4:进行处理结果反馈,并持续优化迭代。
进一步的,在给出处理方案时,同时定义客观的评估指标,这些指标可以基于日志分析、状态检测等获得,无需人工判断,在处理方案实施一段时间后,***自动收集定义的评估指标,将这些指标值与预定义的期望目标值进行对比,若偏差超出阈值,则判定为处理效果不佳,自动启动根因分析,分析产生偏差的原因,归纳出导致偏差的数据库缺陷或方案缺失,优化数据库中的案例特征提取和表示等环节,调整模型的打分机制,弥补生成方案的缺陷,重新训练模型并持续测试,直到评估指标达标。
实施例还提供了一种主配网故障处理方法快速检索实用***,包括问题处理数据库构建模块,用于收集并构建结构化的问题处理数据库;特征表达与向量化模块,用于实现案例的特征向量化表达;相似度计算与排序模块,用于实现案例间相似度计算和排序,并按相似度给案例排名,输出最匹配案例;处理方案生成模块,用于根据匹配案例给出处理方案;评估与优化模块,用于完成处理反馈,迭代优化***,并且提升***知识完善程度,匹配准确性。
本实施例还提供一种计算机设备,适用于主配网故障处理方法快速检索实用方法的情况,包括:存储器和处理器;存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,实现如上述实施例提出主配网故障处理方法快速检索实用方法;还包括工控装置设备,包括FPGA和存储器,所述存储器存储有FPGA程序。
该计算机设备可以是终端,该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本实施例还提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例提出的实现主配网故障处理方法快速检索实用方法;存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
综上,本发明开发一种主配网故障及处理方法的检索工具,辅助运维人员处理问题,减少调度运维人员的工作量,提高了电网***的稳定性及可靠性;本发明工具为离线工具,不依赖网络和***,不存在安全问题且方便推广;本发明能够加快故障处理速度、提供可靠的参考方案、提升处理方案的排序准确性、预测处理效果、提供多样化的处理方案,并通过持续优化和改进不断提高整个***的性能和实用性。
实施例2
参照表1,为本发明第二个实施例,在第一个实施例的基础之上,为了验证其有益效果,提供了本发明的主配网故障处理方法快速检索实用方法的实验仿真数据。
首先,收集历史故障记录,进行文本关键信息提取,构建结构化数据库。评估数据库质量的具体步骤如下:从数据库中随机抽取100条样本作为评估数据集;在评估数据集上进行实体提取,结果与人工标注对比,计算准确率。
基于提取实体使用模板生成结构化数据,与人工标注结果对比,计算生成满足率;若实体提取准确率<85%,则优化实体识别模型;若生成满足率<80%,则调整问题模板结构。
其中,部分故障表如下:
表1故障模板表
字段 | 说明 |
故障编号 | 唯一标识故障记录 |
故障时间 | 故障发生时间 |
故障设备 | 发生故障的设备名称 |
故障描述 | 对故障情况的文字描述 |
故障原因 | 导致故障的根本原因 |
处理措施 | 解决故障采取的具体措施 |
处理结果 | 故障处理结果,分为好、坏两类 |
下表为本发明与现有技术的对比表:
表2本发明与现有技术的处理对比表
可以看出,本表对比了本发明和现有技术在多个关键指标上的表现,从案例库规模来看,本发明收集了超过5000条案例,是现有技术1200条的4倍以上,充分利用了大数据积累的优势;在案例提取准确率方面,本发明达到95.89%,提高了6.35个百分点。这意味着能够从大规模案例中准确识别出关键信息;检索匹配成功率方面,本发明实现了92.3%的成功匹配,超过现有技术4.66个百分点。这证明本发明构建的向量空间模型检索机制效果显著;处理方案准确率是评估实际效果的关键指标。本发明在这一指标上达到87.09%,提高效果11.4个百分点;本发明实现了一周一次的快速迭代优化,而现有技术需要一个月,大幅缩短了优化周期;在故障处理时长上,本发明平均时长是2.13小时,相比现有技术的3.41小时缩短了近40%,这直接提高了电网故障响应速度。
综上,本发明在案例规模、准确率、响应速度等多个维度取得显著提升,能够有效支持电网故障快速准确处理,提高***稳定性和可靠性。
构建案例特征向量,输入查询进行向量化,计算查询向量与案例向量的余弦相似度,找到相似案例,对相似案例进行排名输出;使用神经网络进行相似案例打分,根据输出排序分数,分数越大表示与查询案例越相似,查询故障处理方法;处理实施一段时间后,自动收集指标值,与目标值对比,如果偏差超过阈值,则判定效果不佳,启动根因分析,分析导致偏差的数据库或模型缺陷,进行优化调整,并重新训练模型,测试指标,直至达标。
本发明通过构建问题处理数据库,并建立基于该数据库的故障检索与匹配机制,可以快速找出历史相似故障的处理方案,为当前故障分析提供参考。同时,结合结果反馈持续优化迭代数据库和匹配模型,不断完善处理方案的质量。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种主配网故障处理方法快速检索实用方法,其特征在于:包括:
采集历史问题处理记录,构建问题处理数据库;
构建基于数据库的故障检索与匹配制度;
输出匹配案例的分析过程和处理措施,作为当前故障的参考方案;
进行处理结果反馈,并持续优化迭代。
2.如权利要求1所述的主配网故障处理方法快速检索实用方法,其特征在于:所述构建问题处理数据库的过程如下:
收集历史问题记录;文本关键信息提取;构建结构化数据库;评估知数据库质量;
所述评估数据库质量的具体步骤如下:从数据库中随机抽取n条样本作为评估数据集,设置样本量n,在评估数据集上进行实体提取,并和人工标注的实体结果进行对比,以识别的实体中正确的比例作为准确率;
基于提取的实体,使用模板自动生成结构化数据和人工标注结果对比,计算生成满足要求的数据占比作为填充满足率;若实体提取准确率低于设定值P,则需要优化实体识别模型;若填充满足率低于设定值Q,则需要调整问题模板的结构。
3.如权利要求2所述的主配网故障处理方法快速检索实用方法,其特征在于:所述构建基于该数据库的故障检索与匹配制度的过程包括构建案例特征向量,并且输入查询向量化表示和进行向量相似度比对,并对相似案例进行排名;
所述进行向量相似度比对包括,
设输入查询向量为A,某个案例向量为B,则余弦相似度为:
Q=cos(θ)=AxB/(||A||*||B||)
其中,θ为两个向量间的角度,AxB为向量内积,||A||、||B||为向量长度,余弦值范围为[-1,1],值越大表示越相似;
使用向量维度代表词向量的特征数量,维度越高,表征词语语义信息越丰富;
将全集向量空间分割为M个区域,每个区域包含n个向量,其中,n<<N,选择一个向量作为根节点,计算其他向量与根节点的距离,距离大于中位数的在远端节点,小于中位数的在近端节点,递归构建子树,直到叶子节点;
以根节点作为球心,以中位数距离划分超球体,近端子节点球体半径为中位数距离,远端子节点在较外层球体区域;
计算查询向量与根节点距离d,若d小于中位数,则搜索近端子树,若d大于中位数,则搜索远端子树,逐层缩小搜索范围,直到叶子节点。
4.如权利要求3所述的主配网故障处理方法快速检索实用方法,其特征在于:所述对相似案例进行排名包括,
采集已进行了处理效果的正负面标注的案例作为模型训练数据,将文本使用分词算法进行切分,获取文本中的全部词语,使用以下公式进行计算:
TF-IDF=TF*IDF
其中,TF为词在文本中出现次数/总词数;IDF为log文本总数/词出现文本数;
设定词向量大小M,每个词对应一个长度为M的向量,将TF-IDF值作为词向量的一维采用前馈神经网络结构,输入层接受案例特征向量,隐藏层进行特征学习,提取排序相关隐特征;输出层设置一个节点表示排序分数,节点初始化为一个全连接结构;
首要判断:是否线性输出,若需要,则使用ReLU激活函数进行非线性映射,若不需要,则保持线性输出;
次要判断是否需要注意力机制,判断不同特征对排序的重要性是否不同,若不同,则加入注意力子网络重新加权特征,若相同,则直接全连接输出;
模型输入案例特征,输出一个实数分数,通过设定范围和非线性函数,获得所需排序分数,分数越大表示与查询案例越相似。
5.如权利要求4所述的主配网故障处理方法快速检索实用方法,其特征在于:所述对相似案例进行排名还包括,
在输出层增加一个神经元,使用sigmoid激活获取0~1预测概率,若大于等于0.5则预测正面效果,若小于0.5则预测负面效果。
6.如权利要求5所述的主配网故障处理方法快速检索实用方法,其特征在于:所述输出匹配案例的分析过程和处理措施包括,
判断是否有与当前故障完全相同的案例,若有,则直接输出该案例的处理详情;
若无绝对相同案例,则计算当前故障与数据库案例的近似程度,若近似度大于等于K,则视为近似案例,若小于K,视为参考案例;
在近似案例中选取近似度得分排名前5的案例,对这些相似案例的方案进行整合修改,生成新的处理方案。
7.如权利要求6所述的主配网故障处理方法快速检索实用方法,其特征在于:所述持续优化迭代的过程包括,
在给出处理方案时,同时定义客观的评估指标,所述评估指标基于状态检测获得,无需人工判断;
在处理方案每实施一段时间T后,***自动收集定义的评估指标,将评估指标值与预定义的期望目标值进行对比;
若偏差超出阈值,则判定为处理效果不佳,自动启动根因分析,分析产生偏差的原因,归纳出导致偏差的数据库缺陷或方案缺失,优化数据库中的案例特征提取和表示等环节,调整模型的打分机制,弥补生成方案的缺陷,重新训练模型并持续测试,至评估指标达标。
8.一种主配网故障处理方法快速检索实用***,基于权利要求1~7任一所述的主配网故障处理方法快速检索实用方法,其特征在于:包括:
问题处理数据库构建模块,用于收集并构建结构化的问题处理数据库;
特征表达与向量化模块,用于实现案例的特征向量化表达;
相似度计算与排序模块,用于实现案例间相似度计算和排序,并按相似度给案例排名,输出最匹配案例;
处理方案生成模块,用于根据匹配案例给出处理方案;
评估与优化模块,用于完成处理反馈,迭代优化***,并且提升***知识完善程度,匹配准确性。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述的主配网故障处理方法快速检索实用方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述的主配网故障处理方法快速检索实用方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311107886.5A CN117290404A (zh) | 2023-08-30 | 2023-08-30 | 一种主配网故障处理方法快速检索实用方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311107886.5A CN117290404A (zh) | 2023-08-30 | 2023-08-30 | 一种主配网故障处理方法快速检索实用方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117290404A true CN117290404A (zh) | 2023-12-26 |
Family
ID=89247165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311107886.5A Pending CN117290404A (zh) | 2023-08-30 | 2023-08-30 | 一种主配网故障处理方法快速检索实用方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290404A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556033A (zh) * | 2024-01-11 | 2024-02-13 | 北京并行科技股份有限公司 | 确定问答***的嵌入模型参数的方法、装置及计算设备 |
-
2023
- 2023-08-30 CN CN202311107886.5A patent/CN117290404A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556033A (zh) * | 2024-01-11 | 2024-02-13 | 北京并行科技股份有限公司 | 确定问答***的嵌入模型参数的方法、装置及计算设备 |
CN117556033B (zh) * | 2024-01-11 | 2024-03-29 | 北京并行科技股份有限公司 | 确定问答***的嵌入模型参数的方法、装置及计算设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11449673B2 (en) | ESG-based company evaluation device and an operation method thereof | |
US8126826B2 (en) | Method and system for active learning screening process with dynamic information modeling | |
CN112632228A (zh) | 一种基于文本挖掘的辅助评标方法及*** | |
CN113779272A (zh) | 基于知识图谱的数据处理方法、装置、设备及存储介质 | |
CN106054858A (zh) | 基于决策树分类和故障码分类的车辆远程诊断与备件检索的方法 | |
CN111581545A (zh) | 一种召回文档的排序方法及相关设备 | |
CN111581956B (zh) | 基于bert模型和k近邻的敏感信息识别方法及*** | |
CN111368096A (zh) | 基于知识图谱的信息分析方法、装置、设备和存储介质 | |
Thaler et al. | Towards a neural language model for signature extraction from forensic logs | |
CN117290404A (zh) | 一种主配网故障处理方法快速检索实用方法及*** | |
CN113449508B (zh) | 一种基于事件链的网络舆情关联推演预测分析方法 | |
Balaji et al. | Text summarization using NLP technique | |
Eskandari et al. | Predicting best answer using sentiment analysis in community question answering systems | |
Saha et al. | A large scale study of SVM based methods for abstract screening in systematic reviews | |
Oliveira et al. | Evolutionary rank aggregation for recommender systems | |
CN116205296A (zh) | 一种融合自顶向下与自底向上的abac策略工程方法 | |
Sushentsev et al. | Dapstep: Deep assignee prediction for stack trace error representation | |
Dai et al. | Intelligent audit question answering system based on knowledge graph and semantic similarity | |
Wehnert et al. | ERST: leveraging topic features for context-aware legal reference linking | |
Suryachandra et al. | Machine learning approach to classify the sentiment value of natural language processing in Telugu data | |
CN110619363A (zh) | 物料数据长描述对应小类名称分类方法 | |
Mylavarapu et al. | Assessing context-aware data consistency | |
CN112434212B (zh) | 基于神经自回归分布估计的涉案新闻主题模型构建方法及装置 | |
Khatun et al. | Analysis of Duplicate Bug Report Detection Techniques | |
Lica | Census Optimization Using Machine Learning Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |