CN115859191A - 故障诊断方法、装置、计算机可读存储介质及计算机设备 - Google Patents

故障诊断方法、装置、计算机可读存储介质及计算机设备 Download PDF

Info

Publication number
CN115859191A
CN115859191A CN202211467440.9A CN202211467440A CN115859191A CN 115859191 A CN115859191 A CN 115859191A CN 202211467440 A CN202211467440 A CN 202211467440A CN 115859191 A CN115859191 A CN 115859191A
Authority
CN
China
Prior art keywords
fault
sample
data
characteristic data
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211467440.9A
Other languages
English (en)
Inventor
金渊
刘秀兰
陈平
李香龙
钱梓锋
陈慧敏
张倩
关宇
焦然
杨芮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Beijing Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Beijing Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202211467440.9A priority Critical patent/CN115859191A/zh
Publication of CN115859191A publication Critical patent/CN115859191A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本发明公开了一种故障诊断方法、装置、计算机可读存储介质及计算机设备。其中,该方法包括:获取充电桩的初始数据;基于初始数据,得到充电桩的故障特征数据;将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果;基于故障匹配结果和故障预测结果,确定充电桩的故障诊断结果。本发明解决了用于充电桩的故障诊断方法不够准确、效率低,且诊断结果的可解释性差的技术问题。

Description

故障诊断方法、装置、计算机可读存储介质及计算机设备
技术领域
本发明涉及新能源及节能技术领域,具体而言,涉及一种故障诊断方法、装置、计算机可读存储介质及计算机设备。
背景技术
在相关技术中,通常采用神经网络模型对充电桩的故障进行诊断,但若采用该方法,为了提高诊断精度,需要大量的数据样本进行模型训练,耗费时间较长,且可解释性差,而若采用解析模型法,复杂的非线性***又难以建立准确的模型。
因此,在相关技术中,存在用于充电桩的故障诊断方法不够准确、效率低,且诊断结果的可解释性差的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种故障诊断方法、装置、计算机可读存储介质及计算机设备,以至少解决用于充电桩的故障诊断方法不够准确、效率低,且诊断结果的可解释性差的技术问题。
根据本发明实施例的一个方面,提供了一种故障诊断方法,包括:获取充电桩的初始数据;基于初始数据,得到充电桩的故障特征数据;将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果;基于故障匹配结果和故障预测结果,确定充电桩的故障诊断结果。
可选的,在将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果之前,还包括:获取多个目标样本集,其中,多个目标样本集中的目标样本集包括样本故障特征数据和与样本故障特征数据对应的样本故障标签;按照样本故障标签的故障标签种类,对多个目标样本集进行二分类,得到多个故障类型下的样本集;基于多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,得到预设二分类规则。
可选的,获取多个目标样本集,包括:获取多组样本初始数据;对多组样本初始数据进行特征提取,得到多组初始样本特征数据;对多组初始样本特征数据进行特征筛选,得到多组样本故障特征数据;确定与多组样本故障特征数据分别对应的样本故障标签;基于多组样本故障特征数据和与多组样本故障特征数据分别对应的样本故障标签,确定多个目标样本集。
可选的,基于多组样本故障特征数据和与多组样本故障特征数据分别对应的样本故障标签,确定多个目标样本集包括:基于多组样本故障特征数据和与多组样本故障特征数据分别对应的样本故障标签,确定多个初始样本集;按照样本故障标签的故障标签种类,分别计算多个初始样本集在故障标签种类下对应的样本标签比例;基于样本标签比例,分别对多个初始样本集中的样本故障特征数据进行过采样,得到多组过采样后的样本故障特征数据;基于多组过采样后的样本故障特征数据,以及与多组过采样后的样本故障特征数据分别对应的样本故障标签,得到多个目标样本集。
可选的,在计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果之前,还包括:基于随机森林算法,利用多个目标样本集,构建得到与预设故障类型对应的故障类型预测模型。
可选的,计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果,包括:将故障特征数据中与预设二分类规则匹配失败的数据确定为故障预测数据;利用故障类型预测模型,分别计算故障预测数据在多种预设故障类型下的概率,得到多个概率计算结果;将多个概率结果中概率值最大的故障类型确定为故障预测结果。
根据本发明实施例的另一方面,还提供了一种故障诊断装置,包括:第一获取模块,用于获取充电桩的初始数据;第一确定模块,用于基于初始数据,得到充电桩的故障特征数据;匹配模块,用于将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;计算模块,用于计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果;第二确定模块,用于基于故障匹配结果和故障预测结果,确定充电桩的故障诊断结果。
可选的,上述装置还包括:第二获取模块,用于获取多个目标样本集,其中,多个目标样本集中的目标样本集包括样本故障特征数据和与样本故障特征数据对应的样本故障标签;二分类模块,用于按照样本故障标签的故障标签种类,对多个目标样本集进行二分类,得到多个故障类型下的样本集;规则确定模块,用于基于多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,得到预设二分类规则。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述任意一项的故障诊断方法。
根据本发明实施例的另一方面,还提供了一种计算机设备,包括:存储器和处理器,存储器存储有计算机程序;处理器,用于执行存储器中存储的计算机程序,计算机程序运行时使得处理器执行上述任意一项的故障诊断方法。
在本发明实施例中,采用随机森林算法的方式,通过基于充电桩的初始数据确定该充电桩的故障特征数据,再根据该故障特征数据与预设二分类规则进行匹配,确定由该故障特征数据可直接匹配确定的故障类型,即故障匹配结果,并计算该故障特征数据对应于预设故障类型的概率,确定出充电桩可能对应的故障类型,即故障预测结果,基于上述故障匹配结果和故障预测结果,就可以快速、准确地确定出充电桩的故障类型,从而实现了在保证该模型运行速度快、可靠性高的同时,还可以保证利用模型进行判断时的可解释性的技术效果,进而解决了用于充电桩的故障诊断方法不够准确、效率低,且诊断结果的可解释性差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例提供的故障诊断方法的流程图;
图2是根据本发明可选实施方式提供的基于随机森林算法的充电桩故障诊断方法的流程图;
图3是根据本发明可选实施方式提供的决策树结构示意图;
图4是根据本发明可选实施方式提供的随机森林结构示意图;
图5是根据本发明实施例提供的故障诊断装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种故障诊断的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例提供的故障诊断方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取充电桩的初始数据;
步骤S104,基于初始数据,得到充电桩的故障特征数据;
步骤S106,将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;
步骤S108,计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果;
步骤S110,基于故障匹配结果和故障预测结果,确定充电桩的故障诊断结果。
通过上述步骤,采用随机森林算法的方式,基于充电桩的初始数据确定该充电桩的故障特征数据,再根据该故障特征数据与预设二分类规则进行匹配,确定由该故障特征数据可直接匹配确定的故障类型,即故障匹配结果,并计算该故障特征数据对应于预设故障类型的概率,确定出充电桩可能对应的故障类型,即故障预测结果,基于上述故障匹配结果和故障预测结果,就可以快速、准确地确定出充电桩的故障类型,从而实现了在保证该模型运行速度快、可靠性高的同时,还可以保证利用模型进行判断时的可解释性的技术效果,进而解决了用于充电桩的故障诊断方法不够准确、效率低,且诊断结果的可解释性差的技术问题。
需要说明的是,上述初始数据可以包括充电桩的交易记录,告警记录,运行记录和消缺记录,等等。
作为一种可选的实施例,在将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果之前,还包括:获取多个目标样本集,其中,多个目标样本集中的目标样本集包括样本故障特征数据和与样本故障特征数据对应的样本故障标签;按照样本故障标签的故障标签种类,对多个目标样本集进行二分类,得到多个故障类型下的样本集;基于多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,得到预设二分类规则。
上述预设二分类规则可以基于样本数据确定得到,例如,将样本故障特征数据和与样本故障特征数据对应的样本故障标签确定为一个目标样本集,按照每个样本集中的样本故障标签的种类,对多个目标样本集进行二分类,例如,将A类的样本故障标签对应的目标样本集归为第一类,其它的目标样本集归为其它类,从而将原本故障诊断过程中的多分类问题转换为多个二分类问题,而根据多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,就可以得到上述的预设二分类规则。
基于上述的预设二分类规则进行充电桩的故障诊断时,可以通过充电桩的故障特征数据直接与预设二分类规则进行匹配,当该故障特征数据符合某一故障分类标签时,即匹配成功,就可以直接确定出该充电桩对应的故障类型,即故障匹配结果。
作为一种可选的实施例,获取多个目标样本集,包括:获取多组样本初始数据;对多组样本初始数据进行特征提取,得到多组初始样本特征数据;对多组初始样本特征数据进行特征筛选,得到多组样本故障特征数据;确定与多组样本故障特征数据分别对应的样本故障标签;基于多组样本故障特征数据和与多组样本故障特征数据分别对应的样本故障标签,确定多个目标样本集。
在基于样本初始数据得到样本特征数据之前,还可以对先对样本初始数据进行一些预处理,例如,可以将交易记录、告警记录、运行记录和消缺记录等数据转换为适合随机森林算法的矩阵格式的数据集,也可以对样本初始数据进行数据清洗,例如,对异常值、缺失值、重复数据的处理。其中,对于异常值可以采用3σ原则,服从正态分布的数据特征,μ±3σ区域应该包含99.7%的数据,对这个区间之外的数据直接剔除;对于含有缺失值的数据,由于数据缺失值比例较小,直接进行剔除;对于重复数据直接进行剔除。
在基于样本初始数据得到样本特征数据时,可以基于样本初始数据构建出与故障相关的特征,例如,可以是充电交易过程描述、交易外的告警种类、告警开始阶段、告警结束阶段,交易电量、交易金额、告警原因,等等。
通过对多组初始样本特征数据进行特征筛选,可以筛选对故障影响不大的相关特征,得到初始样本特征数据中较核心的特征数据,即多组样本故障特征数据。具体可以采用方差滤波,相关性过滤和卡方检验等方式进行特征筛选,例如,采用方差滤波时,若特征对应的方差较小,则说明这个特征对于样本区分的作用不大,可以将该特征滤除;采用相关性滤波时,如果特征与标签相关性较大,则说明该特征可以提供大量的信息,因此可以将特征与标签相关性较小的特征滤除;而采用卡方检验则可以比较出两个及两个以上样本率以及两个分类变量的关联性分析。
在确定与多组样本故障特征数据分别对应的样本故障标签时,可以采用基于特征数据生成标签的方式,例如,可以通过充电设备故障器件关键字识别,处理流程操作关键字识别以及故障原因生成的步骤生成样本故障标签。
作为一种可选的实施例,基于多组样本故障特征数据和与多组样本故障特征数据分别对应的样本故障标签,确定多个目标样本集包括:基于多组样本故障特征数据和与多组样本故障特征数据分别对应的样本故障标签,确定多个初始样本集;按照样本故障标签的故障标签种类,分别计算多个初始样本集在故障标签种类下对应的样本标签比例;基于样本标签比例,分别对多个初始样本集中的样本故障特征数据进行过采样,得到多组过采样后的样本故障特征数据;基于多组过采样后的样本故障特征数据,以及与多组过采样后的样本故障特征数据分别对应的样本故障标签,得到多个目标样本集。
在确定出多个初始样本集之后,由于不同的样本标签比例下的样本集所起到的训练效果不同,例如,当样本标签比较低的时候,说明该标签下的样本数据数量并不多,直接利用该样本数据进行训练的话,会产生过拟合的不利效果,从而影响故障诊断结果的准确性。因此,在本实施例中,通过分别计算不同初始样本集所对应的样本标签比例,并对样本标签比例低于预定比值(例如,100:1)的样本集进行过采样,以解决样本不平衡的问题。
作为一种可选的实施例,在计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果之前,还包括:基于随机森林算法,利用多个目标样本集,构建得到与预设故障类型对应的故障类型预测模型。通过采用随机森林算法,构建得到与预设故障类型对应的决策树,即故障类型预测模型,其中,预设故障类型可以是多种的,同理,对应可以得到多棵决策树,每一棵决策树都可以对每项故障特征数据进行分类。
作为一种可选的实施例,计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果,包括:将故障特征数据中与预设二分类规则匹配失败的数据确定为故障预测数据;利用故障类型预测模型,分别计算故障预测数据在多种预设故障类型下的概率,得到多个概率计算结果;将多个概率结果中概率值最大的故障类型确定为故障预测结果。若充电桩的故障特征数据中存在无法与预设二分类规则匹配的数据,则可以采用模型预测的方式继续对充电桩进行故障诊断,例如,可以采用故障类型预测模型,即基于随机森林算法得到的多个决策树,对故障预测数据进行分类及概率计算,得到故障预测数据分别符合各种故障类型的概率,得到多个概率计算结果之后,可以将其中概率值最大的故障类型确定为故障预测结果,也可以将其中概率值大于预定阈值的多个故障类型均确定为故障预测结果。
基于上述实施例及可选实施例,本发明提出一种可选实施方式,下面进行说明。
图2是根据本发明可选实施方式提供的基于随机森林算法的充电桩故障诊断方法的流程图,如图2所示,下面对该方法进行介绍。
(1)数据预处理
将充电桩故障诊断所涉及的交易记录、告警记录、运行记录和消缺记录转化为适合随机森林算法的原始样本集(Sample set)
1)数据清洗
主要是对异常值、缺失值、重复数据的处理。对于异常值采用3σ原则,服从正态分布的数据特征,μ±3σ区域应该包含99.7%的数据,将这个区间之外的数据直接剔除;对于含有缺失值的数据,由于数据缺失值比例较小,直接进行剔除;对于重复数据直接进行剔除。
2)数据标签的构建
对消缺数据中的故障消除过程进行归纳总结,生成故障的具体原因作为诊断模型的标签数据。处理流程可以分为以下三步,充电设备故障器件关键字识别,处理流程操作关键字识别,故障原因生成。
1、充电设备故障器件关键字识别,充电桩中含有大量的元器件,考虑人为因素,同一个器件会有不同的叫法,在一定程度上增加了故障器件识别的难度,因此建立一个完善准确的器件识别字典是非常有必要的。通过j ieba(结巴分词)对大量的历史消缺数据进行文本挖掘,对充电设备故障器件关键字进行提取(例如:充电模块、充电枪、TCU等),梳理出了包含充电设备关键元器件字典。
2、通过j ieba(结巴分词)对大量的历史消缺数据进行文本挖掘,对充电设备操作关键字进行提取(例如:更换、调整等),梳理出了包含充电设备操作关键词字典。
Jieba(结巴分词)是一个简单、高效、灵活的Python工具库,结巴分词的原理是基于统计词典,先构造一个前缀词典;再利用前缀词典对输入句子进行切分,得到所有的切分可能,根据切分位置构造有向无环图;通过动态规划算法,计算得到最大概率路径,找出基于词频的最大切分组合。对于未登录词,采用了基于汉字成词能力的HMM模型,并运用Viterbi算法进行计算及词性标注;分别基于TF-IDF和extrank模型抽取关键词。
通过识别得到的故障器件和操做关键字根据人员业务知识生成具体的故障原因,也就是样本集的标签label。
3)数据合并
将已知的交易记录、告警记录、运行记录进行数据合并,得到每一次充电过程的相关信息(其中包括桩编号、交易时间、交易金额、告警原因等)。
4)特征生成
根据步骤3)中得到的充电过程相关信息通过业务知识构建出与故障相关的特征(例如:充电交易过程描述、交易外的告警种类、告警开始阶段、告警结束阶段等);并与原始的相关信息、标签label结合,转化成k×n矩阵格式的数据集Smatrix,k为历史记录条数,n为故障诊断影响因素个数加1。在矩阵格式的数据集中,每一行代表一条已知故障原因的数据,各列分别代表造成故障原因的各种因素(如,交易电量、交易金额、告警原因、告警开始阶段、告警结束阶段等)和故障原因。
5)特征筛选
通过方差过滤、相关性过滤和卡方检验依次对特征进行过滤,筛选对故障原因影响不大的相关特征。
1、方差过滤,特征本身的方差很小,表示样本在这个特征上基本没有差异,特征中的大多数值都一样,甚至整个特征的取值都相同,那这个特征对于样本区分没有什么作用。
2、相关性过滤,一般情况下特征如果和标签的相关性比较大的话,这样的特征能够为我们提供大量的信息。如果特征与标签无关,只会白白浪费算力,还可能给模型带来噪声。
3、卡方检验,是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率以及两个分类变量的关联性分析。卡方验证的思路是先假设两个变量是独立无关的,由此计算出两变量独立无关时的分布情况,将这个情况与真实情况对比。然后通过查阅卡方表判断假设是否可靠。卡方表会提供计算的卡方值对应的p值,p值使用0.01作为显著性水平,即p值判断的边界,p值小于0.01为相关特征。
6)生成样本集
按照步骤5)确定的数据特征序列{x1,x2,…,xm}生成适合随机算法的原始样本集Sample set,Sample set为k×(m+1)矩阵,原始样本集Sample set中,每一行代表一条已知故障原因的数据,各列分别代表步骤15得到的核心数据特征序列{x1,x2,…,xm}和故障原因。
(2)故障分类及过采样
充电桩故障诊断为多分类问题,其故障类别有几十种,采用one-versus-al l(一对多)策略,将多分类问题转化为多个二分类问题;由于充电桩在运行过程中,不同故障发生的概率各不相同,会造成样本不平衡问题,对所有样本集进行过采样处理。
1)设定由消缺记录构建的标签种类为a,将其中某个类别的样本归为一类,其余a-1个类别的样本归为另一类,生成a个与原始样本集特征相同而标签不同的样本集{Sampleset1,Sample set2,…,Sample seta}。
2)对于样本集中样本标签比例小于100:1的样本集,采用SMOTE过采样方法解决样本不平衡问题;对于样本标签比例大于100:1的样本集,不带入模型进行,直接进行特征规则的提取。
SMOTE过采样步骤如下:
1、对于少数类中每一个样本x,以欧氏距离为标准计算它到少数类样本集中所有样本的距离,得到其k近邻;
2、根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其k近邻中随机选择若干个样本,假设选择的近邻为xn;
3、对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本
Figure BDA0003957931010000091
(3)模型训练
利用集成学习随机森林算法对所有的样本集进行训练,得到多个针对不同故障原因并满足误差要求的充电桩故障诊断模型。
1)抽取样本集
从原始训练集中随机有放回地抽取j个样本(子训练集)并重复j次,每一个样本被抽中的概率均为1/j。被剩下的样本组成袋外数据集(OOB),作为最终的测试集。
2)抽取特征
从总数为M的特征集合中随意抽取m个组成特征子集,其中m<M。
3)特征选择
计算节点数据集中每个特征对该数据集的基尼指数,选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点,从节点生成两个子节点,将剩余训练数据分配到两个子节点中。
4)生成CART决策树
在每个子节点的样本子集中重复执行步骤3,递归地进行节点分割,直到生成所有叶节点。决策树是一种非常快速的分类模型,是最为经典的分类算法之一,不需要进行先验假设,也不需要对特征值进行归一化或标准化处理。
决策树算法具体是根据某种分割规则,将根节点按设定的阈值,分为两个子节点,并在子节点重复这个步骤,直到得出类别结果。图3是根据本发明可选实施方式提供的决策树结构示意图,如图3所示,若是将这个过程用流程图形式显示,就类似于一个二叉树,N0是根节点,没有入边但有零条或两条出边(edge),指向两个内节点(internal node),即Ni(i=1,2,3,4);内节点有一条入边、两条出边,出边指向终节点(terminal node),即最终的分类结果Cr。
5)随机森林
重复执行步骤2)-步骤4),得到j棵不同的决策树。
6)测试数据
每一棵决策树都对测试集中的每一条数据进行分类,统计j个分类结果,票数最多的类别,即为该样本的最终类别。图4是根据本发明可选实施方式提供的随机森林结构示意图。
7)确定故障诊断模型
将步骤(2)中生成的所有样本集进行上述步骤,得到a-b个故障诊断模型,a为故障标签种类,b为样本不平衡度大于100:1的样本集个数。
(4)故障诊断
将需要进行故障诊断的充电桩的数据带入到所有模型当中,得到所有故障诊断的概率,概率最大的为故障诊断的结果。
1)将需要进行故障诊断的充电桩的数据与步骤(2)中生成的规则进行匹配,若匹配上则代表相应故障诊断的结果;
2)将上一步骤中未匹配上的数据带入到所有故障诊断模型当中,得到所有故障诊断的概率,概率最大的为故障诊断的结果。
综上,本发明可选实施方式具有以下几点优势:
1、本发明可选实施方式提供的基于随机森林算法的充电桩故障诊断方法,利用机器学***衡问题。对于未知原因的充电桩故障只需输入其对应的自变量,就可得到故障原因,因而基于机器学习方法的充电桩故障诊断方法具有运算速度快、可靠性高等优点;
2、本发明可选实施方式采用的随机森林算法为人工智能领域中较新颖,且性能优异的算法,可以快速定位故障原因,大大提高了诊断效率和准确度,大大减少维修时间;
3、随机森林算法相对于深度学习及其他大部分机器学习算法,可解释性高,对业务具有一定的指导意义。
根据本发明的另一方面,还提供了一种故障诊断装置,图5是根据本发明实施例提供的故障诊断装置的结构框图,如图5所示,该装置包括:第一获取模块51,第一确定模块52,匹配模块53,计算模块54和第二确定模块55,下面对该装置进行说明。
第一获取模块51,用于获取充电桩的初始数据;第一确定模块52,连接至上述第一获取模块51,用于基于初始数据,得到充电桩的故障特征数据;匹配模块53,连接至上述第一确定模块52,用于将故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;计算模块54,连接至上述匹配模块53,用于计算故障特征数据对应于预设故障类型的概率,得到计算结果,并基于计算结果得到故障预测结果;第二确定模块55,连接至上述计算模块54,用于基于故障匹配结果和故障预测结果,确定充电桩的故障诊断结果。
作为一种可选的实施例,上述装置还包括:第二获取模块,用于获取多个目标样本集,其中,多个目标样本集中的目标样本集包括样本故障特征数据和与样本故障特征数据对应的样本故障标签;二分类模块,用于按照样本故障标签的故障标签种类,对多个目标样本集进行二分类,得到多个故障类型下的样本集;规则确定模块,用于基于多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,得到预设二分类规则。
根据本发明的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述任意一项的故障诊断方法。
根据本发明的另一方面,还提供了一种计算机设备,包括:存储器和处理器,存储器存储有计算机程序;处理器,用于执行存储器中存储的计算机程序,计算机程序运行时使得处理器执行上述任意一项的故障诊断方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种故障诊断方法,其特征在于,包括:
获取充电桩的初始数据;
基于所述初始数据,得到所述充电桩的故障特征数据;
将所述故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;
计算所述故障特征数据对应于预设故障类型的概率,得到计算结果,并基于所述计算结果得到故障预测结果;
基于所述故障匹配结果和所述故障预测结果,确定所述充电桩的故障诊断结果。
2.根据权利要求1所述的方法,其特征在于,在所述将所述故障特征数据与预设二分类规则进行匹配,得到故障匹配结果之前,还包括:
获取多个目标样本集,其中,所述多个目标样本集中的目标样本集包括样本故障特征数据和与所述样本故障特征数据对应的样本故障标签;
按照所述样本故障标签的故障标签种类,对所述多个目标样本集进行二分类,得到多个故障类型下的样本集;
基于所述多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,得到所述预设二分类规则。
3.根据权利要求2所述的方法,其特征在于,所述获取多个目标样本集,包括:
获取多组样本初始数据;
对所述多组样本初始数据进行特征提取,得到多组初始样本特征数据;
对所述多组初始样本特征数据进行特征筛选,得到多组样本故障特征数据;
确定与所述多组样本故障特征数据分别对应的样本故障标签;
基于所述多组样本故障特征数据和与所述多组样本故障特征数据分别对应的样本故障标签,确定所述多个目标样本集。
4.根据权利要求3所述的方法,其特征在于,所述基于所述多组样本故障特征数据和所述与所述多组样本故障特征数据分别对应的样本故障标签,确定所述多个目标样本集包括:
基于所述多组样本故障特征数据和所述与所述多组样本故障特征数据分别对应的样本故障标签,确定多个初始样本集;
按照所述样本故障标签的故障标签种类,分别计算所述多个初始样本集在所述故障标签种类下对应的样本标签比例;
基于所述样本标签比例,分别对所述多个初始样本集中的样本故障特征数据进行过采样,得到多组过采样后的样本故障特征数据;
基于所述多组过采样后的样本故障特征数据,以及与所述多组过采样后的样本故障特征数据分别对应的所述样本故障标签,得到所述多个目标样本集。
5.根据权利要求2所述的方法,其特征在于,在所述计算所述故障特征数据对应于预设故障类型的概率,得到计算结果,并基于所述计算结果得到故障预测结果之前,还包括:
基于随机森林算法,利用所述多个目标样本集,构建得到与所述预设故障类型对应的故障类型预测模型。
6.根据权利要求5所述的方法,其特征在于,所述计算所述故障特征数据对应于预设故障类型的概率,得到计算结果,并基于所述计算结果得到故障预测结果,包括:
将所述故障特征数据中与所述预设二分类规则匹配失败的数据确定为故障预测数据;
利用所述故障类型预测模型,分别计算所述故障预测数据在多种预设故障类型下的概率,得到多个概率计算结果;
将所述多个概率结果中概率值最大的故障类型确定为所述故障预测结果。
7.一种故障诊断装置,其特征在于,包括:
第一获取模块,用于获取充电桩的初始数据;
第一确定模块,用于基于所述初始数据,得到所述充电桩的故障特征数据;
匹配模块,用于将所述故障特征数据与预设二分类规则进行匹配,得到故障匹配结果;
计算模块,用于计算所述故障特征数据对应于预设故障类型的概率,得到计算结果,并基于所述计算结果得到故障预测结果;
第二确定模块,用于基于所述故障匹配结果和所述故障预测结果,确定所述充电桩的故障诊断结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个目标样本集,其中,所述多个目标样本集中的目标样本集包括样本故障特征数据和与所述样本故障特征数据对应的样本故障标签;
二分类模块,用于按照所述样本故障标签的故障标签种类,对所述多个目标样本集进行二分类,得到多个故障类型下的样本集;
规则确定模块,用于基于所述多个故障类型下的样本集中的样本故障特征数据与故障类型的对应关系,得到所述预设二分类规则。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至6中任意一项所述的故障诊断方法。
10.一种计算机设备,其特征在于,包括:存储器和处理器,
所述存储器存储有计算机程序;
所述处理器,用于执行所述存储器中存储的计算机程序,所述计算机程序运行时使得所述处理器执行权利要求1至6中任意一项所述的故障诊断方法。
CN202211467440.9A 2022-11-22 2022-11-22 故障诊断方法、装置、计算机可读存储介质及计算机设备 Pending CN115859191A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211467440.9A CN115859191A (zh) 2022-11-22 2022-11-22 故障诊断方法、装置、计算机可读存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211467440.9A CN115859191A (zh) 2022-11-22 2022-11-22 故障诊断方法、装置、计算机可读存储介质及计算机设备

Publications (1)

Publication Number Publication Date
CN115859191A true CN115859191A (zh) 2023-03-28

Family

ID=85664986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211467440.9A Pending CN115859191A (zh) 2022-11-22 2022-11-22 故障诊断方法、装置、计算机可读存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN115859191A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117278383A (zh) * 2023-11-21 2023-12-22 航天科工广信智能技术有限公司 一种物联网故障排查方案生成***及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117278383A (zh) * 2023-11-21 2023-12-22 航天科工广信智能技术有限公司 一种物联网故障排查方案生成***及方法
CN117278383B (zh) * 2023-11-21 2024-02-20 航天科工广信智能技术有限公司 一种物联网故障排查方案生成***及方法

Similar Documents

Publication Publication Date Title
US6336109B2 (en) Method and apparatus for inducing rules from data classifiers
CN106570513A (zh) 大数据网络***的故障诊断方法和装置
CN111798312A (zh) 一种基于孤立森林算法的金融交易***异常识别方法
CN114818643B (zh) 一种保留特定业务信息的日志模板提取方法及装置
Kobayashi et al. Towards an NLP-based log template generation algorithm for system log analysis
Li Automatic log analysis using machine learning: awesome automatic log analysis version 2.0
CN110659175A (zh) 日志的主干提取方法、分类方法、设备及存储介质
CN113918367A (zh) 一种基于注意力机制的大规模***日志异常检测方法
CN111366816B (zh) 一种基于机器学习的电网故障诊断方法
CN110704616A (zh) 设备告警工单识别方法及装置
CN114398891B (zh) 基于日志关键词生成kpi曲线并标记波段特征的方法
CN115859191A (zh) 故障诊断方法、装置、计算机可读存储介质及计算机设备
CN116318830A (zh) 一种基于生成对抗网络的日志入侵检测***
CN115758183A (zh) 日志异常检测模型的训练方法及装置
CN112882899B (zh) 一种日志异常检测方法及装置
CN117633666A (zh) 网络资产识别方法、装置、电子设备和存储介质
CN115221013B (zh) 一种日志模式的确定方法、装置及设备
CN112039907A (zh) 一种基于物联网终端评测平台的自动测试方法及***
CN114465875B (zh) 故障处理方法及装置
CN108491618A (zh) 故障电流识别方法、装置、设备及介质
CN115470854A (zh) 信息***故障分类方法及分类***
CN114610576A (zh) 一种日志生成监控方法和装置
CN108460119A (zh) 一种使用机器学习提升技术支持效率的***
CN114626433A (zh) 一种智能电能表故障预测并分类方法、装置及***
CN113268419A (zh) 测试用例优化信息的生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination