CN111881259B - 一种基于文本挖掘的设备故障概率评估方法及*** - Google Patents

一种基于文本挖掘的设备故障概率评估方法及*** Download PDF

Info

Publication number
CN111881259B
CN111881259B CN202010752094.3A CN202010752094A CN111881259B CN 111881259 B CN111881259 B CN 111881259B CN 202010752094 A CN202010752094 A CN 202010752094A CN 111881259 B CN111881259 B CN 111881259B
Authority
CN
China
Prior art keywords
fault
probability
equipment
text
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010752094.3A
Other languages
English (en)
Other versions
CN111881259A (zh
Inventor
杜林�
陶钢
石平灯
易可
陈怀蔺
杨鹏
杨云懿
王师国
熊楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN202010752094.3A priority Critical patent/CN111881259B/zh
Publication of CN111881259A publication Critical patent/CN111881259A/zh
Application granted granted Critical
Publication of CN111881259B publication Critical patent/CN111881259B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于文本挖掘的设备故障概率评估方法及***,包括,对相关设备进行故障模式影响分析;利用文本挖掘技术将所述相关设备运行记录的文本数据分类为正确的故障模式;根据所述正确的故障模式和所述影响分析计算所述相关设备各部分和组件的故障概率;集成所述各部分和组件的故障概率,计算所述相关设备的故障概率。通过文本挖掘等信息化技术,解决了传统手动方式难以在海量的、存有各种细微差别的故障记录内实现故障模式分类的问题,同时利用词袋模型、韦伯分布函数等手段,自动将故障报告分类为不同设备的不同故障模式,最终实现设备故障概率评估的自动获得,为设备更换、维护等决策提供了客观依据。

Description

一种基于文本挖掘的设备故障概率评估方法及***
技术领域
本发明涉及的能源互联网技术领域,尤其涉及一种基于文本挖掘的设备故障概率评估方法及***。
背景技术
近年来能源互联网设备在长期运行过程中必然面临维护、更换等情况,以保障***的正常稳定持续运行。然而,针对具体设备是采用及时更换还是维护后继续使用,便涉及到了投资的合理性,需要进行客观决策。风险量化是客观决策中不可或缺的要素,其中最为重要的,就是需要对设备故障的概率进行量化评估,以便作出准确决定。
在设备设施维护中,事故发生时往往会记录“异常事故报告”(包括文本)。然而,报告中的文本数据并不总是适合于数值分析,因此不能有效地使用。为了精确地计算设备的故障概率,数据收集(大量过去的事故报告)和适当分析是必不可少的。能源互联网中的设备,如冷热电三联供、电力变压器,往往表现出复杂的故障模式,这意味着不同模式下的故障概率趋势不同(例如,一些故障模式可能与运行时间有关,而另一些则与操作次数有关)。在设备长期运行过程中,往往会积累大量的故障报告,这些数据可以有效地实现精确的故障概率计算。然而,由于这些文本中包含的大量数据和各种细微差别等因素,很难将报告手动分类为各种故障模式,更难以采用手动方式实现故障概率的有效评估。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在难以在海量的、有各种细微差别的故障记录中实现故障模式分类的问题,提出了本发明。
因此,本发明解决的技术问题是:通过文本信息挖掘技术从历史故障报告中获得相关数据,并利用词袋模型、韦伯分布函数分类为正确的故障模式,最终自动计算出故障概率评估数据。
为解决上述技术问题,本发明提供如下技术方案:对相关设备进行故障模式影响分析;利用文本挖掘技术将所述相关设备运行记录的文本数据分类为正确的故障模式;根据所述正确的故障模式计算所述相关设备各部分和组件的故障概率;集成所述各部分和组件的故障概率,计算所述相关设备的故障概率。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述文本挖掘技术包括,定义设备故障特征词的类别和集合(包括权重值);使用词袋模型对输入文档的记录内容进行矢量表达并且对每个类别的特征词进行矢量表达;利用“余弦相似度”评价输入文档向量与类别向量的相似度。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述余弦相似度包括,向量A和向量B的相似性通过向量的角度来度量,n为向量维数;所述余弦相似度的数值越大,则表明两向量之间的相似性越高,文本分类的故障模式越正确,因此,设定一个门槛参数R,取“余弦相似度”>R的一部分作为分类结果,一般而言,R可取0.95,所述余弦相似度的计算如下:
Figure BDA0002610349860000021
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述计算各部分的故障概率,包括,根据所述故障信息,采用韦伯分布函数绘制组件的故障概率曲线,如下:
Figure BDA0002610349860000022
其中,x为随机变量,λ为比例参数且λ>0,k为形状参数且k>0;根据组件的故障信息采用描点法画出分布图,再利用韦伯分布函数,确定参数λ和k,其中λ为比例参数(scale),k为形状参数(shape)。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述计算设备的故障概率包括,
PF=1-∏(1-Pk)
其中,设备的故障概率为PF,Pk为各个故障模式的故障概率。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述对相关设备进行故障模式影响分析包括,所述相关设备,每个都由多个较小组件组成,且组件表现出不同的故障模式;根据所述相关设备的特征和独特性将设备分成几个部分并进一步分成不同组件和对应的故障模式,进行分类编号形成故障文本;使组件与其对应的故障模式相联系。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述故障文本包括,所述故障文本记录越全面,则故障概率计算的准确度就越高。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述故障概率包括,所述故障概率是一个与所述相关设备使用年数相关的故障概率参数,且随着使用年数的增加,所述相关设备的故障概率就越高;当使用年数少于规定的年限如20年或所述故障概率小于规定的参数如1%,则对所述相关设备进行维修,否则,则需要进行更换。
作为本发明所述的一种基于文本挖掘的设备故障概率评估方法的一种优选方案,其中:所述分类结果包括,“余弦相似度”>R,则表明两向量之间的相似度高,归类为与组件对应的故障模式并且记录各个所述故障模式出现的次数和频率用于所述故障概率的计算。
本发明解决的另一个技术问题是:提出一种基于文本挖掘的设备故障概率评估***,解决自动计算相关设备的故障概率问题。
为解决上述技术问题,本发明提供如下技术方案:一种基于文本挖掘的设备故障概率评估***,包括,分析模块,用于对相关设备进行故障模式的影响分析;数据分类模块,用于对所述相关设备运行过程中记录的文本数据进行分类;计算模块包括组件计算单元和设备计算单元,其中所述组件计算单元连接于所述数据分类模块,用于计算所述相关设备各部分和组件的故障概率;所述设备计算单元连接于所述组件计算单元,用于集成所述组件计算模块得到的所述各部分和组件的故障概率,计算所述相关设备的故障概率。
本发明的有益效果:本发明利用文本挖掘等信息化技术,解决了传统手动方式难以在海量的、存有各种细微差别的故障记录内实现故障模式分类的问题,同时利用词袋模型、韦伯分布函数等手段,自动将故障报告分类为不同设备的不同故障模式,最终实现设备故障概率评估的自动获得,为设备更换、维护等决策提供了客观依据。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一个实施例所述一种基于文本挖掘的设备故障概率评估方法的流程示意图;
图2为本发明第一个实施例所述一种基于文本挖掘的设备故障概率评估方法的逻辑关系示意图;
图3为本发明第一个实施例所述一种基于文本挖掘的设备故障概率评估方法的故障模式影响分析结构示意图;
图4为本发明第一个实施例所述一种基于文本挖掘的设备故障概率评估方法的采用文本挖掘技术进行故障记录分类的流程示意图;
图5为本发明第一个实施例所述一种基于文本挖掘的设备故障概率评估方法的不同λ和k参数下的韦伯分布函数曲线示意图;
图6为本发明第二个实施例所述一种基于文本挖掘的设备故障概率评估***的模块结构分布示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1~5,为本发明的第一个实施例,该实施例提供了一种基于文本挖掘的设备故障概率评估方法,包括:
S1:对相关设备进行故障模式影响分析。其中需要说明的是,对相关设备进行故障模式影响分析包括,相关设备,每个都由多个较小组件组成,且组件表现出不同的故障模式;根据相关设备的特征和独特性将设备分成几个部分,每个部分再进一步分成不同组件和对应的故障模式,进行分类编号形成故障文本,使组件与其对应的故障模式相联系;
其中,故障文本包括,故障文本记录越全面,则故障概率计算的准确度就越高。
S2:利用文本挖掘技术将相关设备运行记录的文本数据分类为正确的故障模式。其中需要说明的是,文本挖掘技术包括,定义设备故障特征词的类别和集合(包括权重值);使用词袋模型对输入文档的记录内容进行矢量表达并且对每个类别的特征词进行矢量表达;利用“余弦相似度”评价输入文档向量与类别向量的相似度;
其中,余弦相似度包括,向量A和向量B的相似性通过向量的角度来度量,n为向量维数;余弦相似度的数值越大,则表明两向量之间的相似性越高,文本分类的故障模式越正确,因此,设定一个门槛参数R,取“余弦相似度”>R的一部分作为分类结果,一般而言,R可取0.95,余弦相似度的计算如下:
Figure BDA0002610349860000061
其中,分类结果包括,“余弦相似度”>R,则表明两向量之间的相似度高,归类为与组件对应的故障模式并且记录各个故障模式出现的次数和频率用于计算故障概率。
S3:根据正确的故障模式计算相关设备各部分和组件的故障概率。其中需要说明的是,计算各部分的故障概率,包括,根据故障信息,采用韦伯分布函数绘制组件的故障概率曲线,如下:
Figure BDA0002610349860000062
其中,x为随机变量,λ为比例参数且λ>0,k为形状参数且k>0;根据组件的故障信息采用描点法画出分布图,再利用韦伯分布函数,确定参数λ和k,其中λ为比例参数(scale),k为形状参数(shape)。
S4:集成各部分和组件的故障概率,计算相关设备的故障概率。其中需要说明的是,计算设备的故障概率包括,
PF=1-∏(1-Pk)
其中,设备的故障概率为PF,Pk为各个故障模式的故障概率。
进一步的是,故障概率是一个与相关设备使用年数相关的故障概率参数,且随着使用年数的增加,相关设备的故障概率就越高;当使用年数少于规定的年限如20年或故障概率小于规定的参数如1%,则对相关设备进行维修,否则,则需要进行更换。
为了更好地对本发明方法中采用的技术效果加以验证说明,本实施例中选择基于雷电实测数据的输电线路故障概率评估方法与本发明方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果;传统基于雷电实测数据的输电线路故障概率评估方法在进行故障概率评估时仅能对雷击发生时的故障进行评估而对于各种情况下相关设备故障概率评估的准确度很难保障,为验证本方法相对于传统方法具有较高的准确度,本实施例中将采用传统方法与本方法分别对各种情况下,各种相关设备故障概率评估的准确度进行实时测试对比。
测试条件:采用5种故障发生情况作为测试样本,分别为自身因素、灾害天气、外力破坏、人为操作和运行工况,运用MATLB软件实现两种方法的数据测试,对相关设备进行故障模式的影响分析,计算相关设备中各个部分和组件的故障概率进而集成计算相关设备的故障概率,得到5种测试情况下的故障概率的评估结果,每种测试方法各测试5组数据,根据实验结果得到故障概率评估的准确度,所得结果如下表所示:
表1:测试样本的实验结果。
Figure BDA0002610349860000071
从表1可以看出,在5种情况下,使用传统的基于雷电实测数据的输电线路故障概率评估方法虽然在灾害天气的情况下对于故障概率的评估准确度有明显的提升,但是准确度仍比使用本方法所得的故障概率评估的准确度低,在测试的其他情况下,使用本发明方法所得到的故障概率评估的准确度要远远高于使用传统的故障概率评估方法,因此能够看出在5组数据中本发明方法取得了较高的准确度,本发明方法对于故障概率评估的准确度有了明显的提高,便于对相关设备采取有效的解决措施。
实施例2
参照图6,为本发明的第二个实施例,该实施例不同于第一个实施例的是,提供了一种基于文本挖掘的设备故障概率评估***,包括:分析模块100、数据分类模块200和计算模块300。更加具体的,其中分析模块100,用于对相关设备进行故障模式的影响分析,并将分析结果上传至数据分类模块200;数据分类模块200,用于对所述相关设备运行过程中记录的文本数据进行分类,并将分类结果上传至计算模块300;该计算模块300包括组件计算单元301和设备计算单元302,其中组件计算单元301连接于所述数据分类模块200,能够接收数据分类模块200上传的分类结果,用于计算所述相关设备各部分和组件的故障概率,并将结果上传至设备计算单元302,设备计算单元302连接于组件计算单元301,能够接收组件计算单元301上传的故障概率,用于用于集成所述组件计算单元301得到的所述各部分和组件的故障概率,计算所述相关设备的故障概率。
不难理解的是,本实施例所提出的***,其内容涉及分析模块100、数据分类模块200和计算模块300,之间的连接关系,例如可以是运行在计算机可读程序,通过提高各模块的程序数据接口实现。
应当认识到,本发明的实施例可以由计算机硬件、硬件和软件的组合、或者通过存储在非暂时性计算机可读存储器中的计算机指令来实现或实施。所述方法可以使用标准编程技术-包括配置有计算机程序的非暂时性计算机可读存储介质在计算机程序中实现,其中如此配置的存储介质使得计算机以特定和预定义的方式操作——根据在具体实施例中描述的方法和附图。每个程序可以以高级过程或面向对象的编程语言来实现以与计算机***通信。然而,若需要,该程序可以以汇编或机器语言实现。在任何情况下,该语言可以是编译或解释的语言。此外,为此目的该程序能够在编程的专用集成电路上运行。
此外,可按任何合适的顺序来执行本文描述的过程的操作,除非本文另外指示或以其他方式明显地与上下文矛盾。本文描述的过程(或变型和/或其组合)可在配置有可执行指令的一个或多个计算机***的控制下执行,并且可作为共同地在一个或多个处理器上执行的代码(例如,可执行指令、一个或多个计算机程序或一个或多个应用)、由硬件或其组合来实现。所述计算机程序包括可由一个或多个处理器执行的多个指令。
进一步,所述方法可以在可操作地连接至合适的任何类型的计算平台中实现,包括但不限于个人电脑、迷你计算机、主框架、工作站、网络或分布式计算环境、单独的或集成的计算机平台、或者与带电粒子工具或其它成像装置通信等等。本发明的各方面可以以存储在非暂时性存储介质或设备上的机器可读代码来实现,无论是可移动的还是集成至计算平台,如硬盘、光学读取和/或写入存储介质、RAM、ROM等,使得其可由可编程计算机读取,当存储介质或设备由计算机读取时可用于配置和操作计算机以执行在此所描述的过程。此外,机器可读代码,或其部分可以通过有线或无线网络传输。当此类媒体包括结合微处理器或其他数据处理器实现上文所述步骤的指令或程序时,本文所述的发明包括这些和其他不同类型的非暂时性计算机可读存储介质。当根据本发明所述的方法和技术编程时,本发明还包括计算机本身。计算机程序能够应用于输入数据以执行本文所述的功能,从而转换输入数据以生成存储至非易失性存储器的输出数据。输出信息还可以应用于一个或多个输出设备如显示器。在本发明优选的实施例中,转换的数据表示物理和有形的对象,包括显示器上产生的物理和有形对象的特定视觉描绘。
如在本申请所使用的,术语“组件”、“模块”、“***”等等旨在指代计算机相关实体,该计算机相关实体可以是硬件、固件、硬件和软件的结合、软件或者运行中的软件。例如,组件可以是,但不限于是:在处理器上运行的处理、处理器、对象、可执行文件、执行中的线程、程序和/或计算机。作为示例,在计算设备上运行的应用和该计算设备都可以是组件。一个或多个组件可以存在于执行中的过程和/或线程中,并且组件可以位于一个计算机中以及/或者分布在两个或更多个计算机之间。此外,这些组件能够从在其上具有各种数据结构的各种计算机可读介质中执行。这些组件可以通过诸如根据具有一个或多个数据分组(例如,来自一个组件的数据,该组件与本地***、分布式***中的另一个组件进行交互和/或以信号的方式通过诸如互联网之类的网络与其它***进行交互)的信号,以本地和/或远程过程的方式进行通信。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (6)

1.一种基于文本挖掘的设备故障概率评估方法,其特征在于:
对相关设备进行故障模式影响分析;所述相关设备,每个都由多个较小组件组成,且组件表现出不同的故障模式;根据所述相关设备的特征和独特性将设备分成几个部分并进一步分成不同组件和对应的故障模式,进行分类编号形成故障文本;使组件与其对应的故障模式相联系;
利用文本挖掘技术将所述相关设备运行记录的文本数据分类为正确的故障模式;所述文本挖掘技术包括,定义设备相关故障特征词的类别和集合;使用词袋模型对输入文档的记录内容进行矢量表达并且对每个类别的特征词进行矢量表达;利用“余弦相似度”评价输入文档向量与类别向量的相似度与设定一个门槛参数R,取“余弦相似度”>R的一部分作为分类结果,分类结果包括,“余弦相似度”>R,则表明两向量之间的相似度高,归类为与组件对应的故障模式并且记录各个所述故障模式出现的次数和频率用于所述故障概率的计算;
根据所述正确的故障模式计算所述相关设备各部分和组件的故障概率;根据故障信息,采用韦伯分布函数绘制组件的故障概率曲线,如下:
Figure FDA0004116079370000011
其中,x为随机变量,λ为比例参数且λ>0,k为形状参数且k>0;根据组件的故障信息采用描点法画出分布图,再利用韦伯分布函数,确定参数λ和k,其中λ为比例参数,k为形状参数;
集成所述各部分和组件的故障概率,计算所述相关设备的故障概率。
2.根据权利要求1所述的一种基于文本挖掘的设备故障概率评估方法,其特征在于:所述余弦相似度包括,
向量A和向量B的相似性通过向量的角度来度量,n为向量维数;所述余弦相似度的数值越大,则表明两向量之间的相似性越高,文本分类的故障模式越正确,因此,设定一个门槛参数R,取“余弦相似度”>R的一部分作为分类结果,所述余弦相似度的计算如下:
Figure FDA0004116079370000012
3.根据权利要求2所述的一种基于文本挖掘的设备故障概率评估方法,其特征在于:所述计算所述相关设备的故障概率包括,
PF=1-∏(1-Pk)
其中,设备的故障概率为PF,Pk为各个故障模式的故障概率。
4.根据权利要求3所述的一种基于文本挖掘的设备故障概率评估方法,其特征在于:所述故障文本包括,
所述故障文本记录越全面,则故障概率计算的准确度就越高。
5.根据权利要求4所述的一种基于文本挖掘的设备故障概率评估方法,其特征在于:所述故障概率包括,
所述故障概率是一个与所述相关设备使用年数相关的故障概率参数,且随着使用年数的增加,所述相关设备的故障概率就越高;当使用年数少于规定的年限或所述故障概率小于规定的参数,则对所述相关设备进行维修,否则,则需要进行更换。
6.一种基于文本挖掘的设备故障概率评估***,其特征在于:包括,
分析模块(100),用于对相关设备进行故障模式的影响分析;所述相关设备,每个都由多个较小组件组成,且组件表现出不同的故障模式;根据所述相关设备的特征和独特性将设备分成几个部分并进一步分成不同组件和对应的故障模式,进行分类编号形成故障文本;使组件与其对应的故障模式相联系;
数据分类模块(200)连接于分析模块(100),用于对所述相关设备运行过程中记录的文本数据进行分类;
计算模块(300)包括组件计算单元(301)和设备计算单元(302),其中所述组件计算单元(301)连接于所述数据分类模块(200),其用于计算所述相关设备各部分和组件的故障概率,所述设备计算单元(302)连接于所述组件计算单元(301),用于集成所述组件计算单元(301)得到的所述各部分和组件的故障概率,计算所述相关设备的故障概率。
CN202010752094.3A 2020-07-30 2020-07-30 一种基于文本挖掘的设备故障概率评估方法及*** Active CN111881259B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010752094.3A CN111881259B (zh) 2020-07-30 2020-07-30 一种基于文本挖掘的设备故障概率评估方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010752094.3A CN111881259B (zh) 2020-07-30 2020-07-30 一种基于文本挖掘的设备故障概率评估方法及***

Publications (2)

Publication Number Publication Date
CN111881259A CN111881259A (zh) 2020-11-03
CN111881259B true CN111881259B (zh) 2023-06-20

Family

ID=73204573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010752094.3A Active CN111881259B (zh) 2020-07-30 2020-07-30 一种基于文本挖掘的设备故障概率评估方法及***

Country Status (1)

Country Link
CN (1) CN111881259B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112966093A (zh) * 2021-03-04 2021-06-15 北京航空航天大学 一种对电子产品进行改进的方法、装置、设备和介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277370A (ja) * 2005-03-29 2006-10-12 Toshiba Corp 回路基板の品質解析システム及び品質解析方法
KR20090089631A (ko) * 2008-02-19 2009-08-24 한양대학교 산학협력단 최소 절단 집합과 퍼지 전문가 시스템을 이용한 시스템의고장 모드 및 임계 분석 장치 및 그 방법
CN102982385A (zh) * 2011-08-03 2013-03-20 通用电气公司 为风力发电机管理与全面服务协议相关的风险的***
CN105302941A (zh) * 2015-09-17 2016-02-03 广州供电局有限公司 高压单芯电缆寿命评估方法及***
CN105512195A (zh) * 2015-11-26 2016-04-20 中国航空工业集团公司沈阳飞机设计研究所 一种产品fmeca报告分析决策辅助方法
CN107577738A (zh) * 2017-08-28 2018-01-12 电子科技大学 一种通过svm文本挖掘处理数据的fmeca方法
CN108646725A (zh) * 2018-07-31 2018-10-12 河北工业大学 基于动态加权的双模型故障诊断方法
CN109684447A (zh) * 2018-12-13 2019-04-26 贵州电网有限责任公司 一种基于文本挖掘的电网调度运行日志故障信息分析方法
CN110781671A (zh) * 2019-10-29 2020-02-11 西安科技大学 一种智能ietm故障维修记录文本的知识挖掘方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8065334B2 (en) * 2007-10-30 2011-11-22 Wipro Limited Warranty insight solution framework system and method

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277370A (ja) * 2005-03-29 2006-10-12 Toshiba Corp 回路基板の品質解析システム及び品質解析方法
KR20090089631A (ko) * 2008-02-19 2009-08-24 한양대학교 산학협력단 최소 절단 집합과 퍼지 전문가 시스템을 이용한 시스템의고장 모드 및 임계 분석 장치 및 그 방법
CN102982385A (zh) * 2011-08-03 2013-03-20 通用电气公司 为风力发电机管理与全面服务协议相关的风险的***
CN105302941A (zh) * 2015-09-17 2016-02-03 广州供电局有限公司 高压单芯电缆寿命评估方法及***
CN105512195A (zh) * 2015-11-26 2016-04-20 中国航空工业集团公司沈阳飞机设计研究所 一种产品fmeca报告分析决策辅助方法
CN107577738A (zh) * 2017-08-28 2018-01-12 电子科技大学 一种通过svm文本挖掘处理数据的fmeca方法
CN108646725A (zh) * 2018-07-31 2018-10-12 河北工业大学 基于动态加权的双模型故障诊断方法
CN109684447A (zh) * 2018-12-13 2019-04-26 贵州电网有限责任公司 一种基于文本挖掘的电网调度运行日志故障信息分析方法
CN110781671A (zh) * 2019-10-29 2020-02-11 西安科技大学 一种智能ietm故障维修记录文本的知识挖掘方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"基于大数据的大容量电力电子***可靠性研究";何湘宁、石巍、李武华、罗皓泽、赵荣祥;《基于大数据的大容量电力电子***可靠性研究》;20170103;第37卷(第01期);209-221 *
"基于深度学习的故障诊断方法综述";文成林、吕菲亚;《电子与信息学报》;20200115;第42卷(第01期);234-248 *
"基于词向量语义扩展的网络文本特征选择方法研究";吕建新、郑伟、马林、李明、谷翠梅;《情报科学》;20191201;第37卷(第12期);47-51 *
"电网故障智能诊断技术研究综述";刘仲民、呼彦喆、张鑫;《南京师大学报(自然科学版》;20190920;第42卷(第03期);138-144 *
Xiaoqin Zhang ; Ying Chen ; Xiang Ma ; Rui Kang."Simulation assisted FMEA of electronic product".《 Proceedings of the IEEE 2012 Prognostics and System Health Management Conference (PHM-2012 Beijing)》.2012,论文第1-5页. *
Zhaojun Li ; Gongyu Wu."AText Mining based Reliability Analysis Method in Design Failure Mode and Effect Analysis".《2018 IEEE International Conference on Prognostics and Health Management (ICPHM)》.2018,论文第1-7页. *

Also Published As

Publication number Publication date
CN111881259A (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
US10534361B2 (en) Industrial asset health model update
CN109685289B (zh) 高炉炉况顺行预测方法、装置及***
CN103247008B (zh) 一种电力统计指标数据的质量评估方法
CN107545349A (zh) 一种面向电力大数据的数据质量分析评价模型
CN111400371A (zh) 一种基于电压相关性校验的户变关系识别方法
KR101756189B1 (ko) 환경 정보 수집 및 평가 시스템
US20170169380A1 (en) Method and System for Determining Quality Level of Performance Data Associated With an Enterprise
US11568429B2 (en) Demand forecasting method and demand forecasting apparatus
CN111597121B (zh) 一种基于历史测试用例挖掘的精准测试方法
CN111160582A (zh) 设备故障识别方法、装置及计算机可读存储介质
US20180137218A1 (en) Systems and methods for similarity-based information augmentation
CN109542742A (zh) 基于专家模型的数据库服务器硬件健康评估方法
CN111881259B (zh) 一种基于文本挖掘的设备故障概率评估方法及***
CN115689396A (zh) 污染物排放管控方法、装置、设备及介质
CN112200459A (zh) 一种配电网数据质量分析评价方法及***
CN113590392B (zh) 换流站设备异常检测方法、装置、计算机设备和存储介质
CN112597435B (zh) 基于设备监理的火电设备质量数据处理方法及装置
CN114548493A (zh) 一种电能表电流过载预测方法与***
CN117390370A (zh) 基于健康指数的机台预警方法、装置、设备及可读介质
CN112345972A (zh) 基于停电事件的配电网线变关系异常诊断方法、装置及***
CN111080364A (zh) 一种工程造价数据中心管理***及装置
CN107169294A (zh) 一种环境试验自动测试***中Excel报表二次判断处理方法
CN111612356A (zh) 一种工程质量保险风险管理效果和方案分析方法及***
CN108446213A (zh) 一种静态代码质量分析方法和装置
JP2010231376A (ja) 機器品質管理方法、機器品質管理システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant