CN114595943A - 机械设备画像生成方法 - Google Patents

机械设备画像生成方法 Download PDF

Info

Publication number
CN114595943A
CN114595943A CN202210132467.6A CN202210132467A CN114595943A CN 114595943 A CN114595943 A CN 114595943A CN 202210132467 A CN202210132467 A CN 202210132467A CN 114595943 A CN114595943 A CN 114595943A
Authority
CN
China
Prior art keywords
label
data
equipment
value
mechanical equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210132467.6A
Other languages
English (en)
Inventor
王新梦
王宗文
李海龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yantai Jereh Oilfield Services Group Co Ltd
Original Assignee
Yantai Jereh Oilfield Services Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yantai Jereh Oilfield Services Group Co Ltd filed Critical Yantai Jereh Oilfield Services Group Co Ltd
Priority to CN202210132467.6A priority Critical patent/CN114595943A/zh
Priority to PCT/CN2022/090147 priority patent/WO2023151191A1/zh
Publication of CN114595943A publication Critical patent/CN114595943A/zh
Priority to US18/160,876 priority patent/US20230259862A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Manufacturing & Machinery (AREA)
  • Primary Health Care (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供一种机械设备画像生成方法,该方法包括:获取所有与机械设备相关的数据信息;对机械设备相关的数据信息进行数据融合,以获得多源数据信息集合;基于多源数据信息集合获取机械设备的目标属性数据和目标状态数据;基于所获取的所述目标属性数据生成机械设备的属性标签;将机械设备的当前目标状态数据输入到训练好的神经网络模型中,获得机械设备当前状态标签,其中,当前状态标签包括机械设备的状态标签值;通过所获取的属性标签的属性标签值和所获得的当前状态标签的状态标签值,生成机械设备的设备画像。根据本申请的方法,有助于实现柱塞泵故障检测,并能及时准确地掌握设备当前的运行状况,便于掌控整个生产过程。

Description

机械设备画像生成方法
技术领域
本申请涉及机械设备智能化管理技术领域,更具体地说,涉及一种机械设备画像生成方法。
背景技术
画像技术被广泛应用于互联网等多行业领域,主要以用画像为主,可以用来挖掘用户特征、掌握用户偏好、以及深入彻底的了解和掌握被刻画对象。同样,大型机械设备也可以像人一样被刻画,也可以通过画像技术进行特征提取和完成全面描述刻画。大型机械设备出厂、生产和维修过程都产生了大量的监控、监测数据,这些数据可以直接反应出设备的显著特征,但是只是通过大量的数据无法直观深入的挖掘出其特征。所以构建机械设备画像,可以准确的挖掘提取机械设备各方面特征、并将其全面的呈现出来,便于我们及时了解掌握设备状态和运行现状。
发明内容
要解决的技术问题
目前为止,对于机械设备画像的研究相对较少,对于油气行业大型机械服务设备的相关研究更少。所以创建完整的机械设备画像是亟待解决的问题。随着设备数据的持续积累和广泛应用,各类大型设备画像将被创建,从而帮助在生产作业过程中及时准确掌握设备动态和运行状况。
技术方案
为了实现上述目的,本申请提供一种机械设备画像生成方法,该方法包括:获取所有与机械设备相关的数据信息;对机械设备相关的数据信息进行数据融合,以获得多源数据信息集合;基于多源数据信息集合获取机械设备的目标属性数据和目标状态数据;基于所获取的所述目标属性数据生成机械设备的属性标签;将机械设备的当前目标状态数据输入到训练好的神经网络模型中,获得机械设备当前状态标签,其中,当前状态标签包括机械设备的状态标签值;通过所获取的属性标签的属性标签值和所获得的当前状态标签的状态标签值,生成机械设备的设备画像。
进一步地,机械设备画像生成方法还包括:基于机械设备的目标状态数据以及目标状态数据的目标状态标签值数量,对神经网络模型进行初始化;基于目标状态数据生成多个统计指标;以及将包括多个统计指标以及目标状态数据的状态分类标签数据的数据矩阵输入到初始化的所述神经网络模型中,对神经网络模型进行训练。
进一步地,基于多源数据信息集合获取机械设备的目标属性数据和目标状态数据,包括:基于多源数据信息集合获取初始属性数据和初始状态数据;基于对初始属性数据的关注度和/或重要性,获取目标属性数据;对初始状态数据进行归一化处理,获取目标状态数据。
进一步地,通过所获取的属性标签的属性标签值和所获得的当前状态标签的状态标签值,生成机械设备的设备画像,包括:基于机械设备的属性标签值和当前状态标签值,构建所有标签值集合和设备集合;基于标签值集合和设备集合,构建共现矩阵;基于共现矩阵,通过聚类算法获取属性标签和当前状态标签的标签聚类簇;以及基于标签聚类簇获取设备当前重点标签值,生成机械设备的设备画像。
进一步地,基于标签聚类簇获取设备当前重点标签值,生成机械设备的设备画像,包括:将各设备所有标签值与所获取的标签聚类簇所含标签值进行比较;以及获取各设备所含标签值覆盖标签聚类簇中标签值类别数最多的第一标签聚类簇,并将第一标签聚类簇中所对应的标签值设为设备当前重点标签值。
进一步地,机械设备画像生成方法还包括:将所生成的设备画像可视化为画像词云图。
进一步地,机械设备画像生成方法还包括:将机械设备的当前目标状态数据的状态标签值与设定值进行比较,获得机械设备的当前状态标签。
进一步地,将机械设备的当前目标状态数据的状态标签值与设定值进行比较,获得机械设备的当前状态标签。
进一步地,对机械设备相关的数据信息进行数据融合,以获得多源数据信息集合,包括:为各设备设定相互不同的唯一标识;获取各设备具有唯一标识的第一库表以及与第一库表相关联的第二库表;以及以唯一标识使得第一库表和第二库表相互关联。
进一步地,神经网络模型包括反向传播神经网络模型。
进一步地,统计指标包括:均值、标准差、方根幅值、有效值、峰值、偏度、峭度、最大值、裕度值、波形因子、脉冲指数。
进一步地,状态标签值包括:正常、故障、高、中和低。
根据本申请的又一方面,提供一种计算机设备,包括存储器及处理器,所述存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述机械设备画像生成方法的步骤。
根据本申请的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述机械设备画像生成方法的步骤。
有益效果
根据本申请,通过将客户画像技术应用到柱塞泵设备中,构建起了较为完善的柱塞泵设备画像标签体系。
并且,本申请中所构建的标签体系既包含了静态属性和瞬时参量,又包含了参量状态评价和维护状态信息,并提供了基于神经网路进行设备当前状态标签的构建方法,从而便于获得设备当前健康状态等标签,最终获得关于设备的画像,有助于实现柱塞泵故障检测,并能及时准确地掌握设备当前的运行状况,便于掌控整个生产过程。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本申请的一优选实施例的机械设备画像生成方法的流程图;
图2示出了根据本申请的一实施例的机械设备相关多源数据的融合处理示意图;
图3示意性示出了根据本申请的所构建的样本数据的示例标签体系;
图4示出了根据本申请的一优选实施例的将机械设备的画像可视化为画像词云图的示意图;
图5示出了根据本申请的一具体实施例的机械设备画像生成方法的流程示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
根据本申请的一实施例,如图1所示,提供一种机械设备画像生成方法,该方法包括:获取所有与机械设备相关的数据信息(S101);对机械设备相关的数据信息进行数据融合,以获得多源数据信息集合(S102);基于多源数据信息集合获取机械设备的目标属性数据和目标状态数据(S103);基于所获取的所述目标属性数据生成机械设备的属性标签(S104);将机械设备的当前目标状态数据输入到训练好的神经网络模型中,获得机械设备当前状态标签,其中,当前状态标签包括机械设备的状态标签值(S105);通过所获取的属性标签的属性标签值和所获得的当前状态标签的状态标签值,生成机械设备的设备画像(S106)。
根据本申请能够为机械设备,诸如,柱塞泵设备,构建起较为完善的画像标签体系,有助于在生产过程中及时准确掌握设备的动态和运行状况。
下面,通过详细的描述来说明机械设备画像生成方法的具体过程。
S101:获取所有与机械设备相关的数据信息。
机械设备应用广泛,例如:油气设备服务行业的柱塞泵就是油气行业主要应用的大型机械设备之一,可以利用其进行固井、酸化、压裂等高强度作业。机械设备从生产落地到现场作业再到维修、报废,整个生命周期中产生大量的生产数据和运维数据。
并且,机械设备运行期间涉及数据是多元的且分散的,不同类型的数据分散在各大设备管理***中,需要对其进行梳理,主要包括(但不仅限于下述数据):设备档案属性类数据、设备生产作业运行数据、设备售后维保数据、设备实时监控***各类传感器数据。通过对包含上述数据的设备相关业务***底层数据库表、库表字段进行梳理,并以此作为机械设备画像数据源,从而获得所有与各机械设备相关的数据信息。
下面,以压裂井场压裂车载柱塞泵为例来说明获取与该设备相关的数据信息。
对与柱塞泵相关的多源数据以及涉及数据源***进行梳理,获得如下所示的数据库表:
Figure BDA0003503188470000051
以上四类数据属于柱塞泵涉及的主要数据范围,因此,构建柱塞泵画像指标体系需要基于上述数据源来实现。
S102:对机械设备相关的数据信息进行数据融合,以获得多源数据信息集合。
机械设备相关业务***数据多源分散在各业务***,数据相对孤立,需要对其进行数据融合,实现多源数据信息的串并。
根据本申请的一优选实施例,通过以下方法对上述获得数据信息进行融合。
优选地,确定一个唯一标识作为每台设备的唯一身份象征,该唯一标识对于不同设备之间互不相同,可以(但不仅限于)是设备出厂时的“设备编号”。
梳理如上所述获得的数据信息中设备相关的所有数据表,该处数据信息应该是各业务***底层结构化数据库中的所有数据库表,根据库表结构(即库表中所含字段),将具有设备唯一标识的第一库表以及与该第一库表通过其他字段可进行关联的第二库表进行归纳。
具体地,把这两类数据库表进行梳理,例如,梳理每个数据源信息有多少个具有设备唯一标识的第一库表以及与该第一库表通过其他字段可进行关联的第二库表,并且,每个库表分别是什么并且包含哪些字段等等。
第一库表中具有设备唯一标识的字段,第二库表中没有设备唯一标识的字段,但是第二库表中的其他字段可以与第一库表进行关联。
上面所说的第一库表和第二库表均可以设置有多个,使用“第一库表”和“第二库表”用于区分库表是否具有设备唯一标识。
开通上面所涉及业务***数据库(例如第一库表和第二库表等)彼此之间的访问权限,以设备唯一标识作为关联字段,通过数据库语句,例如通过结构化查询语言(sql)语句,对上述中梳理出来的各***数据库表创建关联关系,从而实现以设备唯一标识为索引的设备多源数据有效融合。
以压裂井场压裂车载柱塞泵为例来说明对机械设备相关的数据信息进行数据融合的过程,图2示出了根据本申请的一实施例的机械设备相关多源数据的融合处理示意图。
如图2所示,将“柱塞泵设备编号”作为唯一标识,与“柱塞泵设备编号”相关的***和库表示例为:压裂车作业监控***、柱塞泵智能检测***、压裂车售后维护管理***以及设备生产档案管理库。例如,压裂车售后维护管理***中设备运行参数表共23个字段;柱塞泵智能检测***中设备振动信号记录表共9字段;压裂车售后维护管理***中设备维保记录表共12个字段以及设备生产档案管理库中设备档案信息表共25个字段,基于唯一标识“柱塞泵设备编号”关联上述四张表,除去重复字段,数据融合后,结果表中共含61个字段。
当然,可以根据不同标签需求筛选需要的字段放入关联结果表中,并且可以根据标签计算需要对上述数据融合表所含字段进行删减查询等。
通过如上所述的操作,获得以设备唯一标识为索引的融合后的设备多源数据信息集合。
本申请中,设备标签分为两大类,分别是设备状态热标签类和设备属性冷标签类。其中,设备属性冷标签指的是标签值是设备固有属性或者一旦生成一般不会发生变化的属性标签类;设备状态热标签指的是标签值跟随设备状态发生周期性或不定时随机变化的标签类。机械设备所有标签都可以归入上述两大类中。
例如,如图3所示,其示意性示出了根据本申请的所构建的样本数据的示例标签体系。
例如,设备属性冷标签可以包括:设备编号、设备类型、设备生产日期、设备投产日期、设备额定功率、设备冲程、设备柱塞规格、设备最高压力、设备最大排量、设备外形尺寸、设备重量等。
设备状态热标签可以包括:设备健康状态标签(标签值为正常或故障)、设备当前压力状态标签(标签值包括:高、中、低)、设备故障风险等级等。
S103:基于上述获得的多源数据信息集合获取机械设备的目标属性数据和目标状态数据。
从上述获得的多源数据信息集合中获取设备的初始属性数据,即,以设备唯一标识为索引,检索上述获得的多源数据信息集合中设备所有相关属性字段,作为初始属性数据。
以压裂井场压裂车载柱塞泵为例,初始属性数据可以包含(但不仅限于):设备编号、设备类型、设备生产日期、设备投产日期、设备额定功率、设备冲程、设备柱塞规格、设备最高压力、设备最大排量、设备外形尺寸、设备重量……。
对初始属性数据进行标准化处理获得目标属性数据。根据本申请一优选实施例,标准化处理方法可以基于本领域专家经验,对初始属性数据进行关注度和重要性排序,并进行综合评分,评分范围在0与1之间;并且去除综合评分在0.8以下的属性数据,将所有专家综合评分大于0.8的属性数据作为目标属性数据。
以压裂井场压裂车载柱塞泵为例,目标属性数据,即,根据专家经验,专家评分大于0.8分的初始属性数据,可以包括(但不仅限于):设备编号、设备类型、设备生产日期、设备投产日期、设备额定功率、设备冲程、设备柱塞规格。
从上述获得的多源数据信息集合中获取设备初始状态数据,即以设备唯一标识作为索引,检索上述获得的多源数据信息集合中设备所有与设备状态相关的字段数据,作为初始状态数据。
以压裂井场压裂车载柱塞泵为例,柱塞泵状态可以(但不仅限于)是柱塞泵液力端泵阀健康状态(正常或者故障),该状态对应状态数据可以包含(但不仅限于):历史液力端单缸振动幅值数据、历史液力端单缸温度值数据、历史液力端单缸压力值数据。
并且,对初始状态数据进行标准化处理。根据本申请一优选实施例,该标准化处理包括对初始状态数据进行MIN-MAX归一化处理,从而获得目标状态数据。
S104:基于所获取的机械设备的目标属性数据生成设备的属性标签。具体地,例如,基于设备目标属性数据字段名称直接命名构建;并将属性标签数据存入标准结构化标签数据库。
以压裂井场压裂车载柱塞泵为例,属性标签可以包括(但不仅限于):设备编号标签、设备类型标签、设备生产日期标签、设备投产日期标签、设备额定功率标签、设备冲程标签、设备柱塞规格标签。
S105:将机械设备的当前目标状态数据输入到训练好的神经网络模型中,获得机械设备当前状态标签。
根据本申请的一优选实施例,使用反向传播(BP)神经网络。当然,也可以使用其他神经网络。
根据设备历史目标状态数据以及设备该状态标签值数量,初始化网络层数、各层神经元个数、各层非线性激活函数、连接权值、单次训练样本数、样本训练循环数、学习速率、损失函数、优化器等神经网络初始值。
根据本申请的一优选实施例,神经网络的初始网络参数设置如下:
参数名称 参数值
网络层数 10
各层神经元个数 20-50个,最后一层为2个
非线性激活函数 Sigmod
连接权值 固定随机数
单次训练样本数 100
样本训练循环数 800
学习速率 0.001
损失函数 MSE
优化器 Adam
通过训练数据对上述BP神经网络进行训练。
以压裂井场压裂车载柱塞泵为例说明训练过程。
待分类设备状态标签可以(但不仅限于)是设备液力端泵阀健康状态标签,标签值为正常或者故障。设备液力端泵阀健康状态数据包括:历史液力端单缸振动幅值、历史液力端单缸温度值、历史液力端单缸压力值三个指标。
示例样本数据为目标设备(即,设备液力端泵阀)历史正常和故障两种状态下的各10小时的运行数据,分别以1s为间隔划分原始数据为36000段,统计计算各指标每段数据(即,历史目标状态数据,包括但不限于历史液力端单缸振动幅值、历史液力端单缸温度值、历史液力端单缸压力值)的均值、标准差、方根幅值、有效值、峰值、偏度、峭度、最大值、裕度值、波形因子、脉冲指数11个统计指标数据。
将上述振动幅值的11个统计指标数据、单缸温度值的11个统计指标数据、单缸压力值的11个统计指标数据以及设备液力端泵阀故障或正常数据标签值(即,从设备历史目标状态数据中获得的状态分类标签数据)作为矩阵的列,此处,共11*3+1列;将正常和故障两种状态下,以1s为间隔,获取的36000样本数据作为矩阵的行,总共36000*2行,从而获得(36000*2,11*3+1)大小的数据矩阵。
将上述获得的数据矩阵,按照9:1比例分为训练数据集和测试数据集。
将训练数据集输入构建好的BP神经网络模型,数据在各层网络进行计算后经过激活函数输出到下一层神经网络层,最后一层输出计算结果,将计算结果与真实数据输入到损失函数,损失函数计算损失值,当损失值大于设定阈值时,优化函数根据损失值反向传播值在梯度方向上朝着降低损失值的方向更新各层网络连接权值;当损失函数值小于设定阈值时,神经网络训练结束,保存网络结构和各级神经元信息,从而,得到训练好的神经网络。
上述设定阈值越小越好,优选地,至少要小于0.05。
将上述测试数据集中的当前目标状态数据输入训练好的神经网络模型中,输出测试结果(即,设备当前状态预测标签)和测试精度。测试精度根据基于测试数据输出的测试结果和它对应的真实状态标签,通过计算AUC值获得。如果测试精度小于设定阈值则完成模型测试,如果测试精度大于阈值则重新选择样本数据重新进行上述的模型训练和测试。
基于上述完成训练的神经网络模型,输入设备当前目标状态数据,预测输出设备当前状态分类,作为设备当前状态标签。最后,将设备当前状态标签存入标准结构化标签数据库。
以压裂井场压裂车载柱塞泵为例,示例样本数据基于上述实验数据和神经网络训练步骤,计算得到目标设备当前液力端泵阀健康状态标签为故障。
另外,其他设备部件健康状态或者其他设备的诸如故障风险等级等状态标签,亦可通过上述方法进行计算。
此外,设备当前状态标签还可以通过预定义的方式获取,即针对设备当前目标状态数据,基于历史专家经验,输出设备当前状态分类,作为设备当前状态标签。并将该设备当前状态标签存入标准结构化标签数据库。
以压裂井场压裂车载柱塞泵为例,通过预定义的方式获取设备当前状态标签,可以但不仅限于是设备当前压力状态标签,标签值包括:高、中、低。例如,将α1,β1预设为阈值的上下限,通过该预定义的方式设定如下标签值:
高:设备当前压力>α1
中:β1<=设备当前压力<=α1
低:设备当前压力<β1。
另外,以压裂井场压裂车载柱塞泵为例,基于上述画像标签构建方法,可以构建如图3所示的标签体系。如图所示,该标签体系可以包括如下标签:瞬态参数标签类,诸如,瞬时压力标签、瞬时温度标签、瞬时沙比标签、瞬时转速标签等;作业状态标签类,诸如,设备当前压力状态、设备当前温度状态、设备当前沙比状态等;振动特征类标签,例如,诸如振动信号时域幅值均值、振动信号时域幅值绝对均值、振动信号时域幅值方差等的动力端振动特征类标签;诸如振动信号时域幅值均值、振动信号时域幅值绝对均值、振动信号时域幅值方差等的液力端振动特征类标签等等。
S106:通过所生成属性标签的属性标签值和所获得的当前状态标签的状态标签值,生成机械设备的设备画像。
根据本申请的一优选实施例,基于标签值聚类的方法来构建设备画像。
获取机械设备的所有属性标签值和状态标签值,创建所有标签值集合X以及目标区域范围内所有设备集合Y,构建共现矩阵(X,Y),如果设备Yi具有Xj类标签值,则矩阵中对应位置值为1,否则为0,该处,1,0只是作为各设备和各标签值的对应情况标记,根据各设备与标签值的对应关系作为聚类特征,从而将具有相似对应关系的标签聚为一类,并将每类标签作为具有该类标签的设备的画像。
以压裂井场压裂车载柱塞泵为例,共现矩阵示例如下所示:
Figure BDA0003503188470000121
利用诸如k-medoid等的聚类算法,基于上述标签-设备共现矩阵,对各类标签进行聚类,最终获得目标属性数据的属性标签和当前状态标签的多类标签聚类簇,其中,聚类类别数量可以根据需要设定。
对各设备所有标签值与各类标签簇所含标签值进行比较,获取各设备所含标签值覆盖标签值类别数最多的标签聚类簇,并取对应标签聚类簇下标签值作为该设备当前重点标签值,生成该设备的设备画像。
例如,第一类包含:泵阀健康状态(故障)标签、十字头健康状态(健康)标签、泵阀压力状态(高)标签等10个标签,第二类包含另外15个标签,设备A一共具有100个当前标签,为了突出重点,选用设备A的画像中的部分标签。如果设备A的100个标签中包含第一类的20个标签,也就是包含第一类的所有的10个标签,而只包含第二类中的5个标签,那么第一类中的标签值就是设备A当前时刻最集中和最重要的一类标签,即,上面所说的当前重点标签。因此,以该第一类标签生成设备A的画像。
并且,根据本申请的一优选实施例,将设备画像可视化为画像词云图,如图4所示。如图所示,从该图中可以容易获得设备的运行状况,从而便于掌握设备的动态、运行状况及健康状况。
图5示出了根据本申请的一具体实施例的机械设备画像生成方法的流程示意图。
如图所示,根据上面所述的方法获取所有与机械设备相关的数据信息,从而构建设备画像数据源。
接着,根据上面所述的方法,对所获取的设备画像数据源,即,所有与机械设备相关的数据信息,进行数据融合,从而获得多源数据信息集合。
根据所获得的多源数据信息集合,对设备标签进行分类,例如,上面提到的设备属性标签和设备状态标签。
并且,对所获得设备属性标签数据和设备状态标签数据进行预处理,以获得设备目标属性标签和设备目标状态标签。
基于设备目标属性标签和设备目标状态标签来生成设备画像。
在包括属性标签和状态标签的标签中,可以通过上述构建好的神经网络模型来获得设备当前状态标签,当然也可以根据本领域的专家经验,通过预设的阈值来获得设备当前状态标签。根据实际需要,可以对上述两种方法进行选择,或者将两种方法结合使用。
最终,通过所获得的设备目标属性标签和设备目标状态标签,例如,通过标签值聚类的方法来构建设备画像,并且通过可视化方法(例如,词云图)将这些数据呈现出来。
根据本申请,通过将客户画像技术应用到柱塞泵设备中,构建起了较为完善的柱塞泵设备画像标签体系。
并且,本申请中所构建的标签体系即包含了静态属性和瞬时参量,又包含了参量状态评价和维护状态信息,并提供了基于神经网路进行设备当前状态标签的构建方法,从而便于获得设备当前健康状态等标签,最终获得关于设备的画像,有助于实现柱塞泵故障检测,并能及时准确地掌握设备当前的运行状况,便于掌控整个生产过程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种机械设备画像生成方法,其特征在于,所述机械设备画像生成方法包括:
获取所有与所述机械设备相关的数据信息;
对所述机械设备相关的数据信息进行数据融合,以获得多源数据信息集合;
基于所述多源数据信息集合获取所述机械设备的目标属性数据和目标状态数据;
基于所获取的所述目标属性数据生成所述机械设备的属性标签;
将所述机械设备的当前目标状态数据输入到训练好的神经网络模型中,获得所述机械设备的当前状态标签,其中,所述当前状态标签包括所述机械设备的状态标签值;
通过所获取的所述属性标签的属性标签值和所获得的所述当前状态标签的状态标签值,生成所述机械设备的设备画像。
2.根据权利要求1所述的机械设备画像生成方法,其特征在于,所述机械设备画像生成方法还包括:
基于所述机械设备的目标状态数据以及所述目标状态数据的目标状态标签值数量,对神经网络模型进行初始化;
基于所述目标状态数据生成多个统计指标;以及
将包括所述多个统计指标以及所述目标状态数据的状态分类标签数据的数据矩阵输入到初始化的所述神经网络模型中,对所述神经网络模型进行训练。
3.根据权利要求1所述的机械设备画像生成方法,其特征在于,基于所述多源数据信息集合获取所述机械设备的目标属性数据和目标状态数据,包括:
基于所述多源数据信息集合获取初始属性数据和初始状态数据;
基于对所述初始属性数据的关注度和/或重要性,获取所述目标属性数据;
对所述初始状态数据进行归一化处理,获取所述目标状态数据。
4.根据权利要求1所述的机械设备画像生成方法,其特征在于,通过所获取的所述属性标签的属性标签值和所获得的所述当前状态标签的状态标签值,生成所述机械设备的设备画像,包括:
基于所述机械设备的所述属性标签值和所述当前状态标签值,构建所有标签值集合和设备集合;
基于所述标签值集合和所述设备集合,构建共现矩阵;
基于所述共现矩阵,通过聚类算法获取所述属性标签和所述当前状态标签的标签聚类簇;以及
基于所述标签聚类簇获取设备当前重点标签值,生成所述机械设备的设备画像。
5.根据权利要求4所述的机械设备画像生成方法,其特征在于,基于所述标签聚类簇获取设备当前重点标签值,生成所述机械设备的设备画像,包括:
将各设备所有标签值与所获取的所述标签聚类簇所含标签值进行比较;以及
获取各设备所含标签值覆盖所述标签聚类簇中标签值类别数最多的第一标签聚类簇,并将所述第一标签聚类簇中所对应的标签值设为所述设备当前重点标签值。
6.根据权利要求1至5中任一项所述的机械设备画像生成方法,其特征在于,所述机械设备画像生成方法还包括:
将所生成的所述设备画像可视化为画像词云图。
7.根据权利要求1至5中任一项所述的机械设备画像生成方法,其特征在于,所述机械设备画像生成方法还包括:
将所述机械设备的当前目标状态数据的状态标签值与设定值进行比较,获得所述机械设备的当前状态标签。
8.根据权利要求1所述的机械设备画像生成方法,其特征在于,对所述机械设备相关的数据信息进行数据融合,以获得多源数据信息集合,包括:
为各设备设定相互不同的唯一标识;
获取各设备具有唯一标识的第一库表以及与所述第一库表相关联的第二库表;以及
以所述唯一标识使得所述第一库表和所述第二库表相互关联。
9.根据权利要求1所述的机械设备画像生成方法,其特征在于,所述神经网络模型包括反向传播神经网络模型。
10.根据权利要求2所述的机械设备画像生成方法,其特征在于,所述统计指标包括:均值、标准差、方根幅值、有效值、峰值、偏度、峭度、最大值、裕度值、波形因子、脉冲指数。
11.根据权利要求7所述的机械设备画像生成方法,其特征在于,所述状态标签值包括:正常、故障、高、中和低。
12.一种计算机设备,包括存储器及处理器,所述存储器上存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN202210132467.6A 2022-02-14 2022-02-14 机械设备画像生成方法 Pending CN114595943A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210132467.6A CN114595943A (zh) 2022-02-14 2022-02-14 机械设备画像生成方法
PCT/CN2022/090147 WO2023151191A1 (zh) 2022-02-14 2022-04-29 机械设备画像生成方法
US18/160,876 US20230259862A1 (en) 2022-02-14 2023-01-27 Method for generating portrait of mechanical equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210132467.6A CN114595943A (zh) 2022-02-14 2022-02-14 机械设备画像生成方法

Publications (1)

Publication Number Publication Date
CN114595943A true CN114595943A (zh) 2022-06-07

Family

ID=81805454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210132467.6A Pending CN114595943A (zh) 2022-02-14 2022-02-14 机械设备画像生成方法

Country Status (2)

Country Link
CN (1) CN114595943A (zh)
WO (1) WO2023151191A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544144A (zh) * 2022-10-14 2022-12-30 中电金信软件有限公司 一种标签数据的处理方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117116407B (zh) * 2023-10-23 2024-02-23 之江实验室 基于电子病历的患者画像生成方法、装置及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423442B (zh) * 2017-08-07 2020-09-25 火烈鸟网络(广州)股份有限公司 基于用户画像行为分析的应用推荐方法及***,储存介质及计算机设备
CN108416620B (zh) * 2018-02-08 2022-02-22 杭州浮云网络科技有限公司 一种基于大数据的画像数据的智能社交广告投放平台
US11544491B2 (en) * 2020-01-15 2023-01-03 Accenture Global Solutions Limited Data clustering
CN112364008A (zh) * 2020-11-20 2021-02-12 国网江苏省电力有限公司营销服务中心 一种面向电力物联网智能终端的设备画像构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544144A (zh) * 2022-10-14 2022-12-30 中电金信软件有限公司 一种标签数据的处理方法及装置
CN115544144B (zh) * 2022-10-14 2024-05-31 中电金信软件有限公司 一种标签数据的处理方法及装置

Also Published As

Publication number Publication date
WO2023151191A1 (zh) 2023-08-17

Similar Documents

Publication Publication Date Title
CN114595943A (zh) 机械设备画像生成方法
CN106294887B (zh) 基于四维空间的对客观世界存在的物体和事件的描述方法
Liao et al. A case-based reasoning system for identifying failure mechanisms
CN111460167A (zh) 基于知识图谱定位排污对象的方法及相关设备
CN112860872A (zh) 基于自学习的配电网操作票语义合规性的校验方法及***
CN106533754A (zh) 用于高校教学服务器故障诊断的方法及专家***
US20120154149A1 (en) Automated fault analysis and response system
EP2323083A1 (de) Technisches Klassifikationssystem
CN111080128A (zh) 一种火电站金属设备大数据分析和可靠性评价管理***
Vychuzhanin et al. Analysis and structuring diagnostic large volume data of technical condition of complex equipment in transport
US20230259862A1 (en) Method for generating portrait of mechanical equipment
CN112765232A (zh) 核电厂重大设备的数据管理方法及***
Choy et al. Design of an intelligent supplier knowledge management system-An integrative approach
CN115952914A (zh) 一种基于大数据的电力计量运维工作判别规划方法
Feijoo-Martinez et al. Event analysis on power communication networks with big data for maintenance forms
CN114529383A (zh) 实现税务缴纳追踪和税款流失预警方法及***
CN112784129A (zh) 一种泵站设备运维数据监管平台
CN112668836A (zh) 一种面向风险图谱的关联风险证据高效挖掘与监控方法和装置
US11256757B1 (en) Systems and methods for automatically classifying a fault report related to a mechanical asset
CN118035249B (zh) 核工程复杂关系数据建模与监控方法和***
CN111292052B (zh) 基于多源事件驱动的电子监察方法
CN116542503B (zh) 一种基于人工智能的性能测试分配方法、***及介质
EP3454233A1 (de) Verfahren zum auffinden von technischen lösungselementen zur verwendung bei der konstruktion von industriellen erzeugnissen
CN117436444B (zh) 基于标签的数据处理方法、设备及计算机可读存储介质
RU2670842C1 (ru) Устройство универсального хранилища данных и способ его формирования

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination