CN110826196A - 一种工业设备运行数据的处理方法及装置 - Google Patents
一种工业设备运行数据的处理方法及装置 Download PDFInfo
- Publication number
- CN110826196A CN110826196A CN201910999867.5A CN201910999867A CN110826196A CN 110826196 A CN110826196 A CN 110826196A CN 201910999867 A CN201910999867 A CN 201910999867A CN 110826196 A CN110826196 A CN 110826196A
- Authority
- CN
- China
- Prior art keywords
- data
- characteristic
- correlation coefficient
- preset
- operating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title description 5
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000004458 analytical method Methods 0.000 claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 32
- 238000012896 Statistical algorithm Methods 0.000 claims abstract description 15
- 238000013499 data model Methods 0.000 claims abstract description 14
- 238000004891 communication Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 7
- 238000007405 data analysis Methods 0.000 abstract description 23
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 230000005611 electricity Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种工业设备运行数据的处理方法及装置。该方法采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到运行数据的特征,运行数据的特征包括离散型特征和连续型特征;获取离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;采用预设统计算法,对每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到每个离散型特征的运行数据对应的第一特征数据;根据运行数据和第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取相关系数大于预设相关系数阈值的数据。该方法提高后续建立的模型的模型精度,以及提升数据模型的数据分析性能。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种工业设备运行数据的处理方法及装置。
背景技术
目前,随着工业设备的智能化水平不断提升,工业场景的数据分析与建模的需求越来越强烈,例如,设备的远程状态监测与智能运维中,需要使用数据驱动的方法,基于现有的传感器数据等,分析与评价设备等状态;还有工业设备市场相关的分析与预测等。这些场景中的一个核心环节就是数据的分析与建模。
数据分析与建模可以包括数据预处理、特征工程、数据建模等核心环节,在实际的数据分析与建模过程中,特征工程可以影响数据模型的数据分析性能,即特征工程是影响数据模型效果的一个主要因素。特征工程是指在实际建模过程中的数据预处理之后,工程师需要通过手动的可视化方法,如数据曲线等,同时结合相关的工程经验与领域知识,在获取的原始数据集的基础上,构造出一些新的特征数据的过程。
然而,由于新的特征数据的构造完全由工程师自主构造,故存在工程师的主观性,使不同工程师构造的特征数据不同,且构造过程中容易遗漏有效的特征数据,影响后续建立的模型的模型精度,以及导致数据模型的数据分析性能不高。
发明内容
本申请实施例提供一种工业设备运行数据的处理方法及装置,解决了现有技术存在的上述问题,以提高后续建立的模型的模型精度,以及提升数据模型的数据分析性能。
第一方面,提供了一种工业设备运行数据的处理方法,该方法可以包括:
采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到所述运行数据的特征,其中,所述运行数据的特征包括离散型特征和连续型特征;
获取所述离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;
采用预设统计算法,对所述每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到第一特征数据;
根据所述运行数据和所述第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
采用预设相关算法,得到所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数;
获取所述相关系数大于预设相关系数阈值的运行数据或所述第一特征数据。
在一个可选的实现中,获取所述相关系数大于预设相关系数阈值的数据之后,所述方法还包括:
采用预设模型建立算法,对所述相关系数大于预设相关系数阈值的数据进行处理,建立数据模型。
在一个可选的实现中,所述离散型特征的运行数据包括日期型特征的运行数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据之前,所述方法还包括:
采用数据值特征分析算法,对所述日期型特征的运行数据进行具体特征分析,得到第二特征数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
根据所述运行数据、所述第一特征数据和所述第二特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据之前,所述方法还包括:
采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
根据所述运行数据、所述第一特征数据、所述第二特征数据和所述第三特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,包括:
若所述连续型特征的运行数据的个数大于预设数量阈值,则在向用户展示获取的运行数据中全部连续型特征的运行数据后,接收用户每次从所述连续型特征的运行数据中选择的两个运行数据,并采用预设组合算法,对所述连续型特征的运行数据中所述两个运行数据的数据值进行运算;
若所述连续型特征的运行数据的个数不大于预设数量阈值,则采用预设组合算法,对所述连续型特征的运行数据中每两个运行数据的数据值进行运算。
第二方面,提供了一种工业设备运行数据的处理装置,该装置可以包括:分析单元、获取单元和运算单元;
所述分析单元,用于采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到所述运行数据的特征,其中,所述运行数据的特征包括离散型特征和连续型特征;
所述获取单元,用于获取所述离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;
所述运算单元,用于采用预设统计算法,对所述每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到第一特征数据;
所述获取单元,还用于根据所述运行数据和所述第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,所述获取单元,具体用于采用预设相关算法,得到所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数;
获取所述相关系数大于预设相关系数阈值的运行数据或所述第一特征数据。
在一个可选的实现中,所述运行数据的特征还包括日期型特征;
所述分析单元,还用于采用数据值特征分析算法,对所述日期型特征的运行数据进行具体特征分析,得到第二特征数据;
所述获取单元,还用于根据所述运行数据、所述第一特征数据和所述第二特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,所述运算单元,还用于采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据;
所述获取单元,还用于根据所述运行数据、所述第一特征数据、所述第二特征数据和所述第三特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,所述运算单元,还具体用于若所述连续型特征的运行数据的个数大于预设数量阈值,则在向用户展示获取的运行数据中全部连续型特征的运行数据后,接收用户每次从所述连续型特征的运行数据中选择的两个运行数据,并采用预设组合算法,对所述连续型特征的运行数据中所述两个运行数据的数据值进行运算;
若所述连续型特征的运行数据的个数不大于预设数量阈值,则采用预设组合算法,对所述连续型特征的运行数据中每两个运行数据的数据值进行运算。
第三方面,提供了一种电子设备,该电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中任一所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。
本发明实施例的上述处理方法采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到运行数据的特征,其中,运行数据的特征包括离散型特征和连续型特征;获取离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;采用预设统计算法,对每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到每个离散型特征的运行数据对应的第一特征数据;根据运行数据和第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取相关系数大于预设相关系数阈值的数据。该方法实现了对运行数据的自动分析过程,即引导用户完成自助式数据分析过程,从而提高后续建立的模型的模型精度,提高模型的预测结果,提高对数据分析准确性;同时,克服现有的数据分析过程需要用户需要参与分析的缺陷,使得用户能够专注与业务问题本身,提升了用户体验。
附图说明
图1为提供的一种对工业设备的运行数据进行数据分析与建模的方法的流程示意图;
图2为本发明实施例提供的一种工业设备运行数据的处理方法的流程示意图;
图3为本发明实施例提供的一种工业设备运行数据的处理装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
对工业设备的运行数据进行数据分析与建模的执行主体可以是数据分析与建模设备。如图1所示,对工业设备的运行数据进行数据分析与建模的方法可以包括:
步骤110、获取工业设备在历史预设时间内的运行数据。
将存储的工业设备在历史预设时间内的运行数据导入数据分析与建模设备。
可选地,在获取工业设备在历史预设时间内的运行数据之后,可以通过可视化的工具,如历史预设时间内运行数据的曲线图,表格等向用户显示历史预设时间内的运行数据的相应特征数据,如运行数据的周期等。
步骤120、对历史预设时间内的运行数据进行数据预处理,得到处理后的运行数据。
数据预处理可以包括对运行数据进行缺失值处理、特征编码处理、标准化处理等。
步骤130、根据处理后的运行数据,生成新的特征数据。
其中,新的特征数据可以表示处理后的运行数据隐含的特征数据,从而提高后续建立的数据模型的有效性。
步骤140、根据新的特征数据和历史预设时间内的运行数据,训练数据模型。
步骤150、根据数据模型,对待预测的运行参数进行预测,得到预测结果。
数据分析与建模设备可以通过多种形式展示数据模型的预测结果。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
其中,在构建数据分析与建模的过程中,本发明实施例针对步骤130的特征工程的构建过程,提出了数据处理方法,实现快速的构造新的特征数据,以提高建模的数据分析性能。如图2所示,该方法可以包括:
步骤210、采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到运行数据的特征。
在执行该步骤之前,需要获取工业设备在历史预设时间内的运行数据,以及确定待预测运行数据。待预测运行数据为未来时间的运行数据。
其中,运行数据包括运行数据名和运行数据值,如运行数据可以是风机的轴承温度和相应温度值,风机运行状态和相应状态值等。
对待预测运行数据的预测问题可以是分类问题或回归问题,其中,分类问题是指预测的待预测数据为离散型特征数据的问题,回归问题是指预测的待预测数据为连续型特征数据的问题。
回到步骤210、采用数据值特征分析算法,对运行数据的数据值进行特征分析,得到运行数据的特征。运行数据的特征可以包括离散型特征和连续型特征。离散型特征是指运行数据的取值是离散的,不连续的。连续型特征是指运行数据的取值是连续的。
其中,离散型特征的运行数据在工业设备的运行时间、工业设备的运行状态等运行信息上与连续型特征的运行数据存在关联关系。例如,当离散型特征的运行数据为风机的不同运行状态时,连续型特征的运行数据为风机在不同运行状态下随时间变化产生的轴承温度;当离散型特征的运行数据为售卖机的不同月份时,连续型特征的运行数据为售卖机在不同月份中每天的销售量。
步骤220、获取离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据。
按照离散型特征的运行数据的不同数据值,对连续型特征的运行数据进行分组,得到每个离散型特征的运行数据对应的连续型特征的运行数据。
数据分析与建模设备可以按照获取的运行数据中全部离散型特征的运行数据,将获取的运行数据中全部连续型特征的运行数据进行分组,得到每个离散型特征的运行数据对应的连续型特征的运行数据;
或者,数据分析与建模设备可以向用户展示历史预设时间内的运行数据中全部离散型特征的运行数据,并向用户发起选择提示信息,以指示用户根据确定的待预测运行数据,选择与待预测运行数据相关的离散型特征的运行数据,并按照选择的离散型特征的运行数据的不同数据值,对连续型特征的运行数据进行分组,得到每个离散型特征的运行数据对应的连续型特征的运行数据。
例如,以离散型特征的运行数据为风机运行状态,连续型特征的运行数据为风机的轴承温度为例,按照风机运行状态的不同状态值,将风机的轴承温度进行分组,即得到每个风机在不同风机运行状态下的轴承温度。
步骤230、采用预设统计算法,对每组中连续型特征的运行数据的数据值进行运算,得到第一特征数据。
预设统计算法可以包括最小值算法、最大值算法、平均值算法、中位数算法、标准差算法等。
为了提高数据分析的精确度,可以采用预设统计算法,对每组中连续型特征的运行数据的数据值进行远算,得到每组的第一特征数据,以增加新的特征数据,且还可以避免遗漏有效的特征数据。
例如,以每组表示一种风机运行状态,每组中的数据为该状态下风机的轴承温度,即历史预设时间段内风机的轴承温度为例,对每种风机运行状态下的轴承温度进行统计,可以得到该风机运行状态下的轴承温度的相应统计指标,即新的特征数据。其本质是对不同的风机状态的分布进行描述,计算每个风机状态下的统计指标。
步骤240、根据运行数据和第一特征数据分别相对于待预测运行数据的相关系数,获取相关系数大于预设相关系数阈值的数据。
采用预设相关算法,得到运行数据和第一特征数据分别相对于待预测运行数据的相关系数,并获取相关系数大于预设相关系数阈值的运行数据或第一特征数据。
预设相关算法可以是随机森林算法或梯度提升(Extreme Gradient Boosting,XGBoost)算法。
为了方便用户选择相关数据进行建模,提高用户体验,可以按照相关系数从大到小的顺序对运行数据和第一特征数据进行排序,之后获取相关系数大于预设相关系数阈值的运行数据或第一特征数据。
采用预设模型建立算法,对相关系数大于预设相关系数阈值的数据进行处理,建立数据模型。
或者,将运行数据和所有的特征数据,按照其相关系数进行排序,并将排序结果推荐给用户,最终由用户根据其经验,选择部分或全部的数据,之后采用预设模型建立算法,对用户选择的数据进行处理,建立数据模型。
可选地,离散型特征的运行数据可以包括日期型特征的运行数据。
在执行步骤240之前,可以采用数据值特征分析算法,对日期型特征的运行数据进行特征分析,得到第二特征数据;第二特征数据可以包括月份、日期、时刻、是否为工作日、周几等日期类特征数据。
此时采用预设相关算法,可以得到运行数据、第一特征数据和第二特征数据分别相对于待预测运行数据的相关系数。
可选地,在执行步骤240之前,可以采用预设组合算法,对连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据。
其中,若连续型特征的运行数据的个数大于预设数量阈值,则在向用户展示获取的运行数据中全部连续型特征的运行数据后,接收用户每次从连续型特征的运行数据中选择的两个运行数据,并采用预设组合算法,对连续型特征的运行数据中两个运行数据的数据值进行运算;
若连续型特征的运行数据的个数不大于预设数量阈值,则采用预设组合算法,对连续型特征的运行数据中每两个运行数据的数据值进行运算。
此时采用预设相关算法,可以得到运行数据、第一特征数据、第二特征数据和第三特征数据分别相对于待预测运行数据的相关系数。
可以理解的是,若不存在日期型特征的运行数据,则可以采用预设相关算法,得到运行数据、第一特征数据和第三特征数据分别相对于待预测运行数据的相关系数。
下面以均存在日期型特征的运行数据为例,对本申请实施例提供的工业设备运行数据的处理方法进行详细描述。
在一个具体的实施例中,在风力发电机的状态评估中,针对目标时刻的轴承温度的预测问题。
第一步,在已知SCADA***中获取的历史预设时间内的运行数据,包括风速、环境温度等工况相关的连续型数据,也有功率、电流、电压、轴承温度等风机相关的连续型数据,还有日期型特征的时间戳,以及离散型的风机运行状态数据等。待预测运行数据为预测目标时刻的轴承温度。具体实现中可以根据同时刻的其他信息,预测目标时刻的轴承温度,以此对风机健康状态下的轴承温度进行建模。
第二步,对日期型特征的时间戳进行具体特征分析,得到第二特征数据,包括month、day、hour、isWeekday、DayOfWeek等信息。
第三步,采用预设组合算法,对连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据,如将电流与电压进行乘积运算,得到实际功率。
第四步,按照离散型特征的风机运行状态数据,将连续型特征的轴承温度数据进行分组,并采用预设统计算法,对每组中的轴承温度数据的数据值进行统计,得到每组的第一特征数据。
第一特征数据可以包括最小值、最大值、平均值、中位数、标准差等统计指标。
第五步,采用预设的XGBoost算法,得到运行数据、第一特征数据、第二特征数据和第三特征数据分别相对于待预测目标时刻的轴承温度的相关系数。
将运行数据和所有特征数据,按照相关系数进行排列,并将排序结果和运行数据和所有特征数据推荐给用户。最终由用户根据其经验,选择部分或全部的特征,完成后面的建模过程。
在另一个具体的实施例中,在电力市场中,针对未来电价的预测问题。
第一步,获取的历史预设时间内的运行数据可以包括:历史电价、历史电力负荷,以及对某时刻的电力负荷的预估值。这是一个时间序列预测的问题,需要使用历史的电价、负荷等数据来预测未来的电价。用户首先将历史运行数据整理成模型训练的样本,例如,使用一天前与一周前的信息来预测未来一天的电价。这样,历史运行数据中的待预测的运行数据为待预测的第d天h时刻的电价历史运行数据可以包括一天前的日期d-1,以及一周前的日期d-7,第d天第h时刻的负荷的预估值第d-1天第h时刻的负荷以及电价第d-7天第h时刻的负荷以及电价其中,上述数据除了日期为日期型数据之外,其余的均为连续型数据,由于待预测运行数据为第d天h时刻的电价故该预测问题为回归问题。
第二步,对日期型特征的时间戳进行具体特征分析,得到第二特征数据,包括month、day、hour、isWeekday、DayOfWeek等信息。共生成三组日期型特征,分别为待预测日、一天前和一周前。
第三步,采用预设组合算法,对除日期为日期型数据之外的运行数据的数据值进行运算,得到第三特征数据,包括monthd、dayd、hourd、isWeekdayd、DayOfWeekd、dated-1、dated-7,即待预测当天的月份、日期、时刻、是否为工作日、周几,以及前一天和一周前的日期
第四步,按照离散型特征的第三特征数据,将获取的运行数据中除日期为日期型数据之外的运行数据进行分组,并采用预设统计算法,对每组中的数据值进行统计,得到每组的第一特征数据。
由于获取的运行数据中没有离散型的运行数据,但通过得到的第三特征数据属于离散型的运行数据,因此按照第三特征数据,将获取的运行数据中除日期为日期型数据之外的电价、负荷等数据进行分组,并采用预设统计算法,对每组中的数据值进行统计,得到每组的第一特征数据。
例如,根据dated-1得到特征数据,表示的是待预测日期前一天各个指标的统计值。
之后,将运行数据和所有的特征数据,按照其重要度降序排列,并将排序结果推荐给用户。最终由用户根据其经验,选择部分或全部的特征,完成后面的建模过程。
本发明实施例的上述处理方法采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到运行数据的特征,其中,运行数据的特征包括离散型特征和连续型特征;获取离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;采用预设统计算法,对每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到每个离散型特征的运行数据对应的第一特征数据;根据运行数据和第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取相关系数大于预设相关系数阈值的数据。该方法实现了对运行数据的自动分析过程,即引导用户完成自助式数据分析过程,从而提高后续建立的模型的模型精度,提高模型的预测结果,提高对数据分析准确性;同时,克服现有的数据分析过程需要用户需要参与分析的缺陷,使得用户能够专注与业务问题本身,提升了用户体验。
与上述方法对应的,本发明实施例还提供一种工业设备运行数据的处理装置,如图3所示,该工业设备运行数据的处理装置包括:分析单元310、获取单元311、和运算单元312;
分析单元310,用于采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到所述运行数据的特征,其中,所述运行数据的特征包括离散型特征和连续型特征;
获取单元311,用于获取所述离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;
运算单元312,用于采用预设统计算法,对所述每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到第一特征数据;
获取单元311,还用于根据所述运行数据和所述第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,获取单元311,具体用于采用预设相关算法,得到所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数;
获取所述相关系数大于预设相关系数阈值的运行数据或所述第一特征数据。
在一个可选的实现中,所述运行数据的特征还包括日期型特征;
分析单元310,还用于采用数据值特征分析算法,对所述日期型特征的运行数据进行具体特征分析,得到第二特征数据;
获取单元311,还用于根据所述运行数据、所述第一特征数据和所述第二特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,运算单元312,还用于采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据;
获取单元311,还用于根据所述运行数据、所述第一特征数据、所述第二特征数据和所述第三特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,运算单元312,还具体用于若所述连续型特征的运行数据的个数大于预设数量阈值,则在向用户展示获取的运行数据中全部连续型特征的运行数据后,接收用户每次从所述连续型特征的运行数据中选择的两个运行数据,并采用预设组合算法,对所述连续型特征的运行数据中所述两个运行数据的数据值进行运算;
若所述连续型特征的运行数据的个数不大于预设数量阈值,则采用预设组合算法,对所述连续型特征的运行数据中每两个运行数据的数据值进行运算。
本发明上述实施例提供的工业设备运行数据的处理装置的各功能单元的功能,可以通过上述各方法步骤来实现,因此,本发明实施例提供的工业设备运行数据的处理装置中的各个单元的具体工作过程和有益效果,在此不复赘述。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器410、通信接口420、存储器430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。
存储器430,用于存放计算机程序;
处理器410,用于执行存储器430上所存放的程序时,实现如下步骤:
采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到所述运行数据的特征,其中,所述运行数据的特征包括离散型特征和连续型特征;
获取所述离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;
采用预设统计算法,对所述每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到第一特征数据;
根据所述运行数据和所述第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
采用预设相关算法,得到所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数;
获取所述相关系数大于预设相关系数阈值的运行数据或所述第一特征数据。
在一个可选的实现中,获取所述相关系数大于预设相关系数阈值的数据之后,所述方法还包括:
采用预设模型建立算法,对所述相关系数大于预设相关系数阈值的数据进行处理,建立数据模型。
在一个可选的实现中,所述离散型特征的运行数据包括日期型特征的运行数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据之前,所述方法还包括:
采用数据值特征分析算法,对所述日期型特征的运行数据进行具体特征分析,得到第二特征数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
根据所述运行数据、所述第一特征数据和所述第二特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据之前,所述方法还包括:
采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
根据所述运行数据、所述第一特征数据、所述第二特征数据和所述第三特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
在一个可选的实现中,采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,包括:
若所述连续型特征的运行数据的个数大于预设数量阈值,则在向用户展示获取的运行数据中全部连续型特征的运行数据后,接收用户每次从所述连续型特征的运行数据中选择的两个运行数据,并采用预设组合算法,对所述连续型特征的运行数据中所述两个运行数据的数据值进行运算;
若所述连续型特征的运行数据的个数不大于预设数量阈值,则采用预设组合算法,对所述连续型特征的运行数据中每两个运行数据的数据值进行运算。
上述提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图2所示的实施例中的各步骤来实现,因此,本发明实施例提供的电子设备的具体工作过程和有益效果,在此不复赘述。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的工业设备运行数据的处理方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的工业设备运行数据的处理方法。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、***、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。
Claims (10)
1.一种工业设备运行数据的处理方法,其特征在于,所述方法包括:
采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到所述运行数据的特征,其中,所述运行数据的特征包括离散型特征和连续型特征;
获取所述离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;
采用预设统计算法,对所述每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到第一特征数据;
根据所述运行数据和所述第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
2.如权利要求1所述的方法,其特征在于,根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
采用预设相关算法,得到所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数;
获取所述相关系数大于预设相关系数阈值的运行数据或所述第一特征数据。
3.如权利要求1所述的方法,其特征在于,获取所述相关系数大于预设相关系数阈值的数据之后,所述方法还包括:
采用预设模型建立算法,对所述相关系数大于预设相关系数阈值的数据进行处理,建立数据模型。
4.如权利要求1所述的方法,其特征在于,所述离散型特征的运行数据包括日期型特征的运行数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据之前,所述方法还包括:
采用数据值特征分析算法,对所述日期型特征的运行数据进行特征分析,得到第二特征数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
根据所述运行数据、所述第一特征数据和所述第二特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
5.如权利要求4所述的方法,其特征在于,根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据之前,所述方法还包括:
采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,得到第三特征数据;
根据所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据,包括:
根据所述运行数据、所述第一特征数据、所述第二特征数据和所述第三特征数据分别相对于所述待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
6.如权利要求5所述的方法,其特征在于,采用预设组合算法,对所述连续特征的运行数据中每两个运行数据的数据值进行运算,包括:
若所述连续型特征的运行数据的个数大于预设数量阈值,则在向用户展示获取的运行数据中全部连续型特征的运行数据后,接收用户每次从所述连续型特征的运行数据中选择的两个运行数据,并采用预设组合算法,对所述连续型特征的运行数据中所述两个运行数据的数据值进行运算;
若所述连续型特征的运行数据的个数不大于预设数量阈值,则采用预设组合算法,对所述连续型特征的运行数据中每两个运行数据的数据值进行运算。
7.一种工业设备运行数据的处理装置,其特征在于,所述装置包括:分析单元、获取单元和运算单元;
所述分析单元,用于采用数据值特征分析算法,对历史预设时间内工业设备的运行数据的数据值进行特征分析,得到所述运行数据的特征,其中,所述运行数据的特征包括离散型特征和连续型特征;
所述获取单元,用于获取所述离散型特征的运行数据中每个离散型特征的运行数据对应的连续型特征的运行数据;
所述运算单元,用于采用预设统计算法,对所述每个离散型特征的运行数据对应的连续型特征的运行数据进行运算,得到第一特征数据;
所述获取单元,还用于根据所述运行数据和所述第一特征数据分别相对于预先确定的待预测运行数据的相关系数,获取所述相关系数大于预设相关系数阈值的数据。
8.如权利要求7所述的装置,其特征在于,
所述获取单元,具体用于采用预设相关算法,得到所述运行数据和所述第一特征数据分别相对于所述待预测运行数据的相关系数;
获取所述相关系数大于预设相关系数阈值的运行数据或所述第一特征数据。
9.一种电子设备,其特征在于,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存储的程序时,实现权利要求1-6任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910999867.5A CN110826196B (zh) | 2019-10-21 | 2019-10-21 | 一种工业设备运行数据的处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910999867.5A CN110826196B (zh) | 2019-10-21 | 2019-10-21 | 一种工业设备运行数据的处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110826196A true CN110826196A (zh) | 2020-02-21 |
CN110826196B CN110826196B (zh) | 2024-03-12 |
Family
ID=69549765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910999867.5A Active CN110826196B (zh) | 2019-10-21 | 2019-10-21 | 一种工业设备运行数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110826196B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310351A (zh) * | 2020-02-26 | 2020-06-19 | 深圳市青柠互动科技开发有限公司 | 车间设备的状态监测方法、装置、终端设备及存储介质 |
CN113282812A (zh) * | 2021-06-24 | 2021-08-20 | 苏州创腾软件有限公司 | 数据处理方法、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017217957A1 (en) * | 2016-06-13 | 2017-12-21 | Schlumberger Technology Corporation | Runtime parameter selection in simulations |
CN110134040A (zh) * | 2019-05-07 | 2019-08-16 | 上海电气集团股份有限公司 | 工业设备的运行数据的处理方法及*** |
-
2019
- 2019-10-21 CN CN201910999867.5A patent/CN110826196B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017217957A1 (en) * | 2016-06-13 | 2017-12-21 | Schlumberger Technology Corporation | Runtime parameter selection in simulations |
CN110134040A (zh) * | 2019-05-07 | 2019-08-16 | 上海电气集团股份有限公司 | 工业设备的运行数据的处理方法及*** |
Non-Patent Citations (1)
Title |
---|
程继红;阮传峰;崔嘉;齐玉东;: "大数据分析技术在装备监测***中应用研究" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111310351A (zh) * | 2020-02-26 | 2020-06-19 | 深圳市青柠互动科技开发有限公司 | 车间设备的状态监测方法、装置、终端设备及存储介质 |
CN113282812A (zh) * | 2021-06-24 | 2021-08-20 | 苏州创腾软件有限公司 | 数据处理方法、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110826196B (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110969285B (zh) | 预测模型训练方法、预测方法、装置、设备及介质 | |
CN102890803B (zh) | 电子商品异常交易过程的确定方法及其装置 | |
CN107506868B (zh) | 一种短时电力负荷预测的方法及装置 | |
CN109726865A (zh) | 基于emd-qrf的用户负荷概率密度预测方法、装置和存储介质 | |
CN111680841B (zh) | 基于主成分分析的短期负荷预测方法、***及终端设备 | |
CN113222403B (zh) | 基于大数据的电力调节方法、装置、存储介质及电子设备 | |
CN109118012A (zh) | 一种工业动态多维度能耗成本预测方法、***、存储介质和终端 | |
CN110826196B (zh) | 一种工业设备运行数据的处理方法及装置 | |
CN110930179A (zh) | 任务评估方法、***、设备和计算机可读存储介质 | |
CN110991739A (zh) | 一种行业电量需求预测模型的构建方法及预测方法 | |
CN105825286A (zh) | 一种武器装备全生命周期费用估算***及方法 | |
KR20220115357A (ko) | 어텐션 메커니즘 기반의 미래 수요 예측 데이터 생성방법 및 장치 | |
CN111415027A (zh) | 构建件量预测模型的方法和装置 | |
CN114782075A (zh) | 一种基于机器学习的电力现货交易策略确定方法及*** | |
Rabie et al. | A new strategy of load forecasting technique for smart grids | |
CN114111730A (zh) | 一种下游水文情报预测的方法及*** | |
CN112365156A (zh) | 一种数据处理方法、数据处理装置、终端及存储介质 | |
CN116957640A (zh) | 产品销量预测方法及*** | |
Nigam et al. | Sales forecasting using Box Jenkins method based ARIMA model considering effect of COVID-19 pandemic situation | |
CN111967774B (zh) | 软件质量风险预测方法及装置 | |
Akbaş et al. | Predicting newspaper sales by using data mining techniques | |
CN112685610A (zh) | 虚假注册账号识别方法及相关装置 | |
Voloshko et al. | An improved pre-forecasting analysis of electrical loads of pumping station | |
CN115009744B (zh) | 一种前置仓货物出仓时长预估方法及装置 | |
CN115034645B (zh) | 生产计划可行性判断方法、***、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |