CN116881635B - 一种用于纺织品洗涤剂设备数据管理*** - Google Patents

一种用于纺织品洗涤剂设备数据管理*** Download PDF

Info

Publication number
CN116881635B
CN116881635B CN202311154708.8A CN202311154708A CN116881635B CN 116881635 B CN116881635 B CN 116881635B CN 202311154708 A CN202311154708 A CN 202311154708A CN 116881635 B CN116881635 B CN 116881635B
Authority
CN
China
Prior art keywords
data
parameter
time sequence
point
range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311154708.8A
Other languages
English (en)
Other versions
CN116881635A (zh
Inventor
郭继东
闫昶
黎婉斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sunshine Xusheng Fine Chemical Technology Research Institute
Original Assignee
Beijing Sunshine Xusheng Fine Chemical Technology Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sunshine Xusheng Fine Chemical Technology Research Institute filed Critical Beijing Sunshine Xusheng Fine Chemical Technology Research Institute
Priority to CN202311154708.8A priority Critical patent/CN116881635B/zh
Publication of CN116881635A publication Critical patent/CN116881635A/zh
Application granted granted Critical
Publication of CN116881635B publication Critical patent/CN116881635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Manufacturing & Machinery (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及数据处理技术领域,具体涉及一种用于纺织品洗涤剂设备数据管理***,包括:获取各种参数数据;得到每一种参数数据的数据范围;根据函数曲线上数据点的斜率值和窗口内数据的标准差得到实际波动评估值;根据时序范围内数据点的斜率值、数据点与添加原料时间之间的时序跨度和数据点与距离最近的极值点之间的时序跨度,得到保留度初值,根据保留度初值得到参数的保留度;得到任意一个样本数据的优化离群值;获取所有样本数据的优化离群值,根据样本数据的优化离群值进行清洗及存储。本发明通过对每一样本数据在参与其余样本数据的离群因子计算时,进一步优化了对离群数据的筛选,使得数据可以更好的反映洗涤剂在生产过程中的实际状态。

Description

一种用于纺织品洗涤剂设备数据管理***
技术领域
本发明涉及数据处理技术领域,具体涉及一种用于纺织品洗涤剂设备数据管理***。
背景技术
纺织品洗涤剂在日常生活中的应用越来越多,需求也越来越高。而纺织品的多种参数例如离子水平,成分组成以及生产效率等多方面参数都与其最终生产出来的产品质量以及产品数量直接挂钩。因此对于纺织品洗涤剂设备数据的管理***随之出现,通过对生产过程中的设备数据通过聚类算法,根据设备中安置的多模态传感器监测值作为距离度量特征,从而对设备的不同运行状态进行聚类,并根据聚类结果对其中异常值进行检测,从而对生产设备的参数进行优化。
在通过搅拌机生产洗涤剂的过程中,会定期的通过采集样本数据来监测当前洗涤剂成分,并对应的进行部分原料的添加,从而保证最终产品符合要求。而洗涤剂的原料之间通常会存在各种化学反应,对应的会导致监测参数发生变化,例如PH值的变化、温度的变化等,而这类变化便会导致此时针对搅拌机监测到的各类参数并不是完全由搅拌机本身所决定的。因此部分样本数据在参与其余样本数据的局部离群因子计算时会由于参与的样本数据本身参考价就不高,从而导致在聚类过程中判断离群数据时的结果更加不准确,因此需要对局部离群因子优化。
发明内容
本发明提供一种用于纺织品洗涤剂设备数据管理***,以解决现有的问题。
本发明的一种用于纺织品洗涤剂设备数据管理***采用如下技术方案:
本发明一个实施例提供了一种用于纺织品洗涤剂设备数据管理***,该***包括以下模块:
数据采集模块:获取各种参数数据,将任意一个时刻的所有参数数据记为一个样本数据,对所有样本数据进行聚类得到若干簇类,获取所有添加原料时间;
数据范围确定模块:根据每一种参数数据得到每一种参数数据的数据范围;
数据波动评估模块:对每一种参数数据的数据范围内每一个数据点构建窗口,根据窗口内数据标准差得到函数曲线,根据函数曲线上数据点的斜率值和窗口内的数据标准差得到每一种参数数据的每个数据点的实际波动评估值;
保留度计算模块:根据相邻两个添加原料时间得到若干个时序范围,根据时序范围内数据点的斜率值、数据点与添加原料时间之间的时序跨度和数据点与距离最近的极值点之间的时序跨度,得到每一种参数数据的每一个时序范围的保留度初值,根据每一种参数数据的所有时序范围的保留度初值得到每一个参数的保留度;
离群值计算模块:获取样本数据之间的时序跨度,根据样本数据之间的时序跨度、每一种参数数据的数据范围内数据的实际波动评估值以及每一个参数的保留度,得到优化后的样本数据之间的欧式距离,根据所有参与第w个样本数据的局部邻域密度计算时优化后的样本数据之间的欧式距离进行局部离群因子计算,得到第w个样本数据的优化离群值;
数据清洗及存储模块:获取所有样本数据的优化离群值,对所有样本数据的优化离群值进行线性归一化处理,得到每一个样本数据的归一化离群值,根据样本数据的归一化离群值对所有簇类进行清洗及存储。
进一步地,所述根据每一种参数数据得到每一种参数数据的数据范围,包括的具体步骤如下:
以第i种参数数据中最后一个时刻的数据点为起点,向前取时序长度为L的参数数据作为第i种参数数据的数据范围,将最近一次添加原料时间记为U,U至参数数据中最后一个时刻的数据点之间的时序长度记为L;
获取每一种参数数据的数据范围。
进一步地,所述对每一种参数数据的数据范围内每一个数据点构建窗口,包括的具体步骤如下:
在第i种参数数据的数据范围内,根据窗口长度,以每一个数据点为窗口最右端构建窗口;获取每一种参数数据的数据范围内每一个数据点对应的窗口。
进一步地,所述根据窗口内数据标准差得到函数曲线,包括的具体步骤如下:
构建二维坐标系,其中横坐标为第i种参数数据的数据范围内数据点的索引,顺序从左往右,将数据点对应窗口内的数据标准差累加作为纵坐标,获得若干数据点,将若干数据点进行平滑处理得到第i种参数数据的函数曲线;获取每种参数数据的函数曲线。
进一步地,所述根据函数曲线上数据点的斜率值和窗口内的数据标准差得到每一种参数数据的每个数据点的实际波动评估值,包括的具体步骤如下:
将第i种参数数据的函数曲线上任意一个数据点记为第一数据点,将第i种参数数据的函数曲线上第一数据点的斜率值与线性归一化后第一数据点对应的窗口内的数据标准差的乘积作为第i种参数数据的第一数据点的实际波动评估值;获取每种参数数据的每个数据点的实际波动评估值。
进一步地,所述根据相邻两个添加原料时间得到若干个时序范围,包括的具体步骤如下:
将第i种参数数据中每相邻两个添加原料时间之间的范围记为第i种参数数据的一个时序范围,得到第i种参数数据的若干时序范围;获取每一种参数数据的若干时序范围。
进一步地,所述根据时序范围内数据点的斜率值、数据点与添加原料时间之间的时序跨度和数据点与距离最近的极值点之间的时序跨度,得到每一种参数数据的每一个时序范围的保留度初值,包括的具体步骤如下:
式中,为第i种参数数据的第m个时序范围内第j个数据点的斜率值,/>为第i种参数数据的第m个时序范围内数据点的斜率均值,/>为以自然常数e为底的指数函数,/>为线性归一化处理后第i种参数数据的第m个时序范围内第j个数据点与添加原料时间之间的时序跨度,/>为线性归一化处理后第i种参数数据的第m个时序范围内第j个数据点与距离最近的极值点之间的时序跨度,J为时序范围内数据点的总个数,/>为第i种参数数据的第m个时序范围的保留度初值。
进一步地,所述根据每一种参数数据的所有时序范围的保留度初值得到每一个参数的保留度,包括的具体步骤如下:
将每一种参数数据的所有时序范围的保留度初值均值作为每一个参数的保留度。
进一步地,所述根据样本数据之间的时序跨度、每一种参数数据的数据范围内数据的实际波动评估值以及每一个参数的保留度,得到优化后的样本数据之间的欧式距离,包括的具体步骤如下:
式中,为第w个样本数据中第i种参数数据的数据值,/>为第q个样本数据中第i种参数数据的数据值,/>为第w个样本数据在第i种参数数据的实际波动评估值,为第q个样本数据与第w个样本数据之间的时序跨度,/>为自然常数e为底的指数函数,/>为第i个参数的保留度,/>为优化后的第w个样本数据与第q个样本数之间据的欧式距离。
进一步地,所述根据样本数据的归一化离群值对所有簇类进行清洗及存储,包括的具体步骤如下:
预设一个离群阈值,将样本数据的归一化离群值大于离群阈值时的样本数据记为离群数据,对所有簇类中的离群数据进行清洗去除,将清洗之后的多个簇类中的样本数据进行存储。
本发明的技术方案的有益效果是:常规的算法中,对于局部离群因子的计算中,默认每一样本数据的参考价值相同。但是在洗涤剂的生产过程中,搅拌机设备的数据会由于其容器内原料的加入导致其数据发生变化,从而导致其数据并不是搅拌机本身的实际状态,进而会导致某些样本数据其自身参考价值不同,同时还会使得在参与其余样本数据的离群因子判定时,使其判定结果不准确。因此本发明通过对每一参数中的波动特征进行时序分析,从而量化出其波动评估值,再根据相邻时序内的样本数据在参与邻域判断时,本身差异比较小这一问题,进行时序分析,并根据每一参数信息,对不同参数的时序调整值进行约束,最终完成对每一样本数据再参与其余样本数据的离群因子计算时,进一步优化了对离群数据的筛选,使得数据可以更好的反映洗涤剂在生产过程中的实际状态。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种用于纺织品洗涤剂设备数据管理***的框架图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于纺织品洗涤剂设备数据管理***,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种用于纺织品洗涤剂设备数据管理***的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用于纺织品洗涤剂设备数据管理***的***框架图,该***包括以下模块:
数据采集模块:
需要说明的是,本实施例是一种用于纺织品洗涤剂设备数据管理***,首先需要采集相关的数据并进行预处理。
具体的,通过洗涤剂设备管理***,采集生产线上,洗涤剂生产设备中搅拌机的参数数据,参数数据包括转速数据、温度数据及功耗数据等各种参数数据,参数数据是时序监测数据,采集的参数数据为最近一周的数据,本实施例不做限定,主要针对的是同一搅拌机上的各种能够用于表征当前设备运行状态的参数信息。
具体的,其中由于不同的参数数据可能由于传感器限制,其采样频率可能存在差异,因此需要进行一定的预处理,利用样条插值算法和数据整合算法对所有的参数数据进行标准化,本实施例中将标准化后的参数数据也记为参数数据,使得多种参数数据在时序上可以一一对应,且数据取值范围都量化到[0,1]之间。所述利用样条插值算法和数据整合算法对所有的参数数据进行标准化为现有方法,本实施例不再赘述,获取所有添加原料时间。
进一步地,将任意一个时刻的所有参数数据记为一个样本数据,需要说明的是,聚类时样本数据之间的距离度量特征为同一参数数据下数据点对应数据之间的差值绝对值,具体为现有方法此处不再赘述,并基于轮廓系数作为聚类算法中k值的判定依据,对所有样本数据进行/>聚类,得到表征设备中搅拌机不同运行状态的多个簇类。
需要说明的是,对搅拌机参数数据的聚类目的是为了通过以不同时刻下的设备参数,从而识别和分类不同的搅拌状态或异常情况,从而快速识别搅拌过程中的异常情况或特殊状态。
至此,完成了数据采集。
需要说明的是,对每一时刻数据进行聚类时,其距离度量特征都仅仅根据这一时刻的指标作为某一状态的表征,而异常状态或是否具有实际意义都无法表征出来。同时由于采集到的各种参数数据都为时序数据,若参数数据在一段时间内的波动较严重,相邻数据之间的差异不会较大;对于这种情况,新样本数据被分配在簇类中后,参与其邻域范围内的离群密度评估中大多都为其时序上相邻较近的数据特征,进一步会导致离群密度无法实际表达出其数据的异常情况。因此不仅需要根据其连续时序上的变化对其可能存在的异常状态进行分析,还需进一步对用于评估时,邻域范围内样本数据参与其评估时的权重值进行调整,进而给予每一时刻的参数数据在作为样本数据并参与聚类时的调整系数。
数据范围确定模块:
需要说明的是,在搅拌机搅拌过程中,会定期的通过采集样本监测当前洗涤剂成分,并对应的进行部分原料的添加,从而保证最终产品符合要求。而洗涤剂的原料之间通常会存在各种化学反应,对应的会导致监测参数发生变化,例如PH值的变化、温度的变化等,而这类变化便会导致此时针对搅拌机监测到的各类参数并不是完全由搅拌机本身所决定的,因此需要确定数据的范围,并计算数据范围内数据的实际波动评估值。
具体的,以第i种参数数据中最后一个时刻的数据点为起点,向前取时序长度为L的参数数据作为第i种参数数据的数据范围,L可通过添加原料的时间确定,将最近一次添加原料时间记为U,则U至参数数据中最后一个时刻的数据点之间的时序长度记为L;按照上述方法获取每一种参数数据的数据范围。
至此,确定了参数数据的数据范围。
数据波动评估模块:
具体的,预设窗口长度为,本实施例中以/>为例进行叙述,即一个窗口包含15个数据点,以第i种参数数据的数据范围为例,在第i种参数数据上将第i种参数数据的数据范围内每一个数据点作为窗口最右端来构建窗口,需要说明的是,对于数据范围内前15个数据点,其不能获取完整的窗口,无需进行补全,以实际能获取到的数据点来构建窗口;分别计算每一个窗口内数据的标准差,记为数据标准差,并将所有窗口内的数据标准差进行线性归一化处理,得到线性归一化后第i种参数数据的每一个窗口内的数据标准差。需要说明的是,该标准差表示第i种参数数据的数据范围内每一数据所在窗口范围内的数据波动大小,即表征数据的平稳情况,而该波动情况的时序变化,则能够反映从上一次添加完原料后,第i种参数数据的波动情况是否逐渐收敛,趋于平稳。
进一步地,构建二维坐标系,其中横坐标为第i种参数数据的数据范围内数据点的索引,数据点的索引表示数据点的次序值,例如第i种参数数据的数据范围内第一个数据点的索引为1,第二个数据点的索引为2,以此类推,顺序从左往右,将数据点对应窗口内的数据标准差累加作为纵坐标,例如横坐标的索引值为4,则纵坐标为,/>为第n个索引值对应窗口内的数据标准差,则二维坐标系中一个数据点的坐标为/>,获得若干数据点,将若干数据点进行平滑处理得到第i种参数数据的函数曲线;按照上述方法获取每种参数数据的函数曲线。
需要说明的是,从原材料添加时刻至当前时刻,每一时刻的纵坐标都等于前面所有时刻标准差的累计,因此通过构建该函数,沿原材料添加时刻至当前时刻的顺序下,其标准差一直在变小,那么在函数曲线中便会逐渐趋于平稳,即斜率逐渐趋近为0,即表征该参数数据中的波动也逐渐趋于平稳。
具体的,获取函数曲线上每个数据点的斜率值,根据函数曲线上数据点的斜率值和窗口内的数据标准差得到实际波动评估值,具体如下:
式中,为第i种参数数据的函数曲线上任意一个数据点的斜率值,/>为线性归一化后第i种参数数据的该数据点对应的窗口内的数据标准差,/>为第i种参数数据的该数据点的实际波动评估值。需要说明的是,/>与/>越大,都表征第i种参数数据的数据范围内数据波动情况,且时序上,其波动情况并未表现出较明显的波动减弱的特征,因此当前时刻参数数据的实际波动值较大,其表现出来的稳态特征相对较弱;按照上述方法获取每种参数数据的每个数据点的实际波动评估值。
至此,得到了参数数据的数据范围内数据的实际波动评估值。
保留度计算模块:
需要说明的是,上述对某一参数的数据范围内数据实际波动评估值进行了分析,该分析特征主要作为这一样本数据自身在参与其余样本数据邻域密度判定时的权重值。若此时直接将多种参数数据的实际评估值进行累计后,再直接根据其时序差异作为样本数据之间的权重值时,是不合理的。不同的参数,其在时序上的变化特征是不同的,例如温度数据,由于温度在极短的时间内很难产生极大的数值变化,而例如搅拌机的转速或容器内的液位高度,这类参数其在极短的时间内是可以发生较大的变化,那么对于该类参数,在同样的时间跨度下,在判断离群数据时的结果更加不准确,影响便相对较弱。而如果不对该情况进行约束,那么便会导致某些数据的波动特征所表达出的稳态评估信息会不准确。因此,在结合样本数据的多个参数评估值以及时序差异作为样本数据之间的权重值时,还需对每一参数中的数据变化在时序上表现出的特征进行调整保留度的分析。
具体的,确定时序范围,具体如下:将第i种参数数据中每相邻两个添加原料时间之间的范围记为第i种参数数据的一个时序范围,最终得到若干时序范围,需要说明的是,时序范围内只包含一个添加原料的时间,即相邻两个添加原料的时间中左侧添加原料时间在时序范围内;按照上述方法获取每一种参数数据的若干时序范围。
进一步地,以第i种参数数据的任意一个时序范围为例,记为第m个时序范围,获取第m个时序范围的数据曲线,获取第m个时序范围的数据曲线上每一个数据点的斜率值K;需要说明的是,该斜率值表征当前时刻数据的变化速率,由于添加原料后,其一开始混合时造成的参数波动时最剧烈,此时无论参数自身较剧烈或是不剧烈,其大多表现出来的是较为剧烈的特征,因此距离一开始添加原料时间相近的部分数据需要降低权重,则获取第m个时序范围内每一个数据点与添加原料时间之间的时序跨度,获取每一种参数数据的每一个时序范围内每一个数据点与添加原料时间之间的时序跨度,并进行线性归一化处理,得到线性归一化处理后每一种参数数据的每一个时序范围内每一个数据点与添加原料时间之间的时序跨度,需要说明的是,时序跨度为时序差异,例如第m个时序范围内任意一个数据点对应的时间为第100分钟,添加原料时间为第130分钟,则时序跨度为30;
具体的,获取第m个时序范围的数据曲线上的极值点,获取第m个时序范围内每一个数据点与距离最近的极值点之间的时序跨度,获取每一种参数数据的每一个时序范围内每一个数据点与距离最近的极值点之间的时序跨度,并进行线性归一化处理,得到线性归一化处理后每一种参数数据的每一个时序范围内每一个数据点与距离最近的极值点之间的时序跨度;需要说明的是,本实施例中主要是得到当前参数在一段时序范围内数据的变化大小,而距离极值点较近的数据点,对应的数据值变化通常都较为缓慢,因此为了能更加实际的表征出参数数据本身的变化特征,需要降低数据值变化缓慢的参数数据的权重。
具体的,根据时序范围内数据点的斜率值、数据点与添加原料时间之间的时序跨度和数据点与距离最近的极值点之间的时序跨度,得到时序范围的保留度初值,具体如下:
式中,为第i种参数数据的第m个时序范围内第j个数据点的斜率值,/>为第i种参数数据的第m个时序范围内数据点的斜率均值,/>为以自然常数e为底的指数函数,本实施例采用/>模型来呈现反比例关系及归一化处理,y为模型的输入,实施者可根据实际情况设置反比例函数及归一化函数,/>为线性归一化处理后第i种参数数据的第m个时序范围内第j个数据点与添加原料时间之间的时序跨度,/>为线性归一化处理后第i种参数数据的第m个时序范围内第j个数据点与距离最近的极值点之间的时序跨度,J为时序范围内数据点的总个数,/>为第i种参数数据的第m个时序范围的保留度初值,当/>越大,则表征此时在该时序范围内,第i种参数数据的数据变化斜率整体偏大,即与其余参数数据相比,该参数数据本身变化特征便更大,因此该参数数据的调整保留度相对较弱。进一步地,获取其他参数数据在相同时序范围的保留度初值,并进行线性归一化处理,得到线性归一化后每一种参数数据的第m个时序范围的保留度初值;按照上述方法获取线性归一化后每一种参数数据的每个时序范围的保留度初值。
需要说明的是,该特征是表征根据两个时序跨度特征得到的权重值,该特征值相比常规线性归一化作为权重的作用是,通过这一函数,可以更大程度的将时序跨度极近的数据给予更低的权重值,而随着时序跨度越大,其数据之间的权重差异越小。
具体的,根据时序范围的保留度初值得到参数的保留度,具体如下:
式中,为线性归一化后第i种参数数据的第m个时序范围的保留度初值,/>为第i种参数数据的时序范围总个数,/>为第i种参数数据的保留度,记为第i个参数的保留度。第i个参数的保留度越大,第i种参数数据与其余参数数据相比,其参数数据本身相邻之间的变化率相对较大,因此相邻时序的数据在聚类过程中参与判断邻域密度时的权重相对较弱;按照上述方法获取每个参数的保留度。
至此,得到了参数的保留度。
离群值计算模块:
需要说明的是,实际场景中,搅拌机在运行过程中,其会定期添加原料,从而调整洗涤剂成分,而该行为便会导致某些样本数据中的参数数据并不是搅拌机本身的信息。因此部分样本数据在参与其余样本数据的局部离群因子计算时会由于参与的样本数据本身参考价就不高,从而导致在判断离群数据时的结果更加不准确,因此需要对离群值进行优化。
具体的,在聚类过程中,当第q个样本数据参与第w个样本数据的局部邻域密度计算时,局部邻域密度计算为现有方法,本实施例不再赘述,根据样本数据之间的时序跨度、实际波动评估值以及参数的保留度得到优化后的样本数据之间的欧式距离,具体如下:
式中,为第w个样本数据中第i种参数数据的数据值,/>为第q个样本数据中第i种参数数据的数据值,/>为第w个样本数据在第i种参数数据的实际波动评估值,为第q个样本数据与第w个样本数据之间的时序跨度,当时序跨度越小,对应的样本数据q在参与样本数据w的局部邻域密度时,应该表达出比实际计算出来的值更高的距离,从而降低样本数据w的局部邻域密度,因此这里采用/>这一方式来表达,/>为以自然常数e为底的指数函数,本实施例采用/>模型来呈现反比例关系及归一化处理,y为模型的输入,实施者可根据实际情况设置反比例函数及归一化函数,/>为第i个参数的保留度,/>为优化后的第w个样本数据与第q个样本数据之间的欧式距离。需要说明的是,在聚类过程中第q个样本数据参与第w个样本数据的局部邻域密度计算,同理,可以获得所有参与第w个样本数据的局部邻域密度计算时优化后的样本数据之间的欧式距离。
进一步地,根据所有参与第w个样本数据的局部邻域密度计算时优化后的样本数据之间的欧式距离进行局部离群因子计算,得到第w个样本数据的优化离群值,所述进行局部离群因子计算为现有方法,本实施例不再赘述。同理,可以获得每一个样本数据的优化离群值,并将所有样本数据的优化离群值进行线性归一化处理,得到每一个样本数据的归一化离群值。
至此,得到了样本数据的优化离群值。
数据清洗及存储模块:
需要说明的是,数据在存储时一些异常数据是不需要进行存储的,而异常数据多为一些聚类结果中的离群值,因此可以通过优化离群值进行筛选,将离群数据进行清洗去除。
具体的,预设一个离群阈值,本实施例中以离群阈值为0.8进行叙述,将样本数据的归一化离群值大于离群阈值时的样本数据记为离群数据,离群数据存在异常,并将离群数据进行清洗去除,对所有簇类中的离群数据进行清洗去除,将清洗之后的多个簇类中的样本数据进行存储,所述将离群数据进行清洗去除为现有方法,本实施例不再赘述,存储的样本数据可以更准确的反应纺织品洗涤剂设备在运行过程中的状态,便于纺织品洗涤剂设备数据的有效管理。
至此,本实施例完成。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于纺织品洗涤剂设备数据管理***,其特征在于,该***包括以下模块:
数据采集模块:采集生产线上,洗涤剂生产设备中搅拌机的参数数据,将任意一个时刻的所有参数数据记为一个样本数据,对所有样本数据进行聚类得到若干簇类,获取所有添加原料时间;参数数据包括转速数据、温度数据及功耗数据;
数据范围确定模块:根据每一种参数数据得到每一种参数数据的数据范围;
数据波动评估模块:对每一种参数数据的数据范围内每一个数据点构建窗口,根据窗口内数据标准差得到函数曲线,根据函数曲线上数据点的斜率值和窗口内的数据标准差得到每一种参数数据的每个数据点的实际波动评估值;
保留度计算模块:根据相邻两个添加原料时间得到若干个时序范围,根据时序范围内数据点的斜率值、数据点与添加原料时间之间的时序跨度和数据点与距离最近的极值点之间的时序跨度,得到每一种参数数据的每一个时序范围的保留度初值,根据每一种参数数据的所有时序范围的保留度初值得到每一个参数的保留度;
离群值计算模块:获取样本数据之间的时序跨度,根据样本数据之间的时序跨度、每一种参数数据的数据范围内数据的实际波动评估值以及每一个参数的保留度,得到优化后的样本数据之间的欧式距离,根据所有参与第w个样本数据的局部邻域密度计算时优化后的样本数据之间的欧式距离进行局部离群因子计算,得到第w个样本数据的优化离群值;
数据清洗及存储模块:获取所有样本数据的优化离群值,对所有样本数据的优化离群值进行线性归一化处理,得到每一个样本数据的归一化离群值,根据样本数据的归一化离群值对所有簇类进行清洗及存储。
2.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据每一种参数数据得到每一种参数数据的数据范围,包括的具体步骤如下:
以第i种参数数据中最后一个时刻的数据点为起点,向前取时序长度为L的参数数据作为第i种参数数据的数据范围,将最近一次添加原料时间记为U,U至参数数据中最后一个时刻的数据点之间的时序长度记为L;
获取每一种参数数据的数据范围。
3.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述对每一种参数数据的数据范围内每一个数据点构建窗口,包括的具体步骤如下:
在第i种参数数据的数据范围内,根据窗口长度,以每一个数据点为窗口最右端构建窗口;获取每一种参数数据的数据范围内每一个数据点对应的窗口。
4.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据窗口内数据标准差得到函数曲线,包括的具体步骤如下:
构建二维坐标系,其中横坐标为第i种参数数据的数据范围内数据点的索引,顺序从左往右,将数据点对应窗口内的数据标准差累加作为纵坐标,获得若干数据点,将若干数据点进行平滑处理得到第i种参数数据的函数曲线;获取每种参数数据的函数曲线。
5.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据函数曲线上数据点的斜率值和窗口内的数据标准差得到每一种参数数据的每个数据点的实际波动评估值,包括的具体步骤如下:
将第i种参数数据的函数曲线上任意一个数据点记为第一数据点,将第i种参数数据的函数曲线上第一数据点的斜率值与线性归一化后第一数据点对应的窗口内的数据标准差的乘积作为第i种参数数据的第一数据点的实际波动评估值;获取每种参数数据的每个数据点的实际波动评估值。
6.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据相邻两个添加原料时间得到若干个时序范围,包括的具体步骤如下:
将第i种参数数据中每相邻两个添加原料时间之间的范围记为第i种参数数据的一个时序范围,得到第i种参数数据的若干时序范围;获取每一种参数数据的若干时序范围。
7.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据时序范围内数据点的斜率值、数据点与添加原料时间之间的时序跨度和数据点与距离最近的极值点之间的时序跨度,得到每一种参数数据的每一个时序范围的保留度初值,包括的具体步骤如下:
式中,为第i种参数数据的第m个时序范围内第j个数据点的斜率值,/>为第i种参数数据的第m个时序范围内数据点的斜率均值,/>为以自然常数e为底的指数函数,为线性归一化处理后第i种参数数据的第m个时序范围内第j个数据点与添加原料时间之间的时序跨度,/>为线性归一化处理后第i种参数数据的第m个时序范围内第j个数据点与距离最近的极值点之间的时序跨度,J为时序范围内数据点的总个数,/>为第i种参数数据的第m个时序范围的保留度初值。
8.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据每一种参数数据的所有时序范围的保留度初值得到每一个参数的保留度,包括的具体步骤如下:
将每一种参数数据的所有时序范围的保留度初值均值作为每一个参数的保留度。
9.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据样本数据之间的时序跨度、每一种参数数据的数据范围内数据的实际波动评估值以及每一个参数的保留度,得到优化后的样本数据之间的欧式距离,包括的具体步骤如下:
式中,为第w个样本数据中第i种参数数据的数据值,/>为第q个样本数据中第i种参数数据的数据值,/>为第w个样本数据在第i种参数数据的实际波动评估值,/>为第q个样本数据与第w个样本数据之间的时序跨度,/>为自然常数e为底的指数函数,为第i个参数的保留度,/>为优化后的第w个样本数据与第q个样本数之间据的欧式距离。
10.根据权利要求1所述一种用于纺织品洗涤剂设备数据管理***,其特征在于,所述根据样本数据的归一化离群值对所有簇类进行清洗及存储,包括的具体步骤如下:
预设一个离群阈值,将样本数据的归一化离群值大于离群阈值时的样本数据记为离群数据,对所有簇类中的离群数据进行清洗去除,将清洗之后的多个簇类中的样本数据进行存储。
CN202311154708.8A 2023-09-08 2023-09-08 一种用于纺织品洗涤剂设备数据管理*** Active CN116881635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311154708.8A CN116881635B (zh) 2023-09-08 2023-09-08 一种用于纺织品洗涤剂设备数据管理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311154708.8A CN116881635B (zh) 2023-09-08 2023-09-08 一种用于纺织品洗涤剂设备数据管理***

Publications (2)

Publication Number Publication Date
CN116881635A CN116881635A (zh) 2023-10-13
CN116881635B true CN116881635B (zh) 2023-12-05

Family

ID=88272240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311154708.8A Active CN116881635B (zh) 2023-09-08 2023-09-08 一种用于纺织品洗涤剂设备数据管理***

Country Status (1)

Country Link
CN (1) CN116881635B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117421686B (zh) * 2023-12-18 2024-03-05 山东金诺种业有限公司 一种水肥一体化灌溉用量数据收集方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109765869A (zh) * 2019-02-13 2019-05-17 北京日光旭升精细化工技术研究所 一种化妆品生产监控管理***及方法
CN115577275A (zh) * 2022-11-11 2023-01-06 山东产业技术研究院智能计算研究院 一种基于lof和孤立森林的时序数据异常监测***及方法
CN115952062A (zh) * 2023-01-31 2023-04-11 中移动信息技术有限公司 数据异常检测方法、装置、设备及介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6456580B1 (ja) * 2018-06-14 2019-01-23 三菱電機株式会社 異常検知装置、異常検知方法及び異常検知プログラム
CN113869526A (zh) * 2021-10-20 2021-12-31 京东城市(北京)数字科技有限公司 数据处理模型性能提高方法及装置、存储介质和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109765869A (zh) * 2019-02-13 2019-05-17 北京日光旭升精细化工技术研究所 一种化妆品生产监控管理***及方法
CN115577275A (zh) * 2022-11-11 2023-01-06 山东产业技术研究院智能计算研究院 一种基于lof和孤立森林的时序数据异常监测***及方法
CN115952062A (zh) * 2023-01-31 2023-04-11 中移动信息技术有限公司 数据异常检测方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
洗衣房液体洗涤剂的性能特点及其在布草洗涤中的应用;郭继东 等;中国洗涤用品工业杂志;20-31 *

Also Published As

Publication number Publication date
CN116881635A (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
CN116881635B (zh) 一种用于纺织品洗涤剂设备数据管理***
CN112527788A (zh) 变压器监测数据异常值检测与清洗的方法及装置
CN117196353B (zh) 基于大数据的环境污染评估与监测方法及***
CN116400126B (zh) 一种具有数据处理***的低压电力箱
CN116433085A (zh) 一种轧制过程控制***性能评估方法
CN108305002A (zh) 一种基于监控威布尔形状参数的早期失效率变点识别方法
CN107808209B (zh) 基于加权kNN距离的风电场异常数据辨识方法
CN116894151B (zh) 基于人工智能的智慧电网异常数据清洗方法
CN116341770B (zh) 基于聚苯乙烯生产数据的生产能力预测方法及***
CN116213095A (zh) 一种基于重介质分选的精煤产品灰分智能调节方法及***
CN110117798B (zh) 一种铝电解的氧化铝浓度估计方法及装置
CN113158552B (zh) 基于时间序列的生物反应器运行状况分级预测方法及***
CN112925290A (zh) 一种基于多变量本征chirp模态分解的厂级振荡检测方法
CN116774575B (zh) 一种用于糊精生产过程中粘度控制方法及***
CN117950324B (zh) 一种智能化塑胶供料控制方法及装置
CN113222266B (zh) 一种基于水表日用量大数据的预测模型匹配方法
CN115907202B (zh) 一种双碳背景下的数据中心pue计算分析方法及***
CN117786584B (zh) 基于大数据分析的畜牧业水源污染监测预警方法及***
CN117312617B (zh) 基于污水数据监测的实时污水处理方法及***
CN115213735B (zh) 一种铣削加工过程刀具状态监测***及方法
CN115470658A (zh) 一种基于自回归模型的造纸清水流量预测智能预测模型
CN117850511A (zh) 一种基于物联网的皮蛋腌制环境自动控制方法和***
CN115510956A (zh) 工况识别器制作方法、识别方法、装置、设备及存储介质
CN112434892A (zh) 基于多因素组合学习的差异化用电需求预测方法及***
CN116776096A (zh) 一种重要用户用电量特征描述分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant