CN113642251A - 一种建筑陶瓷喷雾制粉质量的数据分析预测方法及*** - Google Patents
一种建筑陶瓷喷雾制粉质量的数据分析预测方法及*** Download PDFInfo
- Publication number
- CN113642251A CN113642251A CN202111016978.3A CN202111016978A CN113642251A CN 113642251 A CN113642251 A CN 113642251A CN 202111016978 A CN202111016978 A CN 202111016978A CN 113642251 A CN113642251 A CN 113642251A
- Authority
- CN
- China
- Prior art keywords
- data
- powder
- variable
- slurry
- spray
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000843 powder Substances 0.000 title claims abstract description 151
- 239000007921 spray Substances 0.000 title claims abstract description 106
- 238000000034 method Methods 0.000 title claims abstract description 82
- 239000000919 ceramic Substances 0.000 title claims abstract description 43
- 238000007405 data analysis Methods 0.000 title claims abstract description 23
- 230000002159 abnormal effect Effects 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000005507 spraying Methods 0.000 claims abstract description 15
- 208000025174 PANDAS Diseases 0.000 claims abstract description 13
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 claims abstract description 13
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000011156 evaluation Methods 0.000 claims abstract description 6
- 239000002002 slurry Substances 0.000 claims description 86
- 238000004364 calculation method Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 18
- 240000004718 Panda Species 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 10
- 238000003801 milling Methods 0.000 claims description 10
- 239000002245 particle Substances 0.000 claims description 9
- 238000011049 filling Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 5
- 238000003491 array Methods 0.000 claims description 4
- 230000005484 gravity Effects 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 3
- 238000013523 data management Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000005086 pumping Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 abstract description 23
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000013178 mathematical model Methods 0.000 abstract description 3
- 240000000220 Panda oleosa Species 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 15
- 238000002360 preparation method Methods 0.000 description 4
- 238000002485 combustion reaction Methods 0.000 description 3
- 238000001035 drying Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010298 pulverizing process Methods 0.000 description 2
- 238000001694 spray drying Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000003595 mist Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明涉及建筑陶瓷喷雾制粉领域,特别是一种建筑陶瓷喷雾制粉质量的数据分析预测方法及***;数据分析预测方法包括如下内容:获取流程数据步骤、构建追溯数据链路步骤、构建预处理数据集并利用pandas求出预处理数据集的总样本数量及各变量数量统计情况的步骤和对缺失值和异常值的判断及处理的步骤和使用Xgboost函数包建立模型评估的步骤;数据分析预测***应用该数据分析预测方法后,通过数学模型的搭建与分析,可对喷雾塔制粉质量的情况进行监控,快速给出可能对产质量产生影响的因素建议,辅助技术人员快速调整,保障产品质量的稳定,降低对后工序生产的影响。
Description
技术领域
本发明涉及建筑陶瓷喷雾制粉领域,特别是一种建筑陶瓷喷雾制粉质量的数据分析预测方法及***。
背景技术
喷雾干燥塔是建筑陶瓷生产过程中进行陶瓷粉料颗粒制备所需的设备,将浆料通过由喷雾装置喷出并在热风的作用下进行脱水、干燥形成含有一定水分和粒度的陶瓷粉料颗粒,即浆料雾滴与热空气形成混合流的方式,浆料雾滴由于表面张力作用而形成球形,其水分在高温下迅速蒸发干燥,最终获得干燥的球形陶瓷粉料颗粒。
建陶行业中,利用干燥塔制备陶瓷粉料被称为喷雾制粉工艺。喷雾制粉工序中的生产、管理、质量控制仍保留传统制造业的特点,生产调节全靠技术人员的经验,没有更科学和更标准的指标去指导在生产过程中如何调整生产参数,生产效率和粉料质量难以提高。
为解决该问题,本领域行业普遍是喷雾制粉工人对产线的喷雾制粉工艺参数和喷雾制粉工序进行调整实验。但存在的问题是,调整时间长,试错成本大,且只有足够经验的工人才能对产线进行有效率的调整实验。
发明内容
针对上述缺陷,本发明的目的在于提出一种建筑陶瓷喷雾制粉质量的数据分析预测方法及***,已解决现有技术中调整调整时间长,试错成本大,且只有足够经验的工人才能对产线进行有效率的调整实验的技术问题。
为达此目的,本发明采用以下技术方案:
一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其包括如下内容:
A.获取流程数据、喷雾塔参数和浆料性能数据及制备出陶瓷粉料的粉料性能数据;
B.以流程数据为连接信息,以连接信息对浆料进入喷雾塔、喷雾制粉和检测陶瓷粉料三个流程的数据链路搭建,得到追溯数据链路;
C.将追溯数据链路导入python数据集中得到预处理数据集,利用pandas求出预处理数据集的总样本数量及各变量数量统计情况;
D.根据比总样本量和各变量统计数量情况,完成对缺失值和异常值的判断及处理;
E.以粉料性能数据为输出变量X,以喷雾塔参数和浆料性能数据为输入变量Y,利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息;使用Xgboost函数包建立模型,分别对粉料性能数据中单一指定参数进行建模训练,训练时使用自动调参,调整最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数;通过R2_SCORE指标评价模型效果,对最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数的不同组合成的模型进行评价,其中R2_SCORE计算公式为:
选择训练集和测试集R2_SCORE值越趋近于1的模型,输出排名靠前的变量特征,排名越靠前的变量特征,即分别为对粉料性能数据中对应单一指定参数的影响作用越大的输入变量。
具体的,所述A步骤还包括如下内容:所述流程数据包括日期时间信息、浆池号、中转缸号和喷雾塔塔号;所述喷雾塔参数包括:炉膛温度、塔顶温度、塔中温度、出口温度、助燃风频率、炉排频率、螺杆泵频率、喷***数、喷片孔径、送浆压力、负压、风机电流和/或大风机频率;所述浆料性能数据包括;浆料水分、浆料流速、和/或浆料性能-比重;所述粉料性能数据包括:粉料名称、粉料水分、粉料容重和/或颗粒度;并对各个参数进行类别划分。
具体的,所述B步骤还包括如下内容:以抽浆时间、浆池号、中转缸号、喷雾塔记录的日期时间、喷雾塔塔号、粉料名称和粉料检测时间在的流程数据为连接信息,将从浆料进入喷雾塔到喷雾塔制粉完成并检测粉料质量的整个流程的数据链路进行搭建,得到追溯数据链路。
具体的,所述C步骤还包括如下内容:
将搭建好的追溯数据链路导入python数据集中作为预处理数据集,利用pandas得到各变量的最大值、最大值位数、最小值、最小值位置、25%分位数、中位数、75%分位数、均值、平均绝对偏差、方差、标准差、偏度和峰度统计指标,用于了解的总样本数量及各变量数量统计情况。
更优的,所述D步骤还包括如下内容:
缺失值判断及处理:对比总样本量和各变量统计数量的差,判断各变量缺失值的情况;根据工艺经验及模型实际需求,结合数据的实际情况,确定删除或填补缺失值的方法;当数据集的样本量很大,或存在较多缺失值的字段并不是重要变量,即删除缺失值或缺失值数据后,进入模型的样本数量/字段仍然可以保证模型的有效性,则可以直接去掉缺失值或缺失值样本;可通过Pandas或Numpy来实现;填补缺失值可采用随机森林等多种方法进行填补,在数据治理阶段无法判断应采用哪种方法对缺失值进行填补时,可进入模型建立阶段再进行处理;
异常值的判断及处理:根据最大最小值、四分位数等统计指标,判断各变量中,数值的分布及偏离情况,判断数据中是否存在异常值;将异常值进行自动更正。
更优的,所述D和E步骤之间还设有数据描述统计步骤,该步骤包括如下内容:以工艺标准为基础,对比阶段生产的浆料性能数据、粉料性能数据和喷雾塔参数的达标情况;将包括送浆压力、大风机频率、炉膛温度、塔顶温度、塔中温度和出口温度在内的可控参数,及粉料水分、粉料容重和颗粒度在内的目标变量的工艺参数标准范围设定为数;设定不达标准的数量及不达标准比例的空数组;建立循环统计不达标数量及不达标比例;数据集中,对应stat_cols内的变量,若不在对应的array标准范围之内,计算低于最小标准值和高于最大标准值的数量,输出记录不达标的数量nogood数组及不达标比例nogood_rate数组。
具体的,所述以粉料性能数据为输出变量,以喷雾塔参数和浆料参数为输入变量,利用利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息的步骤包括如下内容:输入变量X为炉膛温度、塔顶温度、塔中温度、出口温度、助燃风、喷***数、送浆压力、浆料水分、浆料流速、负压、风机电流或大风机频率;输出变量Y为粉料水分、粉料容重或粉料颗粒度;利用python的corr函数计算每个输入变量X与每个输出变量Y的特征相关性,结合计算结果分析输出变量Y与输入变量X的相关性强弱。
具体的,输出变量Y与输入变量X的相关性强弱相关性评判指标为:利用python的corr函数计算每个输入变量X与每个输出变量Y的特征相关性,计算结果相关系数绝对值超过0.3则判定该输出变量Y和对应的输入变量X有弱相关性;如果计算结果相关系数绝对值超过0.6则判定该输出变量Y和对应的输入变量X有强相关性;如果计算结果相关系数绝对值为正则为正相关,为负则为负相关。
一种建筑陶瓷喷雾制粉质量的数据分析预测***,其应用在如上所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法;所述数据分析预测***包括:
数据获取模块,用于获取流程数据、喷雾塔参数和浆料性能数据及制备出陶瓷粉料的粉料性能数据;
数据搭链路建模块,用于以流程数据为连接信息,以连接信息对浆料进入喷雾塔、喷雾制粉和检测陶瓷粉料三个流程的数据链路搭建,得到追溯数据链路;
数据预处理模块,用于将追溯数据链路导入python数据集中得到预处理数据集,利用pandas求出预处理数据集的总样本数量及各变量数量统计情况;
数据判断处理模块,用于根据比总样本量和各变量统计数量情况,完成对缺失值和异常值的判断及处理;
还包括数据描述统计模块,用于以工艺标准为基础,对比阶段生产的浆料性能数据、粉料性能数据和喷雾塔参数的达标情况;
特征相关性计算模块,用于以粉料性能数据为输出变量X,以喷雾塔参数和浆料参数为输入变量Y,利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息;
所述Xgboost分类模型建立模块,使用Xgboost函数包建立模型,分别对粉料性能数据中单一指定参数进行建模训练,训练时使用自动调参,调整最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数;通过R2_SCORE指标评价模型效果,对最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数的不同组合成的模型进行评价,其中R2_SCORE计算公式为:
选择训练集和测试集R2_SCORE值越趋近于1的模型,输出排名靠前的变量特征,排名越靠前的变量特征,即分别为对粉料性能数据中对应单一指定参数的影响作用越大的输入变量。
一种计算机存储介质,其存储有计算机指令,所述计算机指令被调用时用于执行如上所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法。
本发明的实施例的有益效果:
所述数据分析预测方法及***,结合建筑陶瓷喷雾制粉工序中喷雾塔参数和浆料性能数据对粉料性能特性的影响相关性强弱,并通过数学模型的搭建与分析,可对喷雾塔制粉质量的情况进行监控,快速给出可能对产质量产生影响的因素建议,辅助技术人员快速调整,保障产品质量的稳定,降低对后工序生产的影响。
附图说明
图1是本发明的一个实施例中一种建筑陶瓷喷雾制粉质量的数据分析预测方法的流程示意结图;
图2是本发明的另一个实施例中一种建筑陶瓷喷雾制粉质量的数据分析预测方法的流程示意结图;
图3是本发明的一个实施例中在计算计算每个输入变量与每个输出变量的特征相关性信息时的建模流程示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本申请的一个实施例,如图1和图2所示,一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其包括如下内容:
A.获取流程数据、喷雾塔参数和浆料性能数据及制备出陶瓷粉料的粉料性能数据;具体包括数据维度明确和数据准备两个阶段。
数据维度明确:喷雾干燥就是将陶瓷泥浆用喷枪在塔内喷洒成雾滴状,与热风炉产生的热风相接触,由于雾滴细,具有巨大的蒸发面积,几乎在瞬间就完成干燥,得到合乎要求的颗粒状粉料,积聚在塔底由卸料阀卸出。在建筑陶瓷实际生产过程中,浆料进入喷雾塔,工艺操作人员根据生产配方中对粉料的质量要求,设定喷雾塔的参数,以得到符合质量要求的粉料,这涉及的数据维度有三个:浆料性能数据(进入喷雾塔制粉工序前的浆料检测)、喷雾塔参数(喷雾塔设备制粉过程中的参数)、粉料性能数据(喷雾塔工序产品的检测数据),详细变量包含但不限于下表1所示。
表1变量明细表
如上表所示,所述流程数据包括日期时间信息、浆池号、中转缸号和喷雾塔塔号;所述喷雾塔参数包括:炉膛温度、塔顶温度、塔中温度、出口温度、助燃风频率、炉排频率、螺杆泵频率、喷***数、喷片孔径、送浆压力、负压、风机电流和/或大风机频率;所述浆料性能数据包括;浆料水分、浆料流速、和/或浆料性能-比重;所述粉料性能数据包括:粉料名称、粉料水分、粉料容重和/或颗粒度。
数据准备:采集阶段,据工厂数字化程度的基础不同,划分为两种情况。一种是数字化程度比较高,工厂有条件自动采集电子化数据,则直接从数据库调用数据;另一种情况,工厂缺乏自动数据采集条件,则按照明确的数据维度,梳理在工厂日常生产流程记录中,有记录变量明细表中的表格,进行数据收集、整理;对日常生产过程中没有记录的数据进行新增,保证对日常有记录的数据完整的记录及有效保存。粉料性能数据的采集,存在部分工厂会对粉料物化性能进行多个环节的检测,例如,有些工厂在喷雾塔完成制粉后对粉料性能进行检测并出相关粉料质量数据的记录,在压机顶环节,会对进入粉仓存储的粉料进行二次检测并记录相关粉料质量数据,这形成了两份对粉料质量评估的数据。在这种情况下,考虑到本发明是针对喷雾塔环节影响粉料质量的突出因素的研究,所以建议使用喷雾塔制粉完成后对粉料进行检测并记录的粉料质量数据。
所述流程数据、所述喷雾塔参数、所述浆料性能数据和所述粉料性能数据中各个参数进行类别划分,具体如表2所示。
表2变量类型划分
变量维度 | 变量名称 | 单位 | 变量类型 |
流程数据 | 日期时间 | / | |
流程数据 | 塔号 | / | |
粉料性能数据 | 粉料名称 | 不可控变量 | |
喷雾塔参数 | 炉膛温度 | ℃ | 可控变量 |
喷雾塔参数 | 塔顶温度 | ℃ | 可控变量 |
喷雾塔参数 | 塔中温度 | ℃ | 可控变量 |
喷雾塔参数 | 出口温度 | ℃ | 可控变量 |
喷雾塔参数 | 助燃风频率 | Hz | 可控变量 |
喷雾塔参数 | 炉排/螺杆泵频率 | Hz | 可控变量 |
喷雾塔参数 | 喷***数 | 可控变量 | |
喷雾塔参数 | 喷片孔径 | mm | 可控变量 |
喷雾塔参数 | 送浆压力 | Mpa | 可控变量 |
浆料性能数据 | 浆料水分 | % | 不可控变量 |
浆料性能数据 | 浆料流速 | 秒 | 不可控变量 |
喷雾塔参数 | 负压 | pa | 可控变量 |
喷雾塔参数 | 风机电流 | A | 可控变量 |
喷雾塔参数 | 大风机频率 | Hz | 可控变量 |
粉料性能数据 | 粉料水分 | % | 目标变量 |
粉料性能数据 | 粉料容重 | 目标变量 | |
粉料性能数据 | 颗粒度 | % | 目标变量 |
浆料性能数据 | 浆料性能-比重 | 不可控变量 |
B.以流程数据为连接信息,以连接信息对浆料进入喷雾塔、喷雾制粉和检测陶瓷粉料三个流程的数据链路搭建,得到追溯数据链路;
具体的,以抽浆时间、浆池号、中转缸号、喷雾塔记录的日期时间、喷雾塔塔号、粉料名称和粉料检测时间在的流程数据为连接信息,将从浆料进入喷雾塔到喷雾塔制粉完成并检测粉料质量的整个流程的数据链路进行搭建,得到追溯数据链路。
C.将追溯数据链路导入python数据集中得到预处理数据集,利用pandas求出预处理数据集的总样本数量及各变量数量统计情况;
具体的,将搭建好的追溯数据链路导入python数据集中作为预处理数据集,利用pandas得到各变量的最大值、最大值位数、最小值、最小值位置、25%分位数、中位数、75%分位数、均值、平均绝对偏差、方差、标准差、偏度和峰度统计指标,用于了解的总样本数量及各变量数量统计情况。
D.根据比总样本量和各变量统计数量情况,完成对缺失值和异常值的判断及处理;具体包括如下内容:
缺失值判断及处理:
对比总样本量和各变量统计数量的差,判断各变量缺失值的情况;根据工艺经验及模型实际需求,结合数据的实际情况,确定删除或填补缺失值的方法;
当数据集的样本量很大,或存在较多缺失值的字段并不是重要变量,即删除缺失值或缺失值数据后,进入模型的样本数量/字段仍然可以保证模型的有效性,则可以直接去掉缺失值或缺失值样本;可通过Pandas或Numpy来实现;
填补缺失值可采用随机森林等多种方法进行填补,在数据治理阶段无法判断应采用哪种方法对缺失值进行填补时,可进入模型建立阶段再进行处理;
异常值的判断及处理:
根据最大最小值、四分位数等统计指标,判断各变量中,数值的分布及偏离情况,判断数据中是否存在异常值;将异常值进行自动更正。
具体的,异常值主要存在两种情况(1)填写错误:根据经验判断单个变量的正常取值范围,例如一般喷雾塔工序中喷雾塔设备参数的送浆压力,正常数值范围在0.9MPa-1.4MPa,但数据中存在一定量的12MPa,可以判断,12MPa是缺失小数点的填写错误,可以直接修改为1.2MPa;(2)定义异常值,从统计上操作,一般将超出均值±3倍标准差的数据点判定为异常值(判定的标准需要根据不同的情况而定,本发明将超出均值±3倍标准差的数据点判定为异常值),将超出范围的异常值去除。
在一些实施例中还包括如下步骤:
D1.数据描统计步骤步骤包括如下内容:
以工艺标准为基础,对比阶段生产的浆料性能数据、粉料性能数据和喷雾塔参数的达标情况;
将包括送浆压力、大风机频率、炉膛温度、塔顶温度、塔中温度和出口温度在内的可控参数,及粉料水分、粉料容重和颗粒度在内的目标变量的工艺参数标准范围设定为数组;
例如:
设定array=[(0.9,1.4),(39,49),(980,1040),(600,650),(85,1000),(50,1000),(6.5,7.3),(0,10),(-1,0.8),(55,65),(85,95),(97,120)];
设定对应数组array中的各项变量名称为stat_cols=[‘送浆压力’,’大风机频率’,’炉膛温度’,’塔顶温度’,’塔中温度’,’出口温度’,’粉料水份’,’粉料容重’,’颗粒度’];
设定不达标准的数量及不达标准比例的空数组;
如:设定不达标数量数组nogood=[];
设定不达标比例数组nogood_rate=[];
建立循环统计不达标数量及不达标比例;
数据集中,对应stat_cols内的变量,若不在对应的array标准范围之内,计算低于最小标准值和高于最大标准值的数量,输出记录不达标的数量nogood数组及不达标比例nogood_rate数组。
根据不达标数量和不达标比例的计算结果,为阶段性的喷雾塔制粉过程中,工艺流程参数控制的情况,以及粉料质量的大概水平的判断得出参考数值,不达标数量或不达标比例越大,则工艺流程控制和粉料质量的水平存在一定问题或波动较大。
以样本数据本身为基础,统计各类浆料、各类粉料的数量,对比各类参数在阶段生产过程中的质量、操作的波动情况;挖掘数据呈现出来的关于可优化的生产调整节点;
E.以粉料性能数据为输出变量X,以喷雾塔参数和浆料性能数据为输入变量Y,利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息。
具体的,建模流程如图3所示,输入变量X为炉膛温度、塔顶温度、塔中温度、出口温度、助燃风、喷***数、送浆压力、浆料水分、浆料流速、负压、风机电流或大风机频率;输出变量Y为粉料水分、粉料容重或粉料颗粒度;利用python的corr函数计算每个输入变量X与每个输出变量Y的特征相关性,结合计算结果分析输出变量Y与输入变量X的相关性强弱。
其中,输出变量Y与输入变量X的相关性强弱相关性评判指标为:利用python的corr函数计算每个输入变量X与每个输出变量Y的特征相关性,计算结果相关系数绝对值超过0.3则判定该输出变量Y和对应的输入变量X有弱相关性;如果计算结果相关系数绝对值超过0.6则判定该输出变量Y和对应的输入变量X有强相关性;如果计算结果相关系数绝对值为正则为正相关,为负则为负相关。
例如:如表3所示输出变量Y和对应的输入变量X相关性结果输出。
表3相关性结果输出
相关系数 | 容重 | 颗粒度 |
炉膛温度 | 0.075 | -0.306 |
塔顶温度 | 0.082 | 0.286 |
塔中温度 | 0.051 | 0.207 |
出口温度 | 0.019 | 0.192 |
助燃风频率 | 0.287 | -0.374 |
喷***数 | -0.055 | 0.280 |
送浆压力 | 0.135 | -0.237 |
浆料水分 | -0.074 | 0.367 |
浆料流速 | -0.094 | -0.168 |
负压 | -0.191 | 0.237 |
风机电流 | -0.407 | 0.157 |
大风机频率 | -0.170 | 0.457 |
以上表格中,输出变量粉料容重与输入变量风机电流具有弱相关性,为负相关,即当生产过程中,喷雾塔粉料的容重达标情况不理想时,可以优先考虑风机电流的原因;颗粒度与大风机频率存在弱相关性,为正相关。其它绝对值少于0.3的变量相关性不明显。相关系数绝对值越大,表示该输出变量受对应输入变量的影响相对较大。
E1.使用Xgboost函数包建立模型,分别对粉料性能数据中单一指定参数进行建模训练,训练时使用自动调参,调整最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数;通过R2_SCORE指标评价模型效果,对最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数的不同组合成的模型进行评价,其中R2_SCORE计算公式为:
选择训练集和测试集R2_SCORE值越趋近于1的模型,输出排名靠前的变量特征,排名越靠前的变量特征,即分别为对粉料性能数据中对应单一指定参数的影响作用越大的输入变量。
通过数学模型的搭建与分析,可对喷雾塔制粉质量的情况进行监控,快速给出可能对产质量产生影响的因素建议,辅助技术人员快速调整,保障产品质量的稳定,降低对后工序生产的影响。
实施例二
一种建筑陶瓷喷雾制粉质量的数据分析预测***,其应用在如上所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法;所述数据分析预测***包括:
数据获取模块,用于获取流程数据、喷雾塔参数和浆料性能数据及制备出陶瓷粉料的粉料性能数据;
数据搭链路建模块,用于以流程数据为连接信息,以连接信息对浆料进入喷雾塔、喷雾制粉和检测陶瓷粉料三个流程的数据链路搭建,得到追溯数据链路;
数据预处理模块,用于将追溯数据链路导入python数据集中得到预处理数据集,利用pandas求出预处理数据集的总样本数量及各变量数量统计情况;
数据判断处理模块,用于根据比总样本量和各变量统计数量情况,完成对缺失值和异常值的判断及处理;
还包括数据描述统计模块,用于以工艺标准为基础,对比阶段生产的浆料性能数据、粉料性能数据和喷雾塔参数的达标情况;
特征相关性计算模块,用于以粉料性能数据为输出变量X,以喷雾塔参数和浆料参数为输入变量Y,利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息;
所述Xgboost分类模型建立模块,使用Xgboost函数包建立模型,分别对粉料性能数据中单一指定参数进行建模训练,训练时使用自动调参,调整最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数;通过R2_SCORE指标评价模型效果,对最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数的不同组合成的模型进行评价,其中R2_SCORE计算公式为:
选择训练集和测试集R2_SCORE值越趋近于1的模型,输出排名靠前的变量特征,排名越靠前的变量特征,即分别为对粉料性能数据中对应单一指定参数的影响作用越大的输入变量。
实施例三
一种计算机存储介质,其存储介质存储有计算机指令,所述计算机指令被调用时用于执行如上所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法。
本实施例中数据链搭建的优势有:目前,多数建陶生产企业的各工序是存在很大程度上的数据孤岛,包括制粉工序。本发明的实施例中需要对数据链路进行搭建,一定程度上解决了数据追溯问题。本分析预测方法可以自适应调节模型的超参数,通过模型评估指标选择最优超参。
需要说明的是,数据在本实施例中的应用并不只局限在列举的3个数据维度,也不只局限列举的数据变量,还能增加工艺经验认为对粉料质量产生影响的参数,放入本方法中作为输入X,即可通过本方法及***进行评估、分析预测。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
Claims (10)
1.一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,包括如下内容:
A.获取流程数据、喷雾塔参数和浆料性能数据及制备出陶瓷粉料的粉料性能数据;
B.以流程数据为连接信息,以连接信息对浆料进入喷雾塔、喷雾制粉和检测陶瓷粉料三个流程的数据链路搭建,得到追溯数据链路;
C.将追溯数据链路导入python数据集中得到预处理数据集,利用pandas求出预处理数据集的总样本数量及各变量数量统计情况;
D.根据比总样本量和各变量统计数量情况,完成对缺失值和异常值的判断及处理;
E.以粉料性能数据为输出变量X,以喷雾塔参数和浆料性能数据为输入变量Y,利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息;使用Xgboost函数包建立模型,分别对粉料性能数据中单一指定参数进行建模训练,训练时使用自动调参,调整最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数;通过R2_SCORE指标评价模型效果,对最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数的不同组合成的模型进行评价,其中R2_SCORE计算公式为:
选择训练集和测试集R2_SCORE值越趋近于1的模型,输出排名靠前的变量特征,排名越靠前的变量特征,即分别为对粉料性能数据中对应单一指定参数的影响作用越大的输入变量。
2.根据权利要求1所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,所述A步骤还包括如下内容:所述流程数据包括日期时间信息、浆池号、中转缸号和喷雾塔塔号;所述喷雾塔参数包括:炉膛温度、塔顶温度、塔中温度、出口温度、助燃风频率、炉排频率、螺杆泵频率、喷***数、喷片孔径、送浆压力、负压、风机电流和/或大风机频率;所述浆料性能数据包括;浆料水分、浆料流速、和/或浆料性能-比重;所述粉料性能数据包括:粉料名称、粉料水分、粉料容重和/或颗粒度;并对各个参数进行类别划分。
3.根据权利要求2所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,所述B步骤还包括如下内容:
以抽浆时间、浆池号、中转缸号、喷雾塔记录的日期时间、喷雾塔塔号、粉料名称和粉料检测时间在的流程数据为连接信息,将从浆料进入喷雾塔到喷雾塔制粉完成并检测粉料质量的整个流程的数据链路进行搭建,得到追溯数据链路。
4.根据权利要求2所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,所述C步骤还包括如下内容:
将搭建好的追溯数据链路导入python数据集中作为预处理数据集,利用pandas得到各变量的最大值、最大值位数、最小值、最小值位置、25%分位数、中位数、75%分位数、均值、平均绝对偏差、方差、标准差、偏度和峰度统计指标,用于了解的总样本数量及各变量数量统计情况。
5.根据权利要求1所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,所述D步骤还包括如下内容:
缺失值判断及处理:
对比总样本量和各变量统计数量的差,判断各变量缺失值的情况;根据工艺经验及模型实际需求,结合数据的实际情况,确定删除或填补缺失值的方法;
当数据集的样本量很大,或存在较多缺失值的字段并不是重要变量,即删除缺失值或缺失值数据后,进入模型的样本数量或字段仍然可以保证模型的有效性,则直接去掉缺失值或缺失值样本;可通过Pandas或Numpy来实现;
填补缺失值可采用随机森林等多种方法进行填补,在数据治理阶段无法判断应采用哪种方法对缺失值进行填补时,可进入模型建立阶段再进行处理;
异常值的判断及处理:
根据最大最小值、四分位数等统计指标,判断各变量中,数值的分布及偏离情况,判断数据中是否存在异常值;将异常值进行自动更正。
6.根据权利要求2所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,所述D和E步骤之间还设有数据描述统计步骤,该步骤包括如下内容:
以工艺标准为基础,对比阶段生产的浆料性能数据、粉料性能数据和喷雾塔参数的达标情况;
将包括送浆压力、大风机频率、炉膛温度、塔顶温度、塔中温度和出口温度在内的可控参数,及粉料水分、粉料容重和颗粒度在内的目标变量的工艺参数标准范围设定为数;
设定不达标准的数量及不达标准比例的空数组;
建立循环统计不达标数量及不达标比例;
数据集中,对应stat_cols内的变量,若不在对应的array标准范围之内,计算低于最小标准值和高于最大标准值的数量,输出记录不达标的数量nogood数组及不达标比例nogood_rate数组。
7.根据权利要求1所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,所述以粉料性能数据为输出变量,以喷雾塔参数和浆料参数为输入变量,利用利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息的步骤包括如下内容:
输入变量X为炉膛温度、塔顶温度、塔中温度、出口温度、助燃风、喷***数、送浆压力、浆料水分、浆料流速、负压、风机电流或大风机频率;输出变量Y为粉料水分、粉料容重或粉料颗粒度;利用python的corr函数计算每个输入变量X与每个输出变量Y的特征相关性,结合计算结果分析输出变量Y与输入变量X的相关性强弱。
8.根据权利要求7所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法,其特征在于,输出变量Y与输入变量X的相关性强弱相关性评判指标为:利用python的corr函数计算每个输入变量X与每个输出变量Y的特征相关性,计算结果相关系数绝对值超过0.3则判定该输出变量Y和对应的输入变量X有弱相关性;如果计算结果相关系数绝对值超过0.6则判定该输出变量Y和对应的输入变量X有强相关性;如果计算结果相关系数绝对值为正则为正相关,为负则为负相关。
9.根据权利要求1所述的一种建筑陶瓷喷雾制粉质量的数据分析预测***,其特征在于,应用在如权利要求1-7任一项所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法;
所述数据分析预测***包括:
数据获取模块,用于获取流程数据、喷雾塔参数和浆料性能数据及制备出陶瓷粉料的粉料性能数据;
数据搭链路建模块,用于以流程数据为连接信息,以连接信息对浆料进入喷雾塔、喷雾制粉和检测陶瓷粉料三个流程的数据链路搭建,得到追溯数据链路;
数据预处理模块,用于将追溯数据链路导入python数据集中得到预处理数据集,利用pandas求出预处理数据集的总样本数量及各变量数量统计情况;
数据判断处理模块,用于根据比总样本量和各变量统计数量情况,完成对缺失值和异常值的判断及处理;
还包括数据描述统计模块,用于以工艺标准为基础,对比阶段生产的浆料性能数据、粉料性能数据和喷雾塔参数的达标情况;
特征相关性计算模块,用于以粉料性能数据为输出变量X,以喷雾塔参数和浆料参数为输入变量Y,利用python的corr函数,计算每个输入变量与每个输出变量的特征相关性信息;
所述Xgboost分类模型建立模块,使用Xgboost函数包建立模型,分别对粉料性能数据中单一指定参数进行建模训练,训练时使用自动调参,调整最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数;通过R2_SCORE指标评价模型效果,对最大深度(max_depth)、学习率(learning_rate)和评估器数量(n_estimators)三个超参数的不同组合成的模型进行评价,其中R2_SCORE计算公式为:
选择训练集和测试集R2_SCORE值越趋近于1的模型,输出排名靠前的变量特征,排名越靠前的变量特征,即分别为对粉料性能数据中对应单一指定参数的影响作用越大的输入变量。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时用于执行如权利要求1-8中任意一项所述的一种建筑陶瓷喷雾制粉质量的数据分析预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111016978.3A CN113642251B (zh) | 2021-08-31 | 2021-08-31 | 一种建筑陶瓷喷雾制粉质量的数据分析预测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111016978.3A CN113642251B (zh) | 2021-08-31 | 2021-08-31 | 一种建筑陶瓷喷雾制粉质量的数据分析预测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113642251A true CN113642251A (zh) | 2021-11-12 |
CN113642251B CN113642251B (zh) | 2024-05-28 |
Family
ID=78424804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111016978.3A Active CN113642251B (zh) | 2021-08-31 | 2021-08-31 | 一种建筑陶瓷喷雾制粉质量的数据分析预测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642251B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116992390A (zh) * | 2023-09-26 | 2023-11-03 | 北京联创高科信息技术有限公司 | 一种异常数据的配置及展示方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108375808A (zh) * | 2018-03-12 | 2018-08-07 | 南京恩瑞特实业有限公司 | Nriet基于机器学习的大雾预报方法 |
CN108595803A (zh) * | 2018-04-13 | 2018-09-28 | 重庆科技学院 | 基于递归神经网络的页岩气井生产压力预测方法 |
WO2020234899A2 (en) * | 2019-05-17 | 2020-11-26 | Tata Consultancy Services | Method and system for adaptive learning of models for manufacturing systems |
CN112687349A (zh) * | 2020-12-25 | 2021-04-20 | 广东海洋大学 | 一种降低辛烷值损失模型的构建方法 |
CN112785091A (zh) * | 2021-03-04 | 2021-05-11 | 湖北工业大学 | 一种对油田电潜泵进行故障预测与健康管理的方法 |
CN112818601A (zh) * | 2021-02-05 | 2021-05-18 | 河海大学 | 基于ga-bp神经网络和误差统计分析的水电机组健康评估方法 |
CN112990311A (zh) * | 2021-03-15 | 2021-06-18 | 中国建设银行股份有限公司 | 一种准入客户的识别方法和装置 |
CN113008805A (zh) * | 2021-02-07 | 2021-06-22 | 浙江工业大学 | 基于高光谱成像深度分析的白芷饮片质量预测方法 |
WO2021143067A1 (zh) * | 2020-05-28 | 2021-07-22 | 平安科技(深圳)有限公司 | 预测加工件质量的方法、装置和计算机设备 |
-
2021
- 2021-08-31 CN CN202111016978.3A patent/CN113642251B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108375808A (zh) * | 2018-03-12 | 2018-08-07 | 南京恩瑞特实业有限公司 | Nriet基于机器学习的大雾预报方法 |
CN108595803A (zh) * | 2018-04-13 | 2018-09-28 | 重庆科技学院 | 基于递归神经网络的页岩气井生产压力预测方法 |
WO2020234899A2 (en) * | 2019-05-17 | 2020-11-26 | Tata Consultancy Services | Method and system for adaptive learning of models for manufacturing systems |
WO2021143067A1 (zh) * | 2020-05-28 | 2021-07-22 | 平安科技(深圳)有限公司 | 预测加工件质量的方法、装置和计算机设备 |
CN112687349A (zh) * | 2020-12-25 | 2021-04-20 | 广东海洋大学 | 一种降低辛烷值损失模型的构建方法 |
CN112818601A (zh) * | 2021-02-05 | 2021-05-18 | 河海大学 | 基于ga-bp神经网络和误差统计分析的水电机组健康评估方法 |
CN113008805A (zh) * | 2021-02-07 | 2021-06-22 | 浙江工业大学 | 基于高光谱成像深度分析的白芷饮片质量预测方法 |
CN112785091A (zh) * | 2021-03-04 | 2021-05-11 | 湖北工业大学 | 一种对油田电潜泵进行故障预测与健康管理的方法 |
CN112990311A (zh) * | 2021-03-15 | 2021-06-18 | 中国建设银行股份有限公司 | 一种准入客户的识别方法和装置 |
Non-Patent Citations (3)
Title |
---|
刘夏;黄灿;余骁锋;: "基于机器学习模型的专利质量预测初探", 情报学报, no. 04 * |
朱占军;王明侠;王春林;: "基于质量预测与统计分析的烧结过程性能监控***研究", 烧结球团, no. 01 * |
林霞;刘宗尚;高宇;武博宇;: "基于机器学习的产油量主控因素分析", 信息***工程, no. 12 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116992390A (zh) * | 2023-09-26 | 2023-11-03 | 北京联创高科信息技术有限公司 | 一种异常数据的配置及展示方法 |
CN116992390B (zh) * | 2023-09-26 | 2023-12-05 | 北京联创高科信息技术有限公司 | 一种异常数据的配置及展示方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113642251B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330555A (zh) | 一种基于随机森林回归的制丝过程参数赋权方法 | |
CN108469180A (zh) | 基于大数据和机器学习的烧结终点预测***的建立方法 | |
CN113642251A (zh) | 一种建筑陶瓷喷雾制粉质量的数据分析预测方法及*** | |
CN111667156B (zh) | 一种多点生产的卷烟物理质量一致性评价的方法 | |
CN109342279B (zh) | 基于粉磨机理和神经网络的混合软测量方法 | |
CN105044022A (zh) | 一种基于近红外光谱技术快速无损检测小麦硬度的方法及应用 | |
CN112986491A (zh) | 一种基于反馈自适应预测模型的混合料水分检测值修正方法 | |
CN115099457A (zh) | 烟丝结构在线预测分析*** | |
CN111667148A (zh) | 一种led产线品质管控方法 | |
CN108052559A (zh) | 基于大数据处理的配电终端缺陷挖掘分析方法 | |
CN114881374A (zh) | 用于建筑能耗预测的多元异构能耗数据融合方法和*** | |
CN108519760A (zh) | 一种基于变点检测理论的制丝过程稳态识别方法 | |
CN110196797B (zh) | 适于信用评分卡***的自动优化方法和*** | |
CN106873365A (zh) | 一种综合质量目标与设备性能的挤出吹塑工艺优化方法 | |
CN107243461B (zh) | 一种自动分级装置 | |
CN106779322B (zh) | 服从二项分布的计件值工序能力指数评价方法 | |
CN115420566A (zh) | 一种全自动制样***的性能检验方法 | |
CN105424249B (zh) | 一种粮仓储粮状态的检测方法及其装置 | |
CN106174672A (zh) | 一种有利于实现均质化控制的烟叶入库方法 | |
CN111680260A (zh) | 一种功效函数法评价卷烟物理质量的方法 | |
CN115169737A (zh) | 一种基于cnn-lstm混合神经网络模型的工艺质量预测方法 | |
CN108646688A (zh) | 一种基于回归学习的工艺参数优化分析方法 | |
CN114842918A (zh) | 一种基于机器学习的烧结混合料自动加水方法 | |
Chen et al. | The determination of optimum process mean for a one-sided specification limit product with manufacturing cost and linear quality loss | |
CN109324009B (zh) | 一种烟草制丝生产线全线烟草含水率指标符合性的判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |