CN112257942A - 一种应力腐蚀开裂预测方法及*** - Google Patents
一种应力腐蚀开裂预测方法及*** Download PDFInfo
- Publication number
- CN112257942A CN112257942A CN202011177708.6A CN202011177708A CN112257942A CN 112257942 A CN112257942 A CN 112257942A CN 202011177708 A CN202011177708 A CN 202011177708A CN 112257942 A CN112257942 A CN 112257942A
- Authority
- CN
- China
- Prior art keywords
- elm
- classifier
- training
- prediction
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005336 cracking Methods 0.000 title claims abstract description 81
- 230000007797 corrosion Effects 0.000 title claims abstract description 79
- 238000005260 corrosion Methods 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 143
- 238000012360 testing method Methods 0.000 claims abstract description 96
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 23
- 238000005070 sampling Methods 0.000 claims description 15
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 claims description 14
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 14
- 229910052760 oxygen Inorganic materials 0.000 claims description 14
- 239000001301 oxygen Substances 0.000 claims description 14
- 238000010606 normalization Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 10
- 238000000638 solvent extraction Methods 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229910000963 austenitic stainless steel Inorganic materials 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)
Abstract
本发明公开一种应力腐蚀开裂预测方法及***,方法包括:根据训练集确定最优ELM分类器个数m;根据最优ELM分类器个数m、训练集和测试集确定m个分类器;采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;将待测试样本数据输入AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。本发明采用集成学习中的Adaboost算法将m个ELM分类器进行叠加,既提升了AdaELM集成预测分类器的性能,又避免了ELM算法自身的不稳定性,进而以提高应力腐蚀开裂预测的准确性。
Description
技术领域
本发明涉及应力腐蚀开裂预测技术领域,特别是涉及一种应力腐蚀开裂预测方法及***。
背景技术
应力腐蚀开裂(以下简称SCC)是承压类特种设备风险评价中的重要损伤模式,其开裂受材料、应力和介质环境三大因素的共同作用,存在着巨大的事故潜在风险,威胁国民生命和财产安全。根据我国GB/T 30579-2014《承压设备损伤模式识别》规定:当设备暴露在能够导致管道或容器开裂的环境中,例如含氯化物、硫化物、碳酸盐或碱性环境,在受到一定的应力情况下则会很容易发生应力腐蚀开裂现象,进而引发承压设备失效甚至发生事故灾害,具有十分严重的危险性和破坏性。目前,大多数事故风险是可以通过常规检验方法提前预知的,但是SCC作为工业生产中危害较大的一种损伤模式,却无法轻易预知。因此,亟需对应力腐蚀开裂进行预测研究,以便提前应对风险并采取相应策略。
目前,国内外已有部分学者将机器学习算法应用于应力腐蚀开裂预测中,例如传统的SVM支持向量机、三层BP神经网络和EF反馈神经网络模型,结果表明这些模型都有较好的预测效果,证明了用机器学习预测SCC的可行性。但这些传统的算法都存在容易发生过拟合的缺点,且BP神经网络容易陷入局部极值。
发明内容
基于此,本发明的目的是提供一种应力腐蚀开裂预测方法及***,以提高应力腐蚀开裂预测的准确性。
为实现上述目的,本发明提供了一种应力腐蚀开裂预测方法,所述方法包括:
步骤S1:构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
步骤S2:根据所述历史数据集确定训练集和测试集;
步骤S3:根据所述训练集确定最优ELM分类器个数m;
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
步骤S6:获取待测试样本数据;
步骤S7:将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
可选地,所述根据所述历史数据集确定训练集和测试集,具体包括:
步骤S21:将所述历史数据集划分模型输入数据集和模型输出数据集;
步骤S22:对所述模型输入数据集进行对数变换,获得对数数据集;
步骤S23:对所述对数数据集进行归一化处理,获得归一化数据集;
步骤S24:根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
可选地,所述根据所述训练集和所述测试集确定最优ELM分类器个数,具体包括:
步骤S31:将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
步骤S32:将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
步骤S33:利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
步骤S34:绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
可选地,所述根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器,具体包括:
步骤S41:初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
步骤S42:从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
步骤S43:将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
步骤S44:判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“步骤S45”;如果k小于设定值Q,则令k=k+1,返回“步骤S42”;
步骤S45:选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
步骤S46:基于所述测试集确定第i个ELM分类器对应的权重;
步骤S47:根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
步骤S48:判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“步骤S42”。
可选地,所述基于所述测试集确定第i个ELM分类器对应的权重,具体包括:
步骤S461:将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
步骤S462:将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
步骤S463:根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
本发明还提供一种应力腐蚀开裂预测***,所述***包括:
历史数据集构建模块,用于构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
训练集和测试集确定模块,用于根据所述历史数据集确定训练集和测试集;
最优ELM分类器个数确定模块,用于根据所述训练集确定最优ELM分类器个数m;
分类器确定模块,用于根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
AdaELM集成预测分类器确定模块,用于采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
获取模块,用于获取待测试样本数据;
预测模块,用于将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
可选地,所述训练集和测试集确定模块,具体包括:
第一集合划分单元,用于将所述历史数据集划分模型输入数据集和模型输出数据集;
对数变换单元,用于对所述模型输入数据集进行对数变换,获得对数数据集;
归一化处理单元,用于对所述对数数据集进行归一化处理,获得归一化数据集;
第二集合划分单元,用于根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
可选地,所述最优ELM分类器个数确定模块,具体包括:
第一训练单元,用于将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
预测单元,用于将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
准确率确定单元,用于利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
最优ELM分类器个数选取单元,用于绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
可选地,所述分类器确定模块,具体包括:
初始化单元,用于初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
抽样单元,用于从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
第二训练单元,用于将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
第一判断单元,用于判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“选取单元”;如果k小于设定值Q,则令k=k+1,返回“抽样单元”;
选取单元,用于选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
分类器权重确定单元,用于基于所述测试集确定第i个ELM分类器对应的权重;
初始权重确定单元,用于根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
第二判断单元,用于判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“抽样单元”。
可选地,所述分类器权重确定单元,具体包括:
预测子单元,用于将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
错误率确定子单元,用于将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
分类器权重确定子单元,用于根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开一种应力腐蚀开裂预测方法及***,方法包括:根据训练集确定最优ELM分类器个数m;根据最优ELM分类器个数m、训练集和测试集确定m个分类器;采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;将待测试样本数据输入AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。本发明采用集成学习中的Adaboost算法将m个ELM分类器进行叠加,既提升了AdaELM集成预测分类器的性能,又避免了ELM算法自身的不稳定性,进而以提高应力腐蚀开裂预测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例应力腐蚀开裂预测方法流程图;
图2为本发明实施例应力腐蚀开裂预测过程示意图;
图3为本发明实施例分类器的个数对AdaELM分类准确率的影响示意图;
图4为本发明实施例应力腐蚀开裂预测***结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种应力腐蚀开裂预测方法及***,以提高应力腐蚀开裂预测的准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1-2所示,本发明公开一种应力腐蚀开裂预测方法,所述方法包括:
步骤S1:构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果。
步骤S2:根据所述历史数据集确定训练集和测试集。
步骤S3:根据所述训练集确定最优ELM分类器个数m。
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器。
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器。
步骤S6:获取待测试样本数据。
步骤S7:将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
下面对各个步骤进行详细论述:
步骤S1:构建历史数据集;所述历史数据集包括温度(Temp)、氯离子浓度(Chlorides)、氧浓度(Oxygen)和应力腐蚀开裂(SCC)的实际分类结果;所述应力腐蚀开裂的实际分类结果包括“0”和“1”;其中,“1”代表已发生应力腐蚀开裂行为,“0”代表未发生应力腐蚀开裂行为。
步骤S2:根据所述历史数据集确定训练集和测试集,具体包括:
步骤S21:将所述历史数据集划分模型输入数据集和模型输出数据集;其中,所述模型输入数据集包括温度、氯离子浓度和氧浓度,所述模型输出数据集包括应力腐蚀开裂的实际分类结果。
步骤S22:对所述模型输入数据集进行对数变换,获得对数数据集,具体计算公式为:
X′=ln(X);
其中,X′表示对数数据集,X表示模型输入数据集。
步骤S23:对所述对数数据集进行归一化处理,获得归一化数据集,具体计算公式为:
其中,X*表示归一化数据集,X′表示对数数据集。
步骤S24:根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集,所述训练集包括:训练输入集X_train和训练输出集Y_train;所述测试集包括:测试输入集X_test和测试输出集Y_test。
具体的,将70%的所述归一化数据集划分为训练输入集X_train,将30%的所述归一化数据集划分为测试输入集X_test,将70%的所述模型输出数据集划分为训练输出集Y_train,将30%的所述模型输出数据集划分为测试输出集Y_test。
步骤S3:根据所述训练集和所述测试集确定最优ELM分类器个数,具体包括:
步骤S31:将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器。
步骤S32:将所述测试输入集输入各所述ELM分类器,获得各所述ELM分类器对应的预测输出集。
步骤S33:利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率。
步骤S34:绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
在一定程度内,ELM分类器越多,模型预测的准确率和精度也就越高,但所消耗的时间和训练成本也就越多。因此,ELM分类器个数的选择需综合准确率和训练效率两方面考虑。
如图3所示,根据训练集绘制出ELM分类器个数与准确率的关系折线图,在训练效率高的前提下,选出对应准确率最高的ELM分类器个数作为最优ELM分类器个数。图3中9次迭代的用时仅为0.29秒,效率最高,因此确定ELM分类器个数为9。
本发明更新样本权重的目的是提高被分类错误的样本的权重,降低分类正确的样本权重,更加关注被分类错误的样本。例如ELM分类器1确定之后,对之前的训练样本权重集D1进行更新,然后用于训练ELM分类器2的过程中。ELM分类器2的选择与ELM分类器1的方法相同,随机建立10个模型,从中挑选出误差最小的作为ELM分类器2,而误差的计算就是被分类错误的样本对应的样本权重之和。所以提高被分类错误样本的权重更有利于找到能将这些之前被错误分类的样本分类正确的模型,因此总结的具体步骤如下:
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器,具体包括:
步骤S41:初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;所述初始权重为总样本个数的均值,具体计算公式为:
其中,wij表示用于训练第i个ELM分类器的第j个训练样本的权值,N表示训练样本的总个数,D1表示用于训练第i个ELM分类器的N个训练样本权重的集合。
步骤S42:从所述训练集中分别有放回地循环随机抽样,获得N个训练样本。
步骤S43:将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器。
步骤S44:判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“S45”;如果k小于设定值Q,则令k=k+1,返回“步骤S42”。本实施例中设定值Q取10。
步骤S45:选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器。
步骤S46:基于所述测试集确定第i个ELM分类器对应的权重,具体包括:
步骤S461:将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果。
步骤S462:将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率,具体公式为:
步骤S463:根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重,具体公式为:
其中,αi表示第i个ELM分类器对应的权重,εi表示第i个ELM分类器对应的错误率。
步骤S47:根据第i个ELM分类器对应的权重更新各训练样本的初始权重,具体公式为:
其中,表示WiN表示第i个分类器的第N个训练样本的权重,W(i-1)N表示第i-1个分类器的第N个训练样本的权重,αi-1表示第i-1个分类器的权重,yN表示第N个训练样本的实际分类结果,Gi-1(XN)表示第i-1个分类器对第N个训练样本的预测分类结果。Zi-1表示第i-1个分类器的规范化因子。
步骤S48:判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“步骤S42”。
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器,具体计算公式为:
如图4所示,本发明还提供一种应力腐蚀开裂预测***,所述***包括:
历史数据集构建模块1,用于构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果。
训练集和测试集确定模块2,用于根据所述历史数据集确定训练集和测试集。
最优ELM分类器个数确定模块3,用于根据所述训练集确定最优ELM分类器个数m。
分类器确定模块4,用于根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器。
AdaELM集成预测分类器确定模块5,用于采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器。
获取模块6,用于获取待测试样本数据。
预测模块7,用于将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
作为一种可选的实施方式,本发明所述训练集和测试集确定模块2,具体包括:
第一集合划分单元,用于将所述历史数据集划分模型输入数据集和模型输出数据集。
对数变换单元,用于对所述模型输入数据集进行对数变换,获得对数数据集。
归一化处理单元,用于对所述对数数据集进行归一化处理,获得归一化数据集。
第二集合划分单元,用于根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
作为一种可选的实施方式,本发明所述最优ELM分类器个数确定模块3,具体包括:
第一训练单元,用于将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器。
预测单元,用于将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集。
准确率确定单元,用于利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率。
最优ELM分类器个数选取单元,用于绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
作为一种可选的实施方式,本发明所述分类器确定模块4,具体包括:
初始化单元,用于初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重。
抽样单元,用于从所述训练集中分别有放回地循环随机抽样,获得N个训练样本。
第二训练单元,用于将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器。
第一判断单元,用于判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“选取单元”;如果k小于设定值Q,则令k=k+1,返回“抽样单元”。
选取单元,用于选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器。
分类器权重确定单元,用于基于所述测试集确定第i个ELM分类器对应的权重。
初始权重确定单元,用于根据第i个ELM分类器对应的权重更新各训练样本的初始权重。
第二判断单元,用于判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“抽样单元”。
作为一种可选的实施方式,本发明所述分类器权重确定单元,具体包括:
预测子单元,用于将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果。
错误率确定子单元,用于将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率。
分类器权重确定子单元,用于根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
本发明采用集成学习中的Adaboost算法将m个ELM分类器进行叠加,既提升了AdaELM集成预测分类器的性能,又避免了ELM算法自身的不稳定性,进而以提高应力腐蚀开裂预测的准确性。
由于在实际工业生产环境中,很难收集与发生应力腐蚀开裂的敏感性相关的环境条件方面的特征数据,进而很难利用收集到的相关文献中的实验数据进行应力腐蚀开裂预测实证研究。本发明收集不同型号的奥氏体不锈钢在不同温度、不同氧浓度和氯离子浓度的水溶液三种场景下的交叉数据,以每种综合数据条件下是否发生应力腐蚀开裂构建ELM分类器。其中,温度条件为60℃~350℃,实验溶液中的氧浓度的变化范围是0.01~1200mg/L,氯离子浓度变化的范围在0.1~1000mg/L,实验材料为两种型号奥氏体不锈钢。
鉴于实际试验中离子浓度会对腐蚀开裂行为产生很大的影响而且不同量纲可能会带来巨大的结果差异,能够严重影响到最终预测结果的准确性,因此在将数据输入神经网络前,提前将应力腐蚀开裂数据进行预处理,即将氧浓度和氯离子浓度都取对数。之后对温度变量、氧浓度和氯离子浓度三项数据进行归一化处理,来减少输入数据的变化幅度,有利于模拟。
同时,对于从数据进行基本统计描述显示,不论是氯离子浓度还是氧浓度对应力腐蚀开裂的影响是正向的,温度与应力腐蚀开裂的敏感性的关系却并非简单的线性关系,这为下文对应力腐蚀开裂敏感性的研究提供了参考。
对应力腐蚀开裂进行预测时,预测分类结果可分为发生应力腐蚀开裂和未发生应力腐蚀开裂。为了更好的评价模型的分类性能,在这个问题中,可以使用准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值、ROC曲线和AUC等指标来度量。其中,准确率表示对应力腐蚀开裂现象的发生与否预测正确的样本与总样本数的比值;精确率指预测会发生应力腐蚀开裂的样本中,实际也确实发生了应力腐蚀开裂的比例,衡量的是分类器的查准率;召回率是指对应力腐蚀开裂现象的发生与否预测正确的所有样本中,正确预测会发生应力腐蚀开裂这一类的样本数所占的比例,衡量的是分类器的查全率;F1值是在精确率和召回率的基础上,考虑对两种评价方法进行整体评价;ROC曲线和AUC值一起共同评价分类器的性能,目的在于使得误差更小的情况下,尽量多的预测承压类特种设备中发生应力腐蚀开裂现象的样本。
分别用逻辑回归(LR)、决策树(DT)、支持向量机(SVM)等机器学习传统的分类模型与加gaussian核函数的ELM分类器在测试集上的结果进行对比,ELM分类器选取隐层神经元个数为20的情况,其结果如表1所示。
表1 ELM分类器与各个分类模型结果对比
随机森林算法RF和梯度提升树算法GBDT都是基于集成思想的分类模型,本发明基于集成学习中的Adaboost算法构建集成AdaELM集成预测分类器,利用测试集采用上述三种方法进行预测,结果如表2所示。
表2 AdaELM分类器与各个集成模型结果对比
由表2中的数据可知,与随机森林RF和梯度提升树GBDT这种同样基于集成思想的分类算法相比,本发明利用Adaboost算法集成多个ELM分类器后获得AdaELM集成预测分类器,预测分类结果会有所提升,在这三种算法中,AdaELM集成预测分类器的预测效果最好,预测准确度高达82.61%,AUC值也高达0.84。从单一的ELM分类器的角度来看,集成后的分类器对测试集的准确度都有所提升:AdaELM集成预测分类器的准确度提升了10.8%,AUC值提升了10.8%。在这三种算法中,最终证实AdaELM分类器的预测效果最好,预测准确度高达82.61%,AUC值也高达0.84,是应力腐蚀开裂预测的最佳分类器。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种应力腐蚀开裂预测方法,其特征在于,所述方法包括:
步骤S1:构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
步骤S2:根据所述历史数据集确定训练集和测试集;
步骤S3:根据所述训练集确定最优ELM分类器个数m;
步骤S4:根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
步骤S5:采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
步骤S6:获取待测试样本数据;
步骤S7:将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
2.根据权利要求1所述的应力腐蚀开裂预测方法,其特征在于,所述根据所述历史数据集确定训练集和测试集,具体包括:
步骤S21:将所述历史数据集划分模型输入数据集和模型输出数据集;
步骤S22:对所述模型输入数据集进行对数变换,获得对数数据集;
步骤S23:对所述对数数据集进行归一化处理,获得归一化数据集;
步骤S24:根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
3.根据权利要求2所述的应力腐蚀开裂预测方法,其特征在于,所述根据所述训练集和所述测试集确定最优ELM分类器个数,具体包括:
步骤S31:将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
步骤S32:将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
步骤S33:利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
步骤S34:绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
4.根据权利要求1所述的应力腐蚀开裂预测方法,其特征在于,所述根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器,具体包括:
步骤S41:初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
步骤S42:从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
步骤S43:将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
步骤S44:判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“步骤S45”;如果k小于设定值Q,则令k=k+1,返回“步骤S42”;
步骤S45:选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
步骤S46:基于所述测试集确定第i个ELM分类器对应的权重;
步骤S47:根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
步骤S48:判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“步骤S42”。
5.根据权利要求4所述的应力腐蚀开裂预测方法,其特征在于,所述基于所述测试集确定第i个ELM分类器对应的权重,具体包括:
步骤S461:将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
步骤S462:将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
步骤S463:根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
6.一种应力腐蚀开裂预测***,其特征在于,所述***包括:
历史数据集构建模块,用于构建历史数据集;所述历史数据集包括温度、氯离子浓度、氧浓度和应力腐蚀开裂的实际分类结果;
训练集和测试集确定模块,用于根据所述历史数据集确定训练集和测试集;
最优ELM分类器个数确定模块,用于根据所述训练集确定最优ELM分类器个数m;
分类器确定模块,用于根据所述最优ELM分类器个数m、所述训练集和所述测试集确定m个分类器;
AdaELM集成预测分类器确定模块,用于采用集成学习中的Adaboost算法,将m个ELM分类器进行叠加,获得AdaELM集成预测分类器;
获取模块,用于获取待测试样本数据;
预测模块,用于将所述待测试样本数据输入所述AdaELM集成预测分类器进行预测,获得应力腐蚀开裂预测结果。
7.根据权利要求6所述的应力腐蚀开裂预测***,其特征在于,所述训练集和测试集确定模块,具体包括:
第一集合划分单元,用于将所述历史数据集划分模型输入数据集和模型输出数据集;
对数变换单元,用于对所述模型输入数据集进行对数变换,获得对数数据集;
归一化处理单元,用于对所述对数数据集进行归一化处理,获得归一化数据集;
第二集合划分单元,用于根据所述归一化数据集和所述模型输出数据集划分成训练集和测试集;所述训练集包括:训练输入集和训练输出集;所述测试集包括:测试输入集和测试输出集。
8.根据权利要求7所述的应力腐蚀开裂预测***,其特征在于,所述最优ELM分类器个数确定模块,具体包括:
第一训练单元,用于将所述训练集输入到ELM极限学习机进行训练,获得M个ELM分类器;
预测单元,用于将所述测试集中的测试输入集输入各所述ELM分类器进行预测,获得各所述ELM分类器对应的预测输出集;
准确率确定单元,用于利用Python中的sklearn.metircs库,计算所述预测输出集与各所述ELM分类器对应的测试输出集之间的准确率;
最优ELM分类器个数选取单元,用于绘制所述准确率与ELM分类器个数的关系折线图,确定最高准确率对应的ELM分类器个数作为最优ELM分类器个数m,其中,1≤m≤M。
9.根据权利要求6所述的应力腐蚀开裂预测***,其特征在于,所述分类器确定模块,具体包括:
初始化单元,用于初始化i=1,k=1,并给定第i个ELM分类器对应的各训练样本的初始权重;
抽样单元,用于从所述训练集中分别有放回地循环随机抽样,获得N个训练样本;
第二训练单元,用于将N个训练样本按照所述初始权重输入ELM极限学习机进行训练,获得第k个局部分类器;
第一判断单元,用于判断k是否大于或等于设定值Q;如果k大于或等于设定值Q,则执行“选取单元”;如果k小于设定值Q,则令k=k+1,返回“抽样单元”;
选取单元,用于选取Q个局部分类器中误差最小的局部分类器作为第i个ELM分类器;
分类器权重确定单元,用于基于所述测试集确定第i个ELM分类器对应的权重;
初始权重确定单元,用于根据第i个ELM分类器对应的权重更新各训练样本的初始权重;
第二判断单元,用于判断i是否大于或等于m;如果i大于或等于m,则输出m个ELM分类器;如果i小于m,则令i=i+1,返回“抽样单元”。
10.根据权利要求9所述的应力腐蚀开裂预测***,其特征在于,所述分类器权重确定单元,具体包括:
预测子单元,用于将所述测试集输入第i个ELM分类器进行预测,获得多个第i个ELM分类器对应预测分类结果;
错误率确定子单元,用于将所述训练集中应力腐蚀开裂的实际分类结果与所述预测分类结果进行对比,确定第i个ELM分类器对应的错误率;
分类器权重确定子单元,用于根据第i个ELM分类器对应的错误率确定第i个ELM分类器对应的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011177708.6A CN112257942B (zh) | 2020-10-29 | 2020-10-29 | 一种应力腐蚀开裂预测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011177708.6A CN112257942B (zh) | 2020-10-29 | 2020-10-29 | 一种应力腐蚀开裂预测方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112257942A true CN112257942A (zh) | 2021-01-22 |
CN112257942B CN112257942B (zh) | 2023-11-14 |
Family
ID=74262317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011177708.6A Active CN112257942B (zh) | 2020-10-29 | 2020-10-29 | 一种应力腐蚀开裂预测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257942B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052207A (zh) * | 2021-03-10 | 2021-06-29 | 中国特种设备检测研究院 | 基于Hybrid思想的不锈钢环境开裂判别方法及*** |
CN113138157A (zh) * | 2021-04-08 | 2021-07-20 | 北京科技大学 | 一种铝合金挤压型材应力腐蚀敏感性无损评估方法 |
CN114187977A (zh) * | 2021-12-09 | 2022-03-15 | 中国特种设备检测研究院 | 一种设备材料球化程度预测方法及*** |
CN115879379A (zh) * | 2023-02-16 | 2023-03-31 | 北京华科仪科技股份有限公司 | 一种设备的腐蚀智能监测预警方法及*** |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104050380A (zh) * | 2014-06-26 | 2014-09-17 | 东北大学 | 一种基于Adaboost-PLS-ELM的LF炉终点温度预报方法 |
CN104992184A (zh) * | 2015-07-02 | 2015-10-21 | 东南大学 | 一种基于半监督极限学习机的多类图像分类方法 |
WO2016101182A1 (zh) * | 2014-12-23 | 2016-06-30 | 清华大学 | 基于贝叶斯网络和极限学习机的区间型指标预报方法 |
CN106874934A (zh) * | 2017-01-12 | 2017-06-20 | 华南理工大学 | 基于加权极限学习机集成算法的污水处理故障诊断方法 |
WO2017197626A1 (zh) * | 2016-05-19 | 2017-11-23 | 江南大学 | 改进人工蜂群优化的极限学习机方法 |
CN107688825A (zh) * | 2017-08-03 | 2018-02-13 | 华南理工大学 | 一种改进型的集成加权极限学习机污水处理故障诊方法 |
CN111582534A (zh) * | 2020-03-09 | 2020-08-25 | 华能四川水电有限公司 | 一种基于极限学习机的水力发电预测方法 |
-
2020
- 2020-10-29 CN CN202011177708.6A patent/CN112257942B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104050380A (zh) * | 2014-06-26 | 2014-09-17 | 东北大学 | 一种基于Adaboost-PLS-ELM的LF炉终点温度预报方法 |
WO2016101182A1 (zh) * | 2014-12-23 | 2016-06-30 | 清华大学 | 基于贝叶斯网络和极限学习机的区间型指标预报方法 |
CN104992184A (zh) * | 2015-07-02 | 2015-10-21 | 东南大学 | 一种基于半监督极限学习机的多类图像分类方法 |
WO2017197626A1 (zh) * | 2016-05-19 | 2017-11-23 | 江南大学 | 改进人工蜂群优化的极限学习机方法 |
CN106874934A (zh) * | 2017-01-12 | 2017-06-20 | 华南理工大学 | 基于加权极限学习机集成算法的污水处理故障诊断方法 |
CN107688825A (zh) * | 2017-08-03 | 2018-02-13 | 华南理工大学 | 一种改进型的集成加权极限学习机污水处理故障诊方法 |
CN111582534A (zh) * | 2020-03-09 | 2020-08-25 | 华能四川水电有限公司 | 一种基于极限学习机的水力发电预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052207A (zh) * | 2021-03-10 | 2021-06-29 | 中国特种设备检测研究院 | 基于Hybrid思想的不锈钢环境开裂判别方法及*** |
CN113138157A (zh) * | 2021-04-08 | 2021-07-20 | 北京科技大学 | 一种铝合金挤压型材应力腐蚀敏感性无损评估方法 |
CN114187977A (zh) * | 2021-12-09 | 2022-03-15 | 中国特种设备检测研究院 | 一种设备材料球化程度预测方法及*** |
CN114187977B (zh) * | 2021-12-09 | 2024-07-12 | 中国特种设备检测研究院 | 一种设备材料球化程度预测方法及*** |
CN115879379A (zh) * | 2023-02-16 | 2023-03-31 | 北京华科仪科技股份有限公司 | 一种设备的腐蚀智能监测预警方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN112257942B (zh) | 2023-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257942A (zh) | 一种应力腐蚀开裂预测方法及*** | |
Gunnarsson et al. | Deep learning for credit scoring: Do or don’t? | |
CN113011796B (zh) | 一种基于“层次分析-神经网络”的食用油安全预警方法 | |
Teles et al. | Artificial neural network and Bayesian network models for credit risk prediction | |
Graczyk et al. | Comparative analysis of premises valuation models using KEEL, RapidMiner, and WEKA | |
CN108665339B (zh) | 一种基于主观情感测度的电商产品可靠性指标及其实现方法 | |
Callejón et al. | A System of Insolvency Prediction for industrial companies using a financial alternative model with neural networks | |
CN112989635B (zh) | 基于自编码器多样性生成机制的集成学习软测量建模方法 | |
CN110542819A (zh) | 一种基于半监督dbnc的变压器故障类型诊断方法 | |
Jing et al. | Predicting US bank failures: A comparison of logit and data mining models | |
CN110019822B (zh) | 一种少样本关系分类方法及*** | |
El-Bannany et al. | A robust deep learning model for financial distress prediction | |
Zhao et al. | Reliability analysis of mooring lines for floating structures using ANN-BN inference | |
Mao et al. | Comparative study on prediction of fuel cell performance using machine learning approaches | |
Owusu et al. | A deep learning approach for loan default prediction using imbalanced dataset | |
Ashoori et al. | Compare failure prediction models based on feature selection technique: empirical case from Iran | |
Vallabhaneni et al. | Application of radial basis neural network on damage assessment of structures | |
CN116204825A (zh) | 一种基于数据驱动的生产线设备故障检测方法 | |
Sharma | Application of support vector machines for damage detection in structures | |
Taira et al. | Fault detection in a fluid catalytic cracking process using bayesian recurrent neural network | |
Raza et al. | Application of extreme learning machine algorithm for drought forecasting | |
Yang et al. | An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity | |
Miao et al. | Corroded submarine pipeline degradation prediction based on theory-guided IMOSOA-EL model | |
Belciug et al. | Business Intelligence: Statistics in predicting stock market | |
CN111832942A (zh) | 一种基于机器学习的罪犯改造质量评估*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |