CN112069567B - 基于随机森林和智能算法预测混凝土抗压强度的方法 - Google Patents

基于随机森林和智能算法预测混凝土抗压强度的方法 Download PDF

Info

Publication number
CN112069567B
CN112069567B CN202010787302.3A CN202010787302A CN112069567B CN 112069567 B CN112069567 B CN 112069567B CN 202010787302 A CN202010787302 A CN 202010787302A CN 112069567 B CN112069567 B CN 112069567B
Authority
CN
China
Prior art keywords
compressive strength
concrete
variable
model
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010787302.3A
Other languages
English (en)
Other versions
CN112069567A (zh
Inventor
刘富成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Jiaotou Shiwu Expressway Co ltd
Original Assignee
Hubei Jiaotou Shiwu Expressway Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Jiaotou Shiwu Expressway Co ltd filed Critical Hubei Jiaotou Shiwu Expressway Co ltd
Priority to CN202010787302.3A priority Critical patent/CN112069567B/zh
Publication of CN112069567A publication Critical patent/CN112069567A/zh
Application granted granted Critical
Publication of CN112069567B publication Critical patent/CN112069567B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/13Architectural design, e.g. computer-aided architectural design [CAAD] related to design of buildings, bridges, landscapes, production plants or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Geometry (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Civil Engineering (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Architecture (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Structural Engineering (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于混凝土抗压强度预测领域,并具体公开了一种基于随机森林和智能算法预测混凝土抗压强度的方法。包括:建立混凝土抗压强度指标体系的原始样本集,将训练数集作为随机森林回归模型的输入,以对构成混凝土抗压强度指标体系的影响因素进行重要性评价,并进行特征选择,选出误差最小的影响因素集合作为最优特征变量集,将其作为最小二乘支持向量机模型的输入,混凝土28d抗压强度数值作为输出,对最小二乘支持向量机模型进行训练,并采用测试数集验证训练后的最小二乘支持向量机模型的预测结果;对预测结果进行误差分析。本发明提高了预测模型的精度,使得预测结果更加精确、稳定,可以作为快速预测混凝土抗压强度的有效的工具。

Description

基于随机森林和智能算法预测混凝土抗压强度的方法
技术领域
本发明属于混凝土抗压强度预测领域,更具体地,涉及一种基于随机森林和智能算法预测混凝土抗压强度的方法。
背景技术
近些年来,混凝土结构耐久性设计不足而导致的工程事故频频发生,工程上对混凝土耐久性提出了更高的要求。在我国东北、西北、华北地区混凝土结构长期服役在潮湿寒冷的环境中,冻融循环破坏作为混凝土在寒冷地区的主要问题,已成为国内外研究关注的重点。抗压强度能是评价混凝土耐久性重要指标之一,对混凝土抗压强度能进行预测具有重要的现实价值。
目前,目前国内外学者研究的混凝土耐久性预测方法主要有理论解析、实测分析法、智能算法等。然而经理论研究建立预测模型其推导过程复杂,与实际情况存在一定程度的脱离,适用性不强,传统的混凝土冻融试验方法能够得到具有高精度冻融耐久性的预测结果,但试验研究存在试验周期比较长、工作量比较大、实验误差等多个弊端。况且混凝土的冻融过程伴随着许多不确定性,致使描述混凝土冻融规律的表达方式也具有不确定性,这些不确定性主要来源于测量数据的随机性、***误差以及某些不能确知的不定性。采用一般的统计方法,由于试验观测数据的离散性较大,往往会造成分析结果失真。除此之外,随着智能算法和机器学习的不断发展,也有不少研究将智能算法应用到混凝土抗压强度预测领域,目前常见的算法主要围绕BP神经网络、人工神经网络、RBF神经网络等展开,但这些神经网络智能模型都存在学习速度很慢,网络训练失败的可能性较大和易陷入局部极值等缺点,混凝土抗压强度预测过程存在影响因素众多,用于学习的数据具有复杂的噪声干扰,这些算法在一定程度上满足不了预测精度的要求。
因此,本领域亟需提出一种新的预测混凝土抗压强度的方法,能够筛选出混凝土结构抗压强度的关键影响因素,并以此对混凝土结构抗压强度进行精准快速智能预测。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于随机森林和智能算法预测混凝土抗压强度的方法,其中结合混凝土自身的特征及混凝土抗压强度预测的工艺特点,相应的充分利用了随机森林回归模型能够有效处理有多个指标、噪声干扰的样本数据,筛选有用特征变量的特点,筛选出用于建模的关键变量得到最优变量组合,降低最小二乘支持向量机训练模型的维度,提高预测精度,得到更贴近实际的预测结果,用以解决实际工程中混凝土抗压强度快速预测问题,使得混凝土抗压强度的预测结果更加准确、智能、可靠,预测速度更快。
为实现上述目的,本发明提出了一种基于随机森林和智能算法预测混凝土抗压强度的方法,包括以下步骤:
S1根据影响混凝土抗压强度的原材料和配合比因素构建混凝土抗压强度指标体系,并采集该抗压强度指标体系的样本数据,建立原始样本集,将所述原始样本集按指定比例划分为训练数集和测试数集;
S2将所述训练数集作为随机森林回归模型的输入,以对构成所述混凝土抗压强度指标体系的影响因素进行重要性评价,根据该变量重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集;
S3将所述最优特征变量集作为输入变量,对应混凝土28d抗压强度数值作为输出变量,构建基于最小二乘支持向量机的混凝土抗压强度预测模型,并采用改进粒子群算法对最小二乘支持向量机的核函数和惩罚因子进行优化,其中,改进粒子群采用可变惯性权重的粒子群算法,然后采用所述测试数集验证优化后的混凝土抗压强度预测模型对混凝土抗压强度预测的结果。
作为进一步优选的,步骤S1中,所述抗压强度指标体系包括混凝土抗压强度影响因素和混凝土抗压强度评价指标。
作为进一步优选的,所述混凝土抗压强度影响因素包括水胶比、水泥用量、粉煤灰用量、细集料、粗集料、减水剂、引气剂、水泥强度,所述混凝土抗压强度评价指标包括混凝土28d抗压强度数值。进一步的,所述混凝土抗压强度影响因素中的每个影响因素均构成机森林回归模型中的输入变量,该变量记为特征X。进一步的,每个混凝土抗压强度影响因素和混凝土抗压强度评价指标构成训练数集与测试数集中的样本,相应的数据则作为样本数据。其中,所述训练数集与测试数集中样本总数量的比为2∶1~4∶1。
作为进一步优选的,步骤S2具体包括以下步骤:
S21根据随机森林回归模型中二叉树节点包含的特征数和决策树的棵数构建随机森林回归模型;
S22将所述训练数集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差errOOB1;
S23随机将上述决策树相应的袋外数据中所有样本数据中的某个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差errOOB2;
S24构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价;
S25重复步骤S22至步骤S24,直至输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选;
S26对初步筛选后得到的变量集,利用递归特征后向消除法从该变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的数量。
其中,在计算袋外数据误差时,通过计算Bootsrap抽样中得到的袋外数据误差。在将有变量的变量重要性评价按降序排列时,以可视化指标均方残差减小量(%IncMSE)和模型精确度的减小量(IncNodePurity)初步衡量各变量的重要性,将该重要性作为对应变量的重要性评价,并将所有变量的变量重要性评价按降序排列。
作为进一步优选的,步骤S24中,所述重要性计算模型为:
Importance=∑(errOOB2-errOOB1)/Ntree
其中,Ntree为随机森林回归模型中决策树的棵树。
作为进一步优选的,步骤S3中,可变惯性权重的计算公式为:
Wm=Wmax-(Wmax-Wmin)·(1-e-(5m/t))
其中,W为惯性权重,m为当前进化代数,t为最大迭代代数,Wmax为惯性权重的最大上限,Wmin为惯性权重的最小下限。
作为进一步优选的,步骤S3中,在改进粒子群算法中,种群个体数目设置为10,进化代数设置为100,认知学***均误差率作为适应函数,混凝土原材料和配合比取值范围为约束条件。
作为进一步优选的,步骤S3中,选择高斯核函数构建最小二乘支持向量机的计算模型。将所述最优特征变量集作为最小二乘支持向量机的输入变量,对应混凝土28d抗压强度数值作为输出变量,并采用改进粒子群算法对最小二乘支持向量机的核函数和惩罚因子进行优化,以确定最小二乘支持向量机模型的惩罚参数C和高斯核函数核宽度参数σ2的最优参数组合;基于最优特征变量集采用最优参数组合的最小二乘支持向量机对测试数集进行预测,并输出预测结果以验证优化后的混凝土抗压强度预测模型对混凝土抗压强度预测的结果。
作为进一步优选的,所述高斯核函数表达式如下:
其中,x为输入的变量,xi为第i个样本,xj为第j个样本,σ2为核宽度参数。
作为进一步优选的,本发明方法还包括对所述方法还包括对所述预测结果进行分析,验证优化后的混凝土抗压强度预测模型预测混凝土抗压强度的效果,其具体包括以下步骤:
构建模型性能参数均方根误和拟合优度的计算模型,并采用未进行影响因素特征选择的支持向量机模型以及人工神经网络预测模型的预测结果和对影响因素进行特征选择后的混凝土抗压强度预测模型的预测结果进行误差分析,验证优化后的混凝土抗压强度预测模型预测混凝土抗压强度的效果。
作为进一步优选的,所述模型性能参数均方根误的计算模型为:
所述拟合优度的计算模型为:
其中yobs为样本数据观测值,ypred为混凝土28d抗压强度预测值,为所有样本观测值的平均值,n为样本数。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要具备以下的技术优点:
1.本发明方法充分利用了随机森林能够有效处理有多个指标、噪声干扰的样本数据,筛选有用特征变量的特点,创新性地提高了最小二乘支持向量机模型的预测精度,使得混凝土28d抗压强度的预测结果更加准确、可靠。
2.本发明方法将随机森林与最小二乘支持向量机结合建立混合智能模型,充分利用了不同智能算法的特点,规避了现有方法的缺陷,降低模型维度,加快训练速度且解决了预测结果不稳定的问题,为实现混凝土抗压强度预测提供了一种快捷有效的工具。
3.本发明选用了LSSVM(最小二乘支持向量机)建立预测模型,对传统的SVM进行了改进,RF-LSSVM模型算法(随机森林融合最小二乘支持向量机模型)将复杂的二次规划问题转变为线性方程组的求解,不仅解决了计算复杂度,还能降低错误率,使回归问题得到了更好的解决。
4.本发明通过误差分析验证了随机森林回归模型特征筛选的有效性和正确性。
5.本发明选用高斯核函数不仅性能较好且兼具了径向基核函数的优势,还具有良好的抗干扰能力。
附图说明
图1是本发明优选实施例涉及的一种基于随机森林和智能算法预测混凝土抗压强度的方法的流程图;
图2是本发明优选实施例涉及的一种基于随机森林和智能算法预测混凝土抗压强度的方法中各变量重要性排序示意图,其中,图2中的(a)为以可视化指标均方残差减小量(%IncMSE)衡量各变量重要性排序示意图,图2中的(b)为以模型精确度的减小量(IncNodePurity)衡量各变量重要性排序示意图;
图3是本发明优选实施例涉及的一种基于随机森林和智能算法预测混凝土抗压强度的方法中影响因素相关性大小图;
图4是本发明优选实施例涉及的一种基于随机森林和智能算法预测混凝土抗压强度的方法中不同变量组合时RMSE变化趋势图,其中,横坐标为变量组合个数;
图5是本发明实施例提供的LSSVM模型训练数集拟合结果示意图;
图6是本发明实施例提供的LSSVM模型测试数集预测结果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,本发明实施例提供的一种基于随机森林和智能算法预测混凝土抗压强度的方法,包括以下步骤:
步骤一,根据影响混凝土抗压强度的原材料和配合比因素构建混凝土抗压强度指标体系,并采集该抗压强度指标体系的样本数据,建立原始样本集,将所述原始样本集按指定比例划分为训练数集和测试数集。即基于混凝土材料和配合比,选取影响混凝土抗压强度的主要因素,构建混凝土抗压强度指标体系,收集混凝土抗压强度指标体系对应样本数据,建立原始样本集。所述抗压强度指标体系包括混凝土抗压强度影响因素和混凝土抗压强度评价指标。所述混凝土抗压强度影响因素包括水胶比、水泥用量、粉煤灰用量、细集料、粗集料、减水剂、引气剂、水泥强度,所述混凝土抗压强度评价指标包括混凝土28d抗压强度数值。每个混凝土抗压强度影响因素和混凝土抗压强度评价指标构成训练数集与测试数集中的样本,相应的数据则作为样本数据。所述训练数集与测试数集中样本总数量的比为2∶1~4∶1。优选的,随机将总样本数据的80%为训练数集,用于随机森林回归模型的构建,以选取指标集;剩余20%为测试数集用于最后模型预测性能的评估。
步骤二,将所述训练数集作为随机森林回归模型的输入,以对构成所述混凝土抗压强度指标体系的影响因素进行重要性评价,根据该变量重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集。即,根据随机森林回归模型中二叉树节点包含的特征数和决策树的棵数构建随机森林回归模型;将所述训练数集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差errOOB1;随机将上述决策树相应的袋外数据中所有样本数据中的某个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差errOOB2;构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价;输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选;对初步筛选后得到的变量集,利用递归特征后向消除法从该变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的数量。其中,在计算袋外数据误差时,通过计算Bootsrap抽样中得到的袋外数据误差。在将有变量的变量重要性评价按降序排列时,以可视化指标均方残差减小量(%IncMSE)和模型精确度的减小量(IncNodePurity)初步衡量各变量的重要性,将该重要性作为对应变量的重要性评价,并将所有变量的变量重要性评价按降序排列。
更具体的,步骤二中,首先输入随机森林回归模型的两个参数:二叉树节点包含的特征数mtry和决策树的棵数Ntree,默认情况下mtry=P/3(回归模型),P为变量个数,Ntree=500;建随机森林回归模型并训练数据集。通过计算Bootsrap抽样中得到的袋外(OOB)数据误差,以可视化指标均方残差减小量(%IncMSE)和模型精确度的减小量(IncNodePurity)初步衡量各变量的重要性并作降序排列。进一步,步骤二中,所述将原始样本集作为随机森林模型的输入,经随机森林模型训练进行变量重要性评价,通过递归特征后向剔除法(RFE)对输入变量进行特征选择,选出模型误差最小的最优特征变量集实现随机森林降维包括以下步骤:
(1)变量重要性评价:
对于随机森林中每一棵树,利用相应的袋外数据计算其袋外数据误差,为errOOB1;随机对袋外数据所有样本的特征X加入噪声干扰,再次计算袋外数据误差,为errOOB2;随机森林里有Ntree棵树,则特征X的重要性计算公式为:
Importance=∑(errOOB2-errOOB1)/Ntree (1)
其中,Ntree为随机森林回归模型中决策树的棵树。
(2)重要变量筛选:
对变量重要性评分输出可视化绘图,按降序排列,得出不同变量的重要性强弱程度,初步确定特征集里的重要性度量值较大的影响因素;利用递归特征后向消除(RFE)从指标集中逐次去除相应比例的不重要指标,每次去除得到一个指标集;对比得到的各指标集对应的OOB误差率,将误差率最小的指标集作为最优指标集,确定最优特征的数量。
步骤三,将所述最优特征变量集作为输入变量,对应混凝土28d抗压强度数值作为输出变量,构建基于最小二乘支持向量机的混凝土抗压强度预测模型,并采用改进粒子群算法对最小二乘支持向量机的核函数和惩罚因子进行优化,其中,改进粒子群采用可变惯性权重的粒子群算法,然后采用所述测试数集验证优化后的混凝土抗压强度预测模型对混凝土抗压强度预测的结果。将所述最优特征变量集作为最小二乘支持向量机模型的输入变量,对应混凝土28d抗压强度数值作为输出变量,采用改进粒子群算法进行参数寻优,以确定最小二乘支持向量机模型的惩罚参数C和高斯核函数核宽度参数σ2的最优参数组合;基于最优特征变量集采用最优参数组合的最小二乘支持向量机模型对测试数集进行预测,并输出预测结果以验证训练后的最小二乘支持向量机模型预测混凝土抗压强度的效果。
可变惯性权重的计算公式为:
Wm=Wmax-(Wmax-Wmin)·(1-e-(5m/t)) (2)
其中,W为惯性权重,m为当前进化代数,t为最大迭代代数,Wmax为惯性权重的最大上限,Wmin为惯性权重的最小下限。
其中,混凝土抗压强度预测方法包括:
(1)选择映射能力强、泛化性能优、适用性好的高斯核函数(RBF)建立最小二乘支持向量机(LSSVM)模型,高斯核函数表达式如下:
其中,x为输入的变量,xi为第i个样本,xj为第j个样本,σ2为核宽度参数。
(2)采用改进粒子群算法进行参数寻优,确定模型的惩罚参数C和RBF核函数核宽度参数σ2的最优参数组合;在改进粒子群算法中,种群个体数目设置为10,进化代数设置为100,认知学***均误差率作为适应函数,混凝土原材料和配合比取值范围为约束条件。
所述约束条件的计算模型为:
其中,x1为水胶比,x3为水泥量,x4为粉煤灰,x5为细集料,x6为粗集料,x8为硅灰用量,fcu,k为混凝土立方体抗压强度标准值。
(3)基于最优特征集对样本训练集和测试集进行训练预测,并输出预测结果以实际值和预测值拟合曲线表示。
步骤四,对所述预测结果进行分析,验证训练后的最小二乘支持向量机模型预测混凝土抗压强度的效果。具体为:构建模型性能参数均方根误和拟合优度的计算模型,并采用未进行影响因素特征选择的支持向量机模型以及人工神经网络预测模型的预测结果和对影响因素进行特征选择后的混凝土抗压强度预测模型的预测结果进行误差分析,验证优化后的混凝土抗压强度预测模型预测混凝土抗压强度的效果。
对预测结果进行误差分析包括:
首先,选用模型性能参数均方根误差(RMSE)、拟合优度(R2)来评价模型的预测精度,对输出拟合曲线效果的进一步验证,表达式如下:
其中,yobs为样本数据观测值,ypred为混凝土28d抗压强度预测值,为所有样本观测值的平均值,n为样本数。
其次,选择未进行特征选择的支持向量机以及人工神经网络预测模型的结果与之作对比分析,再次肯定了随机森林回归模型特征筛选的有效性和正确性。
本发明基于混凝土材料和配合比,选取影响混凝土抗压强度的主要因素,构建指标体系,收集对应样本数据,作为随机森林模型的输入;然后基于随机森林回归模型作变量重要性排序,对影响因子进行特征选择,选出最优特征变量集实现降维;接着输入最优特征集,利用参数寻优后的最小二乘支持向量机(LLSVM)建模,训练样本数据,输出混凝土28d抗压强度预测结果,并利用测试集验证模型的预测结果最后对预测结果进行误差分析,选择未进行特征选择的支持向量机以及人工神经网络进行建模,利用相同的误差指标作对比分析,验证该模型的适用性和优越性。本发明将随机森林回归模型特征选择与最小二乘支持向量机结合,能在保证结果准确性的前提下提取关键特征,提高了预测模型的精度,使得预测结果更加精确、稳定,可以作为快速预测混凝土抗压强度的有效的工具。
实施例1
本发明实施例中的基于随机森林和智能算法预测混凝土抗压强度的方法,主要包括以下步骤:
(1)影响因素指标体系样本数据采集
以水水胶比、水泥用量、粉煤灰用量、细集料、粗集料、减水剂、引气剂、水泥强度等8个影响因素,作为输入变量,以某项目七个标段的混凝土抗压强度作为输出变量,选取监测的119组数据作为原始训练集,数据如表1:
表1样本数据
(2)随机森林回归模型特征选择
将全部数据样本划分为容量为95的训练数据集和容量为24的测试数据集两部分,在回归分析中一般默认为mtry为输入影响因素数的1/3,输入mtry=3,Ntree=800,建立随机森林回归模型。
通过R软件中Random Forest程序包来实现Importance函数的重要性评价指标可视化绘图,并将不同变量的重要性降序排列,其排列分布如图2所示,节点纯度的增加值越大(IncNodePurity),说明该变量重要性越强;均方误差增加值越大(IncMSE),说明该变量重要性越强。由图2可知,水胶比、水泥用量、粗集料用量、水泥强度等因素重要性度量值比较大,说明这些变量对混凝土抗压强度大小有较大的影响。
利用Pearson函数分析影响因素与28d抗压强度之间的相关性,对上述的重要性排序做一个验证。调用R软件ggplot2程序包输出绘图结果,如图4所示。Pearson相关系数取值范围为-1到1,圆的颜色越深,直径越大说明两个变量间的Pearson相关系数绝对值越大,则相关性越强,反之,则相关性越弱。由图4可以看出,水胶比、水泥用量、水泥强度与抗压强度的相关性明显高于其他影响因素,与重要性排序图一致。
经过改进粒子群算法重复迭代后得到不同变量组合的RMSE和R2的数值,如表2。
表2不同变量组合时RMSE和R2变化表
Variables RMSE R squared
1 1.1237 0.2922
2 0.9210 0.4867
3 0.7719 0.6551
4 0.6591 0.7805
5 0.6618 0.7897
6 0.6309 0.7994
7 0.6435 0.8071
8 0.6661 0.8024
根据表2作出均方根误差变化趋势折现图,如图4所示。当变量个数达到8个时,均方根误差值达到最小,另一评价指标拟合优度排在第三位,相差不多,此时模型精度最高。利用递归特征消除法(RFE)依托重要性排序,通过交叉组合,不断建立模型,依次剔除不重要变量,直到遍历所有的特征变量,最终得到最佳变量组合。确定最优指标集为水胶比、水泥强度、水泥用量、粗集料用量、粉煤灰用量、引气剂用量将用于最小二乘支持向量机模型的构建。
(3)最小二乘支持向量机建模和评估
随机选取95组数据作为支向量机的训练集,剩余24组数据作为测试集,以水胶比、水泥强度、水泥用量、粗集料用量、粉煤灰用量、引气剂用量6个影响因素作为模型的输入变量,混凝土28d抗压强度作为输出变量。加载R语言中e1071 1.6-7程序,并进行参数寻优,输出寻优结果如表3所示。
表3参数优选表
参数优化的结果为:best c=0.01,best g=100,best performance=0.1900995(最小),输入该参数建立最小二乘支持向量机模型,对训练样本训练拟合结果如图5所示,对测试样本的预测结果如图6所示。从图5可以看出,模拟值和实际值很接近,模拟效果较好。利用训练好的随机森林模型对测试集进行预测,如图6,可以看出随机森林模型测试集上的预测值曲线较贴近真实值。
(4)预测结果评价
为了检验随机森林融合最小二乘支持向量机模型(RF-LLSVM)的优越性,选择未进行特征选择的支持向量机以人工神经网络进行建模并做对比分析,选用公式(5)均方根误差RMSE和公式(6)确定性系数R2和来衡量模型的预测精度,得到误差对比结果如表4。
表4误差比较
从结果显示可以看出RF-LSSVM模型预测结果的均方根误差最接近于0且确定性系数最为接近1,说明RF-LSSVM模型的预测准确率优于单纯的支持向量机与人工神经网络模型,在基于材料和配合比的混凝土抗压强度预测研究领域有良好应用前景。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于随机森林和智能算法预测混凝土抗压强度的方法,其特征在于,包括以下步骤:
S1根据影响混凝土抗压强度的原材料和配合比因素构建混凝土抗压强度指标体系,并采集该抗压强度指标体系的样本数据,建立原始样本集,将所述原始样本集按指定比例划分为训练数集和测试数集;
S2将所述训练数集作为随机森林回归模型的输入,以对构成所述混凝土抗压强度指标体系的影响因素进行重要性评价,根据该重要性评价的结果对影响因素进行特征选择,选出随机森林回归模型误差最小的影响因素集合,并将该影响因素集合作为最优特征变量集;
步骤S2具体包括以下步骤:
S21根据随机森林回归模型中二叉树节点包含的特征数和决策树的棵数构建随机森林回归模型;
S22将所述训练数集作为随机森林回归模型的输入,对于随机森林回归模型中的每一棵决策树,采用该决策树相应的袋外数据计算其袋外数据误差errOOBss1;
S23随机将上述决策树相应的袋外数据中所有样本数据的某个变量作为特征X,并对该特征X加入噪声干扰,然后再次计算该决策树相应的袋外数据误差errOOB2;
S24构建重要性计算模型,并根据所述重要性计算模型对上述特征X进行变量重要性评价;
S25重复步骤S22至步骤S24,直至输出所述训练数集中所有变量的变量重要性评价,然后绘制变量重要性评价的可视化绘图,并将所有变量的变量重要性评价按降序排列,并根据排序结果对变量进行重要性度量的初步筛选;
S26对初步筛选后得到的变量集,利用递归特征后向消除法从该变量集中逐次去除指定比例的变量,每次去除得到一个变量,对比除去该变量后,剩余变量对应的袋外误差率,将误差率最小的变量集作为最优特征变量集,并以此确定最优特征变量集中最优特征的数量;
S3将所述最优特征变量集作为输入变量,对应混凝土28d抗压强度数值作为输出变量,构建基于最小二乘支持向量机的混凝土抗压强度预测模型,并采用改进粒子群算法对最小二乘支持向量机的核函数和惩罚因子进行优化,其中,改进粒子群采用可变惯性权重的粒子群算法,然后采用所述测试数集验证优化后的混凝土抗压强度预测模型对混凝土抗压强度预测的结果;
步骤S1中,所述抗压强度指标体系包括混凝土抗压强度影响因素和混凝土抗压强度评价指标;
所述混凝土抗压强度影响因素包括水胶比、水泥用量、粉煤灰用量、细集料、粗集料、减水剂、引气剂、水泥强度,所述混凝土抗压强度评价指标包括混凝土28d抗压强度数值;
所述方法还包括对所述预测结果进行分析,验证优化后的混凝土抗压强度预测模型预测混凝土抗压强度的效果,其具体包括以下步骤:
构建模型性能参数均方根误和拟合优度的计算模型,并采用未进行影响因素特征选择的支持向量机模型以及人工神经网络预测模型的预测结果和对影响因素进行特征选择后的混凝土抗压强度预测模型的预测结果进行误差分析,验证优化后的混凝土抗压强度预测模型预测混凝土抗压强度的效果。
2.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土抗压强度的方法,其特征在于,步骤S3中,可变惯性权重的计算公式为:
其中,W为惯性权重,m为当前进化代数,t为最大迭代代数,为惯性权重的最大上限,/>为惯性权重的最小下限。
3.根据权利要求2所述的一种基于随机森林和智能算法预测混凝土抗压强度的方法,其特征在于,步骤S3中,在改进粒子群算法中,种群个体数目设置为10,进化代数设置为100,认知学***均误差率作为适应函数,混凝土原材料和配合比取值范围为约束条件。
4.根据权利要求1所述的一种基于随机森林和智能算法预测混凝土抗压强度的方法,其特征在于,所述模型性能参数均方根误的计算模型为:
所述拟合优度的计算模型为:
其中为样本数据观测值,/>为混凝土28d抗压强度预测值,/>为所有样本观测值的平均值,n为样本数。
CN202010787302.3A 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土抗压强度的方法 Active CN112069567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010787302.3A CN112069567B (zh) 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土抗压强度的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010787302.3A CN112069567B (zh) 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土抗压强度的方法

Publications (2)

Publication Number Publication Date
CN112069567A CN112069567A (zh) 2020-12-11
CN112069567B true CN112069567B (zh) 2024-01-12

Family

ID=73660848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010787302.3A Active CN112069567B (zh) 2020-08-07 2020-08-07 基于随机森林和智能算法预测混凝土抗压强度的方法

Country Status (1)

Country Link
CN (1) CN112069567B (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112712861A (zh) * 2021-01-07 2021-04-27 北京明略软件***有限公司 模型构建方法、装置、设备及计算机可读介质
CN113012773A (zh) * 2021-03-11 2021-06-22 华南理工大学 一种内部影响因素下基于宽度学习的水泥强度估测方法
CN113051821B (zh) * 2021-03-24 2023-03-10 临沂大学 一种混凝土抗压强度预测方法及***
CN113109145A (zh) * 2021-03-24 2021-07-13 中国水利水电第七工程局有限公司 模型构建方法及装置和混凝土抗压强度预测方法及装置
CN113067522B (zh) * 2021-03-29 2023-08-01 杭州吉易物联科技有限公司 基于rf-ga-svm算法的升降机输出电压控制方法
CN113159220B (zh) * 2021-05-14 2022-02-15 中国人民解放军军事科学院国防工程研究院工程防护研究所 基于随机森林的混凝土侵彻深度经验算法评价方法和装置
CN113240321A (zh) * 2021-05-31 2021-08-10 中海石油(中国)有限公司 一种基于深度学习的油田类比评价方法及***
CN113283174B (zh) * 2021-06-09 2022-08-30 中国石油天然气股份有限公司 基于算法集成与自控制的储层产能预测方法、***及终端
CN113468803B (zh) * 2021-06-09 2023-09-26 淮阴工学院 一种基于改进的woa-gru洪水流量预测方法及***
CN113486575A (zh) * 2021-06-21 2021-10-08 武汉科技大学 一种地表变形破坏预测预警方法、装置及存储介质
CN113722988B (zh) * 2021-08-18 2024-01-26 扬州大学 定量构效关系模型预测有机物pdms膜-空气分配系数的方法
CN113850024A (zh) * 2021-10-09 2021-12-28 长安大学 一种基于机器学习的钢筋混凝土构件抗撞性能预测方法
CN113868960B (zh) * 2021-10-18 2024-04-16 青岛农业大学 一种基于典型相关森林的土壤重金属特征选取方法及***
CN114496304A (zh) * 2022-01-13 2022-05-13 山东师范大学 抗癌候选药物的admet性质预测方法及***
CN114331221A (zh) * 2022-03-02 2022-04-12 中核华纬工程设计研究有限公司 一种基于机器学习的混凝土工程量指标估算方法
CN114780599A (zh) * 2022-04-06 2022-07-22 四川农业大学 基于小麦品比试验数据的综合分析***
CN115081067B (zh) * 2022-06-17 2023-09-15 中建安装集团有限公司 一种淤泥固化土的强度预测方法及***
CN116385591B (zh) * 2023-06-06 2023-08-15 杭州芯翼科技有限公司 变化趋势图的显示方法、装置和设备
CN117422156B (zh) * 2023-12-19 2024-03-22 南京农业大学 一种森林生态***碳储功能评估方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231057A (zh) * 2011-03-04 2011-11-02 江苏大学 基于混沌粒子群优化的赖氨酸发酵过程软测量方法
CN107330555A (zh) * 2017-06-30 2017-11-07 红云红河烟草(集团)有限责任公司 一种基于随机森林回归的制丝过程参数赋权方法
CN107368913A (zh) * 2017-06-15 2017-11-21 中国汽车技术研究中心 一种基于最小二乘支持向量机的油耗预测方法
EP3255593A1 (en) * 2016-06-08 2017-12-13 Essentia Analytics Ltd. Performance analysing and forecasting system
CN108764305A (zh) * 2018-05-14 2018-11-06 浙江大学 一种改进的群智能机器学习故障诊断***
CN111260201A (zh) * 2020-01-13 2020-06-09 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN111488713A (zh) * 2020-04-14 2020-08-04 中国交通建设股份有限公司吉林省分公司 一种混凝土早期碳化预测的方法、预测***及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10371740B2 (en) * 2017-05-31 2019-08-06 University Of Tennessee Research Foundation Power system disturbance localization using recurrence quantification analysis and minimum-volume-enclosing ellipsoid
WO2020000248A1 (zh) * 2018-06-27 2020-01-02 大连理工大学 一种基于空间重构的航空发动机过渡态加速过程关键性能参数预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231057A (zh) * 2011-03-04 2011-11-02 江苏大学 基于混沌粒子群优化的赖氨酸发酵过程软测量方法
EP3255593A1 (en) * 2016-06-08 2017-12-13 Essentia Analytics Ltd. Performance analysing and forecasting system
CN107368913A (zh) * 2017-06-15 2017-11-21 中国汽车技术研究中心 一种基于最小二乘支持向量机的油耗预测方法
CN107330555A (zh) * 2017-06-30 2017-11-07 红云红河烟草(集团)有限责任公司 一种基于随机森林回归的制丝过程参数赋权方法
CN108764305A (zh) * 2018-05-14 2018-11-06 浙江大学 一种改进的群智能机器学习故障诊断***
CN111260201A (zh) * 2020-01-13 2020-06-09 北京科技大学 一种基于分层随机森林的变量重要性分析方法
CN111488713A (zh) * 2020-04-14 2020-08-04 中国交通建设股份有限公司吉林省分公司 一种混凝土早期碳化预测的方法、预测***及存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
基于GRA-RFR的油气集输管道内腐蚀速率预测;骆正山;宋莹莹;毕傲睿;;材料保护(第03期);全文 *
基于空间聚类的杉木生长预测方法;张英凯;刘鹏举;刘长春;任怡;;林业科学(第11期);全文 *
基于随机森林――递归特征消除的道路交通事故成因分析;黄卫卫;;电脑知识与技术(第14期);全文 *
拱坝变形监测预报的随机森林模型及应用;罗浩;郭盛勇;包为民;;南水北调与水利科技(第06期);全文 *
改进的多类支持向量机递归特征消除在癌症多分类中的应用;黄晓娟;张莉;;计算机应用(第10期);全文 *
改进随机森林算法在Android恶意软件检测中的应用;吴非;吴向前;陈晓燕;;新疆大学学报(自然科学版)(第03期);全文 *

Also Published As

Publication number Publication date
CN112069567A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
CN112069567B (zh) 基于随机森林和智能算法预测混凝土抗压强度的方法
CN111985796B (zh) 基于随机森林和智能算法预测混凝土结构耐久性的方法
AU2020101854A4 (en) A method for predicting concrete durability based on data mining and artificial intelligence algorithm
CN112070356B (zh) 一种基于rf-lssvm模型预测混凝土抗碳化性能的方法
CN110544011B (zh) 一种智能化的体系作战效能评估和优化方法
CN112069656B (zh) 基于lssvm-nsgaii耐久性混凝土配合比多目标优化的方法
CN112016244B (zh) 基于svm与智能算法的耐久性混凝土多目标配合比优化方法
CN111488713A (zh) 一种混凝土早期碳化预测的方法、预测***及存储介质
CN107292502B (zh) 一种配电网可靠性评估方法
CN111507518A (zh) 一种基于随机森林的小波神径网络混凝土抗渗预测的方法
CN113469426A (zh) 基于改进bp神经网络的光伏输出功率预测方法及***
CN112926795A (zh) 一种基于sbo优化cnn的高层住宅建筑群热负荷预测方法及***
CN109190839B (zh) 一种融合风向的铁路沿线风速智能滚动预测方法
CN112765902B (zh) 一种基于TentFWA-GD的RBF神经网络的农村生活污水处理过程中COD浓度的软测量建模方法
CN113094988A (zh) 一种基于数据驱动的浆液循环泵运行优化方法及***
CN111967183A (zh) 一种配电网台区线损的计算方法和***
CN111292124A (zh) 一种基于优化组合神经网络的需水预测方法
CN114119273A (zh) 一种园区综合能源***非侵入式负荷分解方法及***
CN110264006B (zh) 基于混沌萤火虫算法和贝叶斯网络的风电功率概率性预测方法
CN115221793A (zh) 一种隧道围岩变形预测方法及装置
CN114578087A (zh) 基于非支配排序和随机模拟算法的风速不确定性度量方法
CN117935988A (zh) 基于支持向量回归的再生粗骨料混凝土抗压强度预测方法
CN113762602A (zh) 一种风电场短期风速预测方法
Jinlian et al. Long and medium term power load forecasting based on a combination model of GMDH, PSO and LSSVM
CN116029183A (zh) 一种基于iPSO-LSTM模型的动力电池温度预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant