CN117235510A

CN117235510A - 节理粗糙度预测方法与节理粗糙度预测模型训练方法

Info

Publication number: CN117235510A
Application number: CN202311255874.7A
Authority: CN
Inventors: 冯兴隆; 李争荣; 刘明武; 甘登俊; 苏岩; 黄恒; 沙文忠; 林杭; 谢世杰; 曹日红; 高如高; 朱雄鹏; 王泽越; 汤艺; 陈怡帆; 潘镜桓
Original assignee: Yunnan Diqing Nonferrous Metals Co ltd; Central South University
Current assignee: Yunnan Diqing Nonferrous Metals Co ltd; Central South University
Priority date: 2023-09-26
Filing date: 2023-09-26
Publication date: 2023-12-15

Abstract

本申请实施例提供了一种节理粗糙度预测方法与节理粗糙度预测模型训练方法，其中，节理粗糙度预测模型训练方法，包括：获取m个初始训练样本，每个初始训练样本包括n个粗糙度参数指标和粗糙度标签；对m个初始训练样本进行主成分分析，得到k个主成分特征向量；基于k个主成分特征向量处理m个初始训练样本，得到m个目标训练样本；使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型。本申请实施例针对不同节理的粗糙度系数的预测有着较高的精度和较广的适用性。

Description

节理粗糙度预测方法与节理粗糙度预测模型训练方法

技术领域

本申请涉及岩石工程技术领域，尤其涉及一种节理粗糙度预测方法与节理粗糙度预测模型训练方法。

背景技术

岩石节理是天然岩石在外力和地质力的长期作用下形成的一种自然缺陷，严重影响岩石的力学行为和结构稳定性。大量工程实践表明，节理抗剪强度对于自然地质灾害(如断层运动、滑坡和地震)的预测和大型地质工程结构(如地下洞室、矿山、地基和废物储存库)的稳定性评估非常重要。

节理粗糙度系数(Joint Roughness Coefficient，JRC)是决定节理抗剪强度的重要因素，相关技术中存在利用统计参数法来确定JRC的方式，即通过建立粗糙度统计参数和JRC之间的关系式来计算JRC。然而，由大量粗糙度统计参数组成的评价指标体系是一个具有大量重叠信息的非线性***，受制于非线性关系和节理多样性的影响，现有的JRC确定方式存在关系式拟合复杂，适用性较差的问题。

发明内容

本申请实施例提供一种节理粗糙度预测方法与节理粗糙度预测模型训练方法，以解决相关技术中JRC确定方式所存在的关系式拟合复杂，适用性较差的问题。

为了解决上述技术问题，本申请是这样实现的：

第一方面，本申请实施例提供了一种节理粗糙度预测模型训练方法，包括：

获取m个初始训练样本，每个初始训练样本包括n个粗糙度参数指标和粗糙度标签，m和n均为大于1的整数；

对m个初始训练样本进行主成分分析，得到k个主成分特征向量，k为正整数；

基于k个主成分特征向量处理m个初始训练样本，得到m个目标训练样本，每个目标训练样本包括k个目标指标和粗糙度标签，目标指标为通过主成分特征向量对粗糙度参数指标处理得到；

使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，初始XGBoost模型用于接收目标训练样本，输出预测粗糙度，并根据预测粗糙度和粗糙度标签调整网络参数，智能优化算法模型用于调整初始XGBoost模型的超参数。

第二方面，本申请实施例还提供了一种节理粗糙度预测方法，其特征在于，包括：

获取待预测样本，待预测样本包括n个粗糙度参数指标，n为大于1的整数；

使用k个主成分特征向量处理待预测样本，得到预处理样本，k个主成分特征向量为基于主成分分析得到，k为正整数；

将预处理样本输出至节理粗糙度预测模型，输出得到节理粗糙度系数，节理粗糙度预测模型为通过第一方面所示的方法训练得到。

第三方面，本申请实施例还提供了一种节理粗糙度预测模型训练装置，包括：

第一获取模块，用于获取m个初始训练样本，每个初始训练样本包括n个粗糙度参数指标和粗糙度标签，m和n均为大于1的整数；

主成分分析模块，用于对m个初始训练样本进行主成分分析，得到k个主成分特征向量，k为正整数；

第一处理模块，用于基于k个主成分特征向量处理m个初始训练样本，得到m个目标训练样本，每个目标训练样本包括k个目标指标和粗糙度标签，目标指标为通过主成分特征向量对粗糙度参数指标处理得到；

训练模块，用于使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，初始XGBoost模型用于接收目标训练样本，输出预测粗糙度，并根据预测粗糙度和粗糙度标签调整网络参数，智能优化算法模型用于调整初始XGBoost模型的超参数。

第四方面，本申请实施例还提供了一种节理粗糙度预测装置，包括：

第二获取模块，用于获取待预测样本，待预测样本包括n个粗糙度参数指标，n为大于1的整数；

第二处理模块，用于使用k个主成分特征向量处理待预测样本，得到预处理样本，k个主成分特征向量为基于主成分分析得到，k为正整数；

预测模块，用于将预处理样本输出至节理粗糙度预测模型，输出得到节理粗糙度系数，节理粗糙度预测模型为通过第一方面所示的方法训练得到。

第五方面，本申请实施例还提供了一种电子设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述的方法。

第六方面，本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述的方法。

本申请实施例提供的节理粗糙度预测模型训练方法，针对初始训练样本中的粗糙度参数指标进行主成分分析，可以找出影响节理粗糙度的关键因素，使得得到的目标训练样本中的目标指标既不丢失节理粗糙度的模糊信息，又最大程度地保留了节理粗糙度的原始信息；目标训练样本用于对预先建立的初始机器学习模型进行训练以得到节理粗糙度预测模型，其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，利用全局优化能力强、收敛准确、速度快的智能优化算法模型对初始XGBoost模型中的超参数进行优化，从而达到提高节理粗糙度预测模型预测性能和运行效率的目的，而节理粗糙度预测模型作为训练得到的机器学习模型，能够突破传统经验回归模型的局限性，对表征多维变量之间的非线性关系具有很强的鲁棒性，针对不同节理的粗糙度预测也有着较广的适用性；除此以外，通过主成分分析，通常也能够使得目标训练样本中的目标指标的维度有所降低，有助于解决数据稀疏化问题，提升训练得到的节理粗糙度预测模型的泛化能力，更好地适应不同类型节理的节理粗糙度系数的预测。

附图说明

图1为本申请实施例提供的节理粗糙度预测模型训练方法的流程示意图；

图2为一个应用例中节理粗糙度预测模型的训练过程的流程示意图；

图3为本申请实施例提供的节理粗糙度预测方法的流程示意图；

图4为本申请实施例提供的节理粗糙度预测模型训练装置的结构示意图。

具体实施方式

为使本申请要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。在下面的描述中，提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本申请的实施例。因此，本领域技术人员应该清楚，可以对这里描述的实施例进行各种改变和修改而不脱离本申请的范围和精神。另外，为了清楚和简洁，省略了对已知功能和构造的描述。

除非另作定义，本申请中使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样，“一个”或者“一”等类似词语也不表示数量限制，而是表示存在至少一个。

如图1所示，本申请实施例提供的节理粗糙度预测模型训练方法，包括：

步骤101，获取m个初始训练样本，每个初始训练样本包括n个粗糙度参数指标和粗糙度标签，m和n均为大于1的整数；

步骤102，对m个初始训练样本进行主成分分析，得到k个主成分特征向量，k为正整数；

步骤103，基于k个主成分特征向量处理m个初始训练样本，得到m个目标训练样本，每个目标训练样本包括k个目标指标和粗糙度标签，目标指标为通过主成分特征向量对粗糙度参数指标处理得到；

步骤104，使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，初始XGBoost模型用于接收目标训练样本，输出预测粗糙度，并根据预测粗糙度和粗糙度标签调整网络参数，智能优化算法模型用于调整初始XGBoost模型的超参数。

本申请实施例提供的节理粗糙度预测模型训练方法，针对初始训练样本中的粗糙度参数指标进行主成分分析，可以找出影响节理粗糙度的关键因素，使得得到的目标训练样本中的目标指标既不丢失节理粗糙度的模糊信息，又最大程度地保留了节理粗糙度的原始信息；目标训练样本用于对预先建立的初始机器学习模型进行训练以得到节理粗糙度预测模型，其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，利用全局优化能力强、收敛准确、速度快的智能优化算法模型对初始XGBoost模型中的超参数进行优化，从而达到提高节理粗糙度预测模型预测性能和运行效率的目的，而节理粗糙度预测模型作为训练得到的机器学习模型，能够突破传统经验回归模型的局限性，对表征多维变量之间的非线性关系具有很强的鲁棒性，针对不同节理的粗糙度预测也有着较广的适用性；除此以外，通过主成分分析，通常也能够使得目标训练样本中的目标指标的维度有所降低，有助于解决数据稀疏化问题，提升训练得到的节理粗糙度预测模型的泛化能力，更好地适应不同类型节理的节理粗糙度系数(Joint Roughness Coefficient，JRC)的预测。

本申请实施例提供的节理粗糙度预测模型训练方法，可以应用于例如个人电脑、工控机、移动终端或者服务器等类型的电子设备，此处不作具体限定，为便于描述，下文实施例中将主要以电子设备作为方法的执行主体进行描述。

在步骤101中，电子设备可以获取m个初始训练样本，每个初始训练样本包括n个粗糙度参数指标和粗糙度标签。

对初始训练样本，可以通过对节理相关数据进行测量或者统计得到，比如，可以预先建立多个数字化节理剖面的数据集，各数字化节理剖面可以包括10个标准轮廓线，基于这些标准轮廓线得到例如平均相对高度、最大相对高度或者高度标准差等类型的粗糙度统计参数，这些粗糙度统计参数可以作为上述的粗糙度参数指标，每个数字化节理剖面可以对应有上述的n个粗糙度参数指标，而各数字化节理剖面通过各类现有的定量方法测量出相应的JRC，这些测量的JRC可以作为对应的粗糙度标签。组合数字化节理剖面对应的n个粗糙度参数指标和粗糙度标签，可以得到相应的初始训练样本。

在一些示例中，n个粗糙度参数指标可以包括以下指标中的至少两者，平均相对高度、最大相对高度、高度标准差、平均倾角、倾角标准差、坡度均方根、粗糙度剖面指数和剖面结构函数。

结合一些应用场景，n个粗糙度参数指标可以包括上述的8个指标，其中，平均相对高度记为R_ave、最大相对高度记为R_max、高度标准差记为SD_h、平均倾角记为i_ave、倾角标准差记为SD_i、坡度均方根记为Z₂、粗糙度剖面指数记为R_p、剖面结构函数记为SF，通过这些指标来表征岩石节理剖面的粗糙度特征。以上粗糙度参数指标的定义如下：

其中，在式(1)～(8)中，h_ave为节理剖面上的平均高度，L为节理剖面在水平方向上的长度，y_max为节理剖面在高度方向上的最大高度坐标，y_min为节理剖面在高度方向上的最小高度坐标，N为将节理剖面分成的节点总数，n为节点的编号(和上文中粗糙度参数指标n不是同一个概念)，(x_n,y_n)是第n个节点的坐标。

由粗糙度统计参数(对应n个粗糙度参数指标)组成的指标体系是一个具有大量重叠信息的非线性***，由于计算公式的复杂性而难以应用。因此，可以参数选择和计算方法两方面入手，以达到合理预测JRC的目的。鉴于此，本申请引入主成分分析实现参数降维，有效剥离交叉信息。

具体地，在步骤102中，电子设备可以对m个初始训练样本进行主成分分析，得到k个主成分特征向量。

在一些实施方式中，主成分分析的步骤可以采用主成分分析方法(PrincipalComponent Analysis，PCA)，比如基于特征值分解协方差矩阵实现的PCA算法，或者基于奇异值分解(singular value decomposition，SVD)协方差矩阵实现的PCA算法等等。

在一个实施例中，上述步骤102可以包括：

步骤S1，根据m个初始训练样本以及各个初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵；

步骤S2，根据原始数据矩阵构建相关系数矩阵；

步骤S3，求解相关系数矩阵的特征根和特征向量；

步骤S4，根据相关系数矩阵的特征根和特征向量确定k个主成分特征向量。

为便于说明，对于第i个初始训练样本中的第j个粗糙度参数指标可以记为x_ij，其中，i＝1,2,3,…,m；j＝1,2,3,…,n。在步骤S1中，构建的m×n阶的原始数据矩阵X_m×n可以记为：

在一些实施方式中，在进行主成分分析之前，可以对n个粗糙度参数指标中的任两个粗糙度参数指标之间的相关系数进行计算，如果任两个粗糙度参数指标之间的相关系数均大于系数阈值的情况下，则根据m个初始训练样本以及各个初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵。

结合一些示例，任两个粗糙度参数指标之间的相关系数可以是KMO(Kaiser-Meyer-Olkin)指数，KMO的计算方式可以如下：

其中，公式(10)中的i和j分别代表两个不同的粗糙度参数指标(与式(9)中的定义不同)，r_ij为两个粗糙度参数指标之间的相关性，p_ij为两个粗糙度参数指标之间的偏相关性。

当KMO的值大于系数阈值，例如0.6或者其他预设值的情况下，可以认为以上两个粗糙度参数指标可以进行主成分分析。类似地，对于其他的两个粗糙度参数指标之间的组合，也可以通过类似的方式去计算KMO，并根据KMO的计算结果，来判定是否进行主成分分析。

在一个实施例中，在步骤S2，根据原始数据矩阵构建相关系数矩阵时，可以对上述的原始数据矩阵X_m×n进行归一化处理，以克服原始数据量级与量纲差异导致的大数淹没小数的问题，并可以保证计算精度并加快后续模型训练的速度。

在一个实施方式中，针对原始数据矩阵X_m×n的归一化处理包括归一化和标准化两层处理过程，经过标准化处理后的粗糙度参数指标的均值为0，方差为1，归一化的公式如式(11)所示：

其中，x_ij ^*为x_ij的归一化值，μ_j为均值，σ_i为方差。

对原始数据矩阵X_m×n进行归一化和标准化处理后得到的矩阵，可以记为标准化矩阵X^* _m×n，具体的表达式可以为：

在一个实施方式中，步骤S2，根据原始数据矩阵构建相关系数矩阵可以按照如下公式进行计算：

其中，R_m×n为相关系数矩阵，X^*为标准化矩阵，X^*T为标准化矩阵的转置矩阵。

当然，在其他一些可行的实施方式中，式(13)中计算相关系数矩阵时所采用的系数也可以根据需要进行调整。

在步骤S3中，电子设备可以求解相关系数矩阵的特征根和特征向量。

在一个实施方式中，电子设备可以利用拉格朗日乘子法求解R_m×n的特征根和特征向量：

|R_m×n-λE|＝0 (14)

其中，E为单位矩阵。

针对R_m×n所求得的特征根可以记为λ₁、λ₂、λ₃、…、λ_n，求得的特征向量可以记为u₁、u₂、u₃、…、u_n。

步骤S4，电子设备可以根据相关系数矩阵的特征根和特征向量确定k个主成分特征向量。

在一个实施例中，步骤S4可以包括：

将相关系数矩阵的全部特征根按从大到小的顺序排列，确地各个特征根分别对应的方差贡献率；

按照全部特征根的排列顺序，依次对方差贡献率进行累加；

在累加的方差贡献率的值首次大于预设阈值的情况下，获取累加的k个方差贡献率所对应的k个特征根；

将k个特征根分别对应的k个特征向量确定为k个主成分特征向量。

在完成全部特征根按从大到小的顺序排列的情况下，对于排序中的第j个特征根λ_j，对应的方差贡献率η_j可以按如下方式计算：

按照全部特征根的排列顺序，依次对方差贡献率进行累加，累加k个方差贡献率可以得到η_j(k)，公式如下：

当η_j(k)的值首次大于预设阈值时，可以提取累加所使用的k个特征根，并得到k个特征根分别对应的k个特征向量，分别记为u₁、u₂、u₃、…、u_k，这k个特征向量则可以确定为k个主成分特征向量。

步骤103中，电子设备可以基于k个主成分特征向量处理m个初始训练样本，得到m个目标训练样本。在一个实施例中，步骤103可以具体包括：

根据各初始训练样本所包括的n个粗糙度参数确定行向量，将各主成分特征向量作为列向量，并通过点乘得到目标训练样本。

在一些实施方式中，电子设备可以直接使用初始训练样本对应的原始数据矩阵X_m×n和主成分特征向量来计算得到目标训练样本，或者，电子设备也可以使用原始数据矩阵X_m×n归一化处理得到的标准化矩阵X^* _m×n和主成分特征向量来计算得到目标训练样本。

作为一个示例性说明，后续将主要以根据标准化矩阵X^* _m×n和主成分特征向量来计算得到目标训练样本的例子进行说明。

针对k个主成分特征向量u₁、u₂、u₃、…、u_k，可以分别作为列向量并组合得到成分得分系数矩阵U_n×k，对X^* _m×n和U_n×k进行点乘，可以得到主成分矩阵Z_m×k，公式为：

Z_m×k＝X^* _m×nU_n×k (17)

可见，主成分矩阵Z_m×k中共m行数据，每一行对应一个目标训练样本，每一行有k个数据，这k个数据对应了一个目标训练样本中的k个目标指标。基于式(17)可知，X^* _m×n中每一行的n个粗糙度参数可以确定行向量，U_n×k中每一列对应一个主成分特征向量，并可以确定为列向量，通过行向量和列向量的点乘，可以得到相应的目标训练样本。相应地，目标指标为通过主成分特征向量对归一化后的粗糙度参数指标处理得到，而目标训练样本同样可以包括上述的粗糙度标签。

在步骤104中，电子设备可以使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型。

其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，在一些示例中，智能优化算法可以是白鲨优化算法(White Shark Optimizer,WSO)、鲸鱼算法或者差分进化算法等等，为简化描述，下文中将主要以智能优化算法为WSO为例进行说明。而包括初始XGBoost模型和WSO算法的初始机器学习模型可以称为未得到训练的WSO-XGB模型，节理粗糙度预测模型称为得到充分训练的WSO-XGB模型。

在WSO-XGB模型的训练过程中，对于初始XGBoost模型本身来说，其可以接收目标训练样本，输出预测粗糙度，并根据预测粗糙度和粗糙度标签调整自身网络参数。WSO模型可以对初始XGBoost模型的超参数进行调整，例如对初始XGBoost模型的最大迭代数、深度和学习率中的至少一者进行调整。至于WSO模型的参数，例如种群数或者最大迭代数等则可以在训练前预先设置。

在一些实施方式中，步骤104，使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，包括：

将m个目标训练样本分为训练集和测试集；

使用训练集训练预先建立的初始机器学习模型，得到节理粗糙度预测模型；

使用测试集评价节理粗糙度预测模型的性能。

同样以初始机器学习模型为未得到训练的WSO-XGB模型为例，下面结合一个具体应用例对训练过程进行说明。如图2所示，图2为节理粗糙度预测模型的训练过程的流程示意图。

电子设备中可以建立有与节理相关的数据库，为了建立全面的数据库，除了10个标准轮廓线外，还可以从已有公开的数据库中收集多个数字化节理剖面。这些节理的投影长度从72到119.6mm不等，并且节理剖面覆盖了广泛的岩石类型，包括砂岩、石灰岩、大理石、花岗岩、片麻岩、板岩、白云岩和粉砂岩。这八种岩石分别对应岩浆岩、变质岩和沉积岩。将直剪试验结果代入现有的JRC计算公式进行反算，得到这些剖面的JRC值。基于以上数字化节理轮廓，分别计算平均相对高度(R_ave)、最大相对高度(R_max)、高度标准差(SD_h)、平均倾角(i_ave)、倾角标准差(SD_i)、坡度均方根(Z₂)、粗糙度剖面指数(R_p)、剖面结构函数(SF)等8个粗糙度统计参数。以上8个粗糙度统计参数可以作为初始训练样本的粗糙度参数指标，计算得到的JRC值可以作为初始训练样本的粗糙度标签。

针对初始训练样本的集合进行主成分分析处理，可以得到目标训练样本，具体的实现过程在上文实施例中进行了详细介绍，此处不作重复说明。在该应用例中，目标训练样本中的目标指标的数量可以为2个，分别记为F₁和F₂。

为避免模型训练过程中出现过拟合问题，可以将目标训练样本随机分为两组，即训练集和测试集，其中，训练集可以占90％，测试集可以占10％，当然，训练集和测试集的比例可以根据实际需要进行调整。

训练集可以输入到初始XGBoost模型(对应XGB模型)，根据训练集中所携带的粗糙度标签和初始XGBoost模型自身输出的预测粗糙度进行网络参数调整，而WSO模型可以对初始XGBoost模型的超参数进行调整。WSO模型和初始XGBoost模型可以构成未训练的WSO-XGB模型，在WSO-XGB模型训练过程中，模型中的损失函数收敛时，可以认为满足训练要求，得到最终WSO-XGB模型，即上述的节理粗糙度预测模型，以用于在实际应用中预测JRC。测试集可以评价节理粗糙度预测模型的性能。

基于以上应用例，本申请实施例提供的节理粗糙度预测模型训练方法，获取节理的粗糙度统计参数，建立了初始训练样本的数据库。初始训练样本包含8个输入变量和1个输出变量(JRC)。引入主成分分析对指标体系进行降维，提取两个独立的主成分(对应目标指标)，解决粗糙度表征的重叠问题。然后，引入WSO算法对XGBoost模型进行优化，提出一种混合机器学习预测模型(即WSO-XGB模型)对JRC进行预测。在提取两个主成分的基础上，利用建立的数据库对WSO-XGB模型进行训练和测试。与经验模型相比，该WSO-XGB模型采用数据驱动的，不仅能进行特征提取，而且具有较强的学习能力，从而使预测结果更加可靠，对JRC的预测精度得到了有效提高，并且具有较好的泛化能力。

如图3所示，本申请实施例还提供了一种节理粗糙度预测方法，包括：

步骤301，获取待预测样本，待预测样本包括n个粗糙度参数指标，n为大于1的整数；

步骤302，使用k个主成分特征向量处理待预测样本，得到预处理样本，k个主成分特征向量为基于主成分分析得到，k为正整数；

步骤303，将预处理样本输出至节理粗糙度预测模型，输出得到节理粗糙度系数，节理粗糙度预测模型为通过上文实施例提供的节理粗糙度预测模型训练方法训练得到。

本申请实施例中，节理粗糙度预测模型为基于上文实施例提供的节理粗糙度预测模型训练方法训练得到，基于上述训练方法相同的理由，得到的节理粗糙度预测模型能够有效提升JRC的预测精度。

如图4所示，本申请实施例还提供了一种节理粗糙度预测模型训练装置，包括：

第一获取模块401，用于获取m个初始训练样本，每个初始训练样本包括n个粗糙度参数指标和粗糙度标签，m和n均为大于1的整数；

主成分分析模块402，用于对m个初始训练样本进行主成分分析，得到k个主成分特征向量，k为正整数；

第一处理模块403，用于基于k个主成分特征向量处理m个初始训练样本，得到m个目标训练样本，每个目标训练样本包括k个目标指标和粗糙度标签，目标指标为通过主成分特征向量对粗糙度参数指标处理得到；

训练模块404，用于使用m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，其中，初始机器学习模型包括初始XGBoost模型和智能优化算法模型，初始XGBoost模型用于接收目标训练样本，输出预测粗糙度，并根据预测粗糙度和粗糙度标签调整网络参数，智能优化算法模型用于调整初始XGBoost模型的超参数。

可选地，主成分分析模块402可具体用于：

根据m个初始训练样本以及各个初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵；

根据原始数据矩阵构建相关系数矩阵；

求解相关系数矩阵的特征根和特征向量；

根据相关系数矩阵的特征根和特征向量确定k个主成分特征向量。

可选地，主成分分析模块402还可用于：

对原始数据矩阵进行归一化和标准化处理，得到标准化矩阵；

根据如下公式确定相关系数矩阵R_m×n：

其中，X^*为标准化矩阵，X^*T为标准化矩阵的转置矩阵。

可选地，主成分分析模块402还可用于：

按照全部特征根的排列顺序，依次对方差贡献率进行累加；

可选地，主成分分析模块402还可用于：

获取任两个粗糙度参数指标之间的相关系数；

在任两个粗糙度参数指标之间的相关系数均大于系数阈值的情况下，根据m个初始训练样本以及各个初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵。

可选地，第一处理模块403可具体用于：

可选地，训练模块404可具体用于：

将m个目标训练样本分为训练集和测试集；

使用测试集评价节理粗糙度预测模型的性能。

可选地，n个粗糙度参数指标包括以下指标中的至少两者：平均相对高度、最大相对高度、高度标准差、平均倾角、倾角标准差、坡度均方根、粗糙度剖面指数和剖面结构函数；

智能优化算法模型包括白鲨优化算法；

超参数包括最大迭代数、深度和学习率中的至少一者。

本申请实施例提供的节理粗糙度预测模型训练装置是与上文实施例的节理粗糙度预测模型训练方法对应的装置权限，方法实施例可以应用到装置实施例中，并取得相同的技术效果，此处不再赘述。

本申请实施例还提供了一种节理粗糙度预测装置，包括：

预测模块，用于将预处理样本输出至节理粗糙度预测模型，输出得到节理粗糙度系数，节理粗糙度预测模型为通过上述节理粗糙度预测模型训练方法训练得到。

本申请实施例提供的节理粗糙度预测装置是与上文实施例的节理粗糙度预测方法对应的装置权限，方法实施例可以应用到装置实施例中，并取得相同的技术效果，此处不再赘述。

本申请实施例还提供了一种电子设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述的节理粗糙度预测模型训练方法或节理粗糙度预测方法。

本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序被处理器执行时实现上述的节理粗糙度预测模型训练方法或节理粗糙度预测方法。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述***中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种节理粗糙度预测模型训练方法，其特征在于，包括：

获取m个初始训练样本，每个所述初始训练样本包括n个粗糙度参数指标和粗糙度标签，m和n均为大于1的整数；

对所述m个初始训练样本进行主成分分析，得到k个主成分特征向量，k为正整数；

基于所述k个主成分特征向量处理所述m个初始训练样本，得到m个目标训练样本，每个所述目标训练样本包括k个目标指标和所述粗糙度标签，所述目标指标为通过所述主成分特征向量对所述粗糙度参数指标处理得到；

使用所述m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，其中，所述初始机器学习模型包括初始XGBoost模型和智能优化算法模型，所述初始XGBoost模型用于接收所述目标训练样本，输出预测粗糙度，并根据所述预测粗糙度和所述粗糙度标签调整网络参数，所述智能优化算法模型用于调整所述初始XGBoost模型的超参数。

2.根据权利要求1所述的方法，其特征在于，所述对所述m个初始训练样本进行主成分分析，得到k个主成分特征向量，包括：

根据所述m个初始训练样本以及各个所述初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵；

根据所述原始数据矩阵构建相关系数矩阵；

求解所述相关系数矩阵的特征根和特征向量；

根据所述相关系数矩阵的特征根和特征向量确定所述k个主成分特征向量。

3.根据权利要求2所述的方法，其特征在于，所述根据所述原始数据矩阵构建相关系数矩阵，包括：

对所述原始数据矩阵进行归一化和标准化处理，得到标准化矩阵；

根据如下公式确定所述相关系数矩阵R_m×n：

其中，X^*为所述标准化矩阵，X^*T为所述标准化矩阵的转置矩阵。

4.根据权利要求2所述的方法，其特征在于，所述根据所述相关系数矩阵的特征根和特征向量确定所述k个主成分特征向量；

将所述相关系数矩阵的全部特征根按从大到小的顺序排列，确地各个所述特征根分别对应的方差贡献率；

按照所述全部特征根的排列顺序，依次对所述方差贡献率进行累加；

在累加的所述方差贡献率的值首次大于预设阈值的情况下，获取累加的k个所述方差贡献率所对应的k个特征根；

将所述k个特征根分别对应的k个所述特征向量确定为所述k个主成分特征向量。

5.根据权利要求2所述的方法，其特征在于，所述根据所述m个初始训练样本以及各个所述初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵，包括：

获取任两个所述粗糙度参数指标之间的相关系数；

在任两个所述粗糙度参数指标之间的相关系数均大于系数阈值的情况下，根据所述m个初始训练样本以及各个所述初始训练样本所包括的n个粗糙度参数指标，构建m×n阶的原始数据矩阵。

6.根据权利要求1所述的方法，其特征在于，所述基于所述k个主成分特征向量处理所述m个初始训练样本，得到m个目标训练样本，包括：

根据各所述初始训练样本所包括的n个粗糙度参数确定行向量，将各所述主成分特征向量作为列向量，并通过点乘得到所述目标训练样本。

7.根据权利要求1所述的方法，其特征在于，所述使用所述m个目标训练样本训练预先建立的初始机器学习模型，得到节理粗糙度预测模型，包括：

将所述m个目标训练样本分为训练集和测试集；

使用所述训练集训练预先建立的初始机器学习模型，得到节理粗糙度预测模型；

使用所述测试集评价所述节理粗糙度预测模型的性能。

8.根据权利要求1所述的方法，其特征在于，所述n个粗糙度参数指标包括以下指标中的至少两者：平均相对高度、最大相对高度、高度标准差、平均倾角、倾角标准差、坡度均方根、粗糙度剖面指数和剖面结构函数；

所述智能优化算法模型包括白鲨优化算法；

所述超参数包括最大迭代数、深度和学习率中的至少一者。

9.一种节理粗糙度预测方法，其特征在于，包括：

获取待预测样本，所述待预测样本包括n个粗糙度参数指标，n为大于1的整数；

使用k个主成分特征向量处理所述待预测样本，得到预处理样本，所述k个主成分特征向量为基于主成分分析得到，k为正整数；

将所述预处理样本输出至节理粗糙度预测模型，输出得到节理粗糙度系数，所述节理粗糙度预测模型为通过权利要求1至8中任一项所述的方法训练得到。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的节理粗糙度预测模型训练方法，或者实现如权利要求8所述的节理粗糙度预测方法。