CN116167288A

CN116167288A - 一种ua2ft半监督迁移学习建模方法、介质及设备

Info

Publication number: CN116167288A
Application number: CN202310421764.7A
Authority: CN
Inventors: 吕文君; 张文婷; 康宇; 李鲲; 李泽瑞
Original assignee: University of Science and Technology of China USTC
Current assignee: University of Science and Technology of China USTC
Priority date: 2023-04-19
Filing date: 2023-04-19
Publication date: 2023-05-26
Anticipated expiration: 2043-04-19
Also published as: CN116167288B

Abstract

本发明涉及地质建模迁移学习技术领域，公开了一种UA2FT半监督迁移学习建模方法、介质及设备，建模方法包括：获取源域和目标域数据；样本映射高维空间；单向对齐；精细调整；得到预测模型并得到预测结果；本发明有效解决了建模中的数据分布偏差问题，实现了从成熟区块的丰富数据集向新区块的知识迁移，有效提升了建模精度；充分利用了已有的数据标签和数据内蕴结构，减少了建模中对数据的依赖性；保持了特征的地球物理意义，建模过程具有一定的可解释性。

Description

一种UA2FT半监督迁移学习建模方法、介质及设备

技术领域

本发明涉及地质建模迁移学习技术领域，具体涉及一种UA2FT半监督迁移学习建模方法、介质及设备。

背景技术

地质建模是在将地质、测井、地球物理资料和各种解释结果或者概念模型进行综合分析的基础上，利用计算机图形技术，生成的三维定量模型。因此地质建模是一个涉及地质学、数据和信息分析、计算科学的交叉性的综合学科。以对测井解释进行地质建模为例，在固体地面上钻孔几乎是直接探索地下表面的唯一方法，因为我们可以观察钻孔岩屑和岩芯。未损坏的岩心为地层的形成提供了丰富的信息，但由于取心成本高、时间长，无法获得完整的、连续的沿井岩心序列。与岩心直接观测井眼地质相比，测井可连续、高分辨率地记录井眼物探参数(如声、电等)，间接反映地层性质。因此，将稀缺而直接的岩心与间接而持续的地球物理测井相结合，建立完整而精细的井眼地质模型，是地质工作者的重要任务。

基于机器学习的测井解释已经得到了广泛的研究，但大多数研究都是在独立同分布(iid)假设下进行的，即训练数据集和测试数据集之间的概率分布不存在差异。一般来说，训练数据集可以由单口井组成，也可以由多口井的数据合并而成。因此，我们总是可以假设获得一个具有丰富甚至完整标签的训练数据集。但是，由于不同的井在钻井条件、测井设备等方面存在差异，因此有标记训练数据集与未标记(或几乎没有标记)测试数据集之间存在不可忽略的概率分布差异。因此，在实践中，基于机器学习的建模应该在非iid（独立同分布）问题下进行研究。

发明内容

为解决上述技术问题，本发明提供一种UA2FT半监督迁移学习建模方法、介质及设备。

为解决上述技术问题，本发明采用如下技术方案：

一种UA2FT半监督迁移学习建模方法，通过源域s的有标签样本和源域任务的预测模型

，获取目标域t任务的预测模型/>

；源域的有标签样本数量/>

大于目标域的有标签样本数量/>

；包括以下步骤：

步骤一、获取源域和目标域数据：源域数据

中，/>

分别表示源域第i个样本和对应的标签；目标域数据/>

、/>

中，/>

表示目标域样本总数，

分别表示目标域第i个样本和对应的标签；/>

和/>

统一记为样本/>

，/>

和/>

统一记为标签/>

；源域样本矩阵/>

，目标域样本矩阵/>

；源域标签矩阵/>

；/>

为样本/>

的维数，c为预测目标类别总数；

步骤二、样本映射高维空间：采用样本映射函数

对源域样本矩阵/>

和目标域样本矩阵/>

进行变换，分别得到映射样本矩阵/>

和/>

；其中/>

为再生核希尔伯特空间，/>

为特征空间，/>

，/>

的元素

，/>

，/>

为映射样本维度，/>

为从高斯分布

采样的输入权重向量，/>

为从均匀分布/>

采样的输入偏置标量，/>

为输入权重向量采样方差系数，/>

表示实数域；

步骤三、单向对齐阶段：通过

对映射样本矩阵/>

和

进行变换，得到调整后的源域样本矩阵/>

和目标域样本矩阵

；其中/>

为输出权重矩阵；通过优化函数/>

使调整后的源域样本矩阵接近原始的源域样本，即/>

，并使调整后的目标域样本矩阵/>

向源域概率分布对齐；

步骤四、精细调整阶段：通过优化函数

对经过单向对齐阶段后的源域样本矩阵/>

和目标域样本矩阵/>

进行精细调整；

步骤五、得到预测模型并得到预测结果：经过单向对齐阶段和精细调整阶段训练后得到输出权重矩阵

和/>

，获得目标域任务的预测模型/>

，

为极限学习机随机映射；将通过预测模型/>

预测目标域的无标签样本，得到预测结果，实现建模。

进一步地，样本x是由测井数据组成的测井样本或者是由地震属性数据组成的地震样本，步骤五中通过预测模型得到目标域多个无标签测井样本或地震样本的预测结果，实现井或者区块的地质建模。

进一步地，如果目标域任务为测井解释任务，则样本x是由测井数据组成的测井样本，标签y为测井标签，具体地：

测井样本x为一口井在同一深度上的多个测井值组成的向量，测井标签y为需要解释的地质信息，d为测井总数，源域数据的测井标签数量大于目标域数据中的测井标签数量；

步骤二中，映射样本维度

取200至1000之间的整数，输入权重向量采样方差系数/>

取0.01至4之间的实数；

步骤五中，通过预测模型得到目标域多个无标签测井样本的预测结果，得到井的完整地质模型。

进一步地，如果目标域任务为地震解释任务，则样本x是由地震属性数据组成的地震样本，标签y为地震标签，具体地：

地震样本x为一个区块在同一方位上的地震属性值组成的向量，地震标签y为需要解释的地质信息，d为地震属性总数，源域数据的地震标签数量大于目标域数据中的地震标签数量；

步骤二中，映射样本维度

取500至2000之间的整数，输入权重向量采样方差系数/>

取1至16之间的实数；

步骤五中，通过预测模型得到目标域多个无标签地震样本的预测结果，得到区块的完整地质模型。

进一步地，步骤三中，优化函数

；其中

用于度量跨域概率分布，/>

为全体样本矩阵，/>

为全体标签矩阵，/>

，/>

为目标域标签矩阵，其中无标签的目标域样本采用伪标签；/>

用于避免变换过程中的信息丢失；/>

用于度量单向对齐阶段的复杂性；具体地：

，其中/>

表示全体映射样本矩阵，/>

表示转置，tr表示矩阵的迹，M为边缘MMD矩阵或者条件MMD矩阵；/>

；

。

进一步地，在步骤三的优化函数

中加入平衡系数，则优化函数/>

为：

；

其中，

、/>

为人工定义的平衡系数，均大于0；如果目标域任务为测井解释任务，

，/>

；如果目标域任务为地震解释任务，/>

，/>

；

优化函数

进一步写作：

；

其中，中间变量

，/>

和/>

表示全1和全0矩阵，/>

和/>

的下标表示维度；优化/>

即得到A的解析解：

，I为单位阵，下标表示该单位阵的维度。

进一步地，步骤四中，优化函数

；/>

为源域的总预测误差，/>

为目标域中的总预测误差，/>

用于评估目标域预测模型在特征空间中的平滑性，/>

用于降低输出权重矩阵B的复杂度；

，其中/>

为/>

经过极限学习机随机映射得到的高维映射矩阵，/>

为映射后特征维度，/>

；/>

，其中/>

为/>

经过极限学习机随机映射/>

得到的高维映射矩阵，/>

为对角阵，

为目标域标签矩阵；/>

，其中/>

表示转置，tr表示矩阵的迹，/>

为目标域上的用于半监督的图拉普拉斯矩阵；/>

。

进一步地，在步骤四的优化函数

加入平衡系数，则优化函数/>

为：

；

其中，

、/>

、/>

为人工定义的平衡系数，均大于0；如果目标域任务为测井解释任务，/>

、/>

、/>

；如果目标域任务为地震解释任务，/>

、

、/>

；

优化函数

进一步写作：

；

其中，中间变量

，/>

和/>

表示全1和全0矩阵，/>

和/>

的下标表示维度；中间变量/>

，/>

为全体标签矩阵，/>

为全体样本高维映射矩阵；优化/>

即得到B的解析解：

。

本发明还提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行上述方法的步骤。

本发明还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述方法的步骤。

与现有技术相比，本发明的有益技术效果是：

1.本发明有效解决了地质建模中的数据分布偏差问题，实现了从成熟区块的丰富数据集向新区块的知识迁移，有效提升了建模精度；

2.充分利用了已有的数据标签和数据内蕴结构，减少了地质建模中对数据的依赖性；

3.保持了特征的地球物理意义，地质建模过程具有一定的可解释性。

附图说明

图1为本发明的流程示意图。

具体实施方式

下面结合附图对本发明的一种优选实施方式作详细的说明。

源域、目标域、样本、标签、预测模型，属于迁移学习领域技术人员的技术用语。

本发明除了提出UA2FT半监督迁移学***衡系数/>

、/>

、/>

、/>

、/>

等在不同的任务中取值范围不同。

如图1所示，本发明提出一种UA2FT半监督迁移学***滑性外，还引入了源域丰富标签的知识。将目标域预测模型在源域的约束下进行更新，从而命名为精细调整。需要说明的是：UA和FT在循环中相互促进，由于UA增强了源域和目标域之间的关系，所以UA对FT有促进作用；另外由于FT提高了分布差异的测量精度，UA对FT有促进作用。

步骤S1、数据收集与处理：

收集数据并整理成样本，一个样本表达为

，其中d是样本的维数，/>

是特征空间，样本的标签表达为/>

，其中/>

为标签空间，对于分类任务或回归任务，/>

分别属于有限元素集合或实数。一个样例定义为/>

，域/>

由一个特征空间/>

，一个标签空间/>

和联合概率分布/>

组成，且/>

。分类模型或者回归模型/>

可以对样本进行预测，从概率的角度说，/>

等价于/>

。

如果采集到n个样本，则得到样本集合

，样本集合写作矩阵形式为

，样本集合/>

对应的标签集合/>

，其矩阵形式为

，c为预测目标类别总数；源域和目标域为两个不同的域，源域具有较多的有标签样本，目标域样本的标签稀少。

采用符号s标识源域，t标识目标域；源域数据由

构成，/>

表示源域有标签样本总数，/>

分别表示源域的样本和标签，目标域数据由/>

和少量的

构成，/>

表示目标域样本总数，/>

表示目标域的有标签样本数量，/>

分别表示目标域的样本和标签；源域和目标域的预测模型分别用/>

和/>

表示；所有样本要进行归一化处理。源域数据的矩阵形式为/>

，称为源域样本矩阵；目标域数据的矩阵形式为/>

，称为目标域样本矩阵。

如果样本

是由测井数据组成的测井样本，/>

，测井数据包括SP、GR、AC、R25、COND等测井值，d为测井总数，同一深度上的测井值组成的向量即为测井样本/>

。测井标签为需要解释的地质信息，如果解释岩性，则/>

，c为岩性总数，y为独热编码，/>

为实数域；如果解释物性，则/>

。测井解释任务中，源域数据一般用多口已经完成测录井、测井数据处理、录井数据归位校正、人工解释的井数据合并而成，因此具有大量的有标签样本，目标域一般为刚完成测井且缺少大量录井数据和人工解释的井数据，因此目标域有大量无标签样本和极少数量的有标签样本，通过源域样本和目标域样本训练预测模型，得到目标域无标签样本的预测结果，即可得到该井的完整地质模型。

如果样本x是由地震属性数据组成的地震样本，

，地震属性数据包括地震波的几何学、运动学、动力学或统计学特征，具体包括振幅、频率、相位、能量、波形、波阻抗、波速等，d为地震属性总数。同一方位上的地震属性值组成的向量即为地震样本x，地震标签为需要解释的地质信息，如果解释岩性，则/>

，c为岩性总数，y为独热编码；如果解释物性，则/>

。地震解释任务中，源域一般由成熟探区的地震属性数据合并而成，因此具有大量的有标签样本，目标域一般为新的探区或勘探程度较低的区块的地震属性数据组成，因此目标域有大量无标签样本和极少数量的有标签样本，通过源域和目标域数据训练预测模型，得到目标域无标签样本的预测结果，即可得到该区块的完整地质模型。

步骤S2、样本映射高维空间：

采用样本映射函数

对样本进行变换，其中/>

为再生核希尔伯特空间（RKHS），/>

，其元素/>

，/>

和w下标i取值范围为1至/>

，/>

为映射样本维度，/>

为从高斯分布/>

采样的输入权重向量，/>

为从均匀分布/>

采样的输入偏置标量，/>

为输入权重向量采样方差系数。

对于测井解释任务，预测模型复杂度相对较低，

可取200至1000之间的整数，/>

可取0.01至4之间的实数；对于地震解释任务，预测模型复杂度相对较高，/>

可取500至2000之间的整数，/>

可取1至16之间的实数。

步骤S3、单向对齐阶段（UA）：

源域的样本矩阵

和目标域的样本矩阵/>

经过步骤S2后映射到高维空间，得到映射样本矩阵/>

和/>

，通过/>

对映射样本矩阵再次进行变换，得到调整后的源域样本矩阵/>

和目标域样本矩阵/>

。在UA阶段，希望调整后的源域样本矩阵接近原始的源域样本矩阵，即/>

，调整后的目标域样本具有显著变化，向源域概率分布对齐，则定义优化函数：

；

其中，第一项

度量跨域概率分布，/>

，/>

，

，该项用以显式地消除源域和目标域之间的差异，其中无标签的目标域样本可以用伪标签，具体地/>

，其中/>

，/>

表示转置，tr表示矩阵的迹，M为边缘或者条件MMD矩阵，MMD为最大均值差异（Maximum MeanDiscrepancy）的缩写。第二项/>

避免了变换过程中的信息丢失，没有/>

将得到一个平凡解/>

，其中/>

是一个零矩阵，即UA后所有信息都被消去，与/>

相比，/>

只涉及两个域中的样本，没有标签的参与，所以该项在一定程度上保留了样本分布的内在结构，具体地/>

，该项本质上为重构误差，能够让调整后的样本保持原始特征的物理意义，也进而保留了一定的可解释性。第三项/>

，一般定义为/>

，以度量UA模型的复杂性，该项可以防止经过训练的A过拟合。

进一步，加入平衡系数，优化函数

可以写为：

；

其中，

、/>

为人工定义的平衡系数，均大于0；对于测井解释任务，/>

，

；对于地震解释任务，/>

，/>

。

优化函数

可以进一步写作：

。

其中，

，/>

和/>

表示全1和全0矩阵，下标表示其维度；优化

即可得到A的解析解：

。

步骤S4、精细调整阶段（FT）：

经过UA阶段，源域得到了调整后的样本矩阵

，目标域得到了调整后的样本矩阵

，下面在此基础上进行精细调整，定义优化函数/>

：

。

其中，第一项

定义了经验损失，即源域的总预测误差，该项试图充分利用源域中的丰富标签，并以某种方式保存源域信息，否则，目标域预测模型的结果可能非常糟糕，具体地/>

，其中/>

为/>

经过极限学***滑性，即特征空间中更接近的两个样本更有可能具有相同的标签，其中/>

被列为一个条件，表明使用原始的目标域特征空间来构造图拉普拉斯矩阵，具体地

，其中/>

定义为目标域上的用于半监督的图拉普拉斯矩阵；第四项/>

用于降低B的复杂度，具体地/>

，防止B在训练中过拟合。

进一步，加入平衡系数，优化函数

可以写为：

。

其中，

、/>

、/>

为人工定义的平衡系数，均大于0；在测井解释任务中，/>

、

、/>

；在地震解释任务中，/>

、/>

、/>

。

优化函数

可以进一步写作：

。

其中，

，/>

，/>

，

；优化/>

即可得到B的解析解：

。

步骤S5、得到预测模型并进行地质建模：

经过UA2FT训练后得到输出权重矩阵

和/>

，可得目标域的预测模型/>

。

然后将预测模型

用于预测目标域的无标签样本，即可得到其预测结果，当输入为测井数据组成的测井样本或由地震属性数据组成的地震样本，预测结果为地质信息，即实现了地质建模。

又一方面，本发明还公开一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行上述方法的步骤。

再一方面，本发明还公开一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述方法的步骤。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例中的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(如同轴电缆、光纤、数字用户线)或无线(如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(如软盘、硬盘、磁带)、光介质(如DVD)或者半导体介质(如固态硬盘)等。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内，不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立技术方案，说明书的这种叙述方式仅仅是为了清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种UA2FT半监督迁移学习建模方法，通过源域s的有标签样本和源域任务的预测模型

，获取目标域t任务的预测模型/>

；源域的有标签样本数量/>

大于目标域的有标签样本数量/>

；包括以下步骤：

步骤一、获取源域和目标域数据：源域数据

中，/>

分别表示源域第i个样本和对应的标签；目标域数据/>

、/>

中，/>

表示目标域样本总数，/>

分别表示目标域第i个样本和对应的标签；/>

和/>

统一记为样本/>

，/>

和/>

统一记为标签/>

；源域样本矩阵/>

，目标域样本矩阵/>

；源域标签矩阵/>

；/>

为样本/>

的维数，c为预测目标类别总数；

步骤二、样本映射高维空间：采用样本映射函数

对源域样本矩阵/>

和目标域样本矩阵/>

进行变换，分别得到映射样本矩阵/>

和/>

；其中/>

为再生核希尔伯特空间，/>

为特征空间，/>

，/>

的元素

，/>

，/>

为映射样本维度，/>

为从高斯分布/>

采样的输入权重向量，/>

为从均匀分布/>

采样的输入偏置标量，/>

为输入权重向量采样方差系数，/>

表示实数域；

步骤三、单向对齐阶段：通过

对映射样本矩阵/>

和/>

进行变换，得到调整后的源域样本矩阵/>

和目标域样本矩阵/>

；其中/>

为输出权重矩阵；通过优化函数/>

使调整后的源域样本矩阵接近原始的源域样本，即

，并使调整后的目标域样本矩阵/>

向源域概率分布对齐；

步骤四、精细调整阶段：通过优化函数

对经过单向对齐阶段后的源域样本矩阵

和目标域样本矩阵/>

进行精细调整；

和/>

，获得目标域任务的预测模型/>

，/>

为极限学习机随机映射；将通过预测模型/>

预测目标域的无标签样本，得到预测结果，实现建模。

2.根据权利要求1所述的UA2FT半监督迁移学习建模方法，其特征在于：样本x是由测井数据组成的测井样本或者是由地震属性数据组成的地震样本，步骤五中通过预测模型得到目标域多个无标签测井样本或地震样本的预测结果，实现井或者区块的地质建模。

3.根据权利要求1所述的UA2FT半监督迁移学习建模方法，其特征在于：如果目标域任务为测井解释任务，则样本x是由测井数据组成的测井样本，标签y为测井标签，具体地：

步骤二中，映射样本维度

取200至1000之间的整数，输入权重向量采样方差系数/>

取0.01至4之间的实数；

4.根据权利要求1所述的UA2FT半监督迁移学习建模方法，其特征在于：如果目标域任务为地震解释任务，则样本x是由地震属性数据组成的地震样本，标签y为地震标签，具体地：

步骤二中，映射样本维度

取500至2000之间的整数，输入权重向量采样方差系数/>

取1至16之间的实数；

5.根据权利要求1所述的UA2FT半监督迁移学习建模方法，其特征在于：步骤三中，优化函数

；其中/>

用于度量跨域概率分布，/>

为全体样本矩阵，/>

为全体标签矩阵，/>

，

为目标域标签矩阵，其中无标签的目标域样本采用伪标签，伪标签通过源域分类器预测目标域无标签样本获得；/>

用于避免变换过程中的信息丢失；/>

用于度量单向对齐阶段的复杂性；具体地：

，其中/>

表示全体映射样本矩阵，/>

；

。

6.根据权利要求5所述的UA2FT半监督迁移学***衡系数，则优化函数/>

为：

；

其中，

、/>

，/>

；如果目标域任务为地震解释任务，/>

，/>

；

优化函数

进一步写作：

；

其中，中间变量

，/>

和/>

表示全1和全0矩阵，/>

和/>

的下标表示维度；优化/>

即得到A的解析解：

，I为单位阵，I的下标表示单位阵I的维度。

7.根据权利要求1所述的UA2FT半监督迁移学***滑性，/>

用于降低输出权重矩阵B的复杂度；

，其中/>

为/>

经过极限学习机随机映射得到的高维映射矩阵，/>

为映射后特征维度，/>

；/>

，其中/>

为/>

经过极限学习机随机映射/>

得到的高维映射矩阵，/>

为对角阵，

为目标域标签矩阵；/>

，其中/>

表示转置，tr表示矩阵的迹，/>

为目标域上的用于半监督的图拉普拉斯矩阵；/>

。

8.根据权利要求7所述的UA2FT半监督迁移学***衡系数，则优化函数/>

为：

；

其中，

、/>

、/>

、/>

、/>

；如果目标域任务为地震解释任务，/>

、

、/>

；

优化函数

进一步写作：

；

其中，中间变量

，/>

和/>

表示全1和全0矩阵，/>

和/>

的下标表示维度；中间变量/>

，/>

为全体标签矩阵，/>

为全体样本高维映射矩阵；优化/>

即得到B的解析解：

。

9.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。