CN111507155A - 联合U-Net++和UDA的微地震有效信号初至拾取方法及装置 - Google Patents

联合U-Net++和UDA的微地震有效信号初至拾取方法及装置 Download PDF

Info

Publication number
CN111507155A
CN111507155A CN202010051627.5A CN202010051627A CN111507155A CN 111507155 A CN111507155 A CN 111507155A CN 202010051627 A CN202010051627 A CN 202010051627A CN 111507155 A CN111507155 A CN 111507155A
Authority
CN
China
Prior art keywords
data
supervised
loss
net
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010051627.5A
Other languages
English (en)
Inventor
盛冠群
郭小龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangtze University
Original Assignee
Yangtze University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangtze University filed Critical Yangtze University
Priority to CN202010051627.5A priority Critical patent/CN111507155A/zh
Publication of CN111507155A publication Critical patent/CN111507155A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V1/00Seismology; Seismic or acoustic prospecting or detecting
    • G01V1/28Processing seismic data, e.g. for interpretation or for event detection
    • G01V1/288Event detection in seismic signals, e.g. microseismics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V2210/00Details of seismic processing or analysis
    • G01V2210/30Noise handling
    • G01V2210/32Noise reduction
    • G01V2210/324Filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V2210/00Details of seismic processing or analysis
    • G01V2210/40Transforming data representation
    • G01V2210/48Other transforms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01VGEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
    • G01V2210/00Details of seismic processing or analysis
    • G01V2210/60Analysis
    • G01V2210/67Wave propagation modeling

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Environmental & Geological Engineering (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Acoustics & Sound (AREA)
  • Geology (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geophysics (AREA)
  • Geophysics And Detection Of Objects (AREA)

Abstract

本发明公开一种联合U‑Net++和UDA的微地震有效信号初至拾取方法及装置,所述方法包括:获取原始微地震信号数据并进行预处理,得到微地震信号数据集;根据微地震信号数据集的部分数据制作有标签数据集,其余为无标签数据集;将有标签数据集和无标签数据集一并投入到U‑Net++网络中分别进行基于高斯噪音的有监督训练和基于数据增强的无监督训练,将预测出的有监督部分的损失值和无监督部分的损失值整合为最终损失值,将所述最终损失值作为衡量整个网络模型质量的标准进行半监督模型训练;通过训练好的网络模型进行微地震有效信号初至拾取。本发明可减少人工成本,提高集成预测的准确度。

Description

联合U-Net++和UDA的微地震有效信号初至拾取方法及装置
技术领域
本发明属于微地震信号检测领域,具体涉及一种联合UDA和U-Net++网 络实现微地震有效信号的初至拾取的方法及装置。
背景技术
微地震是一种小型地震,在地下矿井深部开采过程中常常是不可避免的。 微地震监测技术作为页岩气开采的重要途径,在勘探过程中发挥着越来越重要 的作用,若能实现微地震有效信号的自动识别和初至的自动拾取,将对海量微 地震数据的自动处理有重要意义。
通过卷积神经网络(Convolutional Neural Network,CNN)进行微地震有 效信号的初至拾取已有大量研究。Nested-U-Net(UNet++)网络在U-Net网络的基 础上加入跳层结构,可以有效提取不同维度特征,但由于UNet++网络本身层数 较浅,在识别精度上还有待提高。传统的微地震有效信号检测需要大量的人工 标记样本,耗时长并且准确率低。因此,如何实现半监督条件下对连续输入信 号的准确检测就显得至关重要,本发明重点研究如何在强噪音背景下快速准确 的实现对小样本的微地震有效信号的初至拾取。
发明内容
本发明在U-Net++的基础上,结合无监督数据增强(Unsupervised DataAugmentation,UDA),生成多样且真实的噪声数据并使模型对这些噪声保持一 致性,这样不仅可以对小样本的微地震信号进行高精度的初至拾取,还能优化 损失,解决传统微地震信号检测需依赖大量样本数据计算和拾取精度低的问题。
本发明第一方面,提出一种联合U-Net++和UDA的微地震有效信号初至 拾取方法,所述方法包括:
S1、获取原始微地震信号数据并进行预处理,得到微地震信号数据集;
S2、根据微地震信号数据集的部分数据制作有标签数据集,其余为无标签 数据集;
S3、将有标签数据集和无标签数据集一并投入到U-Net++网络中分别进行 基于高斯噪音的有监督训练和基于数据增强的无监督训练,将预测出的有监督 部分的损失值和无监督部分的损失值整合为最终损失值,将所述最终损失值作 为衡量整个网络模型质量的标准进行半监督模型训练;
S4、通过训练好的网络模型进行微地震有效信号初至拾取。
优选地,所述步骤S1具体包括:
用matlab画出原始微地震信号数据的剖面图并标记信号的采样点,提取出 有效信号道、剔除无效道,通过低通或高通滤波实现信号和噪音的分离;
使用S变换对微地震信号进行时频分析,得到微地震信号数据集;所述S 变换的公式为:
Figure BDA0002371373270000021
其中
Figure BDA0002371373270000022
为高斯窗函数,t代表时间,f代表频率。
优选地,所述步骤S3中,所述基于高斯噪音的有监督训练的过程为:
将有标签数据集分为两批标签信号,一批保持不变,另一批通过添加高斯 噪音进行干扰;将两批有标签信号放入U-Net++网络进行卷积、池化操作得到 端对端的输出;
对于保持不变的数据,计算得到条件概率分布pθ(y|x),对于添加高斯噪音 进行干扰的数据,计算得到条件概率分布
Figure BDA0002371373270000024
整合计算两批特征不同层次的交叉熵损失,将骰子系数引入交叉熵损失中, 作为有监督部分的损失值,有监督部分的损失公式为:
Figure BDA0002371373270000023
其中x指代输入,y和y*分别指代真实值和预测值,b指第b个信号,N为批量大 小,θ指模型参数,L指带标签的样本,
Figure BDA00023713732700000310
指代噪音。
优选地,所述步骤S3中,所述基于数据增强的无监督训练的过程为:
将无标签数据集分为两批无标签信号,一批进行数据增强,另一批保持不 变;将两批无标签信号放入U-Net++网络进行卷积、池化操作得到端对端的输 出;
将上采样后得到的信号按如下方式处理:对于保持不变的数据,计算给定 输入x时y的条件概率分布
Figure BDA0002371373270000031
对于经过增强的数据
Figure BDA0002371373270000032
计算给定输入
Figure BDA0002371373270000033
时y 的条件概率分布
Figure BDA0002371373270000034
整合计算两批次不同层次的一致性损失,将一致性损失作为无监督的loss 值,其计算公式为:
Figure BDA0002371373270000035
其中
Figure BDA0002371373270000036
U指无标签数据,
Figure BDA0002371373270000037
是数据增强转换,
Figure BDA0002371373270000038
是当前参数θ的 固定副本。
优选地,所述步骤S3中,所述最终损失值由使用权重因子平衡有监督损 失和无监督损失构成,其表达式为:
final_loss=cross_entropy_loss+λconsistency_loss λ为权重因子;
对于网络最终输出的final_loss值,若final_loss小于等于预设阈值,表明 模型收敛性好,保留其训练数据;若final_loss值大于预设阈值,采用BP神经 网络算法将最后一层得到的特征结果向前推进更新参数,直到模型收敛。
优选地,所述步骤S3中,所述半监督模型训练中使用随机梯度下降作为 优化器训练样本,通过每个样本的损失函数对θ求导得到相应梯度进而更新θ, 通过调参优化网络,其训练公式为:
Figure BDA0002371373270000039
Figure BDA0002371373270000041
其中θ是迭代参数,y是函数输出量,h(θ)是求出的拟合函数,j是参数个 数,θ′是沿θ梯度负方向更新的得到的参数;
本发明第二方面,提出一种联合U-Net++和UDA的微地震有效信号初至 拾取装置,所述装置包括:
数据集获取模块:获取原始微地震信号数据并进行预处理,得到微地震信 号数据集;
数据集标记模块:根据微地震信号数据集的部分数据制作有标签数据集, 其余为无标签数据集;
半监督训练模块:将有标签数据集和无标签数据集一并投入到U-Net++网 络模型中分别进行基于高斯噪音的有监督训练和基于数据增强的无监督训练, 将预测出的有监督部分的损失值和无监督部分的损失值整合为最终损失值,将 所述最终损失值作为衡量整个网络模型质量的标准进行半监督模型训练;
初至拾取模块:通过训练好的网络模型进行微地震有效信号初至拾取。
优选地,其特征在于,所述半监督模型训练模块具体包括:
有监督训练单元:
用于将有标签数据集分为两批标签信号,一批保持不变,另一批通过添加 高斯噪音进行干扰;将两批有标签信号放入U-Net++网络进行卷积、池化操作 得到端对端的输出;
对于保持不变的数据,计算得到条件概率分布pθ(y|x),对于添加高斯噪音 进行干扰的数据,计算得到条件概率分布
Figure BDA0002371373270000044
整合计算两批特征不同层次的交叉熵损失,将骰子系数引入交叉熵损失中, 作为有监督部分的损失值,有监督部分的损失公式为:
Figure BDA0002371373270000042
其中x指代输入,y和y*分别指代真实值和预测值,b指第b个信号,N为批量大 小,θ指模型参数,L指带标签的样本,
Figure BDA0002371373270000043
指代噪音;
无监督训练单元:
用于将无标签数据集分为两批无标签信号,一批进行数据增强,另一批保 持不变;将两批无标签信号放入U-Net++网络进行卷积、池化操作得到端对端 的输出;
将上采样后得到的信号按如下方式处理:对于保持不变的数据,计算给定 输入x时y的条件概率分布
Figure BDA0002371373270000051
对于经过增强的数据
Figure BDA0002371373270000052
计算给定输入
Figure BDA0002371373270000053
时y 的条件概率分布
Figure BDA0002371373270000054
整合计算两批次不同层次的一致性损失,将一致性损失作为无监督的loss 值,其计算公式为:
Figure BDA0002371373270000055
其中
Figure BDA0002371373270000056
U指无标签数据,
Figure BDA0002371373270000057
是数据增强转换,
Figure BDA0002371373270000058
是当前参数θ的 固定副本;
最终损失值计算单元:
用于使用权重因子平衡的有监督损失和无监督损失计算最终损失值,其表 达式为:
final_loss=cross_entropy_loss+λconsistency_loss λ为权重因子。
优选地,所述半监督模型训练模块中,使用随机梯度下降作为优化器训练 样本,通过每个样本的损失函数对θ求导得到相应梯度进而更新参数θ,通过 调参优化网络,其训练公式为:
Figure BDA0002371373270000059
Figure BDA00023713732700000510
其中θ是迭代参数,y是函数输出量,h(θ)是求出的拟合函数,j是参数个 数,θ′是沿θ梯度负方向更新的得到的参数。
本发明联合UDA和U-Net++网络实现微地震有效信号的初至拾取有如下 两点优势:
一、理论优势:目前的微地震检测很难实现对小样本数据的检测,本 发明联合UDA和U-Net++网络通过UDA独特的扩容方式,生成大量且真 实的数据传输到网络训练,同时还能提高集成预测的准确度,有效的解决了 这一难题。
二、现实优势:现存的微地震检测技术需要依赖大量人工标记样本训 练,该过程耗时耗力,使用本专利处理微地震数据集在一定程度上可以节约 大量的人力成本,同时更高效的拾取微地震初至信号点。
附图说明
为了更清楚地说明本发明的技术方案,下面将对本发明技术描述中所需要 使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一 些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图1为本发明提供的联合U-Net++和UDA的微地震有效信号初至拾取方法 流程示意图;
图2为本发明使用的U-Net++网络模型结构示意图;
图3为残差块结构示意图;
图4为待测信号图;
图5为图4的微地震信号初至拾取结果。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结 合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描 述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施 例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提 下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明提出一种联合U-Net++和UDA的微地震有效信号初至 拾取方法,所述方法包括:
S1、获取原始微地震信号数据并进行预处理,得到微地震信号数据集;
用matlab画出原始微地震信号数据的剖面图并标记信号的采样点,提取出 有效信号道、剔除无效道,通过低通或高通滤波实现信号和噪音的分离;
使用S变换对微地震信号进行时频分析,得到微地震信号数据集;所述S 变换的公式为:
Figure BDA0002371373270000071
其中
Figure BDA0002371373270000072
为高斯窗函数,t代表时间,f代表频率。
S2、根据微地震信号数据集的部分数据制作有标签数据集,其余为无标签 数据集;
具体的,在matlab生成的信号剖面图中找出有效信号道,人工标记有效信 号的初至位置,制作成有标签数据集。
S3、将有标签数据集和无标签数据集一并投入到U-Net++网络中分别进行 基于高斯噪音的有监督训练和基于数据增强的无监督训练,将预测出的有监督 部分的损失值和无监督部分的损失值整合为最终损失值,将所述最终损失值作 为衡量整个网络模型质量的标准进行半监督模型训练;
具体的,将有标签数据集和无标签数据集通过添零补齐的方式转化成二维 信号,一并投入到U-Net++网络中进行集成预测,将整个网络训练过程分为有 监督训练和无监督训练两个阶段,综合两个阶段的loss值作为整体的final_loss 作为衡量模型质量的标准对网络进行半监督模型训练。
请参阅图2,图2为本发明使用的U-Net++网络模型结构示意图,U-Net++ 相比于U-Net网络,其增加的跳层连接能整合不同层次的深层和浅层特征,新 增的深度监督结构减少了网络的庞杂的参数,可以提高网络的效率和提取精度。
所述U-Net++网络模型在i=0时开始执行跳层连接,其操作公式为
Figure RE-GDA0002556815810000081
其中H(·)表示一个卷积与一个激活函数,u(·)表示一个上采样层,[·]表示连接层;
在U-Net++网络的下采样和上采样之间引入一个残差块,所述残差块的结 构请参阅图3,每个卷积层后使用relu函数剪裁信号,其中relu函数为:
f(x)=max(0,x) (3)
其中x为模型输出值。
进一步地,所述基于高斯噪音的有监督训练的过程为:
将有标签数据集分为两批标签信号,一批保持不变,另一批通过添加高斯 噪音进行干扰;将两批有标签信号放入U-Net++网络进行卷积、池化操作得到 端对端的输出;两批标签信号经过U-Net++网络的下采样编码,能增加对输入 信号一些小扰动的鲁棒性,减少过拟合,降低其运算量,增加感受野的大小, 再通过上采样解码操作,恢复下采样丢失的参数,进行特征提取,通过softmax 函数输出分类概率。
对于保持不变的数据,计算得到条件概率分布pθ(y|x),对于添加高斯噪音 进行干扰的数据,计算得到条件概率分布
Figure BDA0002371373270000083
整合计算两批特征不同层次的交叉熵损失,将骰子系数引入交叉熵损失中, 将该引入骰子系数的交叉熵损失作为有监督部分的损失值,有监督部分的损失 公式为:
Figure BDA0002371373270000082
其中x指代输入,y和y*分别指代真实值和预测值,b指第b个信号,N为批量大 小,θ指模型参数,L指带标签的样本,
Figure BDA0002371373270000084
指代噪音。
进一步地,所述基于数据增强的无监督训练的过程为:
将无标签数据集分为两批无标签信号,一批进行数据增强,另一批保持不 变;将两批无标签信号放入U-Net++网络进行卷积、池化操作得到端对端的输 出;
将上采样后得到的信号按如下方式处理:对于保持不变的数据,计算给定 输入x时y的条件概率分布
Figure BDA0002371373270000091
对于经过增强的数据
Figure BDA0002371373270000092
计算给定输入
Figure BDA0002371373270000093
时y 的条件概率分布
Figure BDA0002371373270000094
整合计算两批次不同层次的一致性损失,将一致性损失作为无监督的损失 值,其计算公式为:
Figure BDA0002371373270000095
其中
Figure BDA0002371373270000096
U指无标签数据,
Figure BDA0002371373270000097
是数据增强转换,
Figure BDA0002371373270000098
是当前参数θ的 固定副本。
进一步地,所述最终损失值由使用权重因子平衡有监督损失和无监督损失 得到,其表达式为:
final_loss=cross_entropy_loss+λconsistency_loss (6)
λ为权重因子;
对于网络最终输出的final_loss值,若final_loss小于等于预设阈值,表明 模型收敛性好,保留其训练数据;若final_loss值大于预设阈值,采用BP神经 网络算法将最后一层得到的特征结果向前推进更新参数,直到模型收敛。
通过最小化两个分布的散度度量
Figure BDA00023713732700000910
不仅会使模型的 抗噪能力得到提高,还可以把标签信息从标签数据传递无标签数据中,从而平 滑模型。
本发明将上述有监督训练和无监督训练构成半监督模型训练,所述半监督 模型训练中使用随机梯度下降(Stochastic Gradient Descent,SGD)作为优化器 训练样本,通过每个样本的损失函数对θ求导得到相应梯度进而更新θ,通过 调参优化网络,其训练公式为:
Figure BDA0002371373270000099
Figure BDA0002371373270000101
其中θ是迭代参数,y是函数输出量,h(θ)是求出的拟合函数,j是参数个 数,θ′是沿θ梯度负方向更新的得到的参数;
S4、通过训练好的网络模型进行微地震有效信号初至拾取。
请参阅图4,图4为待测信号,将图4的待测信号输入步骤S3训练好的模 型中,得到微地震信号初至拾取结果如图5所示。
与所述方法实施例相对应,本发明提出一种联合U-Net++和UDA的微地 震有效信号初至拾取装置,所述装置包括:
数据集获取模块:获取原始微地震信号数据并进行预处理,得到微地震信 号数据集;
数据集标记模块:根据微地震信号数据集的部分数据制作有标签数据集, 其余为无标签数据集;
半监督训练模块:将有标签数据集和无标签数据集一并投入到U-Net++网 络模型中分别进行基于高斯噪音的有监督训练和基于数据增强的无监督训练, 将预测出的有监督部分的损失值和无监督部分的损失值整合为最终损失值,将 所述最终损失值作为衡量整个网络模型质量的标准进行半监督模型训练;
初至拾取模块:通过训练好的网络模型进行微地震有效信号初至拾取。
进一步地,所述半监督模型训练模块具体包括:
有监督训练单元:
用于将有标签数据集分为两批标签信号,一批保持不变,另一批通过添加 高斯噪音进行干扰;将两批有标签信号放入U-Net++网络进行卷积、池化操作 得到端对端的输出;
对于保持不变的数据,计算得到条件概率分布pθ(y|x),对于添加高斯噪音 进行干扰的数据,计算得到条件概率分布
Figure BDA0002371373270000102
整合计算两批特征不同层次的交叉熵损失,将骰子系数引入交叉熵损失中, 作为有监督部分的损失值,有监督部分的损失公式为:
Figure BDA0002371373270000111
其中x指代输入,y和y*分别指代真实值和预测值,b指第b个信号,N为批量大 小,θ指模型参数,L指带标签的样本,
Figure BDA00023713732700001112
指代噪音;
无监督训练单元:
用于将无标签数据集分为两批无标签信号,一批进行数据增强,另一批保 持不变;将两批无标签信号放入U-Net++网络进行卷积、池化操作得到端对端 的输出;
将上采样后得到的信号按如下方式处理:对于保持不变的数据,计算给定 输入x时y的条件概率分布
Figure BDA0002371373270000112
对于经过增强的数据
Figure BDA0002371373270000113
计算给定输入
Figure BDA0002371373270000114
时y 的条件概率分布
Figure BDA0002371373270000115
整合计算两批次不同层次的一致性损失,将一致性损失作为无监督的loss 值,其计算公式为:
Figure BDA0002371373270000116
其中
Figure BDA0002371373270000117
U指无标签数据,
Figure BDA0002371373270000118
是数据增强转换,
Figure BDA0002371373270000119
是当前参数θ的 固定副本;
最终损失值计算单元:
用于计算最终损失值,其表达式为:
final_loss=cross_entropy_loss+λconsistency_loss λ为权重因子。
进一步地,所述半监督模型训练模块中,使用随机梯度下降作为优化器训 练样本,通过每个样本的损失函数对θ求导得到相应梯度进而更新参数θ,通 过调参优化网络,其训练公式为:
Figure BDA00023713732700001110
Figure BDA00023713732700001111
其中θ是迭代参数,y是函数输出量,h(θ)是求出的拟合函数,j是参数个 数,θ′是沿θ梯度负方向更新的得到的参数。
以上装置实施例与方法实施例是一一对应的,装置实施例简略之处,参见 方法实施例即可。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是 与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可,说明 书中未阐述的部分均为现有技术或公知常识。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例 的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为 了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能性一般性地 描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决 于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用 来使用不同方法来实现所描述的功能,但是这种实现不应超过本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处 理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机储存器、 内存、只读存储器、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、 可移动磁盘、CD-ROM、或技术领域内所公知的任意其他形式的存储介质中。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制,尽 管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理 解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分 技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱 离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种联合U-Net++和UDA的微地震有效信号初至拾取方法,其特征在于,所述方法包括:
S1、获取原始微地震信号数据并进行预处理,得到微地震信号数据集;
S2、根据微地震信号数据集的部分数据制作有标签数据集,其余为无标签数据集;
S3、将有标签数据集和无标签数据集一并投入到U-Net++网络中分别进行基于高斯噪音的有监督训练和基于数据增强的无监督训练,将预测出的有监督部分的损失值和无监督部分的损失值整合为最终损失值,将所述最终损失值作为衡量整个网络模型质量的标准进行半监督模型训练;
S4、通过训练好的网络模型进行微地震有效信号初至拾取。
2.根据权利要求1所述联合U-Net++和UDA的微地震有效信号初至拾取方法,其特征在于,所述步骤S1具体包括:
用matlab画出原始微地震信号数据的剖面图并标记信号的采样点,提取出有效信号道、剔除无效道,通过低通或高通滤波实现信号和噪音的分离;
使用S变换对微地震信号进行时频分析,得到微地震信号数据集;所述S变换的公式为:
Figure FDA0002371373260000011
其中
Figure FDA0002371373260000012
为高斯窗函数,t代表时间,f代表频率。
3.根据权利要求1所述联合U-Net++和UDA的微地震有效信号初至拾取方法,其特征在于,所述步骤S3中,所述基于高斯噪音的有监督训练的过程为:
将有标签数据集分为两批标签信号,一批保持不变,另一批通过添加高斯噪音进行干扰;将两批有标签信号放入U-Net++网络进行卷积、池化操作得到端对端的输出;
对于保持不变的数据,计算得到条件概率分布pθ(y|x),对于添加高斯噪音进行干扰的数据,计算得到条件概率分布pθ(y*|x,∈);
整合计算两批特征不同层次的交叉熵损失,将骰子系数引入交叉熵损失中,作为有监督部分的损失值,有监督部分的损失公式为:
Figure FDA0002371373260000021
其中x指代输入,y和y*分别指代真实值和预测值,b指第b个信号,N为批量大小,θ指模型参数,L指带标签的样本,∈指代噪音。
4.根据权利要求3所述联合U-Net++和UDA的微地震有效信号初至拾取方法,其特征在于,所述步骤S3中,所述基于数据增强的无监督训练的过程为:
将无标签数据集分为两批无标签信号,一批进行数据增强,另一批保持不变;将两批无标签信号放入U-Net++网络进行卷积、池化操作得到端对端的输出;
将上采样后得到的信号按如下方式处理:对于保持不变的数据,计算给定输入x时y的条件概率分布
Figure FDA0002371373260000022
对于经过增强的数据
Figure FDA0002371373260000023
计算给定输入
Figure FDA0002371373260000024
时y的条件概率分布
Figure FDA0002371373260000025
整合计算两批次不同层次的一致性损失,将一致性损失作为无监督部分的损失值,其计算公式为:
Figure FDA0002371373260000026
其中
Figure FDA0002371373260000027
U指无标签数据,
Figure FDA0002371373260000028
是数据增强转换,
Figure FDA0002371373260000029
是当前参数θ的固定副本。
5.根据权利要求5所述联合U-Net++和UDA的微地震有效信号初至拾取方法,其特征在于,所述步骤S3中,所述最终损失值由使用权重因子平衡有监督损失和无监督损失得到,其表达式为:
final_loss=cross_entropy_loss+λconsistency_loss
λ为权重因子;
对于网络最终输出的final_loss值,若final_loss小于等于预设阈值,表明模型收敛性好,保留其训练数据;若final_loss值大于预设阈值,采用BP神经网络算法将最后一层得到的特征结果向前推进更新参数,直到模型收敛。
6.根据权利要求1所述联合U-Net++和UDA的微地震有效信号初至拾取方法,其特征在于,所述步骤S3中,所述半监督模型训练中使用随机梯度下降作为优化器训练样本,通过每个样本的损失函数对θ求导得到相应梯度进而更新参数θ,通过调参优化网络,其训练公式为:
Figure FDA0002371373260000031
Figure FDA0002371373260000032
其中θ是迭代参数,y是函数输出量,h(θ)是求出的拟合函数,j是参数个数,θ′是沿θ梯度负方向更新的得到的参数;
7.一种联合U-Net++和UDA的微地震有效信号初至拾取装置,其特征在于,所述装置包括:
数据集获取模块:获取原始微地震信号数据并进行预处理,得到微地震信号数据集;
数据集标记模块:根据微地震信号数据集的部分数据制作有标签数据集,其余为无标签数据集;
半监督训练模块:将有标签数据集和无标签数据集一并投入到U-Net++网络模型中分别进行基于高斯噪音的有监督训练和基于数据增强的无监督训练,将预测出的有监督部分的损失值和无监督部分的损失值整合为最终损失值,将所述最终损失值作为衡量整个网络模型质量的标准进行半监督模型训练;
初至拾取模块:通过训练好的网络模型进行微地震有效信号初至拾取。
8.根据权利要求7所述联合U-Net++和UDA的微地震有效信号初至拾取装置,其特征在于,所述半监督模型训练模块具体包括:
有监督训练单元:
用于将有标签数据集分为两批标签信号,一批保持不变,另一批通过添加高斯噪音进行干扰;将两批有标签信号放入U-Net++网络进行卷积、池化操作得到端对端的输出;
对于保持不变的数据,计算得到条件概率分布pθ(y|x),对于添加高斯噪音进行干扰的数据,计算得到条件概率分布pθ(y*|x,∈);
整合计算两批特征不同层次的交叉熵损失,将骰子系数引入交叉熵损失中,作为有监督部分的损失值,有监督部分的损失公式为:
Figure FDA0002371373260000041
其中x指代输入,y和y*分别指代真实值和预测值,b指第b个信号,N为批量大小,θ指模型参数,L指带标签的样本,∈指代噪音;
无监督训练单元:
用于将无标签数据集分为两批无标签信号,一批进行数据增强,另一批保持不变;将两批无标签信号放入U-Net++网络进行卷积、池化操作得到端对端的输出;
将上采样后得到的信号按如下方式处理:对于保持不变的数据,计算给定输入x时y的条件概率分布
Figure FDA0002371373260000042
对于经过增强的数据
Figure FDA0002371373260000043
计算给定输入
Figure FDA0002371373260000044
时y的条件概率分布
Figure FDA0002371373260000045
整合计算两批次不同层次的一致性损失,将一致性损失作为无监督部分的损失值,其计算公式为:
Figure FDA0002371373260000046
其中
Figure FDA0002371373260000047
U指无标签数据,
Figure FDA0002371373260000048
是数据增强转换,
Figure FDA0002371373260000049
是当前参数θ的固定副本;
最终损失值计算单元:
用于使用权重因子平衡有监督损失和无监督损失计算最终损失值,其表达式为:
final_loss=cross_entropy_loss+λconsistency_loss
λ为权重因子。
9.根据权利要求8所述联合U-Net++和UDA的微地震有效信号初至拾取装置,其特征在于,所述半监督模型训练模块中,使用随机梯度下降作为优化器训练样本,通过每个样本的损失函数对θ求导得到相应梯度进而更新θ,通过调参优化网络,其训练公式为:
Figure FDA0002371373260000051
Figure FDA0002371373260000052
其中θ是迭代参数,y是函数输出量,h(θ)是求出的拟合函数,j是参数个数,θ′是沿θ梯度负方向更新的得到的参数。
CN202010051627.5A 2020-01-17 2020-01-17 联合U-Net++和UDA的微地震有效信号初至拾取方法及装置 Pending CN111507155A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010051627.5A CN111507155A (zh) 2020-01-17 2020-01-17 联合U-Net++和UDA的微地震有效信号初至拾取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010051627.5A CN111507155A (zh) 2020-01-17 2020-01-17 联合U-Net++和UDA的微地震有效信号初至拾取方法及装置

Publications (1)

Publication Number Publication Date
CN111507155A true CN111507155A (zh) 2020-08-07

Family

ID=71863877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010051627.5A Pending CN111507155A (zh) 2020-01-17 2020-01-17 联合U-Net++和UDA的微地震有效信号初至拾取方法及装置

Country Status (1)

Country Link
CN (1) CN111507155A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112229952A (zh) * 2020-09-30 2021-01-15 重庆科技学院 一种检测化工园区有毒有害气体的方法
CN112580689A (zh) * 2020-11-23 2021-03-30 北京迈格威科技有限公司 神经网络模型的训练方法、应用方法、装置和电子设备
CN112926631A (zh) * 2021-02-01 2021-06-08 大箴(杭州)科技有限公司 金融文本的分类方法、装置及计算机设备
CN113255807A (zh) * 2021-06-03 2021-08-13 北京的卢深视科技有限公司 人脸解析模型训练方法、电子设备及存储介质
CN113591914A (zh) * 2021-06-28 2021-11-02 中国平安人寿保险股份有限公司 一种数据分类方法、装置、计算机设备和存储介质
CN113627073A (zh) * 2021-07-01 2021-11-09 武汉大学 一种基于改进的Unet++网络的水下航行器流场结果预测方法
CN114037059A (zh) * 2021-11-05 2022-02-11 北京百度网讯科技有限公司 预训练模型、模型的生成方法、数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106405640A (zh) * 2016-08-26 2017-02-15 中国矿业大学(北京) 基于深度信念神经网络的微震信号到时自动拾取方法
CN110619264A (zh) * 2019-07-30 2019-12-27 长江大学 基于UNet++的微地震有效信号识别方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106405640A (zh) * 2016-08-26 2017-02-15 中国矿业大学(北京) 基于深度信念神经网络的微震信号到时自动拾取方法
CN110619264A (zh) * 2019-07-30 2019-12-27 长江大学 基于UNet++的微地震有效信号识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QIZHE XIE等: "UNSUPERVISED DATA AUGMENTATION FOR CONSISTENCY TRAINING" *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112229952A (zh) * 2020-09-30 2021-01-15 重庆科技学院 一种检测化工园区有毒有害气体的方法
CN112229952B (zh) * 2020-09-30 2022-11-15 重庆科技学院 一种监测化工园区有毒有害气体的方法
CN112580689A (zh) * 2020-11-23 2021-03-30 北京迈格威科技有限公司 神经网络模型的训练方法、应用方法、装置和电子设备
CN112926631A (zh) * 2021-02-01 2021-06-08 大箴(杭州)科技有限公司 金融文本的分类方法、装置及计算机设备
CN113255807A (zh) * 2021-06-03 2021-08-13 北京的卢深视科技有限公司 人脸解析模型训练方法、电子设备及存储介质
CN113255807B (zh) * 2021-06-03 2022-03-25 北京的卢深视科技有限公司 人脸解析模型训练方法、电子设备及存储介质
CN113591914A (zh) * 2021-06-28 2021-11-02 中国平安人寿保险股份有限公司 一种数据分类方法、装置、计算机设备和存储介质
CN113627073A (zh) * 2021-07-01 2021-11-09 武汉大学 一种基于改进的Unet++网络的水下航行器流场结果预测方法
CN113627073B (zh) * 2021-07-01 2023-09-19 武汉大学 一种基于改进的Unet++网络的水下航行器流场结果预测方法
CN114037059A (zh) * 2021-11-05 2022-02-11 北京百度网讯科技有限公司 预训练模型、模型的生成方法、数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN111507155A (zh) 联合U-Net++和UDA的微地震有效信号初至拾取方法及装置
CN109993100B (zh) 基于深层特征聚类的人脸表情识别的实现方法
CN111243674B (zh) 一种碱基序列的识别方法、装置和存储介质
CN113642698B (zh) 地球物理测井智能解释方法、***及存储介质
CN114239749B (zh) 基于残差收缩及双向长短期记忆网络的调制识别方法
CN112233675B (zh) 一种基于分离卷积神经网络的语音唤醒方法及***
CN111695413A (zh) 联合U-Net和Temporal Ensembling的信号初至拾取方法及装置
CN114492521A (zh) 一种基于声振信号的随钻岩性智能识别方法与***
CN111882057A (zh) 一种面向时空序列数据建模的多阶段深度学习方法及应用
CN117272138B (zh) 一种基于参考道数据约束与深度学习的地磁数据去噪方法及***
CN117473305A (zh) 一种近邻信息增强的储层参数预测方法及***
CN117272232A (zh) 数据融合的隧道监测方法、装置、计算机设备及存储介质
CN115795369B (zh) 煤岩界面识别方法和装置
CN116386720A (zh) 基于深度学习和注意力机制的单细胞转录因子预测方法
CN114706128A (zh) 一种微地震资料噪声压制方法及***、存储介质和地震信息处理设备
CN113850185A (zh) 井下声发射源多分类方法、装置、终端、存储介质
CN116226623B (zh) 基于SegNet分段模型的标志层划分方法、装置和计算机设备
CN113487519B (zh) 一种基于人工智能的图像去雨方法
CN116204760B (zh) 一种基于gru网络的钻孔应变数据异常提取方法
CN117633658B (zh) 岩石储层岩性识别方法及***
CN117647837B (zh) 一种地震数据的初至拾取方法、***及计算机设备
CN116304996B (zh) 一种石质文物监测数据本体趋势的提取方法和装置
CN116469398A (zh) 一种基于二进制模式和pba-ann的电机故障诊断方法
CN117669795A (zh) 基于深度学习的致密气藏产量预测方法及***
CN117711505A (zh) 一种酶动力学参数预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200807

RJ01 Rejection of invention patent application after publication