CN107798340A - 基于空间约束多自编码器的多元地球化学异常识别方法 - Google Patents
基于空间约束多自编码器的多元地球化学异常识别方法 Download PDFInfo
- Publication number
- CN107798340A CN107798340A CN201710911714.1A CN201710911714A CN107798340A CN 107798340 A CN107798340 A CN 107798340A CN 201710911714 A CN201710911714 A CN 201710911714A CN 107798340 A CN107798340 A CN 107798340A
- Authority
- CN
- China
- Prior art keywords
- self
- sample
- geochemical
- encoding
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Geophysics And Detection Of Objects (AREA)
Abstract
本发明公开了基于空间约束多自编码器的多元地球化学异常识别方法,包括以下步骤:数据聚类;空间域划分;自监督学习;异常值计算;异常地图生成。本发明将多元数据聚类、空间滤波与自编码神经网络结合,兼顾多种地球化学元素间的复杂关系和空间分布特征,从而有效提高化探异常识别的精确性,为复杂地质条件下利用多元化探数据进行异常识别提供了较为实用可靠的科学方法。
Description
技术领域
本发明涉及地球化探异常识别领域、人工智能应用领域,尤其涉及一种基于空间约束多自编码器的多元地球化学异常识别方法。
背景技术
地球化探异常识别是矿产勘探的重要工作之一,地质学家将化探异常与其他地质信息结合进行综合判断来寻找潜在矿田。基于频域的异常识别法被广泛使用,如箱线图法、均值法、多元数据分析法等。但这些方法缺少考虑地球化学数据的一个重要特征---地球化学场的空间性。分形/多重分形、克里金方法、奇异值方法、空间因素分析法、趋势面法等考虑了空间近邻样本的相关性,在化探异常识别领域有突出表现。随着人工智能领域的技术发展和机器学习的广泛应用,神经网络对深层次隐含结构特征的学习能力使其在化探异常识别领域引起了广泛关注。已有的研究表明,深度玻尔兹曼、深度置信网络等神经网络模型在复杂地质环境的异常识别中表现不俗。然而,由于基于单一神经网络模型的化探异常识别方法缺乏考虑区域范围的地球化学背景差异,不能因地制宜地区分空间差异,造成模型参数训练难度较大,对包含弱异常的潜在矿产资源区域识别准确率低。总之,目前缺乏综合考虑地球化学背景空间差异、数据非正态分布、以及多化学元素非线性关系的化探异常识别方法。
发明内容
有鉴于此,本发明的实施例提供了一种以实现复杂地质环境下的多元化探异常识别,为区域性找矿、圈定潜在含矿单元提供技术支持的基于空间约束多自编码器的多元地球化学异常识别方法。
本发明的实施例提供基于空间约束多自编码器的多元地球化学异常识别方法,包括以下步骤:
步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;
步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;
步骤3.自监督学习,即针对每个空间域,利用多个结构特征不同的自编码器组件构建多自编码器神经网络模型(Multi-Auto-Encoder,MAE),并利用相应空间域内的样本数据进行训练,选取误差最小的自编码器作为该空间域的最优模型;
步骤4.异常值计算,即计算每个化探样本原始数据与相应空间域最优自编码器输出值之间的欧式距离;
步骤5.异常地图生成,即将样本异常值映射到样本所在地理位置,反映化探异常的地理空间分布。
进一步,所述步骤1中,分析不同聚类因素对化探样本数据聚类结果的影响,并查看不同聚类因素条件下的聚类结果是否在空间分布上具有差异。
进一步,所述聚类因素包括聚类数、聚类方法和相似性度量方式,所述聚类方法为无监督方法,所述聚类方法包括K-means方法和SOM方法。
进一步,所述步骤2的具体步骤为:
步骤2.1.利用圆形窗口的中值滤波方法对聚类结果进行滤波,并多次迭代,直至各个样本组再不发生明显变化;
步骤2.2.设定空间约束规则,并利用空间约束规则进一步优化样本组划分;
步骤2.3.将属于同组但空间分离的样本块划分为独立样本组,最终生成的多个样本组,在地理空间上的表现为多个相互独立且各自内部连续的区块,即空间域。
进一步,所述步骤3中,针对每个空间域,利用多个结构特征不同的自编码器组件构建多个自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,每个自编码器的训练在误差不再变化时停止,选取误差最小的自编码器作为该空间域的最优模型。
进一步,样本异常值的计算公式如下:
l:样本异常值
xk:化探样本原始数据中元素k的含量;
xk′:相应空间域最优自编码器输出数据中元素k的含量;
n:化学元素的个数。
与现有技术相比,本发明具有以下有益效果:
(1)将多元数据聚类、空间滤波与自编码神经网络结合,兼顾多种地球化学元素间的复杂关系和空间分布特征,从而有效提高化探异常识别的精确性,为复杂地质条件下利用多元化探数据进行异常识别提供了较为实用可靠的科学方法。
(2)利用自编码神经网络进行自监督学习,可以避免化探异常提取方法中常用的正态分布(或其他已知分布)假设,提取复杂地质环境下的化探数据的普遍规律(即地球化学背景),减少人为干预,从而为异常值计算提供有效基础。
(3)利用聚类和滤波进行空间域划分,可以提取空间域内自相似性特征,区分地球化学背景的空间差异,有利于不同背景条件下化学异常的精细提取,减少异常圈定范围,提高潜在矿质异常识别能力;另外,相对于全局建模和训练,针对每个空间域单独建模并训练,可以降低神经网络的训练难度,提高收敛速度和可靠性。
(4)本方法的异常识别效果优于基于全局单一多层自编码器的异常识别效果,其完全数据驱动的异常识别方式,避免了“就矿找矿”方式对非常规矿产资源的不适应性。
附图说明
图1是本发明基于空间约束多自编码器的多元地球化学异常识别方法的流程图。
图2是本发明实施例的闽西铁矿带研究区的5个化学元素(Cu、Zn、Mn、 Pb和Fe2O3)的化探数据直方图。
图3是本发明对原始数据进行分类形成样本块的效果图。
图4是本发明进行空间域划分的流程图。
图5是本发明对多个空间域数据进行MAE模型训练的流程图。
图6是本发明实施例中输出的化探异常地图以及利用已知铁矿点对异常地图的ROC曲线评估,(a)输出的化探异常地图;(b)ROC评估曲线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。
请参考图1,本发明的实施例提供了基于空间约束多自编码器的多元地球化学异常识别方法,包括以下步骤:
步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;
本实施例中,对Cu-Zn-Mn-Pb-Fe2O3化探样本数据(如图2所示)进行归一化和聚类,分析不同聚类因素(包括聚类数、聚类方法、相似性度量方式)对 Cu-Zn-Mn-Pb-Fe2O3化探样本数据聚类结果的影响,查看不同影响因素条件下的聚类结果(即样本组)是否在空间分布上具有较大差异。
在本实施例中,对于研究区内1:20万化探数据,不同聚类方法(如K-means、 SOM等无监督方法)以及不同相似性度量对聚类结果影响不大。本实施例采用 K-means方法进行聚类。当聚类数大于3类时,样本组的空间分布过于碎片化,不符合地质条件(包括断层、岩体、地层)的分布,故聚类数设为2类。聚类结果中,被划分到同组且空间邻接的多个样本形成样本块,如图3所示。
步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;
具体步骤为:
步骤2.1.利用圆形窗口的中值滤波方法对聚类结果进行滤波,目的是消除占据较大空间范围的样本块中夹杂的异类数据细小碎片,并多次迭代,直至各个样本组再不发生明显变化,得到如图4中步骤2.1对应的效果图;
步骤2.2.设定空间约束规则,并利用空间约束规则进一步优化样本组划分;本实施例将面积小于研究区总面积10%的小样本块融合到周围的大面积样本块中,得到如图4中步骤2.2对应的效果图;
步骤2.3.将属于同组但空间分离的样本块划分为独立样本组,最终生成的多个样本组,在地理空间上的表现为多个相互独立且各自内部连续的区块,即空间域,即图4中步骤2.3对应的效果图。
步骤3.自监督学习,即针对每个空间域,利用多个结构特征不同的自编码器组件构建多自编码器神经网络模型(Multi-Auto-Encoder,MAE),并利用相应空间域内的样本数据进行训练,选取误差最小的自编码器作为该空间域的最优模型;
如图5所示,针对每个空间域,优选利用30个结构特征不同的自编码器组件构建多自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,每个多自编码器的训练在误差不再变化时停止,选取误差最小的自编码器作为该空间域的最优模型。
步骤4.异常值计算,即计算每个化探样本原始数据与相应空间域的最优自编码器输出值之间的欧式距离,计算公式如下:
l:样本异常值
xk:化探样本原始数据中元素k的含量;
xk′:相应空间域的最优自编码器输出数据中元素k的含量;
n:化学元素的个数。
步骤5.异常地图生成,即将样本异常值映射到样本所在地理位置,反映化探异常的地理空间分布,如图6所示。
异常识别效果评价:利用研究区内已知矿点对异常地图进行评估,采用ROC 曲线,计算AUC值。AUC值大于50%,证明异常识别的有效性。本实施例中,AUC 值为89%(图6),优于全局单一自编码器模型的AUC值(77%)。
本发明将多元数据聚类、空间滤波与自编码神经网络结合,兼顾多种地球化学元素间的复杂关系和空间分布特征,从而有效提高化探异常识别的精确性,为复杂地质条件下利用多元化探数据进行异常识别提供了较为实用可靠的科学方法;利用自编码神经网络进行自监督学习,可以避免化探异常提取方法中常用的正态分布(或其他已知分布)假设,提取复杂地质环境下的化探数据的普遍规律(即地球化学背景),减少人为干预,从而为异常值计算提供有效基础;利用聚类和滤波进行空间域划分,可以提取空间域内自相似性特征,区分地球化学背景的空间差异,有利于不同背景条件下化学异常的精细提取,减少异常圈定范围,提高潜在矿质异常识别能力;另外,相对于全局建模和训练,针对每个空间域单独建模并训练,可以降低神经网络的训练难度,提高收敛速度和可靠性;本方法的异常识别效果优于基于全局单一多层自编码器的异常识别效果,其完全数据驱动的异常识别方式,避免了“就矿找矿”方式对非常规矿产资源的不适应性。
在不冲突的情况下,本文中上述实施例及实施例中的特征可以相互结合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,包括以下步骤:
步骤1.数据聚类,即通过对多元化探样本数据进行归一化和聚类,生成多个样本组;
步骤2.空间域划分,即根据样本组的地理空间分布,利用中值滤波和空间约束规则消除碎片,生成多个空间域;
步骤3.自监督学习,即针对每个空间域构建多个结构特征不同的自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,选取误差最小的自编码器作为该空间域的最优模型;
步骤4.异常值计算,即计算每个化探样本原始数据与相应空间域的最优自编码器输出值之间的欧式距离;
步骤5.异常地图生成,即将样本异常值映射到样本所在地理位置,反映化探异常的地理空间分布。
2.根据权利要求1所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,所述步骤1中,分析不同聚类因素对化探样本数据聚类结果的影响,并查看不同聚类因素条件下的聚类结果是否在空间分布上具有差异。
3.根据权利要求2所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,所述聚类因素包括聚类数、聚类方法和相似性度量方式,所述聚类方法为无监督方法,所述聚类方法包括K-means方法和SOM方法。
4.根据权利要求1所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,所述步骤2的具体步骤为:
步骤2.1.利用圆形窗口的中值滤波方法对聚类结果进行滤波,并多次迭代,直至各个样本组再不发生明显变化;
步骤2.2.设定空间约束规则,并利用空间约束规则进一步优化样本组划分;
步骤2.3.将属于同组但空间分离的样本块划分为独立样本组,直至最终生成的多个样本组在地理空间上的表现为多个相互独立且各自内部连续的区块,即空间域。
5.根据权利要求1所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,所述步骤3中,针对每个空间域,利用多个结构特征不同的自编码器组件构建多个自编码器神经网络模型,并利用相应空间域内的样本数据进行训练,每个自编码器的训练在误差不再变化时停止,选取误差最小的自编码器作为该空间域的最优模型。
6.根据权利要求5所述的基于空间约束多自编码器的多元地球化学异常识别方法,其特征在于,样本异常值的计算公式如下:
<mrow>
<mi>l</mi>
<mo>=</mo>
<msqrt>
<mrow>
<msubsup>
<mi>&Sigma;</mi>
<mrow>
<mi>k</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</msubsup>
<msup>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>-</mo>
<msubsup>
<mi>x</mi>
<mi>k</mi>
<mo>&prime;</mo>
</msubsup>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
l:样本异常值
xk:化探样本原始数据中元素k的含量;
xk′:相应空间域的最优自编码器输出数据中元素k的含量;
n:化学元素的个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710911714.1A CN107798340B (zh) | 2017-09-29 | 2017-09-29 | 基于空间约束多自编码器的多元地球化学异常识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710911714.1A CN107798340B (zh) | 2017-09-29 | 2017-09-29 | 基于空间约束多自编码器的多元地球化学异常识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107798340A true CN107798340A (zh) | 2018-03-13 |
CN107798340B CN107798340B (zh) | 2018-10-26 |
Family
ID=61533959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710911714.1A Expired - Fee Related CN107798340B (zh) | 2017-09-29 | 2017-09-29 | 基于空间约束多自编码器的多元地球化学异常识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107798340B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108710777A (zh) * | 2018-05-21 | 2018-10-26 | 中国地质大学(武汉) | 基于多卷积自编码神经网络的多元化探异常识别方法 |
CN110334228A (zh) * | 2019-07-09 | 2019-10-15 | 广西壮族自治区基础地理信息中心 | 一种基于深度学习的互联网问题地图筛查方法 |
CN111639067A (zh) * | 2020-05-21 | 2020-09-08 | 中国地质大学(武汉) | 多特征融合卷积自编码的多元地球化学异常识别方法 |
CN112990322A (zh) * | 2021-03-23 | 2021-06-18 | 中国地质调查局发展研究中心 | 一种确定地球化学异常识别临界值的方法、装置及设备 |
WO2022095434A1 (zh) * | 2020-11-09 | 2022-05-12 | 平安科技(深圳)有限公司 | 基于自编码器的数据异常识别方法、装置和计算机设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103345566A (zh) * | 2013-02-26 | 2013-10-09 | 郑有业 | 基于地质内涵的化探异常识别与评价方法 |
US20140330519A1 (en) * | 2013-05-01 | 2014-11-06 | Heiko Mueller | Method to identify multivariate anomalies by computing similarity and dissimilarity between entities and considering their spatial interdependency |
-
2017
- 2017-09-29 CN CN201710911714.1A patent/CN107798340B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103345566A (zh) * | 2013-02-26 | 2013-10-09 | 郑有业 | 基于地质内涵的化探异常识别与评价方法 |
US20140330519A1 (en) * | 2013-05-01 | 2014-11-06 | Heiko Mueller | Method to identify multivariate anomalies by computing similarity and dissimilarity between entities and considering their spatial interdependency |
Non-Patent Citations (2)
Title |
---|
YIHUI XIONG ET AL: "Recognition of geochemical anomalies using a deep autoencoder", 《COMPUTERS & GEOSCIENCES》 * |
龚鹏 等: "矿产预测中区域化探异常的识别和评价", 《地球科学(中国地质大学学报)》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108710777A (zh) * | 2018-05-21 | 2018-10-26 | 中国地质大学(武汉) | 基于多卷积自编码神经网络的多元化探异常识别方法 |
CN110334228A (zh) * | 2019-07-09 | 2019-10-15 | 广西壮族自治区基础地理信息中心 | 一种基于深度学习的互联网问题地图筛查方法 |
CN111639067A (zh) * | 2020-05-21 | 2020-09-08 | 中国地质大学(武汉) | 多特征融合卷积自编码的多元地球化学异常识别方法 |
CN111639067B (zh) * | 2020-05-21 | 2023-05-30 | 中国地质大学(武汉) | 多特征融合卷积自编码的多元地球化学异常识别方法 |
WO2022095434A1 (zh) * | 2020-11-09 | 2022-05-12 | 平安科技(深圳)有限公司 | 基于自编码器的数据异常识别方法、装置和计算机设备 |
CN112990322A (zh) * | 2021-03-23 | 2021-06-18 | 中国地质调查局发展研究中心 | 一种确定地球化学异常识别临界值的方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107798340B (zh) | 2018-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107798340B (zh) | 基于空间约束多自编码器的多元地球化学异常识别方法 | |
Wang et al. | Marcellus shale lithofacies prediction by multiclass neural network classification in the Appalachian Basin | |
Koike et al. | Neural network-based estimation of principal metal contents in the Hokuroku district, northern Japan, for exploring Kuroko-type deposits | |
CN104537375B (zh) | 一种基于卫星遥感数据的褐铁矿化信息提取方法 | |
CN109389128A (zh) | 电成像测井图像特征自动提取方法及装置 | |
CN110609320B (zh) | 一种基于多尺度特征融合的叠前地震反射模式识别方法 | |
Tadeusiewicz | Neural networks in mining sciences–general overview and some representative examples | |
CN103487832A (zh) | 一种三维地震信号中的有监督波形分类方法 | |
Libohova et al. | Geomorphons: Landform and property predictions in a glacial moraine in Indiana landscapes | |
Brandmeier et al. | Boosting for mineral prospectivity modeling: A new GIS toolbox | |
Jung et al. | Training image-based scenario modeling of fractured reservoirs for flow uncertainty quantification | |
CN105467449B (zh) | 基于地震分级敏感属性融合的深层薄互储层定量表征方法 | |
CN104181597B (zh) | 一种基于叠前地震数据的地震相分析方法 | |
CN108710777A (zh) | 基于多卷积自编码神经网络的多元化探异常识别方法 | |
Eskandari et al. | Reservoir Modelling of Complex Geological Systems--A Multiple-Point Perspective | |
CN110412662A (zh) | 基于地震多属性深度学习的薄互层储层预测方法 | |
Chudasama et al. | Target-scale prospectivity modeling for gold mineralization within the rajapalot Au-Co project area in northern Fennoscandian Shield, Finland. Part 1: application of knowledge-driven-and machine learning-based-hybrid-expert systems for exploration targeting and addressing model-based uncertainties | |
CN109613623A (zh) | 一种基于残差网络的岩性预测方法 | |
CN109447158A (zh) | 一种基于不平衡数据的Adaboost有利储层发育区预测方法 | |
Kang et al. | Managing Uncertainty in Geological Scenarios Using Machine Learning‐Based Classification Model on Production Data | |
CN115690772A (zh) | 基于深度学习的重力断层自动识别方法 | |
Xu et al. | The use of 3D convolutional autoencoder in fault and fracture network characterization | |
Esmaeiloghli et al. | Optimizing the grade classification model of mineralized zones using a learning method based on harmony search algorithm | |
Fan et al. | Quantitative Prediction of Low‐Permeability Sandstone Grain Size Based on Conventional Logging Data by Deep Neural Network‐Based BP Algorithm | |
Zhou | Data-Driven Modeling and Prediction for Reservoir Characterization and Simulation Using Seismic and Petrophysical Data Analyses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181026 Termination date: 20200929 |