CN112150582B - 一种面向多模态数据的地质剖面图近似表达方法 - Google Patents

一种面向多模态数据的地质剖面图近似表达方法 Download PDF

Info

Publication number
CN112150582B
CN112150582B CN202010848638.6A CN202010848638A CN112150582B CN 112150582 B CN112150582 B CN 112150582B CN 202010848638 A CN202010848638 A CN 202010848638A CN 112150582 B CN112150582 B CN 112150582B
Authority
CN
China
Prior art keywords
geological
data
information
rock stratum
map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010848638.6A
Other languages
English (en)
Other versions
CN112150582A (zh
Inventor
吴亮
王斌
李文佳
邱芹军
陈占龙
刘昊
周媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010848638.6A priority Critical patent/CN112150582B/zh
Publication of CN112150582A publication Critical patent/CN112150582A/zh
Application granted granted Critical
Publication of CN112150582B publication Critical patent/CN112150582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种面向多模态数据的地质剖面图近似表达方法。首先,通过自然语言处理(NLP)有效提取拟构建地质剖面图的成图数据;其次,通过提取到的地质剖面线起始点和终止点的经纬度信息获取该区域的DEM数据,进而获取起始点、终止点对应的地质剖面线;最后,通过结构化数据和提取的地质剖面线构建完整的研究区地质剖面图近似表示。本发明的填图过程避免了人工绘制的繁琐,填图数据容易获得,且填图效果与原始地质剖面图差异较小。本发明的结果以矢量形式展示,易保存和编辑以及进行相关的空间分析,具有完整的几何形态和属性信息,可供后续的研究决策分析,以及推演该区域各岩层的演化等研究。

Description

一种面向多模态数据的地质剖面图近似表达方法
技术领域
本发明涉及计算机视觉中的数字化填图领域,具体为一种面向多模态数据的地质剖面图近似表达方法。
背景技术
地质剖面图是地质内容最基本的表达形式之一,是将各种勘查工程(钻探、坑探等)及不同岩层、岩体、构造形态等地质和矿产现象沿不同方位二维投影,并用不同的岩性花纹、符号及各种注记绘制的二维图形。地质剖面图是沿某一选定方向,垂直于水平面的二维平面图(或投影)。地质平剖面图对分析地层结构具有重要意义,是整个地质工作成果的基础和先导图件,可以整体地反映所调查区域的地质状况,发挥着指导地质勘查、成矿预测、矿山设计与生产决策等的重要作用。传统的地质信息的表达方式主要有两种:一种是采用平面图和剖面图来表达,其实质就是将三维地质环境中的地质现象投影到某一平面(XY平面、XZ平面或YZ平面)上进行表达;另一种是采用透视和轴侧投影原理,对三维地质环境中的地质现象进行透视制图,或是将它们投影到两个以上的平面上进行组合表达,以增强三维视觉效果,提高人们对目标体的三维理解。而二维平面图或剖面图是构建三维立体地质信息表达的基础,所以针对地质剖面图的填图研究对后续研究三维建模大有裨益。
图件的制作是实际工作中投入技术力量最多的、最经常的一项基础性工作。现在的地质剖面图多为工作人员野外作业手绘后再进行数字化的成图,成图效果好但耗时耗力。近年来,自动化成图的研究愈发得到研究者们的青睐,地质剖面图的自动数字化也在不断发展中。当前的地质剖面图数字化填图多以钻孔数据为主,数据收集较为困难,且生成的图像不能编辑,不能进行一些必要的空间分析。目前,地质图件构图多以数据驱动构建,数据驱动的建模方法是指根据建模数据直接建模的方法。按照数据源的不同,数据驱动的建模方法可分为基于钻孔、剖面、平面地质图和多源数据融合的建模方法。相较于数据驱动的建模方法,知识驱动的建模方法在建模过程中增加了地质知识的应用。按知识的主要应用方式,该建模方法又可分为两种:一种是基于知识规则对建模数据进行综合分析后,再进行模型构建的非参数化建模方法;另一种是指利用定量的数学规律(如代数方程、微分方程组、曲线方程和拟合函数等),来描述地质体空间展布特征的参数化建模方法。知识驱动的建模方法能够弥补数据驱动的建模方法的不足,有利于建模的智能化和自动化,是未来的发展趋势,其填图效果更加丰满和具有说服力。总之,无论是数据驱动还是知识驱动下的数字化填图在地质填图领域都发挥着各自的优势,数据驱动下的填图方法在平面图、剖面图、三维立体图中都有深入的探究结果,而知识驱动目前更多应用于三维立体图件的填图。
发明内容
本发明针对现有地质剖面图填图技术的数据获取困难,填图效率慢的缺陷,结合地质报告中含有丰富的填图数据以及DEM数据,提出了一种面向多模态数据的地质剖面图近似表达方法。该方法有效缓解了地质剖面图填图数据获取困难的问题,且填图效率高,最终结果属于几何形态和属性信息相结合的展现形式,易编辑和进行必要的空间分析。
本发明解决上述技术问题所采用的技术方案是:一种多模态数据关联的地质剖面图近似表达方法。
一种面向多模态数据的地质剖面图近似表达方法,包括以下步骤:
S1:获取拟数字化填图区域的地质区域调查报告,对地质区域调查报告的文本数据做相应的预处理;
S2:利用S1预处理后的地质报告文本,通过NLP中的正则表达式抽取地质区域调查报告中的填图数据,包括:地质剖面图填图区域范围经纬度信息、各岩层的属性信息、倾角信息和厚度信息,并存储在数据库中;
S3:根据S2抽取到的地质剖面图填图区域范围经纬度信息在相应区域的DEM数据(空间分辨率为8米)中提取相应的地质剖面线,通过反距离权重法确定地质剖面线上内插点的高程值;
S4:根据S3获得的高程点,用最小二乘法多项式拟合所述地质剖面线;
S5:为各岩层界面线设置一个统一长度,然后根据S2抽取的填图数据和S4获得的地质剖面线确定新的各岩层界面线;
S6:根据S4得到的地质剖面线和S5确定的各岩层界面线实现各岩层的对象化进而得到对象化的多边形岩层,构建拓扑关系,并检查有无拓扑错误,若无拓扑错误,则直接进入S7,否则,更改拓扑错误后,进入S7;
S7:在S6所获得的对象化的多边形岩层添加S2已经抽取到各岩层的属性信息、倾角信息和厚度信息,从而完成地质剖面图的近似表达。
进一步地,步骤S1中,首先,对已获得的地质区域调查报告截取拟数字化填图部分的文本信息,然后,将截取部分的文本信息由.pdf格式转为.txt格式。
进一步地,步骤S2中,对S1获取的拟数字化填图部分的.txt文本通过其填图数据信息格式设置正则表达式,从而抽取出填图信息,并存储为结构化数据导入数据库中。
进一步地,步骤S3中,通过S2抽取获得的地质剖面图填图区域范围经纬度信息获取相应范围内的DEM数据(空间分辨率为8米),直线连接相应经纬度的点,并将此直线以0.1米等距离打断,通过反距离权重插值法获得各端点高程值。
进一步地,步骤S4中,以每隔0.1米为一个单位的距离设置x坐标值,S3获得的高程点的值作为y坐标,通过最小二乘法多项式拟合这些散点,从而获得拟合后的地质剖面线。
进一步地,步骤S5中,首先,为各岩层界面线设置一个统一长度,其次,依次读取S2中抽取到的岩层厚度值和岩层倾角数据值,然后,假设存在一个点,同时满足以下两个条件:
(1)该点到相邻岩层界面线左侧的距离,满足读取到的岩层厚度值;
(2)该点满足拟合后的地质剖面线多项式方程;
如果满足上述条件,则记录该点,并通过该点结合已读取的岩层倾角和岩层界线长度绘制新的各岩层界面线,否则,更改制图比例尺后重新执行该步骤。
进一步地,步骤S6中,通过以上5个步骤后,已构建完整的地质剖面线和各岩层界面线,为实现岩层的对象化编辑和分析,将各岩层界面线终点连接起来,从而形成封闭的多边形连接线,最后,通过矢量线转面的工具完成各岩层生成对象化的多边形岩层,并构建拓扑关系并检查有无拓扑错误,若无拓扑错误,则直接进入S7;否则,更改拓扑错误后进入S7;
进一步地,步骤S7中,为S6形成的对象化的多边形岩层地质剖面原图添加S2已经抽取到各岩层的属性信息、倾角信息和厚度信息,从而完成对象化的多边形岩层的地质剖面图近似表达。
实施本发明的一种面向多模态数据关联的地质剖面图近似表达方法,具有以下有益效果:
(1)本发明将地质报告文本数据和DEM数据有效关联起来,从而解决了地质剖面图填图数据获取困难的缺陷;
(2)本发明将各岩层实现了对象化形式的表达,实现了完整的几何形态和属性信息的双重表达,可供后续进行相关的空间分析,可随时进行适当的编辑修改。
附图说明
图1为本发明的技术流程图;
图2为地质文档成图数据抽取后存储成的结构化数据;
图3为DEM数据生成的等距离高程点数据;
图4为内插高程点高程计算示意图;
图5为岩层参数表达;
图6为构建界面线流程图;
图7为生成的地质剖面轮廓多边形;
图8为地质剖面图近似表达结果图;
图9为各岩层的属性信息表示。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参考附图1,图1为本发明方法的技术流程图,本发明提出的一种面向多模态数据关联的地质剖面图近似表达方法,包括以下步骤:
步骤S1中,首先截取地质区域调查报告(.pdf格式)中拟填图区域所有描述性文本的页码范围,其次,将截取到地质区域调查报告由.pdf格式转化为.txt格式。
步骤S2中,对步骤S1中获得的.txt文本内容利用正则表达式过滤掉一些表格内容及其他噪声文本,并针对地质区域调查报告中填图数据撰写的格式,设置合理的正则表达式抽取出拟构建地质剖面图的填图数据,并将抽取出的填图数据导入数据库中存储为结构化数据,包括拟构建区域范围经纬度信息,各岩层的属性信息,倾角信息和厚度信息。其抽取结果请参考图2。
步骤S3中,利用S2抽取到的拟构建地质剖面图区域经纬度信息获取该范围DEM数据,直线连接相应经纬度点作为地质剖面图的起终点(A点和B点),并将此直线等距离(0.1m)打断,其中,获得的DEM数据范围和起终点连线结果请参考图3。最后,通过反距离权重插值法获得各端点(请参考图4中P点)高程值,反距离权重插值法高程点计算公式如下:
Figure GDA0003610084170000061
其中,由于获取的DEM属于格网类型,取n=4,即用周围四个点估计内插未知点高程值。Z表示未知点高程估计值,Zi为已知控制点的高程,di为已知数据点到未知内插高程点的距离。对于起始点和终止点A和B的高程值,格网DEM可通过其周围的4个格网点内插出。
步骤S4中,以距离(每隔0.1米为一个单位)为x坐标,步骤S3获得的内插高程点的值作为y坐标,通过最小二乘法多项式拟合这些散点,从而获得拟合后的地质剖面线,最小二乘法拟合公式如下:
Figure GDA0003610084170000062
其中,p表示函数中需要确定的一组参数,yi表示控制点高程值,函数为最终拟合函数。当S(p)取最小值时,则此时的系数为最佳的拟合状态。
当利用最小二乘法获得高程点的最优拟合函数时,绘制出这条拟合后的曲线,即为拟合后的地质剖面线。
步骤S5中,首先,为各岩层界面线自定义设置一个统一长度L,其次,假设存在这样一个点,同时满足以下两个条件:(1)该点到相邻岩层界面线(左侧)的距离,使其满足读取到的厚度信息;(2)该点需满足拟合后的地质剖面线多项式方程。如果同时满足条件,则记录该点,否则,更改制图比例尺后重新执行该步骤。然后,依次读取步骤S2中抽取到的岩层厚度Hi和岩层倾角数据,i表示岩层实体类别编号,并结合设置的岩层界面线长度L绘制该点处的界面线,得到新的各岩层界面线,其中,各参数表示请参考图5。该步骤流程图请参考图6。其中,点到直线距离公式如下:
Figure GDA0003610084170000071
其中A,B,C分别为前一条界面线(左侧)的直线方程系数,x0和y0为满足上述两个条件时记录的点的横坐标和纵坐标。
步骤S6中,通过以上5个步骤后,已构建完整的地质剖面线和各岩层界面线。为实现岩层的对象化编辑和分析,将各岩层界面线终点连接起来,从而形成封闭的多边形连接线,请参考图7,最后,通过矢量线转面的形式实现各岩层形成独立的多边形,并构建拓扑关系以及检查是否存在拓扑错误,若有拓扑错误,则修改拓扑错误后进入S7,否则直接进入S7。
步骤S7中,为S6形成的各个对象化岩层添加S2已抽取的属性信息,包括倾角信息,以及各岩层的描述信息和厚度信息,从而完成几何形态和属性信息结合的地质剖面图近似表达,其结果请参考图8和图9。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (6)

1.一种面向多模态数据的地质剖面图近似表达方法,其特征在于:包括以下步骤:
S1:获取拟数字化填图区域的地质区域调查报告,对地质区域调查报告的文本数据做相应的预处理;
S2:利用S1预处理后的地质报告文本,通过NLP中的正则表达式抽取地质区域调查报告中的填图数据,包括:地质剖面图填图区域范围经纬度信息、各岩层的属性信息、倾角信息和厚度信息,并存储在数据库中;
S3:根据S2抽取到的地质剖面图填图区域范围经纬度信息在相应区域的DEM数据中提取相应的地质剖面线,通过反距离权重法确定地质剖面线上内插点的高程值;
S4:根据S3获得的高程点,用最小二乘法多项式拟合所述地质剖面线;
S5:为各岩层界面线设置一个统一长度,然后根据S2抽取的填图数据,包括倾角和厚度信息,结合S4获得的地质剖面线确定新的岩层界面线;
步骤S5中,首先,为各岩层界面线设置一个统一长度,其次,依次读取S2中抽取到的厚度信息值和岩层倾角数据值,然后,假设存在一个点,同时满足以下两个条件:
(1)该点到相邻岩层界面线左侧的垂直距离,满足读取到的厚度信息值;
(2)该点满足拟合后的地质剖面线多项式方程;
如果满足上述条件,则记录该点,并通过该点结合已读取的岩层倾角和岩层界线长度绘制新的岩层界面线,否则,更改制图比例尺重新执行该步骤;
S6:根据S4得到的地质剖面线和S5确定的各岩层界面线实现各岩层的对象化进而得到对象化的多边形岩层,构建拓扑关系,并检查有无拓扑错误,若无拓扑错误,则直接进入S7,否则,更改拓扑错误后再进入S7;
步骤S6中,通过以上5个步骤后,已构建完整的地质剖面线和各岩层界面线,为实现岩层的对象化编辑和分析,将各岩层界面线终点连接起来,从而形成封闭的多边形连接线,最后,通过矢量线转面的工具完成各岩层生成对象化的多边形岩层,并构建拓扑关系并检查有无拓扑错误,若无拓扑错误,则直接进入S7,否则,更改拓扑错误后再进入S7;
S7:为S6所获得的地质剖面原图各岩层添加S2已经抽取到各岩层的属性信息、倾角信息和厚度信息,从而完成地质剖面图的近似表达,获得最终具有属性信息和几何形状信息的地质剖面成果图。
2.根据权利要求1所述的一种面向多模态数据的地质剖面图近似表达方法,其特征在于:
步骤S1中,首先,对已获得的地质区域调查报告截取拟数字化填图部分的文本信息;然后,将截取部分的文本信息由.pdf格式转为.txt格式。
3.根据权利要求2所述的一种面向多模态数据的地质剖面图近似表达方法,其特征在于:
步骤S2中,对S1截取的拟数字化填图部分的.txt文本通过其填图数据信息格式设置正则表达式,从而抽取出填图信息,并存储为结构化数据导入数据库中。
4.根据权利要求1所述的一种面向多模态数据的地质剖面图近似表达方法,其特征在于:
步骤S3中,通过S2抽取获得的地质剖面图填图区域范围经纬度信息获取相应范围内的DEM数据,直线连接相应经纬度的点,并将此直线以0.1米等距离打断,通过反距离权重插值法获得各端点高程值。
5.根据权利要求1所述的一种面向多模态数据的地质剖面图近似表达方法,其特征在于:
步骤S4中,以每隔0.1米为一个单位的距离设置x坐标值,S3获得的高程点的值作为y坐标,通过最小二乘法多项式拟合这些散点,从而获得拟合后的地质剖面线。
6.根据权利要求1所述的一种面向多模态数据的地质剖面图近似表达方法,其特征在于:
步骤S7中,为S6形成的对象化的各多边形岩层地质剖面原图添加S2已经抽取到各岩层的属性信息、倾角信息和厚度信息,从而完成对象化的多边形岩层的地质剖面图近似表达。
CN202010848638.6A 2020-08-21 2020-08-21 一种面向多模态数据的地质剖面图近似表达方法 Active CN112150582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010848638.6A CN112150582B (zh) 2020-08-21 2020-08-21 一种面向多模态数据的地质剖面图近似表达方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010848638.6A CN112150582B (zh) 2020-08-21 2020-08-21 一种面向多模态数据的地质剖面图近似表达方法

Publications (2)

Publication Number Publication Date
CN112150582A CN112150582A (zh) 2020-12-29
CN112150582B true CN112150582B (zh) 2022-06-21

Family

ID=73888088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010848638.6A Active CN112150582B (zh) 2020-08-21 2020-08-21 一种面向多模态数据的地质剖面图近似表达方法

Country Status (1)

Country Link
CN (1) CN112150582B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114581556B (zh) * 2022-03-10 2022-12-27 青海省地质调查院 一种区域地质调查中的数字填图方法
CN116597043B (zh) * 2023-05-11 2023-10-31 青海省地质调查院(青海省地质矿产研究院、青海省地质遥感中心) 一种基于地质调查的数字填图方法及***
CN117132723A (zh) * 2023-08-23 2023-11-28 北京龙软科技股份有限公司 一种用于构建煤层地质模型的剖面图数据提取方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477567A (zh) * 2003-07-11 2004-02-25 中国地质大学(武汉) 基于便携机的计算机辅助地质调查***
RU2592739C1 (ru) * 2015-04-17 2016-07-27 Общество с ограниченной ответственностью "Арктический Научно-Проектный Центр Шельфовых Разработок" (ООО "Арктический Научный Центр") Способ сейсмических исследований на акваториях и устройство для его осуществления

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1477567A (zh) * 2003-07-11 2004-02-25 中国地质大学(武汉) 基于便携机的计算机辅助地质调查***
RU2592739C1 (ru) * 2015-04-17 2016-07-27 Общество с ограниченной ответственностью "Арктический Научно-Проектный Центр Шельфовых Разработок" (ООО "Арктический Научный Центр") Способ сейсмических исследований на акваториях и устройство для его осуществления

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Further Frontiers in GIS: Extending Spatial Analysis to Textual Sources in Archaeology;Patricia Murrieta-Flores;《Open Archaeology》;20151231;全文 *
三维地质建模中的多源数据融合技术与方法;吴志春等;《吉林大学学报(地球科学版)》;20161126(第06期);全文 *
地质剖面自动绘制的数据模型研究;朱莹等;《湖南科技大学学报(自然科学版)》;20070925(第03期);全文 *
甘肃省花牛山幅1∶50000矿产地质图数据库;王春女等;《中国地质》;20190615;全文 *

Also Published As

Publication number Publication date
CN112150582A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN112150582B (zh) 一种面向多模态数据的地质剖面图近似表达方法
US8655632B2 (en) Gridless geological modeling
CN111079217B (zh) 一种基于bim的岩土工程综合勘察信息解译方法及***
US9618639B2 (en) Method and system for image-guided fault extraction from a fault-enhanced seismic image
EP3293552B1 (en) System and method for editing geological models by switching between volume-based models and surface-based structural models augmented with stratigraphic fiber bundles
GB2474740A (en) Gridless geological modeling of a structural framework
CN110400371B (zh) 一种水平构造地貌实体的三维模型构建方法
CN108978573A (zh) 一种地形数据快速可视化辅助河床演变研究的方法
CN111814298A (zh) 近水平钻孔轨迹约束下采煤工作面煤层迭代建模方法
CN111986321B (zh) 三维地质建模方法、装置、设备及存储介质
CN114943178A (zh) 一种三维地质模型建模方法、装置及计算机设备
CN103376463B (zh) 一种基于断层控制的反演建模方法
CN110058298B (zh) 一种三维地质体空间插值方法及***
CN117351165A (zh) 一种基于ArcGIS的三维地层模型的构建及测算方法
CN114581556B (zh) 一种区域地质调查中的数字填图方法
CN116226640A (zh) 一种针对隧道物探反演数据的不良地质特征提取方法
CN106846481B (zh) 一种地质剖面图的生成方法
CN114511240A (zh) 一种矿山采掘计划生成方法及存储介质
CN115880455A (zh) 基于深度学习的三维智能插值方法
CN110942510A (zh) 一种平面地质图件三维快速组合方法
CN113626916B (zh) 一种基于gis的桩基长度验证方法及***
CN115469361B (zh) 一种碎屑岩地层三维地质建模方法
CN117274463B (zh) 一种三维地质模型实时剖切渲染处理方法及***
CN113376697B (zh) 基于三维近地表模型的静校正方法及装置
CN110322563B (zh) 构建地质模型的补充钻孔选址方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant