CN111783815A - 一种岩石地层深度学习识别模型的多尺度采样与输入方法 - Google Patents
一种岩石地层深度学习识别模型的多尺度采样与输入方法 Download PDFInfo
- Publication number
- CN111783815A CN111783815A CN202010029405.3A CN202010029405A CN111783815A CN 111783815 A CN111783815 A CN 111783815A CN 202010029405 A CN202010029405 A CN 202010029405A CN 111783815 A CN111783815 A CN 111783815A
- Authority
- CN
- China
- Prior art keywords
- rock
- slice
- detail
- sample
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011435 rock Substances 0.000 title claims abstract description 120
- 238000005070 sampling Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013135 deep learning Methods 0.000 title claims abstract description 22
- 238000002372 labelling Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000001514 detection method Methods 0.000 claims abstract description 20
- 238000005520 cutting process Methods 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 8
- 230000002349 favourable effect Effects 0.000 claims abstract description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 7
- 210000000746 body region Anatomy 0.000 claims description 6
- 239000000523 sample Substances 0.000 abstract description 66
- 239000006101 laboratory sample Substances 0.000 abstract description 2
- 229910052500 inorganic mineral Inorganic materials 0.000 description 9
- 239000011707 mineral Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 238000011160 research Methods 0.000 description 6
- 238000013136 deep learning model Methods 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 241000220304 Prunus dulcis Species 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种岩石地层深度学习识别模型的多尺度采样与输入方法,包括:根据岩石标本拍照规则和要求,采集岩石标本图片,按照有利于标本特征提取的分类进行存储;筛选存储的典型岩石标本图片,对岩石标本图片的主体区域和特征细节区域进行标注,利用已标注图片及其标注文件训练目标检测模型,采用已经训练好的目标检测模型对剩余岩石标本图片进行主体区域和细节区域的自动标注;根据标注的主体区域和细节区域进行多尺度采样无失真裁切,得到宏观切片与细节切片;进行特征组合成超图,共同构成用于神经网络训练的输入数据。本发明的优点是:实现简单,解决岩石识别精度不高的技术问题,避免模型过度依赖实验室样本,提高岩石识别泛化能力。
Description
技术领域
本发明涉及一种岩石地层深度学习识别模型的多尺度采样与输入方法。
背景技术
从地质专业角度出发,区域地质调查是地质工作的先行步骤,又是地质工作的基础工作。它是指在选定地区的范围内,在充分研究和运用已有资料的基础上,采用必要的手段,进行全面***的综合性的地质调查研究工作。其主要任务是,通过地质填图、找矿和综合研究,阐明区域内的岩石、地层、构造、地貌、水文地质等基本地质特征及其相互关系,研究矿产的形成条件和分布规律。为进一步的地质找矿工作提供基础地质资料。要实现上述目标,最基本最主要的工作方法是野外实地勘查和观测研究,而岩石学矿物学是地质学最基础的知识,一到野外首先遇到的就是矿物岩石。因此,认识岩石是每一个地质工作者最基本的专业能力。目前,据大多专业地质人员提供经验数据表明,一个专业人员在野外正确识别标本的能力,准确率达60-80%算是较高至高的水平了。因此,在野外准确的识别岩石,不仅是专业人员也是地学爱好者最大的需求。
中国地质调查经历了百年历程,查明了三大岩类的分类、分布与成因,同时积累了大量的剖面岩石标本,为打造岩石深度学***方公里,占陆域国土面积63.4%,全国1∶20万区域地质调查完成726.8 万平方公里,占陆域国土面积75.3%,全国1∶5万区域地质调查完成396.1 万平方公里,占陆域国土面积41.4%。在不同比列尺区域地质调查中,建立的岩石地层单位超过4956个,各类层型剖面超过14899条。各省积累的大量的实物标本(地质路线、地质剖面)。经对十几个省考察,从19世纪50年代至今,保存典型地质路线、地质剖面的标本超过50万块。如果把各省区域地质调查中采集的实物标本都进行拍照采集,并采用人工智能方法构建高精度的中国岩石地层识别模型,必将成为我国现代地质调查科学的基石。
目前从现有技术来看,均存在以下问题:第一,从文献来看,所有的试验或建模,均在项目级别或实验室内,因而都是小样本的方法试验,多数文章的样本均在千张数量级上,分类的数据也在都限于3-6类;对于这么小的样本,特别是标本的形态也作为样本的输入,综合上述因素,现有的类似岩石深度学***;如果离开原采样样本,而采用其他类似的岩性进行测试,可以证明基本没有文中所说的泛化能力。其次,在深度学习通用应用研究中(非岩石识别深度学习模型研究领域),虽然研究者都懂得在计算机视觉领域,图像所反映的特征信息尤为重要,是作为各种分类或检测任务的重要依据。但受到神经网络自身结构以及计算资源的限制,图像在被输入网络进行计算前,一般都会进行统一的缩放采样处理,以此来适应网络结构以及减少计算量。常见的缩放方式包括直接缩放和等比例缩放:直接缩放:图像的长和宽都直接缩放到指定尺寸。该方式会忽略图像的原始比例,会导致图像特征产生形变,影响神经网络的判断;等比例缩放:图像长边缩放到指定尺寸,短边按照图像的原始长宽比等比例缩放,其余区域进行空白填充。该方式虽然不会产生形变,但是会在训练数据中引入噪声,同样会影响模型的训练/识别结果。上述两种方式通常适用于COCO、Pascal VOC等通用数据集,该类数据集类间差异大,类内差异小,对图像特征提取的要求相对较低。而岩石图像的识别任务属于细粒度图像分类,类间差异小,类内差异大,岩石的宏观形状轮廓、表面的纹理特征、几何构造等细节都对结果的判定至关重要。上述两种缩放采样方式会并不适用于岩石图像的细粒度分类任务。
发明内容
本发明的目的在于克服上述不足,提供一种岩石地层深度学习识别模型的多尺度采样与输入方法,其解决岩石识别精度不高的技术问题,避免模型过度依赖实验室样本,提高岩石识别泛化能力。
为了实现上述目的,本发明采用的技术本发明为:一种岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,包括:
根据岩石标本拍照规则和要求,采集岩石标本图片,按照有利于标本特征提取的分类进行存储;
筛选存储的典型岩石标本图片,对岩石标本图片的主体区域和特征细节区域进行标注,利用已标注图片及其标注文件训练目标检测模型,然后,采用已经训练好的目标检测模型对剩余岩石标本图片进行主体区域和细节区域的自动标注;
根据标注的主体区域和细节区域对岩石标本图片进行多尺度采样无失真裁切,得到主体标注切片和若干细节标注切片;
对所述主体标注切片进行中心采样及缩放工作,得到宏观切片;
对所述细节标注切片进行任意采样及缩放工作,得到细节切片;
将所述宏观切片和细节切片进行特征组合成超图,共同构成用于神经网络训练的输入数据。
进一步地,所述根据标注的主体区域和细节区域对岩石标本图片进行多尺度采样无失真裁切,得到主体标注切片和若干细节标注切片,包括:
任取一张岩石标本图片,按照其标注文件信息对两种采样区域进行无失真裁剪,经过标注模型检测及无失真裁切,原图生成一个样本主体区域,记作A1,及三个特征细节区域,分别记作A2、A3、A4。
进一步地,对所述主体标注切片进行中心采样及缩放工作,得到宏观切片,包括:对于样本主体区域A1,该区域短边边长记作WB,长边边长记作 HB,以WB为边长,在A1区域上中心裁切一个正方形宏观特征切片,记作 B1,在不产生形变的基础上,最大限度保留样本主体区域信息;
在切片B1的基础上,中心裁切一个正方形宏观特征切片,记作B2。其中,B2切片边长计算公式如下:
b2=α×WB(0.75≤α<1)。
进一步地,对所述细节标注切片进行任意采样及缩放工作,得到细节切片,包括:对于任意特征细节区域A2,该区域短边记作WD,长边记作HD,在该区域任意位置裁剪一个边长为b3的正方形微观特征切片,记作B3,其中, b3计算公式如下:
进一步地,将所述宏观切片和细节切片进行特征组合成超图,包括:将宏观特征切片B1、B2及微观特征切片B3、B4缩放到同一大小,并进行通道叠加,得到用于神经网络训练/预测的超图。
进一步地,所述有利于标本特征提取的分类为:岩性名称(特殊构造或现象)+(省名+剖面名称或地名,样号或层号)+{地质代号}。
进一步地,所述筛选存储的典型岩石标本图片包括:单一背景图像、复杂背景图像、多目标图像。
进一步地,所述利用已标注图片及其标注文件训练目标检测模型采用RetinaNet目标检测算法。
本发明的有益效果为:
实现简单,包括:根据岩石标本拍照规则和要求,采集岩石标本图片,按照有利于标本特征提取的分类进行存储;筛选存储的典型岩石标本图片,对岩石标本图片的主体区域和特征细节区域进行标注,利用已标注图片及其标注文件训练目标检测模型,然后,采用已经训练好的目标检测模型对剩余岩石标本图片进行主体区域和细节区域的自动标注;根据标注的主体区域和细节区域对岩石标本图片进行多尺度采样无失真裁切,得到主体标注切片和若干细节标注切片;对所述主体标注切片进行中心采样及缩放工作,得到宏观切片;对所述细节标注切片进行任意采样及缩放工作,得到细节切片;将所述宏观切片和细节切片进行特征组合成超图,共同构成用于神经网络训练的输入数据。目前模型入库已超过50万原始张照片,训练时采样最大可达 5000万张。形成了覆盖岩类最多、识别精度高的中国岩石识别AI模型库。最终通过Restful API对移动端提供岩石识别、岩石的地质年代、所属填图单位和产地等相关AI内容服务。目前模型最细6级分类(手标本分类级)准确率达93.6%。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本发明的岩石地层深度学习识别模型的多尺度采样与输入方法的流程图;
图2是本发明的对原始的岩石图像进行主体区域和细节区域的标注流程流程图;
图3是本发明的按照标注信息对图片的各标注区域进行无失真裁切流程图。
具体实施方式
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
请参照图1至图3,本发明的一种岩石地层深度学习识别模型的多尺度采样与输入方法,包括:
步骤1,确定岩石标本拍照规则和要求,采集岩石图像并整理,给出每一类(手标本分类级别)标注,并按有利于标本特征提取的分类进行存储;
步骤2,筛选典型图片,人工对样本主体区域和特征细节区域进行标注;利用已标注图片及其标注文件训练目标检测模型;利用已经训练好的目标检测模型对剩余岩石图片进行主体区域和细节区域的自动标注;
步骤3,根据标注框对岩石图片进行初步的无失真裁切,得到主体标注切片和若干细节标注切片;
步骤4,对所述主体标注切片进行中心采样及缩放工作,得到宏观切片;
步骤5,对所述细节标注切片进行任意采样及缩放工作,得到细节切片;
步骤6,所述宏观切片和细节切片进行特征组合成“超图”,共同构成用于神经网络训练的输入数据。
在一个实施例中,所述
本发明在流程中各个节点的实施方案如下:
1原始标本样本采集
(1)样本对象选择要求
①应以剖面标本为主,尽量选取剖面上连续采集的标本。
②直接在野外实测剖面的分层位置采样,连续拍摄照片,是样本采样最好的方式。
③单个教学示范(或仅以展示三大岩类)的标本,也可考虑,但应有该标本的产地、岩石名称、地质代号(地质年代和地层单位名称等)。
(2)每个标本的基本信息要求
①标本的岩性名称(薄片鉴定名称或最终综合确定的名称);
②采样位置(地名或剖面名称,没有地名或剖面名称也可提供图幅号和X,Y或者经纬度坐标)、样号或层号等);
③填图单位地质代号(年代+地层代号)。该基本信息最后作为文件名体现;
④如果有相关的薄片鉴定结果,提供薄片鉴定的相关信息以及薄片照片;
⑤如果有相应的填图单位信息,则也提供相应的地层、岩性描述信息。
(3)标本拍摄基本要求
①每个标本至少2个人拍(避免相机拍照像素原因造成该标本照片全为无效照片);一人一个标本至少拍30张左右。拍照时,除全景照片拍摄外,尽量避开涂油漆(标样号)或肮脏部位。
②全景拍摄要求:每个标本至少全景1-2张(即至少两个主要的面,如标本的正方面)。
③变焦拍摄要求:近距10-30cm左右处,对准标本(即用户关心的标本焦点或特征或新鲜面),采用不同焦距(放大)拍一遍,目标是获取标本的微观特征。注意避免全部都是对准标本的全景拍摄,应有局部焦点的拍摄。
④变距拍摄:自选焦距(即用户关系的标本焦点或特征或新鲜面,自己调整焦距),即近中距离(10-20cm左右)拍一遍,中距离(15-25cm左右) 拍一遍,中远(20-30cm左右)拍一遍,如果在野外现场对露头拍照,距离可以放宽。距离有用户可根据具体情况掌握。目标是标本的宏观特征获取。注意避免全部都是对准标本的全景拍摄,应有局部焦点的拍摄。
⑤特别要求,对标本的新鲜面或新鲜断面,除全局拍照外,应尽量对准该区域采用放大镜头的方式进行拍摄,建议多拍。鼓励发挥拍摄。用户在保证上列要求的基础上,可以根据标本的特点,自选角度任意拍摄,张数可不限。
⑥应尽量保持保标本的长轴方向与矩形照相框的长边方向保持一致。
⑦照片应清晰。拍照时避免手动造成模糊,特别是标本表面凹凸不平,注意焦点的清晰捕获。
⑧如果直接在野外现场拍摄,根据现场情况灵活掌握。具体要求如下:
1)露头很好的情况,则不需两人同时拍摄一块标本。
2)在野外同一岩性应至少4-5块以上标本及两人以上拍摄,每一个岩性的标本照片数量累计应超过50张。
3)在野外如果有清晰的宏观现象,如层理构造等,应多拍一下这些宏观的照片,建议每一现象不少于6张。
4)其他拍摄要求仍按上述要求进行。
(4)标本照片标签及存盘要求
①目录名要求:岩性名称(特殊构造或现象)+(省名+剖面名称或地名,样号或层号)+{地质代号}。样例见表1。
表1岩石标本标签规则样式
②属于同一标本的照片考入同一目录。照片原始的文件名不需改变。
③如果野外标签有野外定名和室内薄片定名,应薄片鉴定名称为主,野外定名为辅,该名称可以放在剖面名称或地名之前(放入括号外)。
2采样区域标注
为了去除背景噪声,划分宏观及微观特征区域,同时为了提高标注效率,本方法采用“人工标注为辅,自动标注为主”的标注原则,对原始的岩石图像进行主体区域和细节区域的标注。结合图2,主要过程如下:
(1)人工挑选部分典型岩石样本图像,包括单一背景图像、复杂背景图像、多目标图像等;
(2)专家对选取的岩石样本图像进行样本主体区域标注和特征细节区域标注(图3);
(3)完成人工标注后,选取适当的目标检测算法(此处使用RetinaNet),根据已标注图片及其标注文件进行算法调整及模型训练,故此得到一个能够检测岩石主体区域和特征细节区域的岩石标注模型。
(4)最后,使用(3)中所述岩石标注模型对所有未标注图片进行自动标注。
3多尺度采样无失真裁切流程与算法
为了使网络输入同时涵盖岩石样本的多尺度特征,采用多尺度采样方法对样本已标注的区域进行采样。多尺度采样方法流程,具体对图片的各标注区域进行无失真裁切流程与算法,其主要计算过程如下:
(1)任取一张图片,按照其标注文件信息对两种采样区域进行无失真裁剪,采样区域数目不定,视具体标注情况而定。(经过标注模型检测及无失真裁切,原图可生成一个样本主体区域,记作A1,及三个特征细节区域,分别记作A2、A3、A4)。
(2)对于样本主体区域,如A1,该区域短边边长记作WB,长边边长记作 HB。以WB为边长,在A1区域上中心裁切一个正方形宏观特征切片,记作B1,在不产生形变的基础上,最大限度保留样本主体区域信息;
(3)在切片B1的基础上,中心裁切一个正方形宏观特征切片,记作B2。其中,B2切片边长计算公式如下:
b2=α×WB(0.75≤α<1)
(4)对于任意特征细节区域,如A2,该区域短边记作WD,长边记作HD。在该区域任意位置裁剪一个边长为b3的正方形微观特征切片,记作B3。其中,b3计算公式如下:
(5)若该张图被检测出两个或两个以上特征细节区域,则任选两个区域分别进行步骤(4)(选取A2及A4区域);若该张图只检测出一个特征细节区域,则对同一区域重复步骤(4)。
(6)经过步骤(4)、(5)后,可得到两个微观特征切片:B3、B4。
将宏观特征切片B1、B2及微观特征切片B3、B4缩放到同一大小,并进行通道叠加,得到用于神经网络训练/预测的输入——“超图”(672x672像素)。
试验
(1)本方法采用“人工标注为辅,自动标注为主”的标注原则,在为去除背景噪声,有效识别标本的基础上,在同一块标本上,划分宏观及微观特征区域,对原始的岩石图像进行主体区域和细节区域的多个标注框的标注。提高了采样输入的多尺度标注框数量,使目标捕捉从一个标注框可增加到3-5个标注框(见图)。一般领域的标注只针对目标或对象而已,如画面中的汽车、电脑。采用基于深度学习的目标检测自动标注方法,不但实现了一块标本可提供多个样本机制,而且实现原始的岩石图像进行主体区域和细节区域的标注自动化,大大提高了提高了目标捕捉和标注效率,有效减弱了背景因素对神经网络训练过程的影响,避免模型出现过拟合现象,提高了模型的鲁棒性;同时大大提高标注效率。
(2)通过单块标本多个标注框的机制,可以有效的控制宏观与微观信息的比例输入,为多尺度输入提供了条件,大大提高了单个标本有效样本的数量,突出了标本通性的特征采取信息,把标本本身外部形态影响因素降到最低,甚至全部消除标本形态影响,为模型识别的泛化能力提高奠定基础
(3)采用多尺度采样方法,在有限计算资源下保证图像的无失真多尺度输入;
(4)采用多尺度采样方法,采样切片无形变,无冗余填充,极大限度保留了原始样本特征;
(5)采用多尺度采样方法,同时兼顾岩石样本的宏观和微观特征:宏观特征提供大类分类信息,微观特征用于细粒度分类优化,二者结合可为神经网络的训练提供更多的信息,大大提高了模型识别精度。
(6)采用多标注框切片后的4个图片组成超图(672*672像素),试验结果大大提高了模型的精度(可以提高10%),如果在组成切片后的4 个图片中,再去掉全景的切片,即含有标本形态的图片,模型的泛化能力可以提高20%)。具体对比如下:
如果未采用本方法进行采样,按照一般方法处理,在原始数据集共130,713 张标本图片(训练样本超过1978万),覆盖2889个岩石种类(手标本分类级别),标签划分为6级的情况下(从目前发表的文献来看,无论从样本还分类数都远远超过目前所有已有的相关模型),输入训练图片大小为448×448 像素,在单个标注框内采样,最终训练模型的各级准确率见表3。
表3多输入多输出模型评价
测试集精度 | 第一级 | 第二级 | 第三级 | 第四级 | 第五级 | 第六级 |
独热码 | 94.57% | 90.81% | 87.87% | 84.80% | 83.34% | 83.33% |
采用本方法后,手标本识别精度从83%提高到93%(见下表),证明了本方法的提出,对提高岩石识别精度的提高非常有效和明显。
注:4张和9张切片主要考虑计算效率的测试,其多尺度的输入模型和机制是一致的。
在切片组成超图时,去掉含有标本形态的全景切片,试验模型的泛化能力提高28%,见下表:
本发明的有益效果为:
实现简单,包括:根据岩石标本拍照规则和要求,采集岩石标本图片,按照有利于标本特征提取的分类进行存储;筛选存储的典型岩石标本图片,对岩石标本图片的主体区域和特征细节区域进行标注,利用已标注图片及其标注文件训练目标检测模型,然后,采用已经训练好的目标检测模型对剩余岩石标本图片进行主体区域和细节区域的自动标注;根据标注的主体区域和细节区域对岩石标本图片进行多尺度采样无失真裁切,得到主体标注切片和若干细节标注切片;对所述主体标注切片进行中心采样及缩放工作,得到宏观切片;对所述细节标注切片进行任意采样及缩放工作,得到细节切片;将所述宏观切片和细节切片进行特征组合成超图,共同构成用于神经网络训练的输入数据。目前模型入库已超过50万原始张照片,训练时采样最大可达 5000万张。形成了覆盖岩类最多、识别精度高的中国岩石识别AI模型库。最终通过Restful API对移动端提供岩石识别、岩石的地质年代、所属填图单位和产地等相关AI内容服务。目前模型最细6级分类(手标本分类级)准确率达93.6%。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述申请构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。
Claims (8)
1.一种岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,包括:
根据岩石标本拍照规则和要求,采集岩石标本图片,按照有利于标本特征提取的分类进行存储;
筛选存储的典型岩石标本图片,对岩石标本图片的主体区域和特征细节区域进行标注,利用已标注图片及其标注文件训练目标检测模型,然后,采用已经训练好的目标检测模型对剩余岩石标本图片进行主体区域和细节区域的自动标注;
根据标注的主体区域和细节区域对岩石标本图片进行多尺度采样无失真裁切,得到主体标注切片和若干细节标注切片;
对所述主体标注切片进行中心采样及缩放工作,得到宏观切片;
对所述细节标注切片进行任意采样及缩放工作,得到细节切片;
将所述宏观切片和细节切片进行特征组合成超图,共同构成用于神经网络训练的输入数据。
2.根据权利要求1所述的岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,所述根据标注的主体区域和细节区域对岩石标本图片进行多尺度采样无失真裁切,得到主体标注切片和若干细节标注切片,包括:
任取一张岩石标本图片,按照其标注文件信息对两种采样区域进行无失真裁剪,经过标注模型检测及无失真裁切,原图生成一个样本主体区域,记作A1,及三个特征细节区域,分别记作A2、A3、A4。
3.根据权利要求2所述的岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,对所述主体标注切片进行中心采样及缩放工作,得到宏观切片,包括:对于样本主体区域A1,该区域短边边长记作WB,长边边长记作HB,以WB为边长,在A1区域上中心裁切一个正方形宏观特征切片,记作B1,在不产生形变的基础上,最大限度保留样本主体区域信息;
在切片B1的基础上,中心裁切一个正方形宏观特征切片,记作B2。其中,B2切片边长计算公式如下:
b2=α×WB(0.75≤α<1)。
5.根据权利要求4所述的岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,将所述宏观切片和细节切片进行特征组合成超图,包括:将宏观特征切片B1、B2及微观特征切片B3、B4缩放到同一大小,并进行通道叠加,得到用于神经网络训练/预测的超图。
6.根据权利要求1所述的岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,所述有利于标本特征提取的分类为:岩性名称(特殊构造或现象)+(省名+剖面名称或地名,样号或层号)+{地质代号}。
7.根据权利要求1所述的岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,所述筛选存储的典型岩石标本图片包括:单一背景图像、复杂背景图像、多目标图像。
8.根据权利要求1所述的岩石地层深度学习识别模型的多尺度采样与输入方法,其特征在于,所述利用已标注图片及其标注文件训练目标检测模型采用RetinaNet目标检测算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010029405.3A CN111783815B (zh) | 2020-01-15 | 2020-01-15 | 一种岩石地层深度学习识别模型的多尺度采样与输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010029405.3A CN111783815B (zh) | 2020-01-15 | 2020-01-15 | 一种岩石地层深度学习识别模型的多尺度采样与输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783815A true CN111783815A (zh) | 2020-10-16 |
CN111783815B CN111783815B (zh) | 2024-02-13 |
Family
ID=72753103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010029405.3A Active CN111783815B (zh) | 2020-01-15 | 2020-01-15 | 一种岩石地层深度学习识别模型的多尺度采样与输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783815B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104750874A (zh) * | 2015-04-22 | 2015-07-01 | 成都理工大学 | 一种多尺度岩石切片图像管理*** |
CN105068737A (zh) * | 2015-07-29 | 2015-11-18 | 中国地质科学院地质力学研究所 | 多尺度岩石切片图像管理***的使用方法 |
CN109615024A (zh) * | 2018-12-28 | 2019-04-12 | 东北大学 | 一种岩石种类智能区分识别及定位方法 |
CN110070552A (zh) * | 2019-05-07 | 2019-07-30 | 西南石油大学 | 一种基于语义分割的岩石图像孔隙类型识别方法 |
CN110110661A (zh) * | 2019-05-07 | 2019-08-09 | 西南石油大学 | 一种基于unet分割的岩石图像孔隙类型识别方法 |
CN110211173A (zh) * | 2019-04-03 | 2019-09-06 | 中国地质调查局发展研究中心 | 一种基于深度学习的古生物化石定位和识别方法 |
-
2020
- 2020-01-15 CN CN202010029405.3A patent/CN111783815B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104750874A (zh) * | 2015-04-22 | 2015-07-01 | 成都理工大学 | 一种多尺度岩石切片图像管理*** |
CN105068737A (zh) * | 2015-07-29 | 2015-11-18 | 中国地质科学院地质力学研究所 | 多尺度岩石切片图像管理***的使用方法 |
CN109615024A (zh) * | 2018-12-28 | 2019-04-12 | 东北大学 | 一种岩石种类智能区分识别及定位方法 |
CN110211173A (zh) * | 2019-04-03 | 2019-09-06 | 中国地质调查局发展研究中心 | 一种基于深度学习的古生物化石定位和识别方法 |
CN110070552A (zh) * | 2019-05-07 | 2019-07-30 | 西南石油大学 | 一种基于语义分割的岩石图像孔隙类型识别方法 |
CN110110661A (zh) * | 2019-05-07 | 2019-08-09 | 西南石油大学 | 一种基于unet分割的岩石图像孔隙类型识别方法 |
Non-Patent Citations (2)
Title |
---|
DONGLIANG HE 等: ""Stnet: Local and global spatial-temporal modeling for action recognition"", 《PROCEEDINGS OF THE AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, 》 * |
柳小波;***;王连成;: "岩石种类智能识别研究的Faster R-CNN方法", 现代矿业, no. 05 * |
Also Published As
Publication number | Publication date |
---|---|
CN111783815B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109711288B (zh) | 基于特征金字塔和距离约束fcn的遥感船舶检测方法 | |
Francus | An image-analysis technique to measure grain-size variation in thin sections of soft clastic sediments | |
Zhang et al. | A progressive morphological filter for removing nonground measurements from airborne LIDAR data | |
Sime et al. | Information on grain sizes in gravel-bed rivers by automated image analysis | |
US8566069B2 (en) | Method for geologically modeling seismic data by trace correlation | |
CN103268358B (zh) | 多源控制点影像数据库构建及更新方法 | |
CN108596108B (zh) | 基于三元组语义关系学习的航拍遥感图像变化检测方法 | |
CN110163275B (zh) | 基于深度卷积神经网络的sar图像目标分类方法 | |
CN103218787B (zh) | 多源异构遥感影像控制点自动采集方法 | |
CN108564085A (zh) | 一种自动读取指针式仪表读数的方法 | |
GB2524810A (en) | Method of analysing a drill core sample | |
CN101770583B (zh) | 一种基于场景全局特征的模板匹配方法 | |
CN111524117A (zh) | 一种基于特征金字塔网络的隧道表面缺陷检测方法 | |
CN108520277A (zh) | 基于计算机视觉的钢筋混凝土结构地震损伤自动识别与智能定位方法 | |
CN114241332A (zh) | 一种基于深度学习的固废场识别方法、装置以及存储介质 | |
CN117197596B (zh) | 基于小样本迁移学习的混合底质声学分类方法 | |
CN111381275A (zh) | 一种地震数据的初至拾取方法和装置 | |
CN107578424A (zh) | 一种基于时空分类的动态背景差分检测方法、***及装置 | |
CN106203446B (zh) | 用于增强现实辅助维修***的三维对象识别定位方法 | |
CN104484679A (zh) | 非制式枪射击弹头痕迹图像自动识别方法 | |
CN112164103B (zh) | 多数据交叉的野外露头信息采集及建模方法 | |
CN117593601A (zh) | 一种基于深度学习的水尺验潮方法 | |
CN111783815A (zh) | 一种岩石地层深度学习识别模型的多尺度采样与输入方法 | |
CN117011759A (zh) | 钻爆法隧道掌子面围岩多元地质信息解析方法及*** | |
CN116051966A (zh) | 基于深度学习网络的笔石图像识别方法及其模型训练方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230703 Address after: 100055 No.55, Honglian South Road, Xicheng District, Beijing Applicant after: Command center of natural resources comprehensive survey of China Geological Survey Address before: 100037 Beijing City, Xicheng District Fuwai Street No. 45 Applicant before: DEVELOPMENT & RESEARCH CENTER OF CHINA GEOLOGICAL SURVEY BUREAU |
|
GR01 | Patent grant | ||
GR01 | Patent grant |