CN115205614A - 一种用于智能制造的矿石x光图像识别方法 - Google Patents

一种用于智能制造的矿石x光图像识别方法 Download PDF

Info

Publication number
CN115205614A
CN115205614A CN202210556471.5A CN202210556471A CN115205614A CN 115205614 A CN115205614 A CN 115205614A CN 202210556471 A CN202210556471 A CN 202210556471A CN 115205614 A CN115205614 A CN 115205614A
Authority
CN
China
Prior art keywords
layer
scale
ore
ray image
attention module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210556471.5A
Other languages
English (en)
Other versions
CN115205614B (zh
Inventor
钟家兴
袁明康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Worui Image Technology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210556471.5A priority Critical patent/CN115205614B/zh
Publication of CN115205614A publication Critical patent/CN115205614A/zh
Application granted granted Critical
Publication of CN115205614B publication Critical patent/CN115205614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • G06V10/765Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种用于智能制造的矿石X光图像识别方法,包括制作训练数据集、训练图像分类网络、识别待分选矿石X光图像等步骤。图像分类网络包括多尺度特征提取模块、最大池化层、全局平均池化层、FC层和softmax分类器,多个多尺度特征提取模块沿图像分类网络的深度方向设置,最后一个最大池化层的输出端通过全局平均池化层与FC层的输入端连接,FC层的输出端与softmax分类器的输入端连接。本发明将多尺度特征提取结构与注意力机制结合,控制多尺度特征提取模块参数量和计算量的情况下,极大提升了网络对图像特征的提取效率,与现有技术相比,本发明提供的图像分类识别网络在识别精度和运行速度上取得了更好的平衡。

Description

一种用于智能制造的矿石X光图像识别方法
技术领域
本发明属于采矿和图像处理技术领域,具体地说,涉及一种用于智能制造的矿石X光图像识别方法。
背景技术
随着5G、人工智能和物联网等新兴技术的发展和应用,各行各业都在朝着智能制造方向发展,生产效率得到了进一步的提升。在选矿工艺上,将原矿破碎后,利用X射线透射矿石生成对应的X光图像,通过图像分类网络对获得的X光图像进行识别分类,能够实现自动快速预分选矿石,避免尾矿进入后续的加工环节造成浪费。但是,实践表明,现有的轻型分类识别网络对矿石X光图像分类精度偏低,难以满足需求,而分类精度高的网络普遍存在计算量大、图像识别速度慢的问题,没有在精度和速度上取得很好的平衡。
发明内容
针对上述现象,本发明提供一种用于智能制造的矿石X光图像识别方法,保证识别正确率的情况下,减少模型的计算量,提高运行速度,促进采矿业朝着智能制造方向发展。
为了达到上述目的,本发明采用的解决方案是:一种用于智能制造的矿石X光图像识别方法,包括以下步骤:
S100、收集矿石X光图像,通过人类专家为获得的矿石X光图像标注标签信息,制得训练数据集;
S200、获取图像分类网络,利用所述训练数据集训练所述图像分类网络;
S300、获取待分选矿石X光图像,将所述待分选矿石X光图像输入训练好的所述图像分类网络,经所述图像分类网络分类识别后,输出所述待分选矿石X光图像的类别信息,即精矿或尾矿。实际应用场景中,X光图像输入图像分类网络前,可以根据需要先进行降噪、二值化和图像分割等预处理,使每个图像中基本只包含单个矿石的X光图像。
所述图像分类网络包括多尺度特征提取模块、最大池化层、全局平均池化层、FC层(即全连接层)和softmax分类器,多个所述多尺度特征提取模块沿所述图像分类网络的深度方向设置,所述最大池化层与所述多尺度特征提取模块对应设置,且所述最大池化层位于所述多尺度特征提取模块的下游端,这样多尺度特征提取模块与全局平均池化层交替排列,所述最大池化层用于减小特征图长度和宽度方向的尺寸,最后一个所述最大池化层的输出端通过所述全局平均池化层与所述FC层的输入端连接,所述FC层的输出端与所述softmax分类器的输入端连接,softmax分类器为现有技术。
所述多尺度特征提取模块的数学模型为:
Y1=θ1(η1 3(Hn))
Y2=θ2(η1 5(Hn))
CM1=fCA 1(fR(Y1,Y2))
CM2=fCA 2(fR(Y1,Y2),E)
Y3=[(Y1·CM1),(Y2·CM2)]
Figure BDA0003655117080000021
Figure BDA0003655117080000022
其中,Hn代表输入所述多尺度特征提取模块的特征图,η1 3()和η2 3()均表示卷积核尺寸为3*3的卷积操作层,η1 5()代表卷积核尺寸为5*5的卷积操作层,η1 1()表示卷积核尺寸为1*1的卷积操作层,θ1()、θ2()、θ3()和θ4()均表示非线性激活函数ReLU,fR()表示特征融合单元,fCA 1()和fCA 2()分别代表小尺度通道注意力模块和大尺度通道注意力模块,E表示从所述小尺度通道注意力模块输入所述大尺度通道注意力模块中的跨尺度校准图,CM1代表所述小尺度通道注意力模块生成的第一校准图,CM2代表所述大尺度通道注意力模块生成的第二校准图,[·]表示将其中的特征图做拼接操作,Hn+1为所述多尺度特征提取模块输出的特征图。CM1、CM2和CM1+CM2均为通道校准图,Y1·CM1表示将所述第一校准图与特征图Y1相乘,对Y1中的各个通道进行校准,同样地,CM2、CM1+CM2也是通过矩阵乘法对相应特征图的各个通道进行校准。
进一步地,步骤S200中,训练所述图像分类网络时,采用的损失函数为交叉熵。
进一步地,步骤S200中,训练所述图像分类网络时,学习率固定设置为0.0004。
进一步地,所述最大池化层的池化窗口尺寸为2*2,步长为2。
进一步地,所述特征融合单元的数学模型为:
R1=[Y1,Y2]+λ1(η2 1(Y1))+λ2(η3 1(Y2))
R2=θ5(η4 1(R1))
其中,Y1特征图和Y2特征图共同作为所述特征融合单元的输入,[·]表示将其中的特征图做拼接操作,η2 1()、η3 1()和η4 1()均表示卷积核尺寸为1*1的卷积操作层,λ1()和λ2()均表示非线性激活函数Logistic,θ5()表示非线性激活函数ReLU,R2特征图为所述特征融合单元的输出。
进一步地,所述小尺度通道注意力模块的数学模型为:
SV1=ε1(ζ1(SEL(R2)))
SV2=ε2(ζ2(SAL(R2)))
CM1=SV1+SV2
其中,R2特征图作为所述小尺度通道注意力模块的输入,SEL()表示全图层平均池化处理层(计算特征图中各个图层的平均值),SAL()表示全图层最大池化处理层(计算特征图中各个图层的最大值),ε1和ε2均代表sigmoid激活函数,ζ1和ζ2均表示激活单元,CM1为所述小尺度通道注意力模块输出的第一校准图。
进一步地,所述大尺度通道注意力模块的数学模型为:
BV1=ε3(ζ3(BEL(R2)))-SM1
BV2=ε4(ζ4(BAL(R2)))+SM2
BV3=ε5(ζ5(BVL(R2)))
CM2=BV1+BV2+BV3
其中,SM1表示所述小尺度通道注意力模块中全图层平均池化处理层输出的第一校准向量,SM2表示所述小尺度通道注意力模块中全图层最大池化处理层输出的第二校准向量,从所述小尺度通道注意力模块输入所述大尺度通道注意力模块中的跨尺度校准图E也就是SM1和SM2。SM1、SM2和R2特征图共同作为所述大尺度通道注意力模块的输入,BEL()表示全图层平均池化处理层(计算特征图中各个图层的平均值),BAL()表示全图层最大池化处理层(计算特征图中各个图层的最大值),BVL()表示全图层方差池化处理层(计算特征图中各个图层的方差值),ε3、ε4和ε5均代表sigmoid激活函数,ζ3、ζ4和ζ5均表示激活单元,CM2为所述大尺度通道注意力模块输出的第二校准图。
进一步地,所述激活单元包括顺次连接的前端全连接运算层、非线性ReLU激活层和后端全连接运算层。
本发明的有益效果是:
(1)本发明将多尺度特征提取结构与注意力机制结合,控制多尺度特征提取模块参数量和计算量的情况下,极大提升了网络对图像特征的提取效率,与现有技术相比,本发明提供的图像分类识别网络在识别精度和运行速度上取得了更好的平衡;
(2)矿石X光图像的特征与人脸、车牌等图像有很大区别,对于识别矿石X光图像来说,图像中的纹理特征远比图像边缘和内部的线条特征更重要,所以本发明针对性地设计了小尺度通道注意力模块和大尺度通道注意力模块的内部结构,通过两个注意力机制的配合作用,对不同尺度中包含的纹理特征实现了高效地强化;
(3)本发明对矿石X光图像识别的目的是区分精矿和尾矿,结合矿石X光图像特点可以发现,本发明中图像分类网络对图像特征提取后,所需要特征信息的抽象程度和全局性低于人脸识别等分类任务,所以本发明利用CM1+CM2再次校准多尺度特征提取模块后部的特征图,以此达到控制信息抽象程度和全局性的效果,进一步提升对矿石X光图像的识别准确率。
附图说明
图1为实施例1中图像分类网络的结构示意图;
图2为实施例1中多尺度特征提取模块的结构示意图;
图3为实施例1中特征融合单元的结构示意图;
图4为实施例1中小尺度通道注意力模块和大尺度通道注意力模块的内部结构示意图;
图5为实施例1中激活单元的内部结构示意图;
图6为对比实施例B中多尺度特征提取模块的内部结构示意图;
附图中:
1-待分选矿石X光图像,2-类别信息,3-多尺度特征提取模块,31-小尺度通道注意力模块,32-大尺度通道注意力模块,33-残差连接,34-特征融合单元,35-激活单元,36-前端全连接运算层,37-非线性ReLU激活层,38-后端全连接运算层,4-最大池化层,5-全局平均池化层,6-FC层,7-softmax分类器。
具体实施方式
以下结合附图对本发明作进一步描述:
实施例1:
下面以铅锌矿石作为对象实施本发明。收集铅锌矿石X光图像,以1代表精矿,0代表尾矿,通过人类专家为获得的矿石X光图像标注标签信息,制得训练数据集和测试集。训练数据集中包含3200张精矿图像,2700张尾矿图像,测试集中包含500张精矿图像,380张尾矿图像。然后搭建图像分类网络,该分类网络的结构如图1所示,其中设置了五个多尺度特征提取模块3,多尺度特征提取模块3与最大池化层4交替排列,最后一个最大池化层4的输出端通过全局平均池化层5与FC层6的输入端连接,FC层6的输出端与softmax分类器7的输入端连接。
多尺度特征提取模块3内部结构如图2所示,对于第一个多尺度特征提取模块3,输入其中的图像先分别经过3*3卷积和5*5卷积,两个分支分别输出特征图Y1和特征图Y2,Y1和Y2的通道数量均为36。对于后面四个多尺度特征提取模块3中,卷积操作后两个分支输出的特征图Y1和特征图Y2的通道数量,均与3*3卷积、5*5卷积前的特征图通道数量相等。
Y3特征图的通道数量是同一多尺度特征提取模块3中Y1/Y2通道数量的两倍,Y3特征图经过η2 3卷积后,通道数量减少一半,这样η2 3卷积操作输出特征图的通道数量与CM1/CM2的长度相等,便于CM1+CM2对η2 3卷积输出的特征图通道进行校准。为了缓解特征消失,多尺度特征提取模块3中还设有残差连接33。对于多尺度特征提取模块3尾部的η1 1卷积,特征图经过该卷积操作后,通道数量增加一倍,这样第五个多尺度特征提取模块3输出的特征图通道数量为1152。
特征融合单元34内部结构如图3所示,Y1特征图和Y2特征图分别经过1*1卷积后,通道数量翻倍,然后一起与Y1、Y2拼接后的特征图相加,得到特征图R1。R1经过1*1卷积后,通道数量减少一半,得到特征图R2,完成特征融合。实验表明,采用特征融合单元34的融合效果比直接将Y1、Y2相加更好,具体实验数据见实施例2。
小尺度通道注意力模块31和大尺度通道注意力模块32的内部结构如图4所示,输入注意力模块的特征图先经过全图层池化处理,得到长度与R2通道数量相等的通道校准向量。然后校准向量经过激活单元35和sigmoid激活函数,最终分别生成第一校准图CM1和第二校准图CM2,第一校准图和第二校准图的长度均与同一多尺度特征提取模块3中R2通道数量相等。
激活单元35的内部结构如图5所示,包括顺次连接的前端全连接运算层36、非线性ReLU激活层37和后端全连接运算层38,前端全连接运算层37的输入结点数量与对应的R2特征图通道数量相等,前端全连接运算层37的输出结点数量为其输入结点数量的九分之一。后端全连接运算层38的输入结点数与前端全连接运算层37的输出结点数相等,后端全连接运算层38的输出结点数与前端全连接运算层37的输入结点数相等。
本实施例中,最大池化层4的池化窗口尺寸为2*2,步长为2,特征图经过最大池化层4后,其长宽尺寸减小变为原来的一半。全局平均池化层5是计算特征图各个图层的平均值,全局平均池化层5输出是长度为1152的特征向量。FC层6也就是全连接层,其输入结点数为1152,输出结点数为2,最后softmax分类器7输出分类识别后的类别信息2。
利用训练数据集训练该网络,训练过程中的操作细节如下表所示:
框架 Pytorch
CPU 英特尔E5-2689
GUP NVIDIAGTX2080ti
优化器 SGD
epoch 600
损失函数 交叉熵
学习率 固定为0.0004
模型训练完成后,以测试集中的图像作为待分选矿石X光图像1,输入训练好的图像分类网络进行测试。此外,将本实施例还使用相同的训练集和测试集,训练并测试了VGG16和ResNet18的识别精度,三个模型的实验结果如下表所示:
Figure BDA0003655117080000091
从上面的结果可以看出,与现有技术相比,本实施例所提供的图像分类网络在参数量和计算量更小的情况下,取得了更好的识别效果。
实施例2:
本实施例为消融对比实验。
对比实施例A:单独取消实施例1中的特征融合单元34,将特征图Y1和Y2采用直接相加的形式进行融合,网络其他部分与实施例1相同。
对比实施例B:单独取消实施例1中CM1+CM2校准特征图部分,修改后的多尺度特征提取模块3如图6所示,网络其他部分与实施例1相同。
在相同训练数据集和测试数据集上对比实验,结果如下表所示:
Figure BDA0003655117080000092
根据以上表格数据可以得出结论,设置特征融合单元34和CM1+CM2校准特征图,均能够明显提高图像分类网络对待分选矿石X光图像1的分类识别准确率。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (8)

1.一种用于智能制造的矿石X光图像识别方法,其特征是:包括以下步骤:
S100、收集矿石X光图像,通过人类专家为获得的矿石X光图像标注标签信息,制得训练数据集;
S200、获取图像分类网络,利用所述训练数据集训练所述图像分类网络;
S300、获取待分选矿石X光图像,将所述待分选矿石X光图像输入训练好的所述图像分类网络,经所述图像分类网络分类识别后,输出所述待分选矿石X光图像的类别信息;
所述图像分类网络包括多尺度特征提取模块、最大池化层、全局平均池化层、FC层和softmax分类器,多个所述多尺度特征提取模块沿所述图像分类网络的深度方向设置,所述最大池化层与所述多尺度特征提取模块对应设置,且所述最大池化层位于所述多尺度特征提取模块的下游端,所述最大池化层用于减小特征图长度和宽度方向的尺寸,最后一个所述最大池化层的输出端通过所述全局平均池化层与所述FC层的输入端连接,所述FC层的输出端与所述softmax分类器的输入端连接;
所述多尺度特征提取模块的数学模型为:
Y1=θ1(η1 3(Hn))
Y2=θ2(η1 5(Hn))
CM1=fCA 1(fR(Y1,Y2))
CM2=fCA 2(fR(Y1,Y2),E)
Y3=[(Y1·CM1),(Y2·CM2)]
Figure FDA0003655117070000011
Figure FDA0003655117070000021
其中,Hn代表输入所述多尺度特征提取模块的特征图,η1 3()和η2 3()均表示卷积核尺寸为3*3的卷积操作层,η1 5()代表卷积核尺寸为5*5的卷积操作层,η1 1()表示卷积核尺寸为1*1的卷积操作层,θ1()、θ2()、θ3()和θ4()均表示非线性激活函数ReLU,fR()表示特征融合单元,fCA 1()和fCA 2()分别代表小尺度通道注意力模块和大尺度通道注意力模块,E表示从所述小尺度通道注意力模块输入所述大尺度通道注意力模块中的跨尺度校准图,CM1代表所述小尺度通道注意力模块生成的第一校准图,CM2代表所述大尺度通道注意力模块生成的第二校准图,[·]表示将其中的特征图做拼接操作,Hn+1为所述多尺度特征提取模块输出的特征图。
2.根据权利要求1所述的用于智能制造的矿石X光图像识别方法,其特征是:步骤S200中,训练所述图像分类网络时,采用的损失函数为交叉熵。
3.根据权利要求1所述的用于智能制造的矿石X光图像识别方法,其特征是:步骤S200中,训练所述图像分类网络时,学习率固定设置为0.0004。
4.根据权利要求1所述的用于智能制造的矿石X光图像识别方法,其特征是:所述最大池化层的池化窗口尺寸为2*2,步长为2。
5.根据权利要求1所述的用于智能制造的矿石X光图像识别方法,其特征是:所述特征融合单元的数学模型为:
R1=[Y1,Y2]+λ1(η2 1(Y1))+λ2(η3 1(Y2))
R2=θ5(η4 1(R1))
其中,Y1特征图和Y2特征图共同作为所述特征融合单元的输入,[·]表示将其中的特征图做拼接操作,η2 1()、η3 1()和η4 1()均表示卷积核尺寸为1*1的卷积操作层,λ1()和λ2()均表示非线性激活函数Logistic,θ5()表示非线性激活函数ReLU,R2特征图为所述特征融合单元的输出。
6.根据权利要求1所述的用于智能制造的矿石X光图像识别方法,其特征是:所述小尺度通道注意力模块的数学模型为:
SV1=ε1(ζ1(SEL(R2)))
SV2=ε2(ζ2(SAL(R2)))
CM1=SV1+SV2
其中,R2特征图作为所述小尺度通道注意力模块的输入,SEL()表示全图层平均池化处理层,SAL()表示全图层最大池化处理层,ε1和ε2均代表sigmoid激活函数,ζ1和ζ2均表示激活单元,CM1为所述小尺度通道注意力模块输出的第一校准图。
7.根据权利要求6所述的用于智能制造的矿石X光图像识别方法,其特征是:所述大尺度通道注意力模块的数学模型为:
BV1=ε3(ζ3(BEL(R2)))-SM1
BV2=ε4(ζ4(BAL(R2)))+SM2
BV3=ε5(ζ5(BVL(R2)))
CM2=BV1+BV2+BV3
其中,SM1表示所述小尺度通道注意力模块中全图层平均池化处理层输出的第一校准向量,SM2表示所述小尺度通道注意力模块中全图层最大池化处理层输出的第二校准向量,SM1、SM2和R2特征图共同作为所述大尺度通道注意力模块的输入,BEL()表示全图层平均池化处理层,BAL()表示全图层最大池化处理层,BVL()表示全图层方差池化处理层,ε3、ε4和ε5均代表sigmoid激活函数,ζ3、ζ4和ζ5均表示激活单元,CM2为所述大尺度通道注意力模块输出的第二校准图。
8.根据权利要求7所述的用于智能制造的矿石X光图像识别方法,其特征是:所述激活单元包括顺次连接的前端全连接运算层、非线性ReLU激活层和后端全连接运算层。
CN202210556471.5A 2022-05-20 2022-05-20 一种用于智能制造的矿石x光图像识别方法 Active CN115205614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210556471.5A CN115205614B (zh) 2022-05-20 2022-05-20 一种用于智能制造的矿石x光图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210556471.5A CN115205614B (zh) 2022-05-20 2022-05-20 一种用于智能制造的矿石x光图像识别方法

Publications (2)

Publication Number Publication Date
CN115205614A true CN115205614A (zh) 2022-10-18
CN115205614B CN115205614B (zh) 2023-12-22

Family

ID=83574835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210556471.5A Active CN115205614B (zh) 2022-05-20 2022-05-20 一种用于智能制造的矿石x光图像识别方法

Country Status (1)

Country Link
CN (1) CN115205614B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116416479A (zh) * 2023-06-06 2023-07-11 江西理工大学南昌校区 基于深度卷积融合多尺度图像特征的矿物分类方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1164537A2 (en) * 2000-06-16 2001-12-19 Canon Kabushiki Kaisha Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements
CN109902693A (zh) * 2019-02-16 2019-06-18 太原理工大学 一种基于多注意力空间金字塔特征图像识别方法
CN110728224A (zh) * 2019-10-08 2020-01-24 西安电子科技大学 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
CN111259982A (zh) * 2020-02-13 2020-06-09 苏州大学 一种基于注意力机制的早产儿视网膜图像分类方法和装置
CN112784764A (zh) * 2021-01-27 2021-05-11 南京邮电大学 一种基于局部与全局注意力机制的表情识别方法及***
CN112836773A (zh) * 2021-04-08 2021-05-25 河海大学 一种基于全局注意力残差网络的高光谱图像分类方法
US20210232813A1 (en) * 2020-01-23 2021-07-29 Tongji University Person re-identification method combining reverse attention and multi-scale deep supervision
CN113486981A (zh) * 2021-07-30 2021-10-08 西安电子科技大学 基于多尺度特征注意力融合网络的rgb图像分类方法
CN113627376A (zh) * 2021-08-18 2021-11-09 北京工业大学 基于多尺度密集连接深度可分离网络的人脸表情识别方法
US20210390338A1 (en) * 2020-06-15 2021-12-16 Dalian University Of Technology Deep network lung texture recogniton method combined with multi-scale attention
CN114067107A (zh) * 2022-01-13 2022-02-18 中国海洋大学 基于多粒度注意力的多尺度细粒度图像识别方法及***
WO2022061726A1 (en) * 2020-09-25 2022-03-31 Intel Corporation Method and system of multiple facial attributes recognition using highly efficient neural networks
CN114360030A (zh) * 2022-01-17 2022-04-15 重庆锐云科技有限公司 一种基于卷积神经网络的人脸识别方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1164537A2 (en) * 2000-06-16 2001-12-19 Canon Kabushiki Kaisha Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements
CN109902693A (zh) * 2019-02-16 2019-06-18 太原理工大学 一种基于多注意力空间金字塔特征图像识别方法
CN110728224A (zh) * 2019-10-08 2020-01-24 西安电子科技大学 一种基于注意力机制深度Contourlet网络的遥感图像分类方法
US20210232813A1 (en) * 2020-01-23 2021-07-29 Tongji University Person re-identification method combining reverse attention and multi-scale deep supervision
CN111259982A (zh) * 2020-02-13 2020-06-09 苏州大学 一种基于注意力机制的早产儿视网膜图像分类方法和装置
US20210390338A1 (en) * 2020-06-15 2021-12-16 Dalian University Of Technology Deep network lung texture recogniton method combined with multi-scale attention
WO2022061726A1 (en) * 2020-09-25 2022-03-31 Intel Corporation Method and system of multiple facial attributes recognition using highly efficient neural networks
CN112784764A (zh) * 2021-01-27 2021-05-11 南京邮电大学 一种基于局部与全局注意力机制的表情识别方法及***
CN112836773A (zh) * 2021-04-08 2021-05-25 河海大学 一种基于全局注意力残差网络的高光谱图像分类方法
CN113486981A (zh) * 2021-07-30 2021-10-08 西安电子科技大学 基于多尺度特征注意力融合网络的rgb图像分类方法
CN113627376A (zh) * 2021-08-18 2021-11-09 北京工业大学 基于多尺度密集连接深度可分离网络的人脸表情识别方法
CN114067107A (zh) * 2022-01-13 2022-02-18 中国海洋大学 基于多粒度注意力的多尺度细粒度图像识别方法及***
CN114360030A (zh) * 2022-01-17 2022-04-15 重庆锐云科技有限公司 一种基于卷积神经网络的人脸识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116416479A (zh) * 2023-06-06 2023-07-11 江西理工大学南昌校区 基于深度卷积融合多尺度图像特征的矿物分类方法
CN116416479B (zh) * 2023-06-06 2023-08-29 江西理工大学南昌校区 基于深度卷积融合多尺度图像特征的矿物分类方法

Also Published As

Publication number Publication date
CN115205614B (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN110033002B (zh) 基于多任务级联卷积神经网络的车牌检测方法
CN109543502B (zh) 一种基于深度多尺度神经网络的语义分割方法
CN109190752B (zh) 基于深度学习的全局特征和局部特征的图像语义分割方法
US20210158166A1 (en) Semi-structured learned threshold pruning for deep neural networks
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN111275107A (zh) 一种基于迁移学习的多标签场景图像分类方法及装置
Al-Haija et al. Multi-class weather classification using ResNet-18 CNN for autonomous IoT and CPS applications
CN109740686A (zh) 一种基于区域池化和特征融合的深度学习图像多标记分类方法
CN110210027B (zh) 基于集成学习的细粒度情感分析方法、装置、设备及介质
CN114048822A (zh) 一种图像的注意力机制特征融合分割方法
CN113034506B (zh) 遥感图像语义分割方法、装置、计算机设备和存储介质
CN111680739A (zh) 一种目标检测和语义分割的多任务并行方法及***
CN110059765B (zh) 一种矿物智能识别分类***与方法
CN113128620A (zh) 一种基于层次关系的半监督领域自适应图片分类方法
CN112200797B (zh) 一种基于pcb噪声标注数据的有效训练方法
US11449758B2 (en) Quantization and inferencing for low-bitwidth neural networks
CN115565071A (zh) 高光谱图像Transformer网络训练及分类方法
CN115205614B (zh) 一种用于智能制造的矿石x光图像识别方法
CN114445620A (zh) 一种改进Mask R-CNN的目标分割方法
Luo et al. Dense-tnt: Efficient vehicle type classification neural network using satellite imagery
CN111612803B (zh) 一种基于图像清晰度的车辆图像语义分割方法
US20230108248A1 (en) Model compression via quantized sparse principal component analysis
CN115953506A (zh) 基于图像生成模型的工业零件缺陷图像生成方法及***
CN114758133A (zh) 基于超像素主动学习和半监督学习策略的图像瑕疵分割方法
CN112749667B (zh) 一种基于深度学习的线虫分类识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231127

Address after: 518000, Room 402-1, Building 18, Zhonghai Xin Innovation Industrial City, No. 11 Ganli Second Road, Gankeng Community, Jihua Street, Longgang District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Worui Image Technology Co.,Ltd.

Address before: 610031 No. 2, group 5, Yinzi village, Nanyue Town, Dachuan District, Dazhou City, Sichuan Province

Applicant before: Zhong Jiaxing

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant