CN108364023A - 基于注意力模型的图像识别方法和*** - Google Patents
基于注意力模型的图像识别方法和*** Download PDFInfo
- Publication number
- CN108364023A CN108364023A CN201810139775.5A CN201810139775A CN108364023A CN 108364023 A CN108364023 A CN 108364023A CN 201810139775 A CN201810139775 A CN 201810139775A CN 108364023 A CN108364023 A CN 108364023A
- Authority
- CN
- China
- Prior art keywords
- matrix
- image
- weight matrix
- attention
- characteristic pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于注意力模型的图像识别方法和***,首先获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;然后使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C],可有效提高特征提取的针对性,从而强化对于图像局部特征的提取能力。
Description
技术领域
本发明涉及图像处理技术领域,具体而言,本发明涉及一种基于注意力模型的图像识别方法和***。
背景技术
近年来,深度学习在视频图像处理、语音识别、自然语言处理等相关领域得到了广泛应用。但是在处理具体的图像分类任务或者语音识别任务时,会由于输入数据的多样性,使得模型只能捕捉到数据的全局信息,而忽视了数据的局部信息。以图像分类为例,一些传统的解决办法是将图像人为划分成多个区域,采用空间金字塔的形式捕捉数据的局部信息,虽然该方法可以一定程度上解决上述问题,但是由于是人为预先划定分割区域,所以其对不同数据的泛化能力较差。
发明内容
本发明的目的旨在至少能解决上述的技术缺陷之一,特别是容易忽略数据局部信息的技术缺陷。
本发明提供一种基于注意力模型的图像识别方法,包括如下步骤:
步骤S10:获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;
步骤S20:使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。
在其中一个实施例中,所述预设的空间映射权重矩阵为空间注意力矩阵[C,1]时,在步骤S20中使用以下公式:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c·ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图,i:,:,c为输入的特征图,sigmoid为激活函数,ws为空间映射权重,bs为偏差。
在其中一个实施例中,所述预设的空间映射权重矩阵为通道注意力矩阵[C,C]时,在步骤S20中使用以下公式:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)·wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图,iw,h,:为输入的特征图,sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差。
在其中一个实施例中,步骤S20包括:
在卷积神经网络的浅层网络使用所述空间注意力矩阵[C,1]对输入特征图进行空间映射,并经过激活函数激活后得到第一空间权重矩阵,将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图;
在卷积神经网络的深层网络使用所述通道注意力矩阵[C,1]对所述第一输出特征图进行空间映射,并经过激活函数激活后得到第二空间权重矩阵,将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。
在其中一个实施例中,还包括步骤S30:
根据所述输出特征图应用分类器进行图像分类。
本发明还提供一种基于注意力模型的图像识别***,包括:
图像获取模块,用于获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;
图像处理模块,用于使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。
在其中一个实施例中,所述预设的空间映射权重矩阵为空间注意力矩阵[C,1]时,所述图像处理模块使用以下公式得到输出特征图:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c·ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图,i:,:,c为输入的特征图,sigmoid为激活函数,ws为空间映射权重,bs为偏差。
在其中一个实施例中,所述预设的空间映射权重矩阵为通道注意力矩阵[C,C]时,所述图像处理模块使用以下公式得到输出特征图:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)·wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图,iw,h,:为输入的特征图,sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差。
在其中一个实施例中,所述图像处理模块包括低级语义特征提取模块和高级语义特征提取模块;
所述低级语义特征提取模块用于:在卷积神经网络的浅层网络使用所述空间注意力矩阵[C,1]对输入特征图进行空间映射,并经过激活函数激活后得到第一空间权重矩阵,将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图;
所述高级语义特征提取模块用于:在卷积神经网络的深层网络使用所述通道注意力矩阵[C,1]对所述第一输出特征图进行空间映射,并经过激活函数激活后得到第二空间权重矩阵,将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。
在其中一个实施例中,还包括分类模块,用于根据所述输出特征图应用分类器进行图像分类。
上述的基于注意力模型的图像识别方法和***,首先获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;然后使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。通过上述的的空间注意力矩阵[C,1]或通道注意力矩阵[C,C],可以使得在特征提取过程中注意力在于空间或通道,有效提高特征提取的针对性,从而强化对于图像局部特征的提取能力。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为一个实施例的基于注意力模型的图像识别方法流程示意图;
图2为一个实施例的基于空间注意力模型的特征提取过程示意图;
图3为一个实施例的基于通道注意力模型的特征提取过程示意图;
图4为另一个实施例的基于注意力模型的图像识别方法流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
实施例一
图1为一个实施例的基于注意力模型的图像识别方法流程示意图,一种基于注意力模型的图像识别方法,包括如下步骤:
步骤S10:获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度(图像的宽度,单位为像素),H为高度(图像的高度,单位为像素),C为通道数(图像的颜色通道数量)。这里的图像矩阵为三维矩阵,[W,H,C]的格式还可以写成W*H*C的格式,即宽度*高度*通道数。
步骤S20:使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。
在本实施例中,预设的空间映射权重矩阵为空间注意力矩阵[C,1]时,在步骤S20中使用以下公式:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c·ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图(图像矩阵),i:,:,c为输入的特征图(图像矩阵),sigmoid为激活函数,ws为空间映射权重,bs为偏差。⊙是表示两个相同尺寸矩阵中相同位置的数据相乘以生成一个同一尺寸的矩阵。例如A和B为两个2*2的二维矩阵,最后生成2*2的二维矩阵K。A矩阵中的数据为Amn(A11,A12,A21,A22),m为行数,n为列数;B矩阵中的数据为Bmn(B11,B12,B21,B22),m为行数,n为列数;K矩阵中的数据为Kmn(K11,K12,K21,K22),m为行数,n为列数;则Amn×Bmn=Kmn,即A11×B11=K11,A12×B12=K12,A21×B21=K21,A22×B22=K22。
图2为一个实施例的基于空间注意力模型的特征提取过程示意图,i为输入特征图,w为空间权重矩阵,o为输出特征图。
在本实施例中,预设的空间映射权重矩阵为通道注意力矩阵[C,C]时,在步骤S20中使用以下公式:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)·wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图(图像矩阵),iw,h,:为输入的特征图(图像矩阵),sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差。
图3为一个实施例的基于通道注意力模型的特征提取过程示意图,左侧的“特征图1、特征图2、……特征图m”表示m个通道的输入特征图,右侧的“特征图1、特征图2、……特征图m”表示m个通道的输出特征图。
在上述本实施例中,还可以包括步骤S30:根据输出特征图应用分类器进行图像分类。
实施例二
图4为另一个实施例的基于注意力模型的图像识别方法流程示意图,一种基于注意力模型的图像识别方法,包括如下步骤:
步骤S21:获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度(图像的宽度,单位为像素),H为高度(图像的高度,单位为像素),C为通道数(图像的颜色通道数量)。这里的图像矩阵为三维矩阵,[W,H,C]的格式还可以写成W*H*C的格式,即宽度*高度*通道数。
步骤S22:在卷积神经网络的浅层网络使用空间注意力矩阵[C,1]对输入特征图进行空间映射,并经过激活函数激活后得到第一空间权重矩阵,将第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图。浅层网络用于提取图像的底层特征,所以在空间上较为敏感,使用空间注意力矩阵[C,1]提取特征的注意力模式比较合适。
在本实施例中,可以使用以下公式得到第一输出特征图:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c·ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图(即第一输出特征图),i:,:,c为输入的特征图(即输入特征图),sigmoid为激活函数,ws为空间映射权重(即空间注意力矩阵[C,1]),bs为偏差,sigmoid(i:,:,c·ws+bs)为第一空间权重矩阵。图2为一个实施例的基于空间注意力模型的特征提取过程示意图,i为输入特征图,w为空间权重矩阵,o为输出特征图。
步骤S23:在卷积神经网络的深层网络使用通道注意力矩阵[C,1]对第一输出特征图进行空间映射,并经过激活函数激活后得到第二空间权重矩阵,将第二空间权重矩阵与第一输出特征图的图像矩阵按位相乘得到第二输出特征图。深层网络用于提取高级语义层级的特征,所以对通道的信息较为敏感。
在本实施例中,使用以下公式得到第二输出特征图:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)·wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图(即第二输出特征图),iw,h,:为输入的特征图(即第一输出特征图),sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差,sigmoid(mean(iw,h,:)·wc+bc)为第二空间权重矩阵。图3为一个实施例的基于通道注意力模型的特征提取过程示意图,左侧的“特征图1、特征图2、……特征图m”表示m个通道的输入特征图,右侧的“特征图1、特征图2、……特征图m”表示m个通道的输出特征图。
在上述本实施例中,还可以包括步骤S24:根据第二输出特征图应用分类器进行图像分类。
实施例三
本发明还提供一种基于注意力模型的图像识别***,包括:
图像获取模块,用于获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数。
图像处理模块,用于使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。
在本实施例中,预设的空间映射权重矩阵为空间注意力矩阵[C,1]时,图像处理模块使用以下公式得到输出特征图:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c·ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图,i:,:,c为输入的特征图,sigmoid为激活函数,ws为空间映射权重,bs为偏差。
在本实施例中,预设的空间映射权重矩阵为通道注意力矩阵[C,C]时,图像处理模块使用以下公式得到输出特征图:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)·wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图,iw,h,:为输入的特征图,sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差。
在上述本实施例中,还可以包括分类模块,用于根据输出特征图应用分类器进行图像分类。
实施例四
本发明还提供一种基于注意力模型的图像识别***,包括:图像获取模块和图像处理模块。
图像获取模块用于获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数。
图像处理模块包括低级语义特征提取模块和高级语义特征提取模块。
低级语义特征提取模块用于:在卷积神经网络的浅层网络使用空间注意力矩阵[C,1]对输入特征图进行空间映射,并经过激活函数激活后得到第一空间权重矩阵,将第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图。浅层网络用于提取图像的底层特征,所以在空间上较为敏感,使用空间注意力矩阵[C,1]提取特征的注意力模式比较合适。
在本实施例中,可以使用以下公式得到第一输出特征图:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c·ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图(即第一输出特征图),i:,:,c为输入的特征图(即输入特征图),sigmoid为激活函数,ws为空间映射权重(即空间注意力矩阵[C,1]),bs为偏差,sigmoid(i:,:,c·ws+bs)为第一空间权重矩阵。
高级语义特征提取模块用于:在卷积神经网络的深层网络使用通道注意力矩阵[C,1]对第一输出特征图进行空间映射,并经过激活函数激活后得到第二空间权重矩阵,将第二空间权重矩阵与第一输出特征图的图像矩阵按位相乘得到第二输出特征图。深层网络用于提取高级语义层级的特征,所以对通道的信息较为敏感。
在本实施例中,使用以下公式得到第二输出特征图:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)·wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图(即第二输出特征图),iw,h,:为输入的特征图(即第一输出特征图),sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差,sigmoid(mean(iw,h,:)·wc+bc)为第二空间权重矩阵。
在本实施例中,还包括分类模块,用于根据第二输出特征图应用分类器进行图像分类。
上述的基于注意力模型的图像识别方法和***,首先获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;然后使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。通过上述的的空间注意力矩阵[C,1]或通道注意力矩阵[C,C],可以使得在特征提取过程中注意力在于空间或通道,有效提高特征提取的针对性,从而强化对于图像局部特征的提取能力。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于注意力模型的图像识别方法,其特征在于,包括如下步骤:
步骤S10:获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;
步骤S20:使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。
2.根据权利要求1所述的基于注意力模型的图像识别方法,其特征在于,所述预设的空间映射权重矩阵为空间注意力矩阵[C,1]时,在步骤S20中使用以下公式:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c■ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图,i:,:,c为输入的特征图,sigmoid为激活函数,ws为空间映射权重,bs为偏差。
3.根据权利要求1所述的基于注意力模型的图像识别方法,其特征在于,所述预设的空间映射权重矩阵为通道注意力矩阵[C,C]时,在步骤S20中使用以下公式:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)■wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图,iw,h,:为输入的特征图,sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差。
4.根据权利要求1所述的基于注意力模型的图像识别方法,其特征在于,步骤S20包括:
在卷积神经网络的浅层网络使用所述空间注意力矩阵[C,1]对输入特征图进行空间映射,并经过激活函数激活后得到第一空间权重矩阵,将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图;
在卷积神经网络的深层网络使用所述通道注意力矩阵[C,1]对所述第一输出特征图进行空间映射,并经过激活函数激活后得到第二空间权重矩阵,将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。
5.根据权利要求1所述的基于注意力模型的图像识别方法,其特征在于,还包括步骤S30:
根据所述输出特征图应用分类器进行图像分类。
6.一种基于注意力模型的图像识别***,其特征在于,包括:
图像获取模块,用于获取图像矩阵形状为[W,H,C]的输入特征图,其中,W为宽度,H为高度,C为通道数;
图像处理模块,用于使用预设的空间映射权重矩阵对输入特征图进行空间映射,并经过激活函数激活后得到空间权重矩阵,将所述空间权重矩阵与输入特征图的图像矩阵按位相乘得到输出特征图,其中,所述预设的空间映射权重矩阵为注意力在于图像宽度和高度的空间注意力矩阵[C,1],此时空间权重矩阵的形状为[W,H,1],或者所述预设的空间映射权重矩阵为注意力在于图像通道数的通道注意力矩阵[C,C],此时空间权重矩阵的形状为[1,1,C]。
7.根据权利要求6所述的基于注意力模型的图像识别***,其特征在于,所述预设的空间映射权重矩阵为空间注意力矩阵[C,1]时,所述图像处理模块使用以下公式得到输出特征图:
o:,:,c=i:,:,c⊙sigmoid(i:,:,c■ws+bs)
其中,⊙为按位乘,■为矩阵乘法,o:,:,c为输出的特征图,i:,:,c为输入的特征图,sigmoid为激活函数,ws为空间映射权重,bs为偏差。
8.根据权利要求6所述的基于注意力模型的图像识别***,其特征在于,所述预设的空间映射权重矩阵为通道注意力矩阵[C,C]时,所述图像处理模块使用以下公式得到输出特征图:
ow,h,:=iw,h,:⊙sigmoid(mean(iw,h,:)■wc+bc)
其中,⊙为按位乘,■为矩阵乘法,ow,h,:为输出的特征图,iw,h,:为输入的特征图,sigmoid为激活函数,mean为求平均值函数,wc为空间映射权重,bc为偏差。
9.根据权利要求6所述的基于注意力模型的图像识别***,其特征在于,所述图像处理模块包括低级语义特征提取模块和高级语义特征提取模块;
所述低级语义特征提取模块用于:在卷积神经网络的浅层网络使用所述空间注意力矩阵[C,1]对输入特征图进行空间映射,并经过激活函数激活后得到第一空间权重矩阵,将所述第一空间权重矩阵与输入特征图的图像矩阵按位相乘得到第一输出特征图;
所述高级语义特征提取模块用于:在卷积神经网络的深层网络使用所述通道注意力矩阵[C,1]对所述第一输出特征图进行空间映射,并经过激活函数激活后得到第二空间权重矩阵,将所述第二空间权重矩阵与所述第一输出特征图的图像矩阵按位相乘得到第二输出特征图。
10.根据权利要求6所述的基于注意力模型的图像识别***,其特征在于,还包括分类模块,用于根据所述输出特征图应用分类器进行图像分类。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810139775.5A CN108364023A (zh) | 2018-02-11 | 2018-02-11 | 基于注意力模型的图像识别方法和*** |
PCT/CN2018/122684 WO2019153908A1 (zh) | 2018-02-11 | 2018-12-21 | 基于注意力模型的图像识别方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810139775.5A CN108364023A (zh) | 2018-02-11 | 2018-02-11 | 基于注意力模型的图像识别方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108364023A true CN108364023A (zh) | 2018-08-03 |
Family
ID=63005720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810139775.5A Pending CN108364023A (zh) | 2018-02-11 | 2018-02-11 | 基于注意力模型的图像识别方法和*** |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108364023A (zh) |
WO (1) | WO2019153908A1 (zh) |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109325911A (zh) * | 2018-08-27 | 2019-02-12 | 北京航空航天大学 | 一种基于注意力增强机制的空基铁轨检测方法 |
CN109376804A (zh) * | 2018-12-19 | 2019-02-22 | 中国地质大学(武汉) | 基于注意力机制和卷积神经网络高光谱遥感图像分类方法 |
CN109584161A (zh) * | 2018-11-29 | 2019-04-05 | 四川大学 | 基于通道注意力的卷积神经网络的遥感图像超分辨率重建方法 |
CN109871777A (zh) * | 2019-01-23 | 2019-06-11 | 广州智慧城市发展研究院 | 一种基于注意力机制的行为识别*** |
CN109871909A (zh) * | 2019-04-16 | 2019-06-11 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
CN109871532A (zh) * | 2019-01-04 | 2019-06-11 | 平安科技(深圳)有限公司 | 文本主题提取方法、装置及存储介质 |
CN109919925A (zh) * | 2019-03-04 | 2019-06-21 | 联觉(深圳)科技有限公司 | 印刷电路板智能检测方法、***、电子装置及存储介质 |
CN109919249A (zh) * | 2019-03-19 | 2019-06-21 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
CN109960726A (zh) * | 2019-02-13 | 2019-07-02 | 平安科技(深圳)有限公司 | 文本分类模型构建方法、装置、终端及存储介质 |
CN110046598A (zh) * | 2019-04-23 | 2019-07-23 | 中南大学 | 即插即用的多尺度空间和通道注意遥感影像目标检测方法 |
CN110084794A (zh) * | 2019-04-22 | 2019-08-02 | 华南理工大学 | 一种基于注意力卷积神经网络的皮肤癌图片识别方法 |
WO2019153908A1 (zh) * | 2018-02-11 | 2019-08-15 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和*** |
CN110135325A (zh) * | 2019-05-10 | 2019-08-16 | 山东大学 | 基于尺度自适应网络的人群人数计数方法及*** |
CN110334749A (zh) * | 2019-06-20 | 2019-10-15 | 浙江工业大学 | 基于注意力机制的对抗攻击防御模型、构建方法及应用 |
CN110334716A (zh) * | 2019-07-04 | 2019-10-15 | 北京迈格威科技有限公司 | 特征图处理方法、图像处理方法及装置 |
CN110689093A (zh) * | 2019-12-10 | 2020-01-14 | 北京同方软件有限公司 | 一种复杂场景下的图像目标精细分类方法 |
WO2020029708A1 (zh) * | 2018-08-07 | 2020-02-13 | 深圳市商汤科技有限公司 | 图像处理方法和装置、电子设备、存储介质、程序产品 |
CN110991568A (zh) * | 2020-03-02 | 2020-04-10 | 佳都新太科技股份有限公司 | 目标识别方法、装置、设备和存储介质 |
CN111191737A (zh) * | 2020-01-05 | 2020-05-22 | 天津大学 | 基于多尺度反复注意力机制的细粒度图像分类方法 |
CN111461973A (zh) * | 2020-01-17 | 2020-07-28 | 华中科技大学 | 一种图像的超分辨率重建方法及*** |
CN111598117A (zh) * | 2019-02-21 | 2020-08-28 | 成都通甲优博科技有限责任公司 | 图像识别方法及装置 |
CN112287989A (zh) * | 2020-10-20 | 2021-01-29 | 武汉大学 | 一种基于自注意力机制的航空影像地物分类方法 |
CN112329702A (zh) * | 2020-11-19 | 2021-02-05 | 上海点泽智能科技有限公司 | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 |
CN112633158A (zh) * | 2020-12-22 | 2021-04-09 | 广东电网有限责任公司电力科学研究院 | 一种输电线路走廊车辆识别方法、装置、设备和存储介质 |
CN112766597A (zh) * | 2021-01-29 | 2021-05-07 | 中国科学院自动化研究所 | 公交客流预测方法及*** |
CN113076878A (zh) * | 2021-04-02 | 2021-07-06 | 郑州大学 | 基于注意力机制卷积网络结构的体质辨识方法 |
CN113139444A (zh) * | 2021-04-06 | 2021-07-20 | 上海工程技术大学 | 基于MobileNetV2的时空注意力口罩佩戴实时检测方法 |
CN113361441A (zh) * | 2021-06-18 | 2021-09-07 | 山东大学 | 基于头部姿态和空间注意力的视线区域估计方法及*** |
CN113539297A (zh) * | 2021-07-08 | 2021-10-22 | 中国海洋大学 | 一种用于声音分类的联合注意力机制模型、方法及应用 |
CN114005078A (zh) * | 2021-12-31 | 2022-02-01 | 山东交通学院 | 一种基于双关系注意力机制的车辆重识别方法 |
WO2022105655A1 (zh) * | 2020-11-23 | 2022-05-27 | 中兴通讯股份有限公司 | 图像处理方法、图像处理装置、电子设备和计算机可读存储介质 |
CN116030014A (zh) * | 2023-01-06 | 2023-04-28 | 浙江伟众科技有限公司 | 空调软硬管的智能化加工方法及其*** |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733578B (zh) * | 2019-10-28 | 2024-05-24 | 普天信息技术有限公司 | 车辆重识别方法及*** |
CN111369433B (zh) * | 2019-11-12 | 2024-02-13 | 天津大学 | 基于可分离卷积和注意力的三维图像超分辨率重建方法 |
CN111028253B (zh) * | 2019-11-25 | 2023-05-30 | 北京科技大学 | 一种铁精粉分割方法及分割装置 |
CN111126258B (zh) * | 2019-12-23 | 2023-06-23 | 深圳市华尊科技股份有限公司 | 图像识别方法及相关装置 |
CN111414962B (zh) * | 2020-03-19 | 2023-06-23 | 创新奇智(重庆)科技有限公司 | 一种引入物体关系的图像分类方法 |
US11694319B2 (en) | 2020-04-10 | 2023-07-04 | Samsung Display Co., Ltd. | Image-based defects identification and semi-supervised localization |
CN111539884B (zh) * | 2020-04-21 | 2023-08-15 | 温州大学 | 一种基于多注意力机制融合的神经网络视频去模糊方法 |
CN111639654B (zh) * | 2020-05-12 | 2023-12-26 | 博泰车联网(南京)有限公司 | 一种图像处理方法、装置及计算机存储介质 |
CN111950586B (zh) * | 2020-07-01 | 2024-01-19 | 银江技术股份有限公司 | 一种引入双向注意力的目标检测方法 |
CN112035645B (zh) * | 2020-09-01 | 2024-06-11 | 平安科技(深圳)有限公司 | 数据查询方法以及*** |
CN112464787B (zh) * | 2020-11-25 | 2022-07-08 | 北京航空航天大学 | 基于空间融合注意力的遥感图像舰船目标细粒度分类方法 |
CN112560907B (zh) * | 2020-12-02 | 2024-05-28 | 西安电子科技大学 | 基于混合域注意力的有限像素红外无人机目标检测方法 |
CN112613356B (zh) * | 2020-12-07 | 2023-01-10 | 北京理工大学 | 一种基于深度注意力融合网络的动作检测方法及装置 |
CN112489033A (zh) * | 2020-12-13 | 2021-03-12 | 南通云达信息技术有限公司 | 基于分类权重的混凝土养护箱的清洁效果的检测方法 |
CN112653899B (zh) * | 2020-12-18 | 2022-07-12 | 北京工业大学 | 一种基于联合注意力ResNeSt的复杂场景下网络直播视频特征提取方法 |
CN113283278B (zh) * | 2021-01-08 | 2023-03-24 | 浙江大学 | 一种抗干扰的激光水下目标识别仪 |
CN112801945A (zh) * | 2021-01-11 | 2021-05-14 | 西北大学 | 基于双重注意力机制特征提取的深度高斯混合模型颅骨配准方法 |
CN113408577A (zh) * | 2021-05-12 | 2021-09-17 | 桂林电子科技大学 | 一种基于注意力机制的图像分类方法 |
CN113468967B (zh) * | 2021-06-02 | 2023-08-18 | 北京邮电大学 | 基于注意力机制的车道线检测方法、装置、设备及介质 |
CN113255821B (zh) * | 2021-06-15 | 2021-10-29 | 中国人民解放军国防科技大学 | 基于注意力的图像识别方法、***、电子设备及存储介质 |
CN113674334B (zh) * | 2021-07-06 | 2023-04-18 | 复旦大学 | 基于深度自注意力网络和局部特征编码的纹理识别方法 |
CN113450366B (zh) * | 2021-07-16 | 2022-08-30 | 桂林电子科技大学 | 基于AdaptGAN的低照度语义分割方法 |
CN113569735B (zh) * | 2021-07-28 | 2023-04-07 | 中国人民解放军空军预警学院 | 基于复数坐标注意力模块的复输入特征图处理方法及*** |
CN113658114A (zh) * | 2021-07-29 | 2021-11-16 | 南京理工大学 | 基于多尺度交叉注意力的接触网开口销缺陷目标检测方法 |
CN113744284B (zh) * | 2021-09-06 | 2023-08-29 | 浙大城市学院 | 脑肿瘤图像区域分割方法、装置、神经网络及电子设备 |
CN113793345B (zh) * | 2021-09-07 | 2023-10-31 | 复旦大学附属华山医院 | 一种基于改进注意力模块的医疗影像分割方法及装置 |
CN113744844B (zh) * | 2021-09-17 | 2024-01-26 | 天津市肿瘤医院(天津医科大学肿瘤医院) | 基于深度卷积神经网络的甲状腺超声影像处理方法 |
CN113744164B (zh) * | 2021-11-05 | 2022-03-15 | 深圳市安软慧视科技有限公司 | 一种快速夜间低照度图像增强方法、***及相关设备 |
CN114549962B (zh) * | 2022-03-07 | 2024-06-21 | 重庆锐云科技有限公司 | 一种园林植物叶病分类方法 |
CN114612979B (zh) * | 2022-03-09 | 2024-05-31 | 平安科技(深圳)有限公司 | 一种活体检测方法及装置、电子设备、存储介质 |
CN114758206B (zh) * | 2022-06-13 | 2022-10-28 | 武汉珈鹰智能科技有限公司 | 一种钢网架结构异常检测方法及装置 |
CN115578615B (zh) * | 2022-10-31 | 2023-05-09 | 成都信息工程大学 | 基于深度学习的夜间交通标志图像检测模型建立方法 |
CN115937792B (zh) * | 2023-01-10 | 2023-09-12 | 浙江非线数联科技股份有限公司 | 基于区块链的智慧社区运营管理*** |
CN116503398B (zh) * | 2023-06-26 | 2023-09-26 | 广东电网有限责任公司湛江供电局 | 绝缘子污闪检测方法、装置、电子设备及存储介质 |
CN117218720B (zh) * | 2023-08-25 | 2024-04-16 | 中南民族大学 | 一种复合注意力机制的足迹识别方法、***及相关装置 |
CN117789153B (zh) * | 2024-02-26 | 2024-05-03 | 浙江驿公里智能科技有限公司 | 基于计算机视觉的汽车油箱外盖定位***及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934397A (zh) * | 2017-03-13 | 2017-07-07 | 北京市商汤科技开发有限公司 | 图像处理方法、装置及电子设备 |
CN107291945A (zh) * | 2017-07-12 | 2017-10-24 | 上海交通大学 | 基于视觉注意力模型的高精度服装图像检索方法及*** |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104517122A (zh) * | 2014-12-12 | 2015-04-15 | 浙江大学 | 一种基于优化卷积架构的图像目标识别方法 |
CN106127749A (zh) * | 2016-06-16 | 2016-11-16 | 华南理工大学 | 基于视觉注意机制的目标零件识别方法 |
CN107273800B (zh) * | 2017-05-17 | 2020-08-14 | 大连理工大学 | 一种基于注意机制的卷积递归神经网络的动作识别方法 |
CN107609638B (zh) * | 2017-10-12 | 2019-12-10 | 湖北工业大学 | 一种基于线性编码器和插值采样优化卷积神经网络的方法 |
CN108364023A (zh) * | 2018-02-11 | 2018-08-03 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和*** |
-
2018
- 2018-02-11 CN CN201810139775.5A patent/CN108364023A/zh active Pending
- 2018-12-21 WO PCT/CN2018/122684 patent/WO2019153908A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106934397A (zh) * | 2017-03-13 | 2017-07-07 | 北京市商汤科技开发有限公司 | 图像处理方法、装置及电子设备 |
CN107291945A (zh) * | 2017-07-12 | 2017-10-24 | 上海交通大学 | 基于视觉注意力模型的高精度服装图像检索方法及*** |
Cited By (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019153908A1 (zh) * | 2018-02-11 | 2019-08-15 | 北京达佳互联信息技术有限公司 | 基于注意力模型的图像识别方法和*** |
WO2020029708A1 (zh) * | 2018-08-07 | 2020-02-13 | 深圳市商汤科技有限公司 | 图像处理方法和装置、电子设备、存储介质、程序产品 |
CN109325911A (zh) * | 2018-08-27 | 2019-02-12 | 北京航空航天大学 | 一种基于注意力增强机制的空基铁轨检测方法 |
CN109584161A (zh) * | 2018-11-29 | 2019-04-05 | 四川大学 | 基于通道注意力的卷积神经网络的遥感图像超分辨率重建方法 |
CN109376804A (zh) * | 2018-12-19 | 2019-02-22 | 中国地质大学(武汉) | 基于注意力机制和卷积神经网络高光谱遥感图像分类方法 |
CN109376804B (zh) * | 2018-12-19 | 2020-10-30 | 中国地质大学(武汉) | 基于注意力机制和卷积神经网络高光谱遥感图像分类方法 |
CN109871532A (zh) * | 2019-01-04 | 2019-06-11 | 平安科技(深圳)有限公司 | 文本主题提取方法、装置及存储介质 |
CN109871777A (zh) * | 2019-01-23 | 2019-06-11 | 广州智慧城市发展研究院 | 一种基于注意力机制的行为识别*** |
CN109871777B (zh) * | 2019-01-23 | 2021-10-01 | 广州智慧城市发展研究院 | 一种基于注意力机制的行为识别*** |
CN109960726B (zh) * | 2019-02-13 | 2024-01-23 | 平安科技(深圳)有限公司 | 文本分类模型构建方法、装置、终端及存储介质 |
CN109960726A (zh) * | 2019-02-13 | 2019-07-02 | 平安科技(深圳)有限公司 | 文本分类模型构建方法、装置、终端及存储介质 |
CN111598117A (zh) * | 2019-02-21 | 2020-08-28 | 成都通甲优博科技有限责任公司 | 图像识别方法及装置 |
CN109919925A (zh) * | 2019-03-04 | 2019-06-21 | 联觉(深圳)科技有限公司 | 印刷电路板智能检测方法、***、电子装置及存储介质 |
CN109919249B (zh) * | 2019-03-19 | 2020-07-31 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
CN109919249A (zh) * | 2019-03-19 | 2019-06-21 | 北京字节跳动网络技术有限公司 | 用于生成特征图的方法和装置 |
CN109871909B (zh) * | 2019-04-16 | 2021-10-01 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
US11100320B2 (en) | 2019-04-16 | 2021-08-24 | Boe Technology Group Co., Ltd. | Image recognition method and apparatus |
CN109871909A (zh) * | 2019-04-16 | 2019-06-11 | 京东方科技集团股份有限公司 | 图像识别方法及装置 |
CN110084794A (zh) * | 2019-04-22 | 2019-08-02 | 华南理工大学 | 一种基于注意力卷积神经网络的皮肤癌图片识别方法 |
CN110046598B (zh) * | 2019-04-23 | 2023-01-06 | 中南大学 | 即插即用的多尺度空间和通道注意遥感影像目标检测方法 |
CN110046598A (zh) * | 2019-04-23 | 2019-07-23 | 中南大学 | 即插即用的多尺度空间和通道注意遥感影像目标检测方法 |
CN110135325A (zh) * | 2019-05-10 | 2019-08-16 | 山东大学 | 基于尺度自适应网络的人群人数计数方法及*** |
CN110135325B (zh) * | 2019-05-10 | 2020-12-08 | 山东大学 | 基于尺度自适应网络的人群人数计数方法及*** |
CN110334749A (zh) * | 2019-06-20 | 2019-10-15 | 浙江工业大学 | 基于注意力机制的对抗攻击防御模型、构建方法及应用 |
CN110334716B (zh) * | 2019-07-04 | 2022-01-11 | 北京迈格威科技有限公司 | 特征图处理方法、图像处理方法及装置 |
CN110334716A (zh) * | 2019-07-04 | 2019-10-15 | 北京迈格威科技有限公司 | 特征图处理方法、图像处理方法及装置 |
CN110689093A (zh) * | 2019-12-10 | 2020-01-14 | 北京同方软件有限公司 | 一种复杂场景下的图像目标精细分类方法 |
CN111191737B (zh) * | 2020-01-05 | 2023-07-25 | 天津大学 | 基于多尺度反复注意力机制的细粒度图像分类方法 |
CN111191737A (zh) * | 2020-01-05 | 2020-05-22 | 天津大学 | 基于多尺度反复注意力机制的细粒度图像分类方法 |
CN111461973A (zh) * | 2020-01-17 | 2020-07-28 | 华中科技大学 | 一种图像的超分辨率重建方法及*** |
CN110991568A (zh) * | 2020-03-02 | 2020-04-10 | 佳都新太科技股份有限公司 | 目标识别方法、装置、设备和存储介质 |
CN112287989A (zh) * | 2020-10-20 | 2021-01-29 | 武汉大学 | 一种基于自注意力机制的航空影像地物分类方法 |
CN112287989B (zh) * | 2020-10-20 | 2022-06-07 | 武汉大学 | 一种基于自注意力机制的航空影像地物分类方法 |
CN112329702A (zh) * | 2020-11-19 | 2021-02-05 | 上海点泽智能科技有限公司 | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 |
CN112329702B (zh) * | 2020-11-19 | 2021-05-07 | 上海点泽智能科技有限公司 | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 |
WO2022105655A1 (zh) * | 2020-11-23 | 2022-05-27 | 中兴通讯股份有限公司 | 图像处理方法、图像处理装置、电子设备和计算机可读存储介质 |
CN112633158A (zh) * | 2020-12-22 | 2021-04-09 | 广东电网有限责任公司电力科学研究院 | 一种输电线路走廊车辆识别方法、装置、设备和存储介质 |
CN112766597A (zh) * | 2021-01-29 | 2021-05-07 | 中国科学院自动化研究所 | 公交客流预测方法及*** |
CN112766597B (zh) * | 2021-01-29 | 2023-06-27 | 中国科学院自动化研究所 | 公交客流预测方法及*** |
CN113076878A (zh) * | 2021-04-02 | 2021-07-06 | 郑州大学 | 基于注意力机制卷积网络结构的体质辨识方法 |
CN113139444A (zh) * | 2021-04-06 | 2021-07-20 | 上海工程技术大学 | 基于MobileNetV2的时空注意力口罩佩戴实时检测方法 |
CN113361441B (zh) * | 2021-06-18 | 2022-09-06 | 山东大学 | 基于头部姿态和空间注意力的视线区域估计方法及*** |
CN113361441A (zh) * | 2021-06-18 | 2021-09-07 | 山东大学 | 基于头部姿态和空间注意力的视线区域估计方法及*** |
CN113539297A (zh) * | 2021-07-08 | 2021-10-22 | 中国海洋大学 | 一种用于声音分类的联合注意力机制模型、方法及应用 |
CN114005078B (zh) * | 2021-12-31 | 2022-03-29 | 山东交通学院 | 一种基于双关系注意力机制的车辆重识别方法 |
CN114005078A (zh) * | 2021-12-31 | 2022-02-01 | 山东交通学院 | 一种基于双关系注意力机制的车辆重识别方法 |
CN116030014A (zh) * | 2023-01-06 | 2023-04-28 | 浙江伟众科技有限公司 | 空调软硬管的智能化加工方法及其*** |
CN116030014B (zh) * | 2023-01-06 | 2024-04-09 | 浙江伟众科技有限公司 | 空调软硬管的智能化加工方法及其*** |
Also Published As
Publication number | Publication date |
---|---|
WO2019153908A1 (zh) | 2019-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108364023A (zh) | 基于注意力模型的图像识别方法和*** | |
CN104978580B (zh) | 一种用于无人机巡检输电线路的绝缘子识别方法 | |
CN111523470B (zh) | 一种行人重识别方法、装置、设备及介质 | |
CN111814574B (zh) | 应用双分支三维卷积模型的人脸活体检测***、终端及存储介质 | |
WO2018120013A1 (en) | Artificial neural network | |
CN108171701B (zh) | 基于u网络和对抗学习的显著性检测方法 | |
CN106295502B (zh) | 一种人脸检测方法及装置 | |
CN109816769A (zh) | 基于深度相机的场景地图生成方法、装置及设备 | |
CN107516096A (zh) | 一种字符识别方法及装置 | |
CN113822209B (zh) | 高光谱图像识别方法、装置、电子设备及可读存储介质 | |
CN110782420A (zh) | 一种基于深度学习的小目标特征表示增强方法 | |
CN111626184B (zh) | 一种人群密度估计方法及*** | |
CN112149694B (zh) | 一种基于卷积神经网络池化模块的图像处理方法、***、存储介质及终端 | |
CN111553267A (zh) | 图像处理方法、图像处理模型训练方法及设备 | |
CN110399908A (zh) | 基于事件型相机的分类方法和装置、存储介质、电子装置 | |
CN111833360B (zh) | 一种图像处理方法、装置、设备以及计算机可读存储介质 | |
CN109523558A (zh) | 一种人像分割方法及*** | |
CN114821096A (zh) | 一种图像处理方法、神经网络的训练方法以及相关设备 | |
CN109977762A (zh) | 一种文本定位方法及装置、文本识别方法及装置 | |
CN110399760A (zh) | 一种批量二维码定位方法、装置、电子设备及存储介质 | |
CN115578590A (zh) | 基于卷积神经网络模型的图像识别方法、装置及终端设备 | |
CN110222568A (zh) | 一种基于时空图的跨视角步态识别方法 | |
CN111967478B (zh) | 一种基于权重翻转的特征图重构方法、***、存储介质及终端 | |
Aziz et al. | Evaluation of visual attention models for robots | |
CN116229584A (zh) | 一种人工智能领域的文本分割识别方法、***、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180803 |