CN110334716B - 特征图处理方法、图像处理方法及装置 - Google Patents

特征图处理方法、图像处理方法及装置 Download PDF

Info

Publication number
CN110334716B
CN110334716B CN201910600515.8A CN201910600515A CN110334716B CN 110334716 B CN110334716 B CN 110334716B CN 201910600515 A CN201910600515 A CN 201910600515A CN 110334716 B CN110334716 B CN 110334716B
Authority
CN
China
Prior art keywords
parameters
parameter
feature map
weight
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910600515.8A
Other languages
English (en)
Other versions
CN110334716A (zh
Inventor
马宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN201910600515.8A priority Critical patent/CN110334716B/zh
Publication of CN110334716A publication Critical patent/CN110334716A/zh
Application granted granted Critical
Publication of CN110334716B publication Critical patent/CN110334716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了特征图处理方法、图像处理方法及装置。其中特征提取方法包括:获取特征图步骤,获取次级特征图;参数生成步骤,基于次级特征图,通过池化得到个性参数;参数调整步骤,通过对个性参数进行点卷积,得到个性指导参数;权重调整步骤,根据个性指导参数,对权重的进行调整,得到个性权重;特征提取步骤,基于次级特征图以及个性权重,得到高级特征图。本公开提供的特征提取方法通过针对输入的不同特征图,生成不同的个性权重,每个特征同通过根据各自特点生成的个性权重进行特征提取,从而提高了结果的精度。

Description

特征图处理方法、图像处理方法及装置
技术领域
本发明一般地涉及图像识别领域,具体涉及一种特征图处理方法、图像处理方法及装置。
背景技术
随着计算机技术的发展,越来越多的场景需要通过计算机技术来进行如目标检测、目标识别等图像处理工作。其中卷积神经网络(CNN)模型是现代深度视觉识别***的核心。卷积神经网络的形式一般是Y=conv(X,W),其中X是输入特征,Y是输出特征,W是权重。通过神经网络反向传播、梯度更新等算法,更新权重的值,神经网络的训练也即对权重的更新。
而通过完成对一个神经网络的训练,所有的数据将这个训练好的网络的权重,也即所有数据共享这套权重;然而,所有数据虽然都有共性,可以公用一个权重,但数据还有各自的特点,仅用一个权重会导致输出特征的不准确。
发明内容
为了解决现有技术中存在的上述问题,本发明的第一方面特征图处理方法,其中,方法包括:获取特征图步骤,获取次级特征图;参数生成步骤,基于次级特征图,通过池化得到个性参数;参数调整步骤,通过对个性参数进行点卷积,得到个性指导参数;权重调整步骤,根据个性指导参数,对权重的进行调整,得到个性权重;特征提取步骤,基于次级特征图以及个性权重,得到高级特征图。
在一例中,个性参数包括:卷积核参数和/或通道参数。
在一例中,卷积核参数通过对次级特征图进行所述池化得到。
在一例中,通道参数通过对卷积核参数进行池化得到。
在一例中,通道参数通过对次级特征图进行池化得到。
在一例中,池化为平均池化。
在一例中,参数调整步骤包括:通过对个性参数进行多层点卷积,得到个性指导参数。
在一例中,参数调整步骤还包括:在通过对个性参数进行点卷积后,经激活函数进行非线性变换,得到个性指导参数。
本发明的第二方面提供一种图像处理方法,包括:图像获取步骤,获取图像;特征提取步骤,根据如第一方面的特征图处理方法,提取图像的图像特征;图像识别步骤,根据图像特征进行图像识别。
本发明的第三方面提供一种特征图处理装置,装置包括:获取特征图模块,用于获取次级特征图;参数生成模块,用于基于次级特征图,通过池化得到个性参数;参数调整模块,用于通过对个性参数进行点卷积,得到个性指导参数;权重调整模块,用于根据个性指导参数,对权重的进行调整,得到个性权重;特征提取模块,用于基于次级特征图以及个性权重,得到高级特征图。
本发明的第四方面提供一种图像处理装置,图像处理装置包括:图像获取模块,用于获取图像;特征提取模块,用于根据如第一方面的特征图处理方法,提取图像的图像特征;图像识别模块,用于根据图像特征进行图像识别。
本发明的第五方面提供一种电子设备,包括:存储器,用于存储指令;以及处理器,用于调用存储器存储的指令执行第一方面的特征图处理方法或第二方面的图像处理方法。
本发明的第六方面提供一种计算机可读存储介质,其中存储有指令,指令被处理器执行时,执行如第一方面的特征图处理方法或如第二方面的图像处理方法。
本发明提供的特征图处理方法、图像处理方法及装置通过在卷积神经网络卷积层中,通过针对输入的不同特征图,生成不同的个性权重,每个特征同通过根据各自特点生成的个性权重进行特征提取,从而提高了结果的精度。
附图说明
通过参考附图阅读下文的详细描述,本发明实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示出了根据本发明一实施例特征图处理方法的流程示意图;
图2示出了根据本发明一实施例特征图处理装置的示意图;
图3是本发明实施例提供的一种电子设备示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
需要注意,虽然本文中使用“第一”、“第二”等表述来描述本发明的实施方式的不同模块、步骤和数据等,但是“第一”、“第二”等表述仅是为了在不同的模块、步骤和数据等之间进行区分,而并不表示特定的顺序或者重要程度。实际上,“第一”、“第二”等表述完全可以互换使用。
随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对图像中的目标进行检测、追踪、识别越来越热门,对目标进行动态实时跟踪定位在智能化交通***、智能监控***、军事目标检测及医学导航手术中手术器械定位等方面具有广泛的应用价值;而对目标的识别在公安、反恐等安全保障领域也起到了举足轻重的作用。卷积神经网络是上述技术的核心,其对特征提取的运行效率很大程度上决定了图像处理工作的效率。
为了提高卷积神经网络输出结果的准确性,图1示出了本发明实施例提供的一种特征图处理方法100,包括:获取特征图步骤110,参数生成步骤120,参数调整步骤130,权重调整步骤140以及特征提取步骤150。特征图处理方法100可以应用于卷积神经网络的某一卷积层,也可以应用于多层或全部卷积层中。下面对上述步骤进行详细说明。
获取特征图步骤110,获取次级特征图。
其中,次级特征图具有的参数可以包括特征图批次数量、特征图通道数量、特征图高度以及特征图宽度。
其中,获取的次级特征图可以是原始图,也可以是经过其他卷积层操作的特征图。此处将特征图输入特征以X标识,其可以具有四维张量(tensor),尺寸为(n,c,h,w),其中n为批次数量,c为通道数量,h为特征图的高度,w为特征图的宽度。
在一例中,在应用神经网络模型进行特征提取时,每次仅有一张图片被送入模型,因此n=1;在另一例中,在对神经网络模型进行训练时,n为输入的特征图数量,为大于等于1的正整数。
参数生成步骤120,基于次级特征图,通过池化得到个性参数。
通过对特征图进行池化,得到具有特征图特点的个性参数。在一例中,池化为平均池化(Average Pooling)。
在一例中,个性参数可以包括:卷积核参数和/或通道参数。
在一例中,卷积核参数可以通过次级特征图直接进行池化得到,例如,将滑动窗口尺寸(window size)设置为h*w,边沿填充尺寸(padding)设置为(k-1)/2,其中k为卷积核大小,一般取3,通过池化,生成得到卷积核参数,其张量为(n,c,k,k)。
在另一例中,通道参数可以通过对卷积核参数进行池化得到。对得到的卷积核参数(n,c,k,k)做进一步池化得到通道参数,即,在得到卷积核参数(n,c,k,k)基础上,进一步通过池化层,将滑动窗口尺寸设置为k*k,边沿填充尺寸设置为0,得到通道参数,其张量为(n,c,1,1)。
在又一例中,通道参数也可以通过对次级特征图进行池化得到。例如,将滑动窗口尺寸(window size)设置为h*w,边沿填充尺寸设置为0,直接得到通道参数,其张量为(n,c,1,1)。
参数调整步骤130,通过对个性参数进行点卷积,得到个性指导参数。
在一例中,可以对个性参数,即卷积核参数和/或通道参数,进行多层的1×1的点卷积,得到个性指导参数。经过多层的点卷积,能够使得到的个性指导参数具有更多的特征。
在一例中,在经过点卷积后,经激活函数进行非线性变换,得到所述个性指导参数。其中激活函数可以是sigmoid非线性函数。
通过上述方式,可以对卷积核参数和/或通道参数进行调整得到卷积核指导参数和/或通道指导参数,能够分别对权重的不同维度进行指导。其中,得到的卷积核指导参数的张量可以是(n,c,k,k),通道指导参数的张量可以是(n,0,1,1)。
权重调整步骤140,根据个性指导参数,对权重的进行调整,得到个性权重。
通过得到的个性指导参数,对原本共享的权重进行调整,从而得到针对不同输入的特征图个性化的权重。
在一例中,个性指导参数包括卷积核指导参数和/或通道指导参数,分别对权重的相应的维度进行调整,具体而言,卷积核指导参数对权重的卷积核维度进行调整,通道指导参数对权重的通道维度进行调整。其中调整可以通过变换(reshape)后相乘的方式进行,例如,原始权重W的张量为(0,c,k,k),经过变换为(1,0,c,k,k),将卷积核指导参数张量(n,c,k,k)变换为(n,1,c,k,k),将通道指导参数的张量(n,0,1,1)变换为(n,0,1,1,1),通过上述五维张量相乘,得到调整后的个性权重,张量为(n,0,c,k,k)。
特征提取步骤150,基于次级特征图以及个性权重,得到高级特征图。
基于输入的次级特征图,以及根据该次级特征图生成的对应的个性权重,提取得到高级特征图。例如,次级特征图的输入域特征X的张量(n,c,h,w),经过变化为(1,n*c,h,w),再通过个性权重(n,0,c,k,k)进行分组卷积(groupwise conv),得到张量为(1,n,0,h,w)的结果,在通过变换得到张量(n,0,h,w)的输出特征Y。
通过本公开提供的上述任一实施例,根据每个特征图各自的特点,生成指导参数,再通过指导参数对权重进行调整,使权重加入每个特征图各自的特征,在此基础上再进行特征提取时,能够提高特征提取的精度。
本发明实施例还提供的一种图像处理方法,包括:图像获取步骤,获取图像;特征提取步骤,根据前述任一实施例的特征图处理方法100,提取图像的图像特征;图像识别步骤,根据图像特征进行图像识别。其中,在特征提取步骤中,可以在某一卷积层中应用前述任一实施例的特征图处理方法100,也可以在多个或全部卷积层中应用前述任一实施例的特征图处理方法100。每在一个卷积层应用时,均能够根据当前层输入的次级特征图进行个性化调整其参数,因此能够使得当前层输出的高级特征图更加准确。
图2示出了本发明实施例提供的一种特征图处理装置200,如图2所示,特征图处理装置200包括:获取特征图模块210,用于获取特征图;参数生成模块220,用于基于特征图,通过池化得到个性参数;参数调整模块230,用于通过对个性参数进行点卷积,得到个性指导参数;权重调整模块240,用于根据个性指导参数,对权重的进行调整,得到个性权重;特征提取模块250,用于基于特征图以及个性权重,得到特征图的特征。
在一例中,个性参数包括:卷积核参数和/或通道参数。
在一例中,通道参数通过对特征图进行池化得到,或通过对卷积核参数进行池化得到。
在一例中,池化为平均池化。
在一例中,参数调整模块230用于:通过对个性参数进行多层点卷积,得到个性指导参数。
在一例中,参数调整模块230还用于:在通过对个性参数进行点卷积后,经激活函数进行非线性变换,得到个性指导参数。
本发明实施例还提供的一种图像处理装置,包括:图像获取模块,用于获取图像;特征提取模块,用于根据如前述任一实施例的特征图处理方法,提取图像的图像特征;图像识别模块,用于根据图像特征进行图像识别。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
如图3所示,本发明的一个实施方式提供了一种电子设备300。其中,该电子设备300包括存储器301、处理器302、输入/输出(Input/Output,I/O)接口303。其中,存储器301,用于存储指令。处理器302,用于调用存储器301存储的指令执行本发明实施例的特征图处理方法。其中,处理器302分别与存储器301、I/O接口303连接,例如可通过总线***和/或其他形式的连接机构(未示出)进行连接。存储器301可用于存储程序和数据,包括本发明实施例中涉及的特征图处理方法的程序,处理器302通过运行存储在存储器301的程序从而执行电子设备300的各种功能应用以及数据处理。
本发明实施例中处理器302可以采用数字信号处理器(Digital SignalProcessing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现,所述处理器302可以是中央处理单元(Central Processing Unit,CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元中的一种或几种的组合。
本发明实施例中的存储器301可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(Random Access Memory,RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(Read-OnlyMemory,ROM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD)等。
本发明实施例中,I/O接口303可用于接收输入的指令(例如数字或字符信息,以及产生与电子设备300的用户设置以及功能控制有关的键信号输入等),也可向外部输出各种信息(例如,图像或声音等)。本发明实施例中I/O接口303可包括物理键盘、功能按键(比如音量控制按键、开关按键等)、鼠标、操作杆、轨迹球、麦克风、扬声器、和触控面板等中的一个或多个。
可以理解的是,本发明实施例中尽管在附图中以特定的顺序描述操作,但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作,或是要求执行全部所示的操作以得到期望的结果。在特定环境中,多任务和并行处理可能是有利的。
本发明实施例涉及的方法和装置能够利用标准编程技术来完成,利用基于规则的逻辑或者其他逻辑来实现各种方法步骤。还应当注意的是,此处以及权利要求书中使用的词语“装置”和“模块”意在包括使用一行或者多行软件代码的实现和/或硬件实现和/或用于接收输入的设备。
此处描述的任何步骤、操作或程序可以使用单独的或与其他设备组合的一个或多个硬件或软件模块来执行或实现。在一个实施方式中,软件模块使用包括包含计算机程序代码的计算机可读介质的计算机程序产品实现,其能够由计算机处理器执行用于执行任何或全部的所描述的步骤、操作或程序。
出于示例和描述的目的,已经给出了本发明实施的前述说明。前述说明并非是穷举性的也并非要将本发明限制到所公开的确切形式,根据上述教导还可能存在各种变形和修改,或者是可能从本发明的实践中得到各种变形和修改。选择和描述这些实施例是为了说明本发明的原理及其实际应用,以使得本领域的技术人员能够以适合于构思的特定用途来以各种实施方式和各种修改而利用本发明。

Claims (10)

1.一种特征图处理方法,其中,所述特征图处理方法用于图像处理,所述方法包括:
获取特征图步骤,获取次级特征图;
参数生成步骤,基于所述次级特征图,通过池化得到个性参数,其中,所述个性参数包括:卷积核参数和/或通道参数;
参数调整步骤,通过对所述个性参数进行点卷积,经激活函数进行非线性变换,得到个性指导参数;其中,所述个性指导参数包括:卷积核指导参数和/或通道指导参数;
权重调整步骤,根据所述个性指导参数,对权重进行调整,得到个性权重,其中,所述卷积核指导参数对权重的卷积核维度进行调整,所述通道指导参数对权重的通道维度进行调整,其中所述调整通过变换后相乘的方式进行;
特征提取步骤,基于所述次级特征图以及所述个性权重,得到高级特征图;
所述参数调整步骤包括:通过对所述个性参数进行多层所述点卷积,得到所述个性指导参数。
2.根据权利要求1所述的方法,其中,所述卷积核参数通过对所述次级特征图进行所述池化得到。
3.根据权利要求2所述的方法,其中,所述通道参数通过对所述卷积核参数进行所述池化得到。
4.根据权利要求1所述的方法,其中,所述通道参数通过对所述次级特征图进行所述池化得到。
5.根据权利要求1-4任一项所述的方法,其中,所述池化为平均池化。
6.一种图像处理方法,包括:
图像获取步骤,获取图像;
特征提取步骤,根据权利要求1-5任一项所述的特征图处理方法,提取所述图像的图像特征;
图像识别步骤,根据所述图像特征进行图像识别。
7.一种特征图处理装置,其中,所述装置包括:
获取特征图模块,用于获取次级特征图;
参数生成模块,用于基于所述次级特征图,通过池化得到个性参数,其中,所述个性参数包括:卷积核参数和/或通道参数;
参数调整模块,用于通过对所述个性参数进行点卷积,经激活函数进行非线性变换,得到个性指导参数;其中,所述个性指导参数包括:卷积核指导参数和/或通道指导参数;
权重调整模块,用于根据所述个性指导参数,对权重进行调整,得到个性权重,其中,所述卷积核指导参数对权重的卷积核维度进行调整,所述通道指导参数对权重的通道维度进行调整,其中所述调整通过变换后相乘的方式进行;
特征提取模块,用于基于所述次级特征图以及所述个性权重高级特征图;
所述参数调整模块,还用于通过对所述个性参数进行多层所述点卷积,得到所述个性指导参数。
8.一种图像处理装置,其中,所述图像处理装置包括:
图像获取模块,用于获取图像;
特征提取模块,用于根据权利要求1-5任一项所述的特征图处理方法,提取所述图像的图像特征;
图像识别模块,用于根据所述图像特征进行图像识别。
9.一种电子设备,其中,所述电子设备包括:
存储器,用于存储指令;以及
处理器,用于调用所述存储器存储的指令执行如权利要求1 至 5 中任一项所述的特征图处理方法或如权利要求6 所述的图像处理方法。
10.一种计算机可读存储介质,其中存储有指令,所述指令被处理器执行时,执行如权利要求1至5中任一项所述的特征图处理方法或如权利要求6所述的图像处理方法。
CN201910600515.8A 2019-07-04 2019-07-04 特征图处理方法、图像处理方法及装置 Active CN110334716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910600515.8A CN110334716B (zh) 2019-07-04 2019-07-04 特征图处理方法、图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910600515.8A CN110334716B (zh) 2019-07-04 2019-07-04 特征图处理方法、图像处理方法及装置

Publications (2)

Publication Number Publication Date
CN110334716A CN110334716A (zh) 2019-10-15
CN110334716B true CN110334716B (zh) 2022-01-11

Family

ID=68143150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910600515.8A Active CN110334716B (zh) 2019-07-04 2019-07-04 特征图处理方法、图像处理方法及装置

Country Status (1)

Country Link
CN (1) CN110334716B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110852348B (zh) * 2019-10-18 2022-09-30 北京迈格威科技有限公司 特征图处理方法、图像处理方法及装置
CN111210017B (zh) * 2019-12-24 2023-09-26 北京迈格威科技有限公司 确定布局顺序及数据处理的方法、装置、设备及存储介质
CN113239899B (zh) * 2021-06-17 2024-05-28 阿波罗智联(北京)科技有限公司 用于处理图像和生成卷积核的方法、路侧设备和云控平台

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529670A (zh) * 2016-10-27 2017-03-22 中国科学院计算技术研究所 一种基于权重压缩的神经网络处理器、设计方法、芯片
CN107766894A (zh) * 2017-11-03 2018-03-06 吉林大学 基于注意力机制和深度学习的遥感图像自然语言生成方法
CN108182452A (zh) * 2017-12-29 2018-06-19 哈尔滨工业大学(威海) 基于分组卷积自编码器的航空发动机故障检测方法及***
CN108364023A (zh) * 2018-02-11 2018-08-03 北京达佳互联信息技术有限公司 基于注意力模型的图像识别方法和***
CN108388900A (zh) * 2018-02-05 2018-08-10 华南理工大学 基于多特征融合和时空注意力机制相结合的视频描述方法
US10242289B2 (en) * 2015-12-21 2019-03-26 Nokia Technologies Oy Method for analysing media content
CN109753903A (zh) * 2019-02-27 2019-05-14 北航(四川)西部国际创新港科技有限公司 一种基于深度学习的无人机检测方法
CN109858419A (zh) * 2019-01-23 2019-06-07 广州智慧城市发展研究院 一种自下而上-自上而下的行为识别***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101690297B1 (ko) * 2010-04-12 2016-12-28 삼성디스플레이 주식회사 영상 변환 장치 및 이를 포함하는 입체 영상 표시 장치
CN108510012B (zh) * 2018-05-04 2022-04-01 四川大学 一种基于多尺度特征图的目标快速检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10242289B2 (en) * 2015-12-21 2019-03-26 Nokia Technologies Oy Method for analysing media content
CN106529670A (zh) * 2016-10-27 2017-03-22 中国科学院计算技术研究所 一种基于权重压缩的神经网络处理器、设计方法、芯片
CN107766894A (zh) * 2017-11-03 2018-03-06 吉林大学 基于注意力机制和深度学习的遥感图像自然语言生成方法
CN108182452A (zh) * 2017-12-29 2018-06-19 哈尔滨工业大学(威海) 基于分组卷积自编码器的航空发动机故障检测方法及***
CN108388900A (zh) * 2018-02-05 2018-08-10 华南理工大学 基于多特征融合和时空注意力机制相结合的视频描述方法
CN108364023A (zh) * 2018-02-11 2018-08-03 北京达佳互联信息技术有限公司 基于注意力模型的图像识别方法和***
CN109858419A (zh) * 2019-01-23 2019-06-07 广州智慧城市发展研究院 一种自下而上-自上而下的行为识别***
CN109753903A (zh) * 2019-02-27 2019-05-14 北航(四川)西部国际创新港科技有限公司 一种基于深度学习的无人机检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CBAM: Convolutional Block Attention Module;Sanghyun Woo等;《arXiv:1807.06521v2》;20180718;第1-14页 *
Sanghyun Woo等.CBAM: Convolutional Block Attention Module.《arXiv:1807.06521v2》.2018, *
Spatial Group-wise Enhance: Improving Semantic Feature Learning in Convolutional Networks;Xiang Li;《arXiv:1905.09646v2》;20190525;第1-8页 *

Also Published As

Publication number Publication date
CN110334716A (zh) 2019-10-15

Similar Documents

Publication Publication Date Title
CN110334716B (zh) 特征图处理方法、图像处理方法及装置
US11556786B2 (en) Attention-based decoder-only sequence transduction neural networks
WO2020042895A1 (en) Device and method of tracking poses of multiple objects based on single-object pose estimator
KR102410820B1 (ko) 뉴럴 네트워크를 이용한 인식 방법 및 장치 및 상기 뉴럴 네트워크를 트레이닝하는 방법 및 장치
CN111063410B (zh) 一种医学影像文本报告的生成方法及装置
WO2018105194A1 (en) Method and system for generating multi-relevant label
KR20200022739A (ko) 데이터 증강에 기초한 인식 모델 트레이닝 방법 및 장치, 이미지 인식 방법 및 장치
US11455523B2 (en) Risk evaluation method, computer-readable recording medium, and information processing apparatus
KR20220059194A (ko) 대상 객체에 적응적인 객체 추적 방법 및 장치
CN114781272A (zh) 碳排放量预测方法、装置、设备及存储介质
CN111260032A (zh) 神经网络训练方法、图像处理方法及装置
JP2020522773A (ja) 画像内のオブジェクトの検出および表現
CN110059804B (zh) 数据处理方法及装置
CN113298152B (zh) 模型训练方法、装置、终端设备及计算机可读存储介质
KR20190081218A (ko) 컨볼루션 신경망의 하이퍼파라미터를 설정하는 방법 및 이를 수행하는 단말 장치
KR20200052446A (ko) 딥러닝 모델 학습 장치 및 방법
CN112668607A (zh) 一种用于目标物体触觉属性识别的多标签学习方法
KR102210404B1 (ko) 위치 정보 추출 장치 및 방법
CN114519401A (zh) 一种图像分类方法及装置、电子设备、存储介质
CN111242158A (zh) 神经网络训练方法、图像处理方法及装置
Mao et al. IffDetector: Inference-aware feature filtering for object detection
Xie et al. ViT-MVT: A Unified Vision Transformer Network for Multiple Vision Tasks
CN110852348B (zh) 特征图处理方法、图像处理方法及装置
KR20220058189A (ko) 뉴럴 네트워크를 이용한 분류 방법 및 장치
KR102534936B1 (ko) 영상 분류 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant