CN111523533B - 一种从图像中确定物体所在区域的方法及装置 - Google Patents

一种从图像中确定物体所在区域的方法及装置 Download PDF

Info

Publication number
CN111523533B
CN111523533B CN201910106122.1A CN201910106122A CN111523533B CN 111523533 B CN111523533 B CN 111523533B CN 201910106122 A CN201910106122 A CN 201910106122A CN 111523533 B CN111523533 B CN 111523533B
Authority
CN
China
Prior art keywords
convolution
map data
feature map
candidate
convolution kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910106122.1A
Other languages
English (en)
Other versions
CN111523533A (zh
Inventor
杨攸奕
武元琪
李名杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910106122.1A priority Critical patent/CN111523533B/zh
Publication of CN111523533A publication Critical patent/CN111523533A/zh
Application granted granted Critical
Publication of CN111523533B publication Critical patent/CN111523533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种从图像中确定物体所在区域的方法及装置。其中,所述从图像中确定物体所在区域的方法包括:获取待识别图像;获取所述待识别图像的特征图数据;获得所述特征图数据中的物体分;根据所述物体分确定所述待识别图像中的物体所在区域。采用本申请提供的方法,以提高物体识别的计算效率。

Description

一种从图像中确定物体所在区域的方法及装置
技术领域
本申请涉及物体识别领域,具体涉及一种从图像中确定物体所在区域的方法及装置。
背景技术
目前,基于区域的物体识别方法一直是物体识别领域的主流方法。当前,绝大多数高级的基于区域的物体探测器是使用感兴趣区域池化层与区域候选网络结合来实现的。
通过从高阶的卷积神经网络(Convolutional Neural Network,CNN)特征中学习嵌入的空间信息,基于区域的物体探测器相对于诸如可变型部件模型(Deformable PartsModel,DPM)等传统的非CNN方法而言,已经取得了巨大的进步。最近,基于区域的全卷积网络(Region-based Fully Convolutional Network,R-FCNs)通过在最后的FCN(FullyConvolutional Network)特征图上的感兴趣区域池化层来减少重复预测的开销,进一步优化了物体识别的性能和计算效率。
但是,目前这些基于区域的物体识别方法,必须使用大量的边框标注训练数据进行模型训练来获得物体分,进而导致物体识别的计算效率低。尤其是在高级的区域候选网络(RPN)中,当采用的CNN的卷积核的尺寸增加后,训练参数的计算量非常庞大,进一步降低了物体识别的计算效率
发明内容
本申请提供一种从图像中确定物体所在区域的方法及装置,以提高物体识别的计算效率。
本申请提供一种从图像中确定物体所在区域的方法,包括:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域。
可选的,所述获取所述待识别图像的特征图数据,包括:
利用卷积神经网络针对所述待识别图像进行特征提取,获取所述待识别图像的特征图数据。
可选的,获得所述特征图数据中的物体分,包括:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果;
根据所述卷积结果,获得所述特征图数据中的物体分。
可选的,所述从图像中确定物体所在区域的方法,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
可选的,所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
可选的,所述根据所述候选卷积核的尺寸信息,获得所述卷积核,包括:
根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸;
将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息;
根据所述放大后的所述候选卷积核的尺寸信息,获得所述卷积核。
可选的,所述候选卷积核的尺寸信息包括所述候选卷积核的高度信息和所述候选卷积核的宽度信息,所述放大后的所述候选卷积核的尺寸信息包括所述放大后的所述候选卷积核的高度信息和所述放大后的所述候选卷积核的宽度信息;
所述根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸,包括:根据所述候选卷积核的高度信息,确定所述候选卷积核的高度,并根据候选卷积核的宽度信息,确定所述候选卷积核的宽度;
将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息,包括:将所述候选卷积核的高度进行放大处理,获得放大后的所述候选卷积核的高度信息,将所述候选卷积核的宽度进行放大处理,获得放大后的所述候选卷积核的宽度信息。
可选的,所述将所述特征图数据与卷积核进行卷积运算,获得卷积结果,包括:
根据所述特征图数据的属性以及所述卷积核判断是否需要针对所述特征图数据进行填充处理;
若是,则针对所述特征图数据进行填充处理,将填充后的特征图数据与所述卷积核进行卷积运算,获得卷积结果。
可选的,所述将所述特征图数据与卷积核进行卷积运算,获得卷积结果,包括:
将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果;
所述根据所述卷积结果,获得所述特征图数据中的物体分,包括:根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
可选的,所述从图像中确定物体所在区域的方法,还包括:
根据所述特征图数据的属性,获得所述第一数量的尺寸不同的所述卷积核。
可选的,所述根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分,包括:
将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分。
可选的,所述将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分,包括:
将每个尺寸不同的所述卷积核对应的卷积结果进行拼接,获得所述特征图数据的拼接特征向量;
根据所述拼接特征向量,获得所述特征图数据中感兴趣区域的物体分,所述感兴趣区域为特征图数据中可能包含所述物体对象的区域。
可选的,所述感兴趣区域是根据所述特征图数据对应的卷积核的尺寸在所述特征图数据中确定的。
可选的,所述根据所述物体分确定所述待识别图像中的物体所在区域,包括:
根据所述物体分,从所述感兴趣区域中确定所述特征图数据中包含所述物体的目标区域;
根据所述目标区域,确定所述待识别图像中的物体所在区域。
本申请提供一种从图像中确定物体所在区域的装置,包括:
图像获取单元,用于获取待识别图像;
特征获取单元,用于获取所述待识别图像的特征图数据;
物体分获得单元,用于获得所述特征图数据中的物体分;
确定单元,用于根据所述物体分确定所述待识别图像中的物体所在区域。
可选的,所述特征获取单元,具体用于:
利用卷积神经网络针对所述待识别图像进行特征提取,获取所述待识别图像的特征图数据。
可选的,所述物体分获得单元,具体用于:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果;
根据所述卷积结果,获得所述特征图数据中的物体分。
可选的,所述的从图像中确定物体所在区域的装置,还包括卷积核获得单元,用于:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
可选的,所述卷积核获得单元中,所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
可选的,所述卷积核获得单元,还用于:
根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸;
将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息:
根据所述放大后的所述候选卷积核的尺寸信息,获得所述卷积核。
可选的,所述卷积核获得单元中,所述候选卷积核的尺寸信息包括所述候选卷积核的高度信息和所述候选卷积核的宽度信息,所述放大后的所述候选卷积核的尺寸信息包括所述放大后的所述候选卷积核的高度信息和所述放大后的所述候选卷积核的宽度信息;
所述根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸,包括:根据所述候选卷积核的高度信息,确定所述候选卷积核的高度,并根据候选卷积核的宽度信息,确定所述候选卷积核的宽度;
所述将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息,包括:将所述候选卷积核的高度进行放大处理,获得放大后的所述候选卷积核的高度信息,并将所述候选卷积核的宽度进行放大处理,获得放大后的所述候选卷积核的宽度信息。
可选的,所述卷积核获得单元,还用于:
根据所述特征图数据的属性以及所述卷积核判断是否需要针对所述特征图数据进行填充处理;
若是,则针对所述特征图数据进行填充处理,将填充后的特征图数据与所述卷积核进行卷积运算,获得卷积结果。
可选的,所述物体分获得单元,具体用于:
将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果;
所述根据所述卷积结果,获得所述特征图数据中的物体分,包括:根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
可选的,所述物体分获得单元,还包括尺寸不同的卷积核获得单元,所述尺寸不同的卷积核获得单元,用于:
根据所述特征图数据的属性,获得所述第一数量的尺寸不同的所述卷积核。
可选的,所述物体分获得单元,具体用于:
将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分。
可选的,所述物体分获得单元,还用于:
将每个尺寸不同的所述卷积核对应的卷积结果进行拼接,获得所述特征图数据的拼接特征向量;
根据所述拼接特征向量,获得所述特征图数据中感兴趣区域的物体分,所述感兴趣区域为特征图数据中可能包含所述物体对象的区域。
可选的,所述物体分获得单元,还用于:
所述感兴趣区域是根据所述特征图数据对应的卷积核的尺寸在所述特征图数据中确定的。
可选的,所述确定单元,具体用于:
根据所述物体分,从所述感兴趣区域中确定所述特征图数据中包含所述物体的目标区域;
根据所述目标区域,确定所述待识别图像中的物体所在区域。
本申请提供一种电子设备,所述电子设备包括:
处理器;
存储器,用于存储链表的处理程序,所述程序在被所述处理器读取执行时,执行如下操作:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域。
本申请提供一种计算机可读取存储介质,其上存储有计算机程序,该程序被处理器执行时,实现以下步骤:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域。
本申请提供一种从待识别对象中确定物体所在区域的方法,包括:
获取待识别对象;
获取所述待识别对象的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别对象中的物体所在区域。
可选的,所述获得所述特征图数据中的物体分,包括:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果;
根据所述卷积结果,获得所述特征图数据中的物体分。
可选的,所述从待识别对象中确定物体所在区域的方法,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
可选的,所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
可选的,所述将所述特征图数据与卷积核进行卷积运算,获得卷积结果,包括:
将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果;
所述根据所述卷积结果,获得所述特征图数据中的物体分,包括:根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
与现有技术相比,本申请具有如下优点:
采用本申请提供的从图像中确定物体所在区域的方法,直接获得所述特征图数据中的物体分,从而在物体识别过程中,不需要使用大量的边框标注训练数据来进行模型训练,提高了物体识别的计算效率。
附图说明
图1是本申请第一实施例的方法流程图;
图2是本申请第一实施例涉及的一个从图像中确定物体所在区域的示意图;
图3是本申请第一实施例涉及的一种BING(Binarized Normed Gradients)-RPN(Region Proposal Network,区域候选网络)的网络架构图;
图4是本申请第一实施例涉及的一种BING-RPN网络的物体识别分支的示意图;
图5是本申请第一实施例涉及的一种BING-RPN网络中卷积计算的示意图;
图6是本申请第二实施例的装置示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请第一实施例提供一种从图像中确定物体所在区域的方法。请参看图1,该图为本申请第一实施例的方法流程图。以下结合图1对本申请第一实施例提供的一种从图像中确定物体所在区域的方法进行详细说明。所述方法包括如下步骤:
步骤S101:获取待识别图像。
本步骤用于获取待识别图像。
请参考图2,其为采用本实施例提供的一个从图像中确定物体所在区域过程的示意图。图2中的第一行提供了包括一只鸟的图像,图像的背景包括绿草。所述待识别对象就是包含鸟的图像。一般的,把图像中的鸟作为待识别的物体。采用本实施例提供的方法,从该图像中获得包括待识别物体的目标区域,进而识别出该物体。
另外请参考图3,其为采用本实施例提供的方法的一种BING-RPN的网络架构图。在图3中,所述待识别图像就是图中最左侧的包含狗的图像。
不同于传统的BING,本实施例提供了一种改进版的BING方法,请参考图4、图5。图4为本实施例提供的BING-RPN网络的物体识别分支的示意图。图5为BING-RPN网络中卷积计算的示意图。针对图4、图5,在下面的步骤说明中会进行更加详细的说明。
步骤S102:获取所述待识别图像的特征图数据。
本步骤用于获取所述待识别图像的特征图数据。
所述获取所述待识别图像的特征图数据,包括:
利用卷积神经网络针对所述待识别图像进行特征提取,获取所述待识别图像的特征图数据。
本实施例中的卷积神经网络可以为常用的ResNet,Inception V3,Inception V4等。请参考图3,所述骨干CNN网络即为所述卷积神经网络。
步骤S103:获得所述特征图数据中的物体分。
本步骤用于利用负拉普拉斯算子获得所述特征图数据中的物体分。
拉普拉斯算子是图像处理中常用的工具,用于图像的锐化处理。本实施例提供的方法将负拉普拉斯算子用于物体分的计算中,取得了较高的物体识别效率。
物体分(objectness score)用在RPN网络中,是指在待识别图像对应的特征图数据中的候选区域包含待识别物体的概率。物体分的值介于0到1之间,其值越大,代表候选区域包含待识别物体的概率越大。
所述利用负拉普拉斯算子获得所述特征图数据中的物体分,包括:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果,其中,所述卷积核的权重为负拉普拉斯算子;
根据所述卷积结果,获得所述特征图数据中的物体分。
本实施例中的特征图数据x,可以使用下面的公式表示。
x∈Rh×w×C
其中,h表示该特征图数据的高度,w表示该特征图数据的宽度,C表示该特征图数据的通道数。例如,特征图数据x可以为在Inception-V4中采用的8×8×1536数据块。
本实施例提供的BING-RPN将所述特征图数据x进行多次并行深度卷积运算,所述深度卷积运算的卷积核使用如下公式获取:
Figure BDA0001966220900000091
其中,
Figure BDA0001966220900000092
并且/>
Figure BDA0001966220900000093
请参考图4,本实施例提供的BING-RPN,输出的是N个C维的区域候选。其中,N使用如下公式获取:
Figure BDA0001966220900000094
其中,h是输入特征图数据的高度,w是输入特征图数据的宽度,hθ,wθ是按照上述从1×1开始成倍增加的大小不同的卷积核的高度和宽度。
所述从图像中确定物体所在区域的方法,还包括:
根据所述特征图数据的属性,获得所述第一数量的尺寸不同的所述卷积核。
通过上述N的求取公式,可以看出,上述第一数量N可以通过特征图数据的高度和宽度数据获取。
所述从图像中确定物体所在区域的方法,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
例如,根据上述方法,可以获得的卷积核大小为1×1,2×1,4×1,8×1,1×2,2×2,4×2,8×2,1×4,2×4,4×4,8×4,1×8,2×8,4×8,8×8。采用这种从1×1开始成倍增加的卷积核的搜寻策略,提高了卷积核的获取效率。请参考图5中的(a)和(b)。图5中,加粗的框代表卷积核,右边的(0,0,1,1)分别代表(x,y,卷积核宽度,卷积核高度),x,y是上述框的最左上角的坐标。
所述根据所述候选卷积核的尺寸信息,获得所述卷积核,包括:
根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸;
根据所述负拉普拉斯算子的尺寸,将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息;
根据所述放大后的所述候选卷积核的尺寸信息,获得所述卷积核。
因为物体通常被认为是具有良好的封闭边界,因此从感兴趣区域(Region ofinterest)获得的可视野(receptive field)对于物体识别而言是不够的。本实施例提供的从图像中确定物体所在区域的方法,放大了上述卷积核的尺寸。
所述候选卷积核的尺寸信息包括所述候选卷积核的高度信息和所述候选卷积核的宽度信息,所述放大后的所述候选卷积核的尺寸信息包括所述放大后的所述候选卷积核的高度信息和所述放大后的所述候选卷积核的宽度信息;
所述根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸,包括:根据所述候选卷积核的高度信息,确定所述候选卷积核的高度,并根据候选卷积核的宽度信息,确定所述候选卷积核的宽度;
所述根据所述负拉普拉斯算子的尺寸,将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息,包括:根据所述负拉普拉斯算子的高度,将所述候选卷积核的高度进行放大处理,获得放大后的所述候选卷积核的高度信息,并根据所述负拉普拉斯算子的宽度,将所述候选卷积核的宽度进行放大处理,获得放大后的所述候选卷积核的宽度信息。
所述将所述特征图数据与卷积核进行卷积运算,获得卷积结果,包括:
根据所述特征图数据的属性以及所述卷积核判断是否需要针对所述特征图数据进行填充处理;
若是,则针对所述特征图数据进行填充处理,将填充后的特征图数据与所述卷积核进行卷积运算,获得卷积结果。
由于针对卷积核的放大会导致卷积计算的不均匀,因此需要针对所述特征图数据进行填0操作。请参考图5中的(c)和(d)。以图5中的(d)为例,pad(2,4)表示,在8×8的特征图数据的基础上,在高度方向,向上和向下两个方向各新扩张2行。在宽度方向,向左和向右两个方向各新扩张4列。扩张的行和列采用补0填充。
所述将所述特征图数据与卷积核进行卷积运算,获得卷积结果,其中,所述卷积核的权重为负拉普拉斯算子,包括:
将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,其中,所述第一数量的尺寸不同的所述卷积核的权重为负拉普拉斯算子;
所述根据所述卷积结果,获得所述特征图数据中的物体分,包括:根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
假定给定的负拉普拉斯算子的高度和宽度均为k,如果要获得k×k倍的可视野,那么可以使用尺寸为(k·hθ)×(k·wθ)的卷积核,并将该卷积核进行(k-1)/2h,(k-1)/2w补0的填充处理。根据所述分析,本实施例提供的BING-RPN可以使用如下公式来表示:
BING(x;Θ,k)={Convdepthwise(x′;θ)|θ∈Θ(k)} 公式1
其中,x′是通过针对输入特征图数据x进行(k-1)/2h,(k-1)/2w的补0填充处理后的填充数据,k是可视野的放大比例,Θ(k)是卷积核的集合,该卷积核跟随k变化。当k=1时,该BING算法等同于不填充0的BING算法。请参考图4。图4中,最下方为8×8×C的特征图数据,倒数第二行是填充的尺寸,如填充尺寸(2,1),代表向上向下两个方向各扩张两行,向左向右各扩张一列。在所述扩张的数据上进行补0。倒数第三行是针对前面获得的1×1,2×1,4×1,8×1,1×2,2×2,4×2,8×2,1×4,2×4,4×4,8×4,1×8,2×8,4×8,8×8卷积核进行k=3的放大后获得的3×3,6×3,12×3,24×3,3×6,6×6,12×6,24×6,3×12,6×12,12×12,24×12,3×24,6×24,12×24,24×24等16个大小的卷积核。所述卷积核的权重采用人工给定的负拉普拉斯算子。
在现有的BING实现中,使用训练模型来获取物体分。本实施例提供的方法,发现使用负拉普拉斯算子计算物体分是可行的,并通过业内常用的ImageNet 2012实验数据集进行了证明。基于上述分析,可以按照如下公式选择卷积核:
Figure BDA0001966220900000122
其中,
Figure BDA0001966220900000121
是一个二维的拉普拉斯过滤器,变量σx,σy和该拉普拉斯过滤器的尺寸成比例的。可以设定[σx,σy]=[1.4,1.4]对应卷积核的尺寸为9×9。将所述公式2中的Θobj′带入公式1,一个N×C维的矢量会被生成,里面的每一个元素对应着在某个通道中一个物体分。拉普拉斯过滤器的最小尺寸为3×3,因此k=3用来保持输出的分辨率。物体识别可以通过BING(x;Θobj′,3)来获得。图4展示了BING(x;Θobj′,3)的计算过程。从图4中可以看出,该计算过程包括:首先获取特征图数据,然后进行填充处理,而后与多个卷积核尺寸不同的卷积核进行卷积运算,将获得的各个卷积运算结果进行合成,获得物体分。
所述根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分,包括:
将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分。
所述将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分,包括:
将每个尺寸不同的所述卷积核对应的卷积结果进行拼接,获得所述特征图数据的拼接特征向量;
根据所述拼接特征向量,获得所述特征图数据中感兴趣区域的物体分,所述感兴趣区域为特征图数据中可能包含所述物体的区域。
所述感兴趣区域是根据所述特征图数据对应的卷积核的尺寸在所述特征图数据中确定的。
步骤S104:根据所述物体分确定所述待识别图像中的物体所在区域。
本步骤用于根据所述物体分确定所述待识别图像中的物体所在区域。
所述根据所述物体分确定所述待识别图像中的物体所在区域,包括:
根据所述物体分,从所述感兴趣区域中确定所述特征图数据中包含所述物体的目标区域;
根据所述目标区域,确定所述待识别图像中的物体所在区域。
请参考图3,图中的目标区域即为包含狗的边框。
在上述的实施例中,提供了一种从图像中确定物体所在区域的方法,与之相对应的,本申请还提供一种从图像中确定物体所在区域的装置。请参看图6,其为本申请的一种从图像中确定物体所在区域的装置实施例的流程图。由于本实施例,即第二实施例,基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
所述从图像中确定物体所在区域的装置,包括:
图像获取单元601,用于获取待识别图像;
特征获取单元602,用于获取所述待识别图像的特征图数据;
物体分获得单元603,用于利用负拉普拉斯算子获得所述特征图数据中的物体分;
确定单元604,用于根据所述物体分确定所述待识别图像中的物体所在区域。
本实施例中,所述特征获取单元,具体用于:
利用卷积神经网络针对所述待识别对象进行特征提取,获取所述待识别对象的特征图数据。
本实施例中,所述物体分获得单元,具体用于:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果,其中,所述卷积核的权重为负拉普拉斯算子;
根据所述卷积结果,获得所述特征图数据中的物体分。
本实施例中,所述的从图像中确定物体所在区域的装置,还包括卷积核获得单元,用于:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
本实施例中,所述卷积核获得单元中,所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
本实施例中,所述卷积核获得单元,还用于:
根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸;
根据所述负拉普拉斯算子的尺寸,将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息;
根据所述放大后的所述候选卷积核的尺寸信息,获得所述卷积核。
本实施例中,所述卷积核获得单元中,所述候选卷积核的尺寸信息包括所述候选卷积核的高度信息和所述候选卷积核的宽度信息,所述放大后的所述候选卷积核的尺寸信息包括所述放大后的所述候选卷积核的高度信息和所述放大后的所述候选卷积核的宽度信息;
所述根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸,包括:根据所述候选卷积核的高度信息,确定所述候选卷积核的高度,并根据候选卷积核的宽度信息,确定所述候选卷积核的宽度;
所述根据所述负拉普拉斯算子的尺寸,将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息,包括:根据所述负拉普拉斯算子的高度,将所述候选卷积核的高度进行放大处理,获得放大后的所述候选卷积核的高度信息,并根据所述负拉普拉斯算子的宽度,将所述候选卷积核的宽度进行放大处理,获得放大后的所述候选卷积核的宽度信息。
本实施例中,所述卷积核获得单元,还用于:
根据所述特征图数据的属性以及所述卷积核判断是否需要针对所述特征图数据进行填充处理;
若是,则针对所述特征图数据进行填充处理,将填充后的特征图数据与所述卷积核进行卷积运算,获得卷积结果。
本实施例中,所述物体分获得单元,具体用于:
将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,其中,所述第一数量的尺寸不同的所述卷积核的权重为负拉普拉斯算子;
所述根据所述卷积结果,获得所述特征图数据中的物体分,包括:根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
本实施例中,所述物体分获得单元,还包括尺寸不同的卷积核获得单元,所述尺寸不同的卷积核获得单元,用于:
根据所述特征图数据的属性,获得所述第一数量的尺寸不同的所述卷积核。
可选的,所述物体分获得单元,具体用于:
将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分。
本实施例中,所述物体分获得单元,还用于:
将每个尺寸不同的所述卷积核对应的卷积结果进行拼接,获得所述特征图数据的拼接特征向量;
根据所述拼接特征向量,获得所述特征图数据中感兴趣区域的物体分,所述感兴趣区域为特征图数据中可能包含所述物体对象的区域。
本实施例中,所述物体分获得单元,还用于:
所述感兴趣区域是根据所述特征图数据对应的卷积核的尺寸在所述特征图数据中确定的。
本实施例中,所述确定单元,具体用于:
根据所述物体分,从所述感兴趣区域中确定所述特征图数据中包含所述物体的目标区域;
根据所述目标区域,识别所述待识别对象中的物体。
本申请第三实施例提供一种电子设备,所述电子设备包括:
处理器;
存储器,用于存储链表的处理程序,所述程序在被所述处理器读取执行时,执行如下操作:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域。
本申请第四实施例提供一种计算机可读取存储介质,其上存储有计算机程序,该程序被处理器执行时,实现以下步骤:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域。
本申第五实施例提供一种从待识别对象中确定物体所在区域的方法,由于本实施例,基本类似于第一实施例,因此描述的比较简单,详细说明请参考第一实施例的相关部分。
本申请提供的一种从图像中确定物体所在区域的方法,包括:
获取待识别对象;
获取所述待识别对象的特征图数据;
利用负拉普拉斯算子,获得所述特征图数据中的物体分;
根据所述物体分识别所述待识别对象中的物体。所述待识别对象可以为静态的图片,也可以为通过摄像头等视频采集设备获取的视频。
本实施例中,所述利用负拉普拉斯算子获得所述特征图数据中的物体分,包括:
将所述特征图数据与卷积核进行卷积运算,获得卷积结果,其中,所述卷积核的权重为负拉普拉斯算子;
根据所述卷积结果,获得所述特征图数据中的物体分。
本实施例中,所述从图像中确定物体所在区域的方法,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个操作器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims (17)

1.一种从图像中确定物体所在区域的方法,其特征在于,包括:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域;
其中,所述获得所述特征图数据中的物体分,包括:将所述特征图数据与卷积核进行卷积运算,获得卷积结果,根据所述卷积结果,获得所述特征图数据中的物体分,具体为:将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
2.根据权利要求1所述的从图像中确定物体所在区域的方法,其特征在于,所述获取所述待识别图像的特征图数据,包括:
利用卷积神经网络针对所述待识别图像进行特征提取,获取所述待识别图像的特征图数据。
3.根据权利要求1所述的从图像中确定物体所在区域的方法,其特征在于,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
4.根据权利要求3所述的从图像中确定物体所在区域的方法,其特征在于,所述候选卷积核的初始高度为1,所述候选卷积核的初始宽度为1,所述第一倍数为2,所述第二倍数为2。
5.根据权利要求3所述的从图像中确定物体所在区域的方法,其特征在于,所述根据所述候选卷积核的尺寸信息,获得所述卷积核,包括:
根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸;
将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息;
根据所述放大后的所述候选卷积核的尺寸信息,获得所述卷积核。
6.根据权利要求5所述的从图像中确定物体所在区域的方法,其特征在于,所述候选卷积核的尺寸信息包括所述候选卷积核的高度信息和所述候选卷积核的宽度信息,所述放大后的所述候选卷积核的尺寸信息包括所述放大后的所述候选卷积核的高度信息和所述放大后的所述候选卷积核的宽度信息;
所述根据所述候选卷积核的尺寸信息,确定所述候选卷积核的尺寸,包括:根据所述候选卷积核的高度信息,确定所述候选卷积核的高度,并根据候选卷积核的宽度信息,确定所述候选卷积核的宽度;
所述将所述候选卷积核的尺寸进行放大处理,获得放大后的所述候选卷积核的尺寸信息,包括:将所述候选卷积核的高度进行放大处理,获得放大后的所述候选卷积核的高度信息,将所述候选卷积核的宽度进行放大处理,获得放大后的所述候选卷积核的宽度信息。
7.根据权利要求3所述的从图像中确定物体所在区域的方法,其特征在于,所述将所述特征图数据与卷积核进行卷积运算,获得卷积结果,包括:
根据所述特征图数据的属性以及所述卷积核判断是否需要针对所述特征图数据进行填充处理;
若是,则针对所述特征图数据进行填充处理,将填充后的特征图数据与所述卷积核进行卷积运算,获得卷积结果。
8.根据权利要求1所述的从图像中确定物体所在区域的方法,其特征在于,还包括:
根据所述特征图数据的属性,获得所述第一数量的尺寸不同的所述卷积核。
9.根据权利要求1所述的从图像中确定物体所在区域的方法,其特征在于,所述根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分,包括:
将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分。
10.根据权利要求9所述的从图像中确定物体所在区域的方法,其特征在于,所述将所述第一数量的尺寸不同的所述卷积核对应的卷积结果进行合成处理,获得所述特征图数据中的物体分,包括:
将每个尺寸不同的所述卷积核对应的卷积结果进行拼接,获得所述特征图数据的拼接特征向量;
根据所述拼接特征向量,获得所述特征图数据中感兴趣区域的物体分,所述感兴趣区域为特征图数据中可能包含所述物体对象的区域。
11.根据权利要求10所述的从图像中确定物体所在区域的方法,其特征在于,所述感兴趣区域是根据所述特征图数据对应的卷积核的尺寸在所述特征图数据中确定的。
12.根据权利要求10所述的从图像中确定物体所在区域的方法,其特征在于,所述根据所述物体分确定所述待识别图像中的物体所在区域,包括:
根据所述物体分,从所述感兴趣区域中确定所述特征图数据中包含所述物体的目标区域;
根据所述目标区域,确定所述待识别图像中的物体所在区域。
13.一种从图像中确定物体所在区域的装置,其特征在于,包括:
图像获取单元,用于获取待识别图像;
特征获取单元,用于获取所述待识别图像的特征图数据;
物体分获得单元,用于获得所述特征图数据中的物体分;
确定单元,用于根据所述物体分确定所述待识别图像中的物体所在区域;
其中,所述获得所述特征图数据中的物体分,包括:将所述特征图数据与卷积核进行卷积运算,获得卷积结果,根据所述卷积结果,获得所述特征图数据中的物体分,具体为:将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
14.一种电子设备,其特征在于,所述电子设备包括:
处理器;
存储器,用于存储链表的处理程序,所述程序在被所述处理器读取执行时,执行如下操作:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域;
其中,所述获得所述特征图数据中的物体分,包括:将所述特征图数据与卷积核进行卷积运算,获得卷积结果,根据所述卷积结果,获得所述特征图数据中的物体分,具体为:将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
15.一种计算机可读取存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现以下步骤:
获取待识别图像;
获取所述待识别图像的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别图像中的物体所在区域;
其中,所述获得所述特征图数据中的物体分,包括:将所述特征图数据与卷积核进行卷积运算,获得卷积结果,根据所述卷积结果,获得所述特征图数据中的物体分,具体为:将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
16.一种从待识别对象中确定物体所在区域的方法,其特征在于,包括:
获取待识别对象;
获取所述待识别对象的特征图数据;
获得所述特征图数据中的物体分;
根据所述物体分确定所述待识别对象中的物体所在区域;
其中,所述获得所述特征图数据中的物体分,包括:将所述特征图数据与卷积核进行卷积运算,获得卷积结果,根据所述卷积结果,获得所述特征图数据中的物体分,具体为:将所述特征图数据分别与第一数量的尺寸不同的所述卷积核进行卷积运算,获得所述第一数量的尺寸不同的所述卷积核对应的卷积结果,根据所述第一数量的尺寸不同的所述卷积核对应的卷积结果,获得所述特征图数据中的物体分。
17.根据权利要求16所述的从待识别对象中确定物体所在区域的方法,其特征在于,还包括:
确定候选卷积核的初始高度和所述候选卷积核的初始宽度;
以所述初始高度为基准,进行第一倍数的倍乘运算,获得所述候选卷积核的候选高度;
以所述初始宽度为基准,进行第二倍数的倍乘运算,获得所述候选卷积核的候选宽度;
根据所述初始高度、所述初始宽度、所述候选高度和所述候选宽度,获得所述候选卷积核的尺寸信息;
根据所述候选卷积核的尺寸信息,获得所述卷积核。
CN201910106122.1A 2019-02-01 2019-02-01 一种从图像中确定物体所在区域的方法及装置 Active CN111523533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910106122.1A CN111523533B (zh) 2019-02-01 2019-02-01 一种从图像中确定物体所在区域的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910106122.1A CN111523533B (zh) 2019-02-01 2019-02-01 一种从图像中确定物体所在区域的方法及装置

Publications (2)

Publication Number Publication Date
CN111523533A CN111523533A (zh) 2020-08-11
CN111523533B true CN111523533B (zh) 2023-07-07

Family

ID=71900036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910106122.1A Active CN111523533B (zh) 2019-02-01 2019-02-01 一种从图像中确定物体所在区域的方法及装置

Country Status (1)

Country Link
CN (1) CN111523533B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113378873A (zh) * 2021-01-13 2021-09-10 杭州小创科技有限公司 一种用于确定目标对象归属或归类的算法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063719A (zh) * 2014-06-27 2014-09-24 深圳市赛为智能股份有限公司 基于深度卷积网络的行人检测方法及装置
CN104933722A (zh) * 2015-06-29 2015-09-23 电子科技大学 一种基于Spiking-卷积网络模型的图像边缘检测方法
CN107315995A (zh) * 2017-05-18 2017-11-03 中国科学院上海微***与信息技术研究所 一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法
CN109086656A (zh) * 2018-06-06 2018-12-25 平安科技(深圳)有限公司 机场异物检测方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063719A (zh) * 2014-06-27 2014-09-24 深圳市赛为智能股份有限公司 基于深度卷积网络的行人检测方法及装置
CN104933722A (zh) * 2015-06-29 2015-09-23 电子科技大学 一种基于Spiking-卷积网络模型的图像边缘检测方法
CN107315995A (zh) * 2017-05-18 2017-11-03 中国科学院上海微***与信息技术研究所 一种基于拉普拉斯对数脸及卷积神经网络的人脸识别方法
CN109086656A (zh) * 2018-06-06 2018-12-25 平安科技(深圳)有限公司 机场异物检测方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN111523533A (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
US10803554B2 (en) Image processing method and device
US9418458B2 (en) Graph image representation from convolutional neural networks
CN110852349B (zh) 一种图像处理方法、检测方法、相关设备及存储介质
JP2019087252A (ja) ニューラルネットワークにおいてデコンボルーション演算を実行する装置及びその方法
CN111161349B (zh) 物体姿态估计方法、装置与设备
US20130287250A1 (en) Method and apparatus for tracking object in image data, and storage medium storing the same
CN111091123A (zh) 文本区域检测方法及设备
US20120163704A1 (en) Apparatus and method for stereo matching
CN108961180B (zh) 红外图像增强方法及***
CN111696110B (zh) 场景分割方法及***
CN110176024B (zh) 在视频中对目标进行检测的方法、装置、设备和存储介质
CN111814905A (zh) 目标检测方法、装置、计算机设备和存储介质
CN108022244B (zh) 一种基于前景和背景种子用于显著目标检测的超图优化方法
WO2017050083A1 (zh) 一种元件识别方法及装置
CN111738036B (zh) 图像处理方法、装置、设备及存储介质
CN109255382B (zh) 用于图片匹配定位的神经网络***,方法及装置
CN111444807B (zh) 目标检测方法、装置、电子设备和计算机可读介质
CN110910445B (zh) 一种物件尺寸检测方法、装置、检测设备及存储介质
CN109902588B (zh) 一种手势识别方法、装置及计算机可读存储介质
CN114241388A (zh) 基于时空记忆信息的视频实例分割方法和分割装置
CN116310688A (zh) 基于级联融合的目标检测模型及其构建方法、装置及应用
CN111523533B (zh) 一种从图像中确定物体所在区域的方法及装置
CN111914596A (zh) 车道线检测方法、装置、***及存储介质
CN111027551B (zh) 图像处理方法、设备和介质
US20140023260A1 (en) Biological unit segmentation with ranking based on similarity applying a geometric shape and scale model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant