CN110796104A - 目标检测方法、装置、存储介质及无人机 - Google Patents

目标检测方法、装置、存储介质及无人机 Download PDF

Info

Publication number
CN110796104A
CN110796104A CN201911060737.1A CN201911060737A CN110796104A CN 110796104 A CN110796104 A CN 110796104A CN 201911060737 A CN201911060737 A CN 201911060737A CN 110796104 A CN110796104 A CN 110796104A
Authority
CN
China
Prior art keywords
target
image
sub
rectangular frame
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911060737.1A
Other languages
English (en)
Inventor
李亚学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Autel Robotics Co Ltd
Shenzhen Autel Intelligent Aviation Technology Co Ltd
Original Assignee
Autel Robotics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Autel Robotics Co Ltd filed Critical Autel Robotics Co Ltd
Priority to CN201911060737.1A priority Critical patent/CN110796104A/zh
Publication of CN110796104A publication Critical patent/CN110796104A/zh
Priority to PCT/CN2020/124055 priority patent/WO2021083151A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了目标检测方法、装置、存储介质及无人机。该方法包括:获取云台相机拍摄的第一图像,对第一图像进行分割处理,得到至少两个分割图像,对至少两个分割图像进行尺寸变更操作,得到至少两个子图像,至少两个子图像的分辨率与至少两个图像分析单元对应的分辨率相匹配,将至少两个子图像输入至至少两个图像分析单元中,并根据至少两个图像分析单元的分析结果确定目标检测结果。本发明通过采用上述技术方案,可减少图像信息的丢失量,提升目标检测的准确率和成功率。

Description

目标检测方法、装置、存储介质及无人机
技术领域
本发明实施例涉及无人机技术领域,尤其涉及目标检测方法、装置、存储介质及无人机。
背景技术
无人机(Unmanned Aerial Vehicles,UAVs)是指通过无线电遥控设备和独立程序控制设备操作的无人驾驶飞机,或者由机载计算机完全地或间歇地自主操作。与有人驾驶飞机相比,无人机具有体积小、造价低、对环境要求低、生存能力较强等优点,往往更适合危险或环境恶劣的任务。随着无人机制造业的快速发展,无人机***被广泛应用于智慧城市管理以及智能交通监控等领域。其中,目标检测是无人机***中一个基本但是具有挑战性的功能需求,与基础设施检查、城市感知、地图重构以及交通控制等应用密切相关。这些应用推动了基于无人机的在线监控***的发展,这些在线***可以执行各种任务,例如现场设施的检查和违规的检测、不健康农作物的识别以及地图数据的获取等。
无人机上一般集成有图像处理芯片,图像处理芯片中的图像分析单元对无人机上的云台相机拍摄的图像进行分析处理,实现目标检测。目前,为了保证检测的实时性,图像处理芯片的输入图像的分辨率一般较低,而云台相机的分辨率很高,需要将云台相机拍摄的图像进行尺寸变更(resize)操作后,再交给图像处理芯片进行处理,这使得图像处理过程中会丢失部分图像信息,使得一些小目标的检测变得非常困难,甚至无法检测,因此现有的无人机目标检测方案需要改进。
发明内容
本发明实施例提供了目标检测方法、装置、存储介质及设备,可以优化现有的目标检测方案。
第一方面,本发明实施例提供了一种目标检测方法,应用于无人机,所述无人机中集成有至少两个图像分析单元,所述方法包括:
获取云台相机拍摄的第一图像;
对所述第一图像进行分割处理,得到至少两个分割图像;
对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
第二方面,本发明实施例提供了一种目标检测装置,应用于无人机,所述无人机中集成有至少两个图像分析单元,所述装置包括:
图像获取模块,用于获取云台相机拍摄的第一图像;
图像分割模块,用于对所述第一图像进行分割处理,得到至少两个分割图像;
尺寸变更模块,用于对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
目标检测模块,用于将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例提供的目标检测方法。
第四方面,本发明实施例提供了一种无人机,包括存储器、至少两个图像分析单元、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如本发明实施例提供的目标检测方法。
本发明实施例中提供的目标检测方案,应用于无人机,无人机中集成有至少两个图像分析单元,获取云台相机拍摄的第一图像,对第一图像进行分割处理,对至少两个分割图像进行尺寸变更操作,得到的至少两个子图像的分辨率与至少两个图像分析单元对应的分辨率相匹配,将至少两个子图像输入至至少两个图像分析单元中,并根据至少两个图像分析单元的分析结果确定目标检测结果。通过采用上述技术方案,将云台相机拍摄的原始图像进行分割后,在进行尺寸变更操作时,可减少图像信息的丢失量,随后交由至少两个图像分析单元进行分析,可提升目标检测的准确率和成功率。
附图说明
图1为本发明实施例一提供的一种目标检测方法的流程示意图;
图2为本发明实施例一提供的一种云台相机拍摄的图像示意图;
图3为本发明实施例一提供的一种经过尺寸变更处理的图像示意图;
图4为本发明实施例一提供的一种分割后的左侧图像示意图;
图5为本发明实施例一提供的一种分割后的右侧图像示意图;
图6为本发明实施例一提供的一种尺寸变更后的左侧图像示意图;
图7为本发明实施例一提供的一种尺寸变更后的右侧图像示意图;
图8为本发明实施例二提供的一种目标检测方法的流程示意图;
图9为本发明实施例三提供的一种目标检测方法的流程示意图;
图10为本发明实施例三提供的一种包含位置信息的左侧图像示意图;
图11为本发明实施例三提供的一种包含位置信息的右侧图像示意图;
图12为本发明实施例三提供的一种分析结果融合示意图;
图13为本发明实施例四提供的一种目标检测装置的结构框图;
图14为本发明实施例六提供的一种无人机的结构框图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种目标检测方法的流程示意图,该方法可以由目标检测装置执行,其中该装置可由软件和/或硬件实现,一般可集成在无人机中。如图1所示,该方法包括:
步骤101、获取云台相机拍摄的第一图像。
本发明实施例中,云台相机可以集成在无人机内部,也可外置于无人机上,通过有线或无线等方式与无人机建立连接。云台相机能够在无人机的飞行过程中实时进行图像采集,可以实时或以预设频率获取云台相机拍摄的图像。第一图像可以是任意时刻拍摄的图像,本发明实施例不做限定。
本发明实施例中,无人机中集成有至少两个图像分析单元,对图像分析单元的具体类型不做限定,例如可以是基于神经网络进行加速的正向推理器(Neural NetworkInference Engine,NNIE)。图像分析单元可以集成在图像处理芯片内,如HI3559C芯片,该芯片携带两个专门针对神经网络进行加速的正向推理器,两个正向推理器可以单独地处理检测及分类等任务。
步骤102、对所述第一图像进行分割处理,得到至少两个分割图像。
随着相机技术的快速发展,目前云台相机的分辨率可以达到很高,如8K,所拍摄的图像的比例一般为4:3或16:9。为了保证检测的实时性,图像分析单元的输入图像的分辨率一般较低,如512*512,这样,在对云台相机拍摄的图像进行尺寸变更(resize)操作时,就会损失较多的图像信息,使得目标检测准确率下降,尤其难以检测小目标,当无人机飞行高度较高时,地面上的目标在图像中更小,更加难以检出。
图2为本发明实施例一提供的云台相机拍摄的图像示意图,该图像比例为16:9,分辨率为1920*1080。图3为本发明实施例一提供的一种经过尺寸变更处理的图像示意图,经过resize之后,图2中的图像变成了图3中的1:1的图像,分辨率为512*512,这样,图2中的大部分信息被丢失掉,导致小目标的检测不理想。
本步骤中,可以按照预设规则对第一图像进行分割处理,得到至少两个分割图像。其中,预设规则可以包括具体的分割数量以及分割方式等,如平均分割或按照比例分割等,又如左右结构的分割、上下结构的分割、田字形分割以及九宫格式分割等等。具体的分割数量以及分割方式可根据图像分析单元的数量以及其他参考因素确定,本发明实施例不做限定。
本发明实施例中,为了加强与现有技术的对比效果,仍以图2中的图像为例。图4为本发明实施例一提供的一种分割后的左侧图像示意图,图5为本发明实施例一提供的一种分割后的右侧图像示意图,参照图4和图5,可以对图2中的图像进行左右结构的平均分割,得到两个图像比例为8:9的分割图像。
步骤103、对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配。
本发明实施例中,对分割图像进行尺寸变更操作的具体方式不做限定,该尺寸变更操作的目的是使至少两个子图像的分辨率与至少两个图像分析单元对应的分辨率相匹配。示例性的,一般的,至少两个图像分析单元对应的分辨率相等,这样,至少两个子图像的分辨率与该分辨率相同。
示例性的,尺寸变更操作可包括利用插值算法进行的尺寸变更操作。插值算法例如可以是最近邻法、双线性法、双三次法、基于像素区域关系的算法、以及兰索斯插值法等。
图6为本发明实施例一提供的一种尺寸变更后的左侧图像示意图,图7为本发明实施例一提供的一种尺寸变更后的右侧图像示意图。参照图6和图7,分别对图5和图6中的图像进行尺寸变更操作,得到两张图像比例为1:1的图像,分辨率为512*512。
步骤104、将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
通过采用本发明实施例的方案,使得输入至图像分析单元的图像的总面积变大,参照上述举例,相当于将图像中的目标放大了一倍,若分割图像数量更多,则放大倍数也更大,降低了目标检测的难度,可有效提高目标检测的准确度以及成功率。
所述至少两个图像分析单元的工作时序本发明实施例不做具体限定。可选的,所述将所述至少两个子图像输入至所述至少两个图像分析单元中之后,还包括:控制所述至少两个图像分析单元并行对所接收到的子图像进行分析处理。这样设置的好处在于,在保证检测实时性的同时,提升目标检测的准确率和成功率。
示例性的,图像分析单元的分析结果所包含的内容与图像分析单元的具体类型、型号以及功能等有关,本发明实施例不做限定。一般的,分析结果中可包括分析出来的目标的位置信息以及类型信息等。目标可以是目标物体或目标人物等,可以是预先指定的目标,也可以是自动识别出来的目标,可以根据实际需求进行设置。可对至少两个图像分析单元的分析结果进行整合,确定最终的目标检测结果。
本发明实施例中提供的目标检测方法,应用于无人机,无人机中集成有至少两个图像分析单元,获取云台相机拍摄的第一图像,对第一图像进行分割处理,对至少两个分割图像进行尺寸变更操作,得到的至少两个子图像的分辨率与至少两个图像分析单元对应的分辨率相匹配,将至少两个子图像输入至至少两个图像分析单元中,并根据至少两个图像分析单元的分析结果确定目标检测结果。通过采用上述技术方案,将云台相机拍摄的原始图像进行分割后,在进行尺寸变更操作时,可减少图像信息的丢失量,随后交由至少两个图像分析单元进行分析,可提升目标检测的准确率和成功率。
实施例二
图8为本发明实施例二提供的一种目标检测方法的流程示意图,该方法在上述实施例基础上进行优化,对根据所述至少两个图像分析单元的分析结果确定目标检测结果的具体过程进行细化。
示例性的,所述根据所述至少两个图像分析单元的分析结果确定目标检测结果,包括:获取所述至少两个图像分析单元的分析结果;对至少两个分析结果进行融合处理,得到目标检测结果。这样设置的好处在于,在进行分割处理时,可能目标处于分割位置,导致在相邻图像中均会检测到目标,针对这种情况,可以对分析结果进行融合处理,以对被分割的目标的分析结果进行融合。
进一步的,所述分析结果中包括分析出来的目标的类型信息和位置信息,所述对至少两个分析结果进行融合处理,包括:依次将每两个相邻的子图像记为当前子图像对,所述当前子图像对包括第一子图像和第二子图像,针对所述当前子图像对进行如下操作:确定所述第一子图像中的第一目标,以及所述第二子图像中的第二目标,根据所述第一目标对应的第一位置信息和第一类型信息,以及所述第二目标对应的第二位置信息和第二类型信息,确定所述第一目标和所述第二目标是否对应同一目标,若是,则将所述第一目标和所述第二目标融合为同一目标。这样设置的好处在于,可以根据位置信息和类型信息逐一判断每两个相邻子图像中是否存在被分割的目标对应的图像,能够准确地识别出在图像中被分割的目标。
具体的,该方法包括如下步骤:
步骤201、获取云台相机拍摄的第一图像。
步骤202、对第一图像进行分割处理,得到至少两个分割图像。
步骤203、对至少两个分割图像进行尺寸变更操作,得到至少两个子图像,至少两个子图像的分辨率与至少两个图像分析单元对应的分辨率相匹配。
步骤204、将至少两个子图像输入至所述至少两个图像分析单元中,并控制至少两个图像分析单元并行对所接收到的子图像进行分析处理。
步骤205、获取至少两个图像分析单元的分析结果。
步骤206、依次将每两个相邻的子图像记为当前子图像对,针对当前子图像对进行如下操作:确定第一子图像中的第一目标以及第二子图像中的第二目标,根据第一目标对应的第一位置信息和第一类型信息,以及第二目标对应的第二位置信息和第二类型信息,确定第一目标和第二目标是否对应同一目标,若是,则将第一目标和所述第二目标融合为同一目标。
其中,所述分析结果中包括分析出来的目标的类型信息和位置信息,当前子图像对包括第一子图像和第二子图像。第一目标可以是第一子图像中分析出来的任意一个目标,第二目标可以是第二子图像中分析出来的任意一个目标。
可选的,为了减少计算量,可以对第一目标和第二目标进行初筛,将距离分割边界较近的目标确定为第一目标或第二目标。示例性的,以第一目标为例,记第一子图像中与第二子图像重合的边界为分割边界,获取第一子图像中分析出来的备选目标,针对每个备选目标,判断当前备选目标与所述分割边界的第五距离,若所述第五距离小于第三预设阈值,则将所述当前备选目标确定为第一目标。同理,可参考上述内容来确定第二目标。其中,第三预设阈值可以根据子图像的尺寸进行设置,例如可以是与分割边界垂直的边的边长的预设比例,预设比例例如可以是10%。
示例性的,分析结果中的位置信息可以包括坐标范围,该坐标范围可以形成一定的形状,例如可以是圆形、椭圆形或矩形等,也可以是与目标外形相匹配的形状。
可选的,所述位置信息包括矩形框的坐标,所述矩形框内包含分析出来的目标对应的图像。所述第一目标对应的矩形框记为第一矩形框,所述第二目标对应的矩形框记为第二矩形框。类型信息可以由图像分析单元的具体能力确定,例如,可以分析出是运动物体还是静物、是动物还是人物,还可以分析出具体的类别,如车辆、房屋等,还可分析出更细致的类别,如轿车、公交车、消防车以及救护车等等。
示例性的,针对第一矩形和第二矩形采用同样的规则进行四条边的编号,然后基于各边之间的距离以及两个目标对应的类型信息来判断两个矩形是否对应同一目标。对于左右相邻情况,可以判断两个矩形框在水平方向上的距离是否足够近,在竖直方向上偏离同一水平线的程度是否足够小;对于上下相邻情况,可以判断两个矩形框在竖直方向上的距离是否足够近,在水平方向上偏离同一垂直线的程度是否足够小。若满足上述条件,且第一目标和第二目标类型信息相同时,可认为第一目标和第二目标为同一目标。
具体的,所述根据所述第一目标对应的第一位置信息和第一类型信息,以及所述第二目标对应的第二位置信息和第二类型信息,确定所述第一目标和所述第二目标是否为对应同一目标,可包括:
根据所述第一矩形框的坐标和所述第二矩形框的坐标,计算所述第一矩形框的第一边界与所述第二矩形框的第三边界的第一距离、所述第一矩形框的第三边界与所述第二矩形框的第一边界的第二距离、所述第一矩形框的第二边界与所述第二矩形框的第四边界的第三距离、以及所述第一矩形框的第四边界与所述第二矩形框的第二边界的第四距离,其中,每个矩形框中的第一边界和第三边界平行,第二边界和第四边界平行,当所述第一子图像与所述第二子图像为左右相邻时,每个矩形框中的第一边界为左边界,当所述第一子图像与所述第二子图像为上下相邻时,每个矩形中的第一边界为上边界;
计算所述第一距离和所述第二距离中,数值较小的距离与数值较大的距离的第一比值;以及,计算所述第三距离和所述第四距离中,数值较小的距离与数值较大的距离的第二比值;
当所述第一比值小于第一预设阈值、所述第二比值大于第二预设阈值、且所述第一类型信息和所述第二类型信息相同时,确定所述第一目标和所述第二目标是否为对应同一目标,其中,所述第一预设阈值小于所述第二预设阈值。
其中,第一预设阈值和第二预设阈值可以根据实际需求设置,例如,第一预设阈值为0.1,第二预设阈值为0.6。
可选的,所述将所述第一目标和所述第二目标融合为同一目标,包括:根据所述第一矩形框的坐标和所述第二矩形的坐标确定目标矩形框,所述目标矩形框同时包含所述第一矩形框和所述第二矩形框;将所述目标矩形框和第一类型信息确定为融合后的目标对应的分析结果。这样设置的好处在于,在确定第一目标和第二目标为同一目标时,可以将同时包含第一矩形框和第二矩形框的目标矩形框确定为该目标最终的位置信息,避免最终的目标检测结果中的目标数量出现错误。
步骤207、将经过融合处理后的结果确定为目标检测结果。
本发明实施例提供的目标检测方法,在进行图像分割以及尺寸变更之后,交由至少两个图像分析单元进行并行处理,在得到各图像分析单元的初步分析结果后,充分考虑同一目标被分割到两个子图像中的情况,对判断出来的被分割的目标的分析结果进行融合,最终得到准确的目标检测结果。
在上述实施例基础上,在确定目标检测结果之后,还可包括,将包含目标检测结果的至少两个子图像进行拼接操作,并输出至用户设备。其中,用户设备可以是移动终端或计算机等供用户查看目标检测结果的设备。
实施例三
图9为本发明实施例三提供的一种目标检测方法的流程示意图,该方法以无人机中集成有两个图像分析单元,对图像进行左右平均分割为例进行说明,具体的,该方法包括如下步骤:
步骤301、获取云台相机拍摄的第一图像。
为了便于说明,以图2中的图像为第一图像为例进行下面的描述。该图像比例为16:9,分辨率为1920*1080。
步骤302、对第一图像进行左右平均分割处理,得到两个分割图像。
对图2中的图像进行左右结构的平均分割,得到两个图像比例为8:9的分割图像,如图4和图5所示。
步骤303、对两个分割图像进行尺寸变更操作,得到两个子图像,两个子图像的分辨率与两个图像分析单元对应的分辨率相匹配。
示例性的,两个图像分析单元为HI3559C芯片上携带的两个专门针对神经网络进行加速的正向推理器,每个推理器所支持的分辨率为512*512,参照图6和图7,分别对图5和图6中的图像进行尺寸变更操作,得到两张图像比例为1:1的图像,分辨率为512*512。
步骤304、将两个子图像输入至两个图像分析单元中,并控制两个图像分析单元并行对所接收到的子图像进行分析处理。
步骤305、获取两个图像分析单元的分析结果。
示例性的,两个推理器会分别给出分析得到的目标在所属子图像中的位置信息(BBox)和类别(Class)信息。其中,位置信息以矩形框的坐标表示。当一个目标在左右两个子图像中并存时,如图中的汽车,同时出现在图6和图7中,那么两个推理器也会分别给出自己负责的子图像中的汽车的位置信息。图10为本发明实施例三提供的一种包含位置信息的左侧图像示意图,图11为本发明实施例三提供的一种包含位置信息的右侧图像示意图,如图10和图11所示,分别采用矩形框圈出了分析出来的目标的位置。
步骤306、确定第一子图像中的第一目标以及第二子图像中的第二目标,根据第一目标对应的第一位置信息和第一类型信息,以及第二目标对应的第二位置信息和第二类型信息,确定第一目标和第二目标是否对应同一目标,若是,则将第一目标和第二目标融合为同一目标。
图12为本发明实施例三提供的一种分析结果融合示意图,如图所示,左侧矩形框Left BBox表示第一目标的第一矩形框,右侧矩形框Right BBox表示第二目标的第二矩形框。
其中,左图的矩形框和右图的矩形框处于同一坐标系中,该坐标系可根据第一子图像和第二子图像拼接成的图像来确定,例如,以该图像的左下角为坐标原点,下边界为横轴,左边界为竖轴。左图的矩形框可以用坐标(Ltop,Lbottom,Lleft,Lrigth)表示,右图的矩形框可以用坐标(Rtop,Rbottom,Rleft,Rrigth)表示,图中的W、w、H和h以如下公式表示。
W=Rrigth–Lleft w=Rleft–Lrigth
H=Rbottom–Ltop h=Lbottom-Rtop
当w/W<0.1并且h/H>0.6的时候,并且类别信息相同,可以认为左右两个BBox为同一目标,这时融合后的BBox为(Ltop,Rbottom,Lleft,Rrigth)。其中的0.1为第一预设阈值,0.6为第二预设阈值。
上面只是一种情况,由于矩形框的尺寸以及相对位置关系可能不同,因此可以用通用公式可以表示为:
W=Rrigth–Lleft w=Rleft–Lrigth
H=max(Rbottom,Lbottom)–min(Ltop,Rtop)
h=min(Lbottom,Rbottom)–max(Rtop,Ltop)
当w/W<0.1并且h/H>0.6的时候,并且类别信息相同,可以认为左右两个BBox为同一目标,这时融合后的BBox为(min(Ltop,Rtop),max(Lbottom,Rbottom),Lleft,Rrigth)。
步骤307、将经过融合处理后的结果确定为目标检测结果。
本发明实施例提供的目标检测方法,对云台相机采集的原始图像进行左右结构的平均分割,并进行尺寸变更操作,交由两个推理器进行并行处理,在得到两个推理器的初步分析结果后,充分考虑同一目标被分割到两个子图像中的情况,对判断出来的被分割的目标的分析结果进行融合,最终得到准确的目标检测结果。通过上述举例可以看出,检测分辨率从512*512扩大至1024*512,能够提升小目标的检测成功率,双推理器并行运算,耗时和与单推理器的512*512时相同,8:9的图像resize成1:1相比较于16:9的图像resize成1:1,resize过程保留了图像更多的信息,进一步提升目标检测的准确度和成功率。
实施例四
图13为本发明实施例四提供的一种目标检测装置的结构框图,该装置可由软件和/或硬件实现,一般可集成在无人机中,可通过执行目标检测方法来进行目标检测,其中,无人机中集成有至少两个图像分析单元。如图13所示,该装置包括:
图像获取模块401,用于获取云台相机拍摄的第一图像;
图像分割模块402,用于对所述第一图像进行分割处理,得到至少两个分割图像;
尺寸变更模块403,用于对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
目标检测模块404,用于将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
本发明实施例中提供的目标检测装置,应用于无人机,无人机中集成有至少两个图像分析单元,获取云台相机拍摄的第一图像,对第一图像进行分割处理,对至少两个分割图像进行尺寸变更操作,得到的至少两个子图像的分辨率与至少两个图像分析单元对应的分辨率相匹配,将至少两个子图像输入至至少两个图像分析单元中,并根据至少两个图像分析单元的分析结果确定目标检测结果。通过采用上述技术方案,将云台相机拍摄的原始图像进行分割后,在进行尺寸变更操作时,可减少图像信息的丢失量,随后交由至少两个图像分析单元进行分析,可提升目标检测的准确率和成功率。
可选的,所述根据所述至少两个图像分析单元的分析结果确定目标检测结果,包括:
获取所述至少两个图像分析单元的分析结果;
对至少两个分析结果进行融合处理,得到目标检测结果。
可选的,所述分析结果中包括分析出来的目标的类型信息和位置信息,所述对至少两个分析结果进行融合处理,包括:
依次将每两个相邻的子图像记为当前子图像对,所述当前子图像对包括第一子图像和第二子图像,针对所述当前子图像对进行如下操作:
确定所述第一子图像中的第一目标,以及所述第二子图像中的第二目标;
根据所述第一目标对应的第一位置信息和第一类型信息,以及所述第二目标对应的第二位置信息和第二类型信息,确定所述第一目标和所述第二目标是否对应同一目标,若是,则将所述第一目标和所述第二目标融合为同一目标。
可选的,所述位置信息包括矩形框的坐标,所述矩形框内包含分析出来的目标对应的图像;所述第一目标对应的矩形框记为第一矩形框,所述第二目标对应的矩形框记为第二矩形框;
所述根据所述第一目标对应的第一位置信息和第一类型信息,以及所述第二目标对应的第二位置信息和第二类型信息,确定所述第一目标和所述第二目标是否为对应同一目标,包括:
根据所述第一矩形框的坐标和所述第二矩形框的坐标,计算所述第一矩形框的第一边界与所述第二矩形框的第三边界的第一距离、所述第一矩形框的第三边界与所述第二矩形框的第一边界的第二距离、所述第一矩形框的第二边界与所述第二矩形框的第四边界的第三距离、以及所述第一矩形框的第四边界与所述第二矩形框的第二边界的第四距离,其中,每个矩形框中的第一边界和第三边界平行,第二边界和第四边界平行,当所述第一子图像与所述第二子图像为左右相邻时,每个矩形框中的第一边界为左边界,当所述第一子图像与所述第二子图像为上下相邻时,每个矩形框中的第一边界为上边界;
计算所述第一距离和所述第二距离中,数值较小的距离与数值较大的距离的第一比值;以及,计算所述第三距离和所述第四距离中,数值较小的距离与数值较大的距离的第二比值;
当所述第一比值小于第一预设阈值、所述第二比值大于第二预设阈值、且所述第一类型信息和所述第二类型信息相同时,确定所述第一目标和所述第二目标是否为对应同一目标,其中,所述第一预设阈值小于所述第二预设阈值。
可选的,所述将所述第一目标和所述第二目标融合为同一目标,包括:
根据所述第一矩形框的坐标和所述第二矩形的坐标确定目标矩形框,所述目标矩形框同时包含所述第一矩形框和所述第二矩形框;
将所述目标矩形框和第一类型信息确定为融合后的目标对应的分析结果。
可选的,记所述第一子图像中与所述第二子图像重合的边界为分割边界,所述确定所述第一子图像中的第一目标,包括:
获取所述第一子图像中分析出来的备选目标;
针对每个备选目标,判断当前备选目标与所述分割边界的第五距离,若所述第五距离小于第三预设阈值,则将所述当前备选目标确定为第一目标。
可选的,所述至少两个图像分析单元包括至少两个基于神经网络进行加速的正向推理器NNIE。
实施例五
本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行目标检测方法,该方法包括:
获取云台相机拍摄的第一图像;
对所述第一图像进行分割处理,得到至少两个分割图像;
对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机***存储器或随机存取存储器,诸如DRAM、DDRRAM、SRAM、EDORAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机***中,或者可以位于不同的第二计算机***中,第二计算机***通过网络(诸如因特网)连接到第一计算机***。第二计算机***可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机***中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的目标检测操作,还可以执行本发明任意实施例所提供的目标检测方法中的相关操作。
实施例六
本发明实施例提供了一种无人机,该无人机中可集成本发明实施例提供的目标检测装置。图14为本发明实施例六提供的一种无人机的结构框图。无人机500可以包括:存储器501,处理器502及至少两个图像分析单元503(图中仅示出一个)存储在存储器501上并可在处理器运行的计算机程序,所述处理器502执行所述计算机程序时实现如本发明实施例所述的目标检测方法。该方法可包括:
获取云台相机拍摄的第一图像;
对所述第一图像进行分割处理,得到至少两个分割图像;
对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
本发明实施例提供的计算机设备,将云台相机拍摄的原始图像进行分割后,在进行尺寸变更操作时,可减少图像信息的丢失量,随后交由至少两个图像分析单元进行分析,可提升目标检测的准确率和成功率。
上述实施例中提供的目标检测装置、存储介质以及计算机设备可执行本发明任意实施例所提供的目标检测方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的目标检测方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种目标检测方法,其特征在于,应用于无人机,所述无人机中集成有至少两个图像分析单元,所述方法包括:
获取云台相机拍摄的第一图像;
对所述第一图像进行分割处理,得到至少两个分割图像;
对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个图像分析单元的分析结果确定目标检测结果,包括:
获取所述至少两个图像分析单元的分析结果;
对至少两个分析结果进行融合处理,得到目标检测结果。
3.根据权利要求2所述的方法,其特征在于,所述分析结果中包括分析出来的目标的类型信息和位置信息,所述对至少两个分析结果进行融合处理,包括:
依次将每两个相邻的子图像记为当前子图像对,所述当前子图像对包括第一子图像和第二子图像,针对所述当前子图像对进行如下操作:
确定所述第一子图像中的第一目标,以及所述第二子图像中的第二目标;
根据所述第一目标对应的第一位置信息和第一类型信息,以及所述第二目标对应的第二位置信息和第二类型信息,确定所述第一目标和所述第二目标是否对应同一目标,若是,则将所述第一目标和所述第二目标融合为同一目标。
4.根据权利要求3所述的方法,其特征在于,所述位置信息包括矩形框的坐标,所述矩形框内包含分析出来的目标对应的图像;所述第一目标对应的矩形框记为第一矩形框,所述第二目标对应的矩形框记为第二矩形框;
所述根据所述第一目标对应的第一位置信息和第一类型信息,以及所述第二目标对应的第二位置信息和第二类型信息,确定所述第一目标和所述第二目标是否为对应同一目标,包括:
根据所述第一矩形框的坐标和所述第二矩形框的坐标,计算所述第一矩形框的第一边界与所述第二矩形框的第三边界的第一距离、所述第一矩形框的第三边界与所述第二矩形框的第一边界的第二距离、所述第一矩形框的第二边界与所述第二矩形框的第四边界的第三距离、以及所述第一矩形框的第四边界与所述第二矩形框的第二边界的第四距离,其中,每个矩形框中的第一边界和第三边界平行,第二边界和第四边界平行,当所述第一子图像与所述第二子图像为左右相邻时,每个矩形框中的第一边界为左边界,当所述第一子图像与所述第二子图像为上下相邻时,每个矩形框中的第一边界为上边界;
计算所述第一距离和所述第二距离中,数值较小的距离与数值较大的距离的第一比值;以及,计算所述第三距离和所述第四距离中,数值较小的距离与数值较大的距离的第二比值;
当所述第一比值小于第一预设阈值、所述第二比值大于第二预设阈值、且所述第一类型信息和所述第二类型信息相同时,确定所述第一目标和所述第二目标是否为对应同一目标,其中,所述第一预设阈值小于所述第二预设阈值。
5.根据权利要求4所述的方法,其特征在于,所述将所述第一目标和所述第二目标融合为同一目标,包括:
根据所述第一矩形框的坐标和所述第二矩形的坐标确定目标矩形框,所述目标矩形框同时包含所述第一矩形框和所述第二矩形框;
将所述目标矩形框和第一类型信息确定为融合后的目标对应的分析结果。
6.根据权利要求3所述的方法,其特征在于,记所述第一子图像中与所述第二子图像重合的边界为分割边界,所述确定所述第一子图像中的第一目标,包括:
获取所述第一子图像中分析出来的备选目标;
针对每个备选目标,判断当前备选目标与所述分割边界的第五距离,若所述第五距离小于第三预设阈值,则将所述当前备选目标确定为第一目标。
7.根据权利要求1-6任一所述的方法,其特征在于,所述至少两个图像分析单元包括至少两个基于神经网络进行加速的正向推理器NNIE。
8.一种目标检测装置,其特征在于,应用于无人机,所述无人机中集成有至少两个图像分析单元,所述装置包括:
图像获取模块,用于获取云台相机拍摄的第一图像;
图像分割模块,用于对所述第一图像进行分割处理,得到至少两个分割图像;
尺寸变更模块,用于对所述至少两个分割图像进行尺寸变更操作,得到至少两个子图像,所述至少两个子图像的分辨率与所述至少两个图像分析单元对应的分辨率相匹配;
目标检测模块,用于将所述至少两个子图像输入至所述至少两个图像分析单元中,并根据所述至少两个图像分析单元的分析结果确定目标检测结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的方法。
10.一种无人机,包括存储器、至少两个图像分析单元、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的方法。
CN201911060737.1A 2019-11-01 2019-11-01 目标检测方法、装置、存储介质及无人机 Pending CN110796104A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911060737.1A CN110796104A (zh) 2019-11-01 2019-11-01 目标检测方法、装置、存储介质及无人机
PCT/CN2020/124055 WO2021083151A1 (zh) 2019-11-01 2020-10-27 目标检测方法、装置、存储介质及无人机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911060737.1A CN110796104A (zh) 2019-11-01 2019-11-01 目标检测方法、装置、存储介质及无人机

Publications (1)

Publication Number Publication Date
CN110796104A true CN110796104A (zh) 2020-02-14

Family

ID=69442491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911060737.1A Pending CN110796104A (zh) 2019-11-01 2019-11-01 目标检测方法、装置、存储介质及无人机

Country Status (2)

Country Link
CN (1) CN110796104A (zh)
WO (1) WO2021083151A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951328A (zh) * 2020-08-05 2020-11-17 清华大学苏州汽车研究院(吴江) 一种物***置检测方法、装置、设备和存储介质
CN112101134A (zh) * 2020-08-24 2020-12-18 深圳市商汤科技有限公司 物体的检测方法及装置、电子设备和存储介质
CN112307976A (zh) * 2020-10-30 2021-02-02 北京百度网讯科技有限公司 目标检测方法、装置、电子设备以及存储介质
CN112348835A (zh) * 2020-11-30 2021-02-09 广联达科技股份有限公司 一种物料数量的检测方法、装置、电子设备及存储介质
WO2021083151A1 (zh) * 2019-11-01 2021-05-06 深圳市道通智能航空技术股份有限公司 目标检测方法、装置、存储介质及无人机

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103149939B (zh) * 2013-02-26 2015-10-21 北京航空航天大学 一种基于视觉的无人机动态目标跟踪与定位方法
US9070289B2 (en) * 2013-05-10 2015-06-30 Palo Alto Research Incorporated System and method for detecting, tracking and estimating the speed of vehicles from a mobile platform
CN104966092B (zh) * 2015-06-16 2018-06-01 中国联合网络通信集团有限公司 一种图像处理方法和装置
CN107909600B (zh) * 2017-11-04 2021-05-11 南京奇蛙智能科技有限公司 一种基于视觉的无人机实时运动目标分类与检测方法
CN109765939A (zh) * 2018-12-21 2019-05-17 中国科学院自动化研究所南京人工智能芯片创新研究院 无人机的云台控制方法、装置和存储介质
CN110796104A (zh) * 2019-11-01 2020-02-14 深圳市道通智能航空技术有限公司 目标检测方法、装置、存储介质及无人机

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021083151A1 (zh) * 2019-11-01 2021-05-06 深圳市道通智能航空技术股份有限公司 目标检测方法、装置、存储介质及无人机
CN111951328A (zh) * 2020-08-05 2020-11-17 清华大学苏州汽车研究院(吴江) 一种物***置检测方法、装置、设备和存储介质
CN112101134A (zh) * 2020-08-24 2020-12-18 深圳市商汤科技有限公司 物体的检测方法及装置、电子设备和存储介质
CN112101134B (zh) * 2020-08-24 2024-01-02 深圳市商汤科技有限公司 物体的检测方法及装置、电子设备和存储介质
CN112307976A (zh) * 2020-10-30 2021-02-02 北京百度网讯科技有限公司 目标检测方法、装置、电子设备以及存储介质
CN112307976B (zh) * 2020-10-30 2024-05-10 北京百度网讯科技有限公司 目标检测方法、装置、电子设备以及存储介质
CN112348835A (zh) * 2020-11-30 2021-02-09 广联达科技股份有限公司 一种物料数量的检测方法、装置、电子设备及存储介质
CN112348835B (zh) * 2020-11-30 2024-04-16 广联达科技股份有限公司 一种物料数量的检测方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2021083151A1 (zh) 2021-05-06

Similar Documents

Publication Publication Date Title
CN110163904B (zh) 对象标注方法、移动控制方法、装置、设备及存储介质
US20220076444A1 (en) Methods and apparatuses for object detection, and devices
CN110059608B (zh) 一种物体检测方法、装置、电子设备和存储介质
CN108171112B (zh) 基于卷积神经网络的车辆识别与跟踪方法
CN110796104A (zh) 目标检测方法、装置、存储介质及无人机
CN111563415B (zh) 一种基于双目视觉的三维目标检测***及方法
US11120280B2 (en) Geometry-aware instance segmentation in stereo image capture processes
CN110825101A (zh) 一种基于深度卷积神经网络的无人机自主降落方法
CN113228043A (zh) 移动平台基于神经网络的障碍物检测及关联的***和方法
CN111738033B (zh) 基于平面分割的车辆行驶信息确定方法及装置、车载终端
US20220301099A1 (en) Systems and methods for generating object detection labels using foveated image magnification for autonomous driving
EP3703008A1 (en) Object detection and 3d box fitting
CN111098850A (zh) 一种自动停车辅助***及自动泊车方法
CN113255444A (zh) 图像识别模型的训练方法、图像识别方法和装置
CN116601667A (zh) 用单目监视相机进行3d对象检测和跟踪的***和方法
CN113111787A (zh) 目标检测方法、装置、设备以及存储介质
CN116385997A (zh) 一种车载障碍物精确感知方法、***及存储介质
CN114648639A (zh) 一种目标车辆的检测方法、***及装置
CN114596239A (zh) 装卸货事件检测方法、装置、计算机设备和存储介质
CN111815667B (zh) 一种相机移动条件下高精度检测运动目标的方法
CN115063594B (zh) 一种基于自动驾驶的特征提取方法及装置
US20230230317A1 (en) Method for generating at least one ground truth from a bird&#39;s eye view
US20230252638A1 (en) Systems and methods for panoptic segmentation of images for autonomous driving
CN115223146A (zh) 障碍物检测方法、装置、计算机设备和存储介质
CN114549976A (zh) 一种基于多摄像头的移动机器人的轨迹测量方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518055 Guangdong city of Shenzhen province Nanshan District Xili Street Xueyuan Road No. 1001 Chi Yuen Building 9 layer B1

Applicant after: Shenzhen daotong intelligent Aviation Technology Co.,Ltd.

Address before: 518055 Guangdong city of Shenzhen province Nanshan District Xili Street Xueyuan Road No. 1001 Chi Yuen Building 9 layer B1

Applicant before: AUTEL ROBOTICS Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination