CN112711972A - 一种目标检测方法及装置 - Google Patents
一种目标检测方法及装置 Download PDFInfo
- Publication number
- CN112711972A CN112711972A CN201911026844.2A CN201911026844A CN112711972A CN 112711972 A CN112711972 A CN 112711972A CN 201911026844 A CN201911026844 A CN 201911026844A CN 112711972 A CN112711972 A CN 112711972A
- Authority
- CN
- China
- Prior art keywords
- bounding
- bounding box
- target
- box
- bounding boxes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000012163 sequencing technique Methods 0.000 claims description 31
- 230000015654 memory Effects 0.000 claims description 20
- 230000005540 biological transmission Effects 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 12
- 230000002829 reductive effect Effects 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种目标检测方法及装置,其中方法包括:获取目标图像上多个边界框及所述多个边界框的得分,所述得分用于表征所述边界框中包含目标对象的置信度;对所述目标图像进行划分得到多个网格,并确定所述多个边界框所属的网格;遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框;根据所述目标边界框的得分确定目标检测结果。本申请实施例通过对目标图像进行网格划分,确定边界框归属的网格,然后根据网格之间的相邻关系确定边界框的相邻关系,使得在进行NMS算法运算时,只需要计算参考边界框与相邻边界框的重叠度,有效降低NMS的时间复杂度,提升了目标检测效率。
Description
技术领域
本申请涉及图像处理领域,尤其涉及一种目标检测方法及装置。
背景技术
随着深度学习和计算机视觉的快速发展,相关技术已经在诸多领域广泛应用。目标检测(Object Detection)作为图像处理中的重要一环,其任务是找出图像中所有感兴趣的目标(物体),确定它们的位置和大小,是机器视觉领域的核心问题之一。
在采用深度学习方法进行目标检测时,可以包含两个步骤,首先在目标图像上生成边界框(bounding box,bbox)以及边界框得分,其中边界框得分值越高,bbox框中的物体是目标物体的概率也越大;筛选出边界框得分满足预设条件的高分边界框,确定高分边界框中的物体为需要识别的目标物体。
在这个过程中,为了避免目标漏检,在生成bbox框时,bbox框的位置排布会比较密,因此会导致在同一个目标物体上出现多个框,为了从众多重叠框中选出最优框,非极大值抑制(Non-Maximum Suppression,NMS)算法被引入,通过交并比(Intersection OverUnion,IOU)计算筛选掉与高得分边界框重叠的低得分框,得出目标物体上的最优框。
但是,NMS算法中每个被选取的高得分框都要与得分低于自身的所有低得分框做IOU计算,最坏情况下算法复杂度为O(N^2),所以当bbox框的个数增多时,耗时会幂次倍增加,NMS耗时增加会导致检测帧率降低,严重影响算法检测效果。
发明内容
本申请实施例提供一种目标检测方法及装置,采用本申请实施例的方案能够通过对目标图像进行网格划分,确定边界框归属的网格,然后根据网格之间的相邻关系确定边界框的相邻关系,使得在进行NMS算法运算时,只需要计算参考边界框与相邻边界框的重叠度,有效降低NMS的时间复杂度,提升目标检测效率。
第一方面,本申请实施例提供一种目标检测方法,该方法包括:获取目标图像上多个边界框及该多个边界框的得分,该得分用于表征该边界框中包含目标对象的置信度;对该目标图像进行划分得到多个网格,并确定该多个边界框所属的网格;遍历该多个边界框,计算参考边界框与相邻边界框的重叠度,并根据该重叠度得到目标边界框;该参考边界框为该多个边界框中的任一个,该相邻边界框包括属于目标网格的边界框以及属于该目标网格的相邻网格的边界框,该目标网格为述参考边界框所属的网格,该相邻边界框不包括该参考边界框;根据该目标边界框的得分确定目标检测结果。
在本申请实施例中,对目标图像进行划分得到多个网格;根据网格划分结果确定多个边界框对应的相邻边界框;然后遍历多个边界框,计算获得多个边界框中未被相邻边界框抑制的目标边界框,最后根据目标边界框的得分确定目标检测结果。在这个过程中,通过确定多个边界框所属网格,进而确定边界框的相邻边界框,使得在遍历边界框时,只需要计算边界框与相邻边界框的重叠度,极大减少了数据处理量,提升了数据处理效率,进而提升了目标检测效率。
在一个可选的示例中,在遍历多个边界框之前,该方法还包括:按照该边界框的得分大小对该边界框进行排序,获得该边界框对应的排序编号。
在本申请实施例中,对多个边界框按照得分大小进行排序获得边界框对应的排序编号,使得在后续对边界框进行遍历时按照排序编号依次进行,在计算参考边界框与相邻边界框的重叠度时,可以只考虑排序编号大于或小于参考边界框的相邻边界框,减少了数据处理量,进一步提升了目标检测的效率。
在一个可选的示例中,按照该边界框的得分大小对该边界框进行排序,具体包括:按照得分大小对该边界框进行降序排序,得分越小的边界框对应的排序编号越大。
在一个可选的示例中,遍历多个边界框,计算参考边界框与相邻边界框的重叠度,得到目标边界框,包括:获取该多个边界框中的排序编号为i的边界框作为参考边界框,同时获取其标识位;在该参考边界框的标识位为第一标识值的情况下,获取该参考边界框的相邻边界框,并判定该相邻边界框的排序编号是否大于i;在确定该相邻边界框的排序编号大于i的情况下,计算该参考边界框与该相邻边界框的交并比;在该交并比大于预设阈值的情况下,将该相邻边界框的标识位置为第二标识值;获取该标识位为该第一标识值的边界框作为目标边界框。
在一个可选的示例中,多个边界框的尺寸不同,对目标图像进行划分得到多个网格,包括:按照该多个边界框的尺寸中的最大尺寸对该目标图像划分得到多个网格。
在本申请实施例中,将目标图像按照多个边界框的尺寸中的最大尺寸划分得到多个网格,可以使得根据边界框所属的网格获取参考边界框的相邻边界框时,避免因为网格尺寸过小导致获取的相邻边界框里面未包含全部与参考边界框重叠度大于预设阈值的边界框,提升了获取目标边界框的准确度,进而提升了目标检测结果的准确度。
在一个可选的示例中,多个边界框的尺寸相同,对目标图像进行划分得到多个网格,包括:按照该多个边界框的尺寸对该目标图像划分得到多个网格。
在一个可选的示例中,该多个边界框的尺寸相同包括:该多个边界框之间具有相同的宽,且该多个边界框之间具有相同的高。
在一个可选的示例中,确定多个边界框所属的网格包括:确定目标坐标点,该目标坐标点为该边界框上或该边界框内的任一个坐标点;将该目标坐标点所属的网格确定为该边界框所属的网格。
在一个可选的示例中,目标坐标点包括:边界框的右上角坐标点,边界框的左上角坐标点,边界框的右下角坐标点,边界框的左下角坐标点或边界框的中心坐标点中的任一个。
在一个可选的示例中,在确定多个边界框所属的网格之后,该方法还包括:根据该边界框所属的网格,建立该网格对应的索引队列,该索引队列中包括至少一个该边界框的排序编号;
获取参考边界框的相邻边界框包括:按照该索引队列从目标网格和该目标网格的相邻网格中获取相邻边界框。
在一个可选的示例中,在对边界框按照其对应得分大小进行排序之前,该方法还包括:确定该多个边界框为得分大于预设得分的多个边界框。
在本申请实施例中,筛选出得分大于预设得分的边界框,再对多个边界框进行排序和遍历,因为得分低的边界框对目标检测结果影响低甚至无影响,因此省略对得分低的边界框的排序和遍历,可以在保证目标检测结果的可靠性的同时,提升目标检测的效率。
在一个可选的示例中,根据目标边界框的得分确定目标检测结果,包括:根据得分大于预设得分的目标边界框确定目标检测结果。
第二方面,本申请实施例提供了一种目标检测装置,该装置包括:获取单元,用于获取目标图像上多个边界框及该多个边界框的得分,该得分用于表征该边界框中包含目标对象的置信度;划分单元,用于对该目标图像进行划分得到多个网格,并确定该多个边界框所属的网格;遍历单元,用于遍历该多个边界框,计算参考边界框与相邻边界框的重叠度,并根据该重叠度得到目标边界框;该参考边界框为该多个边界框中的任一个,该相邻边界框包括属于目标网格的边界框以及属于该目标网格的相邻网格的边界框,该目标网格为述参考边界框所属的网格,该相邻边界框不包括该参考边界框;确定单元,用于根据该目标边界框的得分确定目标检测结果。
在一个可选的示例中,该装置还包括排序单元,具体用于:按照该边界框的得分大小对该边界框进行排序,获得该边界框对应的排序编号。
在一个可选的示例中,排序单元,具体用于:按照得分大小对该边界框进行降序排序,得分越小的边界框对应的排序编号越大。
在一个可选的示例中,遍历单元具体用于:获取多个边界框中的排序编号为i的边界框作为参考边界框,同时获取其标识位;在该参考边界框的标识位为第一标识值的情况下,获取该参考边界框的相邻边界框,并判定该相邻边界框的排序编号是否大于i;在确定该相邻边界框的排序编号大于i的情况下,计算该参考边界框与该相邻边界框的交并比;在该交并比大于预设阈值的情况下,将该相邻边界框的标识位置为第二标识值;获取该标识位为该第一标识值的边界框作为目标边界框。
在一个可选的示例中,多个边界框的尺寸不同,划分单元具体用于:按照该多个边界框的尺寸中的最大尺寸对该目标图像划分得到多个网格。
在一个可选的示例中,多个边界框的尺寸相同,划分单元具体用于:按照该多个边界框的尺寸对该目标图像划分得到多个网格。
在一个可选的示例中,在确定多个边界框所属的网格方面,划分单元具体用于:确定目标坐标点,该目标坐标点为该边界框上或该边界框内的任一个坐标点;将该目标坐标点所属的网格确定为该边界框所属的网格。
在一个可选的示例中,目标坐标点包括:边界框的右上角坐标点,边界框的左上角坐标点,边界框的右下角坐标点,边界框的左下角坐标点或边界框的中心坐标点中的任一个。
在一个可选的示例中,在确定多个边界框所属的网格之后,划分单元还用于:根据该边界框所属的网格,建立该网格对应的索引队列,该索引队列中包括至少一个该边界框的排序编号;
在获取参考边界框的相邻边界框方面,遍历单元还用于:按照该索引队列从目标网格和该目标网格的相邻网格中获取相邻边界框。
在一个可选的示例中,排序单元还用于:在对该边界框按照其对应得分大小进行排序之前,确定该多个边界框为得分大于预设得分的多个边界框。
在一个可选的示例中,确定单元具体用于:根据得分大于预设得分的目标边界框确定目标检测结果。
第三方面,本申请实施例提供了一种装置,该装置包括:
处理器和传输接口;
该处理器调用该存储器中存储的该可执行程序代码,使得该装置执行第一方面该的任一方法。
在一个可选的示例中,该装置还包括:该存储器,与该处理器耦合。
在一个可选的示例中,该装置还包括:图像传感器,用于获取该目标图像。
第四方面,本发明实施例提供了一种计算机可读存储介质,该计算机存储介质包括程序指令,该程序指令在计算机上运行时,使该计算机执行如第一方面所述的任一方法。
第五方面,本申请实施例提供了一种包含指令的计算机程序产品,当其在计算机或处理器上运行时,使得该计算机或处理器执行如上述第一方面或者其任一种可能的实施方式中的方法。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A为本申请实施例提供的一种生成多个边界框的示意图;
图1B为本申请实施例中提供的另一种生成多个边界框的示意图;
图2为本申请实施例提供的一种目标检测方法流程示意图;
图3为本申请实施例提供的一种划分网格的示意图;
图4A为本申请实施例提供的一种网格划分过程示意图;
图4B为本申请实施例提供的一种确定边界框所属网格的示意图;
图4C为本申请实施例提供的一种网格相邻关系示意图;
图5为本申请实施例提供的一种遍历多个边界框并得到目标边界框的方法流程示意图;
图6为本申请实施例提供的一种网格中的索引队列示意图;
图7为本申请实施例提供的一种目标检测装置结构示意图;
图8为本发明实施例提供的一种装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案说明。
本申请的说明书实施例和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在使用深度学习检测网进行目标检测时,根据在目标图像生成的bbox框的得分和位置确定目标物体的置信度和位置。为了避免对目标物体的漏检,在生成bbox框时,bbox框的位置排布会比较密,因此会导致在同一个目标物体上出现多个边界框的情况,请参阅图1A,图1A为本申请实施例提供的一种生成多个边界框的示意图,如图1A中的(a)所示,在人脸图像上生成了3个bbox框,每个bbox框对应的得分不同。为了从众多重叠框中选出最优框,NMS算法被引入,用来抑制低得分框,筛选出目标物体上如图1A中的(b)所示的得分最高的bbox作为最优框。最后根据最优框确定目标物体的位置,并确定目标物体为人脸图像的置信度为0.98。
或者,请参阅图1B,图1B为本申请实施例中提供的另一种生成多个边界框的示意图,如图1B中的(c)所示,分别在2个人脸上各自生成了3个bbox框,根据NMS算法,抑制低分框后,筛选出2个最优框。最后根据2个最优框分别确定了两个目标物体的位置,以及两个目标物体为人脸图像的置信度分别为0.93和0.80。
在传统方法中,在采用NMS算法抑制低得分边界框并获得最优框的过程时,首先将所有的bbox框按照得分高低进行降序排序,然后经过多次IOU计算筛选出最优框。
上述多次IOU计算的具体流程如下:
(1)选取目标图像上得分最高的bbox框记为S_bbox。
(2)用S_bbox与排在其后的所有框依次进行IOU计算,IOU计算公式如下:
IOU=(A1∩A2)/(A1∪A2)
其中A1和A2分别表示参与IOU计算的两个框的面积,如果IOU大于设定的阈值T,则表示该框被S_bbox抑制,将该框从排序队列中删除。
(3)如果所选取的S_bbox不是排序队列中最后一个bbox框,则选取紧排其后的一个框为S_bbox,重复步骤(2)。
从NMS算法原理中可以看出,每个被选取S_bbox都要与排在其后所有的框做IOU计算,最坏情况下算法复杂度为O(N^2),所以当bbox框的个数增多时,耗时会幂次倍增加,NMS耗时增加会导致检测帧率降低,严重影响算法检测效果。
为了解决上述问题,请参阅图2,图2为本申请实施例提供的一种目标检测方法流程示意图,如图2所示,该方法包括如下步骤:
201、获取目标图像上多个边界框及所述多个边界框的得分,所述得分用于表征所述边界框中包含目标对象的置信度。
目标图像是指需要进行目标检测的图像,可以是输入设备直接输入的图像作为目标图像,也可以是输入设备输入的图像中,根据用户设置的尺寸或范围确定的部分图像作为目标图像。与传统的NMS算法过程相同,首先获取在目标图像上生成的多个边界框及其得分,边界框的得分表示边界框中包含目标对象的置信度,可以为0~1之间的任意值。
202、对所述目标图像进行划分得到多个网格,并确定所述多个边界框所属的网格。
对目标图像进行划分获得多个网格,每个网格对应部分目标图像。网格的划分可以是随机的,也可以根据目标图像的形状和尺寸划分,还可以根据边界框的位置或大小来划分。请参阅图3,图3为本申请实施例提供的一种划分网格的示意图,如图3中的(a)所示,根据目标图像的形状和尺寸划分出多个网格,使得生成的网格数量刚好完全覆盖完整的目标图像;或者如图3中的(b)所示,根据目标图像中的边界框的位置划分网格,使得生成的网格完全覆盖边界框,而没有生成边界框的位置则没有划分网格。完成网格划分后,根据多个边界框生成的位置可以确定每个边界框属于的网格。
在进行网格划分时,可以按照非固定尺寸划分,即目标图像上划分的多个网格具有不同的宽和高。也可以按照固定尺寸划分网格,即目标图像上划分的多个网格具有相同的宽和高。
在按照固定尺寸划分网格时,可以是在确定目标图像尺寸和网格个数的情况下确定网格的固定尺寸;也可以是在确定目标图像尺寸和网格固定尺寸的情况下确定划分的网格个数。对于前一种情况,例如已知目标图像尺寸为3cm*2cm,网格个数为3*2,可知网格的固定尺寸为1cm*1cm;或者已知网格个数为3*4,那么网格的固定尺寸为1cm*0.5cm;对于后一种情况,例如已知目标图像尺寸为8cm*6cm,网格尺寸为2cm*2cm,那么横向网格数量Nw=ceil(8cm/2cm)=4个,纵向网格数量Nh=ceil(6cm/2cm)=3个,网格总个数为4*3=12个。其中,计算网格数量时采用ceil函数表示向上取整,即对于目标图像中最后不能满足一个网格尺寸大小的图像也生成一个网格。在一些情况下,计算网格数量时也可以采用floor函数向下取整,还可以采用round函数四舍五入取整;因为小于一个网格大小的图像中生成边界框的概率较低,或者生成边界框对应的得分也会较低,可以省略对这部分目标图像中的边界框的重叠度计算。
可选的,多个边界框的尺寸不同,对目标图像进行划分得到多个网格,包括:按照多个边界框的尺寸中的最大尺寸对目标图像划分得到多个网格。
多个边界框的尺寸不同,是指多个边界框具有不同的宽和高。在按照固定尺寸划分网格时,如果多个边界框的尺寸不同,可以将多个边界框的尺寸中的最大尺寸作为划分网格的固定尺寸。这样可以是使得获取参考边界框的相邻边界框时,能够涵盖所有相邻边界框。
可选的,多个边界框的尺寸相同,对目标图像进行划分得到多个网格,包括:按照多个边界框的尺寸对目标图像划分得到多个网格。
多个边界框的尺寸相同,是指多个边界框具有相同的宽和高。在按照固定尺寸划分网格时,如果多个边界框的尺寸相同,可以将多个边界框的尺寸作为划分网格的固定尺寸。
具体地,请参阅图4A,图4A为本申请实施例提供的一种网格划分过程示意图,如图4A所示,获取目标图像的高度H和宽度W,然后按照边界框的高度Hb和宽度Wb作为划分网格的固定尺寸。示例性的,宽度方向上网格个数为Nw=ceil(W/Wb),高度方向上网格个数为Nh=ceil(H/Hb)。ceil表示向上取整,图4A中右边的每个小格即为划分的网格。
可选的,确定多个边界框所属的网格包括:确定目标坐标点,目标坐标点为边界框上或边界框内的任一个坐标点;将目标坐标点所属的网格确定为边界框所属的网格。
可选的,目标坐标点包括:边界框的右上角坐标点,边界框的左上角坐标点,边界框的右下角坐标点,边界框的左下角坐标点或边界框的中心坐标点中的任一个。
完成对目标图像的网格划分后,根据多个边界框所在的位置确定边界框所属的网格。边界框有一定面积,边界框的不同位置可能位于不同的网格中。可以以边界框上,或者边界框内部任意一个坐标点所属的网格确定边界框所属的网格。或者,确定边界框上或边界框内的多个坐标点所属的网格,然后按照多个坐标点中个数最多的坐标点所属的网格确定边界框所属的网格。
以边界框上或边界框内任意一个坐标点所属的网格确定边界框所属的网格为例,请参阅图4B,图4B为本申请实施例提供的一种确定边界框所属网格的示意图,如图4B所示,首先为生成的网格进行编号,然后确定每个边界框所属的网格编号。以得分为0.84的边界框为例,假设该边界框左上角坐标点为(Xmin,Ymax),确定边界框所属网格编号可以采用如下公式:
Iw=floor(Xmin/Wb)
Ih=floor(Ymax/Hb)
其中Iw表示边界框在宽度上对应的网格序号,Ih表示边界框在高度上对应的网格序号,即根据左上角坐标点所属的网格确定边界框所属的网格编号为R_Ih_Iw。
可以看出图4B中的网格从0开始排序,因此上述确定边界框所属网格的公式采用floor函数向下取整。当网格从1开始排序时,确定边界框所属网格的公式可以采用ceil函数向上取整。
同样的,也可以获取边界框右上角坐标点(Xmax,Ymax),或右下角坐标点(Xmax,Ymin),或中心坐标点(Xmed,Ymed),然后根据上述公式计算这些坐标点所属的网格,进而确定边界框所属的网格。
203、遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框;所述参考边界框为所述多个边界框中的任一个,所述相邻边界框包括属于目标网格的边界框以及属于所述目标网格的相邻网格的边界框,所述目标网格为述参考边界框所属的网格,所述相邻边界框不包括所述参考边界框。
确定每个边界框所属的网格之后,即可根据边界框所属的网格以及网格之间的关系确定边界框之间的关系。在本申请实施例中,边界框之间的关系主要指相邻或不相邻的关系。
可选情况下,可以根据目标网格的八邻域网格确定目标网格的相邻网格。网格的八邻域网格是指所有与网格有边或顶点重合的网格。请参阅图4C,图4C为本申请实施例提供的一种网格相邻关系示意图,如图4C中的(a)所示,以网格R_1_1为目标网格,填充网格即为目标网格的八邻域网格,也即目标网格的相邻网格。
可选情况下,可以根据目标网格的四邻域网格确定目标网格的相邻网格。网格的四邻域网格是指所有与网格有边重合的网格。如图4C中的(b)所示,填充网格即为目标网格R_1_1的四邻域网格,也即目标网格的相邻网格。
可选情况下,可以根据与目标网格的中心距离确定目标网格的相邻网格。例如可以将中心与目标网格的中心距离不大于预设距离的网格作为目标网格的相邻网格,预设距离可以是目标网格的边长,或者等于目标网格的多倍边长,或者其他值。例如图4C中的(c),假设预设距离为目标网格R_1_1的边长,网格R_0_1,R_1_0,R_1_2和R_2_1的中心与目标网格的中心之间的距离等于预设距离,满足中心与网格的中心距离不大于预设距离的条件,因此这四个网格为目标网格的相邻网格。
确定目标网格的相邻网格后,即可确定参考边界框的相邻边界框。与参考边界框位于同一网格的边界框,以及位于参考边界框的相邻网格的边界框,都为参考边界框的相邻边界框。其中,参考边界框的相邻边界框不包括其自身。
可选的,在遍历多个边界框之前,方法还包括:对边界框按照其得分大小进行排序,获得边界框对应的排序编号。
在目标图像上生成多个边界框后,每个边界框还有其对应得分,边界框的得分可能是0~1之间的任意值,用来表示边界框中包含待检测的目标对象的置信度。因为高得分的边界框会对低得分的边界框进行抑制,那么按照得分大小对边界框进行排序,获得边界框对应的排序编号后,按照排序编号对边界框进行遍历时,可以根据参考边界框和相邻边界框各自的排序编号确定参考边界框是否需要与相邻边界框进行重叠度计算,可以有效提高遍历效率。
可以按照分数由大到小进行降序排列,即分数越高,对应边界框的排序编号越小;也可以按照分数由小到大进行升序排列,即分数越高,对应边界框的排序编号越大。以降序排列为例,如图1B中的多个边界框,其对应的排序编号如表1所示:
表1
排序编号 | 边界框得分 |
1 | 0.93 |
2 | 0.84 |
3 | 0.80 |
4 | 0.62 |
5 | 0.51 |
6 | 0.31 |
可选的,在对边界框按照其对应得分大小进行排序之前,方法还包括:确定多个边界框为得分大于预设得分的多个边界框。
在上述过程中,在目标图像上生成了边界框以及边界框对应的得分。这些得分为0~1之间的任意值,但是,当边界框的得分小于预设得分时,边界框中包含待检测的目标对象的置信度十分低,那么这些边界框即使没有被抑制,也不能用来确定该边界框中包含目标对象。因此,可以直接筛选掉得分低于预设得分的边界框。例如预设得分可以为0.8,那么图1B中筛选掉得分为0.61,0.51和0.31的边界框,仅保留得分为0.93、0.84和0.80的边界框。其对应的排序编号如表2所示:
表2
排序编号 | 边界框得分 |
1 | 0.93 |
2 | 0.84 |
3 | 0.80 |
这个过程可以有效减少后续进行重叠度计算的数据量,提升了目标检测效率。完成上述全部或部分步骤后,即可遍历多个边界框并得出目标边界框,请参阅图5,图5为本申请实施例提供的一种遍历多个边界框并得到目标边界框的方法流程示意图,具体包括如下步骤:
501、多个边界框为N个边界框,将N个边界框的标识位初始化为0;
502、将i置为0;
503、获取排序编号为i的边界框作为参考边界框,同时获取其标识位;在参考边界框的标识位为1的情况下,执行步骤504;在参考边界框的标识位为0的情况下,执行步505;
504、将i递增1,并确定i是否小于N;确定i小于N时,执行步骤503;在确定i不小于N时,执行步骤511;
505、获取参考边界框的相邻边界框;
506、判定相邻边界框的排序编号是否大于i,若是,执行步骤507,若否,执行步骤509;
507、计算参考边界框与相邻边界框的交并比,确定交并比是否大于预设阈值,若否,执行步骤509;若是,执行步骤508;
508、将相邻边界框的标识位置为1,执行步骤509;
509、确定该相邻边界框是否为参考边界框的最后一个相邻边界框,若是执行步骤504,若否,执行步骤510;
510、选择下一个相邻边界框,执行步骤506;
511、结束遍历,获取标识位为0的边界框作为目标边界框。
在这个过程中,N为从目标图像上获取的多个边界框总个数。将边界框的标识位用来表征边界框是否被抑制,其中第一标识值用来表示边界框未被抑制,第二标识值用来表示边界框被抑制。初始状态时,所有边界框的标识位都被置为第一标识值,在如图5的示例中,第一标识值为0,表示所有边界框都未被抑制。应当理解,边界框的初始标识位也可以为其他值或者字符。进一步的,按照边界框的排序编号顺序获取参考边界框,如图5的示例中,边界框从0开始排序编号,那么首先将i置为0,然后获取排序编号为0的边界框作为第一个参考边界框。如果边界框从1开始排序编号,那么首先将i置为1,然后获取排序编号为1的边界框作为第一个参考边界框。即是说,i的初始值由边界框第一个排序编号确定。然后获取参考边界框的标识位,第一个参考边界框的标识位为0,获取参考边界框的相邻边界框,并计算参考边界框与相邻边界框的重叠度,其中重叠度表示参考边界框与相邻边界框的重叠面积所占的比率,可以是重叠面积占参考边界框面积的比率,也可以是重叠面积占相邻边界框面积的比率,还可以是重叠面积占参考边界框和相邻边界框合并面积的比率。重叠度可以通过交并比来体现,即通过IOU计算公式来计算,如果IOU的值大于预设阈值,说明相邻边界框被参考边界框抑制,将相邻边界框的标识位置为第二标识值,在如图5的示例中第二标识值为1。然后获取参考边界框的下一个相邻边界框,在相邻边界框的排序编号大于参考边界框的排序编号,且相邻边界框的标识位为第一标识值的情况下,对参考边界框和相邻边界框同样进行IOU计算,直到确定参考边界框的相邻边界框全部进行了IOU计算并做了相应的标识位修改。根据边界框的排序编号选择下一个边界框作为参考边界框继续进行参考边界框与相邻边界框的重叠度计算,直到完成对第N个排序编号的边界框的遍历。从另一方面来说,因为第N个排序编号的边界框不会有排序编号比它更大的相邻边界框,可以省略对第N个排序编号的边界框的遍历过程,因此也可以在遍历完第N-1个边界框后结束遍历。
遍历完多个边界框之后,主要是对多个边界框的标识位进行了修改,使得一些被抑制的边界框的标识位被修改为1,而未被抑制的边界框的标识位保持为0。标识位为0的边界框作为目标边界框,即目标边界框为多个边界框中未被抑制的边界框。
可选的,在确定多个边界框所属的网格之后,方法还包括:根据边界框所属的网格,建立网格对应的索引队列,索引队列中包括至少一个边界框的排序编号;获取参考边界框的相邻边界框包括:按照索引队列从目标网格和目标网格的相邻网格中获取相邻边界框。
在上述过程中,在确定了边界框所述的网格之后,在对多个边界框进行遍历之前,还可以对网格中所属的边界框建立索引队列,索引队列的顺序可以根据边界框的排序编号确定。请参阅图6,图6为本申请实施例提供的一种网格中的索引队列示意图,如图6所示,按照边界框的排序编号依次确定每个边界框所属的网格,在确定了边界框属于目标网格后,将边界框的排序编号加入网格对应的索引队列中。图6中生成了网格R_1_0,R_1_2和R_2_2的索引队列,索引队列中包括一个或多个边界框的排序编号,排序编号顺序排列,索引队列中还可以包括每个排序编号对应的边界框的得分。生成网格中包含的边界框的索引队列后,在遍历多个边界框,获取参考边界框对应的相邻边界框时,可以按照参考边界框所属的目标网格,以及目标网格的相邻网格各自对应的索引队列顺序获取相邻边界框。
205、根据所述目标边界框的得分确定目标检测结果。
根据上述步骤获得的目标边界框没有被其他边界框抑制,可以用来确定目标检测结果。如图1B中的(d)所示,0.93和0.80对应的边界框即为目标边界框,根据目标边界框的得分确定目标检测结果,即是说,目标边界框的得分表明该边界框圈定范围内包括目标对象的置信度,置信度越大,说明包括目标对象的概率越大。例如本申请实施例中目标检测对应的目标对象为人脸图像,目标边界框1得分为0.80,表示目标边界框1范围内包括人脸图像的置信度为0.80,得到的目标检测结果可以是:目标边界框1包括人脸图像的概率为80%。如果预先设定了当边界框得分大于0.7时,可确定边界框中包括目标对象,那么得到的目标检测结果可以是:目标边界框1中包括人脸图像。
可选的,根据目标边界框的得分确定目标检测结果,包括:根据得分大于预设得分的目标边界框确定目标检测结果。
如果遍历多个边界框后得到多个目标边界框,且包括得分小于预设得分的目标边界框,这些目标边界框用来确定目标检测结果时,边界框内包括目标对象的概率低于要求的概率,可以直接筛选掉这些目标边界框,而只根据得分大于预设得分的目标边界框来确定目标检测结果,提升目标检测结果生成的效率。或者,也可以根据得分等于预设得分的目标边界框来确定目标检测结果。
可见,在本申请实施例中,对目标图像进行划分得到多个网格;根据网格划分结果确定多个边界框对应的相邻边界框;然后遍历多个边界框,计算获得多个边界框中未被相邻边界框抑制的目标边界框,最后根据目标边界框的得分确定目标检测结果。在这个过程中,通过确定多个边界框所属网格,进而确定边界框的相邻边界框,使得在遍历边界框时,只需要计算边界框与相邻边界框的重叠度,极大减少了数据处理量,提升了数据处理效率,进而提升了目标检测效率。
参见图7,为本申请实施例提供的一种目标检测装置,如图7所示,所述装置700包括:
获取单元701,用于获取目标图像上多个边界框及所述多个边界框的得分,所述得分用于表征所述边界框中包含目标对象的置信度;
划分单元702,用于对所述目标图像进行划分得到多个网格,并确定所述多个边界框所属的网格;
遍历单元703,用于遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框;所述参考边界框为所述多个边界框中的任一个,所述相邻边界框包括属于目标网格的边界框以及属于所述目标网格的相邻网格的边界框,所述目标网格为述参考边界框所属的网格,所述相邻边界框不包括所述参考边界框;
确定单元704,用于根据所述目标边界框的得分确定目标检测结果。
本申请实施例中所提供的装置,目标图像进行划分得到多个网格;根据网格划分结果确定多个边界框对应的相邻边界框;然后遍历多个边界框,计算获得多个边界框中未被相邻边界框抑制的目标边界框,最后根据目标边界框的得分确定目标检测结果。在这个过程中,通过确定多个边界框所属网格,进而确定边界框的相邻边界框,使得在遍历边界框时,只需要计算边界框与相邻边界框的重叠度,极大减少了数据处理量,提升了数据处理效率,进而提升了目标检测效率。
在一个可选的示例中,所述装置还包括排序单元705,具体用于:
按照所述边界框的得分大小对所述边界框进行排序,获得所述边界框对应的排序编号。
在一个可选的示例中,所述排序单元705具体用于:
按照得分大小对所述边界框进行降序排序,得分越小的边界框对应的排序编号越大。
在一个可选的示例中,所述遍历单元703具体用于:
获取所述多个边界框中的排序编号为i的边界框作为参考边界框,同时获取其标识位;
在所述参考边界框的标识位为第一标识值的情况下,获取所述参考边界框的相邻边界框,并判定所述相邻边界框的排序编号是否大于i;
在确定所述相邻边界框的排序编号大于i的情况下,计算所述参考边界框与所述相邻边界框的交并比;
在所述交并比大于预设阈值的情况下,将所述相邻边界框的标识位置为第二标识值;
获取所述标识位为所述第一标识值的边界框作为目标边界框。
在一个可选的示例中,所述多个边界框的尺寸不同,所述划分单元702具体用于:
按照所述多个边界框的尺寸中的最大尺寸对所述目标图像划分得到多个网格。
在一个可选的示例中,所述多个边界框的尺寸相同,所述划分单元702具体用于:
按照所述多个边界框的尺寸对所述目标图像划分得到多个网格。
在一个可选的示例中,在确定所述多个边界框所属的网格方面,所述划分单元702具体用于:
确定目标坐标点,所述目标坐标点为所述边界框上或所述边界框内的任一个坐标点;
将所述目标坐标点所属的网格确定为所述边界框所属的网格。
在一个可选的示例中,所述目标坐标点包括:
所述边界框的右上角坐标点,所述边界框的左上角坐标点,边界框的右下角坐标点,边界框的左下角坐标点或边界框的中心坐标点中的任一个。
在一个可选的示例中,在确定所述多个边界框所属的网格之后,所述划分单元702还用于:
根据所述边界框所属的网格,建立所述网格对应的索引队列,所述索引队列中包括至少一个所述边界框的排序编号;
在所述获取所述参考边界框的相邻边界框方面,所述遍历单元703还用于:
按照所述索引队列从目标网格和所述目标网格的相邻网格中获取相邻边界框。
在一个可选的示例中,所述排序单元705还用于:
在对所述边界框按照其对应得分大小进行排序之前,确定所述多个边界框为得分大于预设得分的多个边界框。
在一个可选的示例中,所述确定单元704具体用于:
根据得分大于预设得分的目标边界框确定目标检测结果。
本申请另外一种实施例,参见图8,装置800包括至少一个处理器801,至少一个存储器802以及至少一个通信接口803,还包括图像传感器804和显示器805。所述处理器801、所述存储器802、所述通信接口803、所述图像传感器804和显示器805通过所述通信总线连接并完成相互间的通信。
装置800可用于智能门禁,智慧安防等智能设备中。装置800可以通过图像传感器804采集图像,或者由通信接口803连接其他通信设备或者可读存储器获取图像数据,传输给处理器801进行目标检测,检测结果一般会做后处理(比如:结果分类,打分,筛选,识别等),然后将最终结果输出给显示器805显示或者存储到存储器802中。
处理器801可以是通用中央处理器(central processing unit,CPU),图形处理器(graphics processing unit,GPU),微处理器,特定应用集成电路(application-specificintegrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
通信接口803,用于与其他设备或通信网络进行光纤通信。
存储器802可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器802用于存储执行以上方案的应用程序代码以及程序执行结果,并由处理器801来控制执行。所述处理器801用于执行所述存储器802中存储的应用程序代码。
存储器802存储的代码可执行以上提供的目标检测方法,比如:
获取目标图像上多个边界框及所述多个边界框的得分,所述得分用于表征所述边界框中包含目标对象的置信度;
对所述目标图像进行划分得到多个网格,并确定所述多个边界框所属的网格;
遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框;所述参考边界框为所述多个边界框中的任一个,所述相邻边界框包括属于目标网格的边界框以及属于所述目标网格的相邻网格的边界框,所述目标网格为述参考边界框所属的网格,所述相邻边界框不包括所述参考边界框;
根据所述目标边界框的得分确定目标检测结果。
本申请实施例中的装置800,具体还可以是复杂可编程逻辑器件(ComplexProgrammable Logic Device,CPLD)、现场可编程门阵列(Field-Programmable GateArray,FPGA)等实现,本申请实施例对此不作限定。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述任一个方法中的一个或多个步骤。上述信号处理装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中。
基于这样的理解,本申请实施例还提供一种包含指令的计算机程序产品,当其在计算机或处理器上运行时,使得计算机或处理器执行本申请实施例提供的任一个方法。本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备或其中的处理器执行本申请各个实施例所述方法的全部或部分步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器如前述存储器802,此处不再赘述。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上上述,本说明书内容不应理解为对本申请的限制。
Claims (23)
1.一种目标检测方法,其特征在于,所述方法包括:
获取目标图像上多个边界框及所述多个边界框的得分,所述得分用于表征所述边界框中包含目标对象的置信度;
对所述目标图像进行划分得到多个网格,并确定所述多个边界框所属的网格;
遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框;所述参考边界框为所述多个边界框中的任一个,所述相邻边界框包括属于目标网格的边界框以及属于所述目标网格的相邻网格的边界框,所述目标网格为述参考边界框所属的网格,所述相邻边界框不包括所述参考边界框;
根据所述目标边界框的得分确定目标检测结果。
2.根据权利要求1所述的方法,其特征在于,在遍历所述多个边界框之前,所述方法还包括:
按照所述边界框的得分大小对所述边界框进行排序,获得所述边界框对应的排序编号。
3.根据权利要求2所述的方法,其特征在于,所述按照所述边界框的得分大小对所述边界框进行排序,具体包括:
按照得分大小对所述边界框进行降序排序,得分越小的边界框对应的排序编号越大。
4.根据权利要求3所述的方法,其特征在于,所述遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框,包括:
获取所述多个边界框中的排序编号为i的边界框作为参考边界框,同时获取其标识位;
在所述参考边界框的标识位为第一标识值的情况下,获取所述参考边界框的相邻边界框,并判定所述相邻边界框的排序编号是否大于i;
在确定所述相邻边界框的排序编号大于i的情况下,计算所述参考边界框与所述相邻边界框的交并比;
在所述交并比大于预设阈值的情况下,将所述相邻边界框的标识位置为第二标识值;
获取所述标识位为所述第一标识值的边界框作为目标边界框。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述多个边界框的尺寸不同,所述对所述目标图像进行划分得到多个网格,包括:
按照所述多个边界框的尺寸中的最大尺寸对所述目标图像划分得到多个网格。
6.根据权利要求1-4任一项所述的方法,其特征在于,所述多个边界框的尺寸相同,所述对所述目标图像进行划分得到多个网格,包括:
按照所述多个边界框的尺寸对所述目标图像划分得到多个网格。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述确定所述多个边界框所属的网格包括:
确定目标坐标点,所述目标坐标点为所述边界框上或所述边界框内的任一个坐标点;
将所述目标坐标点所属的网格确定为所述边界框所属的网格。
8.根据权利要求7所述的方法,其特征在于,所述目标坐标点包括:
所述边界框的右上角坐标点,所述边界框的左上角坐标点,边界框的右下角坐标点,边界框的左下角坐标点或边界框的中心坐标点中的任一个。
9.根据权利要求2-8任一项所述的方法,其特征在于,在确定所述多个边界框所属的网格之后,所述方法还包括:
根据所述边界框所属的网格,建立所述网格对应的索引队列,所述索引队列中包括至少一个所述边界框的排序编号;
所述获取所述参考边界框的相邻边界框包括:
按照所述索引队列从目标网格和所述目标网格的相邻网格中获取相邻边界框。
10.根据权利要求2-9任一项所述的方法,其特征在于,在按照所述边界框的得分大小对所述边界框进行排序之前,所述方法还包括:
确定所述多个边界框为得分大于预设得分的多个边界框。
11.根据权利要求1-9任一项所述的方法,其特征在于,根据所述目标边界框的得分确定目标检测结果,包括:
根据得分大于预设得分的目标边界框确定目标检测结果。
12.一种目标检测装置,其特征在于,所述装置包括:
获取单元,用于获取目标图像上多个边界框及所述多个边界框的得分,所述得分用于表征所述边界框中包含目标对象的置信度;
划分单元,用于对所述目标图像进行划分得到多个网格,并确定所述多个边界框所属的网格;
遍历单元,用于遍历所述多个边界框,计算参考边界框与相邻边界框的重叠度,并根据所述重叠度得到目标边界框;所述参考边界框为所述多个边界框中的任一个,所述相邻边界框包括属于目标网格的边界框以及属于所述目标网格的相邻网格的边界框,所述目标网格为述参考边界框所属的网格,所述相邻边界框不包括所述参考边界框;
确定单元,用于根据所述目标边界框的得分确定目标检测结果。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括排序单元,具体用于:
按照所述边界框的得分大小对所述边界框进行排序,获得所述边界框对应的排序编号。
14.根据权利要求13所述的装置,其特征在于,所述排序单元,具体用于:
按照得分大小对所述边界框进行降序排序,得分越小的边界框对应的排序编号越大。
15.根据权利要求14所述的装置,其特征在于,所述遍历单元具体用于:
获取所述多个边界框中的排序编号为i的边界框作为参考边界框,同时获取其标识位;
在所述参考边界框的标识位为第一标识值的情况下,获取所述参考边界框的相邻边界框,并判定所述相邻边界框的排序编号是否大于i;
在确定所述相邻边界框的排序编号大于i的情况下,计算所述参考边界框与所述相邻边界框的交并比;
在所述交并比大于预设阈值的情况下,将所述相邻边界框的标识位置为第二标识值;
获取所述标识位为所述第一标识值的边界框作为目标边界框。
16.根据权利要求12-15任一项所述的装置,其特征在于,所述多个边界框的尺寸不同,所述划分单元具体用于:
按照所述多个边界框的尺寸中的最大尺寸对所述目标图像划分得到多个网格。
17.根据权利要求12-15任一项所述的装置,其特征在于,所述多个边界框的尺寸相同,所述划分单元具体用于:
按照所述多个边界框的尺寸对所述目标图像划分得到多个网格。
18.根据权利要求12-17任一项所述的装置,其特征在于,所述划分单元具体用于:
确定目标坐标点,所述目标坐标点为所述边界框上或所述边界框内的任一个坐标点;
将所述目标坐标点所属的网格确定为所述边界框所属的网格。
19.根据权利要求18所述的装置,其特征在于,所述目标坐标点包括:
所述边界框的右上角坐标点,所述边界框的左上角坐标点,边界框的右下角坐标点,边界框的左下角坐标点或边界框的中心坐标点中的任一个。
20.根据权利要求13-19任一项所述的装置,其特征在于,在确定所述多个边界框所属的网格之后,所述划分单元还用于:
根据所述边界框所属的网格,建立所述网格对应的索引队列,所述索引队列中包括至少一个所述边界框的排序编号;
在所述获取所述参考边界框的相邻边界框方面,所述遍历单元还用于:
按照所述索引队列从目标网格和所述目标网格的相邻网格中获取相邻边界框。
21.根据权利要求12-20任一项所述的装置,其特征在于,所述排序单元还用于:
在对所述边界框按照其对应得分大小进行排序之前,确定所述多个边界框为得分大于预设得分的多个边界框。
22.根据权利要求11-20所述的装置,其特征在于,所述确定单元具体用于:
根据得分大于预设得分的目标边界框确定目标检测结果。
23.一种装置,其特征在于,包括:处理器和传输接口;
所述处理器调用存储器中存储的可执行程序代码,以执行如权利要求1-11任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911026844.2A CN112711972B (zh) | 2019-10-26 | 2019-10-26 | 一种目标检测方法及装置 |
PCT/CN2020/108964 WO2021077868A1 (zh) | 2019-10-26 | 2020-08-13 | 一种目标检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911026844.2A CN112711972B (zh) | 2019-10-26 | 2019-10-26 | 一种目标检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112711972A true CN112711972A (zh) | 2021-04-27 |
CN112711972B CN112711972B (zh) | 2024-06-14 |
Family
ID=75541559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911026844.2A Active CN112711972B (zh) | 2019-10-26 | 2019-10-26 | 一种目标检测方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112711972B (zh) |
WO (1) | WO2021077868A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705643A (zh) * | 2021-08-17 | 2021-11-26 | 荣耀终端有限公司 | 一种目标物检测方法、装置以及电子设备 |
US20220083819A1 (en) * | 2019-11-15 | 2022-03-17 | Salesforce.Com, Inc. | Image augmentation and object detection |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2593462B (en) * | 2020-03-20 | 2022-03-30 | Imagination Tech Ltd | Apparatus and method for processing detection boxes |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145756A (zh) * | 2018-07-24 | 2019-01-04 | 湖南万为智能机器人技术有限公司 | 基于机器视觉和深度学习的目标检测方法 |
US20190050981A1 (en) * | 2017-08-09 | 2019-02-14 | Shenzhen Keya Medical Technology Corporation | System and method for automatically detecting a target object from a 3d image |
CN109883400A (zh) * | 2018-12-27 | 2019-06-14 | 南京国图信息产业有限公司 | 基于yolo-sitcol的固定站自动目标检测与空间定位方法 |
CN110059548A (zh) * | 2019-03-08 | 2019-07-26 | 北京旷视科技有限公司 | 目标检测方法及装置 |
CN110084173A (zh) * | 2019-04-23 | 2019-08-02 | 精伦电子股份有限公司 | 人头检测方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9582895B2 (en) * | 2015-05-22 | 2017-02-28 | International Business Machines Corporation | Real-time object analysis with occlusion handling |
US10867393B2 (en) * | 2018-03-22 | 2020-12-15 | Texas Instruments Incorporated | Video object detection |
CN109117794A (zh) * | 2018-08-16 | 2019-01-01 | 广东工业大学 | 一种运动目标行为跟踪方法、装置、设备及可读存储介质 |
-
2019
- 2019-10-26 CN CN201911026844.2A patent/CN112711972B/zh active Active
-
2020
- 2020-08-13 WO PCT/CN2020/108964 patent/WO2021077868A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190050981A1 (en) * | 2017-08-09 | 2019-02-14 | Shenzhen Keya Medical Technology Corporation | System and method for automatically detecting a target object from a 3d image |
CN109145756A (zh) * | 2018-07-24 | 2019-01-04 | 湖南万为智能机器人技术有限公司 | 基于机器视觉和深度学习的目标检测方法 |
CN109883400A (zh) * | 2018-12-27 | 2019-06-14 | 南京国图信息产业有限公司 | 基于yolo-sitcol的固定站自动目标检测与空间定位方法 |
CN110059548A (zh) * | 2019-03-08 | 2019-07-26 | 北京旷视科技有限公司 | 目标检测方法及装置 |
CN110084173A (zh) * | 2019-04-23 | 2019-08-02 | 精伦电子股份有限公司 | 人头检测方法及装置 |
Non-Patent Citations (1)
Title |
---|
王 超 等: ""基于 YOLO v2 模型的交通标识检测算法"", 《计算机应用》, pages 276 - 278 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220083819A1 (en) * | 2019-11-15 | 2022-03-17 | Salesforce.Com, Inc. | Image augmentation and object detection |
US11710077B2 (en) * | 2019-11-15 | 2023-07-25 | Salesforce, Inc. | Image augmentation and object detection |
CN113705643A (zh) * | 2021-08-17 | 2021-11-26 | 荣耀终端有限公司 | 一种目标物检测方法、装置以及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2021077868A1 (zh) | 2021-04-29 |
CN112711972B (zh) | 2024-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112711972A (zh) | 一种目标检测方法及装置 | |
CN109523621B (zh) | 对象的加载方法和装置、存储介质、电子装置 | |
CN103473799B (zh) | 一种图片的动态处理方法及装置、终端设备 | |
CN108470174B (zh) | 障碍物分割方法及装置、计算机设备及可读介质 | |
US10424093B2 (en) | Computer-readable recording medium, computer apparatus, and computer processing method | |
CN107220647A (zh) | 一种叶片交叉条件下作物中心点定位方法及*** | |
US20210004721A1 (en) | Inspection system, discrimination system, and learning data generation device | |
CN111369688B (zh) | 一种结构化场景表达的认知导航方法及*** | |
CN112734900A (zh) | 阴影贴图的烘焙方法、装置、设备及计算机可读存储介质 | |
CN117058338A (zh) | 基于cad的三维建筑模型构建方法、***、设备及介质 | |
CN104239874B (zh) | 一种器官血管识别方法及装置 | |
CN103065306A (zh) | 图形数据的处理方法及装置 | |
KR102068745B1 (ko) | 그리드 맵을 복수개의 룸으로 구획하는 방법 및 장치 | |
CN113117334B (zh) | 目标点的可见区域的确定方法及相关装置 | |
CN113808192B (zh) | 一种户型图生成方法、装置、设备及存储介质 | |
CN115713600A (zh) | 自动驾驶场景的数字高程模型的生成方法和装置 | |
JP6947889B2 (ja) | プログラム、コンピュータ装置、及び、プログラム実行方法 | |
CN115019001A (zh) | 一种地质分析的显示处理方法、装置、设备及介质 | |
JP2021156879A (ja) | 破断面解析装置、破断面解析方法、及び、機械学習用データセットの生成方法 | |
CN113469968A (zh) | 一种卷烟包装盒盒缝高度差检测方法、装置及电子设备 | |
CN110738719A (zh) | 一种基于视距分层优化的Web3D模型渲染方法 | |
JP6100874B1 (ja) | プログラム、コンピュータ装置、及び、プログラム実行方法 | |
CN103247026B (zh) | 基于黄金分割比例的菱形模板双尺度图像去噪方法 | |
CN117786148B (zh) | 一种三维数字园区的数据组织和管理方法及*** | |
CN115457432B (zh) | 用于视频帧提取的数据处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 101, No. 2 Hongqiaogang Road, Qingpu District, Shanghai, 201721 Applicant after: Haisi Technology Co.,Ltd. Address before: Room 101, 318 Shuixiu Road, Jinze town (xicen), Qingpu District, Shanghai, 201799 Applicant before: Shanghai Haisi Technology Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant |