CN109255320A - 一种改进的非极大值抑制方法 - Google Patents

一种改进的非极大值抑制方法 Download PDF

Info

Publication number
CN109255320A
CN109255320A CN201811018713.5A CN201811018713A CN109255320A CN 109255320 A CN109255320 A CN 109255320A CN 201811018713 A CN201811018713 A CN 201811018713A CN 109255320 A CN109255320 A CN 109255320A
Authority
CN
China
Prior art keywords
rectangle frame
rectangle
maxima suppression
deleted
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811018713.5A
Other languages
English (en)
Other versions
CN109255320B (zh
Inventor
李宏亮
廖加竞
孙旭
刘玮
何慕威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201811018713.5A priority Critical patent/CN109255320B/zh
Publication of CN109255320A publication Critical patent/CN109255320A/zh
Application granted granted Critical
Publication of CN109255320B publication Critical patent/CN109255320B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种改进的非极大值抑制方法。本发明通过多次迭代筛选的方式进行抑制处理:对待处理的矩形框按照置信度从高到低排序,保留当前置信度最高的矩形框,然后依次遍历余下矩形框的与已保留的所有矩形框的重叠面积的总和占全图面积的比例是否大于阈值,若是,则将其删除;然后未删除和未保留的矩形框作为新的一轮待处理的矩形框继续进行上述抑制处理,直到待处理的矩形框只存在一个。本发明通过上述方式,解决了传统非极大值抑制方法对于不规则目标输出矩形框数量较少、重叠率较高、矩形框对目标的拟合度较低的技术问题。

Description

一种改进的非极大值抑制方法
技术领域
本发明属于目标检测技术领域,具体涉及在深度学习目标检测中一种改进的非极大值抑制方法。
背景技术
在深度学习目标检测中,通常都涉及到对输出结果(矩形框)进行非极大值抑制处理,以去除冗余重复框。但是传统的非极大值抑制方法用于不规则目标检测时存在以下3个问题:
(1)每次比较时,传统方法中当前选中的框仅与置信度最高的一个框进行比较。这样的方法对于规则目标可以起到减少矩形框数量,取得局部极大值的优点。然而,对于不规则目标的检测中,这样的方法得到的矩形框数量太少,无法充分拟合目标对象的形状;
(2)若仅仅是调低传统方法的阈值,虽然输出矩形框的数量会增多,但是又会引起矩形框之间重叠率较高的副作用;
(3)对于不规则目标,经常需要多个大小差异比较大的矩形框去拟合其形状,传统方法中与阈值进行比较时,计算的是两个框重叠面积占两个框总面积的比例。这样的方法受到矩形框面积影响比较大。较小的矩形框自身面积小,在这种方法中很容易被删除。
发明内容
本发明的发明目的在于:针对传统非极大值抑制方法对于不规则目标输出矩形框数量较少、重叠率较高、矩形框对目标的拟合度较低的技术问题,提出了一种改进的非极大值抑制方法。
本发明的改进的非极大值抑制方法包括下列步骤:
步骤S1:对待进行非极大值抑制的所有待处理矩形框按照置信度从高到低排序,得到第一集合T1;
步骤S2:将第一集合T1中的第一个元素放入第二集合T2,其中集合T2的初始值为空集;
步骤S3:判断第一集合T1的元素个数是否为1,若否,则删除第一集合T1中的第一个元素后,执行步骤S4;若是,则跳转到步骤S8;
步骤S4:依次遍历第一集合T1中的所有矩形框;
步骤S5:判断是否遍历完毕,若是,则跳转到步骤S2;否则执行步骤S6;
步骤S6:判断遍历的当前矩形框与第二集合T2中的所有矩形框的重叠面积的总和占全图面积的比例是否大于预设阈值(优选取值范围为:0.01~0.03),若是,则执行步骤S7;否则跳转到步骤S4;
其中,全图面积指待处理矩形框所在的待检测图像的全图面积。
深度学习目标检测网络的输入图像的面积;
步骤S7:从集合T1中删除遍历的当前矩形框,并跳转到步骤S4;
步骤S8:输出集合T1与T2的并集。
综上所述,由于采用了上述技术方案,与现有技术相比,本发明的有益效果是:
(1)通过调整步骤S6中的阈值,可以提高抑制处理后输出矩形框的数量,即将阈值调高,则可提高输出矩形框的数量;
(2)步骤S6中,将当前遍历的矩形框和已保留的所有矩形框进行比较计算,而传统非极大值抑制方法中当前矩形框只与置信度最高的一个矩形框进行比较,该改进方式使得输出的矩形框之间重叠率较低;
(3)步骤S6中,采用计算当前矩形框与所有已保留矩形框的重叠面积的总和占全图面积的比例,而传统非极大值抑制方法计算的是两个矩形框重叠面积占两个矩形框总面积的比例,本发明的改进方式减少了小框被删除的概率,增加了输出框之间的尺度差异,从而提高了矩形框对目标的拟合度因此提高了目标检测对于不规则目标的检测精度。
附图说明
图1是本发明的处理流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本发明作进一步地详细描述。
参见图1,本发明的具体处理步骤如下:
步骤S1:获取深度学习目标检测网络输出的所有矩形框,即待进行非极大值抑制的所有矩形框;
步骤S2:将所有矩形框按照置信度从高到低排序,得到第一集合T1;
步骤S3:将第一集合T1中的第一个元素(当前置信度最高的矩形框)放入第二集合T2(初始值为空集);
步骤S4:判断当前置信度最高的矩形框是否为第一集合T1的最后一个元素(即判断第一集合T1的元素个数是否为1),若否,则删除第一集合T1中的第一个元素(当前置信度最高的矩形框)后,执行步骤S5;若是,则跳转到步骤S9;
步骤S5:依次遍历第一集合T1中的所有矩形框;
步骤S6:判断是否遍历完毕,若是,则跳转到步骤S3;否则执行步骤S7;
步骤S7:判断遍历的当前矩形框与第二集合T2中的所有矩形框的重叠面积的总和占全图(输入深度学习目标检测网络的待检测图片)面积的比例是否大于0.02,若是,则执行步骤S8;否则跳转到步骤S5;
步骤S8:从集合T1中删除遍历的当前矩形框(即删除与第二集合T2中的所有矩形框的重叠面积的总和占全图面积的比例大于0.02的矩形框),并跳转到步骤S5;
步骤S9:输出所有未删除的矩形框,即输出集合T1与T2的并集。
以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。

Claims (3)

1.一种改进的非极大值抑制方法,其特征在于,包括下列步骤:
步骤S1:对待进行非极大值抑制的所有待处理矩形框按照置信度从高到低排序,得到第一集合T1;
步骤S2:将第一集合T1中的第一个元素放入第二集合T2,其中集合T2的初始值为空集;
步骤S3:判断第一集合T1的元素个数是否为1,若否,则删除第一集合T1中的第一个元素后,执行步骤S4;若是,则跳转到步骤S8;
步骤S4:依次遍历第一集合T1中的所有矩形框;
步骤S5:判断是否遍历完毕,若是,则跳转到步骤S2;否则执行步骤S6;
步骤S6:判断遍历的当前矩形框与第二集合T2中的所有矩形框的重叠面积的总和占全图面积的比例是否大于预设阈值,若是,则执行步骤S7;否则跳转到步骤S4;
步骤S7:从集合T1中删除遍历的当前矩形框,并跳转到步骤S4;
步骤S8:输出集合T1与T2的并集。
2.如权利要求1所述的方法,其特征在于,步骤S6中,预设阈值的优选取值范围为:0.01~0.03。
3.如权利要求2所述的方法,其特征在于,步骤S6中,预设阈值的优选取值0.02。
CN201811018713.5A 2018-09-03 2018-09-03 一种改进的非极大值抑制方法 Active CN109255320B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811018713.5A CN109255320B (zh) 2018-09-03 2018-09-03 一种改进的非极大值抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811018713.5A CN109255320B (zh) 2018-09-03 2018-09-03 一种改进的非极大值抑制方法

Publications (2)

Publication Number Publication Date
CN109255320A true CN109255320A (zh) 2019-01-22
CN109255320B CN109255320B (zh) 2020-09-25

Family

ID=65050475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811018713.5A Active CN109255320B (zh) 2018-09-03 2018-09-03 一种改进的非极大值抑制方法

Country Status (1)

Country Link
CN (1) CN109255320B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948480A (zh) * 2019-03-05 2019-06-28 中国电子科技集团公司第二十八研究所 一种针对任意四边形的非极大值抑制方法
CN110930420A (zh) * 2019-11-11 2020-03-27 中科智云科技有限公司 基于神经网络的稠密目标背景噪声抑制方法及设备
CN112069874A (zh) * 2020-07-17 2020-12-11 中山大学 胚胎光镜图像中细胞的识别方法及***、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150278631A1 (en) * 2014-03-28 2015-10-01 International Business Machines Corporation Filtering methods for visual object detection
CN107563412A (zh) * 2017-08-09 2018-01-09 浙江大学 一种基于深度学习的红外图像电力设备实时检测方法
CN107742093A (zh) * 2017-09-01 2018-02-27 国网山东省电力公司电力科学研究院 一种红外图像电力设备部件实时检测方法、服务器及***
CN107909027A (zh) * 2017-11-14 2018-04-13 电子科技大学 一种具有遮挡处理的快速人体目标检测方法
CN108427912A (zh) * 2018-02-05 2018-08-21 西安电子科技大学 基于稠密目标特征学习的光学遥感图像目标检测方法
CN108460403A (zh) * 2018-01-23 2018-08-28 上海交通大学 一种图像中多尺度特征融合的目标检测方法与***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150278631A1 (en) * 2014-03-28 2015-10-01 International Business Machines Corporation Filtering methods for visual object detection
CN107563412A (zh) * 2017-08-09 2018-01-09 浙江大学 一种基于深度学习的红外图像电力设备实时检测方法
CN107742093A (zh) * 2017-09-01 2018-02-27 国网山东省电力公司电力科学研究院 一种红外图像电力设备部件实时检测方法、服务器及***
CN107909027A (zh) * 2017-11-14 2018-04-13 电子科技大学 一种具有遮挡处理的快速人体目标检测方法
CN108460403A (zh) * 2018-01-23 2018-08-28 上海交通大学 一种图像中多尺度特征融合的目标检测方法与***
CN108427912A (zh) * 2018-02-05 2018-08-21 西安电子科技大学 基于稠密目标特征学习的光学遥感图像目标检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
E. ZAYTSEVA 等: "A search based approach to non maximum suppression in face detection", 《2012 19TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
王林 等: "Faster R-CNN 模型在车辆检测中的应用", 《计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948480A (zh) * 2019-03-05 2019-06-28 中国电子科技集团公司第二十八研究所 一种针对任意四边形的非极大值抑制方法
CN110930420A (zh) * 2019-11-11 2020-03-27 中科智云科技有限公司 基于神经网络的稠密目标背景噪声抑制方法及设备
CN110930420B (zh) * 2019-11-11 2022-09-30 中科智云科技有限公司 基于神经网络的稠密目标背景噪声抑制方法及设备
CN112069874A (zh) * 2020-07-17 2020-12-11 中山大学 胚胎光镜图像中细胞的识别方法及***、设备及存储介质

Also Published As

Publication number Publication date
CN109255320B (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN109255320A (zh) 一种改进的非极大值抑制方法
CN101087365B (zh) 一种滤除图像混合噪声的方法
CN103268481B (zh) 一种复杂背景图像中的文本提取方法
CN103177259A (zh) 色块识别方法及装置
CN105469027B (zh) 针对文档图像的水平和垂直线检测和移除
WO2020060895A1 (en) Method and apparatus for vehicle damage identification
CN108537821A (zh) 一种基于视频的运动目标检测方法
CN109241938A (zh) 道路拥堵检测方法及终端
US20150310302A1 (en) Image processing device and method
CN102956034A (zh) 使用影像对比增进的移动对象检测方法
US10803116B2 (en) Logo detection system for automatic image search engines
CN105787902A (zh) 利用分块排序检测噪声的图像降噪方法
CN107169503B (zh) 一种室内场景的分类方法及装置
CN103093185B (zh) 字符识别装置、图像处理装置及其方法
Phueakjeen et al. A study of the edge detection for road lane
CN115170804B (zh) 基于深度学习的表面缺陷检测方法、装置、***和介质
CN112862845A (zh) 一种基于置信度评估的车道线重构方法及装置
CN110599453A (zh) 一种基于图像融合的面板缺陷检测方法、装置及设备终端
Grigoryev et al. Vision-Based Vehicle Wheel Detector And Axle Counter.
CN103020949A (zh) 人脸图像检测方法
CN110807406B (zh) 一种雾天检测方法及装置
CN104281850A (zh) 一种文字区域识别方法和装置
CN106407894A (zh) 一种改进基于ldcf的行人检测方法
CN109977910A (zh) 基于彩色线段的票据快速定位方法及其***
CN111738085B (zh) 实现自动驾驶同时定位与建图的***构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant