CN109815843B - 图像处理方法及相关产品 - Google Patents
图像处理方法及相关产品 Download PDFInfo
- Publication number
- CN109815843B CN109815843B CN201811645347.6A CN201811645347A CN109815843B CN 109815843 B CN109815843 B CN 109815843B CN 201811645347 A CN201811645347 A CN 201811645347A CN 109815843 B CN109815843 B CN 109815843B
- Authority
- CN
- China
- Prior art keywords
- frame
- target
- class
- mask
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 95
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 35
- 238000010586 diagram Methods 0.000 description 15
- 230000002093 peripheral effect Effects 0.000 description 12
- 238000009826 distribution Methods 0.000 description 10
- 230000007613 environmental effect Effects 0.000 description 8
- 238000013507 mapping Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000003709 image segmentation Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种目标检测方法及相关产品,所述方法包括:获取待处理图像;将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数;依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask为1的框;在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0。通过本申请实施例可以降低计算复杂度,缩减NMS运行时间。
Description
技术领域
本申请涉及目标检测技术领域,具体涉及一种图像处理方法及相关产品。
背景技术
随着电子技术的快速发展,电子设备(如手机、平板电脑等)越来越智能化,例如,电子设备可以实现拍照,能够实现目标检测,但是,检测算法中,常采用非极大值抑制(nonmaximum suppression,NMS)方法滤除重叠的框(检测出来的一个物体,就是一个框)。而NMS算法由于其本身的迭代-遍历-消除的算法性质,需要逐个遍历,迭代次数多,且计算复杂度高。
发明内容
本申请实施例提供了一种目标检测方法及相关产品,可以减少迭代次数,降低计算复杂度。
本申请实施例第一方面提供了一种目标检测方法,应用于电子设备,包括:
获取待处理图像;
将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数;
依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;
设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;
确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask为1 的框;
在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0。
可选地,所述方法还包括:
将剩余的框用于非极大值抑制运算,得到至少一个框,将该至少一个框对应的区域作为目标图像。
可选地,在上述目标图像包括人脸图像时,所述方法还包括:
对所述目标图像进行特征点提取,得到目标特征点集;
依据所述目标特征点集,确定所述目标图像的目标特征点分布密度;
按照预设的特征点分布密度与匹配阈值之间的映射关系,确定所述目标特征点分布密度对应的目标匹配阈值;
依据所述目标匹配阈值以及所述目标图像在预设数据库中进行搜索,得到与所述目标图像匹配成功的目标对象。
可选地,依据所述目标匹配阈值以及所述目标图像在预设数据库中进行搜索,得到与所述目标图像匹配成功的目标对象,包括:
对所述目标图像进行轮廓提取,得到目标***轮廓;
将所述目标特征点集与人脸图像x的特征点集进行匹配,得到第一匹配值,所述人脸图像x为所述预设数据库中的任一人脸图像;
将所述目标***轮廓与所述人脸图像x的***轮廓进行匹配,得到第二匹配值;
获取特征点集对应的第一权值,以及***轮廓对应的第二权值;
依据所述第一匹配值、所述第二匹配值、所述第一权值和所述第二权值进行加权运算,得到目标匹配值;
在所述目标匹配值大于所述目标匹配阈值时,确认所述人脸图像x为目标对象;
在所述目标匹配值小于或等于所述目标匹配阈值时,确认所述人脸图像x 不为所述目标对象。
可选地,所述方法还包括:
对所述待处理图像进行图像分割,得到至少一个目标区域;
确定所述M个框中每一框与所述至少一个目标区域的重叠面积,得到多个重叠面积;
从所述多个重叠面积中选取大于预设面积值的重叠面积,得到N个重叠面积,并获取该N个重叠面积对应的N个框,N为小于或等于所述M的整数;
则所述依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序,包括:
依据所述N个第一类框中每一框的得分从高到低顺序对所述N个第一类框进行排序。
本申请实施例第二方面提供了一种目标检测装置,包括:
获取单元,用于获取待处理图像;
输入单元,用于将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数;
排序单元,用于依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;
选取单元,用于设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;
确定单元,用于确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask为1的框;
设置单元,用于在所述重叠面积大于预设阈值时,将所述第i个框的mask 设置为0。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,通过本申请实施例所描述的目标检测方法及相关产品,获取待处理图像,将待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数,依据M个第一类框中每一框的得分从高到低顺序对M个第一类框进行排序,设置所有框mask为1,从排序后的 M个第一类框中选取一个框作为目标框,目标框的mask置为0,确定第i个框与目标框之间的重叠面积,第i个框为任一mask为1的框,在重叠面积大于预设阈值时,将第i个框的mask设置为0,在目标检测过程中,可以过滤掉一些框,从而可以减少迭代次数,降低了计算复杂度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是本申请实施例提供的一种目标检测方法的实施例流程示意图;
图1B是本申请实施例提供的框的演示示意图;
图1C是本申请实施例提供的框的重叠区域的演示示意图;
图2是本申请实施例提供的一种目标检测方法的另一实施例流程示意图;
图3A是本申请实施例提供的一种目标检测装置的实施例结构示意图;
图3B是本申请实施例提供的另一种目标检测装置的实施例结构示意图;
图4是本申请实施例提供的一种电子设备的实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例所描述电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备(MID,MobileInternet Devices)或穿戴式设备等,上述仅是举例,而非穷举,包含但不限于上述装置,当然,上述电子设备还可以为服务器。
需要说明的是,本申请实施例中的电子设备可与多个摄像头连接,每一摄像头均可用于抓拍视频图像,每一摄像头均可有一个与之对应的位置标记,或者,可有一个与之对应的编号。通常情况下,摄像头可设置在公共场所,例如,学校、博物馆、十字路口、步行街、写字楼、车库、机场、医院、地铁站、车站、公交站台、超市、酒店、娱乐场所等等。摄像头在拍摄到视频图像后,可将该视频图像保存到电子设备所在***的存储器。存储器中可存储有多个图像库,每一图像库可包含同一人的不同视频图像,当然,每一图像库还可以用于存储一个区域的视频图像或者某个指定摄像头拍摄的视频图像。
进一步可选地,本申请实施例中,摄像头拍摄的每一帧视频图像均对应一个属性信息,属性信息为以下至少一种:视频图像的拍摄时间、视频图像的位置、视频图像的属性参数(格式、大小、分辨率等)、视频图像的编号和视频图像中的人物特征属性。上述视频图像中的人物特征属性可包括但不仅限于:视频图像中的人物个数、人物位置、人物角度值、年龄、图像质量等等。
进一步需要说明的是,每一摄像头采集的视频图像通常为动态人脸图像,因而,本申请实施例中可以对人脸图像的角度值信息进行规划,上述角度值信息可包括但不仅限于:水平转动角度值、俯仰角或者倾斜度。例如,可定义动态人脸图像数据要求两眼间距不小于30像素,建议60像素以上。水平转动角度值不超过±30°、俯仰角不超过±20°、倾斜角不超过±45°。建议水平转动角度值不超过±15°、俯仰角不超过±10°、倾斜角不超过±15°。例如,还可对人脸图像是否被其他物体遮挡进行筛选,通常情况下,饰物不应遮挡脸部主要区域,饰物如深色墨镜、口罩和夸张首饰等,当然,也有可能摄像头上面布满灰尘,导致人脸图像被遮挡。本申请实施例中的视频图像的图像格式可包括但不仅限于:BMP,JPEG,JPEG2000,PNG等等,其大小可以在10-30KB 之间,每一视频图像还可以对应一个拍摄时间、以及拍摄该视频图像的摄像头统一编号、与人脸图像对应的全景大图的链接等信息(人脸图像和全局图像建立特点对应性关系文件)。
本申请实施例,在设备上要求很低,仅需要能够拍摄RGB图像或视频的单个摄像头即可完成数据的采集与点云的生成,再将点云数据与原始RGB图像送入后续封装好的流程中即可实现场景的三维重建。基于单摄像头景深预测的场景三维重建技术可分为:视频流获取、图像预处理、深度特征提取与场景深度图生成、基于深度图的点云数据生成、RGB图像与点云数据匹配融合、三维物体表面生成六个模块。其中视频流获取、图像预处理已经后面的RGB图像与点云数据匹配融合、三维物体表面生成技术相对成熟,本申请可优化从场景中生成点云数据的方法,大大降低了其对设备和计算能力的要求。
请参阅图1A,为本申请实施例提供的一种目标检测方法的实施例流程示意图。本实施例中所描述的目标检测方法,包括以下步骤:
101、获取待处理图像。
其中,本申请实施例中,应用于电子设备,具体地,可以应用于目标检测,待处理图像可以为包括目标的图像,该目标可以为以下至少一种:人、动物、车牌、车、建筑物等等,在此不做限定。
其中,待处理图像可以由摄像头拍摄,上述待处理图像可以由用户指定或者由摄像头拍摄得到。
可选地,上述步骤101,获取目标人脸图像,可以包括如下步骤:
11、获取目标环境参数;
12、按照预设的环境参数与拍摄参数之间的映射关系,确定所述目标环境参数对应的目标拍摄参数;
13、依据所述目标拍摄参数进行拍摄,得到所述待处理图像。
其中,本申请实施例中,环境参数可以包括以下至少一种:温度、湿度、位置、磁场干扰强度、天气、环境光亮度、环境光源数量等等,在此不做限定。上述环境参数可以由环境传感器采集,环境传感器可以集成到电子设备中。环境传感器可以为以下至少一种:温度传感器、湿度传感器、定位装置、磁场检测传感器、处理器、环境光传感器、颜色传感器等等,在此不做限定,例如,温度传感器可以用于检测温度,湿度传感器可以用于检测湿度,全球定位*** GPS可以用于检测位置,磁场检测传感器可以用于检测磁场强度,处理器可以用于获取天气(例如,电子设备中安装天气APP,通过该天气APP获取天气),环境光传感器可以用于检测环境亮度,颜色传感器可以用于检测环境光源数量等等。
进一步地,拍摄参数可以为以下至少一种:曝光时长、拍摄模式(如海景模式、沙漠模式、夜景模式、全景模式等等)、感光度ISO、焦距、物距、光圈大小等等,在此不做限定。
另外,电子设备中还可以预先存储预设的环境参数与拍摄参数之间的映射关系,如下提供一种环境参数与拍摄参数之间的映射关系,具体如下:
环境参数 | 拍摄参数 |
环境参数1 | 拍摄参数1 |
环境参数2 | 拍摄参数2 |
... | ... |
环境参数n | 拍摄参数n |
具体实现中,电子设备可以获取目标环境参数,进而,按照预设的环境参数与拍摄参数之间的映射关系,确定目标环境参数对应的目标拍摄参数,并依据目标拍摄参数进行拍摄,得到待处理图像,如此,可以得到与环境相宜的图像,提升了监控效率。
102、将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数。
其中,上述预设卷积神经网络可以预先设置。电子设备可以将待处理图像输入到预设卷积神经网络中,得到M个第一类框,每一第一类框对应一个得分,得分可以理解为对应的框存在目标的概率,得分越高,则框所在区域越有可能是目标,上述M为大于1的整数,具体实现中,可以取M个第一类框中每一框的对角线对应的2个坐标,并由该2个坐标用来标记框。如图1B所示,图1B 示出了一个框,虚线表示该框的对角线,而(x0a,y0a)、(x1a,y1a)则表示该对角线对应的两个顶点。
103、依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序。
具体实现中,电子设备获取对M个第一类框中每一框的得分,并依据M个第一类框中每一框的得分对该M个第一类框进行排序,具体地,可以为得到由高到低的顺序对M个第一类框进行排序。
104、设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0。
其中,本申请实施例中,mask为掩膜,当对一个图像设置mask=1时,该图像的所有像素点的像素值为1,当对一个图像中的某个像素点设置mask=1时,该像素点的像素值为1,电子设备可以从排序后的M个第一类框中选取任一框作为目标框,当然,该任一框不为排序的最后一个框,并设置所有框为mask=1,即所有框的像素点的像素值为1,以便于后续计算面积,在选取目标框之后,可以将目标框的mask设置为0,即目标框中所有像素点的像素值为0。
可选地,上述步骤104,从排序后的所述M个第一类框中选取一个框作为目标框,可按照如下方式实施:
从排序后的所述M个第一类框中选取得分最高的一个框作为所述目标框。
其中,电子设备可以从排序后的M个第一类框中选取得分最高的一个框作为目标框。
105、确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask 为1的框。
其中,电子设备可以计算第i个框与目标框之间的重叠面积,具体地,可以计算两者之间重叠的像素点个数,上述第i个框为为任一mask为1的框,当然也可以为M个第一类框中除了目标框之外且得分排序在目标框之后的任一mask 为1的框。
106、在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0。
其中,上述预设阈值可以用户自行设置或者***默认。电子设备可以在重叠面积大于预设阈值时,将第i个框的mask设置为0,则相当于过滤掉第i个框,反之,则可以保留第i个框,执行i=i+1,重复步骤105-步骤106,可以将剩余的框采用NMS进行去重处理,得到至少一个框,将该对应的区域为目标图像,即最终代表目标所在区域的图像。反之,在重叠面积小于预设阈值时,则可以保留第i框的mask为1。
可选地,所述电子设备包括矢量寄存器,在上述步骤106之后,还可以包括如下步骤:
A1、用标量寄存器计算所述目标框的面积值;
A2、采用所述预设矢量寄存器取预设维度的第二类框,所述第二类框为所述第i个框对应的矢量框;
A3、用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,所述目标重叠面积为一矢量;
A4、用矢量运算方法计算所述第二类框的矢量面积;
A5、根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0。
其中,上述预设维度可以由用户自行设置或者***默认。本申请实施例中,电子设备可以通过矢量寄存器取64/32/16(跟矢量处理器的能力相关)个第二类框,即预设维度可以为64或者32或者16,电子设备可以采用预设矢量寄存器取预设维度的第二类框,第二类框为一个矢量框,具体地,即第i个框对应的矢量框,具体地,将第i框的参数(如面积)拓展(复制)为预设维度。
针对重叠面积的理解,如图1C所示,图1C中,黑色区域代表两者之间的重叠区域,1、2为一个框的一条对角线的两个顶点坐标,3、4为另一个框的一条对角线的两个顶点坐标,基于该1、2、3、4四个顶点可以计算两个框之间的重叠面积。
进一步地,电子设备可以确定第二类框与目标框之间的目标重叠面积,目标重叠面积为一矢量,进一步地,类似地,基于此原理,可以计算第二类框的矢量面积,具体地,按照如下公式计算第二类框的矢量面积:
SB=(X1B-X0B+1)*(Y1B-Y0B+1)
其中,SB表示第二类框的矢量面积,(X0B,Y0B)、(X1B,Y1B)为所述第二类框的一条对角线的两个顶点坐标。
进一步地,电子设备根据目标重叠面积、矢量面积与预设阈值确定预设比对公式,并依据预设比对公式将第i个框的mask设置为0。
可选地,上述步骤A1,计算所述目标框的面积值,可以按照如下方式实施:
按照如下公式计算所述目标框的面积值:
S=(x1a-x0a+1)*(y1a-y0a+1)
其中,(x0a,y0a)、(x1a,y1a)为所述目标框的一条对角线的两个顶点坐标,sa为所述目标框的面积值,为一标量+。
可选地,上述步骤A3,用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,可以按照如下方式实施:
按照如下公式计算所述第二类框与所述目标框之间的目标重叠面积:
Soverlap=max(0,min(X1B,x1a)-max(X0B,x0a))*(0,min(Y1B,y1a)-max(Y0B,y0a))
其中,(x0a,y0a)、(x1a,y1a)为所述目标框的一条对角线的两个顶点坐标,(X0B,Y0B)、(X1B,Y1B)为所述第二类框的一条对角线的两个顶点坐标, Soverlap表示所述第二类框与所述目标框之间的目标重叠面积,结合图1C, (x0a,y0a)、(x1a,y1a)可以视作图1C中一个框的顶点,(X0B,Y0B)、 (X1B,Y1B)可以视作图1C中另一个框的顶点,基于该4个顶点可以计算两个框之间的重叠面积。
可选地,上述步骤A5,根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask 设置为0,可以按照如下方式实施:
构建所述预设对比公式,如下:
(sa+SB-Soverlap)*thres,其中,sa为矢量,且由标量sa矢量化处理得到,具体地,将面积拓展(复制)为预设维度,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
将Soverlap与(sa+SB-Soverlap)*thres进行比较,具体为:将Soverlap的第j个元素与 (sa+SB-Soverlap)*thres(sa+SB-Soverlap)*thres中对应的第j个元素进行比对,若大于,则将第二类框的第j个元素的mask设置为0,反之,将所述第二类框的第j 个元素的mask保持为1,j为Soverlap中任一元素位置。
可选地,上述步骤A5,根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask 设置为0,可以按照如下方式实施:
构建所述预设对比公式,如下:
min(sa,SB)*thres,其中,sa为矢量,且由标量sa矢量化处理得到,具体地,将面积拓展(复制)为预设维度,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
Soverlap与min(sa,SB)*thres进行比较,具体为:将Soverlap的第k个元素与 min(sa,SB)*thres中对应的第k个元素进行比对,若大于,则将第二类框的第k 个元素的mask设置为0,反之,将所述第二类框的第k个元素的mask保持为1, k为Soverlap中任一元素位置。
举例说明下,对于任意框,如图1B所示,取图1B中的框的一对角线的两个顶点的坐标(x0a,y0a)、(x1a,y1a),则框可以记作 (x0a,y0a,x1a,y1a),分别对应图像左上角的坐标和右下角的坐标(可以默认图像左上角的点的坐标为(0,0)),每个框对应一个得分,可以执行如下步骤:
1、根据得分对M个框从大到小进行排序;
2、针对每个框设置一个mask,初始化为1;
3、取mask为1,得分最大的框a(x0a,y0a,x1a,y1a),如果不能取到(mask 均为0),则NMS完成;如果能取到,取完后mask置为0,此框为满足条件的框保存在结果中,同时计算框a的面积sa
sa=(x1a-x0a+1)*(y1a-y0a+1)
4、用矢量寄存器取64/32/16(跟矢量处理器的能力相关)个框 B(X0B,Y0B,Y1B,Y1B),计算B与a的重叠面积Soverlap,各个框B的面积SB;
Soverlap=max(0,min(X1B,x1a)-max(X0B,x0a))*(0,min(Y1B,y1a)-max(Y0B,y0a))
SB=(X1B-X0B+1)*(Y1B-Y0B+1)
注:上述Soverlap、SB均为矢量。
5、判断是否满足预设阈值thres(将除法转换成乘法),未超过门限的mask 置0;
可以采用如下两种比较方式,union和min,具体选哪种可以由用户自行决定。
union情况如下:
矢量比较Soverlap和(sa+SB-Soverlap)*thres;
若Soverlap中某一个元素大于(sa+SB-Soverlap)*thres中对应的元素,则对应的框中该元素对应位置设置mask为0,反之,则对应的框中该元素对应位置设置mask=1;
min情况如下:
矢量比较Soverlap和min(sa,SB)*thres;
若Soverlap中某一个元素大于大于min(sa,SB)*thres,则对应的框中该元素对应位置设置mask为0,反之,则对应的框中该元素对应位置设置mask=1;
6、重复4和5,直到把a以后的所有的框都遍历完;
7、回到步骤3。
可选地,上述步骤106之后,还可以包括如下步骤:
将剩余的框用于非极大值抑制运算,得到至少一个框,将该至少一个框对应的区域作为目标图像。
如此,通过减少框的数量,另外,还可以提升NMS运算效率。
进一步可选地,在上述目标图像包括人脸图像时,上述步骤,将该至少一个框对应的区域作为目标图像之后,还可以包括如下步骤:
B1、对所述目标图像进行特征点提取,得到目标特征点集;
B2、依据所述目标特征点集,确定所述目标图像的目标特征点分布密度;
B3、按照预设的特征点分布密度与匹配阈值之间的映射关系,确定所述目标特征点分布密度对应的目标匹配阈值;
B4、依据所述目标匹配阈值以及所述目标图像在预设数据库中进行搜索,得到与所述目标图像匹配成功的目标对象。
其中,电子设备中可以预先存储预设的特征点分布密度与匹配阈值之间的映射关系,预设数据库也可以事先建立,该预设数据库中包括至少一个人脸图像。具体实现中,电子设备可以对目标图像进行特征点提取,得到目标特征点集,依据该目标特征点集,可以确定目标图像的目标特征点分布密度,目标特征点分布密度=目标特征点集的数量/目标图像的面积,进一步地,可以依据上述映射关系确定目标特征点分布密度对应的目标匹配阈值,依据该目标匹配阈值,可以将目标图像在预设数据库中进行搜索,得到与目标图像匹配成功的目标对象,即目标图像与目标对象的人脸图像之间的匹配值大于目标匹配阈值时,则可以认为两者匹配成功,如此,可以动态调整匹配阈值,提高检索效率。
进一步地,上述步骤B4,依据所述目标匹配阈值以及所述目标图像在预设数据库中进行搜索,得到与所述目标图像匹配成功的目标对象,可包括如下步骤:
B41、对所述目标图像进行轮廓提取,得到目标***轮廓;
B42、将所述目标特征点集与人脸图像x的特征点集进行匹配,得到第一匹配值,所述人脸图像x为所述预设数据库中的任一人脸图像;
B43、将所述目标***轮廓与所述人脸图像x的***轮廓进行匹配,得到第二匹配值;
B44、获取特征点集对应的第一权值,以及***轮廓对应的第二权值;
B45、依据所述第一匹配值、所述第二匹配值、所述第一权值和所述第二权值进行加权运算,得到目标匹配值;
B46、在所述目标匹配值大于所述目标匹配阈值时,确认所述人脸图像x为目标对象;
B47、在所述目标匹配值小于或等于所述目标匹配阈值时,确认所述人脸图像x不为所述目标对象。
其中,具体实现中,电子设备可以对目标图像进行轮廓提取,得到目标***轮廓,可以将目标特征点集与人脸图像x的特征点集进行匹配,得到第一匹配值,上述人脸图像x为预设数据库中的任意人脸图像,可以将目标***轮廓与人脸图像x的***轮廓进行匹配,得到第二匹配值,获取特征点集对应的第一权值,以及***轮廓对应的第二权值,该第一权值、第二权值均可以预先设置,第一权值+第二权值=1,进而,目标匹配值=第一匹配值*第一权值+第二匹配值*第二权值,在目标匹配值大于目标匹配阈值时,确认人脸图像x为目标对象,反之,在目标匹配值小于或等于目标匹配阈值时,确认人脸图像x不为目标对象,如此,可以更精准地实现人脸识别。
可选地,在上述步骤102与步骤103之间还可以包括如下步骤:
C1、对所述待处理图像进行图像分割,得到至少一个目标区域;
C2、确定所述M个框中每一框与所述至少一个目标区域的重叠面积,得到多个重叠面积;
C3、从所述多个重叠面积中选取大于预设面积值的重叠面积,得到N个重叠面积,并获取该N个重叠面积对应的N个框,N为小于或等于所述M的整数;
则上述步骤103,依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序,可以按照如下方式实施:
依据所述N个第一类框中每一框的得分从高到低顺序,对所述N个第一类框进行排序。
其中,上述预设面积值可以由用户自行设置或者***默认。具体实现中,可以先对待处理图像进行图像分割,得到至少一个目标区域,即初步识别目标可能存在的区域,再确定M个框中每一框与至少一个目标区域的重叠面积,得到多个重叠面积,从多个重叠面积中选取大于预设面积值的重叠面积,得到N 个重叠面积,并获取该N个重叠面积对应的N个框,N为小于或等于M的整数,如此,可以减少后续框进行NMS运算的数量,提升了运算速度,也提升了识别精度。
可以看出,通过本申请实施例所描述的目标检测方法,获取待处理图像,将待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数,依据M个第一类框中每一框的得分从高到低顺序对M个第一类框进行排序,设置所有框mask为1,从排序后的M个第一类框中选取一个框作为目标框,目标框的mask置为0,确定第i个框与目标框之间的重叠面积,第i个框为任一mask为1的框,在重叠面积大于预设阈值时,将第i个框的mask设置为0,在目标检测过程中,可以过滤掉一些框,从而可以减少迭代次数,降低了计算复杂度。之后还可以再从剩下的第一类框中选取 mask为1且得分最高的作为目标框,重复上述重叠面积过滤,直至取出最后一个mask为1的目标框,可以缩减NMS运行时间。
另外,本申请实施例中,先采用本申请实施例的方法对框进行过滤,可以减少后续用于NMS运算的数量,相较于传统的直接将所有框用于NMS运算,可以减少迭代次数,降低了计算复杂度,提升了目标检测效率。
与上述一致地,请参阅图2,为本申请实施例提供的一种目标检测方法的实施例流程示意图。本实施例中所描述的目标检测方法,包括以下步骤:
201、获取待处理图像。
202、将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数。
203、依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序。
204、设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0。
205、确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask 为1的框。
206、在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0。
207、用标量寄存器计算所述目标框的面积值。
208、采用所述预设矢量寄存器取预设维度的第二类框,所述第二类框为所述第i个框对应的矢量框。
209、用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,所述目标重叠面积为一矢量。
210、用矢量运算方法计算所述第二类框的矢量面积。
211、根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0。
其中,上述步骤201-步骤211所描述的目标检测方法可参考图1A所描述的目标检测方法的对应步骤。
可以看出,通过本申请实施例所描述的目标检测方法,获取待处理图像,将待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数,依据M个第一类框中每一框的得分从高到低顺序对M个第一类框进行排序,设置所有框mask为1,从排序后的M个第一类框中选取一个框作为目标框,目标框的mask置为0,确定第i个框与目标框之间的重叠面积,第i个框为任一mask为1的框,在重叠面积大于预设阈值时,将第i个框的mask设置为0,用标量寄存器计算目标框的面积值,采用预设矢量寄存器取预设维度的第二类框,第二类框为第i个框对应的矢量框,用矢量运算方法计算第二类框与目标框之间的目标重叠面积,目标重叠面积为一矢量,用矢量运算方法计算第二类框的矢量面积,根据目标重叠面积、矢量面积与预设阈值确定预设比对公式,并依据预设比对公式将第二类框的对应mask设置为 0,在目标检测过程中,可以过滤掉一些框,从而可以减少迭代次数,降低了计算复杂度。
与上述一致地,以下为实施上述目标检测方法的装置,具体如下:
请参阅图3A ,为本申请实施例提供的一种目标检测装置的实施例结构示意图。本实施例中所描述的目标检测装置,包括:获取单元301、输入单元302、排序单元303、选取单元304、确定单元305和设置单元306,具体如下:
获取单元301,用于获取待处理图像;
输入单元302,用于将所述待处理图像输入到预设卷积神经网络,得到M 个第一类框,每一第一类框对应一个得分,M为大于1的整数;
排序单元303,用于依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;
选取单元304,用于设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;
确定单元305,用于确定第i个框与所述目标框之间的重叠面积,所述第i 个框为任一mask为1的框;
设置单元306,用于在所述重叠面积大于预设阈值时,将所述第i个框的 mask设置为0。
可以看出,通过本申请实施例所描述的目标检测装置,获取待处理图像,将待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数,依据M个第一类框中每一框的得分从高到低顺序对M个第一类框进行排序,设置所有框mask为1,从排序后的M个第一类框中选取一个框作为目标框,目标框的mask置为0,确定第i个框与目标框之间的重叠面积,第i个框为任一mask为1的框,在重叠面积大于预设阈值时,将第i个框的mask设置为0,在目标检测过程中,可以过滤掉一些框,从而可以减少迭代次数,降低了计算复杂度。
其中,上述获取单元301可用于实现上述步骤101所描述的方法,输入单元302可用于实现上述步骤102所描述的方法,上述排序单元303可用于实现上述步骤103所描述的方法,上述选取单元304可用于实现上述步骤104所描述的方法,上述确定单元305可用于实现上述步骤105所描述的方法,上述设置单元306可用于实现上述步骤106所描述的方法,以下如此类推。
在一个可能的示例中,在所述从排序后的所述M个第一类框中选取一个框作为目标框方面,所述排序单元303具体用于:
从排序后的所述M个第一类框中选取得分最高的一个框作为所述目标框。
在一个可能的示例中,所述电子设备包括矢量寄存器,如图3B所示,图3B 为图3A所示的目标检测装置的又一变型结构,其与图3A相比较,还可以包括:所述方法还包括:计算单元307和执行单元308,具体如下:
计算单元307,用于用标量寄存器计算所述目标框的面积值;
所述获取单元301,用于采用所述预设矢量寄存器取预设维度的第二类框,所述第二类框为所述第i个框对应的矢量框;
所述确定单元305,用于用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,所述目标重叠面积为一矢量;
所述计算单元307,还用于用矢量运算方法计算所述第二类框的矢量面积;
所述执行单元308,还用于根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应 mask设置为0。
在一个可能的示例中,在所述用标量寄存器计算所述目标框的面积值方面,所述计算单元307具体用于:
按照如下公式计算所述目标框的面积值:
sa=(x1a-x0a+1)*(y1a-y0a+1)
其中,(x0a,y0a)、(x1a,y1a)为所述目标框的一条对角线的两个顶点坐标,sa为所述目标框的面积值。
在一个可能的示例中,在所述用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积方面,所述执行单元308具体用于:
按照如下公式计算所述第二类框与所述目标框之间的目标重叠面积:
Soverlap=max(0,min(X1B,x1a)-max(X0B,x0a))*(0,min(Y1B,y1a)-max(Y0B,y0a))
其中,(X0B,Y0B)、(X1B,Y1B)为所述第二类框的一条对角线的两个顶点坐标,Soverlap表示所述第二类框与所述目标框之间的目标重叠面积。
在一个可能的示例中,在所述根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0方面,所述执行单元308具体用于:
构建所述预设对比公式,如下:
(sa+SB-Soverlap)*thres,其中,sa为矢量,且由sa矢量化处理得到,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
将Soverlap与(sa+SB-Soverlap)*thres进行比较,具体为:将Soverlap的第j个元素与 (sa+SB-Soverlap)*thres中对应的第j个元素进行比对,若大于,则将第二类框的第 j个元素的mask设置为0,反之,将所述第二类框的第j个元素的mask保持为 1,j为Soverlap中任一元素位置。
在一个可能的示例中,在所述根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0方面,所述确定单元具体用于:
构建所述预设对比公式,如下:
min(sa,SB)*thres,其中,sa为矢量,且由sa矢量化处理得到,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
Soverlap与min(sa,SB)*thres进行比较,具体为:将Soverlap的第k个元素与 min(sa,SB)*thres中对应的第k个元素进行比对,若大于,则将第二类框的第k 个元素的mask设置为0,反之,将所述第二类框的第k个元素的mask保持为1, k为Soverlap中任一元素位置。
可以理解的是,本实施例的目标检测装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
与上述一致地,请参阅图4,为本申请实施例提供的一种电子设备的实施例结构示意图。本实施例中所描述的电子设备,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000 连接。
其中,上述输入设备1000具体可为触控面板、物理按键或者鼠标。
上述输出设备2000具体可为显示屏。
上述存储器4000可以是高速RAM存储器,也可为非易失存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000 中存储的程序代码,执行如下操作:
上述处理器3000,用于:
获取待处理图像;
将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数;
依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;
设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;
确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask为1 的框;
在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0。
可以看出,通过本申请实施例所描述的电子设备,获取待处理图像,将待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数,依据M个第一类框中每一框的得分从高到低顺序对M个第一类框进行排序,设置所有框mask为1,从排序后的M个第一类框中选取一个框作为目标框,目标框的mask置为0,确定第i个框与目标框之间的重叠面积,第i个框为任一mask为1的框,在重叠面积大于预设阈值时,将第i个框的mask设置为0,在目标检测过程中,可以过滤掉一些框,从而可以减少迭代次数,降低了计算复杂度。
在一个可能的示例中,在所述从排序后的所述M个第一类框中选取一个框作为目标框方面,上述处理器3000具体用于:
从排序后的所述M个第一类框中选取得分最高的一个框作为所述目标框。
在一个可能的示例中,所述电子设备包括矢量寄存器,上述处理器3000还具体用于:
用标量寄存器计算所述目标框的面积值;
采用所述预设矢量寄存器取预设维度的第二类框,所述第二类框为所述第i 个框对应的矢量框;
用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,所述目标重叠面积为一矢量;
用矢量运算方法计算所述第二类框的矢量面积;
根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0。
在一个可能的示例中,在所述用标量寄存器计算所述目标框的面积值方面,上述处理器3000还具体用于:
按照如下公式计算所述目标框的面积值:
sa=(x1a-x0a+1)*(y1a-y0a+1)
其中,(x0a,y0a)、(x1a,y1a)为所述目标框的一条对角线的两个顶点坐标,sa为所述目标框的面积值。
在一个可能的示例中,在所述用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积方面,上述处理器3000具体用于:
按照如下公式计算所述第二类框与所述目标框之间的目标重叠面积:
Soverlap=max(0,min(X1B,x1a)-max(X0B,x0a))*(0,min(Y1B,y1a)-max(Y0B,y0a))
其中,(X0B,Y0B)、(X1B,Y1B)为所述第二类框的一条对角线的两个顶点坐标,Soverlap表示所述第二类框与所述目标框之间的目标重叠面积。
在一个可能的示例中,在所述根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0方面,上述处理器3000具体用于:
构建所述预设对比公式,如下:
(sa+SB-Soverlap)*thres,其中,sa为矢量,且由sa矢量化处理得到,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
将Soverlap与(sa+SB-Soverlap)*thres进行比较,具体为:将Soverlap的第j个元素与 (sa+SB-Soverlap)*thres中对应的第j个元素进行比对,若大于,则将第二类框的第 j个元素的mask设置为0,反之,将所述第二类框的第j个元素的mask保持为 1,j为Soverlap中任一元素位置。
在一个可能的示例中,在所述根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0方面,上述处理器3000具体用于:
构建所述预设对比公式,如下:
min(sa,SB)*thres,其中,sa为矢量,且由sa矢量化处理得到,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
Soverlap与min(sa,SB)*thres进行比较,具体为:将Soverlap的第k个元素与 min(sa,SB)*thres中对应的第k个元素进行比对,若大于,则将第二类框的第k 个元素的mask设置为0,反之,将所述第二类框的第k个元素的mask保持为1, k为Soverlap中任一元素位置。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种目标检测方法的部分或全部步骤。
本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例所记载的任何一种目标检测方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括” (comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
本领域技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/ 分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信***。
本申请是参照本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/ 或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (9)
1.一种图像处理方法,其特征在于,应用于电子设备,所述方法包括:
获取待处理图像;
将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数;
依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;
设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;
确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask为1的框;
在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0;
用标量寄存器计算所述目标框的面积值;
采用矢量寄存器取预设维度的第二类框,所述第二类框为第i个框对应的矢量框,所述第i个框为任一mask为1的框;
用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,所述目标重叠面积为一矢量;
用矢量运算方法计算所述第二类框的矢量面积;
根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0。
2.根据权利要求1所述的方法,其特征在于,所述从排序后的所述M个第一类框中选取一个框作为目标框,包括:
从排序后的所述M个第一类框中选取得分最高的一个框作为所述目标框。
3.根据权利要求1所述的方法,其特征在于,所述用标量寄存器计算所述目标框的面积值,包括:
按照如下公式计算所述目标框的面积值:
S=(x1a-x0a+1)*(y1a-y0a+1)
其中,(x0a,y0a)、(x1a,y1a)为所述目标框的一条对角线的两个顶点坐标,sa为所述目标框的面积值。
4.根据权利要求3所述的方法,其特征在于,所述用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,包括:
按照如下公式计算所述第二类框与所述目标框之间的目标重叠面积:
Soverlap=max(0,min(X1B,x1a)-max(X0B,x0a))*(0,min(Y1B,y1a)-max(Y0B,y0a))
其中,(X0B,Y0B)、(X1B,Y1B)为所述第二类框的一条对角线的两个顶点坐标,Soverlap表示所述第二类框与所述目标框之间的目标重叠面积。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0,包括:
构建所述预设对比公式,如下:
(sa+SB-Soverlap)*thres,其中,sa为矢量,且由sa矢量化处理得到,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
将Soverlap与(sa+SB-Soverlap)*thres进行比较,具体为:将Soverlap的第j个元素与(sa+SB-Soverlap)*thres中对应的第j个元素进行比对,若大于,则将第二类框的第j个元素的mask设置为0,反之,将所述第二类框的第j个元素的mask保持为1,j为Soverlap中任一元素位置。
6.根据权利要求4所述的方法,其特征在于,所述根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0,包括:
构建所述预设对比公式,如下:
min(sa,SB)*thres,其中,sa为矢量,且由sa矢量化处理得到,sa的维度数量与Soverlap的维度数量相同,其中,thres为所述预设阈值,SB表示所述第二类框的矢量面积;
Soverlap与min(sa,SB)*thres进行比较,具体为:将Soverlap的第k个元素与min(sa,SB)*thres中对应的第k个元素进行比对,若大于,则将第二类框的第k个元素的mask设置为0,反之,将所述第二类框的第k个元素的mask保持为1,k为Soverlap中任一元素位置。
7.一种图像处理装置,其特征在于,包括:
获取单元,用于获取待处理图像;
输入单元,用于将所述待处理图像输入到预设卷积神经网络,得到M个第一类框,每一第一类框对应一个得分,M为大于1的整数;
排序单元,用于依据所述M个第一类框中每一框的得分从高到低顺序对所述M个第一类框进行排序;
选取单元,用于设置所有框mask为1,从排序后的所述M个第一类框中选取一个框作为目标框,所述目标框的mask置为0;
确定单元,用于确定第i个框与所述目标框之间的重叠面积,所述第i个框为任一mask为1的框;
设置单元,用于在所述重叠面积大于预设阈值时,将所述第i个框的mask设置为0;
计算单元,用于用标量寄存器计算所述目标框的面积值;
所述获取单元,用于采用矢量寄存器取预设维度的第二类框,所述第二类框为第i个框对应的矢量框,所述第i个框为任一mask为1的框;
所述确定单元,用于用矢量运算方法计算所述第二类框与所述目标框之间的目标重叠面积,所述目标重叠面积为一矢量;
所述计算单元,还用于用矢量运算方法计算所述第二类框的矢量面积;
执行单元,用于根据所述目标重叠面积、所述矢量面积与所述预设阈值确定预设比对公式,并依据所述预设比对公式将所述第二类框的对应mask设置为0。
8.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-6任一项所述的方法中的步骤的指令。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-6任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811645347.6A CN109815843B (zh) | 2018-12-29 | 2018-12-29 | 图像处理方法及相关产品 |
PCT/CN2019/114330 WO2020134528A1 (zh) | 2018-12-29 | 2019-10-30 | 目标检测方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811645347.6A CN109815843B (zh) | 2018-12-29 | 2018-12-29 | 图像处理方法及相关产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109815843A CN109815843A (zh) | 2019-05-28 |
CN109815843B true CN109815843B (zh) | 2021-09-14 |
Family
ID=66603279
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811645347.6A Active CN109815843B (zh) | 2018-12-29 | 2018-12-29 | 图像处理方法及相关产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109815843B (zh) |
WO (1) | WO2020134528A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109815843B (zh) * | 2018-12-29 | 2021-09-14 | 深圳云天励飞技术有限公司 | 图像处理方法及相关产品 |
CN112101061A (zh) * | 2019-06-17 | 2020-12-18 | 富士通株式会社 | 目标检测方法、装置及图像处理设备 |
CN111652158A (zh) * | 2020-06-04 | 2020-09-11 | 浙江大华技术股份有限公司 | 目标对象的检测方法和装置、存储介质及电子装置 |
CN111951601B (zh) * | 2020-08-05 | 2021-10-26 | 智慧互通科技股份有限公司 | 一种识别配送车辆停放位置的方法及装置 |
CN111709951B (zh) * | 2020-08-20 | 2020-11-13 | 成都数之联科技有限公司 | 目标检测网络训练方法及***及网络及装置及介质 |
CN112464938B (zh) * | 2020-12-18 | 2024-04-12 | 深圳赛安特技术服务有限公司 | 车牌检测识别方法、装置、设备及存储介质 |
CN112699808B (zh) * | 2020-12-31 | 2024-06-07 | 深圳市华尊科技股份有限公司 | 密集目标检测方法、电子设备及相关产品 |
CN113129418B (zh) * | 2021-03-02 | 2023-06-27 | 武汉联影智融医疗科技有限公司 | 基于三维影像的目标表面重建方法、装置、设备和介质 |
CN113283307A (zh) * | 2021-04-30 | 2021-08-20 | 北京雷石天地电子技术有限公司 | 一种视频中物体识别方法、***及计算机存储介质 |
CN113192048A (zh) * | 2021-05-17 | 2021-07-30 | 广州市勤思网络科技有限公司 | 一种多模态融合的人数识别统计方法 |
CN113449373B (zh) * | 2021-07-21 | 2024-04-30 | 深圳须弥云图空间科技有限公司 | 重叠检测方法、装置及电子设备 |
CN115050129B (zh) * | 2022-06-27 | 2023-06-13 | 北京睿家科技有限公司 | 一种智能门禁的数据处理方法及*** |
CN117274814B (zh) * | 2023-10-08 | 2024-02-20 | 北京香田智能科技有限公司 | 一种烟田图像的处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228137A (zh) * | 2016-07-26 | 2016-12-14 | 广州市维安科技股份有限公司 | 一种基于关键点定位的atm机异常人脸检测方法 |
CN106485215A (zh) * | 2016-09-29 | 2017-03-08 | 西交利物浦大学 | 基于深度卷积神经网络的人脸遮挡检测方法 |
CN108416250A (zh) * | 2017-02-10 | 2018-08-17 | 浙江宇视科技有限公司 | 人数统计方法及装置 |
CN109815843A (zh) * | 2018-12-29 | 2019-05-28 | 深圳云天励飞技术有限公司 | 目标检测方法及相关产品 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101325690A (zh) * | 2007-06-12 | 2008-12-17 | 上海正电科技发展有限公司 | 监控视频流中人流分析与人群聚集过程的检测方法及*** |
US10169661B2 (en) * | 2014-03-28 | 2019-01-01 | International Business Machines Corporation | Filtering methods for visual object detection |
CN107909005A (zh) * | 2017-10-26 | 2018-04-13 | 西安电子科技大学 | 基于深度学习的监控场景下人物姿态识别方法 |
CN108171694B (zh) * | 2017-12-28 | 2021-05-14 | 开立生物医疗科技(武汉)有限公司 | 基于卷积神经网络的结节检测方法、***及设备 |
CN108921017B (zh) * | 2018-05-24 | 2021-05-18 | 苏州飞搜科技有限公司 | 人脸检测方法及*** |
CN108898610B (zh) * | 2018-07-20 | 2020-11-20 | 电子科技大学 | 一种基于mask-RCNN的物体轮廓提取方法 |
-
2018
- 2018-12-29 CN CN201811645347.6A patent/CN109815843B/zh active Active
-
2019
- 2019-10-30 WO PCT/CN2019/114330 patent/WO2020134528A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106228137A (zh) * | 2016-07-26 | 2016-12-14 | 广州市维安科技股份有限公司 | 一种基于关键点定位的atm机异常人脸检测方法 |
CN106485215A (zh) * | 2016-09-29 | 2017-03-08 | 西交利物浦大学 | 基于深度卷积神经网络的人脸遮挡检测方法 |
CN108416250A (zh) * | 2017-02-10 | 2018-08-17 | 浙江宇视科技有限公司 | 人数统计方法及装置 |
CN109815843A (zh) * | 2018-12-29 | 2019-05-28 | 深圳云天励飞技术有限公司 | 目标检测方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
WO2020134528A1 (zh) | 2020-07-02 |
CN109815843A (zh) | 2019-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109815843B (zh) | 图像处理方法及相关产品 | |
CN109961009B (zh) | 基于深度学习的行人检测方法、***、装置及存储介质 | |
US10198823B1 (en) | Segmentation of object image data from background image data | |
CN108710847B (zh) | 场景识别方法、装置及电子设备 | |
CN109255352B (zh) | 目标检测方法、装置及*** | |
US9965865B1 (en) | Image data segmentation using depth data | |
CN108876791B (zh) | 图像处理方法、装置和***及存储介质 | |
CN107808111B (zh) | 用于行人检测和姿态估计的方法和装置 | |
WO2019218824A1 (zh) | 一种移动轨迹获取方法及其设备、存储介质、终端 | |
CN108256404B (zh) | 行人检测方法和装置 | |
CN106650662B (zh) | 目标对象遮挡检测方法及装置 | |
CN107844794B (zh) | 图像识别方法和装置 | |
US8792722B2 (en) | Hand gesture detection | |
US8750573B2 (en) | Hand gesture detection | |
CN111583097A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN109816745B (zh) | 人体热力图展示方法及相关产品 | |
CN106845352B (zh) | 行人检测方法和装置 | |
CN110163188B (zh) | 视频处理以及在视频中嵌入目标对象的方法、装置和设备 | |
CN108875750B (zh) | 物体检测方法、装置和***及存储介质 | |
WO2018210047A1 (zh) | 数据处理方法、数据处理装置、电子设备及存储介质 | |
CN111008935B (zh) | 一种人脸图像增强方法、装置、***及存储介质 | |
CN109840885B (zh) | 图像融合方法及相关产品 | |
CN113436338A (zh) | 火灾现场的三维重建方法、装置、服务器及可读存储介质 | |
CN108875500B (zh) | 行人再识别方法、装置、***及存储介质 | |
CN109785439B (zh) | 人脸素描图像生成方法及相关产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |