CN113033719A - 目标检测处理方法、装置、介质及电子设备 - Google Patents

目标检测处理方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN113033719A
CN113033719A CN202110581939.1A CN202110581939A CN113033719A CN 113033719 A CN113033719 A CN 113033719A CN 202110581939 A CN202110581939 A CN 202110581939A CN 113033719 A CN113033719 A CN 113033719A
Authority
CN
China
Prior art keywords
difficult
basic
target detection
loss
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110581939.1A
Other languages
English (en)
Other versions
CN113033719B (zh
Inventor
王威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Zhuoyun Intelligent Technology Co ltd
Original Assignee
Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Zhuoyun Intelligent Technology Co ltd filed Critical Zhejiang Zhuoyun Intelligent Technology Co ltd
Priority to CN202110581939.1A priority Critical patent/CN113033719B/zh
Publication of CN113033719A publication Critical patent/CN113033719A/zh
Application granted granted Critical
Publication of CN113033719B publication Critical patent/CN113033719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种目标检测处理方法、装置、介质及电子设备。所述方法包括:确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。本方案能够提高模型稳定性。

Description

目标检测处理方法、装置、介质及电子设备
技术领域
本申请实施例涉及目标检测技术略领域,尤其涉及一种目标检测处理方法、装置、介质及电子设备。
背景技术
随着计算机技术的发展和计算机视觉原理的广泛应用,利用计算机图像处理技术对目标进行检测越来越热门。
传统的目标检测算法,为了平衡训练时的正负样本比例,往往将正负样本设置成一定的比例,然后根据设置的比例计算正负样本所需要的数量,在候选的检测区域中随机采样。为了使采样出的样本更具代表性,一般采用难例挖掘的方式挖掘出难例样本,模型使用难例样本训练可以达到更好的训练效果。OHEM(Online Hard negative ExampleMining,在线难例挖掘)算法是比较典型的难例挖掘方法,该算法在模型训练根据候选区域的损失值排序,选择损失值比较大的候选框进行训练。然而,OHEM算法存在模型稳定性较差的缺陷。
发明内容
本申请实施例提供一种目标检测处理方法、装置、介质及电子设备,可以提高模型的稳定性。
第一方面,本申请实施例提供了一种目标检测处理方法,包括:
确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
从所述候选区域集合中选择损失值相对较高的实际难例个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
第二方面,本申请实施例提供了一种目标检测处理装置,所述装置包括:
损失确定模块,用于确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
扩张数量确定模块,用于根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
基础难例集合确定模块,用于从所述候选区域集合中选择损失值相对较高的实际难例个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的一种目标检测处理方法。
第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的一种目标检测处理方法。
本申请实施例所提供的技术方案,通过动态确定样本图像的扩张难例数量,动态调整目标检测模型训练过程中的难例范围,使模型训练更加稳定,提高模型的鲁棒性。
附图说明
图1是本申请实施例一提供的一种目标检测处理方法的流程图;
图2是本申请实施例一提供的一种目标检测处理的模型网络结构示意图;
图3是本申请实施例二提供的另一种目标检测处理方法的流程图;
图4是本申请实施例二提供的动态难例挖掘与原难例挖掘相比的模型指标示意图;
图5本申请实施例二提供的动态调整难例样本采样频率与固定采样频率相比的模型指标示意图;
图6是本申请实施例三提供的一种目标检测处理装置的结构示意图;
图7是本申请实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1是本申请实施例一提供的一种目标检测处理方法的流程图,本实施例可适用于对动态进行在线难例样本挖掘的情况。该方法可以由本申请实施例所提供的一种目标检测处理装置执行,该装置可以由软件和/或硬件的方式来实现,可配置于电子设备中。
如图1所示,所述目标检测处理方法包括:
S110、确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值。
S120、根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量。
S130、从所述候选区域集合中选择损失值相对较高的实际难例个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
难例是指模型训练过程中损失值较大的一些样本,用于重新训练目标检测模型,以提高目标检测模型的学习效果。图2是本申请实施例一提供的一种目标检测处理的模型网络结构示意图。以目标检测模型采用快速区域卷积神经网络(Faster Regions with CNNfeatures,Faster R-CNN)结构为例,对样本图像进行特征提取得到特征图,通过区域生成网络(Region Proposal Network,RPN)提取样本图像中的所有候选区域,得到样本图像的候选区域集合;通过动态难例挖掘(OHEM)模块从候选区域集合中挖掘样本图像的基础难例集合,并使用基础难例集合对目标检测模型进行训练,例如对基础难例执行感兴趣区域池化(ROI pooling),且对池化结果进行区域卷积处理,以得到输出结果。
其中,样本图像的原始候选区域构建候选区域集合,原始候选区域可以通过确定样本图像的特征图,且对特征图进行处理得到,候选区域的损失值可以是候选区域的分类损失值,可以采用如下交叉熵损失值公式确定:
Figure 49587DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
为第i个候选区域的概率值,
Figure 904411DEST_PATH_IMAGE004
为第i个候选区域的损失值。
其中,目标检测模型的基础难例数量是指目标检测模型基础网络中超参,用于表示实际需要参与训练的候选区域数量。样本图像的扩张难例数量大于基础难例数量,是指对基础难例数量的扩张处理结果。
在本申请实施例中,可以按照损失值对候选区域集合中的各候选区域进行排序,选择损失值相对较高的扩张难例数量个候选区域,以得到样本图像的扩张难例集合。并且,还可以从扩张难例集合中随机选择基础难例数量个候选区域,以得到样本图像的基础难例集合。在目标检测模型训练过程中噪声的损失值一般较大,通过将候选区域集合中损失值较高的扩张难例数量个候选区域作为扩张难例集合,并从扩张难例集合中随机选择基础难例数量个候选区域得到基础难例集合,相比于直接将候选区域集合中损失值较高的基础难例数量个候选区域得到基础难例集合,由于扩张难例集合中的噪声样本不会每次都被随机选择到基础难例集合中,从而可以降低模型对噪声的敏感程度,降低噪声对模型的干扰,提高目标检测模型的鲁棒性。
本申请实施例所提供的技术方案,通过确定样本图像的扩张难例集合,从扩张难例集合中选择基础难例数量个候选区域得到基础难例集合,相比于将候选区域集合中损失值较高的基础难例数量个候选区域得到基础难例集合,能够抑制噪声的敏感程度,提高目标检测模型的稳定性、鲁棒性。
在一种可选实施方式中,根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量,包括:确定所述候选区域集合中第一数量个相对较高的损失值的平均值;采用所述平均值,确定扩张难例系数;根据所述扩张难例系数和所述基础难例数量,确定所述样本图像的扩张难例数量。
其中,第一数量可以为经验值,可以手动设置。第一数量可以由目标检测模型的初始损失分布决定,第一数量需满足扩张难例数量小于难例数量阈值,以难例数量阈值为1000为例,第一数量可以为100或200。
具体的,可以获取候选区域集合中第一数量个相对较高的损失值,并确定获取的损失值的平均值;根据如下公式确定样本图像的扩张难例系数:
Figure DEST_PATH_IMAGE005
其中,
Figure 621831DEST_PATH_IMAGE006
为扩张难例系数,
Figure DEST_PATH_IMAGE007
为损失值的平均值;由于损失值的平均值始终大 于0,因此扩张难例系数是指大于1。并且,将扩张难例系数和基础难例数量的乘积,作为样 本图像的扩张难例数量。
由于模型训练初期损失值的平均值较大,所以扩张难例系数较大,扩张难例数量接近于候选区域集合的总候选区域数量,因此从扩张难例集合中选择基础难例集合,近似于从候选区域集合中选择基础难例集合;训练后期,扩张难例数量越来越接近基础难例数量,因此扩张难例集合中候选区域被选到难例基础集合的概率越来越多,扩张难例集合中的候选区域可以称为扩张难例,难例基础集合中的候选区域可以称为基础难例。也就是说,动态地调整难例范围,使模型训练初期扩张难例集合的范围更大,从中随机选择基础难例的概率更小;模型训练后期,扩张难例集合的范围更小,从中随机选择基础难例的概率更大,可以提高模型训练时的稳定性。因此,从模型训练由初期到后期,能够逐步提高扩张难例被选作基础难例的概率,从而提高模型的学习效果,即提高模型的稳定性和鲁棒性。
实施例二
图3是本申请实施例二提供的另一种目标检测处理方法的流程图。本实施例在上述实施例的基础上进行进一步地优化。如图3所示,所述一种目标检测处理方法包括:
S210、确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值。
S220、根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量。
S230、从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合。
S240、根据所述目标检测模型在历史迭代过程中的损失值,确定所述目标检测模型在本轮迭代过程中的难例损失阈值。
S250、根据本轮迭代过程中的难例损失阈值,和所述基础难例集合中候选区域的损失值,确定所述基础难例集合中候选区域的重复采样次数。
S260、根据所述候选区域的重复采样次数,将重复采样的候选区域添加到所述基础难例集合中,以得到新基础难例集合,用于采用所述新基础难例集合对所述目标检测模型进行本轮迭代训练。
其中,基础难例集合包括基础难例数量个候选区域,基础难例集合中的候选区域可以称为基础难例,扩张难例集合包括扩张难例数量个候选区域,扩张难例集合中的候选区域可以称为扩张难例。
其中,历史迭代过程位于本次迭代过程之前,目标检测模型在某次迭代过程中的损失值是指在对目标检测模型在该次迭代过程中的整体损失值。本申请实施例对单次迭代过程中输入的样本图像数量不做具体限定。基础难例集合中候选区域的重复采样次数根据本轮迭代过程中的难例损失阈值,和该候选区域的损失值确定。因此,不同迭代过程的难例损失阈值可以不同,相同迭代过程中不同候选区域的重复采样次数可以不同。通过对基础难例集合中不同基础难例采用不同重复采样次数,也就是对不同难度系数的难例进行区分,相比于相同的重复采样次数,能够进一步提高模型的学习能力。
在一种可选实施方式中,根据所述目标检测模型在历史迭代过程中的损失值,确定所述目标检测模型在本轮迭代过程中的难例损失阈值,包括:将所述目标检测模型在本次迭代过程中的本次损失值,与在前第二数值次历史迭代过程中的历史损失值之间的损失均值,作为所述目标检测模型在本轮迭代过程中的难例损失阈值。
具体的,可以通过如下公式确定目标检测模型在本轮迭代过程中的难例损失阈值:
Figure DEST_PATH_IMAGE009
其中,thr为本轮迭代过程中的难例损失阈值,本次迭代过程为第c次迭代过程,t 为难例损失阈值的迭代周期长度,即每经t次迭代更新一次难例损失阈值,可手动设置的经 验参数,
Figure 954724DEST_PATH_IMAGE010
为第i次迭代过程的损失值。通过将t次迭代的损失均值作为难例损失阈 值,使难例损失阈值与模型成熟度呈正相关,即随着模型成熟度增加,难度损失阈值增加。
在一种可选实施方式中,根据本轮迭代过程中的难例损失阈值,和所述基础难例集合中候选区域的损失值,确定所述基础难例集合中候选区域的重复采样次数,包括:通过如下公式得到所述基础难例集合中候选区域的重复采样次数:s=⌊loss/thr⌋;
其中,s为重复采样次数,⌊ ⌋为向下取整算符,loss为基础难例集合中候选区域的损失值,thr为本轮迭代过程中的难例损失阈值。
具体的,针对基础难例集合中每一候选区域,可以确定该候选区域的损失值与难例损失阈值之间的比例值,且对该比例值向下取整得到该候选区域的重复采样次数,重复采样次数的最大值为经验值,例如可以为3。并且,如果任一候选区域的loss/thr小于1,即该候选区域的重复采样次数s取值为0,则不对该候选区域进行重复采样;如果该候选区域的重复采样次数s不为0,则对该候选区域进行s次重复采样,使新基础难例集合中包括s+1个候选区域。由于候选区域的重复采样次数与候选区域的损失值呈正相关,难度较大候选区域的重复采样次数也较大,能够加强对难度大候选区域的学习,提高模型的学习效果。
并且,在得到新基础难例集合之后,还可以将新基础难例集合中候选区域送到感兴趣区域池化层,再经RCNN网络进一步分类与回归,得到输出结果。
图4是本申请实施例二提供的动态难例挖掘与原难例挖掘相比的模型指标示意图,参考图4,动态扩充难例范围相比于原始OHEM,mAP(Mean Average Precision,均值平均精度)和AP50(两个矩形框面积的交集和并集的比值取50%)指标均有上升,并且假阳率(FP)降低,模型训练更稳定且鲁棒性更强。图5本申请实施例二提供的动态调整难例样本采样频率与固定采样频率相比的模型指标示意图,参考图5,动态调整难例样本采样频率相比于固定采样频率的模型指标,AP50保持稳定,mAP上升约1%,并且假阳率降低,模型训练效果更好。
本申请实施例通过动态扩张难例数量,动态调整难例的范围、难例损失阈值,控制难例样本的重复采样次数,从而降低噪声对模型的影响,使模型训练更加稳定,提高模型的鲁棒性,加强模型对于更难样本的学习。
实施例三
图6是本申请实施例三提供的一种目标检测处理装置的结构示意图,本实施例可适用于动态进行在线难例样本挖掘的情况。该装置可以由软件和/或硬件的方式来实现,可配置于电子设备中。如图6所示,该装置可以包括:
损失确定模块301,用于确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
扩张数量确定模块302,用于根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
基础难例集合确定模块303,用于从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
在一种可选实施方式中,扩张数量确定模块302包括:
平均值单元,用于确定所述候选区域集合中第一数量个相对较高的损失值的平均值;
扩张系数单元,用于采用所述平均值,确定扩张难例系数;
扩张数量单元,用于根据所述扩张难例系数和所述基础难例数量,确定所述样本图像的扩张难例数量。
在一种可选实施方式中,所述装置还包括重复采样模块,所述重复采样模块包括:
难例损失阈值单元,用于根据所述目标检测模型在历史迭代过程中的损失值,确定所述目标检测模型在本轮迭代过程中的难例损失阈值;
重复次数单元,用于根据本轮迭代过程中的难例损失阈值,和所述基础难例集合中候选区域的损失值,确定所述基础难例集合中候选区域的重复采样次数;
重复采样单元,用于根据所述候选区域的重复采样次数,将重复采样的候选区域添加到所述基础难例集合中,以得到新基础难例集合,用于采用所述新基础难例集合对所述目标检测模型进行本轮迭代训练。
在一种可选实施方式中,难例损失阈值单元具体用于:
将所述目标检测模型在本次迭代过程中的本次损失值,与在前第二数值次历史迭代过程中的历史损失值之间的损失均值,作为所述目标检测模型在本轮迭代过程中的难例损失阈值。
在一种可选实施方式中,重复次数单元具体用于:
通过如下公式得到所述基础难例集合中候选区域的重复采样次数:
s=⌊loss/thr⌋
其中,s为重复采样次数,⌊ ⌋为向下取整算符,loss为基础难例集合中候选区域的损失值,thr为本轮迭代过程中的难例损失阈值。
本发明实施例所提供的一种目标检测处理装置可执行本发明任意实施例所提供的一种目标检测处理方法,具备执行一种目标检测处理方法相应的功能模块和有益效果。
实施例四
本申请实施例四还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种目标检测处理方法,该方法包括:
确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
存储介质是指任何的各种类型的存储器电子设备或存储电子设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机***存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM,兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机***中,或者可以位于不同的第二计算机***中,第二计算机***通过网络(诸如因特网)连接到计算机***。第二计算机***可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同未知中(例如在通过网络连接的不同计 算机***中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的一种目标检测处理操作,还可以执行本申请任意实施例所提供的一种目标检测处理方法中的相关操作。
实施例五
本申请实施例五提供了一种电子设备,该电子设备中可集成本申请实施例提供的一种目标检测处理装置,该电子设备可以是配置于***内的,也可以是执行***内的部分或者全部功能的设备。图7是本申请实施例五提供的一种电子设备的结构示意图。如图7所示,本实施例提供了一种电子设备400,其包括:一个或多个处理器420;存储装置410,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器420执行,使得所述一个或多个处理器420实现本申请实施例所提供的一种目标检测处理方法,该方法包括:
确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
当然,本领域技术人员可以理解,处理器420还实现本申请任意实施例所提供的一种目标检测处理方法的技术方案。
图7显示的电子设备400仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,该电子设备400包括处理器420、存储装置410、输入装置430和输出装置440;电子设备中处理器420的数量可以是一个或多个,图7中以一个处理器420为例;电子设备中的处理器420、存储装置410、输入装置430和输出装置440可以通过总线或其他方式连接,图7中以通过总线450连接为例。
存储装置410作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块单元,如本申请实施例中的一种目标检测处理方法对应的程序指令。
存储装置410可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储装置410可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储装置410可进一步包括相对于处理器420远程设置的存储器,这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字、字符信息或语音信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏、扬声器等电子设备。
上述实施例中提供的一种目标检测处理装置、介质及电子设备可执行本申请任意实施例所提供的一种目标检测处理方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的一种目标检测处理方法。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.一种目标检测处理方法,其特征在于,包括:
确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量,包括:
确定所述候选区域集合中第一数量个相对较高的损失值的平均值;
采用所述平均值,确定扩张难例系数;
根据所述扩张难例系数和所述基础难例数量,确定所述样本图像的扩张难例数量。
3.根据权利要求1所述的方法,其特征在于,所述从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合之后,还包括:
根据所述目标检测模型在历史迭代过程中的损失值,确定所述目标检测模型在本轮迭代过程中的难例损失阈值;
根据本轮迭代过程中的难例损失阈值,和所述基础难例集合中候选区域的损失值,确定所述基础难例集合中候选区域的重复采样次数;
根据所述候选区域的重复采样次数,将重复采样的候选区域添加到所述基础难例集合中,以得到新基础难例集合,用于采用所述新基础难例集合对所述目标检测模型进行本轮迭代训练。
4.根据权利要求3所述的方法,其特征在于,根据所述目标检测模型在历史迭代过程中的损失值,确定所述目标检测模型在本轮迭代过程中的难例损失阈值,包括:
将所述目标检测模型在本次迭代过程中的本次损失值,与在前第二数值次历史迭代过程中的历史损失值之间的损失均值,作为所述目标检测模型在本轮迭代过程中的难例损失阈值。
5.根据权利要求3所述的方法,其特征在于,所述根据本轮迭代过程中的难例损失阈值,和所述基础难例集合中候选区域的损失值,确定所述基础难例集合中候选区域的重复采样次数,包括:
通过如下公式得到所述基础难例集合中候选区域的重复采样次数:
s=⌊loss/thr⌋
其中,s为重复采样次数,⌊ ⌋为向下取整算符,loss为基础难例集合中候选区域的损失值,thr为本轮迭代过程中的难例损失阈值。
6.一种目标检测处理装置,其特征在于,包括:
损失确定模块,用于确定样本图像的候选区域集合,以及所述候选区域集合中候选区域的损失值;
扩张数量确定模块,用于根据所述候选区域的损失值和目标检测模型的基础难例数量,确定所述样本图像的扩张难例数量;
基础难例集合确定模块,用于从所述候选区域集合中选择损失值相对较高的扩张难例数量个候选区域,以得到所述样本图像的扩张难例集合,且从所述扩张难例集合中选择基础难例数量个候选区域,以得到所述样本图像的基础难例集合,用于采用所述样本图像的基础难例集合对所述目标检测模型进行训练。
7.根据权利要求6所述的装置,其特征在于,所述扩张数量确定模块包括:
平均值单元,用于确定所述候选区域集合中第一数量个相对较高的损失值的平均值;
扩张系数单元,用于采用所述平均值,确定扩张难例系数;
扩张数量单元,用于根据所述扩张难例系数和所述基础难例数量,确定所述样本图像的扩张难例数量。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括重复采样模块,所述重复采样模块包括:
难例损失阈值单元,用于根据所述目标检测模型在历史迭代过程中的损失值,确定所述目标检测模型在本轮迭代过程中的难例损失阈值;
重复次数单元,用于根据本轮迭代过程中的难例损失阈值,和所述基础难例集合中候选区域的损失值,确定所述基础难例集合中候选区域的重复采样次数;
重复采样单元,用于根据所述候选区域的重复采样次数,将重复采样的候选区域添加到所述基础难例集合中,以得到新基础难例集合,用于采用所述新基础难例集合对所述目标检测模型进行本轮迭代训练。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
10.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-5中任一项所述的方法。
CN202110581939.1A 2021-05-27 2021-05-27 目标检测处理方法、装置、介质及电子设备 Active CN113033719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110581939.1A CN113033719B (zh) 2021-05-27 2021-05-27 目标检测处理方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110581939.1A CN113033719B (zh) 2021-05-27 2021-05-27 目标检测处理方法、装置、介质及电子设备

Publications (2)

Publication Number Publication Date
CN113033719A true CN113033719A (zh) 2021-06-25
CN113033719B CN113033719B (zh) 2021-08-24

Family

ID=76455989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110581939.1A Active CN113033719B (zh) 2021-05-27 2021-05-27 目标检测处理方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN113033719B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780277A (zh) * 2021-09-08 2021-12-10 浙江啄云智能科技有限公司 目标检测模型的训练方法、装置、电子设备及存储介质
CN115294536A (zh) * 2022-08-10 2022-11-04 北京百度网讯科技有限公司 基于人工智能的违章检测方法、装置、设备及存储介质
CN115359308A (zh) * 2022-04-06 2022-11-18 北京百度网讯科技有限公司 模型训练、难例识别方法、装置、设备、存储介质及程序

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489034A (zh) * 2013-10-12 2014-01-01 山东省科学院海洋仪器仪表研究所 预测与诊断在线海流监测数据的方法和装置
CN107633232A (zh) * 2017-09-26 2018-01-26 四川长虹电器股份有限公司 一种基于深度学习的低维人脸模型训练方法
CN110322438A (zh) * 2019-06-26 2019-10-11 杭州上池科技有限公司 结核分枝杆菌自动检测模型的训练方法及自动检测***
US20190392242A1 (en) * 2018-06-20 2019-12-26 Zoox, Inc. Instance segmentation inferred from machine-learning model output
CN111598175A (zh) * 2020-05-19 2020-08-28 南京甄视智能科技有限公司 一种基于在线难例挖掘方式的检测器训练优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489034A (zh) * 2013-10-12 2014-01-01 山东省科学院海洋仪器仪表研究所 预测与诊断在线海流监测数据的方法和装置
CN107633232A (zh) * 2017-09-26 2018-01-26 四川长虹电器股份有限公司 一种基于深度学习的低维人脸模型训练方法
US20190392242A1 (en) * 2018-06-20 2019-12-26 Zoox, Inc. Instance segmentation inferred from machine-learning model output
CN110322438A (zh) * 2019-06-26 2019-10-11 杭州上池科技有限公司 结核分枝杆菌自动检测模型的训练方法及自动检测***
CN111598175A (zh) * 2020-05-19 2020-08-28 南京甄视智能科技有限公司 一种基于在线难例挖掘方式的检测器训练优化方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780277A (zh) * 2021-09-08 2021-12-10 浙江啄云智能科技有限公司 目标检测模型的训练方法、装置、电子设备及存储介质
CN113780277B (zh) * 2021-09-08 2023-06-30 浙江啄云智能科技有限公司 目标检测模型的训练方法、装置、电子设备及存储介质
CN115359308A (zh) * 2022-04-06 2022-11-18 北京百度网讯科技有限公司 模型训练、难例识别方法、装置、设备、存储介质及程序
CN115359308B (zh) * 2022-04-06 2024-02-13 北京百度网讯科技有限公司 模型训练、难例识别方法、装置、设备、存储介质及程序
CN115294536A (zh) * 2022-08-10 2022-11-04 北京百度网讯科技有限公司 基于人工智能的违章检测方法、装置、设备及存储介质
CN115294536B (zh) * 2022-08-10 2023-07-28 北京百度网讯科技有限公司 基于人工智能的违章检测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113033719B (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN113033719B (zh) 目标检测处理方法、装置、介质及电子设备
CN110991311A (zh) 一种基于密集连接深度网络的目标检测方法
US9025889B2 (en) Method, apparatus and computer program product for providing pattern detection with unknown noise levels
CN108229675B (zh) 神经网络的训练方法、物体检测方法、装置和电子设备
CN113408634A (zh) 模型推荐方法及装置、设备、计算机存储介质
CN110659658B (zh) 一种目标检测方法及其装置
CN111126278A (zh) 针对少类别场景的目标检测模型优化与加速的方法
CN112906865B (zh) 神经网络架构搜索方法、装置、电子设备及存储介质
CN110866872A (zh) 一种路面裂缝图片预处理智能选择方法、装置及电子设备
CN111753870B (zh) 目标检测模型的训练方法、装置和存储介质
CN115797735A (zh) 目标检测方法、装置、设备和存储介质
CN111738319A (zh) 一种基于大规模样本的聚类结果评价方法及装置
CN117350929B (zh) 一种基于改进元启发式算法的电力图像增强优化方法
CN116188834B (zh) 基于自适应训练模型的全切片图像分类方法及装置
US20230401670A1 (en) Multi-scale autoencoder generation method, electronic device and readable storage medium
CN111353822A (zh) 一种图像布局、模型训练方法、装置、设备及存储介质
CN111222558A (zh) 图像处理方法及存储介质
CN115049851A (zh) 基于YOLOv5网络的目标检测方法、装置和设备终端
CN113962332B (zh) 基于自优化融合反馈的显著目标识别方法
CN113947154A (zh) 一种目标检测方法、***、电子设备及存储介质
CN114529828A (zh) 遥感图像居民地要素提取方法和装置及设备
CN112016599B (zh) 用于图像检索的神经网络训练方法、装置及电子设备
CN112819079A (zh) 模型的采样算法匹配方法、装置和电子设备
CN112580689A (zh) 神经网络模型的训练方法、应用方法、装置和电子设备
CN111626370B (zh) 基于神经网络的镂空识别方法及装置、存储介质、终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant