CN113378829A - 一种基于正负样本均衡的弱监督目标检测方法 - Google Patents

一种基于正负样本均衡的弱监督目标检测方法 Download PDF

Info

Publication number
CN113378829A
CN113378829A CN202011481683.9A CN202011481683A CN113378829A CN 113378829 A CN113378829 A CN 113378829A CN 202011481683 A CN202011481683 A CN 202011481683A CN 113378829 A CN113378829 A CN 113378829A
Authority
CN
China
Prior art keywords
target candidate
frame
target
branch
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011481683.9A
Other languages
English (en)
Other versions
CN113378829B (zh
Inventor
阮颖颖
龚小谨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202011481683.9A priority Critical patent/CN113378829B/zh
Publication of CN113378829A publication Critical patent/CN113378829A/zh
Application granted granted Critical
Publication of CN113378829B publication Critical patent/CN113378829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于正负样本均衡的弱监督目标检测方法。采集需要进行目标检测的场景图像,场景图像对应有标签,主要由场景图像和对应的标签组成训练集;将训练集输入筛选目标候选框模块,筛选目标候选框模块输出场景图像对应的初始目标候选框;建立弱监督目标检测网络,将训练集和对应的初始目标候选框同时输入弱监督目标检测网络中进行训练,训练过程中,获得训练后的弱监督目标检测网络;将待测场景图像分别输入到筛选目标候选框模块和训练后的弱监督目标检测网络中,对待测场景图像的目标进行分类与定位。本发明只需要含有图像所对应的图像级类别标签数据集,在无目标框级别标签存在的情况下有较好的目标检测能力。

Description

一种基于正负样本均衡的弱监督目标检测方法
技术领域
本发明属于计算机视觉技术领域,涉及了一种图像目标的检测方法,具体 涉及了一种基于正负样本均衡的弱监督目标检测方法。
背景技术
目标检测任务的目的是对待识别图像中存在的目标进行定位与分类。由于 目标检测广泛应用于自动驾驶、视频监控、工业检测等方面,近几年这一任务 吸引了工业界和学术界的广泛关注和研究。
在目标检测任务中,全监督的方法需要目标框级别的标签提供位置与类别 信息,而给大量图像进行目标框级别的标注是费时费力的,并且许多现实应用 场景下不存在专门的大规模标注数据集,标注数据十分稀缺;为了缓解这一问 题,许多弱监督、半监督目标检测方法被提出。
其中仅有图像级别标签的弱监督目标检测方法起初基于多示例学习。随着 深度卷积网络的发展,许多弱监督目标检测方法将多示例学习与卷积神经网络 结合在一起,如Hakan Bilen等人发表在《In Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition》的《Weakly supervised deep detection networks》以及Peng Tang等人发表在《In Proceedings of the IEEE Conference on ComputerVision and Pattern Recognition》的《Multiple instance detection network withonline instance classifier refinement》都是弱监督目标检测方法中常被选择的 模型结构。
现有的弱监督目标检测方法由于缺少空间信息的标注,与全监督目标检测 之间存在较大的差距,如何更好的挖掘图像级别标签中所含有的信息,平衡正 负样本以检测出更完整的目标仍是值得探究的问题。
发明内容
为了解决弱监督目标检测中存在的问题,本发明提供了一种基于正负样本 均衡的弱监督目标检测方法,以弱监督目标检测中常用到的OICR网络作为本发 明的基础网络模型,在此基础上,关注于弱监督目标检测中目标候选框正负样 本数目的不均衡以及同类别多物体存在的情况,利用弱监督语义分割提供的信 息筛选负样本,利用训练过程中间的信息挖掘更多的正样本,以提升弱监督目 标检测模型的检测能力。
本发明是针对只有图像级别的类别标注信息场景下的弱监督目标检测。
本发明的技术方案如下:
1)采集需要进行目标检测的场景图像,场景图像对应有标签,主要由场景 图像和对应的标签组成训练集;
2)将训练集输入筛选目标候选框模块,筛选目标候选框模块通过选择性搜 索方法获取场景图像的所有目标候选框,根据场景图像对应的弱监督语义分割 结果M计算所有目标候选框的环境系数,将所有目标候选框的环境系数进行排序 并选择环境系数靠前的若干个目标候选框,将选择的目标候选框作为场景图像 对应的初始目标候选框;
3)建立弱监督目标检测网络,将步骤1)中的训练集和步骤2)中对应的 初始目标候选框同时输入弱监督目标检测网络中进行训练,训练过程中利用最 优目标框更新方法获得训练后的弱监督目标检测网络;
4)将待测场景图像分别输入到筛选目标候选框模块和训练后的弱监督目标 检测网络中,对待测场景图像的目标进行分类与定位。
环境系数的计算具体为:
对含有n个目标候选框的场景图像,每一个目标候选框r都有一个对应的扩 大边框,将目标候选框与目标候选框对应的扩大边框之间的区域记作环境区域cr; 计算弱监督语义分割结果M在目标候选框r区域中概率值的均值并记为内部系数 Sin;同时,将弱监督语义分割结果M在环境区域cr中的概率值进行降序排列, 计算前50%的概率值的均值并记为外部系数Sout,目标候选框r的环境系数Sr由 下式计算获得:
Sr=Sin-Sout
弱监督目标检测网络包括特征提取模块、多示例检测分支、若干个示例优 化分支和边框回归分支;特征提取模块的输出分别作为多示例检测分支、若干 个示例优化分支和边框回归分支的输入,步骤1)中的训练集的标签监督多示例 检测分支,多示例检测分支的输出经过处理后监督第一个示例优化分支,前一 个示例优化分支的输出经过处理后监督后一个示例优化分支,若干个示例优化 分支的输出均经过处理后监督边框回归分支,边框回归分支输出筛选目标候选 框模块输入弱监督目标检测网络的目标候选框对应的位置偏移量。
特征提取模块主要由卷积模块、ROI池化层、第一全连接层和第二全连接 层依次连接构成;其中,训练集中的场景图像作为卷积模块的输入,卷积模块 的输出和初始目标候选框进行处理后共同作为ROI池化层的输入;卷积模块提 取场景图像的特征图后通过ROI池化层、第一全连接层和第二全连接层获取所 有初始目标候选框的特征图,将所有初始目标候选框的特征图分别输入到多示 例检测分支、若干个示例优化分支和边框回归分支中。
多示例检测分支包括第三全连接层、第四全连接层、第一Softmax输出层、 第二Softmax输出层和累加层;第三全连接层作为多示例检测分支的第一输入层, 第四全连接层作为多示例检测分支的第二输入层,第三全连接层与第一Softmax 输出层相连,第四全连接层与第二Softmax输出层相连,第三全连接层输出分类 结果xcls,第四全连接层输出定位结果xdet,训练集中的标签为
Figure BDA0002837775580000031
其中,xcls,
Figure BDA0002837775580000032
y1为第一类别的真假值, y2为第二类别的真假值,yc为第C类别的真假值,C为所有类别的个数,R为 实数集,n表示场景图像中含有的n个目标候选框;第一Softmax输出层的输出 和第二Softmax输出层的输出经过哈达玛积操作后输入到累加层;第一Softmax 输出层的输出和第二Softmax输出层的输出经过哈达玛积操作后输出所有候选框的目标候选框可信度
Figure BDA0002837775580000033
累加层输出场景图像的预测可信 度
Figure BDA0002837775580000034
标签监督累加层的输出,其中,
Figure BDA0002837775580000035
表示哈达玛积操作,σ()表 示Softmax操作,
Figure BDA0002837775580000036
表示第r个目标候选框第c个类别的目标候选框可信度;多 示例检测分支的损失函数Lmil如下:
Figure BDA0002837775580000037
其中,c为其中一个类别,yc为第c类别的真假值;
最终的所有候选框的目标候选框可信度作为多示例检测分支的输出。
示例优化分支主要由第五全连接层和第三Softmax输出层依次相连组成;
第一个示例优化分支,从多示例检测分支中得到的目标候选框可信度中场 景图像所含类别对应的系数与对应的环境系数之和最高的目标候选框作为正样 本,正样本的标签为目标候选框对应的场景图像所含类别,剩余的目标候选框 中与正样本的重叠度大于设置的阈值Lable_t的目标候选框会被标注为与正样本 相同的类别,与正样本的重叠度小于或等于设置的阈值Lable_t的目标候选框标 注为背景,背景作为负样本,正样本和负样本组成伪真值,伪真值监督第一个 示例优化分支的训练,第一个示例优化分支训练后获得一个优化分支目标候选 框可信度;
后一个示例优化分支从前一个示例优化分支中得到的优化分支目标候选框 可信度中场景图像所含类别对应的系数与对应的环境系数之和最高的目标候选 框为最优目标候选框,最优目标候选框作为正样本;正样本的标签为目标候选 框对应的场景图像所含类别,剩余的目标候选框中与正样本的重叠度大于设置 的阈值Lable_t的目标候选框会被标注为与正样本相同的类别,与正样本的重叠 度小于或等于设置的阈值Lable_t的目标候选框标注为背景,背景作为负样本, 正样本和负样本组成伪真值,伪真值监督本后一个示例优化分支的训练,每一 个示例优化分支训练后均获得一个优化分支目标候选框可信度;其中监督第k 个示例优化分支时,候选框r对应的伪真值
Figure BDA0002837775580000041
满足
Figure BDA0002837775580000042
其中,
Figure BDA0002837775580000043
为第k个示例优化分支时, 目标候选框r在第一类别下的伪真值;
Figure BDA0002837775580000044
为第k个示例优化分支时,目标候选框 r在第二类别下的伪真值;
Figure BDA0002837775580000045
为第k个示例优化分支时,目标候选框r在第三类 别下的伪真值;
Figure BDA0002837775580000046
为第k个示例优化分支时,目标候选框r在背景下的伪真 值;伪真值
Figure BDA0002837775580000047
监督第k个示例优化分支的训练,示例优化分支的损失函数为加 权交叉熵损失函数,如下式:
Figure BDA0002837775580000048
其中,
Figure BDA0002837775580000049
为第k个示例优化分支输出第c个类别的第r个目标候选框可信度, 权重
Figure BDA00028377755800000410
为与第r个目标候选框覆盖程度最大的上一分支选择的系数最高的目标 候选框的目标候选框可信度,C+1为背景;
所有示例优化分支在训练的过程中采取最优目标框更新方法,最优目标框 更新方法具体为:
对训练集中的场景图像,建立场景图像对应的最优目标框集合Gc,每一个 最优目标框集合Gc对应每一个存在的类别c∈C,最优目标框集合Gc来更新弱监 督目标检测网络的不同训练阶段的各个示例优化分支选出的最优目标候选框, 选出的最优目标候选框赋值给最优目标框集合Gc;在后续的迭代训练中,按照 下式不断更新最优目标框集合Gc中包含的目标候选框:
Figure BDA00028377755800000411
其中TPA(·)表示最优目标候选框更新方法,t表示弱监督目标检测网络第t 轮训练,
Figure BDA00028377755800000412
表示第t轮次训练下第c个类别的最优目标候选框。
边框回归分支主要由第六全连接层组成;
在第一轮迭代训练时,对所有示例优化分支中的同一类别的优化分支目标 候选框可信度进行取均值,获得所有类别的目标候选框可信度均值,选取图像 所含类别中不同类别的最高的目标候选框可信度均值所对应的目标候选框,该 目标候选框作为伪真值监督边框回归分支;
从第二轮迭代训练开始,边框回归分支的伪真值为最优目标框集合Gc,最 优目标框集合Gc监督边框回归分支,边框回归分支的损失函数Lreg为平滑L1损 失函数;
弱监督目标检测网络的训练通过随机梯度下降优化方法优化多示例检测分 支、示例优化分支和边框回归分支分损失函数:
Figure BDA0002837775580000051
其中,L为弱监督目标检测网络整体的损失函数。
正样本的选择方式具体为:
第一轮次训练阶段,选择多示例检测分支中得到的最优目标候选框或者示 例优化分支中得到的最优目标候选框作为正样本;
第二轮次训练阶段时,选择第一轮次后的多示例检测分支中得到的最优目 标候选框或者示例优化分支中得到的最优目标候选框作为正样本并且初始化最 优目标框集合Gc
之后的训练阶段中,首先选择多示例检测分支中得到的最优目标候选框, 判断最优目标候选框与对应类别最优目标框集合Gc中的目标候选框是否有重叠 部分,若最优目标候选框和目标候选框有重叠,则将对应类别最优目标框集合G 中的目标候选框移除;进行下一个示例优化分支,选择示例优化分支中得到的 最优目标候选框,判断最优目标候选框与对应类别最优目标框集合Gc中的目标 候选框是否有重叠部分,若最优目标候选框和目标候选框有重叠,则将对应类 别最优目标框集合Gc中的目标候选框移除;直至本训练阶段中的最优目标候选 框与对应类别最优目标框集合Gc中的目标候选框均无重叠,将最优目标候选框 加入到对应类别最优目标框集合Gc中,最后对应类别最优目标框集合Gc中的所有目标候选框作为正样本。
步骤4)具体为:
待测场景图像通过选择性搜索方法获取所有待测目标候选框,将待测场景 图像与所有待测目标候选框输入训练后的弱监督目标检测网络中,所有示例优 化分支输出优化分支目标候选框可信度以及边框回归分支输出的边框偏移量, 对所有示例优化分支中的同一类别的优化分支目标候选框可信度进行取均值, 获得所有类别的目标候选框可信度均值,每一类的目标候选框可信度均值为该 类下的分类置信度,从边框回归分支得到边框偏移量,根据所有类别的目标候 选框可信度均值和边框偏移量来获得未知待检测图像中所有预测框,对所有预 测框进行非极大值抑制得到获得未知待检测图像的最终预测框。
对所有预测框进行非极大值抑制得到获得未知待检测图像的最终预测框具 体为:
首先判断两个预测框之间的交并比是否大于非极大值抑制设定的交并比阈 值;若两个预测框之间的交并比大于交并比阈值,比较两个预测框在每一类下 的分类置信度,保留该类分类置信度更大的预测框,将该类分类置信度较小的 预测框的该类分类置信度置为0,即忽略该预测框为该类的概率;对所有的预测 框进行两两比较后,根据分类置信度阈值再对保留下来的预测框的分类置信度 进行筛选,高于分类置信度阈值的预测框作为预测框最终的检测结果。
多示例分支检测和示例优化分支中的监督为弱监督方式。
本发明具有以下有益效果:
1、利用弱监督语义分割的结果初步区分目标候选框中的负样本,在训练前 筛选部分负样本,减小正负样本之间数目的差异,防止负样本在网络训练中占 主导,此外,目标候选框数目的减少也减少了训练过程中的计算量;
2、利用训练中间结果的信息,引入最优目标框更新方法,缓解同类别多物 体存在时的OICR网络选取正样本的不合理之处,OICR网络在生成伪真值时只 能选择图像所含类别的一个系数最高的目标框,当同类别多物体存在时,除了 被选中的目标框所包含的物体,其余物体的伪真值会被标注为背景,最优目标 框更新方法根据训练过程中网络关注区域的变化,将中间过程选出的正样本累 积至后续训练过程之中,挖掘更多的正样本,减少目标被分类为背景的概率, 使得示例优化分支以及边框回归分支的伪真值更可信;
3、本发明只需要图像级别标注的训练数据,大大减少了目标检测数据的标 注成本,并且能够达到较好的目标检测性能。
附图说明
图1是本发明的网络模型示意图。
图2是本发明的一些检测结果示意图。
图3是最优目标框更新方法示意图。
具体实施方式
下面结合附图对本发明进行进一步的说明,本发明的实施例及其实施过程 是:
如图1所示,本发明包括以下步骤:
1)采集需要进行目标检测的场景图像,场景图像对应有标签,主要由场景 图像和对应的标签组成训练集,标签包含场景图像中所有的需要检测的目标所 对应的类别,标签不包含目标的位置和场景图像中同一类别的目标数量;
2)将训练集输入筛选目标候选框模块,筛选目标候选框模块通过选择性搜 索方法获取场景图像的所有目标候选框,根据场景图像对应的弱监督语义分割 结果M,弱监督语义分割的结果由弱监督语义分割方法获得,计算所有目标候选 框的环境系数,将所有目标候选框的环境系数进行排序并选择环境系数靠前的 若干个目标候选框,具体实施中若干个为400个,将选择的目标候选框作为场 景图像对应的初始目标候选框;
环境系数的计算具体为:
对含有n个目标候选框的场景图像,每一个目标候选框r都有一个对应的扩 大边框,扩大的倍数取1.1倍,即扩大区域的长和宽为目标候选框长和宽的1.1 倍,将目标候选框与目标候选框对应的扩大边框之间的区域记作环境区域cr;计 算弱监督语义分割结果M在目标候选框r区域中概率值的均值并记为内部系数 Sin;同时,将弱监督语义分割结果M在环境区域cr中的概率值进行降序排列, 计算前50%的概率值的均值并记为外部系数Sout,目标候选框r的环境系数Sr由 下式计算获得:
Sr=Sin-Sout
3)建立弱监督目标检测网络,将步骤1)中的训练集和步骤2)中对应的 初始目标候选框同时输入弱监督目标检测网络中进行训练,在训练的过程中, 累积选择的正样本,选择的正样本延续到后续的训练过程中,弱监督目标检测 网络训练过程中使用随机梯度下降优化算法(SGD),使用到的损失函数有交 叉熵损失和平滑L1损失函数;训练过程中利用最优目标框更新方法获得训练后 的弱监督目标检测网络;
弱监督目标检测网络包括特征提取模块、多示例检测分支、若干个示例优 化分支和边框回归分支;弱监督目标检测网络是改进的OICR网络,OICR网络 包含特征提取部分、多示例检测分支和示例优化分支,特征提取部分包括卷积 模块,将OICR网络的特征提取部分中的卷积模块由ImageNet数据集训练后的 VGG 16神经网络中的卷积模块部分替换,替换后的卷积模块的结构和初始值与 ImageNet数据集训练后的VGG 16神经网络中的卷积模块部分的结构和初始值 相同,初始值具体为偏移量和卷积核的权重;并在OICR网络中加入边框回归分 支,最终形成改进的OICR网络。特征提取模块的输出分别作为多示例检测分支、 若干个示例优化分支和边框回归分支的输入,步骤1)中的训练集的标签监督多 示例检测分支,多示例检测分支的输出经过处理后监督第一个示例优化分支, 前一个示例优化分支的输出经过处理后监督后一个示例优化分支,若干个示例 优化分支的输出均经过处理后监督边框回归分支,边框回归分支输出筛选目标 候选框模块输入弱监督目标检测网络的目标候选框对应的位置偏移量。
筛选目标候选框模块输入弱监督目标检测网络的目标候选框具体为:在训 练时,目标候选框为初始目标候选框;在测试时,目标候选框为待测目标候选 框。
特征提取模块主要由卷积模块、ROI池化层、第一全连接层和第二全连接 层依次连接构成;其中,训练集中的场景图像作为卷积模块的输入,卷积模块 的输出和初始目标候选框进行处理后共同作为ROI池化层的输入,即弱监督目 标检测网络的输入为训练集以及每个场景图像对应的400个目标候选框,400个 目标候选框R记作R=(R_1,R_2,R_3,…,R_400);卷积模块提取场景图像的特征 图后通过ROI池化层、第一全连接层和第二全连接层获取所有初始目标候选框 的特征图,将所有初始目标候选框的特征图分别输入到多示例检测分支、若干 个示例优化分支和边框回归分支中。
多示例检测分支包括第三全连接层、第四全连接层、第一Softmax输出层、 第二Softmax输出层和累加层;第三全连接层作为多示例检测分支的第一输入层, 第四全连接层作为多示例检测分支的第二输入层,第三全连接层和第四全连接 层的参数均初始化为标准差为0.01的正态分布,特征提取模块的输出同时输入 到第三全连接层和第四全连接层中,第三全连接层与第一Softmax输出层相连, 第四全连接层与第二Softmax输出层相连,第三全连接层输出分类结果xcls,第 四全连接层输出定位结果xdet,训练集中的标签为
Figure BDA0002837775580000081
其中,xcls,
Figure BDA0002837775580000082
y1为第一类别的真假值,y2为第二类别的真假值,yC为 第C类别的真假值,C为所有类别的个数,R为实数集,n表示场景图像中含有 的n个目标候选框;第一Softmax输出层的输出和第二Softmax输出层的输出经过哈达玛积操作后输入到累加层;第一Softmax输出层的输出和第二Softmax输 出层的输出经过哈达玛积操作后输出所有候选框的目标候选框可信度
Figure BDA0002837775580000083
累加层输出场景图像的预测可信度
Figure BDA0002837775580000084
标签 监督累加层的输出,其中,
Figure BDA0002837775580000085
表示哈达玛积操作,σ()表示Softmax操作,
Figure BDA0002837775580000086
表 示第r个目标候选框第c个类别的目标候选框可信度;多示例检测分支的损失函 数Lmil如下:
Figure BDA0002837775580000087
其中,c为其中一个类别,yc为第c类别的真假值;
最终的所有候选框的目标候选框可信度作为多示例检测分支的输出。
示例优化分支主要由第五全连接层和第三Softmax输出层依次相连组成;第 五全连接层的参数初始化为标准差为0.01的正态分布。
第一个示例优化分支,从多示例检测分支中得到的目标候选框可信度中场 景图像所含类别对应的系数与对应的环境系数之和最高的目标候选框作为正样 本,正样本的标签为目标候选框对应的场景图像所含类别,剩余的目标候选框 中与正样本的重叠度大于设置的阈值Lable_t的目标候选框会被标注为与正样本 相同的类别,与正样本的重叠度小于或等于设置的阈值Lable_t的目标候选框标 注为背景,其中重叠度由交并比(IoU)评价,Lable_t设置为0.5,背景作为负 样本,正样本和负样本组成伪真值,伪真值监督第一个示例优化分支的训练, 第一个示例优化分支训练后获得一个优化分支目标候选框可信度;
后一个示例优化分支从前一个示例优化分支中得到的优化分支目标候选框 可信度中场景图像所含类别对应的系数与对应的环境系数之和最高的目标候选 框为最优目标候选框,最优目标候选框作为正样本;正样本的标签为目标候选 框对应的场景图像所含类别,剩余的目标候选框中与正样本的重叠度大于设置 的阈值Lable_t的目标候选框会被标注为与正样本相同的类别,与正样本的重叠 度小于或等于设置的阈值Lable_t的目标候选框标注为背景,背景作为负样本, 正样本和负样本组成伪真值,伪真值监督本后一个示例优化分支的训练,每一 个示例优化分支训练后均获得一个优化分支目标候选框可信度;其中监督第k 个示例优化分支时,候选框r对应的伪真值
Figure BDA0002837775580000091
满足
Figure BDA0002837775580000092
其中,
Figure BDA0002837775580000093
为第k个示例优化分支时, 目标候选框r在第一类别下的伪真值;
Figure BDA0002837775580000094
为第k个示例优化分支时,目标候选框 r在第二类别下的伪真值;
Figure BDA0002837775580000095
为第k个示例优化分支时,目标候选框r在第三类 别下的伪真值;
Figure BDA0002837775580000096
为第k个示例优化分支时,目标候选框r在背景下的伪真 值;伪真值
Figure BDA0002837775580000097
监督第k个示例优化分支的训练,示例优化分支的损失函数为加 权交叉熵损失函数,如下式:
Figure BDA0002837775580000098
其中,
Figure BDA0002837775580000099
为第k个示例优化分支输出第c个类别的第r个目标候选框可信度, 权重
Figure BDA00028377755800000910
为与第r个目标候选框覆盖程度最大的上一分支选择的系数最高的目标 候选框的目标候选框可信度,C+1为背景;
如图2所示,所有示例优化分支在训练的过程中采取最优目标框更新方法, 最优目标框更新方法具体为:
对训练集中的场景图像,建立场景图像对应的最优目标框集合Gc,每一个 最优目标框集合Gc对应每一个存在的类别c∈C,最优目标框集合G_c个数与图 像I中存在的类别数量相同,最优目标框集合Gc来更新弱监督目标检测网络的不 同训练阶段的各个示例优化分支选出的最优目标候选框,在训练的初期阶段, 弱监督目标检测网络的检测能力较差,因此选择从第二轮迭代训练开始累积系 数和最高的目标候选框,第二轮迭代训练中,选出的最优目标候选框赋值给最 优目标框集合Gc;在后续的迭代训练中,按照下式不断更新最优目标框集合Gc中 包含的目标候选框,目标候选框中包含目标候选框左上角坐标以及对应目标框 的长和宽:
Figure BDA0002837775580000101
其中TPA(·)表示最优目标候选框更新方法,t表示弱监督目标检测网络第t 轮训练,
Figure BDA0002837775580000102
表示第t轮次训练下第c个类别的最优目标候选框。
更具体的,最优目标框集合Gc的确定为:如果第t轮次训练下第c个类别的 最优目标候选框
Figure BDA0002837775580000103
与最优目标框集合Gc中所有的目标候选框都没有重叠,那么 直接将第t轮次训练下第c个类别的最优目标候选框
Figure BDA0002837775580000104
加入到最优目标框集合Gc中,否则先将与最优目标框集合Gc中与第t轮次训练下第c个类别的最优目标候 选框
Figure BDA0002837775580000105
重叠的目标候选框从最优目标框集合Gc中移除,再将第t轮次训练下第c 个类别的最优目标候选框
Figure BDA0002837775580000106
加入到最优目标框集合Gc中,第二次训练迭代之后 的示例优化分支的正样本的选择来自最优目标框集合Gc而不是仅选择多示例检 测分支中得到的最优目标候选框或者示例优化分支中得到的最优目标候选框;
正样本的选择方式具体为:
第一轮次训练阶段,选择多示例检测分支中得到的最优目标候选框或者示 例优化分支中得到的最优目标候选框作为正样本;
第二轮次训练阶段时,选择第一轮次后的多示例检测分支中得到的最优目 标候选框或者示例优化分支中得到的最优目标候选框作为正样本并且初始化最 优目标框集合Gc
之后的训练阶段中,首先选择多示例检测分支中得到的最优目标候选框, 判断最优目标候选框与对应类别最优目标框集合Gc中的目标候选框是否有重叠 部分,若最优目标候选框和目标候选框有重叠,则将对应类别最优目标框集合Gc中的目标候选框移除;进行下一个示例优化分支,选择示例优化分支中得到的 最优目标候选框,判断最优目标候选框与对应类别最优目标框集合Gc中的目标 候选框是否有重叠部分,若最优目标候选框和目标候选框有重叠,则将对应类 别最优目标框集合Gc中的目标候选框移除;直至本训练阶段中的最优目标候选 框与对应类别最优目标框集合Gc中的目标候选框均无重叠,将最优目标候选框 加入到对应类别最优目标框集合Gc中,最后对应类别最优目标框集合Gc中的所有目标候选框作为正样本。
多示例分支检测和示例优化分支中的监督为弱监督方式。
边框回归分支主要由第六全连接层组成;第六全连接层的参数初始化为标 准差为0.001的正态分布。
在第一轮迭代训练时,对所有示例优化分支中的同一类别的优化分支目标 候选框可信度进行取均值,获得所有类别的目标候选框可信度均值,选取图像 所含类别中不同类别的最高的目标候选框可信度均值所对应的目标候选框,该 目标候选框作为伪真值监督边框回归分支;
从第二轮迭代训练开始,边框回归分支的伪真值为最优目标框集合Gc,最 优目标框集合Gc监督边框回归分支,边框回归分支的损失函数Lreg为平滑L1损 失函数;
弱监督目标检测网络的训练通过随机梯度下降优化方法优化多示例检测分 支、示例优化分支和边框回归分支分损失函数:
Figure RE-GDA0003194052910000111
其中,L为弱监督目标检测网络整体的损失函数。
4)将待测场景图像分别输入到筛选目标候选框模块和训练后的弱监督目标 检测网络中,对待测场景图像的目标进行分类与定位。
步骤4)具体为:
待测场景图像通过选择性搜索方法获取所有待测目标候选框,将待测场景 图像与所有待测目标候选框输入训练后的弱监督目标检测网络中,所有示例优 化分支输出优化分支目标候选框可信度以及边框回归分支输出的边框偏移量, 对所有示例优化分支中的同一类别的优化分支目标候选框可信度进行取均值, 获得所有类别的目标候选框可信度均值,每一类的目标候选框可信度均值为该 类下的分类置信度,从边框回归分支得到边框偏移量,根据所有类别的目标候 选框可信度均值和边框偏移量来获得未知待检测图像中所有预测框,对所有预 测框进行非极大值抑制得到获得未知待检测图像的最终预测框,如图3所示。
对所有预测框进行非极大值抑制得到获得未知待检测图像的最终预测框具 体为:
首先判断两个预测框之间的交并比是否大于非极大值抑制设定的交并比阈 值;若两个预测框之间的交并比大于交并比阈值,具体实施中,交并比阈值为 0.3,比较两个预测框在每一类下的分类置信度,保留该类分类置信度更大的预 测框,将该类分类置信度较小的预测框的该类分类置信度置为0,即忽略该预测 框为该类的概率;对所有的预测框进行两两比较后,根据分类置信度阈值再对 保留下来的预测框的分类置信度进行筛选,具体实施中,分类置信度阈值为0.2, 高于分类置信度阈值的预测框作为预测框最终的检测结果。
为验证本发明方法的有效性,本发明在公开的目标检测数据集Pascal Voc 2007数据集上进行验证,与其他弱监督目标检测方法进行对比:
Pascal Voc 2007数据集共含有20个类别,训练集共5011张图像,测试集 共4952张图像,总计9963张图像。以弱监督目标检测中常用的两个评价指标 评估检测准确度:mAP和CorLoc。其中mAP评价测试集,CorLoc评价训练集。
为了说明本发明各个模块的有效性,不同模型变式的评测结果如表1所示:
表1
Figure BDA0002837775580000121
表1中,baseline指OICR模型,IP表示利用从弱监督语义分割结果得到的 目标候选框的环境系数筛选初始目标候选框,RP表示网络预测的分类结果以及 环境系数共同决定正样本的选择,Reg表示在OICR模型的基础上增加边框回归 分支,TPA表示最优目标框更新方法的加入。从表1中可以观察到,本发明提 出的各个模块都有提升检测能力的作用。
将本发明的方法与主流的弱监督目标检测方法进行对比,以说明本发明的 有利性,第一部分为主流的弱监督目标检测网络,第二部分为结合了弱监督语 义分割的弱监督目标检测方法。‘-Ens’表示多个模型集成的结果,‘+FR’表示 在训练完弱监督目标检测器之后,用其得到的结果作为伪真值全监督训练Faster RCNN网络。可以看出本发明所提出的方法在两个指标的评估中都处于较好的 水平,并且集成的模型mAP与其他方法相比达到了最优。

Claims (10)

1.一种基于正负样本均衡的弱监督目标检测方法,其特征在于:包括以下步骤:
1)采集需要进行目标检测的场景图像,场景图像对应有标签,主要由场景图像和对应的标签组成训练集;
2)将训练集输入筛选目标候选框模块,筛选目标候选框模块通过选择性搜索方法获取场景图像的所有目标候选框,根据场景图像对应的弱监督语义分割结果M计算所有目标候选框的环境系数,将所有目标候选框的环境系数进行排序并选择环境系数靠前的若干个目标候选框,将选择的目标候选框作为场景图像对应的初始目标候选框;
3)建立弱监督目标检测网络,将步骤1)中的训练集和步骤2)中对应的初始目标候选框同时输入弱监督目标检测网络中进行训练,训练过程中利用最优目标框更新方法获得训练后的弱监督目标检测网络;
4)将待测场景图像分别输入到筛选目标候选框模块和训练后的弱监督目标检测网络中,对待测场景图像的目标进行分类与定位。
2.根据权利要求书1中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:所述环境系数的计算具体为:
对含有n个目标候选框的场景图像,每一个目标候选框r都有一个对应的扩大边框,将目标候选框与目标候选框对应的扩大边框之间的区域记作环境区域cr;计算弱监督语义分割结果M在目标候选框r区域中概率值的均值并记为内部系数Sin;同时,将弱监督语义分割结果M在环境区域cr中的概率值进行降序排列,计算前50%的概率值的均值并记为外部系数Sout,目标候选框r的环境系数Sr由下式计算获得:
Sr=Sin-Sout
3.根据权利要求书1中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:
所述弱监督目标检测网络包括特征提取模块、多示例检测分支、若干个示例优化分支和边框回归分支;特征提取模块的输出分别作为多示例检测分支、若干个示例优化分支和边框回归分支的输入,步骤1)中的训练集的标签监督多示例检测分支,多示例检测分支的输出经过处理后监督第一个示例优化分支,前一个示例优化分支的输出经过处理后监督后一个示例优化分支,若干个示例优化分支的输出均经过处理后监督边框回归分支,边框回归分支输出筛选目标候选框模块输入弱监督目标检测网络的目标候选框对应的位置偏移量。
4.根据权利要求书3中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:
所述特征提取模块主要由卷积模块、ROI池化层、第一全连接层和第二全连接层依次连接构成;其中,训练集中的场景图像作为卷积模块的输入,卷积模块的输出和初始目标候选框进行处理后共同作为ROI池化层的输入;卷积模块提取场景图像的特征图后通过ROI池化层、第一全连接层和第二全连接层获取所有初始目标候选框的特征图,将所有初始目标候选框的特征图分别输入到多示例检测分支、若干个示例优化分支和边框回归分支中。
5.根据权利要求书3中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:
所述多示例检测分支包括第三全连接层、第四全连接层、第一Softmax输出层、第二Softmax输出层和累加层;第三全连接层作为多示例检测分支的第一输入层,第四全连接层作为多示例检测分支的第二输入层,第三全连接层与第一Softmax输出层相连,第四全连接层与第二Softmax输出层相连,第三全连接层输出分类结果xcls,第四全连接层输出定位结果xdet,训练集中的标签为
Figure RE-FDA0003017562420000021
其中,
Figure RE-FDA0003017562420000022
y1为第一类别的真假值,y2为第二类别的真假值,yC为第C类别的真假值,C为所有类别的个数,R为实数集,n表示场景图像中含有的n个目标候选框;第一Softmax输出层的输出和第二Softmax输出层的输出经过哈达玛积操作后输入到累加层;第一Softmax输出层的输出和第二Softmax输出层的输出经过哈达玛积操作后输出所有候选框的目标候选框可信度xR=σ(xcls)⊙σ(xdet),累加层输出场景图像的预测可信度
Figure RE-FDA0003017562420000023
标签监督累加层的输出,其中,⊙表示哈达玛积操作,σ()表示Softmax操作,
Figure RE-FDA0003017562420000024
表示第r个目标候选框第c个类别的目标候选框可信度;多示例检测分支的损失函数Lmil如下:
Figure RE-FDA0003017562420000025
其中,c为其中一个类别,yc为第c类别的真假值;
最终的所有候选框的目标候选框可信度作为多示例检测分支的输出。
6.根据权利要求书3中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:所述示例优化分支主要由第五全连接层和第三Softmax输出层依次相连组成;
第一个示例优化分支,从多示例检测分支中得到的目标候选框可信度中场景图像所含类别对应的系数与对应的环境系数之和最高的目标候选框作为正样本,所述正样本的标签为目标候选框对应的场景图像所含类别,剩余的目标候选框中与正样本的重叠度大于设置的阈值Lable_t的目标候选框会被标注为与正样本相同的类别,与正样本的重叠度小于或等于设置的阈值Lable_t的目标候选框标注为背景,背景作为负样本,正样本和负样本组成伪真值,伪真值监督第一个示例优化分支的训练,第一个示例优化分支训练后获得一个优化分支目标候选框可信度;
后一个示例优化分支从前一个示例优化分支中得到的优化分支目标候选框可信度中场景图像所含类别对应的系数与对应的环境系数之和最高的目标候选框为最优目标候选框,最优目标候选框作为正样本;所述正样本的标签为目标候选框对应的场景图像所含类别,剩余的目标候选框中与正样本的重叠度大于设置的阈值Lable_t的目标候选框会被标注为与正样本相同的类别,与正样本的重叠度小于或等于设置的阈值Lable_t的目标候选框标注为背景,背景作为负样本,正样本和负样本组成伪真值,伪真值监督本后一个示例优化分支的训练,每一个示例优化分支训练后均获得一个优化分支目标候选框可信度;其中监督第k个示例优化分支时,候选框r对应的伪真值
Figure RE-FDA0003017562420000031
满足
Figure RE-FDA0003017562420000032
其中,
Figure RE-FDA0003017562420000033
为第k个示例优化分支时,目标候选框r在第一类别下的伪真值;
Figure RE-FDA0003017562420000034
为第k个示例优化分支时,目标候选框r在第二类别下的伪真值;
Figure RE-FDA0003017562420000035
为第k个示例优化分支时,目标候选框r在第三类别下的伪真值;
Figure RE-FDA0003017562420000036
为第k个示例优化分支时,目标候选框r在背景下的伪真值;伪真值
Figure RE-FDA0003017562420000037
监督第k个示例优化分支的训练,示例优化分支的损失函数为加权交叉熵损失函数,如下式:
Figure RE-FDA0003017562420000038
其中,
Figure RE-FDA0003017562420000039
为第k个示例优化分支输出第c个类别的第r个目标候选框可信度,权重
Figure RE-FDA00030175624200000310
为与第r个目标候选框覆盖程度最大的上一分支选择的系数最高的目标候选框的目标候选框可信度,C+1为背景;
所有示例优化分支在训练的过程中采取最优目标框更新方法,最优目标框更新方法具体为:
对训练集中的场景图像,建立场景图像对应的最优目标框集合Gc,每一个最优目标框集合Gc对应每一个存在的类别c∈C,最优目标框集合Gc来更新弱监督目标检测网络的不同训练阶段的各个示例优化分支选出的最优目标候选框,选出的最优目标候选框赋值给最优目标框集合Gc;在后续的迭代训练中,按照下式不断更新最优目标框集合Gc中包含的目标候选框:
Figure RE-FDA0003017562420000041
其中TPA(·)表示最优目标候选框更新方法,t表示弱监督目标检测网络第t轮训练,
Figure RE-FDA0003017562420000042
表示第t轮次训练下第c个类别的最优目标候选框。
7.根据权利要求书3中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:
所述边框回归分支主要由第六全连接层组成;
在第一轮迭代训练时,对所有示例优化分支中的同一类别的优化分支目标候选框可信度进行取均值,获得所有类别的目标候选框可信度均值,选取图像所含类别中不同类别的最高的目标候选框可信度均值所对应的目标候选框,该目标候选框作为伪真值监督边框回归分支;
从第二轮迭代训练开始,边框回归分支的伪真值为最优目标框集合Gc,最优目标框集合Gc监督边框回归分支,边框回归分支的损失函数Lreg为平滑L1损失函数;
弱监督目标检测网络的训练通过随机梯度下降优化方法优化多示例检测分支、示例优化分支和边框回归分支分损失函数:
Figure RE-FDA0003017562420000043
其中,L为弱监督目标检测网络整体的损失函数。
8.根据权利要求书6中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:所述正样本的选择方式具体为:
第一轮次训练阶段,选择多示例检测分支中得到的最优目标候选框或者示例优化分支中得到的最优目标候选框作为正样本;
第二轮次训练阶段时,选择第一轮次后的多示例检测分支中得到的最优目标候选框或者示例优化分支中得到的最优目标候选框作为正样本并且初始化最优目标框集合Gc
之后的训练阶段中,首先选择多示例检测分支中得到的最优目标候选框,判断最优目标候选框与对应类别最优目标框集合Gc中的目标候选框是否有重叠部分,若最优目标候选框和目标候选框有重叠,则将对应类别最优目标框集合Gc中的目标候选框移除;进行下一个示例优化分支,选择示例优化分支中得到的最优目标候选框,判断最优目标候选框与对应类别最优目标框集合Gc中的目标候选框是否有重叠部分,若最优目标候选框和目标候选框有重叠,则将对应类别最优目标框集合Gc中的目标候选框移除;直至本训练阶段中的最优目标候选框与对应类别最优目标框集合Gc中的目标候选框均无重叠,将最优目标候选框加入到对应类别最优目标框集合Gc中,最后对应类别最优目标框集合Gc中的所有目标候选框作为正样本。
9.根据权利要求书1中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:所述步骤4)具体为:
待测场景图像通过选择性搜索方法获取所有待测目标候选框,将待测场景图像与所有待测目标候选框输入训练后的弱监督目标检测网络中,所有示例优化分支输出优化分支目标候选框可信度以及边框回归分支输出的边框偏移量,对所有示例优化分支中的同一类别的优化分支目标候选框可信度进行取均值,获得所有类别的目标候选框可信度均值,每一类的目标候选框可信度均值为该类下的分类置信度,从边框回归分支得到边框偏移量,根据所有类别的目标候选框可信度均值和边框偏移量来获得未知待检测图像中所有预测框,对所有预测框进行非极大值抑制得到获得未知待检测图像的最终预测框。
10.根据权利要求书9中所述的一种基于正负样本均衡的弱监督目标检测方法,其特征在于:所述的对所有预测框进行非极大值抑制得到获得未知待检测图像的最终预测框具体为:
首先判断两个预测框之间的交并比是否大于非极大值抑制设定的交并比阈值;若两个预测框之间的交并比大于交并比阈值,比较两个预测框在每一类下的分类置信度,保留该类分类置信度更大的预测框,将该类分类置信度较小的预测框的该类分类置信度置为0,即忽略该预测框为该类的概率;对所有的预测框进行两两比较后,根据分类置信度阈值再对保留下来的预测框的分类置信度进行筛选,高于分类置信度阈值的预测框作为预测框最终的检测结果。
CN202011481683.9A 2020-12-15 2020-12-15 一种基于正负样本均衡的弱监督目标检测方法 Active CN113378829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011481683.9A CN113378829B (zh) 2020-12-15 2020-12-15 一种基于正负样本均衡的弱监督目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011481683.9A CN113378829B (zh) 2020-12-15 2020-12-15 一种基于正负样本均衡的弱监督目标检测方法

Publications (2)

Publication Number Publication Date
CN113378829A true CN113378829A (zh) 2021-09-10
CN113378829B CN113378829B (zh) 2022-09-27

Family

ID=77569095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011481683.9A Active CN113378829B (zh) 2020-12-15 2020-12-15 一种基于正负样本均衡的弱监督目标检测方法

Country Status (1)

Country Link
CN (1) CN113378829B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792803A (zh) * 2021-09-16 2021-12-14 中国科学技术大学 前景信息引导的弱监督目标检测方法与***
CN114415254A (zh) * 2022-01-21 2022-04-29 哈尔滨工业大学 基于在线学习的多事例弱监督火星表面形态检测方法
CN114627437A (zh) * 2022-05-16 2022-06-14 科大天工智能装备技术(天津)有限公司 一种交通目标识别方法及***
CN114821331A (zh) * 2022-05-13 2022-07-29 北京航空航天大学 基于自注意力机制的遥感图像弱监督目标检测方法及***
CN115019133A (zh) * 2022-06-16 2022-09-06 华中科技大学 基于自训练和标签抗噪的图像中弱目标的检测方法及***
CN115690524A (zh) * 2023-01-05 2023-02-03 中国科学院空天信息创新研究院 语义信息指导的点云目标检测正样本筛选方法
CN117372919A (zh) * 2023-09-22 2024-01-09 北京市燃气集团有限责任公司 一种第三方施工威胁物检测方法及装置
CN117475263A (zh) * 2023-12-27 2024-01-30 成都数喆数据科技有限公司 图像模型训练方法及其图像识别方法、工程智慧管理***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203781A (zh) * 2017-05-22 2017-09-26 浙江大学 一种基于显著性指导的端到端的弱监督目标检测方法
US20190244366A1 (en) * 2017-09-07 2019-08-08 Comcast Cable Communications, Llc Relevant Motion Detection in Video
US20190370965A1 (en) * 2017-02-22 2019-12-05 The United States Of America, As Represented By The Secretary, Department Of Health And Human Servic Detection of prostate cancer in multi-parametric mri using random forest with instance weighting & mr prostate segmentation by deep learning with holistically-nested networks
CN110598650A (zh) * 2019-09-17 2019-12-20 中控智慧科技股份有限公司 车牌虚警过滤方法、装置及电子设备和存储介质
CN111091105A (zh) * 2019-12-23 2020-05-01 郑州轻工业大学 基于新的边框回归损失函数的遥感图像目标检测方法
CN111209810A (zh) * 2018-12-26 2020-05-29 浙江大学 向可见光与红外图像准确实时行人检测的边界框分割监督深度神经网络架构
CN111369572A (zh) * 2020-02-28 2020-07-03 清华大学深圳国际研究生院 一种基于图像修复技术的弱监督语义分割方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190370965A1 (en) * 2017-02-22 2019-12-05 The United States Of America, As Represented By The Secretary, Department Of Health And Human Servic Detection of prostate cancer in multi-parametric mri using random forest with instance weighting & mr prostate segmentation by deep learning with holistically-nested networks
CN107203781A (zh) * 2017-05-22 2017-09-26 浙江大学 一种基于显著性指导的端到端的弱监督目标检测方法
US20190244366A1 (en) * 2017-09-07 2019-08-08 Comcast Cable Communications, Llc Relevant Motion Detection in Video
CN111209810A (zh) * 2018-12-26 2020-05-29 浙江大学 向可见光与红外图像准确实时行人检测的边界框分割监督深度神经网络架构
CN110598650A (zh) * 2019-09-17 2019-12-20 中控智慧科技股份有限公司 车牌虚警过滤方法、装置及电子设备和存储介质
CN111091105A (zh) * 2019-12-23 2020-05-01 郑州轻工业大学 基于新的边框回归损失函数的遥感图像目标检测方法
CN111369572A (zh) * 2020-02-28 2020-07-03 清华大学深圳国际研究生院 一种基于图像修复技术的弱监督语义分割方法和装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792803A (zh) * 2021-09-16 2021-12-14 中国科学技术大学 前景信息引导的弱监督目标检测方法与***
CN113792803B (zh) * 2021-09-16 2024-03-29 中国科学技术大学 前景信息引导的弱监督目标检测方法与***
CN114415254A (zh) * 2022-01-21 2022-04-29 哈尔滨工业大学 基于在线学习的多事例弱监督火星表面形态检测方法
CN114415254B (zh) * 2022-01-21 2023-02-07 哈尔滨工业大学 基于在线学习的多事例弱监督火星表面形态检测方法
CN114821331A (zh) * 2022-05-13 2022-07-29 北京航空航天大学 基于自注意力机制的遥感图像弱监督目标检测方法及***
CN114627437A (zh) * 2022-05-16 2022-06-14 科大天工智能装备技术(天津)有限公司 一种交通目标识别方法及***
CN115019133A (zh) * 2022-06-16 2022-09-06 华中科技大学 基于自训练和标签抗噪的图像中弱目标的检测方法及***
CN115019133B (zh) * 2022-06-16 2024-07-02 华中科技大学 基于自训练和标签抗噪的图像中弱目标的检测方法及***
CN115690524A (zh) * 2023-01-05 2023-02-03 中国科学院空天信息创新研究院 语义信息指导的点云目标检测正样本筛选方法
CN117372919A (zh) * 2023-09-22 2024-01-09 北京市燃气集团有限责任公司 一种第三方施工威胁物检测方法及装置
CN117475263A (zh) * 2023-12-27 2024-01-30 成都数喆数据科技有限公司 图像模型训练方法及其图像识别方法、工程智慧管理***
CN117475263B (zh) * 2023-12-27 2024-03-15 成都数喆数据科技有限公司 图像模型训练方法及其图像识别方法、工程智慧管理***

Also Published As

Publication number Publication date
CN113378829B (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN113378829B (zh) 一种基于正负样本均衡的弱监督目标检测方法
Zhao et al. Cloud shape classification system based on multi-channel cnn and improved fdm
CN108830188B (zh) 基于深度学习的车辆检测方法
CN110533084B (zh) 一种基于自注意力机制的多尺度目标检测方法
CN107316036B (zh) 一种基于级联分类器的害虫识别方法
CN108229566B (zh) 一种层次性分类方法及装置
CN112561910A (zh) 一种基于多尺度特征融合的工业表面缺陷检测方法
CN104063719A (zh) 基于深度卷积网络的行人检测方法及装置
CN107273832B (zh) 基于积分通道特征与卷积神经网络的车牌识别方法及***
CN114399719A (zh) 一种变电站火灾视频监测方法
CN117516937A (zh) 基于多模态特征融合增强的滚动轴承未知故障检测方法
CN114943840A (zh) 机器学习模型的训练方法、图像的处理方法和电子设备
CN111461323A (zh) 一种图像识别方法及装置
CN108932471B (zh) 一种车辆检测方法
CN113011528A (zh) 一种基于上下文和级联结构的遥感图像小目标检测方法
Lee A Study on Fruit Quality Identification Using YOLO V2 Algorithm
Al-Shammri et al. A combined method for object detection under rain conditions using deep learning
CN116452877A (zh) 一种弱监督目标检测方法及***
CN114596273B (zh) 利用yolov4网络的陶瓷基板多种瑕疵智能检测方法
CN114067314B (zh) 一种基于神经网络的花生霉变识别方法及***
CN113610831B (zh) 基于计算机图像技术和迁移学习的木材缺陷检测方法
CN115861956A (zh) 一种基于解耦头部的Yolov3道路垃圾检测方法
CN114170625A (zh) 一种上下文感知、噪声鲁棒的行人搜索方法
CN114077663A (zh) 应用日志的分析方法及装置
CN111291624B (zh) 一种挖掘机目标识别方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant