CN110378420A - 一种图像检测方法、装置及计算机可读存储介质 - Google Patents

一种图像检测方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110378420A
CN110378420A CN201910657541.4A CN201910657541A CN110378420A CN 110378420 A CN110378420 A CN 110378420A CN 201910657541 A CN201910657541 A CN 201910657541A CN 110378420 A CN110378420 A CN 110378420A
Authority
CN
China
Prior art keywords
image
classification
target
test object
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910657541.4A
Other languages
English (en)
Inventor
侯允
刘耀勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910657541.4A priority Critical patent/CN110378420A/zh
Publication of CN110378420A publication Critical patent/CN110378420A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种图像检测方法、装置及计算机可读存储介质,预先标注训练样本集中每一张样本图像中的至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;从而得到用于识别检测对象位置的目标检测模型,以及用于识别检测对象类别的目标类别模型;利用目标检测模型和目标类别模型分别识别检测对象的位置和类别,能够提高检测对象识别的准确性。

Description

一种图像检测方法、装置及计算机可读存储介质
技术领域
本申请涉及图像技术,尤其涉及一种图像检测方法、装置及计算机可读存储介质。
背景技术
现有的图像检测技术对于大规模实时多物体检测通常直接使用一个目标检测网络来框选出多个目标物体,并对每个矩形框中包含的目标物体进行分类设置矩形框的标签。因为做到实时性的情况下,会采用轻量级的网络模型,如mobilenet-ssd,yolo系列等,为实现多物体的检测,网络模型的训练集至少需要成百上千累生活常见物品。但是采用现有技术得到矩形框的标签容易出现错误,比如,“桌子”被误识别为“汽车”,“显示器”被误识别为“窗户”等,物体识别的准确性较低。
发明内容
为解决上述技术问题,本申请实施例期望提供一种图像检测方法、装置及计算机存储介质。
本申请的技术方案是这样实现的:
第一方面,提供了一种图像检测方法,该方法包括:
获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
预先标注样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
利用训练样本集,以及检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,目标检测模型用于检测一张图像中的至少两个检测对象的位置;
利用训练样本集,以及检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,目标分类模型用于检测一张图像中至少两个检测对象的类别;
利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息。
第二方面,提供了一种图像检测装置,该装置包括:
获取单元,用于获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
标注单元,用于预先标注样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
处理单元,用于利用训练样本集,以及检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,目标检测模型用于检测一张图像中的至少两个检测对象的位置;
处理单元,用于利用训练样本集,以及检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,目标分类模型用于检测一张图像中至少两个检测对象的类别;
处理单元,用于利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息。
第三方面,提供了一种图像检测装置,包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器配置为运行所述计算机程序时,执行前述方法的步骤。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现前述方法的步骤。
采用上述技术方案,预先标注训练样本集中每一张样本图像中的至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;从而得到用于识别检测对象位置的目标检测模型,以及用于识别检测对象类别的目标类别模型。如此,相较于现有技术中利用一个模型同时识别检测对象的位置和类别,本申请利用目标检测模型和目标类别模型分别识别检测对象的位置和类别,能够提高检测对象识别的准确性。
附图说明
图1为本申请实施例中图像检测方法的第一流程示意图;
图2为本申请实施例中图像检测方法的第二流程示意图;
图3为本身器实施例中图像检测方法的实现场景示意图;
图4为本申请实施例中图像检测装置的第一组成结构示意图;
图5为本申请实施例中图像检测装置的第二组成结构示意图。
具体实施方式
为了能够更加详尽地了解本申请实施例的特点与技术内容,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。
实施例一
本申请实施例提供了一种图像检测方法,如图1所示,该方法具体可以包括:
步骤101:获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
步骤102:预先标注所述样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
步骤103:利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,所述目标检测模型用于检测一张图像中的至少两个检测对象的位置;
步骤104:利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,所述目标分类模型用于检测一张图像中至少两个检测对象的类别;
步骤105:利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息。
这里,步骤101至步骤105的执行主体可以为图像检测装置的处理器。
在一些实施例中,所述利用所述训练样本集,以及所述样本图像中检测对象的位置信息对目标检测网络进行训练,包括:将所述训练样本集中的样本图像输入到所述目标检测网络中,输出检测对象的预测位置;利用检测对象的预测位置和标注位置调整所述目标检测网络,得到目标检测模型。
这里,标注位置作为目标检测模型的训练效果的标准,预测位置和标注位置之间的误差不满足预设误差标准,表明当前检测模型没有达到期望效果,确定训练失败,需要继续调整模型参数,使得到的预测位置和标准位置之间的误差满足预设误差标准,表明当前检测模型达到期望效果,将当前检测模型作为目标检测模型。
这里,目标检测网络可以使用轻量级检测网络,比如:mobilenet-ssd、faster-rcnn、yolov3等。
在一些实施例中,所述利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,包括:利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块;将所述样本图像对应的至少两个目标图像块输入至所述目标分类网络中,输出检测对象的预测类型;利用所述检测对象的预测类型和标注类型调整所述目标分类网络,得到目标分类模型。
这里,标注类别作为目标分类模型的训练效果的标准,预测类别和标注类别之间的误差不满足预设误差标准,表明当前分类模型没有达到期望效果,确定训练失败,需要继续调整模型参数,使得到的预测类别和标准类别相同,表明当前类别模型达到期望效果,将当前检测模型作为目标检测模型。
在一些实施例中,所述利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块,包括:利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个子图像块;对所述至少两个子图像块进行尺寸调整,得到预设尺寸的至少两个目标图像块。
也就是说,由于检测对象在样本图像中所占的区域面积不同,为了提高分类网络的训练效率,通过对图像块进行缩放处理将不同尺寸的图像块调整为固定尺寸大小的图像块。
这里,目标分类网络可以使用轻量级分类网络,比如:mobilenet_v2、resnet50、shufflennetv2等。
在一些实施例中,所述获取包含至少两张样本图像的训练样本集,包括:获取至少一张样本图像;对所述至少一张样本图像进行数据增强,得到至少两张样本图像;利用所述至少两个样本图像建立所述训练样本集。
这里,为了增加数据量,缓解网络过拟合,对样本图像进行增强处理,可以获得更多的训练样本,在一张图像的基础上可以得到多张图像,扩增样本数量,能够提高模型训练效率。增强处理包括:对给定样本图像进行随机裁剪、水平翻转、尺寸缩放、色调调整、亮度调整、饱和度调整等预处理。
进一步地,步骤105具体可以包括:获取待检测图像;其中,所述待检测图像中包含至少两个检测对象;将所述待检测图像输入到所述目标检测模型中,得到所述待检测图像中至少两个目标检测对象的位置信息;利用所述待检测图像中至少两个目标检测对象的位置信息,提取包含所述至少两个目标检测对象的至少两个目标图像块;将所述至少两个目标图像块输入到所述目标分类模型中,输出所述待检测图像中至少两个检测对象的类别信息。
实际应用中,训练完成的目标检测模型和目标分类模型做模型量化后,可以部署在具有图像检测功能的终端上,当该功能被调用时,目标检测网络首先框选出当前图像帧中的多个目标检测对象,然后对框选出的图片进行裁剪,送给目标分类网络模型进行处理,从而的到正确的类别信息。这里,终端可以为智能手机、个人电脑(例如平板电脑、台式电脑、笔记本、上网本、掌上电脑)、移动电话、电子书阅读器、便携式多媒体播放器、音频/视频播放器、摄像机、虚拟现实设备和可穿戴设备等。
采用上述技术方案,预先标注训练样本集中每一张样本图像中的至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;从而得到用于识别检测对象位置的目标检测模型,以及用于识别检测对象类别的目标类别模型。如此,相较于现有技术中利用一个模型同时识别检测对象的位置和类别,本申请利用目标检测模型和目标类别模型分别识别检测对象的位置和类别,能够提高检测对象识别的准确性。
实施例二
本申请实施例提供了一种图像检测方法,如图2所示,该方法具体可以包括:
步骤201:获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
这里,可以根据检测对象来建立训练样本集,检测对象可以为日常生活中常见物体,比如,桌子、椅子、汽车、动物、植物、人等,检测对象也可以为一类物体的细分类型,比如不同种类的动物、植物等。
在一些实施例中,获取训练样本集的方法具体可以包括:获取至少一张样本图像;对所述至少一张样本图像进行数据增强,得到至少两张样本图像;利用所述至少两个样本图像建立所述训练样本集。
这里,为了增加数据量,缓解网络过拟合,对样本图像进行增强处理,可以获得更多的训练样本,在一张图像的基础上可以得到多张图像,扩增样本数量,能够提高模型训练效率。增强处理包括:对给定样本图像进行随机裁剪、水平翻转、尺寸缩放、色调调整、亮度调整、饱和度调整等预处理。
步骤202:预先标注所述样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
这里,在获取到训练样本集后,可以通过人工标注的方法对每一张样本图像中的检测对象的位置和类别进行标注,得到的标注位置和标注类别作为判断目标检测网络和目标分类网络训练完成的依据。具体的,检测对象的位置可以为框选检测对象的矩形框的坐标位置,检测对象的类别可以为检测对象的一级、二级、三级或更进一步的细分类别。
步骤203:利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,所述目标检测模型用于检测一张图像中的至少两个检测对象的位置;
具体的,将所述训练样本集中的样本图像输入到所述目标检测网络中,输出检测对象的预测位置;利用检测对象的预测位置和标注位置调整所述目标检测网络,得到目标检测模型。
这里,标注位置作为目标检测模型的训练效果的标准,预测位置和标注位置之间的误差不满足预设误差标准,表明当前检测模型没有达到期望效果,确定训练失败,需要继续调整模型参数,使得到的预测位置和标准位置之间的误差满足预设误差标准,表明当前检测模型达到期望效果,将当前检测模型作为目标检测模型。
这里,目标检测网络可以使用轻量级检测网络,比如:mobilenet-ssd、faster-rcnn、yolov3等。
步骤204:利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,所述目标分类模型用于检测一张图像中至少两个检测对象的类别;
具体的,利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块;将所述样本图像对应的至少两个目标图像块输入至所述目标分类网络中,输出检测对象的预测类型;利用所述检测对象的预测类型和标注类型调整所述目标分类网络,得到目标分类模型。
这里,标注类别作为目标分类模型的训练效果的标准,预测类别和标注类别之间的误差不满足预设误差标准,表明当前分类模型没有达到期望效果,确定训练失败,需要继续调整模型参数,使得到的预测类别和标准类别相同,表明当前类别模型达到期望效果,将当前检测模型作为目标检测模型。
在一些实施例中,所述利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块,包括:利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个子图像块;对所述至少两个子图像块进行尺寸调整,得到预设尺寸的至少两个目标图像块。
也就是说,由于检测对象在样本图像中所占的区域面积不同,为了提高分类网络的训练效率,通过对图像块进行缩放处理将不同尺寸的图像块调整为固定尺寸大小的图像块。
这里,目标分类网络可以使用轻量级分类网络,比如:mobilenet_v2、resnet50、shufflennetv2等。
步骤205:获取待检测图像;将所述待检测图像输入到所述目标检测模型中,得到所述待检测图像中至少两个目标检测对象的位置信息;
本申请实施例提供的图像识别方法主要应用于多物体的实时检测,即待检测图像中包含至少两个检测对象,相较于现有技术能够更准确的检测到不同物体的类别信息。
需要说明的是,本申请提供的图像识别方法也可以应用于单物体的实时检测,即待检测图像中包含一个检测对象。
这里,当待检测图像中包含至少两个检测对象时,由于不同检测对象的图像清晰度可能不同,相对清晰的检测对象可以识别出其类别信息,相对模糊的检测对象无法识别出其类别信息,因此从所述至少两个检测对象中确定能够进行类别检测的至少两个目标检测对象。
具体的,所述将所述待检测图像输入到所述目标检测模型中,得到所述待检测图像中至少两个目标检测对象的位置信息,包括:将所述待检测图像输入到所述目标检测模型中,输出所述待检测图像中至少两个检测对象的位置信息以及每一个位置信息的置信度;选取置信度大于置信度阈值的至少两个目标检测对象的位置信息。这里,置信度用于表征矩形框位置准确性的可信程度,置信度越高表明矩形框的位置越可信,置信度越低表明矩形框的位置越不可信。
步骤206:利用所述待检测图像中至少两个目标检测对象的位置信息,提取包含所述至少两个目标检测对象的至少两个目标图像块;
步骤207:将所述至少两个目标图像块输入到所述目标分类模型中,输出所述待检测图像中至少两个检测对象的类别信息。
在一些实施例中,所述方法还包括:基于所述待检测图像中至少两个检测对象的类别信息,获取类别信息对应的关联信息;在所述待检测图像中显示类别信息对应的关联信息。
也就是说,当确定了检测对象的位置信息和类别信息之后,根据正确的类别信息给出检测对象的关联信息,关联信息具体可以为检测对象的详细介绍、商品购买地址或者其他周边信息。具体的,关联信息可以为网址链接,用户点击类别信息可进入到该网址链接。
比如,检测对象是植物,目标分类模型可以为植物的细分类模型,得到植物的具体类别并给出相关介绍信息。检测对象是猫,目标分类模型可以为猫的细分类模型,得到猫的具体类别并给出相关介绍信息。
图3中示出了一种图像检测过程,待检测图像中包含三个检测对象,即冰箱、空调和人,首先将待检测图像输入至目标检测模型中,确定框选检测对象的矩形框的位置,以及每个矩形框的置信度,确定置信度大于置信度阈值的目标矩形框;对目标矩形框框选出的图像进行裁剪后送给目标分类模型中,得到每一个检测对象的类别,最终在检测后的图像中显示每一个检测对象的矩形框和类别。
采用上述技术方案,预先标注训练样本集中每一张样本图像中的至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;从而得到用于识别检测对象位置的目标检测模型,以及用于识别检测对象类别的目标类别模型。如此,相较于现有技术中利用一个模型同时识别检测对象的位置和类别,本申请利用目标检测模型和目标类别模型分别识别检测对象的位置和类别,能够提高检测对象识别的准确性。
实施例三
本申请实施例中还提供了一种图像检测装置,如图4所示,该装置包括:
获取单元401,用于获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
标注单元402,用于预先标注所述样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
处理单元403,用于利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,所述目标检测模型用于检测一张图像中的至少两个检测对象的位置;
处理单元403,还用于利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,所述目标分类模型用于检测一张图像中至少两个检测对象的类别;
处理单元403,还用于利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息。
在一些实施例中,所述处理单元,具体用于将所述训练样本集中的样本图像输入到所述目标检测网络中,输出检测对象的预测位置;利用检测对象的预测位置和标注位置调整所述目标检测网络,得到目标检测模型。
在一些实施例中,所述处理单元,具体用于利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块;将所述样本图像对应的至少两个目标图像块输入至所述目标分类网络中,输出检测对象的预测类型;利用所述检测对象的预测类型和标注类型调整所述目标分类网络,得到目标分类模型。
在一些实施例中,所述处理单元,具体用于利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个子图像块;对所述至少两个子图像块进行尺寸调整,得到预设尺寸的至少两个目标图像块。
在一些实施例中,所述获取单元,具体用于获取至少一张样本图像;对所述至少一张样本图像进行数据增强,得到至少两张样本图像;利用所述至少两个样本图像建立所述训练样本集。
在一些实施例中,所述获取单元,还用于获取待检测图像;其中,所述待检测图像中包含至少两个检测对象;
所述处理单元,还用于将所述待检测图像输入到所述目标检测模型中,得到所述待检测图像中至少两个目标检测对象的位置信息;利用所述待检测图像中至少两个目标检测对象的位置信息,提取包含所述至少两个目标检测对象的至少两个目标图像块;
所述处理单元,还用于将所述至少两个目标图像块输入到所述目标分类模型中,输出所述待检测图像中至少两个检测对象的类别信息。
在一些实施例中,所述处理单元,具体用于将所述待检测图像输入到所述目标检测模型中,输出所述待检测图像中至少两个检测对象的位置信息以及每一个位置信息的置信度;选取置信度大于置信度阈值的至少两个目标检测对象的位置信息。
基于上述图像检测装置中各单元的硬件实现,本申请实施例还提供了另一种图像检测装置,如图5所示,该装置包括:处理器501和配置为存储能够在处理器上运行的计算机程序的存储器502;
其中,处理器501配置为运行计算机程序时,执行前述实施例中的方法步骤。
当然,实际应用时,如图5所示,该装置中的各个组件通过总线***503耦合在一起。可理解,总线***503用于实现这些组件之间的连接通信。总线***503除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线***503。
在实际应用中,上述处理器可以为特定用途集成电路(ASIC,ApplicationSpecific Integrated Circuit)、数字信号处理装置(DSPD,Digital Signal ProcessingDevice)、可编程逻辑装置(PLD,Programmable Logic Device)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、控制器、微控制器、微处理器中的至少一种。可以理解地,对于不同的设备,用于实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
上述存储器可以是易失性存储器(volatile memory),例如随机存取存储器(RAM,Random-Access Memory);或者非易失性存储器(non-volatile memory),例如只读存储器(ROM,Read-Only Memory),快闪存储器(flash memory),硬盘(HDD,Hard Disk Drive)或固态硬盘(SSD,Solid-State Drive);或者上述种类的存储器的组合,并向处理器提供指令和数据。
本申请实施例还提供了一种计算机可读存储介质,用于存储计算机程序。
可选的,该计算机可读存储介质可应用于本申请实施例中的任意一种图像检测装置中,并且该计算机程序使得计算机执行本申请实施例的各个方法中由处理器实现的相应流程,为了简洁,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。
本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。
本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种图像检测方法,其特征在于,所述方法包括:
获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
预先标注所述样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,所述目标检测模型用于检测一张图像中的至少两个检测对象的位置;
利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,所述目标分类模型用于检测一张图像中至少两个检测对象的类别;
利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息。
2.根据权利要求1所述的方法,其特征在于,所述利用所述训练样本集,以及所述样本图像中检测对象的位置信息对目标检测网络进行训练,包括:
将所述训练样本集中的样本图像输入到所述目标检测网络中,输出检测对象的预测位置;
利用检测对象的预测位置和标注位置调整所述目标检测网络,得到目标检测模型。
3.根据权利要求1所述的方法,其特征在于,所述利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,包括:
利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块;
将所述样本图像对应的至少两个目标图像块输入至所述目标分类网络中,输出检测对象的预测类型;
利用所述检测对象的预测类型和标注类型调整所述目标分类网络,得到目标分类模型。
4.根据权利要求3所述的方法,其特征在于,所述利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个目标图像块,包括:
利用所述检测对象的标注位置,提取所述样本图像中包含所述至少两个检测对象的至少两个子图像块;
对所述至少两个子图像块进行尺寸调整,得到预设尺寸的至少两个目标图像块。
5.根据权利要求1所述的方法,其特征在于,所述获取包含至少两张样本图像的训练样本集,包括:
获取至少一张样本图像;
对所述至少一张样本图像进行数据增强,得到至少两张样本图像;
利用所述至少两个样本图像建立所述训练样本集。
6.根据权利要求1所述的方法,其特征在于,所述利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息,包括:
获取待检测图像;其中,所述待检测图像中包含至少两个检测对象;
将所述待检测图像输入到所述目标检测模型中,得到所述待检测图像中至少两个目标检测对象的位置信息;
利用所述待检测图像中至少两个目标检测对象的位置信息,提取包含所述至少两个目标检测对象的至少两个目标图像块;
将所述至少两个目标图像块输入到所述目标分类模型中,输出所述待检测图像中至少两个检测对象的类别信息。
7.根据权利要求6所述的方法,其特征在于,所述将所述待检测图像输入到所述目标检测模型中,得到所述待检测图像中至少两个目标检测对象的位置信息,包括:
将所述待检测图像输入到所述目标检测模型中,输出所述待检测图像中至少两个检测对象的位置信息以及每一个位置信息的置信度;
选取置信度大于置信度阈值的至少两个目标检测对象的位置信息。
8.一种图像检测装置,其特征在于,所述装置包括:
获取单元,用于获取包含至少两张样本图像的训练样本集;其中,每一张样本图像中包含至少两个检测对象;
标注单元,用于预先标注所述样本图像中至少两个检测对象的位置和类别,得到检测对象的标注位置和标注类别;
处理单元,用于利用所述训练样本集,以及所述检测对象的标注位置对目标检测网络进行训练,得到目标检测模型;其中,所述目标检测模型用于检测一张图像中的至少两个检测对象的位置;
处理单元,用于利用所述训练样本集,以及所述检测对象的标注位置和标注类别对目标分类网络进行训练,得到目标分类网络模型;其中,所述目标分类模型用于检测一张图像中至少两个检测对象的类别;
处理单元,用于利用所述目标检测模型和所述目标分类模型对待检测图像进行识别,得到所述待检测图像中至少两个检测对象的位置信息和类别信息。
9.一种图像检测装置,所述装置包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器配置为运行所述计算机程序时,执行权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的方法的步骤。
CN201910657541.4A 2019-07-19 2019-07-19 一种图像检测方法、装置及计算机可读存储介质 Pending CN110378420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910657541.4A CN110378420A (zh) 2019-07-19 2019-07-19 一种图像检测方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910657541.4A CN110378420A (zh) 2019-07-19 2019-07-19 一种图像检测方法、装置及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110378420A true CN110378420A (zh) 2019-10-25

Family

ID=68254337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910657541.4A Pending CN110378420A (zh) 2019-07-19 2019-07-19 一种图像检测方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110378420A (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110675399A (zh) * 2019-10-28 2020-01-10 上海悦易网络信息技术有限公司 屏幕外观瑕疵检测方法及设备
CN110796107A (zh) * 2019-11-04 2020-02-14 南京北旨智能科技有限公司 电力巡检图像缺陷识别方法和***、电力巡检无人机
CN110796647A (zh) * 2019-10-28 2020-02-14 上海悦易网络信息技术有限公司 一种电子设备屏幕区域瑕疵检测方法与设备
CN110827246A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 电子设备边框外观瑕疵检测方法及设备
CN110827249A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 电子设备背板外观瑕疵检测方法及设备
CN110827244A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 一种用于电子设备外观瑕疵检测的方法与设备
CN111061898A (zh) * 2019-12-13 2020-04-24 Oppo(重庆)智能科技有限公司 图像处理方法、装置、计算机设备及存储介质
CN111078908A (zh) * 2019-11-28 2020-04-28 北京云聚智慧科技有限公司 一种数据标注的检测方法和装置
CN111124862A (zh) * 2019-12-24 2020-05-08 北京安兔兔科技有限公司 智能设备性能测试方法、装置及智能设备
CN111291799A (zh) * 2020-01-21 2020-06-16 青梧桐有限责任公司 房间窗户分类模型构建方法、房间窗户分类方法及***
CN111400533A (zh) * 2020-03-02 2020-07-10 北京三快在线科技有限公司 图像筛选方法、装置、电子设备和存储介质
CN111444807A (zh) * 2020-03-19 2020-07-24 北京迈格威科技有限公司 目标检测方法、装置、电子设备和计算机可读介质
CN111640103A (zh) * 2020-05-29 2020-09-08 北京百度网讯科技有限公司 图像检测方法、装置、设备以及存储介质
CN111738183A (zh) * 2020-06-28 2020-10-02 达闼机器人有限公司 一种数据标注方法和装置
CN111783635A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 图像标注方法、装置、设备以及存储介质
CN111797934A (zh) * 2020-07-10 2020-10-20 北京嘉楠捷思信息技术有限公司 路标识别方法及装置
CN111881944A (zh) * 2020-07-08 2020-11-03 贵州无忧天空科技有限公司 图像鉴别的方法、电子设备和计算机可读介质
CN111950391A (zh) * 2020-07-23 2020-11-17 中国农业科学院农业信息研究所 果树芽体的识别方法及装置
CN112132220A (zh) * 2020-09-24 2020-12-25 杭州海康威视数字技术股份有限公司 一种自训练方法、***、装置、电子设备及存储介质
CN112308054A (zh) * 2020-12-29 2021-02-02 广东科凯达智能机器人有限公司 基于目标检测算法的多功能数字表自动读数方法
CN112418287A (zh) * 2020-11-16 2021-02-26 深圳市优必选科技股份有限公司 图像预标注方法、装置、电子设备及介质
CN112699842A (zh) * 2021-01-13 2021-04-23 上海镜河科技有限公司 宠物识别方法、装置、设备及计算机可读存储介质
CN112861948A (zh) * 2021-01-29 2021-05-28 南京中兴力维软件有限公司 虹吸式排泥设备工作状态的识别方法、装置及设备
CN112850436A (zh) * 2019-11-28 2021-05-28 宁波微科光电股份有限公司 一种电梯智能光幕的行人趋势检测方法及***
CN113034449A (zh) * 2021-03-11 2021-06-25 深圳市优必选科技股份有限公司 目标检测模型训练方法、装置及通信设备
CN113076860A (zh) * 2021-03-30 2021-07-06 南京大学环境规划设计研究院集团股份公司 一种野外场景下的鸟类检测***
CN113095434A (zh) * 2021-04-27 2021-07-09 深圳市商汤科技有限公司 目标检测方法及装置、电子设备、存储介质
CN113158969A (zh) * 2021-05-10 2021-07-23 上海畅选科技合伙企业(有限合伙) 一种苹果外观缺陷识别***及方法
CN113591901A (zh) * 2021-06-10 2021-11-02 中国航天时代电子有限公司 一种基于锚框的目标检测方法
CN113762292A (zh) * 2020-06-03 2021-12-07 杭州海康威视数字技术股份有限公司 一种训练数据获取方法、装置及模型训练方法、装置
CN113780480A (zh) * 2021-11-11 2021-12-10 深圳佑驾创新科技有限公司 基于YOLOv5的多目标检测及类别识别模型的构建方法
CN117726926A (zh) * 2023-05-15 2024-03-19 荣耀终端有限公司 训练数据处理方法、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108961267A (zh) * 2018-06-19 2018-12-07 Oppo广东移动通信有限公司 图片处理方法、图片处理装置及终端设备
CN108985214A (zh) * 2018-07-09 2018-12-11 上海斐讯数据通信技术有限公司 图像数据的标注方法和装置
CN109063740A (zh) * 2018-07-05 2018-12-21 高镜尧 超声影像关键目标的检测模型构建及检测方法、装置
CN109801284A (zh) * 2019-01-25 2019-05-24 华中科技大学 一种基于深度学习的高铁接触网绝缘子故障检测方法
CN109977872A (zh) * 2019-03-27 2019-07-05 北京迈格威科技有限公司 动作检测方法、装置、电子设备及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108961267A (zh) * 2018-06-19 2018-12-07 Oppo广东移动通信有限公司 图片处理方法、图片处理装置及终端设备
CN109063740A (zh) * 2018-07-05 2018-12-21 高镜尧 超声影像关键目标的检测模型构建及检测方法、装置
CN108985214A (zh) * 2018-07-09 2018-12-11 上海斐讯数据通信技术有限公司 图像数据的标注方法和装置
CN109801284A (zh) * 2019-01-25 2019-05-24 华中科技大学 一种基于深度学习的高铁接触网绝缘子故障检测方法
CN109977872A (zh) * 2019-03-27 2019-07-05 北京迈格威科技有限公司 动作检测方法、装置、电子设备及计算机可读存储介质

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110675399A (zh) * 2019-10-28 2020-01-10 上海悦易网络信息技术有限公司 屏幕外观瑕疵检测方法及设备
CN110796647A (zh) * 2019-10-28 2020-02-14 上海悦易网络信息技术有限公司 一种电子设备屏幕区域瑕疵检测方法与设备
CN110827246A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 电子设备边框外观瑕疵检测方法及设备
CN110827249A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 电子设备背板外观瑕疵检测方法及设备
CN110827244A (zh) * 2019-10-28 2020-02-21 上海悦易网络信息技术有限公司 一种用于电子设备外观瑕疵检测的方法与设备
CN110796107A (zh) * 2019-11-04 2020-02-14 南京北旨智能科技有限公司 电力巡检图像缺陷识别方法和***、电力巡检无人机
CN111078908B (zh) * 2019-11-28 2023-06-09 北京云聚智慧科技有限公司 一种数据标注的检测方法和装置
CN111078908A (zh) * 2019-11-28 2020-04-28 北京云聚智慧科技有限公司 一种数据标注的检测方法和装置
CN112850436A (zh) * 2019-11-28 2021-05-28 宁波微科光电股份有限公司 一种电梯智能光幕的行人趋势检测方法及***
CN111061898A (zh) * 2019-12-13 2020-04-24 Oppo(重庆)智能科技有限公司 图像处理方法、装置、计算机设备及存储介质
CN111124862A (zh) * 2019-12-24 2020-05-08 北京安兔兔科技有限公司 智能设备性能测试方法、装置及智能设备
CN111124862B (zh) * 2019-12-24 2024-01-30 北京安兔兔科技有限公司 智能设备性能测试方法、装置及智能设备
CN111291799A (zh) * 2020-01-21 2020-06-16 青梧桐有限责任公司 房间窗户分类模型构建方法、房间窗户分类方法及***
CN111400533A (zh) * 2020-03-02 2020-07-10 北京三快在线科技有限公司 图像筛选方法、装置、电子设备和存储介质
CN111400533B (zh) * 2020-03-02 2023-10-17 北京三快在线科技有限公司 图像筛选方法、装置、电子设备和存储介质
CN111444807B (zh) * 2020-03-19 2023-09-22 北京迈格威科技有限公司 目标检测方法、装置、电子设备和计算机可读介质
CN111444807A (zh) * 2020-03-19 2020-07-24 北京迈格威科技有限公司 目标检测方法、装置、电子设备和计算机可读介质
CN111640103A (zh) * 2020-05-29 2020-09-08 北京百度网讯科技有限公司 图像检测方法、装置、设备以及存储介质
CN113762292A (zh) * 2020-06-03 2021-12-07 杭州海康威视数字技术股份有限公司 一种训练数据获取方法、装置及模型训练方法、装置
CN113762292B (zh) * 2020-06-03 2024-02-02 杭州海康威视数字技术股份有限公司 一种训练数据获取方法、装置及模型训练方法、装置
CN111738183A (zh) * 2020-06-28 2020-10-02 达闼机器人有限公司 一种数据标注方法和装置
CN111783635A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 图像标注方法、装置、设备以及存储介质
CN111881944A (zh) * 2020-07-08 2020-11-03 贵州无忧天空科技有限公司 图像鉴别的方法、电子设备和计算机可读介质
CN111797934A (zh) * 2020-07-10 2020-10-20 北京嘉楠捷思信息技术有限公司 路标识别方法及装置
CN111950391A (zh) * 2020-07-23 2020-11-17 中国农业科学院农业信息研究所 果树芽体的识别方法及装置
CN112132220A (zh) * 2020-09-24 2020-12-25 杭州海康威视数字技术股份有限公司 一种自训练方法、***、装置、电子设备及存储介质
CN112418287A (zh) * 2020-11-16 2021-02-26 深圳市优必选科技股份有限公司 图像预标注方法、装置、电子设备及介质
CN112418287B (zh) * 2020-11-16 2023-10-13 深圳市优必选科技股份有限公司 图像预标注方法、装置、电子设备及介质
CN112308054A (zh) * 2020-12-29 2021-02-02 广东科凯达智能机器人有限公司 基于目标检测算法的多功能数字表自动读数方法
CN112308054B (zh) * 2020-12-29 2021-07-20 广东科凯达智能机器人有限公司 基于目标检测算法的多功能数字表自动读数方法
CN112699842A (zh) * 2021-01-13 2021-04-23 上海镜河科技有限公司 宠物识别方法、装置、设备及计算机可读存储介质
CN112861948A (zh) * 2021-01-29 2021-05-28 南京中兴力维软件有限公司 虹吸式排泥设备工作状态的识别方法、装置及设备
CN112861948B (zh) * 2021-01-29 2024-04-09 南京中兴力维软件有限公司 虹吸式排泥设备工作状态的识别方法、装置及设备
CN113034449B (zh) * 2021-03-11 2023-12-15 深圳市优必选科技股份有限公司 目标检测模型训练方法、装置及通信设备
CN113034449A (zh) * 2021-03-11 2021-06-25 深圳市优必选科技股份有限公司 目标检测模型训练方法、装置及通信设备
CN113076860B (zh) * 2021-03-30 2022-02-25 南京大学环境规划设计研究院集团股份公司 一种野外场景下的鸟类检测***
CN113076860A (zh) * 2021-03-30 2021-07-06 南京大学环境规划设计研究院集团股份公司 一种野外场景下的鸟类检测***
CN113095434A (zh) * 2021-04-27 2021-07-09 深圳市商汤科技有限公司 目标检测方法及装置、电子设备、存储介质
CN113095434B (zh) * 2021-04-27 2024-06-11 深圳市商汤科技有限公司 目标检测方法及装置、电子设备、存储介质
CN113158969A (zh) * 2021-05-10 2021-07-23 上海畅选科技合伙企业(有限合伙) 一种苹果外观缺陷识别***及方法
CN113591901A (zh) * 2021-06-10 2021-11-02 中国航天时代电子有限公司 一种基于锚框的目标检测方法
CN113780480B (zh) * 2021-11-11 2022-02-22 深圳佑驾创新科技有限公司 基于YOLOv5的多目标检测及类别识别模型的构建方法
CN113780480A (zh) * 2021-11-11 2021-12-10 深圳佑驾创新科技有限公司 基于YOLOv5的多目标检测及类别识别模型的构建方法
CN117726926A (zh) * 2023-05-15 2024-03-19 荣耀终端有限公司 训练数据处理方法、电子设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN110378420A (zh) 一种图像检测方法、装置及计算机可读存储介质
CN109492643B (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
He et al. Application of deep learning in integrated pest management: a real‐time system for detection and diagnosis of oilseed rape pests
CN111340126B (zh) 物品识别方法、装置、计算机设备和存储介质
Beijbom et al. Menu-match: Restaurant-specific food logging from images
Puri et al. Recognition and volume estimation of food intake using a mobile device
CN105809146B (zh) 一种图像场景识别方法和装置
CN109447169A (zh) 图像处理方法及其模型的训练方法、装置和电子***
French et al. Deep neural networks for analysis of fisheries surveillance video and automated monitoring of fish discards
US20190188465A1 (en) Recognizing text in image data
CN107808120A (zh) 眼镜定位方法、装置及存储介质
CN109740571A (zh) 图像采集的方法、图像处理的方法、装置和电子设备
Aslan et al. Benchmarking algorithms for food localization and semantic segmentation
CN108549870A (zh) 一种对物品陈列进行鉴别的方法及装置
CN108229418B (zh) 人体关键点检测方法和装置、电子设备、存储介质和程序
WO2021238548A1 (zh) 区域识别方法、装置、设备及可读存储介质
CN107918767B (zh) 目标检测方法、装置、电子设备及计算机可读介质
CN111061898A (zh) 图像处理方法、装置、计算机设备及存储介质
CN107808126A (zh) 车辆检索方法及装置
US20190294863A9 (en) Method and apparatus for face classification
CN110222582B (zh) 一种图像处理方法和相机
JP2018512567A (ja) 検査室自動化のためのサイドビューサンプルチューブ画像におけるバーコードタグ検出
CN110533654A (zh) 零部件的异常检测方法及装置
CN109857878B (zh) 物品标注方法及装置、电子设备及存储介质
CN110765882A (zh) 一种视频标签确定方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination