CN108648211B - 一种基于深度学习的小目标检测方法、装置、设备和介质 - Google Patents

一种基于深度学习的小目标检测方法、装置、设备和介质 Download PDF

Info

Publication number
CN108648211B
CN108648211B CN201810470081.XA CN201810470081A CN108648211B CN 108648211 B CN108648211 B CN 108648211B CN 201810470081 A CN201810470081 A CN 201810470081A CN 108648211 B CN108648211 B CN 108648211B
Authority
CN
China
Prior art keywords
image
foreground
background
pixel
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810470081.XA
Other languages
English (en)
Other versions
CN108648211A (zh
Inventor
马明阳
田志博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spider Iot Technology Beijing Co ltd
Original Assignee
Spider Iot Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spider Iot Technology Beijing Co ltd filed Critical Spider Iot Technology Beijing Co ltd
Priority to CN201810470081.XA priority Critical patent/CN108648211B/zh
Publication of CN108648211A publication Critical patent/CN108648211A/zh
Application granted granted Critical
Publication of CN108648211B publication Critical patent/CN108648211B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种基于深度学习的小目标检测方法、装置、设备和介质。该方法包括:将图像集合中的第一图像作为背景模型,将第一图像的每一个像素点建立初始样本集,初始样本集包括与该像素点临近的像素点的像素值;将图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的初始样本集进行对比,将第二图像的像素点划分为前景点或背景点;确定第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片;利用经过训练的分类模型对前景区域图片进行分类,从而确定待检测的目标。本申请提供的方法能够在实际场景中快速且高精度的检测小目标,与传统检测算法相比,计算时间短、重复计算量小、背景建模更新速度快且检测精度高。

Description

一种基于深度学习的小目标检测方法、装置、设备和介质
技术领域
本申请涉及图像处理技术领域,特别是涉及基于深度学习的小目标检测方法、装置、设备和介质。
背景技术
近些年来,视觉检测方法已成为计算机视觉领域一大热点,而小目标检测则成为视觉检测领域的一个重大难题,同时由于场景环境干扰的影响,小目标检测算法很难达到极高的精度,同时计算量大,实时性较差。因此能够在较高鲁棒性的前提下,高精度且快速的检测的场景中的待检测目标是衡量检测算法的优劣的决定性因素。
目前常用的目标检测算法主要有背景建模法、光流法和特征匹配算法。
背景建模法:背景建模法常用的有高斯混合背景建模算法和背景差分法,其原理是是首先根据图像序列的第一帧或前几帧根据像素点差异建立背景参考模型,并使用图像序列中的当前帧和背景参考模型进行像素比较来判断该像素点是否属于运动物体。在基于背景建模法的运动目标检测中,背景图像建模和模拟的准确程度,直接影响到检测的效果。由于场景的复杂性、不可预知性以及各种环境干扰和噪声的存在,如光照的突然变化、实际背景图像中有些物体的波动、摄像机的抖动、运动物体进出场景对原场景的影响等,使得传统背景建模算法很难具备较高的鲁棒性。同时传统背景建模也存在内存消耗大,计算量大,背景更新慢等缺点。
光流法:光流法的原理在于计算运动物体形成的运动场在二维图像上的投影,其主要任务就是计算光流场,即根据图像序列的时空梯度估算运动物体形成的运动场,并通过分析运动场的变化检测和分割目标场景以达到检测目标物体的目的。光流法主要包括基于全局光流场和特征点光流场两种算法。其中全局光流场的计算方法是L-K法和H-S法,通过计算得到全局光流场后,比较运动目标与背景之间的运动差异以达到运动目标进行分割的目的,由于需要计算全局的光流场,计算量及内存消耗较大。特征点光流法原理在于通过特征匹配求得特征点处的流速,快速灵活且计算量较小,但精度较低。总的来说,光流法对于检测运动对象具有很好的效果,但光流法鲁棒性较低,环境影响如噪声、光照等对算法结果会产生很大干扰;而且光流法计算量大,内存消耗严重,无法做到实时处理。
特征点检测算法:传统特征点检测算法即滑动窗口检测方法,其原理在于将一张图分解成几百万个不同位置不同尺度的子窗口,针对每一个窗口使用分类器判断是否包含目标物体,一般会设计不同的特征和分类算法,比如人脸检测的经典算法是Haar特征与Adaboosting分类器;行人检测的经典算法是HOG与SVM算法;一般性物体检测是HOG特征加上DOM算法。但是此种算法也同样存在着诸多不足:滑动窗口检测算法为静态检测,在应用到视频中时无法利用上下帧之间的联系;由于在检测时需要生成大量的滑动窗口,会产生非常大的计算量,加重了运算负担;同时由于小目标的特征点有限,本算法在检测小目标时精度较低。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
根据本申请的一个方面,提供了一种目标检测方法,包括:
背景模型建立步骤:将图像集合中的第一图像作为背景模型,将所述第一图像的每一个像素点建立初始样本集,所述初始样本集包括与该像素点临近的像素点的像素值;
像素点分类步骤:将所述图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的所述初始样本集进行对比,将第二图像的像素点划分为前景点或背景点,其中,所述第二图像中的像素点的样本集包括与该像素点临近的像素点;
轮廓确定步骤:确定所述第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片;和
目标检测步骤:利用经过训练的分类模型对所述前景区域图片进行分类,从而确定待检测的目标。
本申请提供的方法能够在实际场景中快速且高精度的检测小目标,与传统检测算法相比,计算时间短、重复计算量小、背景建模更新速度快且检测精度高。
可选地,在所述背景模型建立步骤之前,该方法还包括:
分类模型训练步骤:利用背景样本集和待检测的目标样本集对分类模型进行训练,在该分类模型的准确率达到第一阈值的情况下,得到经过训练的分类模型。
该步骤能够将获取的一定数量的待检测小目标样本集和背景负样本集利用深度学习算法建立高精度分类器,对制作的分类样本集进行训练生成深度学习算法模型,将目标样本与负样本有效分类。
可选地,所述像素点分类步骤包括:将所述第二样本集中的每一个元素与所述初始样本集中的每一个元素作差,在所有的差值均大于第二阈值的情况下,将所述第二样本集对应的像素点设置为前景点,否则将该像素点设置为背景点,根据前景点和背景点对所述第二图像的像素点进行二值化处理,将被设置为背景点的像素点加入背景模型中。
可选地,所述轮廓提取步骤包括:通过开闭运算消除离散的前景点,通过积分运算将前景点围成的区域中的像素点设置为前景点。
采用该方法,能够得到连续的轮廓,消除了噪声的干扰。
可选地,在所述目标检测步骤之后,该方法还包括;
分类模型更新步骤:在利用经过训练的分类模型对所述前景区域图片进行分类得到的分类结果为背景,则利用该分类结果反向更新所述背景模型。
该方法能够通过结果对分类模型进行反馈和更新,使得分类模型更加准确,提高后续目标检测的速度和效果。
根据本申请的另一个方面,还提供了一种目标检测装置,包括:
背景模型模块,其配置成用于将图像集合中的第一图像作为背景模型,将所述第一图像的每一个像素点建立初始样本集,所述初始样本集包括与该像素点临近的像素点的像素值;
像素点分类模块,其配置成用于将所述图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的所述初始样本集进行对比,将第二图像的像素点划分为前景点或背景点,其中,所述第二图像中的像素点的样本集包括与该像素点临近的像素点;
轮廓确定模块,其配置成用于确定所述第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片;和
目标检测模块,其配置成用于利用经过训练的分类模型对所述前景区域图片进行分类,从而确定待检测的目标。
本申请提供的装置能够在实际场景中快速且高精度的检测小目标,与传统检测算法相比,计算时间短、重复计算量小、背景建模更新速度快且检测精度高。
可选地,所述背景模型模块还与所述分类模型训练模块连接,所述分类模型训练模块,其配置成用于利用背景样本集和待检测的目标样本集对分类模型进行训练,在该分类模型的准确率达到第一阈值的情况下,得到经过训练的分类模型。
可选地,在所述目标检测模块还与分类模型更新模块连接,所述分类模型更新模块配置成用于在利用经过训练的分类模型对所述前景区域图片进行分类得到的分类结果为背景,则利用该分类结果反向更新所述背景模型。
根据本申请的另一个方面,还提供了一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述的方法。
根据本申请的另一个方面,还提供了一种计算机可读存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现上述的方法。
根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:
图1是根据本申请的目标检测方法的一个实施方案的示意性流程图;
图2是根据本申请的目标检测方法的另一个实施方案的示意性流程图;
图3是是根据本申请的目标检测方法的另一个实施方案的示意性流程图;
图4是基于背景模型得到的前景背景二值图;
图5是用于提取轮廓图片的前景背景二值图;
图6是前景的轮廓图片;
图7和图8是发现待检测目标的图像;
图9根据本申请的目标检测装置的一个实施方案的示意性框图;
图10根据本申请的目标检测装置的另一个实施方案的示意性框图;
图11是本申请的计算设备的一个实施例的框图;
图12是本申请的计算机可读存储介质的一个实施例的框图。
具体实施方式
根据下文结合附图对本申请的具体实施例的详细描述,本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。
本申请的实施方案提供了一种目标检测方法。图1是根据本申请的目标检测方法的一个实施方案的示意性流程图。该方法包括如下步骤:
S200背景模型建立步骤:将图像集合中的第一图像作为背景模型,将所述第一图像的每一个像素点建立初始样本集,所述初始样本集包括与该像素点临近的像素点的像素值。
S300像素点分类步骤:将所述图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的所述初始样本集进行对比,将第二图像的像素点划分为前景点或背景点,其中,所述第二图像中的像素点的样本集包括与该像素点临近的像素点。
S400轮廓确定步骤:确定所述第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片。
S500目标检测步骤:利用经过训练的分类模型对所述前景区域图片进行分类,从而确定待检测的目标。
本申请提供的方法能够在实际场景中快速且高精度的检测小目标,与传统检测算法相比,计算时间短、重复计算量小、背景建模更新速度快且检测精度高。本方法采用第一图像作为背景模型能够极大降低建立背景模型对内存的大量消耗,加快运算速度;采用分类模型进行分类相对于传统的特征点匹配分类方法分类的精度更高,并且更灵活。
本申请提供的目标检测方法尤其适用于小目标检测。例如,待检测的目标为鼠类、小型虫类。该方法对于防治鼠患及其他小型害虫有着重要意义。
图2是根据本申请的目标检测方法的另一个实施方案的示意性流程图。在一个可选实施方案中,在所述S200背景模型建立步骤之前,该方法还包括:
S100分类模型训练步骤:利用背景样本集和待检测的目标样本集对分类模型进行训练,在该分类模型的准确率达到第一阈值的情况下,得到经过训练的分类模型。
该步骤能够将获取的一定数量的待检测小目标样本集和背景负样本集利用深度学习算法建立高精度分类器,对制作的分类样本集进行训练生成深度学习算法模型,将目标样本与负样本有效分类。
所述S100分类模型训练步骤具体可以包括以下步骤:
正样本集和负样本集获取步骤:获取正样本集和负样本集,其中正样本集中包括待检测的小目标样本,并将其标签设置为1,负样本集包括非待检测目标并可能对检测目标产生干扰的背景图,将负样本的标签设定为0;
深度学习模型建立步骤:建立深度学习模型,例如,可以采用图像分类精度较高的卷积神经网络模型,并将神经网络输入设定为正样本集和负样本集中的样本图片,输出设定为二维向量,即为每个分类的得分值,神经网络的层数可根据样本量的大小自行定义;
深度学习模型训练步骤:使用正样本集和负样本集对建立好的深度学习模型进行训练,并通过反向传播算法对训练结果进行优化,根据损失值及验证精度判断模型训练进度,当验证精度高于第一阈值,例如,99%以上时停止训练,表明深度学习模型已经搭建完成。
在通过建立的卷积神经网络模型对标注的正负样本进行训练时,可以根据反向传播原理通过设定一凸优化策略对深度学习进行优化,建立其能够高精度分类正负样本的深度学习模型。
可选地,在S200背景模型建立步骤中,通过视觉相机获取若干个实际场景图片,这些图片构成图像集合,将图像集合的第一帧作为第一图像,将该第一图像作为背景模型进行背景建模,为第一图像的每一个像素点建立一个样本集,初始样本集为每个像素点的临近像素点。可选地,初始样本集为预定长度。例如,第一图像的每一个像素点可以设置一个长度为20的初始样本集,初始样本集中包括该像素点的临近像素点,则对于其任意像素点x0处的像素值,初始样本集M(x0)为:
M(x0)={V1,V2,...VN}(N=20)
其中,V1至VN表示像素点x0的临近像素点的像素值。
可选地,S300像素点分类步骤包括:将所述第二样本集中的每一个元素与所述初始样本集中的每一个元素作差,在所有的差值均大于第二阈值的情况下,将所述第二样本集对应的像素点设置为前景点,否则将该像素点设置为背景点,根据前景点和背景点对所述第二图像的像素点进行二值化处理。
对于视觉相机采集到的所有后续图像,逐帧计算后续图像对应位置像素与背景模型的样本集的每一元素的差值,如果后续图像像素点与对应位置样本集中每一个的差值均大于第二阈值的像素点则将该像素点设置为前景点,将该点的像素值设置为高亮状态,例如用白色表示;否则将该像素点设置为背景点,并将该点的像素值设置为低亮状态,例如用黑色表示。例如,对于第二图片,判断对应位置的像素点与背景模型的样本集的差值,以x为中心R为半径的建立像素点x的像素值集合SR(V(x)),如果对应像素点的像素值小于或等于第二阈值,则该像素点为背景点,并将该像素点放入背景样本集中,同时需要保证背景样本长度不变;反之,则将该像素点设置为前景点。图4是基于背景模型得到的前景背景二值图。对于得到的像素点分类图像,通过二值化处理后将后续图像设置为前景背景二值图,如图4所示。
将被设置为背景点的像素点加入背景模型中,可以利用该像素点替换背景模型中相应的像素点,并用该像素点的样本集作为背景模型中像素点的样本集,以便以后与新的图像中像素点进行比较。这样能够更新背景模型,使得背景模型更加准确,提高后续目标检测的速度和效果。
可选地,所述S400轮廓确定步骤包括:通过开闭运算消除离散的前景点,通过积分运算将前景点围成的区域中的像素点设置为前景点。
图5是用于提取轮廓图片的前景背景二值图,如图5所示,对于得到的将前景点和背景点进行区分的二值图,利用开闭运算将提取出的前景图中的离散前景点消除,并通过积分运算消除前景图像的空洞得到被判断为前景的高亮像素区域。
在得到的前景背景二值图中,提取出图5中前景点像素的区域边界,并根据该区域边界的坐标在第二图像对应位置进行框选,得到如图6所示的前景的轮廓图片。
可选地,所述S500目标检测步骤包括:
前景区域图片提取步骤:根据步骤S400得到的每一个前景轮廓图片,提取得到每一个前景区域图片;
目标判断步骤:将每一个前景区域图片作为深度学习模型的输入参数,并通过已经训练好的深度学习模型进行计算得到预测结果判断该区域是否为待检测的目标。
其中所述的深度学习模型的预测步骤如下:对于给定的输入样本图片x,通过下式对其输出结果进行判断,其中,CNN(x)表示图片x通过卷积神经网络计算得到计算结果,argmax()表示计算矩阵某一坐标中最大值的位置。
Figure BDA0001663066510000071
如果深度学习模型的输出为1,则证明此处前景区域图片为正样本,将判断结果输出,即采用本发明提供的方法检测到的小目标。图7和图8是发现待检测目标的图像,如图7和图8中加粗的白色框内所示。根据上式的输出结果,如果判断为正样本,则该处为待检测目标,直接输出为算法结果。如图3所示,图3是是根据本申请的目标检测方法的另一个实施方案的示意性流程图。如果深度学习模型的输出为0,则证明此处前景区域图片为负样本。对于判断为负样本,将此负样本处的像素点加入背景模型中像素点的样本集中,更新背景模型,并进行下一帧的判断。
参见图2,可选地,在所述S500目标检测步骤之后,该方法还包括;
S600分类模型更新步骤:在利用经过训练的分类模型对所述轮廓图片进行分类得到的分类结果为背景,则利用该分类结果反向更新所述背景模型。
所述步骤S600中根据深度学习计算结果反向更新背景建模模型,加快背景建模更新速度。在该步骤中:对于深度学习模型输出的结果为0,即表示该前景区域图片被判断为负样本,则根据从第二图像上提取到的此处前景区域坐标位置提取区域内所有的像素点,将此区域内所有的像素点的像素值添加进入背景模型中对应位置的样本集内,将此前景区域的像素点直接更新为背景,同时由于背景模型的样本集需要保持一定的长度,需要将背景模型的样本集的第一个元素删除。这样通过循环替代背景模型的样本集,能够使得样本集更加接近于真实背景的信息,以便后续更快速地进行目标检测。
对于后续的每一帧场景图片均采用此种更新策略,通过深度学习模型计算得到的输出结果,不断对背景模型进行更新,根据图4、图5、图6可以看出随着对每一帧进行计算及反向更新,白色框迅速减少,说明负样本的前景被迅速更新为背景,背景建模的速度明显加快,同时算法能够一直捕捉到待检测目标。
本方法基于深度学习反向更新背景建模能够加快背景建模算法的更新速度,提高目标的检测精度,同时相对于其他检测方法,本方法在检测小目标时具备了更高的精度和速度;由于选用了深度学习算法为背景建模进行反向更新优化,该方法对环境干扰具有很强的适应性,具备了较高的鲁棒性。
本申请的实施方案还公开了一种目标检测装置。图9根据本申请的目标检测装置的一个实施方案的示意性框图。该装置包括以下模块:
背景模型模块200,其配置成用于将图像集合中的第一图像作为背景模型,将所述第一图像的每一个像素点建立初始样本集,所述初始样本集包括与该像素点临近的像素点的像素值;
像素点分类模块300,其配置成用于将所述图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的所述初始样本集进行对比,将第二图像的像素点划分为前景点或背景点,其中,所述第二图像中的像素点的样本集包括与该像素点临近的像素点;
轮廓确定模块400,其配置成用于确定所述第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片;和
目标检测模块500,其配置成用于利用经过训练的分类模型对所述前景区域图片进行分类,从而确定待检测的目标。
本申请提供的装置能够在实际场景中快速且高精度的检测小目标,与传统检测算法相比,计算时间短、重复计算量小、背景建模更新速度快且检测精度高。
图10根据本申请的目标检测装置的另一个实施方案的示意性框图。可选地,所述背景模型模块还与所述分类模型训练模块100连接,所述分类模型训练模块100配置成用于利用背景样本集和待检测的目标样本集对分类模型进行训练,在该分类模型的准确率达到第一阈值的情况下,得到经过训练的分类模型。
可选地,所述轮廓确定模块400配置为通过开闭运算消除离散的前景点,通过积分运算将前景点围成的区域中的像素点设置为前景点。
参见图10,可选地,在所述目标检测模块还与分类模型更新模块600连接,所述分类模型更新模块配置成用于在利用经过训练的分类模型对所述前景区域图片进行分类得到的分类结果为背景,则利用该分类结果反向更新所述背景模型。
本申请实施例还提供了一种计算设备,参照图11,该计算设备包括存储器1120、处理器1110和存储在所述存储器1120内并能由所述处理器1110运行的计算机程序,该计算机程序存储于存储器1120中的用于程序代码的空间1130,该计算机程序在由处理器1110执行时实现用于执行任一项根据本发明的方法步骤1131。
本申请实施例还提供了一种计算机可读存储介质。参照图12,该计算机可读存储介质包括用于程序代码的存储单元,该存储单元设置有用于执行根据本发明的方法步骤的程序1131′,该程序被处理器执行。
本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行根据本申请的方法步骤。
本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得计算机执行上述方法中的任意一个。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(英文:non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(英文:magnetic tape),软盘(英文:floppy disk),光盘(英文:optical disc)及其任意组合。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (9)

1.一种目标检测方法,包括:
背景模型建立步骤:将图像集合中的第一图像作为背景模型,将所述第一图像的每一个像素点建立初始样本集,所述初始样本集包括与该像素点临近的像素点的像素值;
像素点分类步骤:将所述图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的所述初始样本集进行对比,将第二图像的像素点划分为前景点或背景点,其中,所述第二图像中的像素点的样本集包括与该像素点临近的像素点;
轮廓确定步骤:确定所述第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片;和
目标检测步骤:利用经过训练的分类模型对所述前景区域图片进行分类,从而确定待检测的目标;
所述像素点分类步骤包括:将所述第二样本集中的每一个元素与所述初始样本集中的每一个元素作差,在所有的差值均大于第二阈值的情况下,将所述第二样本集对应的像素点设置为前景点,否则将该像素点设置为背景点,根据前景点和背景点对所述第二图像的像素点进行二值化处理,将被设置为背景点的像素点加入背景模型中;
对于得到的将前景点和背景点进行区分的二值图,利用开闭运算将提取出的前景图中的离散前景点消除,并通过积分运算消除前景图像的空洞得到被判断为前景的高亮像素区域。
2.根据权利要求1所述的方法,其特征在于,在所述背景模型建立步骤之前,该方法还包括分类模型训练步骤:利用背景样本集和待检测的目标样本集对分类模型进行训练,在该分类模型的准确率达到第一阈值的情况下,得到经过训练的分类模型。
3.根据权利要求1所述的方法,其特征在于,所述轮廓确定步骤包括:通过开闭运算消除离散的前景点,通过积分运算将前景点围成的区域中的像素点设置为前景点。
4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述目标检测步骤之后,该方法还包括分类模型更新步骤:在利用经过训练的分类模型对所述前景区域图片进行分类得到的分类结果为背景,则利用该分类结果反向更新所述背景模型。
5.一种目标检测装置,包括:
背景模型模块,其配置成用于将图像集合中的第一图像作为背景模型,将所述第一图像的每一个像素点建立初始样本集,所述初始样本集包括与该像素点临近的像素点的像素值;
像素点分类模块,其配置成用于将所述图像集合的第二图像中的像素点的第二样本集与第一图片中对应的像素点的所述初始样本集进行对比,将第二图像的像素点划分为前景点或背景点,其中,所述第二图像中的像素点的样本集包括与该像素点临近的像素点;
轮廓确定模块,其配置成用于确定所述第二图像中被划分为前景的像素点所构成的轮廓以形成前景区域图片;和
目标检测模块,其配置成用于利用经过训练的分类模型对所述前景区域图片进行分类,从而确定待检测的目标;
所述像素点分类模块:配置成将所述第二样本集中的每一个元素与所述初始样本集中的每一个元素作差,在所有的差值均大于第二阈值的情况下,将所述第二样本集对应的像素点设置为前景点,否则将该像素点设置为背景点,根据前景点和背景点对所述第二图像的像素点进行二值化处理,将被设置为背景点的像素点加入背景模型中;
对于得到的将前景点和背景点进行区分的二值图,利用开闭运算将提取出的前景图中的离散前景点消除,并通过积分运算消除前景图像的空洞得到被判断为前景的高亮像素区域。
6.根据权利要求5所述的装置,其特征在于,所述背景模型模块还与分类模型训练模块连接,所述分类模型训练模块配置成用于利用背景样本集和待检测的目标样本集对分类模型进行训练,在该分类模型的准确率达到第一阈值的情况下,得到经过训练的分类模型。
7.根据权利要求5或6所述的装置,其特征在于,在所述目标检测模块还与分类模型更新模块连接,所述分类模型更新模块配置成用于在利用经过训练的分类模型对所述前景区域图片进行分类得到的分类结果为背景,则利用该分类结果反向更新所述背景模型。
8.一种计算设备,包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的方法。
9.一种计算机可读存储介质,为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现如权利要求1至4中任一项所述的方法。
CN201810470081.XA 2018-05-16 2018-05-16 一种基于深度学习的小目标检测方法、装置、设备和介质 Expired - Fee Related CN108648211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810470081.XA CN108648211B (zh) 2018-05-16 2018-05-16 一种基于深度学习的小目标检测方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810470081.XA CN108648211B (zh) 2018-05-16 2018-05-16 一种基于深度学习的小目标检测方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN108648211A CN108648211A (zh) 2018-10-12
CN108648211B true CN108648211B (zh) 2020-05-01

Family

ID=63756084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810470081.XA Expired - Fee Related CN108648211B (zh) 2018-05-16 2018-05-16 一种基于深度学习的小目标检测方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN108648211B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109299703B (zh) * 2018-10-17 2020-02-21 思百达物联网科技(北京)有限公司 对鼠情进行统计的方法、装置以及图像采集设备
CN109657615B (zh) * 2018-12-19 2021-11-02 腾讯科技(深圳)有限公司 一种目标检测的训练方法、装置及终端设备
CN111382834B (zh) * 2018-12-29 2023-09-29 杭州海康威视数字技术股份有限公司 一种置信度比较方法及装置
CN110207783A (zh) * 2019-06-28 2019-09-06 湖南江河机电自动化设备股份有限公司 一种基于视频识别的检测水位方法
CN110849876B (zh) * 2019-10-17 2022-06-24 广西电网有限责任公司电力科学研究院 一种基于多尺度的背景建模sf6气体红外动态检测方法
CN110826608A (zh) * 2019-10-25 2020-02-21 广州思德医疗科技有限公司 一种图像分类方法及装置
CN112070053B (zh) * 2020-09-16 2023-02-28 青岛维感科技有限公司 背景图像的自更新方法、装置、设备及存储介质
CN113240611B (zh) * 2021-05-28 2024-05-07 中建材信息技术股份有限公司 一种基于图片序列的异物检测方法
CN114581482B (zh) * 2022-03-09 2023-05-02 湖南中科助英智能科技研究院有限公司 一种动平台下运动目标检测方法、装置和检测设备
CN115797750B (zh) * 2023-02-02 2023-04-25 天津滨海迅腾科技集团有限公司 一种基于深度学习算法的大尺寸图像快速传输方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020631A (zh) * 2012-11-23 2013-04-03 西安电子科技大学 基于星型模型的人体运动识别方法
CN103839279A (zh) * 2014-03-18 2014-06-04 湖州师范学院 一种目标检测中基于vibe的粘连目标分割方法
CN104978567A (zh) * 2015-06-11 2015-10-14 武汉大千信息技术有限公司 基于场景分类的车辆检测方法
CN106845396A (zh) * 2017-01-18 2017-06-13 南京理工大学 基于自动图像识别的非法钓鱼行为识别方法
CN107909010A (zh) * 2017-10-27 2018-04-13 北京中科慧眼科技有限公司 一种道路障碍物检测方法与装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101493980B (zh) * 2009-03-05 2011-07-20 中国科学技术大学 一种基于多特征融合的快速视频火焰探测方法
CN101957997B (zh) * 2009-12-22 2012-02-22 北京航空航天大学 一种动态场景中基于区域均值核密度估计的运动目标检测方法
WO2014153369A1 (en) * 2013-03-18 2014-09-25 Life Technologies Corporation Methods and systems for analyzing biological reaction systems
KR102535617B1 (ko) * 2016-01-04 2023-05-24 한국전자통신연구원 깊이 영상에서의 객체 검출 시스템 및 방법
WO2018052912A1 (en) * 2016-09-13 2018-03-22 Oregon Health & Science University Pathogen quantification using labeled probes

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020631A (zh) * 2012-11-23 2013-04-03 西安电子科技大学 基于星型模型的人体运动识别方法
CN103839279A (zh) * 2014-03-18 2014-06-04 湖州师范学院 一种目标检测中基于vibe的粘连目标分割方法
CN104978567A (zh) * 2015-06-11 2015-10-14 武汉大千信息技术有限公司 基于场景分类的车辆检测方法
CN106845396A (zh) * 2017-01-18 2017-06-13 南京理工大学 基于自动图像识别的非法钓鱼行为识别方法
CN107909010A (zh) * 2017-10-27 2018-04-13 北京中科慧眼科技有限公司 一种道路障碍物检测方法与装置

Also Published As

Publication number Publication date
CN108648211A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108648211B (zh) 一种基于深度学习的小目标检测方法、装置、设备和介质
CN112052787B (zh) 基于人工智能的目标检测方法、装置及电子设备
JP7236545B2 (ja) ビデオターゲット追跡方法と装置、コンピュータ装置、プログラム
CN110738101B (zh) 行为识别方法、装置及计算机可读存储介质
WO2020228446A1 (zh) 模型训练方法、装置、终端及存储介质
KR102166458B1 (ko) 인공신경망 기반의 영상 분할을 이용한 불량 검출 방법 및 불량 검출 장치
CN108898624B (zh) 一种运动物体跟踪的方法、装置、电子设备和存储介质
US10373320B2 (en) Method for detecting moving objects in a video having non-stationary background
CN110781836A (zh) 人体识别方法、装置、计算机设备及存储介质
CN111046856B (zh) 基于动静态特征提取并行位姿跟踪与地图创建的方法
CN111860439A (zh) 一种无人机巡检图像缺陷检测方法、***及设备
US20230334235A1 (en) Detecting occlusion of digital ink
CN111079638A (zh) 基于卷积神经网络的目标检测模型训练方法、设备和介质
CN113379789B (zh) 一种复杂环境下运动目标跟踪方法
CN110909657A (zh) 一种隧道表观病害图像识别的方法
CN113763424B (zh) 基于嵌入式平台的实时智能目标检测方法及***
CN111625683A (zh) 基于图结构差异分析的视频摘要自动生成方法及***
CN108765463B (zh) 一种结合区域提取与改进纹理特征的运动目标检测方法
CN109684953B (zh) 基于目标检测和粒子滤波算法进行猪只跟踪的方法及装置
Liu et al. Silhouette-based on-site human action recognition in single-view video
KR101690050B1 (ko) 지능형 영상보안 시스템 및 객체 추적 방법
CN111428567B (zh) 一种基于仿射多任务回归的行人跟踪***及方法
JP6028972B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN116758421A (zh) 一种基于弱监督学习的遥感图像有向目标检测方法
Zou et al. Statistical analysis of signal-dependent noise: application in blind localization of image splicing forgery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200501