CN109685823B - 一种基于深度森林的目标跟踪方法 - Google Patents

一种基于深度森林的目标跟踪方法 Download PDF

Info

Publication number
CN109685823B
CN109685823B CN201811580315.2A CN201811580315A CN109685823B CN 109685823 B CN109685823 B CN 109685823B CN 201811580315 A CN201811580315 A CN 201811580315A CN 109685823 B CN109685823 B CN 109685823B
Authority
CN
China
Prior art keywords
forest
target
image
layer
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811580315.2A
Other languages
English (en)
Other versions
CN109685823A (zh
Inventor
郭唐仪
朱周
刘英舜
胡启洲
周竹萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN201811580315.2A priority Critical patent/CN109685823B/zh
Publication of CN109685823A publication Critical patent/CN109685823A/zh
Application granted granted Critical
Publication of CN109685823B publication Critical patent/CN109685823B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度森林的目标跟踪方法。该方法为:将目标图像与待匹配图像在水平方向上进行串联以组成样本图像,建立正负样本集;定义多粒度扫描层和级联森林层,将两者串联构建深度森林模型;对多粒度扫描层和级联森林层分别进行训练,在训练过程中,以测试准确性的增加值小于阈值作为训练停止条件来确定级联森林层的层数;以上一帧图像中的目标位置为基础定义局部搜索范围,按照离散尺度间隔提取候选图像并归一化,将第一帧目标图像与候选图像进行串联并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪。本发明提高了复杂环境下目标跟踪的稳定性,并具有较好的实时性。

Description

一种基于深度森林的目标跟踪方法
技术领域
本发明属于计算机视觉技术领域,特别是一种基于深度森林的目标跟踪方法。
背景技术
目标跟踪是计算机视觉领域中的重要研究方向,得到了学术界和工业界的广泛关注。它的目的是在序列图像中对运动的目标物体进行定位,从而获得其相关参数,如位置、速度、尺度、轨迹等,这些参数可被进一步用于目标物体的行为理解,或者完成更高一级的任务。随着计算机性能提高和摄像终端增多,目标跟踪的需求不断增加,具有良好的发展前景,其典型应用已包括:安全监控、交通监控、人机交互、机器人、军事领域和医学应用等许多方面。
目标跟踪中存在着诸多影响因素,比如环境光照的变化、目标尺寸及外观的变化、目标与环境之间的遮挡、阴影现象等,都会影响目标跟踪的准确性和鲁棒性。深度神经网络能够从大量数据中自动学习深度特征,相比人工设计的图像特征更为稳定,近年来在目标跟踪中得到了普遍应用,同时它也存在着一些局限性,如对样本数量和计算量要求大,超参数较多,训练过程中的经验性较强。
发明内容
本发明的目的在于提供一种在复杂环境下稳定性高、实时性好的基于深度森林的目标跟踪方法,在保证目标跟踪性能的同时减少对样本数量、超参数的依赖性。
实现本发明目的的技术解决方案为:一种基于深度森林的目标跟踪方法,包括以下步骤:
步骤1:建立目标跟踪视频集,将视频集中的目标图像与待匹配图像进行归一化,并在水平方向上合并以组成样本图像,建立正负样本集,然后将该样本集划分为训练集和测试集两部分;
步骤2:定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型;
步骤3:在训练集中,首先对多粒度扫描层进行训练,然后以训练之后多粒度扫描层输出的特征向量作为样本,对级联森林层进行训练;在训练过程中,以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数;
步骤4:读入跟踪视频,确定目标初始位置、尺寸,提取目标模板图像并归一化,在任意时刻以上一帧图像中的目标位置为中心定义局部搜索范围,对该搜索范围中的每一个候选位置,按照离散尺度间隔提取候选图像并归一化,将归一化后的目标模板图像与候选图像在水平方向上合并,并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪。
进一步地,步骤1中所述的建立正负样本集,具体如下:
步骤1.1:设定目标图像和待匹配图像为I1和I2,按尺寸[Sx,Sy]对I1和I2进行归一化,得到归一化后的目标图像和待匹配图像为I1'和I2',计算两者之间的重叠率
Figure GDA0003739706490000021
定义阈值t1和t2,其中t1>t2
步骤1.2:如果重叠率IOU大于等于阈值t1,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入正样本集;
步骤1.3:如果重叠率IOU小于等于阈值t2,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入负样本集,如果重叠率IOU大于阈值t2小于阈值t1,则丢弃目标图像I1'和待匹配图像I2'。
进一步地,步骤2中所述的定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型,具体如下:
步骤2.1:多粒度扫描层中包括N1种扫描窗口,每一种扫描窗口对应一个随机森林和一个完全随机树森林,每个随机森林和完全随机树森林各包括N2棵决策树,最终将N1个随机森林和N1个完全随机树森林的输出相并联,构成特征向量作为级联森林层的输入,其中N1的取值范围为[1,5],N2的取值范围为[500,1000];
步骤2.2:级联森林层中包含N3个随机森林和N3个完全随机树森林,每个随机森林和完全随机树森林各包括N4棵决策树,对N3个随机森林和N3个完全随机树森林的输出进行平均,最终输出样本属于目标的概率向量,其中N3的取值范围为[1,5],N4的取值范围为[500,1000]。
进一步地,步骤3中所述的在训练过程中,以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数,具体如下:
步骤3.1:设定级联森林层的层数为n情况下的测试准确性为qn,当n=1时以多粒度扫描层输出的特征向量作为样本对第1层级联森林层进行训练,并计算测试准确性q1
步骤3.2:令n=n+1,增加新的级联森林层,以多粒度扫描层输出的特征向量和上一次级联森林层输出的概率向量共同作为样本,对新的级联森林层进行训练,计算新的测试准确性qn,如果qn-qn-1<t3,其中t3为阈值,取值范围为[0.01,0.05],则转到步骤3.3,否则重复步骤3.2;
步骤3.3:结束训练,级联森林层的最终层数为n。
进一步地,步骤4中所述的读入跟踪视频,确定目标初始位置、尺寸,提取目标模板图像并归一化,在任意时刻以上一帧图像中的目标位置为中心定义局部搜索范围,对该搜索范围中的每一个候选位置,按照离散尺度间隔提取候选图像并归一化,将归一化后的目标模板图像与候选图像在水平方向上合并,并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪,具体如下:
步骤4.1:设定第m帧中的目标图像为Pi,目标左上角位置为[xi,yi],目标尺寸为[sxi,syi],当m=1时确定目标初始位置[x1,y1]和初始尺寸[sx1,sy1],并按尺寸[Sx,Sy]对目标初始图像P1进行归一化,得到目标模板图像P1';
步骤4.2:设定新的一帧为m=m+1,定义第m帧中目标候选位置的搜索范围为{[xm,ym]||xm-xm-1|≤R,|ym-ym-1|≤R},R为搜索范围的半径,在该搜索范围中共有(2R+1)2个目标候选位置,每一个目标候选位置对应2N5+1个候选尺寸因子[1-N5δ,1-(N5-1)δ,...,1,...,1+(N5-1)δ,1+N5δ],其中N5的取值范围为[1,5],δ是尺寸变化间隔,共有(2N5+1)(2R+1)2个目标候选图像,将它们按尺寸[Sx,Sy]进行归一化,得到目标候选图像集Z;
步骤4.3:分别将目标模板图像P1'与目标候选图像集Z中的每一个目标候选图像在水平方向上进行合并,并输入深度森林模型,得到(2N5+1)(2R+1)2个概率,计算最大概率所对应的位置和尺寸作为目标在当前帧的位置[xm,ym]和尺寸[sxm,sym];
步骤4.4:设定视频中的总帧数为mmax,如果m=mmax则跟踪结束,否则转至步骤4.2。
本发明与现有技术相比,其显著优点为:(1)采用多粒度窗口进行扫描以提取图像原始特征,能够提取像素点之间的上下文联系,更好地对目标进行描述;(2)在特征学习中对样本数量的要求较低,减少了目标跟踪中特征学习所需的样本数量,提高了小样本情况下目标跟踪的准确性和稳定性;(3)在特征学习中能够自动确定级联森林层的层数,而不需要人工选择,从而对跟踪环境和跟踪对象的变化具有更好的适应性,并具有较好的实时性。
附图说明
图1是本发明基于深度森林的目标跟踪方法的基本流程图。
图2是本发明中样本图像的合并流程图。
图3是本发明中细粒度扫描层的流程图。
图4是本发明中级联森林层的流程图。
图5是本发明中目标候选图像生成的流程图。
图6是本发明中确定当前目标位置的流程图。
具体实施方式
本发明基于深度森林的目标跟踪方法,包括以下步骤:
步骤1:建立目标跟踪视频集,将视频集中的目标图像与待匹配图像进行归一化,并在水平方向上合并以组成样本图像,建立正负样本集,然后将该样本集划分为训练集和测试集两部分;
步骤2:定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型;
步骤3:在训练集中,首先对多粒度扫描层进行训练,然后以训练之后多粒度扫描层输出的特征向量作为样本,对级联森林层进行训练;在训练过程中,以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数;
步骤4:读入跟踪视频,确定目标初始位置、尺寸,提取目标模板图像并归一化,在任意时刻以上一帧图像中的目标位置为中心定义局部搜索范围,对该搜索范围中的每一个候选位置,按照离散尺度间隔提取候选图像并归一化,将归一化后的目标模板图像与候选图像在水平方向上合并,并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪。
进一步地,步骤1中所述的建立正负样本集,具体如下:
步骤1.1:设定目标图像和待匹配图像为I1和I2,按尺寸[Sx,Sy]对I1和I2进行归一化,得到归一化后的目标图像和待匹配图像为I1'和I2',计算两者之间的重叠率
Figure GDA0003739706490000051
定义阈值t1和t2,其中t1>t2
步骤1.2:如果重叠率IOU大于等于阈值t1,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入正样本集;
步骤1.3:如果重叠率IOU小于等于阈值t2,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入负样本集,如果重叠率IOU大于阈值t2小于阈值t1,则丢弃目标图像I1'和待匹配图像I2'。
进一步地,步骤2中所述的定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型,具体如下:
步骤2.1:多粒度扫描层中包括N1种扫描窗口,每一种扫描窗口对应一个随机森林和一个完全随机树森林,每个随机森林和完全随机树森林各包括N2棵决策树,最终将N1个随机森林和N1个完全随机树森林的输出相并联,构成特征向量作为级联森林层的输入,其中N1的取值范围为[1,5],N2的取值范围为[500,1000];
步骤2.2:级联森林层中包含N3个随机森林和N3个完全随机树森林,每个随机森林和完全随机树森林各包括N4棵决策树,对N3个随机森林和N3个完全随机树森林的输出进行平均,最终输出样本属于目标的概率向量,其中N3的取值范围为[1,5],N4的取值范围为[500,1000]。
进一步地,步骤3中所述的在训练过程中,以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数,具体如下:
步骤3.1:设定级联森林层的层数为n情况下的测试准确性为qn,当n=1时以多粒度扫描层输出的特征向量作为样本对第1层级联森林层进行训练,并计算测试准确性q1
步骤3.2:令n=n+1,增加新的级联森林层,以多粒度扫描层输出的特征向量和上一次级联森林层输出的概率向量共同作为样本,对新的级联森林层进行训练,计算新的测试准确性qn,如果qn-qn-1<t3,其中t3为阈值,取值范围为[0.01,0.05],则转到步骤3.3,否则重复步骤3.2;
步骤3.3:结束训练,级联森林层的最终层数为n。
进一步地,步骤4中所述的读入跟踪视频,确定目标初始位置、尺寸,提取目标模板图像并归一化,在任意时刻以上一帧图像中的目标位置为中心定义局部搜索范围,对该搜索范围中的每一个候选位置,按照离散尺度间隔提取候选图像并归一化,将归一化后的目标模板图像与候选图像在水平方向上合并,并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪,具体如下:
步骤4.1:设定第m帧中的目标图像为Pi,目标左上角位置为[xi,yi],目标尺寸为[sxi,syi],当m=1时确定目标初始位置[x1,y1]和初始尺寸[sx1,sy1],并按尺寸[Sx,Sy]对目标初始图像P1进行归一化,得到目标模板图像P1';
步骤4.2:设定新的一帧为m=m+1,定义第m帧中目标候选位置的搜索范围为{[xm,ym]||xm-xm-1|≤R,|ym-ym-1|≤R},R为搜索范围的半径,在该搜索范围中共有(2R+1)2个目标候选位置,每一个目标候选位置对应2N5+1个候选尺寸因子[1-N5δ,1-(N5-1)δ,...,1,...,1+(N5-1)δ,1+N5δ],其中N5的取值范围为[1,5],δ是尺寸变化间隔,共有(2N5+1)(2R+1)2个目标候选图像,将它们按尺寸[Sx,Sy]进行归一化,得到目标候选图像集Z;
步骤4.3:分别将目标模板图像P1'与目标候选图像集Z中的每一个目标候选图像在水平方向上进行合并,并输入深度森林模型,得到(2N5+1)(2R+1)2个概率,计算最大概率所对应的位置和尺寸作为目标在当前帧的位置[xm,ym]和尺寸[sxm,sym];
步骤4.4:设定视频中的总帧数为mmax,如果m=mmax则跟踪结束,否则转至步骤4.2。
下面结合附图及具体实施例对本发明作进一步详细说明。
实施例
结合图1,本发明基于深度森林的目标跟踪方法,包括以下步骤:
步骤1:如图2所示,建立目标跟踪视频集,将视频集中的目标图像与待匹配图像进行归一化,并在水平方向上合并以组成样本图像,建立包含50000个正样本和50000个负样本的样本集合,并将该集合以5:5的比例划分为训练集和测试集两部分,具体如下:
步骤1.1:设定目标图像和待匹配图像为I1和I2,按尺寸[32,32]对I1和I2进行归一化,得到归一化后的目标图像和待匹配图像为I1'和I2',计算两者之间的重叠率
Figure GDA0003739706490000071
步骤1.2:如果重叠率IOU大于阈值0.8,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入正样本集;
步骤1.3:如果重叠率IOU小于阈值0.3,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入负样本集。
步骤2:定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型,具体如下:
步骤2.1:如图3所示,多粒度扫描层中包括3种扫描窗口:7×7、9×9和11×11,每一种扫描窗口对应一个随机森林和一个完全随机树森林,每个随机森林和完全随机树森林各包括500棵决策树,最终将3个随机森林和3个完全随机树森林的输出相并联,构成特征向量作为级联森林层的输入;
步骤2.2:级联森林层中包括4个随机森林和4个完全随机树森林,每个随机森林和完全随机树森林各包括500棵决策树,对500个随机森林和500个完全随机树森林的输出进行平均,最终输出样本属于目标的概率向量。
步骤3:如图4所示,在训练集中,首先对多粒度扫描层进行训练,然后以训练之后多粒度扫描层输出的特征向量作为样本,对级联森林层进行训练;在训练过程中以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数,具体如下;
步骤3.1:设定级联森林层的层数为n情况下的测试准确性为qn,当n=1时以多粒度扫描层输出的特征向量作为样本对第1层级联森林层进行训练,并计算测试准确性q1
步骤3.2:令n=n+1,增加新的级联森林层,以多粒度扫描层输出的特征向量和上一次级联森林层输出的概率向量共同作为样本,对新的级联森林层进行训练,计算新的测试准确性qn,如果qn-qn-1<0.02则转到步骤3.3,否则重复步骤3.2;
步骤3.3:结束训练,级联森林层的最终层数为n。
步骤4:读入跟踪视频,确定目标初始位置、尺寸,提取目标模板图像并归一化,在任意时刻以上一帧图像中的目标位置为中心定义局部搜索范围,对该搜索范围中的每一个候选位置,按照离散尺度间隔提取候选图像并归一化,将归一化后的目标模板图像与候选图像在水平方向上合并,并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪,具体如下:
步骤4.1:设定第m帧中的目标图像为Pi,目标左上角位置为[xi,yi],目标尺寸为[sxi,syi],当m=1时确定目标初始位置[x1,y1]和初始尺寸[sx1,sy1],并按尺寸[Sx,Sy]对目标初始图像P1进行归一化,得到目标模板图像P1';
步骤4.2:如图5所示,设定新的一帧为m=m+1,定义第m帧中目标候选位置的搜索范围为{[xm,ym]||xm-xm-1|≤10,|ym-ym-1|≤10},在该搜索范围中共有441个目标候选位置,每一个目标候选位置对应5个候选尺寸因子[0.9,0.95,1,1.05,1.1],共有2205个目标候选图像,将它们按尺寸[32,32]进行归一化,得到目标候选图像集Z;
步骤4.3:如图6所示,分别将目标模板图像P1'与目标候选图像集Z中的每一个目标候选图像在水平方向上进行合并,并输入深度森林模型,得到2205个概率,计算最大概率所对应的位置和尺寸作为目标在当前帧的位置[xm,ym]和尺寸[sxm,sym];
步骤4.4:设定视频中的总帧数为mmax,如果m=mmax则跟踪结束,否则转至步骤4.2。
综上所述,本发明采用多粒度窗口进行扫描以提取图像原始特征,能够提取像素点之间的上下文联系,更好地对目标进行描述;在特征学习中对样本数量的要求较低,减少了目标跟踪中特征学习所需的样本数量,提高了小样本情况下目标跟踪的准确性和稳定性;并且在特征学习中能够自动确定级联森林层的层数,而不需要人工选择,从而对跟踪环境和跟踪对象的变化具有更好的适应性,并具有较好的实时性。

Claims (4)

1.一种基于深度森林的目标跟踪方法,其特征在于,包括以下步骤:
步骤1:建立目标跟踪视频集,将视频集中的目标图像与待匹配图像进行归一化,并在水平方向上合并以组成样本图像,建立正负样本集,然后将该样本集划分为训练集和测试集两部分;
步骤2:定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型;
步骤3:在训练集中,首先对多粒度扫描层进行训练,然后以训练之后多粒度扫描层输出的特征向量作为样本,对级联森林层进行训练;在训练过程中,以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数;
步骤4:读入跟踪视频,确定目标初始位置、尺寸,提取目标模板图像并归一化,在任意时刻以上一帧图像中的目标位置为中心定义局部搜索范围,对该搜索范围中的每一个候选位置,按照离散尺度间隔提取候选图像并归一化,将归一化后的目标模板图像与候选图像在水平方向上合并,并输入深度森林模型,对深度森林模型输出的概率进行比较,以最高概率所对应的位置作为目标当前位置,从而实现目标跟踪,具体如下:
步骤4.1:设定第m帧中的目标图像为Pi,目标左上角位置为[xi,yi],目标尺寸为[sxi,syi],当m=1时确定目标初始位置[x1,y1]和初始尺寸[sx1,sy1],并按尺寸[Sx,Sy]对目标初始图像P1进行归一化,得到目标模板图像P1';
步骤4.2:设定新的一帧为m=m+1,定义第m帧中目标候选位置的搜索范围为{[xm,ym]||xm-xm-1|≤R,|ym-ym-1|≤R},R为搜索范围的半径,在该搜索范围中共有(2R+1)2个目标候选位置,每一个目标候选位置对应2N5+1个候选尺寸因子[1-N5δ,1-(N5-1)δ,...,1,...,1+(N5-1)δ,1+N5δ],其中N5的取值范围为[1,5],δ是尺寸变化间隔,共有(2N5+1)(2R+1)2个目标候选图像,将它们按尺寸[Sx,Sy]进行归一化,得到目标候选图像集Z;
步骤4.3:分别将目标模板图像P1'与目标候选图像集Z中的每一个目标候选图像在水平方向上进行合并,并输入深度森林模型,得到(2N5+1)(2R+1)2个概率,计算最大概率所对应的位置和尺寸作为目标在当前帧的位置[xm,ym]和尺寸[sxm,sym];
步骤4.4:设定视频中的总帧数为mmax,如果m=mmax则跟踪结束,否则转至步骤4.2。
2.根据权利要求1所述的基于深度森林的目标跟踪方法,其特征在于,步骤1中所述的建立正负样本集,具体如下:
步骤1.1:设定目标图像和待匹配图像为I1和I2,按尺寸[Sx,Sy]对I1和I2进行归一化,得到归一化后的目标图像和待匹配图像为I1'和I2',计算两者之间的重叠率
Figure FDA0003739706480000021
定义阈值t1和t2,其中t1>t2
步骤1.2:如果重叠率IOU大于等于阈值t1,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入正样本集;
步骤1.3:如果重叠率IOU小于等于阈值t2,则将归一化后的目标图像I1'和待匹配图像I2'在水平方向上合并为样本图像I',并加入负样本集,如果重叠率IOU大于阈值t2小于阈值t1,则丢弃目标图像I1'和待匹配图像I2'。
3.根据权利要求1所述的基于深度森林的目标跟踪方法,其特征在于,步骤2中所述的定义多粒度扫描层和级联森林层并将两者串联,以样本图像作为多粒度扫描层的输入,以多粒度扫描层的输出作为级联森林层的输入,构建深度森林模型,具体如下:
步骤2.1:多粒度扫描层中包括N1种扫描窗口,每一种扫描窗口对应一个随机森林和一个完全随机树森林,每个随机森林和完全随机树森林各包括N2棵决策树,最终将N1个随机森林和N1个完全随机树森林的输出相并联,构成特征向量作为级联森林层的输入,其中N1的取值范围为[1,5],N2的取值范围为[500,1000];
步骤2.2:级联森林层中包含N3个随机森林和N3个完全随机树森林,每个随机森林和完全随机树森林各包括N4棵决策树,对N3个随机森林和N3个完全随机树森林的输出进行平均,最终输出样本属于目标的概率向量,其中N3的取值范围为[1,5],N4的取值范围为[500,1000]。
4.根据权利要求1所述的基于深度森林的目标跟踪方法,其特征在于,步骤3中所述的在训练过程中,以深度森林模型测试准确性的增加值小于阈值作为训练停止条件,来确定级联森林层的层数,具体如下:
步骤3.1:设定级联森林层的层数为n情况下的测试准确性为qn,当n=1时以多粒度扫描层输出的特征向量作为样本对第1层级联森林层进行训练,并计算测试准确性q1
步骤3.2:令n=n+1,增加新的级联森林层,以多粒度扫描层输出的特征向量和上一次级联森林层输出的概率向量共同作为样本,对新的级联森林层进行训练,计算新的测试准确性qn,如果qn-qn-1<t3,其中t3为阈值,取值范围为[0.01,0.05],则转到步骤3.3,否则重复步骤3.2;
步骤3.3:结束训练,级联森林层的最终层数为n。
CN201811580315.2A 2018-12-24 2018-12-24 一种基于深度森林的目标跟踪方法 Active CN109685823B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811580315.2A CN109685823B (zh) 2018-12-24 2018-12-24 一种基于深度森林的目标跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811580315.2A CN109685823B (zh) 2018-12-24 2018-12-24 一种基于深度森林的目标跟踪方法

Publications (2)

Publication Number Publication Date
CN109685823A CN109685823A (zh) 2019-04-26
CN109685823B true CN109685823B (zh) 2022-10-28

Family

ID=66188939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811580315.2A Active CN109685823B (zh) 2018-12-24 2018-12-24 一种基于深度森林的目标跟踪方法

Country Status (1)

Country Link
CN (1) CN109685823B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110580517A (zh) * 2019-09-12 2019-12-17 石家庄铁道大学 基于堆叠自编码器的特征提取方法、装置及终端设备
CN113033827B (zh) * 2021-03-03 2024-03-15 南京大学 一种用于深度森林的训练方法和装置
CN113252161A (zh) * 2021-04-26 2021-08-13 西北工业大学 一种基于深度森林的小样本水中目标识别方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506796A (zh) * 2017-08-25 2017-12-22 电子科技大学 一种基于深度森林的阿尔兹海默病分类方法
CN107958255A (zh) * 2017-11-21 2018-04-24 中国科学院微电子研究所 一种基于图像的目标检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506796A (zh) * 2017-08-25 2017-12-22 电子科技大学 一种基于深度森林的阿尔兹海默病分类方法
CN107958255A (zh) * 2017-11-21 2018-04-24 中国科学院微电子研究所 一种基于图像的目标检测方法及装置

Also Published As

Publication number Publication date
CN109685823A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN109190442B (zh) 一种基于深度级联卷积神经网络的快速人脸检测方法
CN108399428B (zh) 一种基于迹比准则的三元组损失函数设计方法
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
CN108288035A (zh) 基于深度学习的多通道图像特征融合的人体动作识别方法
CN109685823B (zh) 一种基于深度森林的目标跟踪方法
CN110929848B (zh) 基于多挑战感知学习模型的训练、跟踪方法
CN112818969B (zh) 一种基于知识蒸馏的人脸姿态估计方法及***
CN112766229B (zh) 基于注意力机制的人脸点云图像智能识别***及方法
CN111259940A (zh) 一种基于空间注意力地图的目标检测方法
CN108021908B (zh) 人脸年龄段识别方法及装置、计算机装置及可读存储介质
CN108320306B (zh) 融合tld和kcf的视频目标跟踪方法
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN108615229B (zh) 基于曲率点聚类及决策树的碰撞检测优化方法
CN109800795A (zh) 一种果蔬识别方法及***
KR102593835B1 (ko) 휴리스틱 가우스 클라우드 변환에 기반하는 얼굴인식 기술
CN110263874A (zh) 一种基于注意力关系图学习的图像分类方法及装置
CN113065974A (zh) 一种基于动态网络表示学习的链路预测方法
CN112163636A (zh) 基于孪生神经网络的电磁信号辐射源的未知模式识别方法
CN115761888A (zh) 基于nl-c3d模型的塔吊操作人员异常行为检测方法
CN112132257A (zh) 基于金字塔池化及长期记忆结构的神经网络模型训练方法
CN115240259A (zh) 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测***
CN111597943A (zh) 一种基于图神经网络的表格结构识别方法
CN110288026A (zh) 一种基于度量关系图学习的图像分割方法及装置
CN111242028A (zh) 基于U-Net的遥感图像地物分割方法
CN113158754B (zh) 一种番茄病害图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Guo Tangyi

Inventor after: Zhu Zhou

Inventor after: Liu Yingshun

Inventor after: Hu Qizhou

Inventor after: Zhou Zhuping

Inventor before: Zhu Zhou

Inventor before: Liu Yingshun

Inventor before: Hu Qizhou

Inventor before: Guo Tangyi

Inventor before: Zhou Zhuping

GR01 Patent grant
GR01 Patent grant