CN111524098A - 一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法 - Google Patents

一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法 Download PDF

Info

Publication number
CN111524098A
CN111524098A CN202010265447.7A CN202010265447A CN111524098A CN 111524098 A CN111524098 A CN 111524098A CN 202010265447 A CN202010265447 A CN 202010265447A CN 111524098 A CN111524098 A CN 111524098A
Authority
CN
China
Prior art keywords
clustering
layer
samples
centers
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010265447.7A
Other languages
English (en)
Other versions
CN111524098B (zh
Inventor
郝梦茜
张辉
周斌
杨柏胜
倪少波
靳松直
丛龙剑
刘严羊硕
郑文娟
韦海萍
田爱国
邵俊伟
李建伟
张孝赫
张连杰
张艺明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aerospace Automatic Control Research Institute
Original Assignee
Beijing Aerospace Automatic Control Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aerospace Automatic Control Research Institute filed Critical Beijing Aerospace Automatic Control Research Institute
Priority to CN202010265447.7A priority Critical patent/CN111524098B/zh
Publication of CN111524098A publication Critical patent/CN111524098A/zh
Application granted granted Critical
Publication of CN111524098B publication Critical patent/CN111524098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,属于卷积神经网络的目标检测识别技术领域,特别提供了一种针对SSD算法的网络输出层裁剪及模板框尺寸确定方法。使用自组织聚类可以在不确定目标尺寸分布的情况下获得更好的聚类结果,使用聚类结果计算目标上限面积,确定输出层层数,删掉感受野过大、层数过深的输出层,减少网络深度和参数数量,降低模型训练的难度,加快模型收敛,提高模型泛化能力,减少计算耗时,提高计算效率。

Description

一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确 定方法
技术领域
本发明涉及一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,属于卷积神经网络的目标检测识别技术领域,特别提供了一种针对SSD算法的网络输出层裁剪及模板框尺寸确定方法。
背景技术
近年来卷积神经网络在图像目标检测识别领域展示出了远超传统图像分析方法的性能,在民用、国防、工业等领域产生了良好的使用效果。目前在学术界,卷积神经网络的主要研究方向以可见光图像大目标场景为主,在此类问题中目标尺寸大、特征丰富、训练样本丰富,需要更深层的网络为目标检测识别提供更好的非线性特性。
然而,在遥感、军事等某些特殊应用场景中,多以SAR、红外图像为主,成像分辨率偏低、目标种类有限、目标像素尺寸普遍偏小、训练样本数量有限,使用更深的网络往往导致训练过程难以收敛,训练结果容易过拟合,导致模型泛化性能较差,实用效果不佳。
为解决这一问题,部分方案采取减少网络深度,减少网络待训练参数数量的方式降低模型训练难度,但是这种减少网络深度的方法基本依靠人为经验调整,调整效果难以保证。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提出一种基于自组织聚类的神经网络输出层裁剪及模板框确定方法,该方法针对目标种类有限、目标像素尺寸普遍偏小、训练样本数量有限的场景下,过深的SSD网络会导致训练收敛困难、模型泛化能力差的问题,对使用自组织聚类算法对训练样本数据中的目标尺寸进行聚类,得到聚类中心个数和聚类中心;根据相应准则确定SSD网络输出层数和模板框(又称:default box)尺寸,去掉不必要的输出层,减少网络深度,降低网络复杂度,降低模型训练收敛难度。本方案针对上述问题,针对SSD算法提出了基于自组织聚类的输出层裁剪及模板框尺寸确定方法,通过对训练样本数据进行分析,提取样本尺寸分布,进而确定合适的网络输出层数和合理的模板框尺寸,对原有模型输出层进行裁剪并合理确定模板框尺寸,减少网络深度,降低网络复杂度,降低模型训练收敛难度和计算耗时。
本发明的解决方案是:
一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,该方法的步骤包括:
(1)将训练数据上的每个目标均用二维特征向量(w,h)表示,其中,w为目标像素宽度,h为目标像素高度,二维特征向量(w,h)的个数用N表示,以下二维特征向量(w,h)简称样本,样本用x表示。
(2)设定步骤(1)得到的N个样本的初始聚类中心个数为K、聚类中最少的样本数目为θN、聚类中样本距离分布的标准差为θS、两聚类中心之间的最小距离为θC、最大迭代运算次数为Imax
(3)在N个样本中随机选取K个作为初始聚类中心,并令NC=K,NC表示当前聚类中心个数,每个聚类中心用Zj表示,j=1,2,…,NC,各聚类中心对应的类别用Sj表示,j=1,2,…,NC,类别Sj中的样本数量用Nj表示,j=1,2,…,NC,迭代运算次数用I表示,令I=1。
(4)遍历所有样本x,计算样本x与各聚类中心Zj之间的距离Dj,将样本x划归到与样本x距离最小的聚类中心对应的类别中。
(5)如果某类别Sj中样本数量NjN,则取消该类别,令当前聚类中心个数NC减少1,并将该类别中的样本按照(4)中的最小距离准则划归到其他类别中;否则对类别Sj不做处理。
(6)对各类别Sj中的样本x取平均,得到的平均值即为修正后的聚类中心Zj,j=1,2,…,NC
(7)对各类别Sj计算各类别中的样本到聚类中心的平均距离
Figure BDA0002441108120000033
j=1,2,…,NC
(8)计算全部类别样本与相应聚类中心的总平均距离
Figure BDA0002441108120000032
(9)判断类别Sj的***、合并及迭代运算。
1)如果迭代运算次数I≥Imax,即最后一次迭代,置θC=0,跳到步骤(13)。
2)如果θN≤K/2,即聚类中心的数目等于或不到规定值的一半,则进入步骤(10),将已有的聚类***。
3)如迭代运算的次数I是偶数,或NC≥2K,则不进行***处理,跳到步骤(13);如果I是奇数,且NC<2K,则进入步骤(10),进行***处理。
(10)计算每个类别Sj中各样本x到聚类中心Zj的标准差向量σj,j=1,2,…,NC
(11)对(10)中计算得到的标准差向量σj提取最大分量,用σjmax表示,j=1,2,…,NC
(12)最大分量集{σjmax},j=1,2,…,NC中,如有σjmaxS,且满足如下两个条件中的任意一个:
(1)
Figure BDA0002441108120000031
且Nj>(θN+1)*2;
(2)NC≤K/2;
则将Zj***为两个新的聚类中心,且令聚类中心个数NC加1。完成***运算后,跳回步骤(4),且令迭代运算次数I加1;否则不对聚类中心Zj进行操作,进入步骤(13)。
(13)计算NC个聚类中心两两之间的距离Dij=||Zi-Zj||,i=1,2,…,NC-1,j=i+1,2,…,NC
(14)若距离最近的两个聚类中心之间的距离DijC,则将这两个聚类中心合并为一个新的聚类中心,两个聚类中心对应的类别合并为一个类别,并令聚类中心个数NC减1;否则则不做处理。
(15)如果迭代运算次数I≥Imax,聚类运算结束,进入步骤(16),否则回到步骤(4)且令迭代运算次数I加1。
(16)对NC个聚类中心Zj=(wj,hj)计算上限面积
Figure BDA0002441108120000041
对NC
Figure BDA0002441108120000042
进行从小到大排序,获得最大上限面积
Figure BDA0002441108120000043
(17)根据
Figure BDA0002441108120000044
判断输出层层数Lout
Figure BDA0002441108120000045
则输出层数为Lout=6;
Figure BDA0002441108120000046
则输出层数为Lout=5;
Figure BDA0002441108120000047
则输出层数为Lout=4;
Figure BDA0002441108120000048
则输出层数为Lout=3;
Figure BDA0002441108120000049
则输出层数为Lout=2。
(18)SSD算法中共有6个输出层,分别为conv4_3,fc7,conv8_2,conv9_2,conv10_2,conv11_2。
若Lout=2则只保留conv4_3,fc7层,删掉fc7之后的卷积层;
若Lout=3则只保留conv4_3,fc7,conv8_2,删掉conv8_2之后的卷积层;
若Lout=4则只保留conv4_3,fc7,conv8_2,conv9_2,删掉conv9_2之后的卷积层;
若Lout=5则只保留conv4_3,fc7,conv8_2,conv9_2,conv10_2,删掉conv10_2之后的卷积层;
若Lout=6则不对SSD网络进行删减。
(19)对各聚类中心确定其相应的模板框所在输出层:
对NC个聚类中心Zj=(wj,hj)计算面积Aj=wj×hj
若Aj>(300/3)2则在conv11_2层设计对应模板框;
若(300/5)2<Aj≤(300/3)2则在conv10_2层设计对应模板框;
若(300/10)2<Aj≤(300/5)2则在conv9_2层设计对应模板框;
若(300/19)2<Aj≤(300/10)2则在conv8_2层设计对应模板框;
若(300/38)2<Aj≤(300/19)2则在fc7层设计对应模板框;
若Aj≤(300/38)2则在conv4_3层设计对应模板框。
(20)对各聚类中心确定其相应的模板框尺寸:
NC个聚类中心Zj=(wj,hj)对应的模板框尺寸分别为:
Figure BDA0002441108120000051
max_size=max(wj,hj)
Figure BDA0002441108120000052
其中floor()为向下取整。
(21)若对所有聚类中心设计了对应的模板框之后仍有某输出层没有设计相应的模板框,则按照如下准则设计:
若某输出层没有设计相应的模板框,那么就采用距离它最近的层的min_size,max_size,aspect_ratio参数。若有两个输出层距离该层距离相同,浅层为LayerB,深层为LayerT,则该输出层参数
Figure BDA0002441108120000053
aspect_ratio采用的LayerB的aspect_ratioB和LayerT的aspect_ratioT的并集。
(22)对所有输出层都添加aspect_ratio=1的模板框比例。
(23)对完成了输出层裁剪及模板框尺寸确定的卷积神经网络进行训练,得到层数更少,复杂度更低的,计算效率更高的神经网络模型。
上述方案在步骤(1)中,提取标注信息中的目标宽w、高h尺寸的具体方法为:读取xml中各<bndbox>节点中的<xmin>、<ymin>、<xmax>、<ymax>值,计算该目标的宽w=xmax-xmin+1,高h=ymax-ymin+1。
上述方案在步骤(3)中,随机选取K个样本的具体方法为:按照U(0,1)在0到1之间按均匀分布生成K一个随机数α12,…,αK,取第ceil(aiN)个样本作为第i个初始聚类中心,其中ceil()为向上取整。
上述方案在步骤(4)中,样本x与聚类中心Zj之间距离的计算方法为:Dj=||x-Zj||。
上述方案在步骤(4)中,样本x的归类方法为:若
Figure BDA0002441108120000054
则该样本x归于Sj类。
上述方案在步骤(5)中,取消某类别的具体方法为:取消该聚类中心,令聚类中心个数NC减1,释放原本归属于该类别的样本,对释放出的样本计算其与其他聚类中心之间的距离,释放样本与哪个聚类中心之间的距离最近就将之归类于哪一个类别。
上述方案在步骤(6)中,修正各类别聚类中心Zj的具体方法为:
Figure BDA0002441108120000061
上述方案在步骤(7)中,计算各类别Sj中的样本到聚类中心的平均距离
Figure BDA0002441108120000067
的具体方法为:
Figure BDA0002441108120000062
上述方案在步骤(8)中,计算全部类别样本与相应聚类中心的总平均距离
Figure BDA0002441108120000063
的具体方法为:
Figure BDA0002441108120000064
上述方案在步骤(10)中,计算每个类别Sj中各样本x=(xw,xh)到聚类中心Zj=(wj,hj)的标准差向量σj=(σw,jh,j)的具体方法为:
Figure BDA0002441108120000065
Figure BDA0002441108120000066
上述方案在步骤(11)中,提取各标准差向量中σj=(σw,jh,j)的最大分量σjmax的具体方法为:
σjmax=max(σw,jh,j)
上述方案在步骤(12)中,将Zj***为两个新的聚类中心的具体方法为:聚类Sj中各样本x到聚类中心Zj的标准差为σj=(σw,jh,j),若σw,j≥σh,j则令γ=(σw,j,0);若σw,jh,j则令γ=(0,σh,j)。Zj***出的两个新聚类中心分别为:Zj+kγ和Zj-kγ,其中0<k<1。
上述方案在步骤(14)中,聚类中心合并的具体方法为:若距离最近的两个聚类中心之间的距离DijC,则将两个聚类中心对应的类别合并为一个类别,取消两个聚类中心的聚类中心地位,对这两类释放出的样本重新计算聚类中心
Figure BDA0002441108120000071
并令聚类中心个数NC减1。
上述方案在步骤(16)中,获得最大面积
Figure BDA0002441108120000072
的具体方法为:
Figure BDA0002441108120000073
其中,
Figure BDA0002441108120000074
附图说明
图1为本发明的方法流程示意图;
图2为模板框尺寸的示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
实施例
一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,该方法的步骤包括:
(1)将训练数据上的每个目标均用二维特征向量(w,h)表示,其中,w为目标像素宽度,h为目标像素高度,二维特征向量(w,h)的个数用N表示,以下二维特征向量(w,h)简称样本,样本用x表示。
(2)设定步骤(1)得到的N个样本的初始聚类中心个数为K、聚类中最少的样本数目为θN、聚类中样本距离分布的标准差为θS、两聚类中心之间的最小距离为θC、最大迭代运算次数为Imax
(3)在N个样本中随机选取K个作为初始聚类中心,并令NC=K,NC表示当前聚类中心个数,每个聚类中心用Zj表示,j=1,2,…,NC,各聚类中心对应的类别用Sj表示,j=1,2,…,NC,类别Sj中的样本数量用Nj表示,j=1,2,…,NC,迭代运算次数用I表示,令I=1。
(4)遍历所有样本x,计算样本x与各聚类中心Zj之间的距离Dj,将样本x划归到与样本x距离最小的聚类中心对应的类别中。
(5)如果某类别Sj中样本数量NjN,则取消该类别,令当前聚类中心个数NC减少1,并将该类别中的样本按照(4)中的最小距离准则划归到其他类别中;否则对类别Sj不做处理。
(6)对各类别Sj中的样本x取平均,得到的平均值即为修正后的聚类中心Zj,j=1,2,…,NC
(7)对各类别Sj计算各类别中的样本到聚类中心的平均距离
Figure BDA0002441108120000081
j=1,2,…,NC
(8)计算全部类别样本与相应聚类中心的总平均距离
Figure BDA0002441108120000082
(9)判断类别Sj的***、合并及迭代运算。
1)如果迭代运算次数I≥Imax,即最后一次迭代,置θC=0,跳到步骤(13)。
2)如果θN≤K/2,即聚类中心的数目等于或不到规定值的一半,则进入步骤(10),将已有的聚类***。
3)如迭代运算的次数I是偶数,或NC≥2K,则不进行***处理,跳到步骤(13);如果I是奇数,且NC<2K,则进入步骤(10),进行***处理。
(10)计算每个类别Sj中各样本x到聚类中心Zj的标准差向量σj,j=1,2,…,NC
(11)对(10)中计算得到的标准差向量σj提取最大分量,用σjmax表示,j=1,2,…,NC
(12)最大分量集{σjmax},j=1,2,…,NC中,如有σjmaxS,且满足如下两个条件中的任意一个:
(1)
Figure BDA0002441108120000083
且Nj>(θN+1)*2;
(2) NC≤K/2;
则将Zj***为两个新的聚类中心,且令聚类中心个数NC加1。完成***运算后,跳回步骤(4),且令迭代运算次数I加1;否则不对聚类中心Zj进行操作,进入步骤(13)。
(13)计算NC个聚类中心两两之间的距离Dij=||Zi-Zj||,i=1,2,…,NC-1,j=i+1,2,…,NC
(14)若距离最近的两个聚类中心之间的距离DijC,则将这两个聚类中心合并为一个新的聚类中心,两个聚类中心对应的类别合并为一个类别,并令聚类中心个数NC减1;否则则不做处理。
(15)如果迭代运算次数I≥Imax,聚类运算结束,进入步骤(16),否则回到步骤(4)且令迭代运算次数I加1。
(16)对NC个聚类中心Zj=(wj,hj)计算上限面积
Figure BDA0002441108120000091
对NC
Figure BDA0002441108120000092
进行从小到大排序,获得最大上限面积
Figure BDA0002441108120000093
(17)根据
Figure BDA0002441108120000094
判断输出层层数Lout
Figure BDA0002441108120000095
则输出层数为Lout=6;
Figure BDA0002441108120000096
则输出层数为Lout=5;
Figure BDA0002441108120000097
则输出层数为Lout=4;
Figure BDA0002441108120000098
则输出层数为Lout=3;
Figure BDA0002441108120000099
则输出层数为Lout=2。
(18)SSD算法中共有6个输出层,分别为conv4_3,fc7,conv8_2,conv9_2,conv10_2,conv11_2。
若Lout=2则只保留conv4_3,fc7层,删掉fc7之后的卷积层;
若Lout=3则只保留conv4_3,fc7,conv8_2,删掉conv8_2之后的卷积层;
若Lout=4则只保留conv4_3,fc7,conv8_2,conv9_2,删掉conv9_2之后的卷积层;
若Lout=5则只保留conv4_3,fc7,conv8_2,conv9_2,conv10_2,删掉conv10_2之后的卷积层;
若Lout=6则不对SSD网络进行删减。
(19)对各聚类中心确定其相应的模板框所在输出层:
对NC个聚类中心Zj=(wj,hj)计算面积Aj=wj×hj
若Aj>(300/3)2则在conv11_2层设计对应模板框;
若(300/5)2<Aj≤(300/3)2则在conv10_2层设计对应模板框;
若(300/10)2<Aj≤(300/5)2则在conv9_2层设计对应模板框;
若(300/19)2<Aj≤(300/10)2则在conv8_2层设计对应模板框;
若(300/38)2<Aj≤(300/19)2则在fc7层设计对应模板框;
若Aj≤(300/38)2则在conv4_3层设计对应模板框。
(20)对各聚类中心确定其相应的模板框尺寸:
NC个聚类中心Zj=(wj,hj)对应的模板框尺寸分别为:
Figure BDA0002441108120000101
max_size=max(wj,hj)
Figure BDA0002441108120000102
其中floor()为向下取整。
(21)若对所有聚类中心设计了对应的模板框之后仍有某输出层没有设计相应的模板框,则按照如下准则设计:
若某输出层没有设计相应的模板框,那么就采用距离它最近的层的min_size,max_size,aspect_ratio参数。若有两个输出层距离该层距离相同,浅层为LayerB,深层为LayerT,则该输出层参数
Figure BDA0002441108120000103
aspect_ratio采用的LayerB的aspect_ratioB和LayerT的aspect_ratioT的并集。
(22)对所有输出层都添加aspect_ratio=1的模板框比例。
(23)对完成了输出层裁剪及模板框尺寸确定的卷积神经网络进行训练,得到层数更少,复杂度更低的,计算效率更高的神经网络模型。
上述方案在步骤(1)中,提取标注信息中的目标宽w、高h尺寸的具体方法为:读取xml中各<bndbox>节点中的<xmin>、<ymin>、<xmax>、<ymax>值,计算该目标的宽w=xmax-xmin+1,高h=ymax-ymin+1。
上述方案在步骤(3)中,随机选取K个样本的具体方法为:按照U(0,1)在0到1之间按均匀分布生成K一个随机数α12,…,αK,取第ceil(aiN)个样本作为第i个初始聚类中心,其中ceil()为向上取整。
上述方案在步骤(4)中,样本x与聚类中心Zj之间距离的计算方法为:Dj=||x-Zj||。
上述方案在步骤(4)中,样本x的归类方法为:若
Figure BDA0002441108120000111
则该样本x归于Sj类。
上述方案在步骤(5)中,取消某类别的具体方法为:取消该聚类中心,令聚类中心个数NC减1,释放原本归属于该类别的样本,对释放出的样本计算其与其他聚类中心之间的距离,释放样本与哪个聚类中心之间的距离最近就将之归类于哪一个类别。
上述方案在步骤(6)中,修正各类别聚类中心Zj的具体方法为:
Figure BDA0002441108120000112
上述方案在步骤(7)中,计算各类别Sj中的样本到聚类中心的平均距离
Figure BDA0002441108120000116
的具体方法为:
Figure BDA0002441108120000113
上述方案在步骤(8)中,计算全部类别样本与相应聚类中心的总平均距离
Figure BDA0002441108120000114
的具体方法为:
Figure BDA0002441108120000115
上述方案在步骤(10)中,计算每个类别Sj中各样本x=(xw,xh)到聚类中心Zj=(wj,hj)的标准差向量σj=(σw,jh,j)的具体方法为:
Figure BDA0002441108120000121
Figure BDA0002441108120000122
上述方案在步骤(11)中,提取各标准差向量中σj=(σw,jh,j)的最大分量σjmax的具体方法为:
σjmax=max(σw,jh,j)
上述方案在步骤(12)中,将Zj***为两个新的聚类中心的具体方法为:聚类Sj中各样本x到聚类中心Zj的标准差为σj=(σw,jh,j),若σw,j≥σh,j则令γ=(σw,j,0);若σw,jh,j则令γ=(0,σh,j)。Zj***出的两个新聚类中心分别为:Zj+kγ和Zj-kγ,其中0<k<1。
上述方案在步骤(14)中,聚类中心合并的具体方法为:若距离最近的两个聚类中心之间的距离DijC,则将两个聚类中心对应的类别合并为一个类别,取消两个聚类中心的聚类中心地位,对这两类释放出的样本重新计算聚类中心
Figure BDA0002441108120000123
并令聚类中心个数NC减1。
上述方案在步骤(16)中,获得最大面积
Figure BDA0002441108120000124
的具体方法为:
Figure BDA0002441108120000125
其中,
Figure BDA0002441108120000126
如图1所示是本方案提出的一种基于自组织聚类的SSD网络输出层裁剪及模板框尺寸确定方法的具体实施过程。
图1中“提取训练数据中目标宽、高作为特征向量样本”对应步骤(1):
全部训练数据共1000张图片,遍历全部图片中的所有目标,读取目标标注信息<bndbox>节点中的<xmin>、<ymin>、<xmax>、<ymax>值,计算该目标的宽w=xmax-xmin+1,高h=ymax-ymin+1,将(w,h)作为一个二维特征向量样本x记录下来,进入后续操作,本实施例中记录特征向量个数N=1858。
图1中“参数初始化”对应步骤(2):
本实施例中设定初始聚类中心个数K=6,聚类中最少的样本数目θN=80,聚类中样本距离分布的标准差θS=5,两聚类中心之间的最小距离θC=5,最大迭代运算次数Imax=100。
图1中“随机选取初始聚类中心”对应步骤(3):
在0到1之间按均匀分布生成K个随机数α12,…,αK,取第ceil(aiN)个样本作为第i个初始聚类中心,其中ceil()为向上取整,令NC=K,迭代运算次数I=1。
图1中“样本按最小距离准则归类”对应步骤(4):
遍历所有样本x,计算其与聚类中心Zj之间的距离Dj=||x-Zj||,将样本x划归到与样本x距离最小的聚类中心对应的类别中。
图1中“取消样本数量过小的类别”对应步骤(5):
如果某类别Sj中样本数量NjN,则取消该类别,令当前聚类中心个数NC减少1,释放原本归属于该类别的样本,对释放的样本计算其与其他聚类中心之间的距离,释放的样本与哪个聚类中心之间的距离最近就将之归类于哪一个类别;否则对类别Sj不做处理。
图1中“修正聚类中心”对应步骤(6):
对各类别Sj中的所有样本取平均,得到的平均值即为修正后的聚类中心
Figure BDA0002441108120000131
j=1,2,…,Nc
图1中“计算各类中样本到聚类中心的平均距离”对应步骤(7):
计算各类别Sj中的样本到聚类中心Zj的平均距离
Figure BDA0002441108120000132
图1中“计算全部类别样本与其相应聚类中心的总平均距离”对应步骤(8):
计算全部类别样本与其相应聚类中心的总平均距离
Figure BDA0002441108120000133
图1中“判断类别的***、合并及迭代运算”对应步骤(9):
判断类别的***、合并及迭代运算,判断当前状态是否需要进行***操作,若需要进行***操作则跳到步骤(10),若不需要进行***操作则跳到步骤(13),具体判断方法如下:
1)如果迭代运算次数I≥Imax,即最后一次迭代,置θC=0,跳到步骤(13)。
2)如果θN≤K/2,即聚类中心的数目等于或不到规定值的一半,则进入步骤(10),将已有的聚类***。
3)如迭代运算的次数I是偶次,或NC≥2K,则不进行***处理,跳到步骤(13);如果I是奇数,且NC<2K,则进入步骤(10),进行***处理。
图1中“计算各类别样本到聚类中心的标准差”对应步骤(10):
计算每个类别Sj中各样本x=(xw,xh)到聚类中心Zj的标准差向量σj=(σw,jh,j),具体方法为:
Figure BDA0002441108120000141
Figure BDA0002441108120000142
图1中所述“获取标准差中的最大分量”对应步骤(11):
提取各标准差向量中σj=(σw,jh,j)的最大分量σjmax=max(σw,jh,j)。
图1中所述“对满足***条件的类别进行类别***”对应步骤(12):
若各类别Sj中有σjmaxS,且满足如下两个条件中的任意一个:
(1)
Figure BDA0002441108120000143
且Nj>(θN+1)*2;
(2)NC≤K/2;
则将Zj***为两个新的聚类中心,类别Sj中各样本x到聚类中心Zj的标准差为σj=(σw,jh,j),若σw,j≥σh,j则令γ=(σw,j,0);若σw,jh,j则令γ=(0,σh,j)。Zj***出的两个新聚类中心分别为Zj+kγ和Zj-kγ,其中0<k<1,本实施例中k=0.5,并令聚类中心个数NC加1;否则不对聚类中心Zj进行操作,进入步骤(13)。
完成***运算后,令迭代运算次数I加1,并跳回步骤(4)。
图1中所述“计算各聚类中心两两之间的距离”对应步骤(13):
计算NC个聚类中心两两之间的距离Dij=||Zi-Zj||,i=1,2,…,NC-1,j=i+1,2,…,NC
图1中所述“对满足合并条件的类别进行合并”对应步骤(14):
若距离最近的两个聚类中心之间的距离DijC,则将两个聚类中心对应的类别合并为一个类别,将这两个聚类中心合并为一个新的聚类中心,取消两个聚类中心的聚类中心地位,对这两类释放出的样本重新计算聚类中心
Figure BDA0002441108120000151
并令聚类中心个数NC减1。
图1中所述“判断迭代是否结束”对应步骤(15):
如果迭代运算次数I≥Imax,聚类运算结束,进入步骤(16),否则回到步骤(4)且迭代运算次数I加1。
图1中所述“计算聚类中心最大上限面积”对应步骤(16):
对NC个聚类中心向量(wj,hj)计算上限面积
Figure BDA0002441108120000152
对NC
Figure BDA0002441108120000153
进行从小到大排序,获得最大上限面积
Figure BDA0002441108120000154
本实施例中,聚类结束时共获得聚类中心7个,分别为(10.9,28.7),(27.2,12.1),(9.8,4.5),(6.8,11.4),(13.9,21.7),(19.7,15.4),(11.9,10.2),计算可得各聚类中心上限面积
Figure BDA0002441108120000155
Figure BDA0002441108120000156
因此最大上限面积为
Figure BDA0002441108120000157
图1中所述“判断输出层层数”对应步骤(17):
根据
Figure BDA0002441108120000158
判断输出层层数Lout
Figure BDA0002441108120000159
则输出层数为Lout=6;
Figure BDA00024411081200001510
则输出层数为Lout=5;
Figure BDA00024411081200001511
则输出层数为Lout=4;
Figure BDA00024411081200001512
则输出层数为Lout=3;
Figure BDA0002441108120000161
则输出层数为Lout=2。
本实施例中
Figure BDA0002441108120000162
因此输出层数Lout=3。
图1中所述“对SSD网络进行删减”对应步骤(18):
SSD算法中共有6个输出层,分别为conv4_3,fc7,conv8_2,conv9_2,conv10_2,conv11_2。
若Lout=2则只保留conv4_3,fc7层,删掉fc7之后的卷积层;
若Lout=3则只保留conv4_3,fc7,conv8_2,删掉conv8_2之后的卷积层;
若Lout=4则只保留conv4_3,fc7,conv8_2,conv9_2,删掉conv9_2之后的卷积层;
若Lout=5则只保留conv4_3,fc7,conv8_2,conv9_2,conv10_2,删掉conv10_2之后的卷积层;
若Lout=6则不对SSD网络进行删减。
本实施例中Lout=3,因此只保留conv4_3,fc7,conv8_2输出层,删掉conv8_2之后的卷积层。
图1中所述“对各聚类中心确定其相应模板框所在输出层”对应步骤(19):
对各聚类中心Zj=(wj,hj)计算面积Aj=wj×hj
若Aj>(300/3)2则在conv11_2层设计对应模板框;
若(300/5)2<Aj≤(300/3)2则在conv10_2层设计对应模板框;
若(300/10)2<Aj≤(300/5)2则在conv9_2层设计对应模板框;
若(300/19)2<Aj≤(300/10)2则在conv8_2层设计对应模板框;
若(300/38)2<Aj≤(300/19)2则在fc7层设计对应模板框;
若Aj≤(300/38)2则在conv4_3层设计对应模板框。
本实施例中各聚类中心为(10.9,28.7),(27.2,12.1),(9.8,4.5),(6.8,11.4),(13.9,21.7),(19.7,15.4),(11.9,10.2);各聚类中心面积分别为A1=312.83,A2=329.12,A3=44.10,A4=77.52,A5=301.63,A6=303.38,A7=121.38,对应的模板框所在层分别为conv8_2层,conv8_2层,conv4_3层,fc7层,conv8_2层,conv8_2层,fc7层。
图1中所述“对各聚类中心确定其相应模板框尺寸”对应步骤(20):
NC个聚类中心Zj=(wj,hj)对应的模板框尺寸为:
Figure BDA0002441108120000171
max_size=max(wj,hj)
Figure BDA0002441108120000172
其中floor()为向下取整。
本实用例中各聚类中心分别为(10.9,28.7),(27.2,12.1),(9.8,4.5),(6.8,11.4),(13.9,21.7),(19.7,15.4),(11.9,10.2)。计算得到各聚类中心对应的模板框尺寸分别为:
聚类中心1:min_size=17.7;max_size=28.7;aspect_ratio=2
聚类中心2:min_size=18.1;max_size=27.2;aspect_ratio=2
聚类中心3:min_size=6.6;max_size=9.8;aspect_ratio=2
聚类中心4:min_size=8.8;max_size=11.4;aspect_ratio=1
聚类中心5:min_size=17.3;max_size=21.7;aspect_ratio=1
聚类中心6:min_size=17.4;max_size=19.7;aspect_ratio=1
聚类中心7:min_size=11.0;max_size=11.9;aspect_ratio=1
图1中所述“对尚未设计模板框的输出层涉及模板框”对应步骤(21):
若某输出层没有设计相应的模板框,那么就采用距离它最近的层的min_size,max_size,aspect_ratio参数。若有两个输出层距离该层距离相同,浅层为LayerB,深层为LayerT,则该输出层参数
Figure BDA0002441108120000173
aspect_ratio采用的LayerB的aspect_ratioB和LayerT的aspect_ratioT的并集。
在本实用例中conv4_3层,fc7层,conv8_2层输出层均有响应的模板框,因此没有进行本步骤操作。
conv4_3层:min_size=6.6;max_size=9.8;aspect_ratio=2
fc7层:min_size=8.8;max_size=11.4;aspect_ratio=1
min_size=11.0;max_size=11.9;aspect_ratio=1
conv8_2层:min_size=17.7;max_size=28.7;aspect_ratio=2
min_size=18.1;max_size=27.2;aspect_ratio=2
min_size=17.3;max_size=21.7;aspect_ratio=1
min_size=17.4;max_size=19.7;aspect_ratio=1
图1中所述“对所有输出层都添加aspect_ratio=1的模板框比例”对应步骤(22):
本实用例中conv4_3层没有aspect_ratio=1的模板框比例,因此添加aspect_ratio=1;fc7层和conv8_2层均有aspect_ratio=1的模板框比例因此不需要添加。
本方案结束时确定的网络结构为SSD网络保留conv4_3,fc7,conv8_2输出层,删掉conv8_2之后的卷积层,各输出层的模板框设计如下所示:
conv4_3层:
min_size=6.6
max_size=9.8
aspect_ratio=1,2
fc7层:
min_size=8.8,11.0
max_size=11.4,11.9
aspect_ratio=1
conv8_2层:
min_size=17.7,18.1,17.3,17.4
max_size=28.7,27.2,21.7,19.7
aspect_ratio=1,2
图2中所示为模板框尺寸的示意图。
对SSD网络进行改造前,网络收敛到MAP=0.9的需要迭代35000次,对SSD网络进行改造后网络收敛到MAP=0.9仅需要23000次,表明本方案能够去掉不必要的输出层,减少网络深度,降低网络复杂度,降低模型训练收敛难度。对SSD网络进行改造前,网络计算耗时为29ms,SSD网络改造后,网络计算耗时为20ms,提高了计算效率。
本发明使用自组织聚类算法对训练样本尺寸进行聚类分析,通过聚类结果确定SSD网络输出层个数,对网络进行裁剪。
使用自组织聚类可以在不确定目标尺寸分布的情况下获得更好的聚类结果,使用聚类结果计算目标上限面积,确定输出层层数,删掉感受野过大、层数过深的输出层,减少网络深度和参数数量,降低模型训练的难度,加快模型收敛,提高模型泛化能力,减少计算耗时,提高计算效率。
本发明使用自组织聚类算法对训练样本尺寸进行聚类分析,通过聚类结果确定模板框尺寸。
使用自组织聚类结果设计模板框尺寸,使模板框尺寸更接近目标真实尺寸,降低网络对目标位置偏差的回归难度,提高目标检测的准确率。

Claims (10)

1.一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于该方法的步骤包括:
(1)将训练数据上的每个目标均用二维特征向量(w,h)表示,其中,w为目标像素宽度,h为目标像素高度,二维特征向量(w,h)的个数用N表示,以下二维特征向量(w,h)简称样本,样本用x表示。
(2)设定步骤(1)得到的N个样本的初始聚类中心个数为K、聚类中最少的样本数目为θN、聚类中样本距离分布的标准差为θS、两聚类中心之间的最小距离为θC、最大迭代运算次数为Imax
(3)在N个样本中随机选取K个作为初始聚类中心,并令NC=K,NC表示当前聚类中心个数,每个聚类中心用Zj表示,j=1,2,…,NC,各聚类中心对应的类别用Sj表示,j=1,2,…,NC,类别Sj中的样本数量用Nj表示,j=1,2,…,NC,迭代运算次数用I表示;
(4)遍历所有样本x,计算样本x与各聚类中心Zj之间的距离Dj,将样本x划归到与样本x距离最小的聚类中心对应的类别中;
(5)如果某类别Sj中样本数量NjN,则取消该类别,令当前聚类中心个数NC减少1,并将该类别中的样本按照(4)中的最小距离准则划归到其他类别中;否则不对类别Sj做处理;
(6)对各类别Sj中的样本x取平均,得到的平均值即为修正后的聚类中心Zj,j=1,2,…,NC
(7)对各类别Sj计算各类别中的样本到聚类中心的平均距离
Figure FDA0002441108110000012
j=1,2,…,NC
(8)计算全部类别样本与相应聚类中心的总平均距离
Figure FDA0002441108110000011
(9)判断类别Sj的***、合并及迭代运算;
1)如果迭代运算次数I≥Imax,即最后一次迭代,置θC=0,跳到步骤(13);
2)如果θN≤K/2,即聚类中心的数目等于或不到规定值的一半,则进入步骤(10),将已有的聚类***;
3)如迭代运算的次数I是偶数,或NC≥2K,则不进行***处理,跳到步骤(13);如果I是奇数,且NC<2K,则进入步骤(10),进行***处理;
(10)计算每个类别Sj中各样本x到聚类中心Zj的标准差向量σj,j=1,2,…,NC
(11)对(10)中计算得到的标准差向量σj提取最大分量,用σjmax表示,j=1,2,…,NC
(12)最大分量集{σjmax}中,j=1,2,…,NC,如有σjmaxS,且满足如下两个条件中的任意一个:
(a)
Figure FDA0002441108110000021
且Nj>(θN+1)*2;
(b)NC≤K/2;
则将Zj***为两个新的聚类中心,且令聚类中心个数NC加1,完成***运算后,跳回步骤(4),且令迭代运算次数I加1;否则不对聚类中心Zj进行操作,进入步骤(13);
(13)计算NC个聚类中心两两之间的距离Dij=||Zi-Zj||,i=1,2,…,NC-1,j=i+1,2,…,NC
(14)若距离最近的两个聚类中心之间的距离DijC,则将这两个聚类中心合并为一个新的聚类中心,两个聚类中心对应的类别合并为一个类别,并令聚类中心个数NC减1;否则不做处理;
(15)如果迭代运算次数I≥Imax,聚类运算结束,进入步骤(16),否则回到步骤(4)且令迭代运算次数I加1;
(16)对NC个聚类中心Zj=(wj,hj)计算上限面积
Figure FDA0002441108110000022
对NC
Figure FDA0002441108110000023
进行从小到大排序,获得最大上限面积
Figure FDA0002441108110000024
(17)根据
Figure FDA0002441108110000025
判断输出层层数Lout
Figure FDA0002441108110000026
则输出层数为Lout=6;
Figure FDA0002441108110000031
则输出层数为Lout=5;
Figure FDA0002441108110000032
则输出层数为Lout=4;
Figure FDA0002441108110000033
则输出层数为Lout=3;
Figure FDA0002441108110000034
则输出层数为Lout=2。
(18)SSD算法中共有6个输出层,分别为conv4_3,fc7,conv8_2,conv9_2,conv10_2,conv11_2。
若Lout=2则只保留conv4_3,fc7层,删掉fc7之后的卷积层;
若Lout=3则只保留conv4_3,fc7,conv8_2,删掉conv8_2之后的卷积层;
若Lout=4则只保留conv4_3,fc7,conv8_2,conv9_2,删掉conv9_2之后的卷积层;
若Lout=5则只保留conv4_3,fc7,conv8_2,conv9_2,conv10_2,删掉conv10_2之后的卷积层;
若Lout=6则不对SSD网络进行删减;
(19)对各聚类中心确定其相应的模板框所在输出层:
对NC个聚类中心Zj=(wj,hj)计算面积Aj=wj×hj
若Aj>(300/3)2则在conv11_2层设计对应模板框;
若(300/5)2<Aj≤(300/3)2则在conv10_2层设计对应模板框;
若(300/10)2<Aj≤(300/5)2则在conv9_2层设计对应模板框;
若(300/19)2<Aj≤(300/10)2则在conv8_2层设计对应模板框;
若(300/38)2<Aj≤(300/19)2则在fc7层设计对应模板框;
若Aj≤(300/38)2则在conv4_3层设计对应模板框。
(20)对各聚类中心确定其相应的模板框尺寸:
NC个聚类中心Zj=(wj,hj)对应的模板框尺寸分别为:
Figure FDA0002441108110000035
max_size=max(wj,hj)
Figure FDA0002441108110000041
其中floor()为向下取整;
(21)若对所有聚类中心设计了对应的模板框之后仍有某输出层没有设计相应的模板框,则按照如下准则设计:
若某输出层没有设计相应的模板框,那么就采用距离它最近的层的min_size,max_size,aspect_ratio参数,若有两个输出层距离该层距离相同,浅层为LayerB,深层为LayerT,则该输出层参数
Figure FDA0002441108110000042
Figure FDA0002441108110000043
aspect_ratio采用的LayerB的aspect_ratioB和LayerT的aspect_ratioT的并集;
(22)对所有输出层都添加aspect_ratio=1的模板框比例;
(23)对完成了输出层裁剪及模板框尺寸确定的卷积神经网络进行训练,得到神经网络模型。
2.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(1)中,提取标注信息中的目标宽w、高h尺寸的具体方法为:读取xml中各<bndbox>节点中的<xmin>、<ymin>、<xmax>、<ymax>值,计算该目标的宽w=xmax-xmin+1,高h=ymax-ymin+1。
3.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(3)中,随机选取K个样本的具体方法为:按照U(0,1)在0到1之间按均匀分布生成K一个随机数α12,…,αK,取第ceil(aiN)个样本作为第i个初始聚类中心,其中ceil()为向上取整。
4.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(4)中,样本x与聚类中心Zj之间距离的计算方法为:Dj=||x-Zj||,样本x的归类方法为:若
Figure FDA0002441108110000044
则该样本x归于Sj类。
5.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(5)中,取消某类别的具体方法为:取消该聚类中心,令聚类中心个数NC减1,释放原本归属于该类别的样本,对释放出的样本计算其与其他聚类中心之间的距离,释放样本与哪个聚类中心之间的距离最近就将之归类于那一个类别。
6.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(6)中,修正各类别聚类中心Zj的具体方法为:
Figure FDA0002441108110000051
步骤(7)中,计算各类别Sj中的样本到聚类中心的平均距离
Figure FDA0002441108110000055
的具体方法为:
Figure FDA0002441108110000052
步骤(8)中,计算全部类别样本与相应聚类中心的总平均距离
Figure FDA0002441108110000056
的具体方法为:
Figure FDA0002441108110000053
7.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(10)中,计算每个类别Sj中各样本x=(xw,xh)到聚类中心Zj=(wj,hj)的标准差向量σj=(σw,jh,j)的具体方法为:
Figure FDA0002441108110000054
8.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(11)中,提取各标准差向量中σj=(σw,jh,j)的最大分量σjmax的具体方法为:
σjmax=max(σw,jh,j)。
9.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(12)中,将Zj***为两个新的聚类中心的具体方法为:聚类Sj中各样本x到聚类中心Zj的标准差为σj=(σw,jh,j),若σw,j≥σh,j则令γ=(σw,j,0);若σw,jh,j则令γ=(0,σh,j)。Zj***出的两个新聚类中心分别为:Zj+kγ和Zj-kγ,其中0<k<1。
10.根据权利要求1所述的一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法,其特征在于:步骤(14)中,聚类中心合并的具体方法为:若距离最近的两个聚类中心之间的距离DijC,则将两个聚类中心对应的类别合并为一个类别,取消两个聚类中心的聚类中心地位,对这两类释放出的样本重新计算聚类中心
Figure FDA0002441108110000061
并令聚类中心个数NC减1;
步骤(16)中,获得最大面积
Figure FDA0002441108110000062
的具体方法为:
Figure FDA0002441108110000063
其中,
Figure FDA0002441108110000064
CN202010265447.7A 2020-04-07 2020-04-07 一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法 Active CN111524098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010265447.7A CN111524098B (zh) 2020-04-07 2020-04-07 一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010265447.7A CN111524098B (zh) 2020-04-07 2020-04-07 一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法

Publications (2)

Publication Number Publication Date
CN111524098A true CN111524098A (zh) 2020-08-11
CN111524098B CN111524098B (zh) 2023-05-12

Family

ID=71901605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010265447.7A Active CN111524098B (zh) 2020-04-07 2020-04-07 一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法

Country Status (1)

Country Link
CN (1) CN111524098B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095418A (zh) * 2021-04-19 2021-07-09 航天新气象科技有限公司 一种目标检测方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170161606A1 (en) * 2015-12-06 2017-06-08 Beijing University Of Technology Clustering method based on iterations of neural networks
CN108898154A (zh) * 2018-09-29 2018-11-27 华北电力大学 一种电力负荷som-fcm分层聚类方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170161606A1 (en) * 2015-12-06 2017-06-08 Beijing University Of Technology Clustering method based on iterations of neural networks
CN108898154A (zh) * 2018-09-29 2018-11-27 华北电力大学 一种电力负荷som-fcm分层聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘绚;文俊;刘天琪: "基于自组织神经网络的模糊聚类同调机群识别" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113095418A (zh) * 2021-04-19 2021-07-09 航天新气象科技有限公司 一种目标检测方法及***
CN113095418B (zh) * 2021-04-19 2022-02-18 航天新气象科技有限公司 一种目标检测方法及***

Also Published As

Publication number Publication date
CN111524098B (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN110276264B (zh) 一种基于前景分割图的人群密度估计方法
CN108229550B (zh) 一种基于多粒度级联森林网络的云图分类方法
Xiao et al. A fast method for particle picking in cryo-electron micrographs based on fast R-CNN
CN111275044A (zh) 基于样本选择和自适应难例挖掘的弱监督目标检测方法
CN112163628A (zh) 一种适用于嵌入式设备的改进目标实时识别网络结构的方法
CN111507426B (zh) 基于视觉融合特征的无参考图像质量分级评价方法及装置
CN111539247B (zh) 一种超光谱人脸识别方法、装置、电子设备及其存储介质
CN111833322B (zh) 一种基于改进YOLOv3的垃圾多目标检测方法
CN112052877B (zh) 一种基于级联增强网络的图片细粒度分类方法
CN112528058B (zh) 基于图像属性主动学习的细粒度图像分类方法
CN111368935A (zh) 一种基于生成对抗网络的sar时敏目标样本增广方法
CN111862040B (zh) 人像图片质量评价方法、装置、设备及存储介质
CN114998602A (zh) 基于低置信度样本对比损失的域适应学习方法及***
CN112489168A (zh) 一种图像数据集生成制作方法、装置、设备及存储介质
CN110503049B (zh) 基于生成对抗网络的卫星视频车辆数目估计方法
CN115565019A (zh) 基于深度自监督生成对抗的单通道高分辨sar图像地物分类方法
CN116704585A (zh) 一种基于质量感知的人脸识别方法
CN111738319A (zh) 一种基于大规模样本的聚类结果评价方法及装置
CN113569687B (zh) 基于双流网络的场景分类方法、***、设备及介质
CN111524098A (zh) 一种基于自组织聚类的神经网络输出层裁剪及模板框尺寸确定方法
CN113627481A (zh) 一种面向智慧园林的多模型组合的无人机垃圾分类方法
CN115588178B (zh) 一种高精地图要素自动化提取的方法
CN115880477A (zh) 一种基于深度卷积神经网络的苹果检测定位方法与***
CN111368625B (zh) 一种基于级联优化的行人目标检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant