CN110163865B - 一种针对模型拟合中不平衡数据的采样方法 - Google Patents

一种针对模型拟合中不平衡数据的采样方法 Download PDF

Info

Publication number
CN110163865B
CN110163865B CN201910451911.9A CN201910451911A CN110163865B CN 110163865 B CN110163865 B CN 110163865B CN 201910451911 A CN201910451911 A CN 201910451911A CN 110163865 B CN110163865 B CN 110163865B
Authority
CN
China
Prior art keywords
sampling
model
theta
subset
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910451911.9A
Other languages
English (en)
Other versions
CN110163865A (zh
Inventor
肖国宝
汪涛
徐海平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou Weipu Software Technology Co.,Ltd.
Original Assignee
Minjiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minjiang University filed Critical Minjiang University
Priority to CN201910451911.9A priority Critical patent/CN110163865B/zh
Publication of CN110163865A publication Critical patent/CN110163865A/zh
Application granted granted Critical
Publication of CN110163865B publication Critical patent/CN110163865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种针对模型拟合中不平衡数据的采样方法,包括以下步骤:步骤S1:提取图像特征数据,并构成数据集;步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;步骤S3:从数据集中随机采样一个最小子集,作为采样子集;步骤S4:根据代表性采样子集和采样子集更新采样集合;步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;步骤S6:去除多余的模型假设,得到最终采样集合;步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。本发明采样方法能够有效地提高参数估计和图像分割的性能。

Description

一种针对模型拟合中不平衡数据的采样方法
技术领域
本发明涉及计算机视觉技术领域,涉及一种针对模型拟合中不平衡数据的采样方法。
背景技术
随着越来越多的计算机视觉产品出现在我们现实生活中,模型拟合作为计算机视觉的一项重要的基础研究越来越重要。而如何有效地采样子集是模型拟合重要的一个步骤。
当前的采样方法可以分为随机采样和指导性采样。随机采样方法中,比较有代表性的有Random Sample Consensus(RANSAC)(M.A.Fischler and R.C.Bolles.Randomsample consensus:a paradigm for model fitting with applications to imageanalysis and automated cartography.Comm.ACM,24(6):381–395,1981)。指导性采样有Proximity(Y.Kanazawa,H.Kawakami,Detection of planar regions with uncalibratedstereo using distributions of feature points.,in:Proc.Bri.Mach.Vis.Conf.,2004,pp.247-256);MultiGS(T.-J.Chin,J.Yu,D.Suter,Accelerated hypothesisgeneration for multistructure data via preference analysis,IEEE Trans.PatternAnal.Mach.Intell.34(4):625-638,2012);SDF(G.Xiao,H.Wang,Y.Yan,and D.Suter,Superpixel-guided two-view deterministic geometric model ftting,Int.J.Comput.Vis.,127(4),323-339,2019).
当前的采样方法在正常情况下能够有效地采样高质量的模型假设。然而,当数据出现不平衡时(即属于不同模型实例的内点数量存在较大的不平衡),当前的采样方法很难采样到对应小结构的模型假设。而不平衡数据在现实生活中比较普通,因此,研究不平衡数据的采样方法具有很大的意义。
发明内容
有鉴于此,本发明的目的在于提供一种针对模型拟合中不平衡数据的采样方法,能够有效地提高图片分割和参数估计的性能。
为实现上述目的,本发明采用如下技术方案:
一种针对模型拟合中不平衡数据的采样方法,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集;
步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S4:根据代表性采样子集和采样子集更新采样集合;
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;
步骤S6:去除多余的模型假设,得到最终采样集合;
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。
进一步的,所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
Figure BDA0002075412180000031
式中,s(θ1)表示模型假设θ1的内点尺度,
Figure BDA0002075412180000032
表示模型假设θ1和数据点xt之间的距离,
Figure BDA0002075412180000038
为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集
Figure BDA0002075412180000033
其中j表示代表性子集的第j个成员,此处j=1。
进一步的,所述步骤S3具体为:
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
Figure BDA0002075412180000034
式中,s(θi)表示模型假设θi的内点尺度,
Figure BDA0002075412180000035
表示模型假设θi和数据点xt之间的距离,
Figure BDA0002075412180000036
为核函数,b(θi)为宽度。
进一步的,所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集
Figure BDA0002075412180000037
的关系,计算公式如下:
Figure BDA0002075412180000041
其中Inlier(θi)和
Figure BDA0002075412180000042
表示相应模型假设的内点集合,
Figure BDA0002075412180000043
Figure BDA0002075412180000044
分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果
Figure BDA0002075412180000045
认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性子集
Figure BDA0002075412180000046
对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果
Figure BDA0002075412180000047
那么θi加入到采样集合中,并取代
Figure BDA0002075412180000048
作为一个代表性子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性子集,那么将θi加入到采样集合中,并作为代表性子集的一个新成员。
进一步的,所述步骤S5具体为:判定采样个数是否达到预设阈值,如果达到则终止循环,并得到采样集合的模型假设θ={θ12,…,θm};反之回到步骤步骤S3,做下一步采样。
进一步的,所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ12,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wi与最大权重的跨度:ψi=max(W)-wi,计算其相应的概率:
Figure BDA0002075412180000049
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
Figure BDA0002075412180000051
步骤S64:通过熵选择模型假设:θ′={θ′i|-logp(ψi)>L},得到的θ′作为最终的采样集合。
本发明与现有技术相比具有以下有益效果:
本发明能够有效地提高图片分割和参数估计的性能,提高图片处理质量。
附图说明
图1是本发明方法流程图;
图2是本发明一实施例中与经典采样算法RANSAC在五个图片数据集上针对基础矩阵估计所生成的采样子集对不同模型实例的比例对比;
图3是本发明实施例得到的采样集合在图片数据集上的分割效果。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种针对模型拟合中不平衡数据的采样方法,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集,得到X={xt},t=1,2,...,N,N为数据总数,N为自然数;
步骤S2:从数据集中随机采样一个最小子集,作为代表性子集,并初始化采样集合;所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
Figure BDA0002075412180000061
式中,s(θ1)表示模型假设θ1的内点尺度,
Figure BDA0002075412180000062
表示模型假设θ1和数据点xt之间的距离,
Figure BDA0002075412180000063
为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集
Figure BDA0002075412180000064
其中j表示代表性子集的第j个成员,此处j=1。
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
Figure BDA0002075412180000065
式中,s(θi)表示模型假设θi的内点尺度,
Figure BDA0002075412180000066
表示模型假设θi和数据点xt之间的距离,
Figure BDA0002075412180000067
为核函数,b(θi)为宽度。
步骤S4:根据代表性采样子集和采样子集更新采样集合;
所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集
Figure BDA0002075412180000071
的关系,计算公式如下:
Figure BDA0002075412180000072
其中Inlier(θi)和
Figure BDA0002075412180000073
表示相应模型假设的内点集合,
Figure BDA0002075412180000074
Figure BDA0002075412180000075
分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果
Figure BDA0002075412180000076
认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性子集
Figure BDA0002075412180000077
对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果
Figure BDA0002075412180000078
那么θi加入到采样集合中,并取代
Figure BDA0002075412180000079
作为一个代表性子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性子集,那么将θi加入到采样集合中,并作为代表性子集的一个新成员。
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;判定采样个数是否达到预设阈值,本实施例中为10000,如果达到则终止循环,并得到采样集合的模型假设θ={θ12,…,θm};反之回到步骤步骤S3,做下一步采样。
步骤S6:去除多余的模型假设,得到最终采样集合;所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ12,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wi与最大权重的跨度:ψi=max(W)-wi,计算其相应的概率:
Figure BDA0002075412180000083
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
Figure BDA0002075412180000082
步骤S64:通过熵选择模型假设:θ′={θ′i|-logp(ψi)>L},得到的θ′作为最终的采样集合。
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (4)

1.一种针对模型拟合中不平衡数据的采样方法,其特征在于,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集;
步骤S2:从数据集中随机采样一个最小子集,作为代表性采样子集,并初始化采样集合;
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S4:根据代表性采样子集和采样子集更新采样集合;
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;
步骤S6:去除多余的模型假设,得到最终采样集合;
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割;
所述步骤S3具体为:
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
Figure FDA0002986880010000011
式中,s(θi)表示模型假设θi的内点尺度,
Figure FDA0002986880010000012
表示模型假设θi和数据点xt之间的距离,
Figure FDA0002986880010000013
为核函数,b(θi)为宽度;N为数据总数;
所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集
Figure FDA0002986880010000021
的关系,计算公式如下:
Figure FDA0002986880010000022
其中Inlier(θi)和
Figure FDA0002986880010000023
表示相应模型假设的内点集合,
Figure FDA0002986880010000024
Figure FDA0002986880010000025
分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果
Figure FDA0002986880010000026
认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性采样子集
Figure FDA0002986880010000027
对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果
Figure FDA0002986880010000028
那么θi加入到采样集合中,并取代
Figure FDA0002986880010000029
作为一个代表性采样子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性采样子集,那么将θi加入到采样集合中,并作为代表性采样子集的一个新成员。
2.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
Figure FDA00029868800100000210
式中,s(θ1)表示模型假设θ1的内点尺度,
Figure FDA0002986880010000031
表示模型假设θ1和数据点xt之间的距离,
Figure FDA0002986880010000032
为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集
Figure FDA0002986880010000033
其中j表示采样集合的第j个成员,此处j=1。
3.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S5具体为:判定采样个数是否达到预设阈值,如果达到则终止循环,并得到采样集合的模型假设θ={θ12,…,θm};反之回到步骤步骤S3,做下一步采样。
4.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ12,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wk与最大权重的跨度:ψk=max(W)-wk,计算其相应的概率:
Figure FDA0002986880010000034
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
Figure FDA0002986880010000035
步骤S64:通过熵选择模型假设:θ′={θk|-log p(ψk)>ζ},得到的θ′作为最终的采样集合。
CN201910451911.9A 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法 Active CN110163865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910451911.9A CN110163865B (zh) 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910451911.9A CN110163865B (zh) 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法

Publications (2)

Publication Number Publication Date
CN110163865A CN110163865A (zh) 2019-08-23
CN110163865B true CN110163865B (zh) 2021-06-01

Family

ID=67629614

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910451911.9A Active CN110163865B (zh) 2019-05-28 2019-05-28 一种针对模型拟合中不平衡数据的采样方法

Country Status (1)

Country Link
CN (1) CN110163865B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723856B (zh) * 2020-06-11 2023-06-09 广东浪潮大数据研究有限公司 一种图像数据处理方法、装置、设备及可读存储介质
CN118115767B (zh) * 2024-04-30 2024-07-19 厦门理工学院 一种基于二阶邻近引导的图像数据采样方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104835174A (zh) * 2015-05-25 2015-08-12 厦门大学 基于超图模式搜索的鲁棒模型拟合方法
CN106296747A (zh) * 2016-07-26 2017-01-04 厦门大学 基于结构决策图的鲁棒多模型拟合方法
CN107123119A (zh) * 2017-04-27 2017-09-01 厦门大学 一种针对多结构数据的指导性采样方法
CN107229934A (zh) * 2017-04-24 2017-10-03 东北大学 基于最小匹配距离与随机采样一致性的错误匹配去除方法
CN105913423B (zh) * 2016-04-08 2018-08-07 厦门大学 一种基于超像素的确定性模型拟合方法
CN108710761A (zh) * 2018-05-22 2018-10-26 泉州装备制造研究所 一种基于谱聚类去除离群点的鲁棒模型拟合方法
CN108921871A (zh) * 2018-07-27 2018-11-30 福建农林大学 一种基于全局贪婪搜索的鲁棒模型拟合方法
CN109614933A (zh) * 2018-12-11 2019-04-12 闽江学院 一种基于确定性拟合的运动分割方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396303B2 (en) * 2008-10-14 2013-03-12 Core Wireless Licensing, S.a.r.l. Method, apparatus and computer program product for providing pattern detection with unknown noise levels
US9208567B2 (en) * 2013-06-04 2015-12-08 Apple Inc. Object landmark detection in images
CN108960296B (zh) * 2018-06-14 2022-03-29 厦门大学 一种基于连续潜在语义分析的模型拟合方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104835174A (zh) * 2015-05-25 2015-08-12 厦门大学 基于超图模式搜索的鲁棒模型拟合方法
CN105913423B (zh) * 2016-04-08 2018-08-07 厦门大学 一种基于超像素的确定性模型拟合方法
CN106296747A (zh) * 2016-07-26 2017-01-04 厦门大学 基于结构决策图的鲁棒多模型拟合方法
CN107229934A (zh) * 2017-04-24 2017-10-03 东北大学 基于最小匹配距离与随机采样一致性的错误匹配去除方法
CN107123119A (zh) * 2017-04-27 2017-09-01 厦门大学 一种针对多结构数据的指导性采样方法
CN108710761A (zh) * 2018-05-22 2018-10-26 泉州装备制造研究所 一种基于谱聚类去除离群点的鲁棒模型拟合方法
CN108921871A (zh) * 2018-07-27 2018-11-30 福建农林大学 一种基于全局贪婪搜索的鲁棒模型拟合方法
CN109614933A (zh) * 2018-12-11 2019-04-12 闽江学院 一种基于确定性拟合的运动分割方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RANSAC类方法先入为主的缺陷和避免方法;程欣宇;《电子科技大学》;20160331;第3卷(第2期);第162-165页 *
Superpixel-Guided Two-View Deterministic Geometric Model Fitting;Guobao Xiao et al.;《International Journal of Computer Vision》;20180519;第323-339页 *
基于数据关系的鲁棒几何模型拟合方法;肖国宝;《万方数据》;20170621;第1-103页 *

Also Published As

Publication number Publication date
CN110163865A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
CN111899163B (zh) 生成对抗网络中单图像超分辨率的有效结构保持
CN108090470B (zh) 一种人脸对齐方法及装置
CN108171663B (zh) 基于特征图最近邻替换的卷积神经网络的图像填充***
Guo et al. JointPruning: Pruning networks along multiple dimensions for efficient point cloud processing
CN112328715B (zh) 视觉定位方法及相关模型的训练方法及相关装置、设备
TWI459307B (zh) 具物體位置偵測功能之裝置及其偵測方法
CN110163865B (zh) 一种针对模型拟合中不平衡数据的采样方法
CN110992243B (zh) 椎间盘截面图像构建方法、装置、计算机设备及存储介质
CN110533632B (zh) 图像模糊篡改检测方法、装置、计算机设备和存储介质
JP2012507793A (ja) 複雑度正規化パターンの表現、探索、及び圧縮
CN111488810A (zh) 人脸识别方法、装置、终端设备及计算机可读介质
CN111724370A (zh) 一种基于不确定性和概率的多任务无参考图像质量评估方法及***
CN112597847A (zh) 人脸姿态估计方法、装置、电子设备和存储介质
Lu et al. Image-specific prior adaptation for denoising
CN117372604B (zh) 一种3d人脸模型生成方法、装置、设备及可读存储介质
CN109447147A (zh) 基于双图稀疏的深度矩阵分解的图像聚类方法
CN113706439A (zh) 一种图像检测方法、装置、存储介质及计算机设备
CN111814884A (zh) 一种基于可变形卷积的目标检测网络模型的升级方法
CN102890822B (zh) 具有物***置侦测功能的装置及其侦测方法
CN115331153B (zh) 一种用于辅助前庭康复训练的姿态监测方法
CN107507210B (zh) 一种基于遗传算法的图像边缘检测方法及装置
CN113887319A (zh) 三维姿态的确定方法、装置、电子设备及存储介质
Lin et al. A proof of image Euler Number formula
Yan et al. FDLNet: Boosting Real-time Semantic Segmentation by Image-size Convolution via Frequency Domain Learning
CN112766312A (zh) 用户信息获取方法、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221108

Address after: 5F-2, Building 1 #, No. 1, Majiang Road, Mawei Town, Mawei District, Fuzhou City, Fujian Province, 350,015 (within the Free Trade Zone)

Patentee after: Fuzhou Weipu Software Technology Co.,Ltd.

Address before: 200 xiyuangong Road, Shangjie Town, Minhou County, Fuzhou City, Fujian Province

Patentee before: MINJIANG University