CN102708589B - 一种基于特征聚类的三维目标多视点视图建模方法 - Google Patents

一种基于特征聚类的三维目标多视点视图建模方法 Download PDF

Info

Publication number
CN102708589B
CN102708589B CN201210150380.8A CN201210150380A CN102708589B CN 102708589 B CN102708589 B CN 102708589B CN 201210150380 A CN201210150380 A CN 201210150380A CN 102708589 B CN102708589 B CN 102708589B
Authority
CN
China
Prior art keywords
target
viewpoint
bending moment
cluster
attitude image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210150380.8A
Other languages
English (en)
Other versions
CN102708589A (zh
Inventor
赵慧洁
李旭东
丁昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201210150380.8A priority Critical patent/CN102708589B/zh
Publication of CN102708589A publication Critical patent/CN102708589A/zh
Application granted granted Critical
Publication of CN102708589B publication Critical patent/CN102708589B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于特征聚类的三维目标多视点视图建模方法,它有四大步骤:一:获取测试目标的全姿态图像。二:从获取的全姿态图像集中提取目标特征向量集合{xi|i=1,2,…N}。采用综合了仿射不变矩和几何不变矩并进一步规则化后形成的7维不变矩描述目标全姿态图像外形特征。三:确定最优聚类数Cop。四:采用k-均值聚类法将目标特征向量集聚为Cop类,将最终得到的少量聚类中心作为建模结果。本发明针对不同视点下目标图像差异导致的单一目标视图描述不能识别目标的缺点,构建了一种描述数量小、冗余信息少、能较好描述目标全姿态特征向量集的三维目标多视点视图建模方法。它在模式识别领域里具有较好的实用价值和广阔的应用前景。

Description

一种基于特征聚类的三维目标多视点视图建模方法
技术领域
本发明涉及一种基于特征聚类的三维目标多视点视图建模方法,属于模式识别领域,具体涉及到目标识别、目标建模和数据约简等方面。用于三维目标多视点建模,适用于不同视点下目标图像差异导致的单一目标视图描述不能识别目标的问题。
背景技术
三维目标识别是计算机视觉领域内一个重要的研究方向。目前在实际应用中获取目标的三维信息往往十分困难,识别三维目标仍然主要通过识别目标二维投影形成的图像完成。目标二维成像(投影)过程导致了部分信息丢失,且在不同视点下,复杂目标的外形差异明显,使得快速稳定的三维目标识别难度很大。
通过对三维目标进行建模以形成对目标外形的全面描述,是解决该问题的手段之一。这就需要研究三维目标的多视点视图建模方法。直观的想法是将多个视点下对目标图像的描述综合起来作为目标的描述。然而对于同一目标,其姿态数目无法穷举,不同描述间也包含了很多冗余信息。因此,需要在约简冗余描述的同时尽可能保留重要的描述。
经典的三维目标多视点视图建模方法基于目标几何结构和可见关系的视点球面分割算法,主要基于目标图像的几何拓扑特征,最终得到的建模结果是关于目标的多姿态特征视图集。但这类方法对目标特征视图集的构建依赖于目标的几何结构和特征,一般只能针对一定复杂程度的某一类特定物体,如回转体、二次曲面体等,实际中难以应用。
发明内容
本发明的目的在于:提供一种基于特征聚类的三维目标多视点视图建模方法,它针对不同视点下目标图像差异导致的单一目标视图描述不能识别目标的缺点,构建了一种描述数量小、冗余信息少、能较好描述目标全姿态特征向量集的三维目标多视点视图建模方法。
其技术方案如下:
本发明一种基于特征聚类的三维目标多视点视图建模方法,它包括以下步骤:
步骤一:获取测试目标的全姿态图像。将目标置于视点球中心,目标姿态变化等效于摄像机在视点球面上的不同点观察目标。在视点球面上均匀采样,获取数量为N的三维目标的全姿态图像集。
步骤二:从获取的全姿态图像集中提取目标特征向量集合{xi|i==1,2,…N}。采用综合了仿射不变矩和几何不变矩并进一步规则化后形成的7维不变矩描述目标全姿态图像外形特征。
步骤三:确定最优聚类数Cop。通过分析聚类总误差平方和Je与聚类数C之间的关系曲线(Je-c曲线)和Je-c二阶导数曲线过零点,确定最优聚类数Cop
步骤四:采用k-均值聚类法将目标特征向量集聚为Cop类,将最终得到的少量聚类中心作为建模结果。
其中,步骤一所述的获取测试目标的全姿态图像,具体实现过程如下:
首先创建需要进行多视点视图建模的目标三维模型。然后将目标模型置于假想视点球的球心,由于目标姿态变化等效于摄像机在视点球面上的不同点观察目标,因此获取摄像机观察视点的过程即为划分视点球面的过程。采用类似划分地球经纬度的方式,以相同间隔均匀划分视点球面,并在对应的划分点处对目标成像,即可获取目标全姿态图像集。
其中,步骤二所述的仿射不变矩由(1)式求出,其中μpq表示图像的p+q阶中心矩。
I 1 = ( μ 20 μ 02 - μ 11 2 ) μ 00 4 I 2 = μ 30 2 μ 03 2 - 6 μ 30 μ 03 μ 21 μ 12 + 4 μ 30 μ 12 3 + 4 μ 21 3 μ 03 - 3 μ 12 2 μ 21 2 μ 00 10 I 3 = μ 20 ( μ 21 μ 03 - μ 12 2 ) - μ 11 ( μ 30 μ 03 - μ 21 μ 12 ) + μ 02 ( μ 30 μ 12 - μ 21 2 ) μ 00 7 - - - ( 1 )
用于与上述仿射不变矩进行综合的几何不变矩前四个分量由(2)式求出
Φ 1 = η 20 + η 02 Φ 2 = ( η 20 - η 02 ) 2 + 4 η 11 2 Φ 3 = ( η 30 - 3 η 12 ) 2 + ( 3 η 21 - η 03 ) 2 Φ 4 = ( η 30 + η 12 ) 2 + ( η 21 + η 03 ) 2 - - - ( 2 )
为解决上述不变矩间数量级的差异,需要进一步对上述不变矩进行规则化运算
I k ‾ = sign ( I k ) | I k | 2 / S - - - ( 3 )
式中Ik表示未规则化的组合不变矩,表示规则化组合不变矩,Sign表示赫维赛德函数,S表示各个矩分量中矩因子阶数的总和。最终得到描述目标外形信息的7维规则化不变矩。
其中,步骤三所述的确定最优聚类数Cop,具体实现过程如下:
采用k-均值聚类法对上述目标全姿态特征向量集进行聚类,使类别数c逐步增加,c=2,c=3,…,记录每次聚类的总误差平方和Je,最终根据得到Je-c曲线,进一步计算得到Je-c二阶导数曲线,在考虑一定数值波动的情况下,选择Je-c二阶导数曲线上第一个接近于零点且相对平缓区间的中点作为最优的聚类数cop的估计值。
本发明具有的优点是:通过特征聚类,用少数聚类中心代表目标全姿态特征向量在特征空间中的分布,实现了数据约简,方法通用性强,可以方便确定最优聚类数。
附图说明
图1为本发明的处理流程图;
图2为本发明中涉及的视点球示意图;
图3为本发明中Je-c曲线示意图;
图4为本发明确定最优聚类数Cop的示意图。
具体实施方式
本发明针对三维目标多视点视图建模问题,提出了一种基于支持向量数据描述的三维目标多视点视图建模方法。
见图1,本发明一种基于特征聚类的三维目标多视点视图建模方法,它包括以下步骤:
步骤一:获取测试目标的全姿态图像。将目标置于视点球中心,目标姿态变化等效于摄像机在视点球面上的不同点观察目标。在视点球面上均匀采样,获取数量为N的三维目标的全姿态图像集。
步骤二:从获取的全姿态图像集中提取目标特征向量集合{xi|i=1,2,…N}。采用综合了仿射不变矩和几何不变矩并进一步规则化后形成的7维不变矩描述目标全姿态图像外形特征。
步骤三:确定最优聚类数Cop。通过分析聚类总误差平方和Je与聚类数C之间的关系曲线(Je-c曲线)和Je-c二阶导数曲线过零点,确定最优聚类数Cop
步骤四:采用k-均值聚类法将目标特征向量集聚为Cop类,将最终得到的少量聚类中心作为建模结果。
首先,获取目标全姿态图像需要创建待建模的目标三维模型。见图2,将目标模型置于视点球的球心。视点球是定义在三维欧氏空间中的假想单位球,不同视点下目标的成像过程可看作目标以球心为起点向不同方向投影的过程,视点球面上每一点P对应一个投影方向向量P,沿投影方向P的正交投影对应于从视点球面上P点看目标。因此获取摄像机观察视点的过程即为划分视点球面的过程。采用类似划分地球经纬度的方式,以相同间隔均匀划分视点球面,并在对应的划分点处对目标成像,即可获取元素个数为N的目标全姿态图像集。
对姿态图像集提取目标特征,获得描述该目标全姿态外形信息的特征向量集合{xi|i=1,2,…N}。采用了综合仿射不变矩和几何不变矩形成的7维不变矩描述目标外形。仿射不变矩由(1)式求出,其中μpq表示图像的p+q阶中心矩。
I 1 = ( μ 20 μ 02 - μ 11 2 ) μ 00 4 I 2 = μ 30 2 μ 03 2 - 6 μ 30 μ 03 μ 21 μ 12 + 4 μ 30 μ 12 3 + 4 μ 21 3 μ 03 - 3 μ 12 2 μ 21 2 μ 00 10 I 3 = μ 20 ( μ 21 μ 03 - μ 12 2 ) - μ 11 ( μ 30 μ 03 - μ 21 μ 12 ) + μ 02 ( μ 30 μ 12 - μ 21 2 ) μ 00 7
用于与上述仿射不变矩进行综合的几何不变矩前四个分量由(2)式求出
Φ 1 = η 20 + η 02 Φ 2 = ( η 20 - η 02 ) 2 + 4 η 11 2 Φ 3 = ( η 30 - 3 η 12 ) 2 + ( 3 η 21 - η 03 ) 2 Φ 4 = ( η 30 + η 12 ) 2 + ( η 21 + η 03 ) 2
为解决上述不变矩间数量级的差异,需要进一步对上述不变矩进行规则化运算
I k ‾ = sign ( I k ) | I k | 2 / S
其中Ik表示未规则化的组合不变矩,表示规则化组合不变矩,Sign表示赫维赛德函数,S表示各个矩分量中矩因子阶数的总和。例如对于几何不变矩第二个分量Ф2,S=(2+0)×2=4,其中(2+0)表示矩因子η20的阶数和,×2表示对矩因子η20的乘方运算。
最终得到了描述目标外形信息的7维规则化不变矩。
对上述目标全姿态特征向量集进行聚类,将最终得到的少量聚类中心作为建模结果。采用了k-均值聚类法。k-均值的基础是误差平方和准则。设Ni是第i聚类Γi中的样本数目,mi是这些样本的均值。把Γi中的各样本y与均值mi间的误差平方和对所有类相加后为:
J e = Σ i = 1 c Σ y ∈ Γ i | | y - m i | | 2 - - - ( 4 )
Je度量了用c个聚类中心m1,m2,…,mc代表c个样本子集时所产生的总的误差平方。对不同的聚类Je的值是不同的,使Je极小的聚类即为误差平方和准则下的最优结果。
采用以下方法确定最优聚类数cop:见图3所示,使类别数c逐步增加,对c=2,c=3,...分别使用k-均值算法,理论上误差平方和将随着c的增加而减小。则存在某个临界点OP,当聚类数为cop个时,Je随着聚类数c从1增加到cop而迅速减小,当c再增加时Je虽有所减小,但减小的速度减缓。见图4所示,根据计算得到Je-c曲线,进一步计算得到Je-c二阶导数曲线,在考虑一定数值波动的情况下,选择Je-c二阶导数曲线上第一个接近于零点且相对平缓区间的中点作为最优的聚类数cop的估计值。
最终,采用k-均值聚类算法,将目标全姿态特征向量集聚类为cop个类别,将各个子类的聚类中心作为三维目标多视点视图建模结果。

Claims (1)

1.一种基于特征聚类的三维目标多视点视图建模方法,其特征在于:它包括以下步骤: 
步骤一:获取测试目标的全姿态图像;将目标置于视点球中心,目标姿态变化等效于摄像机在视点球面上的不同点观察目标,在视点球面上均匀采样,获取数量为N的三维目标的全姿态图像集; 
步骤二:从获取的全姿态图像集中提取目标全姿态特征向量集合{xi|i=1,2,…N},采用综合了仿射不变矩和几何不变矩并进一步规则化后形成的7维不变矩描述目标全姿态图像外形特征; 
步骤三:确定最优聚类数Cop;通过分析聚类总误差平方和Je与聚类数C之间的关系曲线即Je-c曲线和Je-c二阶导数曲线过零点,确定最优聚类数Cop; 
步骤四:采用k-均值聚类法将目标全姿态特征向量集合聚为Cop类,将最终得到的少量聚类中心作为建模结果; 
其中,步骤一所述的获取测试目标的全姿态图像,具体实现过程如下:首先创建需要进行多视点视图建模的目标三维模型,然后将目标模型置于假想视点球的球心,由于目标姿态变化等效于摄像机在视点球面上的不同点观察目标,因此获取摄像机观察视点的过程即为划分视点球面的过程;采用类似划分地球经纬度的方式,以相同间隔均匀划分视点球面,并在对应的划分点处对目标成像,即获取目标全姿态图像集; 
其中,步骤二所述的仿射不变矩由(1)式求出,其中μpq表示图像的p+q阶中心矩; 
用于与上述仿射不变矩进行综合的几何不变矩前四个分量由(2)式求出 
为解决仿射不变矩和几何不变矩间数量级的差异,需要进一步对上述不变矩进行规则化运算 
式中,Ik表示未规则化的组合不变矩,表示规则化组合不变矩,sign表示赫维赛德函数,S表示各个矩分量中矩因子阶数的总和,最终得到描述目标外形信息的7维规则化不变矩; 
其中,步骤三所述的确定最优聚类数Cop,具体实现过程如下: 
采用k-均值聚类法对上述目标全姿态特征向量集进行聚类,使类别数c逐步增加,c=2,c=3,…,记录每次聚类的总误差平方和Je,最终根据得到Je-c曲线,进一步计算得到Je-c二阶导数曲线,在考虑一定数值波动的情况下,选择Je-c二阶导数曲线上第一个接近于零点且相对平缓区间的中点作为最优的聚类数cop的估计值。 
CN201210150380.8A 2012-05-15 2012-05-15 一种基于特征聚类的三维目标多视点视图建模方法 Active CN102708589B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210150380.8A CN102708589B (zh) 2012-05-15 2012-05-15 一种基于特征聚类的三维目标多视点视图建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210150380.8A CN102708589B (zh) 2012-05-15 2012-05-15 一种基于特征聚类的三维目标多视点视图建模方法

Publications (2)

Publication Number Publication Date
CN102708589A CN102708589A (zh) 2012-10-03
CN102708589B true CN102708589B (zh) 2014-10-29

Family

ID=46901305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210150380.8A Active CN102708589B (zh) 2012-05-15 2012-05-15 一种基于特征聚类的三维目标多视点视图建模方法

Country Status (1)

Country Link
CN (1) CN102708589B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103295025B (zh) * 2013-05-03 2016-06-15 南京大学 一种三维模型最优视图的自动选择方法
CN103870845B (zh) * 2014-04-08 2017-02-15 重庆理工大学 点云聚类去噪过程中新的k值优化方法
CN104866872B (zh) * 2015-06-03 2018-06-05 哈尔滨工业大学 多特征参数的电池等量分组方法
US9875427B2 (en) * 2015-07-28 2018-01-23 GM Global Technology Operations LLC Method for object localization and pose estimation for an object of interest
CN107490356B (zh) * 2017-08-21 2020-04-07 上海航天控制技术研究所 一种非合作目标旋转轴和旋转角测量方法
CN108647730B (zh) * 2018-05-14 2020-11-24 中国科学院计算技术研究所 一种基于历史行为共现的数据划分方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024036A (zh) * 2010-11-29 2011-04-20 清华大学 基于超图的三维对象检索方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8375032B2 (en) * 2009-06-25 2013-02-12 University Of Tennessee Research Foundation Method and apparatus for predicting object properties and events using similarity-based information retrieval and modeling

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024036A (zh) * 2010-11-29 2011-04-20 清华大学 基于超图的三维对象检索方法和装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
An Online Approach: Learning-Semantic-Scene-by-Tracking and Tracking-by-Learning-Semantic-Scene;Xuan Song等;《2010 IEEE Conference on Computer Vision and Pattern Recognition(CVPR)》;20100618;第739-746页 *
Xuan Song等.An Online Approach: Learning-Semantic-Scene-by-Tracking and Tracking-by-Learning-Semantic-Scene.《2010 IEEE Conference on Computer Vision and Pattern Recognition(CVPR)》.2010,第739-746页.
三维目标多尺度建模与混合神经网络识别方法;翁文杰;《中国优秀硕士学位论文全文数据库信息科技辑》;20080315(第3期);摘要,第10-29页 *
翁文杰.三维目标多尺度建模与混合神经网络识别方法.《中国优秀硕士学位论文全文数据库信息科技辑》.2008,(第3期),摘要,第10-29页.

Also Published As

Publication number Publication date
CN102708589A (zh) 2012-10-03

Similar Documents

Publication Publication Date Title
Zhi et al. LightNet: A Lightweight 3D Convolutional Neural Network for Real-Time 3D Object Recognition.
CN109753885B (zh) 一种目标检测方法、装置以及行人检测方法、***
CN111160214B (zh) 一种基于数据融合的3d目标检测方法
Huang et al. A coarse-to-fine algorithm for matching and registration in 3D cross-source point clouds
CN102708589B (zh) 一种基于特征聚类的三维目标多视点视图建模方法
CN110852182B (zh) 一种基于三维空间时序建模的深度视频人体行为识别方法
Glasner et al. aware object detection and continuous pose estimation
CN108280858B (zh) 多视图重建中的一种线性全局相机运动参数估计方法
Liu et al. Adaptive object tracking by learning hybrid template online
CN102509104B (zh) 基于置信度图的增强现实场景虚拟对象判别和检测方法
Solanki et al. Automatic Identification of Temples in Digital Images through Scale Invariant Feature Transform
CN104915965A (zh) 一种摄像机跟踪方法及装置
CN103902989B (zh) 基于非负矩阵分解的人体动作视频识别方法
CN107481279A (zh) 一种单目视频深度图计算方法
CN101877143A (zh) 一种二维图像组的三维场景重建方法
CN103295025A (zh) 一种三维模型最优视图的自动选择方法
CN111754618B (zh) 一种面向对象的实景三维模型多层次解译方法及***
CN112712589A (zh) 一种基于激光雷达和深度学习的植株3d建模的方法和***
CN105488541A (zh) 增强现实***中基于机器学习的自然特征点识别方法
CN104463962B (zh) 基于gps信息视频的三维场景重建方法
CN106886754B (zh) 一种基于三角面片的三维场景下的物体识别方法及***
Chiu et al. See the difference: Direct pre-image reconstruction and pose estimation by differentiating hog
CN109284692A (zh) 融合em算法和概率二维cca的人脸识别方法
CN110543845B (zh) 一种三维人脸的人脸级联回归模型训练方法及重建方法
CN116797640A (zh) 一种面向智能伴行巡视器的深度及3d关键点估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant