CN103559705B - 一种比较不同植物形态相似度的计算机方法 - Google Patents

一种比较不同植物形态相似度的计算机方法 Download PDF

Info

Publication number
CN103559705B
CN103559705B CN201310504139.5A CN201310504139A CN103559705B CN 103559705 B CN103559705 B CN 103559705B CN 201310504139 A CN201310504139 A CN 201310504139A CN 103559705 B CN103559705 B CN 103559705B
Authority
CN
China
Prior art keywords
similarity
tree
graph
node
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310504139.5A
Other languages
English (en)
Other versions
CN103559705A (zh
Inventor
丁维龙
吴水生
徐利锋
程志君
危扬
陈淑娇
刘洋
郑蕾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201310504139.5A priority Critical patent/CN103559705B/zh
Publication of CN103559705A publication Critical patent/CN103559705A/zh
Application granted granted Critical
Publication of CN103559705B publication Critical patent/CN103559705B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

一种比较不同植物形态相似度的计算机方法,利用了植株拓扑结构特征、***轮廓特征、器官几何结构信息。该方法首先采用简化的树图描述植物的拓扑结构,再基于树图编辑距离方法计算拓扑结构的相似度。然后,基于二维图形相似度算法计算包含植株的三维凸包在多个面上的投影间的相似度,在此基础上,整合所有投影的二维相似度值从而计算出植物***轮廓的相似度。随后,综合考虑各级子树的几何属性,计算出植物几何细节的相似度。最后,融合上述植株多特征信息,计算出不同植物结构间的相似度。本发明能够量化不同植物间的形态相似性,达到通过相似度区分不同植物种类或科属的目的。

Description

一种比较不同植物形态相似度的计算机方法
技术领域
本发明内容涉及到植物分类、模式识别领域,特别针对植物形态特征的多样性发明了比较不同植物形态之间相似度的计算机方法。
背景技术
植物的外部形态是自然分类方法进行植物分类的依据。不同植物种类之间形态、结构及习性等方面的相似程度,能够描述它们在亲缘关系上的亲疏程度。判别不同植物体之间的相似性,是进行植物分类检索的一个关键步骤。传统的判别方法主要依靠人工操作,主观性较强、效率较低且工作量大,故越来越不适应植物快速分类检索的需要。另外,精确描述植物空间规律的植物结构模拟模型,在诸如农田蒸散的定量化、作物株型设计、栽培措施优化的科学研究中具有实际指导意义。然而,判断一个模型是不是精确,关键问题是判断重建的3D模型与真实植物之间的相似程度。与三维模型的相似性计算与检索、DNA和蛋白质序列的结构相似性比较、恶意代码相似性比较等相比,目前植物结构相似度计算的研究还较薄弱。与树结构相似度计算方法主要包括:全局比较法、分析比较法和基于树图的比较法。全局比较法比较植株的株高、树冠的尺寸等参数来计算植物间的相似程度。这种方法能够粗略地比较植物体的相似性,但不能精细地比较植物拓扑结构和器官的空间相似性。分析比较法首先对植物的拓扑结构和器官的空间分布情况进行统计分析,在获得这些实体的分布特征参数后,再利用这些特征来比较植物之间的相似性。基于树图的比较法采用编辑距离描述待比较的两株植物。由于涉及到较为复杂的数学运算和频繁的替换、删除、***节点操作,这种方法的比较过程有些复杂。另外,基于叶片的相似度能够在一定程度上区分树种的种类,但这类研究针对的仅仅是植物的叶片,而未涉及到植物拓扑结构和轮廓特征的相似度计算。树结构数据的相似度估计,其研究也仅仅针对的是数据结构中的树结构,与真实的树木结构存在明显区别。综上所述,目前国内外还缺少有效的用以比较不同植物结构间相似度的方法。
发明内容
本发明提供了一种可进行植物形态相似度比较的计算机方法,以判别不同植物体之间的相似性,从而为植物分类学和模式识别等领域提供一种全新的技术手段。
本发明解决其技术问题所采用的技术方案是:
一种比较不同植物形态相似度的计算机方法,所述计算方法包括以下步骤:
1)从植物的拓扑结构、***轮廓形状、植物内部细节特征三个方面考虑,定义植物形态相似度的计算公式和计算流程
假设已计算出植物在n(n为正整数)个方面(如拓扑相似度、外观轮廓相似度、多种内部细节特征相似度)的相似度值,记为特征向量s=(s0,s1,…,sn-1)T,并赋给每种特征相应的权值因子(取值范围(0,1]),记为行向量w=(w0,w1,…,wn-1),则加权平均相似度计算公式为:
并用式子(2)求取最终相似度:
(1)、(2)两式中,si∈[0,1],wi>0,a∈[0,1),i为1到n的整数,a为经验常数,Sm=max{s0,s1,…,sn-1}。
本发明考虑了植物七个方面的特征相似度,分别是:拓扑结构相似度St、***廓形状相似度S3g、主干上枝条的平均轴向角相似度Sa、一级侧枝与主干的直径比相似度Sd、整体宽高比相似度Swh、二级侧枝与一级侧枝间的轴向角均值相似度Sa1、一级侧枝与主干的截面积比相似度Ss1。对这七个方面的特征相似度分别赋以权值:wt,w3g,wa,wd,wwh,wa1,ws1,权值的取之值范围为(0,1)。记Sm=max{St,S3g,Sa,Sd,Swh,Sa1,Ss1},为附带权值因子的七个特征相似度的加权平均值。则根据式(2)可得植物形态相似度计算公式为:
2)分别使用树图表示待比较的目标植物和源植物在计算机中的抽象
树图G定义为顶点V和边E的集合,记为G={V,E}。其中,顶点仅表示节间(不包括叶子、花朵、果实等其它器官)。如果没有特别说明,下文节点也表示树图顶点。节点的几何要素包括直径d、节间长l、轴向角θ、旋转角φ。边则表示节点之间的连接方式,用有序对(v1,v2)表示(其中v1和v2表示顶点)。节点间的连接方式有两种:前驱关系(用‘<’表示)和分支关系(用‘+’表示)。对于关系v1<v2,可称v2是v1的轴向子节点或后继节点;对于关系v1+v2,可称v2是v1的分支子节点或侧生节点。另外,用T[v]表示以节点v为根的完全子树(节点集合包括v及其所有子孙节点),用|T|表示树图T的节点个数。
3)基于树图编辑距离方法计算两棵植物拓扑结构间的相似度
3.1树图的轴向退化操作
植物拓扑结构的相似性比较,只考虑分支方式的差异性而不考虑几何形状的差异性。为尽量扩大分支方式对拓扑相似性比较算法的影响,对树图进行轴向退化操作。轴向退化操作定义为:对于树图T中任一节点v,如果v有且仅有一个后继子节点,同时又存在父节点,则将v从树图中剔除。通过这种方式得到的树图称为轴向退化树。轴向退化操作可剔除树图上各子树树轴方向上多余的节点。
3.2树图编辑映射和映射约束
将源树图Ts经过编辑序列S转化为目标树图Td所需的最小代价,定义为这两棵树间的距离。编辑序列S是由若干***、删除和替换操作构成(如图4),它可由编辑映射直观地描述。编辑映射可用三元组(M,Ts,Td)来表示,其中M={(vi,wj)|1≤i≤|Ts|,1≤j≤|Td|}。
为保证树图编辑距离操作遵循植物的自然生长规律,本发明对编辑映射设置了三种约束,即树轴映射约束、子树节点数对齐映射约束和子树深度对齐映射约束。假定节点v∈Td,w∈Ts,(v,w)∈M,v和w分别有子节点{v0,v1,v2,…,vn}和{w0,w1,w2,…,wm},并且满足关系{v<v0,v+v1,v+v2,…,v+vn,w<w0,w+w1,w+w2,…,w+wm},则有:
树轴映射约束:若节点v0在父节点v的轴生长方向上,即满足关系v<v0,则称子树T[v0]为节点v的轴向子树。对于(v,w)∈M,树轴映射约束要求节点v的轴向子树T[v0]和w的轴向子树T[w0]之间建立独立子树映射。
子树节点数对齐映射约束:在进行子树映射时,该约束要求分别对T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的节点数以降序方式进行排序,然后在T[vi]和T[wi]之间按子树的节点数建立独立子树映射。
子树深度对齐映射约束:在进行子树映射时,该约束要求分别对T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的子树深度以降序方式排序,然后在T[vi]和T[wi]之间按子树的深度建立独立子树映射。
3.3拓扑相似度的计算
设置待比较的两个树图中的一个为目标树Td,另一个为源树Ts。分别求Td和Ts的轴向退化树图,然后将Td的节点按照节点映射M进行若干次***、删除和替换操作后变换为Ts所需的总代价Dt(Td,Ts)定义为:
式中,p(T)表示树图T根节点的后继节点(非分支节点);b(T)表示树图T根节点的分支节点集合,且b(T)的元素按其对应子树的节点数或深度降序排列。用b(T,i)表示该集合的第i个元素;当i>|b(T)|时,取其中,表示空树变成(删除节点)T的代价,表示T变成(***节点)空树的代价,|T|表示树图T的节点个数,i>|b(T)|表示访问集合b(T)时下标越界。
根据式(4),通过线性变换将实值距离映射到区间[0,1],从而得到拓扑结构的相似度值(数值从0至1表示植物拓扑结构间的相似度逐渐增大)。转换公式定义为:
至此,植物树图的拓扑相似度St计算完成。
4)计算出两棵植物在***轮廓上的相似度
4.1二维轮廓图形相似度计算
将待比较的图形的顶点坐标存放在特征向量V=((x0,y0),(x1,y1),…,(xn,yn))中。考虑到图形的平移、旋转及伸缩不变性,需对待比较的目标图形和源图形进行规范化操作。具体方法是:在直角坐标系O-XY中,求出两轮廓顶点集的最小覆盖圆,再对这两个顶点集进行平移操作,使得它们的最小覆盖圆的圆心位于原点处,然后对顶点集进行缩放,使得各自的最小覆盖圆为单位圆(半径为1)。
对描述图形的顶点进行一致化操作。方法是:将上述最小单位外接圆平均分成若干个面积相同的扇区(如图6)。如此,每隔弧度2π/K(K为整型常数)就可得到一条从圆心发出的射线。该射线与图形轮廓的相交情况可能有:无交点、有一个或多个交点。如果无交点,则取该射线反向延长线上离圆心最近的交点为标记交点。如果射线和轮廓的交点只有一个时,将取该交点为标记交点;如果有多个交点时,则取离圆心最远的交点记为标记交点。分别求出目标图形和源图形的K个标记交点(xdi,ydi)、(xsi,ysi),并依次连接各自的标记交点,可分别获得目标图形的近似轮廓Gd和和源图形的近似轮廓Gs。考虑到图形的对称性,将Gd按x轴翻转180°得到的图形记为Gd’,然后采用欧式距离法求两二维图形的相似度,如下式。
式中,(xdi,ydi)表示Gd的第i个顶点坐标,(xsi,ysi)表示Gs的第i个顶点坐标,(xdi’,ydi’)表示Gd’的第i个顶点坐标。
4.2三维轮廓图形相似度计算
将包含整个植株的三维凸包在X、Y、Z三个面上进行投影,基于二维图形相似度算法逐一计算目标植物和源植物在相同投影面上的投影的相似度,然后整合所有投影的二维相似度值,从而计算出两棵植物在***轮廓上的相似度。具体步骤如下:
Step1分别提取图形G3d和G3s的特征向量V=((x0,y0,z0),(x1,y1,z1),…,(xn-1,yn-1,zn-1))。
Step2对上述两个三维图形的顶点集进行平移操作,使得它们最小覆盖球的球心和原点重合,然后对顶点集进行缩放,使得各自的最小覆盖球变为单位球(半径为1)。
Step3将变换后的三维图形点集分别先绕x轴旋转2πi/K(K取偶数)弧度,再绕y轴旋转2πj/K弧度,然后从z轴负方向分别对它们投影,以获得目标图形的投影Pdij和源图形的投影Psij
Step4利用二维图形相似度计算方法计算相对应的Pdij和Psij的相似度,在所有投影的相似度值中取最大值作为目标图形G3d和源图形G3s的相似度,其计算公式如下:
4.3计算植物外观轮廓相似度
使用能包含整棵树图点集的凸包及包含子树点集的凸包来描述植物的轮廓特征。凸包的三维轮廓点集可通过遍历树图上的顶点的几何信息计算得出。在树图整体点集凸包的相似度计算中,为提高运算效率,对公式(7)进行降维处理:1)对于目标图形(树图Td)和源图形(树图Ts),只绕y轴旋转并从z轴负方向对其进行投影;2)假设根节点所在空间位置为P,树图最小覆盖圆的圆心为O,则应约束PO连线的方向与y轴重合。令Td的凸包图形绕y轴旋转2πi/K并从z轴负方向对其投射得到的投影为Pd0i,Ts的凸包图形绕y轴旋转2πj/K并从z轴负方向对其投射得到的投影为Ps0j,则树图整体点集凸包的相似度可用下式计算:
本发明还进一步考虑了树图的各级非退化完全子树之间的相似性。对于某树图T的一个节点v,用T[v]表示以节点v为根的完全子树(节点集合包括v及其所有子孙节点)。如果T[v]在数据结构上没有退化成链表,且节点数大于2,且v至少有一个兄弟节点,则T[v]即为一个非退化完全子树。如图7所示,该树图的0级非退化完全子树为自身T[v1]=T,1级非退化完全子树有T[v2]、T[v3]和T[v4],2级非退化完全子树有T[v5]、T[v6]和T[v7]。
假设Td共有0~m级非退化完全子树,Ts共有0~i级非退化完全子树。对于某树图T,取其第i级非退化完全子树集合中与T最相似的那个元素记为MS(T,i),则Td和Ts最终的几何轮廓相似度值计算公式为:
5)计算植物内部细节特征的相似度
本发明综合考虑各级子树的几何属性,如主干上枝条的平均轴向角Sa、一级侧枝与主干的直径比Sd、整体宽高比Swh、二级侧枝与一级侧枝的平均轴向角Sa1、一级侧枝与主干的横截面积比Ss1,从而计算出植物几何细节的相似度。上述参数都是实值参数,本发明给出对两个正数x和y的相似度计算方法。不妨设x≥y,则参数x和y的相似度计算方法定义为:
例如两树Td和Ts的轴向角均值分别为θd和θs,根据式(10)即可得出轴向角相似度Sa为:
Sa(Td,Ts)=s(θds) (11)
上式所得结果的范围是[0,1]。当相似度值为0时,表示这两个参数因子完全不相似,为1时则表示他们完全相同。所以,相似度值越大,表示待比较的两参数越相似。
采用类似的方法获得公式(3)中其它内部细节特征的相似度Sd,Swh,Sa1,Ss1
6)计算最终的植物形态相似度
融合上述植株多特征信息,如植物的拓扑结构、***轮廓形状、植物内部细节特征,利用所求出的各种细节的相似度值,结合公式(5)、(9)和权值因子,根据步骤(1)定义的公式(3),最终计算出不同植物结构间的整体相似度。
本发明的技术构思
随着计算机软、硬件性能的提高,以及模式识别、图像处理技术的发展,传统的植物分类和检索方法已不能满足人们的要求,需要探索简便、快捷、有效的全新的技术方法。利用这种方法,不仅可以判别不同植物种类之间形态、结构及习性等方面的相似程度,也可以判断重建的3D模型与真实植物之间的相似程度,从而为植物分类检索提供有效的技术支撑。
因此,本发明依据植株拓扑结构特征、***轮廓特征及器官几何结构信息,发明了一种计算不同植物间形态相似度的方法。该方法采用简化树图描述植物的拓扑结构,再基于树图编辑距离方法计算拓扑结构的相似度。基于二维图形相似度算法计算包含植株的三维凸包在多个面上的投影间的相似度,并整合所有投影的二维相似度值以计算出植物***轮廓的相似度。综合考虑各级子树的几何属性,计算出植物几何细节的相似度。在此基础上,根据植物形态相似度的定义,计算出不同植物结构间的相似度。
本发明的有益效果主要表现在:应用本发明发明的比较不同植物形态相似度的计算机方法,可以有效地比较不同植物间的形态相似性,达到通过相似度区分不同植物种类或科属的目的,从而为植物分类学和模式识别等领域提供一种全新的模式分类手段。
附图说明
图1是植物形态相似度计算方法的总体流程。
图2是一个树图的例子。
图3为一个树图进行轴向退化操作的示例。
图4描述了一个树图如何编辑成为另一个树图。
图5显示了三种编辑映射约束。
图6为如何用轮廓点集近似地表示二维图形。
图7为一个非退化完全子树的示例。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种比较不同植物形态相似度的计算机方法,包括以下步骤:
1)从植物的拓扑结构、***轮廓形状、植物内部细节特征三个方面考虑,定义植物形态相似度的计算公式和计算流程
假设已计算出植物在n(n为正整数)个方面(如拓扑相似度、外观轮廓相似度、多种内部细节特征相似度)的相似度值,记为特征向量s=(s0,s1,…,sn-1)T,并赋给每种特征相应的权值因子(取值范围(0,1]),记为行向量w=(w0,w1,…,wn-1),则加权平均相似度计算公式为:
并用式子(2)求取最终相似度:
(1)、(2)两式中,si∈[0,1],wi>0,a∈[0,1),i为1到n的整数,a为经验常数,Sm=max{s0,s1,…,sn-1}。
本发明考虑了植物七个方面的特征相似度,分别是:拓扑结构相似度St、***廓形状相似度S3g、主干上枝条的平均轴向角相似度Sa、一级侧枝与主干的直径比相似度Sd、整体宽高比相似度Swh、二级侧枝与一级侧枝间的轴向角均值相似度Sa1、一级侧枝与主干的截面积比相似度Ss1。对这七个方面的特征相似度分别赋以权值:wt,w3g,wa,wd,wwh,wa1,ws1,权值的取之值范围为(0,1)。记Sm=max{St,S3g,Sa,Sd,Swh,Sa1,Ss1},为附带权值因子的七个特征相似度的加权平均值。则根据式(2)可得植物形态相似度计算公式为:
植物形态相似度的比较流程如图1所示。首先,分别使用树图表示待比较的目标植物和源植物在计算机中的抽象。针对它们各自的树图,分别使用拓扑相似度算法和几何形状相似度算法进行计算处理,并添加权值因子,最终计算出两株植物形态相似度。
2)分别使用树图表示待比较的目标植物和源植物在计算机中的抽象
树图G定义为顶点V和边E的集合,记为G={V,E}。其中,顶点仅表示节间(不包括叶子、花朵、果实等其它器官)。如果没有特别说明,下文节点也表示树图顶点。节点的几何要素包括直径d、节间长l、轴向角θ、旋转角φ。边则表示节点之间的连接方式,用有序对(v1,v2)表示(其中v1和v2表示顶点)。节点间的连接方式有两种:前驱关系(用‘<’表示)和分支关系(用‘+’表示)。对于关系v1<v2,可称v2是v1的轴向子节点或后继节点;对于关系v1+v2,可称v2是v1的分支子节点或侧生节点。另外,用T[v]表示以节点v为根的完全子树(节点集合包括v及其所有子孙节点),用|T|表示树图T的节点个数。树图示例如图2。
3)基于树图编辑距离方法计算两棵植物拓扑结构间的相似度
3.1树图的轴向退化操作
植物拓扑结构的相似性比较,只考虑分支方式的差异性而不考虑几何形状的差异性。为尽量扩大分支方式对拓扑相似性比较算法的影响,对树图进行轴向退化操作。轴向退化操作定义为:对于树图T中任一节点v,如果v有且仅有一个后继子节点,同时又存在父节点,则将v从树图中剔除。通过这种方式得到的树图称为轴向退化树。轴向退化操作可剔除树图上各子树树轴方向上多余的节点。例如,图3中树图T的节点v1,v2,v3,v4,v5满足上述条件,因此可将它们一一剔除,从而得到轴向退化树T’。
3.2树图编辑映射和映射约束
将源树图Ts经过编辑序列S转化为目标树图Td所需的最小代价,定义为这两棵树间的距离。编辑序列S是由若干***、删除和替换操作构成(如图4),它可由编辑映射直观地描述。编辑映射可用三元组(M,Ts,Td)来表示,其中M={(vi,wj)|1≤i≤|Ts|,1≤j≤|Td|}。
为保证树图编辑距离操作遵循植物的自然生长规律,本发明对编辑映射设置了三种约束,即树轴映射约束、子树节点数对齐映射约束和子树深度对齐映射约束。假定节点v∈Td,w∈Ts,(v,w)∈M,v和w分别有子节点{v0,v1,v2,…,vn}和{w0,w1,w2,…,wm},并且满足关系{v<v0,v+v1,v+v2,…,v+vn,w<w0,w+w1,w+w2,…,w+wm},则有:
树轴映射约束:若节点v0在父节点v的轴生长方向上,即满足关系v<v0,则称子树T[v0]为节点v的轴向子树。对于(v,w)∈M,树轴映射约束要求节点v的轴向子树T[v0]和w的轴向子树T[w0]之间建立独立子树映射。
子树节点数对齐映射约束:在进行子树映射时,该约束要求分别对T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的节点数以降序方式进行排序,再在T[vi]和T[wi]之间按子树的节点数建立独立子树映射。
子树深度对齐映射约束:在进行子树映射时,该约束要求分别对T[v1],T[v2],…,T[vn]和T[w1],T[w2],…,T[wm]按它们的子树深度以降序方式排序,然后在T[vi]和T[wi]之间按子树的深度建立独立子树映射。
图5中,如果v的轴向子树A和w的轴向子树A’之间建立独立子树映射,则A和A’满足树轴映射约束。如果C和B’之间建立独立子树映射,B和C’之间建立独立子树映射,则它们之间分别满足了子树节点数对齐映射约束。如果B和B’间建立独立子树映射,C和C’间建立独立子树映射,则它们之间分别满足子树深度对齐映射约束。
3.3拓扑相似度的计算
设置待比较的两个树图中的一个为目标树Td,另一个为源树Ts。分别求Td和Ts的轴向退化树图,然后将Td的节点按照节点映射M进行若干次***、删除和替换操作后变换为Ts所需的总代价Dt(Td,Ts)定义为:
式中,p(T)表示树图T根节点的后继节点(非分支节点);b(T)表示树图T根节点的分支节点集合,且b(T)的元素按其对应子树的节点数或深度降序排列。用b(T,i)表示该集合的第i个元素;当i>|b(T)|时,取其中,表示空树变成(删除节点)T的代价,表示T变成(***节点)空树的代价,|T|表示树图T的节点个数,i>|b(T)|表示访问集合b(T)时下标越界。
根据式(4),通过线性变换将实值距离映射到区间[0,1],从而得到拓扑结构的相似度值(数值从0至1表示植物拓扑结构间的相似度逐渐增大)。转换公式定义为:
至此,植物树图的拓扑相似度St计算完成。
4)计算出两棵植物在***轮廓上的相似度
4.1二维轮廓图形相似度计算
将待比较的图形的顶点坐标存放在特征向量V=((x0,y0),(x1,y1),…,(xn,yn))中。考虑到图形的平移、旋转及伸缩不变性,需对待比较的目标图形和源图形进行规范化操作。具体方法是:在直角坐标系O-XY中,求出两轮廓顶点集的最小覆盖圆,再对这两个顶点集进行平移操作,使得它们的最小覆盖圆的圆心位于原点处,然后对顶点集进行缩放,使得各自的最小覆盖圆为单位圆(半径为1)。
对描述图形的顶点进行一致化操作(使顶点个数相同)。一致化方法是:将上述最小单位外接圆平均分成若干个面积相同的扇区(如图6)。如此,每隔弧度2π/K(K为整型常数)就可得到一条从圆心发出的射线。该射线与图形轮廓的相交情况可能有:无交点、有一个或多个交点。如果无交点,则取该射线反向延长线上离圆心最近的交点为标记交点。如果射线和轮廓的交点只有一个时,将取该交点为标记交点;如果有多个交点时,则取离圆心最远的交点记为标记交点。分别求出目标图形和源图形的K个标记交点(xdi,ydi)、(xsi,ysi),并依次连接各自的标记交点,可分别获得目标图形的近似轮廓Gd和和源图形的近似轮廓Gs。考虑到图形的对称性,将Gd按x轴翻转180°得到的图形记为Gd’,然后采用欧式距离法求两二维图形的相似度,如下式。
式中,(xdi,ydi)表示Gd的第i个顶点坐标,(xsi,ysi)表示Gs的第i个顶点坐标,(xdi’,ydi’)表示Gd’的第i个顶点坐标。
4.2三维轮廓图形相似度计算
将包含整个植株的三维凸包在X、Y、Z三个面上进行投影,基于二维图形相似度算法逐一计算目标植物和源植物在相同投影面上的投影的相似度,然后整合所有投影的二维相似度值,从而计算出两棵植物在***轮廓上的相似度。具体步骤如下:
Step1分别提取图形G3d和G3s的特征向量V=((x0,y0,z0),(x1,y1,z1),…,(xn-1,yn-1,zn-1))。
Step2对上述两个三维图形的顶点集进行平移操作,使得它们最小覆盖球的球心和原点重合,然后对顶点集进行缩放,使得各自的最小覆盖球变为单位球(半径为1)。
Step3将变换后的三维图形点集分别先绕x轴旋转2πi/K(K取偶数)弧度,再绕y轴旋转2πj/K弧度,然后从z轴负方向分别对它们投影,以获得目标图形的投影Pdij和源图形的投影Psij
Step4利用二维图形相似度计算方法计算相对应的Pdij和Psij的相似度,在所有投影的相似度值中取最大值作为目标图形G3d和源图形G3s的相似度,其计算公式如下:
4.3计算植物外观轮廓相似度
使用能包含整棵树图点集的凸包及包含子树点集的凸包来描述植物的轮廓特征。凸包的三维轮廓点集可通过遍历树图上的顶点的几何信息计算得出。在树图整体点集凸包的相似度计算中,为提高运算效率,对公式(7)进行降维处理:1)对于目标图形(树图Td)和源图形(树图Ts),只绕y轴旋转并从z轴负方向对其进行投影;2)假设根节点所在空间位置为P,树图最小覆盖圆的圆心为O,则应约束PO连线的方向与y轴重合。令Td的凸包图形绕y轴旋转2πi/K并从z轴负方向对其投射得到的投影为Pd0i,Ts的凸包图形绕y轴旋转2πj/K并从z轴负方向对其投射得到的投影为Ps0j,则树图整体点集凸包的相似度可用下式计算:
本发明还进一步考虑了树图的各级非退化完全子树之间的相似性。对于某树图T的一个节点v,用T[v]表示以节点v为根的完全子树(节点集合包括v及其所有子孙节点)。如果T[v]在数据结构上没有退化成链表,且节点数大于2,且v至少有一个兄弟节点,则T[v]即为一个非退化完全子树。如图7所示,该树图的0级非退化完全子树为自身T[v1]=T,1级非退化完全子树有T[v2]、T[v3]和T[v4],2级非退化完全子树有T[v5]、T[v6]和T[v7]。
假设Td共有0~m级非退化完全子树,Ts共有0~i级非退化完全子树。对于某树图T,取其第i级非退化完全子树集合中与T最相似的那个元素记为MS(T,i),则Td和Ts最终的几何轮廓相似度值计算公式为:
5)计算植物内部细节特征的相似度
本发明综合考虑各级子树的几何属性,如主干上枝条的平均轴向角Sa、一级侧枝与主干的直径比Sd、整体宽高比Swh、二级侧枝与一级侧枝的平均轴向角Sa1、一级侧枝与主干的横截面积比Ss1,从而计算出植物几何细节的相似度。上述参数都是实值参数,本发明给出对两正数参数x和y的相似度计算方法。不妨设x≥y,则参数x和y的相似度计算方法定义为:
例如两树Td和Ts的轴向角均值分别为θd和θs,根据式(10)即可得出轴向角相似度Sa为:
Sa(Td,Ts)=s(θds) (11)
上式所得结果的范围是[0,1]。当相似度值为0时,表示这两个参数因子完全不相似,为1时则表示他们完全相同。所以,相似度值越大,表示待比较的两参数越相似。
采用类似的方法获得公式(3)中其它内部细节特征的相似度Sd,Swh,Sa1,Ss1
6)计算最终的植物形态相似度
融合上述植株多特征信息,如植物的拓扑结构、***轮廓形状、植物内部细节特征,利用所求出的各种细节的相似度值,结合公式(5)、(9)和权值因子,根据步骤(1)定义的公式(3),最终计算出不同植物结构间的整体相似度。

Claims (1)

1.一种比较不同植物形态相似度的计算方法,其特征在于:所述计算方法包括以下步骤:
1)从植物的拓扑结构、***轮廓形状、植物内部细节特征三个方面考虑,定义植物形态相似度的计算公式和计算流程;
假设已计算出植物在n个方面的相似度值,n为正整数,记为特征向量s=(s0,s1,…,sn-1)T,并赋给每种特征相应的权值因子,取值范围(0,1),记为行向量w=(w0,w1,…,wn-1),则加权平均相似度计算公式为:
S &OverBar; = &Sigma; i = 0 n - 1 w i s i &Sigma; i = 0 n - 1 w i - - - ( 1 )
并用式子(2)求取最终相似度:
S = S &OverBar; + ( S m - S &OverBar; ) ( 1 - a n ) - - - ( 2 )
(1)、(2)两式中,si∈[0,1],wi>0,a∈[0,1),i为0到n-1的整数,a为经验常数,Sm=max{s0,s1,…,sn-1};
考虑了植物七个方面的特征相似度,分别是:拓扑结构相似度St、***轮廓形状相似度S3g、主干上枝条的平均轴向角相似度Sa、一级侧枝与主干的直径比相似度Sd、整体宽高比相似度Swh、二级侧枝与一级侧枝间的轴向角均值相似度Sa1、一级侧枝与主干的截面积比相似度Ss1;对这七个方面的特征相似度分别赋以权值因子:wt,w3g,wa,wd,wwh,wa1,ws1,权值因子的取值范围为(0,1);记Sm=max{St,S3g,Sa,Sd,Swh,Sa1,Ss1},为加权平均相似度;则根据式(2)可得植物形态相似度计算公式为:
S = S m - ( S m - S &OverBar; ) a 7 - - - ( 3 )
2)分别使用树图表示待比较的目标植物和源植物在计算机中的抽象树图G定义为顶点V和边E的集合,记为G={V,E};其中,顶点仅表示节点,不包括叶子、花朵、果实其它器官;下文节点也表示树图顶点;节点的几何要素包括直径d、节间长l、轴向角θ、旋转角φ;边则表示节点之间的连接方式,用有序对(v1,v2)表示,其中v1和v2表示顶点;节点间的连接方式有两种:前驱关系和分支关系,前驱关系用‘<’表示,分支关系用‘+’表示;对于关系v1<v2,可称v2是v1的轴向子节点或后继节点;对于关系v1+v2,可称v2是v1的分支子节点或侧生节点;另外,用T[v]表示以节点v为根的完全子树,节点集合包括v及其所有子孙节点,用|T|表示树图T的节点个数;
3)基于树图编辑距离方法计算两棵植物拓扑结构相似度
3.1树图的轴向退化操作
植物拓扑结构的相似性比较,只考虑分支方式的差异性而不考虑几何形状的差异性;为尽量扩大分支方式对拓扑相似性比较算法的影响,对树图进行轴向退化操作;轴向退化操作定义为:对于树图T中任一节点v,如果v有且仅有一个后继子节点,同时又存在父节点,则将v从树图中剔除;通过这种方式得到的树图称为轴向退化树;轴向退化操作可剔除树图上各子树树轴方向上多余的节点;
3.2树图编辑映射和映射约束
将源树图Ts经过编辑序列S转化为目标树图Td所需的最小代价,定义为这两棵树间的距离;编辑序列S是由若干***、删除和替换操作构成,它可由编辑映射直观地描述;编辑映射可用三元组(M,Ts,Td)来表示,其中M={(vi1,wj)|1≤i1≤|Ts|,1≤j≤|Td|};
为保证树图编辑距离操作遵循植物的自然生长规律,对编辑映射设置了三种约束,即树轴映射约束、子树节点数对齐映射约束和子树深度对齐映射约束;假定节点v∈Td,w∈Ts,(v,w)∈M,v和w分别有子节点{v0,v1,v2,…,vn1}和{w0,w1,w2,…,wm1},并且满足关系{v<v0,v+v1,v+v2,…,v+vn1,w<w0,w+w1,w+w2,…,w+wm1},则有:
树轴映射约束:若节点v0在父节点v的轴生长方向上,即满足关系v<v0,则称子树T[v0]为节点v的轴向子树;对于(v,w)∈M,树轴映射约束要求节点v的轴向子树T[v0]和w的轴向子树T[w0]之间建立独立子树映射;
子树节点数对齐映射约束:在进行子树映射时,该约束要求分别对T[v1],T[v2],…,T[vn1]和T[w1],T[w2],…,T[wm1]按它们的节点数以降序方式进行排序,然后在T[vI]和T[wI]之间按子树的节点数建立独立子树映射;
子树深度对齐映射约束:在进行子树映射时,该约束要求分别对T[v1],T[v2],…,T[vn1]和T[w1],T[w2],…,T[wm1]按它们的子树深度以降序方式排序,然后在T[vI]和T[wI]之间按子树的深度建立独立子树映射;
3.3拓扑相似度的计算
设置待比较的两个树图中的一个为目标树图Td,另一个为源树图Ts;分别求Td和Ts的轴向退化树图,然后将Td的节点按照节点映射M进行若干次***、删除和替换操作后变换为Ts所需的总代价Dt(Td,Ts)定义为:
D t ( T d , T s ) = D t ( T &lsqb; T ( T d ) &rsqb; , T &lsqb; p ( T s ) &rsqb; ) + &Sigma; c = 1 max { | b ( T d ) | , | b ( T s ) | } D t ( T &lsqb; b ( T d , c ) &rsqb; , T &lsqb; b ( T s , c ) &rsqb; ) - - - ( 4 )
式中,p(T)表示树图T根节点的后继节点;b(T)表示树图T根节点的分支节点集合,且b(T)的元素按其对应子树的节点数;用b(T,c)表示该集合的第c个元素;当c>|b(T)|时,取其中,表示空树变成T的代价,表示T变成空树的代价,|T|表示树图T的节点个数,c>|b(T)|表示访问集合b(T)时下标越界;
根据式(4),通过线性变换将实值距离映射到区间[0,1],从而得到拓扑结构相似度,数值从0至1表示植物拓扑结构相似度逐渐增大;转换公式定义为:
S t ( T d , T s ) = 1 - D t ( T d , T s ) | T d | + | T s | - - - ( 5 )
至此,植物树图的拓扑相似度St计算完成;
4)计算出两棵植物在***轮廓上的相似度
4.1二维轮廓图形相似度计算
将待比较的图形的顶点坐标存放在特征向量V=((x0,y0),(x1,y1),…,(xn2,yn2))中;考虑到图形的平移、旋转及伸缩不变性,需对待比较的目标图形和源图形进行规范化操作;具体方法是:在直角坐标系O-XY中,求出两轮廓顶点集的最小覆盖圆,再对这两个顶点集进行平移操作,使得它们的最小覆盖圆的圆心位于原点处,然后对顶点集进行缩放,使得各自的最小覆盖圆为单位圆;
对描述图形的顶点进行一致化操作;方法是:将最小单位外接圆平均分成若干个面积相同的扇区;如此,每隔弧度2π/K,K为整型常数,就可得到一条从圆心发出的射线;该射线与图形轮廓的相交情况可能有:无交点、有一个或多个交点;如果无交点,则取射线反向延长线上离圆心最近的交点为标记交点;如果射线和轮廓的交点只有一个时,将取该交点为标记交点;如果有多个交点时,则取离圆心最远的交点记为标记交点;分别求出目标图形和源图形的K个标记交点(xdh,ydh)、(xsh,ysh),并依次连接各自的标记交点,可分别获得目标图形的近似轮廓Gd和和源图形的近似轮廓Gs;考虑到图形的对称性,将Gd按x轴翻转180o得到的图形记为Gd’,然后采用欧式距离法求两二维图形的相似度,如下式;
S g ( G d , G s ) = 1 - min { &Sigma; h = 0 K - 1 &lsqb; ( x d h - x s h ) 2 + ( y d h - y s h ) 2 &rsqb; , &Sigma; h - 0 K - 1 &lsqb; ( x d h &prime; - x s h ) 2 + ( y d h &prime; - y s h ) 2 &rsqb; } K - - - ( 6 )
式中,(xdh,ydh)表示Gd的第h个顶点坐标,(xsh,ysh)表示Gs的第h个顶点坐标,(xdh’,ydh’)表示Gd’的第h个顶点坐标;
4.2三维轮廓图形相似度计算
将包含整个植物的三维凸包在X、Y、Z三个面上进行投影,基于二维图形相似度算法逐一计算目标植物和源植物在相同投影面上的投影的相似度,然后整合所有投影的二维相似度值,从而计算出两棵植物在***轮廓上的相似度;具体步骤如下:
Step 1分别提取图形G3d和G3s的特征向量V=((x0,y0,z0),(x1,y1,z1),…,(xn3-1,yn3-1,zn3-1));
Step 2对两个三维图形的顶点集进行平移操作,使得它们最小覆盖球的球心和原点重合,然后对顶点集进行缩放,使得各自的最小覆盖球变为半径为1的单位球;
Step 3将变换后的三维图形点集分别先绕x轴旋转2πk/K弧度,K取偶数,再绕y轴旋转2πu/K弧度,然后从z轴负方向分别对它们投影,以获得目标图形的投影Pdku和源图形的投影Psku
Step 4利用二维图形相似度计算方法计算相对应的Pdku和Psku的相似度,在所有投影的相似度值中取最大值作为目标图形G3d和源图形G3s的相似度,其计算公式如下:
S 3 g ( G 3 d , G 3 s ) = m a x { S g ( P d k u , P s k u ) } , ( k , u = 0 , 1 , ... , K 2 - 1 ) - - - ( 7 )
4.3计算植物在***轮廓上的相似度
使用能包含整棵树图点集的凸包及包含子树点集的凸包来描述植物的轮廓特征;凸包的三维轮廓点集可通过遍历树图上的顶点的几何信息计算得出;在树图整体点集凸包的相似度计算中,为提高运算效率,对公式(7)进行降维处理:1)对于目标图形树图Td和源图形树图Ts,只绕y轴旋转并从z轴负方向对其进行投影;2)假设根节点所在空间位置为P,树图最小覆盖圆的圆心为O,则应约束PO连线的方向与y轴重合;令Td的凸包图形绕y轴旋转2πe/K并从z轴负方向对其投射得到的投影为Pd0e,Ts的凸包图形绕y轴旋转2πg/K并从z轴负方向对其投射得到的投影为Ps0g,则树图整体点集凸包的相似度可用下式计算:
S 3 g &prime; ( T d , T s ) = m a x { S g ( P d 0 e , P s 0 g ) } , ( e , g = 0 , 1 , ... , K 2 - 1 ) - - - ( 8 )
还进一步考虑了树图的各级非退化完全子树之间的相似性;对于某树图T的一个节点v,用T[v]表示以节点v为根的完全子树,节点集合包括v及其所有子孙节点;如果T[v]在数据结构上没有退化成链表,且节点数大于2,且v至少有一个兄弟节点,则T[v]即为一个非退化完全子树;该树图的0级非退化完全子树为自身T[v1]=T,1级非退化完全子树有T[v2]、T[v3]和T[v4],2级非退化完全子树有T[v5]、T[v6]和T[v7];
假设Td共有0~m4级非退化完全子树,Ts共有0~n4级非退化完全子树;对于某树图T,取其第e级非退化完全子树集合中与T最相似的那个元素记为MS(T,e),则Td和Ts最终的在***轮廓上的相似度值计算公式为:
S 3 g ( T d , T s ) = &Sigma; e = 0 min ( m 4 , n 4 ) S 3 g &prime; ( M S ( T d , e ) , M S ( T s , e ) ) m i n ( m 4 , n 4 ) , m i n ( m 4 , n 4 ) &NotEqual; 0 0 , m i n ( m 4 , n 4 ) = 0 - - - ( 9 )
5)计算植物内部细节特征的相似度
综合考虑各级子树的几何属性,主干上枝条的平均轴向角Sa、一级侧枝与主干的直径比Sd、整体宽高比Swh、二级侧枝与一级侧枝的平均轴向角Sa1、一级侧枝与主干的横截面积比Ss1,从而计算出植物内部细节特征的相似度;参数都是实值参数,给出对两正数参数x和y的相似度计算方法;不妨设x≥y,则参数x和y的相似度计算方法定义为:
s ( x , y ) = 1 - | x 2 - y 2 | 2 x y , 1 &le; x y < 2 + 1 0 , x y &GreaterEqual; 2 + 1 - - - ( 10 )
例如两树Td和Ts的轴向角均值分别为θd和θs,根据式(10)即可得出轴向角相似度Sa为:
Sa(Td,Ts)=s(θds) (11)
上式所得结果的范围是[0,1];当相似度值为0时,表示这两个参数因子完全不相似,为1时则表示他们完全相同;所以,相似度值越大,表示待比较的两参数越相似;
采用类似的方法获得公式(3)中其它内部细节特征的相似度Sd,Swh,Sa1,Ss1
6)计算最终的植物结构间的整体相似度
融合植物多特征信息,植物的拓扑结构、***轮廓形状、植物内部细节特征,利用所求出的各种细节的相似度值,结合公式(5)、(9)和权值因子,根据步骤(1)定义的公式(3),最终计算出不同植物结构间的整体相似度。
CN201310504139.5A 2013-10-23 2013-10-23 一种比较不同植物形态相似度的计算机方法 Active CN103559705B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310504139.5A CN103559705B (zh) 2013-10-23 2013-10-23 一种比较不同植物形态相似度的计算机方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310504139.5A CN103559705B (zh) 2013-10-23 2013-10-23 一种比较不同植物形态相似度的计算机方法

Publications (2)

Publication Number Publication Date
CN103559705A CN103559705A (zh) 2014-02-05
CN103559705B true CN103559705B (zh) 2017-02-22

Family

ID=50013944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310504139.5A Active CN103559705B (zh) 2013-10-23 2013-10-23 一种比较不同植物形态相似度的计算机方法

Country Status (1)

Country Link
CN (1) CN103559705B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850822B (zh) * 2015-03-18 2018-02-06 浙江大学 基于多特征融合的简单背景下的叶片识别方法
CN105554448A (zh) * 2015-12-11 2016-05-04 卢志文 一种基于图像分析的植物墙监控***
CN109240903A (zh) * 2017-06-15 2019-01-18 北京京东尚科信息技术有限公司 一种自动评估的方法和装置
CN108256624B (zh) * 2018-01-10 2020-05-15 河南工程学院 一种基于群体交互环境影响的根分支预测方法
CN110334758A (zh) * 2019-06-28 2019-10-15 西安理工大学 基于拓扑特征的图拓扑结构的相似度计算方法
CN110991553B (zh) * 2019-12-13 2023-09-08 盈嘉互联(北京)科技有限公司 Bim模型对比方法
CN112381758B (zh) * 2020-10-09 2024-01-30 北京师范大学 一种计算血管树相似度的方法
CN113065475B (zh) * 2021-04-08 2023-11-07 上海晓材科技有限公司 一种cad图例快速精准识别方法
CN114550165B (zh) * 2022-02-21 2024-06-18 杭州睿胜软件有限公司 有毒近似物种的识别方法、***及可读存储介质
CN117874157B (zh) * 2024-03-12 2024-07-05 国家海洋技术中心 动态时空对象数据的自适应索引方法、产品、介质及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289846A (zh) * 2011-09-08 2011-12-21 北京林业大学 一种基于广义参数化建模的树木模拟方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7536064B2 (en) * 2005-05-31 2009-05-19 Microsoft Corporation Image comparison by metric embeddings

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289846A (zh) * 2011-09-08 2011-12-21 北京林业大学 一种基于广义参数化建模的树木模拟方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A distance measure between plant architectures;Pascal Ferraro等;《Annals of Forest Science》;20001231;第57卷(第5期);445-461 *
基于树形结构相似度的植物种类识别***;丁维龙等;《中南大学学报(自然科学版)》;20130731;第44卷(第S2期);244-249 *

Also Published As

Publication number Publication date
CN103559705A (zh) 2014-02-05

Similar Documents

Publication Publication Date Title
CN103559705B (zh) 一种比较不同植物形态相似度的计算机方法
US9348877B2 (en) Methods, systems, and data structures for performing searches on three dimensional objects
Zhou et al. Edge bundling in information visualization
CN103839261B (zh) 基于分解进化多目标优化和fcm的sar图像分割方法
Ji et al. A novel simplification method for 3D geometric point cloud based on the importance of point
CN109325993B (zh) 一种基于类八叉树索引的显著性特征强化采样方法
Correa et al. Topological spines: A structure-preserving visual representation of scalar fields
CN110599506B (zh) 一种复杂异形曲面机器人三维测量的点云分割方法
CN109256028B (zh) 一种用于无人驾驶的高精度路网自动生成的方法
Chaudhury et al. Skeletonization of plant point cloud data using stochastic optimization framework
CN107679562A (zh) 三维模型的解析处理方法和装置
Yao et al. Using deep learning in semantic classification for point cloud data
CN104050640B (zh) 一种多视角密集点云数据融合方法
CN102063719B (zh) 一种三维模型局部匹配方法
Hu et al. Geometric feature enhanced line segment extraction from large-scale point clouds with hierarchical topological optimization
Zafari et al. Segmentation of partially overlapping convex objects using branch and bound algorithm
Mirande et al. A graph-based approach for simultaneous semantic and instance segmentation of plant 3D point clouds
Guiducci et al. Learning graph-based features for relief patterns classification on mesh manifolds
CN109035311A (zh) 一种弯骨骨折自动配准及内固定钢板预弯建模方法
CN110533781B (zh) 一种多类别三维模型部件自动标注方法
Xiaogang et al. Point cloud segmentation for complex microsurfaces based on feature line fitting
Lucieer et al. Alpha-shapes for visualizing irregular-shaped class clusters in 3d feature space for classification of remotely sensed imagery
Goudarzi et al. A hybrid spatial data mining approach based on fuzzy topological relations and MOSES evolutionary algorithm
Van Long Visualizing High-density Clusters in Multidimensional Data.
Chaudhury et al. Geometry reconstruction of plants

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant