CN101436213A

CN101436213A - 一种基于内容的三维模型检索性能的评价方法

Info

Publication number: CN101436213A
Application number: CNA2008102438689A
Authority: CN
Inventors: 杨育彬; 林金杰
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2008-12-16
Filing date: 2008-12-16
Publication date: 2009-05-20

Abstract

本发明公开了一种基于内容的三维模型检索性能的评价方法，由测试集的构造和评价指标的设计两个部分组成，测试集的构造和评价指标的设计。前者提供进行评价的数据基础，而后者则是给出具体的评价流程。本发明为如何对基于内容的三维模型检索算法进行评价给出了一个切实可行的解决方案，具有以下的几点优点：1)传统的评价方法将两个模型之间的相似度只定义为相关或者不相关，而本发明则考虑了模型之间存在多种级别的相似性；2)传统的评价方法只考虑同一类别的模型之间存在相似性，而忽视了不同类别间也可能是存在着相似性，而本发明考虑到了这点。本发明可应用于三维模型检索算法的评价，从而促进基于内容三维模型研究的进一步发展。

Description

一种基于内容的三维模型检索性能的评价方法

技术领域

本发明属于计算机应用技术领域，涉及的是一种三维模型检索性能的评价方法。

背景技术

随着计算机软硬件的发展，三维模型在多个领域中得到了广泛的应用。如何实现快速准确地从大规模的三维模型库中检索出符合用户需求的三维模型成为了近年来多媒体信息检索领域的一个研究热点。基于内容的三维模型检索的一个关键问题是三维模型的特征提取。目前世界各地的研究人员已经提出了大量的特征提取算法，并且都认为其提出的算法具有良好的检索性能表现，但是各自采用的测试集不同，具体采用的性能评价方法也不同，这导致其结论的说服力大大减弱。那么如何对各式各样的特征提取算法进行客观真实地评价呢？早期的研究人员在对其提出的特征提取算法进行检索性能评价时大多采用自建的测试集，这使得其实验结果的说服力有限。2004年，普林斯顿大学形状检索与分析研究组(Shape Retrieval and Analysis Group)发布了形状基准数据库(Princeton Shape Benchmark，PSB)，受到了广大研究者的肯定。越来越多的研究人员采用PSB作为检验其算法检索性能的工具。但是，PSB的分类方法存在着不可忽视的缺陷。PSB中的模型分类可以视作一棵分类树，在分类树的高层类别划分的依据是模型的语义特征，而在底层则是模型的形状特征。因此，语义特征不同但形状特征相似的模型总被划分在不同的类别。而在PSB的检索性能评价过程中，只有位于同一类别中的三维模型才被视为是相关的，否则就判定为不相关。其后果是，即使检索结果集全是形状确实相似的模型但由于其语义类别不同，该检索结果仍是一个差的结果。究其原因，就在于PSB的分类方法不考虑类别间的相似性(即语义上不相关的类别它们也可能存在形状上的相似性)。

发明内容

本发明所要解决的技术问题是提供一种基于内容的三维模型检索性能评价方法，从而使得研究人员提出的各种特征提取算法有一个客观真实的评价。

为解决上述技术问题，本发明采用的技术方案如下：

一种基于内容的三维模型检索性能的评价方法，包括如下步骤：

(1)测试集的构造：

(a)收集三维模型文件，将所有三维模型文件转换成相同的文件格式；

(b)对三维模型文件进行基于语义的分类，得到一个基本语义分类表；

(c)将基本语义分类表转换成为基于形状的分类表，具体步骤如下：(i)将基本语义分类表中的全部类别复制到一张新的表中；(ii)对新表中的每个类别执行以下操作，直到所有的类别都执行了一遍：如果该类别中的全部三维模型的形状都足够相似，则重复执行(ii)；否则将该类别***成为若干个类别，使得每个类别中模型之间的相似度都非常高(每个三维模型依据其视觉特性，总可以分为若干个有意义的子区域，例如在一个茶壶的三维模型中，它可以划分为壶嘴、壶身、壶盖、壶把。如果两个三维模型它们的子区域间具有对应关系的比例达到90％以上，则认为这两个三维模型的相似性足够高，可以将其归为同一类别)；

(d)对基于形状的分类表中的每一个类别，标注该类别与表中其它类别的相似度；

所述的相似度按如下方式定义：将相同类别的三维模型间的相似度定义为字母S；将不同类别的三维模型间的相似度定为5个级别，分别用字母A、B、C、D、E表示，其中，A表示的两个三维模型之间的相似度最高，E为两个三维模型毫不相似，其它的字母所表达的相似度介于A与E之间；则按照相似度由高到低的排列顺序为：S>A>B>C>D>E；

在本发明中，S、A、B、C、D和E这六个英文大写字母被用来描述两个类别之间的相似性，称之为相似性字母(Similarity Letter，SL)。由相似性字母组成的字符串称为相似性序列(Similarity Sequence，SS)。在相似性序列中，一个相似性字母的后继(Subsequence)定义为该相似性字母后的字符子串。当一个相似性序列是按照相似性降序排列时(即高相似性的字母排在前面，低相似性的字母排在后面)，称该序列为最好相似性序列(Perfect Similarity Sequence，PSS)；反之，当一个相似性序列时按照相似性升序排列时，则称该序列为最坏相似性序列(Terrible Similarity Sequence，TSS)。显然，对于任意给定的一个SS，只要对该序列中的相似性字母按照相似性大小重新排列就能得到其对应的PSS和TSS；

标注该类别与表中其它类别的相似度的方法如下：从每一个类别中任选一个模型出来，然后比较这些模型之间的相似度作为类别间的相似度。对于一个物体，可以分为若干个有意义的局部区域；如果两个物体的区域之间小于等于20％的对应关系，则这两个模型之间具有E的相似度；如果两个模型的区域之间有大于20％、而小于等于40％的对应关系，则这两个模型之间就具有D的相似度；如果对应的区域数大于40％小于等于60％则相似度为C；如果对应的区域数大于60％小于等于80％，则相似度为B；如果对应的区域数大于80％则相似度为A。

(2)评价指标的设计：

(a)用一种特征提取算法对步骤(1d)得到测试集中的每一个模型作出查询，对于包含N个三维模型的测试集，得到N个检索结果；

(b)根据步骤(1d)得到的相似度标注结果，将检索结果列表转换为相应的相似性序列，具体步骤如下：依据检索结果列表的排列顺序，从上到下逐一比较特征提取算法中所查询的模型与检索结果列表中的模型的相似度，该相似度遵循步骤(1d)所标注的相似度，并将该相似度记录下来形成相应的相似性序列；

(c)按如下方式对相似性序列中的每一个相似性字母的得分率S进行计算：

记Score(SS，SL)表示相似性序列中相似性字母的得分，它的值为相似性字母的后继中比该相似性字母小的相似性字母的个数，即：

Score (SS, SL) = Σ_{i = SS . index At (SL)}^{SS . length} less (SS [i], SL),

其中

其中，SS表示相似性序列，SL表示相似性字母；

记Score(SS)表示相似性序列的得分，它的值为相似性序列中每一个相似性字母的得分的总和，即

Score (SS) = Σ_{i = 1}^{SS . length} Score (SS, SS [i]),

其中，SS表示相似性序列；

则，相似性序列中每一个相似性字母的得分率S定义为Score(SS)/Score(PSS)，

其中，PSS为与相似性序列所对应的最好相似性序列，即将该相似性序列中的所有字母按照相似性降序排列；

(d)对于包含N个三维模型的测试集，按照步骤(2c)的算法，得到N个相似性字母的得分率p₁，p₂，...，p_N，则对于步骤(2a)中所使用的特征提取算法最终评价结果为：

p = \frac{1}{N} Σ_{i = 1}^{N} p_{i} .

有益效果：本发明为如何对基于内容的三维模型检索算法进行评价给出了一个切实可行的解决方案，具有以下的几点优点：1)传统的评价方法将两个模型之间的相似度只定义为相关或者不相关，而本发明则考虑了模型之间存在多种级别的相似性；2)传统的评价方法只考虑同一类别的模型之间存在相似性，而忽视了不同类别间也可能是存在着相似性，而本发明考虑到了这点。本发明可应用于三维模型检索算法的评价，从而促进基于内容三维模型研究的进一步发展。

附图说明

图1本发明整体结构图。

图2本发明测试集的构造流程图。

图3本发明评价的流程图。

具体实施方式：

下面结合附图和实施例对本发明作进一步的说明。

本发明的基于内容的三维模型检索性能评价方法主要由两个部分组成，测试集的构造和评价指标的设计。前者提供进行评价的数据基础，而后者则是给出具体的评价流程。图1是本发明的整体结果图。研究人员设计了一个基于内容的三维模型检索算法之后，首先使用本发明的三维模型测试集中的每一个模型作为查询，这样可以得到若干个检索结果。然后再利用本发明的评价方法对得到的检索结果进行评价，最后便可以得到关于待评测算法的一个评价结果。

图2是本发明测试集的构造流程。步骤1收集三维模型文件，这可通过网络爬虫程序从互联网上下载，或者是使用三维模型建模软件创建。步骤2将各种文件格式的三维模型文件转换为统一的文件格式，例如OFF、OBJ、PLY等三维模型文件格式。步骤3对已收集的三维模型进行手工的基于语义的分类，即依照人的知识判断，为每一个三维模型标注它所属的类别，例如对一个苹果模型，则将其类别标注为“苹果”，得到一个基本的语义分类表。步骤4设置一计数器i，赋初值为0。步骤5判断计数器i所指向的类别是否足够纯，即同一类别中的模型相似度非常高(每个三维模型依据其视觉特性，总可以分为若干个有意义的子区域，例如在一个茶壶的三维模型中，它可以划分为壶嘴、壶身、壶盖、壶把。如果两个三维模型它们的子区域间具有对应关系的比例达到90％以上，则认为这两个三维模型的相似性足够高，可以将其归为同一类别)。对于那些不纯的类别执行步骤6将该类别***成为若干个子类别，使得每一个子类别都非常纯。如果步骤5中该类别已经足够纯则直接进入步骤7。步骤7检测是否还有类别没有处理，即i小于类别总数，若是则执行步骤8让i自增1，否则进入步骤9，标注每一个类别与其它类别间的相似度。所述的相似度按如下方式定义：将相同类别的三维模型间的相似度定义为字母S；将不同类别的三维模型间的相似度定为5个级别，分别用字母A、B、C、D、E表示，其中，A表示的两个三维模型之间的相似度最高，E为两个三维模型毫不相似，其它的字母所表达的相似度介于A与E之间；则按照相似度由高到低的排列顺序为：S>A>B>C>D>E。标注该类别与表中其它类别的相似度的方法如下：对于一个物体，可以分为若干个有意义的局部区域；对于一个物体，可以分为若干个有意义的局部区域；如果两个物体的区域之间小于等于20％的对应关系，则这两个模型之间具有E的相似度；如果两个模型的区域之间有大于20％、而小于等于40％的对应关系，则这两个模型之间就具有D的相似度；如果对应的区域数大于40％小于等于60％则相似度为C；如果对应的区域数大于60％小于等于80％，则相似度为B；如果对应的区域数大于80％则相似度为A。

通过如上的步骤，本发明可以得到一个具有统一格式的三维模型数据集，而且三维模型之间的相似关系通过分类表记录下来。

下面结合图3介绍如何结合上述测试集对研究人员提出的一个基于内容的三维模型特征提取算法(如算法A1g)进行评价。

步骤10设置计数器i，初值为0，以及一个记录总得分率的变量sum，初值也为0。步骤11将测试集中的第i个模型作为Alg的查询，那么Alg将会返回一个检索结果。该检索结果是对测试集中所有模型依照它们与Alg查询之间相似性的一个排序表，与查询最相似的被排在表的最上方，最不相似的放在表的最下方，该排序表由特征提取算法自身形成的排序。步骤12将检索结果列表转换成为相应的相似性序列。具体的方法是：依据检索结果列表的排列顺序，从上到下逐一比较Alg所使用的查询模型与检索结果列表中的模型的相似度，该相似度遵循步骤9所标注的相似度，并将该相似度记录下来形成相应的相似性序列。步骤13计算上一步骤得到的相似性序列中的每一个相似性字母的得分率pi：

p = \frac{Score (SS)}{Score (PSS)},

其中，PSS表示SS的最好相似性序列；

其中，Score(SS)表示相似性序列的得分，它的值为相似性序列中每一个相似性字母的得分的总和，即

Score (SS) = Σ_{i = 1}^{SS . length} Score (SS, SS [i]),

其中，Score(SS，SL)表示相似性序列中相似性字母的得分，它的值为相似性字母的后继中比该相似性字母小的相似性字母的个数，即：

Score (SS, SL) = Σ_{i = SS . index At (SL)}^{SS . length} less (SS [i], SL),

其中

步骤14将pi加到总得分率变量sum中。步骤15检测i是否小于测试集中的模型总数N，若是则执行步骤16让i自增1，否则执行步骤17。步骤17将sum的值除以测试集的模型总数N即可得到三维模型检索算法的平均得分率。

Claims

1、一种基于内容的三维模型检索性能的评价方法，其特征在于该方法包括如下步骤：

(1)测试集的构造：

(c)将基本语义分类表转换成为基于形状的分类表；

(2)评价指标的设计：

(b)根据步骤(1d)得到的相似度标注结果，将检索结果列表转换为相应的相似性序列；

Score (SS, SL) = Σ_{i = SS . indexAt (SL)}^{SS . length} less (SS [i], SL),

其中

其中，SS表示相似性序列，SL表示相似性字母；

记Score(SS)表示相似性序列的得分，它的值为相似性序列中每一个相似性字母的得分的总和，即：

Score (SS) = Σ_{i = 1}^{SS . length} Score (SS, SS [i])

其中，SS表示相似性序列；

(d)对于包含N个三维模型的测试集，按照步骤(2c)的算法，得到N个相似性字母的得分率S₁，S₂，...，S_N，则对于步骤(2a)中所使用的特征提取算法最终评价结果为：

p = \frac{1}{N} Σ_{i = 1}^{N} S_{i} .

2、根据权利要求1所述的基于内容的三维模型检索性能的评价方法，其特征在于步骤(1c)所述的将基本语义分类表转换成为基于形状的分类表的方法包括如下步骤：

(i)将基本语义分类表中的全部类别复制到一张新的表中；

(ii)对新表中的每个类别执行以下操作，直到所有的类别都执行了一遍：如果该类别中的全部三维模型的形状都足够相似，则重复执行(ii)；否则将该类别***成为若干个类别，使得每个类别中模型之间的相似度都很高。

3、根据权利要求1所述的基于内容的三维模型检索性能的评价方法，其特征在于步骤(1d)按照如下方式标注该类别与表中其它类别的相似度：对于一个物体，可以分为若干个有意义的局部区域；如果两个物体的区域之间少于等于20％的对应关系，则这两个模型之间具有E的相似度；如果两个模型的区域之间有大于20％、而小于等于40％的对应关系，则这两个模型之间就具有D的相似度；如果对应的区域数大于40％小于等于60％则相似度为C；如果对应的区域数大于60％小于等于80％，则相似度为B；如果对应的区域数大于80％则相似度为A。

4、根据权利要求1所述的基于内容的三维模型检索性能的评价方法，其特征在于步骤(2b)所述的将检索结果列表转换为相应的相似性序列，方法如下：依据检索结果列表的排列顺序，从上到下逐一比较特征提取算法中所查询的模型与检索结果列表中的模型的相似度，该相似度遵循步骤(1d)所标注的相似度，并将该相似度记录下来形成相应的相似性序列。