CN104350490A

CN104350490A - 用于组织与产品相关的数据的方法、装置以及计算机可读介质

Info

Publication number: CN104350490A
Application number: CN201380029313.3A
Authority: CN
Inventors: 蔡达成; 余建兴; 查正军; 汪萌
Original assignee: National University of Singapore
Current assignee: National University of Singapore
Priority date: 2012-04-11
Filing date: 2013-04-09
Publication date: 2015-02-11
Also published as: WO2013154502A1; JP2015518210A; SG11201406534QA; US20150066711A1; SG10201508709WA

Abstract

各种实施方式涉及用于组织与产品相关的数据的方法、装置以及计算机可读介质。实施方式涉及用于基于与产品有关的数据来生成用于产品的修正层级的方法。所述方法包括生成用于产品的初始层级，所述初始层级包括多个节点，每个节点代表不同的产品层面，所述多个节点取决于不同的产品层面之间的关系而相互连接。所述方法还包括从所述数据识别产品层面。所述方法额外地包括通过计算目标函数为所识别出的产品层面确定在所述初始层级中的优化位置。所述方法进一步包括将所识别出的产品层面***所述初始层级中的所述优化位置以生成所述修正层级。

Description

用于组织与产品相关的数据的方法、装置以及计算机可读介质

技术领域

各种实施方式涉及用于组织与产品相关的数据的方法、装置以及计算机可读介质。尤其，实施方式涉及：用于基于与产品有关的数据来生成用于产品的修正层级的方法；用于基于与产品有关的数据来识别产品层面的方法；用于从与产品有关的数据确定用于产品层面的层面情绪(sentiment)的方法；用于基于与产品有关的数据来分级产品层面的方法；用于从与产品有关的数据确定产品情绪的方法；用于基于与产品有关的数据来生成产品评价概要的方法；以及对应的装置以及计算机可读介质。

背景技术

组织与产品相关的数据使得数据更能理解。数据可以包括文本、图形、表格等。例如，如果数据被组织的话，数据内的讯息或者信息可以变得更清楚。取决于组织的方法，数据内的不同讯息或者信息可以变得更清楚。随着数据的体积增加，越需要组织数据以识别数据内的讯息、信息、主题、课题、趋势。

与产品有关的数据可以指的是产品的一个或多个不同的层面(即特征)。例如，如果产品是移动电话，示范的产品层面可以包括：可用性、尺寸、电池性能、处理性能以及重量。所述数据可以包括对产品的评论或者评价，更具体来说，对产品各个层面的评论或者评价。

发明内容

第一方案提供了用于基于与产品有关的数据来生成用于产品的修正层级的方法，所述方法包括：生成用于产品的初始层级，所述初始层级包括多个节点，每个节点代表不同的产品层面，所述多个节点取决于不同的产品层面之间的关系而相互连接；从所述数据识别产品层面；通过计算目标函数为所识别出的产品层面确定在所述初始层级中的优化位置；以及将所识别出的产品层面***所述初始层级中的所述优化位置以生成所述修正层级。

第二方案提供了用于基于与产品有关的数据来生成用于产品的修正层级的装置，所述装置包括：至少一个处理器；以及至少一个内存包括计算机程序代码；所述至少一个内存和所述计算机程序代码构造为利用所述至少一个处理器引起所述装置至少：生成用于产品的初始层级，所述初始层级包括多个节点，每个节点代表不同的产品层面，所述多个节点取决于不同的产品层面之间的关系而相互连接；从所述数据识别产品层面；通过计算目标函数为所识别出的产品层面确定在所述初始层级中的优化位置；以及将所识别出的产品层面***所述初始层级中的所述优化位置以生成所述修正层级。

第三方案提供了计算机可读存储介质，其上存储有计算机程序代码，计算机程序代码当由计算机执行时引起计算机执行用于基于与产品有关的数据来生成用于产品的修正层级的方法，所述方法是根据所述第一方案的方法。

第四方案提供了用于基于与产品有关的数据来识别产品层面的方法，所述方法包括：从所述数据的第一部分识别数据段；根据所述第一方案基于所述数据的第二部分生成修正层级；以及将所述数据段分类为多个层面类别之一，每个层面类别关联于由所述修正层级中的不同节点代表的产品层面以识别所述数据段相关于哪个产品层面。

第五方案提供了用于基于与产品有关的数据来识别产品层面的装置，所述装置包括：至少一个处理器；以及至少一个内存包括计算机程序代码；所述至少一个内存和所述计算机程序代码构造为利用所述至少一个处理器引起所述装置至少：从所述数据的第一部分识别数据段；使用第二方案的装置基于所述数据的第二部分生成修正层级；以及将所述数据段分类为多个层面类别之一，每个层面类别关联于由所述修正层级中的不同节点代表的产品层面以识别所述数据段相关于哪个产品层面。

第六方案提供了计算机可读存储介质，其上存储有计算机程序代码，计算机程序代码当由计算机执行时引起计算机执行用于基于与产品有关的数据来识别产品层面的方法，所述方法是根据第四方案的方法。

第七方案提供了用于从与产品有关的数据确定用于产品层面的层面情绪的方法，所述方法包括：从所述数据的第一部分识别数据段；根据所述第一方案，基于所述数据的第二部分生成修正层级；将所述数据段分类为多个层面类别之一，每个层面类别关联于由所述修正层级中的不同节点代表的产品层面以识别所述数据段相关于哪个产品层面；从所述数据段抽取与所述数据段相关的产品层面所对应的观点；将所抽取出的观点分类为多个观点类别之一，每个观点类别关联于不同的观点，所述层面情绪是与所述一个观点类别关联的观点。

第八方案提供了用于从与产品有关的数据确定用于产品层面的层面情绪的装置，所述装置包括：至少一个处理器；以及至少一个内存包括计算机程序代码；所述至少一个内存和所述计算机程序代码构造为利用所述至少一个处理器引起所述装置至少：从所述数据的第一部分识别数据段；使用第二方案的装置基于所述数据的第二部分生成修正层级；将所述数据段分类为多个层面类别之一，每个层面类别关联于由所述修正层级中的不同节点代表的产品层面以识别所述数据段相关于哪个产品层面；从所述数据段抽取与所述数据段相关的产品层面所对应的观点；以及将所抽取出的观点分类为多个观点类别之一，每个观点类别关联于不同的观点，所述层面情绪是与所述一个观点类别关联的观点。

第九方案提供了计算机可读存储介质，其上存储有计算机程序代码，计算机程序代码当由计算机执行时引起计算机执行用于从与产品有关的数据确定用于产品层面的层面情绪的方法，所述方法是根据第七方案的方法。

第十方案提供了用于基于与产品有关的数据来分级产品层面的方法，所述方法包括：从所述数据识别产品层面；基于产品层面在数据中的出现频率以及所识别出的产品层面的影响测度，生成用于每个所识别出的产品层面的权重因子；以及基于所生成的权重因子来分级所识别出的产品层面。

第十一方案提供了用于基于与产品有关的数据来分级产品层面的装置，所述装置包括：至少一个处理器；以及至少一个内存包括计算机程序代码；所述至少一个内存和所述计算机程序代码构造为利用所述至少一个处理器引起所述装置至少：从所述数据识别产品层面；基于产品层面在数据中的出现频率以及所识别出的产品层面的影响测度，生成用于每个所识别出的产品层面的权重因子；以及基于所生成的权重因子来分级所识别出的产品层面。

第十二方案提供了计算机可读存储介质，其上存储有计算机程序代码，计算机程序代码当由计算机执行时引起计算机执行用于基于与产品有关的数据来分级产品层面的方法，所述方法是根据第十方案的方法。

第十三方案提供了用于从与产品有关的数据确定产品情绪的方法，所述方法包括：根据第十方案基于所述数据的第一部分确定与产品相关的所分级的产品层面；从所述数据的第二部分识别一个或多个特征，所述或者每个特征识别所分级的产品层面以及对应观点；基于其对应观点将每个特征分类为多个观点类别之一，每个观点类别关联于不同的观点；以及基于所述多个观点类别中哪一个包含最多特征来确定产品情绪。

第十四方案提供了用于从与产品有关的数据确定产品情绪的装置，所述装置包括：至少一个处理器；以及至少一个内存包括计算机程序代码；所述至少一个内存和所述计算机程序代码构造为利用所述至少一个处理器引起所述装置至少：使用第十一方案所述的装置基于所述数据的第一部分确定与产品相关的所分级的产品层面；从所述数据的第二部分识别一个或多个特征，所述或者每个特征识别所分级的产品层面以及对应观点；基于其对应观点将每个特征分类为多个观点类别之一，每个观点类别关联于不同的观点；以及基于所述多个观点类别中哪一个包含最多特征来确定产品情绪。

第十五方案提供了计算机可读存储介质，其上存储有计算机程序代码，计算机程序代码当由计算机执行时引起计算机执行用于从与产品有关的数据确定产品情绪的方法，所述方法是根据第十三方案的方法。

第十六方案提供了用于基于与产品有关的数据来生成产品评价概要的方法，所述方法包括：根据第十方案基于所述数据的第一部分确定与产品相关的所分级的产品层面；从所述数据的第二部分抽取一个或多个数据段，基于所述数据段是否识别出所分级的产品层面以及包含对应观点来计算用于所述或者每个所抽取出的数据段的相关性分数；以及取决于它们的相应相关性分数来生成包括一个或多个所抽取出的数据段的产品评价概要。

第十七方案提供了用于基于与产品有关的数据来生成产品评价概要的装置，所述装置包括：至少一个处理器；以及至少一个内存包括计算机程序代码；所述至少一个内存和所述计算机程序代码构造为利用所述至少一个处理器引起所述装置至少：使用第十一方案的装置基于所述数据的第一部分确定与产品相关的所分级的产品层面；从所述数据的第二部分抽取一个或多个数据段，基于所述数据段是否识别出所分级的产品层面以及包含对应观点来计算用于所述或者每个所抽取出的数据段的相关性分数；以及取决于它们的相应相关性分数来生成包括一个或多个所抽取出的数据段的产品评价概要。

第十八方案提供了计算机可读存储介质，其上存储有计算机程序代码，计算机程序代码当由计算机执行时引起计算机执行用于基于与产品有关的数据来生成产品评价概要的方法，所述方法是根据第十六方案的方法。

应该理解的是，在以下说明中，一个方案(例如，方法)的进一步特征及优势将同样应用于对应的方案(例如，对应装置或者对应计算机可读介质)中，在此在对应的方案中再次陈述。

附图说明

通过以下说明书，仅依靠例子并结合附图，本领域的技术人员将更好地理解和容易明白本发明的实施方式，附图中，类似附图标记涉及类似部件，其中：

图1示出了来自***(Wikipedia)的示范产品说明书；

图2示出了来自CNet.com的示范产品说明书；

图3a是根据实施方式的用于层级组织的框架的流程图；

图3b示出了根据实施方式的用于iPhone 3G产品的示范层级组织；

图4示出了来自网站Viewpoints.com的示范消费者评价；

图5示出了来自网站Reevoo.com的示范消费者评价；

图6是根据实施方式的用于产品层面识别的框架的流程图；

图7示出了来自开放目录专案(ODP)的示范外部语言资源；

图8示出了来自WordNet的示范外部语言资源；

图9是根据实施方式的用于情绪分类的框架的流程图；

图10示出了与示范产品评价数据组的统计相关的估计数据，#指代评价/句子的数量；

图11示出了与示范外部语言资源的统计相关的估计数据；

图12示出了与对自由文本评价的产品层面识别的性能相关的估计数据；

图13示出了与层面层级生成的性能相关的估计数据。应注意的是，'w/H'指代包括初始层级的方法，'w/o H'指的是不包括初始层级的方法；

图14示出了与不同比例的初始层级的影响相关的估计数据；

图15示出了当清除单个标准时与F1-测量的改变的多个优化标准.％相关的估计数据；

图16示出了与语言特征对于语义距离学习的影响相关的估计数据；

图17示出了与外部语言资源对于语义距离学习的影响相关的估计数据；

图18示出了与层面级别情绪分类的性能相关的估计数据；

图19是根据实施方式的用于用生成的层级进行产品层面识别的框架的流程图；

图20示出了与在生成的层级的帮助下进行层面识别的性能相关的估计数据；

图21示出了与在层级的帮助下进行含蓄层面识别的性能相关的估计数据；

图22是根据实施方式的用于使用层级对层面进行情绪分类的框架的流程图；

图23示出了与在层级的帮助下进行层面级别情绪分类的性能相关的估计数据；

图24示出了对例子产品iPhone 3GS的数个例子层面；

图25是根据实施方式的用于层面分级的框架的流程图；

图26示出了根据实施方式的概率层面分级算法的假代码；

图27示出了与在NDCG5方面进行层面分级的性能相关的估计数据；

图28示出了与在NDCG10方面进行层面分级的性能相关的估计数据；

图29示出了与在NDCG15方面进行层面分级的性能相关的估计数据；

图30示出了估计数据，包括一表格，示出了用四种方法为iPhone3GS所分级出的前10个层面；

图31示出了对例子产品iPhone4的示范产品评价；

图32是根据实施方式的具有层面分级结果的用于文件级别情绪分类的框架的流程图；

图33示出了与由三个特征权重方法进行的文件级别情绪分类的性能相关的估计数据，即，布尔(Boolean)、术语频率(TF)以及我们提出的层面分级AR权重；

图34是根据实施方式的具有层面分级结果的用于抽取式评价概要的框架的流程图；

图35a和35b示出了在ROUGE-1(35a)和ROUGE-2(35b)方法与抽取式评价概要的性能相关的估计数据；

图36示出了估计数据，包括一表格，示出了产品iPhone 3GS的样本抽取概要；以及，

图37是根据实施方式的计算机网络装置的示意图。

具体实施方式

各种实施方式涉及用于组织与产品相关的数据的方法、装置以及计算机可读介质。尤其，实施方式涉及用于生成修正层级的方法，用于识别产品层面的方法，用于确定层面情绪的方法，用于分级产品层面的方法，用于确定产品情绪的方法，用于生成产品评价概要的方法，以及对应的装置以及计算机可读介质。

以下的一部分说明明确地或隐含地在计算机内存中的数据中以算法和函数性或图像性表征操作的形式出现。这些算法的描述以及函数性或图像性表征是数据处理领域的技术人员使用的含义以将它们运作的实质最有效地传递给本领域的其他技术人员。此处，算法通常设想为是步骤的自一致序列以形成期望结果。这些步骤是需要物理上操纵物理量的步骤，物理量诸如能够被存储、传递、结合、比较以及以其他方式操作的电的、磁的或者光学的信号。

除非另有说明，如以下可见的，将理解的是，在整个说明书中，利用术语诸如“识别”、“抽取”、“分级”、“计算”、“确定”、“替换”、“生成”、“***”、“分类”、“输出”等的讨论指代计算机***或者类似电子设备的行为以及处理，计算机***或者类似电子设备将计算机***内表示为物理量的数据操纵及转换为由计算机***或其他信息存储、传递或者显示设备内的物理量类似地表示的其他数据。

本说明书还公开了用于执行方法的操作的装置。这种装置可以专门构造为用于所需目的，或者可以包括选择性地被激活或者由存储在计算机中的计算机程序重构的通用计算机或者其他设备。此处提出的算法以及显示器并不内在地相关于任何特定计算机或者其他装置。各种通用机器可以用于根据此处教导的程序。可替换地，用来执行所需方法步骤的更专用装置的的构造可以是合适的。常规通用计算机的结构件见于以下说明中。

此外，本说明书还隐含公开了计算机程序，因为对本领域的技术人员来说显而易见的是，此处描述的方法的各个步骤可以由计算机代码实现。计算机程序不旨在限于任何特定的程序语言以及其实施。将理解的是，可以使用各种程序语言以及其编码来实施此处包含的公开的教导。而且，计算机程序不旨在限于任何特定的控制流。存在许多其他变型的计算机程序，它们能够使用不同的控制流，这并不超出本发明的精神或范围。

此外，一个或多个计算机程序的步骤可以并行执行而不是顺序执行。这种计算机程序可以存储在任何计算机可读介质上。计算机可读介质可以包括存储设备，诸如磁盘或者光盘、内存芯片、或者适合于与通用计算机接口的其他存储设备。计算机可读介质还可以包括诸如在因特网***中典型的硬件介质，或者诸如在GSM移动电话网络中典型的无线介质。计算机程序当在通用计算机上加载及实施时可有效地形成实施优选方法的布置的装置。

层级框架综述

对于特定产品，层级通常归类为数百个产品层面。例如，iPhone3GS具有多于三百个层面(见图24)，诸如“可用性”、“设计”、“应用”、“3G网络”等。某些层面可能比其他层面更重要，并且对最终用户决策以及厂商产品开发策略具有更大影响。例如，iPhone 3GS中的某些层面如“易用性”和“电池”受到大多数用户的关注，并且比其他层面如“USB”更重要。对于相机产品，如“透镜”和“图像质量”的层面可能会大大影响消费者对于摄像机的看法，这些层面比其他层面如“a/v连接线”和“腕带”更加重要。因此，识别重要的产品层面是对消费者和厂商两者都有利的。消费者可以通过更多关注这些重要的层面方便地做出明智的购买决策，而厂商可以集中在提升这些层面的质量上从而有效提升产品信誉。通常，人们从众多评价中手动识别产品的重要层面是不现实的。

各个实施方式涉及组织与产品相关的数据。特别地，实施方式涉及生成修正层级的方法，识别产品层面的方法，确定层面情绪的方法，以及相应的装置和计算机可读介质。

“产品”可以是任意在售的商品或物品。比如，如，消费性电子产品、食品、服装、交通工具、家具等等。其中，所述产品可以是移动电话。

“数据”可以包括任何与所述产品相关的信息。比如，如说明书、评价、情况说明书、操作手册、产品说明、关于产品的文章等等。所述数据可以包含文本、图形、表格等或其任何组合。通常所述数据可能涉及产品或个别产品层面(如特点)。所述数据可以包含对产品及其中个别产品层面的观点(如看法)或评论。所述观点可以是离散的(如好或坏，或者在1到10的整体数值范围中)或者性质上比较连续的。所述产品、观点以及层面是可以从作为文本、图形、表格等或其任何组合的数据中推导出的。

在下面的实施方式中，所述数据可以包括产品的观点(如消费者评价)。所述观点可以是未经组织的，将导致浏览和知识获取上有难度。

对于从所述数据生成评价层级的任务，能够涉及本体学习的传统方法，首先从文本中识别内容，然后利用基于模式的方法或基于聚类的方法在这些内容中确定父子关系。然而，基于模式的方法常常存在内容中父子关系的不一致性，而基于聚类的方法常导致低查准率。因此，通过直接利用这些方法从评价生成层面层级，所产生的层级常常是不准确的，从而导致不符合要求的评价。此外，所生成的层级可能不符合消费者的信息需求，消费者期望确定的子主题被呈现。

另一方面，产品的领域知识可以从网络得到。领域知识可以被理解为关于特定产品的信息。所述信息可以从公知领域获得。这些知识可以提供回答消费者关键信息需求的广义结构。例如，在论坛网站CNet.com上有多于248,474个产品说明书。图1和图2分别示出了在***(www.wikipedia.com)和CNet.com上的移动电话产品“iPhone3GS”的产品说明书。这些产品说明书覆盖了一些产品层面2(如产品层面或特点)并提供了产品层面2的粗粒度父子关系4。这样的领域知识有利于帮助将产品层面组织为层级。而从领域知识获得的最初层级有利于评价组织的大概结构，大概结构常常太粗以至于不能覆盖评价中所评论(如消费者观点)的具体产品层面。此外，在层级中的一些层面可以不是消费者对评价的兴趣点。为了利于这两者最佳，能够整合初级领域知识结构和评价的分布规律，初级领域知识反映了产品中的消费者感兴趣，评价的分布规律指示当前消费者关心的兴趣点和主题。因此，初级评价层级可以被进化成修正层级，修正层级反映当前消费者观点和兴趣点。

一实施方式提供了一种通过同时利用领域知识(如产品说明书)和与产品相关的数据(如消费者评价)来生成评价层级组织的域辅助方法。该实施方式的结构如图3的流程图所示。

在100处，寻找领域知识以确定某一产品的进程描述。例如，领域知识可以从一个或多个互联网网站获得，如，***或者CNet。在102处，使用此领域知识来获得初级层面层级，即用于将与产品相关的产品层面进行组织的层级。在104处，与100和102串行或者并行，从比如一个或多个互联网网站获得与产品相关的数据(如消费者评价)。在106处，使用所获得的数据来识别与产品相关的产品层面。

在108处，基于102中开发的初级层级和106中识别的产品层面来生成修正层级。在一实施方式中，采用优化方法递增地将106中识别的层面***到102中开发的初级层级的适当位置，以获得包含所有层面的层面层级，即修正层级。以该方式，然后将104中获得的数据组织到108中开发的修正层级中的相应层面节点上。一个层面的最佳位置通过计算目标函数来获得，目标函数旨在优化一个或多个标准。在一实施方式中，执行多标准优化。

在110处，可以执行情绪分类以确定消费者对所述层面的观点。所述观点可以从与产品相关的数据中抽取。在112处，情绪可以增加到层级中以获得更为详尽的层级结构，即包含观点或情绪的层级结构。在一实施方式中，上述方法可以通过带有显示屏的通用计算机或者具有显示屏的特别设计的硬件装置执行。相应的，在112处，修正层级可以被送往显示屏以显示给人类消费者。图3b示出了依照一实施方式的修正层级。

在图3b的实施方式中，层级涉及特定产品(如iPhone 3G)且包括多种节点，其中每个节点代表不同的产品层面。例如，显示了节点120(代表产品层面“软件”)和节点122(代表产品层面“多媒体”)。节点120和122代表通过连接件124连接在一起的节点对。连接件124指示节点120和122所代表的产品层面之间的父子关系。父节点是节点120(如软件)，因其比子节点122(如多媒体)更靠近根节点126。层级的叶或根(如128和130)可以代表对所述叶所连接的节点的产品层面的观点。

各个实施方式提供了基于产品相关的数据(如消费者情绪)生成产品的修正层级的方法。所述方法包括下面的内容。生成产品的初始层级，初始层级包括多个节点，每个节点代表不同的产品层面，多个节点取决于不同的产品层面之间的关系而相互连接。从所述数据识别所述产品层面。通过计算目标函数确定所识别出的产品层面在所述初始层级中的优化位置。将所识别出的产品层面***初始层级中的优化位置以生成修正层级。

在实施方式中，基于产品的说明书来生成初始层级，例如，从诸如***或CNet的网站获得的说明书。

在实施方式中，初始层级包括一个或多个节点对，每个节点对具有连接在一起以指示父子关系的父节点以及子节点。在实施方式中，初始层级包括根节点，每个节点对的父节点是最靠近根节点的节点。这可以是在接近度方面是最靠近的，或者在针对根节点的介入节点的最小数量方面是最靠近的。

在实施方式中，将所识别出的产品层面***初始层级包括将所识别出的产品层面关联于现有节点以指示现有节点代表所识别出的产品层面。在实施方式中，将所识别出的产品层面***初始层级包括将新节点互连入初始层级以及将所识别出的产品层面关联于新节点以指示新节点代表所识别出的产品层面。例如，之前***，节点A可以连接至节点B以形成节点对。节点A可以是父节点，而节点B可以是子节点。例如，节点A可以代表产品层面'硬件'，而节点B可以代表产品层面'内存'。新节点可以关联于新产品层面'容量'，即内存容量。因此，新节点C可以加入作为节点B的子节点，从而代表着'容量'是父特征'内存'的子特征。

层级组织框架

如图3所示的，一实施方式包括四个要素：(a)初始层面层级获取；(b)产品层面识别；(c)层面层级生成；以及(d)产品层面上的情绪分类。下面定义一些符号并详细描述这些要素。

初步准备以及符号

在一实施方式中，层面层级可以是由一组节点组成的树。每个节点可以代表(或者关联于)一个独特的产品层面。此外，在这些节点及它们代表的层面中可以有一组父子关系R。例如，两个相邻节点可以互联，以指示由这两个节点(或者节点对)代表的两个层面之间的父子关系。父节点可以是所述层级中最靠近根节点的那个节点。在一实施方式中，最靠近可以是指物理上的靠近或仅仅是在两者之间有较少的节点。

在一实施方式中，给出了一产品的消费者评价，以A＝{a₁...,a_k}表示在所述评价中论及的产品层面。H⁰(A⁰,R⁰)表示从领域知识获得的初始层级。它包括一组层面A⁰和一组关系R⁰。各个实施方式旨在构建一个层面层级H(A,R)，以包括A中的所有层面及其父子关系R，从而所有的消费者评价能够分层级地组织起来。要注意的是H⁰可以是空的。

初始层级获得

如前所述，在某些论坛网站(如***,CNet)中产品说明书覆盖某些产品层面和这些产品层面中的粗粒度父子关系。这样的领域知识有利于帮助将层面组织到层级中。

在一实施方式中，初始层面层级从产品说明书中自动获得。方法首先识别覆盖产品说明书的Web页面区域并将不相干的内容从Web页面清除。然后该方法基于HTML标签解析包含有产品信息的区域，识别层面及其结构。通过规划所述层面及其结构，该方法生成初始层面层级。

产品层面识别

如图4和图5所示，消费者评价由论坛网站上的不同格式组成。例如，诸如CNet.com的网站要求消费者给出产品的总体评分，提供对某些产品层面的概要数据或简明的正负面观点(即赞成和反对)，以及在自由文本156中写下一段详细的评价。如图4中尤其可见，某些其他网站，如Viewpoints.com，仅仅要求一个总体评分150，一个提要式的标题152以及一段自由文本评价154。如图5尤其可见，某些其它网站，如Reevoo.com，在某些层面上包括了一个总体评分158、简要肯定观点160和反对观点162。

总之，除了综合评分，消费者评价可以包括概要数据(如赞成和反对)、自由文本评价或者两者都有。对于概要数据(如赞成和反对)，层面可以通过抽取常用名词术语来识别。这样，通过从概要数据抽取常用名词术语能够获得高度准确的层面。此外，这些常用术语有利于识别自由文本评价中的层面。

图6是根据一个实施方式的识别产品层面的方法的流程图。下面描述此方法的细节。

在200处，如上述提出的那样获得消费者评价。可以理解的是，在本实施方式中，消费者评价代表与某一产品相关的数据。所述数据可以从各种互联网网站获得。在202处，从200中获得的数据中抽取数据段。例如，可以将在200中获得的每个消费者评价的自由文本评价部分154分成句子。在204处，可以例如使用斯坦福解析器来解析每个数据段(例如，句子)。可以使用此解析操作从所述数据中识别和清除不相关的内容。

在206处，然后可以从所述数据段解析树中抽取常用名词短语(NP)作为层面候选。可以理解的是，名词短语是从所述数据中抽取的数据段的特定类型。因此，在其他实施方式中，可以从所述数据抽取数据段(而不是名词短语)。

这些NP候选可以包含噪声(即不是层面的NP)。然而，可以规划评价的其他部分(比如概要数据(如赞成评价160和反对评价162))来提炼候选，因为这些其他部分可以更清楚地识别产品层面。尤其，在208处，可以获得概要数据。在210处，概要数据中的常用名词术语可以被探查作为特征，并用于训练分类器。例如，假设总共收集了N个常用名词术语，每个常用名词术语可以认为是一个样本。也就是，每个常用名词术语可以表示为只有一个维度的N维矢量，即具有值1而其他都为0。基于这种表示法，可以训练分类器。分类器可以是支持向量机(SVM)、朴素贝叶斯(Naive Bayes)和最大熵模型(MaximumEntropyModel)。在一个实施方式中，分类器是单类支持向量机(SVM)，这样将NP候选分类为层面或者不分类。

可以理解的是，在一些其他实施方式中，赞成和反对评价可以是不必要的。反而，可以提供一些其他数据(如文本，图形，表格等)，依赖于这些术语清楚地识别带有关联观点的产品层面。该数据可以指代一般意义上的“概要数据”，其中赞成和反对评价可以是概要数据的特定形式。该数据可以认为是概要数据，因为它概括了产品层面以及其上对应的评价。概要数据可以从200中获得的数据抽取。

在212处，可以使用经训练的分类器识别候选中的真正层面。可以理解的是，此处理可以不仅仅只是简单比较每个候选和概要数据中所识别的每个层面。反而，此处理可以使用机械学习来判断是否新的术语与包括在概要数据中的不同但对应的术语一样。

所获得的层面可以包含一些同义词术语，比如，如“耳机”和“头戴式耳机”。相应的，在214处，可以进一步执行同义词聚类以获取独特的层面。技术上，两个层面之间的距离可以通过余弦相似性测量。与所获得的层面相关的同义词术语可以从同义词字典(如http://thesaurus.com)中抽取，并作为用于聚类的特征。然后在216中收集所识别的结果层面。在一个实施方式中，可以通过带有显示屏的通用计算机或者带有显示屏的特别设计的硬件装置执行所述方法。相应的，在216处，可以将所识别的层面发送给显示屏以显示给人类消费者。

在一实施方式中，从与产品有关的数据识别产品层面包括从数据抽取一个或多个名词短语。

在一实施方式中，如果所抽取的名词短语与层面类别有关联的产品层面相一致，则将所抽取的名词短语分类为层面类别，所述层面类别关联于一个或多个不同的产品层面。在一实施方式中，术语“相一致”可以包括但不限于“匹配”。例如，即使产品层面的精确术语不包括在名词短语中，分类处理也可以识别所述名词短语为对应于特定的产品层面。例如，分类可以采用单类SVM执行。在一实施方式中，层面类别可以与多个(例如，所有)产品层面相关联。这样，所抽取的名词短语既可以分类也可以不分类，这取决于其是否为产品层面。因此，真正的产品层面可以从所抽取的名词短语识别。

在一不同的实施方式中，可以将所抽取的名词短语分类到多个层面类别中之一，每个层面类别关联于不同的产品层面。以该方式，所抽取的名词短语可以被识别为是否为所识别的产品层面。

在一实施方式中，可以将所抽取的多个不同的名词短语聚类在一起，其中所抽取的多个不同的名词短语中的每个包括对应的同义词术语。以该方式，与相同产品层面有关的不同名词短语可以被合并在一起。例如，各种名词短语可以包括术语“头戴式耳机”，而其他各种名词短语可以包括术语“耳机”。由于“头戴式耳机”和“耳机”涉及相同的产品层面，所以所有这些名词短语可以被合并在一起。在本实施方式中，“头戴式耳机”和“耳机”是对应的同义词术语。在一实施方式中，可以在上面提到的分类步骤之后执行同义词聚类的步骤。

层面层级的生成

为了建立层级，可以将新识别的层面递增地***初始层级内的适当位置。最优位置可以通过多标准优化方法找到。下面对本实施方式的进一步详细说明。

公式化

在一实施方式中，给出了从评价识别出的层面A＝{a₁...,a_k}，以及从领域知识中获得的初始层级H⁰(A⁰,R⁰)，使用多标准优化方法来生成层面(即修正)层级H*,该层级分配A中的所有层面，包括初始层级中不包括的那些，如A-A⁰。该方法递增地将新识别出的层面***初始层级内的适当位置。通过多标准找到最优位置。该标准应该保证每个层面将最可能被分配在所述层级内其父层面之下。

在引入标准之前，首先需要定义度量，命名语义距离d(a_x,a_y)，以确定层面a_x和a_y之间的父子关系。d(a_x,a_y)用公式表示为一些以下特征的加权和，

d(a_x，a_y)＝Σ_jω_jf_j(a_x，a_y) (3.1)

其中，ω_j是第j个特征函数f_j(·)的权值。特征函数f(·)的估计和d(a_x,a_y)的学习(即权值ω)将在后面描述。

此外，引入信息函数Info(H)以测量层级H的整个语义距离。Info(H)用公式表示为层级内所有层面对的语义距离之和，如下：

Info (H (A, R)) = Σ_{x < y; a_{x}, a_{y} &Element; A} d (a_{x}, a_{y}) - - - (3.2)

其中，小于号“<”意为层面a_x的指标小于a_y的指标。信息函数不重复计算层面对的距离。

对于每个***到层级内的新层面，其在层级结构内引入一个变量，这增加了整个层级的总语义距离。也就是说，信息函数Info(H)会增加，因而能够使用其来特征化层级结构。基于Info(H)，能够引入下面的三个标准为层面***找到最优位置：最小层级进化论、最小层级差异和最小语义不一致性。

层级进化设计成监控层级的结构进化。层级递增地管理更多层面，直至所有层面都被分配。将新的层面***当前层级H(i)中的各种位置引起不同的新层级。这导致总体语义距离(即，Info(H(i)))的不同增加。当层面被放置在层级中的优化位置时(即，作为其真正父层面的子层面)，Info(H(i))具有最少的增加。换句话说，将Info(H(i))的改变最小化等同于检索到***层面的最佳位置。因此，在新层级之中，优化的一个H(i+1)应该引起总体语义距离对H(i)的最少改变，如下，

{\hat{H}}^{(i + 1)} = \arg \min_{H^{(i + 1)}} ΔInfo (H^{(i + 1)} - H^{(i)}) - - - (3.3)

能够通过将Info(H)***公式(3.2)并且使用最小平方作为损失函数获得第一标准以测量信息改变，

{obj}_{1} = \arg \min_{H^{(i + 1)}} {(Σ_{x < y; a_{x}, a_{y} &Element; A^{i} \cup {a}} d (a_{x}, a_{y}) - Σ_{x < y; a_{x}, a_{y} &Element; A^{i}} d (a_{x}, a_{y}))}^{2} - - - (3.4)

此处，a指代用于***的新层面。

层级冲突用来测量结构进化的全局改变。良好的层级应该是在宏观上对初始层级产生最少改变的层级以便避免算法落入局部最小值，

{\hat{H}}^{(i + 1)} = \arg \min_{H^{(i + 1)}} ΔInfo (H^{(i + 1)} - H^{(i)}) / - (i + 1) - - (3.5)

通过替换公式(3.2)，第二标准能够获得为如下：

{obj}_{2} = \arg \min_{H^{(i + 1)}} \frac{1}{i + 1} {(Σ_{x < y; a_{x}, a_{y} &Element; A^{i} \cup {a}} d (a_{x}, a_{y}) - Σ_{x < y; a_{x}, a_{y} &Element; A^{0}} d (a_{x}, a_{y}))}^{2} - - - (3.6)

语义不一致能够被引入以定量经由层级所估计的语义距离与由特征函数(即公式(3.1))所计算出的语义距离之间的不一致。特征函数下面将更详细地描述。层级应该精确地反映层面间的语义距离。对于两个层面来说，由层级反映的它们的语义距离被计算为沿着它们之间的最短路径的所有相邻间隔距离之和，

d^{H} (a_{x}, a_{y}) = Σ_{p < q; (a_{p}, a_{q}) &Element; SP (a_{x}, a_{y})} d (a_{p}, a_{q}) - - - (3.7)

其中，SP(a_x，a_y)是层面a_x以及a_y经由公用祖先节点之间的最短路径，(a_p，a_q)代表了沿着路径的所有相邻节点。

然后获得第三标准以推导出优化层级，

{obj}_{3} = \arg \min_{H^{(i + 1)}} Σ_{x < y; a_{x}, a_{y} &Element; A_{i} \cup {a}} {(d^{H} (a_{x}, a_{y}) - d (a_{x}, a_{y}))}^{2} - - - (3.8)

其中，d(a_x，a_y)是由公式(3.1)中的特征函数所计算出的距离。

多标准优化-通过对上述标准求积分，多标准优化框架用公式表示为，

\begin{matrix} obj = \arg \min_{H^{(i + 1)}} (λ_{1} \cdot {obj}_{1} + λ_{2} \cdot {obj}_{2} + λ_{3} \cdot {obj}_{3}) \\ λ_{1} + λ_{2} + λ_{3} = 1; 0 \leq λ_{1}, λ_{2}, λ_{3} \leq 1 \end{matrix} - - - (3.9)

其中，λ₁、λ₂、λ₃是权衡参数，稍后将描述。

所有上述标准可以是凸的，因此，可以的是，能够用多标准优化通过对所有标准线性积分来查找优化方案。

为了总结以上描述的实施方式，层级生成开始于初始层级，将层面一个接一个地***其中，直至所有层面被分配。对于每个新层面，用公式(3.9)计算目标函数以查找用于***的优化位置。应注意的是，***次序会影响结果。为了避免这种影响，公式(3.9)中具有最少目标值的层面被选择为用于每个***。基于产生的层级，然后可以将数据(即消费者评价)组织到它们在层级中的对应层面节点。然后可以删去(即，清除)层级中不具有评价的节点。

以下说明介绍了估计特征函数(a_x，a_y)和语义距离d(a_x，a_y)。

在一实施方式中，对于所识别出的产品层面确定层级中的优化位置包括：将所识别出的产品层面***初始层级中的多个样本位置中的每个；计算与每个样本位置相关的定位分数，定位分数是样本位置的适当性测度；以及基于与每个样本位置相关的定位分数来确定优化位置。在一实施方式中，优化位置最小化了定位分数。

在一实施方式中，定位分数是层级语义距离的改变测度，层级语义距离是用于层级中的每个节点对的层面语义距离之和，每个层面语义距离是节点对代表的两个产品层面的意思之间的类似性测度。例如，定位分数可以是层级进化分数(例如公式3.4)。

在一实施方式中，定位分数是初始层级的结构的改变测度。可以采用术语“结构”包括层级的节点以及这些节点的相互连接。可以采用“相互连接”来指代层级中的不同节点对之间的连接。例如，定位分数可以是层级冲突分数(例如公式3.6)。

在一实施方式中，定位分数是与初始层级中的节点对相关的第一和第二层面语义距离之间的改变测度，第一和第二层面语义距离是节点对代表的两个产品层面的意思之间的类似性测度，基于层级来计算第一层面语义距离，即计算经由层级连接节点对的路径的距离，基于与产品有关的辅助数据来计算第二语义距离。在一实施方式中，辅助数据可以是与产品有关的在层级的公式中尚未使用的数据，例如不是图3的数据104。例如，定位分数可以是语义不一致分数(例如公式3.8)。

根据上述，定位分数可以取决于一个或多个不同的标准(例如公式3.4、3.6和3.8)。优化定位分数可以通过计算目标函数(例如公式3.9)来计算，该目标函数旨在同时优化每个标准。以该方式，可以确定出优化了每个标准(例如最小化了定位分数)的优化定位分数。因此，可以执行多标准优化。

用于语义距离估计的语言特征

在一实施方式中，给定两个层面a_x以及a_y，将特征定义为函数f(a_x，a_y)，其生成数值分数或者分数向量。然后探查多个特征，多个特征包括：语境(Contextual)、共生(Co-occurrence)、语法(Syntactic)、模式(Pattern)以及词汇(Lexical)特征。这些特征是基于从网络收集的辅助文件(或者数据)而生成的。具体地，每个层面和层面对用作互联网检索引擎(例如Google以及***)的查询，为每查询收集返回的顶部一百个(100)文件。每个文件被分成句子。基于这些文件以及句子，如下来生成特征。

语境特征。术语的意思如果它们出现在类似内容中则趋向于类似。因而，采集以下语境特征以测量层面之间的关系。在一实施方式中，定义了两种特征，包括全局语境特征及本地语境特征。尤其，对于每个层面，收集所管理的文件并且用Dirichlet平滑方法将他们处理为内容以建立一元语言模型。给定两个层面a_x以及a_y，它们的语言模型之间的Kullback-Leibler(KL)散度被计算作为它们的全局-语境特征。类似地，收集每个层面周围的左边两个以及右边两个单词，将他们用作内容以建立一元语言模型。两个层面a_x以及a_y的语言模型之间的KL散度定义为本地语境特征。

共生特征。共生在测量术语间的关系方面是有效的。在一实施方式中，通过点互信息(PMI)计算两个层面a_x以及a_y的共生：

PMI(a_x，a_y)＝log(Count(a_x，a_y)/Count(a_x)·Count(a_y))，

其中，Count(·)代表包含层面的文件或者句子的数量，或者代表对于层面来说(上述提到的互联网检索结果中)文件查询结果的数量。基于Count(·)的不同定义，能够分别定义这些特征：文件PMI、句子PMI以及Google PMI。

语法特征。使用这些特征来测量层面关于它们的相邻语义角色的重叠。在一实施方式中，收集包含层面a_x以及a_y二者的句子，以及例如使用斯坦福解析器(Stanford Parser)将该句子解析为语法树。对于每个句子，计算层面a_x以及a_y之间在语法树中的最短路径的长度。采用平均长度作为a_x以及a_y之间的语法路径。因此，对于每个层面，解析其所管理的句子，以及从句子解析树收集其修饰词术语。修饰词术语被定义为在层面左侧的形容词以及名词术语。选择出与层面分享相同父节点的修饰词术语。将层面a_x以及a_y的两个修饰词组之间的重叠计算作为修饰词重叠特征。此外，为每个层面选择所管理的句子，以及例如使用ASSERT解析器对句子执行语义角色标记。从标记句子收集主题角色术语作为主题组。然后计算用于层面a_x以及a_y的两个主题组之间的重叠，作为主题重叠特征。例如，层面“照相机”被处理作为评价“我的妻子很喜欢照相机”的宾语。而“透镜”是“我的妻子很喜欢透镜”的宾语。这两个层面具有相同的主题“妻子”，该主题用来计算主题重叠特征。类似地，对于其他语义角色(即宾语以及动词)，使用对应程序来定义宾语重叠以及动词重叠的特征。

关系模式特征。在一实施方式中，可以使用一组n关系模式，其中，每个模式指示两个层面之间的类型关系。例如，关系可以是上位词关系或者一些其他语义关系。在一实施方式中，使用46个关系模式，包括6个模式指示两个层面的上位词关系，以及40个模式测量两个层面的包含(part-of)关系。这些模式特征是不对称的，它们考虑了层面之间的父子关系。但是，应该理解的是，在一些其他实施方式中，可以使用不同的一组n关系模式。在任何情形下，基于这些模式，可以获得用于层面a_x以及a_y的n维分数向量。如果两个层面匹配一模式则分数可以是1，反之可以是0。

词汇特征。单词长度影响单词的抽象性。例如，通用单词(例如，父(parent))通常短于具体单词(例如，子(child))。层面a_x以及a_y之间的单词长度差被计算作为长度差特征。在一实施方式中，将一查询“定义：层面”发送至互联网检索引擎(例如，Google)，并且收集每个层面(a_x/a_y)的定义。两个层面a_x以及a_y的定义之间的单词重叠被计数作为定义重叠特征。该特征测量了用于两个层面a_x以及a_y的定义的类似性。

语义距离的估计

如前述的，在一实施方式中，语义距离d(a_x，a_y)可以用公式表示为Σ_jω_jf_j(a_x，a_y)，其中，ω指代权重，f(a_x，a_y)是特征函数。为了学习权重ω，能够采用初始层级作为训练数据。通过沿着它们之间的最短路径对边缘的所有距离求和，可以计算出两个层面a_x以及a_y之间的地面真正距离即d^G(a_x，a_y)，其中，每个边缘的距离假定为1。然后，通过求解以下岭回归优化问题来估计优化权重，

\arg \min_{{ω_{j}}_{1}^{m}} Σ_{x < y; a_{x}, a_{y} &Element; A^{0}} {(d^{G} (a_{x}, a_{y}) - Σ_{j = 1}^{m} ω_{j} f_{j} (a_{x}, a_{y}))}^{2} + η \cdot Σ_{j = 1}^{m} {ω_{j}}^{2} - - - (3.10)

其中，m代表语言特征的尺寸，η是权衡参数。

公式(3.10)能够改写为矩阵形式：

\underset{w}{\arg \min} {| | d - f^{T} w | |}^{2} + η \cdot {| | w | |}^{2} - - - (3.11)

优化方案被推导为，

w_{0}^{*} = {(f^{T} f + η \cdot I)}^{- 1} (f^{T} d) - - - (3.12)

其中，w₀ ^*是优化权重向量，d指代地面真正距离的向量，f代表特征函数向量，I是单位矩阵。

当能够获得足够训练数据(即层面对的距离)时，能够很好地执行上述学习算法。但是，初始层级可能是很粗略的，因而无法提供用于训练的足够信息。另一方面，外部语言资源(例如，图7的开放目录专案(ODP)以及图8的WordNet)可以提供大量人工制作的层级。这些资源因此被规划以辅助语义距离学习。距离度量w₀是通过公式(3.12)从外部语言资源中的父子对学习到的。因为w₀可能偏离外部语言资源的特性，所以在我们的任务中直接使用w₀可能不能很好地执行。可替换地，w₀能够用作先验知识以帮助从初始层级学习优化距离度量w。学习问题用公式表示如下，

\underset{w}{\arg \min} {| | d - f^{T} w | |}^{2} + η \cdot {| | w | |}^{2} + - γ \cdot {| | w - w_{0} | |}^{2} - - (3.13)

其中，d指代初始层级中的地面真正距离，η以及γ是权衡参数。

w的优化方案层面能够获得为

w^*＝(f^Tf+(η+γ)·I)^-1(f^Td+γ·w₀) (3.14)

结果，根据公式(3.1)可以计算出语义距离d(a_x，a_y)。

对产品层面的情绪分类

在生成层级以组织了所有新识别出的层面和数据(即消费者评价)之后，可以执行情绪分类以确定对对应层面的观点以及获得最终的层级组织。在图9的流程图中示出了根据实施方式的情绪分类。

如以上提到的，概要数据(例如，赞成以及反对评价)明确地归类对层面的正、负面观点。这些评价是有价值的训练样本以教导情绪分类器。情绪分类器因此基于概要数据被训练，采用分类器来确定在自由文本评价154中对层面的观点。

在250处，如上提出的那样，获得消费者评价。应该理解的是，在该实施方式中，消费者评价代表了与特定产品相关的数据。数据可以从各种互联网网站获得。在252处，从250中获得的数据中抽取数据段。例如，从250获得的每个消费者评价的自由文本评价部分154可以被拆成句子。在254处，可以解析每个数据段(例如句子)，例如使用斯坦福解析器。

在256处，基于情绪词典抽取概要数据中的情绪术语(例如赞成以及反对评价)。在一实施方式中，情绪词典是以下中用的一个：T.Wilson、J.Wiebe和P.Hoffmann；识别短语级别的情绪分析中的语境极性；关于人类语言技术和自然语言处理中的实证方法的会议(HLT/EMNLP，2005)。这些情绪术语用作特征，并且将每个评价表示为特征向量。然后从概要数据(例如赞成评价160(即正样本)和反对评价162(即负样本))能够教导情绪分类器。分类器能够是SVM、贝叶斯分类算法以及最大熵模型。

在一实施方式中，基于这样的概要数据来训练SVM分类器，该概要数据明确地提供了对应具体产品层面的观点标记(例如正/负)。收集数据中的情绪术语作为特征，用布尔权重将每个数据段表示在特征向量中。

在258处，给定可以覆盖多个层面的自由文本评价154，定位出修饰对应层面的观点性表达。例如，在评价“诺基亚N95的电池工作良好”中为层面“电池”定位出表达“良好”。通常，如果观点性表达包含情绪词典中的至少一个情绪术语，并且是与254确定的解析树中的层面在特定内容距离(例如是五(5))内最靠近的一个，那么将观点性表达关联于层面。

在260处，然后规划所训练的情绪分类器以确定观点性表达的观点，即对层面的观点。然后在262处，收集产品层面情绪。在一实施方式中，可以通过带显示屏的通用计算机或者具有显示屏的专门设计的硬件装置来执行该方法。因此，在262处，可以将层面情绪发送至显示屏以显示给人类用户。以该方式，能够从与产品有关的数据获得对所识别出的产品层面的观点。

在一实施方式中，用于所识别出的产品层面的层面情绪是基于与产品有关的数据来确定的。层面情绪可以认为是对产品层面的观点(例如好的或坏的)。然后将层面情绪关联于修正(即最终)层级中所识别出的产品层面。以该方式，可以将层级中提到的对产品层面的情绪或者观点关联于层级中的层面。因此，层级可以不仅包括产品的层面，而且包括对每个层面的观点。因此，能够使用层级来获得关于产品的信息观点或结论。

在一实施方式中，以下列方式确定层面情绪。从数据中抽取一个或多个层面观点(例如数据段)。所述层面观点或者每个层面观点识别出所识别出的产品层面以及对该层面的对应观点。或者然后基于其对应观点(例如使用SVM)将每个层面观点分类为多个观点类别之一。每个观点类别关联不同的观点。此外，基于多个观点类别中哪一个包含最多层面观点确定用于所识别出的产品层面的层面情绪。例如，如果关于产品层面的大多数观点是负面的仅有少数正面观点，则对该层面的总体观点(即情绪)是负面的。

在一实施方式中，多个观点类别包括关联于正面观点(例如好、很好、非常好、完美)的正面观点类别和关联于负面观点(例如，不好、很差、糟糕、失望)的负面观点类别。

估计

以下估计了所提出框架在产品层面识别、层面层级生成以及对层面的情绪分类方面的有效性。在以下估计中，‘我们的方法’应理解为指的是‘一实施方式’。

数据设定为及实验设定

图10示出了产品评价集的细节的表格。数据组包含对11个流行产品在四个领域的消费者评价。存在70,359条评价总数，每个产品平均有约6,396条评价。这些评价抓取自多个主流论坛网站，包括cnet.com、viewpoints.com、reevoo.com、gsmarena.com和pricegrabber.com。评价发布于2009年6月至2011年7月之间。邀请八位注释者注释这些评价的地面实况(ground truth)。让他们注释每个评价中的产品层面，还有层面上表达的标记消费者观点。每个评价由至少两位注释者标记。对于所有产品，在Kappa统计方面，平均预测一致率是87％。此外，让三位参与者构建黄金标准层级。对于每个产品，向他们提供了初始层级和评价中所评论的层面。需要他们基于初始层级建立可分配所有层面的层级。在Kappa统计方面，层面之间的父子关系的平均预测一致率是73％。参与者间的冲突通过他们的讨论来解决。对于语义距离学习，分别从WordNet和ODP收集50个层级，作为外部语言资源。

图11示出了这些层级的细节的表格。具体地，利用WordNet中的上位词以及部分词关系来构建50个层级。这种关系指示构思间的父子关系。仅使用WordNet中的一个单词意思以避免单词意思含糊。此外，在ODP XML数据库中解析提纲以获得关系，并使用提纲来构建另外的50个层级。

采用F₁-测量作为用于所有估计的估计度量。这是查准率以及查全率的组合，因为F₁-测量＝2*查准率*查全率/(查准率+查全率)。对于层面层级生成的估计，查准率定义为返回对的总数中正确返回的父子对的比例，查全率定义为黄金标准对的总数中正确返回的父子对的比例。整个实验中，参数设定如下：λ₁＝0.4，λ₂＝0.3，λ₃＝0.3，η＝0.4和γ＝0.6。

对自由文本评价的产品层面识别的估计

在该实验中，实施用于层面识别的以下方法：

·Hu(胡)等人提出的方法：M.Hu及B.Liu；挖掘以及总结顾客评价；第十届ACM SIGKDD知识发现以及数据挖掘国际会议(SIGKDD，2004年)，其中抽取名词术语作为层面候选，并且通过从关联规则挖掘学习到的规则来识别层面。

·Wu(吴)等人提出的方法：Y.Wu、Q.Zhang、X.Huang及L.Wu；用于观点挖掘的短语依赖解析；技术语言协会关于计算语言的第四十七届年会(ACL，2009)，其中从依赖解析树抽取名词短语作为层面候选，并且通过对产品评价建立的语言模型来识别层面。

图12示出了所有11个产品在F₁-测量方面的性能比较。通过使用T-测试来测试各结果的统计显著性以作为估计度量，其中，测试中的显著性级别设定为0.05，即p值<0.05。从这些结果能够看出，我们的方法在所有11个产品上获得了最佳性能。其在平均F₁-测量方面显著优于胡及吴的方法分别达8.84％、4.77％。这意味着赞成以及反对评价在辅助进行自由文本评价的层面识别时的有效性。因此，通过采用赞成以及反对评价，我们的方法能够提高层面识别的性能。

生成层面层级的估计

将我们的方法比较于现有技术方法，然后估计我们的方法中元素的有效性。

与现有技术方法比较

用于层级生成的本体学习中的四个传统方法用来进行比较。

·基于模式的方法描述于：M.-A.Hearst；Automatic Acquisition ofHyponyms from Large Text Corpora(从大文本语料库自动获取下位词)；计算语言第十四届国际会议(COLING，1992)，其中探查预定模式来识别父子关系并且对应地形成层级。

·基于聚类的方法描述于：B.Shi and K.Chang；生成用于情绪分析的构思层级；2008年关于***、人以及控制论的IEEE国际会议，其中通过层级聚类来建立层级。

·Snow等人提出的方法，描述于：R.Snow和D.Jurafsky；由各种证据进行的语义分类演进；技术语言协会关于计算语言的第四十四届年会(ACL，2006)，其中基于概率模型生成层级。

·Yang等人提出的方法，描述于：H.Yang及J.Callan；用于自动分类演进的基于度量的框架；技术语言协会关于计算语言的第四十七届年会(ACL，2009)，其中定义了用于层级生成的多个度量。

因为我们的方法和Yang的方法能够利用初始层级来辅助进行层级生成，所以它们的性能分别在具有或者不具有初始层级时进行估计。基于公平比较的原因，Snow、Yang及我们的方法使用相同的语言特征。

如图13所示，不具有初始层级，在F₁-测量方面，我们的方法优于基于模式的方法、基于聚类的方法、Snow及Yang的方法的显著绝对增益分别达17.9％、19.8％、2.9％和6.1％。如之前的，使用T-测试来测试统计显著性的结果，p-值<0.05。通过采用初始层级，我们的方法显著地提高了性能。相比于基于模式的方法、基于聚类的方法及Snow的方法时，我们的方法提高的平均性能达显著绝对增益分别达49.4％、51.2％和34.3％。相比于Yang的具有初始层级的方法，我们的方法在平均F₁-测量方面实现的显著绝对增益为4.7％。

该结果示出了基于模式以及基于聚类的方法执行得较差。具体地，基于模式的方法实现低查全率；而基于聚类的方法获得低查准率以及低查全率。可能原因在于，基于模式的方法尤其当模式被预定时会存在低的模式覆盖的问题，无法包括评价中的所有评价。相应地，基于聚类的方法受限于使用仅生成二进制树的等分聚类机制。此外，该结果指示出，使用异构特征的方法(即Snow的方法、Yang的方法及我们的方法)可实现高Fr测量。我们能够推测出的是，通过积分多个特征能够增强层面之间的父子关系的区分能力。结果还指示出，具有初始层级的方法(即Yang的方法及我们的方法)能够显著提高性能。这种结果还让我们相信的是，初始层级对于层级生成是有价值的。最终，该结果示出了，当都利用初始层级时，我们的方法优于Yang的方法。可能原因在于，我们的方法通过采用外部语言资源以辅助距离学习能够推导出可靠的层面间的语义距离，从而改善性能。

初始层级的有效性的估计

以下示出了通过使用不同比例的初始层级，所提出的方法仍能够生成满意的层级。探查不同比例的初始层级，包括自上至下、自左至右收集的0％、20％、40％、60％、80％和100％of层面对。如图14所示，当使用较大比例的初始层级时性能可增加。因而，该教导：领域知识在层面层级生成中是有效的。如前述的，使用T-测试来测试统计显著性的结果，p-值<0.05。

优化标准的有效性的估计

执行留一(leave-one-out)研究来估计每个优化标准的有效性。尤其，将公式(3.9)中的权衡参数(λ₁，λ₂，λ₃)之一设定为零，将其对剩余参数的权重按比例分配。如图15所示的，清除任何优化标准将恶化对大部分产品的性能。值得注意的是，清除第三优化标准即最小语义不一致将稍微增加对两个产品(iPad触屏以及索尼MP3)的性能。原因可能在于，三个权衡参数的值(以上凭经验地设定)并不适合于这些两个产品。如前述的，使用T-测试来测试统计显著性的结果，p-值<0.05。

语义距离学习的估计

该部分涉及估计语言特征及外部语言资源对于语义距离学***均来说，组合后的特征在平均F₁-测量方面优于语境特征、共生特征、语法特征、模式特征以及词汇特征分别达13.1％、10.0％、13.6％、9.7％和24.3％。这些结果指示出，异构特征将是互补的，能够辅助于更精确地推导出语义距离。如前述的，使用T-测试来测试统计显著性的结果，p-值<0.05。

接下来，检查使用外部语言资源(例如WordNet以及ODP)对语义距离学***均F₁-测量方面显著优于不具有外部资源的方法达4.2％。这教导了外部语言资源能够帮助我们获得精确的语义距离，这提高了层面层级生成的性能。如前述的，使用T-测试来测试统计显著性的结果，p-值<0.05。

层面级别情绪分类的估计

在该实验中，比较以下情绪分类方法：

·无监督方法。这是基于字典的方法。通过参考情绪词典SentiWordNet来确定每个层面上的观点，该词典来自B.Ohana和B.Tierney；使用SentiwordNet进行评价的情绪分类；2009年第九届IT&T会议。该词典包含正/负单词的列表。如果与层面关联的观点性表达包含正(或者负)列表中的大多数单词，则该观点性表达被分类为正(或者负)。

·三个监督方法。采用以下三个监督方法：Pang等人提出的方法：B.Pang、l.Lee及S.Vaithyanathan；赞许(Thumbs up)？使用机器学***滑实施，ME用L-BFGS参数估计实施。

图18示出了实验结果。可见，三个监督方法比无监督方法可更好地执行。如前述的，使用T-测试来测试统计显著性的结果，p-值<0.05。它们实现对所有11个产品的性能改善。尤其，SVM在9个产品上最佳地执行，NB在剩余两个产品上获得了最佳的性能。在平均性能方面，SVM相比于NB以及ME实现了稍微的提高。这些结果与之前来自B.Pang、l.Lee及S.Vaithyanathan；赞许(Thumbs up)？使用机器学习技术的情绪分类；自然语言处理的经验方法的会议(EMNLP，2002)的研究一致。

通过层级增强的子任务

根据各种实施方式，以下示出了所生成(即修正)的层级能够强化对层面的产品层面识别以及情绪分类的子任务。

具有层级的产品层面识别

如前述的，在一实施方式中，产品层面识别旨在查明在与产品有关的数据(例如消费者评价)中所评论的产品层面。通常，其性能受到三个主要方面的挑战。第一，层面通常被识别为评价中的名词短语。但是，名词短语将包含不是层面的噪声。例如，在评价“我妻子和她的朋友都推荐诺基亚N9”中，名词短语“妻子”和“朋友”不是层面。第二，一些“含蓄”层面不明确地出现在评价中但实际上在评价中被评论。例如，评价“iPhone4很贵”暗示着在层面“价格”上的反对观点，但“价格”没有出现在评价中。通过依赖于层面术语出现的方法无法有效地识别出这些含蓄层面。第三，不考虑层面之间的父子关系时，无法有效识别出一些层面。例如，评价“照相机的电池持续很长”传达了在层面“电池”上的正面观点，而名词术语“照相机”用作修饰术语。需要父子关系来从评价中精确地识别出层面“电池”。

对于这些挑战的一个简单方案能够采用评价层级。如以上提到的，层级将产品层面组织为节点，遵循它们的父子关系。对于每个层面，存储对该层面的评价以及对应观点。这种层级能够利于产品层面识别。具体地，通过使用层级能够过滤噪声名词短语。对于含蓄层面，它们通常被一些特有的情绪术语修饰。例如，层面“尺寸”通常由情绪术语诸如“大”修饰，很少由术语诸如“贵”来修饰。换句话说，层面以及情绪术语之间具有一些关联。从而，通过发现情绪术语和层级中的层面之间的底层关联就能够推断出含蓄层面。而且，通过遵循层级中的父子关系，能够直接获取真正层面。这些观察导致使用所生成(即修正)的层级来强化产品层面识别任务。

在一实施方式中，为了同时识别明确/含蓄层面，通过规划生成层级来采用层级分类技术。这种技术考虑了层面以及层级中的层面之间的父子关系。而且，其通过多个分类器发现了层面以及情绪术语之间的关联。图19图示了根据实施方式的方法的流程图。以下详细描述图19。

在300处，获得与特定产品相关的数据。例如，数据可以包括产品的消费者评价。这些可以例如从因特网获得。如下面更详细讨论的，数据可以包括第一和第二数据部分。在302处，从300中获得的数据抽取数据段。例如，300中获得的每个消费者评价的自由文本评价部分154可以拆成句子。

在一实施方式中，数据部分由多个不同的消费者评价组成，而数据段由来自单个消费者评价的句子组成。因此，在一实施方式中，数据部分可以大于数据段。

在304处，根据上述说明获得所生成的层级。可以使用与产品有关的不同数据来获得该层级。例如，可以使用一组训练数据(即第二数据部分)来生成层级，而可以在上述数据段的抽取中使用一组测试数据(即第一数据部分)。第一和第二数据组都可以包括产品的评价。

在306处，将302中所抽取出的数据段(例如句子)分层级地分类为304中所获得的层级的适当层面节点，即为数据段识别层面。例如，分类可以全面地从上至下或从根到叶地检索层级中的路径。尤其，检索可以开始于根节点，停止于叶节点或者具体节点，具体节点处，相关性分数低于学习(即预定)阈值。每个节点的相关性分数可以通过具有线性核函数的SVM分类器实施来确定。多个SVM分类器可以在层级上被训练，例如一个分类器用于层级中的每个节点。存储在节点以及其子节点中的评价可以被用作分类器的训练样本。可以采用名词术语以及情绪词典中的情绪术语的特征。在308处，层级分类的结果将识别消费者评价中的产品层面。

在一实施方式中，可以通过带显示屏的通用计算机或者具有显示屏的专门设计的硬件装置来执行该方法。因此，在308处，可以将所识别出的层面发送至显示屏以显示给人类用户。

在以上描述的技术中，可以通过感知纠正学习策略为每个独特的分类器(即每个节点的分类器)给出预定阈值。更具体来说，对于层面节点i上的每个训练样本r，策略计算其预测标记为相关性分数为p_i，r。当预测标记与黄金标准标记g_i，r不一致或者相关性分数p_i，r小于当前阈值θ时，阈值被以如下方式更新，

θ_{i}^{t + 1} = θ_{i}^{t} + ϵ ({\hat{y}}_{i, r} - g_{i, r}) - - - (3.15)

其中，ε是纠正常数。例如，该常数可以凭经验地设定为0.001。

各种实施方式提供了用于基于与产品有关的数据来识别产品层面的方法。该方法包括以下。从数据的第一部分识别数据段。基于数据的第二部分如上所述生成修正层级。然后将数据段分类为多个层面类别之一以识别数据段相关于哪个产品层面。将每个层面类别关联于与修正层级中的不同节点关联(即由其代表)的产品层面。例如，层级可以包括五个节点，每个节点代表与产品相关的五个层面中不同的一个层面。在该情况下，将存在五个层面类别，五个层面中的每个层面具有不同的层面类别。

在一实施方式中，分类步骤包括确定用于每个层面类别的相关性分数。相关性分数指示该数据段如何类似于与层面类别关联的产品层面。在一实施方式中，识别数据段相关于哪个产品层面包括确定与低于预定阈值的相关性分数关联的层面类别。以该方式，层面的分类可以不仅仅是公知层面以及所抽取出的术语之间的简单比较。换言之，***可学习如何识别层面，即使其被改写新的形式。

对以上描述的产品评价数据组执行估计。采用五折交叉验证，一折用于测试，其他折用于生成层级。使用F_1-测量作为估计度量。我们的方法(即我们的方案)比较于以下两个方法：

·以上提出的基于名称的方法(名词过滤器)。其抽取频率高的名词短语作为层面候选，然后通过规划对赞成以及反对评价所训练的一类SVM来提炼候选以获得真正层面。

·利用单层分类技术(HierFlat)的基于层级的方法。该方法规划层级以识别产品层面。不同于我们的方法，该方法将层级中的每个层面视为单个类目而不考虑层面之间的父子关系。给定测试评价，该方法通过使用多类SVM分类器将其分类为层面类目来识别出其产品层面。将存储在层面节点中的评价用作训练样本，名词短语以及情绪术语作为特征。

如图20所示，提出的方法在平均F1测量方面显著优于名词过滤器以及Hier单层的方法分别达4.4％和2.9％。这些结果显示，层级有助于过滤噪声以获得精确层面。而且，层级分类技术通过规划层面之间的父子关系可有效识别真正层面。使用T-测试来测试统计显著性的结果，p-值<0.05。

而且，针对含蓄层面识别来估计我们的方法的有效性。使用产品评价数据组中的29,657条含蓄层面评价。将我们的方法比较于Su等人提出的方法：Q.Su、X.Xu、H.Guo、X.Wu、X.Zhang、B.Swen及Z.Su；中国网络观点挖掘中的隐含情绪关联；第十七届全局信息网国际会议(WWW，2008)，其中基于相互聚类来识别含蓄层面。如图21所示，我们的方法在平均F1测量方面显著优于Su的方法达10.9％。这种结果显示出，层级能够通过采用情绪术语和层面之间的深层关联来帮助识别含蓄层面。如前述的，使用T-测试来测试统计显著性的结果，p-值<0.05。

使用层级对层面进行情绪分类，

对层面内容的情绪分类是上下文敏感的。例如，取决于层面的上下文，相同观点性表达将传达不同的观点。例如，观点性表达“长”揭示出在评价“照相机的电池长”中对层面“电池”的正面观点，而在评价“照相机的启动时间长”中是对层面“启动时间”的反面观点。为了精确地确定对层面的观点，使用上下文敏感的情绪分类器。尽管所生成的层级示出为有助于识别产品层面(即上下文)，但是也能够使用其直接训练上下文敏感的分类器。在一实施方式中，层级因而能够被规划以支持层面级别情绪分类。

在一实施方式中，想法是通过为每个评价识别产品层面来捕获上下文，并且通过考虑上下文为每个层面训练情绪分类器。这种分类器是上下文敏感的，这将有助于精确地确定对层面的观点。尤其，多个情绪分类器被训练；一个分类器用于层级中的每个独特层面节点。在一实施方式中，每个分类器是SVM。探查存储在节点及其子节点中的评价作为训练样本。采用情绪词典中提供的情绪术语作为特征。

图22是根据实施方式的使用层级进行层面的情绪分类的方法的流程图。

在350处，获得与特定产品相关的数据。例如，数据可以包括产品的测试消费者评价。这些可以例如从因特网获得如。如下面更详细提到的，数据可以包括第一和第二数据部分。在352处，从350中所获得的数据中抽取数据段。例如，350中所获得的每个消费者评价的自由文本评价部分154可以拆成句子。

在354处，根据上述说明来获得所生成的层级。该层级可以使用与产品有关的不同数据来获得。例如，可以使用一组训练数据(即第二数据部分)来生成层级，而一组测试数据(即第一数据部分)可以用在上述数据段的抽取中。第一和第二数据组都可以包括产品的评价。在356处，如上述参考图19，使用354中所获得的层级来识别产品层面。而且，如上述参考图9的那样，确定用于所识别出的产品层面的观点性表达。

在358处，选择对对应层面节点所训练的特定情绪分类器来确定观点性表达中的观点，即对层面的观点。情绪分类器如上述参考图9描述的。然后在360处，收集对各种层面的观点。在一实施方式中，可以通过带显示屏的通用计算机或者具有显示屏的专门设计的硬件装置来执行该方法。因此，在360处，可以将观点发送至显示屏以显示给人类用户。

各种实施方式提供了用于从与产品有关的数据确定用于产品层面的层面情绪的方法。该方法包括以下。从数据的第一部分识别数据段。基于数据的第二部分生成修正层级，如上述的。例如，可以使用一组训练数据(即第二数据部分)来生成层级，而可以从一组测试数据(即第一数据部分)识别出数据段。第一和第二数据部分都可以包括产品的评价。然后将数据段分类为多个层面类别之一。将每个层面类别关联于与修正层级中的不同节点关联的产品层面。以该方式，能够识别出数据段相关于哪个产品层面。然后从数据段中抽取出对应于数据段相关的产品层面的观点。然后将所抽取出的观点分类为多个观点类别之一。每个观点类别关联不同的观点，层面情绪是与一个观点类别关联的观点。以该方式，能够识别出产品层面，然后识别出对这些产品层面的观点。而且，基于对给定产品层面的重写观点(例如正面的或者负面的)，能够确定出对层面的总体层面情绪(即观点)。

使用以上描述的产品评价数据组来估计所提出的方法。采用五折交叉验证，一折用于测试，其他折用于生成层级。利用F1-测量作为估计度量。所提出的方法比较于训练SVM情绪分类器但不考虑层面上下文的一个方法。用线性核函数来实施SVM。

如图23图示的，我们的方法(即我们的方案)在平均F1测量方面显著优于传统SVM方法达1.6％。这些结果教导的是，所生成的层级能够有助于训练上下文敏感的情绪分类器，这可有效确定出对层面的观点。

总结

根据上述描述的实施方式，已经描述了域辅助方法，其生成用于产品的消费者评价的层级组织。通过使用多标准优化框架同时采用领域知识以及消费者评价来生成层级。层级将产品层面组织为节点，节点遵循它们的父子关系。对于每个层面，存储在该层面上的评价以及对应观点。利用层级，用户能够容易地抓取消费者评价的概观，以及通过层级的导航来寻找对任何具体层面的消费者评价以及观点。有利地、层级能够提高信息传播以及可访问性。

在四个领域对11个不同的产品实施估计。数据组抓取自多个主流论坛网站，诸如CNet.com，Viewpoints.com，Reevoo.com以及Pricegrabber.com等。实验结果证明了我们的方法的有效性。此外，层级已经示出为可强化在层面上的产品层面识别以及情绪分类的子任务。因为层级组织了所有产品层面以及这些层面间的父子关系，所以层级能够用以帮助识别(明确/含蓄)产品层面。尽管通过参考层级能够识别出明确层面，但是情绪术语和层级中的层面之间的关联能够推导出含蓄层面。情绪术语可以发现自对应层面上的评价。而且，通过将上下文敏感的情绪分类器相对于层面进行训练，其利于层面级别情绪分类。执行大量实验来估计依靠层级的这两个子任务的功效，实现了显著的性能改善。

产品层面分级框架

各种实施方式涉及组织与产品相关的数据。尤其，实施方式涉及用于对产品层面分级的方法，用于确定产品情绪的方法，用于生成产品评价概要的方法，以及对应装置以及计算机可读介质。

用于识别重要层面的方法可以是将消费者评价中频繁论及的层面视为重要层面。但是，频繁层面上的消费者观点可能并不影响它们对产品的总体观点，因而将不会影响它们的购买决定。例如，大多数消费者频繁批评iPhone4的“信号连接”不好，但是他们仍会对iPhone4给予高的总体评估。相反，一些层面诸如“设计”以及“速度”可能并不频繁被评论，但通常比“信号连接”更重要。实际上，仅基于频率的方案层面可能无法识别出真正重要的层面。

以下实施方式提出了一种方法，称为层面分级，以从数据中自动识别处重要的产品层面。在该实施方式中，与产品有关的数据包括消费者评价。在一实施方式中，与例子产品(iPhone 3GS)相关的层面可以图示于图24。

在一实施方式中，假设产品的重要层面具有以下特性：(a)它们在数据中被频繁论及；以及(b)对这些层面的观点极大地影响他们对产品的总体观点。还假设的是，基于对产品的多个层面的具体观点的加权集结来生成对产品的总体观点，其中，权重本质上测量了层面的重要程度。此外，可以使用多元高斯分布来对重要权重的不确定性建立模型。可以设计概率回归算法以通过规划层面频率和总体观点及具体观点之间的一致性来推导出重要权重。根据重要权重分数，能够识别出重要的产品层面。

图25图示了根据实施方式的用于识别产品层面的方法的示范框架。以下详细描述该框架。

在400处，获得与特定产品相关的数据。例如，数据可以包括测试产品的消费者评价。这些可以例如从因特网获得。在402处，使用所获得的数据来识别与产品相关的产品层面。在一实施方式中，如上述参考图6那样执行该处理。在404处，使用所获得的数据来识别与所识别出的产品层面相关的观点。在一实施方式中，如上述参考图9那样执行该处理。

在一实施方式中，与产品有关的数据可以呈层级的形式，诸如，根据图3的方法所获得的层级。在该情况下，可以基于与产品有关的数据(即消费者评价)如以上提到的那样已经生成层级。在该情况下，层级能够看做是提供了与产品有关的数据，即使与400的数据相比为更有组织的形式。在406处，使用层面分级算法以通过同时考虑层面频率和每个层面上的观点对产品上的总体观点的影响(即影响测量)来识别重要的层面。产品上的总体观点可以基于对多个产品层面的具体观点的加权集结来生成，其中，权重测量了这些层面的重要(或者影响)程度。可以设计概率回归算法通过并入层面频率和总体以及具体观点之间的关联来推导出重要权重。在408处，收集所分级的层面。在一实施方式中，可以通过带显示屏的通用计算机或者具有显示屏的专门设计的硬件装置来执行该方法。因此，在408处，可以将分级层面发送至显示屏以显示给人类用户。

各种实施方式提供了用于基于与产品有关的数据来分级产品层面的方法。该方法包括以下。从数据识别出产品层面。基于产品层面在数据中的出现频率以及所识别出的产品层面的影响测度，为每个所识别出的产品层面生成权重因子。基于所生成的权重因子来对所识别出的产品层面分级。以该方式，能够确定出哪个产品层面是重要的以及每个重要层面相对于其他重要层面的重要性。

在一实施方式中，从数据识别产品层面包括从数据抽取一个或多个名词短语。

在一实施方式中，如果所抽取出的名词短语符合与层面类别关联的产品层面，则将所抽取出的名词短语类分类为层面类别，层面类别关联于一个或多个不同的产品层面。在一实施方式中，术语‘符合’可以不仅仅包括“匹配”。例如，分类处理可以将名词短语识别为对应于特定产品层面，即使该产品层面的准确术语并不包括在该名词短语中。分类可以使用SVM或一些其他分类器来执行。例如，分类可以使用一类SVM来执行。在一实施方式中，层面类别可以关联于多个(例如所有)产品层面。以该方式，所抽取出的名词短语可以取决于其是否是产品层面而被分类或不被分类。因此，可以从所抽取出的名词短语识别出真正产品层面。

在不同的实施方式中，可以将所抽取出的名词短语分类为多个层面类别之一，每个层面类别关联于不同的产品层面。以该方式，所抽取出的名词短语可以被识别为是否是所识别出的产品层面。

在一实施方式中，如上述参考图19那样，即使用所生成的修正层级，执行从数据识别产品层面。

在一实施方式中，将多个不同的所抽取出的名词短语聚集在一起，其中，多个不同的所抽取出的名词短语中的每个包括对应的同义术语。以该方式，可以将与相同产品层面相关的不同名词短语结合在一起。例如，各种名词短语可以包括术语‘耳机’，而各种其他名词短语可以包括术语‘听筒’。因为‘耳机’以及‘听筒’与相同产品层面相关，所以可以将所有这些名词短语结合在一起。在该实施方式中，‘耳机’以及‘听筒’是对应的同义术语。在一实施方式中，在上述提到的分类步骤之后可以执行同义词聚类的步骤。

在一实施方式中，基于数据确定用于所识别出的产品层面的层面情绪，并且使用层面情绪来确定所识别出的产品层面的影响测度。在一实施方式中，确定层面情绪包括：(i)从数据抽取一个或多个层面观点，所述或者每个层面观点识别所识别出的产品层面以及对应观点；(ii)基于其对应观点将所述或者每个层面观点分类为多个观点类别之一，每个观点类别关联于不同的观点；以及(iii)基于多个观点类别中哪一个包含最多层面观点确定用于所识别出的产品层面的层面情绪。在一实施方式中，如上述参考图22那样确定层面情绪执行，即使用所生成的修正层级来确定层面情绪执行。在一实施方式中，确定影响测度包括从数据抽取用于产品的产品情绪，产品情绪关联于观点；以及比较用于所识别出的产品层面的层面情绪和用于产品的产品情绪以确定影响测度。在一实施方式中，影响测度可以视为重要性测度，即当将产品视为整体时消费者认为层面如何重要。

在一实施方式中，确定产品情绪包括以下。从数据抽取一个或多个产品观点(例如数据段)，所述或者每个产品观点识别产品以及对应观点。基于其对应观点将所述或者每个产品观点分类为多个观点类别之一，每个观点类别关联于不同的观点。基于多个观点类别中哪一个包含最多产品观点来确定用于产品的产品情绪。

以下更详细地描述根据实施方式的用于基于与产品有关的数据来分级产品层面的方法。

符号以及问题公式化

在一实施方式中，用R＝{r₁,…r_|R|}表示特定产品的一组消费者评价。在每个评价r∈R中，消费者表达对产品的多个层面的观点，最后分配总体评分O_r。O_r是指示对评价r中的总体观点的不同级别的数值分数r，即O_r∈[O_min,O_max]，其中，O_min以及O_max分别是最小以及最大评分。O_r被标准化为[0,1]。假定评价集R中总共有m个层面A＝{a₁…a_m}，其中，a_k是第k个层面。对评价r中的层面a_k的观点表示为O_rk。对每个层面的观点潜在地会影响总体评分。假定总体评分O_r是基于对具体层面的观点的加权集结而生成的，其中，每个权重ω_rk基本测量了层面a_k在评价r中的重要性。目的是揭示重要权重(即，对层面的强调)以及对应地识别重要的层面。

接下来，在一实施方式中，从与产品有关的数据获取产品层面a_k以及对各种层面的消费者观点O_rk。然后设计概率层面分级算法以估计重要权重以及识别对应的重要层面。

层面分级算法

根据一实施方式，以下描述了概率层面分级算法以从与产品有关的数据(例如消费者评价)识别产品的重要层面。通常，重要层面具有以下特性：(a)它们在消费者评价中被频繁论及；以及(b)消费者对这些层面的观点极大地影响他们对产品的总体观点。评价中的总体观点是对评价中的具体层面的观点的集结，各种层面在集结中具有不同的贡献。也即，对(不)重要层面的观点对生成总体观点具有强(弱)影响。为了将这种集结模型化，基于对具体层面的观点的加权和来生成每个评价r中的总体评分O_r，用公式表示为或者用矩阵形式表示为ω_r ^To_r。O_rk是对层面a_k的观点，重要权重ω_rk反映对a_k的强调。较大ω_rk意味着a_k是更重要的，反之亦然。ω_r指代权重的向量，o_r是观点向量，每个尺寸指示对特定层面的观点。具体地，所观察的总体评分假定为由高斯分布生成，均值ω_r ^To_r以及变量σ²为：

p (O_{r}) = \frac{1}{\sqrt{2 π σ^{2}}} \exp [- \frac{{(O_{r} - ω_{r}^{T} o_{r})}^{2}}{2 σ^{2}}]; - - - (4.1)

为了考虑ω_r的不特定性，假定ω_r是从多元高斯分布抽出的样本，为如下：

p (ω_{r}) = \frac{\exp [- \frac{1}{2} {(ω_{r} - μ)}^{T} Σ^{- 1} (ω_{r} - μ)]}{{(2 π)}^{m / 2} \det {(Σ)}^{1 / 2}}; - - - (4.2)

其中，μ以及∑分别是均值向量以及协方差矩。它们都可以是未知的，需要被估算。

如前述的，消费者频繁论及的层面易于是重要的。因此，采集层面频率作为先验知识以辅助学习ω_r。尤其，期望ω_r的分布即接近分布N(μ₀，I)。μ₀中的每个元素是具体层面的频率：因而，基于其Kullback-Leibler(KL)散度将分布N(μ₀，I)公式化为N(μ₀，I)：

其中，是权重参数。

基于上述公式，在评价r中生成总体观点评分O_r的可能性给定为：

p (O_{r} | r) = p (O_{r} | ω_{r}, μ, Σ, σ^{2}) = &Integral; p (O_{r} | ω_{r}^{T} o_{r}, σ^{2}) \cdot p (ω_{r} | μ, Σ) \cdot p (μ, Σ) d ω_{r} - - - (4.4)

其中，是重要权重，{μ，Σ，σ²}是模型参数。当能够使用最大似然(ML)估计从评价集R＝{r₁,…r_|R|}估计出{μ，Σ，σ²}时，能够通过最大后验概率(MAP)估计来优化评价r中的ω_r。因为ω_r及{μ，Σ，σ²}彼此耦合，所以能够使用最大期望(EM)算法来优化它们。在E步骤和M步骤中的和{μ，Σ，σ²}的迭代优化如下执行。

给定{μ，Σ，σ²}来优化ω_r：

在一实施方式中，假定给定了参数{μ，Σ，σ²}，使用最大后验概率(MAP)估计来得到ω_r的优化值。将评价r的MAP估计的目标函数定义为：

L (ω_{r}) = \log [p (O_{r} | ω_{r}^{T} o_{r}, σ^{2}) \cdot p (ω_{r} | μ, Σ) \cdot p (μ, Σ)] - - - (4.5)

通过替换公式(4.1)-公式(4.3)，能够获得

因而通过MAP估计能够将ω_r优化为如下：

{\hat{ω}}_{r} = \underset{ω_{r}}{\arg \max} L (ω_{r}) = \underset{ω_{r}}{\arg \max} {- \frac{{(O_{r} - ω_{r}^{T} o_{r})}^{2}}{2 σ^{2}} - \frac{1}{2} {(ω_{r} - μ)}^{T} Σ^{- 1} (ω_{r} - μ)} - - - (4.7)

对ω_r进行求导数L(ω_r)，使其在最小值处成为0：

\frac{&PartialD; L (ω_{r})}{&PartialD; ω_{r}} = - \frac{(ω_{r}^{T} o_{r} - O_{r}) o_{r}}{σ^{2}} - Σ^{- 1} (ω_{r} - μ) = 0 - - - (4.8)

这导致以下结果：

{\hat{ω}}_{r} = {(\frac{o_{r} o_{r}^{T}}{σ^{2}} + Σ^{- 1})}^{- 1} (\frac{O_{r} o_{r}}{σ^{2}} + Σ^{- 1} μ) - - - (4.9)

给定ω_r来优化{μ，Σ，σ²}：

在一实施方式中，给定ω_r，使用最大似然(ML)估计对评价集R优化{μ，Σ，σ²}。期望的是，参数可最大化观察到对集R的所有总体评分的可能性。因而，如下通过使评价集R的对数似然函数最大化来估计这些参数。为简化起见，将{μ，Σ，σ²}定义为Ψ。

\hat{Ψ} = \underset{Ψ}{\arg \max} L (R) = \underset{Ψ}{\arg \max} Σ_{r &Element; R} \log (p (O_{r} | μ, Σ, σ^{2})) - - - (4.10)

通过替换公式(4.1)-公式(4.3)，能够获得

对{μ，Σ，σ²}中的每个参数进行求导数L(R)，使其在最小值处成为0：

这引起以下结果：

在一实施方式中，重复上述两个优化步骤，直至收敛。结果，能够获得用于每个评价r∈R的优化的重要权重ω_r。对于每个层面a_k，然后通过对评价上的其重要性分数积分来计算其总体重要性分数其中，R_k是包含a_k的一组评价。

根据能够识别出重要的产品层面。

图26图示了以上描述的根据实施方式的假代码的概率层面分级算法。

估计

在该部分，进行大量实验以估计以上提出的框架对于产品层面分级的有效性。在下文中，应该理解的是，‘我们的方案’以及‘我们的方法’应该解释为‘一实施方式’。

数据组为及实验设定

使用上述产品评价数据组来估计我们的方法的性能。使用F1-测量作为用于层面识别和层面情绪分类的估计度量。其是查准率以及查全率的组合，因为F₁-测量＝2*查准率*查全率/(查准率+查全率)。为了估计层面分级的性能，使用广泛使用的top-k归一化折损累积增益(NDCGk)作为估计度量。给定层面的分级列表，NDCGk计算为：

NDCG k = \frac{1}{Z} Σ_{i = 1}^{k} \frac{2^{t (i)} - 1}{\log (1 + i)} (4.14)

其中，t(i)是位置i的层面的重要程度，Z是由完美分级的top-k层面推导出的归一化项。对于每个层面，由三个注释者将其重要程度判断为三个重要级别，即“不重要”(分数1)、或者“一般"(分数2)以及“重要”(分数3)。理想地，应该邀请注释者阅读所有评价，然后作出他们的判断。但是，这种标记处理是非常耗时及劳动力大的。因为NDCGk计算是用top-k层面的重要程度来计算的，所以标记处理被如下加速。首先，从所有估计方法的分级结果中收集top-k层面。然后在这些层面上采样一百个(100)评价，并将它们提供给注释者用于标记层面的重要级别。

层面分级的估计

将所提出的层面分级算法比较于以下三个方法。

·基于频率的方法，其根据层面频率来分级层面。

·基于相关性的方法，其测量对具体层面的观点和总体评分之间的相关性。该方法基于两个这种观点一致的情形的数量来对进行层面分级。

·混合方法，其通过线性组合捕获层面频率和相关性λ·基于频率的分级+(Ι-λ)·基于相关性的分级，其中，在实验中将λ设定为0.5。

图27-29分别示出了在NDCG5、NDCG10以及NDCG15方面的比较。使用T-测试来测试统计显著性的结果，p-值<0.05。平价来说，所提出的层面分级方法在NDCG5方面显著优于基于频率、基于相关性以及混合方法分别达7.6％、7.1％和6.8％。其在NDCG10方面比这三个方法改善性能分别达4.5％、3.8％和3.3％，而在NDCG15方面分别达5.4％、3.9％和4.6％。因此，所提出的方法通过同时采用层面频率和每个层面的消费者观点对它们总体观点的影响，能够从消费者评价中有效识别出重要层面。基于频率的方法仅捕获层面频率信息，忽略了要考虑具体层面的观点对总体评分的影响。该方法会将一些通用层面认为是重要层面。虽然通用层面频繁出现在消费者评价中，但是它们并不极大地影响消费者的总体满意度。基于相关性的方法通过对具体层面的观点和总体评分之间一致情形进行计数来对层面进行分级。该方法没有对总体评分生成中的不确定性进行模型化，因而不能够实现满意的性能。混合方法简单地集结了来自基于频率的以及基于相关性的方法的结构，但不能够有效地提高性能。

图30示出了这四个方法产生的样本结果。列出了产品iPhone 3GS的前10个产品层面。从这四个分级列表可见，所提出的层面分级方法比其他方法生成更多合理的分级。例如，通过其他方法会将层面"电话分级在前面。但是，“电话”是通用层面而不是重要层面。

为了更好地调查所提出的方法的分级结果的合理性，考虑一个公共用户反馈报告，即中国unicom100顾客iPhone用户反馈报告”。该报告示出了使用者最关注的iPhone产品的前四个层面，即“3G网络”(30％)、“使用性”(30％)、“外观设计”(26％)以及“应用”(15％)。可见，这四个层面也被我们所提出的层面分级方法分级在前面。

层面分级所支持的任务

层面分级有益于广范围的现实世界检索任务。在一实施方式中，在以下两个任务中调查其能力：(i)对评价文件的文件级别情绪分类，以及(ii)抽取式评价概要。

文件级别情绪分类

在一实施方式中，文件级别情绪分类的目标是确定给定评价文件(即第一数据部分)的总体观点。评价文件通常表达了对特定产品的多个层面的各种观点。对不同层面的观点可以彼此相反，并且对评价文件的总体观点具有不同的影响程度。图31图示了用于示范产品iPhone4的样本评价文件。该评价表达了对一些层面(诸如“可靠性”以及“易于使用”)的正面观点，同时批评一些其他层面，诸如“触摸屏”、“弯曲”、“音乐播放”。最终，由于重要层面相关于正面观点，所以在iPhone4的五个观点(即，正面观点)中分配了五星的总体评分。因此，识别重要层面自然能够利于对评价文件的总体观点的估计。因此能够利用层面分级结果来辅助文件级别情绪分类。

如上所述对产品评价执行文件级别情绪分类的估计。具体地，随机选择每个产品的一百个(100)评价作为测试数据(即第二数据部分)，使用剩余评价用于训练数据(即第一数据部分)。每个评价包含总体评分，其标准化为[0，1]。将具有高总体评分(>0.5)的评价视为正样本，将具有低评分(<0.5)的评价视为负样本。评分为0.5的评价被认为是中立的，在实验中不使用。从训练评价中收集名词术语、层面以及情绪术语作为特征。应该注意的是，情绪术语定义为在上述提到的情绪词典中出现的那些。然后将所有训练及测试评价表示为特征向量。在该表示中，更强度重要层面以及修饰它们的情绪术语。技术上来说，与层面a_k以及其对应情绪术语对应的特征尺寸被加权为其中，是a_k的重要性分数，是权衡参数并且在实验中凭经验设定为100。基于该权重特征，SVM分类器从训练评价所训练并且用来确定对测试评价的总体观点。

图32图示了根据实施方式的以上描述的用于从与产品有关的数据确定产品情绪的方法的框架。

在450处，获得与特定产品相关的数据。在一实施方式中，数据包括第一数据部分(例如训练数据)和第二数据部分(例如测试数据)。在一实施方式中，第一和第二数据部分都包括相同产品的多个评价。第一数据部分的数据可以部分地或者全部不同于第二数据部分的数据。

在452处，根据以上描述的方法(例如，根据图25的方法)使用第一数据部分生成分级层面，。

在454处，将第二数据部分中的每个评价文件表示为向量形式，其中，向量通过452中生成的分级层面被加权重。在一实施方式中，特征可以基于452中生成的分级层面来定义特征，可能地，可以从示范情绪词典来定义特征。特征可以包括名词术语以及情绪术语。基于这些特征，每个评价文件能够表示为向量形式，其中，每个向量尺寸指示从评价文件中所识别出的对应特征及其关联观点(即情绪术语)的存在或者不存在。在一实施方式中，可以根据分级层面的评分和对应观点，即根据它们的权重，对每个尺寸加权重。以这种方式，可以对与重要层面有关的数据以及它们对应观点施加更多的强调。

总之，因此，每个评价文件可以由向量表示。给定向量可以指示每个特征存在或者不存在于关联的评价文件中。而且，如果特征存在于评价文件中，则评价文件中给定的特征的观点可以指示在向量中。在一实施方式中，每个评价文件可以由单独的向量表示。

在456处，确定第二数据部分中的每个评价文件的总体情绪(即观点)。在一实施方式中，这是通过将评价文件的每个特征分类为许多观点类别之一来执行的。每个观点类别关联不同的观点。例如，可以存在关联正面观点的正面观点类别。而且，可以存在关联负面观点的负面观点类别。因此，可以将与单个评价文件相关的每个特征分类为正面的或者负面的。该处理可以为第二数据部分中的每个评价文件执行。

在458处，确定第二数据部分中的每个评价文件的总体观点。例如，评价文件的总体观点可以是对评价文件的每个特征的观点的集结。在一实施方式中，可以基于分级根据特征的重要性对特征加权。以该方式，可以对与重要层面有关的数据(例如，特征)以及它们对应观点施加更多的强调。因此，通过参考对高分级层面的观点比起通过参考较低分级层面，评价文件可以具有更好的总体观点。在一实施方式中，可以通过带显示屏的通用计算机或者具有显示屏的专门设计的硬件装置来执行该方法。因此，在458处，可以将总体观点发送至显示屏以显示给人类用户。

各种实施方式提供了用于从与产品有关的数据确定产品情绪的方法，产品情绪关联于产品的观点。数据包括第一数据部分和第二数据部分。所述方法包括以下。根据以上描述的实施方式，基于第一数据部分来确定与产品相关的所分级的产品层面。从第二数据部分识别出一个或多个特征，所述或者每个特征识别所分级的产品层面以及对应观点。基于其对应观点将每个特征分类为多个观点类别之一，每个观点类别关联于不同的观点。产品情绪是基于多个观点类别中哪一个包含最多特征来确定的。例如，如果与“正面”观点相关的观点类别包含最多数量的特征，则产品情绪可以是“正面”的。

在一实施方式中，产品情绪是基于对应于特征的层面分级来确定的。例如，生成产品情绪可以是简单的计算哪个观点类别包含最多特征。但是，在另一实施方式中，产品情绪可以基于层面的权重来计算的，使得相比于较低分级层面，更多的强调置于与高分级层面相关的观点上。

在一实施方式中，第一数据部分和第二数据部分包括一些所有相同数据，例如评价。在一些其他实施方式中，第一数据部分的数据部分地或者完全地不同于第二数据部分的数据。

在一实施方式中，第一数据部分包括产品的多个独立评价，第二数据部分包括产品的单个评价。

在一实施方式中，数据的第一部分包括产品的多个不同评价，所述方法包括以下。数据的第二部分中的每个评价表示为向量。

每个向量指示每个特征存在或者不存在于关联的评价中。可选地、基于对应于特征的层面分级将每个特征在向量中加权。基于每个向量来确定产品情绪以确定用于数据的第二部分中的每个评价的产品情绪。以该方式能够基于每个评价文件获得对产品的总体观点。换句话说，每个评价文件可以概括为对产品的总体观点。

将上述方法相比于两个现有方法，即，布尔(Boolean)权重以及术语频率(TF)权重。布尔权重将每个评价表示为布尔值的特征向量，每个布尔值指示对应特征存在或者不存在于评价中。术语频率(TF)权重用每个特征在集中的频率来对布尔特征加权重。图33示出了对所有11个产品的评价的分类性能以及对它们的平均性能。此处，我们的方法称为AR，因为其将层面分级结果并入特征表示中。从图33可见，我们的AR权重方法比布尔以及TF权重方法实现了更好的性能。尤其，其在所有11个产品上最佳地执行，在平均F₁-测量方面显著优于布尔以及TF权重方法分别达3.9％和5.8％。值得注意的是，布尔权重是AR权重的特殊情形。当所有层面被设定为相同重要时，AR权重恶化了布尔权重。从这些结果，能够得出的是，层面分级有助于提高文件级别情绪分类的性能。此外，该结果还示出了布尔权重在平均F1-测量方面比TF权重实现的稍微性能改善达大约1.8％。

抽取式评价概要

如前述的，在一实施方式中，对于特定产品，在因特网可以存在大量消费者评价。但是，评价可能是未经组织的。对于用户来说，从如此众多的评价中获取对产品各个层面的消费者评价及观点是不现实的。另一方面，因特网提供的信息超过了所需要的信息。因此，需要自动评价概要，这旨在将源评价浓缩为保存其信息内容以及总体意思的更短版本。现有的评价概要方法能够分类为抽象式概括以及抽取式概括。抽象式概括尝试理解源评价中的主要话题，然后应清楚的自然语言表达出这些话题。其使用语言技术来检查以及翻译文本。然后其查找新的概念和表达式，以通过生成传达原始文本文件中最重要信息的新的更短的概念和表达式来最佳地描述该文本。抽取式概括方法包括从原始评价选择重要句子、段落等，并且将它们连接成更短的形式。

以下关注根据实施方式的抽取式评价概要。以下调查了层面分级在改善概括性能方面的能力。

如以上介绍的，抽取式概括公式化为从源评价抽取出最有信息量的段/部分(例如，句子或者段落)。最有信息量的内容通常视为是现有作品中"最频繁"或者"最有利定位成"的内容。尤其，分数函数如下定义为用于计算每个句子的信息量性：

I(s)＝λ₁·I_a(s)+λ₂·I_o(s)，λ₁+λ₂＝1 (4.15)

其中，I_a(s)定量了在s中层面的重要性方面句子s的信息量性，I_o(s)测量了在s中所表达的观点的代表性方面的信息量性。λ₁、λ₂、λ₃是权衡参数。在一实施方式中，I_a(s)和I_o(s)定义为如下：

I_a(s)：包含频繁层面的句子被视为是重要的。因此，I_a(s)可以基于层面频率定义为：

I_a(s)＝Σ_{aspect in s}frequency(aspect) (4.16)

I_o(s)：期望产生的概要包括源评价中的观点性句子，以便提供对消费者观点的概括。而且，期望的是概要包括这样的句子，该句子的观点与消费者的总体观点一致。对应地，I_o(s)定义为：

I_o(s)＝α·Subjective(s)+β·Consistency(s) (4.17)

在一实施方式中，使用Subjective(s)来区分观点性句子与事实句子，Consistency(s)测量了句子s中的观点和总体观点之间的一致性，如下：

Subjective(s)＝Σ_term in s|Polarity(term)|

(4.18)

Consistency(s)＝-(Overall rating-Polarity(s))²

其中，Polarity(s)计算为：

Polarity(s)＝Σ_term in sPolarity(term)/(ε+Subjective(s)) (4.19)

其中，Polarityi(术语)是特定术语的观点极性，ε是常量以防止分母为零。

在一实施方式中，利用由上述分数函数计算出的评价句子的信息量性，于是能够通过以下两个方法来选择有信息量的句子(a)句子分级(SR)方法根据句子的信息量性来对句子进行分级，并且选择前面分级的句子以形成概括；以及(b)基于图形的(GS)方法将句子表示在图形中，其中，每个节点对应于特定句子，每个边缘象征了两个句子之间的关系。然后对整个图形执行随机漫步以发现最有信息量的句子。每个节点的初始分数由公式(4.15)中的分数函数定义为其信息量性，边缘权重被计算为使用一元作为特征的句子之间的余弦类似性。

如前述的，频繁层面可能不是重要层面，层面频率不能够象征层面的重要性。能够通过采用层面分级结果来改善上述分数函数，层面分级结果指示了层面的重要性。在一实施方式中，句子s的信息量性在层面的重要性方面能够在其内定义为：

I_ar(s)＝Σ_{aspect in s}importance(aspect) (4.20)

其中，importance(aspect)是通过上述层面分级算法获得的重要性分数。句子s的总体信息量性然后计算为：

I(s)＝λ₁·I_ar(s)+λ₂·I_o(s)，λ₁+λ₂＝1 (4.21)

图34图示了根据实施方式的用于基于与产品有关的数据来生成产品评价概要的方法的概观。

在500处，获得与特定产品相关的数据。将数据拆成两个部分，即包括训练数据的第一数据部分以及包括测试数据的第二数据部分。数据可以包括产品的消费者评价。这些可以例如从因特网获得。在502处，从500中获得的第二数据部分抽取数据段。例如，第二数据部分的每个消费者评价的自由文本评价部分可以拆成句子。

在504处，根据以上描述的实施方式(例如，根据图25的方法)使用第一数据部分生成分级层面。在506处，使用504中生成的分级层面来选择502中所抽取出的特定数据段。在一实施方式中，可以基于数据段是否包含所分级的层面(以及，可选地基于这些分级的层面的评分)来选择数据段。此外，可以基于数据段是否包含所分级的层面上的观点(以及，可选地基于这些观点是否与对产品的总体观点一致)来选择数据段。

在506处，使用504中所选择的数据段来生成概要，在508收集该概要。在一实施方式中，可以通过带显示屏的通用计算机或者具有显示屏的专门设计的硬件装置来执行该方法。因此，在506处，可以将评价概要发送至显示屏以显示给人类用户。

各种实施方式提供了用于基于与产品有关的数据来生成产品评价概要的方法，数据包括第一数据部分和第二数据部分。方法包括以下步骤。根据以上描述的实施方式，基于第一数据部分来确定与产品相关的所分级的产品层面。从第二数据部分抽取一个或多个数据段。对于所述或者每个所抽取出的数据段，基于数据段是否识别出所分级的产品层面以及包含对应观点来计算相关性分数。取决于它们的相应相关性分数，生成包括一个或多个所抽取出的数据段的产品评价概要。以该方式，可以基于与产品有关的数据自动生成产品的概要。

在一实施方式中，所抽取出的数据段的相关性分数取决于所分级的产品层面的分级。在一实施方式中，所抽取出的数据段的相关性分数取决于其对应观点是否匹配产品的总体观点。

在一实施方式中，方法包括以下。将用于所抽取出的数据段的相关性分数比较于预定阈值。取决于该比较将所抽取出的数据段包括在产品评价概要中。以这种方式，仅高相关度的信息包括在概要中。

对上述提到的产品评价集执行估计以调查上述方法的有效性。将一百个(100)评价随机采样作为测试样本(即第二数据部分)。使用剩余评价来教导层面分级结果，即剩余评价被视为训练数据(即第一数据部分)。为了避免选择评论相同层面的多余句子，提出了以下策略。在选择每个新句子之后，如下那样更新剩余句子的信息量性：用exp{η·similarity(s_i,s_j)}降低与所选句子s_j对相同层面进行评论的剩余句子s_i的信息量性，此处similarity(·)是使用一元作为特征的句子之间的余弦类似性，η是权衡参数并且在该实验中凭经验地设定为10。邀请三个注释者为每个产品生成参考概要。邀请每个注释者阅读产品的消费者评价，并且通过基于他/她的判断选择有信息量的句子来分别写出达100单词的概要。采用ROUGE(即，面向查全率的要点评估)作为性能度量以估计上述方法所生成的概要的质量。ROUGE通过计数该概要与人工生成的一组参考概要之间重叠的N-gram来测量概要的质量。

ROUGE - N = \frac{\underset{S &Element; {Reference Summaries}}{Σ} \underset{{gram}_{n} &Element; S}{Σ} {Count}_{match} ({gram}_{n})}{\underset{S &Element; {Reference Summaries}}{Σ} \underset{{gram}_{n} &Element; S}{Σ} Count ({gram}_{n})} - - - (4.22)

其中，n表示n-gram的长度，即，gram_n。Count_match(gram_n)是候选概要和参考概要中都出现的n-gram的最大值。使用层面分级结果来计数概括方法(如公式(4.21))比较于使用传统分数函数来计数概括方法(如公式(4.15))。尤其，对四个方法进行估计：SR及SR_AR，即，基于层面分级分别用传统分数函数及所提出的函数进行句子分级；GB及GB_AR，即，分别具有传统分数函数和所提出的分数函数的基于图形的方法。权衡参数，λ₁、λ₂、α及β分别凭经验地设定为0.5、0.5、0.6及0.4。此处，概括性能被报告为ROUGE-1和ROUGE-2，分别对应于一元以及二元。

图35a示出了每个产品上的ROUGE-1性能以及所有11个产品上的平均ROUGE-1，而图35b提供了在ROUGE-2方面的对应性能。从这些结果，能够获得以下观察：

·通过采用层面分级，所提出的SR_AR以及GB_AR方法分别优于传统SR以及GB方法。尤其，SR_AR在平均ROUGE-1和ROUGE-2方面比SR获得的性能改善分别为大约6.9％和16.8％。GB_AR在平均ROUGE-1和ROUGE-2方面比GB分别实现了约11.7％和21.4％的改善；

·考虑ROUGE-1和ROUGE-2结果，SR_AR以及GB_AR在所有11个产品上相比于SR以及GB分别实现了更好的性能；

·基于图形的方法(即GB_AR以及GB)相比于对应句子分级方法(即，SR_AR以及SR)性能获得了稍微的改善。

总之，上述结果显示了层面分级在改善抽取式评价概要方面的能力。借助于层面分级，概括方法能够生成由对最重要层面的消费者评价所构成的更有信息量的概要。图36图示了产品iPhone 3GS的样本概要。可见使用层面分级方法(即SR_AR以及GB_AR)获得的概要包含了对重要层面的消费者评论(诸如“易于使用”、“3G网络”)，并且比由传统方法获得的那些概要更有信息量。

总结

在以上描述的实施方式中，已经提出了产品层面分级框架来从消费者评价中识别产品的重要层面。框架首先采用层级(如先前描述的)来识别层面以及对数个评价的对应观点。然后其利用概率层面分级算法从评价推断产品的各个层面的重要性。该算法同时探查层面频率和每个层面的消费者观点对总体观点的影响。产品层面最终根据它们的重要性分数而被分级。对产品评价数据组进行大量实验以***化估计所提出的该框架。实验结果显示了所提出的方法的有效性。而且，应用产品层面分级以利于两个现实世界任务，即文件级别情绪分类以及抽取式评价概要。由于层面分级可揭示出评价中消费者的主要关注点，所以通过在分析评价文件上的观点时给予重要层面以更多权重，这本质上能够用来改善文件级别情绪分类。而且，通过更多强调包括重要层面的句子，这能够利于抽取式评价概要。在产品层面分级的帮助下能够获得显著的性能改善。

计算机网络

根据各种实施方式的上述方法能够实施在计算机***800上，示意地示出于图37。其可以实施为软件(诸如计算机***800内执行的计算机程序)，并且命令计算机***800执行示范实施方式的方法。

计算机***800包括计算机模块802、输入模块(诸如键盘804和鼠标806)和多个输出设备(诸如显示器808和打印机810)。

计算机模块802经由合适的收发器设备84连接至计算机网络812，以能够访问例如因特网或者其他网络***，诸如局领域网络(LAN)或者广领域网络(WAN)。

在该例子中，计算机模块802包括处理器818、随机访问存储器(RAM)820以及只读存储器(ROM)822。计算机模块802还包括多个输入/输出(i/O)界面，例如显示器808的I/O界面824和键盘804的I/O界面826。

计算机模块802的部件典型地经由相互连接的总线828以本领领域技术人员公知的方式通信。

应用程序典型地被提供至计算机***800的用户，被编码在数据存储介质(诸如CD-ROM或者闪存载体)上，并且利用数据存储设备830的对应数据存储介质驱动来读取。通过处理器818读取应用程序并且控制其实施。可以使用RAM 820完成程序数据的中间存储。

本领领域的技术人员将理解的是，可以对具体实施方式中所示的本发明进行多个改变和/或修改，这并不超出广义上描述的本发明的精神或范围。因此，本实施方式被视为在所有方面是示意性的而不是限制性的。

Claims

1.一种用于基于与产品有关的数据来生成用于所述产品的修正层级的方法，所述方法包括：

生成用于所述产品的初始层级，所述初始层级包括多个节点，每个节点代表不同的产品层面，所述多个节点取决于不同的产品层面之间的关系而相互连接；

从所述数据识别产品层面；

通过计算目标函数为所识别出的产品层面确定在所述初始层级中的优化位置；以及

将所识别出的产品层面***所述初始层级中的所述优化位置以生成所述修正层级。

2.根据权利要求1所述的方法，其中，基于所述产品的说明书来生成所述初始层级。

3.根据权利要求1或2所述的方法，其中，所述初始层级包括一个或多个节点对，每个节点对具有连接在一起以指示父子关系的父节点以及子节点。

4.根据权利要求3所述的方法，其中，所述初始层级包括根节点，所述或每个节点对的父节点是最靠近所述根节点的节点。

5.根据前述任一权利要求所述的方法，其中，从所述数据识别产品层面包括从所述数据抽取一个或多个名词短语。

6.根据权利要求5所述的方法，进一步包括：如果抽取出的名词短语符合与层面类别关联的产品层面，则将抽取出的名词短语分类为所述层面类别，所述层面类别关联于一个或多个不同的产品层面。

7.根据权利要求5或6所述的方法，进一步包括将多个不同的抽取出的名词短语聚集在一起，其中，所述多个不同的抽取出的名词短语中的每个包括对应的同义术语。

8.根据前述任一权利要求所述的方法，其中，确定所述优化位置包括：

将所识别出的产品层面***所述初始层级中的多个样本位置中的每个；

计算与每个样本位置相关的定位分数，所述定位分数是所述样本位置的适当性的测度；以及

基于与每个样本位置相关的所述定位分数来确定所述优化位置。

9.根据权利要求8所述的方法，其中，所述定位分数是层级语义距离的改变的测度，所述层级语义距离是用于所述初始层级中的每个节点对的层面语义距离的总和，每个层面语义距离是由节点对所代表的两个产品层面的意思之间的类似性的测度。

10.根据权利要求8或9所述的方法，其中，所述定位分数是所述初始层级的结构中的改变的测度。

11.根据权利要求8、9或10所述的方法，其中，所述定位分数是与所述初始层级中的节点对相关的第一层面语义距离和第二层面语义距离之间的改变的测度，所述第一层面语义距离和第二层面语义距离是由节点对所代表的两个产品层面的意思之间的类似性的测度，基于所述初始层级来计算所述第一层面语义距离，基于与所述产品有关的辅助数据来计算所述第二语义距离。

12.根据前述任一权利要求所述的方法，其中，将所识别出的产品层面***所述初始层级包括将所识别出的产品层面关联于现有节点以指示所述现有节点代表所识别出的产品层面。

13.根据前述任一权利要求所述的方法，其中，将所识别出的产品层面***所述初始层级包括将新节点互连到所述初始层级内以及将所识别出的产品层面关联于所述新节点以指示所述新节点代表所识别出的产品层面。

14.根据前述任一权利要求所述的方法，进一步包括：

基于所述数据确定用于所识别出的产品层面的层面情绪；以及

将所述层面情绪关联于所述修正层级中的识别出的产品层面。

15.根据权利要求14所述的方法，其中，确定层面情绪包括：

从所述数据抽取一个或多个层面观点，所述或者每个层面观点对识别出的产品层面以及对应观点进行识别；

基于所述对应观点将所述或者每个层面观点分类为多个观点类别之一，每个观点类别关联于不同的观点；以及

基于所述多个观点类别中哪一个包含最多层面观点来确定用于识别出的产品层面的层面情绪。

16.根据权利要求15所述的方法，其中，所述多个观点类别包括正面观点类别以及负面观点类别。

17.一种用于基于与产品有关的数据来生成用于所述产品的修正层级的装置，所述装置包括：

至少一个处理器；

以及包括计算机程序代码的至少一个内存；

其中，所述至少一个内存和所述计算机程序代码构造为通过所述至少一个处理器使得所述装置至少进行以下步骤：

从所述数据识别产品层面；

18.一种计算机可读存储介质，其上存储有计算机程序代码，当计算机程序代码由计算机执行时使得所述计算机执行用于基于与产品有关的数据来生成用于所述产品的修正层级的方法，所述方法是根据权利要求1至16中任一项所述的方法。

19.一种用于基于与产品有关的数据来识别产品层面的方法，所述方法包括：

从所述数据的第一部分识别数据段；

根据权利要求1至16中任一项所述的方法，基于所述数据的第二部分生成修正层级；以及

将所述数据段分类为多个层面类别之一，每个层面类别关联于由所述修正层级中的不同节点所代表的产品层面以识别所述数据段相关于哪个产品层面。

20.根据权利要求19所述的方法，其中，进行分类包括确定用于每个层面类别的相关性分数，所述相关性分数指示所述数据段如何类似于与所述层面类别关联的产品层面。

21.根据权利要求20所述的方法，其中，识别所述数据段相关于哪个产品层面包括确定相关性分数低于预定阈值的层面类别。

22.一种用于基于与产品有关的数据来识别产品层面的装置，所述装置包括：

至少一个处理器；

以及包括计算机程序代码的至少一个内存；

从所述数据的第一部分识别数据段；

使用根据权利要求17所述的装置基于所述数据的第二部分生成修正层级；以及

23.一种计算机可读存储介质，其上存储有计算机程序代码，当计算机程序代码由计算机执行时使得所述计算机执行用于基于与产品有关的数据来识别产品层面的方法，所述方法是根据权利要求19至21中任一项所述的方法。

24.一种用于通过与产品有关的数据确定用于产品层面的层面情绪的方法，所述方法包括：

从所述数据的第一部分识别数据段；

根据权利要求1至16中任一项所述的方法，基于所述数据的第二部分生成修正层级；

将所述数据段分类为多个层面类别之一，每个层面类别关联于由所述修正层级中的不同节点所代表的产品层面以识别所述数据段相关于哪个产品层面；

从所述数据段抽取与所述数据段相关的产品层面所对应的观点；以及

将抽取出的观点分类为多个观点类别中的一个观点类别，每个观点类别关联于不同的观点，所述层面情绪是与所述一个观点类别关联的观点。

25.根据权利要求24所述的方法，其中，所述多个观点类别包括正面观点类别以及负面观点类别。

26.一种用于从与产品有关的数据确定用于产品层面的层面情绪的装置，所述装置包括：

至少一个处理器；

以及包括计算机程序代码的至少一个内存；

从所述数据的第一部分识别数据段；

使用根据权利要求17所述的装置基于所述数据的第二部分生成修正层级；

27.一种计算机可读存储介质，其上存储有计算机程序代码，当计算机程序代码由计算机执行时使得所述计算机执行用于通过与产品有关的数据确定用于产品层面的层面情绪的方法，所述方法是根据权利要求24至25中任一项所述的方法。

28.一种用于基于与产品有关的数据来分级产品层面的方法，所述方法包括：

从所述数据识别产品层面；

基于所述产品层面在所述数据中的出现频率以及识别出的产品层面的影响的测度，生成用于每个识别出的产品层面的权重因子；以及

基于所生成的权重因子来分级所述识别出的产品层面。

29.根据权利要求28所述的方法，其中，从所述数据识别产品层面包括从所述数据抽取一个或多个名词短语。

30.根据权利要求29所述的方法，进一步包括：如果所抽取出的名词短语符合与层面类别关联的产品层面，则将所抽取出的名词短语分类为所述层面类别，所述层面类别关联于一个或多个不同的产品层面。

31.根据权利要求29或30所述的方法，进一步包括将多个不同的抽取出的名词短语聚集在一起，其中，所述多个不同的抽取出的名词短语中的每个包括对应的同义术语。

32.根据权利要求28至31中任一项所述的方法，进一步包括：

使用所述层面情绪确定所识别出的产品层面的影响的测度。

33.根据权利要求32所述的方法，其中，确定层面情绪包括：

基于所述多个观点类别中哪一个包含最多层面观点来确定用于所识别出的产品层面的层面情绪。

34.根据权利要求32所述的方法，其中，根据权利要求24所述的方法来确定层面情绪。

35.根据权利要求32至34中任一项所述的方法，，其中，确定影响的测度包括：

从所述数据确定用于所述产品的产品情绪，所述产品情绪关联于观点；以及

比较用于所识别出的产品层面的层面情绪和用于所述产品的产品情绪以确定所述影响的测度。

36.根据权利要求35所述的方法，其中，确定产品情绪包括：

从所述数据抽取一个或多个产品观点，所述或者每个产品观点识别所述产品以及对应观点；基于所述对应观点将所述或者每个产品观点分类为多个观点类别之一，每个观点类别关联于不同的观点；以及

基于所述多个观点类别中哪一个包含最多产品观点来确定用于所述产品的所述产品情绪。

37.根据权利要求28至36中任一项所述的方法，其中，根据权利要求19所述的方法来执行从所述数据识别产品层面的步骤。

38.一种用于基于与产品有关的数据来分级产品层面的装置，所述装置包括：

至少一个处理器；

以及包括计算机程序代码的至少一个内存；

从所述数据识别产品层面；

基于所述产品层面在所述数据中的出现频率以及所识别出的产品层面的影响的测度，生成用于每个所识别出的产品层面的权重因子；以及

基于所生成的权重因子来分级所识别出的产品层面。

39.一种计算机可读存储介质，其上存储有计算机程序代码，当计算机程序代码由计算机执行时使得所述计算机执行用于基于与产品有关的数据来分级产品层面的方法，所述方法是根据权利要求28至37中任一项的方法。

40.一种用于从与产品有关的数据确定产品情绪的方法，所述方法包括：

根据权利要求28至36中任一项的方法，基于所述数据的第一部分来确定与所述产品相关的所分级的产品层面；

从所述数据的第二部分识别一个或多个特征，所述或者每个特征识别所分级的产品层面以及对应观点；

基于所述对应观点将每个特征分类为多个观点类别之一，每个观点类别关联于不同的观点；以及

基于所述多个观点类别中哪一个包含最多特征来确定所述产品情绪。

41.根据权利要求40所述的方法，其中，所述产品情绪是基于对应于所述特征的层面分级来确定的。

42.根据权利要求40或41所述的方法，其中，所述多个观点类别包括正面观点类别以及负面观点类别。

43.根据权利要求40至42中任一项所述的方法，其中，所述数据的第一部分包括所述产品的多个独立评价，所述数据的第二部分包括所述产品的单个评价。

44.根据权利要求40至42中任一项所述的方法，其中，所述数据的所述第二部分包括所述产品的多个评价，所述方法进一步包括：

将所述数据的所述第二部分中的每个评价代表为向量，每个向量指示每个特征存在或者不存在于关联的评价中，其中，基于对应于所述特征的层面分级将每个特征在向量中加权；以及

其中，基于每个向量来确定产品情绪以确定用于所述数据的所述第二部分中的每个评价的产品情绪。

45.一种用于从与产品有关的数据确定产品情绪的装置，所述装置包括：

至少一个处理器；

以及包括计算机程序代码的至少一个内存；

使用根据权利要求38所述的装置，基于所述数据的第一部分确定与所述产品相关的所分级的产品层面；

46.一种计算机可读存储介质，其上存储有计算机程序代码，当计算机程序代码由计算机执行时使得所述计算机执行用于通过与产品有关的数据确定产品情绪的方法，所述方法是根据权利要求40至44中任一项所述的方法。

47.一种用于基于与产品有关的数据来生成产品评价概要的方法，所述方法包括：

根据权利要求28至36中任一项所述的方法，基于所述数据的第一部分确定与所述产品相关的所分级的产品层面；

从所述数据的第二部分抽取一个或多个数据段，

基于所述数据段是否识别出所分级的产品层面以及是否包含对应观点来计算用于所述或者每个抽取出的数据段的相关性分数；以及，

取决于它们的相应的相关性分数来生成包括一个或多个抽取出的数据段的产品评价概要。

48.根据权利要求47所述的方法，其中，所抽取出的数据段的相关性分数取决于对由所述数据段识别出的所分级的产品层面的分级。

49.根据权利要求47或48所述的方法，其中，所抽取出的数据段的相关性分数取决于其对应观点是否匹配所述产品的总体观点。

50.根据权利要求47至50中任一项所述的方法，进一步包括：

对用于抽取出的数据段的所述相关性分数与预定阈值进行比较；以及，

取决于所述比较将抽取出的数据段包括在所述产品评价概要中。

51.一种用于基于与产品有关的数据来生成产品评价概要的装置，所述装置包括：

至少一个处理器；

以及包括计算机程序代码的至少一个内存；

从所述数据的第二部分抽取一个或多个数据段；

52.一种计算机可读存储介质，其上存储有计算机程序代码，当计算机程序代码由计算机执行时使得所述计算机执行用于基于与产品有关的数据生成产品评价概要的方法，所述方法是根据权利要求47至50中任一项所述的方法。