CN102081631A

CN102081631A - 回答支持***和方法

Info

Publication number: CN102081631A
Application number: CN2009102471249A
Authority: CN
Inventors: 周韡; 邹青; 高鹏; 杨婕
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2009-11-30
Filing date: 2009-11-30
Publication date: 2011-06-01
Also published as: US20110161274A1; US8595174B2

Abstract

一种回答支持方法和***，该方法包括：(a)维护包含关于起因与一组症状之间的映射关系的历史数据的知识库，在知识库中问题症状表示为一组属性的属性值；(b)接收当前问题的已知症状；(c)使用已知症状搜索知识库，以寻找对应的起因；(d)响应于寻找到多个起因，根据多个起因的关于已知症状的历史数据之间的区别确定目标起因；(e)响应于无法确定目标起因，根据知识库中多个起因的历史数据从剩余属性中选择一个属性，该属性的属性值的确定最有可能使得确定目标起因；(f)生成并发送包含所选属性的提问；(g)从对该提问的回答中接收新的已知症状；其中，迭代执行步骤(d)、(e)、(f)、(g)，直到确定目标起因，或者已确定所有剩余属性的属性值而仍未能确定目标起因。

Description

回答支持***和方法

技术领域

本发明涉及计算机领域，具体涉及一种回答支持***和方法。

背景技术

在现代社会，随着诸如软件厂商等企业以及其他机构为客户提供越来越复杂的产品和服务，很多企业和其他机构设立了支持部门来回答客户就其产品和服务提出的各种问题。如何迅速地判断客户问题的性质，向客户搜集进一步的信息，并迅速有效地回答和解决客户的问题，是企业和其他机构所面临的一项挑战。

图1示出了一个典型的软件企业的客户支持流程。如图所示，在步骤1，一线支持人员通过与客户通话等方式搜集与问题相关的信息。所搜集的信息例如包括客户遇到的是什么问题，软件产品运行在什么环境下，客户看到了什么，日志中报告了什么，在问题产生前进行了什么更改，等等。

在步骤2，一线支持人员分析所搜集的信息。该步骤可包括如下两个子步骤：

在步骤2.1，一线支持人员确定所搜索的信息对于确定问题的起因是否已足够。如果已足够，则进行到步骤3。如果还不够，则转到步骤2.2。

在步骤2.2，一线支持人员通过与客户交谈搜集更多的信息。

在步骤3，一线支持人员确定自己能否解决该问题。如果能解决，则转到步骤4；如果不能解决，则转到步骤8。

在步骤4，一线支持人员形成解决方案。

在步骤5，一线支持人员将解决方案提供给客户。

在步骤6，一线支持人员询问客户问题是否已解决。如果问题已解决，则转到步骤7，流程结束。如果问题没有解决，则返回到步骤2.1。

在步骤8，将问题转给二线支持人员，例如资深技术人员。

在以上客户支持流程中，步骤2和4显然高度依赖于一线支持人员的技能和经验。对于资历较浅的支持人员来说，需要花费较长时间才能获得这些技能和经验；而在这之前，他或她将无法为客户提供满意的技术支持。对于资深技术人员来说，日复一日地重复这种流程又是厌倦的，且是人力资源的浪费。如果客户的问题是与不常用的组件相关的，而资深技术人员很久以前处理过类似问题，那么问题的根源可能无法找到。更严重的是，当资深技术人员离职之后，企业将丧失其有价值的经验。

为了提高支持人员确定问题起因的效率和正确性以便提高客户满意度，人们提出了回答支持***(answer support system)等用于协助支持人员工作的自动化辅助工具。例如，标题为“Answer support system，answersupport apparatus，and answer support program”的美国专利申请US20060078862提出了一种回答支持***，该***存储和利用过去的询问案例，从而能够自动为客户的问题呈现适当的回答。然而，由于该发明只能利用客户已提供的信息，而不能动态产生问题集，也不能动态改变问题列表，以便向客户提问适当的问题，因此不能高效地发现客户问题的起因。

发明内容

根据本发明的一个方面，提供了一种回答支持***，包括：包含关于问题起因与一组问题症状之间的映射关系的历史数据的知识库，在该知识库中问题症状表示为一组属性中的属性的属性值；接收装置，用于接收当前问题的一个或多个已知问题症状；寻找装置，用于使用所接收的一个或多个问题症状搜索知识库，以寻找与所述一个或多个已知问题症状对应的潜在起因；确定装置，用于响应于寻找装置寻找到多个潜在起因，根据所述知识库中所述多个潜在起因的历史数据之间的区别确定当前问题的目标起因，所述多个潜在起因的历史数据是关于已知问题症状的；选择装置，用于响应于确定装置无法确定当前问题的目标起因，根据所述知识库中所述多个潜在起因的历史数据选择一个待确定属性值的属性，所述一个待确定属性值的属性是从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择的，该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因；提问装置，用于生成并发送包含所选择属性的提问；所述接收装置还用于从对该提问的回答中接收作所选择属性的属性值的新的已知问题症状；其中，所述寻找装置、确定装置、选择装置、提问装置、接收装置迭代执行其操作，直到确定当前问题的目标起因，或者已确定所有剩余属性的属性值而仍未确定当前问题的目标起因。

根据本发明的另一个方面，提供了一种回答支持方法，包括：(a)维护包含关于问题起因与作为一组属性的属性值的一组问题症状之间的映射关系的历史数据的知识库，在该知识库中问题症状表示为一组属性中的属性的属性值；(b)接收当前问题的一个或多个已知问题症状；(c)使用所接收的一个或多个已知问题症状搜索知识库，以寻找与所述一个或多个已知问题症状对应的潜在起因；(d)响应于寻找到多个潜在起因，根据所述知识库中所述多个潜在起因的关于已知问题症状的历史数据之间的区别确定当前问题的目标起因；(e)响应于无法确定当前问题的目标起因，根据所述知识库中所述多个潜在起因的历史数据从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择一个待确定属性值的属性，该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因；(f)生成并发送包含所选择属性的提问；(g)从对该提问的回答中接收作为所选择属性的属性值的新的已知问题症状；其中，迭代执行步骤(d)、(e)、(f)、(g)，直到确定当前问题的目标起因，或者已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因。

通过使用本发明的回答支持***，一线支持人员可以不再依赖其自身经验和技能，而是可以利用本发明的回答支持***来确定客户的问题的起因并提供解决方案，从而加快了问题解决过程，提高了客户满意度。此外，资历较浅的一线支持人员可以在为客户提供支持服务的同时利用该***迅速提高技能，因为，该***中存储有关于各种起因及问题症状的关联的结构化知识，该知识是基于过去的案例以及资深技术人员的经验。因此，该***可用作一个低成本和见效快的培训***。对于资深技术人员来说，该***使他们可以摆脱接听和回答客户问题的琐屑工作，而致力于研究更复杂的问题，并将研究结果添加到***中，从而使***在未来能够自动解决该问题。当然，资深技术人员还可以利用该***发现对于所研究问题的已有解决方案，而不必进行重复的分析，从而提高了研究工作的效率。

附图说明

所附权利要求中阐述了被认为是本发明的特点的创造性特征。但是，通过参照附图阅读下面对说明性实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点，在附图中：

图1示出了一个典型的软件企业的客户支持流程；

图2示出了一线支持人员利用本发明的回答支持***提供客户支持的流程；

图3示出了根据本发明的实施例的回答支持***中的知识库的示例性结构；

图4示出了根据本发明的实施例的回答支持方法；以及

图5示出了与根据本发明的实施例的回答支持***的结构组成。

具体实施方式

本发明的回答支持***在知识库中存储有关于客户案例的起因-症状二维表(或称矩阵)。本发明的回答支持***根据由从用户搜集的问题描述中获得的症状通过所述二维表自动生成将对客户的动态提问列表，所述列表中的提问及顺序都是动态的，即取决于二维表中的起因/症状关联以及客户的最初问题描述和对先前提问的回答。

本发明的回答支持***可用于为一线支持人员提供支持，即为一线支持人员生成对客户的提问，并最终确定客户问题的起因，从而生成客户问题的解决方案。

此外，资深技术人员可以致力于研究知识库中没有解决方案的问题，将研究得出的解决方案发送给客户，并存储在知识库中以便重用。

下面参照附图来说明本发明的实施例。在下面的说明中，阐述了许多具体细节以便更全面地了解本发明。但是，对于本技术领域内的技术人员明显的是，本发明的实现可不具有这些具体细节中的一些。此外，应当理解的是，本发明并不限于所介绍的特定实施例。相反，可以考虑用下面的特征和要素的任意组合来实施本发明，而无论它们是否涉及不同的实施例。因此，下面的方面、特征、实施例和优点仅作说明之用而不应被看作是所附权利要求的要素或限定，除非权利要求中明确提出。

图2示出了一线支持人员利用本发明的回答支持***提供客户支持的流程。如图所示，在支持人员在步骤1从客户搜集到问题相关信息后，在步骤2将所搜集的信息发送到本发明的回答支持***。在步骤3，本发明的回答支持***判断所搜集的信息对于确定客户问题的起因是否已经足够。如果还不够，则转到步骤3.1，生成新的提问，并提供给支持人员，以便由支持人员在步骤1中通过向客户发出该新的提问搜集进一步的信息，并进一步在步骤2中将所搜集的进一步信息发送到本发明的回答支持***。如果在步骤3判断所搜集的信息对于确定客户问题的起因已经足够，则在步骤3.2判断知识库中是否存在已有的解决方案。如果存在已有的解决方案，则在步骤4生成解决方案，并在步骤5将该解决方案通过支持人员提供给客户，然后在步骤6通过接收客户反馈确定问题是否已解决。如果问题已解决，则在步骤6.1将结果存储在知识库中，并在步骤7结束。如果在步骤3.2判断知识库中不存在已有的解决方案，或在步骤6确定问题没有解决，则转到步骤8，将问题转给二线的资深技术人员。二线的资深技术人员如果经过研究确定了问题的起因从而解决了该问题，可将该问题的解决方案，即起因与症状的关联，存储在知识库中。

下面参照附图更详细地描述根据本发明的实施例的回答支持***的工作流程。

图3示出了根据本发明的实施例的回答支持***中的知识库的示例性结构。如图所示，该知识库的整体结构是一个二维矩阵，其表示起因与症状的之间的映射关系的历史数据。起因是指导致问题的根源，确定了问题的起因就确定了问题的解决方案。症状是指问题的一系列表现。症状可划分为类别，每一个类别可称为属性，症状即为属性值。每一个属性可具有多个属性值。

在图3所示的知识库结构中，C_i表示起因，i＝1...m；

Attribute k表示属性，k＝1...t，属性之间是离散的、非重叠的；

V_j表示症状，即属性值，j＝1...n，同一个属性的属性值之间是离散的、非重叠的；

T_ij表示起因C_i对于症状V_j的次数值；

RC_i表示起因C_i对于所有症状的次数值的和，即C_i行中所有T_ij的和；

RV_j表示所有起因对于症状V_j的次数值的和，即V_j列中所有T_ij的和；

R表示所有RC_i的和。

对于软件产品来说，属性可以是用户使用的平台、机器崩溃的时间、软件产品的版本等等，而起因可以是造成问题的各种具体原因。例如，以IBM Tivoli Integrated Portal为例，其知识库片段示例可以如下所示：

该知识库中的初始数据可以由一线支持人员或资深技术人员或其他人员根据关于客户问题的历史数据录入。在根据本发明的实施例的回答支持***的运行过程，***将自动更新该知识库中的数据。资深技术人员也可以根据自己对客户问题的研究结果将相应的起因和症状数据录入到该知识库。此外，资深技术人员还可以对该知识库进行各种维护，例如，整理知识中的数据，增减调整知识库中的属性和属性值，等等。

在本发明的该实施例中，在图2所示步骤1中，一线支持人员将从客户获得问题的症状描述，并从中产生已知症状矢量，该已知症状矢量中的每个元素值对应于知识库中的一个属性值。例如，从症状描述“在Windows平台上，Tip 1.2被成功安装，但无法登录”可以产生症状矢量(windows XP平台，Tip 1.2，按钮禁用)。如果症状描述中包含了不与知识库中的任何一个属性值对应的症状，该症状也不属于任何一个属性，则一线支持人员可以将该症状及相关信息发送给资深技术人员，以便由资深技术人员决定是否将该症状对应的属性值添加到知识库中。

在本发明的该实施列中，在图2所示步骤2中，一线支持人员将把所产生的已知症状矢量发送到根据本发明的实施例的回答支持***。

在本发明的该实施例中，在图2所示步骤3中，该回答支持***将执行以下子操作：根据已知症状矢量在知识库中进行搜索，对于知识库中的每一行，如果该行中与症状矢量中的每个症状对应的次数值均为空或为零(即该起因在历史中无证据表明其表现于已知症状中任何一个)，则将该行去除；而如果该行中与症状矢量中的各个症状对应的次数值中至少一个非空和非零，则保留该行，从而生成一个子矩阵。然后，在该子矩阵中将症状矢量中每个症状所属的属性中的其他属性值的列删除。也就是说，所生成的子矩阵中的行是原矩阵中包含至少一个对应于症状矢量中的症状的次数值的所有行，而所生成的子矩阵中的列是原矩阵中对应于症状矢量中的症状的属性值列以及所有其余属性的各属性值列。此外，可以重新生成各行与各列的和。

然后，判断所生成的子矩阵中包含的行数是否小于2。如果判断所得到的子矩阵中包含的行数小于2，即得到的起因数小于2，则执行图2中所示的步骤3.2。

在步骤3.2中进一步判断所生成的子矩阵是否为空。如果判断子矩阵为空，即包含的行数为零，表明无法根据所述症状矢量找到起因，则在步骤8将与该问题相关的信息如症状矢量发送给资深技术人员，以便由资深技术人员进行处理，例如通过研究该问题获得相应的起因，并将该起因及相关症状录入知识库中，以用于未来的问题解决。如果在步骤3.2中判断子矩阵非空，即包含的行数为1，表明已经根据所述症状矢量找到了起因，则转到步骤4，生成包含对应于该起因的解决方案，并在步骤5将通过一线支持人员将解决方案提供给客户。当然，在所生成的子矩阵中仅包含一行的情况下，一线支持人员也可以进一步判断该行中的已知症状的次数值是否均大于或等于1，并可进一步针对该行中的已知症状之外的其余属性向客户提出一个或多个问题，通过客户的回答中包含的症状找到该行中对应的其余属性值中的次数值，并根据所述次数值进一步判断所得到的起因是否正确(例如，如果所有次数值均大于等于1，则可判断起因正确)。如果判断所得到的起因正确，则在步骤4生成对应于该起因的解决方案，并将其通过一线支持人员提供给客户；否则，可在步骤8将与该问题相关的信息如症状矢量发送给资深技术人员进行处理，例如通过研究该问题获得相应的起因，并将该起因及相关症状录入知识库中，以用于未来的问题解决。

如果在步骤3中判断所生成的子矩阵的行数大于或等于2，则执行图2中所示的步骤3.1，以生成将向客户提问的问题。

该步骤基于修改的ID3算法以产生动态问题集，来迭代扩展症状矢量，从而尽可能快地找到问题的起因。传统的ID3算法用于根据一组示例来构造一个决策树，该组示例中的每一个都包含若干属性的属性值以及一个目标属性值或分类。该算法通过计算每一个属性的基于熵的信息增益并将各属性按照其信息增益的大小排列来确定检测各属性的顺序，从而构造出决策树，该决策树的根节点和中间节点代表各属性，树枝代表属性值，而叶节点代表目标属性值或目标分类。所构造的决策树可用于针对当前示例的各属性值确定其目标属性值或目标分类。

尽管传统的ID3算法能够用来根据当前示例的属性值确定其目标属性值或目标分类，但由于它对任何当前示例都使用同一个决策树使用相同的属性值序列来求解其目标属性值，因此并不适合于在诸如软件产品的技术支持等存在较多目标属性值或目标分类以及较多属性的复杂场合快速找到当前示例的目标属性值或目标分类。

本发明借鉴了传统的ID3算法中根据不同属性的信息增益来选择属性的思想，形成了本发明的修改的ID3算法。该修改的ID3算法包括如下迭代步骤：

第一步，锁定目标起因。首先，针对在步骤3中生成的子矩阵的每一个起因行，计算其已知信息有效比：针对每一个起因行，将已知症状矢量中的症状的对应次数值求和，并除以该行的总和。对于子矩阵中的第i个起因行，其已知信息有效比的计算公式如下：

\frac{\underset{V_{k_{i}} &Element; Attribute}{Σ T_{ij}}}{R {C_{i}}^{'}}

其中，

表示子矩阵中的各属性值，Attribute表示已知症状矢量，Tij表示子矩阵中第i个起因行中的各次数值，RC_i’表示子矩阵中第i个起因行最后一列的次数值，其等于子矩阵中第i个起因行中全部次数值的和。

其次，将各个起因行按照其已知信息有效比从大到小排列，并将已知信息有效比最大的起因当作临时目标起因，而所有其余起因当作次起因。显然，起因行的已知信息有效比表示该起因是产生当前已知信息中的各症状的目标起因的可能性。

如果临时目标起因与信息有效比最大的次起因的已知信息有效比之间的差值大于一阈值，则确定临时目标起因为目标起因，迭代结束。所述阈值可预先确定，并且例如可以为上述按大小排列的各个起因中的两两相邻的起因之间的差的平均值。

第二步，对于临时目标起因，确定最大区别属性，作为将向客户提问的问题。最大区别属性是指对于临时目标起因而言最能区分该起因与其他起因的属性，即最有可能使该起因与其他起因之间的已知信息有效比之间的差超过阈值的属性。该步骤包括如下子步骤：

首先，遍历已知症状所属属性之外的所有剩余属性，对于每一个剩余属性，定义：

正例数：临时目标起因的该剩余属性的所有症状(属性值)的次数值的和，其公式是：

其中，

表示剩余属性t的正例，

表示该剩余属性中的每一个属性值，剩余属性(t)表示该剩余属性t，T_ij表示该临时目标起因对于该剩余属性每一个症状的次数值。

反例数：所有次起因的该剩余属性的所有症状(属性值)的次数值的和，其公式可以是：

其中，表示剩余属性t的反例，

表示该剩余属性中的每一个属性值，剩余属性(t)表示该剩余属性t，T_ij表示次每一个起因对于该剩余属性每一个症状的次数值。

接着，根据每一个剩余属性中的正例数和反例数计算该每一个剩余属性的熵值，其公式可以是：

Entropy (A_{i}) = - \frac{p_{&CirclePlus;}}{p_{&CirclePlus;} + p_{Θ}} \log_{2} \frac{p_{&CirclePlus;}}{p_{&CirclePlus;} + p_{Θ}} - \frac{p_{Θ}}{p_{&CirclePlus;} + p_{Θ}} \log_{2} \frac{p_{Θ}}{p_{&CirclePlus;} + p_{Θ}}

然后，根据每一个剩余属性的熵值计算该剩余属性的信息增益，其公式可以是：

其中，Gain(A_i)表示属性A_i的信息增益，Entropy(A_i)表示属性Ai熵值，v遍历剩余属性中的每一个属性，Entropy(Sv)表示特定剩余属性的熵值，|Sv|表示特定剩余属性的正例数和反例数之和，|S|表示所有剩余属性的正例数和反例数之和。

最后，选择所有剩余属性中信息增益最大的剩余属性，作为最大区别属性，并通过一线支持人员将该属性作为进一步的提问，发送给客户。

当一线支持人员接收到来自客户的对该提问的回答后，提取该回答中包含的属性值，将该属性值附加到上述已知症状矢量，形成扩展的已知症状矢量。然后，针对该扩展的已知症状矢量迭代执行上述步骤，即将该扩展的已知症状矢量发送到根据本发明的实施例的回答支持***，由该回答支持***根据该扩展的已知症状矢量在知识库中进行搜索，从而形成新的子矩阵，通过计算该子矩阵中每一个起因行的已知信息有效比确定临时目标起因和次起因，判断临时目标起因和最大次起因的已知信息有效比之间的差值是否大于阈值，如果大于阈值，则迭代结束，确定临时目标起因为唯一目标起因，生成相应的解决方案，并通过一线支持人员向用户提供该解决方案；如果小于或等于阈值，则通过计算每一个剩余属性的信息增益确定新的最大区别属性，作为将向客户进一步提问的问题。以上过程迭代执行，直到得出唯一目标起因，或者所有剩余属性均已提问完毕，而仍无法得出唯一的目标起因。

在已得出唯一目标起因的情况下，可在图2所示的步骤4中根据该目标起因生成相应的解决方案，并在图2所示的步骤5中将该解决方案提供给一线支持人员，以便由一线支持人员发送给客户。

仅作为示例，所生成的包含唯一目标起因的解决方案的格式可以如下：

------------------------------------------------

第＊＊＊号支持人员：

以下是可能的结果：

客户已经提供了足够的信息，与知识库匹配的症状矢量是

(＊＊＊＊＊，＊＊＊＊＊＊，＊＊＊＊＊，＊＊＊＊)

我们发现第(＊＊＊＊＊)号起因：(症状名称)平台参数不正确，与症状矢量匹配，

它的解决方案是：

配置平台参数＊＊＊并重启机器

最可能的症状是＊＊＊＊，＊＊＊＊和＊＊＊＊＊

请事先进行试验以确保分析正确。谢谢！

-----------------------------------------------

此后，一线支持人员可在图2所示步骤6中向用户询问客户问题是否已解决，如果客户问题已解决，则一线支持人员可在图2所示步骤6.1中相应更新知识库，例如将该起因对于每一个已知症状的次数值加1。如果客户问题没有解决，则可将客户问题提供给资深技术人员进行研究。

在无法得出唯一目标起因的情况下，可生成包含所获得的所有起因的解决方案，并将其提供给一线支持人员。优选地，并在解决方案中包含每一个起因的概率。起因的概率可以通过如下方法计算：

在最后形成的子矩阵中，计算每一个起因对于所有已知症状的次数值的和；将所有起因的次数值的和相加，获得次数值总和；将每个起因的次数值的和除以次数值总和，其商作为每个起因的概率。例如，对于一子矩阵，起因i的概率的公式可以为：

\frac{R {C_{i}}^{'}}{R}

其中RC_i’为该子矩阵中起因i所在的行中所有次数值的和，即该起因对于已知问题症状的次数值之和；R为该子矩阵中全部起因行的所有次数值的总和，即该起因对于已知问题症状的次数值之和与该起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和。

一线支持人员可将包含多个可能起因的解决方案发送给客户，以便由客户通过试验从中确定一个起因。当然，一线支持人员也可以将该解决方案发送给资深技术人员，并请求资深技术人员研究每一个起因及其症状来确定唯一的目标起因，然后根据所确定的唯一的目标起因生成解决方案，并将该解决方案提供给客户。

同样地，一线支持人员向用户询问客户问题是否已解决，如果客户问题已解决，则一线支持人员可相应更新知识库，例如将目标起因对于每一个已知症状的次数值加1。如果客户问题没有解决，则可将客户问题提供给资深技术人员进行研究。

此外，在无法得出唯一的目标起因的情况下，在所获得的多个起因之间可能并非相互独立，即起因之间有可能存在依赖关系。为此，根据本发明的一实施例，可进一步判断和计算起因之间的依赖性，并将依赖性信息包含在提供给一线支持人员的解决方案中。可以使用如下所述卡方(Chi-square)分析方法来计算起因之间的依赖性：

首先使用如下公式计算起因之间的卡方值：

χ^{2} = n (Σ_{i = 1}^{r} Σ_{j = 1}^{c} \frac{T_{ij}^{2}}{R C_{i} R V_{j}} - 1),

其中，x²表示卡方值，r表示包含多个起因的子矩阵的行数，c表示子矩阵的列数，T_ij表示第i行第j列的次数值，RC_i表示第i行的次数值的和，RV_j表示第j行的次数值的和，n表示总的元素数，即r*c。

然后针对本领域中所公知的卡方表，使用自由度(r-1)＊(c-1)查找卡方表中的相应行，在该行中确定卡方值所属的列，从而获得起因之间存在依赖性的概率。

当一线支持人员通过自己研究或请求资深技术人员的研究确认起因之间存在依赖性时，可以在知识库中将相互依赖的起因合并为单个起因。

仅作为示例，所生成的指示起因之间不存在依赖性的解决方案的格式可以如下：

-----------------------------------------------

第＊＊＊号支持人员：

我们已帮助您检查了起因1、起因2...起因n。我们发现有超过99.9％的概率它们之间是相互独立的。

以下是多个可能的起因及它们的概率：

起因1：＊＊＊的概率；

起因2：＊＊＊的概率；

起因3：＊＊＊的概率

请检查这些起因，并且将检查正确的起因的相关数据添加到知识库中。

-------------------------------------------------------------------------

仅作为示例，所生成的指示起因之间存在依赖性的解决方案的格式可以如下：

-----------------------------------------------

第＊＊＊号支持人员：

我们已帮助您检查了起因1、起因2...起因n。我们发现有超过99.9％的概率它们之间是相互依赖的。

以下是多个可能的起因及它们的概率：

起因1：＊＊＊的概率；

起因2：＊＊＊的概率；

起因3：＊＊＊的概率

请检查这些起因，并且将相互依赖的起因进行合并。

-------------------------------------------------------------------------

由于该回答支持***首先通过计算已知信息有效比确定了当前症状的最大可能的起因，并通过计算剩余属性的信息增益获得最能够将该最大可能的起因与其他起因相区别的剩余属性，然后通过向客户提问该属性获得相应的症状，该症状很可能足以将最大可能起因与其他起因区别开来，因此，该回答支持***能够通过向客户提问较少的问题而迅速找到症状的起因。

以上描述了根据本发明的实施例的回答支持***的工作流程。下面参照附图4描述根据本发明的实施例的回答支持方法，该方法可以由根据本发明的实施例的回答支持***实现。为简明起见，在以下描述中省略了部分与以上描述重复的细节，因此，可参见以上描述获得对根据本发明的实施例的回答支持方法的更详细的了解。

如附图4所示，根据本发明的实施例的回答支持方法包括如下步骤：

在步骤401，维护包含关于问题起因与一组问题症状之间的映射关系的历史数据的知识库，在该知识库中，问题症状表示为一组属性中的属性的属性值。

根据本发明的实施例，所述知识库的结构可选地为矩阵，其行表示各问题起因，其列表示各属性以及在每个属性之下的作为属性值的问题症状，其元素表示相应问题起因对于相应问题症状的次数值。

在步骤402，接收当前问题的一个或多个已知问题症状。

在步骤403，使用所接收的一个或多个已知问题症状搜索知识库，以寻找与所述一个或多个已知问题症状对应的潜在起因。

在步骤404，判断是否寻找到多个潜在起因。如果判断为是，则转到步骤405；如果判断为否，则转到步骤415。

在步骤405，根据所述知识库中所述多个潜在起因的关于已知问题症状的历史数据之间的区别确定当前问题的目标起因。

根据本发明的实施例，该步骤405可选地包括以下子步骤：

(1)计算所述多个潜在起因中的每一个潜在起因的已知信息有效比，其中，每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和，除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和。

(2)将所述多个潜在起因按照其已知信息有效比从大到小排序。

(3)判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值。

(4)响应于该判断为是，将已知信息有效比最大的潜在起因确定为当前问题的目标起因。

根据本发明的实施例，所述阈值可选地为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。

在步骤406，判断是否已确定当前问题的目标起因。如果该判断为否，则转到步骤407；如果该判断为是，则转到步骤411。

在步骤407，判断是否已遍历了所有剩余属性。如果该判断是否，则转到步骤408。如果该判断为是，则转到步骤418.

在步骤408，响应于无法确定当前问题的目标起因，根据所述知识库中所述多个潜在起因的历史数据从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择一个待确定属性值的属性，该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因。

根据本发明的实施例，该步骤408可选地包括以下子步骤：

(1)针对所述剩余属性中的每一个剩余属性，将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数，将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数，计算该剩余属性的信息增益。

(2)将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性。

在步骤409，生成并发送包含所选择属性的提问。

在步骤410，从对该提问的回答中接收作为所选择属性的属性值的新的已知问题症状。

然后，返回到步骤405以迭代执行步骤405-410，直到步骤406的判断为是，即已确定当前问题的目标起因，或者步骤407的判断为是，即已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因。

在步骤411，可选地根据所确定的当前问题的目标起因生成针对当前问题的解决方案。

在步骤412，可选地提供针对当前问题的解决方案。例如，将当前问题的解决方案通过一线支持人员提供给客户。

在步骤413，可选地判断是否接收到当前问题已解决的反馈，例如来自客户的反馈。如果该判断为是，则转到步骤414；如果该判断为否，则转到步骤416，将与当前问题相关的信息提供给技术人员进行研究，例如将从客户搜集的一个或多个问题症状提供给技术人员进行研究。

在步骤414，可选地将当前问题的目标起因以及问题症状之间的映射关系存储到知识库中。例如，将知识库中该起因行对于每一个相关症状的次数值加1。然后，过程结束。

响应于在步骤404判断没有寻找到多个潜在起因，在步骤415，判断是否寻找到单个潜在起因，即判断是寻找到单个潜在起因，还是没有寻找到任何潜在起因。如果该判断为是，则执行步骤411，将该潜在起因作为目标起因从而生成针对当前问题的解决方案；如果该判断为否，则执行步骤416。

在步骤416，可选地将与当前问题相关的信息提供给技术人员进行研究。例如，将从客户搜集的一个或多个问题症状提供给技术人员进行研究，或者将从客户搜集的一个或多个问题症状以及***产生的多个潜在起因及其概率提供给技术人员进行研究。

在步骤417，可选地判断是否接收到由技术人员研究出的问题起因。如果该判断为是，则执行步骤414，以将该问题起因与相关症状之间的映射关系存储在知识库中。作为另一种选择，如果该判断为是，则执行步骤411-414，即根据该问题起因生成针对当前问题的解决方案，向客户提供该技术方案，并在接收到来自客户的问题已解决的反馈后，将问题起因及相关症状的映射关系存储在知识库中。如果该判断为否，则流程结束，或进行其他相关处理。

响应于在步骤407判断已遍历所有属性，在步骤418，可选地计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率。

根据本发明的实施例，所述计算每一个潜在起因的概率可选地包括以下子步骤：

(1)计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和。

(2)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加，得到总和。

(3)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和，将所得的商作为每一个潜在起因的概率。

在步骤419，可选地计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性。

根据本发明的实施例，所述计算多个潜在起因之间的依赖性是使用卡方分析完成的。

然后，可选地执行步骤416，以将寻找到的多个潜在起因、每一个潜在起因的概率、潜在起因之间的依赖性以及一个或多个已知症状等与当前问题相关的信息提供给技术人员进行研究。作为另一种选择，也可以首先转到步骤411，以根据所寻找的多个潜在起因生成相应的解决方案，并将该技术方案提供给客户。

以上描述了根据本发明的实施例的回答支持方法的流程，应指出的是，以上描述仅为示例，而不是对本发明的限制。在本发明的其他实施例中，该方法可具有更多、更少或不同的步骤，且各步骤之间的顺序可以与所描述的不同。例如，上述步骤411-419均为可选步骤，而不是必需的。

现在参照附图5描述与上述方法对应的根据本发明的实施例的回答支持***的结构组成。为简明起见，在以下描述中省略了与以上描述重复的部分细节，因此可参见以上描述获得对该***的更详细的了解。

根据本发明的实施例，该回答支持***包括：包含关于问题起因与作为一组属性的属性值的一组问题症状之间的映射关系的历史数据的知识库501；接收装置502，用于接收当前问题的一个或多个已知问题症状；寻找装置503，用于使用所接收的一个或多个问题症状搜索知识库501，以寻找与所述一个或多个已知问题症状对应的潜在起因；确定装置504，用于响应于寻找装置503寻找到多个潜在起因，根据所述知识库501中所述多个潜在起因的关于已知问题症状的历史数据之间的区别确定当前问题的目标起因；选择装置505，用于响应于确定装置504无法确定当前问题的目标起因，根据所述知识库501中所述多个潜在起因的历史数据从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择一个待确定属性值的属性，该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因；提问装置506，用于生成并发送包含所选择属性的提问；所述接收装置502还用于从对该提问的回答中接收作所选择属性的属性值的新的已知问题症状；其中，所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作，直到确定当前问题的目标起因，或者已确定所有剩余属性的属性值而仍未确定当前问题的目标起因。

根据本发明的实施例，该***可选地还包括：生成装置507，用于根据所确定的当前问题的目标起因生成针对当前问题的解决方案；提供装置508，用于提供针对当前问题的解决方案；存储装置509，用于响应于接收到当前问题已解决的反馈，将当前问题的目标起因以及问题症状之间的映射关系存储到知识库501中。

根据本发明的实施例，所述确定装置504可选地还用于：响应于寻找装置503寻找到与所述一个或多个问题症状对应的单个潜在起因，将该潜在起因确定为当前问题的目标起因。

根据本发明的实施例，所述提供装置508可选地还用于响应于在寻找装置503没有寻找到与所述一个或多个问题症状对应的潜在起因，将所述一个或多个问题症状提供给技术人员进行研究；以及所述存储装置509可选地还用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其问题症状之间的映射关系存储到知识库501中。

根据本发明的实施例，所述提供装置508可选地还用于响应于所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因，将所接收的一个或多个已知问题症状以及从知识库501中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因提供给技术人员进行研究；以及所述存储装置509还用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库501中。

根据本发明的实施例，所述知识库501的结构可选地为矩阵，其行表示各问题起因，其列表示各属性以及在每个属性之下的作为属性值的问题症状，其元素表示相应问题起因对于相应问题症状的次数值。

根据本发明的实施例，所述确定装置504可选地包括：用于计算所述多个潜在起因中的每一个潜在起因的已知信息有效比的装置，其中，每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和，除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和；用于将所述多个潜在起因按照其已知信息有效比从大到小排序的装置；用于判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值的装置；以及用于响应于判断为是，将已知信息有效比最大的潜在起因确定为当前问题的目标起因的装置。

根据本发明的实施例，所述选择装置505可选地包括：用于针对所述剩余属性中的每一个剩余属性，将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数，将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数，计算该剩余属性的信息增益的装置；以及用于将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性的装置。

根据本发明的实施例，该***可选地还包括：概率计算装置，用于响应于所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因，计算从知识库501中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率，并将所述一个或多个已知问题症状以及所述多个潜在起因与每一个潜在起因的概率一起提供给技术人员进行研究；以及所述存储装置509可选地还用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库501中，

根据本发明的实施例，所述概率计算装置可选地包括：用于计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和的装置；用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加，得到总和的装置；用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和，将所得的商作为每一个潜在起因的概率的装置。

根据本发明的实施例，该***可选地还包括：依赖性计算装置，用于响应于所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因，计算从知识库501中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性，并将所述一个或多个已知问题症状以及所述多个潜在起因及其之间的依赖性一起提供给技术人员进行研究；以及所述存储装置509可选地还用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库501中，其中，所述依赖性计算装置使用卡方分析计算多个潜在起因之间的依赖性。

以上描述了根据本发明的实施例的回答支持***的结构组成，应指出的是，以上描述仅为示例，而不是对本发明的限制。在本发明的其他实施例中，该装置可具有更多、更少或不同的模块，且各模块之间的关系可以与所描述的不同。

本发明可以硬件、软件、或硬件与软件的结合的方式实现。本发明可以集中的方式在一个计算机***中实现，或以分布方式实现，在这种分布方式中，不同的部件分布在若干互连的计算机***中。适于执行本文中描述的方法的任何计算机***或其它装置都是合适的。一种典型的硬件和软件的组合可以是带有计算机程序的通用计算机***，当该计算机程序被加载和执行时，控制该计算机***而使其执行本发明的方法，并构成本发明的装置。

本发明也可体现在计算机程序产品中，该程序产品包含使能实现本文中描述的方法的所有特征，并且当其被加载到计算机***中时，能够执行所述方法。

尽管已参照优选实施例具体示出和说明了本发明，但是本领域内的那些技术人员应理解，可在形式和细节上对其进行各种改变而不会背离本发明的精神和范围。

Claims

1.一种回答支持方法，包括：

(a)维护包含问题起因与一组问题症状之间的映射关系的历史数据的知识库，在该知识库中问题症状表示为一组属性中的属性的属性值；

(b)接收当前问题的一个或多个已知问题症状；

(c)使用所接收的一个或多个已知问题症状搜索知识库，以寻找与所述一个或多个已知问题症状对应的潜在起因；

(d)响应于寻找到多个潜在起因，根据所述知识库中所述多个潜在起因的历史数据之间的区别确定当前问题的目标起因，所述多个潜在起因的历史数据是关于已知问题症状的；

(e)响应于无法确定当前问题的目标起因，根据所述知识库中所述多个潜在起因的历史数据选择一个待确定属性值的属性，所述一个待确定属性值的属性是从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择的，该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因；

(f)生成并发送包含所选择属性的提问；

(g)从对该提问的回答中接收作为所选择属性的属性值的新的已知问题症状；

其中，迭代执行步骤(d)、(e)、(f)、(g)，直到确定当前问题的目标起因，或者已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因。

2.根据权利要求1的方法，还包括：

(h)根据所确定的当前问题的目标起因生成针对当前问题的解决方案；

(i)提供针对当前问题的解决方案；

(j)响应于接收到当前问题已解决的反馈，将当前问题的目标起因以及问题症状之间的映射关系存储到知识库中。

3.根据权利要求1的方法，还包括：

(k)响应于在步骤(c)寻找到与所述一个或多个问题症状对应的单个潜在起因，将该潜在起因确定为当前问题的目标起因。

4.根据权利要求1的方法，还包括：

(l)响应于在步骤(c)没有寻找到与所述一个或多个问题症状对应的潜在起因，将所述一个或多个问题症状提供给技术人员进行研究；以及

(m)响应于接收到由技术人员研究出的问题起因，将该问题起因及其问题症状之间的映射关系存储到知识库中。

5.根据权利要求1的方法，还包括：

(n)响应于迭代执行步骤(d)、(e)、(f)、(g)已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因，将所接收的一个或多个已知问题症状以及从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因提供给技术人员进行研究；以及

(o)响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库中。

6.根据权利要求1的方法，其中，所述知识库的结构为矩阵，其行表示各问题起因，其列表示各属性以及在每个属性之下的作为属性值的问题症状，其元素表示相应问题起因对于相应问题症状的次数值。

7.根据权利要求6的方法，其中，步骤(d)包括：

(d1)计算所述多个潜在起因中的每一个潜在起因的已知信息有效比，其中，每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和，除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和；

(d2)将所述多个潜在起因按照其已知信息有效比从大到小排序；

(d3)判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值；以及

(d4)响应于判断为是，将已知信息有效比最大的潜在起因确定为当前问题的目标起因。

8.根据权利要求7的方法，其中，所述阈值为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。

9.根据权利要求7的方法，其中，步骤(e)包括：

(e1)针对所述剩余属性中的每一个剩余属性，将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数，将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数，计算该剩余属性的信息增益；以及

(e2)将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性。

10.根据权利要求6的方法，还包括：

(p)响应于迭代执行步骤(d)、(e)、(f)、(g)已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因，计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率，并将所述一个或多个已知问题症状以及所述多个潜在起因与每一个潜在起因的概率一起提供给技术人员进行研究；以及

(q)响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库中，

其中，所述计算每一个潜在起因的概率包括：

(p1)计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和；

(p2)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加，得到总和；以及

(p3)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和，将所得的商作为每一个潜在起因的概率。

11.根据权利要求6的方法，还包括：

(r)响应于迭代执行步骤(d)、(e)、(f)、(g)已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因，计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性，并将所述一个或多个已知问题症状以及所述多个潜在起因及其之间的依赖性一起提供给技术人员进行研究；以及

(s)响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库中，

其中，所述计算多个起因之间的依赖性是使用卡方分析完成的。

12.一种回答支持***，包括：

包含关于问题起因与一组问题症状之间的映射关系的历史数据的知识库，在该知识库中问题症状表示为一组属性中的属性的属性值；

接收装置，用于接收当前问题的一个或多个已知问题症状；

寻找装置，用于使用所接收的一个或多个问题症状搜索知识库，以寻找与所述一个或多个已知问题症状对应的潜在起因；

确定装置，用于响应于寻找装置寻找到多个潜在起因，根据所述知识库中所述多个潜在起因的历史数据之间的区别确定当前问题的目标起因，所述多个潜在起因的历史数据是关于已知问题症状的；

选择装置，用于响应于确定装置无法确定当前问题的目标起因，根据所述知识库中所述多个潜在起因的历史数据选择一个待确定属性值的属性，所述一个待确定属性值的属性是从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择的，该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因；

提问装置，用于生成并发送包含所选择属性的提问；

所述接收装置还用于从对该提问的回答中接收作所选择属性的属性值的新的已知问题症状；

其中，所述确定装置、选择装置、提问装置、接收装置迭代执行其操作，直到确定当前问题的目标起因，或者已确定所有剩余属性的属性值而仍未确定当前问题的目标起因。

13.根据权利要求12的***，还包括：

生成装置，用于根据所确定的当前问题的目标起因生成针对当前问题的解决方案；

提供装置，用于提供针对当前问题的解决方案；以及

存储装置，用于响应于接收到当前问题已解决的反馈，将当前问题的目标起因以及问题症状之间的映射关系存储到知识库中。

14.根据权利要求12的***，其中，所述确定装置还用于：

响应于寻找装置寻找到与所述一个或多个问题症状对应的单个潜在起因，将该潜在起因确定为当前问题的目标起因。

15.根据权利要求12的***，还包括：

提供装置，用于响应于在寻找装置没有寻找到与所述一个或多个问题症状对应的潜在起因，将所述一个或多个问题症状提供给技术人员进行研究；以及

存储装置，用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其问题症状之间的映射关系存储到知识库中。

16.根据权利要求12的***，还包括：

提供装置，用于响应于所述确定装置、选择装置、提问装置、接收装置迭代执行其操作已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因，将所接收的一个或多个已知问题症状以及从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因提供给技术人员进行研究；以及

存储装置，用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库中。

17.根据权利要求12的***，其中，所述知识库的结构为矩阵，其行表示各问题起因，其列表示各属性以及在每个属性之下的作为属性值的问题症状，其元素表示相应问题起因对于相应问题症状的次数值。

18.根据权利要求17的***，其中，所述确定装置包括：

用于计算所述多个潜在起因中的每一个潜在起因的已知信息有效比的装置，其中，每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和，除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和；

用于将所述多个潜在起因按照其已知信息有效比从大到小排序的装置；

用于判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值的装置；以及

用于响应于判断为是，将已知信息有效比最大的潜在起因确定为当前问题的目标起因的装置。

19.根据权利要求18的***，其中，所述阈值为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。

20.根据权利要求18的***，其中，所述选择装置包括：

用于针对所述剩余属性中的每一个剩余属性，将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数，将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数，计算该剩余属性的信息增益的装置；以及

用于将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性的装置。

21.根据权利要求17的***，还包括：

概率计算装置，用于响应于所述确定装置、选择装置、提问装置、接收装置迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因，计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率，并将所述一个或多个已知问题症状以及所述多个潜在起因与每一个潜在起因的概率一起提供给技术人员进行研究；以及

存储装置，用于响应于接收到由技术人员研究出的问题起因，将该问题起因及其已知问题症状之间的映射关系存储到知识库中，

其中，概率计算装置包括：

用于计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和的装置；

用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加，得到总和的装置；以及

用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和，将所得的商作为每一个潜在起因的概率的装置。

22.根据权利要求17的***，还包括：

依赖性计算装置，用于响应于所述确定装置、选择装置、提问装置、接收装置迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因，计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性，并将所述一个或多个已知问题症状以及所述多个潜在起因及其之间的依赖性一起提供给技术人员进行研究；以及

其中，所述依赖性计算装置使用卡方分析计算多个潜在起因之间的依赖性。