CN102081631A - 回答支持***和方法 - Google Patents

回答支持***和方法 Download PDF

Info

Publication number
CN102081631A
CN102081631A CN2009102471249A CN200910247124A CN102081631A CN 102081631 A CN102081631 A CN 102081631A CN 2009102471249 A CN2009102471249 A CN 2009102471249A CN 200910247124 A CN200910247124 A CN 200910247124A CN 102081631 A CN102081631 A CN 102081631A
Authority
CN
China
Prior art keywords
cause
attribute
potential
symptom
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009102471249A
Other languages
English (en)
Inventor
周韡
邹青
高鹏
杨婕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to CN2009102471249A priority Critical patent/CN102081631A/zh
Priority to US12/955,772 priority patent/US8595174B2/en
Publication of CN102081631A publication Critical patent/CN102081631A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种回答支持方法和***,该方法包括:(a)维护包含关于起因与一组症状之间的映射关系的历史数据的知识库,在知识库中问题症状表示为一组属性的属性值;(b)接收当前问题的已知症状;(c)使用已知症状搜索知识库,以寻找对应的起因;(d)响应于寻找到多个起因,根据多个起因的关于已知症状的历史数据之间的区别确定目标起因;(e)响应于无法确定目标起因,根据知识库中多个起因的历史数据从剩余属性中选择一个属性,该属性的属性值的确定最有可能使得确定目标起因;(f)生成并发送包含所选属性的提问;(g)从对该提问的回答中接收新的已知症状;其中,迭代执行步骤(d)、(e)、(f)、(g),直到确定目标起因,或者已确定所有剩余属性的属性值而仍未能确定目标起因。

Description

回答支持***和方法
技术领域
本发明涉及计算机领域,具体涉及一种回答支持***和方法。
背景技术
在现代社会,随着诸如软件厂商等企业以及其他机构为客户提供越来越复杂的产品和服务,很多企业和其他机构设立了支持部门来回答客户就其产品和服务提出的各种问题。如何迅速地判断客户问题的性质,向客户搜集进一步的信息,并迅速有效地回答和解决客户的问题,是企业和其他机构所面临的一项挑战。
图1示出了一个典型的软件企业的客户支持流程。如图所示,在步骤1,一线支持人员通过与客户通话等方式搜集与问题相关的信息。所搜集的信息例如包括客户遇到的是什么问题,软件产品运行在什么环境下,客户看到了什么,日志中报告了什么,在问题产生前进行了什么更改,等等。
在步骤2,一线支持人员分析所搜集的信息。该步骤可包括如下两个子步骤:
在步骤2.1,一线支持人员确定所搜索的信息对于确定问题的起因是否已足够。如果已足够,则进行到步骤3。如果还不够,则转到步骤2.2。
在步骤2.2,一线支持人员通过与客户交谈搜集更多的信息。
在步骤3,一线支持人员确定自己能否解决该问题。如果能解决,则转到步骤4;如果不能解决,则转到步骤8。
在步骤4,一线支持人员形成解决方案。
在步骤5,一线支持人员将解决方案提供给客户。
在步骤6,一线支持人员询问客户问题是否已解决。如果问题已解决,则转到步骤7,流程结束。如果问题没有解决,则返回到步骤2.1。
在步骤8,将问题转给二线支持人员,例如资深技术人员。
在以上客户支持流程中,步骤2和4显然高度依赖于一线支持人员的技能和经验。对于资历较浅的支持人员来说,需要花费较长时间才能获得这些技能和经验;而在这之前,他或她将无法为客户提供满意的技术支持。对于资深技术人员来说,日复一日地重复这种流程又是厌倦的,且是人力资源的浪费。如果客户的问题是与不常用的组件相关的,而资深技术人员很久以前处理过类似问题,那么问题的根源可能无法找到。更严重的是,当资深技术人员离职之后,企业将丧失其有价值的经验。
为了提高支持人员确定问题起因的效率和正确性以便提高客户满意度,人们提出了回答支持***(answer support system)等用于协助支持人员工作的自动化辅助工具。例如,标题为“Answer support system,answersupport apparatus,and answer support program”的美国专利申请US20060078862提出了一种回答支持***,该***存储和利用过去的询问案例,从而能够自动为客户的问题呈现适当的回答。然而,由于该发明只能利用客户已提供的信息,而不能动态产生问题集,也不能动态改变问题列表,以便向客户提问适当的问题,因此不能高效地发现客户问题的起因。
发明内容
根据本发明的一个方面,提供了一种回答支持***,包括:包含关于问题起因与一组问题症状之间的映射关系的历史数据的知识库,在该知识库中问题症状表示为一组属性中的属性的属性值;接收装置,用于接收当前问题的一个或多个已知问题症状;寻找装置,用于使用所接收的一个或多个问题症状搜索知识库,以寻找与所述一个或多个已知问题症状对应的潜在起因;确定装置,用于响应于寻找装置寻找到多个潜在起因,根据所述知识库中所述多个潜在起因的历史数据之间的区别确定当前问题的目标起因,所述多个潜在起因的历史数据是关于已知问题症状的;选择装置,用于响应于确定装置无法确定当前问题的目标起因,根据所述知识库中所述多个潜在起因的历史数据选择一个待确定属性值的属性,所述一个待确定属性值的属性是从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择的,该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因;提问装置,用于生成并发送包含所选择属性的提问;所述接收装置还用于从对该提问的回答中接收作所选择属性的属性值的新的已知问题症状;其中,所述寻找装置、确定装置、选择装置、提问装置、接收装置迭代执行其操作,直到确定当前问题的目标起因,或者已确定所有剩余属性的属性值而仍未确定当前问题的目标起因。
根据本发明的另一个方面,提供了一种回答支持方法,包括:(a)维护包含关于问题起因与作为一组属性的属性值的一组问题症状之间的映射关系的历史数据的知识库,在该知识库中问题症状表示为一组属性中的属性的属性值;(b)接收当前问题的一个或多个已知问题症状;(c)使用所接收的一个或多个已知问题症状搜索知识库,以寻找与所述一个或多个已知问题症状对应的潜在起因;(d)响应于寻找到多个潜在起因,根据所述知识库中所述多个潜在起因的关于已知问题症状的历史数据之间的区别确定当前问题的目标起因;(e)响应于无法确定当前问题的目标起因,根据所述知识库中所述多个潜在起因的历史数据从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择一个待确定属性值的属性,该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因;(f)生成并发送包含所选择属性的提问;(g)从对该提问的回答中接收作为所选择属性的属性值的新的已知问题症状;其中,迭代执行步骤(d)、(e)、(f)、(g),直到确定当前问题的目标起因,或者已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因。
通过使用本发明的回答支持***,一线支持人员可以不再依赖其自身经验和技能,而是可以利用本发明的回答支持***来确定客户的问题的起因并提供解决方案,从而加快了问题解决过程,提高了客户满意度。此外,资历较浅的一线支持人员可以在为客户提供支持服务的同时利用该***迅速提高技能,因为,该***中存储有关于各种起因及问题症状的关联的结构化知识,该知识是基于过去的案例以及资深技术人员的经验。因此,该***可用作一个低成本和见效快的培训***。对于资深技术人员来说,该***使他们可以摆脱接听和回答客户问题的琐屑工作,而致力于研究更复杂的问题,并将研究结果添加到***中,从而使***在未来能够自动解决该问题。当然,资深技术人员还可以利用该***发现对于所研究问题的已有解决方案,而不必进行重复的分析,从而提高了研究工作的效率。
附图说明
所附权利要求中阐述了被认为是本发明的特点的创造性特征。但是,通过参照附图阅读下面对说明性实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点,在附图中:
图1示出了一个典型的软件企业的客户支持流程;
图2示出了一线支持人员利用本发明的回答支持***提供客户支持的流程;
图3示出了根据本发明的实施例的回答支持***中的知识库的示例性结构;
图4示出了根据本发明的实施例的回答支持方法;以及
图5示出了与根据本发明的实施例的回答支持***的结构组成。
具体实施方式
本发明的回答支持***在知识库中存储有关于客户案例的起因-症状二维表(或称矩阵)。本发明的回答支持***根据由从用户搜集的问题描述中获得的症状通过所述二维表自动生成将对客户的动态提问列表,所述列表中的提问及顺序都是动态的,即取决于二维表中的起因/症状关联以及客户的最初问题描述和对先前提问的回答。
本发明的回答支持***可用于为一线支持人员提供支持,即为一线支持人员生成对客户的提问,并最终确定客户问题的起因,从而生成客户问题的解决方案。
此外,资深技术人员可以致力于研究知识库中没有解决方案的问题,将研究得出的解决方案发送给客户,并存储在知识库中以便重用。
下面参照附图来说明本发明的实施例。在下面的说明中,阐述了许多具体细节以便更全面地了解本发明。但是,对于本技术领域内的技术人员明显的是,本发明的实现可不具有这些具体细节中的一些。此外,应当理解的是,本发明并不限于所介绍的特定实施例。相反,可以考虑用下面的特征和要素的任意组合来实施本发明,而无论它们是否涉及不同的实施例。因此,下面的方面、特征、实施例和优点仅作说明之用而不应被看作是所附权利要求的要素或限定,除非权利要求中明确提出。
图2示出了一线支持人员利用本发明的回答支持***提供客户支持的流程。如图所示,在支持人员在步骤1从客户搜集到问题相关信息后,在步骤2将所搜集的信息发送到本发明的回答支持***。在步骤3,本发明的回答支持***判断所搜集的信息对于确定客户问题的起因是否已经足够。如果还不够,则转到步骤3.1,生成新的提问,并提供给支持人员,以便由支持人员在步骤1中通过向客户发出该新的提问搜集进一步的信息,并进一步在步骤2中将所搜集的进一步信息发送到本发明的回答支持***。如果在步骤3判断所搜集的信息对于确定客户问题的起因已经足够,则在步骤3.2判断知识库中是否存在已有的解决方案。如果存在已有的解决方案,则在步骤4生成解决方案,并在步骤5将该解决方案通过支持人员提供给客户,然后在步骤6通过接收客户反馈确定问题是否已解决。如果问题已解决,则在步骤6.1将结果存储在知识库中,并在步骤7结束。如果在步骤3.2判断知识库中不存在已有的解决方案,或在步骤6确定问题没有解决,则转到步骤8,将问题转给二线的资深技术人员。二线的资深技术人员如果经过研究确定了问题的起因从而解决了该问题,可将该问题的解决方案,即起因与症状的关联,存储在知识库中。
下面参照附图更详细地描述根据本发明的实施例的回答支持***的工作流程。
图3示出了根据本发明的实施例的回答支持***中的知识库的示例性结构。如图所示,该知识库的整体结构是一个二维矩阵,其表示起因与症状的之间的映射关系的历史数据。起因是指导致问题的根源,确定了问题的起因就确定了问题的解决方案。症状是指问题的一系列表现。症状可划分为类别,每一个类别可称为属性,症状即为属性值。每一个属性可具有多个属性值。
在图3所示的知识库结构中,Ci表示起因,i=1...m;
Attribute k表示属性,k=1...t,属性之间是离散的、非重叠的;
Vj表示症状,即属性值,j=1...n,同一个属性的属性值之间是离散的、非重叠的;
Tij表示起因Ci对于症状Vj的次数值;
RCi表示起因Ci对于所有症状的次数值的和,即Ci行中所有Tij的和;
RVj表示所有起因对于症状Vj的次数值的和,即Vj列中所有Tij的和;
R表示所有RCi的和。
对于软件产品来说,属性可以是用户使用的平台、机器崩溃的时间、软件产品的版本等等,而起因可以是造成问题的各种具体原因。例如,以IBM Tivoli Integrated Portal为例,其知识库片段示例可以如下所示:
Figure G2009102471249D00061
该知识库中的初始数据可以由一线支持人员或资深技术人员或其他人员根据关于客户问题的历史数据录入。在根据本发明的实施例的回答支持***的运行过程,***将自动更新该知识库中的数据。资深技术人员也可以根据自己对客户问题的研究结果将相应的起因和症状数据录入到该知识库。此外,资深技术人员还可以对该知识库进行各种维护,例如,整理知识中的数据,增减调整知识库中的属性和属性值,等等。
在本发明的该实施例中,在图2所示步骤1中,一线支持人员将从客户获得问题的症状描述,并从中产生已知症状矢量,该已知症状矢量中的每个元素值对应于知识库中的一个属性值。例如,从症状描述“在Windows平台上,Tip 1.2被成功安装,但无法登录”可以产生症状矢量(windows XP平台,Tip 1.2,按钮禁用)。如果症状描述中包含了不与知识库中的任何一个属性值对应的症状,该症状也不属于任何一个属性,则一线支持人员可以将该症状及相关信息发送给资深技术人员,以便由资深技术人员决定是否将该症状对应的属性值添加到知识库中。
在本发明的该实施列中,在图2所示步骤2中,一线支持人员将把所产生的已知症状矢量发送到根据本发明的实施例的回答支持***。
在本发明的该实施例中,在图2所示步骤3中,该回答支持***将执行以下子操作:根据已知症状矢量在知识库中进行搜索,对于知识库中的每一行,如果该行中与症状矢量中的每个症状对应的次数值均为空或为零(即该起因在历史中无证据表明其表现于已知症状中任何一个),则将该行去除;而如果该行中与症状矢量中的各个症状对应的次数值中至少一个非空和非零,则保留该行,从而生成一个子矩阵。然后,在该子矩阵中将症状矢量中每个症状所属的属性中的其他属性值的列删除。也就是说,所生成的子矩阵中的行是原矩阵中包含至少一个对应于症状矢量中的症状的次数值的所有行,而所生成的子矩阵中的列是原矩阵中对应于症状矢量中的症状的属性值列以及所有其余属性的各属性值列。此外,可以重新生成各行与各列的和。
然后,判断所生成的子矩阵中包含的行数是否小于2。如果判断所得到的子矩阵中包含的行数小于2,即得到的起因数小于2,则执行图2中所示的步骤3.2。
在步骤3.2中进一步判断所生成的子矩阵是否为空。如果判断子矩阵为空,即包含的行数为零,表明无法根据所述症状矢量找到起因,则在步骤8将与该问题相关的信息如症状矢量发送给资深技术人员,以便由资深技术人员进行处理,例如通过研究该问题获得相应的起因,并将该起因及相关症状录入知识库中,以用于未来的问题解决。如果在步骤3.2中判断子矩阵非空,即包含的行数为1,表明已经根据所述症状矢量找到了起因,则转到步骤4,生成包含对应于该起因的解决方案,并在步骤5将通过一线支持人员将解决方案提供给客户。当然,在所生成的子矩阵中仅包含一行的情况下,一线支持人员也可以进一步判断该行中的已知症状的次数值是否均大于或等于1,并可进一步针对该行中的已知症状之外的其余属性向客户提出一个或多个问题,通过客户的回答中包含的症状找到该行中对应的其余属性值中的次数值,并根据所述次数值进一步判断所得到的起因是否正确(例如,如果所有次数值均大于等于1,则可判断起因正确)。如果判断所得到的起因正确,则在步骤4生成对应于该起因的解决方案,并将其通过一线支持人员提供给客户;否则,可在步骤8将与该问题相关的信息如症状矢量发送给资深技术人员进行处理,例如通过研究该问题获得相应的起因,并将该起因及相关症状录入知识库中,以用于未来的问题解决。
如果在步骤3中判断所生成的子矩阵的行数大于或等于2,则执行图2中所示的步骤3.1,以生成将向客户提问的问题。
该步骤基于修改的ID3算法以产生动态问题集,来迭代扩展症状矢量,从而尽可能快地找到问题的起因。传统的ID3算法用于根据一组示例来构造一个决策树,该组示例中的每一个都包含若干属性的属性值以及一个目标属性值或分类。该算法通过计算每一个属性的基于熵的信息增益并将各属性按照其信息增益的大小排列来确定检测各属性的顺序,从而构造出决策树,该决策树的根节点和中间节点代表各属性,树枝代表属性值,而叶节点代表目标属性值或目标分类。所构造的决策树可用于针对当前示例的各属性值确定其目标属性值或目标分类。
尽管传统的ID3算法能够用来根据当前示例的属性值确定其目标属性值或目标分类,但由于它对任何当前示例都使用同一个决策树使用相同的属性值序列来求解其目标属性值,因此并不适合于在诸如软件产品的技术支持等存在较多目标属性值或目标分类以及较多属性的复杂场合快速找到当前示例的目标属性值或目标分类。
本发明借鉴了传统的ID3算法中根据不同属性的信息增益来选择属性的思想,形成了本发明的修改的ID3算法。该修改的ID3算法包括如下迭代步骤:
第一步,锁定目标起因。首先,针对在步骤3中生成的子矩阵的每一个起因行,计算其已知信息有效比:针对每一个起因行,将已知症状矢量中的症状的对应次数值求和,并除以该行的总和。对于子矩阵中的第i个起因行,其已知信息有效比的计算公式如下:
Σ T ij V k i ∈ Attribute R C i ′
其中,
Figure G2009102471249D00092
表示子矩阵中的各属性值,Attribute表示已知症状矢量,Tij表示子矩阵中第i个起因行中的各次数值,RCi’表示子矩阵中第i个起因行最后一列的次数值,其等于子矩阵中第i个起因行中全部次数值的和。
其次,将各个起因行按照其已知信息有效比从大到小排列,并将已知信息有效比最大的起因当作临时目标起因,而所有其余起因当作次起因。显然,起因行的已知信息有效比表示该起因是产生当前已知信息中的各症状的目标起因的可能性。
如果临时目标起因与信息有效比最大的次起因的已知信息有效比之间的差值大于一阈值,则确定临时目标起因为目标起因,迭代结束。所述阈值可预先确定,并且例如可以为上述按大小排列的各个起因中的两两相邻的起因之间的差的平均值。
第二步,对于临时目标起因,确定最大区别属性,作为将向客户提问的问题。最大区别属性是指对于临时目标起因而言最能区分该起因与其他起因的属性,即最有可能使该起因与其他起因之间的已知信息有效比之间的差超过阈值的属性。该步骤包括如下子步骤:
首先,遍历已知症状所属属性之外的所有剩余属性,对于每一个剩余属性,定义:
正例数:临时目标起因的该剩余属性的所有症状(属性值)的次数值的和,其公式是:
Figure G2009102471249D00101
其中,
Figure G2009102471249D00102
表示剩余属性t的正例,
Figure G2009102471249D00103
表示该剩余属性中的每一个属性值,剩余属性(t)表示该剩余属性t,Tij表示该临时目标起因对于该剩余属性每一个症状的次数值。
反例数:所有次起因的该剩余属性的所有症状(属性值)的次数值的和,其公式可以是:
Figure G2009102471249D00104
其中,表示剩余属性t的反例,
Figure G2009102471249D00106
表示该剩余属性中的每一个属性值,剩余属性(t)表示该剩余属性t,Tij表示次每一个起因对于该剩余属性每一个症状的次数值。
接着,根据每一个剩余属性中的正例数和反例数计算该每一个剩余属性的熵值,其公式可以是:
Entropy ( A i ) = - p ⊕ p ⊕ + p Θ log 2 p ⊕ p ⊕ + p Θ - p Θ p ⊕ + p Θ log 2 p Θ p ⊕ + p Θ
然后,根据每一个剩余属性的熵值计算该剩余属性的信息增益,其公式可以是:
其中,Gain(Ai)表示属性Ai的信息增益,Entropy(Ai)表示属性Ai熵值,v遍历剩余属性中的每一个属性,Entropy(Sv)表示特定剩余属性的熵值,|Sv|表示特定剩余属性的正例数和反例数之和,|S|表示所有剩余属性的正例数和反例数之和。
最后,选择所有剩余属性中信息增益最大的剩余属性,作为最大区别属性,并通过一线支持人员将该属性作为进一步的提问,发送给客户。
当一线支持人员接收到来自客户的对该提问的回答后,提取该回答中包含的属性值,将该属性值附加到上述已知症状矢量,形成扩展的已知症状矢量。然后,针对该扩展的已知症状矢量迭代执行上述步骤,即将该扩展的已知症状矢量发送到根据本发明的实施例的回答支持***,由该回答支持***根据该扩展的已知症状矢量在知识库中进行搜索,从而形成新的子矩阵,通过计算该子矩阵中每一个起因行的已知信息有效比确定临时目标起因和次起因,判断临时目标起因和最大次起因的已知信息有效比之间的差值是否大于阈值,如果大于阈值,则迭代结束,确定临时目标起因为唯一目标起因,生成相应的解决方案,并通过一线支持人员向用户提供该解决方案;如果小于或等于阈值,则通过计算每一个剩余属性的信息增益确定新的最大区别属性,作为将向客户进一步提问的问题。以上过程迭代执行,直到得出唯一目标起因,或者所有剩余属性均已提问完毕,而仍无法得出唯一的目标起因。
在已得出唯一目标起因的情况下,可在图2所示的步骤4中根据该目标起因生成相应的解决方案,并在图2所示的步骤5中将该解决方案提供给一线支持人员,以便由一线支持人员发送给客户。
仅作为示例,所生成的包含唯一目标起因的解决方案的格式可以如下:
------------------------------------------------
第***号支持人员:
以下是可能的结果:
客户已经提供了足够的信息,与知识库匹配的症状矢量是
(*****,******,*****,****)
我们发现第(*****)号起因:(症状名称)平台参数不正确,与症状矢量匹配,
它的解决方案是:
配置平台参数***并重启机器
最可能的症状是****,****和*****
请事先进行试验以确保分析正确。谢谢!
-----------------------------------------------
此后,一线支持人员可在图2所示步骤6中向用户询问客户问题是否已解决,如果客户问题已解决,则一线支持人员可在图2所示步骤6.1中相应更新知识库,例如将该起因对于每一个已知症状的次数值加1。如果客户问题没有解决,则可将客户问题提供给资深技术人员进行研究。
在无法得出唯一目标起因的情况下,可生成包含所获得的所有起因的解决方案,并将其提供给一线支持人员。优选地,并在解决方案中包含每一个起因的概率。起因的概率可以通过如下方法计算:
在最后形成的子矩阵中,计算每一个起因对于所有已知症状的次数值的和;将所有起因的次数值的和相加,获得次数值总和;将每个起因的次数值的和除以次数值总和,其商作为每个起因的概率。例如,对于一子矩阵,起因i的概率的公式可以为:
R C i ′ R
其中RCi’为该子矩阵中起因i所在的行中所有次数值的和,即该起因对于已知问题症状的次数值之和;R为该子矩阵中全部起因行的所有次数值的总和,即该起因对于已知问题症状的次数值之和与该起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和。
一线支持人员可将包含多个可能起因的解决方案发送给客户,以便由客户通过试验从中确定一个起因。当然,一线支持人员也可以将该解决方案发送给资深技术人员,并请求资深技术人员研究每一个起因及其症状来确定唯一的目标起因,然后根据所确定的唯一的目标起因生成解决方案,并将该解决方案提供给客户。
同样地,一线支持人员向用户询问客户问题是否已解决,如果客户问题已解决,则一线支持人员可相应更新知识库,例如将目标起因对于每一个已知症状的次数值加1。如果客户问题没有解决,则可将客户问题提供给资深技术人员进行研究。
此外,在无法得出唯一的目标起因的情况下,在所获得的多个起因之间可能并非相互独立,即起因之间有可能存在依赖关系。为此,根据本发明的一实施例,可进一步判断和计算起因之间的依赖性,并将依赖性信息包含在提供给一线支持人员的解决方案中。可以使用如下所述卡方(Chi-square)分析方法来计算起因之间的依赖性:
首先使用如下公式计算起因之间的卡方值:
χ 2 = n ( Σ i = 1 r Σ j = 1 c T ij 2 R C i R V j - 1 ) ,
其中,x2表示卡方值,r表示包含多个起因的子矩阵的行数,c表示子矩阵的列数,Tij表示第i行第j列的次数值,RCi表示第i行的次数值的和,RVj表示第j行的次数值的和,n表示总的元素数,即r*c。
然后针对本领域中所公知的卡方表,使用自由度(r-1)*(c-1)查找卡方表中的相应行,在该行中确定卡方值所属的列,从而获得起因之间存在依赖性的概率。
当一线支持人员通过自己研究或请求资深技术人员的研究确认起因之间存在依赖性时,可以在知识库中将相互依赖的起因合并为单个起因。
仅作为示例,所生成的指示起因之间不存在依赖性的解决方案的格式可以如下:
-----------------------------------------------
第***号支持人员:
我们已帮助您检查了起因1、起因2...起因n。我们发现有超过99.9%的概率它们之间是相互独立的。
以下是多个可能的起因及它们的概率:
起因1:***的概率;
起因2:***的概率;
起因3:***的概率
请检查这些起因,并且将检查正确的起因的相关数据添加到知识库中。
-------------------------------------------------------------------------
仅作为示例,所生成的指示起因之间存在依赖性的解决方案的格式可以如下:
-----------------------------------------------
第***号支持人员:
我们已帮助您检查了起因1、起因2...起因n。我们发现有超过99.9%的概率它们之间是相互依赖的。
以下是多个可能的起因及它们的概率:
起因1:***的概率;
起因2:***的概率;
起因3:***的概率
请检查这些起因,并且将相互依赖的起因进行合并。
-------------------------------------------------------------------------
由于该回答支持***首先通过计算已知信息有效比确定了当前症状的最大可能的起因,并通过计算剩余属性的信息增益获得最能够将该最大可能的起因与其他起因相区别的剩余属性,然后通过向客户提问该属性获得相应的症状,该症状很可能足以将最大可能起因与其他起因区别开来,因此,该回答支持***能够通过向客户提问较少的问题而迅速找到症状的起因。
以上描述了根据本发明的实施例的回答支持***的工作流程。下面参照附图4描述根据本发明的实施例的回答支持方法,该方法可以由根据本发明的实施例的回答支持***实现。为简明起见,在以下描述中省略了部分与以上描述重复的细节,因此,可参见以上描述获得对根据本发明的实施例的回答支持方法的更详细的了解。
如附图4所示,根据本发明的实施例的回答支持方法包括如下步骤:
在步骤401,维护包含关于问题起因与一组问题症状之间的映射关系的历史数据的知识库,在该知识库中,问题症状表示为一组属性中的属性的属性值。
根据本发明的实施例,所述知识库的结构可选地为矩阵,其行表示各问题起因,其列表示各属性以及在每个属性之下的作为属性值的问题症状,其元素表示相应问题起因对于相应问题症状的次数值。
在步骤402,接收当前问题的一个或多个已知问题症状。
在步骤403,使用所接收的一个或多个已知问题症状搜索知识库,以寻找与所述一个或多个已知问题症状对应的潜在起因。
在步骤404,判断是否寻找到多个潜在起因。如果判断为是,则转到步骤405;如果判断为否,则转到步骤415。
在步骤405,根据所述知识库中所述多个潜在起因的关于已知问题症状的历史数据之间的区别确定当前问题的目标起因。
根据本发明的实施例,该步骤405可选地包括以下子步骤:
(1)计算所述多个潜在起因中的每一个潜在起因的已知信息有效比,其中,每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和,除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和。
(2)将所述多个潜在起因按照其已知信息有效比从大到小排序。
(3)判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值。
(4)响应于该判断为是,将已知信息有效比最大的潜在起因确定为当前问题的目标起因。
根据本发明的实施例,所述阈值可选地为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。
在步骤406,判断是否已确定当前问题的目标起因。如果该判断为否,则转到步骤407;如果该判断为是,则转到步骤411。
在步骤407,判断是否已遍历了所有剩余属性。如果该判断是否,则转到步骤408。如果该判断为是,则转到步骤418.
在步骤408,响应于无法确定当前问题的目标起因,根据所述知识库中所述多个潜在起因的历史数据从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择一个待确定属性值的属性,该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因。
根据本发明的实施例,该步骤408可选地包括以下子步骤:
(1)针对所述剩余属性中的每一个剩余属性,将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数,将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数,计算该剩余属性的信息增益。
(2)将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性。
在步骤409,生成并发送包含所选择属性的提问。
在步骤410,从对该提问的回答中接收作为所选择属性的属性值的新的已知问题症状。
然后,返回到步骤405以迭代执行步骤405-410,直到步骤406的判断为是,即已确定当前问题的目标起因,或者步骤407的判断为是,即已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因。
在步骤411,可选地根据所确定的当前问题的目标起因生成针对当前问题的解决方案。
在步骤412,可选地提供针对当前问题的解决方案。例如,将当前问题的解决方案通过一线支持人员提供给客户。
在步骤413,可选地判断是否接收到当前问题已解决的反馈,例如来自客户的反馈。如果该判断为是,则转到步骤414;如果该判断为否,则转到步骤416,将与当前问题相关的信息提供给技术人员进行研究,例如将从客户搜集的一个或多个问题症状提供给技术人员进行研究。
在步骤414,可选地将当前问题的目标起因以及问题症状之间的映射关系存储到知识库中。例如,将知识库中该起因行对于每一个相关症状的次数值加1。然后,过程结束。
响应于在步骤404判断没有寻找到多个潜在起因,在步骤415,判断是否寻找到单个潜在起因,即判断是寻找到单个潜在起因,还是没有寻找到任何潜在起因。如果该判断为是,则执行步骤411,将该潜在起因作为目标起因从而生成针对当前问题的解决方案;如果该判断为否,则执行步骤416。
在步骤416,可选地将与当前问题相关的信息提供给技术人员进行研究。例如,将从客户搜集的一个或多个问题症状提供给技术人员进行研究,或者将从客户搜集的一个或多个问题症状以及***产生的多个潜在起因及其概率提供给技术人员进行研究。
在步骤417,可选地判断是否接收到由技术人员研究出的问题起因。如果该判断为是,则执行步骤414,以将该问题起因与相关症状之间的映射关系存储在知识库中。作为另一种选择,如果该判断为是,则执行步骤411-414,即根据该问题起因生成针对当前问题的解决方案,向客户提供该技术方案,并在接收到来自客户的问题已解决的反馈后,将问题起因及相关症状的映射关系存储在知识库中。如果该判断为否,则流程结束,或进行其他相关处理。
响应于在步骤407判断已遍历所有属性,在步骤418,可选地计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率。
根据本发明的实施例,所述计算每一个潜在起因的概率可选地包括以下子步骤:
(1)计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和。
(2)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加,得到总和。
(3)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和,将所得的商作为每一个潜在起因的概率。
在步骤419,可选地计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性。
根据本发明的实施例,所述计算多个潜在起因之间的依赖性是使用卡方分析完成的。
然后,可选地执行步骤416,以将寻找到的多个潜在起因、每一个潜在起因的概率、潜在起因之间的依赖性以及一个或多个已知症状等与当前问题相关的信息提供给技术人员进行研究。作为另一种选择,也可以首先转到步骤411,以根据所寻找的多个潜在起因生成相应的解决方案,并将该技术方案提供给客户。
以上描述了根据本发明的实施例的回答支持方法的流程,应指出的是,以上描述仅为示例,而不是对本发明的限制。在本发明的其他实施例中,该方法可具有更多、更少或不同的步骤,且各步骤之间的顺序可以与所描述的不同。例如,上述步骤411-419均为可选步骤,而不是必需的。
现在参照附图5描述与上述方法对应的根据本发明的实施例的回答支持***的结构组成。为简明起见,在以下描述中省略了与以上描述重复的部分细节,因此可参见以上描述获得对该***的更详细的了解。
根据本发明的实施例,该回答支持***包括:包含关于问题起因与作为一组属性的属性值的一组问题症状之间的映射关系的历史数据的知识库501;接收装置502,用于接收当前问题的一个或多个已知问题症状;寻找装置503,用于使用所接收的一个或多个问题症状搜索知识库501,以寻找与所述一个或多个已知问题症状对应的潜在起因;确定装置504,用于响应于寻找装置503寻找到多个潜在起因,根据所述知识库501中所述多个潜在起因的关于已知问题症状的历史数据之间的区别确定当前问题的目标起因;选择装置505,用于响应于确定装置504无法确定当前问题的目标起因,根据所述知识库501中所述多个潜在起因的历史数据从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择一个待确定属性值的属性,该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因;提问装置506,用于生成并发送包含所选择属性的提问;所述接收装置502还用于从对该提问的回答中接收作所选择属性的属性值的新的已知问题症状;其中,所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作,直到确定当前问题的目标起因,或者已确定所有剩余属性的属性值而仍未确定当前问题的目标起因。
根据本发明的实施例,该***可选地还包括:生成装置507,用于根据所确定的当前问题的目标起因生成针对当前问题的解决方案;提供装置508,用于提供针对当前问题的解决方案;存储装置509,用于响应于接收到当前问题已解决的反馈,将当前问题的目标起因以及问题症状之间的映射关系存储到知识库501中。
根据本发明的实施例,所述确定装置504可选地还用于:响应于寻找装置503寻找到与所述一个或多个问题症状对应的单个潜在起因,将该潜在起因确定为当前问题的目标起因。
根据本发明的实施例,所述提供装置508可选地还用于响应于在寻找装置503没有寻找到与所述一个或多个问题症状对应的潜在起因,将所述一个或多个问题症状提供给技术人员进行研究;以及所述存储装置509可选地还用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其问题症状之间的映射关系存储到知识库501中。
根据本发明的实施例,所述提供装置508可选地还用于响应于所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因,将所接收的一个或多个已知问题症状以及从知识库501中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因提供给技术人员进行研究;以及所述存储装置509还用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库501中。
根据本发明的实施例,所述知识库501的结构可选地为矩阵,其行表示各问题起因,其列表示各属性以及在每个属性之下的作为属性值的问题症状,其元素表示相应问题起因对于相应问题症状的次数值。
根据本发明的实施例,所述确定装置504可选地包括:用于计算所述多个潜在起因中的每一个潜在起因的已知信息有效比的装置,其中,每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和,除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和;用于将所述多个潜在起因按照其已知信息有效比从大到小排序的装置;用于判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值的装置;以及用于响应于判断为是,将已知信息有效比最大的潜在起因确定为当前问题的目标起因的装置。
根据本发明的实施例,所述阈值可选地为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。
根据本发明的实施例,所述选择装置505可选地包括:用于针对所述剩余属性中的每一个剩余属性,将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数,将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数,计算该剩余属性的信息增益的装置;以及用于将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性的装置。
根据本发明的实施例,该***可选地还包括:概率计算装置,用于响应于所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因,计算从知识库501中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率,并将所述一个或多个已知问题症状以及所述多个潜在起因与每一个潜在起因的概率一起提供给技术人员进行研究;以及所述存储装置509可选地还用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库501中,
根据本发明的实施例,所述概率计算装置可选地包括:用于计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和的装置;用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加,得到总和的装置;用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和,将所得的商作为每一个潜在起因的概率的装置。
根据本发明的实施例,该***可选地还包括:依赖性计算装置,用于响应于所述确定装置504、选择装置505、提问装置506、接收装置502迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因,计算从知识库501中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性,并将所述一个或多个已知问题症状以及所述多个潜在起因及其之间的依赖性一起提供给技术人员进行研究;以及所述存储装置509可选地还用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库501中,其中,所述依赖性计算装置使用卡方分析计算多个潜在起因之间的依赖性。
以上描述了根据本发明的实施例的回答支持***的结构组成,应指出的是,以上描述仅为示例,而不是对本发明的限制。在本发明的其他实施例中,该装置可具有更多、更少或不同的模块,且各模块之间的关系可以与所描述的不同。
本发明可以硬件、软件、或硬件与软件的结合的方式实现。本发明可以集中的方式在一个计算机***中实现,或以分布方式实现,在这种分布方式中,不同的部件分布在若干互连的计算机***中。适于执行本文中描述的方法的任何计算机***或其它装置都是合适的。一种典型的硬件和软件的组合可以是带有计算机程序的通用计算机***,当该计算机程序被加载和执行时,控制该计算机***而使其执行本发明的方法,并构成本发明的装置。
本发明也可体现在计算机程序产品中,该程序产品包含使能实现本文中描述的方法的所有特征,并且当其被加载到计算机***中时,能够执行所述方法。
尽管已参照优选实施例具体示出和说明了本发明,但是本领域内的那些技术人员应理解,可在形式和细节上对其进行各种改变而不会背离本发明的精神和范围。

Claims (22)

1.一种回答支持方法,包括:
(a)维护包含问题起因与一组问题症状之间的映射关系的历史数据的知识库,在该知识库中问题症状表示为一组属性中的属性的属性值;
(b)接收当前问题的一个或多个已知问题症状;
(c)使用所接收的一个或多个已知问题症状搜索知识库,以寻找与所述一个或多个已知问题症状对应的潜在起因;
(d)响应于寻找到多个潜在起因,根据所述知识库中所述多个潜在起因的历史数据之间的区别确定当前问题的目标起因,所述多个潜在起因的历史数据是关于已知问题症状的;
(e)响应于无法确定当前问题的目标起因,根据所述知识库中所述多个潜在起因的历史数据选择一个待确定属性值的属性,所述一个待确定属性值的属性是从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择的,该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因;
(f)生成并发送包含所选择属性的提问;
(g)从对该提问的回答中接收作为所选择属性的属性值的新的已知问题症状;
其中,迭代执行步骤(d)、(e)、(f)、(g),直到确定当前问题的目标起因,或者已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因。
2.根据权利要求1的方法,还包括:
(h)根据所确定的当前问题的目标起因生成针对当前问题的解决方案;
(i)提供针对当前问题的解决方案;
(j)响应于接收到当前问题已解决的反馈,将当前问题的目标起因以及问题症状之间的映射关系存储到知识库中。
3.根据权利要求1的方法,还包括:
(k)响应于在步骤(c)寻找到与所述一个或多个问题症状对应的单个潜在起因,将该潜在起因确定为当前问题的目标起因。
4.根据权利要求1的方法,还包括:
(l)响应于在步骤(c)没有寻找到与所述一个或多个问题症状对应的潜在起因,将所述一个或多个问题症状提供给技术人员进行研究;以及
(m)响应于接收到由技术人员研究出的问题起因,将该问题起因及其问题症状之间的映射关系存储到知识库中。
5.根据权利要求1的方法,还包括:
(n)响应于迭代执行步骤(d)、(e)、(f)、(g)已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因,将所接收的一个或多个已知问题症状以及从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因提供给技术人员进行研究;以及
(o)响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库中。
6.根据权利要求1的方法,其中,所述知识库的结构为矩阵,其行表示各问题起因,其列表示各属性以及在每个属性之下的作为属性值的问题症状,其元素表示相应问题起因对于相应问题症状的次数值。
7.根据权利要求6的方法,其中,步骤(d)包括:
(d1)计算所述多个潜在起因中的每一个潜在起因的已知信息有效比,其中,每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和,除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和;
(d2)将所述多个潜在起因按照其已知信息有效比从大到小排序;
(d3)判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值;以及
(d4)响应于判断为是,将已知信息有效比最大的潜在起因确定为当前问题的目标起因。
8.根据权利要求7的方法,其中,所述阈值为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。
9.根据权利要求7的方法,其中,步骤(e)包括:
(e1)针对所述剩余属性中的每一个剩余属性,将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数,将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数,计算该剩余属性的信息增益;以及
(e2)将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性。
10.根据权利要求6的方法,还包括:
(p)响应于迭代执行步骤(d)、(e)、(f)、(g)已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因,计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率,并将所述一个或多个已知问题症状以及所述多个潜在起因与每一个潜在起因的概率一起提供给技术人员进行研究;以及
(q)响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库中,
其中,所述计算每一个潜在起因的概率包括:
(p1)计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和;
(p2)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加,得到总和;以及
(p3)将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和,将所得的商作为每一个潜在起因的概率。
11.根据权利要求6的方法,还包括:
(r)响应于迭代执行步骤(d)、(e)、(f)、(g)已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因,计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性,并将所述一个或多个已知问题症状以及所述多个潜在起因及其之间的依赖性一起提供给技术人员进行研究;以及
(s)响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库中,
其中,所述计算多个起因之间的依赖性是使用卡方分析完成的。
12.一种回答支持***,包括:
包含关于问题起因与一组问题症状之间的映射关系的历史数据的知识库,在该知识库中问题症状表示为一组属性中的属性的属性值;
接收装置,用于接收当前问题的一个或多个已知问题症状;
寻找装置,用于使用所接收的一个或多个问题症状搜索知识库,以寻找与所述一个或多个已知问题症状对应的潜在起因;
确定装置,用于响应于寻找装置寻找到多个潜在起因,根据所述知识库中所述多个潜在起因的历史数据之间的区别确定当前问题的目标起因,所述多个潜在起因的历史数据是关于已知问题症状的;
选择装置,用于响应于确定装置无法确定当前问题的目标起因,根据所述知识库中所述多个潜在起因的历史数据选择一个待确定属性值的属性,所述一个待确定属性值的属性是从所述一组属性中除已知问题症状所属的属性之外的剩余属性中选择的,该属性的属性值的确定最有可能使得从所寻找到的多个潜在起因中确定当前问题的目标起因;
提问装置,用于生成并发送包含所选择属性的提问;
所述接收装置还用于从对该提问的回答中接收作所选择属性的属性值的新的已知问题症状;
其中,所述确定装置、选择装置、提问装置、接收装置迭代执行其操作,直到确定当前问题的目标起因,或者已确定所有剩余属性的属性值而仍未确定当前问题的目标起因。
13.根据权利要求12的***,还包括:
生成装置,用于根据所确定的当前问题的目标起因生成针对当前问题的解决方案;
提供装置,用于提供针对当前问题的解决方案;以及
存储装置,用于响应于接收到当前问题已解决的反馈,将当前问题的目标起因以及问题症状之间的映射关系存储到知识库中。
14.根据权利要求12的***,其中,所述确定装置还用于:
响应于寻找装置寻找到与所述一个或多个问题症状对应的单个潜在起因,将该潜在起因确定为当前问题的目标起因。
15.根据权利要求12的***,还包括:
提供装置,用于响应于在寻找装置没有寻找到与所述一个或多个问题症状对应的潜在起因,将所述一个或多个问题症状提供给技术人员进行研究;以及
存储装置,用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其问题症状之间的映射关系存储到知识库中。
16.根据权利要求12的***,还包括:
提供装置,用于响应于所述确定装置、选择装置、提问装置、接收装置迭代执行其操作已确定所有剩余属性的属性值而仍未能确定当前问题的目标起因,将所接收的一个或多个已知问题症状以及从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因提供给技术人员进行研究;以及
存储装置,用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库中。
17.根据权利要求12的***,其中,所述知识库的结构为矩阵,其行表示各问题起因,其列表示各属性以及在每个属性之下的作为属性值的问题症状,其元素表示相应问题起因对于相应问题症状的次数值。
18.根据权利要求17的***,其中,所述确定装置包括:
用于计算所述多个潜在起因中的每一个潜在起因的已知信息有效比的装置,其中,每个潜在起因的已知信息有效比被计算为该潜在起因对于已知问题症状的次数值之和,除以该潜在起因对于已知问题症状的次数值之和与该潜在起因对于已知问题症状所属的属性之外的所有剩余属性的所有问题症状的次数值的和;
用于将所述多个潜在起因按照其已知信息有效比从大到小排序的装置;
用于判断已知信息有效比最大的潜在起因与已知信息有效比次大的潜在起因的已知信息有效比之间的差别是否大于阈值的装置;以及
用于响应于判断为是,将已知信息有效比最大的潜在起因确定为当前问题的目标起因的装置。
19.根据权利要求18的***,其中,所述阈值为排序后的所述多个潜在起因中两两相邻的潜在起因的已知信息有效比之间的差别的平均值。
20.根据权利要求18的***,其中,所述选择装置包括:
用于针对所述剩余属性中的每一个剩余属性,将所述多个潜在起因中已知信息有效比最大的潜在起因对该剩余属性中的问题症状的次数值作为正例数,将所述多个潜在起因中所有其他潜在起因对该剩余属性中的问题症状的次数值作为反例数,计算该剩余属性的信息增益的装置;以及
用于将所述剩余属性中信息增益最大的剩余属性选择为所述待确定的属性的装置。
21.根据权利要求17的***,还包括:
概率计算装置,用于响应于所述确定装置、选择装置、提问装置、接收装置迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因,计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因中的每一个的概率,并将所述一个或多个已知问题症状以及所述多个潜在起因与每一个潜在起因的概率一起提供给技术人员进行研究;以及
存储装置,用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库中,
其中,概率计算装置包括:
用于计算每一个潜在起因对所述一个或多个已知问题症状的次数值的和的装置;
用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和相加,得到总和的装置;以及
用于将每一个潜在起因对所述一个或多个已知问题症状的次数值的和除以所述总和,将所得的商作为每一个潜在起因的概率的装置。
22.根据权利要求17的***,还包括:
依赖性计算装置,用于响应于所述确定装置、选择装置、提问装置、接收装置迭代执行其操作已确定所有剩余属性的属性值而未能确定当前问题的目标起因,计算从知识库中寻找到的与所述一个或多个已知问题症状对应的多个潜在起因之间的依赖性,并将所述一个或多个已知问题症状以及所述多个潜在起因及其之间的依赖性一起提供给技术人员进行研究;以及
存储装置,用于响应于接收到由技术人员研究出的问题起因,将该问题起因及其已知问题症状之间的映射关系存储到知识库中,
其中,所述依赖性计算装置使用卡方分析计算多个潜在起因之间的依赖性。
CN2009102471249A 2009-11-30 2009-11-30 回答支持***和方法 Pending CN102081631A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2009102471249A CN102081631A (zh) 2009-11-30 2009-11-30 回答支持***和方法
US12/955,772 US8595174B2 (en) 2009-11-30 2010-11-29 Answer support system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102471249A CN102081631A (zh) 2009-11-30 2009-11-30 回答支持***和方法

Publications (1)

Publication Number Publication Date
CN102081631A true CN102081631A (zh) 2011-06-01

Family

ID=44087598

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102471249A Pending CN102081631A (zh) 2009-11-30 2009-11-30 回答支持***和方法

Country Status (2)

Country Link
US (1) US8595174B2 (zh)
CN (1) CN102081631A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699642A (zh) * 2013-12-25 2014-04-02 江苏省金思维信息技术有限公司 一种基于模块化软件的应答实现方法及***
CN106339464A (zh) * 2016-08-29 2017-01-18 芜湖创易科技有限公司 一种铁路工程问题库管理***
CN106681849A (zh) * 2015-11-10 2017-05-17 阿里巴巴集团控股有限公司 数据处理方法及装置
CN108268431A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 段落向量化的方法和装置
CN108536299A (zh) * 2018-04-12 2018-09-14 广州多益网络股份有限公司 基于矩阵的人机互动结果生成方法及***
CN109949103A (zh) * 2019-03-29 2019-06-28 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN110727773A (zh) * 2019-10-11 2020-01-24 沈阳民航东北凯亚有限公司 信息提供方法及装置

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8434134B2 (en) 2010-05-26 2013-04-30 Google Inc. Providing an electronic document collection
US8856640B1 (en) 2012-01-20 2014-10-07 Google Inc. Method and apparatus for applying revision specific electronic signatures to an electronically stored document
US9087121B2 (en) 2012-04-12 2015-07-21 International Business Machines Corporation Solving problems in data processing systems based on text analysis of historical data
US9529916B1 (en) 2012-10-30 2016-12-27 Google Inc. Managing documents based on access context
US11308037B2 (en) 2012-10-30 2022-04-19 Google Llc Automatic collaboration
US9384285B1 (en) 2012-12-18 2016-07-05 Google Inc. Methods for identifying related documents
US9495341B1 (en) * 2012-12-18 2016-11-15 Google Inc. Fact correction and completion during document drafting
US9514113B1 (en) 2013-07-29 2016-12-06 Google Inc. Methods for automatic footnote generation
US9842113B1 (en) 2013-08-27 2017-12-12 Google Inc. Context-based file selection
US9529791B1 (en) 2013-12-12 2016-12-27 Google Inc. Template and content aware document and template editing
US9542259B1 (en) * 2013-12-23 2017-01-10 Jpmorgan Chase Bank, N.A. Automated incident resolution system and method
US9703763B1 (en) 2014-08-14 2017-07-11 Google Inc. Automatic document citations by utilizing copied content for candidate sources
US10565539B2 (en) 2014-11-07 2020-02-18 International Business Machines Corporation Applying area of focus to workflow automation and measuring impact of shifting focus on metrics
US9813555B2 (en) * 2014-12-12 2017-11-07 Conduent Business Services, Llc Spectral diagnostic engine for customer support call center
US9830249B2 (en) * 2015-03-04 2017-11-28 International Business Machines Corporation Preemptive trouble shooting using dialog manager
US10805244B2 (en) 2015-07-16 2020-10-13 At&T Intellectual Property I, L.P. Service platform to support automated chat communications and methods for use therewith
US11354320B2 (en) * 2018-10-11 2022-06-07 International Business Machines Corporation Determining causes of events in data
US11693860B2 (en) * 2019-01-31 2023-07-04 Optumsoft, Inc. Approximate matching
CN110287304B (zh) * 2019-06-30 2021-11-16 联想(北京)有限公司 问答信息处理方法、装置及计算机设备
CN114153961B (zh) * 2022-02-07 2022-05-06 杭州远传新业科技有限公司 一种基于知识图谱的问答方法及***

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885705A (en) * 1988-02-25 1989-12-05 Eastman Kodak Company Expert system shell for building photofinishing diagnostic systems
JP2002531896A (ja) * 1998-11-30 2002-09-24 シーベル システムズ,インコーポレイティド スマートスクリプトを用いたコールセンター
US6782391B1 (en) * 1999-10-01 2004-08-24 Ncr Corporation Intelligent knowledge base content categorizer (IKBCC)
US20020026435A1 (en) * 2000-08-26 2002-02-28 Wyss Felix Immanuel Knowledge-base system and method
WO2002025627A1 (en) 2000-09-21 2002-03-28 Peoplesupport, Inc. Methods and apparatus for providing customer support
US6983271B2 (en) * 2001-06-13 2006-01-03 Microsoft Corporation Answer wizard drop-down control
US7725334B2 (en) * 2002-11-27 2010-05-25 Computer Sciences Corporation Computerized method and system for estimating liability for an accident using dynamic generation of questions
ATE495626T1 (de) * 2003-03-11 2011-01-15 Koninkl Philips Electronics Nv Scriptorientierte dialogunterstützung für den bediener einer anrufzentrale
US20060106796A1 (en) * 2004-11-17 2006-05-18 Honeywell International Inc. Knowledge stores for interactive diagnostics
US7900201B1 (en) * 2004-12-21 2011-03-01 Zenprise, Inc. Automated remedying of problems in software application deployments
WO2008083345A2 (en) * 2006-12-30 2008-07-10 Peak8 Partners, Llc Technical support agent and technical support service delivery platform
US7941136B2 (en) * 2007-09-14 2011-05-10 Actix Limited Mobile phone network optimisation systems
US20100324927A1 (en) * 2009-06-17 2010-12-23 Tinsley Eric C Senior care navigation systems and methods for using the same

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699642A (zh) * 2013-12-25 2014-04-02 江苏省金思维信息技术有限公司 一种基于模块化软件的应答实现方法及***
CN106681849A (zh) * 2015-11-10 2017-05-17 阿里巴巴集团控股有限公司 数据处理方法及装置
US10678624B2 (en) 2015-11-10 2020-06-09 Alibaba Group Holding Limited Identifying potential solutions for abnormal events based on historical data
CN106339464A (zh) * 2016-08-29 2017-01-18 芜湖创易科技有限公司 一种铁路工程问题库管理***
CN108268431A (zh) * 2016-12-30 2018-07-10 北京国双科技有限公司 段落向量化的方法和装置
CN108268431B (zh) * 2016-12-30 2019-12-03 北京国双科技有限公司 段落向量化的方法和装置
CN108536299A (zh) * 2018-04-12 2018-09-14 广州多益网络股份有限公司 基于矩阵的人机互动结果生成方法及***
CN108536299B (zh) * 2018-04-12 2021-04-27 广州多益网络股份有限公司 基于矩阵的人机互动结果生成方法及***
CN109949103A (zh) * 2019-03-29 2019-06-28 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN109949103B (zh) * 2019-03-29 2021-10-22 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN110727773A (zh) * 2019-10-11 2020-01-24 沈阳民航东北凯亚有限公司 信息提供方法及装置
CN110727773B (zh) * 2019-10-11 2022-02-01 沈阳民航东北凯亚有限公司 信息提供方法及装置

Also Published As

Publication number Publication date
US20110161274A1 (en) 2011-06-30
US8595174B2 (en) 2013-11-26

Similar Documents

Publication Publication Date Title
CN102081631A (zh) 回答支持***和方法
Kamei et al. Studying just-in-time defect prediction using cross-project models
US20210165727A1 (en) Machine Defect Prediction Based on a Signature
Hui et al. Data mining for customer service support
Wróblewski Ensembles of classifiers based on approximate reducts
US20050177351A1 (en) Methods and program products for optimizing problem clustering
CN101840544A (zh) 知识评估工具
Ragin et al. Case-oriented theory building and theory testing
US11775540B2 (en) Mining patterns in a high-dimensional sparse feature space
US11514498B2 (en) System and method for intelligent guided shopping
US20080294941A1 (en) Method and System for Test Case Generation
CN110362562A (zh) 大数据抽取样本数据的方法及***
CN110162775A (zh) 确定意图识别准确度的方法、装置及计算机设备
CN106716420A (zh) 消息匹配方法、消息匹配装置及计算机程序产品、电子设备
KR20160071746A (ko) 규칙 기반 로그 데이터 그룹화를 이용한 개인 맞춤형 로그 분석 시스템 및 그 방법
US9201934B2 (en) Interactive data mining
Melnikov Multiheuristic approach to discrete optimization problems
Van Dang Specification Case Studies in RAISE
CN100568231C (zh) 会话式推荐***及其检索方法
CN112860850B (zh) 人机交互方法、装置、设备及存储介质
CN1976353A (zh) 恢复和调试失败的网络可访问服务构建的方法和***
Motro et al. Not all answers are equally good: Estimating the quality of database answers
CN105608118A (zh) 基于用户交互信息的结果推送方法
Jha et al. A review on reusability of component based software development
Wang et al. Measuring robustness of feature selection techniques on software engineering datasets

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110601