CN112836026B

CN112836026B - 基于对话的问诊方法及装置

Info

Publication number: CN112836026B
Application number: CN201911164016.5A
Authority: CN
Inventors: 郭越坤
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2019-11-25
Filing date: 2019-11-25
Publication date: 2024-03-15
Anticipated expiration: 2039-11-25
Also published as: CN112836026A

Abstract

本发明公开了一种基于对话的问诊方法及装置，该方法包括：接收用户当前输入信息；确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；如果所述查询节点有子节点，则获取各子节点对应的文本；计算各子节点对应的文本与所述输入信息的匹配度，并选取其中匹配度最高的文本作为回复语句输出；如果所述查询节点没有子节点，则根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，并将所述答案文本作为回复语句输出。利用本发明，可以提高问诊效率及问诊结果的准确性和实用性。

Description

基于对话的问诊方法及装置

技术领域

本发明涉及问答***领域，具体涉及一种基于对话的问诊方法及装置。

背景技术

问答***是信息检索***的一种高级形式，它不仅能够向用户提供更加自然的人机交互方式，而且可以直接向用户返回问题的答案，帮助用户快速准确地获取所需信息，是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。不同的应用需要不同形式的问答***，为此，在医疗领域出现了一些自动问诊***。但现有的自动问诊产品大都是针对用户输入的信息，给出选项让用户选择，然后再根据用户的选择给出新的选项，直到结束时给出问诊结果。这种方式存在以下缺点：1)流程冗长且枯燥，效率低；2)给出的选项有时不能准确描述用户问题，导致最终给出的问诊结果准确度不高；3)给出的问诊结果大都为科室或者药物推荐，实用性和普适性较低。

发明内容

本发明实施例提供一种基于对话的问诊方法及装置，以提高问诊效率及问诊结果的准确性和实用性。

为此，本发明提供如下技术方案：

一种基于对话的问诊方法，所述方法包括：

接收用户当前输入信息；

确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；

如果所述查询节点有子节点，则获取各子节点对应的文本；

计算各子节点对应的文本与所述输入信息的匹配度，并选取其中匹配度最高的文本作为回复语句输出；

如果所述查询节点没有子节点，则根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，并将所述答案文本作为回复语句输出。

可选地，所述方法还包括按以下方式建立所述医疗对话图谱：

收集大量完整的问诊对话数据，并将每份对话数据处理为用户和医生轮流交互的数据格式，得到对应每份对话数据的交互数据段；

对所述交互数据段中的每段数据提取节点特征；

以对应每份对话数据的交互数据段中开始的第一段数据作为一个根节点，下一段数据作为子节点，按照先后顺序进行单向链接构建医疗对话图谱，并且将节点特征相同的节点进行合并。

可选地，所述节点特征包括以下任意一种或多种组合：

基于文本的节点特征，所述基于文本的节点特征为对话文本自身；

基于文本特征的节点特征，所述基于文本特征的节点特征为对话文本的向量；

基于实体信息的节点特征，所述基于实体信息的节点特征为从对话文本中抽取的实体信息自身；

基于实体特征的节点特征，所述基于实体特征的节点特征为从对话文本中抽取的实体信息矢量化后的数据。

可选地，所述确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点包括：

如果是首轮对话，则从所述当前输入信息中提取节点特征，在所述医疗对话图谱中查找包含所述节点特征的各节点，并根据各节点对应的文本确定与所述当前输入信息相对应的查询节点；

如果不是首轮对话，并且前一回复语句对应的节点有子节点，则根据各子节点对应的文本确定与所述当前输入信息相对应的查询节点；

如果所述子节点中没有与所述当前输入信息相对应的查询节点，或者前一回复语句对应的节点没有子节点，则通过向上回溯查找确定与所述当前输入信息相对应的查询节点。

可选地，所述根据各节点对应的文本确定与所述当前输入信息相对应的查询节点包括：

计算各节点对应的文本与所述当前输入信息的相似度；

选择相似度最高的节点作为与所述当前输入信息相对应的查询节点。

可选地，所述方法还包括：设置各节点的权重，并且根节点的权重大于子节点的权重；

所述根据各节点对应的文本确定与所述当前输入信息相对应的查询节点还包括：

根据所述各节点的权重调整所述节点对应的文本与所述当前输入信息的相似度。

可选地，所述根据各子节点对应的文本确定与所述当前输入信息相对应的查询节点包括：

计算各子节点对应的文本与所述当前输入信息的相似度，并将其中相似度最高的子节点作为候选节点；

如果所述候选节点对应的相似度大于设定阈值，则将所述候选节点作为与所述当前输入信息相对应的查询节点；

否则，确定所述子节点中没有与所述当前输入信息相对应的查询节点。

可选地，所述方法还包括：

记录每次对话的轮询次数；

在接收到用户当前输入信息后，如果当前轮询次数小于设定次数，则执行确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点的步骤；

否则，执行根据预先建立的问诊数据库获取答案文本的步骤。

可选地，所述根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本包括：

从预先建立的问诊数据库中查找与所述当前输入信息相似的问询语句；

获取所述问询语句的答案文本；

根据所述问询语句的答案文本确定与所述当前输入信息对应的答案文本。

可选地，所述从预先建立的问诊数据库中查找与所述当前输入信息相似的问询语句包括：

抽取所述当前输入信息中的实体信息；

从所述问诊数据库中的问询语句中获取包含所述实体信息的问询语句作为与所述当前输入信息相似的问询语句。

抽取所述当前输入信息中的实体信息；

根据所述实体信息及所述当前输入信息，利用预先建立的分类模型，确定所述问诊数据库中与所述当前输入信息相似的问询语句。

可选地，所述问询语句的答案文本有多个；

所述根据所述问询语句的答案文本确定与所述当前输入信息对应的答案文本包括：

分别计算各答案文本与所述当前输入信息的匹配度，并选取其中匹配度最高的答案文本作为与所述当前输入信息对应的答案文本。

一种基于对话的问诊装置，所述装置包括：

接收模块，用于接收用户当前输入信息；

图谱查询模块，用于确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；

检查模块，用于检查所述查询节点是否有子节点；

节点文本获取模块，用于在所述查询节点有子节点时，获取各子节点对应的文本；

匹配度计算模块，用于计算各子节点对应的文本与所述输入信息的匹配度；

输出模块，用于选取其中匹配度最高的文本作为回复语句输出；

答案文本获取模块，用于在所述查询节点没有子节点时，根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本；

所述输出模块，还用于将所述答案文本作为回复语句输出。

可选地，所述装置还包括图谱建立模块，用于建立所述医疗对话图谱；所述图谱建立模块包括：

数据收集单元，用于收集大量完整的问诊对话数据；

数据处理单元，用于将每份对话数据处理为用户和医生轮流交互的数据格式，得到对应每份对话数据的交互数据段；

特征提取单元，用于对所述交互数据段中的每段数据提取节点特征；

图谱生成单元，用于以对应每份对话数据的交互数据段中开始的第一段数据作为一个根节点，下一段数据作为子节点，按照先后顺序进行单向链接构建医疗对话图谱，并且将节点特征相同的节点进行合并。

可选地，所述节点特征包括以下任意一种或多种组合：

可选地，所述图谱查询模块包括：

特征提取单元，用于在首轮对话时，从所述当前输入信息中提取节点特征；

节点查找单元，用于在所述医疗对话图谱中查找包含所述节点特征的各节点；

第一查询节点确定单元，用于根据包含所述节点特征的各节点对应的文本确定与所述当前输入信息相对应的查询节点；

第二查询节点确定单元，用于在不是首轮对话、并且前一回复语句对应的节点有子节点时，根据各子节点对应的文本确定与所述当前输入信息相对应的查询节点；

回溯单元，用于在所述第二查询节点确定单元根据各子节点对应的文本确定没有与所述当前输入信息相对应的查询节点、或者前一回复语句对应的节点没有子节点时，通过向上回溯查找确定与所述当前输入信息相对应的查询节点。

可选地，所述第一查询节点确定单元包括：

第一相似度计算子单元，用于计算各节点对应的文本与所述当前输入信息的相似度；

选择子单元，用于选择相似度最高的节点作为与所述当前输入信息相对应的查询节点。

可选地，所述装置还包括：

权重设置模块，用于预先设置各节点的权重，并且根节点的权重大于子节点的权重；

第一查询节点确定单元还包括：

相似度调整子单元，用于根据所述各节点的权重调整所述节点对应的文本与所述当前输入信息的相似度。

可选地，所述第二查询节点确定单元包括：

第二相似度计算子单元，用于计算各子节点对应的文本与所述当前输入信息的相似度；

候选节点确定子单元，用于将其中相似度最高的子节点作为候选节点；

判断子单元，用于在所述候选节点对应的相似度大于设定阈值时，将所述候选节点作为与所述当前输入信息相对应的查询节点；否则，确定所述子节点中没有与所述当前输入信息相对应的查询节点。

可选地，所述装置还包括：

记录模块，用于记录每次对话的轮询次数；

判断模块，用于在所述接收模块接收到用户当前输入信息后，判断当前轮询次数是否小于设定次数；如果是，则触发所述图谱查询模块确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；否则，触发所述答案文本获取模块根据预先建立的问诊数据库获取答案文本。

可选地，所述答案文本获取模块包括：

语句查找单元，用于从预先建立的问诊数据库中查找与所述当前输入信息相似的问询语句；

文本获取单元，用于获取所述问询语句的答案文本；

文本确定单元，用于根据所述问询语句的答案文本确定与所述当前输入信息对应的答案文本。

可选地，所述语句查找单元包括：

信息抽取子单元，用于抽取所述当前输入信息中的实体信息；

相似语句获取子单元，用于从所述问诊数据库中的问询语句中获取包含所述实体信息的问询语句作为与所述当前输入信息相似的问询语句。

可选地，所述语句查找单元包括：

相似语句确定单元，用于根据所述实体信息及所述当前输入信息，利用预先建立的分类模型，确定所述问诊数据库中与所述当前输入信息相似的问询语句。

可选地，所述问询语句的答案文本有多个；

所述文本确定单元包括：

匹配度计算子单元，用于分别计算各答案文本与所述当前输入信息的匹配度；

答案文本选择子单元，用于选取其中匹配度最高的答案文本作为与所述当前输入信息对应的答案文本。

一种计算机设备，包括：一个或多个处理器、存储器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，以实现前面所述的方法。

一种可读存储介质，其上存储有指令，所述指令被执行以实现前面所述的方法。

本发明实施例提供的基于对话的问诊方法及装置，在接收到用户当前输入信息后，通过查询预先构建的医疗对话图谱，确定与所述当前输入信息相对应的查询节点，进而根据所述查询节点在所述医疗对话图谱中开始查找相应的子节点，得到与所述当前输入信息匹配度最高的子节点文本，将该子节点对应的文本作为回复语句输出。由于所述医疗对话图谱是基于大量的医疗对话数据建立的，因此，将用户对话匹配到医疗对话图谱中，可以选择真实的医生的高频回复作为***回复，保证了***回复的准确性，并且可以实时给出有效建议，提升***实用性，大大提升了用户的体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明实施例中建立医疗对话图谱的一种流程图；

图2是本发明实施例基于对话的问诊方法的一种流程图；

图3是本发明实施例基于对话的问诊装置的一种结构框图；

图4是本发明实施例中图谱建立模块的一种结构框图；

图5是本发明实施例中图谱查询模块的一种结构框图；

图6是本发明实施例基于对话的问诊装置另一种结构框图；

图7是根据一示例性实施例示出的一种用于输入法应用中表情处理方法的装置的框图；

图8是本发明实施例中服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例的方案，下面结合附图和实施方式对本发明实施例作进一步的详细说明。

本发明实施例提供一种基于对话的问诊方法及***，针对现有的自动问诊产品存在的一些问题，预先利用大量的医疗对话数据，建立医疗对话图谱。在接收到用户当前输入信息后，通过查询所述医疗对话图谱，确定与所述当前输入信息相对应的查询节点，进而根据所述查询节点在所述医疗对话图谱中开始查找相应的子节点，得到与所述当前输入信息匹配度最高的子节点文本，将该子节点对应的文本作为回复语句输出。

下面首先对所述医疗对话图谱的建立做详细说明。如图1所示，是本发明实施例中建立医疗对话图谱的一种流程图，包括以下步骤：

步骤101，收集大量完整的问诊对话数据，并将每份对话数据处理为用户和医生轮流交互的数据格式，得到对应每份对话数据的交互数据段。

在本发明实施例中，将每一次完整问诊的数据作为一份对话数据。通常，问诊对话数据中，经常会出现用户连续说好几句话，医生才回复；或者医生连续说话的状态。针对该情况，将用户或医生连续说的几句话整合到一段中，构成用户和医生轮流交互的数据格式。

步骤102，对所述交互数据段中的每段数据提取节点特征。

步骤103，以对应每份对话数据的交互数据段中开始的第一段数据作为一个根节点，下一段数据作为子节点，按照先后顺序进行单向链接构建医疗对话图谱，并且将节点特征相同的节点进行合并。

所述节点特征可以是以下任意一种或多种组合：

(1)基于文本的节点特征，所述基于文本的节点特征为对话文本自身；

(2)基于文本特征的节点特征，所述基于文本特征的节点特征为对话文本的向量；

(3)基于实体信息的节点特征，所述基于实体信息的节点特征为从对话文本中抽取的实体信息自身；

(4)基于实体特征的节点特征，所述基于实体特征的节点特征为从对话文本中抽取的实体信息矢量化后的数据。

实体信息的抽取方式与现有技术中关键词的提取方式类似，在此不再详细描述。

这样，得到的医疗对话图谱中可以有多棵树，每棵树有一个根节点，不同树之间有关联节点，也就是说，一个子节点可以上溯到不同的根节点。另外，由于在构建所述医疗对话图谱时，将节点特征相同的节点进行了合并，因此，对于这样的节点，其所对应的文本会有多个。可见，所述医疗对话图谱中的每个节点可以具有上述一种或多种组合节点特征，而且每个节点对应的文本有一个或多个。

本发明实施例提供的基于对话的问诊方法，利用上述医疗对话图谱，在接收到用户当前输入信息后，通过查询预先构建的医疗对话图谱，确定与所述当前输入信息相对应的查询节点，进而根据所述查询节点在所述医疗对话图谱中开始查找相应的子节点，得到与所述当前输入信息匹配度最高的子节点文本，将该子节点对应的文本作为回复语句输出。

如图2所示，是本发明实施例基于对话的问诊方法的流程图，包括以下步骤：

步骤201，接收用户当前输入信息。

步骤202，确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点。

需要说明的是，在确定与所述当前输入信息相对应的查询节点时，根据所述当前输入信息是否为首轮对话，确定所述查询节点的方式会有所不同。具体如下：

如果是首轮对话，则从所述当前输入信息中提取节点特征，在所述医疗对话图谱中查找包含所述节点特征的各节点，并根据各节点对应的文本确定与所述当前输入信息相对应的查询节点。具体地，可以分别计算各节点对应的文本与所述当前输入信息的相似度，然后选择相似度最高的节点作为与所述当前输入信息相对应的查询节点。

前面提到，所述医疗对话图谱中的每个节点可以具有上述一种或多种组合节点特征，因此，在查找包含所述节点特征的各节点时，可以采用精准匹配或部分匹配，具体可以按上述节点特征的优先级由高到低顺序进行查找。进一步地，还可设置根节点的匹配权重高于子节点，在匹配时优先匹配根节点。当然，还可以采用其它方式来查找确定所述查询节点，比如，利用预训练的神经网络模型计算当前输入信息的文本矢量，再用决策树模型计算与该文本矢量最相似的节点。

前面还提到，所述医疗对话图谱中各节点对应的文本可以有一个或多个，因此，在一个节点有多个对应文本的情况下，可以分别计算该节点各文本与所述当前输入信息的相似度。

另外，需要说明的是，在本发明实施例中，针对多轮对话的特点，可以设置根节点的权重大于子节点的权重，并根据所述各节点的权重调整所述节点对应的文本与所述当前输入信息的相似度。当然，在实际应用中，也可以设置各节点的权重相同，对此本发明实施例不做限定。

如果不是首轮对话，由于用户的当前输入信息通常是基于前一回复做出的，因此与该输入信息最可能相似的文本是前一回复语句对应节点的子节点文本。为此，在本发明实施例中，如果用户当前输入信息不是首轮对话，并且前一回复语句对应的节点有子节点的情况下，可以根据各子节点对应的文本确定与所述当前输入信息相对应的查询节点。具体地，计算各子节点对应的文本与所述当前输入信息的相似度，并将其中相似度最高的子节点作为候选节点。

在实际应用中，可以将所述候选节点直接作为与所述当前输入信息相对应的查询节点。另外考虑到即使不是首轮对话，但此时用户也可能会输入一些与前一回复完全无关或关系不大的对话，针对这种情况，本发明方法另一实施例中，还可进一步判断所述候选节点对应的相似度是否大于设定阈值；如果是，则将所述候选节点作为与所述当前输入信息相对应的查询节点；否则，确定所述子节点中没有与所述当前输入信息相对应的查询节点。

针对非首轮对话，除了上述描述的这些情况外，还有以下两种情况，即：所述子节点中没有与所述当前输入信息相对应的查询节点，或者前一回复语句对应的节点没有子节点，在这两种情况下，则通过向上回溯查找确定与所述当前输入信息相对应的查询节点。向上回溯的顺序是；首先检查与前一回复对应节点同属一个父节点的其它节点的子节点中是否有可作为查询节点的子节点，具体判断方式与前面类似；如果没有，再继续向上回溯，直至根节点。如果查找到根节点后仍然没有符合要求的查询节点，则按照与首轮对话相同的方式，重新开始查找，即从所述当前输入信息中提取节点特征，在所述医疗对话图谱中查找包含所述节点特征的各节点，并根据各节点对应的文本确定与所述当前输入信息相对应的查询节点。

步骤203，检查所述查询节点是否有子节点。如果是，则执行步骤204；否则执行步骤206。

步骤204，获取各子节点对应的文本。

步骤205，计算各子节点对应的文本与所述输入信息的匹配度，并选取其中匹配度最高的文本作为回复语句输出。

所述匹配度可以利用预先建立的匹配模型来计算，所述匹配模型的具体训练过程可以采用现有技术，比如，可以利用后面提到的问诊数据库中的数据训练得到。具体地，针对所述问诊数据库中的数据，对同一问题的不同回答进行得分标注，利用所述数据及其标注信息训练匹配模型计算问题和答案的匹配度得分。

步骤206，根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，并将所述答案文本作为回复语句输出。

所述问诊数据库是通过从网络中收集的一些问答数据来建立的，其结构形式为一个问题(即问询语句)对应一个或多个答案(即答案文本)，为一组数据。主要包含内容为医疗相关的患者和医生的在线问答。

具体地，首先从所述问诊数据库中查找与所述当前输入信息相似的问询语句；然后，获取所述问询语句的答案文本；根据所述问询语句的答案文本确定与所述当前输入信息对应的答案文本。

其中，从预先建立的问诊数据库中查找与所述当前输入信息相似的问询语句时，可以采用以下两种方式：

(1)直接查找

首先，抽取所述当前输入信息中的实体信息；然后，从所述问诊数据库中的问询语句中获取包含所述实体信息的问询语句作为与所述当前输入信息相似的问询语句。

(2)模型预测

首先，抽取所述当前输入信息中的实体信息；然后，根据所述实体信息及所述当前输入信息，利用预先建立的分类模型，确定所述问诊数据库中与所述当前输入信息相似的问询语句。具体地，分别对抽取的实体信息及当前输入信息进行矢量化；将矢量进行拼接后用线性回归算法、SVM(Support Vector Machine,支持向量机)等计算可能的问询语句，或者是将矢量化的内容分别作为输入特征，利用GBDT(Gradient Boosting Decision Tree，梯度提升决策树)模型计算可能的问询语句。

需要说明的是，所述问诊数据库中，对于每个问询语句，其对应的答案文本可以有一个或多个。在有多个答案文本的情况下，还可以分别计算各答案文本与所述当前输入信息的匹配度，并选取其中匹配度最高的答案文本作为与所述当前输入信息对应的答案文本。这样，可以使输出的回复语句与用户当前输入信息更匹配，提高问诊结果的准确性和实用性。

本发明实施例提供的基于对话的问诊方法，在接收到用户当前输入信息后，通过查询预先构建的医疗对话图谱，确定与所述当前输入信息相对应的查询节点，进而根据所述查询节点在所述医疗对话图谱中开始查找相应的子节点，得到与所述当前输入信息匹配度最高的子节点文本，将该子节点对应的文本作为回复语句输出。由于所述医疗对话图谱是基于大量的医疗对话数据建立的，因此，将用户对话匹配到医疗对话图谱中，可以选择真实的医生的高频回复作为***回复，保证了***回复的准确性，并且可以实时给出有效建议，提升***实用性，大大提升了用户的体验。

进一步地，为了避免过于冗长而没有有效的问诊结果的对话，在本发明方法另一实施例中，还可以在对话过程中，记录每次对话的轮询次数，在接收到用户当前输入信息后，判断当前轮询次数是否小于设定次数。如果是，则按照图2中步骤202至步骤206的方式进行回复；否则，直接执行步骤206，即根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，并将所述答案文本作为回复语句输出。

本发明实施例提供的基于对话的问诊方法，利用预先构建的医疗对话图谱，通过匹配相同情况下医生的高频回复，保证了***回复的准确性和有效性。通过给出医生的建议，有效地提升了回复语句的有效性和适用性，比如，可根据不同情况给出检查、用药的建议，提升了用户的使用体验。

相应地，本发明实施例还提供一种基于对话的问诊装置，如图3所示，是本发明实施例基于对话的问诊装置的一种结构框图。

在该实施例中，所述装置包括以下各模块：

接收模块301，用于接收用户当前输入信息；

图谱查询模块302，用于确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；

检查模块303，用于检查所述查询节点是否有子节点；

节点文本获取模块304，用于在所述查询节点有子节点时，获取各子节点对应的文本；

匹配度计算模块305，用于计算各子节点对应的文本与所述输入信息的匹配度；

输出模块306，用于选取其中匹配度最高的文本作为回复语句输出；

答案文本获取模块307，用于在所述查询节点没有子节点时，根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本；

所述输出模块306，还用于将所述答案文本作为回复语句输出。

其中，所述医疗对话图谱可以由相应的图谱建立模块预先建立，所述图谱建立模块可以作为本发明装置的一部分，也可以独立于该装置，对此本发明实施例不做限定。

如图4所示，是本发明实施例中图谱建立模块的一种结构框图。

所述图谱建立模块包括以下各单元：

数据收集单元41，用于收集大量完整的问诊对话数据；

数据处理单元42，用于将每份对话数据处理为用户和医生轮流交互的数据格式，得到对应每份对话数据的交互数据段；

特征提取单元43，用于对所述交互数据段中的每段数据提取节点特征；

图谱生成单元44，用于以对应每份对话数据的交互数据段中开始的第一段数据作为一个根节点，下一段数据作为子节点，按照先后顺序进行单向链接构建医疗对话图谱，并且将节点特征相同的节点进行合并。

所述节点特征可以是以下任意一种或多种组合：

所述医疗对话图谱中可以有多棵树，每棵树有一个根节点，不同树之间有关联节点，也就是说，一个子节点可以上溯到不同的根节点。另外，由于在构建所述医疗对话图谱时，将节点特征相同的节点进行了合并，因此，对于这样的节点，其所对应的文本会有多个。可见，所述医疗对话图谱中的每个节点可以具有上述一种或多种组合节点特征，而且每个节点对应的文本有一个或多个。

相应地，利用上述医疗对话图谱，所述图谱查询模块302在确定与所述当前输入信息相对应的查询节点时，根据所述当前输入信息是否为首轮对话，确定所述查询节点的方式会有所不同。

具体地，所述图谱查询模块302的一种具体结构如图5所示，包括以下各单元：

特征提取单元51，用于在首轮对话时，从所述当前输入信息中提取节点特征；

节点查找单元52，用于在所述医疗对话图谱中查找包含所述节点特征的各节点；

第一查询节点确定单元53，用于根据包含所述节点特征的各节点对应的文本确定与所述当前输入信息相对应的查询节点；

第二查询节点确定单元54，用于在不是首轮对话、并且前一回复语句对应的节点有子节点时，根据各子节点对应的文本确定与所述当前输入信息相对应的查询节点；

回溯单元55，用于在所述第二查询节点确定单元根据各子节点对应的文本确定没有与所述当前输入信息相对应的查询节点、或者前一回复语句对应的节点没有子节点时，通过向上回溯查找确定与所述当前输入信息相对应的查询节点。

上述第一查询节点确定单元53具体可以分别计算各节点对应的文本与所述当前输入信息的相似度，然后选择相似度最高的节点作为与所述当前输入信息相对应的查询节点。所述第一查询节点确定单元53的一种具体结构可以包括以下各子单元：

前面还提到，所述医疗对话图谱中各节点对应的文本可以有一个或多个，因此，在一个节点有多个对应文本的情况下，上述第一相似度计算子单元可以分别计算该节点各文本与所述当前输入信息的相似度。

另外，需要说明的是，在本发明装置另一实施例中，针对多轮对话的特点，所述装置还可包括：权重设置模块(未图示)，用于预先设置各节点的权重，并且根节点的权重大于子节点的权重。

相应地，在该实施例中，所述第一查询节点确定单元53还可进一步包括：相似度调整子单元，用于根据所述各节点的权重调整所述节点对应的文本与所述当前输入信息的相似度。

可见，通过设置根节点和子节点的不同权重，在首轮对话中，确定与所述当前输入信息相对应的查询节点时，在根节点的文本和子节点的文本与用户当前输入信息相似度相同的情况下，可以优先选中根节点作为所述查询节点，有利于提高最终回复语句的准确性。

上述第二查询节点确定单元54具体可以包括以下各子单元：

继续参照图3，其中的答案文本获取模块307需要根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本。所述答案文本获取模块307具体可以包括以下各单元：

文本获取单元，用于获取所述问询语句的答案文本；

在实际应用中，所述语句查找单元具体可以采用以下两种方式获取与所述当前输入信息相似的问询语句，即：(1)直接查找；(2)模型预测。

对应于上述第(1)种方式，所述语句查找单元可以包括以下各子单元：

对应于上述第(2)种方式，所述语句查找单元可以包括以下各子单元：

需要说明的是，所述问诊数据库中，对于每个问询语句，其对应的答案文本可以有一个或多个。在有多个答案文本的情况下，上述文本确定单元还可以分别计算各答案文本与所述当前输入信息的匹配度，并选取其中匹配度最高的答案文本作为与所述当前输入信息对应的答案文本。比如，可以由以下子单元实现上述功能：

这样，可以使输出的回复语句与用户当前输入信息更匹配，提高问诊结果的准确性和实用性。

本发明实施例提供的基于对话的问诊装置，在接收到用户当前输入信息后，通过查询预先构建的医疗对话图谱，确定与所述当前输入信息相对应的查询节点，进而根据所述查询节点在所述医疗对话图谱中开始查找相应的子节点，得到与所述当前输入信息匹配度最高的子节点文本，将该子节点对应的文本作为回复语句输出。由于所述医疗对话图谱是基于大量的医疗对话数据建立的，因此，将用户对话匹配到医疗对话图谱中，可以选择真实的医生的高频回复作为***回复，保证了***回复的准确性，并且可以实时给出有效建议，提升***实用性，大大提升了用户的体验。

进一步地，为了避免过于冗长而没有有效的问诊结果的对话，在本发明装置另一实施例中，还可以在对话过程中，记录每次对话的轮询次数，在接收到用户当前输入信息后，如果当前轮询次数大于或等于设定次数，则直接根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，并将所述答案文本作为回复语句输出。

如图6所示，是本发明实施例基于对话的问诊装置另一种结构框图。

与图3所示不同的是，在该实施例中，所述装置还包括：

记录模块701，用于记录每次对话的轮询次数；

判断模块702，用于在所述接收模块301接收到用户当前输入信息后，判断当前轮询次数是否小于设定次数；如果是，则触发所述图谱查询模块302确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；否则，触发所述答案文本获取模块307根据预先建立的问诊数据库获取答案文本。

本发明实施例提供的基于对话的问诊装置，利用预先构建的医疗对话图谱，通过匹配相同情况下医生的高频回复，保证了***回复的准确性和有效性。通过给出医生的建议，有效地提升了回复语句的有效性和适用性，比如，可根据不同情况给出检查、用药的建议，提升了用户的使用体验。

需要说明的是，在实际应用中，用户的输入信息及***的回复语句可以采用文本或语音方式，对此本发明实施例不做限定。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

需要说明的是，本发明实施例的方法及装置，可以应用于各种终端设备中，比如手机、计算机、笔记本等设备。

图7是根据一示例性实施例示出的一种用于基于对话的问诊方法的装置800的框图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图7，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理部件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理***，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和***接口模块之间提供接口，上述***接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述按键误触纠错方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种按键误触纠错方法，所述方法包括：在用户输入过程中，获取各按键被触发时的按压信息；根据获取的按压信息确定误触发按键；对误触发按键进行纠错；确定纠错后的完整输入串对应的各候选词。

图8是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(Central Processing Units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作***1941，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置的处理器执行时，使得装置能够执行上述按键误触纠错方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于对话的问诊方法，其特征在于，所述方法包括：

接收用户当前输入信息；

确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；所述医疗对话图谱包括多份对话数据对应的节点，且所述查询节点和所述查询节点的每个子节点对应同一份对话数据，且所述查询节点对应的文本为所述同一份对话数据中的问题数据，所述每个子节点对应的文本为所述同一份对话数据中的回复数据；

如果所述查询节点有子节点，则获取各子节点对应的文本；

如果所述查询节点没有子节点，则根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，并将所述答案文本作为回复语句输出；所述问诊数据库为通过从网络中收集的问答数据建立的，所述问诊数据库的结构形式为一个问题对应一个或多个答案。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括按以下方式建立所述医疗对话图谱：

对所述交互数据段中的每段数据提取节点特征；

3.根据权利要求2所述的方法，其特征在于，所述节点特征包括以下任意一种或多种组合：

4.根据权利要求1所述的方法，其特征在于，所述确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点包括：

5.根据权利要求4所述的方法，其特征在于，所述根据各节点对应的文本确定与所述当前输入信息相对应的查询节点包括：

计算各节点对应的文本与所述当前输入信息的相似度；

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：设置各节点的权重，并且根节点的权重大于子节点的权重；

7.根据权利要求4所述的方法，其特征在于，所述根据各子节点对应的文本确定与所述当前输入信息相对应的查询节点包括：

8.一种基于对话的问诊装置，其特征在于，所述装置包括：

接收模块，用于接收用户当前输入信息；

图谱查询模块，用于确定预先建立的医疗对话图谱中与所述当前输入信息相对应的查询节点；所述医疗对话图谱包括多份对话数据对应的节点，且所述查询节点和所述查询节点的每个子节点对应同一份对话数据，且所述查询节点对应的文本为所述同一份对话数据中的问题数据，所述每个子节点对应的文本为所述同一份对话数据中的回复数据；

检查模块，用于检查所述查询节点是否有子节点；

答案文本获取模块，用于在所述查询节点没有子节点时，根据预先建立的问诊数据库获取与所述当前输入信息对应的答案文本，所述问诊数据库为通过从网络中收集的问答数据建立的，所述问诊数据库的结构形式为一个问题对应一个或多个答案；

所述输出模块，还用于将所述答案文本作为回复语句输出。

9.一种计算机设备，其特征在于，包括：一个或多个处理器、存储器；

所述存储器用于存储计算机可执行指令，所述处理器用于执行所述计算机可执行指令，以实现如权利要求1至7任一项所述的方法。

10.一种可读存储介质，其上存储有指令，所述指令被执行以实现如权利要求1至7任一项所述的方法。