CN110838359B

CN110838359B - 基于对话机器人的分诊方法、装置、存储介质及机器人

Info

Publication number: CN110838359B
Application number: CN201910981777.3A
Authority: CN
Inventors: 谢静文; 阮晓雯; 徐亮
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2023-07-07
Anticipated expiration: 2039-10-16
Also published as: CN110838359A; WO2021073110A1

Abstract

本申请属于计算机技术领域，尤其涉及一种基于对话机器人的分诊方法、装置、计算机可读存储介质及机器人。所述方法在接收到用户下发的分诊请求指令之后，按照预设的对话流程与所述用户进行若干轮对话，并获取所述用户在各轮对话中的对话语句；根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息；将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合；分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度；将优选分诊条目对应的科室推荐给所述用户，所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目。通过本申请，缩短了分诊耗时，提高了分诊的准确率。

Description

基于对话机器人的分诊方法、装置、存储介质及机器人

技术领域

本申请属于计算机技术领域，尤其涉及一种基于对话机器人的分诊方法、装置、计算机可读存储介质及机器人。

背景技术

现有医院内分诊流程主要依靠人工分诊，人力成本消耗较大。近年来已有部分医院引入机器人来辅助人工进行分诊工作，目前机器人分诊主要依靠屏幕点选的方式完成，整体流程耗时长效率较低，而基于语音形式的识别由于患者在主诉时表达方式过于多样，在长串文字中准确提取出目标部位及症状描述难度较高，导致患者可能需要反复描述症状及不适。同时，目前分诊规则主要依靠的是和科室医生以及分诊台护士沟通后提取的经验信息，可能存在有部分主诉信息无法覆盖，病症不能穷尽的问题，导致分诊机器人只能对部分描述进行理解，大多数的主诉无法给出分诊结论。以上多种原因导致了整体分诊流程耗时长且准确率低，在医院流量大时分诊台的工作负担严重。

发明内容

有鉴于此，本申请实施例提供了一种基于对话机器人的分诊方法、装置、计算机可读存储介质及机器人，以解决现有的分诊流程耗时长且精度低的问题。

本申请实施例的第一方面提供了一种基于对话机器人的分诊方法，应用于预设的对话机器人中，所述方法可以包括：

在接收到用户下发的分诊请求指令之后，按照预设的对话流程与所述用户进行F轮对话，并获取所述用户在各轮对话中的对话语句，F为正整数；

根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息；

将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合；

分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度；

将优选分诊条目对应的科室推荐给所述用户，所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目。

本申请实施例的第二方面提供了一种基于对话机器人的分诊装置，应用于预设的对话机器人中，所述装置可以包括：

对话语句获取模块，用于在接收到用户下发的分诊请求指令之后，按照预设的对话流程与所述用户进行F轮对话，并获取所述用户在各轮对话中的对话语句，F为正整数；

主诉信息确定模块，用于根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息；

主诉信息集合构造模块，用于将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合；

匹配度计算模块，用于分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度；

科室推荐模块，用于将优选分诊条目对应的科室推荐给所述用户，所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目。

本申请实施例的第三方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如下步骤：

本申请实施例的第四方面提供了一种机器人，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现如下步骤：

本申请实施例与现有技术相比存在的有益效果是：本申请实施例中的对话机器人在接收到用户下发的分诊请求指令之后，首先按照预设的对话流程与所述用户进行若干轮对话，并获取所述用户在各轮对话中的对话语句，然后根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息，并将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合，接着分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度，最后将所述匹配度取得最大值时所对应的分诊条目作为优选分诊条目，并将所述优选分诊条目对应的科室推荐给所述用户。通过本申请实施例，对话机器人仅需通过若干轮对话即可获取各个分诊维度上的主诉信息，极大缩短了分诊耗时，而且通过与主诉信息库中的各个分诊条目的匹配度计算，为分诊提供了可靠的依据，按照该匹配度可以选取出最合适的科室推荐给用户，大大提高了分诊的准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本申请实施例中一种基于对话机器人的分诊方法的一个实施例流程图；

图2为根据用户在各轮对话中的对话语句分别确定用户在预设的各个分诊维度上的主诉信息的示意流程图；

图3为主诉信息库的设置过程的示意流程图；

图4为将各条历史对话语句按照对应的科室划分为各个群组的示意图；

图5为本申请实施例中一种基于对话机器人的分诊装置的一个实施例结构图；

图6为本申请实施例中一种机器人的示意框图。

具体实施方式

为使得本申请的发明目的、特征、优点能够更加的明显和易懂，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本申请一部分实施例，而非全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

本申请实施例中的分诊方法可以应用于预设的对话机器人(Chatterbot)中，所述对话机器人是一个用来模拟人类对话或聊天的机器人。在本申请实施例的一种具体应用场景中，可以将所述对话机器人设置在医院的分诊台、咨询台或者大厅入口等位置，为经过的用户提供便捷的分诊服务。

请参阅图1，本申请实施例中一种基于对话机器人的分诊方法的一个实施例可以包括：

步骤S101、在接收到用户下发的分诊请求指令之后，按照预设的对话流程与所述用户进行F轮对话，并获取所述用户在各轮对话中的对话语句。

在本实施例中，用户可以通过语音的形式向所述对话机器人下发分诊请求指令。所述对话机器人在接收到用户的语音时，可以判断其中是否包括预设的关键词，所述关键词包括但不限于“分诊”、“导诊”、“科室”等等词语，若用户的语音中包括所述关键词，则可以判定该语音即为用户下发的分诊请求指令。用户还可以通过指定的人机交互界面中的实体按键或者虚拟按键向所述对话机器人下发分诊请求指令，例如，所述对话机器人可以包括一个触控屏幕，用于与用户进行交互，当用户需要向所述对话机器人下发分诊请求指令，可以点击其中显示的特定按键。所述对话机器人在接收到用户下发的分诊请求指令之后，可以按照预设的对话流程与所述用户进行F轮对话，并获取所述用户在各轮对话中的对话语句。其中，F为正整数，其具体取值可以根据实际情况进行设置，例如，可以将其设置为2、3、5或者其它取值。本实施例中，优选设置F＝3，即所述对话机器人可以与所述用户进行3轮对话。例如，在第1轮对话中，所述对话机器人可以询问：“您哪里不舒服”，然后获取所述用户针对该问题所回答的对话语句，在第2轮对话中，所述对话机器人可以询问：“您有哪些主要症状”，然后获取所述用户针对该问题所回答的对话语句，在第3轮对话中，所述对话机器人可以询问：“您有哪些伴随症状”，然后获取所述用户针对该问题所回答的对话语句。

步骤S102、根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息。

所述分诊维度包括但不限于不适部位、主症状、伴随症状等，在本实施例的一种具体实现中，所述对话机器人可以根据所述用户在第1轮对话中的对话语句确定所述用户在不适部位这一分诊维度上的主诉信息，根据所述用户在第2轮对话中的对话语句确定所述用户在主症状这一分诊维度上的主诉信息，根据所述用户在第3轮对话中的对话语句确定所述用户在伴随症状这一分诊维度上的主诉信息。

具体地，以第f轮(1≤f≤F)对话为例，所述对话机器人可以通过如图2所示的过程确定所述用户在第f个分诊维度上的主诉信息：

步骤S1021、在预设的词向量数据库中分别查询各个第一词语的词向量。

所述第一词语为组成所述用户在第f轮对话中的对话语句的词语。可以通过对所述用户在第f轮对话中的对话语句进行分词处理，从而得到各个第一词语。分词处理是指将一条语句切分成一个一个单独的词语，在本实施例中，可以采用通用词典与医学专用词典相结合的方式对所述对话语句进行切分，即使用医学专用词典对所述对话语句进行第一轮切分，再使用通用词典对第一轮切分后剩下的所述对话语句进行切分，通过这样的方式，优先切分出医学专用词语，再切分出通用词语，对于既无法切分出医学专用词语又无法切分出通用词语的对话语句，则切分出单字。

所述词向量数据库为记录词语与词向量之间的对应关系的数据库。所述词向量可以是根据word2vec模型训练词语所得到对应的词向量。即根据词语的上下文信息来表示该词出现的概率。词向量的训练依然按照word2vec的思想，先将每个词表示成一个0-1向量(one-hot)形式，再用词向量进行word2vec模型训练，用n-1个词来预测第n个词，神经网络模型预测后得到的中间过程作为词向量。

现有技术中提供了很多的词向量数据库，本实施例中所使用的词向量数据库可以是基于现有的任意一种开源的词向量数据库，但这些词向量数据库是通用于各个领域的，并非为医学领域专门设置，因此为了提高准确率，本方案中也可以根据word2vec模型重新训练一个专门针对医学领域的词向量数据库。

步骤S1022、计算预设的主诉信息库在第f个分诊维度上的词语中心向量。

所述主诉信息库的具体设置过程将在步骤S104进行详细阐述，本实施例在此不再赘述。

在计算所述主诉信息库在第f个分诊维度上的词语中心向量时，可以首先在所述词向量数据库中分别查询各个第二词语的词向量，所述第二词语为所述主诉信息库中的各个分诊条目在第f个分诊维度上的词语。所述对话机器人可以通过对所述主诉信息库中的各个分诊条目进行分词处理，从而得到各个第二词语。分词处理的具体过程与步骤S1021中的类似，具体可以参照前述内容，此处不再赘述。

然后，可以根据下式计算所述主诉信息库在第f个分诊维度上的词语中心向量：

其中，n为各个第二词语的序号，1≤n≤N，N为第二词语的总数，WordVec_n为第n个第二词语的词向量，且WordVec_n＝(elem_n,1,elem_n,2,...,elem_n,d,...,elem_n,D)，d为词向量中的元素序号，1≤d≤D，D为每个词向量中的元素总数，elem_n,d为第n个第二词语的词向量中的第d个元素，CtVec为所述主诉信息库在第f个分诊维度上的词语中心向量。

步骤S1023、根据各个第一词语的词向量和所述词语中心向量从各个第一词语中选取优选词语。

具体地，可以首先根据下式分别计算各个第一词语的词向量与所述词语中心向量之间的距离：

其中，m为各个第一词语的序号，1≤m≤M，M为第一词语的总数，AnsWdVec_m为第m个第一词语的词向量，且AnsWdVec_m＝(AnsElm_m,1,AnsElm_m,2,...,AnsElm_m,d,...,AnsElm_m,D)，AnsElm_m,d为第m个第一词语的词向量中的第d个元素，AnsDis_m为第m个第一词语的词向量与所述词语中心向量之间的距离。

然后，根据下式从各个第一词语中选取所述优选词语：

SelSeq＝argmin(AnsDis₁,AnsDis₂,...,AnsDis_m,...,AnsDis_M)

其中，argmin为最小自变量函数，SelSeq为所述优选词语的序号。从该式中可以看出，所述优选词语的词向量与所述词语中心向量之间的距离是最小的。

步骤S1024、若所述优选词语的词向量与所述词语中心向量之间的距离小于预设的最大偏移距离，则将所述优选词语确定为所述用户在第f个分诊维度上的主诉信息。

其中，所述最大偏移距离可以根据以下过程进行设置：

首先，根据下式分别计算各个第二词语的词向量与所述词语中心向量之间的距离：

其中，VecDis_n为第n个第二词语的词向量与所述词语中心向量之间的距离。

然后，可以根据下式计算所述最大偏移距离：

MaxDis＝Max(VecDis₁,VecDis₂,...,VecDis_n,...,VecDis_N)

其中，Max为求最大值函数，MaxDis为所述最大偏移距离。

若所述优选词语的词向量与所述词语中心向量之间的距离小于所述最大偏移距离，则可以将所述优选词语确定为所述用户在第f个分诊维度上的主诉信息。若所述优选词语的词向量与所述词语中心向量之间的距离大于或等于所述最大偏移距离，则说明根据所述用户在第f轮对话中的对话语句尚无法确定所述用户在第f个分诊维度上的主诉信息，此时则可重复进行第f轮对话，直至可以确定所述用户在第f个分诊维度上的主诉信息为止。

步骤S103、将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合。

例如，若所述用户在不适部位这一分诊维度上的主诉信息为“面部”，在主症状这一分诊维度上的主诉信息为“水肿”，在伴随症状这一分诊维度上的主诉信息为“消瘦”，则可以构造出如下所示的主诉信息集合：{不适部位：面部，主症状：水肿，伴随症状：消瘦}。

步骤S104、分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度。

所述主诉信息库可以根据如图3所示的过程预先设置：

步骤S1041、从预设的数据库中获取各条历史记录。

在本实施例中，所述数据库可以为各医院存储历史记录的数据库，每条历史记录包括一条历史对话语句以及对应的科室，其中，每条历史对话语句均为病人对自己病情的自述，其对应的科室为最终该病人就诊的科室。

为了提高所述主诉信息库的准确性，应尽可能多的搜集历史记录，保证历史记录的总数超过一定的阈值，该阈值可以根据实际情况进行设置，例如，可以将其设置为一万条、二万条、五万条或者其它取值。

步骤S1042、将各条历史对话语句按照对应的科室划分为各个群组。

如图4所示，所述对话机器人可以将各条历史对话语句按照对应的科室划分为各个群组，这些科室包括但不限于：内分泌肾内科、皮肤科、神经内科、口腔科、眼科、耳鼻喉科、肿瘤科、肝胆外科、消化内科、骨科、妇科等等。

步骤S1043、分别对各个群组中的各条历史对话语句进行信息提取，得到各个群组在各个分诊维度上的主诉信息。

例如，若某条历史对话语句为：“我最近腹部疼痛，而且头晕恶心的厉害”，在对其进行信息提取后，可以得到其在不适部位这一分诊维度上的主诉信息为“腹部”，在主症状这一分诊维度上的主诉信息为“疼痛”，在伴随症状这一分诊维度上的主诉信息为“头晕恶心”。对所有历史对话语句进行遍历，即可得到各个群组在各个分诊维度上的主诉信息。

步骤S1044、分别对各个群组在各个分诊维度上的主诉信息进行频率统计，并选取频率高于预设阈值的主诉信息。

所述阈值可以根据实际情况进行设置，例如，可以将其设置为1000次、2000次、5000次或者其它取值。优选地，可以设置所述阈值与历史记录的总数正相关，即历史记录的总数越多时，所述阈值也越大，反之，历史记录的总数越少时，所述阈值也越小。在本实施例的一种具体实现中，可以根据下式计算所述阈值：Thresh＝LogNum×Coef，其中，LogNum为历史记录的总数，Coef为预设的比例系数，且0<Coef<1，Thresh为所述阈值。

步骤S1045、根据选取的主诉信息构造与各个科室分别对应的分诊条目，并将各个分诊条目组合为所述主诉信息库。

以内分泌肾内科为例，若在不适部位这一分诊维度上选取的主诉信息为“面部”，在主症状这一分诊维度上选取的主诉信息为“水肿”、“皮疹”，在伴随症状这一分诊维度上选取的主诉信息为“消瘦”、“睡眠障碍”、“恶心呕吐”、“尿异常”。则可以将这些主诉信息构造为与内分泌肾内科对应的分诊条目。在对各个科室进行遍历，构造出与各个科室分别对应的分诊条目之后，即可将这些分诊条目组合为所述主诉信息库。

在完成了所述主诉信息库的设置之后即可分别计算所述用户的主诉信息集合与所述主诉信息库中的各个分诊条目之间的匹配度。

现以所述用户的主诉信息集合与所述主诉信息库中的第t个(1≤t≤TN，TN为分诊条目的总数)分诊条目之间的匹配度为例，可以根据下式所述用户的主诉信息集合与所述主诉信息库中的第t个分诊条目之间的匹配度：

DimDeg_t,f＝Max(WdDeg_t,f,1,WdDeg_t,f,2,...,WdDeg_t,f,w,...,WdDeg_t,f,WN)

WdDeg_t,f,w＝CosSim(InfVec_f,SdVec_t,f,w)

其中，Para_f为预设的系数，Para_f>0，且

DimDeg_t,f为第一中间变量，WdDeg_t,f,w为第二中间变量，Max为求最大值函数，InfVec_f为所述主诉信息集合在第f个分诊维度上的主诉信息的词向量，SdVec_t,f,w为所述主诉信息库中的第t个分诊条目在第f个分诊维度上的第w个词语的词向量，1≤w≤WN，WN为所述主诉信息库中的第t个分诊条目在第f个分诊维度上的词语总数，CosSim(InfVec_f,SdVec_t,f,w)为InfVec_f与SdVec_t,f,w之间的余弦相似度，MatDeg_t为所述用户的主诉信息集合与所述主诉信息库中的第t个分诊条目之间的匹配度。

步骤S105、将优选分诊条目对应的科室推荐给所述用户。

所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目，即：

BestDiv＝argmax(MatDeg₁,MatDeg₂,...,MatDeg_t,...,MatDeg_TN)

其中，argmax为最大自变量函数，BestDiv为所述优选分诊条目的序号。

优选地，在将优选分诊条目对应的科室推荐给所述用户之后，还可以对所述用户进行位置导航，指引所述用户前往该科室就诊。具体地，可以首先获取第一位置和第二位置，所述第一位置为所述对话机器人当前所在的位置，所述第二位置为所述优选分诊条目对应的科室的位置。然后，在预设的电子地图中遍历从所述第一位置到所述第二位置的各条路径，并选取距离最短的一条路径作为优选路径。最后，在预设的人机交互界面上显示所述优选路径。这样，所述用户就可以按照所述优选路径的指引顺利地前往对应的科室就诊。

综上所述，本申请实施例中的对话机器人在接收到用户下发的分诊请求指令之后，首先按照预设的对话流程与所述用户进行若干轮对话，并获取所述用户在各轮对话中的对话语句，然后根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息，并将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合，接着分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度，最后将所述匹配度取得最大值时所对应的分诊条目作为优选分诊条目，并将所述优选分诊条目对应的科室推荐给所述用户。通过本申请实施例，对话机器人仅需通过若干轮对话即可获取各个分诊维度上的主诉信息，极大缩短了分诊耗时，而且通过与主诉信息库中的各个分诊条目的匹配度计算，为分诊提供了可靠的依据，按照该匹配度可以选取出最合适的科室推荐给用户，大大提高了分诊的准确率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例所述的一种基于对话机器人的分诊方法，图5示出了本申请实施例提供的一种基于对话机器人的分诊装置的一个实施例结构图。所述装置应用于预设的对话机器人中，所述装置可以包括：

对话语句获取模块501，用于在接收到用户下发的分诊请求指令之后，按照预设的对话流程与所述用户进行F轮对话，并获取所述用户在各轮对话中的对话语句，F为正整数；

主诉信息确定模块502，用于根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息；

主诉信息集合构造模块503，用于将所述用户在各个分诊维度上的主诉信息构造为所述用户的主诉信息集合；

匹配度计算模块504，用于分别计算所述用户的主诉信息集合与预设的主诉信息库中的各个分诊条目之间的匹配度；

科室推荐模块505，用于将优选分诊条目对应的科室推荐给所述用户，所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目。

进一步地，所述主诉信息确定模块可以包括：

第一词向量查询单元，用于在预设的词向量数据库中分别查询各个第一词语的词向量，所述第一词语为组成所述用户在第f轮对话中的对话语句的词语，所述词向量数据库为记录词语与词向量之间的对应关系的数据库，1≤f≤F；

中心向量计算单元，用于计算所述主诉信息库在第f个分诊维度上的词语中心向量；

优选词语选取单元，用于根据各个第一词语的词向量和所述词语中心向量从各个第一词语中选取优选词语；

主诉信息确定单元，用于若所述优选词语的词向量与所述词语中心向量之间的距离小于预设的最大偏移距离，则将所述优选词语确定为所述用户在第f个分诊维度上的主诉信息。

进一步地，所述中心向量计算单元可以包括：

第二词向量查询子单元，用于在所述词向量数据库中分别查询各个第二词语的词向量，所述第二词语为所述主诉信息库中的各个分诊条目在第f个分诊维度上的词语；

中心向量计算子单元，用于根据下式计算所述主诉信息库在第f个分诊维度上的词语中心向量：

进一步地，所述主诉信息确定模块还可以包括：

距离计算单元，用于根据下式分别计算各个第二词语的词向量与所述词语中心向量之间的距离：

其中，VecDis_n为第n个第二词语的词向量与所述词语中心向量之间的距离；

最大偏移距离计算单元，用于根据下式计算所述最大偏移距离：

MaxDis＝Max(VecDis₁,VecDis₂,...,VecDis_n,...,VecDis_N)

其中，Max为求最大值函数，MaxDis为所述最大偏移距离。

进一步地，所述优选词语选取单元可以包括：

距离计算子单元，用于根据下式分别计算各个第一词语的词向量与所述词语中心向量之间的距离：

其中，m为各个第一词语的序号，1≤m≤M，M为第一词语的总数，AnsWdVec_m为第m个第一词语的词向量，且AnsWdVec_m＝(AnsElm_m,1,AnsElm_m,2,...,AnsElm_m,d,...,AnsElm_m,D)，AnsElm_m,d为第m个第一词语的词向量中的第d个元素，AnsDis_m为第m个第一词语的词向量与所述词语中心向量之间的距离；

优选词语选取子单元，用于根据下式从各个第一词语中选取所述优选词语：

SelSeq＝argmin(AnsDis₁,AnsDis₂,...,AnsDis_m,...,AnsDis_M)

其中，argmin为最小自变量函数，SelSeq为所述优选词语的序号。

进一步地，所述装置还可以包括：

历史记录获取模块，用于从预设的数据库中获取各条历史记录，其中，每条历史记录包括一条历史对话语句以及对应的科室；

群组划分模块，用于将各条历史对话语句按照对应的科室划分为各个群组；

信息提取模块，用于分别对各个群组中的各条历史对话语句进行信息提取，得到各个群组在各个分诊维度上的主诉信息；

频率统计模块，用于分别对各个群组在各个分诊维度上的主诉信息进行频率统计，并选取频率高于预设阈值的主诉信息；

主诉信息库构造模块，用于根据选取的主诉信息构造与各个科室分别对应的分诊条目，并将各个分诊条目组合为所述主诉信息库。

进一步地，所述装置还可以包括：

位置获取模块，用于获取第一位置和第二位置，所述第一位置为所述对话机器人当前所在的位置，所述第二位置为所述优选分诊条目对应的科室的位置；

优选路径选取模块，用于在预设的电子地图中遍历从所述第一位置到所述第二位置的各条路径，并选取距离最短的一条路径作为优选路径；

路径显示模块，用于在预设的人机交互界面上显示所述优选路径。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置，模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

图6示出了本申请实施例提供的一种机器人的示意框图，为了便于说明，仅示出了与本申请实施例相关的部分。

在本实施例中，所述机器人6可包括：处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机可读指令62，例如执行上述的基于对话机器人的分诊方法的计算机可读指令。所述处理器60执行所述计算机可读指令62时实现上述各个基于对话机器人的分诊方法实施例中的步骤，例如图1所示的步骤S101至S105。或者，所述处理器60执行所述计算机可读指令62时实现上述各装置实施例中各模块/单元的功能，例如图5所示模块501至505的功能。

示例性的，所述计算机可读指令62可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器61中，并由所述处理器60执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机可读指令62在所述机器人6中的执行过程。

所述处理器60可以是中央处理单元(Central Processing Unit，CPU)，还可以是其它通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器61可以是所述机器人6的内部存储单元，例如机器人6的硬盘或内存。所述存储器61也可以是所述机器人6的外部存储设备，例如所述机器人6上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器61还可以既包括所述机器人6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述机器人6所需的其它指令和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种基于对话机器人的分诊方法，其特征在于，应用于预设的对话机器人中，所述方法包括：

将优选分诊条目对应的科室推荐给所述用户，所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目；

所述根据所述用户在各轮对话中的对话语句分别确定所述用户在预设的各个分诊维度上的主诉信息包括：

在预设的词向量数据库中分别查询各个第一词语的词向量，所述第一词语为组成所述用户在第f轮对话中的对话语句的词语，所述词向量数据库为记录词语与词向量之间的对应关系的数据库，1≤f≤F；

计算所述主诉信息库在第f个分诊维度上的词语中心向量；

根据各个第一词语的词向量和所述词语中心向量从各个第一词语中选取优选词语；其中，所述优选词语的词向量与所述词语中心向量之间的距离最短；

若所述优选词语的词向量与所述词语中心向量之间的距离小于预设的最大偏移距离，则将所述优选词语确定为所述用户在第f个分诊维度上的主诉信息。

2.根据权利要求1所述的基于对话机器人的分诊方法，其特征在于，所述计算所述主诉信息库在第f个分诊维度上的词语中心向量包括：

在所述词向量数据库中分别查询各个第二词语的词向量，所述第二词语为所述主诉信息库中的各个分诊条目在第f个分诊维度上的词语；

根据下式计算所述主诉信息库在第f个分诊维度上的词语中心向量：

3.根据权利要求2所述的基于对话机器人的分诊方法，其特征在于，所述最大偏移距离的设置过程包括：

根据下式分别计算各个第二词语的词向量与所述词语中心向量之间的距离：

根据下式计算所述最大偏移距离：

MaxDis＝Max(VecDis₁,VecDis₂,...,VecDis_n,...,VecDis_N)

其中，Max为求最大值函数，MaxDis为所述最大偏移距离。

4.根据权利要求2所述的基于对话机器人的分诊方法，其特征在于，所述根据各个第一词语的词向量和所述词语中心向量从各个第一词语中选取优选词语包括：

根据下式分别计算各个第一词语的词向量与所述词语中心向量之间的距离：

根据下式从各个第一词语中选取所述优选词语：

SelSeq＝argmin(AnsDis₁,AnsDis₂,...,AnsDis_m,...,AnsDis_M)

5.根据权利要求1所述的基于对话机器人的分诊方法，其特征在于，所述主诉信息库的设置过程包括：

从预设的数据库中获取各条历史记录，其中，每条历史记录包括一条历史对话语句以及对应的科室；

将各条历史对话语句按照对应的科室划分为各个群组；

分别对各个群组中的各条历史对话语句进行信息提取，得到各个群组在各个分诊维度上的主诉信息；

分别对各个群组在各个分诊维度上的主诉信息进行频率统计，并选取频率高于预设阈值的主诉信息；

根据选取的主诉信息构造与各个科室分别对应的分诊条目，并将各个分诊条目组合为所述主诉信息库。

6.根据权利要求1至5中任一项所述的基于对话机器人的分诊方法，其特征在于，在将优选分诊条目对应的科室推荐给所述用户之后，还包括：

获取第一位置和第二位置，所述第一位置为所述对话机器人当前所在的位置，所述第二位置为所述优选分诊条目对应的科室的位置；

在预设的电子地图中遍历从所述第一位置到所述第二位置的各条路径，并选取距离最短的一条路径作为优选路径；

在预设的人机交互界面上显示所述优选路径。

7.一种基于对话机器人的分诊装置，其特征在于，应用于预设的对话机器人中，所述装置包括：

科室推荐模块，用于将优选分诊条目对应的科室推荐给所述用户，所述优选分诊条目为所述匹配度取得最大值时所对应的分诊条目；

所述主诉信息确定模块包括：

优选词语选取单元，用于根据各个第一词语的词向量和所述词语中心向量从各个第一词语中选取优选词语；其中，所述优选词语的词向量与所述词语中心向量之间的距离最短；

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现如权利要求1至6中任一项所述的基于对话机器人的分诊方法的步骤。

9.一种机器人，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如权利要求1至6中任一项所述的基于对话机器人的分诊方法的步骤。