CN109325106A

CN109325106A - 一种医美聊天机器人意图识别方法及装置

Info

Publication number: CN109325106A
Application number: CN201810856548.4A
Authority: CN
Inventors: 林志伟; 肖龙源; ***; 李稀敏; 刘晓葳; 谭玉坤
Original assignee: Xiamen Kuaishangtong Technology Corp ltd
Current assignee: Xiamen Kuaishangtong Technology Corp ltd
Priority date: 2018-07-31
Filing date: 2018-07-31
Publication date: 2019-02-12

Abstract

本发明公开了一种医美聊天机器人意图识别方法及装置，其通过获取训练语料，根据训练语料中的文本数据及对应的意图标签进行训练得到意图识别分类器；预测时，对待识别的当前的文本数据进行预处理并输入训练好的意图识别分类器中，所述意图识别分类器返回意图识别结果；并进一步判断所述意图识别结果是否为有效结果，若是，则输出当前的文本数据对应的意图识别结果；若否，则输出上一组的文本数据对应的有效的意图识别结果；从而通过上文信息来判断访客意图特征，使得意图识别结果更准确，以辅助机器人做出正确的回应决策。

Description

一种医美聊天机器人意图识别方法及装置

技术领域

本发明涉及人工智能技术领域，特别是一种医美聊天机器人意图识别方法及其应用该方法的装置，适用于医疗咨询和整形美容的咨询等。

背景技术

近几年人工智能技术的兴起，使得医疗产业与人工智能的开始加速融合。另一方面，随着社会进步和人们健康意识的觉醒，人口老龄化问题的不断加剧，人们对于提升医疗技术、延长人类寿命、增强健康的需求也更加急迫。而实践中却存在着医疗资源分配不均以及医务人员培养成本过高等问题。

第一代机器人以传统规则***为主，进行模板匹配，所带来的问题是，一方面需要总结所有可能的规则模板，一旦出现规则模板没有涵盖的内容，医疗机器人便无法根据对方发送的信息做出相应回应；另一方面，机器人若收录了大量的规则模板，尽管匹配规则的广度已经得到一定程度解决，但效率就会因为模板数量的增大而大打折扣。

第二代机器人，引入了FAQ和语义相似度概念，相比第一代机器人，解决了需整理大量的规则模板来提高准确度和匹配效率问题。尽管在语义匹配上得到的解决，但语境问题并未得到处理，例如“苹果多少钱”，没有参考上下文信息，可能会有两种意思：一是苹果(水果)多少钱，二是苹果(手机)多少钱；从而使得机器人无法给出正确的回应。

发明内容

本发明为解决上述问题，提供了一种医美聊天机器人意图识别方法及装置，其通过上文信息来判断访客意图特征，使得意图识别结果更准确，以辅助机器人做出正确的回应决策。

为实现上述目的，本发明采用的技术方案为：

一种医美聊天机器人意图识别方法，其包括以下步骤：

a.获取训练语料，根据训练语料中的文本数据及对应的意图标签进行训练得到意图识别分类器；

b.对待识别的当前的文本数据进行预处理并输入训练好的意图识别分类器中，所述意图识别分类器返回意图识别结果；

c.判断所述意图识别结果是否为有效结果，若是，则输出当前的文本数据对应的意图识别结果；若否，则输出上一组的文本数据对应的有效的意图识别结果。

优选的，所述的步骤a中对所述训练语料中的文本数据进行训练时，或者所述的步骤b中对所述的当前的文本数据或者上一组的文本数据进行预测识别时，进一步对所述的文本数据进行分词处理和向量化处理得到词向量，并将该词向量输入所述意图识别分类器中进行训练或预测识别。

进一步的，所述的分词处理，是采用IKAnalyzer分词器、ICTCLAS分词算法、Ansj中文分词或结巴分词的方法进行分词；所述的向量化处理，是利用word2vec模型将分词好的文本数据转化为词向量。

优选的，所述的步骤a中，所述意图识别分类器的训练，进一步包括：

a1.切分所述训练语料，抽取其中的10％作为测试语料，剩余90％作为训练语料；

a2.将所述90％的训练语料输入随机森林模型中进行训练，所述随机森林模型包括多个决策树，通过各个决策树对分类结果进行投票，并根据投票结果输出意图识别结果，得到意图识别分类器；

a3.利用所述10％的测试语料对所述意图识别分类器进行测试，并借助泛化指标对所述意图识别分类器进行评估；

a4.输出符合评估指标的意图识别分类器。

优选的，所述的步骤a中，对所述训练语料中的文本数据及对应的意图标签进行训练之前，先对所述意图标签进行数字映射，将所述训练语料中的意图标签映射成唯一对应的数字。

优选的，所述的步骤b中，对待识别的当前的文本数据进行预处理之前，先对所述文本数据进行字数统计，判断所述文本数据中的文字数量是否小于3，若是，则直接返回无效的意图识别结果；否则，进一步对所述的文本数据进行分词处理和向量化处理得到词向量，并将该词向量输入所述意图识别分类器中进行预测识别。

优选的，还包括步骤d，根据输出的有效的意图识别结果，将对应的答案返回给访客。

优选的，所述的有效的意图识别结果，是指所述的当前的文本数据所对应的意图标签；所述的无效的意图识别结果，是指无输出结果或者所述意图标签以外的其他识别结果。

优选的，所述的意图标签包括：描述症状、咨询价格、咨询地址、确定预约时间、咨询项目、咨询疗程疗效、咨询优惠活动、咨询副作用、咨询材料仪器治疗方法、咨询联系方式。

对应的，本发明还提供一种医美聊天机器人意图识别装置，其包括：

意图训练模块，用于获取训练语料，根据训练语料中的文本数据及对应的意图标签进行训练得到意图识别分类器；

意图预测模块，用于对待识别的当前的文本数据进行预处理并输入训练好的意图识别分类器中，所述意图识别分类器返回意图识别结果；

识别结果判断模块，用于判断所述意图识别结果是否为有效结果，若是，则输出当前的文本数据对应的意图识别结果；若否，则输出上一组的文本数据对应的有效的意图识别结果。

本发明的有益效果是：

(1)本发明通过将当前的文本数据的意图识别结果与上一组的文本数据的有效的意图识别结果相关联，通过上文信息来判断访客意图特征，使得意图识别结果更准确，以辅助机器人做出正确的回应决策；

(2)本发明将意图标签映射为唯一对应的数字，从而便于计算机在训练和预测过程中准确快速识别，提高算法的准确率和计算效率；

(3)本发明对待识别的当前的文本数据进行预处理之前，先对所述文本数据进行字数统计，若所述文本数据中的文字数量小于3，则直接返回无效的意图识别结果，从而简化了计算过程，提高了计算效率。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明一种医美聊天机器人意图识别方法的流程简图；

图2为本发明一种医美聊天机器人意图识别装置的结构示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图及实施例对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明的一种医美聊天机器人意图识别方法，其包括以下步骤：

c.判断所述意图识别结果是否为有效结果，若是，则输出当前的文本数据对应的意图识别结果；若否，则输出上一组的文本数据对应的有效的意图识别结果；

d.根据输出的有效的意图识别结果，将对应的答案返回给访客。

其中，所述的训练语料中的文本数据，可来自于收集的访客的历史对话记录，所述历史对话记录包括语音记录或者文本记录；所述的待识别的当前文本数据、上一组文本数据，可来自于访客输入的语音数据转换而成的文本数据，或者直接来自于访客数据的文本数据。

所述的步骤a中对所述训练语料中的文本数据进行训练时，或者所述的步骤b中对所述的当前的文本数据或者上一组的文本数据进行预测识别时，进一步对所述的文本数据进行预处理：所述预处理包括分词处理和向量化处理，从而得到词向量，并将该词向量输入所述意图识别分类器中进行训练或预测识别。本实施例中，所述的分词处理，可采用IKAnalyzer分词器、ICTCLAS分词算法、Ansj中文分词或结巴分词的方法进行分词，本实施例中采用结巴分词技术；所述的向量化处理，是利用word2vec模型将分词好的文本数据转化为词向量。

其中，所述的结巴分词技术实现了对中文句子按词语粒度进行拆分，支持三种分词模式：一是精确模式，试图将句子最精确地切开，适合文本分析；二是全模式，把句子中所有的可以成词的词语都扫描出来,速度非常快，但是不能解决歧义；三是搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。同时还能支持繁体分词和自定义词典。

所述的Word2Vec词嵌入技术，考虑词语之间的上下文关系，将每个词语映射成一个向量，从而实现对文本数据进行向量化，得到词向量。word2vec主要分为CBOW(Continuous Bag of Words)和Skip-Gram两种模式。CBOW是从原始语句推测目标字词；而Skip-Gram正好相反，是从目标字词推测出原始语句。CBOW对小型数据库比较合适，而Skip-Gram在大型语料中表现更好，可根据实际需要进行选择。

本实施例中，所述的有效的意图识别结果，是指所述的当前的文本数据所对应的意图标签；所述的无效的意图识别结果，是指无输出结果或者所述意图标签以外的其他识别结果。其中，所述的意图标签包括：描述症状、咨询价格、咨询地址、确定预约时间、咨询项目、咨询疗程疗效、咨询优惠活动、咨询副作用、咨询材料仪器治疗方法、咨询联系方式。如表1所示：

表1-访客意图列表

本实施例中，所述的步骤a中，所述意图识别分类器的训练，进一步包括：

a4.输出符合评估指标的意图识别分类器。

其中，随机森林(Random Forest)是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。

并且，所述的步骤a中，对所述训练语料中的文本数据及对应的意图标签进行训练之前，先对所述意图标签进行数字映射，将所述训练语料中的意图标签映射成唯一对应的数字。

本实施例的训练过程举例如下：

1)准备训练语料，包括文本数据，以及文本数据对应的意图标签，如表2所示：

表2-训练预料列表

2)文本划分，利用分词技术把文本划分成词列表，如表3所示：

表3-分词列表

3)文本向量化，对分词好的文本利用预训练好的word2vec模型转化为词向量，如表4所示：

表4-词向量列表

4)意图标签映射，将训练语料中的意图标签映射成数字，如表5所示：

表5-意图标签映射表

5)切分训练语料，抽取10％训练语料作为测试语料(训练集)，用于监测分类器效果，剩余90％作为训练语料(训练集)；

表6-训练集

表7-测试集

意图标签	文本数据	词向量	数字
				咨询价格	价格/怎么算	[0.8, 0.05, 0.09, 0.01]	0
咨询地址	你们/医院/在哪	[0.08, 0.5, 0.1, 0.01]	1

6)分类器训练，将表6的训练集放入随机森林模型中进行训练，得到分类器；

7)模型评估，借助泛化指标(包括accuracy)对分类器进行评估，即，用表7的测试集的数据输入到训练好的模型文件进行预测，得到测试集的预测结果，用于监测模型泛化能力；

表8-测试集的预测结果

根据预测结果，Accuracy值为100％，说明测试集中所有数据都预测正确，后可将模型输出。

8)输出分类器。

本实施例中，所述的步骤b中，对待识别的当前的文本数据进行预处理之前，先对所述文本数据进行字数统计，判断所述文本数据中的文字数量是否小于3，若是，则直接返回无效的意图识别结果；否则，进一步对所述的文本数据进行分词处理和向量化处理得到词向量，并将该词向量输入所述意图识别分类器中进行预测识别。

本实施例的预测过程举例如下：

1)获取访客输入的文本数据；

表9-待识别的当前的文本数据

文本数据
	您好
请问你在吗？
	我想咨询下割双眼皮的价格
你们医院的详细地址可以告诉我下吗？

2)文本判定，判断所述文本数据中的文字符数量是否小于3，若是，输出“无”，否则继续执行下一步；

表10-文本判定表

文本数据	预测结果
		您好	无
请问你在吗？
		我想咨询下割双眼皮的价格
你们医院的详细地址可以告诉我下吗？

3)文本划分，利用分词技术对文本分为列表，如表11所示：

表11-文本划分表

4)文本向量化，对分词好的文本利用预训练好的word2vec模型转化为词向量，如表12所示：

表12-词向量列表

5)意图预测，将词向量作为输入，进入训练好的分类器，分类器会返回意图识别结果，如表13所示：

表13-意图预测表

6)根据意图识别结果向访客返回对应的答案。

例如有以下对话场景，当访客的问题为：“韩式三点呢？”，若没有进行意图识别，机器人可能由于无法理解该句意思而不能进行回复或者直接给出错误回复。而引入本发明的意图识别后，机器人会检测到之前访客有谈及到咨询价格，进而可推断访客可能询问的是价格，于是返回对应的价格信息。

聊天过程举例如下：

1)访客：您好

2)访客：请问你在吗？

3)机器人：{意图识别结果:”无”}您好，在的，请问有什么可以帮助你？

4)访客：我想咨询下割双眼皮的价格

5)机器人：{意图识别结果:[“无”,”咨询价格”]}大概在1000-2000范围

6)访客：韩式三点呢？

7)机器人：{意图识别结果:[“无”,”咨询价格”,”无”]}韩式三点可能会稍微贵一点呢，大概要5000左右。

8)机器人：{意图识别结果:[“无”,”咨询价格”,”无”]}您要不找个时间来我们这，我们安排专业的医生给你指导下。

9)访客：你们医院的详细地址可以告诉我下吗？

10)机器人：{意图识别结果:[“无”,”咨询价格”,”无”,”咨询地址”]}地址在xx省xx市xx区xx大厦x楼。

({……}为隐藏内容，是对前文访客的回复进行意图识别的有序列表，实际聊天过程不显示)

采用本发明的意图识别方法，在已经对上文每条文本数据进行意图识别的情况下，判断当前的文本数据的意图识别结果，如果为"无"，则返回上一条意图识别非'无'的意图识别结果，否则直接返回当前的文本数据的意图识别结果，并根据意图识别结果机器人给出相应回复。本实施例中，在前述的文本数据中，已经在上文中产生两条文本数据，其意图识别结果按先后顺序分别为[“无”,”咨询价格”]，假设访客的当前的文本数据为：“韩式三点呢？”，意图识别结果为：无。于是返回上一条意图识别非'无'的意图识别结果，即上一条非无的意图识别结果：咨询价格。然后依据咨询价格的意图识别，机器人给出相应回复。

如图2所示，本发明还提供一种医美聊天机器人意图识别装置，其包括：

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

并且，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外，本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

上述说明示出并描述了本发明的优选实施例，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

Claims

1.一种医美聊天机器人意图识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种医美聊天机器人意图识别方法，其特征在于：所述的步骤a中对所述训练语料中的文本数据进行训练时，或者所述的步骤b中对所述的当前的文本数据或者上一组的文本数据进行预测识别时，进一步对所述的文本数据进行分词处理和向量化处理得到词向量，并将该词向量输入所述意图识别分类器中进行训练或预测识别。

3.根据权利要求2所述的一种医美聊天机器人意图识别方法，其特征在于：所述的分词处理，是采用IKAnalyzer分词器、ICTCLAS分词算法、Ansj中文分词或结巴分词的方法进行分词；所述的向量化处理，是利用word2vec模型将分词好的文本数据转化为词向量。

4.根据权利要求1所述的一种医美聊天机器人意图识别方法，其特征在于：所述的步骤a中，所述意图识别分类器的训练，进一步包括：

a4.输出符合评估指标的意图识别分类器。

5.根据权利要求1所述的一种医美聊天机器人意图识别方法，其特征在于：所述的步骤a中，对所述训练语料中的文本数据及对应的意图标签进行训练之前，先对所述意图标签进行数字映射，将所述训练语料中的意图标签映射成唯一对应的数字。

6.根据权利要求1所述的一种医美聊天机器人意图识别方法，其特征在于：所述的步骤b中，对待识别的当前的文本数据进行预处理之前，先对所述文本数据进行字数统计，判断所述文本数据中的文字数量是否小于3，若是，则直接返回无效的意图识别结果；否则，进一步对所述的文本数据进行分词处理和向量化处理得到词向量，并将该词向量输入所述意图识别分类器中进行预测识别。

7.根据权利要求1至6任一项所述的一种医美聊天机器人意图识别方法，其特征在于：还包括步骤d，根据输出的有效的意图识别结果，将对应的答案返回给访客。

8.根据权利要求1至6任一项所述的一种医美聊天机器人意图识别方法，其特征在于：所述的有效的意图识别结果，是指所述的当前的文本数据所对应的意图标签；所述的无效的意图识别结果，是指无输出结果或者所述意图标签以外的其他识别结果。

9.根据权利要求1至6任一项所述的一种医美聊天机器人意图识别方法，其特征在于：所述的意图标签包括：描述症状、咨询价格、咨询地址、确定预约时间、咨询项目、咨询疗程疗效、咨询优惠活动、咨询副作用、咨询材料仪器治疗方法、咨询联系方式。

10.一种医美聊天机器人意图识别装置，其特征在于，包括：