CN111708870A

CN111708870A - 基于深度神经网络的问答方法、装置及存储介质

Info

Publication number: CN111708870A
Application number: CN202010460124.3A
Authority: CN
Inventors: 童昌东; 苗应亮; 张浒; 许金金; 熊大华
Original assignee: Maxvision Technology Corp
Current assignee: Maxvision Technology Corp
Priority date: 2020-05-27
Filing date: 2020-05-27
Publication date: 2020-09-25

Abstract

本发明公开了一种基于深度神经网络的问答方法、装置及存储介质，应用于智能问答设备，所述方法包括：对输入问题进行文本纠错处理得到信息语句；将所述信息语句输入到预设算法库中，输出答复语句，所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法，所述任务型对话算法用于识别所述信息语句中预设类型的任务意图，所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。本发明可解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。

Description

基于深度神经网络的问答方法、装置及存储介质

技术领域

本发明涉及人工智能，尤其涉及一种基于深度神经网络的问答方法、装置及存储介质。

背景技术

智能问答***为将积累的无序语料信息，进行有序和科学的整理，并建立基于知识的分类模型；这些分类模型可以指导新增加的语料咨询和服务信息，节约人力资源，提高信息处理的自动性，降低网站运行成本。基于对网站多年积累的关于政府和企业的基本情况常见问题及其解答，整理为规范的问答库形式，以支撑各种形式问题的智能问答。

然而在当前智能问答***中，普遍存在回答准确率低、响应时间较长等问题。

发明内容

本发明针对现有的回答准确率低、响应时间较长的问题，提供了一种基于深度神经网络的问答方法、装置及存储介质。

本发明就上述技术问题而提出的技术方案如下：

第一方面，本发明提供了一种基于深度神经网络的问答方法，所述方法包括：

对输入问题进行文本纠错处理得到信息语句；

将所述信息语句输入到预设算法库中，输出答复语句，所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法，所述任务型对话算法用于识别所述信息语句中预设类型的任务意图，所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。

根据上述的基于深度神经网络的问答方法，所述方法包括：

所述将所述信息语句输入到预设算法库中，输出答复语句，包括：

利用所述任务型对话算法对所述信息语句进行识别；

若识别出所述信息语句中不包含预设类型的任务意图，则利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别；

若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上，则输出与相似度达预设相似度以上的语句对应的答复语句。

根据上述的基于深度神经网络的问答方法，所述将所述信息语句输入到预设算法库中，输出答复语句，还包括：

利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别；

若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上，则利用所述任务型对话算法对所述信息语句进行识别；

若识别出所述信息语句包含预设类型的任务意图，则输出与所述预设类型的任务意图匹配的答复语句。

根据上述的基于深度神经网络的问答方法，所述对输入问题进行文本纠错处理得到信息语句包括：

基于预设规则和语言模型对输入问题进行语句预处理以得到符合预设规则的文本字符串；

利用混淆词典库对所述文本字符串进行混淆度计算以确定所述文本字符串中的错误字词；

获取所述错误字词、所述错误字词的位置及错误类型；获取替换所述错误字词的候选词列表；

对利用所述候选词列表中的候选词替换所述错误字词后的语句进行混淆度计算；

输出混淆度最低的语句。

根据上述的基于深度神经网络的问答方法，所述利用所述任务型对话算法对所述信息语句进行识别包括：

利用双向长短时记忆模型和条件随机场模型对所述信息语句进行BIEO编码模式以得到槽位标记列表；

根据所述槽位标记列表确定所述信息语句是否包含预设类型的任务意图，所述预设类型的任务意图至少包括地点查询任务和/或组合任务意图。

根据上述的基于深度神经网络的问答方法，所述利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别包括：

对所述信息语句进行切词处理及去停用词处理得到语料结果；

从预设问题库中召回按相似度高低顺序排列的预设个数的高顺位相似语句，所述预设个数的高顺位相似语句与所述语料结果均具有相似度；

利用预设深度模型获取所述预设个数的高顺位相似语句的深度语义相似度；

根据深度语义相似度和字面相似度对所述预设个数的高顺位相似语句进行重新排列得到按综合相似度高低顺序排列的相似语句；

获取语句相似度达到预设相似度以上的按综合相似度高低顺序排列的相似语句。

根据上述的基于深度神经网络的问答方法，获取最高顺位的按综合相似度高低顺序排列的相似语句。

根据上述的基于深度神经网络的问答方法，所述方法包括：

若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上，则对所述信息语句进行敏感词检测；

若检测出所述信息语句中包含敏感词，则随机输出预设问答结果库中的答复语句。

第二方面，本发明还提供一种基于深度神经网络的问答装置，应用于智能问答设备，所述装置包括：

预处理模块，用于对输入问题进行文本纠错处理得到信息语句；

处理模块，用于将所述信息语句输入到预设算法库中，输出答复语句，所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法，所述任务型对话算法用于识别所述信息语句中预设类型的任务意图，所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。

第三方面，本发明还提供一种基于深度神经网络的问答存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述基于深度神经网络的问答方法的步骤。

本发明实施例提供的技术方案带来的有益效果是：

本发明提供的基于深度神经网络的问答方法先利用文本纠错算法对用户输入的问题进行处理以得到符合规范的信息语句，其后再利用任务型对话算法和基于深度神经网络的检索型问答算法分别对所述信息语句进行识别，在识别后返回相应的问答结果，以解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于深度神经网络的问答方法在第一实施方式下的流程图；

图2为本发明提供的基于深度神经网络的问答***的纠正流程示意图；

图3为本发明提供的基于深度神经网络的问答***的FAQBot模块流程示意图；

图4为本发明提供的基于深度神经网络的问答方法在第二实施方式下的流程图；

图5为本发明提供的基于深度神经网络的问答方法在第三实施方式下的流程图；

图6为本发明提供的基于深度神经网络的问答***整体模块结构示意图；

图7为本发明提供的基于深度神经网络的问答装置的模块结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

参见图1，为本发明提供的基于深度神经网络的问答方法在第一实施方式下的流程图。本发明提供的基于深度神经网络的问答方法，主要应用于智能问答设备，通过与用户进行问答交互，为用户提供更佳的信息服务，提升用户的问答体验。

步骤S101：对输入问题进行文本纠错处理得到信息语句。

本步骤中，所述输入问题可以为用户输入的文本形式的问题，也可为对用户输入的语音进行转化得到的问题。

结合图2，图2为本发明提供的基于深度神经网络的问答***的纠正流程示意图。在进行文本纠错前，可先对文本进行初步处理以得到规范语句，所述初步处理可以为大小写转换，如可将用户输入的涉及英文字母的问题“IPAD售价是多少”转化为“ipad售价是多少”。此处，所述规范语句为利于进行语句识别的符合自定义规则的语句。

其后，对可能出现的错误进行拼写纠错，所述拼写纠错可基于预设规则和语言模型进行相应处理，具体可包括语句预测处理、错误检测召回处理及纠正排序处理，其中所述语句预测处理可采用正则表达式格式化字符串以得到相应格式的文本，如全角转半角、大写转小写等操作以将语句转换为小写半角文本字符串。所述错误检测召回处理可通过混淆度计算检测语句中疑似错误的字词，获取疑似错误字词及其的位置、错误类型，此外，还获取可替换所述疑似错误字词的候选词列表。所述纠正排序处理为：对候选词列表中的候选词替换相应的疑似错误字词得到的语句，然后对该语句进行排序计算以得到混淆度得分列表，最后返回混淆度最低的语句由此得到纠错文本，也即所述信息语句。

在一具体应用例中，比如输入错误语句“笔记本守家是多少”经过检错会发现在垂直领域汇中“守家”一词在此处可能是错误词，根据混淆词典获得候选词列表['守家','售价','收假','收集']，将候选词依次替换错误词“守家”计算混淆度得分，取让语句混淆度得分最小的候选词“售价”，并替换错词“守家”，便得到最后纠错后的文本：“笔记本售价是多少”。

可以理解的是，还可对输入的问题采用训练正负例方法后再进行数据增强的方式得到相应要求的信息语句。

步骤S102：将所述信息语句输入到预设算法库中，输出答复语句，所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法，所述任务型对话算法用于识别所述信息语句中预设类型的任务意图，所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。

本步骤中，所述预设类型的任务意图至少包括地点查询任务和/或组合任务意图。

利用任务型对话算法对所述信息语句进行识别也即利用任务型对话***(TaskBot***)进行识别。所述任务型对话***的任务模块具体可采用双向长短时记忆模型(Bi-directional Long Short-Term Memory，BiLSTM)和条件随机场模型(ConditionalRandom Fields，CRF)对所述信息语句进行标记并处理，具体地，所述采用所述双向长短是记忆模型和条件随机场模型识别语句中的时间、地点、任务及其命令词，包括对语句进行BIEO编码模式标记处理得到槽位标记列表，其中标签B(begin)表示段的开始，标签I(Intermediate)表示段的中间，标签E(end)表示段的结尾，标签O(other)表示与标记无关的元素。根据所述槽位标记列表可以确定为地点查询任务或组合任务，返回槽位信息和意图。此外，还可分析槽位标记列表并修改其中的错误标记以得到更准确的槽位标记列表。

在一个示例中，如所述信息语句为“三小时后去客厅充电”，则经过模型处理得到槽位标记列表有['B-TIM','I-TIM','E-TIM','O','O','B-LOC','E-LOC','B-ACT','E-ACT']和意图信息为“intentc”组合任务，根据槽位标记列表可以得到时间词为“三小时”、地点词为“客厅”、任务词为“充电”，分析槽位标记列表并修改其中错误标记返回时间词、地点词和任务槽位词，再根据返回的字词获得最终结果：“组合任务|三小时；客厅；充电”，直接返回执行命令并等待下一次文本语句的输入。此处，所述返回执行命令可为预先与相应任务意图建立匹配关系的答复语句。

可以理解的是，若输入的语句为非任务语句，也即输入的语句不能体现用户的任务意图，则经过分析后返回意图槽位为“其他”。如在一个示例中输入的语句为“早上吃什么”，则在识别出意图为“其他”时，也即非预设类型的任务意图时，则将其输出以作为信息语句。

本步骤中，利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别以及利用检索型问答***(FQBot***)进行识别，可具体包括：

1)、对所述信息语句进行切词处理及去停用词处理得到语料结果；

2)、从预设问题库中召回按相似度高低顺序排列的预设个数的高顺位相似语句，所述预设个数的高顺位相似语句与所述语料结果均具有相似度；

3)、利用预设深度模型获取所述预设个数的高顺位相似语句的深度语义相似度；

4)、根据深度语义相似度和字面相似度对所述预设个数的高顺位相似语句进行重新排列得到按综合相似度高低顺序排列的相似语句；

5)、获取语句相似度达到预设相似度以上的按综合相似度高低顺序排列的相似语句。

图3为本发明提供的基于深度神经网络的问答***的FAQBot模块流程示意图。具体可为：

首先，对所述信息语句进行切词并去停用词处理得到语料结果，如输入的语句为“电脑售价是多少”时，经过切词并去停用词处理可得到语料结果为['电脑','售价']。

其次，通过luence从预设问题库中召回出按相似度高低顺序排列的预设个数的高顺位相似语句，如可取排名靠前的K条相似语句(也即与“电脑售价是多少”相类似的问题)，此处，召回出排名靠前的K条相似语句的目的包括在提高召回率的基础上获得较高的问答准确率。

再者，对召回的语句进行编码并利用预设深度模型进行重新排序得到深度语义相似度，此处，所述预设深度模型为SimNet模型。之后，再根据深度语义相似度和jcard字面相似度对语句进行重新排列得到所述K条相似语句的按综合相似度高低顺序排列的相似语句，取最高顺位的按综合相似度高低顺序排列的相似语句，则输出该相似语句所对应的问答结果，作为输入的问题的答复。此处，按综合相似度高低顺序排列可通过对相似语句进行计分实现。

在一示例中，如信息语句为“电脑售价是多少”时，经切词和去停用词之后得到列表(也即语料结果)：['电脑','售价']，然后进入luence召回得到前K个最相似问题列表：['笔记本电脑的售价是多少','邮寄笔记本的售价是多少','请问笔记本要钱吗','笔记本也要交钱吗','笔记本要卖多少钱','笔记本需要多少钱','笔记本可以免费拿吗','笔记本要不要交钱','这个笔记本要卖多少钱','笔记本邮寄要多少钱']，再根据计算的深度语义相似度和jcard语义相似度得分取得最高相似度得分的句子“笔记本电脑的售价是多少”和最终相似度得分“0.9636”，经比较该得分在预设相似度得分之上，则返回“笔记本电脑的售价是多少”的问答结果作为输入句子“电脑售价是多少”的正确问答结果。

此外，若该语句相似度未达到预设相似度以上的按综合相似度高低顺序排列的相似语句，则进入后续处理。

可以理解的上，所述预设深度模型可在采用LSTM、ABCNN等深度算法对相似语句进行匹配。

参见图4，为本发明提供的基于深度神经网络的问答方法在第二实施方式下的流程图。本实施方式与第一实施方式的区别主要在于，先利用任务型对话算法对信息语句进行识别，其后在利用基于深度神经网络的检索型问答算法对信息语句进行识别。本实施方式具体包括如下步骤：

步骤S201：对输入问题进行文本纠错处理得到信息语句。

步骤S202：利用任务型对话算法对所述信息语句进行识别，若识别出所述信息语句包含预设类型的任务意图，则输出与所述预设类型的任务意图匹配的答复语句。

步骤S203：若识别出所述信息语句中不包含预设类型的任务意图，则利用基于深度神经网络的检索型问答算法对所述信息语句进行识别。

步骤S204：若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上，则输出与相似度达预设相似度以上的语句对应的答复语句。

可以理解的是，作为本实施方式的一种变体，所述步骤S202和步骤S203能够相互调换顺序，以在所述信息语句不满足一步骤中的识别要求后，由另一步骤中进行识别，提升对信息语句的有效答复能力。具体可为，所述方法包括步骤：

对输入问题进行文本纠错处理得到信息语句；

利用基于深度神经网络的检索型问答算法对所述信息语句进行识别，若识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上，则输出与相似度达预设相似度以上的语句对应的答复语句；

若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上，则利用任务型对话算法对所述信息语句进行识别；

本实施方式可为第一实施方式的更具体化的应用例，提升回答准确率，缩短响应时长，并实现综合处理任务和垂直领域问答。

参见图5和图6，其中，图5为本发明提供的基于深度神经网络的问答方法在另一实施方式下的流程图，图6为本发明提供的基于深度神经网络的问答***整体模块结构示意图。相较前述实施方式而言，本实施方式不同之处在于，还包括敏感词检查步骤。如图5和图6所示，本实施方式提供的基于深度神经网络的问答方法包括如下步骤：

步骤S301：对输入问题进行文本纠错处理得到信息语句。

步骤S302：利用任务型对话算法对所述信息语句进行识别，若识别出所述信息语句包含预设类型的任务意图，则输出与所述预设类型的任务意图匹配的答复语句。

步骤S303：若识别出所述信息语句中不包含预设类型的任务意图，则利用基于深度神经网络的检索型问答算法对所述信息语句进行识别。

步骤S304：若识别出所述信息语句中不包含预设类型的任务意图，则利用基于深度神经网络的检索型问答算法对所述信息语句进行识别。

步骤S305：若识别出所述信息语句与预设问题库中的语句相似度未达预设相似度以上，则对所述信息语句进行敏感词检测；

步骤S306：若检测出所述信息语句中包含敏感词，则随机输出预设问答结果库中的答复语句。

在步骤S305和步骤S306中，经过敏感词检测步骤，判断用户问答是否存在不友好内容。具体应用时，检测输入的文本是否存在敏感词，如果检测到敏感词则将文本的敏感词替换为“XX”进行表示，且从特定预设问答结果库中随机选择问答结果输出。例如输入句子“她好***啊”，经过前面TaskBot模块和FAQBot模块时均无输出，在敏感词检测步骤中首先判断出输入句子中存在敏感词“***”，然后就将“***”用“XX”替代得到“她好XX啊”，并从特定预设问答结果库随机选择一条问答结果“你要是聊这个，我可走了”进行返回输出。

可以理解的是，在进行敏感词检测时，可采用DFA算法或切词-检测算法。

此外，若未检测出所述信息语句中包含敏感词，则输出闲聊问答库中的闲聊答复语句，以实现与用户的闲聊对话。所述闲聊问答库为可为通过收集、整理日常闲聊时的问答语料所建立问答库。

本实施方式可在前实施方式的基础上，进一步解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题，同时还有利于实现对用户的话题引导及趣味互动。

参见图7，为本发明提供的基于深度神经网络的问答装置的模块结构示意图。本发明还提供一种基于深度神经网络的问答装置，应用于智能问答设备，所述问答装置10包括：

预处理模块11，用于对输入问题进行文本纠错处理得到信息语句；

第一处理模块12，用于利用任务型对话算法对所述信息语句进行识别，若识别出所述信息语句包含预设类型的任务意图，则输出与所述预设类型的任务意图匹配的答复语句；

第二处理模块13，用于在识别出所述信息语句中不包含预设类型的任务意图时，利用基于深度神经网络的检索型问答算法对所述信息语句进行识别；

输出模块14，用于在识别出所述信息语句与预设问题库中的语句相似度达预设相似度以上时，输出与相似度达预设相似度以上的语句对应的答复语句。

可以理解的是，在具体产品中，所述第一处理模块12和第二处理模块13及输出模块14可作为一个处理模块进行相应处理，以用于将所述信息语句输入到预设算法库中，输出答复语句，所述预设算法库中包括任务型对话算法和基于深度神经网络的检索型问答算法，所述任务型对话算法用于识别所述信息语句中预设类型的任务意图，所述基于深度神经网络的检索型问答算法用于识别所述信息语句与预设问题库中的语句相似度。

通过各个模块实现对信息语句的相应功能处理，从而解决目前回答准确率低、响应时间长和不能综合处理任务和垂直领域问答的问题。

此外，本发明还提供一种基于深度神经网络的问答存储介质，其上存储有实现上述问答方法的计算机程序。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度神经网络的问答方法，其特征在于，所述方法包括：

对输入问题进行文本纠错处理得到信息语句；

2.根据权利要求1所述基于深度神经网络的问答方法，其特征在于，所述将所述信息语句输入到预设算法库中，输出答复语句，包括：

利用所述任务型对话算法对所述信息语句进行识别；

3.根据权利要求1所述基于深度神经网络的问答方法，其特征在于，所述将所述信息语句输入到预设算法库中，输出答复语句，还包括：

4.根据权利要求1至3任一项所述基于深度神经网络的问答方法，其特征在于，所述对输入问题进行文本纠错处理得到信息语句包括：

输出混淆度最低的语句。

5.根据权利要求2至3任一项所述基于深度神经网络的问答方法，其特征在于，所述利用所述任务型对话算法对所述信息语句进行识别包括：

6.根据权利要求2至3所述基于深度神经网络的问答方法，其特征在于，所述利用所述基于深度神经网络的检索型问答算法对所述信息语句进行识别包括：

7.根据权利要求6所述基于深度神经网络的问答方法，其特征在于，获取最高顺位的按综合相似度高低顺序排列的相似语句。

8.根据权利要求1所述基于深度神经网络的问答方法，其特征在于，所述方法包括：

9.一种基于深度神经网络的问答装置，其特征在于，所述装置包括：

10.一种基于深度神经网络的问答存储介质，其特征在于，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述基于深度神经网络的问答方法的步骤。