CN111858896A

CN111858896A - 一种基于深度学习的知识库问答方法

Info

Publication number: CN111858896A
Application number: CN202010751026.5A
Authority: CN
Inventors: 翁兆琦; 张琳
Original assignee: Shanghai Maritime University
Current assignee: Shanghai Maritime University
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2020-10-30
Anticipated expiration: 2040-07-30
Also published as: CN111858896B

Abstract

本发明公开了一种基于深度学习的知识库问答方法，包括：对用户的自然语言问句进行主题实体识别，识别出多个主题实体；根据多个主题实体进行权重赋值，获得不同权重的多个中心实体；根据不同权重的多个中心实体，选出候选答案路径，并计算出相似度总分；根据相似度总分，对候选答案路径进行排序权重，获得不同权重的多个候选答案路径；对不同权重的多个中心实体和不同权重的多个候选答案路径进行函数匹配计算，获得最终答案并反馈给用户。此发明解决了传统问答方法识别错误主题实体或无法识别主题实体的问题，降低了主题实体识别模型的错误率，提高了属性关系检测模型的准确率，提高了整个知识库问答的准确率。

Description

一种基于深度学习的知识库问答方法

技术领域

本发明涉及计算机问答***技术领域，具体涉及一种基于深度学习的知识库问答方法。

背景技术

近年来，随着科技的不断创新，人工智能也取得了突飞猛进的发展。自动问答***作为人工智能的一个重要分支领域也受到了越来越多的关注。网络信息的指数增长成为了互联网发展的必然趋势。面对如此庞大的信息量的增长，怎样快速提取用户所需要的有效信息将变得十分重要。搜索引擎技术的出现很大程度上满足了人们对信息获取的需求。搜索引擎也逐渐成为人们获取知识，筛选信息的便捷途径。但是传统的搜索引擎根据用户的问题返回的是一系列的网页或者文档，而不是直接返回用户所需要的答案。问答***就是为了解决用户的这种需求而出现的。用户将需求的问题用自然语言的方式输入给问答***，问答***快速的将最准确的答案返回给用户。问答***将会是下一代搜索引擎的基本形态。

知识库问答是自动问答的一种。知识库又称为知识图谱，是一种用于存储大规模的结构化知识的数据库***。通常知识库中结构化的知识可以用三元组的形式表示，即(subject,predicate,object)。其中subject和object分别表示三元组中的头实体和尾实体，predicate表示头实体和尾实体之间的关系。在大规模知识库中通常包含数千万的三元组，很多三元组相互连接可以构成一个有向图，每个实体代表图中的节点，谓语关系代表节点之间的有向边。知识库中海量的知识储备为问答***提供了丰富的事实资源，而且知识库中结构化的知识表示方式也非常适合应用于事实性的问答任务中。

基于知识库的问答***的研究方法可以分为基于语义解析的方法、基于信息抽取的方法和基于向量建模的方法。

基于语义解析的方法首先将自然语言问题转化为逻辑形式的表达，然后将上一步的表达结果转化为知识库查询语言如sparql等从知识库里查询相应的信息并返回答案。

基于信息抽取的方法是通过提取问题中的实体，通过在知识库中查询该实体得到以该实体节点为中心的知识库子图，子图中的每一个节点或边都可以作为候选答案，然后通过观察问题依据某些规则或模板进行信息抽取，得到问题特征向量，建立分类器通过输入问题特征向量对候选答案进行筛选，从而得出最终答案。

基于向量建模的方法首先是根据自然语言问题抽取出其中的主题实体，根据主题实体在知识库中寻找到候选答案，然后将通过对问题和候选答案一系列的特征提取，最终得到它们的分布式表达，通过计算问题的向量表达和候选答案的向量表达的得分进行候选答案的排序以及选择。

目前存在的基于深度学习的知识库问答方法通常将知识库问答分为三个步骤，分别为主题实体识别、属性关系检测和答案选择。主题实体识别的任务是通过主题实体识别模型将用户提出的自然语言问题中的主题实体识别出来。属性关系检测的任务是根据上一步识别出来的主题实体到知识库中查找对应的头实体，并将头实体所连接的所有路径作为此次用户问题的候选答案，然后通过属性关系检测模型将所有候选答案排序。答案选择的任务是把属性关系检测步骤返回的排序最高的候选路径作为知识库问答的最终答案返回给用户。

现有的主题实体识别模型通常是应用简单的神经网络进行端到端的训练，最终得到的往往只是问句中一个最明显的主题实体供下一步属性关系检测模型使用。如问句“计算机理论与技术是哪个出版社出版的？”经过主题实体识别模型得到的标注序列可能是1、“计算机理论”2、“计算机理论与技术”，但是该模型最终选择了概率更大的“计算机理论”实体返回给的属性关系检测步骤，而这两个实体在知识库中都有相应的头实体和路径。又如问句“石头记的作者是谁？”，主题实体识别模型识别到了实体“石头记”，但是在知识库中却没有“石头记”这个头实体。只选择最明显的主题实体“计算机理论”或者“石头记”作为属性关系检测步骤的中心实体，这样一来无论属性关系检测模型的准确率有多高，都无法给出用户一个正确的答案了，所以后续的工作都是无效的。

而现有的属性关系检测模型通过将连接中心实体的n个路径(包括实体和关系)和用户问句进行编码而得到同一语义空间中的低维稠密向量，从而计算向量间的相似度以得到各个路径的排序结果。但是对n个路径的统一编码忽略了各个路径上关系的作用。此外，由于路径上的实体和关系通常都是短语，和用户问句这种句子并不是一个量级上的，用户问句作为一个句子包含了更多的语义信息，所以简单的对用户问句进行编码并没有充分的利用问句的语义信息和问句与路径之间的交互信息，这是导致属性关系检测模型准确率较低的关键。

以往的答案选择模型通常只是简单的选择属性关系检测步骤中排序最靠前的路径作为知识库问答的结果。但是这样做没有考虑到主题实体识别步骤和属性关系检测步骤之间的联系，认为两个步骤相互独立，从而降低了知识库问答的准确性。

发明内容

本发明的目的是提供一种基于深度学习的知识库问答方法。此方法旨在解决传统问答方法识别错误主题实体或无法识别主题实体的问题，降低主题实体识别模型的错误率，提高属性关系检测模型的准确率，提高整个知识库问答的准确率。

为达到上述目的，本发明提供了一种基于深度学习的知识库问答方法，包括以下步骤：

步骤1：基于主题实体识别SAMM模型，对用户的自然语言问句进行主题实体识别，识别出多个主题实体；

步骤2：根据多个主题实体进行权重赋值，获得不同权重的多个中心实体；

步骤3：基于属性关系检测MGQR模型，根据不同权重的多个中心实体，选出候选答案路径，并计算出用户的自然语言问句和候选答案路径的相似度总分；

步骤4：根据相似度总分，对候选答案路径进行排序权重，获得不同权重的多个候选答案路径；

步骤5：基于线性函数，对不同权重的多个中心实体和不同权重的多个候选答案路径进行函数匹配计算，获得最终答案并反馈给用户。

最优选的，主题实体识别还包括以下步骤：

步骤1.1：将用户的自然语言问句进行分词拼接，获得拼接后的用户问句；

步骤1.2：对拼接后的用户问句进行上下文信息提取，获得含有上下文信息的语义特征；

步骤1.3：根据含有上下文信息的语义特征进行特征识别，识别出多个主题实体。

最优选的，分词拼接还包括以下步骤：

步骤1.1.1：将用户的自然语言问句进行分词和更新，得到用户问句；

步骤1.1.2：基于自注意力机制，计算用户问句中任意两个词向量之间的依赖关系，获得用户问句的自注意交互矩阵；

步骤1.1.3：将用户问句与自注意交互矩阵进行拼接，获得拼接后的用户问句。

最优选的，特征识别还包括以下步骤：

步骤1.3.1：将含有上下文信息的语义特征输入条件随机场CRF，获得标注后的问句序列；

步骤1.3.2：根据标注后的问句序列，识别出多个主题实体。

最优选的，权重赋值还包括以下步骤：

步骤2.1：根据多个主题实体的排序顺序，从中选出排序靠前的多个主题实体；

步骤2.2：对排序靠前的多个主题实体分别赋予不同的权重，获得不同权重的多个主题实体，作为不同权重的多个中心实体。

最优选的，计算相似度总分还包括以下步骤：

步骤3.1：对候选答案路径中字、词和实体关系进行粒度向量表示，分别获得候选答案路径的字粒度向量、词粒度向量和实体关系粒度向量；

步骤3.2：根据字粒度向量、词粒度向量和实体关系粒度向量进行语义特征提取，获得字粒度语义特征、词粒度语义特征和实体关系粒度语义特征；

步骤3.3：根据字粒度向量、词粒度向量、实体关系粒度向量和字粒度语义特征、词粒度语义特征、实体关系粒度语义特征进行相似度计算，计算出相似度总分。

最优选的，粒度向量表示还包括以下步骤：

步骤3.1.1：基于随机初始化的方式，对候选答案路径中的字进行字粒度向量表示，获得字粒度向量；

步骤3.1.2：基于word2vec预训练词向量工具，对候选答案路径中的词进行词粒度向量表示，获得词粒度向量；

步骤3.1.3：基于随机初始化的方式，对候选答案路径中的实体关系进行实体关系粒度向量表示，获得实体关系粒度向量。

最优选的，语义特征提取还包括以下步骤：

步骤3.2.1：对字粒度向量、词粒度向量和实体关系粒度向量分别进行加权计算，分别获得字粒度候选路径下的字粒度用户问句、词粒度候选路径下的词粒度用户问句和实体关系粒度的候选路径下的实体关系粒度用户问句；

步骤3.2.2：分别对字粒度用户问句、词粒度用户问句和实体关系粒度用户问句进行提取，分别获得字粒度语义特征、词粒度语义特征和实体关系粒度语义特征。

最优选的，相似度计算还包括以下步骤：

步骤3.3.1：对字粒度向量和字粒度语义特征进行字粒度相似度计算，计算出字粒度候选路径下用户的自然语言问句和候选答案路径的字粒度相似度得分；

步骤3.3.2：对词粒度向量和词粒度语义特征进行词粒度相似度计算，计算出词粒度候选路径下用户的自然语言问句和候选答案路径的词粒度相似度得分；

步骤3.3.3：对实体关系粒度向量和实体关系粒度语义特征进行实体关系粒度相似度计算，计算出实体关系粒度候选路径下用户的自然语言问句和候选答案路径的实体关系粒度相似度得分；

步骤3.3.4：对字粒度相似度得分、词粒度相似度得分和实体关系粒度相似度得分进行权重分配，并计算出相似度总分。

最优选的，排序权重还包括以下步骤：

步骤4.1：根据相似度总分，对候选答案路径进行排序，获得排序后的候选答案路径；

步骤4.2：从排序后的候选答案路径中，筛选出多个候选答案路径；

步骤4.3：对多个候选答案路径分别赋予不同的权重，获得不同权重的多个候选答案路径。

运用此发明，解决了传统问答方法识别错误主题实体或无法识别主题实体的问题，降低了主题实体识别模型的错误率，提高了属性关系检测模型的准确率，提高了整个知识库问答的准确率。

相对于现有技术，本发明具有以下有益效果：

本发明提供的基于深度学习的知识库问答方法，解决知识库问答的三个步骤中分别提出了改进方法，在步骤一中很大程度上解决了主题实体识别步骤识别了错误的主题实体或者是识别不到主题实体的问题，降低了主题实体识别模型的错误率。在步骤中二中考虑到了候选路径上关系的作用和用户问句表达的更多语义信息，提高了属性关系检测模型的准确率。在步骤三中结合前两个步骤的结果，提高了整个知识库问答的准确率。

附图说明

图1为本发明提供的基于深度学习的知识库问答方法流程图。

图2为本发明提供的主题实体识别和权重赋值的方法流程图。

图3为本发明提供的计算相似度总分的方法流程图。

图4为本发明提供的排序权重方法流程图。

具体实施方式

以下结合附图通过具体实施例对本发明作进一步的描述，这些实施例仅用于说明本发明，并不是对本发明保护范围的限制。

本发明是一种基于深度学习的知识库问答方法，如图1所示，包括以下步骤：

步骤1：如图2所示，基于主题实体识别SAMM模型，对用户的自然语言问句进行主题实体识别，识别出多个主题实体。

其中，主题实体识别还包括以下步骤：

步骤1.1：将用户的自然语言问句进行分词拼接，获得拼接后的用户问句；其中，分词拼接还包括以下步骤：

步骤1.1.1：将用户的自然语言问句进行分词，并通过word2vec预训练词向量工具对分词后的每个词进行更新，得到维度为d的n个词向量，用维度为d的n个词向量作为用户问句E^q；其中，用户问句E^q满足：

其中，维度为d的n个词向量E^q∈R^n×d；n为词向量个数；d为词向量维度；

为用户问句中第i个词的词向量；在本实施例中，维度d为300。

步骤1.1.2：基于自注意力机制，计算用户问句E^q中内部任意两个词向量之间的依赖关系，即第i个词的词向量

和第j个词的词向量

获得用户问句E^q的自注意交互矩阵

且满足：

其中，k∈[1,n]；

为用户问句E^q中第j个词的词向量；α_ij为用户问句E^q中第i个词与第j个词之间的点乘相似度，且满足：

步骤1.1.3：将用户问句E^q与自注意交互矩阵

进行拼接，获得拼接后的用户问句C^q，且满足：

步骤1.2：基于双向长短时记忆网络，对拼接后的用户问句C^q进行上下文信息提取，获得含有上下文信息的语义特征S^q，且满足：

其中，

为拼接后的用户问句C^q在t时刻的语义特征；

步骤1.3：根据含有上下文信息的语义特征S^q进行特征识别，识别出多个主题实体。其中，特征识别还包括以下步骤：

步骤1.3.1：将含有上下文信息的语义特征S^q输入条件随机场CRF，获得标注后的问句序列；

步骤1.3.2：根据标注后的问句序列，识别出多个主题实体；在本实施例中，识别出N个主题实体。

步骤2：根据多个主题实体进行权重赋值，获得不同权重的多个中心实体；其中，权重赋值还包括以下步骤：

步骤2.2：根据排序顺序，对排序靠前的多个主题实体分别赋予不同的权重，获得不同权重的多个主题实体，分别作为不同权重的多个中心实体。

在本实施例中，排序靠前的多个体主题实体个数为K个，中心实体的个数为K个。

根据排序顺序赋予不同的权重是根据，主题实体中顺序靠前的赋予较大的权重，顺序靠后的赋予较小的权重，为后续的答案选择步骤提供了选择知识库问答结果的依据。

步骤3：如图3所示，基于属性关系监测MGQR模型，根据不同权重的多个中心实体，选出候选答案路径，并计算出用户的自然语言问句和候选答案路径的相似度总分。

其中，选出候选答案路径为通过K个中心实体，从知识库中选出K个对应的以该主题实体为中心，n个节点为半径的子图，并将子图上所有路径作为候选答案路径。

其中，计算用户的自然语言问句和候选答案路径的相似度总分还包括以下步骤：

步骤3.1：对候选答案路径中字、词和实体关系进行粒度向量表示，分别获得候选答案路径的字粒度向量、词粒度向量和实体关系粒度向量；其中，粒度向量表示还包括以下步骤：

步骤3.1.1：基于随机初始化的方式，对候选答案路径中的字进行字粒度向量表示，获得候选答案路径的字粒度向量；其中，字粒度向量为P^char，且满足：

其中，v为候选答案路径中字的个数。

步骤3.1.2：基于word2vec预训练词向量工具，对候选答案路径中的词进行词粒度向量表示，获得候选答案路径的词粒度向量；其中，词粒度向量为P^word，且满足：

其中，h为候选答案路径中词的个数。

步骤3.1.3：对词粒度向量P^word进行更新，基于随机初始化的方式，对候选答案路径中的实体关系进行实体关系粒度向量表示，获得候选答案路径中的实体关系粒度向量；其中，实体关系粒度向量为P^relation，且满足：

其中，l为候选答案路径中实体关系的个数。

步骤3.2：根据候选答案路径的字粒度向量P^char、词粒度向量P^word和实体关系粒度向量P^relation进行语义特征提取，获得候选答案路径的字粒度语义特征、词粒度语义特征和实体关系粒度语义特征。

其中，语义特征提取还包括以下步骤：

步骤3.2.1：对候选答案路径的字粒度向量P^char、词粒度向量P^word和实体关系粒度向量P^relation分别进行加权计算，分别获得字粒度候选路径下的字粒度用户问句、词粒度候选路径下的词粒度用户问句和实体关系粒度的候选路径下的实体关系粒度用户问句；其中，字粒度用户问句为

且满足：

其中，

为用户问句中的第i个单词与字粒度候选路径中的每个字的匹配信息；e_ij为用户问句中第i个单词与字粒度候选路径中第j个字之间的点乘相似度，且满足：

词粒度用户问句为

且满足：

其中，

为用户问句中的第i个单词与词粒度候选路径中的每个词的匹配信息；b_ij为用户问句中第i个单词与字粒度候选路径中第j个词之间的点乘相似度，且满足：

实体关系粒度用户问句为

且满足：

其中，

为用户问句中的第i个单词与词粒度候选路径中的每个实体关系的匹配信息；f_ij为用户问句中第i个单词与字粒度候选路径中第j个实体关系之间的点乘相似度，且满足：

步骤3.2.2：基于卷积神经网络，分别对字粒度用户问句

词粒度用户问句

和实体关系粒度用户问句

进行提取，分别获得字粒度语义特征、词粒度语义特征和实体关系粒度语义特征；其中，字粒度语义特征为c_char^q，且满足：

c_char^q＝CNN(α^q)；

词粒度语义特征为c_word^q，且满足：

c_word^q＝CNN(β^q)；

实体关系粒度语义特征为c_re^q，且满足：

c_re^q＝CNN(γ^q)。

步骤3.3：基于双向长短时记忆网络，根据候选答案路径的字粒度向量P^char、词粒度向量P^word和实体关系粒度向量P^relation和候选答案路径的字粒度语义特征c_char^q、词粒度语义特征c_word^q、实体关系粒度语义特征c_re^q进行相似度计算，计算出用户的自然语言问句和候选答案路径的相似度总分。

其中，相似度计算还包括以下步骤：

步骤3.3.1：将字粒度向量P^char和字粒度语义特征c_char^q对应输入双向长短时记忆网络中，进行字粒度相似度计算，计算出字粒度候选路径下用户的自然语言问句和候选答案路径的字粒度相似度得分Score1；

步骤3.3.2：将词粒度向量P^word和词粒度语义特征c_word^q对应输入双向长短时记忆网络中，进行词粒度相似度计算，计算出词粒度候选路径下用户的自然语言问句和候选答案路径的词粒度相似度得分Score2；

步骤3.3.3：将实体关系粒度向量P^relation和实体关系粒度语义特征c_re^q对应输入双向长短时记忆网络中，进行实体关系粒度相似度计算，计算出实体关系粒度候选路径下用户的自然语言问句和候选答案路径的实体关系粒度相似度得分Score3；

步骤3.3.4：对字粒度相似度得分Score1、词粒度相似度得分Score2和实体关系粒度相似度得分Score3进行权重分配，并计算出用户问句和候选路径的相似度总分Score，且满足：

其中，μ，

ω分别为字粒度、词粒度和实体关系粒度的权重系数；且字粒度的权重系数μ、词粒度的权重系数

和实体关系粒度的权重系数ω为实验计算的最优解。

步骤4：如图4所示，根据相似度总分，对候选答案路径进行排序权重，获得不同权重的多个候选答案路径；其中，排序权重还包括以下步骤：

步骤4.1：根据相似度总分Score从高到低对候选答案路径进行排序，获得排序后的候选答案路径；

步骤4.2：从排序后的候选答案路径中，筛选出多个候选答案路径；在本实施例中，候选答案路径的个数为Z个；其中，Z≥1，Z小于候选答案路径的总个数。

Z个候选答案路径赋予不同的权重中，顺序靠前的赋予较大的权重，顺序靠后的赋予较小的权重。

步骤5：基于线性函数，对不同权重的多个中心实体和不同权重的多个候选答案路径进行函数匹配计算，获得最终答案并反馈给用户；其中，最终答案为Selection_Function，且满足：

其中，k_top_entity为不同权重的K个中心实体；z_top_path为不同权重的Z个候选答案路径；

为线性函数系数。

本发明的工作原理：

基于主题实体识别SAMM模型，对用户的自然语言问句进行主题实体识别，识别出多个主题实体；根据多个主题实体进行权重赋值，获得不同权重的多个中心实体；基于属性关系检测MGQR模型，根据不同权重的多个中心实体，选出候选答案路径，并计算出用户的自然语言问句和候选答案路径的相似度总分；根据相似度总分，对候选答案路径进行排序权重，获得不同权重的多个候选答案路径；基于线性函数，对不同权重的多个中心实体和不同权重的多个候选答案路径进行函数匹配计算，获得最终答案并反馈给用户。

综上所述，本发明一种基于深度学习的知识库问答方法，解决了传统问答方法识别错误主题实体或无法识别主题实体的问题，降低了主题实体识别模型的错误率，提高了属性关系检测模型的准确率，提高了整个知识库问答的准确率。

尽管本发明的内容已经通过上述优选实施例作了详细介绍，但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后，对于本发明的多种修改和替代都将是显而易见的。因此，本发明的保护范围应由所附的权利要求来限定。

Claims

1.一种基于深度学习的知识库问答方法，其特征在于，包括以下步骤：

步骤2：根据所述多个主题实体进行权重赋值，获得不同权重的多个中心实体；

步骤3：基于属性关系检测MGQR模型，根据所述不同权重的多个中心实体，选出候选答案路径，并计算出用户的自然语言问句和所述候选答案路径的相似度总分；

步骤4：根据所述相似度总分，对所述候选答案路径进行排序权重，获得不同权重的多个候选答案路径；

步骤5：基于线性函数，对所述不同权重的多个中心实体和所述不同权重的多个候选答案路径进行函数匹配计算，获得最终答案并反馈给用户。

2.如权利要求1所述的基于深度学习的知识库问答方法，其特征在于，所述主题实体识别还包括以下步骤：

步骤1.2：对所述拼接后的用户问句进行上下文信息提取，获得含有上下文信息的语义特征；

步骤1.3：根据所述含有上下文信息的语义特征进行特征识别，识别出多个主题实体。

3.如权利要求2所述的基于深度学习的知识库问答方法，其特征在于，所述分词拼接还包括以下步骤：

步骤1.1.2：基于自注意力机制，计算所述用户问句中任意两个词向量之间的依赖关系，获得所述用户问句的自注意交互矩阵；

步骤1.1.3：将所述用户问句与所述自注意交互矩阵进行拼接，获得拼接后的用户问句。

4.如权利要求2所述的基于深度学习的知识库问答方法，其特征在于，所述特征识别还包括以下步骤：

步骤1.3.1：将所述含有上下文信息的语义特征输入条件随机场CRF，获得标注后的问句序列；

步骤1.3.2：根据所述标注后的问句序列，识别出多个主题实体。

5.如权利要求1所述的基于深度学习的知识库问答方法，其特征在于，所述权重赋值还包括以下步骤：

步骤2.1：根据所述多个主题实体的排序顺序，从中选出排序靠前的多个主题实体；

步骤2.2：对所述排序靠前的多个主题实体分别赋予不同的权重，获得不同权重的多个主题实体，作为所述不同权重的多个中心实体。

6.如权利要求1所述的基于深度学习的知识库问答方法，其特征在于，计算所述相似度总分还包括以下步骤：

步骤3.1：对所述候选答案路径中字、词和实体关系进行粒度向量表示，分别获得所述候选答案路径的字粒度向量、词粒度向量和实体关系粒度向量；

步骤3.2：根据所述字粒度向量、所述词粒度向量和所述实体关系粒度向量进行语义特征提取，获得字粒度语义特征、词粒度语义特征和实体关系粒度语义特征；

步骤3.3：根据所述字粒度向量、所述词粒度向量、所述实体关系粒度向量和所述字粒度语义特征、所述词粒度语义特征、所述实体关系粒度语义特征进行相似度计算，计算出所述相似度总分。

7.如权利要求6所述的基于深度学习的知识库问答方法，其特征在于，所述粒度向量表示还包括以下步骤：

步骤3.1.1：基于随机初始化的方式，对所述候选答案路径中的字进行字粒度向量表示，获得所述字粒度向量；

步骤3.1.2：基于word2vec预训练词向量工具，对所述候选答案路径中的词进行词粒度向量表示，获得所述词粒度向量；

步骤3.1.3：基于随机初始化的方式，对所述候选答案路径中的实体关系进行实体关系粒度向量表示，获得所述实体关系粒度向量。

8.如权利要求6所述的基于深度学习的知识库问答方法，其特征在于，所述语义特征提取还包括以下步骤：

步骤3.2.1：对所述字粒度向量、所述词粒度向量和所述实体关系粒度向量分别进行加权计算，分别获得字粒度候选路径下的字粒度用户问句、词粒度候选路径下的词粒度用户问句和实体关系粒度的候选路径下的实体关系粒度用户问句；

步骤3.2.2：分别对所述字粒度用户问句、所述词粒度用户问句和所述实体关系粒度用户问句进行提取，分别获得所述字粒度语义特征、所述词粒度语义特征和所述实体关系粒度语义特征。

9.如权利要求6所述的基于深度学习的知识库问答方法，其特征在于，所述相似度计算还包括以下步骤：

步骤3.3.1：对所述字粒度向量和所述字粒度语义特征进行字粒度相似度计算，计算出字粒度候选路径下用户的自然语言问句和候选答案路径的字粒度相似度得分；

步骤3.3.2：对所述词粒度向量和所述词粒度语义特征进行词粒度相似度计算，计算出词粒度候选路径下用户的自然语言问句和候选答案路径的词粒度相似度得分；

步骤3.3.3：对所述实体关系粒度向量和所述实体关系粒度语义特征进行实体关系粒度相似度计算，计算出实体关系粒度候选路径下用户的自然语言问句和候选答案路径的实体关系粒度相似度得分；

步骤3.3.4：对所述字粒度相似度得分、所述词粒度相似度得分和所述实体关系粒度相似度得分进行权重分配，并计算出所述相似度总分。

10.如权利要求1所述的基于深度学习的知识库问答方法，其特征在于，所述排序权重还包括以下步骤：

步骤4.1：根据所述相似度总分，对所述候选答案路径进行排序，获得排序后的候选答案路径；

步骤4.2：从所述排序后的候选答案路径中，筛选出多个候选答案路径；

步骤4.3：对所述多个候选答案路径分别赋予不同的权重，获得所述不同权重的多个候选答案路径。