CN117235238B

CN117235238B - 问答方法、装置、存储介质及计算机设备

Info

Publication number: CN117235238B
Application number: CN202311499126.3A
Authority: CN
Inventors: 雷翔; 周子叶; 张开元; 白皓; 郭媛
Original assignee: Guangdong Mushroom Iot Technology Co ltd
Current assignee: Guangdong Mushroom Iot Technology Co ltd
Priority date: 2023-11-13
Filing date: 2023-11-13
Publication date: 2024-03-08
Anticipated expiration: 2043-11-13
Also published as: CN117235238A

Abstract

本申请提供了一种问答方法、装置、存储介质及计算机设备中，一方面，在接收到涉及目标专业领域的问题文本时，可以根据目标专业领域对应的目标知识库的数据量，采用与数据量相对应的快速匹配算法，对问题向量和目标知识库中的多条专家知识向量进行语义相似度匹配，从而可从目标知识库中快速筛选出与问题向量语义相似度最高的N条专家知识向量作为目标知识向量。另一方面，通过将问题文本和每个目标知识向量对应的专家知识文本输入到大语言模型中，使得大语言模型可以学习目标专业领域中与问题文本关联度最高的专家知识文本，有助于通用的大语言模型成为目标专业领域相关的大语言模型，并可准确回答涉及目标专业领域的问题。

Description

问答方法、装置、存储介质及计算机设备

技术领域

本申请涉及智能问答技术领域，尤其涉及一种问答方法、装置、存储介质及计算机设备。

背景技术

随着人工智能的不断发展，一些大语言模型可以在大多数通用场景下具备较好的问答表现，但在面对一些专业领域或面对较新的知识时，由于大语言模型的训练数据针对专业领域或特定行业的覆盖度不够全面，因此现有技术容易出现问题理解不准确、知识过时或知识获取困难等问题，进而无法高效准确地回答问题。

发明内容

本申请的目的旨在至少能解决上述的技术缺陷之一，特别是现有技术中无法高效准确地回答问题的技术缺陷。

第一方面，本申请实施例提供了一种问答方法，所述方法包括：

接收涉及目标专业领域的问题文本，并将所述问题文本转换为问题向量；

若所述问题文本满足预设问题筛选规则，则确定目标知识库的数据量；其中，所述目标知识库包括多个涉及所述目标专业领域的专家知识向量，每个所述专家知识向量是根据预先获取的专家知识文本生成的；

采用对应于所述数据量的快速匹配算法，从所述目标知识库中筛选出与所述问题向量语义相似度最高的N个所述专家知识向量作为目标知识向量；

分别获取每个所述目标知识向量对应的目标专家知识文本，并将各个所述目标专家知识文本和所述问题文本输入到大语言模型中，以使所述大语言模型根据各个所述目标专家知识文本输出所述问题文本对应的答案文本。

第二方面，本申请实施例提供了一种问答装置，所述装置包括：

问题接收模块，用于接收涉及目标专业领域的问题文本，并将所述问题文本转换为问题向量；

数据量确定模块，用于若所述问题文本满足预设问题筛选规则，则确定目标知识库的数据量；其中，所述目标知识库包括多个涉及所述目标专业领域的专家知识向量，每个所述专家知识向量是根据预先获取的专家知识文本生成的；

向量筛选模块，用于采用对应于所述数据量的快速匹配算法，从所述目标知识库中筛选出与所述问题向量语义相似度最高的N个所述专家知识向量作为目标知识向量；

答案文本获取模块，用于分别获取每个所述目标知识向量对应的目标专家知识文本，并将各个所述目标专家知识文本和所述问题文本输入到大语言模型中，以使所述大语言模型根据各个所述目标专家知识文本输出所述问题文本对应的答案文本。

第三方面，本申请实施例提供了一种存储介质，该存储介质中存储有计算机可读指令，该计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述任一实施例所述问答方法的步骤。

第四方面，本申请实施例提供了一种计算机设备，该计算机设备包括：一个或多个处理器，以及存储器；

所述存储器中存储有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，执行上述任一实施例所述问答方法的步骤。

在本申请一些实施例提供的问答方法、装置、存储介质及计算机设备中，一方面，在接收到涉及目标专业领域的问题文本时，可以根据目标专业领域对应的目标知识库的数据量，采用与数据量相对应的快速匹配算法，对问题向量和目标知识库中的多条专家知识向量进行语义相似度匹配，从而可从目标知识库中快速筛选出与问题向量语义相似度最高的N条专家知识向量作为目标知识向量。另一方面，本申请通过将问题文本和每个目标知识向量对应的专家知识文本输入到大语言模型中，使得大语言模型可以学习目标专业领域中与问题文本关联度最高的专家知识文本，有助于通用的大语言模型成为目标专业领域相关的大语言模型，并可准确回答涉及目标专业领域的问题。由此可见，本申请可以高效准确地回答目标专业领域的相关问题，实现高效性与准确性的兼顾。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为一个实施例中，问答方法的流程示意图之一；

图2为一个实施例中，采用对应于数据量的快速匹配算法，从目标知识库中筛选出与问题向量语义相似度最高的N个专家知识向量作为目标知识向量步骤的流程示意图；

图3为一个实施例中，向量生成的示意图；

图4为一个实施例中，问答方法的流程示意图之二；

图5为一个实施例中，问答方法的流程示意图之三；

图6为一个实施例中，问答装置的示意性结构框图；

图7为一个实施例中，计算机设备的内部结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在一个实施例中，本申请提供了一种问答方法。下述实施例以该方法应用于计算机设备为例进行说明，可以理解，本文的计算机设备可以是具备数据处理功能的设备，可以但不限于是电子终端、笔记本电脑、台式电脑、服务器等。

如图1所示，本申请提供的问答方法可以包括如下步骤：

S102：接收涉及目标专业领域的问题文本，并将问题文本转换为问题向量。

其中，目标专业领域可以是任意专业领域，本文对此不作具体限制。为便于描述，本文一些实施例以目标专业领域为工业互联网领域作为示例进行说明，进一步地，工业互联网领域可以包括空压领域、中央空调云智控领域、知识问答领域等多个细分领域。问题文本可以是涉及目标专业领域的文本信息，问题向量可用于表示问题文本的语义内容特征。

本步骤中，计算机设备可以接收问题文本并将该问题文本转换为问题向量，如此，可通过向量的形式来表示问题文本的语义内容，以便于计算机设备准确理解问题文本。可以理解，本申请可采用任意方式来实现文本与向量的转换，在一个示例中，计算机设备可以采用embedding模型将问题文本转换为问题向量。

S104：若问题文本满足预设问题筛选规则，则确定目标知识库的数据量；其中，目标知识库包括多个涉及目标专业领域的专家知识向量，每个专家知识向量是根据预先获取的专家知识文本生成的。

其中，目标知识库可以是与目标专业领域相关联的专家知识库，其存储有多个目标专业领域的专家知识向量。在目标知识库中，每个专家知识向量均为根据目标专业领域的专家知识文本生成的。

在本步骤中，计算机设备可以依据预设问题筛选规则对问题文本进行筛选，以判断是否需要回答该问题文本。可以理解，预设问题筛选规则的具体规则内容可以依据目标专业领域、具备问答方法使用权限的人员性质等实际情况确定，本文对此不作具体限制。在一个示例中，预设问题筛选规则可用于对问题文本进行合规校验，例如用于校验问题文本涉及的问题是否符合法律法规要求以及是否涉及心理健康、歧视偏见、辱骂仇恨等问题。若问题文本合规，则可确定问题文本满足预设问题筛选规则。

在问题文本满足预设问题筛选规则的情况下，计算机设备可确定需要回答问题文本。在此情况下，计算机设备可以确定目标知识库的数据量，以便于后续根据数据量进行向量筛选。进一步地，在一个示例中，若问题文本不满足预设问题筛选规则，则计算机设备可以过滤该问题文本，也即不执行后续步骤，并发送拒绝作答提示信息。

S106：采用对应于数据量的快速匹配算法，从目标知识库中筛选出与问题向量语义相似度最高的N个专家知识向量作为目标知识向量。

可以理解，目标知识库的数据量可以反映目标知识库中专家知识向量的数量，和/或每个专家知识向量的维数。目标知识库的数据量大小影响着语义相似度匹配的匹配效率。在采用相同的匹配算法进行语义相似度匹配的情况下，当待匹配的专家知识向量的数量越多，和/或每个专家知识向量的维数越高时，匹配耗时越长。例如，在匹配算法相同，且待匹配的专家知识向量数量相同的情况下，相较于每个专家知识向量为1×128维的向量，当每个专家知识向量为1×1536的向量时匹配耗时更长。

本步骤中，计算机设备可以根据目标知识库的数据量，按序选择与数据量对应的快速匹配算法，并采用该快速匹配算法对问题文本和目标知识库中的多条专家知识向量快速进行语义相似度匹配，以从目标知识库中筛选出与问题向量语义相似度最高的N个专家知识向量作为N个目标知识向量。其中，N为正整数。在一些示例中，与数据量对应的快速匹配算法可以是能够将匹配耗时控制在预设耗时阈值以内的语义相似度匹配算法。

本步骤通过采用目标知识库的数据量对应的快速匹配算法，筛选出语义相似度最高的N个目标知识向量，从而可在准确理解问题文本的前提下，快速、高效地匹配出与问题文本最相关的专家知识向量。

S108：分别获取每个目标知识向量对应的目标专家知识文本，并将各个目标专家知识文本和问题文本输入到大语言模型中，以使大语言模型根据各个目标专家知识文本输出问题文本对应的答案文本。

其中，每个目标知识向量对应的目标专家知识文本是指用于生成该目标知识向量的专家指示文本。大语言模型（简称为LLM）可以是使用大量文本数据训练得到的深度学习模型。

本步骤中，计算机设备可以根据各个目标知识向量，确定出与问题文本语义相似度最高的N个目标专家知识文本，并将问题文本和N个目标专家知识文本共同输入至大语言模型中。如此，可以融合目标专业领域的知识库和大语言模型，使得大语言模型可以学习到在模型训练阶段未覆盖的专家知识。通用的大语言模型在学习各个目标专家知识文本后，可视为能够用于实现目标专业领域相关的专业问答模型，并可输出更加准确的答案文本。

可以理解，本步骤采用的大语言模型可以是现有技术中任一大语言模型。进一步地，在一个示例中，可以人工选择多个大语言模型作为候选模型，并随机抽取目标知识库中的部分专家知识向量作为测试知识向量，按照不同提问方向分别设置多个不同的测试问题文本，且分别获取每个测试问题文本对应的由人工回答的测试答案文本。采用各个测试问题文本、各个测试知识向量和各个测试答案文本，分别确定每个候选模型的回答准确度，并根据各个回答准确度从多个候选模型中选择一个候选模型作为最终使用的大语言模型。

本实施例中，一方面，在接收到涉及目标专业领域的问题文本时，可以根据目标专业领域对应的目标知识库的数据量，采用与数据量相对应的快速匹配算法，对问题向量和目标知识库中的多条专家知识向量进行语义相似度匹配，从而可从目标知识库中快速筛选出与问题向量语义相似度最高的N条专家知识向量作为目标知识向量。另一方面，本申请通过将问题文本和每个目标知识向量对应的专家知识文本输入到大语言模型中，使得大语言模型可以学习目标专业领域中与问题文本关联度最高的专家知识文本，有助于通用的大语言模型成为目标专业领域相关的大语言模型，并可准确回答涉及目标专业领域的问题。由此可见，本申请可以高效准确地回答目标专业领域的相关问题，实现高效性与准确性的兼顾。

在一个实施例中，如图2所示，采用对应于数据量的快速匹配算法，从目标知识库中筛选出与问题向量语义相似度最高的N个专家知识向量作为目标知识向量，包括：

S202：在目标知识库中选取m个专家知识向量作为待匹配向量；其中，m不大于目标知识库的向量总数量；

S204：若数据量大于第一预设数据量阈值，则将m个1×n维的待匹配向量组合为m×n维的第一中间向量，并根据预设的分段数量M，将第一中间向量划分为M段第二中间向量；

S206：根据分段数量M，将问题向量划分为M段第三中间向量；

S208：基于M段第二中间向量、M段第三中间向量、每段第二中间向量在第一中间向量中的列位置和每段第三中间向量在问题向量中的列位置，分别确定问题向量与每个待匹配向量之间的待匹配向量距离；

S210：根据各个待匹配向量距离，筛选出与问题向量语义相似度最高的N个待匹配向量作为N 个目标知识向量。

其中，待匹配向量可以是需要与问题向量进行深度语义相似度匹配的专家知识向量。目标知识库的向量总数量是指目标知识库所包括的专家知识向量的总数量。m、n和M均为正整数。

在本实施例中，计算机设备可以在目标知识库中选取出m个待匹配向量，其中m个待匹配向量可以是目标知识库中的全部专家知识向量，也可以是目标知识库中的部分专家知识向量。

当目标知识库的数据量大于第一预设数据量阈值时，表明目标知识库的数据量较大。在此情况下，若进行暴力搜索，也即直接将问题向量与每个专家知识向量进行语义相似度计算，并根据计算结果进行向量筛选，则需要消耗较长时间，匹配效率低。因此，在本实施例中，当目标知识库的数据量较大时，计算机设备可以进行分段匹配，通过降低匹配向量的维数来提高语义相似度匹配效率。

具体而言，计算机设备可以将m个1×n维的待匹配向量组合为m×n维的第一中间向量，第一中间向量的每一行分别表示1个待匹配向量。以m=2，n=3为例，若其中一个待匹配向量为[1,2,3]，另一个待匹配向量为[4,5,6]，则组合得到的第一中间向量为：

；

需要说明的是，上述示例中m和n的取值仅用于举例说明，并非对m和n的取值做出限定。

在得到第一中间向量的情况下，计算机设备可以根据预先设置的分段数量M，将第一中间向量划分为M段第二中间向量。若将M段第二中间向量按照各段第二中间向量在第一中间向量中的列位置进行拼接，则可以得到第一中间向量。在一个示例中，若n/M为整数，则在M段第二中间向量中，第i段第二中间向量可以是第一中间向量中第[(i-1)×(n/M)+1]列至第[(i×(n/M)]列的向量片段，i≤M。

计算机设备还可根据分段数量将问题向量划分为M段第三中间向量。划分问题向量的具体说明可参阅划分第一中间向量的相关说明，本文在此不再赘述。在得到M段第二中间向量和M段第三中间向量的情况下，计算机设备可以根据M段第二中间向量、M段第三中间向量、每段第二中间向量在第一中间向量中的列位置和每段第三中间向量在问题向量中的列位置进行分段匹配，从而可分别确定问题向量与每个待匹配向量之间的待匹配向量距离。可以理解，本申请可以采用任意向量距离计算算法来计算向量距离，例如可以采用余弦相似度算法或皮尔逊相关系数算法等来实现。

在得到各个待匹配向量对应的待匹配向量距离的情况下，由于待匹配向量距离可以反映待匹配向量与问题向量的语义相关度，因此可以根据各个待匹配向量距离进行语义相关度筛选，以筛选出与问题向量语义相似度最高的N个待匹配向量作为N 个目标知识向量。

本实施例中，当目标知识库的数据量较大时，计算机设备可以进行分段匹配，通过降低匹配向量的维数来提高语义相似度匹配效率，以进一步实现高效问答。

在一个实施例中，采用对应于数据量的快速匹配算法，从目标知识库中筛选出与问题向量语义相似度最高的N个专家知识向量作为目标知识向量，还包括：

若数据量小于或等于第一预设数据量阈值，则可分别采用向量距离计算算法分别计算问题向量和目标知识库中每个专家知识向量之间的待匹配向量距离，并根据各个待匹配向量距离，筛选出与问题向量语义相似度最高的N个待匹配向量作为N 个目标知识向量。

本实施例中，当目标知识库的数据量小于或等于第一预设数据量阈值时，表明目标知识库的数据量较小，因此可以直接计算向量距离并进行语义相似度筛选。

在一个实施例中，基于M段第二中间向量、M段第三中间向量、每段第二中间向量在第一中间向量中的列位置和每段第三中间向量在问题向量中的列位置，分别确定问题向量与每个待匹配向量之间的待匹配向量距离，包括：

针对每段第二中间向量，根据预设的第一聚类类别数量P，对该第二中间向量中m个1×k维的子向量进行聚类，并得到P个第一聚类中心向量，且分别确定每个第一聚类中心向量的向量标识；k为n/M；

针对每段第二中间向量，分别确定该第二中间向量中每个1×k维的子向量对应的目标标识，并基于每个子向量在该第二中间向量中的行列位置和每个子向量对应的目标标识，生成m×1维的第四中间向量，其中，每个子向量对应的目标标识为在该段第二中间向量对应的P个第一聚类中心向量中，与该子向量距离最近的第一聚类中心向量的向量标识；

根据每段第二中间向量在第一中间向量中的列位置，将M个第四中间向量组合为m×M维的第五中间向量；

针对每段第三中间向量，根据该第三中间向量在问题向量中的列位置确定目标第二中间向量，并分别计算该第三中间向量与目标第二中间向量对应的P个第一聚类中心向量之间的第一中间向量距离；

基于第五中间向量和各个第一中间向量距离，分别计算问题向量与每个待匹配向量之间的待匹配向量距离。

本实施例中，请参阅图3，在分段匹配的过程中，计算机设备可以分别对M段第二中间向量进行聚类，以分别得到每段第二中间向量对应的P个第一聚类中心向量。具体而言，针对每段第二中间向量，该段第二中间向量为m×k维，每个1×k维的子向量分别为一个专家知识向量的向量片段，计算机设备可以对该段第二中间向量中m个1×k维的子向量进行聚类，以将m个子向量聚集成P个类别并得到P个第一聚类中心向量，在得到该段第二中心向量对应的P个第一聚类中心向量的情况下，计算机设备可以分别对应每个第一聚类中心向量的向量标识。

可以理解，在分别对每段第二中间向量进行聚类后，每段第二中间向量均可对应着P个第一聚类中心向量。向量标识可用于唯一地标识各个第一聚类中心向量，换言之，每两个第一聚类中心向量对应的向量标识均不相同。进一步地，针对每段第二中间向量，计算机设备还可生成包括该段第二中间向量对应的P个第一聚类中心向量的第六中间向量，每个第六中间向量为P×(n/M）维。

在聚类完成后，针对每段第二中间向量，计算机设备可以在该段第二中间向量对应的P个第一聚类中心向量中，分别确定该第二中间向量中每个子向量对应的距离最近的第一聚类中心向量的向量标识，以得到每个子向量对应的目标标识。在得到每个子向量对应的目标标识后，请参阅图3，计算机设备还可根据每个子向量在该第二中间向量中的行列位置和每个子向量对应的目标标识，生成m×1维的第四中间向量。在每个第二中间向量对应的第四中间向量中，第j行的值为该第二中间向量第j行子向量对应的目标标识。

在分别根据每段第二中间向量生成第四中间向量后，计算机设备可以根据各段第二中间向量在第一中间向量中的列位置，将各个第四中间向量拼接为m×M维的第五中间向量。在第五中间向量中，第j行第i列的值为第i段第二中间向量第j行子向量对应的目标标识。如此，可以通过各个第一聚类中心向量的向量标识，采用低维数的第五中间向量来表示高维数的第一中间向量，实现向量降维。

每段第三中间向量为对问题向量进行划分得到的1×k维的向量。针对每段第三中间向量，计算机设备可以根据该段第三中间向量在问题向量中的列位置，确定该段第三中间向量对应的目标第二中间向量。例如，若该段第三中间向量为问题向量中的第i段向量片段，则可将作为第一中间向量的第i段向量片段的第二中间向量作为目标第二中间向量。

在确定每段第三中间向量对应的目标第二中间向量，对于每段第三中间向量，计算机设备可以分别计算该段第三中间向量与目标第二中间向量对应的P个第一聚类中心向量之间的向量距离，以得到该段第三中间向量对应的P个第一中间向量距离。

每个待匹配向量与问题向量的距离d均可表示为d=d1+d2+…+dM，其中，d1为该待匹配向量第1段向量片段与问题向量之间的距离，可近似为与第1段向量片段距离最近的第一聚类中心向量与问题向量之间的距离。同理，d2为该待匹配向量第2段向量片段与问题向量之间的距离，可近似为与第2段向量片段距离最近的第一聚类中心向量与问题向量之间的距离。dM为该待匹配向量第M段向量片段与问题向量之间的距离，可近似为与第M段向量片段距离最近的第一聚类中心向量与问题向量之间的距离。如此，计算机设备可以基于第五中间向量和各个第一中间向量距离，计算得到问题向量与每个待匹配向量之间的待匹配向量距离。

本实施例中，通过将高维数的第一中间向量降维为低维数的第五中间向量，并采用第一聚类中心向量来计算待匹配向量距离，从而可降低计算量，并提高语义相似度匹配效率，以进一步实现高效问答。

在一个实施例中，在目标知识库中选取m个专家知识向量作为待匹配向量，包括：

若数据量大于第一预设数据量阈值，且小于或等于第二预设数据量阈值，则将目标知识库中各个专家知识向量作为m个待匹配向量；其中，m为目标知识库的向量总数量，第一预设数据量阈值小于第二预设数据量阈值；

若数据量大于第二预设数据量阈值，则根据预设的第二聚类类别数量Q，对目标知识库中的各个专家知识向量进行聚类，以得到Q个聚类类别和每个聚类类别对应的第二聚类中心向量；

分别计算问题向量与每个第二聚类中心向量之间的第二中间向量距离，并根据各个第二中间向量，确定与问题向量语义相似度最高的K个聚类类别作为目标类别；

分别将每个目标类别包括的专家知识向量作为各个待匹配向量。

具体而言，当目标知识库的数据量大于第一预设数据量阈值，且小于或等于第二预设数据量阈值时，可以将目标知识库中的全部专家知识向量作为待匹配向量，并进行分段匹配。

但是，当目标知识库的数据量大于第二预设数据量阈值时，表明目标知识库中包括大量的专家知识向量，目标知识库中数量较多的专家知识向量与问题向量的关联性较低，计算机设备难以从关联性较低的专家知识向量中匹配出语义相似度较高的目标知识向量，因此，计算机设备可以在进行深度语义相似度匹配之前，过滤这部分专家知识向量，以减少后续进行深度语义相似度匹配的向量数量，从而可降低计算量，并提高语义相似度匹配效率，以进一步实现高效问答。

具体地，在数据量大于第二预设数据量阈值的情况下，计算机设备可以根据第二聚类类别数量Q（Q为正整数），对目标知识库中的各个专家知识向量进行聚类，并可得到Q个聚类类别和每个聚类类别对应的第二聚类中心向量，每个第二聚类中心向量可以是1×n维的向量。计算机设备可分别计算问题向量与每个第二聚类中心向量之间的第二中间向量距离，以通过第二中间向量距离，确定问题向量与每个聚类类别之间的语义关联度。计算机设备可以根据各个第二中间向量，在Q个聚类类别中选取与问题向量语义相似度最高的K个聚类类别作为目标类别，并将属于任一目标类别的专家知识向量作为待匹配向量。

进一步地，在一个示例中，在确定各个待匹配向量后，计算机设备还可将各个待匹配向量和问题向量进行归一化，并基于归一化后的问题向量和各个待匹配向量，执行分段匹配。

在一个实施例中，N个目标知识向量对应的最大距离差值小于预设差值阈值，最大距离差值为N个目标知识向量对应的最大待匹配向量距离与最小待匹配向量距离之差。

本实施例中，若直接选取固定数量的目标知识向量，N个目标知识向量中可能会存在与问题向量语义相似度较低的专家知识向量。例如，当N固定为6时，各个目标知识向量对应的待匹配向量距离可能分别为0.2，0.5，0.56，0.76，0.78，0.8，在此情况下，选取出的各个目标知识向量中仅有1个与问题文本较为相关，其余目标知识向量的语义关联度均较小。若将语义关联度较小的专家知识文本输入到大语言模型中，则会对大语言模型输出的答案文本的准确性有所影响。

因此，在本实施例中，计算机设备可以按照待匹配向量距离，选取出语义相似度最高且相互之间的待匹配向量距离相差不大的待匹配向量作为目标知识向量。在N个目标知识向量中，最大待匹配向量距离为N个目标知识向量对应的待匹配向量距离中的最大值，最小待匹配向量距离为N个目标知识向量对应的待匹配向量距离中的最小值。当N个目标知识向量对应的最大距离差值小于预设差值阈值时，表明目标知识向量相互之间的待匹配向量距离相差不大，各个目标知识向量对应的专家知识文本均为与问题文本较为相关的专家知识文本。如此，可以进一步提高问答的准确性。

在一个实施例中，如图4所示，本申请的问答方法还可包括如下步骤：

S402：在满足预设的知识库更新规则的情况下，确定用于存储目标专业领域的专业知识文本的各个目标数据库，并从各个目标数据库中获取各个初始知识文本；

S404：分别对每个初始知识文本进行文本处理，以得到各个专家知识文本；

S406：分别将每个专家知识文本转换为专家知识向量，并将各个专家知识向量存储在目标知识库中。

本实施例中，计算机设备可以不断更新、维护和完善目标知识数据库，确保目标知识库中涉及的专家知识文本的完整性和时效性，进而可克服大语言模型知识过时、知识更新困难等问题，从而可避免由知识过时或者专家知识文本获取不足而导致的回答准确性低，进而可进一步提高回答的准确性。

具体而言，计算机设备可以在满足预设的知识库更新规则的情况下，从用于存储目标专业领域的专业知识文本的各个目标数据库中，获取各个初始知识文本，以便于根据各个初始知识文本更新目标知识库。

在获取到初始知识文本后，计算机设备可以对其进行文本处理，以得到各个专家知识文本。在一个示例中，对于每个初始知识文本，计算机设备可以首先去除初始知识文本中的一些无意义的特殊字符，并得到中间知识文本，而后可以根据按照中间知识文本的知识结构或者长度，将中间知识文本切分成小部分的专家知识文本，例如按照段落结构来进行切分或者按照字数来进行切分。进一步地，若中间知识文本的知识结构较好，每段均为完整描述，且每段的字数均不多，则计算机设备可以按照段落结构来进行切分。若中间知识文本的描述较长，和/或段落结构比较凌乱，则可选择按照固定字数进行切分，如200字。在按照固定字数切分时，前后分段之间可有一定字数的重复，以减少上下文信息的损失。

在得到各个专家知识文本后，计算机设备可以分别将每个专家知识文本转换为专家知识向量，并存入目标知识库。在一个示例中，计算机设备可以通过embedding模型分别将每个专家知识文本转换成n纬的专家知识向量。

在一个实施例中，各个目标数据库用于存储工业互联网领域的专家知识、云智控***运维记录信息、工业互联网专家培训文档和工业场景问题集中的至少一种数据。

本实施例中，在工业互联网领域中，可利用云智控等产品的优势，在使用的过程中，不断收集工业互联网领域专家知识，并自动化提取和整理，不断更新和完善知识库。通过云智控等产品使用过程中产生的各种运维记录与日志、产品相关的专业知识、工业互联网专家培训文档以与工业现场客户的沟通反馈记录等，对目标知识库进行更新和维护。如此，可进一步避免由知识过时或者专家知识文本获取不足而导致的回答准确性低，进而可进一步提高回答的准确性。

本实施例中，大语言模型能够高效准确地回答工业互联网领域的专业问题，进而快速解决用户在工业互联网领域的相关问题。

为便于理解本申请的方案，下面通过一个具体的示例进行说明。请参阅图5，本示例的问答方法可以包括如下步骤：

步骤A1：接收涉及工业互联网领域的问题文本，并通过embedding模型将问题文本转换为问题向量。

步骤A2：将问题向量与目标知识库中的专业知识向量进行语义相似度匹配，以从目标知识库筛选出与问题向量语义相似度较高的N个专家知识向量作为目标知识向量。

步骤A3：将问题文本和N个目标知识向量对应的专家知识文本输入至大语言模型，使得大语言模型可根据专家知识文本生成相比没有专家知识时更为准确的答案。

其中，步骤A2可以包括如下步骤：

步骤B1：将目标知识库内所有专家知识向量组合成一个m×n维的第一中间向量，其中m为目标知识库的向量总数量，n为每个专家知识向量的向量维度，n=1536；

步骤B2：确定分段数量M=8，将第一中间向量划分成8段第二中间向量，每段第二中间向量的维度为m×192。

步骤B3：针对每段第二中间向量，根据第一聚类类别数量P，将该段第二中间向量中的m个1×192维的子向量进行聚类，并得到该段第二中间向量的各个第一聚类中心向量，每个第一聚类中心向量为1×192维，取P个第一聚类中心向量形成第六中间向量。P=256，每段第六中间向量的向量维度为256×192。

步骤B4：针对每段第二中间向量，分别将该段第二中间向量中每个1×192维的每个子向量，与该段第二中间向量对应的256个第一聚类中心向量计算距离，并得到每个子向量对应的距离最近的第一聚类中心向量的向量标识，生成中m×8维的第五中间向量。

步骤B5：问题向量为1×1536维的向量，根据分段数量将问题向量划分8个1×192维的第三中间向量。

步骤B6：根据各段第三中间向量在问题向量中的列位置，分别将各段第三中间向量与第五中间向量中的对应向量标识的第一聚类中心计算向量距离，并据此得到问题向量与每个专家知识向量的待匹配向量距离。

步骤B7：根据各个待匹配向量距离，从目标知识库筛选出与问题向量语义相似度较高的N个专家知识向量作为目标知识向量。

如此，可以快速、准确地解答用户问题。

下面对本申请实施例提供的问答装置进行描述，下文描述的问答装置与上文描述的问答方法可相互对应参照。

在一个实施例中，如图6所示，本申请提供了一种问答装置600，该装置600包括：

问题接收模块610，用于接收涉及目标专业领域的问题文本，并将所述问题文本转换为问题向量；

数据量确定模块620，用于若所述问题文本满足预设问题筛选规则，则确定目标知识库的数据量；其中，所述目标知识库包括多个涉及所述目标专业领域的专家知识向量，每个所述专家知识向量是根据预先获取的专家知识文本生成的；

向量筛选模块630，用于采用对应于所述数据量的快速匹配算法，从所述目标知识库中筛选出与所述问题向量语义相似度最高的N个所述专家知识向量作为目标知识向量；

答案文本获取模块640，用于分别获取每个所述目标知识向量对应的目标专家知识文本，并将各个所述目标专家知识文本和所述问题文本输入到大语言模型中，以使所述大语言模型根据各个所述目标专家知识文本输出所述问题文本对应的答案文本。

在一个实施例中，向量筛选模块630包括待匹配向量确定单元、第一分段单元、第二分段单元、匹配单元和目标知识向量筛选单元。其中，待匹配向量确定单元用于在所述目标知识库中选取m个专家知识向量作为待匹配向量；其中，m不大于所述目标知识库的向量总数量。第一分段单元用于若所述数据量大于第一预设数据量阈值，则将m个1×n维的所述待匹配向量组合为m×n维的第一中间向量，并根据预设的分段数量M，将所述第一中间向量划分为M段第二中间向量。第二分段单元用于根据所述分段数量M，将所述问题向量划分为M段第三中间向量。匹配单元用于基于M段所述第二中间向量、M段所述第三中间向量、每段所述第二中间向量在所述第一中间向量中的列位置和每段所述第三中间向量在所述问题向量中的列位置，分别确定所述问题向量与每个所述待匹配向量之间的待匹配向量距离。目标知识向量筛选单元用于根据各个所述待匹配向量距离，筛选出与所述问题向量语义相似度最高的N个所述待匹配向量作为N 个所述目标知识向量。

在一个实施例中，匹配单元包括第一聚类单元、第四中间向量生成单元、第五中间向量生成单元、第一向量距离计算单元和第二向量距离计算单元。其中，第一聚类单元用于针对每段第二中间向量，根据预设的第一聚类类别数量P，对该第二中间向量中m个1×k维的子向量进行聚类，并得到P个第一聚类中心向量，且分别确定每个所述第一聚类中心向量的向量标识；k为n/M。第四中间向量生成单元用于针对每段第二中间向量，分别确定该第二中间向量中每个1×k维的子向量对应的目标标识，并基于每个子向量在该第二中间向量中的行列位置和每个子向量对应的目标标识，生成m×1维的第四中间向量，其中，每个子向量对应的目标标识为在该段第二中间向量对应的P个第一聚类中心向量中，与该子向量距离最近的第一聚类中心向量的向量标识。第五中间向量生成单元用于根据每段所述第二中间向量在所述第一中间向量中的列位置，将M个所述第四中间向量组合为m×M维的第五中间向量。第一向量距离计算单元用于针对每段第三中间向量，根据该第三中间向量在所述问题向量中的列位置确定目标第二中间向量，并分别计算该第三中间向量与所述目标第二中间向量对应的P个所述第一聚类中心向量之间的第一中间向量距离。第二向量距离计算单元用于基于所述第五中间向量和各个所述第一中间向量距离，分别计算所述问题向量与每个所述待匹配向量之间的所述待匹配向量距离。

在一个实施例中，待匹配向量确定单元可以包括第一选取单元、第二聚类单元、目标类别确定单元和第二选取单元。其中，第一选取单元用于若所述数据量大于所述第一预设数据量阈值，且小于或等于第二预设数据量阈值，则将所述目标知识库中各个所述专家知识向量作为m个所述待匹配向量；其中，m为所述目标知识库的向量总数量，所述第一预设数据量阈值小于所述第二预设数据量阈值。第二聚类单元用于若所述数据量大于所述第二预设数据量阈值，则根据预设的第二聚类类别数量Q，对所述目标知识库中的各个所述专家知识向量进行聚类，以得到Q个聚类类别和每个所述聚类类别对应的第二聚类中心向量。目标类别确定单元用于分别计算所述问题向量与每个所述第二聚类中心向量之间的第二中间向量距离，并根据各个所述第二中间向量，确定与所述问题向量语义相似度最高的K个所述聚类类别作为目标类别。第二选取单元用于分别将每个所述目标类别包括的专家知识向量作为各个所述待匹配向量。

在一个实施例中，N个所述目标知识向量对应的最大距离差值小于预设差值阈值，所述最大距离差值为N个所述目标知识向量对应的最大待匹配向量距离与最小待匹配向量距离之差。

在一个实施例中，问答装置600还可包括初始文本获取模块、文本处理模块和向量转换模块。其中，初始文本获取模块用于在满足预设的知识库更新规则的情况下，确定用于存储所述目标专业领域的专业知识文本的各个目标数据库，并从各个所述目标数据库中获取各个初始知识文本。文本处理模块用于分别对每个所述初始知识文本进行文本处理，以得到各个专家知识文本。向量转换模块用于分别将每个专家知识文本转换为专家知识向量，并将各个专家知识向量存储在所述目标知识库中。

在一个实施例中，各个所述目标数据库用于存储工业互联网领域的专家知识、云智控***运维记录信息、工业互联网专家培训文档和工业场景问题集中的至少一种数据。

在一个实施例中，本申请还提供了一种存储介质，该存储介质中存储有计算机可读指令，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如任意实施例中问答方法的步骤。

在一个实施例中，本申请还提供了一种计算机设备，所述计算机设备中存储有计算机可读指令，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如任意实施例中问答方法的步骤。

示意性地，图7为本申请实施例提供的一种计算机设备的内部结构示意图，在一个示例中，该计算机设备可以为服务器。参照图7，计算机设备900包括处理组件902，其进一步包括一个或多个处理器，以及由存储器901所代表的存储器资源，用于存储可由处理组件902的执行的指令，例如应用程序。存储器901中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件902被配置为执行指令，以执行上述任意实施例所述问答方法的步骤。

计算机设备900还可以包括一个电源组件903被配置为执行计算机设备900的电源管理，一个有线或无线网络接口904被配置为将计算机设备900连接到网络，和一个输入输出（I/O）接口905。计算机设备900可以操作基于存储在存储器901的操作***，例如WindowsServer TM、Mac OS XTM、Unix TM、Linux TM、Free BSDTM或类似。

本领域技术人员可以理解，本申请示出的计算机设备的内部结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本文中，“一”、“一个”、“所述”、“该”和“其”也可以包括复数形式，除非上下文清楚指出另外的方式。多个是指至少两个的情况，如2个、3个、5个或8个等。“和/或”包括相关所列项目的任何及所有组合。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间可以根据需要进行组合，且相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种问答方法，其特征在于，所述方法包括：

在所述目标知识库中选取m个专家知识向量作为待匹配向量；其中，m不大于所述目标知识库的向量总数量；

若所述数据量大于第一预设数据量阈值，则将m个1×n维的所述待匹配向量组合为m×n维的第一中间向量，并根据预设的分段数量M，将所述第一中间向量划分为M段第二中间向量；

根据所述分段数量M，将所述问题向量划分为M段第三中间向量；

针对每段第二中间向量，根据预设的第一聚类类别数量P，对该第二中间向量中m个1×k维的子向量进行聚类，并得到P个第一聚类中心向量，且分别确定每个所述第一聚类中心向量的向量标识；k为n/M；

根据每段所述第二中间向量在所述第一中间向量中的列位置，将M个所述第四中间向量组合为m×M维的第五中间向量；

针对每段第三中间向量，根据该第三中间向量在所述问题向量中的列位置确定目标第二中间向量，并分别计算该第三中间向量与所述目标第二中间向量对应的P个所述第一聚类中心向量之间的第一中间向量距离；

基于所述第五中间向量和各个所述第一中间向量距离，分别计算所述问题向量与每个所述待匹配向量之间的所述待匹配向量距离；

根据各个所述待匹配向量距离，筛选出与所述问题向量语义相似度最高的N个所述待匹配向量作为N个目标知识向量；

2.根据权利要求1所述的问答方法，其特征在于，所述在所述目标知识库中选取m个专家知识向量作为待匹配向量，包括：

若所述数据量大于所述第一预设数据量阈值，且小于或等于第二预设数据量阈值，则将所述目标知识库中各个所述专家知识向量作为m个所述待匹配向量；其中，m为所述目标知识库的向量总数量，所述第一预设数据量阈值小于所述第二预设数据量阈值；

若所述数据量大于所述第二预设数据量阈值，则根据预设的第二聚类类别数量Q，对所述目标知识库中的各个所述专家知识向量进行聚类，以得到Q个聚类类别和每个所述聚类类别对应的第二聚类中心向量；

分别计算所述问题向量与每个所述第二聚类中心向量之间的第二中间向量距离，并根据各个所述第二中间向量，确定与所述问题向量语义相似度最高的K个所述聚类类别作为目标类别；

分别将每个所述目标类别包括的专家知识向量作为各个所述待匹配向量。

3.根据权利要求1所述的问答方法，其特征在于，N个所述目标知识向量对应的最大距离差值小于预设差值阈值，所述最大距离差值为N个所述目标知识向量对应的最大待匹配向量距离与最小待匹配向量距离之差。

4.根据权利要求1至3任一项所述的问答方法，其特征在于，所述方法还包括：

在满足预设的知识库更新规则的情况下，确定用于存储所述目标专业领域的专业知识文本的各个目标数据库，并从各个所述目标数据库中获取各个初始知识文本；

分别对每个所述初始知识文本进行文本处理，以得到各个专家知识文本；

分别将每个专家知识文本转换为专家知识向量，并将各个专家知识向量存储在所述目标知识库中。

5.根据权利要求4所述的问答方法，其特征在于，各个所述目标数据库用于存储工业互联网领域的专家知识、云智控***运维记录信息、工业互联网专家培训文档和工业场景问题集中的至少一种数据。

6.一种问答装置，其特征在于，所述装置包括：

向量筛选模块，包括待匹配向量确定单元、第一分段单元、第二分段单元、第一聚类单元、第四中间向量生成单元、第五中间向量生成单元、第一向量距离计算单元、第二向量距离计算单元和目标知识向量筛选单元；

所述待匹配向量确定单元，用于在所述目标知识库中选取m个专家知识向量作为待匹配向量；其中，m不大于所述目标知识库的向量总数量；

所述第一分段单元，用于若所述数据量大于第一预设数据量阈值，则将m个1×n维的所述待匹配向量组合为m×n维的第一中间向量，并根据预设的分段数量M，将所述第一中间向量划分为M段第二中间向量；

所述第二分段单元，用于根据所述分段数量M，将所述问题向量划分为M段第三中间向量；

所述第一聚类单元，用于针对每段第二中间向量，根据预设的第一聚类类别数量P，对该第二中间向量中m个1×k维的子向量进行聚类，并得到P个第一聚类中心向量，且分别确定每个所述第一聚类中心向量的向量标识；k为n/M；

所述第四中间向量生成单元，用于针对每段第二中间向量，分别确定该第二中间向量中每个1×k维的子向量对应的目标标识，并基于每个子向量在该第二中间向量中的行列位置和每个子向量对应的目标标识，生成m×1维的第四中间向量，其中，每个子向量对应的目标标识为在该段第二中间向量对应的P个第一聚类中心向量中，与该子向量距离最近的第一聚类中心向量的向量标识；

所述第五中间向量生成单元，用于根据每段所述第二中间向量在所述第一中间向量中的列位置，将M个所述第四中间向量组合为m×M维的第五中间向量；

所述第一向量距离计算单元，用于针对每段第三中间向量，根据该第三中间向量在所述问题向量中的列位置确定目标第二中间向量，并分别计算该第三中间向量与所述目标第二中间向量对应的P个所述第一聚类中心向量之间的第一中间向量距离；

所述第二向量距离计算单元，用于基于所述第五中间向量和各个所述第一中间向量距离，分别计算所述问题向量与每个所述待匹配向量之间的所述待匹配向量距离；

所述目标知识向量筛选单元，用于根据各个所述待匹配向量距离，筛选出与所述问题向量语义相似度最高的N个所述待匹配向量作为N个目标知识向量；

7.一种存储介质，其特征在于，所述存储介质中存储有计算机可读指令，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行如权利要求1至5中任一项所述问答方法的步骤。

8.一种计算机设备，其特征在于，包括：一个或多个处理器，以及存储器；

所述存储器中存储有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，执行如权利要求1至5中任一项所述问答方法的步骤。