CN110263051A

CN110263051A - 用于问答***的问答对更新方法、装置、设备及存储介质

Info

Publication number: CN110263051A
Application number: CN201910501631.4A
Authority: CN
Inventors: 岳聪
Original assignee: Chumen Wenwen Information Technology Co Ltd
Current assignee: Volkswagen China Investment Co Ltd; Mobvoi Innovation Technology Co Ltd
Priority date: 2019-06-11
Filing date: 2019-06-11
Publication date: 2019-09-20

Abstract

本公开提供了一种用于问答***的问答对更新方法，包括：获得目标问题的更正后的目标答案；将目标问题和更正后的目标答案写入可编辑数据库，建立目标问题和更正后的目标答案的索引；以及基于索引，可编辑数据库向问答***提供目标问题的更正后的目标答案。本公开还提供了一种用于问答***的问答对更新装置、电子设备及可读存储介质。

Description

用于问答***的问答对更新方法、装置、设备及存储介质

技术领域

本公开涉及一种用于问答***的问答对更新方法、更新装置、电子设备及可读存储介质。

背景技术

问答***(question answer system，简称QA)，是用来回答用户输入或提出的各种各样的问题。比如用户提问“中国的国土面积是多少”，QA系统回答“960万平方公里”；用户提问“中国有多少人口”，QA***回答“13 亿”。

问答对(question answer pair or key value pair,简称KV对)，是指已经存储好的问题和答案对。比如：中国的国土面积是多少---960万平方公里，中国有多少人口---13亿，这就是两个KV对。

现有技术中，问答***中回答出来的答案，有很大一部分是通过检索问答对来得到的。当用户输入的query和存储的K之间的语义相似度大于一个设定的阈值时，就把K对应的V当做该query的答案，返回给用户。

现有的检索和KV更新方案中，新建索引需要至少10分钟的时间，且每次手动***KV后需要再次手工点击更新url才能使线上生效。不能保证线上实时热更新。

当对问答***的实时纠错能力要求高的时候，比如在特定的产品线，如儿童问答、客服等，期望对于一个用户问的问题，如果回答错了，问答***能立刻补充上正确的答案。这样其他的用户就能够得到满意的回答。所以需要一个问答对实时更新的机制。

发明内容

为了解决上述技术问题中的至少一个，本公开提供了一种用于问答 ***的问答对更新方法、更新装置、电子设备及可读存储介质。

根据本公开的一个方面，一种用于问答***的问答对更新方法，包括：获得目标问题的更正后的目标答案；将目标问题和更正后的目标答案写入可编辑数据库，建立目标问题和更正后的目标答案的索引；以及基于索引，可编辑数据库向问答***提供目标问题的更正后的目标答案。

根据本公开的至少一个实施方式，可编辑数据库至少包括第一子数据库和第二子数据库；目标问题和更正后的目标答案被实时地写入到第一子数据库；对于目标问题，第一子数据库和第二子数据库采用不同的匹配策略。

根据本公开的至少一个实施方式，目标问题和更正后的目标答案被非实时地写入到第二子数据库。

根据本公开的至少一个实施方式，可编辑数据库至少包括第一子数据库、第二子数据库和第三子数据库；目标问题和更正后的目标答案被实时地写入到第一子数据库和第二子数据库；对于目标问题，第一子数据库、第二子数据库和第三子数据库采用的匹配策略均不相同。

根据本公开的至少一个实施方式，目标问题和更正后的目标答案被非实时地写入到第三子数据库。

根据本公开的至少一个实施方式，在获得目标问题的更正后的目标答案之前，还包括：发现目标问题的错误的目标答案。

根据本公开的至少一个实施方式，发现目标问题的错误的目标答案，包括：基于目标问题和目标答案之间的语义相似度来判断目标答案是否为错误的目标答案。

根据本公开的至少一个实施方式，当问答***重启时，问答*** 从可编辑数据库和问答***自身的问答对数据库读取问答对。

根据本公开的至少一个实施方式，获得目标问题的更正后的目标答案，包括：基于语义相似度对目标问题的目标答案进行更正。

根据本公开的另一方面，一种用于问答***的问答对更新装置，其特征在于，包括：获取装置，获取装置用于获得目标问题的更正后的目标答案；处理装置，处理装置将目标问题和更正后的目标答案写入可编辑数据库，建立目标问题和更正后的目标答案的索引；以及，可编辑数据库，可编辑数据库基于索引向问答***提供目标问题的更正后的目标答案。

根据本公开的又一方面，一种电子设备，包括：存储器，存储器存储计算机执行指令；以及处理器，处理器执行存储器存储的计算机执行指令，使得处理器执行上述的方法。

根据本公开的再一方面，一种可读存储介质，可读存储介质中存储有计算机执行指令，计算机执行指令被处理器执行时用于实现上述的方法。

附图说明

附图示出了本公开的示例性实施方式，并与其说明一起用于解释本公开的原理，其中包括了这些附图以提供对本公开的进一步理解，并且附图包括在本说明书中并构成本说明书的一部分。

图1是根据本公开一个实施方式的用于问答***的问答对更新方法的示意性流程图。

图2是根据本公开又一个实施方式的用于问答***的问答对更新方法的示意性流程图。

图3是根据本公开又一个实施方式的用于问答***的问答对更新方法的示意性流程图。

图4是根据本公开又一个实施方式的用于问答***的问答对更新方法的示意性流程图。

图5是根据本公开一个实施方式的用于问答***的问答对更新装置的示意性框图。

图6是根据本公开又一个实施方式的用于问答***的问答对更新装置的示意性框图。

图7是根据本公开又一个实施方式的用于问答***的问答对更新装置的示意性框图。

图8是根据本公开又一个实施方式的用于问答***的问答对更新装置的示意性框图。

图9是根据本公开一个实施方式的电子设备的示意性视图。

具体实施方式

下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施方式仅用于解释相关内容，而非对本公开的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本公开相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开。

图1是本公开一个实施方式的用于问答***的问答对更新方法，包括：S11、获得目标问题的更正后的目标答案；S12、将目标问题和更正后的目标答案写入可编辑数据库，建立目标问题和更正后的目标答案的索引；以及S13、基于索引，可编辑数据库向问答***提供目标问题的更正后的目标答案。

例如用户使用问答***提出一个问题“中国的国土面积是多少”，问答***给出的目标答案是“13亿”，则对于本实施方式的问答对更新方法，需要获得目标问题的更正后的目标答案即“960万平方公里”。将目标问题“中国的国土面积是多少”和更正后的目标答案“960万平方公里”写入可编辑数据库，建立“中国的国土面积是多少”和“960 万平方公里”的索引，当其他用户再次使用问题***提出“中国的国土面积是多少”这一目标问题时，可编辑数据库向问答***提供更正后的目标答案即“960万平方公里”，也即问答***从可编辑数据库读取更正后的目标答案。其中，可编辑数据库优选mySQL数据库。优选地，目标问题和目标答案的索引具有全局唯一性。优选地，获得目标问题的更正后的目标答案，可以通过获取经过人员编辑的目标答案来实现，也可以通过向经过机器学习算法训练的语义相似度模型获取正确的目标答案来实现。

现有技术中的语义相似度模型一般通过计算词语之间的距离，再转换为相似度。而语义之间的距离，例如可以通过大量的语料库进行统计，这种方法主要将上下文信息的概率分布作为词汇语义相似度的参照依据，其利用大规模语料库，将词语的上下文信息作为语义相似度计算的参照依据。基于统计的定量分析方法能够对词汇间的语义相似性进行比较精确和有效的度量，当然本领域技术人员还可以通过本体或分类关系计算词语语义距离，这些均属于现有技术，不再赘述。

问答***(Question Answering System,QA)是信息检索***的一种高级形式，它能用准确、简洁的自然语言回答用户用自然语言提出的问题。问答***以自然语言理解技术为核心，使得计算机能够理解用户的谈话内容，实现人与计算机之间的有效交流沟通。例如在计算机客服***中普遍采用的聊天机器人***就是一种问答***，它是一种通过自然语言技术，能够自动与用户对话的人工智能***。现有技术中已经发展出多种类型的问答***，在此不再赘述。本实施方式对问答对更新方法应用的问答***不做特别限定。

mySQL是一种关系型数据库管理***，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。本公开并不对可编辑数据库的类型做特别限定，本领域技术人员在本公开的启示下，可以选用其他类型的可编辑数据库。

图2是本公开一个实施方式的用于问答***的问答对更新方法，包括：S21、发现目标问题的错误的目标答案；S22、获得目标问题的更正后的目标答案；S23、将目标问题和更正后的目标答案写入可编辑数据库，建立目标问题和更正后的目标答案的索引；以及S24、基于索引，可编辑数据库向问答***提供目标问题的更正后的目标答案。

发现目标问题的错误的目标答案，本实施方式中优选地，基于目标问题和目标答案之间的语义相似度来判断目标答案是否为错误的目标答案。优选地，采用经过机器学习算法训练的语义相似度模型来判断目标答案是否为错误的目标答案。机器学习算法是可以从数据中学习并从中改进的算法，无需人工干预。学习任务可能包括将输入映射到输出，在未标记的数据中学习隐藏的结构，或者“基于实例的学习”，其中通过将新实例与来自存储在存储器中的训练数据的实例进行比较来为新实例生成类标签。

机器学习算法主要分为三大类：监督学习算法、无监督学习算法和强化学习算法。其中，监督学习算法使用标记的训练数据来学习从输入变量(X)到输出变量(Y)的映射函数，典型的监督学习算法例如线性回归算法、Logistic回归算法、CART算法、朴素贝叶斯算法等；无监督学习算法只有输入变量(X)，但没有相应的输出变量，它使用无标签的训练数据来模拟数据的基本结构，典型的无监督学习算法例如Apriori算法、K-means算法、PCA算法等；强化学习算法按照给定条件，可分为基于模式的强化学习算法和无模式强化学习算法，以及主动强化学习算法和被动强化学习算法。

本实施方式中对使用的机器学习算法类型并不做特别限定，只要本领域技术人员能够将其用来训练语义相似度模型，使得语义相似度模型能够判断目标答案是否为错误的目标答案即可。

图3是本公开一个实施方式的用于问答***的问答对更新方法，包括：S31、获得目标问题的更正后的目标答案；S32、将目标问题和更正后的目标答案实时写入可编辑数据库的第一子数据库，建立目标问题和更正后的目标答案的索引；以及S33、基于索引，可编辑数据库向问答***提供目标问题的更正后的目标答案。

其中，可编辑数据库包括第一子数据库和第二子数据库；目标问题和更正后的目标答案被实时地写入到第一子数据库；对于目标问题，第一子数据库和第二子数据库采用不同的匹配策略。目标问题和更正后的目标答案被非实时地写入到第二子数据库。本实施方式中，优选地，可编辑数据库实时向问答***提供目标问题的更正后的目标答案。例如，mySQL数据库配置有完全匹配库和模糊匹配库，本领域技术人员应当理解，对于目标问题，完全匹配库和模糊匹配库采用的匹配策略不同。本实施方式中，完全匹配只做精确匹配，即目标问题与完全匹配库中存储的问题有一个字不一样也不能匹配上，但相应的，完全匹配库在增加新的问答对(即KV对)时的速度特别快，一般1ms以内就能新增KV对完毕。一般地，完全匹配库可以匹配到大约20％的目标问题。模糊匹配虽然能匹配大约80％的目标问题，但是模糊匹配库新增KV对的速度要慢于完全匹配库。

图4是本公开一个实施方式的用于问答***的问答对更新方法，包括：S41、获得目标问题的更正后的目标答案；S42、将目标问题和更正后的目标答案实时写入可编辑数据库的第一子数据库和第二子数据库，建立目标问题和更正后的目标答案的索引；以及S43、基于索引，可编辑数据库向问答***提供目标问题的更正后的目标答案。

其中，可编辑数据库包括第一子数据库、第二子数据库和第三子数据库；目标问题和更正后的目标答案被实时地写入到第一子数据库和第二子数据库；对于目标问题，第一子数据库、第二子数据库和第三子数据库采用不同的匹配策略。目标问题和更正后的目标答案被非实时地写入到第三子数据库。本实施方式中，优选地，可编辑数据库实时向问答***提供目标问题的更正后的目标答案。例如，mySQL数据库配置有完全匹配库、简单模糊匹配库和复杂模糊匹配库，本领域技术人员应当理解，对于目标问题，完全匹配库、简单模糊匹配库、复杂模糊匹配库采用的匹配策略不同。本实施方式中，完全匹配只做精确匹配，即目标问题与完全匹配库中存储的问题有一个字不一样也不能匹配上，与前面一个实施方式的匹配策略相同，不再赘述。

对于简单模糊匹配库，新增KV对时，需计算目标问题的计算机表示，如目标问题的拼音，在匹配时计算目标问题的拼音和已经存储的问题的拼音的编辑距离；再例如，新增KV对时，计算目标问题的 embedding向量，在匹配时，计算目标问题的embedding和已经存储的问题的embedding的余弦距离等。一般地，简单模糊匹配库新增KV 对可以在500ms以内完成，并可以匹配到大约80％的目标问题。

对于复杂模糊匹配库，新增KV对时，需要进行例如建立倒排索引等需要全局KV数据库计算的操作，往往需要10分钟左右。复杂模糊匹配库可以匹配到大约80％的目标问题。

其中，全局KV数据库包括上述可编辑数据库和问答***自身的问答对数据库。当问答***重启时，问答***从可编辑数据库和问答 ***自身的问答对数据库读取问答对。

根据本公开的另一方面，本公开还提供了一种用于问答***的问答对更新装置，图5示出了本公开一个实施方式的用于问答***的问答对更新装置100，问答对更新装置100包括：获取装置101，获取装置101用于获得目标问题的更正后的目标答案；处理装置102，处理装置102将目标问题和更正后的目标答案写入可编辑数据库103，建立目标问题和更正后的目标答案的索引；以及可编辑数据库103，可编辑数据库103基于索引向问答***提供目标问题的更正后的目标答案。

优选地，获得目标问题的更正后的目标答案，获取装置101可以通过获取经过人员编辑的目标答案来实现，获取装置101也可以通过向经过机器学习算法训练的语义相似度模型获取正确的目标答案来实现。

对于本实施方式中的获取装置101和处理装置102可以同时被包括在问答***中；也可以是获取装置101和处理装置102中的一个被包括在问答***中；还可以是获取装置101和处理装置102均不被包括在问答***中，但是获取装置101和处理装置102能够与问答*** 通信连接。作为优选地实施方式，可编辑数据库103不被包括在问答 ***中，问答***能够从可编辑数据库103中读取数据。

图6示出了本公开一个实施方式的用于问答***的问答对更新装置200，问答对更新装置200包括：判断装置204，判断装置204用于发现目标问题的错误的目标答案；获取装置201，获取装置201用于获得目标问题的更正后的目标答案；处理装置202，处理装置202将目标问题和更正后的目标答案写入可编辑数据库203，建立目标问题和更正后的目标答案的索引；以及可编辑数据库203，可编辑数据库 203基于索引向问答***提供目标问题的更正后的目标答案。优选地，判断装置204基于目标问题和目标答案之间的语义相似度来判断目标答案是否为错误的目标答案。判断装置204例如采用经过机器学习算法训练的语义相似度模型来判断目标答案是否为错误的目标答案。

优选地，获得目标问题的更正后的目标答案，获取装置201可以通过获取经过人员编辑的目标答案来实现，获取装置201也可以通过向经过机器学习算法训练的语义相似度模型获取正确的目标答案来实现。

对于本实施方式中的判断装置204、获取装置201和处理装置202 可以同时被包括在问答***中；也可以是判断装置204、获取装置201 和处理装置202中的一个或两个被包括在问答***中；还可以是判断装置204、获取装置201和处理装置202均不被包括在问答***中，但是判断装置204、获取装置201和处理装置202能够与问答***通信连接。作为优选地实施方式，可编辑数据库203不被包括在问答系统中，问答***能够从可编辑数据库203中读取数据。

图7示出了本公开一个实施方式的用于问答***的问答对更新装置300，问答对更新装置300包括：获取装置301，获取装置301用于获得目标问题的更正后的目标答案；处理装置302，处理装置302将目标问题和更正后的目标答案写入可编辑数据库303，建立目标问题和更正后的目标答案的索引；以及可编辑数据库303，可编辑数据库 303基于索引向问答***提供目标问题的更正后的目标答案。

其中，可编辑数据库303包括第一子数据库3031和第二子数据库 3032；目标问题和更正后的目标答案被实时地写入到第一子数据库 3031；对于目标问题，第一子数据库3031和第二子数据库3032采用不同的匹配策略。目标问题和更正后的目标答案被非实时地写入到第二子数据库3032。本实施方式中，优选地，可编辑数据库303实时向问答***提供目标问题的更正后的目标答案。例如，mySQL数据库配置有完全匹配库(第一子数据库3031的示例)和模糊匹配库(第二子数据库3032的示例)，本领域技术人员应当理解，对于目标问题，完全匹配库和模糊匹配库采用的匹配策略不同。本实施方式中，完全匹配只做精确匹配，即目标问题与完全匹配库中存储的问题有一个字不一样也不能匹配上，但相应的，完全匹配库在增加新的问答对(即KV 对)时的速度特别快，一般1ms以内就能新增KV对完毕。一般地，完全匹配库可以匹配到大约20％的目标问题。模糊匹配虽然能匹配大约80％的目标问题，但是模糊匹配库新增KV对的速度要慢于完全匹配库。

优选地，可编辑数据库303与问答***配置在不同的服务器上，相应的，可编辑数据库303与问答***自身的问答对数据库配置在不同的服务器上，例如可编辑数据库303可以配置在云服务器上。

对于本实施方式中的获取装置301和处理装置302可以同时被包括在问答***中；也可以是获取装置301和处理装置302中的一个被包括在问答***中；还可以是获取装置301和处理装置302均不被包括在问答***中，但是获取装置301和处理装置302能够与问答*** 通信连接。作为优选地实施方式，可编辑数据库303不被包括在问答 ***中，问答***能够从可编辑数据库303中读取数据。

图8示出了本公开一个实施方式的用于问答***的问答对更新装置400，问答对更新装置400包括：获取装置401，获取装置401用于获得目标问题的更正后的目标答案；处理装置402，处理装置402将目标问题和更正后的目标答案写入可编辑数据库403，建立目标问题和更正后的目标答案的索引；以及可编辑数据库403，可编辑数据库 403基于索引向问答***提供目标问题的更正后的目标答案。

其中，可编辑数据库403包括第一子数据库4031、第二子数据库 4032和第三子数据库4033；目标问题和更正后的目标答案被实时地写入到第一子数据库4031和第二子数据库4032；对于目标问题，第一子数据库4031、第二子数据库4032和第三子数据库4033采用不同的匹配策略。目标问题和更正后的目标答案被非实时地写入到第三子数据库4033。

本实施方式中，优选地，可编辑数据库403实时向问答***提供目标问题的更正后的目标答案。例如，mySQL数据库配置有完全匹配库(第一子数据库4031的示例)、简单模糊匹配库(第二子数据库4032 的示例)和复杂模糊匹配库(第三子数据库4033的示例)，本领域技术人员应当理解，对于目标问题，完全匹配库、简单模糊匹配库、复杂模糊匹配库采用的匹配策略不同。本实施方式中，完全匹配只做精确匹配，即目标问题与完全匹配库中存储的问题有一个字不一样也不能匹配上，与前面一个实施方式的匹配策略相同，不再赘述。

其中，全局KV数据库包括上述可编辑数据库403和问答***自身的问答对数据库。当问答***重启时，问答***从可编辑数据库403 和问答***自身的问答对数据库读取问答对。

对于本实施方式中的获取装置401和处理装置402可以同时被包括在问答***中；也可以是获取装置401和处理装置402中的一个被包括在问答***中；还可以是获取装置401和处理装置402均不被包括在问答***中，但是获取装置401和处理装置402能够与问答*** 通信连接。作为优选地实施方式，可编辑数据库403不被包括在问答 ***中，问答***能够从可编辑数据库403中读取数据。

本公开还提供一种电子设备，如图9所示，该设备包括：通信接口 1000、存储器2000和处理器3000。通信接口1000用于与外界设备进行通信，进行数据交互传输。存储器2000内存储有可在处理器3000上运行的计算机程序。处理器3000执行所述计算机程序时实现上述实施方式中方法。所述存储器2000和处理器3000的数量可以为一个或多个。

存储器2000可以包括高速RAM存储器，也可以还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

如果通信接口1000、存储器2000及处理器3000独立实现，则通信接口1000、存储器2000及处理器3000可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA，Industry Standard Architecture)总线、外部设备互连(PCI，Peripheral Component)总线或扩展工业标准体系结构(EISA，Extended IndustryStandard Component)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，该图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果通信接口1000、存储器2000、及处理器3000集成在一块芯片上，则通信接口1000、存储器2000、及处理器 3000可以通过内部接口完成相互间的通信。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本公开的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本公开的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的各个方法和处理。例如，本公开中的方法实施方式可以被实现为软件程序，其被有形地包含于机器可读介质，例如存储器。在一些实施方式中，软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或安装。当软件程序加载到存储器并由处理器执行时，可以执行上文描述的方法中的一个或多个步骤。备选地，在其他实施方式中，处理器可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行上述方法之一。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，可以具体实现在任何可读存储介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。

就本说明书而言，“可读存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。可读存储介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式只读存储器(CDROM)。另外，可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在存储器中。

应当理解，本公开的各部分可以用硬件、软件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施方式方法的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种可读存储介质中，该程序在执行时，包括方法实施方式的步骤之一或其组合。

此外，在本公开各个实施方式中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个可读存储介质中。所述存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施方式/方式”、“一些实施方式/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施方式/方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式/方式或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施方式/方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施方式/方式或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施方式/方式或示例以及不同实施方式/方式或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

本领域的技术人员应当理解，上述实施方式仅仅是为了清楚地说明本公开，而并非是对本公开的范围进行限定。对于所属领域的技术人员而言，在上述公开的基础上还可以做出其它变化或变型，并且这些变化或变型仍处于本公开的范围内。

Claims

1.一种用于问答***的问答对更新方法，其特征在于，包括：

获得目标问题的更正后的目标答案；

将所述目标问题和所述更正后的目标答案写入可编辑数据库，建立所述目标问题和所述更正后的目标答案的索引；以及

基于所述索引，所述可编辑数据库向所述问答***提供所述目标问题的所述更正后的目标答案。

2.根据权利要求1所述的问答对更新方法，其特征在于，所述可编辑数据库至少包括第一子数据库和第二子数据库；所述目标问题和所述更正后的目标答案被实时地写入到所述第一子数据库；对于目标问题，所述第一子数据库和第二子数据库采用不同的匹配策略。

3.根据权利要求2所述的问答对更新方法，其特征在于，所述目标问题和所述更正后的目标答案被非实时地写入到所述第二子数据库。

4.根据权利要求1至3中任一项所述的问答对更新方法，其特征在于，在获得目标问题的更正后的目标答案之前，还包括：发现所述目标问题的错误的目标答案。

5.根据权利要求4所述的问答对更新方法，其特征在于，发现所述目标问题的错误的目标答案，包括：基于所述目标问题和目标答案之间的语义相似度来判断所述目标答案是否为错误的目标答案。

6.根据权利要求1至3中任一项所述的问答对更新方法，其特征在于，当所述问答***重启时，所述问答***从所述可编辑数据库和问答***自身的问答对数据库读取问答对。

7.根据权利要求1至6中任一项所述的问答对更新方法，其特征在于，获得目标问题的更正后的目标答案，包括：基于语义相似度对所述目标问题的目标答案进行更正。

8.一种用于问答***的问答对更新装置，其特征在于，包括：

获取装置，所述获取装置用于获得目标问题的更正后的目标答案；

处理装置，所述处理装置将所述目标问题和所述更正后的目标答案写入可编辑数据库，建立所述目标问题和所述更正后的目标答案的索引；以及

可编辑数据库，所述可编辑数据库基于所述索引向所述问答***提供所述目标问题的所述更正后的目标答案。

9.一种电子设备，其特征在于，包括：

存储器，所述存储器存储执行指令；以及

处理器，所述处理器执行所述存储器存储的执行指令，使得所述处理器执行如权利要求1至7中任一项所述的方法。

10.一种可读存储介质，其特征在于，所述可读存储介质中存储有执行指令，所述执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的方法。