CN113887930B

CN113887930B - 问答机器人健康度评估方法、装置、设备及存储介质

Info

Publication number: CN113887930B
Application number: CN202111150154.5A
Authority: CN
Inventors: 高静
Original assignee: Ping An Bank Co Ltd
Current assignee: Ping An Bank Co Ltd
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2024-04-23
Anticipated expiration: 2041-09-29
Also published as: CN113887930A

Abstract

本发明涉及人工智能技术，揭露了一种问答机器人健康度评估方法，包括：获取预设问答机器人的问答文本、人机交互文本和用户评分，对所述问答文本进行错别字检验和语义清晰度检验，得到问答文本的错误率和语义清晰率；计算人机交互文本中的重复文本以及人机交互文本中每个问题和对应的答案之间的匹配值，得到重复率和问答匹配值；将用户评分按照与预算的规则进行计算，得到差评率；通过对错误率、语义清晰率、重复率、问答匹配值和差评率进行权重计算，得到健康度评分。此外，本发明还涉及区块链技术，如问答文本可存储于区块链的节点。本发明还提出一种问答机器人健康度评估装置、设备以及介质。本发明可以提高机器人健康度评估的准确性。

Description

问答机器人健康度评估方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种问答机器人健康度评估方法、装置、电子设备及计算机可读存储介质。

背景技术

随着人工智能的发展，越来越多的企业及公司使用智能机器人来替代人工执行一些枯燥的工作。例如，当用户咨询业务问题时，利用问答机器人来代替客服人员对用户的问题进行分析并进行回答，维系与用户之间的交流。但是随着用户需求的改变以及时代的快速发展，人们对问答机器人的服务质量有着越来越高的要求，因此，定时对问答机器人状况和能力进行评估，以便根据评估结果对问答机器人进行优化更新显得尤为重要。如今对问答机器人大多采用用户使用评价作为评估标准或者利用知识库对问答机器人知识储存进行评估，评判标准不全面。

发明内容

本发明提供一种问答机器人健康度评估方法、装置及计算机可读存储介质，其主要目的在于解决机器人健康度评估的不准确的问题。

为实现上述目的，本发明提供的一种问答机器人健康度评估方法，包括：

获取预设问答机器人的问答文本，对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率；

提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，并根据所述语义清晰度检验的结果计算所述问答文本的语义清晰率；

获取所述问答机器人的人机交互文本，提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率；

从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，根据所述匹配值计算所述交互文本的问答匹配值；

获得用户评分，根据预设的打分规则计算所述用户评分的差评率；

利用预设的权重算法对所述错误率、所述语义清晰率、所述重复率、所述问答匹配值和所述差评率进行计算，得到所述问答机器人健康度评分。

可选地，所述对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率，包括：

对所述问答文本进行分词处理，得到文本分词；

利用预构建的错别字校对模型对所述文本分词进行检测，得到错别字集合；

统计所述错别字集合中错别字的数量，根据所述错别字的数量和所述文本分词的数量计算，得到所述问答文本的错误率。

可选地，所述提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，包括：

对所述文本分词进行向量转化得到文本分词的词向量；

根据预设的分词权重所述词向量进行加权计算，得到文本向量；

利用预设的语义处理模型对所述文本向量进行语义清晰度检验，得到语义清晰度值。

可选地，所述利用预设的语义处理模型对所述文本向量进行语义清晰度检验，得到语义清晰度值，包括：

利用预设的语义处理模型对所述文本向量进行卷积、池化处理，得到所述文本向量的低维特征表达；

利用预设的映射函数将所述低维特征表达映射至预先构建的高维空间，得到所述文本向量的高维特征表达；

利用预设的第一激活函数计算所述高维特征表达中每一个特征的特征输出值，根据所述特征输出值进行计算得到语义清晰度值。

可选地，所述提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率，包括：

利用聚类算法对所述人机交互文本进行分类，得到用户文本和所述机器文本；

提取所述机器文本的重复文本，得到重复文本的数量；

将重复文本的数量在所述机器文本的数量的占比作为所述人机交互文本的重复率。

可选地，所述从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，包括：

按照顺序关系在所述人机交互文本中逐一提取交互文本作为目标文本，其中，所述交互文本包括问题以及所述问题对应的回答；

提取所述目标文本中问题的语义以及所述问题对应的回答的语义；

计算所述问题的语义与所述问题对应的回答的语义的距离值，根据所述距离值计算得到匹配值。

可选地，所述提取所述目标文本中问题的语义以及所述问题对应的回答的语义，包括：

分别对所述目标文本中问题和所述问题对应的回答进行分词处理，得到第一文本分词和第二文本分词；

对所述第一文本分词和第二文本分词进行向量转化，得到第一分词向量和第二分词向量；

分别构建所述第一分词向量和所述第二分词向量的向量子集集合，利用预构建语义分析模型分别对所述第一分词向量和所述第二分词向量的向量子集集合进行特征提取，得到第一特征子集和第二特征子集；

利用预设的第二激活函数计算所述第一特征子集和所述第二特征子集中每个向量的向量输出值，分别选取所述向量输出值大于预设阈值的特征向量为所述目标文本中问题和所述问题对应的回答的语义。

为了解决上述问题，本发明还提供一种问答机器人健康度评估装置，所述装置包括：

错误率评估模块，用于获取预设问答机器人的问答文本，对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率；

语义清晰率评估模块，用于提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，并根据所述语义清晰度检验的结果计算所述问答文本的语义清晰率；

重复率评估模块，用于获取所述问答机器人的人机交互文本，提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率；

问答匹配值评估模块，用于从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，根据所述匹配值计算所述交互文本的问答匹配值；

差评率评估模块，用于获得用户评分，根据预设的打分规则计算所述用户评分的差评率；

健康度打分模块，用于利用预设的权重算法对所述错误率、所述语义清晰率、所述重复率、所述问答匹配值和所述差评率进行计算，得到所述问答机器人健康度评分。

为了解决上述问题，本发明还提供一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述所述的问答机器人健康度评估方法。

为了解决上述问题，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个计算机程序，所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的问答机器人健康度评估方法。

本发明实施例通过对问答机器人的问答文本、人机交互文本和用户评价进行多方面评估，得到错误率、语音清晰度、重复率、问答匹配度和差评率这几个评估指标，实现对问答机器人原始语料和人机交互状态的全面评估，时评估指标更加多样，评估结果更加准确。因此本发明提出的问答机器人健康度评估方法、装置、电子设备及计算机可读存储介质，可以解决机器人健康度评估的不准确的问题。

附图说明

图1为本发明一实施例提供的问答机器人健康度评估方法的流程示意图；

图2为本发明一实施例提供的计算错误率的流程示意图；

图3为本发明一实施例提供的计算语义清晰率的流程示意图；

图4为本发明一实施例提供的计算重复率的流程示意图；

图5为本发明一实施例提供的计算匹配值的流程示意图；

图6为本发明一实施例提供的问答机器人健康度评估装置的功能模块图；

图7为本发明一实施例提供的实现所述问答机器人健康度评估方法的电子设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本申请实施例提供一种问答机器人健康度评估方法。所述问答机器人健康度评估方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之，所述问答机器人健康度评估方法可以由安装在终端设备或服务端设备的软件或硬件来执行，所述软件可以是区块链平台。所述服务端包括但不限于：单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

参照图1所示，为本发明一实施例提供的问答机器人健康度评估方法的流程示意图。在本实施例中，所述问答机器人健康度评估方法包括：

S1、获取预设问答机器人的问答文本，对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率；

本发明实施例中，所述问答文本包括问答机器人已储存的问答话术，例如，在AI机器人与用户交互时，AI机器人需要识别的语音文本内容、AI机器人对于用户提问，所储备的回答话术等等。

本发明实施例中，可利用具有数据抓取功能的计算机语句，例如java语句、python语句等。从预先构建的存储区域抓取预先存储的问答文本，所述存储区域包括但不限于数据库、区块链节点、网络缓存。

进一步地，请参阅图2，所述对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率，包括：

S11、对所述问答文本进行分词处理，得到文本分词；

S12、利用预构建的错别字校对模型对所述文本分词进行检测，得到错别字集合；

S13、统计所述错别字集合中错别字的数量，根据所述错别字的数量和所述文本分词的数量计算，得到所述问答文本的错误率。

本发明实施例中，所述错别字校对模型可通过序列标注模型算法，如HMM(隐马尔可模型)训练得到。例如，将根据所述文本分词生成混淆词文本和文本分词作为训练数据集进行训练，所述混淆词文本可以为网络上抓取的易错字、同音词或模拟工人输入时，出现的拼写错误等等。

例如，问答文本为“要去那里逛逛，来点我查询”，进行分词处理得到“要去”“那里”“逛逛”“，来”“点我”“查询”利用错别字校对模型可得到错别字“那里”，所述“那里”为“哪里”的混淆词。错别字文本的数量为1，文本分词的数量为6，得到错误率为16.67％。

本发明实施例中，通过文本的错误率指标可以显示回答机器人话语数据库的能力，预知了问答机器人在与用户交互过程中可能出现的问题，为机器人最终评判提供了一个基础指标。

S2、提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，并根据所述语义清晰度检验的结果计算所述问答文本的语义清晰率；

本发明实施例中，文本语义可以为进行语义分析后得到的特证词向量，清晰度检验是指评判所述分析后文本语义是否能够清晰的表达清楚所述问答文本的意图。

本发明实施例中，请参阅图3，所述提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，包括：

S21、对所述问答文本进行分词，得到文本分词；

S22、对所述文本分词进行向量转化得到文本分词的词向量；

S23、根据预设的分词权重所述词向量进行加权计算，得到文本向量；

S24、利用预设的语义处理模型对所述文本向量进行语义清晰度检验，得到语义清晰度值。

本发明实施例中，所述词向量可通过Word2Vec模型对文本分词训练得到，所述权重模型可为TF-IDF模型，对所述文本分词进行重要性预估，从而得到不同的权重。

进一步地，所述利用预设的语义处理模型对所述文本向量进行语义清晰度检验，得到语义清晰度值，包括：

详细地，所述语义处理模型包括但不限于NLP(Natural Language Processing，自然语言处理)模型，LDA(Latent Dirichlet Allocation，隐含狄利克雷分布)模型等。

由于所述问答文本中一句话的内容较少，利用所述语义处理模型对所述文本分词进行分析，可提高问答文本中语句的语义清晰度检测的精确度。

具体地，可利用所述语义处理模型对所述上下文进行卷积、池化等处理，以减少所述文本向量的数据维度，进而提取出所述文本向量的数据特征；但提取出的文本向量的低维特征表达中，可能存在着错误特征，该特征并不是该文本向量的特征，但被错误提取出来，因此，可利用预设的映射函数将所述文本向量的低维特征映射至高维空间，得到所述文本向量的高维特征表达，进而提高对提取出的文本特征进行筛选的精确度，所述映射函数包括但不限于高斯函数、remap函数。

例如，存在以二维坐标(x,y)表示的低维特征表达，可将该低维特征表达通过预设函数映射至预先构建的三维空间中，得到以(x,y,z)表示的高维特征表达。

本发明实施例中，可利用预设的激活函数计算所述高维特征表达中每一个特征的特征输出值，所述第一激活函数包括但不限于sigmoid激活函数、relu激活函数、softmax激活函数。

例如，所述高维特征表达中包含特征A、特征B和特征C，利用激活函数对三个特征进行计算后，可得特征A的特征输出值为80，特征B的特征输出值为70，特征C的特征输出值为60，对所述三个特征取平均值，得到70，即为语义清晰度检验结果。

在本发明实施例中，对所述问答文本中每一句话得到的语义清晰度检验结果按照预设的计算规则计算，例如将所述检验结果百分制再取平均值，即可得到所述问答文本的语义清晰率。

本发明一可选实施例中，可利用聚类算法(例如K-Means聚类)对所述问答文本进行分类，得到问题文本和回答文本，所述问题文本包括标准问题文本和所述标准问题文本对应的扩展问题文本。统计所述扩展问题文本的未超过预设阈值(例如20)的数量，所述未超过预设阈值的数量与标准问题文本的数量的比值、所述扩展问题文本与所述标准问题文本直接的相似度以及所述标准问题文本的数量也可作为问答机器人健康度的一个评判指标，使问答机器人健康度的评判更加多方面、多维度。

S3、获取所述问答机器人的人机交互文本，提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率；

本发明实施例中，所述人机交互文本是指在AI机器人工作过程中，与用户交互记录得到的文本数据。所述机器文本是人机交互双方，AI机器人在交互时输出的内容。

本发明实施例中，获取所述问答机器人的人机交互文本的方法可与上述获取问答机器人的问答文本的方法相同。

本发明实施例中，请参阅图4，所述提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率，包括：

S31、利用聚类算法对所述人机交互文本进行分类，得到用户文本和所述机器文本；

S32、提取所述机器文本的重复文本，得到重复文本的数量；

S33、将重复文本的数量在所述机器文本的数量的占比作为所述人机交互文本的重复率。

本发明实施例中，所述聚类算法包括但不限于为K-Means聚类、基于高斯混合模型(GMM)的最大期望(EM)聚类、均值漂移聚类。

例如，机器文本的数量为100，机器文本中存在重复文本A、B、C，A的数量为10、B的数量为5、C的数量为8，得到重复文本的数量为9+4+7＝20，则重复率为20/100＝0.2。

本发明实施例中，通过获取机器文本中的重复文本，可以判断问答机器人在回复用户时，可能因为搜寻不到对应的回答或者无法获取/解析用户的语音文本等问题，带来的重复性询问/回答情况。

S4、从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，根据所述匹配值计算所述交互文本的问答匹配值；

本发明实施例中，交互文本是指在用户与问答机器人进行交互过程中所提的问题，以及与之对应的回答为问答机器人根据用户提出的问题做出的回答。

本发明实施例中，请参阅图5，所述从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，包括：

S41、按照顺序关系在所述人机交互文本中逐一提取交互文本作为目标文本，其中，所述交互文本包括问题以及所述问题对应的回答；

S42、提取所述目标文本中问题的语义以及所述问题对应的回答的语义；

S43、计算所述问题的语义与所述问题对应的回答的语义的距离值，根据所述距离值计算得到匹配值。

进一步地，所述提取所述目标文本中问题的语义以及所述问题对应的回答的语义，包括：

具体地，可利用预设的词向量转化模型对所述第一文本分词和第二文本分词进行向量转换，得到分词向量，所述词向量转换模型包括但不限于word2vec模型、CRF(Conditional Random Field，条件随机场)模型。

本发明实施例中，所述向量子集集合中包括所述分词向量所有的子集，构建所述分词向量的向量子集集合，有利于提高分析向量组合的多样性，进而提高生成的关键语义的精确度。例如，所述分词向量包括向量A、向量B和向量C，则所述分词向量的向量子集集合包括：[向量A]、[向量B]、[向量C]、[向量A，向量B]、[向量A，向量C]、[向量B，向量C]六个子集。

进一步地，本发明实施例可利用预先构建的语义分析模型对所述向量子集集合的每个向量子集中分析向量之间的关联性进行分析，以根据所述关联性从所述向量子集集合中筛选出具有代表性的特征子集。

例如，存在第一分词向量的向量子集集合包括向量子集A、向量子集B和向量子集C，利用所述语义分析模型分别对向量子集A、向量子集B和向量子集C中分词向量的关联程度进行分析，得到向量子集A中分词向量的关联程度为80，向量子集B中分词向量的关联程度为70，向量子集C中分词向量的关联程度为60，则确定向量子集A为所述目标文本中问题的第一特征子集。

详细地，在提取出所述第一特征子集和第二特征子集后，可利用预设的激活函数计算所述特征子集中的每个特征向量的向量输出值，并选取所述向量输出值大于预设输出阈值的特征向量为所述目标文本中问题和所述问题对应的回答的关键语义，其中，所述第二激活函数可以与所述第一激化函数相同，也可以包括但不限于sigmoid激活函数、softmax激活函数。Relu激活函数。

本发明实施例中，所述目标文本中问题的语义与所述问题对应的回答的语义分别为进行语义分析得到的特征向量，计算所述目标文本中问题的特征向量与所述问题对应的回答的特征向量的距离值，计算公式如下：

其中，D为所述距离值，R为目标文本中问题的特征向量，T为问题对应的回答的特征向量，θ为预设系数。

本发明实施例中，若距离值越大则匹配值越低，若距离值越小则匹配值越高。例如，存在两个目标文本的问题的特征向量A和B以及两个目标文本的问题对应的回答的特征向量C和D，利用上述距离值算法对目标文本的问题的特征向量与目标文本的问题对应的回答的特征向量计算后，可得特征向量A与特征向量C之间的距离值为70，特征向量B与特征向量D之间的距离值为40，则第一个目标文本的问题与对应的回答之间的匹配值可为1-(70/100)＝0.3，第二目标文本的问题与对应的回答之间的匹配值可为1-(40/100)＝0.6。

S5、获得用户评分，根据预设的打分规则计算所述用户评分的差评率；

本发明实施例中，所述用户评分是指每一次服务结束后，问答机器人屏幕上显示评价页面，邀请用户评分，评分结果可作为用户评分。

本发明实施例中，可利用具有数据抓取功能的计算机语句，例如java语句、python语句等。从预先构建的存储区域抓取预先存储的用户评分，所述存储区域包括但不限于数据库、区块链节点、网络缓存。

例如，获得三个用户评分A、用户评分B、用户评分C，其中用户评分A为4星、用户评分B为2星、用户评分C为1星，小于预设阈值(例如4星)为差评，则用户评分B、用户评分C这两个用户评分为差评。可通过差评数量在用户评分数量中的占比，计算差评率，则差评率为2/3＝66.67％。

本发明实施例中，差评率是用来评价问答机器人交互性能的一个重要指标，是用户对问答机器人性能的主动评判，对于衡量机器人健康度/能力的重要参考。

S6、利用预设的权重算法对所述错误率、所述语义清晰率、所述重复率、所述问答匹配值和所述差评率进行计算，得到所述问答机器人健康度评分。

本发明实施例中，所述错误率、所述重复率、所述差评率为负指标，所述语义清晰率和所述问答匹配值为正指标，将正指标取反，得到语义不清晰率和问答不匹配度，将正指标变为负指标。可通过人为标定评估指标重要性，并根据重要性设置作为预设的权重算法的参数，以计算问答机器人的健康度评分。

本发明实施例中，可以利用如下权重算法对所述错误率、所述语义不清晰率、所述重复率、所述问答不匹配值和所述差评率这五个评估指标进行计算，得到健康度评分：

其中，G为所述健康度评分，n为评估指标的数量，Q_i为所述评估指标中第i个评估指标的数值，P_i为第i个预设的权重系数。

本发明实施例通过对问答机器人的问答文本、人机交互文本和用户评价进行多方面评估，得到错误率、语音清晰度、重复率、问答匹配度和差评率这几个评估指标，实现对问答机器人原始语料和人机交互状态的全面评估，时评估指标更加多样，评估结果更加准确。因此本发明提出的问答机器人健康度评估方法，可以解决机器人健康度评估的不准确的问题。

如图6所示，是本发明一实施例提供的问答机器人健康度评估装置的功能模块图。

本发明所述问答机器人健康度评估装置100可以安装于电子设备中。根据实现的功能，所述问答机器人健康度评估装置100可以包括错误率评估模块101、语义清晰率评估模块102、重复率评估模块103、问答匹配值评估模块104、差评率评估模块105及健康度打分模块106。本发明所述模块也可以称之为单元，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。

在本实施例中，关于各模块/单元的功能如下：

所述错误率评估模块101，用于获取预设问答机器人的问答文本，对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率；

所述语义清晰率评估模块102，用于提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，并根据所述语义清晰度检验的结果计算所述问答文本的语义清晰率；

所述重复率评估模块103，用于获取所述问答机器人的人机交互文本，提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率；

所述问答匹配值评估模块104，用于从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，根据所述匹配值计算所述交互文本的问答匹配值；

所述差评率评估模块105，用于获得用户评分，根据预设的打分规则计算所述用户评分的差评率；

所述健康度打分模块106，用于利用预设的权重算法对所述错误率、所述语义清晰率、所述重复率、所述问答匹配值和所述差评率进行计算，得到所述问答机器人健康度评分。

详细地，本发明实施例中所述问答机器人健康度评估装置100中所述的各模块在使用时采用与上述图1至图5中所述的问答机器人健康度评估方法一样的技术手段，并能够产生相同的技术效果，这里不再赘述。

如图7所示，是本发明一实施例提供的实现问答机器人健康度评估方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13，还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序，如问答机器人健康度评估程序。

其中，所述处理器10在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(Central Processing unit，CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(ControlUnit)，利用各种接口和线路连接整个电子设备的各个部件，通过运行或执行存储在所述存储器11内的程序或者模块(例如执行问答机器人健康度评估程序等)，以及调用存储在所述存储器11内的数据，以执行电子设备的各种功能和处理数据。

所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如：SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元，例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备，例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card，SMC)、安全数字(Secure Digital，SD)卡、闪存卡(Flash Card)等。进一步地，所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据，例如问答机器人健康度评估程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

所述通信总线12可以是外设部件互连标准(peripheral componentinterconnect，简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture，简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

所述通信接口13用于上述电子设备与其他设备之间的通信，包括网络接口和用户接口。可选地，所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等)，通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard))，可选地，用户接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。

图7仅示出了具有部件的电子设备，本领域技术人员可以理解的是，图7示出的结构并不构成对所述电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

例如，尽管未示出，所述电子设备还可以包括给各个部件供电的电源(比如电池)，优选地，电源可以通过电源管理装置与所述至少一个处理器10逻辑相连，从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等，在此不再赘述。

应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的问答机器人健康度评估程序是多个指令的组合，在所述处理器10中运行时，可以实现：

具体地，所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述，在此不赘述。

进一步地，所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的，也可以是非易失性的。例如，所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)。

本发明还提供一种计算机可读存储介质，所述可读存储介质存储有计算机程序，所述计算机程序在被电子设备的处理器所执行时，可以实现：

在本发明所提供的几个实施例中，应该理解到，所揭露的设备，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。

因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称，而并不表示任何特定的顺序。

最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种问答机器人健康度评估方法，其特征在于，所述方法包括：

利用预设的权重算法对所述错误率、所述语义清晰率、所述重复率、所述问答匹配值和所述差评率进行计算，得到所述问答机器人健康度评分；

其中，所述对所述问答文本进行错别字检验，根据所述错别字的数量计算所述问答文本的错误率，包括：对所述问答文本进行分词处理，得到文本分词；利用预构建的错别字校对模型对所述文本分词进行检测，得到错别字集合；统计所述错别字集合中错别字的数量，根据所述错别字的数量和所述文本分词的数量计算，得到所述问答文本的错误率；

所述提取所述问答文本的文本语义，对所述文本语义进行语义清晰度检验，包括：对所述文本分词进行向量转化得到文本分词的词向量；根据预设的分词权重所述词向量进行加权计算，得到文本向量；利用预设的语义处理模型对所述文本向量进行语义清晰度检验，得到语义清晰度值；

所述利用预设的语义处理模型对所述文本向量进行语义清晰度检验，得到语义清晰度值，包括：利用预设的语义处理模型对所述文本向量进行卷积、池化处理，得到所述文本向量的低维特征表达；利用预设的映射函数将所述低维特征表达映射至预先构建的高维空间，得到所述文本向量的高维特征表达；利用预设的第一激活函数计算所述高维特征表达中每一个特征的特征输出值，根据所述特征输出值进行计算得到语义清晰度值。

2.如权利要求1所述的问答机器人健康度评估方法，其特征在于，所述提取所述人机交互文本中的机器文本并统计所述机器文本中的重复文本，根据所述重复文本的数量计算所述人机交互文本的重复率，包括：

利用聚类算法对所述人机交互文本进行分类，得到用户文本和机器文本；

提取所述机器文本的重复文本，得到重复文本的数量；

3.如权利要求1至2中任一项所述的问答机器人健康度评估方法，其特征在于，所述从所述人机交互文本中逐个选取其中一个人机交互文本为目标文本，计算所述目标文本中问题的语义与所述问题对应的答案的语义之间的匹配值，包括：

4.如权利要求3所述的问答机器人健康度评估方法，其特征在于，所述提取所述目标文本中问题的语义以及所述问题对应的回答的语义，包括：

5.一种问答机器人健康度评估装置，用于实现如权利要求1至4中任意一项所述的问答机器人健康度评估方法，其特征在于，所述装置包括：

6.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行时，使所述至少一个处理器执行如权利要求1至4中任意一项所述的问答机器人健康度评估方法。

7.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的问答机器人健康度评估方法。