CN111314566A

CN111314566A - 一种语音质检方法、装置与***

Info

Publication number: CN111314566A
Application number: CN202010067212.7A
Authority: CN
Inventors: 姜秋宇; 李晓宇; 李明
Original assignee: Beijing Ultrapower Intelligent Data Technology Co ltd
Current assignee: Beijing Ultrapower Intelligent Data Technology Co ltd
Priority date: 2020-01-20
Filing date: 2020-01-20
Publication date: 2020-06-19

Abstract

本发明公开一种语音质检方法、装置与***。本发明的方法包括：获取通话双方的对话语音，并将所述对话语音转换为文本数据；对所述文本数据进行关键词匹配处理，获得关键词匹配结果；以及对所述文本数据进行文本相似度计算，获得相似度计算结果；根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告。本发明结合关键词检索与文本相似度计算进行语音质检，相比于单一的关键词检索质检方式可以降低误差，减小语音质检存在的误差，进而降低企业的人工成本和时间成本。

Description

一种语音质检方法、装置与***

技术领域

本发明涉及数据分析技术领域，尤其涉及一种语音质检方法、装置与***。

背景技术

目前，在电销外呼业务中，人工抽检是一种最常见的质检手段。人工抽检以部分样本的合格率作为交付标准，这种传统的检测方法简单、直观，大多数情况下可以作为衡量业务好坏的标准，但当遇到总体包含的个体数目很大的情况时，不仅无法保证查全率，而且还会产生极大的人工成本和时间成本；当总体的差异程度较大时，传统的抽样方法得到的合格率代表性也会相应下降。

如图1所示，电销外呼业务首先由外呼团队按照标准话术进行电话营销，电销结束后将保存的通话数据提供给质检团队，质检团队对这些数据进行抽检，抽检合格率达到一定标准后将合格数据交付给客户，不合格的数据反馈回外呼团队，由外呼团队进行记录并根据不合格的原因整改外呼团队或优化标准话术。

随着大数据概念的提出，这种人工抽检的方式暴露出了所需人工成本和时间成本较高、查全率较低等问题，并且仅对通话记录进行质检显然造成了数据的浪费。

发明内容

本发明的目的在于提供了一种语音质检方法、装置与***。

第一方面，本发明实施例提供了一种语音质检方法，包括：

获取通话双方的对话语音，并将所述对话语音转换为文本数据；对所述文本数据进行关键词匹配处理，获得关键词匹配结果；以及对所述文本数据进行文本相似度计算，获得相似度计算结果；根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告。

第二方面，本发明实施例提供了一种语音质检装置，包括：

处理单元，用于获取通话双方的对话语音，并将所述对话语音转换为文本数据；检索单元，用于对所述文本数据进行关键词匹配处理，获得关键词匹配结果；计算单元，用于对所述文本数据进行文本相似度计算，获得相似度计算结果；质检单元，用于根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告。

第三方面，本发明实施例提供了一种语音质检***，包括：存储器和处理器；存储器，存储计算机可执行指令；处理器，计算机可执行指令在被执行时使处理器执行语音质检方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，计算机可读存储介质上存储有一个或多个计算机程序，一个或多个计算机程序被执行时实现语音质检方法。

本发明至少取得以下技术效果：本发明在计算对话语音的文本数据与关键词的匹配程度之后，还通过计算对话语音的文本数据和标准话术的相似度，利用相似度来判断客服的话术是否大致上与标准话术吻合，而不是单单的依据文本中出现的关键词来判断客服是否说出了话术中要求的语句，避免仅依靠关键词检索进行质检所存在的因为客服人员及客户的语言习惯的质检误差。本发明结合关键词检索与文本相似度计算进行语音质检，相比于单一的关键词检索质检方式可以降低误差，减小语音质检存在的误差，进而降低企业的人工成本和时间成本。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍。应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定。对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为现有技术中的一种人工抽检方法流程图；

图2为本发明实施例示出的语音质检***的硬件配置的框图；

图3为本发明实施例示出的语音质检方法流程图；

图4为本发明实施例示出的一种语音质检的流程示意图；

图5为本发明实施例示出的质检报告示意图；

图6为本发明实施例示出的语音质检装置的结构框图；

图7为本发明实施例示出的语音质检***的结构框图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它例子可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

<实施例一>

图2是根据本发明实施例的语音质检***100的硬件配置的框图。

如图2所示，语音质检***100包括数据采集装置1000和语音质检装置2000。

数据采集装置1000用于采集通话双方的对话语音，并将采集到的对话语音提供至语音质检装置2000。

语音质检装置2000可以是任意的电子设备，例如PC机、笔记本电脑、服务器等。

在本实施例中，参照图2所示，语音质检装置2000可以包括处理器2100、存储器2200、接口装置2300、通信装置2400、显示装置2500、输入装置2600、扬声器2700、麦克风2800等等。

处理器2100可以是移动版处理器。存储器2200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置2300例如包括USB接口、耳机接口等。通信装置2400例如能够进行有线或无线通信，通信装置2400可以包括短距离通信装置，例如是基于Hilink协议、WiFi(IEEE 802.11协议)、Mesh、蓝牙、ZigBee、Thread、Z-Wave、NFC、UWB、LiFi等短距离无线通信协议进行短距离无线通信的任意装置，通信装置2400也可以包括远程通信装置，例如是进行WLAN、GPRS、2G/3G/4G/5G远程通信的任意装置。显示装置2500例如是液晶显示屏、触摸显示屏等。输入装置2600例如可以包括触摸屏、键盘等。用户可以通过扬声器2700和麦克风2800输入/输出语音信息。

在该实施例中，语音质检装置2000的存储器2200用于存储指令，该指令用于控制处理器2100进行操作以至少执行根据本发明任意实施例的语音质检方法。技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作，这是本领域公知，故在此不再详细描述。

尽管在图2中示出了语音质检装置2000的多个装置，但是，本发明可以仅涉及其中的部分装置，例如，语音质检装置2000只涉及存储器2200、处理器2100。

在本实施例中，图数据采集装置1000用于采集通话双方的对话语音，并将采集到的对话语音提供至语音质检装置2000，语音质检装置2000则基于该对话语音实施根据本发明任意实施例的语音质检方法。

应当理解的是，尽管图2仅示出一个数据采集装置1000和一个语音质检装置2000，但不意味着限制各自的数量，语音质检***100中可以包含多个数据采集装置1000和/或语音质检装置2000。

<实施例二>

图3为本发明实施例示出的语音质检方法流程图，如图3所示，本实施例的方法包括：

S3100，获取通话双方的对话语音，并将所述对话语音转换为文本数据。

在本实施例中，通话双方包括第一方和第二方，第一方向第二方发送访问语音，第二方基于访问语音向第一方返回反馈语音。例如第一方为业务人员，例如为电销外呼业务中的外呼人员，第二方为电销外呼业务中的业务对象。

相应的，对话语音包括：第一方向第二方发送的访问语音、第二方根据第一方发送的访问语音向所述第一方返回的反馈语音。

其中，可以采用语音转换技术将对话语音转换为文本数据。

S3200，对文本数据进行关键词匹配处理，获得关键词匹配结果；以及对文本数据进行文本相似度计算，获得相似度计算结果。

S3300，根据关键词匹配结果与相似度计算结果，获得对话语音的质检报告。

对关键词匹配结果以及相似度计算结果进行权值赋值处理，获得质检模型，计算质检模型的输出结果；若输出结果大于预设阈值，输出质检合格；若输出结果不大于预设阈值，输出质检不合格。其中，预设阈值可以根据经验设置，质检模型为关于关键词匹配结果与相似度计算结果的线性模型，质检模型包括关键词匹配结果对应的第一权值与相似度计算结果对应的第二权值，第一权值与第二权值可以根据业务需求进行设置。

将计算得到的相似度计算结果与关键词匹配结果进行配合，例如将二者赋予权值，权值可以根据业务的实际情况进行调整，基于赋值后的最终结果对对话语音进行质检。由此，可以将相似度高并且关键词匹配得分高的对话语音标记为合格数据，将相似度低并且关键词匹配得分低的对话语音标记为合格数据，将相似度高但关键词匹配得分低标记为需进一步判断的数据，在对话语音被标记为需进一步判断时，结合业务需求进行判断。以克服电话销售为例，当客服电销内容基本吻合标准话术要求，但缺少某些关键话术时，例如忘记询问客户的预约时间、能接受的价格范围等关键话术时，此时本实施例会判断这段对话语音需进一步判断。

本实施例在计算对话语音的文本数据与关键词的匹配程度之后，还通过计算对话语音的文本数据和标准话术的相似度，利用相似度来判断客服的话术是否大致上与标准话术吻合，而不是单单的依据文本中出现的关键词来判断客服是否说出了话术中要求的语句，避免仅依靠关键词检索进行质检所存在的因为客服人员及客户的语言习惯的质检误差。本实施例结合关键词检索与文本相似度计算进行语音质检，相比于单一的关键词检索质检方式可以降低误差，减小语音质检存在的误差，进而降低企业的人工成本和时间成本。

<实施例三>

本实施例还提供一种语音质检方法。结合图4，上述步骤S3200中对文本数据进行文本相似度计算，获得相似度计算结果，还包括：

首先，对文本数据进行分词处理，得到文本数据的分词；对文本数据进行分词处理，得到文本数据的分词。例如“这里是外呼团队”分词处理后可以得到“这里/是/外呼团队”这三组分词。根据所获得的分词可以完成话术检测，即营销过程中是否说出话术必要关键词。然后，计算每个分词在文本数据中出现的频率，以及计算预设语料库中出现每个分词的文本数量；最后，根据每个分词的频率与文本数量计算文本向量与标准话术文本的文本向量之间的相似度，将计算得到的相似度值作为相似度计算结果。

在一个示例中，可以采用TF-IDF(Term Frequency-Inverse DocumentFrequency)进行文本相似度计算。其中，TF指一篇文本中单词出现的频率，一般TF＝词在文本中出现的次数/文本中所有词的个数；而IDF指语料库中出现某个词的文档数，对文档数取对数，例如IDF＝log(语料库的文本总数/语料库中出现某单词的不同文本个数)。

TF-IDF的原理为：某个词在一篇文本中出现的频率越多则对这篇文本越重要；该词在越多的文本中出现，则说明它对文章没有很强的区分度，在文档中所占的权重也就越小，一般采用取词频的逆。还要考虑一个现象，一些通用词出现的次数可能是低频词的几十倍上百倍，如果只是简单的取逆处理，通用词的权重会变动非常小，稀缺词的权重就显得的过大。为了平衡通用词与稀缺词的权重关系，又对逆运算采用取对数运算。

通过TF-IDF词频计算相似度的方法对文本数据和标准话术进行对比，可以得到二者的向量相似度，相似度的值越大，则说明此次通话的内容越与标准话术相吻合，反之则越小。

示例性的，本实施例基于TF-IDF算法构建用于计算相似度的词袋模型TF_IDF(t,d)＝TF(t,d)×IDF(t)。

然后基于词袋模型计算文本向量与标准话术文本的文本向量之间的相似度。具体的，以语音A：“我喜欢看电视，不喜欢看电影”，语音B：“我不喜欢看电视，也不喜欢看电影”为例进行说明。

将语音A“我喜欢看电视，不喜欢看电影”进行分词，得到的分词结果为：我/喜欢/看/电视，不/喜欢/看/电影；将语音B“我不喜欢看电视，也不喜欢看电影”进行分词，得到的分词结果为：我/不/喜欢/看/电视，也/不/喜欢/看/电影。

上述两个语音分词对应的维度为：我，喜欢，看，电视，电影，不，也。

由此，统计语音A中每个分词对应的词频为：

语音A：我1，喜欢2，看2，电视1，电影1，不1，也0。

语音B：我1，喜欢2，看2，电视1，电影1，不2，也1。

统计得到语音A与语音B对应的向量数据为：

语音A：[1,2,2,1,1,1,0]

语音B：[1,2,2,1,1,2,1]

在得到语音A与语音B对应的向量数据后，即可计算语音A中每个分词的TF(t,d)值，然后基于公式

计算语音A中每个分词的IDF(t)值，将计算得到的TF(t,d)值与IDF(t)值代入上述词袋模型，即可计算出语音A与标准话术文本的文本向量之间的相似度。

由于本实施例中，通话双方包括第一方与第二方，而对语音质检中，若需要判断营销过程中是否说出话术必要关键词，需要对第一方对应的对话语音进行判断。由此，可以获取对话语音中第一方的访问语音，将访问语音转换为第一文本数据。相应的，分别对第一文本数据进行关键词匹配处理与文本相似度计算，获得关键词匹配结果与相似度计算结果。

以电销外呼业务中的外呼人员A与客户B之间的通话为例，可以从录音文件中获取外呼人员A与客户B之间的对话语音，并将该对话语音转换为文本数据，此时文本数据中包括对应于外呼人员A的第一文本数据，还包括对应于客户B的第二文本数据，对第一文本数据进行关键词匹配处理与文本相似度计算，获得关键词匹配结果与相似度计算结果，将关键词匹配结果与相似度计算结果输入到质检模型中，利用质检模型的输出结果判断此次语音通话是否合格。

在一些实施例中，在将访问语音转换为第一文本数据之后，还可以对第一文本数据进行分词处理，获得第一文本数据的分词；对分词进行敏感词检索，在检索到分词中存在敏感词时，输出质检不合格。

参考图4，在对第一方对应的第一文本数据进行分词处理后，对处理所得到的分词进行关键词检索，若检索到敏感词，例如辱骂词语等敏感词，输出质检不合格，并在质检报告中标记不合格原因为“出现敏感词”，以便基于质检报告中的不合格标记完成告警推送。

在一些实施例中，还可以获取对话语音中第二方的反馈语音，将反馈语音转换为第二文本数据，对第二文本数据进行用户画像收集，获得用户画像数据，用户画像数据包括客户的年龄、性别、所在地区、具体需求，以便根据用户画像数据挖掘客户潜在需求。

继续参考图4，可以通过关键词检索或通过上下文语义关联，获得标签关键词，对标签关键词进行聚类，如购买偏好、兴趣偏好、潜在需求、经济实力等，分析客户标签，将客户信息标签化，完成对用户画像数据的收集。

在一些实施例中，在将反馈语音转换为第二文本数据之后，基于第二文本数据，分析第二方在通话过程中的情感状态，获得第二方的情感分析指标，基于情感分析指标预测销售成功或失败。

继续参考图4，通过对第二方在通话过程中的情感状态进行分析，可以获得乐观、愤怒、犹豫等情感分析指标，例如在分析得到第二方的情感分析指标为乐观，可以预测销售成功。

在一些实施例中，上述步骤S3300中根据关键词匹配结果与相似度计算结果，获得对话语音的质检报告，还包括：

继续参考图4，根据业务需求选择相应的赋值方法对关键词匹配结果与相似度计算结果进行加权赋值计算，根据计算结果对对话语音进行合格与否的质检。例如可以选择熵权法、标准离差法或CRITIC法(Criteria Importance Though IntercrieriaCorrelation，相关法)对关键词匹配结果与相似度计算结果进行加权赋值计算。

熵权法：一般认为，如果指标的信息熵越小，则该指标包含的信息量越大，在综合评价中所占的比重就应该越高。依据这个原理，本实施例给出指标的权重计算公式如下：

先根据公式

计算上述两个指标(即关键词匹配结果与相似度计算结果)的信息熵。

其中，参数E_j表示第j个指标的信息熵，n为评价对象的个数，参数p_ij为比重值，参数d_ij为标准化数据，如果p_ij＝0，则

在计算两个指标的信息熵之后，利用信息熵构造每个指标的权重系数，具体的计算公式为：

其中，参数w_j表示第j个指标的权重系数，参数m为指标个数，本实施例中m＝2。

标准离差法：

标准离差法的思想与熵权法是十分类似的，但它基于的不再是信息熵而是标准差。一般认为，一个指标的标准差越大，则说明该指标的变异越大，即其中包含的信息越多，其权重自然也应该越大。基于这种思想，利用第j个指标的标准差σ_j，可采用公式

计算权重系数。

CRITIC法：

CRITIC法的基本思想是在构造权重时，以对比强度和冲突性为基础。其中对比强度以标准差的形式来体现。一般来说，指标的标准差越大，各评价对象的差距越大。而冲突性则以各指标之间的相关系数来体现，如果指标之间的相关性较强，则冲突性较弱。基于以上思想，本实施例构造了包含两种信息的指标c_j，其中c_j的计算公式为：

通过以上指标可以看出，c_j越大，所包含的信息就越多，占有的权重系数自然就比较大。因此，第j个指标的权重系数可由公式

计算得到。

图5示出了采用本实施例的语音质检方法得到的质检报告，结合图5所示，本实施例的语音质检方法可以实现以下几点：

1、营销话术质检和评估：质检过程对要求用语、违规用语等关键词进行标记，同时根据质检规则，对通话进行打分，支持人工抽检，对文本和录音进行复检，对不一致结论进行标记。本实施例输出质检明细表、合格(不合格)情况、抽检差异表等，还可以自定义评分细则以及相应的加减分值，从而量化服务质量，更直观的看到评分结果。并且根据评分细则，可查阅话务检测结果、内容检测结果、命中录音明细、分话务组及坐席风险详情。

2、挖掘客户潜在需求：通过收集用户画像数据将客户信息标签化，同时将新增标签同步到客户管理***，为后期精准服务提供依据。

3、预测销售行为：通过收集情感分析指标预测销售是否成功；

4、优化营销策略：对质检的对话语音进行数据分析，进行话务统计、热点分部、异常分析可视化展示，为管理层决策提供依据。分析场景包括超长静音分析、超长通话分析、语速分析、话术对比分析等，通过分析对现场及流程、技能提供质检结论及改善建议。

5、告警推送：实时监控高危紧急对话场景如“客户投诉”“客户曝光”等舆情风险。

<实施例四>

图6为本发明实施例示出的语音质检装置的结构框图，如图6所示，本实施例的装置包括：

处理单元6100，用于获取通话双方的对话语音，并将所述对话语音转换为文本数据；

检索单元6200，用于对所述文本数据进行关键词匹配处理，获得关键词匹配结果；

计算单元6300，用于对所述文本数据进行文本相似度计算，获得相似度计算结果；

质检单元6400，用于根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告。

在一些实施例中，质检单元6400，用于对所述关键词匹配结果以及所述相似度计算结果进行权值赋值处理，获得质检模型；计算所述质检模型的输出结果；若所述输出结果大于预设阈值，输出质检合格；若所述输出结果不大于预设阈值，输出质检不合格。

在一些实施例中，计算单元6300用于对所述文本数据进行分词处理，得到所述文本数据的分词；计算所述分词在所述文本数据中出现的频率，以及计算预设语料库中出现所述分词的文本数量；根据所述频率与所述文本数量计算所述文本向量与标准话术文本的文本向量之间的相似度，将计算得到的相似度值作为所述相似度计算结果。

在一些实施例中，对话语音包括第一方向第二方发送的访问语音，以及包括第二方根据第一方发送的访问语音向所述第一方返回的反馈语音。

处理单元6100，用于获取所述对话语音中所述第一方的访问语音，将所述访问语音转换为第一文本数据；检索单元6200，用于对所述第一文本数据进行关键词匹配处理，获得关键词匹配结果；计算单元6300，用于对所述第一文本数据进行文本相似度计算，获得相似度计算结果。

检索单元6200，还用于对所述第一文本数据进行分词处理，获得所述第一文本数据的分词，对所述分词进行敏感词检索；质检单元6400，用于在检索到所述分词中存在敏感词时，输出质检不合格。

处理单元6100，还用于获取所述对话语音中所述第二方的反馈语音，将所述反馈语音转换为第二文本数据；检索单元6200，用于对所述第二文本数据进行用户画像收集，获得用户画像数据。

语音质检装置还包括情感分析单元，情感分析单元用于基于所述第二文本数据，分析所述第二方在通话过程中的情感状态，获得所述第二方的情感分析指标。

本发明装置实施例中各模块的具体实现方式可以参见本发明方法实施例中的相关内容，在此不再赘述。

<实施例五>

图7为本发明实施例示出的语音质检***的结构框图，如图7所示，在硬件层面，该虚拟现实***包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-Access Memory，RAM)，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器等。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(PeripheralComponent Interconnect，外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机可执行指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成语音质检装置。处理器，执行存储器所存放的程序实现如上文描述的语音质检方法。

上述如本说明书图7所示实施例揭示的语音质检装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上文描述的语音质检方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述语音质检方法的步骤。

本发明还提供了一种计算机可读存储介质。

该计算机可读存储介质存储一个或多个计算机程序，该一个或多个计算机程序包括指令，该指令当被处理器执行时，能够实现上文描述的语音质检方法。

为了便于清楚描述本发明实施例的技术方案，在发明的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分，本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。

以上所述，仅为本发明的具体实施方式，在本发明的上述教导下，本领域技术人员可以在上述实施例的基础上进行其他的改进或变形。本领域技术人员应该明白，上述的具体描述只是更好的解释本发明的目的，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种语音质检方法，其特征在于，包括：

获取通话双方的对话语音，并将所述对话语音转换为文本数据；

对所述文本数据进行关键词匹配处理，获得关键词匹配结果；以及对所述文本数据进行文本相似度计算，获得相似度计算结果；

根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告。

2.根据权利要求1所述的方法，其特征在于，根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告，包括：

对所述关键词匹配结果以及所述相似度计算结果进行权值赋值处理，获得质检模型；

计算所述质检模型的输出结果；

若所述输出结果大于预设阈值，输出质检合格；若所述输出结果不大于预设阈值，输出质检不合格。

3.根据权利要求1所述的方法，其特征在于，对所述文本数据进行文本相似度计算，获得相似度计算结果，包括：

对所述文本数据进行分词处理，得到所述文本数据的分词；

计算所述分词在所述文本数据中出现的频率，以及计算预设语料库中出现所述分词的文本数量；

根据所述频率与所述文本数量计算所述文本向量与标准话术文本的文本向量之间的相似度，将计算得到的相似度值作为所述相似度计算结果。

4.根据权利要求1所述的方法，其特征在于，所述对话语音包括第一方向第二方发送的访问语音，则获取通话双方的对话语音，并将所述对话语音转换为文本数据，包括：

获取所述对话语音中所述第一方的访问语音，将所述访问语音转换为第一文本数据。

5.根据权利要求4所述的方法，其特征在于，对所述文本数据进行关键词匹配处理，获得关键词匹配结果；以及对所述文本数据进行文本相似度计算，获得相似度计算结果，包括：

分别对所述第一文本数据进行关键词匹配处理与文本相似度计算，获得关键词匹配结果与相似度计算结果。

6.根据权利要求4所述的方法，其特征在于，在将所述访问语音转换为第一文本数据之后，还包括：

对所述第一文本数据进行分词处理，获得所述第一文本数据的分词；

对所述分词进行敏感词检索，在检索到所述分词中存在敏感词时，输出质检不合格。

7.根据权利要求4所述的方法，其特征在于，所述对话语音还包括第二方根据第一方发送的访问语音向所述第一方返回的反馈语音，则获取通话双方的对话语音，并将所述对话语音转换为文本数据，包括：

获取所述对话语音中所述第二方的反馈语音，将所述反馈语音转换为第二文本数据；

对所述第二文本数据进行用户画像收集，获得用户画像数据。

8.根据权利要求7所述的方法，其特征在于，在将所述反馈语音转换为第二文本数据之后，还包括：

基于所述第二文本数据，分析所述第二方在通话过程中的情感状态，获得所述第二方的情感分析指标。

9.一种语音质检装置，包括：

处理单元，用于获取通话双方的对话语音，并将所述对话语音转换为文本数据；

检索单元，用于对所述文本数据进行关键词匹配处理，获得关键词匹配结果；

计算单元，用于对所述文本数据进行文本相似度计算，获得相似度计算结果；

质检单元，用于根据所述关键词匹配结果与所述相似度计算结果，获得所述对话语音的质检报告。

10.一种语音质检***，包括：存储器和处理器；

所述存储器，存储计算机可执行指令；

所述处理器，计算机可执行指令在被执行时使所述处理器执行如权利要求1-9任一项所述的语音质检方法。