CN110148413B

CN110148413B - 语音评测方法及相关装置

Info

Publication number: CN110148413B
Application number: CN201910422699.3A
Authority: CN
Inventors: 刘丹; 刘俊华; 刘晨璇; 魏思; 王智国; 胡国平
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2019-05-21
Filing date: 2019-05-21
Publication date: 2021-10-08
Anticipated expiration: 2039-05-21
Also published as: CN110148413A

Abstract

本申请实施例公开了一种语音评测方法及相关装置，方法包括：获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音；处理第一语音得到第一文本，以及处理第二语音得到第二文本；获取第一测评模式对应的第一文本检测策略；按照第一文本检测策略处理第一文本和第二文本，得到针对第二语音的检测结果。本申请有利于提高设备进行语音评测的灵活性和全面性。

Description

语音评测方法及相关装置

技术领域

本申请涉及电子设备技术领域，具体涉及一种语音评测方法及相关装置。

背景技术

同声传译是一种受时间严格限制难度极高的语言翻译转换活动，它要求译员在听辨源语讲话的同时，借助已有的主题知识迅速完成源语信息的预测、理解、记忆、转换和目标语言的组织和表达，因此同声传译又称之为同步口译。同声传译学生的培养是一个非常复杂的过程，主要包括培养学生对源语言和目标语言的掌握，对知识范围的广泛了解，对同声传译技巧的训练。其中同声传译技巧的训练是目前同声传译学生培养的重中之重。

目前同声传译技巧的基础训练主要是通过基于复述练习培养短时记忆能力，通过数数练习培养在干扰情况下边听边说的能力。当学生具备一定的基础之后，再进行同声传译的训练。对于每个阶段的教学练习，做出及时有效的效果评估和反馈对学生能力快速提升非常关键。

发明内容

本申请实施例提供了一种语音评测方法及相关装置，以期提高设备进行语音评测的灵活性和全面性。

第一方面，本申请实施例提供一种语音评测方法，包括：

获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音；

处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本；

获取所述第一测评模式对应的第一文本检测策略；

按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果。

第二方面，本申请实施例提供一种语音评测装置，包括处理单元和通信单元，其中，

所述处理单元，用于通过所述通信单元获取第一测评模式下作为评测标准的第一语音，以及通过所述通信单元获取待评测的第二语音，所述第一测评模式包括复述测试模式或者传译测试模式；以及用于处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本；以及用于获取所述第一测评模式对应的第一文本检测策略；以及用于按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果。

第三方面，本申请实施例提供一种电子设备，包括处理器、存储器、通信接口以及一个或多个程序，其中，上述一个或多个程序被存储在上述存储器中，并且被配置由上述处理器执行，上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。

第四方面，本申请实施例提供了一种计算机可读存储介质，其中，上述计算机可读存储介质存储用于电子数据交换的计算机程序，其中，上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。

第五方面，本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

可以看出，本申请实施例中，电子设备能够在不同测试模式下进行语音检测时，可以动态选择适配当前测评模式的专属文本检测策略，并按照该专属文本检测策略处理语音对应的文本，从而得到检测结果，实现对待评测语音的检测，如此可以避免因使用单一检测策略而无法适配不同测评模式的情况出现，有利于提高电子设备进行语音测评的灵活性和全面性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种电子设备采集指纹的示意图；

图2a是本申请实施例提供的一种语音评测方法的流程示意图；

图2b是本申请实施例提供的一种复述测试模式的检测结果示例界面；

图2c是本申请实施例提供的一种传译测试模式的检测结果示例界面；

图3本申请实施例提供的一种电子设备的结构示意图；

图4本申请实施例提供的一种语音评测装置的功能单元组成框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，图1为一个语音评测***100的示意图，该语音评测***100包括语音获取装置110、语音处理装置120，所述语音获取装置110连接所述语音处理装置120，语音获取装置110用于获取语音数据并发给语音处理装置120进行处理，语音处理装置120用于对语音数据进行处理并输出处理结果，该语音评测***100可以包括集成式单体设备或者多设备，为方便描述，本申请将语音评测***100统称为电子设备。显然该电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备，以及各种形式的用户设备(User Equipment，UE)，移动台(MobileStation，MS)，终端设备(terminal device)等等。

目前同声传译学员的效果评估和反馈主要做法有两种，一是通过教师或同学的现场合作练习和反馈，帮助学生发现口译语音中存在的问题；二是教师或者学员通过录音回放进行总结分析。对于第一种教师或同学的合作练习，需要他人的配合，练习环境受限。对于第二种方式，听录音回放效率较低。

基于此，本申请实施例提出一种语音评测方法以解决上述问题，下面对本申请实施例进行详细介绍。

请参阅图2a，图2a是本申请实施例提供了一种语音评测方法的流程示意图，应用于如图1所示的电子设备，如图所示，本语音评测方法包括：

S201，电子设备获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音。

其中，所述第一语音为源语音，所述第二语音为目标语音，源语音可以由用户(如：学员或教师)自行选择或指定，例如英文BBC广播，目标语音为用户(如：学员)口语翻译的录音文件。

具体实现中，所述第一语音可以是电子设备本端预存的语音文件，或者，实时与服务器(如：云端)交互而获取的服务器推送的语音文件，所述第二语音可以是电子设备通过本端的语音采集装置获取，或者通过与本端通信的专用录音***获取，此处不做唯一限定。

其中，所述电子设备支持的测评模式包括复述测试模式和传译测试模式，所述复述测试模式是指用户收听源语音的音频内容，并复述(如延迟2-3秒)该音频的内容信息。通过该方法，主要练***的重要的考量指标。

S202，所述电子设备处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本。

其中，电子设备处理第一第二语音得到第一第二文本的过程不仅包括语音转文字步骤的处理，还包括针对转换后初始文本的预处理，该预处理可以包括以下至少一种：数字和时间规整、滤除无意义的语气词，以及进行断句和标点预测。

具体实现中，电子设备的语音转文字步骤的处理可以包括以下两种情况：

第一种，针对第一测评模式为复述测试模式时，此时所述第一语音所属语种和所述第二语音所属语种相同，所述第一文本所属语种和所述第二文本所属语种相同。所述电子设备处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本，包括：所述电子设备调用所述第一语音所属语种对应的第一语音识别***；通过所述第一语音识别***处理所述第一语音得到第一文本；通过所述第一语音识别***处理所述第二语音得到第二文本。可见该处理过程仅需要使用同一个语音识别***即可完成。

第二种，针对第一测评模式为传译测试模式时，此时所述第一语音所属语种和所述第二语音所属语种不同，所述第一文本所属语种和所述第二文本所属语种不同。所述电子设备处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本，包括：所述电子设备调用所述第一语音所属语种对应的第一语音识别***，以及调用所述第二语音所属语种对应的第二语音识别***；通过所述第一语音识别***处理所述第一语音得到第一文本；通过所述第二语音识别***处理所述第二语音得到第二文本。

S203，所述电子设备获取所述第一测评模式对应的第一文本检测策略。

其中，所述第一测评模式为复述测试模式时，所述电子设备还支持第二测评模式，此时第二测评模式为传译测试模式，同样的，若第一测评模式为传译测试模式，则电子设备还支持第二测评模式，此时第二测评模式为复述测试模式。

其中，电子设备本端可以预存有第一测评模式与第一文本检测策略之间的对应关系，以及存储有第二测评模式与第二文本检测策略之间的对应关系。具体实现中，电子设备仅需要通过查询预存的映射关系集合的方式，即可快速确定当前第一测评模式对应的第一文本检测策略的具体内容。方便高效快捷。

其中，上述对应关系可以预先在服务器侧进行设置。具体实现中，电子设备可以实时与服务器进行交互，通知服务器查询当前第一测评模式对应的第一文本检测策略，并回传给电子设备。

需要说明的是，本申请中电子设备获取第一文本检测策略的具体实现方式包括但不局限于上述示例方法，还可以是其他方式，此处不做唯一限定。

S204，所述电子设备按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果。

其中，若所述第一测评模式为复述测试模式，则所述检测结果包括以下呈现形式中的任意一种：复述质量综合评分、各细分指标评分(例如：复述对齐程度评分、漏复述量、多复述量、复述准确度等)、错误文本单元展示(例如：将复述过程中出现的错误通过两个句子对齐的方式展现出来)等。

以文本展示单元为例，如图2b所示的复述测试模式的检测结果示例界面，其中，该界面包括第一语音的第一播放进度控件和第二语音的第二播放进度控件，还包括错误语句对应的原始文本单元和复述文本单元，其中，原始文本单元和复述文本单元中不一致的单词或短语或被突出显示出来，此外，第一播放进度控件的进度条的第一目标区间被标记出来以方便用户快速定位复述错误原始语句位置(第一目标区间包含原始文本单元对应的进度区间)，第二播放进度控件的进度条的第二目标区间被标记出来以方便用户快速定位复述错误复述语句位置(第一目标区间包含原始文本单元对应的进度区间)，从而用户点击原始文本单元或者选取第一目标区间时，电子设备可以播放包含复述错误原始语句的语音，用户点击复述文本单元或者选取第二目标区间时，电子设备可以播放包含复述错误复述语句的语音，提高查阅便捷性。

此外，播放进度控件目标区间可以包含复述错误语句的上下文信息，如包括前一句和后一句，也可以根据段落进行分层级，如仅包括复述错误语句所属的当前段落等。

若所述第一测评模式为传译测试模式，则所述检测结果包括以下呈现形式中的任意一种：传译质量综合评分、各细分指标评分(例如：传译对齐程度评分、翻译流畅性评分、漏翻译量、多翻译量和翻译准确度等)、错误文本单元展示(例如：将传译过程中出现的错误通过两个句子对齐的方式展现出来)等。

以文本展示单元为例，如图2c所示的传译测试模式的检测结果示例界面，其中，该界面包括第一语音的第一播放进度控件和第二语音的第二播放进度控件，还包括错误语句对应的原始文本单元和传译文本单元，其中，原始文本单元和传译文本单元中不一致的单词或短语或被突出显示出来，此外，第一播放进度控件的进度条的第一目标区间被标记出来以方便用户快速定位传译错误原始语句位置(第一目标区间包含原始文本单元对应的进度区间)，第二播放进度控件的进度条的第二目标区间被标记出来以方便用户快速定位传译错误传译语句位置(第一目标区间包含原始文本单元对应的进度区间)，从而用户点击原始文本单元或者选取第一目标区间时，电子设备可以播放包含传译错误原始语句的语音，用户点击传译文本单元或者选取第二目标区间时，电子设备可以播放包含传译错误传译语句的语音，提高查阅便捷性。

此外，播放进度控件可以包含翻译错误语句的上下文信息，如包括前一句和后一句，也可以根据段落进行分层级，如仅包括翻译错误语句所属的当前段落等。

在一个可能的示例中，所述第一测评模式包括复述测试模式；所述第一语音所属语种和所述第二语音所属语种相同，所述第一文本所属语种和所述第二文本所属语种相同。

可以理解的是，上述电子设备按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果的具体实现方式可以是多种多样的，本申请不做唯一限定，下面举例进行说明。

在本申请可能的示例中，所述电子设备按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果的具体实现方式可以是：所述电子设备确定所述第二文本相对于所述第一文本的匹配度；根据所述匹配度生成检测结果。

具体实现中，所述电子设备确定所述第二文本相对于所述第一文本的匹配度，包括：所述电子设备将所述第一文本进行分解得到第一文本单元集合，将所述第二文本进行分解得到第二文本单元集合；根据所述第一词级文本单元集合和所述第二词级文本单元集合计算匹配度。

其中，所述第一文本单元和所述第二文本单元的文本单元精细化层级可以是词级、短语级、句级、段落级等，如计算句子的语音向量，得到句级匹配度等，此处不做唯一限定。

在本申请可能的示例中，所述电子设备按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果的具体实现方式还可以是：所述电子设备确定所述第一文本和所述第二文本的对齐信息；根据所述对齐信息确定所述第二语音的复述准确性；根据所述对齐信息和/或所述复述准确性生成检测结果。

具体实现中，所述电子设备确定所述第一文本和所述第二文本的对齐信息，包括：所述电子设备计算所述第二文本相对于所述第一文本的复述匹配度，得到复述匹配度矩阵，其中，所述复述匹配度用于表示第二文本单元相对于第一文本单元的匹配度，所述复述匹配度是根据第一数量和第二数量计算得到，所述第一数量用于表示所述第二文本单元与所述第一文本单元中相同的词级文本单元的数量，所述第二数量用于表示所述第二文本单元中词级文本单元的数量，所述第一文本包括至少一个第一文本单元，所述第二文本包括至少一个第二文本单元；从所述复述匹配度矩阵中筛选出最优复述对齐路径；根据所述最优复述对齐路径确定所述对齐信息。

其中，若所述第一文本单元和所述第二文本单元的文本单元精细化层级可以是词级、句级、短语级、段落级等，此处不做唯一限定。所述最优复述对齐路径是指复述匹配度矩阵中的最大累计匹配度得分的对齐关系路径，具体可以采用维特比Viterbi算法等常用算法实现，此处不做具体限定。

具体实现中，所述电子设备根据所述对齐信息确定所述第二语音的复述准确性，包括：所述电子设备根据所述最优复述对齐路径中的句级复述匹配度计算所述第二语音的复述准确性。例如可以采用加权平均的方式来计算复述准确性。

在本申请可能的示例中，所述电子设备根据所述对齐信息和/或所述复述准确性生成检测结果，包括：所述电子设备根据所述对齐信息计算所述第二文本的参考复述质量参数，所述参考复述质量参数包括漏复述率和/或多复述率；根据所述参考复述质量参数和/或所述复述准确性确定检测结果。

下面以句级文本单元为例，对上述计算过程进行示例说明。

假设第一文本包括A、B、C、D、E五个第一句级文本单元(即五句话)，第二文本包括a、b、c、d、e、f六个第二句级文本单元，则可以定义句级复述匹配度Ai,j的计算公式为：

其中，i为第一文本中的第i个第一句级文本单元，j为第二文本中的第j个第二句级文本单元，Ei，j表示第j个第二句级文本单元与第i个第一句级文本单元的相同的词级文本单元的数量，Qy，j表示第j个第二文本单元中词级文本单元的总数量。

则对应的句级复述匹配度矩阵为

假设基于上述句级复述匹配度矩阵确定出最优复述对齐路径为：

A1,1→A2,2→A4,3→A5,5→A5,6，

则可以确定本次复述测试中，第一文本中的第3个第一句级文本单元为漏复述的句级文本单元，第二文本单元中的第4个和第6个第二句级文本单元为多复述的句级文本单元，因此可以计算出漏复述率、多复述率以及复述准确率分别如下：

漏复述率为：漏复述的句级文本单元的数量除以第一句级文本单元的数量，即1/5＝0.2；

多复述率为：多复述的句级文本单元的数量除以第二句级文本单元的数量，即2/6≈0.33；

复述准确性为：最优复述对齐路径中句级复述匹配度的加权平均，例如可以是：

(A1,1+A2,2+A4,3+A5,5+A5,6)/6。

需要说明的是，上述复述测试模式下的对齐信息的计算方式仅为示例，还可以采用其他本领域熟知的方法来计算第一文本和所述第二文本的对齐信息，如基于空间向量的余弦算法等，此处不做唯一限定。

可见，本示例中，电子设备针对复述测试模式，可以基于第一文本和第二文本的对其信息计算复述准确性，然后基于对齐信息和/或复述准确性生成检测结果，由于对齐信息、复述准确性能够较全面的反映用户的复述质量，故而可以提高测评准确度和全面性。

在一个可能的示例中，所述第一测评模式包括传译测试模式；所述第一语音所属语种和所述第二语音所属语种不同，所述第一文本所属语种和所述第二文本所属语种不同。

在本申请可能的示例中，所述电子设备按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果，包括：所述电子设备确定所述第一文本与所述第二文本的对齐信息；确定所述第二文本的翻译流畅性；根据所述对齐信息和/或所述翻译流畅性生成检测结果。

具体实现中，所述电子设备确定所述第二文本的翻译流畅性的实现方式可以是多种多样的，此处不做唯一限定。

举例来说，电子设备可以基于预设的流畅性预测模型处理所述第二文本得到翻译流畅性的预测结果，该流畅性预测模型可以采用神经网络语言模型，也可以采用简单的N元n-gram语言模型。

在本申请可能的示例中，所述电子设备根据所述对齐信息和/或所述翻译流畅性生成检测结果，包括：所述电子设备根据所述对齐信息确定所述第二语言的参考传译质量参数，所述参考传译质量参数包括以下至少一种：漏翻译率、多翻译率和翻译准确率；根据所述参考传译质量参数和/或所述翻译流畅性生成检测结果。

在本申请可能的示例中，所述电子设备确定所述第一文本与所述第二文本的对齐信息，包括：所述电子设备确定所述第一文本和所述第二文本的互译置信度矩阵；从所述互译置信度矩阵中筛选出最优翻译对齐路径；根据所述最优翻译对齐路径确定对齐信息。

在本申请可能的示例中，所述电子设备确定所述第一文本和所述第二文本的互译置信度矩阵，包括：所述电子设备获取正向翻译模型和反向翻译模型，所述正向翻译模型用于由所述第一文本所属语种转换为所述第二文本所属语种，所述反向翻译模型用于由所述第二文本所属语种转换为所述第一文本所述语种；通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵，所述第一文本包括多个第一文本单元，所述第二文本包括多个第二文本单元。

在本申请可能的示例中，所述电子设备通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵，包括：所述电子设备通过所述正向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的正向翻译置信度；通过所述反向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的反向翻译置信度；根据所述正向翻译置信度和所述反向翻译置信度确定所述每个第二文本单元相对于每个第一文本单元的互译置信度，得到互译置信度矩阵。

其中，所述正向翻译置信度用于表示第二文本单元相对于第一文本单元的第一翻译置信度，所述第一翻译置信度是根据所述第一文本单元中多个第一文本子单元的多个第一翻译子置信度加权平均得到的，每个第一翻译子置信度是每个第一文本子单元的第一输出概率集合中多个第一输出概率的最大值，每个第一输出概率是指所述正向翻译模型在输入第一文本子单元的情况下，所述正向翻译模型输出结果为所述第二文本单元中的第二文本子单元的概率；所述反向翻译置信度用于表示第一文本单元相对于第二文本单元的第二翻译置信度，所述第二翻译置信度是根据所述第二文本单元中多个第二文本子单元的多个第二翻译子置信度加权平均得到的，每个第二子翻译置信度是每个第二文本子单元的第二输出概率集合中多个第二输出概率的最大值，每个第二输出概率是指所述反向翻译模型在输入第二文本子单元的情况下，所述反向翻译模型输出结果为所述第一文本子单元中的第一文本子单元的概率。

以句级文本单元和词级文本单元为例，则所述正向翻译置信度用于表示第二句级文本单元相对于第一句级文本单元的第一句级翻译置信度，所述第一句级翻译置信度是根据所述第一句级文本单元中多个第一词级文本单元的多个第一词级翻译置信度加权平均得到的，每个第一词级翻译置信度是每个第一词级文本单元的第一输出概率集合中多个第一输出概率的最大值，每个第一输出概率是指所述正向翻译模型在输入第一词级文本单元的情况下，所述正向翻译模型输出结果为所述第二句级文本单元中的第二词级文本单元的概率；所述反向翻译置信度用于表示第一句级文本单元相对于第二句级文本单元的第二句级翻译置信度，所述第二句级翻译置信度是根据所述第二句级文本单元中多个第二词级文本单元的多个第二词级翻译置信度加权平均得到的，每个第二词级翻译置信度是每个第二词级文本单元的第二输出概率集合中多个第二输出概率的最大值，每个第二输出概率是指所述反向翻译模型在输入第二词级文本单元的情况下，所述反向翻译模型输出结果为所述第一句级文本单元中的第一词级文本单元的概率。

下面针对句级文本单元，结合具体实例对传译测试模式进行示例说明。

(1)获取学员练习用的原始音频信号Wx和学员练习过程中产生的音频信号Wy；其中Wx是学员练习采用的源语言语音，由学员自行选择或教师指定，例如英文BBC广播，Wy是学员口语翻译的目标语言的录音文件，通过录音***获得。

(2)采用和语言语种对应的语音识别***将音频信号Wx转写成对应文字表示Tx，同时将音频信号Wy转写成文字表示Ty。

(3)分别对Tx和Ty进行识别文字后处理，包括数字和时间规整、滤除无意义的语气词，以及进行断句和标点预测，得到输出结果

和

其中S_x，i，S_y，j分别是断句之后源语言音频的第i句文字，以及学员输出音频的第j句文字，M和N分别是基于原始音频内容转写预测出来的句子个数和基于学员输出音频内容转写预测出来的句子个数。

(4)训练一套源语言和目标语言的正向机器翻译模型E_f和反向机器翻译模型E_b，其中正向翻译是指将源语言文字翻译成目标语言文字，反向翻译则是将目标语言文字翻译成源语言文字。机器翻译模型，可以采用统计机器翻译(Statistical Machine Translation，SMT)方案或神经机器翻译(Neural Machine Translation，NMT)方案，不做限定。

(5)基于正向翻译模型E_f，计算学员同声传译的每句话在源语言音频中每句话上的翻译置信度F_i，j，定义如下：

F_i，j＝P(S_y，j|S_x，i，E_f)，i＝1，2，...，M j＝1，2，...，N

F_i，j表示给定源语言句子S_x，i和正向机器翻译模型Ef，翻译出目标语言句子S_y，j的置信度得分。其计算方法是首先对源语言句子S_x，i进行分词等预处理，然后使用机器翻译模型E_f，计算出在该机器翻译模型下目标语言句子S_y，j的得分概率。具体计算过程和采用的机器翻译建模方案相关，例如对于神经机器翻译，同样对目标语言句子S_y，j进行分词处理后，计算在每个解码时刻对应目标语言词的概率，最后将所有目标词的解码概率进行加权平均作为整句的置信度。

举例来说，假设源语言句子S_x，i的文本为“我爱唱歌”，目标语言句子S_y，j为“I lovesinging”，将“我爱唱歌”分词为“我”、“爱”、“唱歌”，将“I love singing”分词为“I”、“love”、“singing”，则通过正向翻译模型E_f，计算分词“我”翻译为“I”、“love”、“singing”的概率分别为0.9、0、0，计算分词“爱”翻译为“I”、“love”、“singing”的概率分别为0、0.8、0，计算分词“唱歌”翻译为“I”、“love”、“singing”的概率分别为0、0、0.7，得到词级最优翻译路径为分词“我”翻译为“I”0.9，分词“爱”翻译为“love”0.8，分词“唱歌”翻译为“singing”0.7，加权平均得到目标语言句子S_y，j“I love singing”相对于源语言句子S_x，i的置信度得分0.8。

(6)基于反向翻译模型，计算学员同声传译的每句话在源语言音频中每句话上的翻译置信度B_j，i，定义如下：

B_j，i＝P(S_x，i|S_y，j，Eb)，i＝1，2，...，M j＝1，2，...，N

表示给定目标语言句子S_y，j和反向机器翻译模型Eb，翻译出源语言句子S_x，i的置信度得分，其计算方式同正向翻译模型置信度计算方法，只不过输入是目标语言句子S_y，j，输出是源语言句子S_x，i。

(7)基于正向翻译置信度得分和反向翻译置信度得分，计算源语言句子和目标语言句子的互译置信度C_i，j：

C_i，j＝(F_i，j+B_j，i)/2，i＝1，2，...，M j＝1，2，...，N

其中C_i，j表示S_x，i与S_y，j互译的置信度，得分越高说明学员同声传译翻译的越准确。

(8)基于互译置信度矩阵C＝{C_i，j}，采用维特比Viterbi算法计算源语言句子与学员翻译出的目标语言句子的最大对齐关系路径。定义Viterbi解码至目标语言第j个句子与源语言第i个句子最大对齐路径累计置信度得分为西格玛σ_j(i)，该路径上一句目标语言句子对应的最大置信度得分的源语言句子下标为佛-爱

则根据Viterbi公式，其计算方式如下：

其中西格玛σ₀(i)＝0，i＝1，2，...，M，M和N分别是源语言句子个数和目标语言句子个数。正常情况下，一句英文对应一句中文，源语言句子和对应学员翻译结果句子的下标差值在一定范围之内，因此在Viterbi结果过程中，向后扩展是引入了搜索路径宽度K，该值根据实验结果确定。具体解码过程与现有技术相同，在此不再详述；最后通过回溯可以得到解码的最优翻译对应路径，即目标语言句子S_y，j其对应的源语言句子为

其中，

表示利用对齐算法得到的目标语言第j句对齐的源语言句子下标；通过该方法，可以得到每个目标语言句子和源语言句子的对齐关系。

(9)翻译错误检测。在学员翻译过程中，可能会出现翻译错误的句子，例如出现漏翻(对应源语言句子)时，源语言句子就找不到对应目标语言句子，此时通过最优解码对齐路径，统计不在最优路径上的源语言句子即可以得到漏掉的源语言句子的个数。令漏掉句子集合为A，则：

定义漏翻错误得分为：

Score₁＝|A|/M

其中|A|表示漏翻句子个数，M是源语言句子总数。

除了漏翻之外，学员练习中也有可能无意中出现多翻，若目标语言句子第j句是多翻译出来的句子，则其对应的对齐句子的置信度得分

就会比较低，因此通过设定阈值T，若

则认为是多翻出来的句子。假设多翻的句子个数为P，定义多翻错误得分计算方式如下：

Score₂＝P/N

其中N是目标语言句子总数。

对于对齐句对

Sy，j，若翻译准确性较好，则其置信度得分

就比较高，因此定义翻译准确性得分为：

其中L为

的句子数，作为归一化参数。

高质量的翻译结果要求翻译流畅自然，因此定义流畅性得分为：

其中λ为采用大量目标语言训练的语言模型，P(S_y，j|λ)为学员练习句子S_y，j在该语言模型上的流畅性得分。语言模型可以采用神经网络语言模型，也可以采用简单的n-gram语言模型。

基于上述多翻漏翻错误得分，翻译准确性得分，以及翻译流畅性得分，定义本次练***总得分为：

Score＝α₁(1-Score₁)+α₂(1-Score₂)+α₃·Score₃+α₄·Score₄

其中α_i，i＝1，2，3，4为每项得分的权重，具体取值可以根据实验结果或经验得到。

与上述图2a所示的实施例一致的，请参阅图3，图3是本申请实施例提供的一种电子设备300的结构示意图，如图所示，所述电子设备300包括应用处理器310、存储器320、通信接口330以及一个或多个程序321，其中，所述一个或多个程序321被存储在上述存储器320中，并且被配置由上述应用处理器310执行，所述一个或多个程序321包括用于执行以下步骤的指令；

获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音；以及用于处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本；以及用于获取所述第一测评模式对应的第一文本检测策略；以及用于按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果。

在一个可能的示例中，在所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果方面，所述程序中的指令具体用于执行以下操作：确定所述第一文本和所述第二文本的对齐信息；以及用于根据所述对齐信息确定所述第二语音的复述准确性；以及用于根据所述对齐信息和/或所述复述准确性生成检测结果。

在一个可能的示例中，在所述根据所述对齐信息和/或所述复述准确性生成检测结果方面，所述程序中的指令具体用于执行以下操作：根据所述对齐信息计算所述第二文本的参考复述质量参数，所述参考复述质量参数包括漏复述率和/或多复述率；以及用于根据所述参考复述质量参数和/或所述复述准确性确定检测结果。

在一个可能的示例中，在所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果方面，所述程序中的指令具体用于执行以下操作：确定所述第一文本与所述第二文本的对齐信息；以及用于确定所述第二文本的翻译流畅性；以及用于根据所述对齐信息和/或所述翻译流畅性生成检测结果。

在一个可能的示例中，在所述根据所述对齐信息和/或所述翻译流畅性生成检测结果方面，所述程序中的指令具体用于执行以下操作：根据所述对齐信息确定所述第二语言的参考传译质量参数，所述参考传译质量参数包括以下至少一种：漏翻译率、多翻译率和翻译准确率；以及用于根据所述参考传译质量参数和/或所述翻译流畅性生成检测结果。

在一个可能的示例中，在所述确定所述第一文本与所述第二文本的对齐信息方面，所述程序中的指令具体用于执行以下操作：确定所述第一文本和所述第二文本的互译置信度矩阵；以及用于从所述互译置信度矩阵中筛选出最优翻译对齐路径；以及用于根据所述最优翻译对齐路径确定对齐信息。

在一个可能的示例中，在所述确定所述第一文本和所述第二文本的互译置信度矩阵方面，所述程序中的指令具体用于执行以下操作：获取正向翻译模型和反向翻译模型，所述正向翻译模型用于由所述第一文本所属语种转换为所述第二文本所属语种，所述反向翻译模型用于由所述第二文本所属语种转换为所述第一文本所述语种；以及用于通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵，所述第一文本包括多个第一文本单元，所述第二文本包括多个第二文本单元。

在一个可能的示例中，在所述通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵方面，所述程序中的指令具体用于执行以下操作：通过所述正向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的正向翻译置信度；以及用于通过所述反向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的反向翻译置信度；以及用于根据所述正向翻译置信度和所述反向翻译置信度确定所述每个第二文本单元相对于每个第一文本单元的互译置信度，得到互译置信度矩阵。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所提供的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

图4是本申请实施例中所涉及的语音评测装置400的功能单元组成框图。该语音评测装置400应用于电子设备，所述电子设备包括处理单元401和通信单元402，其中，

所述处理单元401，用于通过所述通信单元402获取第一测评模式下作为评测标准的第一语音，以及通过所述通信单元获取待评测的第二语音，所述第一测评模式包括复述测试模式或者传译测试模式；以及用于处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本；以及用于获取所述第一测评模式对应的第一文本检测策略；以及用于按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果。

其中，所述语音评测装置400还可以包括存储单元403，用于存储电子设备的程序代码和数据。所述处理单元401可以是处理器，所述通信单元402可以是内部通信接口，存储单元403可以是存储器。

在一个可能的示例中，在所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果方面，所述处理单元401具体用于：确定所述第一文本和所述第二文本的对齐信息；以及用于根据所述对齐信息确定所述第二语音的复述准确性；以及用于根据所述对齐信息和/或所述复述准确性生成检测结果。

在一个可能的示例中，在所述根据所述对齐信息和/或所述复述准确性生成检测结果方面，所述处理单元401具体用于：根据所述对齐信息计算所述第二文本的参考复述质量参数，所述参考复述质量参数包括漏复述率和/或多复述率；以及用于根据所述参考复述质量参数和/或所述复述准确性确定检测结果。

在一个可能的示例中，在所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果方面，所述处理单元401具体用于：确定所述第一文本与所述第二文本的对齐信息；以及用于确定所述第二文本的翻译流畅性；以及用于根据所述对齐信息和/或所述翻译流畅性生成检测结果。

在一个可能的示例中，在所述根据所述对齐信息和/或所述翻译流畅性生成检测结果方面，所述处理单元401具体用于：根据所述对齐信息确定所述第二语言的参考传译质量参数，所述参考传译质量参数包括以下至少一种：漏翻译率、多翻译率和翻译准确率；以及用于根据所述参考传译质量参数和/或所述翻译流畅性生成检测结果。

在一个可能的示例中，在所述确定所述第一文本与所述第二文本的对齐信息方面，所述处理单元401具体用于：确定所述第一文本和所述第二文本的互译置信度矩阵；以及用于从所述互译置信度矩阵中筛选出最优翻译对齐路径；以及用于根据所述最优翻译对齐路径确定对齐信息。

在一个可能的示例中，在所述确定所述第一文本和所述第二文本的互译置信度矩阵方面，所述处理单元401具体用于：获取正向翻译模型和反向翻译模型，所述正向翻译模型用于由所述第一文本所属语种转换为所述第二文本所属语种，所述反向翻译模型用于由所述第二文本所属语种转换为所述第一文本所述语种；以及用于通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵，所述第一文本包括多个第一文本单元，所述第二文本包括多个第二文本单元。

在一个可能的示例中，在所述通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵方面，所述处理单元401具体用于：通过所述正向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的正向翻译置信度；以及用于通过所述反向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的反向翻译置信度；以及用于根据所述正向翻译置信度和所述反向翻译置信度确定所述每个第二文本单元相对于每个第一文本单元的互译置信度，得到互译置信度矩阵。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤，上述计算机包括电子设备。

本申请实施例还提供一种计算机程序产品，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包，上述计算机包括电子设备。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种语音评测方法，其特征在于，包括：

电子设备获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音；处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本；获取所述第一测评模式对应的第一文本检测策略；按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果；

所述第一测评模式包括复述测试模式；所述第一语音所属语种和所述第二语音所属语种相同，所述第一文本所属语种和所述第二文本所属语种相同；所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果，包括：确定所述第一文本和所述第二文本的对齐信息；根据所述对齐信息确定所述第二语音的复述准确性；根据所述对齐信息和/或所述复述准确性生成检测结果；所述确定所述第一文本和所述第二文本的对齐信息，包括：计算所述第二文本相对于所述第一文本的复述匹配度，得到复述匹配度矩阵；从所述复述匹配度矩阵中筛选出最优复述对齐路径；根据所述最优复述对齐路径确定所述对齐信息；和/或，

所述第一测评模式包括传译测试模式；所述第一语音所属语种和所述第二语音所属语种不同，所述第一文本所属语种和所述第二文本所属语种不同；所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果，包括：确定所述第一文本与所述第二文本的对齐信息；确定所述第二文本的翻译流畅性；根据所述对齐信息和/或所述翻译流畅性生成检测结果；所述确定所述第一文本与所述第二文本的对齐信息，包括：确定所述第一文本和所述第二文本的互译置信度矩阵；从所述互译置信度矩阵中筛选出最优翻译对齐路径；根据所述最优翻译对齐路径确定对齐信息。

2.根据权利要求1所述的方法，其特征在于，所述根据所述对齐信息和/或所述复述准确性生成检测结果，包括：

根据所述对齐信息计算所述第二文本的参考复述质量参数，所述参考复述质量参数包括漏复述率和/或多复述率；

根据所述参考复述质量参数和/或所述复述准确性确定检测结果。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述对齐信息和/或所述翻译流畅性生成检测结果，包括：

根据所述对齐信息确定所述第二文本的参考传译质量参数，所述参考传译质量参数包括以下至少一种：漏翻译率、多翻译率和翻译准确率；

根据所述参考传译质量参数和/或所述翻译流畅性生成检测结果。

4.根据权利要求1或2所述的方法，其特征在于，所述确定所述第一文本和所述第二文本的互译置信度矩阵，包括：

获取正向翻译模型和反向翻译模型，所述正向翻译模型用于由所述第一文本所属语种转换为所述第二文本所属语种，所述反向翻译模型用于由所述第二文本所属语种转换为所述第一文本所述语种；

通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵，所述第一文本包括多个第一文本单元，所述第二文本包括多个第二文本单元。

5.根据权利要求4所述的方法，其特征在于，所述通过所述正向翻译模型、所述反向翻译模型、所述第一文本和所述第二文本，确定每个第一文本单元和每个第二文本单元的互译置信度，得到互译置信度矩阵，包括：

通过所述正向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的正向翻译置信度；

通过所述反向翻译模型、所述第一文本和所述第二文本，计算所述第二文本的反向翻译置信度；

根据所述正向翻译置信度和所述反向翻译置信度确定所述每个第二文本单元相对于每个第一文本单元的互译置信度，得到互译置信度矩阵。

6.一种语音评测装置，其特征在于，包括处理单元和通信单元，其中，

所述处理单元，用于通过所述通信单元获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音；处理所述第一语音得到第一文本，以及处理所述第二语音得到第二文本；获取所述第一测评模式对应的第一文本检测策略；按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果；

所述第一测评模式包括复述测试模式；所述第一语音所属语种和所述第二语音所属语种相同，所述第一文本所属语种和所述第二文本所属语种相同；在所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果方面，所述处理单元具体用于：确定所述第一文本和所述第二文本的对齐信息；根据所述对齐信息确定所述第二语音的复述准确性；根据所述对齐信息和/或所述复述准确性生成检测结果；在所述确定所述第一文本和所述第二文本的对齐信息方面，所述处理单元具体用于：计算所述第二文本相对于所述第一文本的复述匹配度，得到复述匹配度矩阵；从所述复述匹配度矩阵中筛选出最优复述对齐路径；根据所述最优复述对齐路径确定所述对齐信息；和/或，

所述第一测评模式包括传译测试模式；所述第一语音所属语种和所述第二语音所属语种不同，所述第一文本所属语种和所述第二文本所属语种不同；在所述按照所述第一文本检测策略处理所述第一文本和所述第二文本，得到针对所述第二语音的检测结果方面，所述处理单元具体用于：确定所述第一文本与所述第二文本的对齐信息；确定所述第二文本的翻译流畅性；根据所述对齐信息和/或所述翻译流畅性生成检测结果；在所述确定所述第一文本与所述第二文本的对齐信息方面，所述处理单元具体用于：确定所述第一文本和所述第二文本的互译置信度矩阵；从所述互译置信度矩阵中筛选出最优翻译对齐路径；根据所述最优翻译对齐路径确定对齐信息。

7.一种电子设备，其特征在于，包括处理器、存储器，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。

8.一种计算机可读存储介质，其特征在于，存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。