CN103065642B

CN103065642B - 检测口语的方法及

Info

Publication number: CN103065642B
Application number: CN201210590964.7A
Authority: CN
Inventors: 王士进; 何婷婷; 刘丹; 胡国平; 胡郁; 刘庆峰
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2012-12-31
Filing date: 2012-12-31
Publication date: 2015-06-17
Anticipated expiration: 2032-12-31
Also published as: CN103065642A

Abstract

本发明涉及语音数据处理技术领域，公开了一种检测口语***的方法及***。该方法包括：提取所有考生的考生语音数据，所述考生语音数据包括考试前的测试音数据和考题录音数据；根据所述考生语音数据确定各考生的疑似作弊数据集；根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果。利用本发明，可以保证在监考阶段没有监考人员监测到，也可以在成绩发布之前进行快速、精确的作弊检测，保证口语考试的公平客观性。

Description

检测口语***的方法及***

技术领域

本发明涉及语音数据处理技术领域，具体涉及一种检测口语***的方法及***。

背景技术

近年来随着社会经济的不断发展和全球化趋势的加剧，人们对语言学***评测方法使教师和学生在教学时间和空间上受到很大限制，在师资力量、教学场地、经费支出等方面也存在诸多硬件上的差距和不平衡，对此基于计算机的大规模口语测试开始流行，出现了诸如四六级考试、TOFEL机考等。然而随着基于计算机的大规模口语测试的普及和推广，作弊替考的事件也时有发生。在传统考试中对***检测主要还是通过监考人员现场监督的方式，然而如果无法及时在当场发现事后基本没有方法再去检测。

发明内容

本发明提供一种检测口语***的方法及***，以保证在监考阶段没有监考人员监测到，也可以在成绩发布之前进行快速、精确的作弊检测，保证口语考试的公平客观性。

为此，本发明提供如下技术方案：

一种检测口语***的方法，包括：

提取所有考生的考生语音数据，所述考生语音数据包括考试前的测试音数据和考题录音数据；

针对每个考生，从所述考生的考生语音数据中提取比对特征；

基于所述比对特征计算不同考生语音数据之间的距离；

根据所述不同考生语音数据之间的距离确定各考生的疑似作弊数据集；

根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果。

优选地，所述根据基于所述比对特征计算不同考生语音数据之间的距离包括：

基于所述比对特征确定所述考生语音数据的代表模型；

根据所述代表模型计算不同考生语音数据之间的距离。

优选地，所述基于所述比对特征确定所述考生语音数据的代表模型包括：

提取所述考生语音数据中比对特征矢量集合的类中心作为所述考生语音数据的代表模型；或者

利用所述考生语音数据中比对特征矢量集合训练得到一个高斯混合模型，并将所述高斯混合模型作为所述考生语音数据的代表模型。

可选地，所述根据所述不同考生语音数据之间的距离确定所述考生的疑似作弊数据集包括：

选择与所述考生的考生语音数据距离小于设定距离门限的数据生成所述考生的疑似作弊数据集；或者

选择与所述考生的考生语音数据距离最小的前预定个数的数据生成所述考生的疑似作弊数据集。

优选地，所述方法还包括：

在根据所述考生语音数据确定各考生的疑似作弊数据集之前，从提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据；

所述根据所述考生语音数据确定各考生的疑似作弊数据集包括：

根据所述需要比对的考生语音数据确定各考生的疑似作弊数据集。

可选地，所述从提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据包括：

从提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限的考生语音数据作为需要比对的考生语音数据；或者

从提取的所有考生的考生语音数据中筛选出考生有效语音数据量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据；或者

从提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限并且考生有效语音量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据。

可选地，所述根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果包括：

基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度；

如果所述相关度高于设定的作弊分值门限，则确定所述考生的考生语音数据为作弊数据。

基于测试音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度；

对基于考题录音数据计算得到的相关度和基于测试音数据计算得到的相关度进行融合，得到综合得分；

如果所述综合得分高于设定的作弊分值门限，则确定所述考生的考生语音数据为作弊数据。

一种检测口语***的***，包括：

数据提取模块，用于提取所有考生的考生语音数据，所述考生语音数据包括考试前的测试音数据和考题录音数据；

疑似数据确定模块，用于根据所述考生语音数据确定各考生的疑似作弊数据集；

复测模块，用于根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果。

优选地，所述疑似数据确定模块包括：

特征提取单元，用于针对每个考生，从所述考生的考生语音数据中提取比对特征；

代表模型确定单元，用于基于所述比对特征确定所述考生语音数据的代表模型；

距离计算单元，用于根据所述代表模型计算不同考生语音数据之间的距离；

疑似数据确定单元，用于根据所述不同考生语音数据之间的距离确定所述考生的疑似作弊数据集。

可选地，所述代表模型确定单元，具体用于提取所述考生语音数据中比对特征矢量集合的类中心作为所述考生语音数据的代表模型；或者利用所述考生语音数据中比对特征矢量集合训练得到一个高斯混合模型，并将所述高斯混合模型作为所述考生语音数据的代表模型。

可选地，所述疑似数据确定单元，具体用于选择与所述考生的考生语音数据距离小于设定距离门限的数据生成所述考生的疑似作弊数据集；或者选择与所述考生的考生语音数据距离最小的前预定个数的数据生成所述考生的疑似作弊数据集。

优选地，所述***还包括：

数据筛选模块，用于在所述疑似数据确定模块根据所述考生语音数据确定各考生的疑似作弊数据集之前，从所述数据提取模块提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据；

所述疑似数据确定模块，具体用于根据所述数据筛选模块筛选出的需要比对的考生语音数据确定各考生的疑似作弊数据集。

可选地，所述数据筛选模块，具体用于从所述数据提取模块提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限的考生语音数据作为需要比对的考生语音数据；或者从所述数据提取模块提取的所有考生的考生语音数据中筛选出考生有效语音数据量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据；或者从所述数据提取模块提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限并且考生有效语音量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据。

可选地，所述复测模块包括：

第一计算单元，用于基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度；

作弊数据确定单元，用于在所述相关度高于设定的作弊分值门限时，确定所述考生的考生语音数据为作弊数据。

可选地，所述复测模块包括：

第二计算单元，用于基于测试音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度；

融合单元，用于对所述第一计算单元基于考题录音数据计算得到的相关度和所述第二计算单元基于测试音数据计算得到的相关度进行融合，得到综合得分；

作弊数据确定单元，用于在所述综合得分高于设定的作弊分值门限时，确定所述考生的考生语音数据为作弊数据。

本发明实施例提供的检测口语***的方法及***，通过确定各考生的疑似作弊数据集，并精确计算复测作弊的可能性，不仅实现了对规模化口语***的快速检测，而且在提高检测效率的同时提高了检测的准确性。因此，即使在监考阶段没有人为监测到，也可以成绩发布之前进行快速精确的作弊检测，并将结果反馈给相关人员，保证了口语考试的公平客观性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本发明实施例检测口语***的方法的流程图；

图2是本发明实施例中根据考生的疑似作弊数据集对考生语音数据进行复测的一种流程图；

图3是本发明实施例检测口语***的***的一种结构示意图；

图4是本发明实施例检测口语***的***中疑似数据确定模块的一种结构示意图；

图5是本发明实施例检测口语***的***中复测模块的一种结构示意图；

图6是本发明实施例检测口语***的***中复测模块的另一种结构示意图；

图7是本发明实施例检测口语***的***的另一种结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明实施例的方案，下面结合附图和实施方式对本发明实施例作进一步的详细说明。

口语***检测即要确认考试数据中是否存在多份雷同数据，显然如果采用精确算法对考试数据中每两份数据进行一一比对，虽然准确率得到了保障但由于计算代价较大，会耽误整体阅卷的进度，不适用于规模化考试的要求。反之若采用简单算法则由于受到比对精度的限制，会导致作弊检测毫无实施意义。

为此，本发明实施例提供一种检测口语***的方法及***，以保证在监考阶段没有监考人员监测到，也可以在成绩发布之前进行快速、精确的作弊检测，保证口语考试的公平客观性。

如图1所示，是本发明实施例检测口语***的方法的流程图，包括以下步骤：

步骤101，提取所有考生的考生语音数据，所述考生语音数据包括考试前的测试音数据和考题录音数据。

基于计算机的大规模口语考试中，通常为了检查录音设备是否正常，需要考生在正式考试前进行一个简短的录音，即录制测试音，对于不同的考生，测试音具有相同的文本内容但录音时长往往较短，约在10秒左右。而考题录音时长较长，但通常具有不同的文本内容。

步骤102，根据所述考生语音数据确定各考生的疑似作弊数据集。

由于考生语音数据通常为一系列采样点，对其直接比对的数据规模过大，且噪音干扰较多。因此，可以先从所有考生的考生语音数据中提取比对特征，然后基于所述比对特征确定各考生的疑似作弊数据集。

比如，可以采用诸如MFCC(Mel Frequency Cepstrum Coefficient，Mel频率倒谱系数)、或PLP(Perceptual Linear Predictive,感知线性预测系数)等声学特征作为比对特征。具体地，可以对窗长25ms帧移10ms的每帧语音数据做短时分析得到MFCC参数或PLP参数。进一步地，为了描述语音的动态变化，还可以在提取的静态特征(即上述比对特征)上获取相应的一阶及二阶差分特征作为补充特征。

需要说明的是，为了降低运算的复杂度及工作量，提高检测效率，在本发明实施例中，还可以通过简单条件过滤的方式从所有考生的考生语音数据中筛选出需要比对的考生语音数据，然后再根据所述需要比对的考生语音数据确定各考生的疑似作弊数据集，即从所述需要比对的考生语音数据中提取比对特征，并基于所述比对特征确定各考生的疑似作弊数据集。所述需要比对的考生语音数据可以包括：测试音数据和/或考题录音数据。

具体地，考虑到存在作弊可能的考生得分往往较高，因此可以筛选所有考分高于设定的分值门限(比如可以将成绩在70％以上的最低分数作为所述分值门限)、和/或考生有效语音数据量高于设定的数据规模门限(比如1分钟的有效语音量)的考生语音数据作为需要比对的考生语音数据。所述有效语音是指考生有效的考题录音，不包括静音和噪声。

当然，为了进一步提高后续***对语音信号的处理能力，还可以对筛选出的需要比对的考生语音数据进行前端降噪预处理，消除语音信号中的噪声，比如可以采用诸如维纳滤波等技术对所述需要比对的考生语音数据进行语音增强等处理。

由于每个考生语音数据都包括一系列比对特征矢量，对这一系列比对特征矢量采用诸如DTW(Dynamic Time Warping，动态时间归整)等动态规划的方法计算距离运算复杂度较高，因此，在本发明实施例中，可以首先确定各考生语音数据的代表模型，即用一个简单模型模拟其发音特点。具体地，可以提取每个需要比对的考生语音数据中比对特征矢量集合的类中心(即比对特征矢量的均值)作为相应的代表模型，或利用比对特征矢量集合训练得到一个GMM(Gaussian Mixture Model，高斯混合模型)作为相应的代表模型。

然后，计算不同考生语音数据之间的距离，具体地，如果是采用比对特征矢量集合的类中心作为考生语音数据的代表模型，则需要计算两两考生语音数据对应的类中心的距离；如果是采用GMM模型作为考生语音数据的代表模型，则需要计算两两考生语音数据对应的GMM模型的距离。具体计算方式可以采用各种常规的距离度量方法，比如欧式距离、K-L距离等，对此本发明实施例不做限定。

最后，根据计算得到的不同考生语音数据之间的距离确定各考生的疑似作弊数据集。具体地，首先分别计算任意两个考生的语音数据之间的距离，随后选择与当前考生语音数据距离小于设定距离门限的数据作为当前考生的疑似作弊数据集，或者选择与当前需要比对的考生语音数据距离最小的前N个数据作为考生的疑似作弊数据集。其中，距离门限和参数N可以预先设定。

通过上述过程，可以对每个考生提供一组疑似作弊数据列表，而且不同考生的疑似作弊数据列表可以重复(比如同一考生多次替考的情况)。

步骤103，根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果。

显然***检测出现误报将是一个严重的事故，为此，在本发明实施例中，进一步对上述步骤102中得到的针对每个考生的疑似作弊数据集中的数据进行确认，确定各考生的考题录音数据和其疑似作弊数据集之间的相关性。

具体地，可以基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度，如果所述相关度高于设定的作弊分值门限，则确定所述考生的考生语音数据为作弊数据。

由于经过初步筛选后获得的疑似作弊数据集规模显著下降，因此可以采用复杂的精确比对算法计算数据之间的相关度，并且可以采用多***融合方法提高检测精度，以避免单项技术确认精度无法满足真实应用的需求。

另外，为了进一步提高复测的准确度，还可以综合考虑基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度，以及基于测试音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度，来确定所述考生的考生语音数据是否为作弊数据。

如图2所示，是本发明实施例中根据考生的疑似作弊数据集对考生语音数据进行复测的一种流程图，包括以下步骤：

步骤201，基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度。

在口语考试中，每个考生通常都有较长的答题音，即前面所述的考题录音数据，因此，可以根据所述考题录音数据对各考生语音数据做进一步的检测。

具体过程如下：

(1)计算考生的考题录音数据与所述考生的疑似作弊数据集中的数据的相关度。

具体地，可以采用文本无关的说话人确认技术，分别确定所述疑似作弊数据集中的数据由所述考题录音数据对应的考生生成的可能性。比如，对于考生a的考题录音数据A及对应的疑似作弊数据集{B，C，D，E，F}，将分别计算数据B，C，D，E，F相应于数据A的相关度，即分别确定数据B，C，D，E，F是否由考生a生成并获得相关度得分。在计算数据B相应于数据A的相关度时，首先利用数据A训练得到考生a的说话人模型M_A，随后再计算数据B相对于考生a说话人模型的似然度p(X_B|M_A)或后验概率。其中UBM为通用背景模型(Universal background model)，由***预先在大量数据上训练得到。

进一步地，为了获得更高的检测精度，还可以采用融合多种不同的文本无关的说话人确认技术，即多说话人确认技术，分别采用不同的说话人确认技术计算所述疑似作弊数据集中的各数据由所述考题录音数据对应的考生生成的可能性。比如，采用诸如基于GMM-UBM的说话人确认方法、以及基于SVM(Support Vector Machine，支持向量机)的说话人确认方法等，分别计算考生的考题录音数据与各疑似作弊数据集中的数据的相关度。

需要说明的是，如果采用多说话人确认技术，则对每两份数据均得到多个相关度。可以这多个相关度进行融合，比如加权平均，得到对应这两份数据的相关度。

(2)获取每两份比较数据的相关度。

通过上述过程(1)，对每一个考生都将获得该考生的考题录音数据与疑似作弊数据集中的数据的相似度。显然每个考生都将作为实际说话人以及替考人身份存在。比如，在对考生a的考题录音数据及对应的疑似作弊数据集{B，C，D，E，F}的考察中，主要考察实际考生a及其对考生b的数据B替考可能，即考生b作为被替考人存在。相应地，在对考生b的考题录音数据及对应的疑似作弊数据集{A，C，D，E，F}的考察中，主要考察实际考生b及其对考生a的数据A的替考可能，即考生A作为被替考人存在。显然对于考生a,b的组合，将获得两个相似度得分。如果采用多说话人确认技术，将得到2*N维的得分矢量，其中N是多说话人确认技术中采用的说话人确认技术方案的个数。

(3)融合上述相关度，得到所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度。

也就是说同，对于考生a,b的组合，有两个相似度得分，分别是A与B的相似度，以及B与A的相似度，对于考生a，融合这两个相似度，得到考生a的考生语音数据和考生b的考生语音数据间的相关度。

具体的融合方法可以采用现有的技术，如基于LR(Logistic Regression，回归分析)的参数估计技术，基于SVM的参数预测技术等。

步骤202，基于测试音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度。

由于不同考生的测试音数据对应了相同的文本内容，不同考生的测试音数据主要体现了说话人的发音特点，更好地避免了发音内容对说话人身份检测的干扰，因此还可以根据考生的测试音数据确定考生语音数据之间的相关度。

具体计算流程与上述基于考题录音数据计算考生的疑似作弊数据集中不同数据间的相关度类似，在此不再详细描述。

步骤203，对基于考题录音数据计算得到的相关度和基于测试音数据计算得到的相关度进行融合，得到综合得分。

具体地，可以对上面得到的每两份考生数据之间的两个相关度得分进行加权平均或通过LR等回归方法获得综合得分。

步骤204，如果所述综合得分高于设定的作弊分值门限，则确定所述考生的考生语音数据为作弊数据。

对于考察的每两份考生数据，都会得到一个综合得分，如果该综合得分高于设定的作弊分值门限，则确定这两份考生数据之间为作弊数据，否则则不是作弊数据。

当然，还可以使用交叉验证的方法，比如，如果基于测试音数据计算得到的相关度和基于考题录音数据计算得到的相关度都高于相应的门限，则判定作弊存在。如果有一个相关度高于相应的门限，则可判定为疑似作弊，并根据具体的应用场合转交人工专家介入或者丢弃。

另外，还可以根据上述考察结果，进一步综合判断每个考场是否存在较明显的个体作弊替考现象以及集体作弊替考现象。比如，如果基于测试音数据计算得到的相关度和基于考题录音数据计算得到的相关度都高于相应的门限，则可判定是个体作弊替考；如果存在较多的个体作弊替考，特别是存在同样的人多次替考的情况，则可判定判断是集体作弊替考。

可见，本发明实施例检测口语***的方法，通过快速筛选的方法确定各考生的疑似作弊数据集，然后通过精确计算复测作弊的可能性，不仅实现了对规模化口语***的快速检测，而且在提高检测效率的同时提高了检测的准确性。

相应地，本发明实施例还提供一种检测口语***的***，如图3所示，是该***的一种结构示意图。

在该实施例中，所述检测口语***的***包括：

数据提取模块301，用于提取所有考生的考生语音数据，所述考生语音数据包括考试前的测试音数据和考题录音数据；

疑似数据确定模块302，用于根据所述考生语音数据确定各考生的疑似作弊数据集；

复测模块303，用于根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果。

由于考生语音数据通常为一系列采样点，对其直接比对的数据规模过大，且噪音干扰较多。因此，疑似数据确定模块302可以先从所有考生的考生语音数据中提取比对特征，然后基于所述比对特征确定各考生的疑似作弊数据集。

由于***检测出现误报将是一个严重的事故，因此，在本发明实施例中，由复测模块303对疑似数据确定模块302得到的针对每个考生的疑似作弊数据集中的数据进行确认，确定各考生的考题录音数据和其疑似作弊数据集之间的相关性。

可见，本发明实施例检测口语***的***，首先确定各考生的疑似作弊数据集，然后通过精确计算复测作弊的可能性，从而可以保证在监考阶段没有监考人员监测到，也可以在成绩发布之前进行快速、精确的作弊检测，保证口语考试的公平客观性。

如图4所示，是本发明实施例检测口语***的***中疑似数据确定模块的一种结构示意图。

该疑似数据确定模块包括：特征提取单元401、代表模型确定单元402、距离计算单元403和疑似数据确定单元404。其中：

特征提取单元401用于针对每个考生，从所述考生的考生语音数据中提取比对特征。

比如，可以提取诸如MFCC、或PLP等声学特征作为比对特征。具体地，可以对窗长25ms帧移10ms的每帧语音数据做短时分析得到MFCC参数或PLP参数。进一步地，为了描述语音的动态变化，还可以在提取的静态特征(即上述比对特征)上获取相应的一阶及二阶差分特征作为补充特征。

代表模型确定单元402用于基于所述比对特征确定所述考生语音数据的代表模型。

所述代表模型用于模拟考生语音数据的发音特点。具体地，代表模型确定单元402可以提取每个需要比对的考生语音数据中比对特征矢量集合的类中心(即比对特征矢量的均值)作为相应的代表模型，或利用比对特征矢量集合训练得到一个GMM模型作为相应的代表模型。

距离计算单元403用于根据所述代表模型计算不同考生语音数据之间的距离。

需要说明的是，如果是采用比对特征矢量集合的类中心作为考生语音数据的代表模型，则距离计算单元403需要计算两两考生语音数据对应的类中心的距离；如果是采用GMM模型作为考生语音数据的代表模型，则距离计算单元403需要计算两两考生语音数据对应的GMM模型的距离。具体计算方式可以采用各种常规的距离度量方法，比如欧式距离、K-L距离等，对此本发明实施例不做限定。

疑似数据确定单元404用于根据所述不同考生语音数据之间的距离确定所述考生的疑似作弊数据集。

比如，疑似数据确定单元404可以选择与所述考生的考生语音数据距离小于设定距离门限的数据生成所述考生的疑似作弊数据集；或者选择与所述考生的考生语音数据距离最小的前预定个数的数据生成所述考生的疑似作弊数据集。

通过上述疑似数据确定模块，可以对每个考生提供一组疑似作弊数据列表，而且不同考生的疑似作弊数据列表可以重复(比如同一考生多次替考的情况)。

在本发明实施例的检测口语***的***中，由于经过疑似数据确定模块302初步筛选后获得的疑似作弊数据集规模显著下降，因此复测模块303可以采用复杂的精确比对算法计算数据之间的相关度，并且可以采用多***融合方法提高检测精度，以避免单项技术确认精度无法满足真实应用的需求。

如图5所示，是本发明实施例检测口语***的***中复测模块的一种结构示意图。

在该实施例中，所述复测模块包括：第一计算单元501和作弊数据确定单元504。其中：

第一计算单元501用于基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度。

作弊数据确定单元504用于在所述综合得分高于设定的作弊分值门限时，确定所述考生的考生语音数据为作弊数据。

如图6所示，是本发明实施例检测口语***的***中复测模块的另一种结构示意图。

该复测模块包括：第一计算单元601、第二计算单元602、融合单元603和作弊数据确定单元604。其中：

第一计算单元601用于基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度。具体计算过程与第二计算单元602基于测试音数据计算考生的疑似作弊数据集中不同数据间的相关度类似。

第二计算单元602用于基于测试音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度，具体计算过程可参照前面本发明实施例检测口语***的方法中的描述，在此不再缀述。

融合单元603用于对所述第一计算单元601基于考题录音数据计算得到的相关度和所述第二计算单元602基于测试音数据计算得到的相关度进行融合，得到综合得分。具体地，可以对第一计算单元601和第二计算单元602得到的每两份考生数据之间的两个相关度得分进行加权平均或通过LR等回归方法获得综合得分。

作弊数据确定单元604用于在所述综合得分高于设定的作弊分值门限时，确定所述考生的考生语音数据为作弊数据。

对于考察的每两份考生数据，都会得到一个综合得分，如果该综合得分高于设定的作弊分值门限，则作弊数据确定单元604确定这两份考生数据之间为作弊数据，否则不是作弊数据。

当然，作弊数据确定单元604还可以使用交叉验证的方法确定作弊数据，比如，如果基于测试音数据计算得到的相关度和基于考题录音数据计算得到的相关度都高于相应的门限，则判定作弊存在。如果有一个相关度高于相应的门限，则可判定为疑似作弊，并根据具体的应用场合转交人工专家介入或者丢弃。

另外，在实际应用中，所述***还可以根据上述考察结果，进一步综合判断每个考场是否存在较明显的个体作弊替考现象以及集体作弊替考现象。比如，如果基于测试音数据计算得到的相关度和基于考题录音数据计算得到的相关度都高于相应的门限，则可判定是个体作弊替考；如果存在较多的个体作弊替考，特别是存在同样的人多次替考的情况，则可判定判断是集体作弊替考。

需要说明的是，为了进一步降低运算的复杂度及工作量，提高检测效率，在本发明检测口语***的***另一实施例中，如图7所示，所述***还进一步包括：

数据筛选模块701，用于在所述疑似数据确定模块302根据所述考生语音数据确定各考生的疑似作弊数据集之前，从数据提取模块301提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据。

相应地，在该实施例中，疑似数据确定模块302需要根据数据筛选模块701筛选出的需要比对的考生语音数据确定各考生的疑似作弊数据集，即从所述需要比对的考生语音数据中提取比对特征，并基于所述比对特征确定各考生的疑似作弊数据集。所述需要比对的考生语音数据可以包括：测试音数据和/或考题录音数据。

具体地，考虑到存在作弊可能的考生得分往往较高，因此，数据筛选模块701具体可以从数据提取模块301提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限的考生语音数据作为需要比对的考生语音数据；或者从数据提取模块301提取的所有考生的考生语音数据中筛选出考生有效语音数据量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据；或者从数据提取模块301提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限并且考生有效语音量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据。所述有效语音是指考生有效的考题录音，不包括静音和噪声。

当然，为了进一步提高后续***对语音信号的处理能力，在实际应用中，所述***还可进一步包括：预处理模块(未图示)，用于对数据筛选模块601筛选出的需要比对的考生语音数据进行前端降噪预处理，消除语音信号中的噪声，比如可以采用诸如维纳滤波等技术对所述需要比对的考生语音数据进行语音增强等处理。

可见，本发明实施例检测口语***的***，通过快速筛选的方法确定各考生的疑似作弊数据集，然后通过精确计算复测作弊的可能性，不仅实现了对规模化口语***的快速检测，而且在提高检测效率的同时提高了检测的准确性。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的***实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上对本发明实施例进行了详细介绍，本文中应用了具体实施方式对本发明进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及设备；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种检测口语***的方法，其特征在于，包括：

基于所述比对特征计算不同考生语音数据之间的距离；

选择与所述考生的考生语音数据距离小于设定距离门限的数据生成所述考生的疑似作弊数据集；或者选择与所述考生的考生语音数据距离最小的前预定个数的数据生成所述考生的疑似作弊数据集；

2.根据权利要求1所述的方法，其特征在于，所述基于所述比对特征计算不同考生语音数据之间的距离包括：

基于所述比对特征确定所述考生语音数据的代表模型；

根据所述代表模型计算不同考生语音数据之间的距离。

3.根据权利要求2所述的方法，其特征在于，所述基于所述比对特征确定所述考生语音数据的代表模型包括：

4.根据权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述从提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据包括：

6.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果包括：

7.根据权利要求1至3任一项所述的方法，其特征在于，所述根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果包括：

8.一种检测口语***的***，其特征在于，包括：

复测模块，用于根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测，得到作弊检测结果；

所述疑似数据确定模块包括：

疑似数据确定单元，用于选择与所述考生的考生语音数据距离小于设定距离门限的数据生成所述考生的疑似作弊数据集；或者选择与所述考生的考生语音数据距离最小的前预定个数的数据生成所述考生的疑似作弊数据集。

9.根据权利要求8所述的***，其特征在于，

所述代表模型确定单元，具体用于提取所述考生语音数据中比对特征矢量集合的类中心作为所述考生语音数据的代表模型；或者利用所述考生语音数据中比对特征矢量集合训练得到一个高斯混合模型，并将所述高斯混合模型作为所述考生语音数据的代表模型。

10.根据权利要求8或9所述的***，其特征在于，所述***还包括：

11.根据权利要求10所述的***，其特征在于，

所述数据筛选模块，具体用于从所述数据提取模块提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限的考生语音数据作为需要比对的考生语音数据；或者从所述数据提取模块提取的所有考生的考生语音数据中筛选出考生有效语音数据量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据；或者从所述数据提取模块提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限并且考生有效语音量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据。

12.根据权利要求8或9所述的***，其特征在于，所述复测模块包括：

13.根据权利要求8或9所述的***，其特征在于，所述复测模块包括：