CN106847305B

CN106847305B - 一种处理客服电话的录音数据的方法及装置

Info

Publication number: CN106847305B
Application number: CN201510883478.8A
Authority: CN
Inventors: 王朝民; 冯俊兰; 任智杰; 丛鹏宇
Original assignee: China Mobile Communications Group Co Ltd
Current assignee: China Mobile Communications Group Co Ltd
Priority date: 2015-12-04
Filing date: 2015-12-04
Publication date: 2020-09-18
Anticipated expiration: 2035-12-04
Also published as: CN106847305A

Abstract

本发明提供了一种处理客服电话的录音数据的方法及装置，其中，客服电话的录音数据中记录有用户和客服代表的对话，该方法包括：根据待评价录音数据，得到待评价录音数据的用户对话节奏特征和客服代表对话节奏特征；根据待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定待评价录音数据的满意度评价结果。本发明的方案，能够在对话节奏层面自动评价客服录音的用户满意度情况，扩大了满意度评价的特征空间，从新的角度更好的为客服热线运营提供了技术支撑。

Description

一种处理客服电话的录音数据的方法及装置

技术领域

本发明涉及通信技术领域，尤其涉及一种处理客服电话的录音数据的方法及装置。

背景技术

客服热线录音满意度评价之前主要是通过互动式语音应答(Interactive VoiceResponse，IVR)或者下发短信的方式直接从用户侧获取，但由于用户参与度与回复率并不是非常高，大部分的热线电话并没有完成满意度评价。因此产生了自动满意度评价，但是自动满意度评价当前主要是通过语音识别引擎将录音数据转换成为识别后的文本，再通过文本情感词相关情况来建模，完成对该录音的自动满意度评价。其中，主要涉及了语音分析技术和机器学习技术。

语音分析技术是通过语音信号处理技术，将输入语音信号分解为在不同变换维度上的特征矢量。主要包括语音信号预处理技术，语音信号处理变换，语音各个域的语音特征提取技术及语音编解码技术等。

机器学习是人工智能领域的重要分支，尤其是语音识别技术是人工智能领域的一个重要研究领域。通过特征提取，统计模型建立，模型优化，模式识别，数据挖掘等完成人工智能的具体实践。

因此，现有技术中主要通过如下三种方案来获取客服热线录音的满意度评价结果。

方案一：通过语音识别引擎将热线录音数据“翻译”为文本内容，然后通过自然语言理解技术得到文本的满意度相关分析，从而判断此通电话录音的用户满意度情况。

方案二：通过语音情感分析得到用户的通话中情绪变化，从而分析确定该通电话的用户满意度情况。

方案三：通过结合语音特征及识别后文本特征组成联合特征来分析建模自动得到该通电话的用户满意度。

然而，上述三种方案中，方案一由于使用语音识别引擎得到识别后文本，处理此文本信息从而得到用户满意度信息，实际上丢失了原本录音中的语音满意度信息，很多用户不满意的情况并没有完全反应出来，影响了满意度评价准确性。方案二单纯从语音情感来判断该用户的满意度并不能特别好的得到评价效果，一方面因为情感本身就是一个模糊的主观的概念，评价标准因人而异；另一方面因为丢掉了文本中所含有的语义信息，所以需要使用联合特征来更好的完成自动评价任务。

然而，虽然方案三通过联合语音情感特征及识别后文本情感特征，自动满意度评价取得了较大的提升，但由于情感及满意度本身就是一个模糊的主观的概念，当前的效果仍有较大的提升空间，需要结合更多类型的特征来提高现有自动评价效果。

发明内容

为了克服现有技术中存在的上述问题，本发明的实施例提供了一种处理客服电话的录音数据的方法及装置，能够在对话节奏层面自动评价客服录音的用户满意度情况，扩大了满意度评价的特征空间，从新的角度更好的为客服热线运营提供技术支撑。

为了解决上述技术问题，本发明采用如下技术方案：

依据本发明实施例的一个方面，提供了一种处理客服电话的录音数据的方法，所述客服电话的录音数据中记录有用户和客服代表的对话，所述方法包括：

根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征；

根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果。

其中，上述方案中，所述根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，包括：

从所述待评价录音数据中获取第一预设时长的录音数据；

对所述第一预设时长的录音数据进行对话双方语音切分，得到用户的第一语音段集和客服代表的第一语音段集；

根据所述用户的第一语音段集，得到所述待评价录音数据的用户对话节奏特征，以及根据所述客服代表的第一语音段集，得到所述待评价录音数据的客服代表对话节奏特征。

其中，上述方案中，所述用户对话节奏特征至少包括所述第一预设时长、所述第一预设时长的录音数据中包括的静音总时长、所述第一预设时长的录音数据中包括的话语总时长、所述第一预设时长的录音数据中包括的静音的段数、所述第一预设时长的录音数据中包括的静音段的平均时长、所述第一预设时长的录音数据中包括的所有话语段的段数、所述第一预设时长的录音数据中包括的话语段的平均时长、所述用户的话语总时长、所述用户的话语段数、所述用户的话语段的平均时长、所述用户的话语总时长与所述客服代表的话语总时长的比值、所述用户的话语段数与所述客服代表的话语段数的比值中的一种或多种；

所述客服代表对话节奏特征至少包括所述客服代表的话语总时长、所述客服代表的话语段数、所述客服代表的话语段的平均时长中的一种或多种。

其中，上述方案中，在根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果之前，所述方法还包括：

根据已知满意度评价结果的录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征；

根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用支持向量机(SVM)算法确定所述满意度评价模型。

其中，上述方案中，所述满意度评价模型包括代表满意评价的第一支撑向量和代表不满意评价的第二支撑向量；

所述根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用SVM算法确定所述满意度评价模型，包括：

根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第一对话节奏特征向量，所述第一对话节奏特征向量的维数等于所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；

根据多个所述第一对话节奏特征向量，利用所述SVM算法的多项式核函数，确定所述第一支撑向量和所述第二支撑向量。

其中，上述方案中，所述根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果，包括：

根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第二对话节奏特征向量，所述第二对话节奏特征向量的维数等于所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；

获取所第二对话节奏特征向量与所述第一支撑向量之间的第一距离，以及所述第二对话节奏特征向量与所述第二支撑向量之间的第二距离；

判断所述第一距离是否小于第一预设阈值，若是，则所述待评价录音数据的满意度评价结果为满意；

若否，则判断所述第二距离是否小于第二预设阈值，若所述第二距离小于所述第二预设阈值，则所述待评价录音数据的满意度评价结果为不满意。

其中，上述方案中，所述根据已知满意度评价结果的所述录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，包括：

从所述已知评价结果的录音数据中获取第二预设时长的录音数据；

对所述第二预设时长的录音数据进行对话双方语音切分，得到用户的第二语音段集和客服代表的第二语音段集；

根据所述用户的第二语音段集，得到所述已知满意度评价结果的录音数据的用户对话节奏特征，以及根据所述客服代表的第二语音段集，得到所述已知满意度评价结果的录音数据的客服代表对话节奏特征。

依据本发明实施例的另一个方面，还提供了一种处理客服电话的录音数据的装置，所述客服电话的录音数据中记录有用户和客服代表的对话，所述装置包括：

第一提取模块，用于根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征；

评价模块，用于根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果。

其中，上述方案中，所述第一提取模块包括：

第一获取单元，用于从所述待评价录音数据中获取第一预设时长的录音数据；

第一切分单元，用于对所述第一预设时长的录音数据进行对话双方语音切分，得到用户的第一语音段集和客服代表的第一语音段集；

特征获取单元，用于根据所述用户的第一语音段集，得到所述待评价录音数据的用户对话节奏特征，以及根据所述客服代表的第一语音段集，得到所述待评价录音数据的客服代表对话节奏特征。

其中，上述方案中，所述装置还包括：

第二提取模块，用于根据已知满意度评价结果的录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征；

模型建立模块，用于根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用SVM算法确定所述满意度评价模型。

所述模型建立模块包括：

第二获取单元，用于根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第一对话节奏特征向量，所述第一对话节奏特征向量的维数等于所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；

模型建立单元，用于根据多个所述第一对话节奏特征向量，利用所述SVM算法的多项式核函数，确定所述第一支撑向量和所述第二支撑向量。

其中，上述方案中，所述评价模块包括：

第三获取单元，用于根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第二对话节奏特征向量，所述第二对话节奏特征向量的维数等于所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；

第四获取单元，用于获取所第二对话节奏特征向量与所述第一支撑向量之间的第一距离，以及所述第二对话节奏特征向量与所述第二支撑向量之间的第二距离；

第一判断单元，用于判断所述第一距离是否小于第一预设阈值，若是，则所述待评价录音数据的满意度评价结果为满意；

第二判断单元，用于当所述第一判断单元的判断结果为否时，判断所述第二距离是否小于第二预设阈值，若所述第二距离小于所述第二预设阈值，则所述待评价录音数据的满意度评价结果为不满意。

其中，上述方案中，所述第二提取模块包括：

第五获取单元，用于从所述已知评价结果的录音数据中获取第二预设时长的录音数据；

第二切分单元，用于对所述第二预设时长的录音数据进行对话双方语音切分，得到用户的第二语音段集和客服代表的第二语音段集；

第六获取单元，用于根据所述用户的第二语音段集，得到所述已知满意度评价结果的录音数据的用户对话节奏特征，以及根据所述客服代表的第二语音段集，得到所述已知满意度评价结果的录音数据的客服代表对话节奏特征。

本发明实施例的有益效果是：

本发明实施例的处理客服电话的录音数据的方法及装置，从待评价录音数据中获得用户对话节奏特征和客服代表对话节奏特征，并依据获得的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定待评价录音数据的满意度评价结果。因此，本发明的实施例将对话节奏特征作为满意度评价的依据，能够在对话节奏层面自动评价客服录音的用户满意度情况，扩大了满意度评价的特征空间，从新的角度更好的为客服热线运营提供了技术支撑。

附图说明

图1表示本发明实施例的第一实施例的处理客服电话的录音数据的方法流程图；

图2表示本发明实施例的第二实施例的处理客服电话的录音数据的装置的结构框图；

图3表示本发明实施例的第三实施例的处理客服电话的录音数据的装置的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

第一实施例

依据本发明实施例的一个方面，提供了一种处理客服电话的录音数据的方法，该方法首先，根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征；然后，根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果。

因此，本发明实施例的处理客服电话的录音数据的方法，提供了一个新的满意度评价角度，扩大了满意度评价的特征空间，从新的角度更好的为客服热线运营提供了技术支撑。

如图1所示，该方法包括：

步骤S11、根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征。

在客服电话的录音数据中记录的是用户与客服代表的对话。其中，通过这种录音形式存储的用户与客服代表之间的对话，不仅仅记录了对话内容，而且还记录了用户与客服代表的对话节奏。在用户与客服代表之间的对话中，对于用户在对话过程中所保持的态度，一般会影响对话的节奏。因此，本发明实施例的处理客服电话的录音数据的方法中，将对话节奏作为判断用户满意度评价的依据。

因此，在需要确定某一条待评价录音数据的满意度评价结果之前，需要从该待评价录音数据中获得所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征。

具体地，步骤S11包括：

从所述待评价录音数据中获取第一预设时长的录音数据；

对于任意一条客服电话的录音数据中，其中，在录音开始的前一部分时间一般是用户与客服代表对基本信息的沟通内容，与所需要确定的满意度评价结果一般关系不大。所以，为了减少对不必要信息的统计，加快满意度评价结果的获取，在从待评价录音数据中获得所述待评价录音数据的用户对话节奏特征和客服代表对话特征时，需要首先从待评价录音数据中截取第一预设时长的录音数据，例如，获取待评价录音数据的后半段时长的录音数据。当然，可以理解的是，对于第一预设时长具体所占待评价录音数据全部时长的百分比，并不限于是百分之五十，还可是待评价录音数据全部时长的后三分之二等。

其中，所述用户对话节奏特征至少包括所述第一预设时长、所述第一预设时长的录音数据中包括的静音总时长、所述第一预设时长的录音数据中包括的话语总时长、所述第一预设时长的录音数据中包括的静音的段数、所述第一预设时长的录音数据中包括的静音段的平均时长、所述第一预设时长的录音数据中包括的所有话语段的段数、所述第一预设时长的录音数据中包括的话语段的平均时长、所述用户的话语总时长、所述用户的话语段数、所述用户的话语段的平均时长、所述用户的话语总时长与所述客服代表的话语总时长的比值、所述用户的话语段数与所述客服代表的话语段数的比值中的一种或多种；

其中，用户对话节奏特征和客服代表对话节奏特征可统称为对话节奏特征，这些对话节奏特征是经过对大量已知满意度评价结果的录音数据的统计后，根据统计结果从中选取的。

具体地，将录音数据利用语音分割技术进行对话双方语音切分之后，先统计目标的统计量在客服代表与用户数据之间的差别，以及目标统计量在对话前段和后段的差别，比如利用如下公式：

X1＝(B1+B2+B3+…)/(A1+A2+A3+…)

计算在对话的后半段用户话语总时长与客服代表话语总时长的比例X1，其中，B1是后一分段用户的第一个话语时长，A1是后一分段客服代表的第一个话语时长；

再或者利用如下公式：

X2＝max(B)/max(A)

计算后半段用户单个切分段的最大时长与后半段客服代表单个切分段的最大时长的比例X2。其中，B表示后半段用户单个切分段的时长，A表示后半段客服代表单个切分段的时长。max函数表征寻找所有目标集合中的最大值。

因此，通过上述类似的统计方法，可以获得大约近千个此类节奏特征。这时，可以将获得的上述多个节奏特征按照用户与客服代表之间的差别从大到小排列，选择位列前若干位的特征作为最终的特征。

步骤S13、根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果。

其中，满意度评价模块是预先根据多条已知满意度评价结果的录音数据确定的。具体地，首先，根据已知满意度评价结果的录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征；然后，根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用SVM算法确定所述满意度评价模型。

其中，在根据已知满意度评价结果的所述录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征时，具体地，首先，需要从所述已知评价结果的录音数据中获取第二预设时长的录音数据，即获取已知评价结果的录音数据的全部时长中后一段的录音数据，以减少对不必要数据的处理，提高数据处理速度；然后，对所述第二预设时长的录音数据进行对话双方语音切分，得到用户的第二语音段集和客服代表的第二语音段集；最后，根据所述用户的第二语音段集，得到所述已知满意度评价结果的录音数据的用户对话节奏特征，以及根据所述客服代表的第二语音段集，得到所述已知满意度评价结果的录音数据的客服代表对话节奏特征。

通过上述方法获得了已知评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征后，则可利用SVM算法，根据大量已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，得到满意度评价模型。

具体地，在根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用SVM算法确定所述满意度评价模型时，可首先，根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第一对话节奏特征向量，所述第一对话节奏特征向量的维数等于所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；然后，根据多个所述第一对话节奏特征向量，利用所述SVM算法的多项式核函数，确定所述第一支撑向量和所述第二支撑向量。

其中，SVM是一个有监督的学习模型，在机器学习领域，通常用来进行模式识别、分类、以及回归分析。SVM方法是通过一个非线性映射p，把样本空间映射到一个高维乃至无穷维的特征空间中，使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。

在本发明实施例的处理客服电话的录音数据的方法中，假设每一条已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征共有13个，则每一条已知满意度评价结果的录音数据对应13个特征值。这时，根据每一条已知满意度评价结果的录音数据对应的13个特征值可获得一个13维的对话节奏特征向量Xt。那么，每一个对话节奏特征向量Xt对应一个满意度评价结果，为满意或者为不满意。

此时，可利用SVM的多项式核函数k(x，y)＝[(ax*y)+c]^d，对已知满意度评价结果的对话节奏特征向量进行训练，从而找到代表满意评价的第一支撑向量Xa和代表不满意评价的第二支撑向量Xb。其中，a、c和d均为常数，可根据实际需求自行设定。

因此，步骤S13包括：

其中，第一距离Da＝sqrt(∑(Xt_i-Xa_i)^2)，第二距离Db＝sqrt(∑(Xt_i-X_bi)^2，其中，i＝1，2..n，n是特征维度。Xt_i是第二对话节奏特征向量的第i个坐标表示，Xa_i是第一支撑向量的第i个坐标表示，Xb_i是第二支撑向量的第i个坐标表示。

另外，还可通过计算召回率来确定从评估数据中得到多少目标不满意数据，从而确定对应***的精确度。

综上所述，当需要确定某一条待评价录音数据的满意度评价结果时，需要从该条待评价录音数据中获得用户对话特征和客服代表对话特征，即对话节奏特征，然后根据这些对话节奏特征获得一个多维对话节奏特征向量Xt；接着，分别计算这个对话节奏特征向量与第一支撑向量Xa和第二支撑向量Xb的距离；最后，判断该对话节奏特征向量与哪一个支撑向量的距离在一定阈值范围之内，则给对话节奏特征向量对应的待评价录音数据的评价结果即为哪一个支撑向量对应的满意度评价结果。

由此可知，本发明实施例的处理客服电话的录音数据的方法是一个新的满意度评价角度，其计算过程非常简单，可以快速的评估满意度，而且能够达到几乎原有相同的评价性能，从而适合快速的处理各个公司大量的客服录音数据。

第二实施例

依据本发明实施例的另一个方面，还提供了一种处理客服电话的录音数据的装置，如图2所示，该装置200包括：

第一提取模块205，用于根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征；

评价模块207，用于根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果。

第三实施例

依据本发明实施例的另一个方面，还提供了一种处理客服电话的录音数据的装置，如图3所示，该装置200包括：

可选地，所述第一提取模块205包括：

第一获取单元2051，用于从所述待评价录音数据中获取第一预设时长的录音数据；

第一切分单元2052，用于对所述第一预设时长的录音数据进行对话双方语音切分，得到用户的第一语音段集和客服代表的第一语音段集；

特征获取单元2053，用于根据所述用户的第一语音段集，得到所述待评价录音数据的用户对话节奏特征，以及根据所述客服代表的第一语音段集，得到所述待评价录音数据的客服代表对话节奏特征。

可选地，所述用户对话节奏特征至少包括所述第一预设时长、所述第一预设时长的录音数据中包括的静音总时长、所述第一预设时长的录音数据中包括的话语总时长、所述第一预设时长的录音数据中包括的静音的段数、所述第一预设时长的录音数据中包括的静音段的平均时长、所述第一预设时长的录音数据中包括的所有话语段的段数、所述第一预设时长的录音数据中包括的话语段的平均时长、所述用户的话语总时长、所述用户的话语段数、所述用户的话语段的平均时长、所述用户的话语总时长与所述客服代表的话语总时长的比值、所述用户的话语段数与所述客服代表的话语段数的比值中的一种或多种；

可选地，该装置200还包括：

第二提取模块201，用于根据已知满意度评价结果的录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征；

模型建立模块203，用于根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用SVM算法确定所述满意度评价模型。

可选地，所述满意度评价模型包括代表满意评价的第一支撑向量和代表不满意评价的第二支撑向量；

所述模型建立模块203包括：

第二获取单元2031，用于根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第一对话节奏特征向量，所述第一对话节奏特征向量的维数等于所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；

模型建立单元2032，用于根据多个所述第一对话节奏特征向量，利用所述SVM算法的多项式核函数，确定所述第一支撑向量和所述第二支撑向量。

可选地，所述评价模块207包括：

第三获取单元2071，用于根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，获得第二对话节奏特征向量，所述第二对话节奏特征向量的维数等于所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征的数目之和；

第四获取单元2072，用于获取所第二对话节奏特征向量与所述第一支撑向量之间的第一距离，以及所述第二对话节奏特征向量与所述第二支撑向量之间的第二距离；

第一判断单元2073，用于判断所述第一距离是否小于第一预设阈值，若是，则所述待评价录音数据的满意度评价结果为满意；

第二判断单元2074，用于当所述第一判断单元2073的判断结果为否时，判断所述第二距离是否小于第二预设阈值，若所述第二距离小于所述第二预设阈值，则所述待评价录音数据的满意度评价结果为不满意。

可选地，所述第二提取模块201包括：

第五获取单元2011，用于从所述已知评价结果的录音数据中获取第二预设时长的录音数据；

第二切分单元2012，用于对所述第二预设时长的录音数据进行对话双方语音切分，得到用户的第二语音段集和客服代表的第二语音段集；

第六获取单元2013，用于根据所述用户的第二语音段集，得到所述已知满意度评价结果的录音数据的用户对话节奏特征，以及根据所述客服代表的第二语音段集，得到所述已知满意度评价结果的录音数据的客服代表对话节奏特征。

以上所述的是本发明的优选实施方式，应当指出对于本技术领域的普通人员来说，在不脱离本发明所述的原理前提下还可以作出若干改进和润饰，这些改进和润饰也在本发明的保护范围内。

Claims

1.一种处理客服电话的录音数据的方法，所述客服电话的录音数据中记录有用户和客服代表的对话，其特征在于，所述方法包括：

根据已知满意度评价结果的录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征；所述用户对话节奏特征至少包括第一预设时长、所述第一预设时长的录音数据中包括的静音总时长、所述第一预设时长的录音数据中包括的话语总时长、所述第一预设时长的录音数据中包括的静音的段数、所述第一预设时长的录音数据中包括的静音段的平均时长、所述第一预设时长的录音数据中包括的所有话语段的段数、所述第一预设时长的录音数据中包括的话语段的平均时长、所述用户的话语总时长、所述用户的话语段数、所述用户的话语段的平均时长、所述用户的话语总时长与所述客服代表的话语总时长的比值、所述用户的话语段数与所述客服代表的话语段数的比值；所述客服代表对话节奏特征至少包括所述客服代表的话语总时长、所述客服代表的话语段数、所述客服代表的话语段的平均时长；

根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用支持向量机SVM算法确定所述满意度评价模型；

2.根据权利要求1所述的方法，其特征在于，所述根据待评价录音数据，得到所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，包括：

从所述待评价录音数据中获取第一预设时长的录音数据；

3.根据权利要求1所述的方法，其特征在于，所述满意度评价模型包括代表满意评价的第一支撑向量和代表不满意评价的第二支撑向量；

所述根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用支持向量机SVM算法确定所述满意度评价模型，包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述待评价录音数据的用户对话节奏特征和客服代表对话节奏特征，利用预先确定的满意度评价模型，确定所述待评价录音数据的满意度评价结果，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据已知满意度评价结果的所述录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，包括：

6.一种处理客服电话的录音数据的装置，所述客服电话的录音数据中记录有用户和客服代表的对话，其特征在于，所述装置包括：

第二提取模块，用于根据已知满意度评价结果的录音数据，得到所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征；所述用户对话节奏特征至少包括第一预设时长、所述第一预设时长的录音数据中包括的静音总时长、所述第一预设时长的录音数据中包括的话语总时长、所述第一预设时长的录音数据中包括的静音的段数、所述第一预设时长的录音数据中包括的静音段的平均时长、所述第一预设时长的录音数据中包括的所有话语段的段数、所述第一预设时长的录音数据中包括的话语段的平均时长、所述用户的话语总时长、所述用户的话语段数、所述用户的话语段的平均时长、所述用户的话语总时长与所述客服代表的话语总时长的比值、所述用户的话语段数与所述客服代表的话语段数的比值；所述客服代表对话节奏特征至少包括所述客服代表的话语总时长、所述客服代表的话语段数、所述客服代表的话语段的平均时长；

模型建立模块，用于根据所述已知满意度评价结果的录音数据的用户对话节奏特征和客服代表对话节奏特征，利用支持向量机SVM算法确定所述满意度评价模型；

7.根据权利要求6所述的装置，其特征在于，所述第一提取模块包括：

8.根据权利要求6所述的装置，其特征在于，所述满意度评价模型包括代表满意评价的第一支撑向量和代表不满意评价的第二支撑向量；

所述模型建立模块包括：

9.根据权利要求8所述的装置，其特征在于，所述评价模块包括：

10.根据权利要求6所述的装置，其特征在于，所述第二提取模块包括：