CN109472487A

CN109472487A - 视频质检方法、装置、计算机设备及存储介质

Info

Publication number: CN109472487A
Application number: CN201811301549.9A
Authority: CN
Inventors: 付舒婷
Original assignee: OneConnect Smart Technology Co Ltd
Current assignee: OneConnect Smart Technology Co Ltd
Priority date: 2018-11-02
Filing date: 2018-11-02
Publication date: 2019-03-15
Also published as: JP2021520014A; WO2020087713A1; KR20210016551A; EP3876549A4; SG11202101615QA; JP7111887B2; EP3876549A1

Abstract

本发明公开了一种视频质检方法，用于解决视频质检时效性低的问题。本发明提供的方法包括：对目标视频进行抽帧处理，得到各个视频图片；对各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；对目标视频的语音进行语音识别处理，得到目标文本；根据目标文本和预设的必读文本计算必读文本的必读率；根据目标文本和预设的不可读读文本计算不可读文本的不可读率；检测是否必读率高于预设第一阈值且不可读率低于预设第二阈值，得到第二检测结果；若均为是，则确定目标视频质检通过；反之，则确定目标视频质检不通过。本发明还提供视频质检装置、计算机设备及存储介质。

Description

视频质检方法、装置、计算机设备及存储介质

技术领域

本发明涉及视频处理技术领域，尤其涉及视频质检方法、装置、计算机设备及存储介质。

背景技术

随着保险行业的发展和完善，保险公司对保险销售过程的管控要求越来越高。目前，当销售保险产品的代理人与投保人进行身份核验、投保注意事项告知、保险合同签订等环节时，均需要对这些环节的全过程进行录音录像，录制得到的视频将提交给保险公司的***，专业的质检人员会通过***对这些视频进行质量检查。

然而，随着保险产品的销量增多，录制保险交易过程得到的视频数量也越来越多，有限的质检人员往往难以及时完成对视频的质检工作，容易导致对这些视频质检的时效性降低。

发明内容

本发明实施例提供一种视频质检方法、装置、计算机设备及存储介质，以解决视频质检时效性低的问题。

一种视频质检方法，包括：

对目标视频进行抽帧处理，得到各个视频图片；

对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；

对所述目标视频的语音进行语音识别处理，得到目标文本；

根据所述目标文本和预设的必读文本计算所述必读文本的必读率，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例；

根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例；

检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果；

若所述第一检测结果或所述第二检测结果为否，则确定所述目标视频质检不通过；

若所述第一检测结果和所述第二检测结果均为是，则确定所述目标视频质检通过。

一种视频质检装置，包括：

抽帧模块，用于对目标视频进行抽帧处理，得到各个视频图片；

第一检测模块，用于对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；

语音识别模块，用于对所述目标视频的语音进行语音识别处理，得到目标文本；

必读率计算模块，用于根据所述目标文本和预设的必读文本计算所述必读文本的必读率，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例；

不可读率计算模块，用于根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例；

第二检测模块，用于检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果；

确定质检不通过模块，用于若所述第一检测结果或所述第二检测结果为否，则确定所述目标视频质检不通过；

确定质检通过模块，用于若所述第一检测结果和所述第二检测结果均为是，则确定所述目标视频质检通过。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述视频质检方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述视频质检方法的步骤。

上述视频质检方法、装置、计算机设备及存储介质，首先，对目标视频进行抽帧处理，得到各个视频图片；然后，对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；另一方面，对所述目标视频的语音进行语音识别处理，得到目标文本；接着，根据所述目标文本和预设的必读文本计算所述必读文本的必读率，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例；再之，根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例；最后，检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果；若所述第一检测结果或所述第二检测结果为否，则确定所述目标视频质检不通过；若所述第一检测结果和所述第二检测结果均为是，则确定所述目标视频质检通过。可见，通过将目标视频拆分成视频图片和语音两大部分分别进行质检，根据检测视频图片得到的第一检测结果和检测语音得到的第二检测结果综合判断该目标视频是否质检通过，不仅可以更准确地完成对视频的质检，而且可以提高视频质检的效率，面对大量需质检的视频时，也可以保证视频质检的时效性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中视频质检方法的一应用环境示意图；

图2是本发明一实施例中视频质检方法的一流程图；

图3是本发明一实施例中视频质检方法步骤102在一个应用场景下的流程示意图；

图4是本发明一实施例中视频质检方法步骤202在一个应用场景下的流程示意图；

图5是本发明一实施例中视频质检方法步骤301在一个应用场景下的流程示意图；

图6是本发明一实施例中视频质检装置的结构示意图；

图7是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请提供的视频质检方法，可应用在如图1的应用环境中，其中，客户端通过网络与服务器进行通信。其中，该客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种视频质检方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

101、对目标视频进行抽帧处理，得到各个视频图片；

本实施例中，在确定出本方法需要质检的目标视频之后，服务器可以对该目标视频进行抽帧处理，得到各个视频图片。具体地，服务器可以从目标视频上以等时间间距抽取图像帧，得到各个视频图片，比如每3秒钟抽取一个图像帧作为视频图片，假设某个视频共30秒，则总共可以提取得到11个视频图片。

102、对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；

可以理解的是，服务器在得到各个视频图片之后，可以对这些视频图片进行人脸识别，比如提取各个视频图片上的人脸特征。服务器可以检测各个视频图片中是否包括指定人员的人脸，从而得到各个视频图片对应的第一检测结果。可以理解的是，在对保险交易过程的视频进行质检时，其中很重要的一点是，检查目标视频中是否存在保险产品交易的投保人和代理人。若目标视频中存在投保人和代理人的人脸，则可以认为该目标视频符合这一规定。因此，具体地，该指定人员可以是代理人和/或投保人，而检测各个视频图片中是否包括指定人员的人脸具体可以是：检测各个视频图片中的人脸特征是否包含指定人员的预留人脸特征。服务器可以预先指定人员的人脸特征作为预留人脸特征，比如代理人作为保险公司的员工，可以预留其人脸特征在服务器上，而投保人在进行保险交易之前，代理人可以要求投保人进行人脸识别，采集投保人的人脸特征预留在服务器上。

进一步地，在实际对目标视频进行质检时，由于目标视频是录制指定交易流程得到的，而一个指定交易流程往往包含多个交易环节，因此可以将目标视频划分为多个交易环节对应的视频段分别进行质检，质检时，对这些交易环节可以分别预设对应的质检标准，也即预设质检条件，当所有交易环节对应的视频段均满足预设质检条件时，则可以认为该目标视频的检测通过。为此，具体地，在本实施例中，所述目标视频由录制指定交易流程得到，所述指定交易流程包括各个交易环节，所述各个视频图片包括各个交易环节对应的环节视频图片；如图3所示，步骤102具体可以包括：

201、获取各个所述交易环节对应的预设质检条件；

202、针对每个交易环节，对所述交易环节对应的环节视频图片进行人脸识别，检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件，得到所述交易环节的环节检测结果；

203、若各个所述交易环节对应的环节检测结果均为是，则确定所述各个视频图片对应的第一检测结果为是；

204、若各个所述交易环节对应的环节检测结果中任一环节检测结果为否，则确定所述各个视频图片对应的第一检测结果为否。

对于步骤201，可以理解的是，服务器上可以预先设置好各个交易环节对应的预设质检条件，在质检时，获取这些交易环节对应的预设质检条件。

对于步骤202，针对每个交易环节，可知，每个交易环节对应的环节视频图片可以有1个以上。比如，假设目标视频共30秒，共3个交易环节，每个交易环节10秒，在抽帧时，每2秒抽一帧作为所述视频图片，则第一个交易环节共有5个环节视频图片。服务器可以对每个交易环节对应的各张环节视频图片进行人脸识别，并检测这些环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件，从而得到该交易环节的环节检测结果。需要说明的是，这里对于每个交易环节对应的预设质检条件，具体可以根据实际使用情况进行设定。例如，考虑到在每个交易环节中，指定人员不一定非要时时刻刻均正脸面对录制视频的镜头，这就导致有些环节视频图片上无法检测到指定人员的人脸特征，为此，对于交易环节对应的预设质检条件，可以设置相对宽松的标准，比如一个交易环节上达到一定比例的环节视频图片中的人脸特征包括指定人员的预留人脸特征，则可以认为该交易环节的环节检测结果为是。比如，某个交易环节共有5个环节视频图片，设定60％以上的环节视频图片中包括投保人的人脸则认为满足预设质检条件，经过检测，5个环节视频图片中有4个环节视频图片上出现投保人的人脸，因此可以认为该交易环节的环节检测结果为是。

对于步骤203和步骤204，可以理解的死，当各个所述交易环节对应的环节检测结果均为是时，则说明该指定交易流程上各个交易环节对应的视频段均符合要求，因此可以确定所述各个视频图片对应的第一检测结果为是；反之，当各个所述交易环节对应的环节检测结果中任一环节检测结果为否时，则说明至少存在一个交易环节对应的视频段不符合要求，因此服务器可以确定所述各个视频图片对应的第一检测结果为否。

更进一步地，如图4所示，步骤202具体可以包括：

301、针对每张环节视频图片，判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致；

302、针对每张环节视频图片，若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致，则确定所述环节视频图片的判断结果为是；

303、针对每张环节视频图片，若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致，则确定所述环节视频图片的判断结果为否；

304、针对每个交易环节，在得到所述交易环节下各张环节视频图片对应的各个判断结果后，判断合格比例是否超过预设的比例阈值，所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比；

305、若合格比例超过预设的比例阈值，则确定所述交易环节的环节检测结果为是；

306、若合格比例不超过预设的比例阈值，则确定所述交易环节的环节检测结果为否。

对于上述步骤301，在一个交易环节中，针对每张环节视频图片，服务器可以判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致。

对于步骤302和303，容易理解的是，当所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致时，也就是该环节视频图片的判断结果为是；反之，当所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致时，也就是该环节视频图片的判断结果为否。

对于步骤304，由上述内容可知，针对每个交易环节，考虑到指定人员不一定非要时时刻刻均正脸面对录制视频的镜头，这就导致有些环节视频图片上无法检测到指定人员的人脸特征，为此，在得到所述交易环节下各张环节视频图片对应的各个判断结果后，服务器只需判断合格比例是否超过预设的比例阈值，若是，则说明该交易环节综合上来说是符合检测要求的，若否，则说明该交易环节综合上来说不符合检测要求的，其中，所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比。举例说明，某个交易环节下共5张环节视频图片，其中3张环节视频图片的判断结果为是，则该合格比例为60％。

对于步骤305和步骤306，可知，若合格比例超过预设的比例阈值，则可以认为该交易环节综合上来说符合检测的要求，因此服务器可以确定所述交易环节的环节检测结果为是；反之，若合格比例不超过预设的比例阈值，则可以认为该交易环节综合上来说不符合检测的要求，因此服务器可以确定所述交易环节的环节检测结果为否。

更进一步地，在如下情况下，所述指定交易流程为保险产品的销售流程，所述指定人员包括所述销售流程的代理人和投保人，如图5所示，步骤301中，判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致具体可以包括：

401、判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征，得到第一判断结果；

402、判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征，得到第二判断结果；

403、若所述第一判断结果和所述第二判断结果均为是，则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致；

404、若所述第一判断结果或所述第二判断结果为否，则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。

对于步骤401和步骤402，可以理解的是，当指定人员包括代理人和投保人时，服务器可以分别对环节视频图片中是否包括代理人和投保人的人脸进行判断，具体地，服务器可以判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征，得到第一判断结果，以及可以判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征，得到第二判断结果。

对于步骤403和404，在判断得到第一判断结果和第二判断结果之后，当所述第一判断结果和所述第二判断结果均为是时，代表该环节视频图片中同时包括了代理人的人脸和投保人的人脸，因此可以确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致；反之，当所述第一判断结果或所述第二判断结果为否时，则代表该环节视频图片中至少缺少了代理人的人脸或投保人的人脸，因此可以确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。

103、对所述目标视频的语音进行语音识别处理，得到目标文本；

可以理解的是，上述步骤101-102主要是对目标视频中的图像进行质检，下述步骤103-106则是对目标视频中的语音进行质检，这两部分步骤可以独立执行，本领域技术人员应当清楚步骤101-102与步骤103-106之间没有严格的执行先后顺序。

对于步骤103，在得到目标视频之后，服务器可以对该目标视频的语音进行语音识别处理，也即对目标视频中的音频进行语音识别，得到目标文本。

104、根据所述目标文本和预设的必读文本计算所述必读文本的必读率，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例；

可以理解的是，在指定交易流程中可以规定指定人员的必读话术，比如保险销售的代理人必须要对投保人详细讲述投保的注意事项和风险等内容，并录制到视频中。因此，在对目标视频的语音进行质检时，需要考察该语音中是否包括了所要求的必读文本。服务器可以根据所述目标文本和预设的必读文本计算所述必读文本的必读率，其中，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例。举例说明，假设必读文本包括了10个指定语句，通过检测目标文本发现，目标文本中包括了9个该指定语句，因此所述目标文本中包含所述必读文本的内容占所述必读文本的比例为90％，也即该必读率为90％。

105、根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例；

与必读文本相反的是，在指定交易流程中可以规定指定人员的不可读话术，比如保险销售的代理人在与投保人交谈过程中不能说出的侮辱性语言。因此，在对目标视频的语音进行质检时，需要考察该语音中是否出现了不可读文本。服务器可以根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，其中，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例。举例说明，预设的不可读文本包括了10个指定语句，通过检测目标文本发现，目标文本中包括了1个该指定语句，因此该目标文本中包含所述不可读文本的内容占所述不可读文本的比例为10％，也即该不可读率为10％。

106、检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果；

在指定交易流程中，通常要求上述必读率要达到一定的值，二不可读率则需要低于一定值，因此，服务器可以预先设定第一阈值和第二阈值，然后检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果。其中，该第一阈值越高，则代表要求指定交易流程中必读文本的阅读比例要越高；该第二阈值越低，则代表要求指定交易流程中不可读文本的阅读比例要越低。因此，在某个保险产品的指定交易流程中，该预设第一阈值可以设定为90％，该预设第二阈值可以设定为0，预设第二阈值为0表示该指定交易流程的目标视频中不能出现不可读文本，例如不能出现任何一句侮辱性语句。

107、判断所述第一检测结果和所述第二检测结果是否均为是，若否，则执行步骤108，若是，则执行步骤109

108、确定所述目标视频质检不通过；

109、确定所述目标视频质检通过。

对于步骤107、步骤108和步骤109，对于目标视频的质检，要求该目标视频的图像和语音均通过质检，因此，若所述第一检测结果或所述第二检测结果为否，则可以确定所述目标视频质检不通过；反之，若所述第一检测结果和所述第二检测结果均为是，则可以确定所述目标视频质检通过。

进一步地，本实施例中，在目标视频进行服务器的自动质检之后，不论质检通过与否，均可能会被抽检至人工质检岗位进行检查，为了便于工作人员对目标视频自动质检的检查，可以标记出目标视频在质检过程中的重要时间点，并且设置跳转至这些时间点的链接，以方便工作人员快速检查。具体地，本方法还可以包括以下四种标记方式中的一种或多种来实现：

第一种方式：标记漏读环节处于所述目标视频的开始播放位置的第一时间点，所述漏读环节是指所述目标文本中漏读的必读文本所在的交易环节，标记的所述第一时间点上设置有跳转至所述目标视频且从所述第一时间点开始播放的链接。在第一种方式中，可以标记出漏读环节处于所述目标视频的开始播放位置的第一时间点，该第一时间点上设置有跳转的链接，工作人员可以直接点击该第一时间点，服务器则自动打开该目标视频并定位到漏读环节的开始播放位置处，极大地方便了工作人员的抽检工作。

第二种方式：标记不可读环节处于所述目标视频的开始播放位置的第二时间点，所述不可读环节是指所述目标文本中出现的不可读文本所在的交易环节，标记的所述第二时间点上设置有跳转至所述目标视频且从所述第二时间点开始播放的链接。对于第二种方式，与第一种方式同理，服务器可以标记出不可读环节处于所述目标视频的开始播放位置的第二时间点，该第二时间点上设置有跳转的链接，工作人员可以直接点击该第二时间点，服务器则自动打开该目标视频并定位到不可读环节的开始播放位置处，极大地方便了工作人员的抽检工作。

第三种方式：标记各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点，标记的所述第三时间点上设置有跳转至所述目标视频且从所述第三时间点开始播放的链接；对于第三种方式，有时候工作人员希望检查抽检到的目标视频中的某个交易环节的图像和语音，因此服务器还可以标记出各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点，该第三时间点上设置有跳转的链接，工作人员可以点击该第三时间点，服务器自动打开目标视频并定位到该交易环节的开始播放位置处开始播放该目标视频。

第四种方式：标记各个所述视频图片分别处于所述目标视频的播放位置的第四时间点，标记的所述第四时间点上设置有跳转至所述目标视频上第四时间点所处播放位置的链接。在第四种方式中，目标视频在自动质检过程中抽帧出了各个视频图片，为便于工作人员检查其中的某个或某些视频图片，服务器还可以标记出各个所述视频图片分别处于所述目标视频的播放位置的第四时间点，该第四时间点上设置有跳转的链接，工作人员可以点击某个视频图片对应的第四时间点，服务器自动打开目标视频并定位至该视频图片所处播放位置。

由上述内容可知，本发明实施例中，首先，对目标视频进行抽帧处理，得到各个视频图片；然后，对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；另一方面，对所述目标视频的语音进行语音识别处理，得到目标文本；接着，根据所述目标文本和预设的必读文本计算所述必读文本的必读率，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例；再之，根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例；最后，检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果；若所述第一检测结果或所述第二检测结果为否，则确定所述目标视频质检不通过；若所述第一检测结果和所述第二检测结果均为是，则确定所述目标视频质检通过。可见，通过将目标视频拆分成视频图片和语音两大部分分别进行质检，根据检测视频图片得到的第一检测结果和检测语音得到的第二检测结果综合判断该目标视频是否质检通过，不仅可以更准确地完成对视频的质检，而且可以提高视频质检的效率，面对大量需质检的视频时，也可以保证视频质检的时效性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种视频质检装置，该视频质检装置与上述实施例中视频质检方法一一对应。如图6所示，该视频质检装置包括抽帧模块501、第一检测模块502、语音识别模块503、必读率计算模块504、不可读率计算模块505、第二检测模块506、确定质检不通过模块507和确定质检通过模块508。各功能模块详细说明如下：

抽帧模块501，用于对目标视频进行抽帧处理，得到各个视频图片；

第一检测模块502，用于对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果；

语音识别模块503，用于对所述目标视频的语音进行语音识别处理，得到目标文本；

必读率计算模块504，用于根据所述目标文本和预设的必读文本计算所述必读文本的必读率，所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例；

不可读率计算模块505，用于根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率，所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例；

第二检测模块506，用于检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值，得到第二检测结果；

确定质检不通过模块507，用于若所述第一检测结果或所述第二检测结果为否，则确定所述目标视频质检不通过；

确定质检通过模块508，用于若所述第一检测结果和所述第二检测结果均为是，则确定所述目标视频质检通过。

进一步地，所述目标视频由录制指定交易流程得到，所述指定交易流程包括各个交易环节，所述各个视频图片可以包括各个交易环节对应的环节视频图片；

所述第一检测模块可以包括：

质检条件获取单元，用于获取各个所述交易环节对应的预设质检条件；

环节检测单元，用于针对每个交易环节，对所述交易环节对应的环节视频图片进行人脸识别，检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件，得到所述交易环节的环节检测结果；

第一确定单元，用于若各个所述交易环节对应的环节检测结果均为是，则确定所述各个视频图片对应的第一检测结果为是；

第二确定单元，用于若各个所述交易环节对应的环节检测结果中任一环节检测结果为否，则确定所述各个视频图片对应的第一检测结果为否。

进一步地，所述环节检测单元可以包括：

人脸特征判断子单元，用于针对每张环节视频图片，判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致；

第一确定子单元，用于针对每张环节视频图片，若所述人脸特征判断子单元的判断结果为是，则确定所述环节视频图片的判断结果为是；

第二确定子单元，用于针对每张环节视频图片，若所述人脸特征判断子单元的判断结果为否，则确定所述环节视频图片的判断结果为否；

合格比例判断子单元，用于针对每个交易环节，在得到所述交易环节下各张环节视频图片对应的各个判断结果后，判断合格比例是否超过预设的比例阈值，所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比；

第三确定子单元，用于若所述合格比例判断子单元的判断结果为是，则确定所述交易环节的环节检测结果为是；

第四确定子单元，用于若所述合格比例判断子单元的判断结果为否，则确定所述交易环节的环节检测结果为否。

进一步地，所述人脸特征判断子单元可以包括：

第一判断次单元，用于判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征，得到第一判断结果；

第二判断次单元，用于判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征，得到第二判断结果；

第一确定次单元，用于若所述第一判断结果和所述第二判断结果均为是，则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致；

第二确定次单元，用于若所述第一判断结果或所述第二判断结果为否，则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。

进一步地，所述视频质检装置还可以包括：

第一标记模块，用于标记漏读环节处于所述目标视频的开始播放位置的第一时间点，所述漏读环节是指所述目标文本中漏读的必读文本所在的交易环节，标记的所述第一时间点上设置有跳转至所述目标视频且从所述第一时间点开始播放的链接；

和/或

第二标记模块，用于标记不可读环节处于所述目标视频的开始播放位置的第二时间点，所述不可读环节是指所述目标文本中出现的不可读文本所在的交易环节，标记的所述第二时间点上设置有跳转至所述目标视频且从所述第二时间点开始播放的链接；

和/或

第三标记模块，用于标记各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点，标记的所述第三时间点上设置有跳转至所述目标视频且从所述第三时间点开始播放的链接；

和/或

第四标记模块，用于标记各个所述视频图片分别处于所述目标视频的播放位置的第四时间点，标记的所述第四时间点上设置有跳转至所述目标视频上第四时间点所处播放位置的链接。

关于视频质检装置的具体限定可以参见上文中对于视频质检方法的限定，在此不再赘述。上述视频质检装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储视频质检方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频质检方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中视频质检方法的步骤，例如图2所示的步骤101至步骤109。或者，处理器执行计算机程序时实现上述实施例中视频质检装置的各模块/单元的功能，例如图6所示模块501至模块508的功能。为避免重复，这里不再赘述。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中视频质检方法的步骤，例如图2所示的步骤101至步骤109。或者，计算机程序被处理器执行时实现上述实施例中视频质检装置的各模块/单元的功能，例如图6所示模块501至模块508的功能。为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种视频质检方法，其特征在于，包括：

对目标视频进行抽帧处理，得到各个视频图片；

对所述目标视频的语音进行语音识别处理，得到目标文本；

2.根据权利要求1所述的视频质检方法，其特征在于，所述目标视频由录制指定交易流程得到，所述指定交易流程包括各个交易环节，所述各个视频图片包括各个交易环节对应的环节视频图片；

所述对所述各个视频图片进行人脸识别，检测各个视频图片中是否包括指定人员的人脸，得到各个视频图片对应的第一检测结果包括：

获取各个所述交易环节对应的预设质检条件；

针对每个交易环节，对所述交易环节对应的环节视频图片进行人脸识别，检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件，得到所述交易环节的环节检测结果；

若各个所述交易环节对应的环节检测结果均为是，则确定所述各个视频图片对应的第一检测结果为是；

若各个所述交易环节对应的环节检测结果中任一环节检测结果为否，则确定所述各个视频图片对应的第一检测结果为否。

3.根据权利要求2所述的视频质检方法，其特征在于，所述检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件，得到所述交易环节的环节检测结果包括：

针对每张环节视频图片，判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致；

针对每张环节视频图片，若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致，则确定所述环节视频图片的判断结果为是；

针对每张环节视频图片，若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致，则确定所述环节视频图片的判断结果为否；

针对每个交易环节，在得到所述交易环节下各张环节视频图片对应的各个判断结果后，判断合格比例是否超过预设的比例阈值，所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比；

若合格比例超过预设的比例阈值，则确定所述交易环节的环节检测结果为是；

若合格比例不超过预设的比例阈值，则确定所述交易环节的环节检测结果为否。

4.根据权利要求3所述的视频质检方法，其特征在于，所述判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致包括：

判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征，得到第一判断结果；

判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征，得到第二判断结果；

若所述第一判断结果和所述第二判断结果均为是，则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致；

若所述第一判断结果或所述第二判断结果为否，则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。

5.根据权利要求2至4中任一项所述的视频质检方法，其特征在于，所述视频质检方法还包括：

标记漏读环节处于所述目标视频的开始播放位置的第一时间点，所述漏读环节是指所述目标文本中漏读的必读文本所在的交易环节，标记的所述第一时间点上设置有跳转至所述目标视频且从所述第一时间点开始播放的链接；

和/或

标记不可读环节处于所述目标视频的开始播放位置的第二时间点，所述不可读环节是指所述目标文本中出现的不可读文本所在的交易环节，标记的所述第二时间点上设置有跳转至所述目标视频且从所述第二时间点开始播放的链接；

和/或

标记各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点，标记的所述第三时间点上设置有跳转至所述目标视频且从所述第三时间点开始播放的链接；

和/或

标记各个所述视频图片分别处于所述目标视频的播放位置的第四时间点，标记的所述第四时间点上设置有跳转至所述目标视频上第四时间点所处播放位置的链接。

6.一种视频质检装置，其特征在于，包括：

7.根据权利要求6所述的视频质检装置，其特征在于，所述目标视频由录制指定交易流程得到，所述指定交易流程包括各个交易环节，所述各个视频图片包括各个交易环节对应的环节视频图片；

所述第一检测模块包括：

8.根据权利要求7所述的视频质检装置，其特征在于，所述环节检测单元包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述视频质检方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述视频质检方法的步骤。