CN109472487A - 视频质检方法、装置、计算机设备及存储介质 - Google Patents

视频质检方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109472487A
CN109472487A CN201811301549.9A CN201811301549A CN109472487A CN 109472487 A CN109472487 A CN 109472487A CN 201811301549 A CN201811301549 A CN 201811301549A CN 109472487 A CN109472487 A CN 109472487A
Authority
CN
China
Prior art keywords
link
video
video pictures
text
testing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811301549.9A
Other languages
English (en)
Inventor
付舒婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811301549.9A priority Critical patent/CN109472487A/zh
Priority to SG11202101615QA priority patent/SG11202101615QA/en
Priority to KR1020207036022A priority patent/KR20210016551A/ko
Priority to PCT/CN2018/123132 priority patent/WO2020087713A1/zh
Priority to JP2021508040A priority patent/JP7111887B2/ja
Priority to EP18938571.9A priority patent/EP3876549A4/en
Publication of CN109472487A publication Critical patent/CN109472487A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234336Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by media transcoding, e.g. video is transformed into a slideshow of still pictures or audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Signal Processing (AREA)
  • Educational Administration (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Image Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种视频质检方法,用于解决视频质检时效性低的问题。本发明提供的方法包括:对目标视频进行抽帧处理,得到各个视频图片;对各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;对目标视频的语音进行语音识别处理,得到目标文本;根据目标文本和预设的必读文本计算必读文本的必读率;根据目标文本和预设的不可读读文本计算不可读文本的不可读率;检测是否必读率高于预设第一阈值且不可读率低于预设第二阈值,得到第二检测结果;若均为是,则确定目标视频质检通过;反之,则确定目标视频质检不通过。本发明还提供视频质检装置、计算机设备及存储介质。

Description

视频质检方法、装置、计算机设备及存储介质
技术领域
本发明涉及视频处理技术领域,尤其涉及视频质检方法、装置、计算机设备及存储介质。
背景技术
随着保险行业的发展和完善,保险公司对保险销售过程的管控要求越来越高。目前,当销售保险产品的代理人与投保人进行身份核验、投保注意事项告知、保险合同签订等环节时,均需要对这些环节的全过程进行录音录像,录制得到的视频将提交给保险公司的***,专业的质检人员会通过***对这些视频进行质量检查。
然而,随着保险产品的销量增多,录制保险交易过程得到的视频数量也越来越多,有限的质检人员往往难以及时完成对视频的质检工作,容易导致对这些视频质检的时效性降低。
发明内容
本发明实施例提供一种视频质检方法、装置、计算机设备及存储介质,以解决视频质检时效性低的问题。
一种视频质检方法,包括:
对目标视频进行抽帧处理,得到各个视频图片;
对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;
对所述目标视频的语音进行语音识别处理,得到目标文本;
根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;
根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;
检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;
若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;
若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。
一种视频质检装置,包括:
抽帧模块,用于对目标视频进行抽帧处理,得到各个视频图片;
第一检测模块,用于对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;
语音识别模块,用于对所述目标视频的语音进行语音识别处理,得到目标文本;
必读率计算模块,用于根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;
不可读率计算模块,用于根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;
第二检测模块,用于检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;
确定质检不通过模块,用于若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;
确定质检通过模块,用于若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述视频质检方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述视频质检方法的步骤。
上述视频质检方法、装置、计算机设备及存储介质,首先,对目标视频进行抽帧处理,得到各个视频图片;然后,对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;另一方面,对所述目标视频的语音进行语音识别处理,得到目标文本;接着,根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;再之,根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;最后,检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。可见,通过将目标视频拆分成视频图片和语音两大部分分别进行质检,根据检测视频图片得到的第一检测结果和检测语音得到的第二检测结果综合判断该目标视频是否质检通过,不仅可以更准确地完成对视频的质检,而且可以提高视频质检的效率,面对大量需质检的视频时,也可以保证视频质检的时效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中视频质检方法的一应用环境示意图;
图2是本发明一实施例中视频质检方法的一流程图;
图3是本发明一实施例中视频质检方法步骤102在一个应用场景下的流程示意图;
图4是本发明一实施例中视频质检方法步骤202在一个应用场景下的流程示意图;
图5是本发明一实施例中视频质检方法步骤301在一个应用场景下的流程示意图;
图6是本发明一实施例中视频质检装置的结构示意图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的视频质检方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务器进行通信。其中,该客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种视频质检方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
101、对目标视频进行抽帧处理,得到各个视频图片;
本实施例中,在确定出本方法需要质检的目标视频之后,服务器可以对该目标视频进行抽帧处理,得到各个视频图片。具体地,服务器可以从目标视频上以等时间间距抽取图像帧,得到各个视频图片,比如每3秒钟抽取一个图像帧作为视频图片,假设某个视频共30秒,则总共可以提取得到11个视频图片。
102、对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;
可以理解的是,服务器在得到各个视频图片之后,可以对这些视频图片进行人脸识别,比如提取各个视频图片上的人脸特征。服务器可以检测各个视频图片中是否包括指定人员的人脸,从而得到各个视频图片对应的第一检测结果。可以理解的是,在对保险交易过程的视频进行质检时,其中很重要的一点是,检查目标视频中是否存在保险产品交易的投保人和代理人。若目标视频中存在投保人和代理人的人脸,则可以认为该目标视频符合这一规定。因此,具体地,该指定人员可以是代理人和/或投保人,而检测各个视频图片中是否包括指定人员的人脸具体可以是:检测各个视频图片中的人脸特征是否包含指定人员的预留人脸特征。服务器可以预先指定人员的人脸特征作为预留人脸特征,比如代理人作为保险公司的员工,可以预留其人脸特征在服务器上,而投保人在进行保险交易之前,代理人可以要求投保人进行人脸识别,采集投保人的人脸特征预留在服务器上。
进一步地,在实际对目标视频进行质检时,由于目标视频是录制指定交易流程得到的,而一个指定交易流程往往包含多个交易环节,因此可以将目标视频划分为多个交易环节对应的视频段分别进行质检,质检时,对这些交易环节可以分别预设对应的质检标准,也即预设质检条件,当所有交易环节对应的视频段均满足预设质检条件时,则可以认为该目标视频的检测通过。为此,具体地,在本实施例中,所述目标视频由录制指定交易流程得到,所述指定交易流程包括各个交易环节,所述各个视频图片包括各个交易环节对应的环节视频图片;如图3所示,步骤102具体可以包括:
201、获取各个所述交易环节对应的预设质检条件;
202、针对每个交易环节,对所述交易环节对应的环节视频图片进行人脸识别,检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件,得到所述交易环节的环节检测结果;
203、若各个所述交易环节对应的环节检测结果均为是,则确定所述各个视频图片对应的第一检测结果为是;
204、若各个所述交易环节对应的环节检测结果中任一环节检测结果为否,则确定所述各个视频图片对应的第一检测结果为否。
对于步骤201,可以理解的是,服务器上可以预先设置好各个交易环节对应的预设质检条件,在质检时,获取这些交易环节对应的预设质检条件。
对于步骤202,针对每个交易环节,可知,每个交易环节对应的环节视频图片可以有1个以上。比如,假设目标视频共30秒,共3个交易环节,每个交易环节10秒,在抽帧时,每2秒抽一帧作为所述视频图片,则第一个交易环节共有5个环节视频图片。服务器可以对每个交易环节对应的各张环节视频图片进行人脸识别,并检测这些环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件,从而得到该交易环节的环节检测结果。需要说明的是,这里对于每个交易环节对应的预设质检条件,具体可以根据实际使用情况进行设定。例如,考虑到在每个交易环节中,指定人员不一定非要时时刻刻均正脸面对录制视频的镜头,这就导致有些环节视频图片上无法检测到指定人员的人脸特征,为此,对于交易环节对应的预设质检条件,可以设置相对宽松的标准,比如一个交易环节上达到一定比例的环节视频图片中的人脸特征包括指定人员的预留人脸特征,则可以认为该交易环节的环节检测结果为是。比如,某个交易环节共有5个环节视频图片,设定60%以上的环节视频图片中包括投保人的人脸则认为满足预设质检条件,经过检测,5个环节视频图片中有4个环节视频图片上出现投保人的人脸,因此可以认为该交易环节的环节检测结果为是。
对于步骤203和步骤204,可以理解的死,当各个所述交易环节对应的环节检测结果均为是时,则说明该指定交易流程上各个交易环节对应的视频段均符合要求,因此可以确定所述各个视频图片对应的第一检测结果为是;反之,当各个所述交易环节对应的环节检测结果中任一环节检测结果为否时,则说明至少存在一个交易环节对应的视频段不符合要求,因此服务器可以确定所述各个视频图片对应的第一检测结果为否。
更进一步地,如图4所示,步骤202具体可以包括:
301、针对每张环节视频图片,判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致;
302、针对每张环节视频图片,若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致,则确定所述环节视频图片的判断结果为是;
303、针对每张环节视频图片,若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致,则确定所述环节视频图片的判断结果为否;
304、针对每个交易环节,在得到所述交易环节下各张环节视频图片对应的各个判断结果后,判断合格比例是否超过预设的比例阈值,所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比;
305、若合格比例超过预设的比例阈值,则确定所述交易环节的环节检测结果为是;
306、若合格比例不超过预设的比例阈值,则确定所述交易环节的环节检测结果为否。
对于上述步骤301,在一个交易环节中,针对每张环节视频图片,服务器可以判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致。
对于步骤302和303,容易理解的是,当所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致时,也就是该环节视频图片的判断结果为是;反之,当所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致时,也就是该环节视频图片的判断结果为否。
对于步骤304,由上述内容可知,针对每个交易环节,考虑到指定人员不一定非要时时刻刻均正脸面对录制视频的镜头,这就导致有些环节视频图片上无法检测到指定人员的人脸特征,为此,在得到所述交易环节下各张环节视频图片对应的各个判断结果后,服务器只需判断合格比例是否超过预设的比例阈值,若是,则说明该交易环节综合上来说是符合检测要求的,若否,则说明该交易环节综合上来说不符合检测要求的,其中,所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比。举例说明,某个交易环节下共5张环节视频图片,其中3张环节视频图片的判断结果为是,则该合格比例为60%。
对于步骤305和步骤306,可知,若合格比例超过预设的比例阈值,则可以认为该交易环节综合上来说符合检测的要求,因此服务器可以确定所述交易环节的环节检测结果为是;反之,若合格比例不超过预设的比例阈值,则可以认为该交易环节综合上来说不符合检测的要求,因此服务器可以确定所述交易环节的环节检测结果为否。
更进一步地,在如下情况下,所述指定交易流程为保险产品的销售流程,所述指定人员包括所述销售流程的代理人和投保人,如图5所示,步骤301中,判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致具体可以包括:
401、判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征,得到第一判断结果;
402、判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征,得到第二判断结果;
403、若所述第一判断结果和所述第二判断结果均为是,则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致;
404、若所述第一判断结果或所述第二判断结果为否,则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。
对于步骤401和步骤402,可以理解的是,当指定人员包括代理人和投保人时,服务器可以分别对环节视频图片中是否包括代理人和投保人的人脸进行判断,具体地,服务器可以判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征,得到第一判断结果,以及可以判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征,得到第二判断结果。
对于步骤403和404,在判断得到第一判断结果和第二判断结果之后,当所述第一判断结果和所述第二判断结果均为是时,代表该环节视频图片中同时包括了代理人的人脸和投保人的人脸,因此可以确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致;反之,当所述第一判断结果或所述第二判断结果为否时,则代表该环节视频图片中至少缺少了代理人的人脸或投保人的人脸,因此可以确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。
103、对所述目标视频的语音进行语音识别处理,得到目标文本;
可以理解的是,上述步骤101-102主要是对目标视频中的图像进行质检,下述步骤103-106则是对目标视频中的语音进行质检,这两部分步骤可以独立执行,本领域技术人员应当清楚步骤101-102与步骤103-106之间没有严格的执行先后顺序。
对于步骤103,在得到目标视频之后,服务器可以对该目标视频的语音进行语音识别处理,也即对目标视频中的音频进行语音识别,得到目标文本。
104、根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;
可以理解的是,在指定交易流程中可以规定指定人员的必读话术,比如保险销售的代理人必须要对投保人详细讲述投保的注意事项和风险等内容,并录制到视频中。因此,在对目标视频的语音进行质检时,需要考察该语音中是否包括了所要求的必读文本。服务器可以根据所述目标文本和预设的必读文本计算所述必读文本的必读率,其中,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例。举例说明,假设必读文本包括了10个指定语句,通过检测目标文本发现,目标文本中包括了9个该指定语句,因此所述目标文本中包含所述必读文本的内容占所述必读文本的比例为90%,也即该必读率为90%。
105、根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;
与必读文本相反的是,在指定交易流程中可以规定指定人员的不可读话术,比如保险销售的代理人在与投保人交谈过程中不能说出的侮辱性语言。因此,在对目标视频的语音进行质检时,需要考察该语音中是否出现了不可读文本。服务器可以根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,其中,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例。举例说明,预设的不可读文本包括了10个指定语句,通过检测目标文本发现,目标文本中包括了1个该指定语句,因此该目标文本中包含所述不可读文本的内容占所述不可读文本的比例为10%,也即该不可读率为10%。
106、检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;
在指定交易流程中,通常要求上述必读率要达到一定的值,二不可读率则需要低于一定值,因此,服务器可以预先设定第一阈值和第二阈值,然后检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果。其中,该第一阈值越高,则代表要求指定交易流程中必读文本的阅读比例要越高;该第二阈值越低,则代表要求指定交易流程中不可读文本的阅读比例要越低。因此,在某个保险产品的指定交易流程中,该预设第一阈值可以设定为90%,该预设第二阈值可以设定为0,预设第二阈值为0表示该指定交易流程的目标视频中不能出现不可读文本,例如不能出现任何一句侮辱性语句。
107、判断所述第一检测结果和所述第二检测结果是否均为是,若否,则执行步骤108,若是,则执行步骤109
108、确定所述目标视频质检不通过;
109、确定所述目标视频质检通过。
对于步骤107、步骤108和步骤109,对于目标视频的质检,要求该目标视频的图像和语音均通过质检,因此,若所述第一检测结果或所述第二检测结果为否,则可以确定所述目标视频质检不通过;反之,若所述第一检测结果和所述第二检测结果均为是,则可以确定所述目标视频质检通过。
进一步地,本实施例中,在目标视频进行服务器的自动质检之后,不论质检通过与否,均可能会被抽检至人工质检岗位进行检查,为了便于工作人员对目标视频自动质检的检查,可以标记出目标视频在质检过程中的重要时间点,并且设置跳转至这些时间点的链接,以方便工作人员快速检查。具体地,本方法还可以包括以下四种标记方式中的一种或多种来实现:
第一种方式:标记漏读环节处于所述目标视频的开始播放位置的第一时间点,所述漏读环节是指所述目标文本中漏读的必读文本所在的交易环节,标记的所述第一时间点上设置有跳转至所述目标视频且从所述第一时间点开始播放的链接。在第一种方式中,可以标记出漏读环节处于所述目标视频的开始播放位置的第一时间点,该第一时间点上设置有跳转的链接,工作人员可以直接点击该第一时间点,服务器则自动打开该目标视频并定位到漏读环节的开始播放位置处,极大地方便了工作人员的抽检工作。
第二种方式:标记不可读环节处于所述目标视频的开始播放位置的第二时间点,所述不可读环节是指所述目标文本中出现的不可读文本所在的交易环节,标记的所述第二时间点上设置有跳转至所述目标视频且从所述第二时间点开始播放的链接。对于第二种方式,与第一种方式同理,服务器可以标记出不可读环节处于所述目标视频的开始播放位置的第二时间点,该第二时间点上设置有跳转的链接,工作人员可以直接点击该第二时间点,服务器则自动打开该目标视频并定位到不可读环节的开始播放位置处,极大地方便了工作人员的抽检工作。
第三种方式:标记各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点,标记的所述第三时间点上设置有跳转至所述目标视频且从所述第三时间点开始播放的链接;对于第三种方式,有时候工作人员希望检查抽检到的目标视频中的某个交易环节的图像和语音,因此服务器还可以标记出各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点,该第三时间点上设置有跳转的链接,工作人员可以点击该第三时间点,服务器自动打开目标视频并定位到该交易环节的开始播放位置处开始播放该目标视频。
第四种方式:标记各个所述视频图片分别处于所述目标视频的播放位置的第四时间点,标记的所述第四时间点上设置有跳转至所述目标视频上第四时间点所处播放位置的链接。在第四种方式中,目标视频在自动质检过程中抽帧出了各个视频图片,为便于工作人员检查其中的某个或某些视频图片,服务器还可以标记出各个所述视频图片分别处于所述目标视频的播放位置的第四时间点,该第四时间点上设置有跳转的链接,工作人员可以点击某个视频图片对应的第四时间点,服务器自动打开目标视频并定位至该视频图片所处播放位置。
由上述内容可知,本发明实施例中,首先,对目标视频进行抽帧处理,得到各个视频图片;然后,对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;另一方面,对所述目标视频的语音进行语音识别处理,得到目标文本;接着,根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;再之,根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;最后,检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。可见,通过将目标视频拆分成视频图片和语音两大部分分别进行质检,根据检测视频图片得到的第一检测结果和检测语音得到的第二检测结果综合判断该目标视频是否质检通过,不仅可以更准确地完成对视频的质检,而且可以提高视频质检的效率,面对大量需质检的视频时,也可以保证视频质检的时效性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种视频质检装置,该视频质检装置与上述实施例中视频质检方法一一对应。如图6所示,该视频质检装置包括抽帧模块501、第一检测模块502、语音识别模块503、必读率计算模块504、不可读率计算模块505、第二检测模块506、确定质检不通过模块507和确定质检通过模块508。各功能模块详细说明如下:
抽帧模块501,用于对目标视频进行抽帧处理,得到各个视频图片;
第一检测模块502,用于对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;
语音识别模块503,用于对所述目标视频的语音进行语音识别处理,得到目标文本;
必读率计算模块504,用于根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;
不可读率计算模块505,用于根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;
第二检测模块506,用于检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;
确定质检不通过模块507,用于若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;
确定质检通过模块508,用于若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。
进一步地,所述目标视频由录制指定交易流程得到,所述指定交易流程包括各个交易环节,所述各个视频图片可以包括各个交易环节对应的环节视频图片;
所述第一检测模块可以包括:
质检条件获取单元,用于获取各个所述交易环节对应的预设质检条件;
环节检测单元,用于针对每个交易环节,对所述交易环节对应的环节视频图片进行人脸识别,检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件,得到所述交易环节的环节检测结果;
第一确定单元,用于若各个所述交易环节对应的环节检测结果均为是,则确定所述各个视频图片对应的第一检测结果为是;
第二确定单元,用于若各个所述交易环节对应的环节检测结果中任一环节检测结果为否,则确定所述各个视频图片对应的第一检测结果为否。
进一步地,所述环节检测单元可以包括:
人脸特征判断子单元,用于针对每张环节视频图片,判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致;
第一确定子单元,用于针对每张环节视频图片,若所述人脸特征判断子单元的判断结果为是,则确定所述环节视频图片的判断结果为是;
第二确定子单元,用于针对每张环节视频图片,若所述人脸特征判断子单元的判断结果为否,则确定所述环节视频图片的判断结果为否;
合格比例判断子单元,用于针对每个交易环节,在得到所述交易环节下各张环节视频图片对应的各个判断结果后,判断合格比例是否超过预设的比例阈值,所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比;
第三确定子单元,用于若所述合格比例判断子单元的判断结果为是,则确定所述交易环节的环节检测结果为是;
第四确定子单元,用于若所述合格比例判断子单元的判断结果为否,则确定所述交易环节的环节检测结果为否。
进一步地,所述人脸特征判断子单元可以包括:
第一判断次单元,用于判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征,得到第一判断结果;
第二判断次单元,用于判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征,得到第二判断结果;
第一确定次单元,用于若所述第一判断结果和所述第二判断结果均为是,则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致;
第二确定次单元,用于若所述第一判断结果或所述第二判断结果为否,则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。
进一步地,所述视频质检装置还可以包括:
第一标记模块,用于标记漏读环节处于所述目标视频的开始播放位置的第一时间点,所述漏读环节是指所述目标文本中漏读的必读文本所在的交易环节,标记的所述第一时间点上设置有跳转至所述目标视频且从所述第一时间点开始播放的链接;
和/或
第二标记模块,用于标记不可读环节处于所述目标视频的开始播放位置的第二时间点,所述不可读环节是指所述目标文本中出现的不可读文本所在的交易环节,标记的所述第二时间点上设置有跳转至所述目标视频且从所述第二时间点开始播放的链接;
和/或
第三标记模块,用于标记各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点,标记的所述第三时间点上设置有跳转至所述目标视频且从所述第三时间点开始播放的链接;
和/或
第四标记模块,用于标记各个所述视频图片分别处于所述目标视频的播放位置的第四时间点,标记的所述第四时间点上设置有跳转至所述目标视频上第四时间点所处播放位置的链接。
关于视频质检装置的具体限定可以参见上文中对于视频质检方法的限定,在此不再赘述。上述视频质检装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储视频质检方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频质检方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中视频质检方法的步骤,例如图2所示的步骤101至步骤109。或者,处理器执行计算机程序时实现上述实施例中视频质检装置的各模块/单元的功能,例如图6所示模块501至模块508的功能。为避免重复,这里不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中视频质检方法的步骤,例如图2所示的步骤101至步骤109。或者,计算机程序被处理器执行时实现上述实施例中视频质检装置的各模块/单元的功能,例如图6所示模块501至模块508的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种视频质检方法,其特征在于,包括:
对目标视频进行抽帧处理,得到各个视频图片;
对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;
对所述目标视频的语音进行语音识别处理,得到目标文本;
根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;
根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;
检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;
若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;
若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。
2.根据权利要求1所述的视频质检方法,其特征在于,所述目标视频由录制指定交易流程得到,所述指定交易流程包括各个交易环节,所述各个视频图片包括各个交易环节对应的环节视频图片;
所述对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果包括:
获取各个所述交易环节对应的预设质检条件;
针对每个交易环节,对所述交易环节对应的环节视频图片进行人脸识别,检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件,得到所述交易环节的环节检测结果;
若各个所述交易环节对应的环节检测结果均为是,则确定所述各个视频图片对应的第一检测结果为是;
若各个所述交易环节对应的环节检测结果中任一环节检测结果为否,则确定所述各个视频图片对应的第一检测结果为否。
3.根据权利要求2所述的视频质检方法,其特征在于,所述检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件,得到所述交易环节的环节检测结果包括:
针对每张环节视频图片,判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致;
针对每张环节视频图片,若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致,则确定所述环节视频图片的判断结果为是;
针对每张环节视频图片,若所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致,则确定所述环节视频图片的判断结果为否;
针对每个交易环节,在得到所述交易环节下各张环节视频图片对应的各个判断结果后,判断合格比例是否超过预设的比例阈值,所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比;
若合格比例超过预设的比例阈值,则确定所述交易环节的环节检测结果为是;
若合格比例不超过预设的比例阈值,则确定所述交易环节的环节检测结果为否。
4.根据权利要求3所述的视频质检方法,其特征在于,所述判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致包括:
判断所述环节视频图片中识别出的人脸特征是否包括所述投保人预留的第一人脸特征,得到第一判断结果;
判断所述环节视频图片中识别出的人脸特征是否包括所述代理人预留的第二人脸特征,得到第二判断结果;
若所述第一判断结果和所述第二判断结果均为是,则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征一致;
若所述第一判断结果或所述第二判断结果为否,则确定所述环节视频图片中指定人员的人脸特征与所述预设质检条件要求的预留人脸特征不一致。
5.根据权利要求2至4中任一项所述的视频质检方法,其特征在于,所述视频质检方法还包括:
标记漏读环节处于所述目标视频的开始播放位置的第一时间点,所述漏读环节是指所述目标文本中漏读的必读文本所在的交易环节,标记的所述第一时间点上设置有跳转至所述目标视频且从所述第一时间点开始播放的链接;
和/或
标记不可读环节处于所述目标视频的开始播放位置的第二时间点,所述不可读环节是指所述目标文本中出现的不可读文本所在的交易环节,标记的所述第二时间点上设置有跳转至所述目标视频且从所述第二时间点开始播放的链接;
和/或
标记各个所述交易环节分别处于所述目标视频的开始播放位置的第三时间点,标记的所述第三时间点上设置有跳转至所述目标视频且从所述第三时间点开始播放的链接;
和/或
标记各个所述视频图片分别处于所述目标视频的播放位置的第四时间点,标记的所述第四时间点上设置有跳转至所述目标视频上第四时间点所处播放位置的链接。
6.一种视频质检装置,其特征在于,包括:
抽帧模块,用于对目标视频进行抽帧处理,得到各个视频图片;
第一检测模块,用于对所述各个视频图片进行人脸识别,检测各个视频图片中是否包括指定人员的人脸,得到各个视频图片对应的第一检测结果;
语音识别模块,用于对所述目标视频的语音进行语音识别处理,得到目标文本;
必读率计算模块,用于根据所述目标文本和预设的必读文本计算所述必读文本的必读率,所述必读率是指所述目标文本中包含所述必读文本的内容占所述必读文本的比例;
不可读率计算模块,用于根据所述目标文本和预设的不可读读文本计算所述不可读文本的不可读率,所述不可读率是指所述目标文本中包含所述不可读文本的内容占所述不可读文本的比例;
第二检测模块,用于检测是否所述必读率高于预设第一阈值且所述不可读率低于预设第二阈值,得到第二检测结果;
确定质检不通过模块,用于若所述第一检测结果或所述第二检测结果为否,则确定所述目标视频质检不通过;
确定质检通过模块,用于若所述第一检测结果和所述第二检测结果均为是,则确定所述目标视频质检通过。
7.根据权利要求6所述的视频质检装置,其特征在于,所述目标视频由录制指定交易流程得到,所述指定交易流程包括各个交易环节,所述各个视频图片包括各个交易环节对应的环节视频图片;
所述第一检测模块包括:
质检条件获取单元,用于获取各个所述交易环节对应的预设质检条件;
环节检测单元,用于针对每个交易环节,对所述交易环节对应的环节视频图片进行人脸识别,检测所述环节视频图片中包括的指定人员的人脸特征是否满足所述预设质检条件,得到所述交易环节的环节检测结果;
第一确定单元,用于若各个所述交易环节对应的环节检测结果均为是,则确定所述各个视频图片对应的第一检测结果为是;
第二确定单元,用于若各个所述交易环节对应的环节检测结果中任一环节检测结果为否,则确定所述各个视频图片对应的第一检测结果为否。
8.根据权利要求7所述的视频质检装置,其特征在于,所述环节检测单元包括:
人脸特征判断子单元,用于针对每张环节视频图片,判断所述环节视频图片中指定人员的人脸特征是否与所述预设质检条件要求的预留人脸特征一致;
第一确定子单元,用于针对每张环节视频图片,若所述人脸特征判断子单元的判断结果为是,则确定所述环节视频图片的判断结果为是;
第二确定子单元,用于针对每张环节视频图片,若所述人脸特征判断子单元的判断结果为否,则确定所述环节视频图片的判断结果为否;
合格比例判断子单元,用于针对每个交易环节,在得到所述交易环节下各张环节视频图片对应的各个判断结果后,判断合格比例是否超过预设的比例阈值,所述合格比例是指判断结果为是的环节视频图片在所述交易环节下各张环节视频图片中的占比;
第三确定子单元,用于若所述合格比例判断子单元的判断结果为是,则确定所述交易环节的环节检测结果为是;
第四确定子单元,用于若所述合格比例判断子单元的判断结果为否,则确定所述交易环节的环节检测结果为否。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述视频质检方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述视频质检方法的步骤。
CN201811301549.9A 2018-11-02 2018-11-02 视频质检方法、装置、计算机设备及存储介质 Pending CN109472487A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201811301549.9A CN109472487A (zh) 2018-11-02 2018-11-02 视频质检方法、装置、计算机设备及存储介质
SG11202101615QA SG11202101615QA (en) 2018-11-02 2018-12-24 Video quality inspection method and apparatus, computer device, and storage medium
KR1020207036022A KR20210016551A (ko) 2018-11-02 2018-12-24 비디오 품질 검사 방법, 장치, 컴퓨터 디바이스 및 저장 매체
PCT/CN2018/123132 WO2020087713A1 (zh) 2018-11-02 2018-12-24 视频质检方法、装置、计算机设备及存储介质
JP2021508040A JP7111887B2 (ja) 2018-11-02 2018-12-24 ビデオ品質検査方法、装置、コンピュータデバイス及び記憶媒体
EP18938571.9A EP3876549A4 (en) 2018-11-02 2018-12-24 VIDEO QUALITY INSPECTION PROCESS AND APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIA

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811301549.9A CN109472487A (zh) 2018-11-02 2018-11-02 视频质检方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109472487A true CN109472487A (zh) 2019-03-15

Family

ID=65666757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811301549.9A Pending CN109472487A (zh) 2018-11-02 2018-11-02 视频质检方法、装置、计算机设备及存储介质

Country Status (6)

Country Link
EP (1) EP3876549A4 (zh)
JP (1) JP7111887B2 (zh)
KR (1) KR20210016551A (zh)
CN (1) CN109472487A (zh)
SG (1) SG11202101615QA (zh)
WO (1) WO2020087713A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111071A (zh) * 2019-04-24 2019-08-09 上海商汤智能科技有限公司 签到方法、装置、电子设备和计算机存储介质
CN110147726A (zh) * 2019-04-12 2019-08-20 财付通支付科技有限公司 业务质检方法和装置、存储介质及电子装置
CN110147926A (zh) * 2019-04-12 2019-08-20 深圳壹账通智能科技有限公司 一种业务类型的风险等级计算方法、存储介质及终端设备
CN111008925A (zh) * 2019-12-11 2020-04-14 京东数字科技控股有限公司 证件水印的验证方法、装置、设备及存储介质
WO2020087713A1 (zh) * 2018-11-02 2020-05-07 深圳壹账通智能科技有限公司 视频质检方法、装置、计算机设备及存储介质
CN111885375A (zh) * 2020-07-15 2020-11-03 中国工商银行股份有限公司 双录视频的检验方法、装置、服务器及***
CN112804587A (zh) * 2020-12-31 2021-05-14 平安科技(深圳)有限公司 基于观看人数序列的视频质检方法、装置及计算机设备
CN113128390A (zh) * 2021-04-14 2021-07-16 北京奇艺世纪科技有限公司 抽检方法、装置、电子设备及存储介质
CN115250375A (zh) * 2021-04-26 2022-10-28 北京中关村科金技术有限公司 一种基于固定话术的音视频内容合规性检测方法及装置
CN115631448A (zh) * 2022-12-19 2023-01-20 广州佰锐网络科技有限公司 一种音视频质检处理方法及***

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111741356B (zh) * 2020-08-25 2020-12-08 腾讯科技(深圳)有限公司 双录视频的质检方法、装置、设备及可读存储介质
CN113792600B (zh) * 2021-08-10 2023-07-18 武汉光庭信息技术股份有限公司 一种基于深度学习的视频抽帧方法和***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102056026A (zh) * 2009-11-06 2011-05-11 ***通信集团设计院有限公司 音视频同步检测方法及其***、语音检测方法及其***
CN105654372A (zh) * 2015-12-22 2016-06-08 深圳前海微众银行股份有限公司 远程开户的身份识别方法、服务器及***
CN106911630A (zh) * 2015-12-22 2017-06-30 上海仪电数字技术股份有限公司 终端及身份认证方法、终端和认证中心的认证方法及***
CN106934713A (zh) * 2017-02-13 2017-07-07 杭州百航信息技术有限公司 金融交易风险管控***及其存储文件快速识别定位方法
US20170201745A1 (en) * 2016-01-12 2017-07-13 Echostar Technologies L.L.C. Detection and marking of low quality video content
CN107016608A (zh) * 2017-03-30 2017-08-04 广东微模式软件股份有限公司 一种基于身份信息验证的远程开户方法及***
CN107610718A (zh) * 2017-08-29 2018-01-19 深圳市买买提乐购金融服务有限公司 一种对语音文件内容进行标记的方法及装置
CN108510213A (zh) * 2018-05-11 2018-09-07 苏州华兴源创电子科技有限公司 将任务依次分配至任务组的方法、装置、设备及介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4236502B2 (ja) 2003-04-03 2009-03-11 三菱電機株式会社 音声認識装置
JP2011215942A (ja) 2010-03-31 2011-10-27 Nec Personal Products Co Ltd ユーザ認証装置、ユーザ認証システム、ユーザ認証方法及びプログラム
US8897500B2 (en) * 2011-05-05 2014-11-25 At&T Intellectual Property I, L.P. System and method for dynamic facial features for speaker recognition
JP2015099474A (ja) 2013-11-19 2015-05-28 芳子 明石 保険渉外システム
CN105187674B (zh) * 2015-08-14 2020-02-14 上海银赛计算机科技有限公司 服务录音的合规检查方法及装置
CN106250837B (zh) * 2016-07-27 2019-06-18 腾讯科技(深圳)有限公司 一种视频的识别方法、装置和***
CN107864118B (zh) * 2017-08-14 2020-03-17 深圳壹账通智能科技有限公司 登录验证方法、***及计算机可读存储介质
CN107862258A (zh) * 2017-10-24 2018-03-30 广东小天才科技有限公司 视频中文本内容的校验方法、装置、设备及存储介质
CN108053838B (zh) * 2017-12-01 2019-10-11 深圳壹账通智能科技有限公司 结合音频分析和视频分析的欺诈识别方法、装置及存储介质
CN108124191B (zh) * 2017-12-22 2019-07-12 北京百度网讯科技有限公司 一种视频审核方法、装置及服务器
CN109472487A (zh) * 2018-11-02 2019-03-15 深圳壹账通智能科技有限公司 视频质检方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102056026A (zh) * 2009-11-06 2011-05-11 ***通信集团设计院有限公司 音视频同步检测方法及其***、语音检测方法及其***
CN105654372A (zh) * 2015-12-22 2016-06-08 深圳前海微众银行股份有限公司 远程开户的身份识别方法、服务器及***
CN106911630A (zh) * 2015-12-22 2017-06-30 上海仪电数字技术股份有限公司 终端及身份认证方法、终端和认证中心的认证方法及***
US20170201745A1 (en) * 2016-01-12 2017-07-13 Echostar Technologies L.L.C. Detection and marking of low quality video content
CN106934713A (zh) * 2017-02-13 2017-07-07 杭州百航信息技术有限公司 金融交易风险管控***及其存储文件快速识别定位方法
CN107016608A (zh) * 2017-03-30 2017-08-04 广东微模式软件股份有限公司 一种基于身份信息验证的远程开户方法及***
CN107610718A (zh) * 2017-08-29 2018-01-19 深圳市买买提乐购金融服务有限公司 一种对语音文件内容进行标记的方法及装置
CN108510213A (zh) * 2018-05-11 2018-09-07 苏州华兴源创电子科技有限公司 将任务依次分配至任务组的方法、装置、设备及介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020087713A1 (zh) * 2018-11-02 2020-05-07 深圳壹账通智能科技有限公司 视频质检方法、装置、计算机设备及存储介质
CN110147726B (zh) * 2019-04-12 2024-02-20 财付通支付科技有限公司 业务质检方法和装置、存储介质及电子装置
CN110147726A (zh) * 2019-04-12 2019-08-20 财付通支付科技有限公司 业务质检方法和装置、存储介质及电子装置
CN110147926A (zh) * 2019-04-12 2019-08-20 深圳壹账通智能科技有限公司 一种业务类型的风险等级计算方法、存储介质及终端设备
CN110111071A (zh) * 2019-04-24 2019-08-09 上海商汤智能科技有限公司 签到方法、装置、电子设备和计算机存储介质
CN111008925A (zh) * 2019-12-11 2020-04-14 京东数字科技控股有限公司 证件水印的验证方法、装置、设备及存储介质
CN111885375A (zh) * 2020-07-15 2020-11-03 中国工商银行股份有限公司 双录视频的检验方法、装置、服务器及***
CN112804587A (zh) * 2020-12-31 2021-05-14 平安科技(深圳)有限公司 基于观看人数序列的视频质检方法、装置及计算机设备
CN112804587B (zh) * 2020-12-31 2022-10-14 平安科技(深圳)有限公司 基于观看人数序列的视频质检方法、装置及计算机设备
CN113128390A (zh) * 2021-04-14 2021-07-16 北京奇艺世纪科技有限公司 抽检方法、装置、电子设备及存储介质
CN115250375A (zh) * 2021-04-26 2022-10-28 北京中关村科金技术有限公司 一种基于固定话术的音视频内容合规性检测方法及装置
CN115250375B (zh) * 2021-04-26 2024-01-26 北京中关村科金技术有限公司 一种基于固定话术的音视频内容合规性检测方法及装置
CN115631448A (zh) * 2022-12-19 2023-01-20 广州佰锐网络科技有限公司 一种音视频质检处理方法及***

Also Published As

Publication number Publication date
JP2021520014A (ja) 2021-08-12
WO2020087713A1 (zh) 2020-05-07
KR20210016551A (ko) 2021-02-16
EP3876549A4 (en) 2021-11-17
SG11202101615QA (en) 2021-03-30
JP7111887B2 (ja) 2022-08-02
EP3876549A1 (en) 2021-09-08

Similar Documents

Publication Publication Date Title
CN109472487A (zh) 视频质检方法、装置、计算机设备及存储介质
US9792655B2 (en) Automated assessment
CN110489520A (zh) 基于知识图谱的事件处理方法、装置、设备和存储介质
CN109543925B (zh) 基于机器学习的风险预测方法、装置、计算机设备和存储介质
Tully et al. Quality standards for digital forensics: Learning from experience in England & Wales
Harb The economic impact of the Internet penetration rate and telecom investments in Arab and Middle Eastern countries
CN109102394A (zh) 风险评估方法、装置及计算机可读存储介质
CN109509087A (zh) 智能化的贷款审核方法、装置、设备及介质
CN110175609B (zh) 界面元素检测方法、装置及设备
CN109901968A (zh) 一种自动化页面数据校验方法和装置
CN109299094A (zh) 数据表处理方法、装置、计算机设备和存储介质
CN112017056A (zh) 一种智能双录方法及***
CN111160783B (zh) 数字资产价值的评价方法、***及电子设备
US20140154657A1 (en) System and method for assessing a user's engagement with digital resources
CN109583682A (zh) 企业财务造假风险的识别方法、装置以及计算机设备
CN109543073A (zh) 企业供销关系图谱生成方法、装置和计算机设备
CN109767226A (zh) 基于大数据的可疑交易统计视图生成方法和装置
US20220327452A1 (en) Method for automatically updating unit cost of inspection by using comparison between inspection time and work time of crowdsourcing-based project for generating artificial intelligence training data
Raman Operational risk management in Indian banks in the context of Basel II: A survey of the state of preparedness and challenges in developing the framework
CN113572900A (zh) 外呼测试方法、装置、计算机设备和计算机可读存储介质
CN113807066A (zh) 一种图表生成方法、装置及电子设备
CN110796178B (zh) 决策模型训练方法及样本特征选择方法、装置和电子设备
CN115760458A (zh) 资金支付的处理方法和装置、处理器及电子设备
CN116932360A (zh) 一种页面测试方法、装置、计算机设备和存储介质
CN113645357B (zh) 通话质检方法、装置、计算机设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination