CN115412765A - 视频精彩片段确定方法、装置、电子设备及存储介质 - Google Patents

视频精彩片段确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115412765A
CN115412765A CN202211054859.1A CN202211054859A CN115412765A CN 115412765 A CN115412765 A CN 115412765A CN 202211054859 A CN202211054859 A CN 202211054859A CN 115412765 A CN115412765 A CN 115412765A
Authority
CN
China
Prior art keywords
segment
video
clip
highlight
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211054859.1A
Other languages
English (en)
Other versions
CN115412765B (zh
Inventor
侯佳芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202211054859.1A priority Critical patent/CN115412765B/zh
Publication of CN115412765A publication Critical patent/CN115412765A/zh
Application granted granted Critical
Publication of CN115412765B publication Critical patent/CN115412765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请实施例提供了一种视频精彩片段确定方法、装置、电子设备及存储介质,一种视频精彩片段确定方法包括:获得目标视频的第一备选片段和第二备选片段,第一备选片段是具有设定的动作标签的视频片段,第二备选片段是精彩度满足精彩度条件的视频片段;基于第一备选片段和第二备选片段,确定目标视频的精彩片段。应用本申请实施例所提供的技术方案,基于第一备选片段和第二备选片段确定出的精彩片段融合了设定的动作标签和精彩度的特征,使得确定出的精彩片段更准确,有助于帮助用户定位感兴趣的视频。

Description

视频精彩片段确定方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机应用技术领域,特别是涉及一种视频精彩片段确定方法、装置、电子设备及存储介质。
背景技术
如今,观看视频逐渐成为人们休闲娱乐的一种方式。视频供应者多会在视频中提取出精彩片段,用于进行视频分发或者信息分发,使得用户通过精彩片段可以了解到相应视频的精彩部分。
那么,如何准确确定视频中的精彩片段,帮助用户定位感兴趣的视频,是本领域技术人员急需解决的技术问题。
发明内容
本申请实施例的目的在于提供一种视频精彩片段确定方法、装置、电子设备及存储介质,以准确确定视频中的精彩片段,有助于帮助用户定位感兴趣的视频。具体技术方案如下:
第一方面,提供一种视频精彩片段确定方法,包括:
获得目标视频的第一备选片段和第二备选片段,所述第一备选片段是具有设定的动作标签的视频片段,所述第二备选片段是精彩度满足精彩度条件的视频片段;
基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段。
在本申请的一种具体实施方式中,所述基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段,包括:
确定所述第一备选片段和所述第二备选片段在所述目标视频的时间轴上是否存在重合部分;
如果存在重合部分,则根据在所述时间轴上存在重合部分的所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段。
在本申请的一种具体实施方式中,所述根据在所述时间轴上存在重合部分的所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段,包括:
分别将在所述时间轴上存在重合部分的所述第二备选片段和对应的所述第一备选片段作为一个片段对;
根据每个所述片段对中所述第二备选片段和所述第一备选片段在所述时间轴上的时间,确定所述目标视频的精彩片段。
在本申请的一种具体实施方式中,所述根据每个所述片段对中所述第二备选片段和所述第一备选片段在所述时间轴上的时间,确定所述目标视频的精彩片段,包括:
针对每个所述片段对,如果当前片段对中所述第一备选片段在所述时间轴上的起始时间在所述当前片段对中所述第二备选片段在所述时间轴上的起始时间之前,则获取所述目标视频中的第一待用片段,所述第一待用片段的起始时间为所述当前片段对中所述第二备选片段在所述时间轴上的起始时间,所述第一待用片段的时长为第一时长;
确定所述第一待用片段是否具有所述动作标签;
将具有所述动作标签的所述第一待用片段所对应的所述片段对确定为待用片段对;
针对每个所述待用片段对,如果当前待用片段对中所述第二备选片段的精彩度高于第一精彩度阈值,或者所述当前待用片段对中所述第二备选片段的精彩度为最高的前N1个精彩度之一,则将所述当前片段对中所述第二备选片段确定为所述目标视频的精彩片段,N1为正整数。
在本申请的一种具体实施方式中,所述根据每个所述片段对中所述第二备选片段和所述第一备选片段在所述时间轴上的时间,确定所述目标视频的精彩片段,包括:
针对每个所述片段对,如果当前片段对中所述第一备选片段在所述时间轴上的起始时间在所述当前片段对中所述第二备选片段在所述时间轴上的起始时间之后,则获取所述目标视频中的第二待用片段,所述第二待用片段的起始时间为所述当前片段对中所述第一备选片段在所述时间轴上的起始时间,所述第二待用片段的终止时间为所述当前片段对中所述第二备选片段在所述时间轴上的终止时间;
如果所述当前片段对中所述第二备选片段的精彩度高于第二精彩度阈值,或者所述当前片段对中所述第二备选片段的精彩度为最高的前N2个精彩度之一,则将所述第二待用片段确定为所述目标视频的精彩片段,N2为正整数。
在本申请的一种具体实施方式中,在确定所述第一备选片段和所述第二备选片段在所述时间轴上不存在重合部分的情况下,还包括:
确定每个所述第一备选片段具有所述动作标签的概率,将概率大于概率阈值的所述第一备选片段确定为所述目标视频的精彩片段,或者将最高的前N3个概率对应的所述第一备选片段确定为所述目标视频的精彩片段,N3为正整数;
或者,
将精彩度高于第三精彩度阈值的所述第二备选片段确定为所述目标视频的精彩片段,或者将最高的前N4个精彩度对应的所述第二备选片段确定为所述目标视频的精彩片段,N4为正整数。
在本申请的一种具体实施方式中,在所述基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段之前,还包括:
确定每个所述第二备选片段的动态率,所述动态率用于表征视频帧间图像变化差异情况;
剔除动态率小于所述目标视频的平均动态率的所述第二备选片段。
在本申请的一种具体实施方式中,在所述确定所述目标视频的精彩片段之后,还包括:
检测所述精彩片段的前第二时长内是否存在目标对象;
如果不存在所述目标对象,则从所述精彩片段在所述目标视频的时间轴上的起始时间开始向后查找存在所述目标对象的时间;
将所述精彩片段的起始时间更新为所述存在所述目标对象的时间。
在本申请的一种具体实施方式中,在所述确定所述目标视频的精彩片段之后,还包括:
确定所述精彩片段的时长是否满足第一时长要求;
如果所述精彩片段的时长不满足所述第一时长要求,则基于所述第一时长要求对所述精彩片段进行截取操作或者补充操作。
在本申请的一种具体实施方式中,所述第一备选片段包括所述目标视频的第一视频片段集合中的一个或多个第一视频片段,所述第一视频片段集合是通过以下步骤获得的:
将所述目标视频按照镜头进行切分,获得多个镜头片段;
根据第二时长要求,对所述镜头片段进行合并,得到所述第一视频片段集合,所述第一视频片段集合中每个所述第一视频片段的时长满足所述第二时长要求。
在本申请的一种具体实施方式中,所述第二备选片段包括所述目标视频的第二视频片段集合中的一个或多个第二视频片段,所述第二视频片段集合中每个所述第二视频片段的精彩度是通过以下步骤确定的:
针对所述第二视频片段集合中每个所述第二视频片段,将当前第二视频片段输入到预先训练获得的分类模型中,得到所述分类模型输出的所述当前第二视频片段为精彩正例的概率;
根据所述当前第二视频片段为精彩正例的概率,确定所述当前第二视频片段的精彩度。
在本申请的一种具体实施方式中,通过以下步骤预先训练获得所述分类模型:
获得训练样本集,所述训练样本集包括多个样本对,每个所述样本对包括一个精彩正例和一个负例;
利用所述训练样本集对预先构建的初始模型进行训练,直至达到设定的训练终止条件时终止训练,获得所述分类模型;
其中,所述利用所述训练样本集对预先构建的初始模型进行训练,包括:
针对每个所述样本对,将当前样本对输入到预先构建的初始模型中;
根据所述当前样本对和所述初始模型输出的所述当前样本对的输出结果,确定模型损失;
根据所述模型损失调整所述初始模型的参数。
在本申请的一种具体实施方式中,还包括:
获得所述目标视频的第二观看数据;
所述根据所述当前第二视频片段为精彩正例的概率,确定所述当前第二视频片段的精彩度,包括:
根据所述第二观看数据和所述当前第二视频片段为精彩正例的概率,确定所述当前第二视频片段的精彩度。
第二方面,提供一种视频精彩片段确定装置,包括:
获得模块,用于获得目标视频的第一备选片段和第二备选片段,所述第一备选片段是具有设定的动作标签的视频片段,所述第二备选片段是精彩度满足精彩度条件的视频片段;
确定模块,用于基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段。
第三方面,提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面所述的视频精彩片段确定方法的步骤。
第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现第一方面所述的视频精彩片段确定方法的步骤。
第五方面,提供一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,且适于由处理器读取并执行,以使得具有所述处理器的电子设备执行第一方面所述的视频精彩片段确定方法的步骤。
应用本申请实施例所提供的技术方案,获得目标视频的第一备选片段和第二备选片段后,基于第一备选片段和第二备选片段,确定目标视频的精彩片段。第一备选片段是具有设定的动作标签的视频片段,第二备选片段是根据精彩度确定的,使得基于第一备选片段和第二备选片段确定出的精彩片段融合了设定的动作标签和精彩度的特征,使得确定出的精彩片段更准确,进而将确定出的精彩片段进行视频分发或信息投放,可以帮助用户定位感兴趣的视频,提高视频的用户点击率,提高用户对目标视频的观看概率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本申请实施例中视频精彩片段确定方法的一种实施流程图;
图2为本申请实施例中视频精彩片段确定方法的另一种实施流程示意图;
图3为本申请实施例中一种视频精彩片段确定装置的结构示意图;
图4为本申请实施例中一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请的核心是提供一种视频精彩片段确定方法,该方法可以应用于视频推荐分发、信息投放等场景中。比如,要将目标视频推荐给用户时,可以先基于本申请实施例所提供的技术方案准确确定出目标视频的精彩片段,然后将精彩片段用于视频分发,使得用户通过精彩片段可以了解到目标视频的精彩部分,可以帮助用户定位感兴趣的视频,提高视频的用户点击率和用户对视频的观看概率。
本申请实施例所提供的技术方案尤其适用于对动漫、儿童类型视频进行精彩片段的确定,因为动漫、儿童类型视频相比于影视、综艺、生活拍摄类型的视频,在画面、拍摄风格、题材等方面存在较大区别,在确定出的精彩片段中融合了设定的动作标签和精彩度的特征,可以提高精彩片段确定准确性。
参见图1所示,为本申请实施例所提供的一种视频精彩片段确定方法的实施流程图,该方法可以包括以下步骤:
S110:获得目标视频的第一备选片段和第二备选片段,第一备选片段是具有设定的动作标签的视频片段,第二备选片段是精彩度满足预设的精彩度条件的视频片段。
在本申请实施例中,目标视频可以是任意一个视频,如待推荐分发的任意一个视频。确定目标视频后,可以获得目标视频的第一备选片段和第二备选片段。具体的,可以将目标视频中具有设定的动作标签的视频片段作为第一备选片段,将目标视频中精彩度满足精彩度条件的视频片段作为第二备选片段。精彩度条件可以是预设的一个条件,如在某一视频片段的精彩度高于一个精彩度阈值时,可以认为该视频片段的精彩度满足精彩度条件,或者某一视频片段的精彩度位于前N个最高精彩度内,可以认为该视频片段的精彩度满足精彩度条件。即第二备选片段具有较高的精彩度。
在一种具体实施方式中,可以对目标视频进行切分,获得目标视频的第一视频片段集合和第二视频片段集合。
第一视频片段集合和第二视频片段集合可以通过相同切分方式得到,还可以通过不同切分方式得到。比如,通过镜头切分方式得到第一视频片段集合,通过滑窗切分方式得到第二视频片段集合。第一视频片段集合中包括至少一个第一视频片段,第二视频片段集合中包括至少一个第二视频片段。
对于第一备选片段,可以根据第一视频片段集合中具有设定的动作标签的第一视频片段进行确定。
在本申请实施例中设定的动作标签可以包括特效、拥抱、吃喝、奔跑、牵手、跳舞、鼓掌、情绪激动等多种类型的标签,以适应于多种题材的视频。情绪激动如大哭、大笑、惊讶等。
可以先确定第一视频片段集合中每个第一视频片段是否具有设定的动作标签。具体的,可以通过预先训练得到的基于时空上自注意力的Timesformer模型得到每个第一视频片段具有每种类型的动作标签的概率,根据该概率可以识别每个第一视频片段具有的动作标签。针对每个第一视频片段,可以将概率最高的动作标签确定为该第一视频片段具有的动作标签。比如,第一视频片段集合中第一视频片段A具有牵手类型的动作标签,第一视频片段B具有奔跑类型的动作标签。第一视频片段集合中不同第一视频片段具有的动作标签的类型可以相同或不同,有的第一视频片段具有设定的动作标签,有的第一视频片段不具有设定的动作标签。
根据第一视频片段集合中具有设定的动作标签的第一视频片段,可以确定第一备选片段。可以分别将每个具有设定的动作标签的第一视频片段确定为一个第一备选片段,还可以在具有设定的动作标签的不同的第一视频片段连续的情况下,先对具有设定的动作标签的连续的第一视频片段进行合并,再将合并后的视频片段确定为一个第一备选片段。
对于第二备选片段,可以根据第二视频片段集合中每个第二视频片段的精彩度进行确定。
可以先确定第二视频片段集合中每个第二视频片段的精彩度。具体的,可以根据用户观看行为、预设的精彩度打分算法等方式确定第二视频片段集合中每个第二视频片段的精彩度。
根据第二视频片段集合中每个第二视频片段的精彩度,可以确定第二备选片段。具体的,可以将高于设定的精彩度阈值的第二视频片段,确定为第二备选片段,或者,可以将精彩度从高到低排序在前N个的第二视频片段,确定为第二备选片段。可以分别将每个符合精彩度条件的第二视频片段确定为一个第二备选片段,还可以在符合精彩度条件的第二视频片段中存在连续片段的情况下,先对连续的第二视频片段进行合并,再将合并后的视频片段确定为一个第二备选片段。
精彩度阈值可以根据实际情况进行设定和调整,如设定为所有第二视频片段的精彩度的平均值或者中位数。
S120:基于第一备选片段和第二备选片段,确定目标视频的精彩片段。
获得目标视频的第一备选片段和第二备选片段后,可以基于第一备选片段和第二备选片段,确定目标视频的精彩片段。因为第一备选片段是具有设定的动作标签的视频片段,第二备选片段是精彩度满足精彩度条件的视频片段,即具有较高精彩度的视频片段,所以使得确定出的精彩片段融合了动作标签和精彩度的特征,提高确定准确性。
应用本申请实施例所提供的方法,获得目标视频的第一备选片段和第二备选片段后,基于第一备选片段和第二备选片段,确定目标视频的精彩片段。第一备选片段是具有设定的动作标签的视频片段,第二备选片段是根据精彩度确定的,使得基于第一备选片段和第二备选片段确定出的精彩片段结合了设定的动作标签和精彩度的特征,使得确定出的精彩片段更准确,进而将确定出的精彩片段用于视频分发或信息投放,可以帮助用户定位感兴趣的视频,提高视频的用户点击率,提高用户对视频的观看概率。
在本申请的一个实施例中,基于第一备选片段和第二备选片段,确定目标视频的精彩片段,可以包括以下步骤:
步骤一:确定第一备选片段和第二备选片段在目标视频的时间轴上是否存在重合部分,如果存在重合部分,则执行步骤二;
步骤二:根据在时间轴上存在重合部分的第一备选片段和第二备选片段,确定目标视频的精彩片段。
为方便描述,将上述两个步骤结合起来进行说明。
在本申请实施例中,获得目标视频的第一备选片段和第二备选片段后,可以确定第一备选片段和第二备选片段在目标视频的时间轴上是否存在重合部分,即第一备选片段和第二备选片段之间是否存在重合时间。比如,某个第二备选片段在目标视频的时间轴上的时间为2分5秒至2分10秒,某个第一备选片段在目标视频的时间轴上的时间为1分50秒至2分8秒,那么可以确定该第二备选片段和第一备选片段在目标视频的时间轴上存在重合部分,即在目标视频的时间轴的2分5秒至2分8秒这个时间重合。
如果第一备选片段和第二备选片段在时间轴上存在重合部分,则可以根据在时间轴上存在重合部分的第一备选片段和第二备选片段,确定目标视频的精彩片段,以进一步保证确定出的精彩片段能够融合动作标签和精彩度的特征,提高精彩片段确定准确性。
在本申请的一个实施例中,根据在时间轴上存在重合部分的第一备选片段和第二备选片段,确定目标视频的精彩片段,可以包括以下步骤:
第一个步骤:分别将在时间轴上存在重合部分的第二备选片段和对应的第一备选片段作为一个片段对;
第二个步骤:根据每个片段对中第二备选片段和第一备选片段在时间轴上的时间,确定目标视频的精彩片段。
为方便描述,将上述两个步骤结合起来进行说明。
在本申请实施例中,在确定第一备选片段和第二备选片段在时间轴上存在重合部分的情况下,可分别将在时间轴上存在重合部分的第二备选片段和对应的第一备选片段作为一个片段对。如果一个第二备选片段与一个第一备选片段在时间轴上存在重合部分,则该第二备选片段和该第一备选片段为一个片段对。如果一个第二备选片段与多个第一备选片段在时间轴上均存在重合部分,则该第二备选片段分别与该多个第一备选片段中的每个第一备选片段为一个片段对。
根据每个片段对中第二备选片段和第一备选片段在时间轴上的时间,确定目标视频的精彩片段。使得确定出的精彩片段能够包含在时间轴上存在重合部分的第二备选片段和第一备选片段中的部分或者全部时间,融合动作标签和精彩度的特征,提高精彩片段确定准确性。
在本申请的一个实施例中,根据每个片段对中第二备选片段和第一备选片段在时间轴上的时间,确定目标视频的精彩片段,可以包括以下步骤:
步骤一:针对每个片段对,如果当前片段对中第一备选片段在时间轴上的起始时间在当前片段对中第二备选片段在时间轴上的起始时间之前,则获取目标视频中的第一待用片段,第一待用片段的起始时间为当前片段对中第二备选片段的起始时间,第一待用片段的时长为第一时长;
步骤二:确定第一待用片段是否具有动作标签;
步骤三:将具有动作标签的第一待用片段所对应的片段对确定为待用片段对;
步骤四:针对每个待用片段对,如果当前待用片段对中第二备选片段的精彩度高于第一精彩度阈值,或者当前待用片段对中第二备选片段的精彩度为最高的前N1个精彩度之一,则将当前片段对中第二备选片段确定为目标视频的精彩片段,N1为正整数。
为方便描述,将上述四个步骤结合起来进行说明。
在本申请实施例中,分别将在时间轴上存在重合部分的第二备选片段和对应的第一备选片段作为一个片段对,可以得到多个片段对,每个片段对均包括一个第一备选片段和一个第二备选片段。
针对每个片段对,可以确定当前片段对中第一备选片段在时间轴上的起始时间是否在当前片段对中第二备选片段在时间轴上的起始时间之前。当前片段对是指当前操作所针对的片段对。
如果当前片段对中第一备选片段在时间轴上的起始时间在当前片段对中第二备选片段在时间轴上的起始时间之前,则可以认为当前片段对中第一备选片段有部分时间的精彩度不够高,可以以当前片段对中第二备选片段在时间轴上的起始时间为起点,获取目标视频中的第一时长的第一待用片段。即第一待用片段的起始时间即为当前片段对中第二备选片段在时间轴上的起始时间,去除了当前片段对中第一备选片段的部分时间。第一时长可以预先设定,比如5秒。因为当前片段对中第一备选片段和第二备选片段在时间轴上存在重合部分,所以,如果该第一备选片段在时间轴上的起始时间在该第二备选片段在时间轴上的起始时间之前,则该第一备选片段在时间轴上的终止时间可以在该第二备选片段在时间轴上的终止时间之前或之后,且在该第二备选片段在时间轴上的起始时间之后。
获取到第一待用片段后,可以确定第一待用片段是否具有设定的动作标签。如果第一待用片段具有设定的动作标签,则可以认为第一待用片段仍符合精彩片段的确定要求。如果第一待用片段不具有设定的动作标签,则可以认为第一待用片段不符合精彩片段的确定要求,可以忽略该第一待用片段。
可以将具有动作标签的第一待用片段所对应的片段对确定为待用片段对。
针对每个待用片段对,可以确定当前待用片段对中第二备选片段的精彩度是否高于第一精彩度阈值,或者当前待用片段对中第二备选片段的精彩度是否为最高的前N1个精彩度之一。如果当前待用片段对中第二备选片段的精彩度高于第一精彩度阈值,或者当前待用片段对中第二备选片段的精彩度为最高的前N1个精彩度之一,则可以认为当前待用片段对中第二备选片段的精彩度较高,而且当前待用片段对是与具有动作标签的第一待用片段所对应的片段对,当前待用片段对中第二备选片段具有动作标签,可以将当前片段对中第二备选片段确定为目标视频的精彩片段。进一步保证确定出的精彩片段具有动作标签,且精彩度较高。第一精彩度阈值和N1可以根据实际情况进行设定和调整。
当前待用片段对是指当前操作所针对的待用片段对。
在本申请的一个实施例中,根据每个片段对中第二备选片段和第一备选片段在时间轴上的时间,确定目标视频的精彩片段,可以包括以下步骤:
第一个步骤:针对每个片段对,如果当前片段对中第一备选片段在时间轴上的起始时间在当前片段对中第二备选片段在时间轴上的起始时间之后,则获取目标视频中的第二待用片段,第二待用片段的起始时间为当前片段对中第一备选片段在时间轴上的起始时间,第二待用片段的终止时间为当前片段对中第二备选片段在时间轴上的终止时间;
第二个步骤:如果当前片段对中第二备选片段的精彩度高于第二精彩度阈值,或者当前片段对中第二备选片段的精彩度为最高的前N2个精彩度之一,则将第二待用片段确定为目标视频的精彩片段,N2为正整数。
为方便描述,将上述两个步骤结合起来进行说明。
在本申请实施例中,分别将在时间轴上存在重合部分的第二备选片段和对应的第一备选片段作为一个片段对,可以得到多个片段对,每个片段对均包括一个第一备选片段和一个第二备选片段。
针对每个片段对,可以确定当前片段对中第一备选片段在时间轴上的起始时间是否在当前片段对中第二备选片段在时间轴上的起始时间之后。如果当前片段对中第一备选片段在时间轴上的起始时间在当前片段对中第二备选片段在时间轴上的起始时间之后,则可以认为当前片段对中第二备选片段在时间轴上的起始时间至当前片段对中第一备选片段在时间轴上的起始时间这段时间的视频片段不具有动作标签,可以将当前片段对中第一备选片段在时间轴上的起始时间为起点,以当前片段对中第二备选片段在时间轴上的终止时间为终点,获取目标视频的第二待用片段。这样可以保证第二待用片段具有动作标签。当前片段对是指当前操作所针对的片段对。因为当前片段对中第一备选片段和第二备选片段在时间轴上存在重合部分,所以如果该第一备选片段在时间轴上的起始时间在第二备选片段在时间轴上的起始时间之后,则该第一备选片段在时间轴上的起始时间必然在第二备选片段在时间轴上的终止时间之前,该第一备选片段在时间轴上的终止时间可以在第二备选片段在时间轴上的终止时间之前或之后。
可以将当前片段对中第二备选片段的精彩度与其他片段对中第二备选片段的精彩度相比,如果当前片段对中第二备选片段的精彩度高于第二精彩度阈值,或者当前片段对中第二备选片段的精彩度为最高的前N2个精彩度之一,则可以将第二待用片段确定为目标视频的精彩片段。进一步保证确定出的精彩片段具有动作标签,且精彩度较高。
第二精彩度阈值和N2可以根据实际情况进行设定和调整。第一精彩度阈值与第二精彩度阈值可以相同或不同,N1和N2可以相同或不同。
在本申请的一个实施例中,在确定第一备选片段和第二备选片段在时间轴上不存在重合部分的情况下,该方法还可以包括以下步骤:
确定每个第一备选片段具有动作标签的概率,将概率大于概率阈值的第一备选片段确定为目标视频的精彩片段,或者将最高的前N3个概率对应的第一备选片段确定为目标视频的精彩片段,N3为正整数;
或者,
将精彩度高于第三精彩度阈值的第二备选片段确定为目标视频的精彩片段,或者将最高的前N4个精彩度对应的第二备选片段确定为目标视频的精彩片段,N4为正整数。
在本申请实施例中,获得目标视频的第一备选片段和第二备选片段后,确定第一备选片段和第二备选片段在时间轴上是否存在重合部分。如果在时间轴上不存在重合部分,则可以通过动作标签或者精彩度确定目标视频的精彩片段。
具体的,可以确定每个第一备选片段具有动作标签的概率,将概率大于概率阈值的第一备选片段确定为目标视频的精彩片段,或者将最高的前N3个概率对应的第一备选片段确定为目标视频的精彩片段。在对每个第一备选片段是否具有动作标签的判定时,可以得到每个第一备选片段判断具有动作标签的概率。针对每个第一备选片段而言,该第一备选片段具有动作标签的概率越高,可以认为该第一备选片段中的动作越明显。可以将概率较高的第一备选片段确定为目标视频的精彩片段,使得确定出的精彩片段具有较丰富的动作。
还可以将精彩度高于第三精彩度阈值的第二备选片段确定为目标视频的精彩片段,或者将最高的前N4个精彩度对应的第二备选片段确定为目标视频的精彩片段,使得确定出的精彩片段是精彩度较高的,也就更容易吸引用户。
在本申请的一个实施例中,在基于第一备选片段和第二备选片段,确定目标视频的精彩片段之前,该方法还可以包括以下步骤:
步骤一:确定每个第二备选片段的动态率,动态率用于表征视频帧间图像变化差异情况;
步骤二:剔除动态率小于目标视频的平均动态率的第二备选片段。
为方便描述,将上述两个步骤结合起来进行说明。
在本申请的一个实施例中,在获得第二备选片段之后,可以确定每个第二备选片段的动态率。动态率用于表征视频帧间图像变化差异情况。具体的,可以通过视频帧间图像差值确定。同时或在此之前或在此之后可以确定目标视频的平均动态率。目标视频的平均动态率可以是目标视频的所有第二备选片段的动态率的平均值。
判断每个第二备选片段的动态率与目标视频的平均动态率的大小关系。针对每个第二备选片段而言,如果该第二备选片段的动态率高于目标视频的平均动态率,则可以认为该第二备选片段帧间图像变化差异较大,更容易提高用户的兴趣,如果该第二备选片段的动态率小于或等于目标视频的平均动态率,则可以认为该第二备选片段帧间图像变化差异较小,可能不容易提高用户的兴趣。
可以剔除动态率小于目标视频的平均动态率的第二备选片段,然后再基于第一备选片段和第二备选片段,确定目标视频的精彩片段。使得确定出的精彩片段的动态率较高。
在本申请的一个实施例中,在确定目标视频的精彩片段之后,该方法还可以包括以下步骤:
第一个步骤:检测精彩片段的前第二时长内是否存在目标对象,如果不存在目标对象,则执行第二个步骤;
第二个步骤:从精彩片段在目标视频的时间轴上的起始时间开始向后查找存在目标对象的时间;
第三个步骤:将精彩片段的起始时间更新为存在目标对象的时间。
为方便描述,将上述三个步骤结合起来进行说明。
在本申请实施例中,在确定目标视频的精彩片段之后,可以检测精彩片段的前第二时长内是否存在目标对象。目标对象可以是目标视频中的主要角色和/或次要角色。可以根据识人索引算法进行检测,如检测是否存在动漫角色等。第二时长可以根据实际情况进行设定和调整,如5秒。
可以理解的是,用户在观看视频时,视频中的角色等目标对象更容易引起用户的兴趣。如果精彩片段的前第二时长内存在目标对象,则可以不再进行后续处理。如果精彩片段的前第二时长内不存在目标对象,则可以从精彩片段在目标视频的时间轴上的起始时间开始向后查找存在目标对象的时间,然后将精彩片段的起始时间更新为最近查找到的存在目标对象的时间点。这样可以使得调整后的精彩片段开始阶段即有目标对象出现,进一步提高用户的观看概率。
在本申请的一个实施例中,在确定目标视频的精彩片段之后,该方法还可以包括以下步骤:
步骤一:确定精彩片段的时长是否满足第一时长要求;
步骤二:如果精彩片段的时长不满足第一时长要求,则基于第一时长要求对精彩片段进行截取操作或者补充操作。
为方便描述,将上述三个步骤结合起来进行说明。
在本申请实施例中,可以对精彩片段的时长进行限定,因为如果精彩片段的时长太短,为用户呈现的精彩内容太少,无法有效提高用户观看目标视频的兴趣,如果精彩片段的时长太长,为用户呈现的精彩内容太多,容易降低用户观看目标视频的概率。
所以,在本申请实施例中,在确定目标视频的精彩片段之后,还可以确定精彩片段的时长是否满足第一时长要求。第一时长要求可以预先设定,如要求时长在30秒至2分钟范围内。
如果精彩片段的时长不满足第一时长要求,如大于第一时长要求的最大值,则可以对精彩片段进行截取操作,使得截取的精彩片段的时长小于或等于第一时长要求的最大值,满足第一时长要求。如可以以精彩片段在时间轴上的起始时间为起点,在目标视频中向后截取1分钟,将截取到的视频片段作为精彩片段。如果精彩片段的时长小于第一时长要求的最小值,则可以对精彩片段进行补充操作,使得补充后的精彩片段的时长大于或等于第一时长要求的最小值,满足第一时长要求。如可以从精彩片段在时间轴上的终止时间开始在目标视频中向后截取一段视频片段补充到精彩片段中,将补充后的视频片段作为精彩片段。
根据精彩片段的时长与第一时长要求,对精彩片段进行调整,使得精彩片段的时长不会太长也不会太短,可以有效提高用户观看目标视频的概率。
在本申请的一个实施例中,第一备选片段包括目标视频的第一视频片段集合中的一个或多个第一视频片段,第一视频片段集合可以是通过以下步骤获得的:
第一个步骤:将目标视频按照镜头进行切分,获得多个镜头片段;
第二个步骤:根据第二时长要求,对镜头片段进行合并,得到第一视频片段集合,第一视频片段集合中每个第一视频片段的时长满足第二时长要求。
为方便描述,将上述两个步骤结合起来进行说明。
在本申请实施例中,可以将目标视频按照镜头进行切分,获得多个镜头片段。具体可以使用图像相似度、直方图统计、画面变化分割(kernel temporal segmentation,KTS)等算法进行切分。
但是由于在镜头快速切换时往往存在动作不连续,难以判断动作标签的问题,所以本申请实施例获得多个镜头片段后,可以根据第二时长要求,对镜头片段进行合并,得到第一视频片段集合。例如,第二时长要求为要求时长为5秒至6秒,如果获得的多个镜头片段的时长为[1s,3s,2s,5.1s,4s,1s],那么合并后可以得到[6s,5.1s,5s]的第一视频片段集合。
第一视频片段集合中每个第一视频片段的时长满足第二时长要求。这样有助于进行动作标签的确定。
在本申请的一个实施例中,第二备选片段包括目标视频的第二视频片段集合中的一个或多个第二视频片段,第二视频片段集合中每个第二视频片段的精彩度可以是通过以下步骤确定的:
步骤一:获得目标视频的第一观看数据;
步骤二:根据第一观看数据,确定第二视频片段集合中每个第二视频片段的精彩度。
为方便描述,将上述三个步骤结合起来进行说明。
在本申请实施例中,对于目标视频,如果存在较多的用户观看行为,如存在播放、暂停、回放、快进以及发送弹幕等观看行为,则可以通过观看数据确定每个第二视频片段的精彩度。
可以先获得目标视频的第一观看数据,第一观看数据是包括上述观看行为的数据。根据第一观看数据,可以确定第二视频片段集合中每个第二视频片段的精彩度。
具体的,可以根据第一观看数据,确定第二视频片段集合中每个第二视频片段的观看人次,根据每个第二视频片段的观看人次可以确定每个第二视频片段的精彩度。如可以按照预设的观看人次和精彩度的对应关系,确定精彩度。
根据观看数据可以快速确定出每个第二视频片段的精彩度。
进而,根据第二视频片段集合中每个第二视频片段的精彩度,确定第二备选片段时,精彩度阈值可以根据观看人次进行设定。比如将第二视频片段集合中第二视频片段的观看人次平均值对应的精彩度确定为精彩度阈值,这样确定出的第二备选片段即为第二视频片段集合中观看人次大于观看人次平均值的第二视频片段,或者将第二视频片段集合中第二视频片段的观看人次中位数对应的精彩度确定为精彩度阈值,这样确定出的第二备选片段即为第二视频片段集合中观看人次大于观看人次中位数的第二视频片段。
在本申请的一个实施例中,第二视频片段集合中的第二视频片段不包括片头和片尾处的视频片段。
可以理解的是,一般情况下,一个视频的片头和片尾被观看的频次较高,但将片头或片尾作为精彩片段意义不大。所以,在根据第一观看数据,确定第二视频片段集合中每个第二视频片段的精彩度之前,可以在第二视频片段集合中去除片头和片尾处的第二视频片段,即第二视频片段集合中的第二视频片段不包括片头和片尾处的视频片段。这样可以有效避免最后确定的精彩片段是目标视频的片头或片尾,提高精彩片段确定准确性。
在本申请的一个实施例中,第二备选片段包括目标视频的第二视频片段集合中的一个或多个第二视频片段,第二视频片段集合中每个第二视频片段的精彩度可以是通过以下步骤确定的:
第一个步骤:针对第二视频片段集合中每个第二视频片段,将当前第二视频片段输入到预先训练获得的分类模型中,得到分类模型输出的当前第二视频片段为精彩正例的概率;
第二个步骤:根据当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度。
为方便描述,将上述两个步骤结合起来进行说明。
在目标视频暂未上线或者上线时间较短的情况下,目标视频的观看数据较少。通过用户观看行为较难对第二视频片段的精彩度进行确定。所以,本申请实施例提供了另一种方式进行精彩度确定。
针对第二视频片段集合中每个第二视频片段,可以将当前第二视频片段输入到预先训练获得的分类模型中,得到分类模型输出的当前第二视频片段为精彩正例的概率。分类模型可以预先训练获得,其可以输出作为输入的第二视频片段为精彩正例的概率。当前第二视频片段为精彩正例的概率越高,表示当前第二视频片段越精彩。当前第二视频片段为当前操作所针对的第二视频片段。
可以根据当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度。具体的,可以预先设定第二视频片段为精彩正例的概率与精彩度的对应关系,根据该对应关系以及分类模型输出的第二视频片段为精彩正例的概率,即可确定出相应第二视频片段的精彩度。
通过分类模型可以准确确定出每个第二视频片段的精彩度,为后续精彩片段的确定提供基础保障。
在本申请的一个实施例中,可以通过以下步骤预先训练获得分类模型:
步骤一:获得训练样本集,训练样本集包括多个样本对,每个样本对包括一个精彩正例和一个负例;
步骤二:利用训练样本集对预先构建的初始模型进行训练,直至达到设定的训练终止条件时终止训练,获得分类模型;
其中,利用训练样本集对预先构建的初始模型进行训练,包括:
针对每个样本对,将当前样本对输入到预先构建的初始模型中;
根据当前样本对和初始模型输出的当前样本对的输出结果,确定模型损失;
根据模型损失调整初始模型的参数。
在本申请实施例中,可以预先获得训练样本集,训练样本集包括多个样本对,每个样本对包括一个精彩正例和一个负例。具体的,可以预先获得多个历史视频和每个历史视频的精彩片段,针对每个历史视频,可以在该历史视频中提取其精彩片段作为精彩正例,在该历史视频除精彩片段外的其他部分中随机提取出设定时长的一段作为负例,该设定时长可以是5秒或者10秒,该精彩正例和负例即可成为一个样本对,多个样本对即构成训练样本集。
利用训练样本集对预先构建的初始模型进行训练,直至达到设定的训练终止条件时终止训练,获得分类模型。初始模型可以是Timesformer模型,初始模型的模型参数具有初始状态。
训练终止条件可以是训练次数达到预设的次数阈值,或者可以是模型精度达到设定的精度阈值。
在进行模型训练时,针对每个样本对,可以将当前样本对输入到预先构建的初始模型中,初始模型可以包括骨干网络和分类网络。可以通过作为初始模型骨干网络的Transformer先提取当前样本对中精彩正例和负例的特征,然后输入到分类网络中。最后可以得到初始模型输出的当前样本对的输出结果。
根据当前样本对和初始模型输出的当前样本对的输出结果,可以确定模型损失。模型损失可以包括交叉熵分类损失和排序损失,排序损失即ranking loss。具体的,模型损失可以为交叉熵分类损失和排序损失的和,或者加权和。
具体的,针对当前样本对中的精彩正例,可以将初始模型输出的该精彩正例属于正例或负例的输出结果与该精彩正例的真实信息进行对比,针对当前样本对中的负例,可以将初始模型输出的该负例属于正例或负例的输出结果与该负例的真实信息进行对比,得到交叉熵分类损失。
针对当前样本对中的精彩正例和负例,得到初始模型输出的该精彩正例的得分以及该负例的得分,根据得分确定排序损失,得分可以与概率相对应。
如可以根据下面的公式确定排序损失Lp(s+,s-):
Lp(s+,s-)=max(0,1-h(s+)+h(s-))p
其中,s+表示精彩正例,s-表示负例,h(s+)表示初始模型输出的精彩正例的得分,h(s-)表示初始模型输出的负例的得分,p表示样本对,排序损失是使得精彩正例的得分大于负例的得分,最好接近于1。
确定出模型损失后,根据模型损失可以调整初始模型的参数,以模型损失减小为目的,使得模型损失不断收敛,初始模型的精度不断提高。
预先训练获得分类模型,方便后续对于精彩度的确定。
在本申请的一个实施例中,该方法还可以包括以下步骤:
获得目标视频的第二观看数据;
根据当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度,可以包括以下步骤:
根据第二观看数据和当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度。
在本申请实施例中,可以获得目标视频的第二观看数据。
针对第二视频片段集合中每个第二视频片段,将当前第二视频片段输入到预先训练获得的分类模型中,得到分类模型输出的当前第二视频片段为精彩正例的概率后,可以根据第二观看数据和当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度。具体的,可以根据第二观看数据,确定当前第二视频片段的第一参考精彩度,根据当前第二视频片段为精彩正例的概率,确定当前第二视频片段的第二参考精彩度,可以将第一参考精彩度和第二参考精彩度的平均值作为当前第二视频片段的精彩度。即将用户观看行为与分类模型的检测相结合确定第二视频片段的精彩度,可以使得确定的精彩度更为准确,为后续进行精彩片段的确定提供基础保障。
如图2所示,为视频精彩片段确定的一种具体过程:
先获得目标视频的第一视频片段集合和第二视频片段集合;
然后确定第一视频片段集合中每个第一视频片段是否具有设定的动作标签,确定第二视频片段集合中每个第二视频片段的精彩度;
再根据第一视频片段集合中具有设定的动作标签的第一视频片段,确定第一备选片段,根据第二视频片段集合中每个第二视频片段的精彩度,确定第二备选片段;
然后基于第一备选片段和第二备选片段,确定目标视频的精彩片段;
最后对确定的精彩片段进行调整,可以检测精彩片段的前第二时长内是否存在目标对象,如果不存在目标对象,则从精彩片段在时间轴上的起始时间开始向后查找存在目标对象的时间,将精彩片段的起始时间更新为存在目标对象的时间,还可以确定精彩片段的时长是否满足第一时长要求,如果精彩片段的时长大于第一时长要求的最大值,则对精彩片段进行截取操作,以使截取的精彩片段的时长小于或等于第一时长要求的最大值,如果精彩片段的时长小于第一时长要求的最小值,则对精彩片段进行补充操作,以使补充后的精彩片段的时长大于或等于第一时长要求的最大值。
其中,在确定第二备选片段之后、基于第一备选片段和第二备选片段,确定目标视频的精彩片段之前,还可以确定每个第二备选片段的动态率,剔除动态率小于目标视频的平均动态率的第二备选片段。
本申请实施例确定出的精彩片段融合了动作标签和精彩度的特征,而且对确定出的精彩片段进行调整,使得确定出的精彩片段更有助于提高用户的观看兴趣,可以提高用户对目标视频的观看概率。
需要说明的是,本申请实施例中涉及到的时间是指在目标视频的时间轴上的时间。
相应于上面的方法实施例,本申请实施例还提供了一种视频精彩片段确定装置,下文描述的视频精彩片段确定装置与上文描述的视频精彩片段确定方法可相互对应参照。
参见图3所示,视频精彩片段确定装置300可以包括以下模块:
获得模块310,用于获得目标视频的第一备选片段和第二备选片段,第一备选片段是具有设定的动作标签的视频片段,第二备选片段是精彩度满足精彩度条件的视频片段;
确定模块320,用于基于第一备选片段和第二备选片段,确定目标视频的精彩片段。
应用本申请实施例所提供的装置,获得目标视频的第一备选片段和第二备选片段后,基于第一备选片段和第二备选片段,确定目标视频的精彩片段。第一备选片段是具有设定的动作标签的视频片段,第二备选片段是精彩度满足精彩度条件的视频片段,使得基于第一备选片段和第二备选片段确定出的精彩片段结合了设定的动作标签和精彩度的特征,使得确定出的精彩片段更准确,进而将确定出的精彩片段用于视频分发或信息投放,可以帮助用户定位感兴趣的视频,提高视频的用户点击率,提高用户对视频的观看概率。
在本申请的一种具体实施方式中,确定模块320,用于:
确定第一备选片段和第二备选片段在目标视频的时间轴上是否存在重合部分;
如果存在重合部分,则根据在时间轴上存在重合部分的第一备选片段和第二备选片段,确定目标视频的精彩片段。
在本申请的一种具体实施方式中,确定模块320,用于:
分别将在时间轴上存在重合部分的第二备选片段和对应的第一备选片段作为一个片段对;
根据每个片段对中第二备选片段和第一备选片段在时间轴上的时间,确定目标视频的精彩片段。
在本申请的一种具体实施方式中,确定模块320,用于:
针对每个片段对,如果当前片段对中第一备选片段在时间轴上的起始时间在当前片段对中第二备选片段在时间轴上的起始时间之前,则获取目标视频中的第一待用片段,第一待用片段的起始时间为当前片段对中第二备选片段在时间轴上的起始时间,第一待用片段的时长为第一时长;
确定第一待用片段是否具有动作标签;
将具有动作标签的第一待用片段所对应的片段对确定为待用片段对;
针对每个待用片段对,如果当前待用片段对中第二备选片段的精彩度高于第一精彩度阈值,或者当前待用片段对中第二备选片段的精彩度为最高的前N1个精彩度之一,则将当前片段对中第二备选片段确定为目标视频的精彩片段,N1为正整数。
在本申请的一种具体实施方式中,确定模块320,用于:
针对每个片段对,如果当前片段对中第一备选片段在时间轴上的起始时间在当前片段对中第二备选片段在时间轴上的起始时间之后,则获取目标视频中的第二待用片段,第二待用片段的起始时间为当前片段对中第一备选片段在时间轴上的起始时间,第二待用片段的终止时间为当前片段对中第二备选片段在时间轴上的终止时间;
如果当前片段对中第二备选片段的精彩度高于第二精彩度阈值,或者述当前片段对中第二备选片段的精彩度为最高的前N2个精彩度之一,则将第二待用片段确定为目标视频的精彩片段,N2为正整数。
在本申请的一种具体实施方式中,确定模块320,还用于:
在确定第一备选片段和第二备选片段在时间轴上不存在重合部分的情况下,确定每个第一备选片段具有动作标签的概率,将概率大于概率阈值的第一备选片段确定为目标视频的精彩片段,或者将最高的前N3个概率对应的第一备选片段确定为目标视频的精彩片段,N3为正整数;
或者,
将精彩度高于第三精彩度阈值的第二备选片段确定为目标视频的精彩片段,或者将最高的前N4个精彩度对应的第二备选片段确定为目标视频的精彩片段,N4为正整数。
在本申请的一种具体实施方式中,还包括剔除模块,用于:
在基于第一备选片段和第二备选片段,确定目标视频的精彩片段之前,确定每个第二备选片段的动态率,动态率用于表征视频帧间图像变化差异情况;
剔除动态率小于目标视频的平均动态率的第二备选片段。
在本申请的一种具体实施方式中,还包括第一调整模块,用于:
在确定目标视频的精彩片段之后,检测精彩片段的前第二时长内是否存在目标对象;
如果不存在目标对象,则从精彩片段在目标视频的时间轴上的起始时间开始向后查找存在目标对象的时间;
将精彩片段的起始时间更新为存在目标对象的时间。
在本申请的一种具体实施方式中,还包括第二调整模块,用于:
在确定目标视频的精彩片段之后,确定精彩片段的时长是否满足第一时长要求;
如果精彩片段的时长不满足第一时长要求,则基于第一时长要求对精彩片段进行截取操作或者补充操作。
在本申请的一种具体实施方式中,第一备选片段包括目标视频的第一视频片段集合中的一个或多个第一视频片段,获得模块310用于通过以下步骤获得第一视频片段集合:
将目标视频按照镜头进行切分,获得多个镜头片段;
根据第二时长要求,对镜头片段进行合并,得到第一视频片段集合,第一视频片段集合中每个第一视频片段的时长满足第二时长要求。
在本申请的一种具体实施方式中,第二备选片段包括目标视频的第二视频片段集合中的一个或多个第二视频片段,获得模块310用于通过以下步骤确定第二视频片段集合中每个第二视频片段的精彩度:
针对第二视频片段集合中每个第二视频片段,将当前第二视频片段输入到预先训练获得的分类模型中,得到分类模型输出的当前第二视频片段为精彩正例的概率;
根据当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度。
在本申请的一种具体实施方式中,第二确定模块330还用于通过以下步骤预先训练获得分类模型:
获得训练样本集,训练样本集包括多个样本对,每个样本对包括一个精彩正例和一个负例;
利用训练样本集对预先构建的初始模型进行训练,直至达到设定的训练终止条件时终止训练,获得分类模型;
其中,利用训练样本集对预先构建的初始模型进行训练,包括:
针对每个样本对,将当前样本对输入到预先构建的初始模型中;
根据当前样本对和初始模型输出的当前样本对的输出结果,确定模型损失;
根据模型损失调整初始模型的参数。
在本申请的一种具体实施方式中,模型损失包括交叉熵分类损失和排序损失。
在本申请的一种具体实施方式中,还包括第四确定模块,用于:
获得目标视频的第二观看数据;
获得模块310,用于:
根据第二观看数据和当前第二视频片段为精彩正例的概率,确定当前第二视频片段的精彩度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请实施例还提供了一种电子设备,如图4所示,包括处理器401、通信接口402、存储器403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信,
存储器403,用于存放计算机程序;
处理器401,用于执行存储器403上所存放的程序时,实现如下步骤:
获得目标视频的第一备选片段和第二备选片段,第一备选片段是具有设定的动作标签的视频片段,第二备选片段是精彩度满足精彩度条件的视频片段;
基于第一备选片段和第二备选片段,确定目标视频的精彩片段。
上述终端提到的通信总线404可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线404可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口402用于上述终端与其他设备之间的通信。
存储器403可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器403还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器401可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一的视频精彩片段确定方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一的视频精彩片段确定方法的步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (16)

1.一种视频精彩片段确定方法,其特征在于,包括:
获得目标视频的第一备选片段和第二备选片段,所述第一备选片段是具有设定的动作标签的视频片段,所述第二备选片段是精彩度满足精彩度条件的视频片段;
基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段。
2.根据权利要求1所述的视频精彩片段确定方法,其特征在于,所述基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段,包括:
确定所述第一备选片段和所述第二备选片段在所述目标视频的时间轴上是否存在重合部分;
如果存在重合部分,则根据在所述时间轴上存在重合部分的所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段。
3.根据权利要求2所述的视频精彩片段确定方法,其特征在于,所述根据在所述时间轴上存在重合部分的所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段,包括:
分别将在所述时间轴上存在重合部分的所述第二备选片段和对应的所述第一备选片段作为一个片段对;
根据每个所述片段对中所述第二备选片段和所述第一备选片段在所述时间轴上的时间,确定所述目标视频的精彩片段。
4.根据权利要求3所述的视频精彩片段确定方法,其特征在于,所述根据每个所述片段对中所述第二备选片段和所述第一备选片段在所述时间轴上的时间,确定所述目标视频的精彩片段,包括:
针对每个所述片段对,如果当前片段对中所述第一备选片段在所述时间轴上的起始时间在所述当前片段对中所述第二备选片段在所述时间轴上的起始时间之前,则获取所述目标视频中的第一待用片段,所述第一待用片段的起始时间为所述当前片段对中所述第二备选片段在所述时间轴上的起始时间,所述第一待用片段的时长为第一时长;
确定所述第一待用片段是否具有所述动作标签;
将具有所述动作标签的所述第一待用片段所对应的所述片段对确定为待用片段对;
针对每个所述待用片段对,如果当前待用片段对中所述第二备选片段的精彩度高于第一精彩度阈值,或者所述当前待用片段对中所述第二备选片段的精彩度为最高的前N1个精彩度之一,则将所述当前片段对中所述第二备选片段确定为所述目标视频的精彩片段,N1为正整数。
5.根据权利要求3所述的视频精彩片段确定方法,其特征在于,所述根据每个所述片段对中所述第二备选片段和所述第一备选片段在所述时间轴上的时间,确定所述目标视频的精彩片段,包括:
针对每个所述片段对,如果当前片段对中所述第一备选片段在所述时间轴上的起始时间在所述当前片段对中所述第二备选片段在所述时间轴上的起始时间之后,则获取所述目标视频中的第二待用片段,所述第二待用片段的起始时间为所述当前片段对中所述第一备选片段在所述时间轴上的起始时间,所述第二待用片段的终止时间为所述当前片段对中所述第二备选片段在所述时间轴上的终止时间;
如果所述当前片段对中所述第二备选片段的精彩度高于第二精彩度阈值,或者所述当前片段对中所述第二备选片段的精彩度为最高的前N2个精彩度之一,则将所述第二待用片段确定为所述目标视频的精彩片段,N2为正整数。
6.根据权利要求2所述的视频精彩片段确定方法,其特征在于,在确定所述第一备选片段和所述第二备选片段在所述时间轴上不存在重合部分的情况下,还包括:
确定每个所述第一备选片段具有所述动作标签的概率,将概率大于概率阈值的所述第一备选片段确定为所述目标视频的精彩片段,或者将最高的前N3个概率对应的所述第一备选片段确定为所述目标视频的精彩片段,N3为正整数;
或者,
将精彩度高于第三精彩度阈值的所述第二备选片段确定为所述目标视频的精彩片段,或者将最高的前N4个精彩度对应的所述第二备选片段确定为所述目标视频的精彩片段,N4为正整数。
7.根据权利要求1所述的视频精彩片段确定方法,其特征在于,在所述基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段之前,还包括:
确定每个所述第二备选片段的动态率,所述动态率用于表征视频帧间图像变化差异情况;
剔除动态率小于所述目标视频的平均动态率的所述第二备选片段。
8.根据权利要求1所述的视频精彩片段确定方法,其特征在于,在所述确定所述目标视频的精彩片段之后,还包括:
检测所述精彩片段的前第二时长内是否存在目标对象;
如果不存在所述目标对象,则从所述精彩片段在所述目标视频的时间轴上的起始时间开始向后查找存在所述目标对象的时间;
将所述精彩片段的起始时间更新为所述存在所述目标对象的时间。
9.根据权利要求1所述的视频精彩片段确定方法,其特征在于,在所述确定所述目标视频的精彩片段之后,还包括:
确定所述精彩片段的时长是否满足第一时长要求;
如果所述精彩片段的时长不满足所述第一时长要求,则基于所述第一时长要求对所述精彩片段进行截取操作或者补充操作。
10.根据权利要求1所述的视频精彩片段确定方法,其特征在于,所述第一备选片段包括所述目标视频的第一视频片段集合中的一个或多个第一视频片段,所述第一视频片段集合是通过以下步骤获得的:
将所述目标视频按照镜头进行切分,获得多个镜头片段;
根据第二时长要求,对所述镜头片段进行合并,得到所述第一视频片段集合,所述第一视频片段集合中每个所述第一视频片段的时长满足所述第二时长要求。
11.根据权利要求1至10之中任一项所述的视频精彩片段确定方法,其特征在于,所述第二备选片段包括所述目标视频的第二视频片段集合中的一个或多个第二视频片段,所述第二视频片段集合中每个所述第二视频片段的精彩度是通过以下步骤确定的:
针对所述第二视频片段集合中每个所述第二视频片段,将当前第二视频片段输入到预先训练获得的分类模型中,得到所述分类模型输出的所述当前第二视频片段为精彩正例的概率;
根据所述当前第二视频片段为精彩正例的概率,确定所述当前第二视频片段的精彩度。
12.根据权利要求11所述的视频精彩片段确定方法,其特征在于,通过以下步骤预先训练获得所述分类模型:
获得训练样本集,所述训练样本集包括多个样本对,每个所述样本对包括一个精彩正例和一个负例;
利用所述训练样本集对预先构建的初始模型进行训练,直至达到设定的训练终止条件时终止训练,获得所述分类模型;
其中,所述利用所述训练样本集对预先构建的初始模型进行训练,包括:
针对每个所述样本对,将当前样本对输入到预先构建的初始模型中;
根据所述当前样本对和所述初始模型输出的所述当前样本对的输出结果,确定模型损失;
根据所述模型损失调整所述初始模型的参数。
13.根据权利要求11所述的视频精彩片段确定方法,其特征在于,还包括:
获得所述目标视频的第二观看数据;
所述根据所述当前第二视频片段为精彩正例的概率,确定所述当前第二视频片段的精彩度,包括:
根据所述第二观看数据和所述当前第二视频片段为精彩正例的概率,确定所述当前第二视频片段的精彩度。
14.一种视频精彩片段确定装置,其特征在于,包括:
获得模块,用于获得目标视频的第一备选片段和第二备选片段,所述第一备选片段是具有设定的动作标签的视频片段,所述第二备选片段是精彩度满足精彩度条件的视频片段;
确定模块,用于基于所述第一备选片段和所述第二备选片段,确定所述目标视频的精彩片段。
15.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现如权利要求1至13之中任一项所述的视频精彩片段确定方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至13之中任一项所述的视频精彩片段确定方法的步骤。
CN202211054859.1A 2022-08-31 2022-08-31 视频精彩片段确定方法、装置、电子设备及存储介质 Active CN115412765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211054859.1A CN115412765B (zh) 2022-08-31 2022-08-31 视频精彩片段确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211054859.1A CN115412765B (zh) 2022-08-31 2022-08-31 视频精彩片段确定方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115412765A true CN115412765A (zh) 2022-11-29
CN115412765B CN115412765B (zh) 2024-03-26

Family

ID=84163759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211054859.1A Active CN115412765B (zh) 2022-08-31 2022-08-31 视频精彩片段确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115412765B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102427507A (zh) * 2011-09-30 2012-04-25 北京航空航天大学 一种基于事件模型的足球视频集锦自动合成方法
CN104994425A (zh) * 2015-06-30 2015-10-21 北京奇艺世纪科技有限公司 一种视频标识方法和装置
CN109977735A (zh) * 2017-12-28 2019-07-05 优酷网络技术(北京)有限公司 运动精彩片段的提取方法及装置
CN110191357A (zh) * 2019-06-28 2019-08-30 北京奇艺世纪科技有限公司 视频片段精彩度评估、动态封面生成方法及装置
US20200213686A1 (en) * 2017-09-21 2020-07-02 Tencent Technology (Shenzhen) Company Limited Video highlight determination method and apparatus, storage medium, and electronic device
CN111669656A (zh) * 2020-06-19 2020-09-15 北京奇艺世纪科技有限公司 一种视频片段的精彩程度确定方法及装置
US20200322647A1 (en) * 2019-04-02 2020-10-08 Wangsu Science & Technology Co., Ltd. Method, apparatus, server, and storage medium for generating live broadcast video of highlight collection
CN112511854A (zh) * 2020-11-27 2021-03-16 刘亚虹 一种直播视频精彩片段生成方法、装置、介质和设备
US20210201038A1 (en) * 2019-12-30 2021-07-01 Alibaba Group Holding Limited Method and apparatus for video processing
CN113194359A (zh) * 2021-04-27 2021-07-30 武汉星巡智能科技有限公司 自动抓取婴儿精彩视频集锦的方法、装置、设备及介质
CN113365147A (zh) * 2021-08-11 2021-09-07 腾讯科技(深圳)有限公司 基于音乐卡点的视频剪辑方法、装置、设备及存储介质
WO2021184852A1 (zh) * 2020-03-16 2021-09-23 平安科技(深圳)有限公司 动作区域提取方法、装置、设备及计算机可读存储介质
US20220078530A1 (en) * 2019-12-17 2022-03-10 Tencent Technology (Shenzhen) Company Limited Video labeling method and apparatus, device, and computer-readable storage medium
CN114329072A (zh) * 2021-12-23 2022-04-12 北京市商汤科技开发有限公司 一种视频处理的方法、装置、电子设备及存储介质
CN114845149A (zh) * 2021-02-01 2022-08-02 腾讯科技(北京)有限公司 视频片段的剪辑方法、视频推荐方法、装置、设备及介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102427507A (zh) * 2011-09-30 2012-04-25 北京航空航天大学 一种基于事件模型的足球视频集锦自动合成方法
CN104994425A (zh) * 2015-06-30 2015-10-21 北京奇艺世纪科技有限公司 一种视频标识方法和装置
US20200213686A1 (en) * 2017-09-21 2020-07-02 Tencent Technology (Shenzhen) Company Limited Video highlight determination method and apparatus, storage medium, and electronic device
CN109977735A (zh) * 2017-12-28 2019-07-05 优酷网络技术(北京)有限公司 运动精彩片段的提取方法及装置
US20200322647A1 (en) * 2019-04-02 2020-10-08 Wangsu Science & Technology Co., Ltd. Method, apparatus, server, and storage medium for generating live broadcast video of highlight collection
CN110191357A (zh) * 2019-06-28 2019-08-30 北京奇艺世纪科技有限公司 视频片段精彩度评估、动态封面生成方法及装置
US20220078530A1 (en) * 2019-12-17 2022-03-10 Tencent Technology (Shenzhen) Company Limited Video labeling method and apparatus, device, and computer-readable storage medium
US20210201038A1 (en) * 2019-12-30 2021-07-01 Alibaba Group Holding Limited Method and apparatus for video processing
WO2021184852A1 (zh) * 2020-03-16 2021-09-23 平安科技(深圳)有限公司 动作区域提取方法、装置、设备及计算机可读存储介质
CN111669656A (zh) * 2020-06-19 2020-09-15 北京奇艺世纪科技有限公司 一种视频片段的精彩程度确定方法及装置
CN112511854A (zh) * 2020-11-27 2021-03-16 刘亚虹 一种直播视频精彩片段生成方法、装置、介质和设备
CN114845149A (zh) * 2021-02-01 2022-08-02 腾讯科技(北京)有限公司 视频片段的剪辑方法、视频推荐方法、装置、设备及介质
CN113194359A (zh) * 2021-04-27 2021-07-30 武汉星巡智能科技有限公司 自动抓取婴儿精彩视频集锦的方法、装置、设备及介质
CN113365147A (zh) * 2021-08-11 2021-09-07 腾讯科技(深圳)有限公司 基于音乐卡点的视频剪辑方法、装置、设备及存储介质
CN114329072A (zh) * 2021-12-23 2022-04-12 北京市商汤科技开发有限公司 一种视频处理的方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN115412765B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
CN111460219B (zh) 视频处理方法及装置、短视频平台
CN112929744B (zh) 用于分割视频剪辑的方法、装置、设备、介质和程序产品
KR102068790B1 (ko) 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체
CN113613065B (zh) 视频编辑方法、装置、电子设备以及存储介质
CN111861572B (zh) 广告投放方法、装置、电子设备及计算机可读存储介质
US11914639B2 (en) Multimedia resource matching method and apparatus, storage medium, and electronic apparatus
CN110475154B (zh) 网络电视视频播放方法和装置、网络电视和计算机介质
CN111279709B (zh) 提供视频推荐
CN110287375B (zh) 视频标签的确定方法、装置及服务器
CN111314732A (zh) 确定视频标签的方法、服务器及存储介质
CN112511854A (zh) 一种直播视频精彩片段生成方法、装置、介质和设备
CN112291634B (zh) 视频处理方法及装置
WO2022087826A1 (zh) 视频处理方法、装置、可移动设备及可读存储介质
CN107480265A (zh) 数据推荐方法、装置、设备以及存储介质
CN113423014B (zh) 一种播放信息的推送方法、装置、终端设备及存储介质
CN113259754B (zh) 视频生成方法、装置、电子设备及存储介质
Tsao et al. Thumbnail image selection for VOD services
TWI725375B (zh) 資料搜尋方法及其資料搜尋系統
CN115412765A (zh) 视频精彩片段确定方法、装置、电子设备及存储介质
CN108882024B (zh) 一种视频播放方法、装置及电子设备
CN114302231B (zh) 视频处理方法及装置、电子设备和存储介质
CN115080792A (zh) 一种视频关联方法、装置、电子设备及存储介质
CN115190357A (zh) 一种视频摘要生成方法和装置
CN112770176B (zh) 一种视频帧确定方法、装置、电子设备和计算机可读介质
CN113420182A (zh) 视频片头片尾识别方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant