CN108307230B - 一种视频精彩片段的提取方法及装置 - Google Patents

一种视频精彩片段的提取方法及装置 Download PDF

Info

Publication number
CN108307230B
CN108307230B CN201810121633.6A CN201810121633A CN108307230B CN 108307230 B CN108307230 B CN 108307230B CN 201810121633 A CN201810121633 A CN 201810121633A CN 108307230 B CN108307230 B CN 108307230B
Authority
CN
China
Prior art keywords
time
time period
preset
clustering
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810121633.6A
Other languages
English (en)
Other versions
CN108307230A (zh
Inventor
马龙飞
张晓明
张迪
赵冲翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810121633.6A priority Critical patent/CN108307230B/zh
Publication of CN108307230A publication Critical patent/CN108307230A/zh
Application granted granted Critical
Publication of CN108307230B publication Critical patent/CN108307230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本申请公开了一种视频精彩片段的提取方法及装置,获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,自适应确定弹幕数量阈值,避免了阈值选取的主观性;将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。通过对精彩时间段进行聚类避免了精彩时间点的离散化和碎片化,保证了目标精彩片段有一定的时间长度且保证了目标精彩片段的精彩度。

Description

一种视频精彩片段的提取方法及装置
技术领域
本发明涉及视频剪辑技术领域,更具体的,涉及一种视频精彩片段的提取方法及装置。
背景技术
视频观看成为中国网民娱乐生活中越来越重要的部分,网络视频日益成为人们观看视频的最重要方式。网络视频资源众多,不仅有电影、电视、综艺节目观等多媒体资源,还有微电影、自拍视频等资源。
用户观看视频一般是由别人推荐或通过网页视频受欢迎排行榜、点击量等挑选视频进行播放,但是视频中常常有部分内容比较吸引用户,也会存在有些部分比较无趣、用户不太感兴趣的部分,对于这些无趣的部分用户观看完毕后才会发觉不感兴趣,这既影响了用户的观看体验,造成了时间的浪费,又浪费了流量资源。因此好多视频播放平台一般将视频剪辑出精彩片段,提供给尚未观看的用户,以提升用户的观看体验且避免不必要的时间、流量资源浪费。
弹幕评论数据是用户在视频观看过程中对不同时间点的及时反馈,是用户及时对视频每个时间点是否精彩的“标签”,通过弹幕评论数据剪辑视频精彩片段是公认的一种有效的视频剪辑方法。通过找出弹幕频次高且分布密集的时间段,即可剪辑出效果很好的精彩片段。现有方法是只简单找出视频每秒弹幕数量超过阈值的所有连续时间点,或找出每秒弹幕平均数量超过阈值的时间段作为精彩片段。
但是,只找出弹幕数量超过阈值的时间点,容易出现时间点离散、不连续的问题,这样取出的时间段很短,其中时间跨度长的片段很少或者没有,效果不好。只找出每秒弹幕平均数量超过阈值的时间段作为精彩片段的问题是,可能时间区间中某一个时间点的弹幕数量非常多,其余时间点弹幕量很少,这样也可能整个区间的平均弹幕数量超过了阈值,但整个区间弹幕量最多的时间点与弹幕量最低的时间点之间时间相差很大,这样取出的连续区间精彩度要打折扣。
发明内容
有鉴于此,本发明提供了一种视频精彩片段的提取方法及装置,通过聚类获取弹幕频次高的时间段组成的时间区间,既不要求时间区间中所有时间段的弹幕数量均高于阈值,也可避免时间区间中某些时间段弹幕数量多、其余时间段弹幕数量极少且总体弹幕数量均值高导致的精彩片段提取的不准确问题。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种视频精彩片段的提取方法,包括:
获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值;
将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;
对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;
根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取得到目标精彩片段。
优选的,所述根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值,包括:
对弹幕数量大于0的预设时间段按弹幕数量从大到小的顺序进行排序,为排序后的每个预设时间段添加一个序号值;
计算弹幕数量大于0的预设时间段的总数与比例阈值的比值,并对所述比值进行向下取整,得到整数值,所述比例阈值为对目标视频的时长与目标精彩片段的预设时长的比值进行向下取整所得到的值;
将序号值为所述整数值的预设时间段的弹幕数量值确定为弹幕数量阈值。
优选的,所述对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻,包括:
根据密度聚类算法,以聚类簇的预设核心半径值和聚类簇的预设密度阈值为参数,对每个所述精彩时间段进行聚类,得到多个聚类簇;
对于每一个聚类簇,将聚类簇中每个预设时间段的开始时刻中的最早开始时刻确定为所述聚类簇的开始时刻,并将所述聚类簇中每个预设时间段的结束时刻中的最晚结束时刻确定为所述聚类簇的结束时刻。
优选的,所述根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段,包括:
对所述多个聚类簇按开始时刻从早到晚或从晚到早的顺序进行排序,并根据每个所述聚类簇的开始时刻和结束时刻计算相邻两个所述聚类簇之间的时间间隔值;
对时间间隔值小于预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间段集合的开始时刻和结束时刻;
根据所述时间段集合的开始时刻和结束时刻,对所述目标视频进行提取,得到以所述时间段集合的开始时刻为开始时刻且以所述时间段集合的结束时刻为结束时刻的目标精彩片段。
优选的,在所述根据所述时间段集合的开始时刻和结束时刻,对所述目标视频进行提取之前,所述方法还包括:
对于每一个所述时间段集合,计算所述时间段集合的结束时刻与开始时刻的差值;
当所述时间段集合的结束时刻与开始时刻的差值小于第三预设值时,删除所述时间段集合。
一种视频精彩片段的提取装置,包括:
第一确定单元,用于获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值;
第二确定单元,用于将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;
聚类单元,用于对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;
提取单元,用于根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。
优选的,所述第一确定单元包括:
排序子单元,用于对弹幕数量大于0的预设时间段按弹幕数量从大到小的顺序进行排序,为排序后的每个预设时间段添加一个序号值;
第一计算子单元,用于计算弹幕数量大于0的预设时间段的总数与比例阈值的比值,并对所述比值进行向下取整,得到整数值,所述比例阈值为对目标视频的时长与目标精彩片段的预设时长的比值进行向下取整所得到的值;
第一确定子单元,用于将序号值为所述整数值的预设时间段的弹幕数量值确定为弹幕数量阈值。
优选的,所述聚类单元包括:
聚类子单元,用于根据密度聚类算法,以聚类簇的预设核心半径值和聚类簇的预设密度阈值为参数,对每个所述精彩时间段进行聚类,得到多个聚类簇;
第二确定子单元,用于对于每一个聚类簇,将聚类簇中每个预设时间段的开始时刻中的最早开始时刻确定为所述聚类簇的开始时刻,并将所述聚类簇中每个预设时间段的结束时刻中的最晚结束时刻确定为所述聚类簇的结束时刻。
优选的,所述提取单元包括:
第二计算子单元,用于对所述多个聚类簇按开始时刻从早到晚或从晚到早的顺序进行排序,并根据每个所述聚类簇的开始时刻和结束时刻计算相邻两个所述聚类簇之间的时间间隔值;
合并子单元,用于对时间间隔值小于预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间段集合的开始时刻和结束时刻;
提取子单元,用于根据所述时间段集合的开始时间和结束时间,对所述目标视频进行提取,得到以所述时间段集合的开始时刻为开始时刻且以所述时间段集合的结束时刻为结束时刻的目标精彩片段。
优选的,所述提取单元还包括:
删除子单元,用于对于每一个所述时间段集合,计算所述时间段集合的结束时刻与开始时刻的差值;当所述时间段集合的结束时刻与开始时刻的差值小于第三预设值时,删除所述时间段集合。
预设时长预设时长相对于现有技术,本发明的有益效果如下:
本发明提供的一种视频精彩片段的提取方法及装置,获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,自适应确定最合理的弹幕数量阈值,避免了阈值选取的主观性。将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。通过对精彩时间段进行聚类避免了精彩时间点的离散化和碎片化,保证聚类出的目标精彩片段具有一定的时间长度且保证目标精彩片段的精彩度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本实施例公开的一种视频精彩片段的提取方法流程图;
图2为本实施例公开的精彩时间段分布图;
图3为本实施例公开的将离散的精彩时间段聚出的簇的示意图;
图4为本实施例公开的小簇聚成大簇的示意图;
图5为本实施例公开的将时间间隔小于预设值的两个簇合并成时间段集合示意图;
图6为本实施例公开的一种视频精彩片段的提取装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本实施例公开了一种视频精彩片段的提取方法,具体包括以下步骤:
S101:获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值;
其中,所述目标视频为需要对其进行剪辑从而提取精彩片段的视频。将目标视频分为多个预设时间段,例如,可以将一段时长为30分钟的目标视频分为1800个预设时间段,每个预设时间段的时长为1秒。当然,本发明并不以此为限。
获取目标视频中每个预设时间段的弹幕数量具体为:
从数据源接入目标视频的弹幕数据,将弹幕数据存入Hadoop分布式文件***中,并使用MapReduce解析所述弹幕数据,统计所述目标视频中每个预设时间段的弹幕数量。
每个预设时间段的弹幕数量为相应时间段中出现弹幕的数量,对于任意一个预设时间段可能出现弹幕也可能不出现弹幕,因此,每个预设时间段的弹幕数量为不小于0的整数,每个预设时间段的弹幕数量不同。
所述根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值,具体为:
对弹幕数量大于0的预设时间段按弹幕数量从大到小的顺序进行排序,为排序后的每个预设时间段添加一个序号值;
计算弹幕数量大于0的预设时间段的总数与比例阈值的比值,并对所述比值进行向下取整,得到整数值,所述比例阈值为对目标精彩片段的预设时长与所述目标视频的时长的比值进行向下取整所得到的值;
将序号值为所述整数值的预设时间段的弹幕数量值确定为弹幕数量阈值。
所述目标精彩片段的预设时长为目标视频需要剪辑出的精彩片段的预设时长,例如,***设定目标精彩片段的预设时长为10分钟。需要说明的是,所述目标精彩片段的预设时长与最后得到的目标精彩片段的时长可能不同。
可以理解的是,本实施例根据目标精彩片段的预设时长自适应确定弹幕数量阈值。
首先,需要先将目标精彩片段的预设时长与所述目标视频的时长的比值的向下取整值,确定为比例阈值。如:目标视频的时长为60分钟,需要提取出的目标精彩片段的预设时长为20分钟,则比例阈值为3;目标视频的时长为60分钟,需要提取出的目标精彩片段的预设时长为15分钟,则比例阈值为4。
然后,按弹幕数量从大到小对弹幕数量大于0的预设时间段进行排序,得到每个弹幕数量大于0的预设时间段的序号值,对弹幕数量大于0的预设时间段的总数与比例阈值的比值进行向下取整,得到整数值,将序号值为所述整数值的时间点的弹幕数量值确定为弹幕数量阈值。以目标视频的时长为70分钟,需要提取出的目标精彩片段的预设时长为20分钟,计算得到目标视频的时长与目标精彩片段的预设时长的比值3.5,3.5向下取整得到整数值3,则比例阈值为3。以目标视频包括10个弹幕数量大于0的预设时间段为例,10个预设时间段的弹幕数量分别为1、3、5、7、9、2、4、6、8、10,按弹幕数量从大到小对这10个预设时间段进行排序,分别为10、9、8、7、6、5、4、3、2、1,此时,对弹幕数量大于0的时间点的总数10与比例阈值3的比值进行向下取整得到整数值3,而序号为3的时间点的弹幕数量为8,将8确定为弹幕数量阈值。
S102:将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;
S103:对多个所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;
具体为,根据密度聚类算法,以聚类簇的预设核心半径值和聚类簇的预设密度阈值为参数,对每个所述精彩时间段进行聚类,得到多个聚类簇;
对于每一个聚类簇,将聚类簇中每个预设时间段的开始时刻中的最早开始时刻确定为所述聚类簇的开始时刻,并将所述聚类簇中每个预设时间段的结束时刻中的最晚结束时刻确定为所述聚类簇的结束时刻。
需要说明的是,聚类簇的预设核心半径值表示聚类簇的大小,聚类簇的预设密度阈值表示聚类簇中预设时间段的密度。可以根据目标视频的特点预先设定核心半径值和密度阈值,例如,目标视频可以为不同类型的视频,电视剧、电影、综艺等,根据不同目标视频的类型特点设定聚类簇的预设核心半径值和聚类簇的预设密度阈值。
优选的,聚类簇的预设核心半径值为3,聚类簇的预设密度阈值为50%。
密度聚类算法的聚类原理为:对一个预设时间段的聚类簇的预设核心半径内,若含有预设时间段的密度达到密度阈值则该预设时间段为核心点,聚类簇的预设核心半径内的预设时间段为密度直达对象,将所有密度直达对象加入集合,对这些密度直达对象的预设时间段用同样的方法找出其中的核心点,再将这些新的核心点对应的密度直达对象加入集合,以此迭代下去,直到所有核心点的密度直达对象都访问完毕,聚类结束。
S104:根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。
具体的,对所述多个聚类簇按开始时刻从早到晚或从晚到早的顺序进行排序,并根据每个所述聚类簇的开始时刻和结束时刻计算相邻两个所述聚类簇之间的时间间隔值;
对时间间隔值小于预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间段集合的开始时刻和结束时刻;
根据所述时间段集合的开始时刻和结束时刻,对所述目标视频进行提取,得到以所述时间段集合的开始时刻为开始时刻且以所述时间段集合的结束时刻为结束时刻的目标精彩片段。
可以理解的是,精彩片段的时长不能太短,如果太短用户观看体验差。因此本实施例对时间间隔值小于预设值的两个聚类簇进行合并,成为一个相对较大的时间段集合,该时间段集合对应的视频片段的长度较长,避免了精彩片段时长太短的问题。
因此,在所述根据所述时间段集合的开始时刻和结束时刻,对所述目标视频进行提取之前,所述方法还包括:
对于每一个所述时间段集合,计算所述时间段集合的结束时刻与开始时刻的差值;
当所述时间段集合的结束时刻与开始时刻的差值小于第三预设值时,删除所述时间段集合。
可以理解的是,如果一个时间段集合对应的视频片段的长度很短,就没有保留的必要。
还需要说明的是,最终得到的为至少一个聚类簇、至少一个时间段集合。如果最后得到多个聚类簇或多个时间段集合,根据业务需要,可以将多个聚类簇对应的视频片段或多个时间段集合对应的视频片段进行拼接得到目标精彩片段,也可以将每个聚类簇对应的视频片段或每个时间段集合对应的视频片段作为一个单独的目标精彩片段,也就是说,所述目标视频最后提取得到的也可能为多个目标精彩片段。
为了进一步对本实施例公开的一种视频精彩片段的提取方法的技术方案进行阐述,以下通过一个具体的场景实施例进行说明。
首先,获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值,将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段。将请参阅2,图2为精彩时间段分布图,图2中每个预设时间段对应一个弹幕数量,每个预设时间段对应的弹幕数量不同,水平线对应的值为弹幕数量阈值,图2中弹幕数量大于弹幕数量阈值的预设时间段为精彩时间段。
然后,设定预设聚类簇核心半径值和预设聚类簇密度阈值,基于密度聚类算法对多个所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻。请参阅图3,图3为精彩时间段聚出的簇的示意图,其中,聚出的簇之间为非精彩时间段,请参阅图4,在聚类过程中,根据聚类簇的预设核心半径值和聚类簇的预设密度阈值将小簇合并为大簇,可以发现当某段时间内精彩时间点很密集,则可以将密集精彩时间点之间的非精彩时间点并入簇中,最后聚类结束得到聚类簇,将聚类簇的整体的开始时刻和结束时刻作为精彩片段的开始时刻和结束时刻。
最后,为了避免精彩时间点的离散,按照开始时间对多个所述聚类簇进行排序,并计算相邻两个所述聚类簇之间的时间间隔值;对时间间隔值小于第二预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间点集合的开始时刻和结束时刻。请参阅图5,将时间间隔小于预设值的两个聚类簇进行合并,减小精彩片段长度短的问题。
本实施例公开的一种视频精彩片段的提取方法,获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,自适应确定最合理的弹幕数量阈值,避免了阈值选取的主观性。将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;对所有所述精彩时间点进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。通过对精彩时间段进行聚类避免了精彩时间段的离散化和碎片化,保证聚类出的目标精彩片段具有一定的时间长度且保证目标精彩片段的精彩度。
基于上述实施例公开的一种视频精彩片段的提取方法,请参阅图2,本实施例对应公开了一种视频精彩片段的提取装置,包括:
第一确定单元201,用于获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,确定弹幕数量阈值;
第二确定单元202,用于将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;
聚类单元203,用于对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;
提取单元204,用于根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。
优选的,所述第一确定单元201包括:
排序子单元,用于对弹幕数量大于0的预设时间段按弹幕数量从大到小的顺序进行排序,根据排序为每个预设时间段添加一个序号值;
第一计算子单元,用于计算弹幕数量大于0的预设时间段的总数与比例阈值的比值,并对所述比值进行向下取整,得到整数值,所述比例阈值为对目标视频的时长与目标精彩片段的预设时长的比值进行向下取整所得到的值;
第一确定子单元,用于将序号值为所述整数值的预设时间段的弹幕数量值确定为弹幕数量阈值。
优选的,所述聚类单元203包括:
聚类子单元,用于根据密度聚类算法,以聚类簇的预设核心半径值和聚类簇的预设密度阈值为参数,对每个所述精彩时间段进行聚类,得到多个聚类簇;
第二确定子单元,用于对于每一个聚类簇,将聚类簇中每个预设时间段的开始时刻中的最早开始时刻确定为所述聚类簇的开始时刻,并将所述聚类簇中每个预设时间段的结束时刻中的最晚结束时刻确定为所述聚类簇的结束时刻。
优选的,所述提取单元204包括:
第二计算子单元,用于对所述多个聚类簇按开始时刻从早到晚或从晚到早的顺序进行排序,并根据每个所述聚类簇的开始时刻和结束时刻计算相邻两个所述聚类簇之间的时间间隔值;
合并子单元,用于对时间间隔值小于预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间段集合的开始时刻和结束时刻;
提取子单元,用于根据所述时间段集合的开始时间和结束时间,对所述目标视频进行提取,得到以所述时间段集合的开始时刻为开始时刻且以所述时间段集合的结束时刻为结束时刻的目标精彩片段。
优选的,所述提取单元204还包括:
删除子单元,用于对于每一个所述时间段集合,计算所述时间段集合的结束时刻与开始时刻的差值;当所述时间段集合的结束时刻与开始时刻的差值小于第三预设值时,删除所述时间段集合。
预设时长本实施例公开的一种视频精彩片段的提取装置,获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量,自适应确定最合理的弹幕数量阈值,避免了阈值选取的主观性。将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。通过对精彩时间段进行聚类避免了精彩时间点的离散化和碎片化,保证聚类出的目标精彩片段具有一定的时间长度且保证目标精彩片段的精彩度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频精彩片段的提取方法,其特征在于,包括:
获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量与比例阈值,确定弹幕数量阈值,所述比例阈值是根据目标视频的时长与目标精彩片段的预设时长设定的;
将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;
对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;
根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取得到目标精彩片段。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标视频中每个预设时间段的弹幕数量与比例阈值,确定弹幕数量阈值,包括:
对弹幕数量大于0的预设时间段按弹幕数量从大到小的顺序进行排序,为排序后的每个预设时间段添加一个序号值;
计算弹幕数量大于0的预设时间段的总数与所述比例阈值的比值,并对所述比值进行向下取整,得到整数值,所述比例阈值为对目标视频的时长与目标精彩片段的预设时长的比值进行向下取整所得到的值;
将序号值为所述整数值的预设时间段的弹幕数量值确定为弹幕数量阈值。
3.根据权利要求1所述的方法,其特征在于,所述对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻,包括:
根据密度聚类算法,以聚类簇的预设核心半径值和聚类簇的预设密度阈值为参数,对每个所述精彩时间段进行聚类,得到多个聚类簇;
对于每一个聚类簇,将聚类簇中每个预设时间段的开始时刻中的最早开始时刻确定为所述聚类簇的开始时刻,并将所述聚类簇中每个预设时间段的结束时刻中的最晚结束时刻确定为所述聚类簇的结束时刻。
4.根据权利要求1所述的方法,其特征在于,所述根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段,包括:
对所述多个聚类簇按开始时刻从早到晚或从晚到早的顺序进行排序,并根据每个所述聚类簇的开始时刻和结束时刻计算相邻两个所述聚类簇之间的时间间隔值;
对时间间隔值小于预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间段集合的开始时刻和结束时刻;
根据所述时间段集合的开始时刻和结束时刻,对所述目标视频进行提取,得到以所述时间段集合的开始时刻为开始时刻且以所述时间段集合的结束时刻为结束时刻的目标精彩片段。
5.根据权利要求4所述的方法,其特征在于,在所述根据所述时间段集合的开始时刻和结束时刻,对所述目标视频进行提取之前,所述方法还包括:
对于每一个所述时间段集合,计算所述时间段集合的结束时刻与开始时刻的差值;
当所述时间段集合的结束时刻与开始时刻的差值小于第三预设值时,删除所述时间段集合。
6.一种视频精彩片段的提取装置,其特征在于,包括:
第一确定单元,用于获取目标视频中每个预设时间段的弹幕数量,并根据所述目标视频中每个预设时间段的弹幕数量与比例阈值,确定弹幕数量阈值,所述比例阈值是根据目标视频的时长与目标精彩片段的预设时长设定的;
第二确定单元,用于将所述目标视频中弹幕数量大于所述弹幕数量阈值的预设时间段确定为精彩时间段;
聚类单元,用于对所有所述精彩时间段进行聚类,得到多个聚类簇,以及每个所述聚类簇的开始时刻和结束时刻;
提取单元,用于根据每个所述聚类簇的开始时刻和结束时刻,对所述目标视频进行提取,得到目标精彩片段。
7.根据权利要求6所述的装置,其特征在于,所述第一确定单元包括:
排序子单元,用于对弹幕数量大于0的预设时间段按弹幕数量从大到小的顺序进行排序,为排序后的每个预设时间段添加一个序号值;
第一计算子单元,用于计算弹幕数量大于0的预设时间段的总数与所述比例阈值的比值,并对所述比值进行向下取整,得到整数值,所述比例阈值为对目标视频的时长与目标精彩片段的预设时长的比值进行向下取整所得到的值;
第一确定子单元,用于将序号值为所述整数值的预设时间段的弹幕数量值确定为弹幕数量阈值。
8.根据权利要求6所述的装置,其特征在于,所述聚类单元包括:
聚类子单元,用于根据密度聚类算法,以聚类簇的预设核心半径值和聚类簇的预设密度阈值为参数,对每个所述精彩时间段进行聚类,得到多个聚类簇;
第二确定子单元,用于对于每一个聚类簇,将聚类簇中每个预设时间段的开始时刻中的最早开始时刻确定为所述聚类簇的开始时刻,并将所述聚类簇中每个预设时间段的结束时刻中的最晚结束时刻确定为所述聚类簇的结束时刻。
9.根据权利要求6所述的装置,其特征在于,所述提取单元包括:
第二计算子单元,用于对所述多个聚类簇按开始时刻从早到晚或从晚到早的顺序进行排序,并根据每个所述聚类簇的开始时刻和结束时刻计算相邻两个所述聚类簇之间的时间间隔值;
合并子单元,用于对时间间隔值小于预设值的两个聚类簇进行合并,得到至少一个时间段集合,以及所述时间段集合的开始时刻和结束时刻;
提取子单元,用于根据所述时间段集合的开始时间和结束时间,对所述目标视频进行提取,得到以所述时间段集合的开始时刻为开始时刻且以所述时间段集合的结束时刻为结束时刻的目标精彩片段。
10.根据权利要求9所述的装置,其特征在于,所述提取单元还包括:
删除子单元,用于对于每一个所述时间段集合,计算所述时间段集合的结束时刻与开始时刻的差值;当所述时间段集合的结束时刻与开始时刻的差值小于第三预设值时,删除所述时间段集合。
CN201810121633.6A 2018-02-07 2018-02-07 一种视频精彩片段的提取方法及装置 Active CN108307230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810121633.6A CN108307230B (zh) 2018-02-07 2018-02-07 一种视频精彩片段的提取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810121633.6A CN108307230B (zh) 2018-02-07 2018-02-07 一种视频精彩片段的提取方法及装置

Publications (2)

Publication Number Publication Date
CN108307230A CN108307230A (zh) 2018-07-20
CN108307230B true CN108307230B (zh) 2021-01-22

Family

ID=62864650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810121633.6A Active CN108307230B (zh) 2018-02-07 2018-02-07 一种视频精彩片段的提取方法及装置

Country Status (1)

Country Link
CN (1) CN108307230B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344697B (zh) * 2018-08-16 2021-11-09 中国科学院信息工程研究所 一种对抗性竞赛中的精彩时刻识别方法
CN109309880B (zh) * 2018-10-08 2021-10-22 腾讯科技(深圳)有限公司 视频播放方法、装置、计算机设备及存储介质
CN109672936B (zh) * 2018-12-26 2021-10-26 上海众源网络有限公司 一种视频评估集的确定方法、装置及电子设备
CN109685144B (zh) * 2018-12-26 2021-02-12 上海众源网络有限公司 一种对视频模型做评估的方法、装置及电子设备
CN109740530B (zh) * 2018-12-29 2022-05-03 深圳Tcl新技术有限公司 视频段的提取方法、装置、设备及计算机可读存储介质
CN110049377B (zh) * 2019-03-12 2021-06-22 北京奇艺世纪科技有限公司 表情包生成方法、装置、电子设备及计算机可读存储介质
CN110248258B (zh) * 2019-07-18 2020-06-23 腾讯科技(深圳)有限公司 视频片段的推荐方法、装置、存储介质和计算机设备
CN110427897B (zh) * 2019-08-07 2022-03-08 北京奇艺世纪科技有限公司 视频精彩度的分析方法、装置和服务器
CN110519610B (zh) * 2019-08-14 2021-08-06 咪咕文化科技有限公司 直播资源处理方法及***、服务器和客户端设备
CN112584199B (zh) * 2019-09-29 2023-12-22 上海哔哩哔哩科技有限公司 一种多媒体文件的封面动图的生成方法与装置
CN111526424B (zh) * 2020-04-30 2022-06-03 北京奇艺世纪科技有限公司 一种精彩视频段提取方法、装置、电子设备及存储介质
CN114257874B (zh) * 2020-09-24 2023-05-12 腾讯科技(深圳)有限公司 视频播放速度的控制方法、装置、电子设备及存储介质
CN112887761A (zh) * 2021-01-19 2021-06-01 深圳聚果科技有限公司 视频播放方法、装置、服务器及存储介质
CN115209165A (zh) * 2021-04-08 2022-10-18 北京字节跳动网络技术有限公司 一种控制直播封面显示的方法及装置
CN115205723A (zh) * 2021-04-13 2022-10-18 影石创新科技股份有限公司 视频精彩片段的检测方法、装置、计算机设备和存储介质
CN113490045B (zh) * 2021-06-30 2024-03-22 北京百度网讯科技有限公司 针对直播视频的特效添加方法、装置、设备及存储介质
CN113766282B (zh) * 2021-10-20 2023-10-27 上海哔哩哔哩科技有限公司 一种直播视频处理方法及装置
CN114630141A (zh) * 2022-03-18 2022-06-14 北京达佳互联信息技术有限公司 视频处理方法及相关设备
CN115225965A (zh) * 2022-09-16 2022-10-21 广州市千钧网络科技有限公司 一种精彩片段截取的方法、装置、设备及存储介质
CN116896654B (zh) * 2023-09-11 2024-01-30 腾讯科技(深圳)有限公司 一种视频处理方法和相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937960A (zh) * 2012-09-06 2013-02-20 北京邮电大学 突发事件热点话题的识别与评估装置和方法
CN105335476A (zh) * 2015-10-08 2016-02-17 北京邮电大学 一种热点事件分类方法及装置
CN106407484A (zh) * 2016-12-09 2017-02-15 上海交通大学 一种基于弹幕语义关联的视频标签提取方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8185448B1 (en) * 2011-06-10 2012-05-22 Myslinski Lucas J Fact checking method and system
US9008489B2 (en) * 2012-02-17 2015-04-14 Kddi Corporation Keyword-tagging of scenes of interest within video content
CN104796781B (zh) * 2015-03-31 2019-01-18 小米科技有限责任公司 视频片段提取方法及装置
CN104994425B (zh) * 2015-06-30 2018-11-23 北京奇艺世纪科技有限公司 一种视频标识方法和装置
CN105847993A (zh) * 2016-04-19 2016-08-10 乐视控股(北京)有限公司 一种分享视频片段的方法及装置
CN106095804B (zh) * 2016-05-30 2019-08-20 维沃移动通信有限公司 一种视频片段的处理方法、定位方法及终端
CN107493512B (zh) * 2016-06-12 2020-11-13 阿里巴巴集团控股有限公司 视频的热点标注方法和装置
CN106210902B (zh) * 2016-07-06 2019-06-11 华东师范大学 一种基于弹幕评论数据的影视片段剪辑方法
WO2018017836A1 (en) * 2016-07-21 2018-01-25 Twitter, Inc. Live video streaming services with machine-learning based highlight replays
CN107105318B (zh) * 2017-03-21 2021-01-29 华为技术有限公司 一种视频热点片段提取方法、用户设备和服务器
CN107071587A (zh) * 2017-04-25 2017-08-18 腾讯科技(深圳)有限公司 视频片段的获取方法及装置
CN107197368B (zh) * 2017-05-05 2019-10-18 中广热点云科技有限公司 确定用户对多媒体播放内容关注程度的方法和***
CN107438204B (zh) * 2017-07-26 2019-12-17 维沃移动通信有限公司 一种媒体文件循环播放的方法及移动终端

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102937960A (zh) * 2012-09-06 2013-02-20 北京邮电大学 突发事件热点话题的识别与评估装置和方法
CN105335476A (zh) * 2015-10-08 2016-02-17 北京邮电大学 一种热点事件分类方法及装置
CN106407484A (zh) * 2016-12-09 2017-02-15 上海交通大学 一种基于弹幕语义关联的视频标签提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《基于视频弹幕评论的自动摘要生成问题的研究》;张超;《中国优秀硕士学位论文全文数据库》;20180115;全文 *

Also Published As

Publication number Publication date
CN108307230A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108307230B (zh) 一种视频精彩片段的提取方法及装置
CN107222566B (zh) 信息推送方法、装置及服务器
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
CN109408639B (zh) 一种弹幕分类方法、装置、设备和存储介质
CN108259939B (zh) 新视频推送控制方法、装置及服务器
CN108650558B (zh) 基于交互视频的视频前情提要的生成方法及装置
JP5086189B2 (ja) 動画コンテンツのダイジェスト映像を生成するサーバ、方法及びプログラム
CN108334601B (zh) 基于标签主题模型的歌曲推荐方法、装置及存储介质
CN107197368B (zh) 确定用户对多媒体播放内容关注程度的方法和***
CN106791930B (zh) 一种视频处理方法和装置
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN106326297B (zh) 一种应用程序推荐方法及装置
CN102855269A (zh) 内容提取装置、内容提取方法和程序
CN103686236A (zh) 推荐视频资源的方法及***
CN104079997A (zh) 一种数字电视个性化节目的推荐***及其方法
AU2017201914A1 (en) Video analytics device
CN111797752A (zh) 违规视频检测方法、装置、设备及存储介质
CN110290199B (zh) 内容推送方法、装置及设备
WO2016065972A1 (zh) 产生视频帧集合的方法、设备及服务器
Altman et al. Measuring audience retention in YouTube
CN111432226A (zh) 直播推荐方法、装置、服务器、终端及存储介质
CN106534984B (zh) 电视节目推送方法及装置
CN110149556A (zh) 一种基于tdc-lda模型的iptv用户行为模式挖掘方法
Ji et al. Tweeting live shows: A content analysis of live-tweets from three entertainment programs
CN103942247A (zh) 多媒体资源的信息提供方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant