CN104463864B

CN104463864B - 多级并行关键帧云提取方法及***

Info

Publication number: CN104463864B
Application number: CN201410731007.0A
Authority: CN
Inventors: 朱定局
Original assignee: South China Normal University
Current assignee: South China Normal University
Priority date: 2014-12-05
Filing date: 2014-12-05
Publication date: 2018-08-14
Anticipated expiration: 2034-12-05
Also published as: CN104463864A; WO2016086731A1

Abstract

本发明公开一种多级并行关键帧云提取方法及***。所述关键帧云提取***包括：视频输入模块，被构造为提取关键帧的视频输入接口；视频镜头分割模块，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成各镜头关键帧组；关键帧输出模块，被构造为对各镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。本发明的多级并行关键帧云提取方法及***对处理大规模关键帧提取时具有较高的效率，同时，具有很好的可扩展性及稳定性，能够满足大规模关键帧提取的需求。

Description

多级并行关键帧云提取方法及***

技术领域

本发明涉及关键帧云提取技术，更具体地讲，涉及一种多级并行关键帧云提取方法及多级并行关键帧云提取***。

背景技术

视频关键帧指能代表镜头中的最重要的、有代表性的一幅或多幅图像。关键帧的提取能大大减少视频数据的处理量，受到研究者的广泛关注。

云计算能够无缝扩展到大规模的集群，且能够容忍部分节点的错误码，甚至很大部分节点发生失效也不会影响程序的正确运行，因此云计算具有较好的可扩展性及稳定性。

现有的关键帧提取的主要方法包括：基于镜头边界的方法、基于运动分析提取关键帧、基于图像信息提取关键帧、基于聚类提取关键帧等。大部分研究主要集中在视频关键帧的提取准确度方面，但视频关键帧的提取涉及许多数字运算，具视频帧数量多，串行视频关键帧抽取会耗时长，且单机处理能力有限，故有必要研究一种多级并行关键帧云提取方法和云提取***。

发明内容

为了解决上述现有技术存在的问题，本发明的目的在于提供一种多级并行关键帧云提取***，其中，所述多级并行关键帧云提取***包括：视频输入模块，被构造为提取关键帧的视频输入接口；视频镜头分割模块，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成各镜头关键帧组；关键帧输出模块，被构造为对各镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。

本发明的另一目的还在于提供一种多级并行关键帧云提取方法，其中，所述多级并行关键帧云提取方法包括：接受需提取关键帧的视频；对所述视频进行镜头分割；对所述镜头进行多级并行关键帧云提取操作；对所提取的镜头关键帧组进行组合，输出最终视频关键帧组。

进一步地，所述多级并行关键帧云提取操作包含并行提取视频帧特征向量、根据视频帧特征向量并行聚类操作。

进一步地，所述镜头关键帧组组合，包含最终聚类产生视频最终关键帧。

进一步地，所述视频特征向量聚类操作可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。

本发明的多级并行关键帧云提取方法及云提取***能大大提高关键帧提取效率，同时具有很好的可扩展性及稳定性。

附图说明

图1是根据本发明的实施例的多级并行关键帧云提取***示意图。

图2是根据本发明的实施例的多级并行关键帧云提取调度方法的流程图。

图3是根据本发明的实施例的多级并行关键帧云提取某实例操作图。

具体实施方式

现在对本发明的实施例进行详细的描述，其示例表示在附图中，其中，相同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。在附图中，为了清晰起见，可以夸大层和区域的厚度。在下面的描述中，为了避免公知结构和/或功能的不必要的详细描述所导致的本发明构思的混淆，可省略公知结构和/或功能的不必要的详细描述。

参照图1，根据本发明的实施例的多级并行关键帧云提取***包括：视频输入模块10，被构造为提取关键帧的视频输入接口；视频镜头分割模块20，被构造为对输入的视频进行镜头分割，以便进行关键帧提取并行处理；多级并行关键帧云处理模块30，被构造为对视频镜头通过多级并行策略，通过并行提取帧特征向量、并行聚类操作，生成各镜头关键帧组；关键帧输出模块40，被构造为对各镜头所生成的关键帧组进行组合，最后输出整个视频的关键帧组。

此外，多级并行关键帧云提取操作包含并行提取视频帧特征向量、根据视频帧特征向量并行聚类操作。

所述视频特征向量聚类操作可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。

相对应地，本发明还提供了一种多级并行关键帧云提取方法，具体请参照图2，其是根据本发明的实施例的多级并行关键帧云提取方法的流程图。

参照图2，根据本发明的实施例的多级并行关键帧云提取方法包括：S1、接受需进行关键帧抽取的视频；S2、对视频进行视频镜头分割；S3、对镜头多级并行提取视频关键帧；S4、对镜头关键帧组进行组合输出。

在本实施例中，视频镜头分割后，可并行提取视频帧特征向量，之后可并行进行视频特征向量聚类操作，聚类可为k-means聚类、模糊C均值聚类或其他适合并行处理的图像特征聚类算法。下面将以并行提取视频帧向量处理及并行进行k-means聚类提取关键帧为例来对本发明进行说明。其中，K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。而，模糊c-均值聚类算法 fuzzy c-means algorithm (FCMA)作为无监督机器学习的主要技术之一，是用模糊理论对重要数据分析和建模的方法，建立了样本类属的不确定性描述，能比较客观地反映现实世界。

具体而言，参照图3，假如经过S1、S2步骤后，视频已分割成k个镜头（k≥1，k∈Z）。S3被构造为如下步骤：

S31：一级镜头map操作，此操作实现将分割的镜头分布到一级云计算平台节点中，此处所述的节点为双重角色，具体为：在第一级云平台中为Datanode及TaskTasker角色，在第二级云计算平台节点中为Namenode及Jobtracker角色。S301操作中，map函数构造输入数据记录的<key,value>为<镜头ID，视频镜头位置>，函数操作为：将镜头拷贝至第一级云计算平台节点中，以便进行第二级的map操作。

S32：对分发到节点上的镜头作第二级map操作预处理。将镜头分割成一组视频帧图像。镜头1包含视频帧数N₁、镜头2包含视频帧数N₂、镜头K包含视频帧数N_k。N₁、N₂、… N_k指各镜头N₁、N₂、…、N_k实际所包含的视频帧数（N₁、N₂、…N_k≥1, N₁、N₂、…N_k∈Z）。

S33：对各镜头并行进行第二级map操作。所述第二级map操作，在于将各帧分发到下一级云计算平台Tasktracker节点中，并行提取视频帧特征向量。所述S33操作中，map函数构造输入数据记录的<key,value>为<帧ID，帧图像位置>，函数操作为对视频帧进行特征向量提取，输出结果<key,value>对的形式为<帧ID，帧特征向量>。

S34：对S33操作所得到的结果进行第三级map操作。所述S34操作，在于对S33生成的<帧ID，帧特征向量>记录组并行进行云聚类操作。具体可描述为：完成每个数据帧到初始帧聚类中心的距离计算，并重新标记其属于的新聚类类别，其输入为S33所生成的<帧ID，帧特征向量>所有记录和上一轮迭代（或初始聚类）的聚类中心。每个map函数都读入聚类中心描述文件，map函数对输入的每个记录点计算其最近的类中心，并做新类别的标记。Map函数输入数据记录的<key,value>为<帧ID，帧特征向量>；输出中间结果<key,value>的形式为<帧所属类别，帧特征向量>。

上述镜头1、镜头2、…、镜头k的初始聚类中心个数被描述为m₁、m₂、…、m_k（m₁、m₂、…、m_k≥1，m₁、m₂、…、m_k∈Z）其值根据各镜头数据帧总数及一定的规则确定，在一定程度上，m₁、m₂、…、m_k也代表各镜头将产生的关键帧数。

上述初始聚类中心被构造为：根据m₁、m₂、…、m_k的值，分别从镜头1、镜头2、…、镜头k中随机抽取m₁、m₂、…、m_k个征特征向量作为镜头1、镜头2、…、镜头k的初始聚类中心。

上述数据帧到聚类中心的距离计算，可以描述为欧式距离、马氏距离等。

S34被构造的map函数可以描述为：

void map(Object key, Text value, Context context)

{

计算帧到各聚类中心的距离；

比较上述距离；

将帧归结到距离最近的那个距类中心所属的类；

将<帧所属类别，帧特征向量>写入中间文件；

}

上述map阶段会进行shuffle操作，完成中间计算结果的分组排序。

S35：根据S34的输出，更新聚类中心，供下一轮map-reduce使用。所述S35操作，输入数据<key,value>对的形式为<聚类类别ID，{记录属性向量集}>；所有key相同的记录（即相同聚类中心类别ID的记录）将送给一个reduce任务。S35操作被描述为：累加key相同的点的个数和各记录分量的和，求各分量的均值，得到新的聚类中心。S35操作输出结果<key,value>对的形式为<聚类类别ID，均值向量>。S35操作过程可描述为：

Void reduce(Text key，Iterable<Text> values, Context context)

{

for(对于key相同的所有记录)

{

求每个属性的均值；

}

将<聚类类别ID，均值向量>写入结果文件；

}

S36：迭代过程。S36步骤可描述为：对S34的输出结果，判断该聚类是否已收敛。具体可描述为：比较上一轮map-reduce得到的聚类中心与本轮map-reduce聚类中心的距离。若距离小于给定阀值，则算法结束。否之，则将本轮的聚类中心替换上一轮的聚类中心，并启动新一轮的map-reduce操作。

S4：对镜头关键帧组进行组合输出。对S3步聚的最终各镜头视频关键帧组进行组合输出视频关键帧。

综上所述，根据本发明的实施例的多级并行关键帧云提取方法及云提取***，具有多级并行操作的特点，能大大提高关键帧提取效率。同时，***基于云计算平台，故具有较好的可扩展性和稳定性。

尽管已经参照其示例性实施例具体显示和描述了本发明，但是本领域的技术人员应该理解，在不脱离权利要求所限定的本发明的精神和范围的情况下，可以对其进行形式和细节上的各种改变。

Claims

1.一种多级并行关键帧云提取方法，其特征在于，所述多级并行关键帧云提取方法包括如下步骤：

S1.接受需进行关键帧抽取的视频；

S2.对视频进行视频镜头分割；

S3.对镜头多级并行提取视频关键帧；具体为：

S31：一级镜头map操作，实现将分割的镜头分布到一级云计算平台节点中，此处所述的节点为双重角色；

S32：对分发到节点上的镜头作第二级map操作预处理，将镜头分割成一组视频帧图像；

S33：对各镜头并行进行第二级map操作，所述第二级map操作，在于将各帧分发到下一级云计算平台Tasktracker节点中，并行提取视频帧特征向量；

S34：对S33操作所得到的结果进行第三级map操作，在于对S33生成的<帧ID，帧特征向量>记录组并行进行云聚类操作；

S35：根据S34的输出，更新聚类中心，供下一轮map-reduce使用；

S36：迭代过程，对S34的输出结果，判断该聚类是否已收敛；

S4.对镜头关键帧组进行组合输出。

2.根据权利要求1所述的多级并行关键帧云提取方法，其特征在于，所述视频特征向量聚类操作为k-means聚类或模糊C均值聚类或其他适合并行处理的图像特征聚类算法中的一种或多种。