CN110852195A

CN110852195A - 一种基于video slice的视频类型分类方法

Info

Publication number: CN110852195A
Application number: CN201911015725.7A
Authority: CN
Inventors: 胡能; 李云夕; 杨金江; 胡耀武
Original assignee: HANGZHOU QUWEI SCIENCE & TECHNOLOGY Co Ltd
Current assignee: HANGZHOU QUWEI SCIENCE & TECHNOLOGY Co Ltd
Priority date: 2019-10-24
Filing date: 2019-10-24
Publication date: 2020-02-28

Abstract

本发明公开了一种基于video slice的视频类型分类方法，包括以下步骤：101)设定分类步骤、102)提取slice图像步骤、103)类别分类步骤、104)类别判定步骤；本发明提供性能提高至少100倍以上的一种基于video slice的视频类型分类方法。

Description

一种基于video slice的视频类型分类方法

技术领域

本发明涉及视频分类技术领域，更具体的说，它涉及一种基于video slice的视频类型分类方法。

背景技术

视频内容分析是一种视频处理的基础技术，包括：(1)镜头切换检测；(2)类型分类，确定如喜剧、战争、悬疑、动漫等；(3)特定物体检测，如检测人脸、汽车、广告牌；(4)语义分析；(5)内容比对等。视频内容分析技术，可以应用于多种领域，如视频编辑软件，视频推荐，内容审核，广告投放，版权维护等等。

视频由很多图像组成，一段10分钟的视频，可包含1万多帧图像，简单的基于图像分析视频内容十分困难，假设一张图像处理50ms(通常比这个时间长)，1万张就需要8分钟。因此目前的应用局限性比较大，比较成熟的有版权维护(采用视频比对技术)，精确性还是不如人工，而且需投放大量服务器。因此很多关于视频处理的工作，基本通过人工来完成，如视频网站的内容审核。

发明内容

本发明克服了现有技术的不足，提供一种基于video slice的视频类型分类方法。

本发明的技术方案如下：

一种基于video slice的视频类型分类方法，包括以下步骤：

101)设定分类步骤：根据应用场景，设计分类标签，所述分类标签包括喜剧、科幻、动漫、色情、暴恐；

102)提取slice图像步骤：采用视频切片方法快速进行视频内容提取，视频切片方法为从每一帧图像中提取部分像素，组合成有一定规律的可代表短视频内容的图像，公式如下：

其中x为切片图像，I为视频帧中间一行像素；

由视频切片方法形成新图像，提取后得到n张256x256的新图像，n的大小和视频总帧数成正比，并通过video slice对视频图像中的场景切换进行检测；

103)类别分类步骤：采用自研神经网络作为分类方法，即以卷积层L_c、激活层L_r、池化层L_p级联组合，加上内积层构成，可快速有效的进行分类任务，公式表示为；

f＝L_p(L_r(L_c(x)))

arg min|F-M·g|

其中，f为神经网络单级特征，g为联合特征，M为内积矩阵，F为分类概率；

104)类别判定步骤：统计n个新图像的标签，找到数量最多分类结果，作为整个视频的分类标签。

进一步的，由中断裂位置判定为cut镜头切换，模糊过滤的位置为渐变镜头切换。

进一步的，将视频类型分类方法的框架部署在服务端；客户端通过http请求方式上传视频，服务端分类后将得到的结果返回。

本发明相比现有技术优点在于：

本发明相对于采用原始帧图像(采样或者全帧)，或者人工来进行的分类方法，性能提高至少100倍以上；video slice的方法有效的抽象了视频的特征，减少了冗余信息，再加上自研网络强大的分类能力，目前的效果已完全替代人工分类。

附图说明

图1为本发明的video slice提取画框部分内容图；

图2为本发明的新图像图；

图3为本发明的分类过程示意图；

图4为本发明的视频分类流程图。

具体实施方式

下面结合附图和具体实施方式对本发明进一步说明。

如图1至图4所示，一种基于video slice的视频类型分类方法，包括以下步骤：

101)设定分类步骤：根据应用场景，设计分类标签，所述分类标签包括喜剧、科幻、动漫、色情、暴恐等标签。

102)提取slice图像步骤：对一个视频中连续的图像，取每一帧图像中间一行像素作为列，形成新图像，这种新的图像可以反映一些视频的特征，视频的镜头切换、视频内容运动方式、内容风格等特征。如图2所示，视频的镜头切换新图像明显的断裂位置为cut镜头切换，模糊过滤的位置为渐变镜头切换。视频内容运动方式，内容静止为静态镜头(如图2从左往右的第一张图中间部分)，内容连续变化(如图2从左往右的第二张图中间部分，镜头往上运动)。内容风格，如图2从左往右的第一、第二张图为动漫视频(冒险类型)，后两张为美剧视频(悬疑类型)，可以明显看出，前两张图像色彩绚丽，后两张颜色暗淡。

采用视频切片方法快速进行视频内容提取，即从每一帧图像中提取部分像素，组合成有一定规律的可代表短视频内容的图像，公式如下，其中x为切片图像，I为视频帧中间一行像素,运算为拼接运算；

通过视频切片方法提取后得到n张256x256的新图像，n的大小和视频总帧数成正比，并通过video slice对视频图像中的场景切换进行检测。如一段视频如果有25600帧，共可以得到256帧slice图像，对每张图像进行上述特征检测。

103)类别分类步骤：采用神经网络作为分类方法，即以卷积层L_c、激活层L_r、池化层L_p三者的级联组合，加上内积层构成，可快速有效的根据特征检测进行分类任务，公式表示为；

f＝L_p(L_r(L_c(x)))

argmin|F-M·g|

f为神经网络单级特征，g为联合特征，M为内积矩阵，F为分类概率。

即对每一张新图像通过多级的由卷积层L_c、激活层L_r、池化层L_p三者的级联组合，得到的数据再通过内积层从而得到分类结果；与全卷积网络相比(如cascade cnn)，上述网络主要引入池化层，同时包含一个很巧妙的结构，最后的特征包含所有卷积层的统计值，因此很好的保留了前后相关性，在和全卷积网络同等参数量的情况下，计算量更小，表示能力更强。卷积层、激活层、池化层都为常用深度神经网络的基础组件。

最终，将视频类型分类方法的框架部署在服务端；客户端通过http请求方式上传视频，服务端分类后将得到的结果返回，实现完整的应用。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员，在不脱离本发明构思的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明保护范围内。

Claims

1.一种基于video slice的视频类型分类方法，其特征在于，包括以下步骤：

其中x为切片图像，I为视频帧中间一行像素；

f＝L_p(L_r(L_c(x)))

arg min|F-M·g|

2.根据权利要求1所述的一种基于video slice的视频类型分类方法，其特征在于，由中断裂位置判定为cut镜头切换，模糊过滤的位置为渐变镜头切换。

3.根据权利要求1所述的一种基于video slice的视频类型分类方法，其特征在于，将视频类型分类方法的框架部署在服务端；客户端通过http请求方式上传视频，服务端分类后将得到的结果返回。