CN108288045A

CN108288045A - 一种移动视频直播/监控视频采集源特征分类方法

Info

Publication number: CN108288045A
Application number: CN201810095732.1A
Authority: CN
Inventors: 曹雪松; 熊军; 徐志坤; 袁媛; 刘林区; 李先贵; 曾科锋; 丘淦腾; 古迅涛; 徐小乐; 彭尊达
Original assignee: Tianxun Ruida Communications Technology Co Ltd
Current assignee: Tianxun Ruida Communications Technology Co Ltd; Tisson Regaltec Communications Tech Co Ltd
Priority date: 2018-01-31
Filing date: 2018-01-31
Publication date: 2018-07-17
Anticipated expiration: 2038-01-31
Also published as: CN108288045B

Abstract

本发明所公开的是一种移动视频直播/监控视频采集源特征分类方法，所述方法包括，S1：基于对所有预分类视频的描述信息建立词频向量，建立每个视频的词频向量；S2：根据视频的词频向量，采用余弦相似度计算每个视频与其它视频的相似度，根据相似度的大小对所有视频分成若干类。本发明提出的视频源特征分类方法，结合视频图像外的一些参数，包括关键词、地理位置等关键因素，计算移动视频采集源采集内容的相似程度，进而分成若干的类，每一种类可代表一个独立的事件，可以达到更细致、准确对视频源进行分类。

Description

一种移动视频直播/监控视频采集源特征分类方法

技术领域

本发明所涉及的技术领域是对视频进行分类的方法，具体为一种移动视频采集源特征分类方法。

技术背景

随着移动手机终端的普及以及4G网络的全面覆盖，视频移动直播、视频移动监控等新媒体互联网应用被广泛应用于人们的生产、生活中。在这种应用中，手机可作为视频采集的源，接入后端的流媒体服务节点，向公众用户发布视频图像信息。移动直播/监控视频采集源由于其随机性会带来内容意义的不断变化，但其中很多源的内容往往指向相同的社会事件。

公告号为CN107180074A的专利在2017年3月31号公开了一种视频分类方法及装置，所述方法包括：获取视频文件；提取所述视频文件中各个镜头的关键帧，得到多个视频帧；针对每个视频帧，确定该视频帧的类别；统计所有视频帧的类别和每个视频帧的时长；根据统计结果，将所述视频文件进行分类。通过本发明实施例提供的视频分类方法及装置，可以实现及时对网站上的视频进行分类，提高用户体验，节约了人力。在现有技术中，采用关键帧图像处理，去判断视频是否属于同一事件，仍存在不足。因为针对同一事件，同一场景，但拍摄者所处的拍摄角度不同，最终呈现的视频影像也会不同，就会造成关键帧的不同，从而导致属于播放同一事件的视频划分到不同的类别中，对视频做出错误的分类。

发明内容

本发明的目的是为了解决上述问题中，存在的不足，提供一种移动视频直播/监控视频采集源特征分类方法，能更好地解决视频分类的方法，每一类可代表一个独立的事件。

本发明所采用的技术方案是提供一种移动视频直播/监控视频采集源特征分类方法，所述方法包括，S1：基于对所有预分类视频的描述信息建立词频向量，建立每个视频的词频向量；S2：根据视频的词频向量，采用余弦相似度计算每个视频与其他视频的相似度，根据相似度的大小对所有视频分成若干类。

优选地，所述词频向量是由0和1组成的多元向量。

优选地，所述计算每个视频与其他视频的相似度具体为：选取任意一个视频的词频向量组，采用余弦相似度算法计算所选的视频其与其它视频的词频向量组彼此间的相似度，根据相似度的大小进行归类，在剩余的词频向量组中重新选择一个新的词频向量组，重复计算步骤，直到所有的词频向量组被选完，将所有的视频分为若干类。

优选地，所述计算所选的视频其与其它视频的词频向量组彼此间的相似度，将相似度大于阈值0.7的视频与所选视频组成归为一类。

优选地，所述的每个视频对应一个地理位置数据，基于视频的地理位置数据对视频进一步划分。

优选地，所述进一步划分的步骤包括：若干类中的任一分类中，任选一个视频，根据地理位置数据，将该视频与同类中跟所选视频地理位置上相距不超过一定距离的视频组成一个新的集合，在该集合中另选一个视频，根据地理位置数据，将该类中与所选视频地理位置上相距不超过一定距离的视频合并到新的集合中，直至集合中的视频全部被选完。

优选地，所述的一定距离为600-1200米。

本发明与现有技术相比较，具有的有益效果为：

1.采用本发明的技术方案，可以实现对移动视频采集源进行分类处理，帮助用户进行大数据挖掘分析，热点事件跟踪以及***资源划级分配等工作。

2.本发明提出的视频源特征分类方法，结合视频图像外的一些参数，包括关键词、地理位置等关键因素，计算移动视频采集源采集内容的相似程度，进而分成若干的类，每一种类可代表一个独立的事件，可以达到更细致、准确对视频源进行分类。

附图说明

图1为本发明的流程图。

图2为本发明视频源分类划分的示意过程。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下将结合附图和实施例，对本发明作进一步详细说明。

首先，基于视频的描述信息建立词频向量。一般移动视频源由发起方建立时会提供若干关键词作为标签用于对该监控事件的描述，或者会用简单摘要（可拆分为单词）描述直播或监控的相关内容，这些内容可作为挖掘直播/监控等视频的社会意义的重要依据，本方法通过关键单词出现频率建立表征视频的向量组。

S1:具体步骤如下：

1）设定已存在在线服务的视频源集合V={V₁，V₂，……，V_m}

2）设定每一个视频V_i对应一个关键词组为P_i = { P_i1，P_i2，……P_ij }，每个集合P_i所包含的词数量可不相同。

3）取A= P₁ ∪ P₂ ∪ P₃……∪P_m，则集合A包括了所有视频源的非重复独立关键词元素，数量设定为h，A={A₁，A₂，A₃，……，A_h}

4）设定A_i为视频V_i对应的一个词频向量，A_i={A_i1，A_i2，A_i3，……，A_ih}

其中向量A_ix∈A_i，则其向量取值计算方法为：

如果A_x ∈ P_i的，则A_ix = 1；

如果A_x ∉ P_i，则A_ix = 0；

因此，可得到视频的词频向量A_i，A_i由0和1组成的一个多元向量。

为了便于理解，具体例子如下，同一时间两个视频源：

视频源1，其关键词为：琶洲国际展馆、A区、食博会、***台路演

视频源2，其关键词为：琶洲国际展馆、B区、安博会、机器人制造展区

则向量分词组为A={琶洲国际展馆，A区，B区，食博会，安博会，***台路演，机器人制造展区}，则

对应视频源1的词频向量值A₁={1，1，0，1，0，1，0}

对应视频源2的词频向量值A₂={1，0，1，0，1，0，1}

S2具体步骤：基于S1步骤得到的每个视频的词频向量，采用余弦相似度算法计算视频源的相似特性，将其分为若干类。余弦相似度算法是根据向量空间的夹角大小来衡量两组多维向量相似的概率的一种有效方法。根据余弦定理求出两组向量余弦值的，余弦值越接近于1，则夹角越小，相似程度越高，余弦值越接近于0，则夹角越大，相似程度越低。当夹角为0时则可认为两组向量重合，两者完全相似，当夹角为90度时，则向量方向成直角，则可认为两者完全不相似。

5）从A₁，A₂，A₃，……，A_m随机选择一个向量组A_j，计算其与其他向量组彼此间的相似度，计算方法如下：

如A_j和另外一个向量A_y间的相似度：

6）选择与A_j相似度大于阈值0.7的视频源，与A_j组成新的一类，认为此类中的视频源内容比较相近，大概率属于监控同一个事件。

7）在剩余的向量组中重新选择一个向量组，重复步骤（5），直到所有的向量组被选完。

8）最终得到一个分类结果，Q={Q₁，Q₂……Q_w}，包含了V中的所有视频源，Q₁，Q₂……Q_w，分别代表不同的类别。

S3具体步骤：基于视频采集源的地理位置信息对S2步骤得到的类进一步划分。现实场景中很多活动名称含义是很相似，但还并不能完全确定针对同一事件，因此还需要借助于其他的因素提高对分类的判断精度。因此对于S2步骤得到的类中超过子元素大于1的类，可基于视频源上传地点的地理位置信息对S2步骤产生的类进行进一步分类，将彼此间距离较近的点再划分为一类，为最终结果。

9）设V中所有的视频源对应一个当前的地理位置数据（可以由手机终端定时采集并且上传，以经纬度方式描述）G={G₁, G₂,……G_m}，则某一个分类Qx中会包含有若干的G元素。

10）在Q中选择一个分类Qx，计算Qx中任意源节点间的直线距离，节点间的距离可标识为D_ij；

11）在Qx中任意选择一个源G_i，同时选出在Qx中所有与G_i距离D不超过阈值，阈值为1000米的所有点，与G_i组合成新的类Q_y，此时G_i可标记为Selected；在Qy中再选出一个未标识为Selected的点Gj，同时选出在Qx中所有与Gj距离D不超过阈值（比如可设定为1000米）的所有点，合并到Qy中（如有重复的点忽略即可），此时Gj可标记为Selected，重复此步骤，直到Qy中所有的点均已设定为Selected；

12)此时从Qx中将最后生成的Qy集合中的节点全部去掉，重复步骤11），直到Qx所有元素全部被选择完毕。

13）重复步骤10)、11）、12），直到所有Q中子元素大于1的类全部完成筛选。

14）综合以上方法，最终可得到一个更加细分的分类结果：Q’={Q’₁，Q’₂，……Q’_z}，Q’₁，Q’₂，……Q’_z，分别为更细致的分类，其中包含了V中的所有视频源，每一个分类中所包含的视频源可认为是较大概率指向同一事件，而不同分类中的视频源可认为没有较大的关联性。

本发明是通过实施例来描述的，但并不对本发明构成限制，参照本发明的描述，所公开的实施例的其他变化，如对于本领域的专业人士是容易想到的，这样的变化应该属于本发明权利要求限定的范围之内。

Claims

1.一种移动视频直播/监控视频采集源特征分类方法，其特征在于：所述方法包括，S1：基于对所有预分类视频的描述信息建立词频向量，建立每个视频的词频向量；S2：根据视频的词频向量，采用余弦相似度计算每个视频与其它视频的相似度，根据相似度的大小对所有视频分成若干类。

2.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法，其特征在于：上述词频向量是由0和1组成的多元向量。

3.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法，其特征在于：上述计算每个视频与其他视频的相似度具体为：选取任意一个视频的词频向量组，采用余弦相似度算法计算所选的视频其与其它视频的词频向量组彼此间的相似度，根据相似度的大小进行归类，在剩余的词频向量组中重新选择一个新的词频向量组，重复计算步骤，直到所有的词频向量组被选完，将所有的视频分为若干类。

4.根据权利要求3所述的移动视频直播/监控视频采集源特征分类方法，其特征在于：上述计算所选的视频其与其它视频的词频向量组彼此间的相似度，将相似度大于阈值0.7的视频与所选视频组成归为一类。

5.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法，其特征在于：所述的每个视频对应一个地理位置数据，基于视频的地理位置数据对视频进一步划分。

6.根据权利要求5所述的移动视频直播/监控视频采集源特征分类方法，其特征在于：所述进一步划分的步骤包括：若干类中的任一分类中，任选一个视频，根据地理位置数据，将该视频与同类中跟所选视频地理位置上相距不超过一定距离的视频组成一个新的集合，在该集合中另选一个视频，根据地理位置数据，将该类中与所选视频地理位置上相距不超过一定距离的视频合并到新的集合中，直至集合中的视频全部被选完。

7.根据权利要求6所述的移动视频直播/监控视频采集源特征分类方法，其特征在于：所述的一定距离为600-1200米。