CN108288045A - 一种移动视频直播/监控视频采集源特征分类方法 - Google Patents

一种移动视频直播/监控视频采集源特征分类方法 Download PDF

Info

Publication number
CN108288045A
CN108288045A CN201810095732.1A CN201810095732A CN108288045A CN 108288045 A CN108288045 A CN 108288045A CN 201810095732 A CN201810095732 A CN 201810095732A CN 108288045 A CN108288045 A CN 108288045A
Authority
CN
China
Prior art keywords
video
similarity
word frequency
frequency vector
live streaming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810095732.1A
Other languages
English (en)
Other versions
CN108288045B (zh
Inventor
曹雪松
熊军
徐志坤
袁媛
刘林区
李先贵
曾科锋
丘淦腾
古迅涛
徐小乐
彭尊达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianxun Ruida Communications Technology Co Ltd
Tisson Regaltec Communications Tech Co Ltd
Original Assignee
Tianxun Ruida Communications Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianxun Ruida Communications Technology Co Ltd filed Critical Tianxun Ruida Communications Technology Co Ltd
Priority to CN201810095732.1A priority Critical patent/CN108288045B/zh
Publication of CN108288045A publication Critical patent/CN108288045A/zh
Application granted granted Critical
Publication of CN108288045B publication Critical patent/CN108288045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明所公开的是一种移动视频直播/监控视频采集源特征分类方法,所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其它视频的相似度,根据相似度的大小对所有视频分成若干类。本发明提出的视频源特征分类方法,结合视频图像外的一些参数,包括关键词、地理位置等关键因素,计算移动视频采集源采集内容的相似程度,进而分成若干的类,每一种类可代表一个独立的事件,可以达到更细致、准确对视频源进行分类。

Description

一种移动视频直播/监控视频采集源特征分类方法
技术领域
本发明所涉及的技术领域是对视频进行分类的方法,具体为一种移动视频采集源特征分类方法。
技术背景
随着移动手机终端的普及以及4G网络的全面覆盖,视频移动直播、视频移动监控等新媒体互联网应用被广泛应用于人们的生产、生活中。在这种应用中,手机可作为视频采集的源,接入后端的流媒体服务节点,向公众用户发布视频图像信息。移动直播/监控视频采集源由于其随机性会带来内容意义的不断变化,但其中很多源的内容往往指向相同的社会事件。
公告号为CN107180074A的专利在2017年3月31号公开了一种视频分类方法及装置,所述方法包括:获取视频文件;提取所述视频文件中各个镜头的关键帧,得到多个视频帧;针对每个视频帧,确定该视频帧的类别;统计所有视频帧的类别和每个视频帧的时长;根据统计结果,将所述视频文件进行分类。通过本发明实施例提供的视频分类方法及装置,可以实现及时对网站上的视频进行分类,提高用户体验,节约了人力。在现有技术中,采用关键帧图像处理,去判断视频是否属于同一事件,仍存在不足。因为针对同一事件,同一场景,但拍摄者所处的拍摄角度不同,最终呈现的视频影像也会不同,就会造成关键帧的不同,从而导致属于播放同一事件的视频划分到不同的类别中,对视频做出错误的分类。
发明内容
本发明的目的是为了解决上述问题中,存在的不足,提供一种移动视频直播/监控视频采集源特征分类方法,能更好地解决视频分类的方法,每一类可代表一个独立的事件。
本发明所采用的技术方案是提供一种移动视频直播/监控视频采集源特征分类方法,所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其他视频的相似度,根据相似度的大小对所有视频分成若干类。
优选地,所述词频向量是由0和1组成的多元向量。
优选地,所述计算每个视频与其他视频的相似度具体为:选取任意一个视频的词频向量组,采用余弦相似度算法计算所选的视频其与其它视频的词频向量组彼此间的相似度,根据相似度的大小进行归类,在剩余的词频向量组中重新选择一个新的词频向量组,重复计算步骤,直到所有的词频向量组被选完,将所有的视频分为若干类。
优选地,所述计算所选的视频其与其它视频的词频向量组彼此间的相似度,将相似度大于阈值0.7的视频与所选视频组成归为一类。
优选地,所述的每个视频对应一个地理位置数据,基于视频的地理位置数据对视频进一步划分。
优选地,所述进一步划分的步骤包括:若干类中的任一分类中,任选一个视频,根据地理位置数据,将该视频与同类中跟所选视频地理位置上相距不超过一定距离的视频组成一个新的集合,在该集合中另选一个视频,根据地理位置数据,将该类中与所选视频地理位置上相距不超过一定距离的视频合并到新的集合中,直至集合中的视频全部被选完。
优选地,所述的一定距离为600-1200米。
本发明与现有技术相比较,具有的有益效果为:
1.采用本发明的技术方案,可以实现对移动视频采集源进行分类处理,帮助用户进行大数据挖掘分析,热点事件跟踪以及***资源划级分配等工作。
2.本发明提出的视频源特征分类方法,结合视频图像外的一些参数,包括关键词、地理位置等关键因素,计算移动视频采集源采集内容的相似程度,进而分成若干的类,每一种类可代表一个独立的事件,可以达到更细致、准确对视频源进行分类。
附图说明
图1为本发明的流程图。
图2为本发明视频源分类划分的示意过程。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下将结合附图和实施例,对本发明作进一步详细说明。
首先,基于视频的描述信息建立词频向量。一般移动视频源由发起方建立时会提供若干关键词作为标签用于对该监控事件的描述,或者会用简单摘要(可拆分为单词)描述直播或监控的相关内容,这些内容可作为挖掘直播/监控等视频的社会意义的重要依据,本方法通过关键单词出现频率建立表征视频的向量组。
S1:具体步骤如下:
1)设定已存在在线服务的视频源集合V={V1,V2,……,Vm}
2)设定每一个视频Vi对应一个关键词组为Pi = { Pi1,Pi2,……Pij },每个集合Pi所包含的词数量可不相同。
3)取A= P1 ∪ P2 ∪ P3……∪Pm,则集合A包括了所有视频源的非重复独立关键词元素,数量设定为h,A={A1,A2,A3,……,Ah}
4)设定Ai为视频Vi对应的一个词频向量,Ai={Ai1,Ai2,Ai3,……,Aih}
其中向量Aix∈Ai,则其向量取值计算方法为:
如果Ax ∈ Pi的,则Aix = 1;
如果Ax ∉ Pi,则Aix = 0;
因此,可得到视频的词频向量Ai,Ai由0和1组成的一个多元向量。
为了便于理解,具体例子如下,同一时间两个视频源:
视频源1,其关键词为:琶洲国际展馆、A区、食博会、***台路演
视频源2,其关键词为:琶洲国际展馆、B区、安博会、机器人制造展区
则向量分词组为A={琶洲国际展馆,A区,B区,食博会,安博会,***台路演,机器人制造展区},则
对应视频源1的词频向量值A1={1,1,0,1,0,1,0}
对应视频源2的词频向量值A2={1,0,1,0,1,0,1}
S2具体步骤:基于S1步骤得到的每个视频的词频向量,采用余弦相似度算法计算视频源的相似特性,将其分为若干类。余弦相似度算法是根据向量空间的夹角大小来衡量两组多维向量相似的概率的一种有效方法。根据余弦定理求出两组向量余弦值的,余弦值越接近于1,则夹角越小,相似程度越高,余弦值越接近于0,则夹角越大,相似程度越低。当夹角为0时则可认为两组向量重合,两者完全相似,当夹角为90度时,则向量方向成直角,则可认为两者完全不相似。
5)从A1,A2,A3,……,Am随机选择一个向量组Aj,计算其与其他向量组彼此间的相似度,计算方法如下:
如Aj和另外一个向量Ay间的相似度:
6)选择与Aj相似度大于阈值0.7的视频源,与Aj组成新的一类,认为此类中的视频源内容比较相近,大概率属于监控同一个事件。
7)在剩余的向量组中重新选择一个向量组,重复步骤(5),直到所有的向量组被选完。
8)最终得到一个分类结果,Q={Q1,Q2……Qw},包含了V中的所有视频源,Q1,Q2……Qw,分别代表不同的类别。
S3具体步骤:基于视频采集源的地理位置信息对S2步骤得到的类进一步划分。现实场景中很多活动名称含义是很相似,但还并不能完全确定针对同一事件,因此还需要借助于其他的因素提高对分类的判断精度。因此对于S2步骤得到的类中超过子元素大于1的类,可基于视频源上传地点的地理位置信息对S2步骤产生的类进行进一步分类,将彼此间距离较近的点再划分为一类,为最终结果。
9)设V中所有的视频源对应一个当前的地理位置数据(可以由手机终端定时采集并且上传,以经纬度方式描述)G={G1, G2,……Gm},则某一个分类Qx中会包含有若干的G元素。
10)在Q中选择一个分类Qx,计算Qx中任意源节点间的直线距离,节点间的距离可标识为Dij
11)在Qx中任意选择一个源Gi,同时选出在Qx中所有与Gi距离D不超过阈值,阈值为1000米的所有点,与Gi组合成新的类Qy,此时Gi可标记为Selected;在Qy中再选出一个未标识为Selected的点Gj,同时选出在Qx中所有与Gj距离D不超过阈值(比如可设定为1000米)的所有点,合并到Qy中(如有重复的点忽略即可),此时Gj可标记为Selected,重复此步骤,直到Qy中所有的点均已设定为Selected;
12)此时从Qx中将最后生成的Qy集合中的节点全部去掉,重复步骤11),直到Qx所有元素全部被选择完毕。
13)重复步骤10)、11)、12),直到所有Q中子元素大于1的类全部完成筛选。
14)综合以上方法,最终可得到一个更加细分的分类结果:Q’={Q’1,Q’2,……Q’z},Q’1,Q’2,……Q’z,分别为更细致的分类,其中包含了V中的所有视频源,每一个分类中所包含的视频源可认为是较大概率指向同一事件,而不同分类中的视频源可认为没有较大的关联性。
本发明是通过实施例来描述的,但并不对本发明构成限制,参照本发明的描述,所公开的实施例的其他变化,如对于本领域的专业人士是容易想到的,这样的变化应该属于本发明权利要求限定的范围之内。

Claims (7)

1.一种移动视频直播/监控视频采集源特征分类方法,其特征在于:所述方法包括,S1:基于对所有预分类视频的描述信息建立词频向量,建立每个视频的词频向量;S2:根据视频的词频向量,采用余弦相似度计算每个视频与其它视频的相似度,根据相似度的大小对所有视频分成若干类。
2.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:上述词频向量是由0和1组成的多元向量。
3.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:上述计算每个视频与其他视频的相似度具体为:选取任意一个视频的词频向量组,采用余弦相似度算法计算所选的视频其与其它视频的词频向量组彼此间的相似度,根据相似度的大小进行归类,在剩余的词频向量组中重新选择一个新的词频向量组,重复计算步骤,直到所有的词频向量组被选完,将所有的视频分为若干类。
4.根据权利要求3所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:上述计算所选的视频其与其它视频的词频向量组彼此间的相似度,将相似度大于阈值0.7的视频与所选视频组成归为一类。
5.根据权利要求1所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:所述的每个视频对应一个地理位置数据,基于视频的地理位置数据对视频进一步划分。
6.根据权利要求5所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:所述进一步划分的步骤包括:若干类中的任一分类中,任选一个视频,根据地理位置数据,将该视频与同类中跟所选视频地理位置上相距不超过一定距离的视频组成一个新的集合,在该集合中另选一个视频,根据地理位置数据,将该类中与所选视频地理位置上相距不超过一定距离的视频合并到新的集合中,直至集合中的视频全部被选完。
7.根据权利要求6所述的移动视频直播/监控视频采集源特征分类方法,其特征在于:所述的一定距离为600-1200米。
CN201810095732.1A 2018-01-31 2018-01-31 一种移动视频直播/监控视频采集源特征分类方法 Active CN108288045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810095732.1A CN108288045B (zh) 2018-01-31 2018-01-31 一种移动视频直播/监控视频采集源特征分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810095732.1A CN108288045B (zh) 2018-01-31 2018-01-31 一种移动视频直播/监控视频采集源特征分类方法

Publications (2)

Publication Number Publication Date
CN108288045A true CN108288045A (zh) 2018-07-17
CN108288045B CN108288045B (zh) 2020-11-24

Family

ID=62836039

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810095732.1A Active CN108288045B (zh) 2018-01-31 2018-01-31 一种移动视频直播/监控视频采集源特征分类方法

Country Status (1)

Country Link
CN (1) CN108288045B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117255212A (zh) * 2023-11-20 2023-12-19 北京泰伯科技有限公司 远程应急直播控制方法及相关设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419614A (zh) * 2008-12-03 2009-04-29 深圳市迅雷网络技术有限公司 视频资源聚类方法和装置
CN103488689A (zh) * 2013-09-02 2014-01-01 新浪网技术(中国)有限公司 基于聚类的邮件分类方法和***
CN103678702A (zh) * 2013-12-30 2014-03-26 优视科技有限公司 视频去重方法及装置
CN103838835A (zh) * 2014-02-25 2014-06-04 中国科学院自动化研究所 一种网络敏感视频检测方法
CN104182421A (zh) * 2013-05-27 2014-12-03 华东师范大学 视频聚类方法及检测方法
CN104794215A (zh) * 2015-04-27 2015-07-22 北京工业大学 一种适合大规模数据的快速递归聚类方法
CN104834686A (zh) * 2015-04-17 2015-08-12 中国科学院信息工程研究所 一种基于混合语义矩阵的视频推荐方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419614A (zh) * 2008-12-03 2009-04-29 深圳市迅雷网络技术有限公司 视频资源聚类方法和装置
CN104182421A (zh) * 2013-05-27 2014-12-03 华东师范大学 视频聚类方法及检测方法
CN103488689A (zh) * 2013-09-02 2014-01-01 新浪网技术(中国)有限公司 基于聚类的邮件分类方法和***
CN103678702A (zh) * 2013-12-30 2014-03-26 优视科技有限公司 视频去重方法及装置
CN103838835A (zh) * 2014-02-25 2014-06-04 中国科学院自动化研究所 一种网络敏感视频检测方法
CN104834686A (zh) * 2015-04-17 2015-08-12 中国科学院信息工程研究所 一种基于混合语义矩阵的视频推荐方法
CN104794215A (zh) * 2015-04-27 2015-07-22 北京工业大学 一种适合大规模数据的快速递归聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
刘璐 等: ""基于文本扩展模型的网络视频聚类方法"", 《智能***学报》 *
艾丽丽: ""基于文本挖掘的视频资源分类研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈翰: ""新闻视频的语义提取与自动分类技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄海琦: ""基于多模态策略的网络视频聚类方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117255212A (zh) * 2023-11-20 2023-12-19 北京泰伯科技有限公司 远程应急直播控制方法及相关设备
CN117255212B (zh) * 2023-11-20 2024-01-26 北京泰伯科技有限公司 远程应急直播控制方法及相关设备

Also Published As

Publication number Publication date
CN108288045B (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
Guo et al. The emergence of visual crowdsensing: Challenges and opportunities
Chen et al. Travel recommendation by mining people attributes and travel group types from community-contributed photos
CN104754413B (zh) 基于图像搜索识别电视信号并推荐信息的方法和设备
US20160034712A1 (en) System and method for event-related content discovery, curation, and presentation
CN110796098B (zh) 内容审核模型的训练及审核方法、装置、设备和存储介质
CN106203498B (zh) 一种城市场景垃圾检测方法及***
JP2018530272A (ja) ステムリソース利用を最適化するための映像セグメントの将来の視聴予測
US9275460B2 (en) Reference orientations for viewing panoramic images
Giridhar et al. On localizing urban events with instagram
US20170039264A1 (en) Area modeling by geographic photo label analysis
CN205263812U (zh) 分布式人脸识别轨迹搜索***
CN103699679A (zh) 目标对象的信息检索方法及信息检索设备
US11768871B2 (en) Systems and methods for contextualizing computer vision generated tags using natural language processing
WO2020052275A1 (zh) 图像处理方法、装置、终端设备、服务器及***
CN109902681B (zh) 用户群体关系确定方法、装置、设备及存储介质
CN103077236A (zh) 便携式设备实现视频知识采集与标注功能的***及方法
CN103577400A (zh) 一种提供地点信息的方法及***
CN105354252A (zh) 一种信息处理方法和装置
CN105631404B (zh) 对照片进行聚类的方法及装置
CN103187083B (zh) 一种基于时域视频融合的存储方法及其***
CN114708426A (zh) 目标检测方法、模型训练方法、装置、设备及存储介质
CN106250396B (zh) 一种图像标签自动生成***及方法
KR20220046692A (ko) 사진 처리 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
CN112925899B (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN108288045A (zh) 一种移动视频直播/监控视频采集源特征分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant