CN110602487B - 一种基于tsn网络的视频画面抖动检测方法 - Google Patents

一种基于tsn网络的视频画面抖动检测方法 Download PDF

Info

Publication number
CN110602487B
CN110602487B CN201910843031.6A CN201910843031A CN110602487B CN 110602487 B CN110602487 B CN 110602487B CN 201910843031 A CN201910843031 A CN 201910843031A CN 110602487 B CN110602487 B CN 110602487B
Authority
CN
China
Prior art keywords
video
optical flow
jitter
tsn
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910843031.6A
Other languages
English (en)
Other versions
CN110602487A (zh
Inventor
毛亮
王倩
李俊民
朱婷婷
王祥雪
谭焕新
侯玉清
刘双广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Gosuncn Technology Group Co Ltd
Original Assignee
Xidian University
Gosuncn Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University, Gosuncn Technology Group Co Ltd filed Critical Xidian University
Priority to CN201910843031.6A priority Critical patent/CN110602487B/zh
Publication of CN110602487A publication Critical patent/CN110602487A/zh
Application granted granted Critical
Publication of CN110602487B publication Critical patent/CN110602487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于视频质量检测技术领域,具体涉及一种基于TSN网络的视频画面抖动检测方法,包括步骤:基于TSN网络结构,利用TVL1光流算法提取正常光流场和扭曲光流场;将所述正常光流场和扭曲光流场输入到TSN网络中;通过TSN网络判断视频是否抖动,并输出抖动的帧号。基于TSN网络的视频抖动检测,可以克服传统算法不能适应环境变化和长时间范围的视频检测,还可以在减少计算量大小的同时保持非常高的检测性能;TSN网络中提出的扭曲光流能够抑制视频中人物或其他事物运动的干扰,从而进一步使得检测抖动更加精准。

Description

一种基于TSN网络的视频画面抖动检测方法
技术领域
本发明属于视频质量检测技术领域,具体涉及一种基于TSN网络的视频画面抖动检测方法。
背景技术
随着平安城市,大安防的快速发展,监控***在各个领域得到广泛应用,而监控***所传输的视频质量是影响其是否能发挥作用的重要因素,因此如何高效率的去维护监控***是视频监控领域急迫需要解决的的问题。视频画面抖动是监控***中经常出现的一种故障,所谓视频画面抖动通常是由于摄像头固定不牢固或者其它外力以及人为的作用造成视频画面出现规律性的上下、左右、或上下左右的抖动,影响视觉效果。目前常用的视频画面抖动的检测方法都是基于传统的方法,而其中使用较多的就是灰度投影法和光流法,灰度投影法其实是一种对图像分布特征进行简化提取的一种操作,以二维图像的像素行和列为单位,将图像特征转化为沿行、列坐标的曲线,从而更容易对图像分布特征进行计算,但其只适用于固定场景及简单条件下视频抖动检测且准确性相对较差;而光流法就是首先提取视频的特征点,然后利用光流算法对特征点进行跟踪,故光流非常依赖于特征点的检测好坏,如果当前环境没有办法找到比较多的角点,那估算出的位移就会比较不正确,如果想要获得比较好的效果则计算量比较大,并且光流对实际环境中移动的物体非常容易产生错误的估计,鲁棒性较差,且其不适用长时间范围和复杂环境下的视频抖动检测。
现有的一些技术基本都是基于传统的方法,但传统算法的泛化效果一般都比较差,通常是一套阈值或者一套规则只适用于特定的场景,改变场景时算法的准确率会受下降甚至失效。但应用场景和环境是***的,这对传统算法来说实现起来会大大增加难度。例如江爱文等提出一种基于前-后向光流点匹配运动熵的视频抖动检测算法,该算法首先采用ORB(oriented FAST and rotated BRIEF)算法提取视频的特征点,然后利用前向-后向光流算法对特征点进行跟踪,该算法具有很强的实时处理能力,但其存在两个问题:①光流算法对光照变化敏感且不适用于长时间跟踪,算法不适用于复杂环境下的视频抖动检测;②只判断视频是否存在抖动,不能输出抖动产生的帧序号。
发明内容
为了解决现有技术中存在的技术缺陷,本发明提出了一种基于TSN网络的视频画面抖动检测方法。
本发明通过以下技术方案实现:
一种基于TSN网络的视频画面抖动检测方法,其包括步骤:
1)基于TSN网络结构,利用TVL1光流算法提取正常光流场和扭曲光流场;
2)将所述正常光流场和扭曲光流场输入到TSN网络中;
3)通过TSN网络判断视频是否抖动,并输出抖动的帧号。
进一步地,所述TSN网络由空间流卷积网络和时间流卷积网络构成。
进一步地,将所述正常光流场和扭曲光流场作为输入,用于捕获运动信息,当实时拍摄的视频中移动物体过多时,通过所述扭曲光流场抑制物体运动,使其专注于视频中的背景运动。
进一步地,在所述步骤3)中,所述TSN网络判断包括:给定一段视频V,将V按相等间隔分为K段{S1,S2,...,SK}之后,TSN网络按如下方式对一系列片段建模:
TSN(T1,T2,...,TK)=H(G(F(T1;W),F(T2;W),...,F(TK;W)))
其中:(T1,T2,...,TK)代表片段序列,每个片段TK从其对应的段SK中随机采样得到;F(TK;W)函数代表采用W作为参数的卷积网络作用于片段TK,该函数返回TK相对于抖动类别的得分;G()为段共识函数;H()为概率预测函数。
进一步地,段共识函数G()结合多个片段的类别得分输出以获得关于类别假设的共识,基于该假设的共识,概率预测函数H()预测整段视频属于抖动类别的概率;结合标准分类交叉熵损失,关于部分共识的最终损失函数的形式为:
Figure BDA0002194320560000031
其中,C是行为总类别数;yi是类别i的groundtruth,Gi为采用聚合函数g从所有片段中相同类别的得分中推断出的抖动类别分数。
优选的,C=1,即抖动一种类别。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现基于TSN网络的视频画面抖动检测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现基于TSN网络的视频画面抖动检测方法的步骤。
与现有技术相比,本发明至少具有下述的有益效果或优点:基于TSN网络的视频抖动检测,可以克服传统算法不能适应环境变化和长时间范围的视频检测,还可以在减少计算量大小的同时保持非常高的检测性能;TSN网络中提出的扭曲光流能够抑制视频中人物或其他事物运动的干扰,从而进一步使得检测抖动更加精准。本方案使用TSN网络去检测视频抖动,充分的利用了TSN网络的优点,不仅能适应任何场景下的环境变化,还能实时检测长时间范围的视频,且能抑制视频中其他物体运动的干扰,抗干扰能力强;在应对不同场景的变换的同时,同样可以达到很好的检测效果。
附图说明
以下将结合附图对本发明做进一步详细说明;
图1为本发明的TSN网络结构结构图;
图2为本发明的视频抖动检测流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种基于TSN网络的视频画面抖动检测方法,在一个实施例中,利用行人识别原理去检测视频是否发生抖动,所谓行为识别就是从一个未知的视频或者是图像序列中自动分析其中正在进行的行为。简单的行为识别即动作分类,给定一段视频,只需将其正确分类到已知的几个动作类别,复杂点的识别是视频中不仅仅只包含一个动作类别,而是有多个,***需自动的识别出动作的类别以及动作的起始时刻,而视频抖动从直观的角度看也是一种动作行为。故可用行为识别的原理来检测视频抖动,其中TSN是目前行为识别中精度较高的算法,它是由空间流卷积网络和时间流卷积网络构成,首先将一个输入视频分为k段,一个片段从他对应的随机采样得到,不同片段的类别得分采用共识函数进行融合来产生段共识,然后对所有模式的预测融合产生最终的预测结果;能够从整个视频中学习模型参数而不是一个短的片段,采用稀疏时间采样策略,其中采样片段只包含一小部分帧,这种方法大大降低了计算开销,TSN的网络结构图如图1所示。
本方案是基于训练TSN网络来使得其学习到视频抖动特征从而检测画面是否抖动。其具体实施步骤如下:根据TSN的网络结构,首先利用TVL1光流算法(TVL1光流算法即假定连续两帧图像I0和I1,X=(x,y)是I0上一个像素点,则其光流模型的能量函数为:
Figure BDA0002194320560000051
Figure BDA0002194320560000052
其中,U=(u,v)是二维光流场,
Figure BDA0002194320560000053
Figure BDA0002194320560000054
是二维梯度,参数λ是数据项的权值常数,第一项为数据约束项,表示同一像素点在前后两帧图像间的灰度值差;第二项是运动正则化约束,即假设运动是连续的。TVL1光流的计算采用基于图像去躁的双向求解的数值分析机制来进行总变分光流能量函数的最小化方法)提取正常光流场和扭曲光流场,将光流场作为输入,致力于捕获运动信息,但当现实拍摄的视频中移动物体过多的时候,很容易因为物体的移动而产生误判,故通过扭曲光流场抑制了物体运动,使得专注于视频中的背景运动;光流场输入到TSN网络中,最终由TSN网络判断视频是否抖动以及输出抖动的帧号。其中TSN网络具体的做法是给定一段视频V,把它按相等间隔分为K段{S1,S2,…,SK}之后,TSN按如下方式对一系列片段建模:
TSN(T1,T2,...,TK)=H(G(F(T1;W),F(T2;W),...,F(TK;W)))
其中:(T1,T2,...,TK)代表片段序列,每个片段TK从它对应的段SK中随机采样得到;F(TK;W)函数代表采用W作为参数的卷积网络作用于短片段TK,函数返回TK相对于抖动类别的得分;段共识函数G结合多个短片段的类别得分输出以获得关于类别假设的共识,基于这个共识,预测函数H预测整段视频属于抖动类别的概率;结合标准分类交叉熵损失,关于部分共识的最终损失函数G的形式为:
Figure BDA0002194320560000061
其中,C是行为总类别数,在这里为1,只有抖动一种类别,yi是类别i的groundtruth(标定的真实数据),采用聚合函数g从所有片段中相同类别的得分中推断出抖动类别分数Gi,聚合函数g采用均匀平均法来表示最终识别精度。其具体流程如图2所示。
另一实施例中,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现基于TSN网络的视频画面抖动检测方法的步骤。
另一实施例中,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中所述处理器执行所述程序时实现基于TSN网络的视频画面抖动检测方法的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。在不脱离本发明之精神和范围内,所做的任何修改、等同替换、改进等,同样属于本发明的保护范围之内。

Claims (6)

1.一种基于TSN网络的视频画面抖动检测方法,其特征在于,包括步骤:
1)基于TSN网络结构,利用TVL1光流算法提取正常光流场和扭曲光流场;
2)将所述正常光流场和扭曲光流场输入到TSN网络中;
3)通过TSN网络判断视频是否抖动,并输出抖动的帧号;
其中在所述步骤3)中,所述TSN网络判断包括:给定一段视频V,将V按相等间隔分为K段{S1,S2,...,SK}之后,TSN网络按如下方式对一系列片段建模:
Figure DEST_PATH_IMAGE001
其中:
Figure 890966DEST_PATH_IMAGE002
代表片段序列,每个片段TK从其对应的段SK中随机采样得到;
Figure DEST_PATH_IMAGE003
函数代表采用W作为参数的卷积网络作用于片段TK,该函数返回TK相对于抖动类别的得分;G()为段共识函数;H()为概率预测函数;
其中,段共识函数G()结合多个片段的类别得分输出以获得关于类别假设的共识,基于该假设的共识,概率预测函数H()预测整段视频属于抖动类别的概率;结合标准分类交叉熵损失,关于部分共识的最终损失函数的形式为:
Figure 614071DEST_PATH_IMAGE004
其中,C是行为总类别数;yi是类别i的groundtruth,Gi为采用聚合函数g从所有片段中相同类别的得分中推断出的抖动类别分数。
2.根据权利要求1所述的基于TSN网络的视频画面抖动检测方法,其特征在于,所述TSN网络由空间流卷积网络和时间流卷积网络构成。
3.根据权利要求1所述的基于TSN网络的视频画面抖动检测方法,其特征在于,将所述正常光流场和扭曲光流场作为输入,用于捕获运动信息,当实时拍摄的视频中移动物体过多时,通过所述扭曲光流场抑制物体运动,使其专注于视频中的背景运动。
4.根据权利要求1所述的基于TSN网络的视频画面抖动检测方法,其特征在于,C=1,即抖动一种类别。
5.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4任一所述的基于TSN网络的视频画面抖动检测方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4任一所述的基于TSN网络的视频画面抖动检测方法的步骤。
CN201910843031.6A 2019-09-06 2019-09-06 一种基于tsn网络的视频画面抖动检测方法 Active CN110602487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910843031.6A CN110602487B (zh) 2019-09-06 2019-09-06 一种基于tsn网络的视频画面抖动检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910843031.6A CN110602487B (zh) 2019-09-06 2019-09-06 一种基于tsn网络的视频画面抖动检测方法

Publications (2)

Publication Number Publication Date
CN110602487A CN110602487A (zh) 2019-12-20
CN110602487B true CN110602487B (zh) 2021-04-20

Family

ID=68858068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910843031.6A Active CN110602487B (zh) 2019-09-06 2019-09-06 一种基于tsn网络的视频画面抖动检测方法

Country Status (1)

Country Link
CN (1) CN110602487B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116193231B (zh) * 2022-10-24 2023-07-18 成都与睿创新科技有限公司 用于处理微创手术视野异常的方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110191320A (zh) * 2019-05-29 2019-08-30 合肥学院 基于像素时序运动分析的视频抖动与冻结检测方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG81980A1 (en) * 1999-05-07 2001-07-24 Sony Prec Engineering Ct Singa Apparatus for measuring jitter in optical disc
US8054881B2 (en) * 2008-12-22 2011-11-08 Honeywell International Inc. Video stabilization in real-time using computationally efficient corner detection and correspondence
CN104135597B (zh) * 2014-07-04 2017-12-15 上海交通大学 一种视频抖动自动检测方法
CN108492287B (zh) * 2018-03-14 2020-06-02 罗普特(厦门)科技集团有限公司 一种视频抖动检测方法、终端设备及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110191320A (zh) * 2019-05-29 2019-08-30 合肥学院 基于像素时序运动分析的视频抖动与冻结检测方法及装置

Also Published As

Publication number Publication date
CN110602487A (zh) 2019-12-20

Similar Documents

Publication Publication Date Title
US10769480B2 (en) Object detection method and system
CN108830252B (zh) 一种融合全局时空特征的卷积神经网络人体动作识别方法
Gehrig et al. Combining events and frames using recurrent asynchronous multimodal networks for monocular depth prediction
WO2020173226A1 (zh) 一种时空行为检测方法
Ruiz et al. Fine-grained head pose estimation without keypoints
CN109740419B (zh) 一种基于Attention-LSTM网络的视频行为识别方法
CN103971386B (zh) 一种动态背景场景下的前景检测方法
US10198660B2 (en) Method and apparatus for event sampling of dynamic vision sensor on image formation
US9767570B2 (en) Systems and methods for computer vision background estimation using foreground-aware statistical models
US8218819B2 (en) Foreground object detection in a video surveillance system
US8218818B2 (en) Foreground object tracking
CN113286194A (zh) 视频处理方法、装置、电子设备及可读存储介质
TWI482123B (zh) 多狀態目標物追蹤方法及系統
KR101910542B1 (ko) 객체 검출을 위한 영상분석 서버장치 및 방법
US7982774B2 (en) Image processing apparatus and image processing method
CN110633643A (zh) 一种面向智慧社区的异常行为检测方法及***
CN112561951B (zh) 一种基于帧差绝对误差和sad的运动和亮度检测方法
KR20180138558A (ko) 객체 검출을 위한 영상분석 서버장치 및 방법
KR20170038144A (ko) 어텐션 검출 장치 및 어텐션 검출 방법
Liu et al. [Retracted] Self‐Correction Ship Tracking and Counting with Variable Time Window Based on YOLOv3
CN110602487B (zh) 一种基于tsn网络的视频画面抖动检测方法
Xu et al. Feature extraction algorithm of basketball trajectory based on the background difference method
CN108876807B (zh) 一种实时星载卫星图像运动对象检测跟踪方法
CN114049483A (zh) 基于事件相机的目标检测网络自监督训练方法及装置
Wu et al. A novel visual object detection and distance estimation method for hdr scenes based on event camera

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant