CN103618900A - 基于编码信息的视频感兴趣区域提取方法 - Google Patents

基于编码信息的视频感兴趣区域提取方法 Download PDF

Info

Publication number
CN103618900A
CN103618900A CN201310591430.0A CN201310591430A CN103618900A CN 103618900 A CN103618900 A CN 103618900A CN 201310591430 A CN201310591430 A CN 201310591430A CN 103618900 A CN103618900 A CN 103618900A
Authority
CN
China
Prior art keywords
frame
video
mode
current
xpn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310591430.0A
Other languages
English (en)
Other versions
CN103618900B (zh
Inventor
刘鹏宇
贾克斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Hongyi Environmental Protection Technology Co ltd
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201310591430.0A priority Critical patent/CN103618900B/zh
Publication of CN103618900A publication Critical patent/CN103618900A/zh
Application granted granted Critical
Publication of CN103618900B publication Critical patent/CN103618900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于视觉感知特征和编码信息的视频感兴趣区域提取方法,涉及视频编码领域。本发明包括以下步骤:首先从原始视频流中提取当前编码宏块的亮度信息;然后,利用当前编码宏块的帧间预测模式类型,标识空域视觉特征显著度区域;再以前一帧编码宏块分别在水平和垂直方向上的平均运动矢量为动态双阈值,根据当前编码宏块的水平及垂直方向的运动矢量与动态双阈值的比较结果,标识时域视觉特征显著度区域;最后结合空域和时域视觉特征显著度区域的标识结果,定义视频感兴趣优先级,实现视频感兴趣的自动提取。本发明方法可为基于ROI(Region of Interest,ROI)的视频编码技术提供重要编码依据。

Description

基于编码信息的视频感兴趣区域提取方法
技术领域
本发明属视频信息处理领域。利用视频编码技术和人眼视觉感知原理实现一种视频感兴趣区域快速提取方法。该方法能够对输入的视频流进行自动分析,利用编码信息标注并输出视频感兴趣区域。
背景技术
最新的视频编码标准H.264/AVC采用了多种先进的编码技术,在提高编码性能的同时,其编码复杂度也急剧增加,限制了其在多媒体信息处理与实时通信业务中的广泛应用。人们对如何提高H.264/AVC编码速度进行了深入研究,并提出了大量快速编码优化算法,但多数算法并不区分视频图像中各个区域在视觉意义上的重要程度,对所有编码内容采用相同的编码方案,忽略了人类视觉***HVS(Human Visual System,HVS)对视频场景感知的差异性。
视觉神经科学研究已证明,HVS对视频场景的感知具有选择性,对不同区域具有不同的视觉重要性。因此,利用已有编码信息进行视觉感知特征分析,再依据视觉感知特征将计算资源优先分配给感兴趣区域,对提高视频编码算法实时性、降低计算复杂度,具有重要的理论意义和应用价值。而快速、有效的视觉特征分析,特别是视觉感兴趣区域的有效检测是优化编码资源、编写高效视频编码方案的重要基础。
发明内容
本发明不同于现有的光流法、帧差法、运动能量检测法、背景差法等视频运动对象提取方法,是以视频码流中的预测模式、运动矢量等编码信息为基础,根据编码信息与视觉感兴趣区域的关联性,识别视频编码内容中的空域视觉特征显著度区域和时域特征视觉显著度区域,从而实现视频感兴趣区域的自动标识和获取。
根据HVS特征,人眼对亮度信息较之色度信息更加敏感,本发明方法针对视频序列中的亮度分量的编码信息,进行视频感兴趣区域的自动标识和获取。
本发明方法具体包括下述步骤:
步骤一:输入YUV格式、GOP(Group of Picture,GOP)结构为IPPP的视频序列,读取编码宏块的亮度分量Y,进行编码参数配置和初始化参数;
步骤二:对视频序列的首帧,即I帧进行帧内预测编码;
在视频编码标准中,I帧做为随机访问的参考点,含有大量信息,由于其不能利用相邻帧之间的时间相关性进行编码,因而采用帧内预测编码方法,利用当前帧中己编码重建宏块的编码信息对当前宏块进行预测,以消除空间冗余。对视频序列首帧,即I帧进行帧内预测编码是视频编码中惯用的一种常规编码方式。
步骤三:对当前p帧进行帧间预测编码,利用相邻帧视频内容的相关性消除时间冗余。记录当前帧内所有编码宏块的帧间预测模式类型,记为Modepn
其中,p=1,2,3,…,L-1,代表第p个进行帧间编码的视频帧,L为整个视频序列进行编码的总帧数;n表示在当前编码帧中的第n个编码宏块的序号。
步骤四:标识当前p帧的空域视觉特征显著度区域,具体为:若当前编码宏块的帧间预测模式Modepn属于亚分割模式集合或者帧内预测模式集合,即Modepn∈{8×8,8×4,4×8,4×4}or{Intra16×16,Intra4×4},则将该宏块标记为SYp(x,y,Modepn)=1,属于空域视觉特征显著度区域,否则标记SYp(x,y,Modepn)=0;其中,Y表示编码宏块的亮度分量,(x,y)表示该编码宏块的位置坐标,p和Modepn的定义同上,遍历当前p帧中的所有编码宏块;
图1给出了H.264标准帧间预测模式选择流程示意图。
经过实验,发现在H.264/AVC标准编码中,预测编码结果与人眼感兴趣区域之间具有较强相关性:对于人眼关注度较高的运动区域或者纹理丰富区域,Modepn大多选择亚分割模式集合{8×8,8×4,4×8,4×4};在镜头切换,视频内容发生突变,或者出现运动幅度较大的运动对象时,人眼关注度最高,此时Modepn才会选择帧内预测模式集合{Intra16×16,Intra4×4};对于人眼关注度较低的背景平滑区域,Modepn大多选择宏块分割模式集合{Skip,16×16,16×8,8×16}。图2以Claire序列为例,给出了Claire序列第50帧帧间预测模式分布图,从图中可以发现在人眼关注度较高的区域中,编码宏块大都选择了帧间亚分割预测模式集合。
步骤五:记录第p帧中每一个编码宏块在水平方向上的运动矢量Vxpn和在垂直方向上的运动矢量Vypn;并计算前一个编码帧中所有编码宏块在水平方向上的平均运动矢量
Figure BDA0000419026700000031
以及垂直方向上的平均运动矢量
Figure BDA0000419026700000041
其中, V ‾ x ( p - 1 ) th = Σ n = 1 Num V x ( p - 1 ) n Num , V ‾ y ( p - 1 ) th = Σ n = 1 Num V y ( p - 1 ) n Num ; Vx(p-1)n和Vy(p-1)n表示前一个编码帧中每一个编码宏块在水平和垂直方向上的运动矢量,p和n的定义与步骤三相同;Num表示一个编码帧中包含的宏块个数,也就是累加次数。图3以QCIF格式(176×144)的视频为例,给出了一个编码帧中所有编码宏块(16×16)的位置及其序号n,此时, Num = 176 16 × 144 16 = 11 × 9 = 99 .
步骤六:标识当前p帧的时域视觉特征显著度区域,具体为:若当前编码宏块的水平方向运动矢量Vxpn大于前一帧编码宏块在水平方向运动矢量平均值
Figure BDA0000419026700000044
或者当前编码宏块的垂直方向运动矢量Vypn大于前一帧编码宏块在垂直方向运动矢量平均值
Figure BDA0000419026700000045
则该宏块属于时域视觉特征显著度区域,标记TYp(x,y,Vxpn,Vypn)=1,否则标记TYp(x,y,Vxpn,Vypn)=0,遍历当前p帧中的所有编码宏块;
其中,Y表示编码宏块的亮度分量,(x,y)表示该编码宏块的位置坐标,p的定义与步骤三相同。
运动感知是人眼视觉***中最重要的视觉处理机制之一。经过实验,发现具有较大运动矢量的编码内容恰好是人眼感兴趣的运动区域(如头部、手臂、人物等);而运动矢量较小甚至为零的编码内容正是人眼关注度较低的静止背景区域。图4以Akiyo序列为例,给出了Akiyo序列第50帧运动矢量分布图,从图中可以发现在人眼关注度较高的人脸及头肩区域中,编码宏块通常具有较大的运动矢量。
当前编码宏块的运动程度剧烈与否,判定阈值的设定对结果的影响较大。为降低误判率,本发明将水平方向和垂直方向的运动程度判定阈值分别记为
Figure BDA0000419026700000051
Figure BDA0000419026700000052
Figure BDA0000419026700000053
表示前一帧中所有编码宏块在水平方向上的平均运动矢量,
Figure BDA0000419026700000054
表示前一帧中所有编码宏块在垂直方向上的平均运动矢量。本发明中动态阈值的设定,充分考虑了视频序列的时间相关性,使阈值能够随前一帧编码宏块运动矢量平均值的变化而改变,有效减少了误判,能够快速、准确地获得时域视觉特征显著度区域。
步骤七:标记当前p帧的视频感兴趣区域,具体为:遍历当前p帧中的所有编码宏块,根据每个编码宏块的空域特征显著度和时域视觉特征显著度进行标记,具体标记公式如下:
ROI Yp ( x , y ) = 3 , S Yp ( x , y , Mode pn ) = 1 | | T Yp ( x , y , V xpn , V ypn ) = 1 2 , S Yp ( x , y , Mode pn ) = 0 | | T Yp ( x , y , V xpn , V ypn ) = 1 1 , S Yp ( x , y , Mode pn ) = 1 | | T Yp ( x , y , V xpn , V ypn ) = 0 0 , S Yp ( x , y , Mode pn ) = 0 | | T Yp ( x , y , V xpn , V ypn ) = 0
标记视频感兴趣区域,分为以下几类情况:
如果当前编码宏块同时具有空域和时域视觉特征显著度,即SYp(x,y,Modepn)=1并且TYp(x,y,Vxpn,Vypn)=1,说明当前编码宏块不仅纹理细节丰富,而且产生了较大的运动矢量,则人眼感兴趣程度最高,标记ROIYp(x,y)=3;
若仅具有时域视觉特征显著度,不具有空域视觉特征显著度,即TYp(x,y,Vxpn,Vypn)=1并且SYp(x,y,Modepn)=0,说明当前编码宏块产生了较大的运动矢量,根据HVS的感知特征,人眼对物体的运动具有高度敏感性,人眼感兴趣程度次之,标记ROIYp(x,y)=2;
若宏块运动程度较低,不具有时域视觉特征显著度,但具有丰富的纹理信息,仅具有空域视觉特征显著度,即SYp(x,y,Modepn)=1并且TYp(x,y,Vxpn,Vypn)=0,人眼感兴趣程度再次,标记ROIYp(x,y)=1;
若既不具有空域视觉特征显著度也不具有时域视觉特征显著度,即SYp(x,y,Modepn)=0并且TYp(x,y,Vxpn,Vypn)=0,说明当前编码宏块纹理平坦、运动平缓或者静止,通常是静止的背景区域,则为人眼非感兴趣区域,人眼感兴趣程度最低,标记ROIYp(x,y)=0;
其中,ROIYp(x,y)代表当前编码宏块视觉感兴趣优先级;TYp(x,y,Vxpn,Vypn)代表当前编码宏块的时域视觉特征显著度;SYp(x,y,Modepn)代表当前编码宏块的空域视觉特征显著度;(x,y)表示当前编码宏块的位置坐标;Y代表宏块的亮度分量;p表示第p个进行帧间编码的视频帧;n表示在当前编码帧中的第n个编码宏块的序号。
步骤八:输出视频编码码流,具体为:根据标记的ROIYp(x,y)感兴趣优先级别高低,对当前p帧中所有宏块的亮度分量Y做如下处理,并输出标记后的视频流,
Y p ( x , y ) = 255 , ROI Yp ( x , y ) = 3 150 , ROI Yp ( x , y ) = 2 100 , ROI Yp ( x , y ) = 1 0 , ROI Yp ( x , y ) = 0
由于编码宏块的亮度分量的取值范围为Y∈[0,255],从0到255代表宏块亮度分量从全黑到全白的256个级别。根据标记的ROIYp(x,y)感兴趣优先级别高低,本发明针对宏块的亮度分量Y做如下处理,并输出标记后的视频流。
如果ROIYp(x,y)=3,感兴趣程度最高,人眼关注度最高,将该编码宏块的亮度分量设为255,输出宏块亮度分量值最高,即Yp(x,y)=255;
如果ROIYp(x,y)=2,感兴趣程度次之,人眼关注度较高,将该编码宏块的亮度分量设为150,输出宏块亮度分量值较高,即Yp(x,y)=150;
如果ROIYp(x,y)=1,感兴趣程度再次,人眼关注度较低,将该编码宏块的亮度分量设为100,输出宏块亮度分量值较低,即Yp(x,y)=100;
如果ROIYp(x,y)=0,是非感兴趣区域,人眼关注度最低,将该编码宏块的亮度分量设为0,输出宏块亮度分量值最低,即Yp(x,y)=0。
步骤九:返回步骤三,对下一帧进行处理,直到遍历整个视频序列。
图5给出了视频感兴趣区域标识与提取方法流程图。
图6给出了典型视频序列的标记后的视频感兴趣区域输出结果。有益效果
本方法根据基本编码信息实现了视频感兴趣区域的快速提取。本方法利用基本编码信息与人眼视觉感兴趣区域之间的关联性,分别识别视频编码内容中的空域视觉特征显著度区域和时域特征视觉显著度区域,再结合空域和时域视觉特征显著度区域的标识结果,定义视频感兴趣优先级,最终实现了视频感兴趣的自动提取。本发明方法可为基于感兴趣区域ROI(Region of Interest,ROI)的视频编码技术提供重要编码依据。
附图说明
图1.H.264标准帧间预测模式选择流程示意图;
图2.Claire序列第50帧帧间预测模式分布图;
图3.一个视频帧中每一个编码宏块的位置及其序号示意图;
图4.Akiyo序列第50帧运动矢量分布图;
图5.本发明方法流程图;
图6.利用本发明方法标记视频感兴趣区域的输出结果示意图。
具体实施方式
鉴于人眼对亮度信息较之色度信息更加敏感,本发明方法针对视频帧的亮度分量进行编码。先读入视频序列,提取其亮度分量,调用本发明的视频感兴趣区域提取模块完成感兴趣区域的自动标识与提取。
本发明实施中是采用视频摄取装置(如数码摄像机等)实现视频图像的采集,并将图象传输至计算机,在计算机中根据视频码流中的编码信息实现视频感兴趣区域的自动标识。依据当前编码宏块的预测编码模式标识空域视觉特征显著度区域;再依据当前编码宏块在水平或垂直方向上的运动矢量,标识时域视觉特征显著度区域,通过设定动态运动矢量判定阈值减小由于不同的视频运动类型对于感兴趣区域提取准确度的影响;最后依据空域/时域视觉特征显著度得到视频感兴趣分类结果,实现视频感兴趣区域的自动提取。
具体实施中,在计算机中完成以下程序:
第一步:根据编码配置文件encoder.cfg读入视频序列,按照配置文件中的参数配置编码器。例如:完成视频码流结构GOP=IPPP…;编码帧数FramesToBeEncoded=100;帧率FrameRate=30f/s;视频文件宽度SourceWidth=176,高度SourceHeight=144;输出文件名称OutputFile=ROI.264;量化步长值QPISlice=28,QPPSlice=28;运动估计搜索范围SearchRange=±16;参考帧数NumberReferenceFrames=5;激活率失真代价函数RDOptimization=on;设置熵编码类型SymbolMode=CAVLC等参数配置,初始化参数L=编码帧数,p=1;
第二步:从输入视频序列中按顺序逐帧读取编码宏块亮度分量值Y;
第三步:对视频序列首帧,即I帧进行帧内预测编码;
第四步:对当前p帧进行帧间预测编码;记录当前编码宏块的帧间预测模式类型Modepn;其中,p=1,2,3,…,L-1,代表第p个进行帧间编码的视频帧,L为整个视频序列进行编码的总帧数;n表示在当前编码帧中的第n个编码宏块的序号。
第五步:标识空域视觉特征显著度区域,若当前编码宏块的帧间预测模式Modepn属于亚分割模式集合或者帧内预测模式集合,Modepn∈{8×8,8×4,4×8,4×4}or{Intra16×16,Intra4×4},则将该宏块标记为SYp(x,y,Modepn)=1,属于空域视觉特征显著度区域,否则标记SYp(x,y,Modepn)=0;
S ( x , y , Mode pn ) = 1 , Mode pn ∈ { 8 × 8,8 × 4,4 × 8,4 × 4 } or { Intra 16 × 16 , Intra 4 × 4 } 0 , else
第六步:若p≠1,记录第p帧中每一个编码宏块在水平方向上的运动矢量Vxpn和在垂直方向上的运动矢量Vypn;并计算前一个编码帧中所有编码宏块在水平方向上的平均运动矢量
Figure BDA0000419026700000102
以及垂直方向上的平均运动矢量
Figure BDA0000419026700000103
否则,跳转至第十步;
第七步:标识时域视觉特征显著度区域,若当前编码宏块的水平方向运动矢量Vxpn大于前一帧编码宏块在水平方向运动矢量平均值
Figure BDA0000419026700000104
或者当前编码宏块的垂直方向运动矢量Vypn大于前一帧编码宏块在垂直方向运动矢量平均值
Figure BDA0000419026700000105
满足其中任何一个判别条件,则该宏块属于时域视觉特征显著度区域,标记TYp(x,y,Vxpn,Vypn)=1,否则标记TYp(x,y,Vxpn,Vypn)=0;
T Yp ( x , y , V xpn , V ypn ) = 1 , V xpn > V ‾ x ( p - ) th or V ypn > V ‾ t ( p - 1 ) th 0 , else
第八步:标记视频感兴趣区域。
ROI Yp ( x , y ) = 3 , S Yp ( x , y , Mode pn ) = 1 | | T Yp ( x , y , V xpn , V ypn ) = 1 2 , S Yp ( x , y , Mode pn ) = 0 | | T Yp ( x , y , V xpn , V ypn ) = 1 1 , S Yp ( x , y , Mode pn ) = 1 | | T Yp ( x , y , V xpn , V ypn ) = 0 0 , S Yp ( x , y , Mode pn ) = 0 | | T Yp ( x , y , V xpn , V ypn ) = 0
如果当前编码宏块同时具有空域和时域视觉特征显著度,即SYp(x,y,Modepn)=1并且TYp(x,y,Vxpn,Vypn)=1,则人眼感兴趣程度最高,标记ROIYp(x,y)=3;
若仅具有时域视觉特征显著度,即TYp(x,y,Vxpn,Vypn)=1并且SYp(x,y,Modepn)=0,人眼感兴趣程度次之,标记ROIYp(x,y)=2;
若仅具有空域视觉特征显著度,即SYp(x,y,Modepn)=1并且TYp(x,y,Vxpn,Vypn)=0,人眼感兴趣程度再次,标记ROIYp(x,y)=1;
若既不具有空域视觉特征显著度也不具有时域视觉特征显著度,即SYp(x,y,Modepn)=0并且TYp(x,y,Vxpn,Vypn)=0,则为人眼非感兴趣区域,标记ROIYp(x,y)=0;
第九步:输出视频编码码流。
Y p ( x , y ) = 255 , ROI Yp ( x , y ) = 3 150 , ROI Yp ( x , y ) = 2 100 , ROI Yp ( x , y ) = 1 0 , ROI Yp ( x , y ) = 0
如果ROIYp(x,y)=3,感兴趣程度最高,人眼关注度最高,将该编码宏块的亮度分量设为255,输出宏块亮度分量值最高,即Yp(x,y)=255;
如果ROIYp(x,y)=2,感兴趣程度次之,人眼关注度较高,将该编码宏块的亮度分量设为150,输出宏块亮度分量值较高,即Yp(x,y)=150;
如果ROIYp(x,y)=1,感兴趣程度再次,人眼关注度较低,将该编码宏块的亮度分量设为100,输出宏块亮度分量值较低,即Yp(x,y)=100;
如果ROIYp(x,y)=0,是非感兴趣区域,人眼关注度最低,将该编码宏块的亮度分量设为0,输出宏块亮度分量值最低,即Yp(x,y)=0。
第十步:若p≠L-1,p=p+1,跳转至第三步;否则,结束编码。
利用本发明方法标记视频感兴趣区域的输出结果示意图,如图6所示。以典型的视频监控序列(Hall)和室内活动视频序列(Salesman)为例,利用运动矢量分布结果和帧间预测模式选择结果,标记视频感兴趣区域,若某宏块的人眼感兴趣程度越高,则在输出视频中该位置处的亮度值越高,反之亮度值越低。从图6中最右侧一列的标记结果可以发现,采用本发明方法获得的视频感兴趣区域的形状是不规则的,与传统的采用固定形状模板的运动目标检测方法获得的感兴趣区域相比较,本发明方法标记结果更接近人眼所关注的感兴趣目标形状,能够更准确地标记感兴趣区域。
本发明方法还可与其他快速编码技术结合,在保证对人眼感兴趣区域编码质量的前提下,降低人眼不感兴趣的背景区域编码复杂度,进一步减少编码时间,也可用于基于H.264的可伸缩编码中,实现感兴趣区域的选择性增强编码。

Claims (1)

1.基于编码信息的视频感兴趣区域提取方法,其特征在于包括下述步骤:
步骤一:输入YUV格式、GOP(Group of Picture,GOP)结构为IPPP的视频序列,读取编码宏块的亮度分量Y,进行编码参数配置;
步骤二:对视频序列的首帧,即I帧进行帧内预测编码;
步骤三:对当前p帧进行帧间预测编码,记录当前p帧中的所有编码宏块的帧间预测模式类型,记为Modepn;p=1,2,3,…,L-1,代表第p个进行帧间编码的视频帧,L为整个视频序列进行编码的总帧数;n表示在当前编码帧中的第n个编码宏块的序号;
步骤四:标识当前p帧的空域视觉特征显著度区域,具体为:若当前编码宏块的帧间预测模式Modepn属于亚分割模式集合或者帧内预测模式集合,即Modepn∈{8×8,8×4,4×8,4×4}or{Intra16×16,Intra4×4},则将该宏块标记为SYp(x,y,Modepn)=1,属于空域视觉特征显著度区域,否则标记SYp(x,y,Modepn)=0;Y表示编码宏块的亮度分量,(x,y)表示该编码宏块的位置坐标,遍历当前p帧中的所有编码宏块;
步骤五:记录第p帧中每一个编码宏块在水平方向上的运动矢量Vxpn和在垂直方向上的运动矢量Vypn;并计算前一个编码帧中所有编码宏块在水平方向上的平均运动矢量
Figure FDA0000419026690000011
以及垂直方向上的平均运动矢量
Figure FDA0000419026690000012
Num表示一个编码帧中包含的宏块个数,即累加次数;步骤六:标识当前p帧的时域视觉特征显著度区域,具体为:若当前编码宏块的水平方向运动矢量Vxpn大于前一帧编码宏块在水平方向运动矢量平均值
Figure FDA0000419026690000022
或者当前编码宏块的垂直方向运动矢量Vypn大于前一帧编码宏块在垂直方向运动矢量平均值
Figure FDA0000419026690000023
则该宏块属于时域视觉特征显著度区域,标记TYp(x,y,Vxpn,Vypn)=1,否则标记TYp(x,y,Vxpn,Vypn)=0,遍历当前p帧中的所有编码宏块;步骤七:标记当前p帧的视频感兴趣区域,具体为:遍历当前p帧中的所有编码宏块,根据每个编码宏块的空域特征显著度和时域视觉特征显著度进行标记,具体标记公式如下: ROI Yp ( x , y ) = 3 , S Yp ( x , y , Mode pn ) = 1 | | T Yp ( x , y , V xpn , V ypn ) = 1 2 , S Yp ( x , y , Mode pn ) = 0 | | T Yp ( x , y , V xpn , V ypn ) = 1 1 , S Yp ( x , y , Mode pn ) = 1 | | T Yp ( x , y , V xpn , V ypn ) = 0 0 , S Yp ( x , y , Mode pn ) = 0 | | T Yp ( x , y , V xpn , V ypn ) = 0 如果当前编码宏块同时具有空域和时域视觉特征显著度,即SYp(x,y,Modepn)=1并且TYp(x,y,Vxpn,Vypn)=1,则标记ROIYp(x,y)=3;若当前编码宏块仅具有时域视觉特征显著度,不具有空域视觉特征显著度,即TYp(x,y,Vxpn,Vypn)=1并且SYp(x,y,Modepn)=0,则标记ROIYp(x,y)=2;若当前编码宏块不具有时域视觉特征显著度,仅具有空域视觉特征显著度,即SYp(x,y,Modepn)=1并且TYp(x,y,Vxpn,Vypn)=0,则标记ROIYp(x,y)=1;若当前编码宏块既不具有空域视觉特征显著度也不具有时域视觉特征显著度,即SYp(x,y,Modepn)=0并且TYp(x,y,Vxpn,Vypn)=0,则标记ROIYp(x,y)=0;步骤八:输出视频编码码流,具体为:根据标记的ROIYp(x,y)感兴趣优先级别高低,对当前p帧中所有宏块的亮度分量Y做如下处理,并输出标记后的视频流, Y p ( x , y ) = 255 , ROI Yp ( x , y ) = 3 150 , ROI Yp ( x , y ) = 2 100 , ROI Yp ( x , y ) = 1 0 , ROI Yp ( x , y ) = 0 步骤九:返回步骤三,对下一帧进行处理,直到遍历整个视频序列。
CN201310591430.0A 2013-11-21 2013-11-21 基于编码信息的视频感兴趣区域提取方法 Active CN103618900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310591430.0A CN103618900B (zh) 2013-11-21 2013-11-21 基于编码信息的视频感兴趣区域提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310591430.0A CN103618900B (zh) 2013-11-21 2013-11-21 基于编码信息的视频感兴趣区域提取方法

Publications (2)

Publication Number Publication Date
CN103618900A true CN103618900A (zh) 2014-03-05
CN103618900B CN103618900B (zh) 2016-08-17

Family

ID=50169604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310591430.0A Active CN103618900B (zh) 2013-11-21 2013-11-21 基于编码信息的视频感兴趣区域提取方法

Country Status (1)

Country Link
CN (1) CN103618900B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104079934A (zh) * 2014-07-14 2014-10-01 武汉大学 一种实时视频通信中的感兴趣区域提取方法
CN104539962A (zh) * 2015-01-20 2015-04-22 北京工业大学 一种融合视觉感知特征的可分层视频编码方法
CN106331711A (zh) * 2016-08-26 2017-01-11 北京工业大学 一种基于网络特征与视频特征的动态码率控制方法
CN107371029A (zh) * 2017-06-28 2017-11-21 上海大学 基于内容的视频包优先级分配方法
CN107483934A (zh) * 2017-08-17 2017-12-15 西安万像电子科技有限公司 编解码方法、装置和***
CN107563371A (zh) * 2017-07-17 2018-01-09 大连理工大学 基于线激光光条的动态搜索感兴趣区域的方法
CN107623848A (zh) * 2017-09-04 2018-01-23 浙江大华技术股份有限公司 一种视频编码方法及装置
CN109151479A (zh) * 2018-08-29 2019-01-04 南京邮电大学 基于h.264压缩域模式和空时特征的显著度提取方法
CN109379594A (zh) * 2018-10-31 2019-02-22 北京佳讯飞鸿电气股份有限公司 视频编码压缩方法、装置、设备和介质
CN109862356A (zh) * 2019-01-17 2019-06-07 中国科学院计算技术研究所 一种基于感兴趣区域的视频编码方法及***
CN110572579A (zh) * 2019-09-30 2019-12-13 联想(北京)有限公司 图像处理方法、装置及电子设备
CN110784716A (zh) * 2019-08-19 2020-02-11 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及介质
CN111079567A (zh) * 2019-11-28 2020-04-28 中科驭数(北京)科技有限公司 采样方法、模型生成方法、视频行为识别方法及装置
WO2021093059A1 (zh) * 2019-11-15 2021-05-20 网宿科技股份有限公司 一种感兴趣区域的识别方法、***及设备
WO2022127865A1 (zh) * 2020-12-18 2022-06-23 中兴通讯股份有限公司 视频处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11112973A (ja) * 1997-10-01 1999-04-23 Matsushita Electric Ind Co Ltd 映像信号変換装置及び映像信号変換方法
CN101640802A (zh) * 2009-08-28 2010-02-03 北京工业大学 基于宏块特征和统计特性的视频帧间压缩编码方法
US20120020407A1 (en) * 2010-07-20 2012-01-26 Vixs Systems, Inc. Resource adaptive video encoding system with region detection and method for use therewith
CN102510496A (zh) * 2011-10-14 2012-06-20 北京工业大学 基于感兴趣区域的快速降尺寸转码方法
CN102740073A (zh) * 2012-05-30 2012-10-17 华为技术有限公司 一种编码方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11112973A (ja) * 1997-10-01 1999-04-23 Matsushita Electric Ind Co Ltd 映像信号変換装置及び映像信号変換方法
CN101640802A (zh) * 2009-08-28 2010-02-03 北京工业大学 基于宏块特征和统计特性的视频帧间压缩编码方法
US20120020407A1 (en) * 2010-07-20 2012-01-26 Vixs Systems, Inc. Resource adaptive video encoding system with region detection and method for use therewith
CN102510496A (zh) * 2011-10-14 2012-06-20 北京工业大学 基于感兴趣区域的快速降尺寸转码方法
CN102740073A (zh) * 2012-05-30 2012-10-17 华为技术有限公司 一种编码方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘鹏宇 贾克斌: "视频感兴趣区域快速提取与编码算法", 《电路与***学报》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104079934A (zh) * 2014-07-14 2014-10-01 武汉大学 一种实时视频通信中的感兴趣区域提取方法
US10313692B2 (en) 2015-01-20 2019-06-04 Beijing University Of Technology Visual perception characteristics-combining hierarchical video coding method
CN104539962A (zh) * 2015-01-20 2015-04-22 北京工业大学 一种融合视觉感知特征的可分层视频编码方法
WO2016115968A1 (zh) * 2015-01-20 2016-07-28 北京工业大学 一种融合视觉感知特征的可分层视频编码方法
CN104539962B (zh) * 2015-01-20 2017-12-01 北京工业大学 一种融合视觉感知特征的可分层视频编码方法
CN106331711A (zh) * 2016-08-26 2017-01-11 北京工业大学 一种基于网络特征与视频特征的动态码率控制方法
CN106331711B (zh) * 2016-08-26 2019-07-05 北京工业大学 一种基于网络特征与视频特征的动态码率控制方法
CN107371029A (zh) * 2017-06-28 2017-11-21 上海大学 基于内容的视频包优先级分配方法
CN107371029B (zh) * 2017-06-28 2020-10-30 上海大学 基于内容的视频包优先级分配方法
CN107563371A (zh) * 2017-07-17 2018-01-09 大连理工大学 基于线激光光条的动态搜索感兴趣区域的方法
CN107563371B (zh) * 2017-07-17 2020-04-07 大连理工大学 基于线激光光条的动态搜索感兴趣区域的方法
CN107483934A (zh) * 2017-08-17 2017-12-15 西安万像电子科技有限公司 编解码方法、装置和***
CN107623848A (zh) * 2017-09-04 2018-01-23 浙江大华技术股份有限公司 一种视频编码方法及装置
CN107623848B (zh) * 2017-09-04 2019-11-19 浙江大华技术股份有限公司 一种视频编码方法及装置
CN109151479A (zh) * 2018-08-29 2019-01-04 南京邮电大学 基于h.264压缩域模式和空时特征的显著度提取方法
CN109379594A (zh) * 2018-10-31 2019-02-22 北京佳讯飞鸿电气股份有限公司 视频编码压缩方法、装置、设备和介质
CN109862356A (zh) * 2019-01-17 2019-06-07 中国科学院计算技术研究所 一种基于感兴趣区域的视频编码方法及***
CN109862356B (zh) * 2019-01-17 2020-11-10 中国科学院计算技术研究所 一种基于感兴趣区域的视频编码方法及***
CN110784716A (zh) * 2019-08-19 2020-02-11 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及介质
CN110784716B (zh) * 2019-08-19 2023-11-17 腾讯科技(深圳)有限公司 媒体数据处理方法、装置及介质
CN110572579A (zh) * 2019-09-30 2019-12-13 联想(北京)有限公司 图像处理方法、装置及电子设备
WO2021093059A1 (zh) * 2019-11-15 2021-05-20 网宿科技股份有限公司 一种感兴趣区域的识别方法、***及设备
CN111079567A (zh) * 2019-11-28 2020-04-28 中科驭数(北京)科技有限公司 采样方法、模型生成方法、视频行为识别方法及装置
CN111079567B (zh) * 2019-11-28 2020-11-13 中科驭数(北京)科技有限公司 采样方法、模型生成方法、视频行为识别方法及装置
WO2022127865A1 (zh) * 2020-12-18 2022-06-23 中兴通讯股份有限公司 视频处理方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103618900B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN103618900A (zh) 基于编码信息的视频感兴趣区域提取方法
Zhao et al. Real-time moving object segmentation and classification from HEVC compressed surveillance video
CN104378643B (zh) 一种3d视频深度图像帧内预测模式选择方法及***
KR101823537B1 (ko) 디지털 이미지들에서 관련된 영역들을 식별하는 방법, 디지털 이미지들을 인코딩하는 방법 및 인코더 시스템
CN102186070B (zh) 分层结构预判的快速视频编码方法
CN101783957B (zh) 一种视频预测编码方法和装置
CN1265321C (zh) 检测视频数据流中卡通的方法和***
CN100499813C (zh) 高级视频编码帧内预测的***和方法
WO2016173277A1 (zh) 视频编码方法、解码方法及其装置
CN111355956B (zh) 一种hevc帧内编码中基于深度学习的率失真优化快速决策***及其方法
CN101266132B (zh) 基于mpfg运动矢量的行车障碍检测方法
CN102724554B (zh) 一种基于场景分割的视频资源语义水印嵌入方法
CN106254868B (zh) 视频编码码率控制方法、装置及***
CN106034237B (zh) 一种基于编码切换的混合编码方法和***
JP7213662B2 (ja) 画像処理装置、画像処理方法
CN104065962A (zh) 基于视觉注意的宏块层比特分配优化方法
CN104093021A (zh) 一种监控视频压缩方法
US20150264357A1 (en) Method and system for encoding digital images, corresponding apparatus and computer program product
CN101478675A (zh) 一种视频中语义事件检测方法及***
CN100579228C (zh) 航拍交通视频快速帧间预测方法
CN106331730B (zh) H.264视频同量化因子双重压缩检测方法
CN102984524B (zh) 一种基于图层分解的视频编解码方法
KR102090775B1 (ko) 압축영상에 대한 신택스 기반의 이동객체 영역 추출 방법
US8644388B2 (en) Method and device for approximating a DC coefficient of a block of pixels of a frame
KR102015082B1 (ko) 압축영상에 대한 신택스 기반의 객체 추적 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240130

Address after: 073099 Room 309, 3rd Floor, Commercial and Residential Building B, Xinhai Science and Technology Plaza, East Side of Beimen Street and South Side of Beimen Street Market, Dingzhou City, Baoding City, Hebei Province

Patentee after: HEBEI HONGYI ENVIRONMENTAL PROTECTION TECHNOLOGY Co.,Ltd.

Country or region after: China

Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing

Patentee before: Beijing University of Technology

Country or region before: China