CN101426148A - 一种视频客观质量评价方法 - Google Patents

一种视频客观质量评价方法 Download PDF

Info

Publication number
CN101426148A
CN101426148A CN 200810162778 CN200810162778A CN101426148A CN 101426148 A CN101426148 A CN 101426148A CN 200810162778 CN200810162778 CN 200810162778 CN 200810162778 A CN200810162778 A CN 200810162778A CN 101426148 A CN101426148 A CN 101426148A
Authority
CN
China
Prior art keywords
block
frame image
current frame
video
macro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200810162778
Other languages
English (en)
Inventor
李均利
卢国庆
陈刚
魏平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo University
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN 200810162778 priority Critical patent/CN101426148A/zh
Publication of CN101426148A publication Critical patent/CN101426148A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频客观质量评价方法,优点在于通过重建视频中各个宏块与原始视频中各个宏块之间的能量差异和根据当前宏块的一些特性而对前面得到的能量差异进行加权处理从而获得重建视频的全局失真度量,可有效的利用该全局失真度量作为视频客观质量评价的评价值来评价重建视频的质量好坏,本发明方法在压缩、模糊、噪声方面均表现出了良好的性能;在计算重建视频中宏块的加权系数时,本发明考虑到了视频中场景的运动性,根据场景的运动性获取不同的运动加权系数,还考虑到了视频中的场景结构信息和亮度信息,根据结构信息和亮度信息的不同重要性获取了不同的加权系数,从而有效的提高了本发明方法的各方面的性能。

Description

一种视频客观质量评价方法
技术领域
本发明涉及一种视频质量评价技术,尤其是涉及一种视频客观质量评价方法。
背景技术
随着视频处理技术在各个领域中的广泛应用,人们发现,在不同的应用领域,对视频质量的要求也各不相同。视频数据通常先存储在用于存放视频数据的各种数据库中,然后通过网络进行视频数据传播,但在视频传播前及传播中的采样、压缩、处理、传输和重建等过程中很容易受到各种各样的失真损失,因此对视频进行有效的视频质量评价是至关重要的。
目前为止,视频质量评价方法主要分为两大类:主观质量评价方法和客观质量评价方法。主观质量评价方法较客观质量评价方法具有较强的可靠性,主观质量评价方法就是由一系列不同年龄段,从事各种职业的评估者对特定的视频进行打分评价,但主观质量评价方法由于需要许多评估者参与且需按复杂程序和步骤进行,存在实施速度缓慢、耗时长、条件要求苛刻、费用高、使用不方便等缺点,使得主观质量评价方法无论从时间还是从资金方面来说,代价都是昂贵的。因此,目前,对视频质量评价方法的研究主要集中在客观质量评价方法上。
对于视频客观质量评价方法,其中PSNR(Peak Signal to Noise Ratio,峰值信噪比)和MSE(Mean Square Error,均方根)因其具有实现过程简单和低复杂度等优点而广泛应用在视频质量评价领域,但它们与人们感知到的视频质量之间相关性比较差,只在独立不相关的噪声方面表现了良好的性能,而在压缩、模糊方面相关性较差。最近ZhouWang等人提出了一种基于结构失真的视频质量评价方法MSSIM(Mean StructuralSimilarity),这种方法是根据人眼对场景中的结构信息的高度敏感性而提出的,实验证明MSSIM要优于PSNR和MSE,并且有着良好的性能和较宽的适用范围,但是在人们进一步研究学习过程中发现,这种方法对模糊和噪声损失方面评价效果较差。后来Guang—Hao Chen等人提出了一种基于结构边缘信息的图像质量评价方法ESSIM(Edge-Based Structural Similarity),这种方法对于压缩、模糊、噪声方面性能较MSSIM略有提高,但是这种方法直接应用到视频领域时没有考虑到视频中场景的连续性和运动对象的运动性,导致这种方法在视频领域应用的性能依然不是很好。
发明内容
本发明所要解决的技术问题是提供一种视频客观质量评价方法,该方法通过重建视频中各个宏块与原始视频中各个宏块之间的能量差异和重建视频中各个宏块的加权系数获得重建视频的结构失真度量来评价视频质量。
本发明解决上述技术问题所采用的技术方案为:一种视频客观质量评价方法,包括以下步骤:
①定义外部视频捕获工具获取的未经处理的视频为原始视频,采用现有技术对原始视频的各个帧进行编码,定义当前正在处理的原始视频的帧为当前帧,当当前帧采用帧内编码时得到I帧,当当前帧采用双向空间预测编码时得到B帧,当当前帧采用单向空间预测编码时得到P帧,在对当前帧进行编码的过程中当该当前帧采用双向空间预测编码或单向空间预测编码时提取该当前帧图像中各个具有不同尺寸大小的原始宏块的运动向量值,然后将各个原始宏块划分成8×8宏块,并将被划分的原始宏块的运动向量值赋值给其划分成的各个8×8宏块,作为8×8宏块的运动向量值;
②对编码后得到的码流进行解码得到重建视频,定义重建视频中第i个帧图像为当前帧图像,根据当前帧图像中各个8×8宏块的运动向量值计算当前帧图像的平均运动向量值,再利用当前帧图像的平均运动向量值将当前帧图像确定为非剧烈运动场景或剧烈运动场景;
③计算当前帧图像中各个8×8宏块与原始视频中对应的8×8宏块之间的能量差异,根据能量差异和当前帧图像中各个8×8宏块的加权系数,利用现有的能量失真ESD算法计算当前帧图像的结构失真度量;
④采用计算重建视频中第i个帧图像的结构失真度量相同的计算方法获取重建视频中各个帧图像的结构失真度量,再利用重建视频中各个帧图像的结构失真度量计算重建视频的全局结构失真度量。
所述的步骤③的具体过程为:③-1、定义当前帧图像中第j个8×8宏块为当前8×8宏块,记为Block′i,j,将与当前8×8宏块Block′i,j相应的原始视频中的8×8宏块记为Blocki,j,将当前8×8宏块Block′i,j中各个像素的亮度值记为P′j(xj,yj),Block′i,j=[P′j(xj,yj)],将与当前8×8宏块Block′i,j相应的原始视频中的8×8宏块Blocki,j中各个像素的亮度值记为Pj(xj,yj),Blocki,j=[Pj(xj,yj)],其中,(xj,yj)为第j个8×8宏块中的像素坐标;③-2、计算Block′i,j的结构信息特征序列SI′i,j SI &prime; i , j = Block &prime; i , j &Sigma; x j , y j P &prime; j ( x j , y j ) 2 , 再利用SI′i,j计算Block′i,j的结构能量E′i,j,E′i,j=<Block′i,j,SI′i,j>,其中,符号“<>”为内积操作符号;计算Blocki,j的结构信息特征序列SIi,j SI i , j = Block i , j &Sigma; x j , y j P j ( x j , y j ) 2 , 再利用SIi,j计算Blocki,j的结构能量Ei,j,Ei,j=<Blocki,j,SIi,j>,其中,符号“<>”为内积操作符号;③-3、根据E′i,j和Ei,j值,得到Block′i,j与Blocki,j之间的能量差异|Ei,j-Ei,j′|;③-4、计算Block′i,j的加权系数wi,j,当当前帧图像为由I帧图像解码后得到的帧图像时,wi,j=li,j×ei,j,当当前帧图像为由B帧或P帧图像解码后得到的帧图像时,wi,j=li,j×ei,j×vi,j,其中,li,j为Block′i,j的亮度加权系数, l i , j = 0 &mu; i , j &le; 36 ( &mu; i , j - 36 ) / 16 36 < &mu; i , j &le; 52 1 &mu; i , j > 52 , μi,j为Block′i,j中所有像素的平均亮度值,ei,j为Block′i,j的结构加权系数, e i , j = 4 AVE _ AMP i , j &GreaterEqual; 510 2 255 &le; AVE _ AMP i , j < 510 1 AVE _ AMP i , j < 255 , AVE_AMPi,j为当前帧图像采用现有技术滤波处理后得到的当前8×8宏块中所有像素的像素平均值,vi,j为Block′i,j的运动加权系数,当当前帧图像为非剧烈运动场景时, v i , j = 1 m i , j &le; 12 2 - ( 20 - m i , j ) / 8 12 < m i , j &le; 20 2 m i , j > 20 , mi,j为Block′i,j的运动向量值,当当前帧图像为剧烈运动场景且当前帧图像中剧烈宏块个数占当前帧图像中所有8×8宏块个数的比重小于95%时, v i , j = 2 m i , j &le; 45 1 + ( 55 - m i , j ) / 10 45 < m i , j &le; 55 1 m i , j > 55 , 当当前帧图像为剧烈运动场景且当前帧图像中剧烈宏块个数占当前帧图像中所有8×8宏块个数的比重大于等于95%时, v i , j = 1 m i , j &le; 45 2 - ( 55 - m i , j ) / 10 45 < m i , j &le; 55 2 m i , j > 55 ; ③-5、采用与第j个8×8宏块相同的处理方法获取当前帧图像中各个8×8宏块与原始视频中对应的8×8宏块之间的能量差异,采用计算Block′i,j的加权系数wi,j相同的计算方法获取当前帧图像中各个8×8宏块的加权系数;③-6、利用现有的能量失真ESD(Energy of Structural Distortion,能量失真)算法计算当前帧图像的结构失真度量WESDi WESD i = &Sigma; j = 1 K &omega; i , j K ( E i , j - E &prime; i , j ) 2 , 其中,K为当前帧图像中8×8宏块的个数,wi,j为第i帧图像中第j个8×8宏块Block′i,j的加权系数,E′i,j为Block′i,j的结构能量,Ei,j为与Block′i,j相应的原始视频中的8×8宏块Blocki,j的结构能量。
所述的步骤④的具体过程为:计算重建视频的全局结构失真度量WESD, WESD = &Sigma; i = 1 F W i * WESD i &Sigma; i = 1 F W i , 其中,F为重建视频中帧图像的个数,Wi为第i个帧图像的权值, W i = 1 0 < WESD i &le; 10 2 10 < WESD i &le; 20 3 20 < WESD i &le; 30 4 30 < WESD i &le; 40 5 50 &le; WESD i , WESDi为第i个帧图像的结构失真度量。
所述的步骤③-4中当前帧图像采用现有技术滤波处理后得到的当前8×8宏块中所有像素的像素平均值AVE_AMPi,j的计算过程为:对当前帧图像采用现有的sobel滤波技术进行滤波处理,滤波处理过程中采用垂直边缘检测模板和水平边缘检测模板;将滤波处理后当前8×8宏块中坐标为(m,n)的像素的像素值记为AMPm,n,AMPm,n=|(-1)*pm-1,n-1+(-2)*pm-1,n+(-1)*pm+1,n+1+(1)*pm+1,n-1+(2)*pm+1,n+(1)*pm+1,n+1|+|(-1)*Pm-1,n-1+(-2)*pm,n+(-1)*pm+1,n+(1)*pm-1,n-1+(2)*pm,n+(1)*pm+1,n+1|,其中,pm,n为坐标为(m,n)的像素的亮度值;计算滤波处理后当前8×8宏块中所有像素的像素平均值AVE_AMPi,j AVE _ AMP i , j = &Sigma; AMP m , n &Element; ( i , j ) AMP m , n .
所述的步骤②将当前帧图像确定为非剧烈运动场景或剧烈运动场景是以当前帧图像的平均运动向量值为标准进行确定的,当当前帧图像的平均运动向量值小于16时,将当前帧图像确定为非剧烈运动场景;当当前帧图像的平均运动向量值大于等于16时,将当前帧图像确定为剧烈运动场景。
所述的③-4剧烈宏块的确定方法为:当当前帧图像为剧烈运动场景时,如果当前帧图像中的8×8宏块的运动向量值大于等于40,则该8×8宏块为剧烈宏块,否则,该8×8宏块为非剧烈宏块。
与现有技术相比,本发明的优点在于通过重建视频中各个宏块与原始视频中各个宏块之间的能量差异和根据当前宏块的一些特性而对前面得到的能量差异进行加权处理从而获得重建视频的全局失真度量,可有效的利用该全局失真度量作为视频客观质量评价的评价值来评价重建视频的质量好坏,本发明方法在压缩、模糊、噪声(包括椒盐噪声、随机噪声和部分椒盐噪声)方面均表现出了良好的性能;在计算重建视频中宏块的加权系数时,本发明考虑到了视频中场景的运动性,根据场景的运动性获取不同的运动加权系数,还考虑到了视频中的场景结构信息和亮度信息,根据结构信息和亮度信息的不同重要性获取了不同的加权系数,从而有效的提高了本发明方法的各方面的性能;原始视频中宏块的运动向量值是在编码过程中提取的,在实际应用中不需要额外的计算工作。
附图说明
图1为本发明方法的流程示意图;
图2为由VQEG组织提供的“tree”原始视频序列的第一帧图像;
图3为由VQEG组织提供的“Harp”原始视频序列的第一帧图像;
图4为由VQEG组织提供的“Canoa Valsesia”原始视频序列的第一帧图像;
图5为由VQEG组织提供的“F1 Car”原始视频序列的第一帧图像;
图6为由VQEG组织提供的“Fries”原始视频序列的第一帧图像;
图7为由VQEG组织提供的“Rugby”原始视频序列的第一帧图像;
图8a为垂直边缘检测模板;
图8b为水平边缘检测模板。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
一种视频客观质量评价方法,如图1所示,包括以下步骤:
①定义外部视频捕获工具获取的未经处理的视频为原始视频,采用现有技术对原始视频的各个帧进行编码,定义当前正在处理的原始视频的帧为当前帧,当当前帧采用帧内编码时得到I帧,当当前帧采用双向空间预测编码时得到B帧,当当前帧采用单向空间预测编码时得到P帧,在对当前帧进行编码的过程中当该当前帧采用双向空间预测编码或单向空间预测编码时提取该当前帧图像中各个具有不同尺寸大小的原始宏块的运动向量值,然后将各个原始宏块划分成8×8宏块,并将被划分的原始宏块的运动向量值赋值给其划分成的各个8×8宏块,作为8×8宏块的运动向量值。原始宏块具有以下几种尺寸大小:8×8、8×16、16×8、16×16,因为在实验过程中,基于8×8宏块进行数据处理时,评价效果最佳,所以在本发明中将原始宏块分割成8×8宏块。
本发明中原始视频直接采用由VQEG组织提供的视频序列,图2至图7给出了VQEG组织提供的6个视频序列的第一帧图像,这6个帧图像的分辨率均为720×576。图2所示的“tree”视频序列的第一帧图像,其内容特点是静态树,属于静态拍摄,场景中存在很多细节,如枝叶、树干等。图3所示的“Harp”视频序列的第一帧图像,其内容特点是弹奏竖琴,里面有一段时间,会拉近屏幕,某些细节被放大。图4所示的“Canoa Valsesia”视频序列的第一帧图像,其内容特点是划独木舟,中间有一个转弯的过程,场景画面动静结合。图5所示的“F1 Car”视频序列的第一帧图像,其内容特点是赛车比赛,中间有赛车冲出跑道,画面拉近放大的过程。图6所示的“Fries”视频序列的第一帧图像,其内容特点是炸薯条,中间有场景变化,主题明确。图7所示的“Rugby”视频序列的第一帧图像,其内容特点是橄榄球比赛,画面运动剧烈,以球为变化中心,人物很多,场面比较杂乱。
本发明中重建视频共分为以下5种质量损失,包括压缩损失、模糊损失、加入椒盐噪声、加入随机噪声和部分帧加入椒盐噪声,其中,压缩损失中,针对VQEG组织提供的6个原始视频,量化步长分别选取6、12、18、24、30;模糊损失中,针对VQEG组织提供的6个原始视频,模糊模板分别选取3×3、5×5、9×9、11×11、15×15、19×19;加入椒盐噪声中,针对VQEG组织提供的6个原始视频,加入噪声分别为0.1%、0.5%、1%、2%、5%;加入随机噪声中,针对VQEG组织提供的6个原始视频,随机变化幅度范围分别选取16、24、32、64、128;部分帧加入椒盐噪声中,针对VQEG组织提供的6个原始视频,加噪声帧的密度分别选取5%、10%、20%、30%、50%,其中噪声帧中加入噪声的密度分别选取0.1%、0.5%、1%、2%、5%。
其中,编解码环境是在由XVID组织提供的xvidcore-1.1.3版本上进行,编码参数设置如下:-i src7_ref_62501.yuv-w720-h576-type0-max_bframes2-max_key_interval90,参数说明如下:-i后面参数是输入的文件名,-w后面参数是视频宽度,-h后面参数视频高度,-type后面是视频类型,0表示是该视频的数据格式为YUV格式,-max_bframes后面参数是最大B帧的间隔,-max_key_interval后面参数是最大I帧间隔。
②对编码后得到的码流进行解码得到重建视频,定义重建视频中第i个帧图像为当前帧图像,根据当前帧图像中各个8×8宏块的运动向量值计算当前帧图像的平均运动向量值,再利用当前帧图像的平均运动向量值将当前帧图像确定为非剧烈运动场景或剧烈运动场景。在本实施例中,当前帧图像的平均运动向量值为6480个8×8宏块的运动向量值之和除以6480。8×8宏块的个数6480由当前帧图像的大小即720×576除以8×8得到。
上述当前帧图像确定为非剧烈运动场景或剧烈运动场景是以当前帧图像的平均运动向量值为标准进行确定的,当当前帧图像的平均运动向量值小于16时,将当前帧图像确定为非剧烈运动场景;当当前帧图像的平均运动向量值大于等于16时,将当前帧图像确定为剧烈运动场景。此处,值16是在实验过程中,先经过多个观察者观看视频内容,统计多个观察者各自的看法,然后将原始视频划分成以上两类,最后分析统计各类视频编码过程中原始视频的各宏块产生的运动向量值的特征而得到的值16。
③计算当前帧图像中各个8×8宏块与原始视频中对应的8×8宏块之间的能量差异,根据能量差异和当前帧图像中各个8×8宏块的加权系数,利用现有的能量失真ESD算法计算当前帧图像的结构失真度量。具体步骤如下:
③-1、定义当前帧图像中第j个8×8宏块为当前8×8宏块,记为Block′i,j,将与当前8×8宏块Block′i,j相应的原始视频中的8×8宏块记为Blocki,j,将当前8×8宏块Block′i,j中各个像素的亮度值记为P′j(xj,yj),Block′i,j=[P′j(xj,yj)],将与当前8×8宏块Block′i,j相应的原始视频中的8×8宏块Blocki,j中各个像素的亮度值记为Pj(xj,yj),Blocki,j=[Pj(xj,yj)],其中,(xj,yj)为第j个8×8宏块中的像素坐标,xj的变化范围为[1,8],yj的变化范围为[1,8]。
③-2、计算Block′i,j的结构信息特征序列SI′i,j SI &prime; i , j = Block &prime; i , j &Sigma; x j , y j P &prime; j ( x j , y j ) 2 , 再利用SI′i,j计算Block′i,j的结构能量E′i,j,E′i,j=<Block′i,j,SI′i,j>,其中,符号“<>”为内积操作符号,Block′i,j与SI′i,j的内积操作即可以看成Block′i,j在SI′i,j上的投影能量,可以有效的表示重建视频中的帧图像相对于原始视频中的帧图像的结构能量损失程度;计算Blocki,j的结构信息特征序列SIi,j SI i , j = Block i , j &Sigma; x j , y j P j ( x j , y j ) 2 , 再利用SIi,j计算Blocki,j的结构能量Ei,j,Ei,j=<Blocki,j,SIi,j>,其中,符号“<>”为内积操作符号。根据 SI i , j = Block i , j &Sigma; x j , y j P j ( x j , y j ) 2 可知,<SIi,j,SIi,j>=1,此特性保证了当与其他帧图像计算结构能量时,不会破坏其他帧图像的结构能量。
③-3、根据E′i,j和Ei,j值,得到Block′i,j与Blocki,j之间的能量差异|Ei,j-Ei,j′|。
③-4、计算Block′i,j的加权系数wi,j,当当前帧图像为由I帧图像解码后得到的帧图像时,wi,j=li,j×ei,j,当当前帧图像为由B帧或P帧图像解码后得到的帧图像时,wi,j=li,j×ei,j×vi,j
其中,li,j为Block′i,j的亮度加权系数。针对一帧图像中的黑色区域,人们往往不会注意到这部分信息,因此需将对这部分区域赋予一个较小的权值,使用块亮度信息中的平均值来判断块的亮度情况。 l i , j = 0 &mu; i , j &le; 36 ( &mu; i , j - 36 ) / 16 36 < &mu; i , j &le; 52 1 &mu; i , j > 52 , μi,j为Block′i,j中所有像素的平均亮度值,在本实施例中Block′i,j包含有64个像素。另外,此处的值36和值52是经过如下实验得到的,我们先观察一帧图像,确定亮度区域和灰度区域,然后分析并统计这两部分区域对应的实际亮度值,从而得到人眼对亮度敏感程度的一个范围,进而确定了此处的值36和值52。
其中,ei,j为Block′i,j的结构加权系数。看一帧图像时,首先会注意到这帧图像中的轮廓和边缘信息,轮廓和边缘信息是一帧图像中的最重要信息,因此,对于不同重要程度的宏块给予不同大小的权值。 e i , j = 4 AVE _ AMP i , j &GreaterEqual; 510 2 255 &le; AVE _ AMP i , j < 510 1 AVE _ AMP i , j < 255 , AVE_AMPi,j为当前帧图像采用现有技术滤波处理后得到的当前8×8宏块中所有像素的像素平均值,AVE_AMPi,j的计算过程为:对当前帧图像采用现有的sobel滤波技术进行滤波处理,滤波处理过程中采用图8a所示的垂直边缘检测模板和图8b所示的水平边缘检测模板;将滤波处理后当前8×8宏块中坐标为(m,n)的像素的像素值记为AMPm,n,AMPm,n=|(-1)*pm-1,n-1+(-2)*Pm-1,n+(-1)*pm+1,n+1+(1)*pm+1,n-1+(2)*pm+1,n+(1)*pm+1,n+1|+|(-1)*pm-1,n-1+(-2)*pm,n+(-1)*pm+1,n+(1)*pm-1,n-1+(2)*pm,n+(1)*pm+1,n+1|,其中,pm,n为坐标为(m,n)的像素的亮度值;计算滤波处理后当前8×8宏块中所有像素的像素平均值AVE_AMPi,j AVE _ AMP i , j = &Sigma; AMP m , n &Element; ( i , j ) AMP m , n 。在此,值255、510是经过如下实验得到,首先我们对一帧图像进行滤波处理,然后显示滤波后值(AMPm,n)大于一指定域值那部分图像,指定域值可以为由大量统计后得到的比较理想的值510,从图像中可以获知这部分区域是重要的轮廓边缘信息,在值510附近做小范围的浮动,整体结果变化不大。值255也是经过这样的实验得到,最后是经过整体测试结果来最终确定这些值的。
其中,vi,j为Block′i,j的运动加权系数。当当前帧图像为非剧烈运动场景时,即整个场景特点是场景变化不大且只有部分对象在运动或变化, v i , j = 1 m i , j &le; 12 2 - ( 20 - m i , j ) / 8 12 < m i , j &le; 20 2 m i , j > 20 , mi,j为Block′i,j的运动向量值,当当前帧图像为剧烈运动场景且当前帧图像中剧烈宏块个数占当前帧图像中所有8×8宏块个数的比重小于95%时,说明大部分对象变化不是很明显,而是一部分对象在高速运动,这部分高速运动的对象是主体,人们注意力会集中在高速运动的对象上,因此给予高速运动的对象一个高的权值, v i , j = 2 m i , j &le; 45 1 + ( 55 - m i , j ) / 10 45 < m i , j &le; 55 1 m i , j > 55 , 当当前帧图像为剧烈运动场景且当前帧图像中剧烈宏块个数占当前帧图像中所有8×8宏块个数的比重大于等于95%时,说明运动剧烈的宏块较多,这时人们会更关注相对变化较小的对象, v i , j = 1 m i , j &le; 45 2 - ( 55 - m i , j ) / 10 45 < m i , j &le; 55 2 m i , j > 55 ; 。此外,值95%是首先过对视频运动信息数据进行分析统计,得到一个大概值,然后根据实验结果进行调整而得到的一个值。此处,值12、20、45、55是根据实际视频中对应的块运动信息值,分析并统计其变化范围而得到的。
上述剧烈宏块的确定方法为:当当前帧图像为剧烈运动场景时,如果当前帧图像中的8×8宏块的运动向量值大于等于40,则该8×8宏块为剧烈宏块,否则,该8×8宏块为非剧烈宏块。此处,值40是根据视频实际的运动信息值分析而得到的。
③-5、采用与第j个8×8宏块相同的处理方法获取当前帧图像中各个8×8宏块与原始视频中对应的8×8宏块之间的能量差异,采用计算Block′i,j的加权系数wi,j相同的计算方法获取当前帧图像中各个8×8宏块的加权系数。
③-6、利用现有的能量失真ESD算法计算当前帧图像的结构失真度量WESDi WESD i = &Sigma; j = 1 K &omega; i , j K ( E i , j - E &prime; i , j ) 2 , 其中,K为当前帧图像中8×8宏块的个数,在此实施例中,K=(720×576)/(8×8)=6480,wi,j为第i帧图像中第j个8×8宏块Block′i,j的加权系数,E′i,j为Block′i,j的结构能量,Ei,j为与Block′i,j相应的原始视频中的8×8宏块Blocki,j的结构能量。
④采用计算重建视频中第i个帧图像的结构失真度量相同的计算方法获取重建视频中各个帧图像的结构失真度量,再利用重建视频中各个帧图像的结构失真度量计算重建视频的全局结构失真度量。具体过程为:计算重建视频的全局结构失真度量WESD, WESD = &Sigma; i = 1 F W i * WESD i &Sigma; i = 1 F W i , 其中,F为重建视频中帧图像的个数,Wi为第i个帧图像的权值, W i = 1 0 < WESD i &le; 10 2 10 < WESD i &le; 20 3 20 < WESD i &le; 30 4 30 < WESD i &le; 40 5 50 &le; WESD i , WESDi为第i个帧图像的结构失真度量。将最终得到的全局结构失真度量作为视频客观质量评价的评价值。在此,值10、20、30、40、50是根据做主观实验时,打分时会划分出5个标准,加上人的思维方式如非常好、好、一般、不好、非常差等的影响,而划分出的,另外具体值时根据实验测试结果而最终定下来的。
对采用本发明方法与采用现有的PSNR、MSSIM和ESSIM方法,在相同的实验条件下进行视频客观质量评价对比实验,实验结果如表1至表5所示。
表1压缩损失比较数据
Figure A200810162778D00153
表2模糊损失比较数据
Figure A200810162778D00154
表3部分椒盐噪声损失比较数据
表4椒盐噪声损失比较数据
表5随机噪声损失比较数据
Figure A200810162778D00162
表1至表5中pearson和RMSE用于反映模型预测的准确性,spearman用于反映模型预测的单调性。其中,二次曲线回归数据是在spss12.0版本上计算得来的。
分析表1至表5我们可以得到以下结论:
A.本发明的客观质量评价方法在整体评价结果中,针对压缩损失、模糊损失、加入椒盐噪声、加入随机噪声和部分帧加入椒盐噪声这5种失真,综合性能是最好的。
B.在压缩损失上,本发明的客观质量评价结果最佳,明显优于PSNR、MSSIM和ESSIM方法。
C.在模糊损失上,本发明的客观质量评价结果要明显优于PSNR、MSSIM和ESSIM方法,弥补了现有的三种方法在这方面表现出来的缺陷。
D.在噪声损失中,虽然性能要略差于PSNR,但是要明显优于MSSIM和ESSIM方法,接近PSNR的视频效果。

Claims (6)

1、一种视频客观质量评价方法,其特征在于包括以下步骤:
①定义外部视频捕获工具获取的未经处理的视频为原始视频,采用现有技术对原始视频的各个帧进行编码,定义当前正在处理的原始视频的帧为当前帧,当当前帧采用帧内编码时得到I帧,当当前帧采用双向空间预测编码时得到B帧,当当前帧采用单向空间预测编码时得到P帧,在对当前帧进行编码的过程中当该当前帧采用双向空间预测编码或单向空间预测编码时提取该当前帧图像中各个具有不同尺寸大小的原始宏块的运动向量值,然后将各个原始宏块划分成8×8宏块,并将被划分的原始宏块的运动向量值赋值给其划分成的各个8×8宏块,作为8×8宏块的运动向量值;
②对编码后得到的码流进行解码得到重建视频,定义重建视频中第i个帧图像为当前帧图像,根据当前帧图像中各个8×8宏块的运动向量值计算当前帧图像的平均运动向量值,再利用当前帧图像的平均运动向量值将当前帧图像确定为非剧烈运动场景或剧烈运动场景;
③计算当前帧图像中各个8×8宏块与原始视频中对应的8×8宏块之间的能量差异,根据能量差异和当前帧图像中各个8×8宏块的加权系数,利用现有的能量失真ESD算法计算当前帧图像的结构失真度量;
④采用计算重建视频中第i个帧图像的结构失真度量相同的计算方法获取重建视频中各个帧图像的结构失真度量,再利用重建视频中各个帧图像的结构失真度量计算重建视频的全局结构失真度量。
2、根据权利要求1所述的一种视频客观质量评价方法,其特征在于所述的步骤③的具体过程为:③-1、定义当前帧图像中第j个8×8宏块为当前8×8宏块,记为Bloc′i,j,将与当前8×8宏块Block′i,j相应的原始视频中的8×8宏块记为Blocki,j,将当前8×8宏块Block′i,j中各个像素的亮度值记为P′j(xj,yj),Block′i,j=[P′j(xj,yj)],将与当前8×8宏块Block′i,j相应的原始视频中的8×8宏块Blocki,j中各个像素的亮度值记为Pj(xj,yj),Blocki,j=[Pj(xj,yj)],其中,(xj,yj)为第j个8×8宏块中的像素坐标;③-2、计算Block′i,j的结构信息特征序列SI′i,j SI &prime; ij = Block &prime; i , j &Sigma; x j , y j P &prime; j ( x j , y j ) 2 ,再利用SI′i,j计算Block′i,j的结构能量E′i,j E &prime; i , j = &lang; Block &prime; i , j , SI &prime; i , j &rang; ,其中,符号“<>”为内积操作符号;计算Blocki,j的结构信息特征序列SIi,j SI ij = Block i , j &Sigma; x j , y j P j ( x j , y j ) 2 ,再利用SIi,j计算Blocki,j的结构能量Ei,j E i , j = &lang; Block i , j , SI i , j &rang; ,其中,符号“<>”为内积操作符号;③-3、根据E′i,j和Ei,j值,得到Block′i,j与Blocki,j之间的能量差异|Ei,j-Ei,j′|;③-4、计算Block′i,j的加权系数wi,j,当当前帧图像为由I帧图像解码后得到的帧图像时,wi,j=li,j×ei,j,当当前帧图像为由B帧或P帧图像解码后得到的帧图像时,wi,j=li,j×ei,j×vi,j,其中,li,j为Block′i,j的亮度加权系数, l ij = 0 &mu; i , j &le; 36 ( &mu; i , j - 36 ) / 16 36 < &mu; i , j &le; 52 1 &mu; i , j > 52 , μi,j为Block′i,j中所有像素的平均亮度值,ei,j为Block′i,j的结构加权系数, e ij = 4 AVE _ AMP i , j &GreaterEqual; 510 2 255 &le; AVE _ AMP i , j < 510 1 AVE _ AMP i , j < 255 ,AVE_AMPi,j为当前帧图像采用现有技术滤波处理后得到的当前8×8宏块中所有像素的像素平均值,vi,j为Block′i,j的运动加权系数,当当前帧图像为非剧烈运动场景时, v ij = 1 m i j &le; 12 2 - ( 20 - m i j ) / 8 12 < m i j &le; 20 2 m i j > 20 ,mij为Block′i,j的运动向量值,当当前帧图像为剧烈运动场景且当前帧图像中剧烈宏块个数占当前帧图像中所有8×8宏块个数的比重小于95%时, v ij = 2 m i j &le; 45 1 + ( 55 - m i j ) / 10 45 < m i j &le; 55 1 m i j > 55 ,当当前帧图像为剧烈运动场景且当前帧图像中剧烈宏块个数占当前帧图像中所有8×8宏块个数的比重大于等于95%时, v ij = 1 m i j &le; 45 2 - ( 55 - m i j ) / 10 45 < m i j &le; 55 2 m i j > 55 ;③-5、采用与第j个8×8宏块相同的处理方法获取当前帧图像中各个8×8宏块与原始视频中对应的8×8宏块之间的能量差异,采用计算Block′i,j的加权系数wi,j相同的计算方法获取当前帧图像中各个8×8宏块的加权系数;③-6、利用现有的能量失真ESD算法计算当前帧图像的结构失真度量WESDi WESD i = &Sigma; j = 1 K &omega; i , j K ( E i , j - E &prime; i , j ) 2 ,其中,K为当前帧图像中8×8宏块的个数,wi,j为第i帧图像中第j个8×8宏块Block′i,j的加权系数,E′i,j为Block′i,j的结构能量,Ei,j为与Block′i,j相应的原始视频中的8×8宏块Blocki,j的结构能量。
3、根据权利要求2所述的一种视频客观质量评价方法,其特征在于所述的步骤④的具体过程为:计算重建视频的全局结构失真度量WESD, WESD = &Sigma; i = 1 F W i * WESD i &Sigma; i = 1 F W i ,其中,F为重建视频中帧图像的个数,Wi为第i个帧图像的权值, W i = 1 0 < WESD i &le; 10 2 10 < WESD i &le; 20 3 20 < WESD i &le; 30 4 30 < WESD i &le; 40 5 50 < WESD i , WESDi为第i个帧图像的结构失真度量。
4、根据权利要求2所述的一种视频客观质量评价方法,其特征在于所述的步骤③-4中当前帧图像采用现有技术滤波处理后得到的当前8×8宏块中所有像素的像素平均值AVE_AMPi,j的计算过程为:对当前帧图像采用现有的sobel滤波技术进行滤波处理,滤波处理过程中采用垂直边缘检测模板和水平边缘检测模板;将滤波处理后当前8×8宏块中坐标为(m,n)的像素的像素值记为AMPm,n,AMPm,n=|(-1)*pm-1,n-1+(-2)*pm-1,n+(-1)*pm+1,n+1+(1)*pm+1,n-1+(2)*pm+1,n+(1)*pm+1,n+1|+|(-1)*pm-1,n-1+(-2)*pm,n+(-1)*pm+1,n+(1)*pm-1,n-1+(2)*pm,n+(1)*pm+1,n+1|,其中,pm,n为坐标为(m,n)的像素的亮度值;计算滤波处理后当前8×8宏块中所有像素的像素平均值AVE_AMPi,j AVE _ AMP i , j = &Sigma; AMP m , n &Element; ( i , j ) AMP m , n .
5、根据权利要求1所述的一种视频客观质量评价方法,其特征在于所述的步骤②将当前帧图像确定为非剧烈运动场景或剧烈运动场景是以当前帧图像的平均运动向量值为标准进行确定的,当当前帧图像的平均运动向量值小于16时,将当前帧图像确定为非剧烈运动场景;当当前帧图像的平均运动向量值大于等于16时,将当前帧图像确定为剧烈运动场景。
6、根据权利要求2所述的一种视频客观质量评价方法,其特征在于所述的③-4剧烈宏块的确定方法为:当当前帧图像为剧烈运动场景时,如果当前帧图像中的8×8宏块的运动向量值大于等于40,则该8×8宏块为剧烈宏块,否则,该8×8宏块为非剧烈宏块。
CN 200810162778 2008-12-01 2008-12-01 一种视频客观质量评价方法 Pending CN101426148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810162778 CN101426148A (zh) 2008-12-01 2008-12-01 一种视频客观质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810162778 CN101426148A (zh) 2008-12-01 2008-12-01 一种视频客观质量评价方法

Publications (1)

Publication Number Publication Date
CN101426148A true CN101426148A (zh) 2009-05-06

Family

ID=40616438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810162778 Pending CN101426148A (zh) 2008-12-01 2008-12-01 一种视频客观质量评价方法

Country Status (1)

Country Link
CN (1) CN101426148A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102026001A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 基于运动信息的视频帧重要性评估方法
CN102036099A (zh) * 2010-12-30 2011-04-27 杭州华三通信技术有限公司 一种分析图像质量的方法和装置
WO2012000137A1 (en) * 2010-07-02 2012-01-05 Thomson Broadband R&D (Beijing) Co., Ltd. Method for measuring quality of a video with at least two different views, and corresponding device
CN101827280B (zh) * 2010-02-04 2012-03-21 深圳市同洲电子股份有限公司 视频输出质量的检测方法和装置
CN102917157A (zh) * 2012-10-19 2013-02-06 北京快联科技有限公司 一种基于人体视觉***的图片压缩***及方法
CN102984540A (zh) * 2012-12-07 2013-03-20 浙江大学 一种基于宏块域失真度估计的视频质量评价方法
CN103780895A (zh) * 2014-01-16 2014-05-07 天津大学 一种立体视频质量评价方法
CN106851261A (zh) * 2017-02-23 2017-06-13 中国矿业大学 一种基于gop的视频质量评价方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101827280B (zh) * 2010-02-04 2012-03-21 深圳市同洲电子股份有限公司 视频输出质量的检测方法和装置
WO2012000137A1 (en) * 2010-07-02 2012-01-05 Thomson Broadband R&D (Beijing) Co., Ltd. Method for measuring quality of a video with at least two different views, and corresponding device
CN102036099A (zh) * 2010-12-30 2011-04-27 杭州华三通信技术有限公司 一种分析图像质量的方法和装置
CN102026001A (zh) * 2011-01-06 2011-04-20 西安电子科技大学 基于运动信息的视频帧重要性评估方法
CN102026001B (zh) * 2011-01-06 2012-07-25 西安电子科技大学 基于运动信息的视频帧重要性评估方法
CN102917157A (zh) * 2012-10-19 2013-02-06 北京快联科技有限公司 一种基于人体视觉***的图片压缩***及方法
CN102984540A (zh) * 2012-12-07 2013-03-20 浙江大学 一种基于宏块域失真度估计的视频质量评价方法
CN103780895A (zh) * 2014-01-16 2014-05-07 天津大学 一种立体视频质量评价方法
CN103780895B (zh) * 2014-01-16 2015-11-04 天津大学 一种立体视频质量评价方法
CN106851261A (zh) * 2017-02-23 2017-06-13 中国矿业大学 一种基于gop的视频质量评价方法

Similar Documents

Publication Publication Date Title
Athar et al. A comprehensive performance evaluation of image quality assessment algorithms
Liu et al. End-to-End Blind Quality Assessment of Compressed Videos Using Deep Neural Networks.
CN101426148A (zh) 一种视频客观质量评价方法
Ponomarenko et al. A new color image database TID2013: Innovations and results
Agustsson et al. Ntire 2017 challenge on single image super-resolution: Dataset and study
CN110992275B (zh) 一种基于生成对抗网络的细化单幅图像去雨方法
Gu et al. Multiscale natural scene statistical analysis for no-reference quality evaluation of DIBR-synthesized views
CN107483920B (zh) 一种基于多层级质量因子的全景视频评估方法及***
Fu et al. Screen content image quality assessment using multi-scale difference of Gaussian
Wang et al. Reduced-reference image quality assessment using a wavelet-domain natural image statistic model
CN102611910B (zh) 基于关键帧图像质量加权的无参考视频质量客观评价方法
CN100559880C (zh) 一种基于自适应st区的高清视频图像质量评价方法及装置
CN104079925B (zh) 基于视觉感知特性的超高清视频图像质量客观评价方法
CN105208374A (zh) 一种基于深度学习的无参考图像质量客观评价方法
CN101562675B (zh) 基于Contourlet变换的无参考型图像质量评测方法
Cheng et al. Screen content video quality assessment: Subjective and objective study
Lu et al. Deep neural network for blind visual quality assessment of 4K content
CN108347612A (zh) 一种基于视觉注意机制的监控视频压缩与重构方法
CN109447903B (zh) 一种半参考型超分辨率重构图像质量评价模型的建立方法
Chen et al. Blind quality assessment for cartoon images
CN107197297A (zh) 一种检测基于dct系数隐写的视频隐写分析方法
He et al. A visual residual perception optimized network for blind image quality assessment
CN108830829B (zh) 联合多种边缘检测算子的无参考质量评价算法
Moreno et al. Towards no-reference of peak signal to noise ratio
Li et al. Gradient-weighted structural similarity for image quality assessments

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090506