CN112508847A - 一种基于深度特征与结构加权lbp特征的图像质量评价方法 - Google Patents

一种基于深度特征与结构加权lbp特征的图像质量评价方法 Download PDF

Info

Publication number
CN112508847A
CN112508847A CN202011225809.6A CN202011225809A CN112508847A CN 112508847 A CN112508847 A CN 112508847A CN 202011225809 A CN202011225809 A CN 202011225809A CN 112508847 A CN112508847 A CN 112508847A
Authority
CN
China
Prior art keywords
image
lbp
gradient
distorted
distorted image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011225809.6A
Other languages
English (en)
Inventor
郑元林
于淼淼
廖开阳
赵金娟
邓轩
李佳
楼豪杰
范冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202011225809.6A priority Critical patent/CN112508847A/zh
Publication of CN112508847A publication Critical patent/CN112508847A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于深度特征与结构加权LBP特征的图像质量评价方法,具体为:将原始图像和失真图像转变为YCrCb颜色空间;提取梯度特征,并将YCrCb空间的图像反变换,得到增强图像;将增强图像作为预训练的VGG16深度模型的输入,计算图像相似度,得到相似性深度图;提取频域相位特征,并与失真图像的梯度特征进行融合,得到结构图,然后提取LBP特征,得到基于结构加权的LBP特征;分别提取每个相似性深度图的均值,提取颜色相似性特征的均值、标准偏差、熵,并与50维的基于结构加权的LBP特征进行多特征融合,生成373维特征向量;将373维特征向量以及平均主观分数MOS值采用随机森林RF策略训练IQA模型,训练好的模型对彩色失真图像质量的准确预测和评估。

Description

一种基于深度特征与结构加权LBP特征的图像质量评价方法
技术领域
本发明属于图像质量评价方法技术领域,涉及一种基于深度特征与结构加权LBP特征的图像质量评价方法。
背景技术
随着数字媒体技术的飞速发展,各行各业对数字图像的质量都提出了越来越高的要求,在医学成像领域中,高质量的医学图像有助于医生准确的判断病人的病情,做到及时对症下药;在图像识别中,高质量的图像是确保图像识别准确性和可靠性的关键因素;在军事领域中,战场监视和精确打击的效果取决于无人机等航拍设备所拍摄到的图像或视频的质量。
然而,图像在经过获取、处理、传输和存储等各个环节,由于各种因素的影响,如成像设备、内嵌的图像处理方法、传输介质、编码压缩技术等的不完善,会导致图像质量发生退化现象,无法忠实的还原原始图像,不仅影响其视觉可观性,同时影响其实际应用效果。
目前,大多数图像质量评价方法仅提取图像的空域特征、频域特征或统计特征,没有考虑到将这些传统特征与使用深度模型(如:VGG16网络)提取的深度特征进行融合,这些深度特征涵盖了图像从低维到高维的特征,与其它特征组合能够更全面的描述图像的失真效应。另外,很多方法仅能在一个图像数据库中表现良好,但不适用于所有数据库,模型的泛化性有待加强,对图像质量评价的准确性方面也需进一步提高。
发明内容
本发明的目的是提供一种基于深度特征与结构加权LBP特征的图像质量评价方法,通过提取图像的颜色特征、结构加权LBP特征与使用VGG16深度模型提取的深度特征进行融合,实现对彩色失真图像质量的精确预测和评估。
本发明所采用的技术方案是,一种基于深度特征与结构加权LBP特征的图像质量评价方法,具体按照以下步骤实施:
步骤1、转换图像的颜色空间,将原始图像和失真图像由RGB颜色空间转变为YCrCb颜色空间;
步骤2、在亮度通道Y中提取原始图像和失真图像的梯度特征,将梯度特征与图像的亮度通道进行融合,并将YCrCb空间的图像反变换,得到基于梯度域的RGB增强图像;
步骤3、将原始图像和失真图像的RGB增强图像分别作为预训练的VGG16深度模型的输入,并计算五个池化层下的图像相似度,得到相似性深度图;
步骤4、在亮度通道Y中提取失真图像的频域相位特征,并与失真图像的梯度特征进行融合,得到失真图像的结构图,然后在该结构图中提取LBP特征,得到失真图像的50维的基于结构加权的LBP特征;
步骤5、计算原始图像和失真图像分别在两个色度通道Cr、Cb中的相似性,两者乘积即为提取的图像颜色相似性特征;
步骤6、分别提取每个相似性深度图的均值,提取颜色相似性特征的均值、标准偏差、熵,并与50维的基于结构加权的LBP特征进行多特征融合,生成一个表征其失真效应的373维的特征向量;
步骤7、将图像数据库中所有图像提取的373维特征向量以及相应的平均主观分数MOS或DMOS值采用随机森林RF策略训练IQA模型,训练好的模型即可实现对彩色失真图像质量的准确预测和评估。
步骤1中Y表示明亮度,Cr和Cb表示色度;对于一幅RGB图像,其颜色空间转变过程可表示为:
Figure BDA0002763617820000031
实现将图像的亮度通道和色度通道进行分离。
步骤2具体为:
步骤2.1、选择大小为5×5并包含0°、90°、45°及135°四个方向的高通滤波模板分别对原始图像的Y通道图像做卷积运算来提取梯度特征,具体操作如下:
Figure BDA0002763617820000032
其中:(x,y)表示图像中像素点的坐标,Gk(x,y)(其中k分别取1,2,3,4)表示使用M1、M2、M3、M4四个高通滤波模板进行卷积运算后所得到的分别对应于0°、90°、45°、135°方向的四个梯度分量,(i,j)表示高通滤波模板中像素点的坐标;
步骤2.2、用步骤2.1得到的四个梯度分量G1(x,y)、G2(x,y)、G3(x,y)、G4(x,y)计算原始图像的梯度幅度值,具体计算过程如下:
Figure BDA0002763617820000033
其中:Gm(x,y)表示融合0°和90°方向的梯度幅度分量,Gn(x,y)表示融合45°和135°方向的梯度幅度分量,GMap表示在四个方向上提取的梯度幅度值;
步骤2.3、将计算得到的梯度特征GMap1和GMap2与亮度通道Y进行融合,并将YCrCb空间的图像进行反变换,得到基于梯度域的RGB增强图像。
步骤2.3具体为:
步骤2.3.1、将原始图像的梯度特征与亮度通道Y1(Y2)进行融合:
Y1=GMap1+Y1 (4)
Y2=GMap2+Y2 (5)
其中:等式左边的Y1和Y2即分别表示原始图像和失真图像融合梯度特征后的亮度通道;
步骤2.3.2、将原始图像和失真图像的颜色空间进行反变换,由YCrCb颜色空间转换为RGB颜色空间,转换过程为:
Figure BDA0002763617820000041
其中:等式右边的亮度通道Y即为使用式(4)和(5)进行融合后原始图像和失真图像的亮度通道。
步骤3具体为:
调整原始图像和失真图像的大小为(224,224),并分别作为预训练的VGG16深度模型的输入;该模型总共有五个池化层,分别对应有64、128、256、512和512个通道数量;取每个池化层前64个通道的特征图像,计算原始图像和失真图像分别对应于每一个通道下的图像相似度,计算过程如下:
Figure BDA0002763617820000051
其中:X表示像素点,
Figure BDA0002763617820000052
表示原始图像第M(M∈(1,5))个池化层第N(N∈(1,64))个通道的特征图像;C1(C1=1.27)为正常量,防止分母为零而造成Poolsim的不稳定,得到320个相似性深度图。
步骤4具体为:
步骤4.1、在亮度通道Y中提取失真图像的频域相位特征,在频域中使用Log-Gabor滤波器对图像做卷积运算;具体的,对图像进行2DLog-Gabor变换,函数表达式如下:
Figure BDA0002763617820000053
其中:σx和σy分别表示窗口在水平方向和竖直方向的宽度,ω表示滤波器频率,ψ表示相位,d为缩放因子用以确保
Figure BDA0002763617820000054
接下来,使用尺度为n的相互正交的even(en)和odd(on)对称滤波器计算响应能量,在像素点X上的响应能量表达式为:
Figure BDA0002763617820000055
其中:θj表示方向,
Figure BDA0002763617820000056
其中,
Figure BDA0002763617820000057
表示偶对称滤波器响应,
Figure BDA0002763617820000058
表示奇对称滤波器响应;
然后,计算局部幅度值:
Figure BDA0002763617820000059
其中:
Figure BDA00027636178200000510
表示局部幅度值,
Figure BDA00027636178200000511
表示偶对称滤波器响应,
Figure BDA00027636178200000512
表示奇对称滤波器响应;
最后,计算频域相位信息,计算公式如下:
Figure BDA0002763617820000061
其中:n为尺度大小,j表示方向大小,λ=0.0001,防止分母为零而造成PC(X)的不稳定;得到失真图像的频域相位特征,记为PC2
步骤4.2、对失真图像的梯度特征进行归一化,得到归一化的梯度幅度值,具体为:
GMap2norm=GMap2/GMap2max (12)
其中:GMap2max表示梯度幅度特征的最大值,GMap2norm表示归一化的梯度幅度特征;
再通过频域相位特征和归一化梯度幅度特征建立失真图像的结构图,选取每一个像素点处的频域相位值和归一化梯度幅度值的较大者作为该像素点处的结构值,具体为:
PG2(x,y)=max(PC2,GMap2norm) (13)
得到失真图像的结构图PG2
步骤4.3、在该结构图中使用LBP算子,计算失真图像的基于结构加权的LBP特征,LBP算子的计算如下:
Figure BDA0002763617820000062
其中:(Xi,Yi)表示中心像素点的坐标,P表示相邻像素的数量,R表示相邻像素的半径,Vi表示中心像素点的灰度值,Vj表示相邻像素点的灰度值,S(x)函数可表示为:
Figure BDA0002763617820000063
接着计算失真图像的基于结构加权的LBP特征:
Figure BDA0002763617820000071
Figure BDA0002763617820000072
其中:N表示图像像素点的数量,wi代表权值,k∈[0,K]表示可能存在的LBP模式;
在5个尺度下提取图像的LBP特征以模拟HVS由粗到精的感知图像边缘的特性,最终得到失真图像的50维的基于结构加权的LBP特征。
步骤5具体为:
Figure BDA0002763617820000073
其中:X表示图像中像素点的坐标,Cr1(Cr2)和Cb1(Cb2)分别表示参考图像的两个色度通道的信息;C2(C2=130)为正常量,用于防止分母为零而造成Csim的不稳定。
步骤6中,将RF中决策树的数量ntree和节点预选变量个数mtry设置为(ntree,mtry)=(500,2)。
本发明的有益效果是:
1)本发明,采用VGG16深度模型提取池化层由低维到高维的深度特征,并提取在5个尺度下的基于梯度加权的LBP特征,以模拟HVS由粗到精的理解图像边缘的特性,最后,将深度特征、LBP特征与颜色相似性特征进行多特征融合,实现了与人眼主观判断的高度一致性。
(2)本发明,在IQA数据库中的实验结果表明,与其他FR-IQA方法相比,本发明在图像质量的预测准确性方面显示出绝对优势,在模型计算复杂度和预测性能上实现了较好的平衡。
(3)本发明,使用具有优越泛化性的随机森林RF策略建立IQA模型,所建立的模型不仅鲁棒性好,同时具有较好的跨数据库交叉运行能力。
附图说明
图1是本发明基于深度特征与结构加权LBP特征的图像质量评价方法流程框图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
如图1所示,实施过程主要包含两个部分:建立IQA模型和失真图像质量的回归预测。
首先,建立IQA模型。将图像数据库中RGB颜色空间的原始图像和失真图像转换到YCrCb空间中,在两个色度通道Cr和Cb中计算原始图像和失真图像的颜色相似性特征;在亮度通道Y中计算原始图像和失真图像的梯度特征,并将梯度特征与亮度信息进行融合,经颜色空间反变换后,得到原始图像和失真图像的基于梯度域的RGB增强图像。将增强图像作为VGG16深度模型的输入,以提取图像从低维到高维的深度特征;在失真图像的亮度通道Y中计算频域相位特征,与梯度特征进行融合后,提取基于结构加权的LBP特征。经池化策略和多特征融合后,每一幅失真图像将生成一个表征其失真效应的373维的特征向量,结合平均主观分数MOS或DMOS值,采用随机森林RF策略训练回归模型,从而建立IQA模型。
其次,失真图像质量的回归预测。经上述过程建立的IQA模型即可实现对待评价的失真图像的质量进行预测和评估。用相同的特征提取方法在待评价的失真图像及其对应的原始图像中提取373维相似性特征向量,将该特征向量输入到训练好的RF回归模型中,输出结果即为对该失真图像质量的准确预测。
一种基于深度特征与结构加权LBP特征的图像质量评价方法,具体按照以下步骤实施:
步骤1、转换图像的颜色空间,将原始图像和失真图像由RGB颜色空间转变为YCrCb颜色空间;
步骤2、在亮度通道Y中提取原始图像和失真图像的梯度特征,将梯度特征与图像的亮度通道进行融合,并将YCrCb空间的图像反变换,得到基于梯度域的RGB增强图像;
步骤3、将原始图像和失真图像的RGB增强图像分别作为预训练的VGG16深度模型的输入,并计算五个池化层下的图像相似度,得到相似性深度图;
步骤4、在亮度通道Y中提取失真图像的频域相位特征,并与失真图像的梯度特征进行融合,得到失真图像的结构图,然后在该结构图中提取LBP特征,得到失真图像的50维的基于结构加权的LBP特征;
步骤5、计算原始图像和失真图像分别在两个色度通道Cr、Cb中的相似性,两者乘积即为提取的图像颜色相似性特征;
步骤6、分别提取每个相似性深度图的均值,提取颜色相似性特征的均值、标准偏差、熵,并与50维的基于结构加权的LBP特征进行多特征融合,生成一个表征其失真效应的373维的特征向量;
步骤7、将图像数据库中所有图像提取的373维特征向量以及相应的平均主观分数MOS或DMOS值采用随机森林RF策略训练IQA模型,训练好的模型即可实现对彩色失真图像质量的准确预测和评估。
步骤1中Y表示明亮度,Cr和Cb表示色度;对于一幅RGB图像,其颜色空间转变过程可表示为:
Figure BDA0002763617820000101
上述过程即可实现将图像的亮度通道和色度通道进行分离,为后续步骤2、步骤3和步骤4的分通道特征提取做准备。进行颜色空间转换后的图像大小与变换前保持一致。
经步骤1完成后,可得到原始图像的亮度通道Y1以及两个色度通道Cr1和Cb1,得到失真图像的亮度通道Y2以及两个色度通道Cr2和Cb2。梯度特征能够捕获边缘变化最为剧烈的图像信息,使用大尺寸的卷积核提取梯度特征能够更充分的考虑周围像素之间的相邻关系,在多个方向下同时提取梯度特征有利于保留更丰富的边缘细节。
步骤2具体为:
步骤2.1、选择大小为5×5并包含0°、90°、45°及135°四个方向的高通滤波模板分别对原始图像的Y通道图像做卷积运算来提取梯度特征,具体操作如下:
Figure BDA0002763617820000102
其中:(x,y)表示图像中像素点的坐标,Gk(x,y)(其中k分别取1,2,3,4)表示使用M1、M2、M3、M4四个高通滤波模板进行卷积运算后所得到的分别对应于0°、90°、45°、135°方向的四个梯度分量,(i,j)表示高通滤波模板中像素点的坐标;
高通滤波模板M1、M2、M3、M4分别定义为:
Figure BDA0002763617820000111
步骤2.2、用步骤2.1得到的四个梯度分量G1(x,y)、G2(x,y)、G3(x,y)、G4(x,y)计算原始图像的梯度幅度值,具体计算过程如下:
Figure BDA0002763617820000112
其中:Gm(x,y)表示融合0°和90°方向的梯度幅度分量,Gn(x,y)表示融合45°和135°方向的梯度幅度分量,GMap表示在四个方向上提取的梯度幅度值;
步骤2.3、步骤2.1完成后,可计算得到原始图像和失真图像的梯度特征,分别记为GMap1和GMap2,将计算得到的梯度特征GMap1和GMap2与亮度通道Y进行融合,并将YCrCb空间的图像进行反变换,得到基于梯度域的RGB增强图像。
4.根据权利要求3所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤2.3具体为:
步骤2.3.1、将原始图像(失真图像)的梯度特征与亮度通道Y1(Y2)进行融合:
Y1=GMap1+Y1 (4)
Y2=GMap2+Y2 (5)
其中:等式左边的Y1和Y2即分别表示原始图像和失真图像融合梯度特征后的亮度通道;
步骤2.3.2、将原始图像和失真图像的颜色空间进行反变换,由YCrCb颜色空间转换为RGB颜色空间,转换过程为:
Figure BDA0002763617820000121
其中:等式右边的亮度通道Y即为使用式(4)和(5)进行融合后原始图像和失真图像的亮度通道。可得到原始图像和失真图像的基于梯度域的RGB增强图像。
步骤3具体为:
调整原始图像和失真图像的大小为(224,224),并分别作为预训练的VGG16深度模型的输入;该模型总共有五个池化层,分别对应有64、128、256、512和512个通道数量;取每个池化层前64个通道的特征图像,计算原始图像和失真图像分别对应于每一个通道下的图像相似度,计算过程如下:
Figure BDA0002763617820000122
其中:X表示像素点,
Figure BDA0002763617820000123
表示原始图像(失真图像)第M(M∈(1,5))个池化层第N(N∈(1,64))个通道的特征图像;C1(C1=1.27)为正常量,防止分母为零而造成Poolsim的不稳定,得到320个相似性深度图。
相位特征可以捕获图像中的角、线、纹理等信息,提取方法是在频域中使用Log-Gabor滤波器对图像做卷积运算。
步骤4具体为:
步骤4.1、在亮度通道Y中提取失真图像的频域相位特征,在频域中使用Log-Gabor滤波器对图像做卷积运算;具体的,对于一幅图像f(x,y),(x,y)表示图像中像素点的坐标,对图像进行2DLog-Gabor变换,函数表达式如下:
Figure BDA0002763617820000131
其中:σx和σy分别表示窗口在水平方向和竖直方向的宽度,ω表示滤波器频率,ψ表示相位,d为缩放因子用以确保
Figure BDA0002763617820000132
接下来,使用尺度为n的相互正交的even(en)和odd(on)对称滤波器计算响应能量,在像素点X上的响应能量表达式为:
Figure BDA0002763617820000133
其中:θj表示方向,
Figure BDA0002763617820000134
其中,
Figure BDA0002763617820000135
表示偶对称滤波器响应,
Figure BDA0002763617820000136
表示奇对称滤波器响应;
然后,计算局部幅度值:
Figure BDA0002763617820000137
其中:
Figure BDA0002763617820000138
表示局部幅度值,
Figure BDA0002763617820000139
表示偶对称滤波器响应,
Figure BDA00027636178200001310
表示奇对称滤波器响应;
最后,计算频域相位信息,计算公式如下:
Figure BDA0002763617820000141
其中:n为尺度大小,j表示方向大小,λ=0.0001,防止分母为零而造成PC(X)的不稳定;得到失真图像的频域相位特征,记为PC2
步骤4.2、对失真图像的梯度特征进行归一化,得到归一化的梯度幅度值,具体为:
GMap2norm=GMap2/GMap2max (12)
其中:GMap2max表示梯度幅度特征的最大值,GMap2norm表示归一化的梯度幅度特征;
再通过频域相位特征和归一化梯度幅度特征建立失真图像的结构图,选取每一个像素点处的频域相位值和归一化梯度幅度值的较大者作为该像素点处的结构值,具体为:
PG2(x,y)=max(PC2,GMap2norm) (13)
得到失真图像的结构图PG2;在该结构图中使用LBP算子,计算失真图像的基于结构加权的LBP特征。LBP是一种有效的局部纹理描述算子,通过计算像素点间的灰度差值来描述中心像素与其周围相邻像素之间的关系。
步骤4.3、在该结构图中使用LBP算子,计算失真图像的基于结构加权的LBP特征,LBP算子的计算如下:
Figure BDA0002763617820000142
其中:(Xi,Yi)表示中心像素点的坐标,P表示相邻像素的数量,R表示相邻像素的半径,Vi表示中心像素点的灰度值,Vj表示相邻像素点的灰度值,S(x)函数可表示为:
Figure BDA0002763617820000151
接着计算失真图像的基于结构加权的LBP特征:
Figure BDA0002763617820000152
Figure BDA0002763617820000153
其中:N表示图像像素点的数量,wi代表权值,k∈[0,K]表示可能存在的LBP模式;
在5个尺度下提取图像的LBP特征以模拟HVS由粗到精的感知图像边缘的特性,最终得到失真图像的50维的基于结构加权的LBP特征。
步骤5具体为:
Figure BDA0002763617820000154
其中:X表示图像中像素点的坐标,Cr1(Cr2)和Cb1(Cb2)分别表示参考图像的两个色度通道的信息;C2(C2=130)为正常量,用于防止分母为零而造成Csim的不稳定。
步骤6中,经步骤5完成后,将图像数据库(如:TID2013、TID2008、LIVE、CSIQ等)中所有失真图像与对应参考图像提取的373维的特征向量‘feature’以及相应的平均主观分数MOS或DMOS值采用随机森林RF策略训练IQA模型。将RF中决策树的数量ntree和节点预选变量个数mtry设置为(ntree,mtry)=(500,2)。
本发明首先执行将图像数据库中RGB颜色空间的原始图像和失真图像转换到YCrCb空间中,在两个色度通道Cr和Cb中计算原始图像和失真图像的颜色相似性特征;然后执行在亮度通道Y中计算原始图像和失真图像的梯度特征,并将梯度特征与亮度信息进行融合,经颜色空间反变换后,得到原始图像和失真图像的基于梯度域的RGB增强图像。将增强图像作为VGG16深度模型的输入,以提取图像从低维到高维的深度特征;接下来,执行在失真图像的亮度通道Y中计算频域相位特征,与梯度特征进行融合后,提取基于结构加权的LBP特征。经池化策略和多特征融合后,每一幅失真图像将生成一个表征其失真效应的373维的特征向量。最后,将图像数据库中提取的所有相似性特征向量及对应的平均主观分数MOS或DMOS值一同输入到随机森林RF中训练回归模型,从而建立图像质量预测模型。训练好的模型即可实现对待评价的彩色失真图像的质量进行预测和评估。
特征提取过程充分模拟人类视觉***(HVS)对视觉场景的感知特性。使用基于梯度域的增强图像在VGG16网络中提取由低维到高维的图像深度特征,同时在5个尺度下提取基于结构加权的LBP特征以模拟HVS由粗到精的理解图像边缘的特性。采用具有强大学习能力的随机森林RF策略建立质量预测模型,训练好的模型即可实现对待评价的彩色失真图像的质量进行预测和评估。

Claims (8)

1.一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,具体按照以下步骤实施:
步骤1、转换图像的颜色空间,将原始图像和失真图像由RGB颜色空间转变为YCrCb颜色空间;
步骤2、在亮度通道Y中提取原始图像和失真图像的梯度特征,将梯度特征与图像的亮度通道进行融合,并将YCrCb空间的图像反变换,得到基于梯度域的RGB增强图像;
步骤3、将原始图像和失真图像的RGB增强图像分别作为预训练的VGG16深度模型的输入,并计算五个池化层下的图像相似度,得到相似性深度图;
步骤4、在亮度通道Y中提取失真图像的频域相位特征,并与失真图像的梯度特征进行融合,得到失真图像的结构图,然后在该结构图中提取LBP特征,得到失真图像的50维的基于结构加权的LBP特征;
步骤5、计算原始图像和失真图像分别在两个色度通道Cr、Cb中的相似性,两者乘积即为提取的图像颜色相似性特征;
步骤6、分别提取每个相似性深度图的均值,提取颜色相似性特征的均值、标准偏差、熵,并与50维的基于结构加权的LBP特征进行多特征融合,生成一个表征其失真效应的373维的特征向量;
步骤7、将图像数据库中所有图像提取的373维特征向量以及相应的平均主观分数MOS或DMOS值采用随机森林RF策略训练IQA模型,训练好的模型即可实现对彩色失真图像质量的准确预测和评估。
2.根据权利要求1所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤1中Y表示明亮度,Cr和Cb表示色度;对于一幅RGB图像,其颜色空间转变过程可表示为:
Figure FDA0002763617810000021
实现将图像的亮度通道和色度通道进行分离。
3.根据权利要求2所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤2具体为:
步骤2.1、选择大小为5×5并包含0°、90°、45°及135°四个方向的高通滤波模板分别对原始图像的Y通道图像做卷积运算来提取梯度特征,具体操作如下:
Figure FDA0002763617810000022
其中:(x,y)表示图像中像素点的坐标,Gk(x,y)(其中k分别取1,2,3,4)表示使用M1、M2、M3、M4四个高通滤波模板进行卷积运算后所得到的分别对应于0°、90°、45°、135°方向的四个梯度分量,(i,j)表示高通滤波模板中像素点的坐标;
步骤2.2、用步骤2.1得到的四个梯度分量G1(x,y)、G2(x,y)、G3(x,y)、G4(x,y)计算原始图像的梯度幅度值,具体计算过程如下:
Figure FDA0002763617810000023
其中:Gm(x,y)表示融合0°和90°方向的梯度幅度分量,Gn(x,y)表示融合45°和135°方向的梯度幅度分量,GMap表示在四个方向上提取的梯度幅度值;
步骤2.3、将计算得到的梯度特征GMap1和GMap2与亮度通道Y进行融合,并将YCrCb空间的图像进行反变换,得到基于梯度域的RGB增强图像。
4.根据权利要求3所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤2.3具体为:
步骤2.3.1、将原始图像的梯度特征与亮度通道Y1(Y2)进行融合:
Y1=GMap1+Y1 (4)
Y2=GMap2+Y2 (5)
其中:等式左边的Y1和Y2即分别表示原始图像和失真图像融合梯度特征后的亮度通道;
步骤2.3.2、将原始图像和失真图像的颜色空间进行反变换,由YCrCb颜色空间转换为RGB颜色空间,转换过程为:
Figure FDA0002763617810000031
其中:等式右边的亮度通道Y即为使用式(4)和(5)进行融合后原始图像和失真图像的亮度通道。
5.根据权利要求1所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤3具体为:
调整原始图像和失真图像的大小为(224,224),并分别作为预训练的VGG16深度模型的输入;该模型总共有五个池化层,分别对应有64、128、256、512和512个通道数量;取每个池化层前64个通道的特征图像,计算原始图像和失真图像分别对应于每一个通道下的图像相似度,计算过程如下:
Figure FDA0002763617810000041
其中:X表示像素点,
Figure FDA0002763617810000042
表示原始图像第M(M∈(1,5))个池化层第N(N∈(1,64))个通道的特征图像;C1(C1=1.27)为正常量,防止分母为零而造成Poolsim的不稳定,得到320个相似性深度图。
6.根据权利要求1所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤4具体为:
步骤4.1、在亮度通道Y中提取失真图像的频域相位特征,在频域中使用Log-Gabor滤波器对图像做卷积运算;具体的,对图像进行2DLog-Gabor变换,函数表达式如下:
Figure FDA0002763617810000043
其中:σx和σy分别表示窗口在水平方向和竖直方向的宽度,ω表示滤波器频率,ψ表示相位,d为缩放因子用以确保
Figure FDA0002763617810000044
接下来,使用尺度为n的相互正交的even(en)和odd(on)对称滤波器计算响应能量,在像素点X上的响应能量表达式为:
Figure FDA0002763617810000045
其中:θj表示方向,
Figure FDA0002763617810000046
其中,
Figure FDA0002763617810000047
表示偶对称滤波器响应,
Figure FDA0002763617810000048
表示奇对称滤波器响应;
然后,计算局部幅度值:
Figure FDA0002763617810000049
其中:
Figure FDA0002763617810000051
表示局部幅度值,
Figure FDA0002763617810000052
表示偶对称滤波器响应,
Figure FDA0002763617810000053
表示奇对称滤波器响应;
最后,计算频域相位信息,计算公式如下:
Figure FDA0002763617810000054
其中:n为尺度大小,j表示方向大小,λ=0.0001,防止分母为零而造成PC(X)的不稳定;得到失真图像的频域相位特征,记为PC2
步骤4.2、对失真图像的梯度特征进行归一化,得到归一化的梯度幅度值,具体为:
GMap2norm=GMap2/GMap2max (12)
其中:GMap2max表示梯度幅度特征的最大值,GMap2norm表示归一化的梯度幅度特征;
再通过频域相位特征和归一化梯度幅度特征建立失真图像的结构图,选取每一个像素点处的频域相位值和归一化梯度幅度值的较大者作为该像素点处的结构值,具体为:
PG2(x,y)=max(PC2,GMap2norm) (13)
得到失真图像的结构图PG2
步骤4.3、在该结构图中使用LBP算子,计算失真图像的基于结构加权的LBP特征,LBP算子的计算如下:
Figure FDA0002763617810000055
其中:(Xi,Yi)表示中心像素点的坐标,P表示相邻像素的数量,R表示相邻像素的半径,Vi表示中心像素点的灰度值,Vj表示相邻像素点的灰度值,S(x)函数可表示为:
Figure FDA0002763617810000061
接着计算失真图像的基于结构加权的LBP特征:
Figure FDA0002763617810000062
Figure FDA0002763617810000063
其中:N表示图像像素点的数量,wi代表权值,k∈[0,K]表示可能存在的LBP模式;
在5个尺度下提取图像的LBP特征以模拟HVS由粗到精的感知图像边缘的特性,最终得到失真图像的50维的基于结构加权的LBP特征。
7.根据权利要求1所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤5具体为:
Figure FDA0002763617810000064
其中:X表示图像中像素点的坐标,Cr1(Cr2)和Cb1(Cb2)分别表示参考图像的两个色度通道的信息;C2(C2=130)为正常量,用于防止分母为零而造成Csim的不稳定。
8.根据权利要求1所述的一种基于深度特征与结构加权LBP特征的图像质量评价方法,其特征在于,所述步骤6中,将RF中决策树的数量ntree和节点预选变量个数mtry设置为(ntree,mtry)=(500,2)。
CN202011225809.6A 2020-11-05 2020-11-05 一种基于深度特征与结构加权lbp特征的图像质量评价方法 Pending CN112508847A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011225809.6A CN112508847A (zh) 2020-11-05 2020-11-05 一种基于深度特征与结构加权lbp特征的图像质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011225809.6A CN112508847A (zh) 2020-11-05 2020-11-05 一种基于深度特征与结构加权lbp特征的图像质量评价方法

Publications (1)

Publication Number Publication Date
CN112508847A true CN112508847A (zh) 2021-03-16

Family

ID=74955262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011225809.6A Pending CN112508847A (zh) 2020-11-05 2020-11-05 一种基于深度特征与结构加权lbp特征的图像质量评价方法

Country Status (1)

Country Link
CN (1) CN112508847A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114638793A (zh) * 2022-04-19 2022-06-17 深圳闪回科技有限公司 一种屏幕老化程度检测方法及装置
CN114821133A (zh) * 2022-06-27 2022-07-29 江苏瑞立环保工程股份有限公司 一种基于人工智能的环保设备故障检测方法及***
CN114638793B (zh) * 2022-04-19 2024-07-02 深圳闪回科技有限公司 一种屏幕老化程度检测方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578404A (zh) * 2017-08-22 2018-01-12 浙江大学 基于视觉显著特征提取的全参考立体图像质量客观评价方法
CN108961227A (zh) * 2018-06-22 2018-12-07 西安理工大学 一种基于空域和变换域多特征融合的图像质量评价方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578404A (zh) * 2017-08-22 2018-01-12 浙江大学 基于视觉显著特征提取的全参考立体图像质量客观评价方法
CN108961227A (zh) * 2018-06-22 2018-12-07 西安理工大学 一种基于空域和变换域多特征融合的图像质量评价方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAOWANZI,: "基于人眼对视觉场景感知分析的图像质量评价方法", 《道客巴巴:HTTP://WWW.DOC88.COM/P-69859431651716.HTML》 *
张浩 等,: "基于迁移学习的无参考视频质量评价", 《激光与光电子学进展》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114638793A (zh) * 2022-04-19 2022-06-17 深圳闪回科技有限公司 一种屏幕老化程度检测方法及装置
CN114638793B (zh) * 2022-04-19 2024-07-02 深圳闪回科技有限公司 一种屏幕老化程度检测方法及装置
CN114821133A (zh) * 2022-06-27 2022-07-29 江苏瑞立环保工程股份有限公司 一种基于人工智能的环保设备故障检测方法及***

Similar Documents

Publication Publication Date Title
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
CN109978854B (zh) 一种基于边缘与结构特征的屏幕内容图像质量评估方法
CN109255358B (zh) 一种基于视觉显著性和深度图的3d图像质量评价方法
CN109919959B (zh) 基于色彩、自然性及结构的色调映射图像质量评价方法
CN108134937B (zh) 一种基于hevc的压缩域显著性检测方法
CN108830823B (zh) 基于空域结合频域分析的全参考型图像质量评价方法
CN110120034B (zh) 一种与视觉感知相关的图像质量评价方法
Zhang et al. Video salient region detection model based on wavelet transform and feature comparison
CN112950596B (zh) 基于多区域多层次的色调映射全向图像质量评价方法
CN110910365A (zh) 一种同时对于动态场景和静态场景的多曝光融合图像的质量评价方法
Wang et al. No-reference stereoscopic image quality assessment using quaternion wavelet transform and heterogeneous ensemble learning
Ahmed et al. PIQI: perceptual image quality index based on ensemble of Gaussian process regression
CN117252936A (zh) 一种适配多种训练策略的红外图像彩色化方法及***
CN111047618A (zh) 基于多尺度的无参考屏幕内容图像质量评估方法
CN110910347A (zh) 一种基于图像分割的色调映射图像无参考质量评价方法
CN113128517B (zh) 色调映射图像混合视觉特征提取模型建立及质量评价方法
CN110321452A (zh) 一种基于方向选择机制的图像检索方法
CN112508847A (zh) 一种基于深度特征与结构加权lbp特征的图像质量评价方法
CN115953330B (zh) 虚拟场景图像的纹理优化方法、装置、设备和存储介质
CN108648186B (zh) 基于初级视觉感知机制的无参考立体图像质量评价方法
CN114067006B (zh) 一种基于离散余弦变换的屏幕内容图像质量评价方法
Yuan et al. Color image quality assessment with multi deep convolutional networks
CN114463379A (zh) 一种视频关键点的动态捕捉方法及装置
CN111127587B (zh) 一种基于对抗生成网络的无参考图像质量地图生成方法
CN110930398B (zh) 一种基于Log-Gabor相似度的全参考视频质量评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination