CN112529846A - 图像处理方法及装置、电子设备和存储介质 - Google Patents
图像处理方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112529846A CN112529846A CN202011337518.6A CN202011337518A CN112529846A CN 112529846 A CN112529846 A CN 112529846A CN 202011337518 A CN202011337518 A CN 202011337518A CN 112529846 A CN112529846 A CN 112529846A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- target image
- feature information
- reference image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 71
- 238000000605 extraction Methods 0.000 claims description 83
- 238000012545 processing Methods 0.000 claims description 68
- 238000007781 pre-processing Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 description 36
- 230000008569 process Effects 0.000 description 29
- 238000004364 calculation method Methods 0.000 description 26
- 238000012549 training Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 22
- 239000013598 vector Substances 0.000 description 17
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000013441 quality evaluation Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- APEMUHZPMLSNQK-VPYPWEPUSA-N [4-[3-(2,5-dioxopyrrolidin-1-yl)oxy-3-oxopropyl]phenyl] 6-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]hexanoate Chemical compound C([C@H]1[C@H]2NC(=O)N[C@H]2CS1)CCCC(=O)NCCCCCC(=O)OC(C=C1)=CC=C1CCC(=O)ON1C(=O)CCC1=O APEMUHZPMLSNQK-VPYPWEPUSA-N 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种图像处理方法及装置、电子设备和存储介质。所述方法包括:分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,所述目标图像与所述参考图像对应于同一场景;根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,其中,所述多个第一像素点与所述第二像素点在空间中的距离不超过预设范围;根据所述特征差值,确定所述目标图像与所述参考图像的相似度;根据所述目标图像与所述参考图像的相似度,确定所述目标图像的图像质量。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法及装置、电子设备和存储介质。
背景技术
图像质量评测是影响图像复原领域发展走势的重要因素之一,基于不同图像质量评测方法进行优化的图像复原模型,会给输出图像带来各不相同的感知效果。
然而,随着生成式对抗网络(GAN,Generative Adversarial Networks)技术的发展,生成的图像可能在空间上存在扭曲型失真,而相关的图像质量评测方法无法客观地评价此类图像的质量。因此,如何客观地确定各种类型图像的质量,成为目前一个亟待解决的问题。
发明内容
本公开提出了一种图像处理技术方案。
根据本公开的一方面,提供了一种图像处理方法,包括:
分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,所述目标图像与所述参考图像对应于同一场景;根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,其中,所述多个第一像素点与所述第二像素点在空间中的距离不超过预设范围;根据所述特征差值,确定所述目标图像与所述参考图像的相似度;根据所述目标图像与所述参考图像的相似度,确定所述目标图像的图像质量。
通过上述公开实施例,由于第二像素点与多个第一像素点在空间中的距离不超过预设范围,在目标图像在空间上具有扭曲失真的情况下,也可以利用第二像素点与多个第一像素点在空间上的对应关系来得到较为真实的特征差值,从而使得基于该特征差值确定的目标图像与参考图像之间的相似度更准确,继而使得基于该相似度确定的目标图像的质量更加准确与客观,有效地提升了对目标图像质量判断的准确性。
在一种可能的实现方式中,所述根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,包括:将所述第一特征信息在所述预设范围内向至少一个方向进行移动,得到至少一个第三特征信息,其中,所述第三特征信息包括所述目标图像中的多个第一像素点;根据所述参考图像中的第二像素点,获取所述第二特征信息与至少一个第三特征信息之间的第一中间特征差值;根据至少一个所述第一中间特征差值,确定所述第二特征信息与所述第一特征信息之间的特征差值。
通过上述公开实施例,可以利用第一特征信息移动后所得到的第三特征信息,来实现第二特征信息与第一特征信息之间的错位相减,减小由于目标图像的空间扭曲等因素对特征差值计算结果的准确度的影响,令得到的第二特征信息与第一特征信息之间的特征差值更加准确,从而使得根据该特征差值所确定的目标图像与参考图像之间的相似度更准确,继而更加准确与客观地确定目标图像的图像质量。
在一种可能的实现方式中,所述根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,包括:将所述参考图像中的至少一个像素点分别作为第二像素点,并将所述目标图像中与所述第二像素点之间的位置距离在预设范围内的至少一个像素点,作为所述第一像素点;根据所述第二像素点在所述第二特征信息中对应的特征信息,与至少一个所述第一像素点在所述第一特征信息中对应的特征信息,得到至少一个第二中间特征差值;根据所述至少一个第二中间特征差值,确定所述第二像素点的特征差值;根据至少一个所述第二像素点的特征差值,确定所述第二特征信息与所述第一特征信息之间的特征差值。
通过上述公开实施例,可以将参考图像的第二像素点与目标图像的多个第一像素点之间的特征信息进行一定范围内的遍历式做差,寻找空间扭曲失真中,目标图像内各像素点中与参考图像中实际对应的像素点,基于该实际对应的像素点所确定的特征差值,可以更准确地判断目标图像与参考图像之间的相似度,从而更加客观与准确地评价目标图像的质量。
在一种可能的实现方式中,所述第一特征信息包括至少一个尺度下的第一特征信息,所述第二特征信息包括至少一个尺度下的第二特征信息;所述根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,包括:根据所述参考图像中的第二像素点与所述目标图像中的多个第一像素点,分别确定所述至少一个尺度下的第二特征信息与具有相同尺度的所述第一特征信息之间的特征差值,得到至少一个尺度下的特征差值。
通过上述公开实施例,可以通过得到多个尺度的特征差值,来提升后续确定的相似度的准确程度,继而提升确定的目标图像的图像质量的客观度和准确性。
在一种可能的实现方式中,所述分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,包括:将所述目标图像输入特征提取网络,根据所述特征提取网络中至少一个网络层的输出,获取所述目标图像在至少一个尺度下的第一特征信息;将所述参考图像输入特征提取网络,根据所述特征提取网络中至少一个网络层的输出,获取所述参考图像在至少一个尺度下的第二特征信息。
通过上述公开实施例,一方面可以利用特征提取网络准确高效地获取第一特征信息与第二特征信息,另一方面,通过特征提取网络,可以得到至少一个尺度下的第一特征信息与第二特征信息,从而使得得到的特征信息既可以包含图像中的低频特征(如图片背景等),也可以包含图像中的中高频特征(如纹理细节以及外形轮廓等)。
在一种可能的实现方式中,所述根据所述特征差值,确定所述目标图像与所述参考图像的相似度,包括:将所述特征差值输入回归网络,根据所述回归网络的输出,确定所述目标图像与所述参考图像的相似度。
通过上述公开实施例,可以利用回归网络对特征差值进行高效以及准确地处理和计算,从而得到具有较为准确的相似度,提高了确定目标图像质量过程的效率、准确度以及实现的便捷程度。
在一种可能的实现方式中,所述特征差值包括至少一个尺度下的特征差值;所述根据所述特征差值,确定所述目标图像与所述参考图像的相似度,包括:将所述至少一个尺度下的特征差值分别输入回归网络,得到至少一个所述回归网络的输出结果;将所述至少一个回归网络的输出结果进行融合,根据融合结果确定所述目标图像与所述参考图像的相似度。
通过上述公开实施例,可以基于目标图像与参考图像在不同尺度下的特征差值,来分别求取目标图像与参考图像的多个相似度,从而根据这多个相似度对目标图像与参考图像的相似度进行综合判断,提升了得到的相似度的准确性,继而可以更加准确与客观地评价目标图像的质量。
在一种可能的实现方式中,所述目标图像通过对初始目标图像进行图像预处理所获得,所述参考图像通过对初始参考图像进行图像预处理所获得;所述图像预处理包括:正则化处理和/或格式变换。
通过上述公开实施例,可以使得得到的目标图像以及参考图像更符合后续特征提取的需求,一方面提高整个图像处理过程的效率,另一方面也可以提高后续特征提取所得到的特征的精度,从而提高最终确定的目标图像质量的准确性和客观性。
根据本公开的一方面,提供了一种图像处理装置,包括:
特征提取模块,用于分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,所述目标图像与所述参考图像对应于同一场景;特征差值获取模块,用于根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,其中,所述多个第一像素点与所述第二像素点在空间中的距离不超过预设范围;相似度确定模块,用于根据所述特征差值,确定所述目标图像与所述参考图像的相似度;图像质量确定模块,用于根据所述目标图像与所述参考图像的相似度,确定所述目标图像的图像质量。
在一种可能的实现方式中,所述特征差值获取模块用于:将所述第一特征信息在所述预设范围内向至少一个方向进行移动,得到至少一个第三特征信息,其中,所述第三特征信息包括所述目标图像中的多个第一像素点;根据所述参考图像中的第二像素点,获取所述第二特征信息与至少一个第三特征信息之间的第一中间特征差值;根据至少一个所述第一中间特征差值,确定所述第二特征信息与所述第一特征信息之间的特征差值。
在一种可能的实现方式中,所述特征差值获取模块用于:将所述参考图像中的至少一个像素点分别作为第二像素点,并将所述目标图像中与所述第二像素点之间的位置距离在预设范围内的至少一个像素点,作为所述第一像素点;根据所述第二像素点在所述第二特征信息中对应的特征信息,与至少一个所述第一像素点在所述第一特征信息中对应的特征信息,得到至少一个第二中间特征差值;根据所述至少一个第二中间特征差值,确定所述第二像素点的特征差值;根据至少一个所述第二像素点的特征差值,确定所述第二特征信息与所述第一特征信息之间的特征差值。
在一种可能的实现方式中,所述第一特征信息包括至少一个尺度下的第一特征信息,所述第二特征信息包括至少一个尺度下的第二特征信息;所述特征差值获取模块用于:根据所述参考图像中的第二像素点与所述目标图像中的多个第一像素点,分别确定所述至少一个尺度下的第二特征信息与具有相同尺度的所述第一特征信息之间的特征差值,得到至少一个尺度下的特征差值。
在一种可能的实现方式中,所述特征提取模块用于:将所述目标图像输入特征提取网络,根据所述特征提取网络中至少一个网络层的输出,获取所述目标图像在至少一个尺度下的第一特征信息;将所述参考图像输入特征提取网络,根据所述特征提取网络中至少一个网络层的输出,获取所述参考图像在至少一个尺度下的第二特征信息。
在一种可能的实现方式中,所述相似度确定模块用于:将所述特征差值输入回归网络,根据所述回归网络的输出,确定所述目标图像与所述参考图像的相似度。
在一种可能的实现方式中,所述特征差值包括至少一个尺度下的特征差值;所述相似度确定模块用于:将所述至少一个尺度下的特征差值分别输入回归网络,得到至少一个所述回归网络的输出结果;将所述至少一个回归网络的输出结果进行融合,根据融合结果确定所述目标图像与所述参考图像的相似度。
在一种可能的实现方式中,所述目标图像通过对初始目标图像进行图像预处理所获得,所述参考图像通过对初始参考图像进行图像预处理所获得;所述图像预处理包括:正则化处理和/或格式变换。
根据本公开的一方面,提供了一种电子设备,包括:
处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述图像处理方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述图像处理方法。
在本公开实施例中,通过分别获取目标图像的第一特征信息以及参考图像的第二特征信息,并根据参考图像中的第二像素点,与目标图像中与第二像素点在空间中的距离不超过预设范围的多个第一像素点,来获取第二特征信息与第一特征信息之间的特征差值,从而根据特征差值,确定目标图像与参考图像的相似度,并根据该相似度确定目标图像的图像质量。通过上述过程,由于第二像素点与多个第一像素点在空间中的距离不超过预设范围,在目标图像在空间上具有扭曲失真的情况下,也可以利用第二像素点与多个第一像素点在空间上的对应关系来得到较为真实的特征差值,从而使得基于该特征差值确定的目标图像与参考图像之间的相似度更准确,继而使得基于该相似度确定的目标图像的质量更加准确与客观,有效地提升了对目标图像质量判断的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开一实施例的图像处理方法的流程图。
图2示出根据本公开一实施例的图像处理方法的流程图。
图3示出根据本公开一实施例的获取第二特征信息与第一特征信息之间的特征差值的示意图。
图4示出根据本公开一应用示例的示意图。
图5示出根据本公开一实施例的图像处理装置的框图。
图6示出根据本公开实施例的一种电子设备的框图。
图7示出根据本公开实施例的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开一实施例的图像处理方法的流程图,该方法可以应用于图像处理装置,图像处理装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
在一些可能的实现方式中,该图像处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
如图1所示,所述图像处理方法可以包括:
步骤S11,分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,目标图像与所述参考图像对应于同一场景。
步骤S12,根据目标图像中的多个第一像素点与参考图像中的第二像素点,获取第二特征信息与第一特征信息之间的特征差值,其中,多个第一像素点与第二像素点在空间中的距离不超过预设范围。
步骤S13,根据特征差值,确定目标图像与参考图像的相似度。
步骤S14,根据目标图像与参考图像的相似度,确定目标图像的图像质量。
其中,目标图像可以是任意需要确定质量的图像,其实现形式在本公开实施例中不做限制,可以根据实际情况灵活选择。目标图像的获取方式在本公开实施例中不做限制,不局限于下述各公开实施例。在一种可能的实现方式中,目标图像可以是通过某种图像处理或是生成方法所得到的图像,通过确定目标图像的图像质量,可以进一步对该图像处理或生成方法的效果进行评判。在一种可能的实现方式中,目标图像可以是通过某种图像处理的神经网络所生成的图像,通过确定目标图像的图像质量,可以判断该神经网络的质量等。
参考图像可以是为了确定目标图像的图像质量而作为参考的图像,其实现形式在本公开实施例中同样不做限制,可以根据实际情况灵活选择。在一种可能的实现方式中,目标图像与参考图像可以对应于同一场景,从而可以根据目标图像与参考图像的相似度,来确定目标图像的图像质量;举例来说,在一个示例中,参考图像可以是与目标图像具有相同图像内容,且具有较高图像质量,未进行任何失真处理的原始图像。参考图像的获取方式在本公开实施例中也不做限制,可以根据实际情况灵活选择,不局限于下述各公开实施例。在一种可能的实现方式中,参考图像可以是从某种或某些图像数据库中获取的图像,在这种情况下,目标图像可以是对参考图像进行某些图像失真处理所得到的图像,或是通过某种图像生成或重建方法所生成的与参考图像具有相同内容的图像等。
基于上述各公开实施例中提出的目标图像与参考图像,可以通过上述步骤S11,来分别获取目标图像的第一特征信息,以及参考图像的第二特征信息。
其中,第一特征信息可以是从目标图像中提取的特征信息,其表示形式在本公开实施例中不做限制,在一种可能的实现方式中,第一特征信息可以通过如特征向量集合等数据形式进行表示;在一种可能的实现方式中,第一特征信息可以通过如特征图的形式等进行表示,具体如何选择可以根据实际情况灵活决定。
第一特征信息的获取方式可以根据实际情况灵活决定,任何可以对目标图像进行特征提取的方式均可以作为第一特征信息的获取方式,详见下述各公开实施例,在此先不做展开。第一特征信息包含的特征信息情况在本公开实施例中不做限制,可以根据第一特征信息的获取方式灵活确定,在一种可能的实现方式中,第一特征信息可以包含多个尺度的特征信息,在一种可能的实现方式中,第一特征信息也可以仅包含某个尺度的特征信息等。
第二特征信息可以是从参考图像中提取的特征信息,其表示形式在本公开实施例中同样不做限制,可以参考第一特征信息,在此不再赘述。
第二特征信息的获取方式同样可以根据实际情况灵活决定,任何可以对参考图像进行特征提取的方式均可以作为第二特征信息的获取方式,详见下述各公开实施例,在此先不做展开。第二特征信息包含的特征信息情况在本公开实施例中同样不做限制,可以根据第二特征信息的获取方式灵活确定,在一种可能的实现方式中,第二特征信息可以包含多个尺度的特征信息,在一种可能的实现方式中,第二特征信息也可以仅包含某个尺度的特征信息等。
需要注意的是,在本公开实施例中,第一特征信息与第二特征信息中的“第一”与“第二”仅用于区分不同图像的特征信息,并不对特征信息的获取方式或顺序等做任何限制。第一特征信息与第二特征信息的获取方式、表示形式以及实现方式等均可以相同或不同,第一特征信息与第二特征信息可以同时获取也可以以一定顺序依次获取,均可以根据实际情况灵活决定。后续出现的其他对特征信息的编号同理,不再赘述。
在获取第一特征信息以及第二特征信息以后,可以通过步骤S12,根据参考图像中的第二像素点与目标图像中的多个第一像素点,来获取第二特征信息与第一特征信息之间的特征差值。
其中,第二像素点可以是参考图像中包含的任意像素点,具体选择参考图像中的哪些点作为第二像素点,在本公开实施例中不做限制,不局限于下述各公开实施例。在一种可能的实现方式中,可以将参考图像中的某个像素点选定为第二像素点;在一种可能的实现方式中,也可以将参考图像中的多个像素点分别作为第二像素点;在一种可能的实现方式中,也可以将参考图像中的每个像素点分别作为第二像素点。
第一像素点可以是目标图像中的像素点,通过上述公开实施例可以看出,在一种可能的实现方式中,第一像素点的数量可以为多个,这多个第一像素点的具体数目可以根据实际情况灵活决定,在本公开实施例中不做限制。
通过上述公开实施例还可以看出,第一像素点与第二像素点在空间中的距离不超过预设范围,其中,第一像素点与第二像素点在空间中的距离,可以根据实际情况灵活确定。在一种可能的实现方式中,可以根据第一像素点在目标图像中的位置,以及第二像素点在参考图像中的位置,分别确定第一像素点与第二像素点在空间中的位置,继而根据第一像素点与第二像素点在空间中位置之间的差异来确定二者在空间中的距离;在一种可能的实现方式中,如上述公开实施例所述,由于参考图像与目标图像可以对应于同一场景,因此参考图像与目标图像可能与场景中的空间具有相同的对应关系,在这种情况下,可以直接根据第一像素点在目标图像中的位置和第二像素点在参考图像中的位置之间的差异,来确定二者在空间中的距离等。
预设范围可以根据实际情况灵活设定,在本公开实施例中不做限制,不局限于下述各公开实施例。在一种可能的实现方式中,可以将目标图像中位置与参考图像中第二像素点的位置之间的距离不大于d的范围作为预设范围;在一种可能的实现方式中,也可以将目标图像中位置,与参考图像中第二像素点的位置的x轴距离与y轴距离均不大于d的范围作为预设范围。其中,d的数值可以根据实际情况灵活选择,不局限于下述各公开实施例,在一个示例中,d的取值可以为3个像素距离。
如上述公开实施例所述,多个第一像素点与第二像素点在空间中的距离不超过预设范围,因此,这多个第一像素点可以是第二像素点预设范围内中的至少部分像素点。举例来说,在一种可能的实现方式中,多个第一像素点可以是目标图像中与第二像素点在空间中的距离不超过预设范围内的所有像素点;在一种可能的实现方式中,多个像素点也可以是从目标图像中与第二像素点在空间中的距离不超过预设范围内的所有像素点中选定的部分像素点,选定方式在本公开实施例中不做限定,在一个示例中,可以是随机选定部分像素点作为第一像素点,在一个示例中,也可以是按照预设的选定规则,如在某些方向中选定某些数量的像素点来作为第一像素点等。需要注意的是,由于预设范围可以根据实际情况灵活确定,因此在一些可能的实现方式中,多个第一像素点中,可以包含有在目标图像中与第二像素点在空间中的距离为0的像素点,即第一像素点在目标图像中的位置,可以与第二像素点在参考图像中的位置相同。
在一些可能的实现方式中,由于目标图像与参考图像对应于同一场景,理论上来说,目标图像与参考图像中位于相同位置的像素,应该是表达同一内容的像素,比如参考图像中位于位置A的像素点,与目标图像中位于位置A的像素点相互对应,表达的内容相同。然而在一些可能的实现方式中,在目标图像存在空间扭曲型失真的情况下,比如目标图像是通过GAN网络所生成的图像的情况下,目标图像中的像素可能存在位置上的偏移,在这种情况下,参考图像中位于位置A的像素点,可能与目标图像中位于位置B的像素点相互对应,表达相同的内容,在这种情况下,直接根据参考图像中位置A的像素点与目标图像中位置A的像素点,来获取第二特征信息与第一特征信息的特征差值,所得到的特征差值可能无法真正反映出目标图像与参考图像的相似程度。因此,在一种可能的实现方式中,可以根据参考图像中的第二像素点与目标图像中的多个第一像素点,来获取第二特征信息与第一特征信息之间的特征差值。进一步地,步骤S12如何实现,来得到该特征差值,其具体的实现方式可以根据实际情况灵活决定,详见下述各公开实施例,在此先不做展开。
在获取第二特征信息与第一特征信息之间的特征差值以后,可以根据特征差值,来确定目标图像与参考图像的相似度。相似度可以反映目标图像与参考图像的相似程度,相似度的表现形式可以根据实际情况灵活决定,不局限于下述各公开实施例,比如可以通过相似分数或是相似百分数等形式进行表示等。根据特征差值确定目标图像与参考图像的相似度的具体过程可以根据实际情况灵活决定,比如可以基于特征差值进行回归计算或是其他方式等,详见下述各公开实施例,在此先不做展开。
图像质量可以是对目标图像的质量的评价,影响图像质量的因素可以包括多种,比如与参考图像的相似度,以及其他额外的因素,比如图像清晰度等。在确定目标图像与参考图像的相似度以后,如何根据该相似度确定目标图像的图像质量,可以根据参考图像的实际情况,以及对图像质量的确定标准等共同灵活决定,详见下述各公开实施例,在此先不做展开。
在本公开实施例中,通过分别获取目标图像的第一特征信息以及参考图像的第二特征信息,并根据参考图像中的第二像素点,与目标图像中与第二像素点在空间中的距离不超过预设范围的多个第一像素点,来获取第二特征信息与第一特征信息之间的特征差值,从而根据特征差值,确定目标图像与参考图像的相似度,并根据该相似度确定目标图像的图像质量。通过上述过程,由于第二像素点与多个第一像素点在空间中的距离不超过预设范围,在目标图像在空间上具有扭曲失真的情况下,也可以利用第二像素点与多个第一像素点在空间上的对应关系来得到较为真实的特征差值,从而使得基于该特征差值确定的目标图像与参考图像之间的相似度更准确,继而使得基于该相似度确定的目标图像的质量更加准确与客观,有效地提升了对目标图像质量判断的准确性。
如上述各公开实施例所述,步骤S1中获取特征信息的方式可以根据实际情况灵活决定。在一些可能的实现方式中,可以通过一些相关的特征提取算法,分别对目标图像的第一特征信息和参考图像的第二特征信息进行提取,其中,对目标图像进行特征提取的算法,可以与对参考图像进行特征提取的算法相同或不同。
图2示出根据本公开一实施例的图像处理方法的流程图,如图所示,在一种可能的实现方式中,步骤S1可以包括:
步骤S111,将目标图像输入特征提取网络,根据特征提取网络中至少一个网络层的输出,获取目标图像在至少一个尺度下的第一特征信息;
步骤S112,将参考图像输入特征提取网络,根据特征提取网络中至少一个网络层的输出,获取参考图像在至少一个尺度下的第二特征信息。
其中,特征提取网络可以是对图像进行特征提取的神经网络,其实现形式可以根据实际情况灵活选择,不局限于下述各公开实施例。在一种可能的实现方式中,特征提取网络可以是Alex卷积神经网络或是VGG卷积神经网络等;在一种可能的实现方式中,特征提取网络也可以是对相关的用于特征提取的神经网络的变形,比如将相关的用于特征提取的神经网络中的最大池化层替换为l2范数池化层等。
步骤S111的具体实现过程可以根据实际情况灵活决定。在一些可能的实现方式中,在第一特征信息仅包含一个尺度下的第一特征信息的情况下,可以根据特征提取网络中间某一网络层的输出特征,或是最后一层网络层的输出特征来得到第一特征信息;在一些可能的实现方式中,在第一特征信息包含多个尺度下的第一特征信息的情况下,可以根据特征提取网络中多个网络层的输出特征来得到多个尺度的第一特征信息。举例来说,在一个示例中,在特征提取网络为Alex卷积神经网络的情况下,可以分别根据特征提取网络第2、5、7、9以及12层等网络层的输出来得到五个尺度下的第一特征信息。在一个示例中,在特征提取网络为VGG卷积神经网络的情况下,可以分别根据特征提取网络第4、9、16、23以及30层等网络层的输出特征来得到五个尺度下的第一特征信息。
步骤S112的实现方式可以参考上述步骤S111的实现方式,在此不再赘述。在一些可能的实现方式中,提取第一特征信息的特征提取网络,与提取第二特征信息的特征提取网络可以相同也可以不同,步骤S112的实现方式可以与步骤S111相同或不同,均可以根据实际情况灵活决定。步骤S111与步骤S112的实现顺序也可以根据实际情况灵活决定,在一种可能的实现方式中,步骤S111与步骤S112可以同时实现,在一种可能的实现方式中,步骤S111与步骤S112也可以按照一定的顺序依次执行。
通过将目标图像输入特征提取网络,根据特征提取网络中至少一个网络层的输出,获取目标图像在至少一个尺度下的特征信息,以及将参考图像输入特征提取网络,根据特征提取网络中至少一个网络层的输出,获取参考图像在至少一个尺度下的第二特征信息,通过上述过程,一方面可以利用特征提取网络准确高效地获取第一特征信息与第二特征信息,另一方面,通过特征提取网络,可以得到至少一个尺度下的第一特征信息与第二特征信息,从而使得得到的特征信息既可以包含图像中的低频特征(如图片背景等),也可以包含图像中的中高频特征(如纹理细节以及外形轮廓等)。
如上述各公开实施例所述,在一种可能的实现方式中,可以通过特征提取网络获取目标图像的第一特征信息,以及参考图像的第二特征信息。在一些可能的实现方式中,为了满足特征提取网络或是其他特征提取方法对图像的格式需求或处理需求等,可能需要将目标图像或参考图像进行一定的图像预处理。因此,在一种可能的实现方式中,目标图像可以通过对初始目标图像进行图像预处理所获得,参考图像可以通过对初始参考图像进行图像预处理所获得;在一种可能的实现方式中,图像预处理可以包括:正则化处理和/或格式变换。
其中,初始目标图像与初始参考图像可以是未经处理的直接获取的相应图像,其获取方式可以参考上述各公开实施例中目标图像以及参考图像的获取方式,在此不再赘述。在获取初始目标图像以及初始参考图像以后,可以根据特征提取的需求,对初始目标图像以及初始参考图像进行相应的图像预处理,其中,图像预处理包含的处理方式可以根据实际情况灵活决定,不局限于下述各公开实施例。
在一种可能的实现方式中,图像预处理可以包括正则化处理,正则化处理的参数可以根据图像的实际情况灵活设定,在一个示例中,对于三通道的RGB图像,正则化处理的均值可以设定为[0.485,0.456,0.406],正则化处理的标准差可以设定为[0.229,0.224,0.225]。
在一种可能的实现方式中,图像预处理也可以包括格式变换,变换后的目标格式以及变换的方式均可以根据特征提取的实际需求灵活决定,在一个示例中,可以通过机器学习库PyTorch将图像转换为张量格式。
在一种可能的实现方式中,图像预处理也可以同时包含格式变换与正则化处理,其中,格式变换与正则化处理等处理方式的实现顺序可以根据实际情况灵活设定,不局限于下述各公开实施例。在一个示例中,可以先将图像进行格式变换,再对变换后的图像进行正则化处理。
在一些可能的实现方式中,图像预处理也可以扩展为其他的处理方式,比如更改分辨率、图像裁剪、图像降采样或是图像插值中的一种或多种,具体如何选择可以根据实际情况灵活决定。在一种可能的实现方式中,对初始目标图像以及初始参考图像进行的图像预处理可以相同,也可以不同。
通过对初始目标图像以及初始参考图像进行各种形式的图像预处理,得到目标图像以及参考图像,可以使得得到的目标图像以及参考图像更符合后续特征提取的需求,一方面提高整个图像处理过程的效率,另一方面也可以提高后续特征提取所得到的特征的精度,从而提高最终确定的目标图像质量的准确性和客观性。
如上述各公开实施例所述,步骤S12的实现方式可以根据实际情况灵活决定。在一种可能的实现方式中,步骤S12可以包括:
将第一特征信息在预设范围内向至少一个方向进行移动,得到至少一个第三特征信息,其中,第三特征信息包括目标图像中的多个第一像素点;
根据参考图像中的第二像素点,获取第二特征信息与至少一个第三特征信息之间的第一中间特征差值;
根据至少一个第一中间特征差值,确定第二特征信息与第一特征信息之间的特征差值。
其中,第三特征信息可以是对第一特征信息在预设范围内向某个或某些方向移动所得到的特征信息,如上述各公开实施例所述,第一特征信息可以通过特征图的形式进行表示,因此在一个示例中,将第一特征信息在预设范围内向某个或某些方向移动后,原第一特征信息中与目标图像中位置B的像素点对应的特征值或特征向量,可能发生移动从而与目标图像中位置A的像素点对应的特征值或特征向量相互对应,在这种情况下,对第一特征信息移动所得到的至少一个第三特征信息中包含的像素点,可以为上述公开实施例中提出的多个第一像素点,故第二特征信息与第三特征信息之间的第一中间特征差值,可以更好地反映出目标图像与参考图像的相似程度。
第三特征信息的数量在本公开实施例中不做限制,可以根据第一特征信息的移动方向以及移动距离等因素灵活决定,不局限于下述各公开实施例。如上述公开实施例所述,第一特征信息可以向至少一个方向进行移动,相应地,在一种可能的实现方式中,在第一特征信息的各移动方向上,可以分别得到一个第三特征信息;在一种可能的实现方式中,在第一特征信息的各移动方向上,随着移动距离的不同,也可以分别得到多个第三特征信息。
第一特征信息的移动方向也可以根据实际情况灵活设定,不局限于下述各公开实施例。在一种可能的实现方式中,可以仅将第一特征信息向一个预设的方向进行移动;在一种可能的实现方式中,也可以将第一特征信息向多个预设的方向进行移动。第一特征信息的移动距离同样可以根据实际情况灵活设定,在本公开实施例中不做限制,在一种可能的实现方式中,移动距离可以为在预设范围内的任意距离。不同方向上的移动距离可以相同,也可以不同,在一个示例中,可以将第一特征信息分别向左上、上、右上、左、右、左下、下以及右下共八个方向移动相同的距离,分别得到八个第三特征信息。
在得到至少一个第三特征信息以后,可以分别计算第二特征信息与至少一个第三特征信息的第一中间特征差值,第一中间特征差值的计算方式在本公开实施例中不做限定,不局限于下述各公开实施例。在一种可能的实现方式中,可以根据参考图像中的第二像素点,来直接将第二特征信息与第三特征信息中相同位置像素点所对应的特征值或特征向量进行相减,来得到第一中间特征差值;在一种可能的实现方式中,也可以根据参考图像中的第二像素点,来计算第二特征信息与第三特征信息中相同位置像素点所对应的特征值或特征向量的曼哈顿距离,来作为第一中间特征差值等。
通过对第二特征信息与至少一个第三特征信息的特征差值进行计算,可以得到至少一个第一中间特征差值。在得到至少一个第一中间特征差值以后,可以根据至少一个第一中间特征差值,来确定第二特征信息与第一特征信息之间的特征差值。
根据第一中间特征差值确定第二特征信息与第一特征信息之间的特征差值的方式可以根据实际情况灵活决定,不局限于下述各公开实施例。在一种可能的实现方式中,在仅得到一个第一中间特征差值的情况下,可以将该第一中间特征差值直接作为第二特征信息与第一特征信息之间的特征差值;在一种可能的实现方式中,在得到多个第一中间特征差值的情况下,可以比较多个第一中间特征差值中对应位置的数据,并在各位置处,将多个第一中间特征差值中具有最小数值的数据作为该位置的特征差值,从而得到第二特征信息与第一特征信息之间的特征差值;在一种可能的实现方式中,在得到多个第一中间特征差值的情况下,也可以整体比较各第一中间特征差值的数据,并将整体特征差最小的第一中间特征差值作为第二特征信息与第一特征信息之间的特征差值。
通过获取第二特征信息与至少一个第三特征信息之间的第一中间特征差值,并根据至少一个第一中间特征差值,来确定第二特征信息与第一特征信息之间的特征差值,通过上述过程,可以利用第一特征信息移动后所得到的第三特征信息,来实现第二特征信息与第一特征信息之间的错位相减,减小由于目标图像的空间扭曲等因素对特征差值计算结果的准确度的影响,令得到的第二特征信息与第一特征信息之间的特征差值更加准确,从而使得根据该特征差值所确定的目标图像与参考图像之间的相似度更准确,继而更加准确与客观地确定目标图像的图像质量。
在一种可能的实现方式中,步骤S12可以包括:
将参考图像中的至少一个像素点分别作为第二像素点,并将目标图像中与第二像素点之间的位置距离在预设范围内的至少一个像素点,作为第一像素点;
根据第二像素点在第二特征信息中对应的特征信息,与至少一个第一像素点在第一特征信息中对应的特征信息,得到至少一个第二中间特征差值;
根据至少一个第二中间特征差值,确定第二像素点的特征差值;
根据至少一个第二像素点的特征差值,确定第二特征信息与第一特征信息之间的特征差值。
其中,第一像素点与第二像素点的实现形式可以参考上述各公开实施例,在此不再赘述。
上述公开实施例中已经提出,第一像素点可以为目标图像中与第二像素点在空间中的距离不超过预设范围的多个像素点,因此第二中间特征差值也可以根据第一像素点实现形式的不同而灵活发生变化。在一种可能的实现方式中,可以将第二像素点在第二特征信息中对应的特征信息(如特征值或特征向量等),分别与至少一个第一像素点在第一特征信息中对应的特征信息(如特征值或特征向量等)进行特征差值计算,来分别得到至少一个第二中间特征差值。
第二中间特征差值的计算方式在本公开实施例中不做限定,可以参考上述各实施例中第一中间特征差值的计算方式,比如直接计算像素点对应的特征值或特征向量之间的差值,或是计算像素点对应的特征值或特征向量之间的曼哈顿距离,或是计算像素点对应的特征值或特征向量之间的均方误差(MSE,Mean Square Error)等。需要注意的是,第一中间特征差值与第二中间特征差值中的“第一”与“第二”等仅用于区分基于不同对象所计算得到的特征差值,并不对特征差值的计算方式或计算顺序等进行限定。
在得到至少一个第二中间特征差值以后,可以进一步从至少一个第二中间特征差值中,确定第二像素点的特征差值,具体如何确定可以根据得到的第二中间特征差值的实际情况灵活决定。在一种可能的实现方式中,在第二像素点与多个第一像素点分别计算得到该第二像素点对应的多个第二中间特征差值的情况下,可以将具有最小数值的第二中间特征差值作为该第二像素点的特征差值;在一种可能的实现方式中,在第二像素点与多个第一像素点分别计算得到该第二像素点对应的多个第二中间特征差值的情况下,也可以将具有最小绝对值的第二中间特征差值作为该第二像素点的特征差值。
在确定第二像素点的特征差值以后,可以根据至少一个第二像素点的特征差值,确定第二特征信息与第一特征信息之间的特征差值。在一种可能的实现方式中,由于可以遍历第二特征信息中的各像素点,分别作为第二像素点,在这种情况下,统计各第二像素点的特征差值,即可以得到第二特征信息与第一特征信息之间的特征差值。
图3示出根据本公开一实施例的获取第二特征信息与第一特征信息之间的特征差值的示意图,如图所示,参考图像的第二特征信息可以表示为fR,目标图像的第一特征信息可以表示为fA,第一特征信息中对应像素点的预设范围可以为d,第二特征信息与第一特征信息之间的特征差值可以表示为SWDd(fR,fA)。
在一个示例中,SWDd(fR,fA)的计算方式可以通过下述公式(1)进行表述:
SWDd(fR,fA)[x,y]=fR[x,y]-fA[x',y'] (1)
其中,fR[x,y]表示参考图像中位置为(x,y)的第二像素点在第二特征信息中对应的特征向量,fA[x',y']为目标图像中位置为(x',y')的第一像素点在第一特征信息中对应的特征向量,其中,(x',y')与(x,y)之间的距离不大于d,且fA[x',y']与fR[x,y]这两个特征向量之间的欧几里得距离,不大于在目标图像中(x,y)的预设范围d内其余任一像素点的特征向量与fR[x,y]这一特征向量之间的欧几里得距离,在一个示例中,fA[x',y']满足的条件可以通过下述公式(2)来表示:
通过根据第二像素点在第二特征信息中对应的特征信息,与至少一个第一像素点在第一特征信息中对应的特征信息,来得到至少一个第二中间特征差值,并根据至少一个第二中间特征差值确定第二像素点的特征差值,从而根据至少一个第二像素点的特征差值,确定第二特征信息与第一特征信息之间的特征差值,通过上述过程,可以将参考图像的第二像素点与目标图像的多个第一像素点之间的特征信息进行一定范围内的遍历式做差,寻找空间扭曲失真中,目标图像内各像素点中与参考图像中实际对应的像素点,基于该实际对应的像素点所确定的特征差值,可以更准确地判断目标图像与参考图像之间的相似度,从而更加客观与准确地评价目标图像的质量。
如上述各公开实施例所述,在一种可能的实现方式中,第一特征信息可以包括多个尺度的第一特征信息,第二特征信息也可以包括多个尺度的第二特征信息。因此,在一种可能的实现方式中,步骤S12可以包括:根据参考图像中的第二像素点与目标图像中的多个第一像素点,分别确定至少一个尺度下的第二特征信息与具有相同尺度的第一特征信息之间的特征差值,得到至少一个尺度下的特征差值。
在一种可能的实现方式中,由于第一特征信息可以分别包含多个尺度的第一特征信息,第二特征信息也可以分别包含多个尺度的第二特征信息,因此,通过上述公开实施例可以看出,可以分别在多个尺度下,计算该尺度的第二特征信息与第一特征信息之间的特征差值,从而得到多个尺度下的第二特征信息与第一特征信息之间的特征差值。
其中,在各尺度下的特征差值的计算方式,可以参考上述各公开实施例中提出的方式,在此不再赘述。需要注意的是,本公开实施例中S12的各类实现方式,仅是S12的示例性实现方式,S12的实现过程不局限于上述各公开实施例。在一些可能的实现方式中,上述各公开实施例中S12的实现方式可以相互结合实现,具体如何结合可以根据实际情况灵活决定,在本公开实施例中不做限制。
通过根据参考图像中的第二像素点与目标图像中的多个第一像素点,分别确定至少一个尺度下的第二特征信息与具有相同尺度的第一特征信息之间的特征差值,得到至少一个尺度下的特征差值,通过上述过程,可以通过得到多个尺度的特征差值,来提升后续确定的相似度的准确程度,继而提升确定的目标图像的图像质量的客观度和准确性。
在一种可能的实现方式中,在得到第二特征信息与第一特征信息之间的特征差值以后,可以通过步骤S13,来确定目标图像与参考图像的相似度。如上述各公开实施例所述,步骤S13的实现方式可以根据实际情况灵活决定,在一种可能的实现方式中,步骤S13可以包括:
将特征差值输入回归网络,根据回归网络的输出,确定目标图像与参考图像的相似度。
其中,回归网络可以是通过一个或多个网络层所构成的神经网络,回归网络可以根据输入的特征差值进行处理与计算,从而输出目标图像与参考图像的相似度。
如上述各公开实施例所述,目标图像与参考图像的相似度的表现形式可以根据实际情况灵活决定,不局限于下述各公开实施例。在一种可能的实现方式中,可以通过评分的分数的方式来表示目标图像与参考图像的相似度,其中,评分的区间和分值等均可以根据实际情况灵活设定,在本公开实施例中不做限制。在一种可能的实现方式中,也可以通过百分数的形式来表示目标图像与参考图像的相似度等。随着目标图像与参考图像的相似度的表现形式的不同,回归网络的计算方式以及实现形式均可以灵活变化。在一个示例中,回归网络可以包括依次连接的两个卷积层以及一个平均池化层,来对输入的特征差值依次进行计算与处理,从而输出目标图像与参考图像的相似度。
通过将特征差值输入回归网络,根据回归网络的输出,确定目标图像与参考图像的相似度,通过上述过程,可以利用回归网络对特征差值进行高效以及准确地处理和计算,从而得到具有较为准确的相似度,提高了确定目标图像质量过程的效率、准确度以及实现的便捷程度。
如上述各公开实施例所述,特征差值可以包括至少一个尺度下的特征差值,因此在一种可能的实现方式中,步骤S13也可以包括:
将至少一个尺度下的特征差值分别输入回归网络,得到至少一个回归网络的输出结果;
将至少一个回归网络的输出结果进行融合,根据融合结果确定目标图像与参考图像的相似度。
通过上述公开实施例可以看出,在一种可能的实现方式中,可以将至少一个尺度下的特征差值分别输入回归网络,来得到至少一个回归网络的输出结果。
其中,回归网络的实现形式可以参考上述各公开实施例,在此不再赘述。在一种可能的实现方式中,在特征差值包括多个尺度下的特征差值的情况下,多个特征差值可以分别输入同一个回归网络,来分别得到相应的输出结果,其中,输入的顺序可以根据实际情况灵活设定,在本公开实施例中不做限制;在一种可能的实现方式中,在特征差值包括多个尺度下的特征差值的情况下,多个特征差值也可以分别输入不同的回归网络,来分别得到相应的输出结果。不同的回归网络的实现方式可以相同,也可以不同,在本公开实施例中不做限制。在一个示例中,多个尺度下的特征差值可以分别输入多个回归网络,这多个回归网络具有一样的网络层结构,区别在于不同回归网络对于输入数据的格式要求不同。
在得到至少一个回归网络的输出结果以后,可以将至少一个回归网络的输出结果进行融合,并根据融合结果确定目标图像与参考图像的相似度。其中,融合的方式可以根据实际情况灵活选择,不局限于下述各公开实施例。在一种可能的实现方式中,可以直接将至少一个回归网络的输出结果进行相加,将相加结果作为融合结果;在一种可能的实现方式中,也可以将至少一个回归网络的输出结果的平均值作为融合结果;在一种可能的实现方式中,也可以对至少一个回归网络的输出结果进行加权平均,来得到融合结果,其中各回归网络的输出结果的权重可以根据实际情况灵活设定,在本公开实施例中不做限制。
得到的融合结果可以直接作为目标图像与参考图像的相似度,也可以进行一定的处理后转化为目标图像与参考图像的相似度,比如进行归一化处理等,具体如何选择可以根据实际情况灵活设定,在本公开实施例中不做限制。
通过将至少一个尺度下的特征差值分别输入回归网络,得到至少一个回归网络的输出结果,并将至少一个回归网络的输出结果进行融合,根据融合结果确定目标图像与参考图像的相似度,通过上述过程,可以基于目标图像与参考图像在不同尺度下的特征差值,来分别求取目标图像与参考图像的多个相似度,从而根据这多个相似度对目标图像与参考图像的相似度进行综合判断,提升了得到的相似度的准确性,继而可以更加准确与客观地评价目标图像的质量。
在确定目标图像与参考图像的相似度以后,可以通过步骤S14,确定目标图像的图像质量。其中,步骤S14的实现方式可以根据实际情况灵活决定,不局限于下述各公开实施例。在一种可能的实现方式中,可以直接将得到的相似度作为目标图像的图像质量;在一些可能的实现方式中,也可以将参考图像本身的质量评分与得到的相似度进行结合,来作为目标图像的图像质量;在一些可能的实现方式中,还可以将得到的相似度作为目标图像的图像质量的一个评判标准,与目标图像的其他图像质量评判标准进行结合,比如清晰度、完整度或是分辨率等,共同进行求和、平均值计算或是加权平均计算等,来确定目标图像的图像质量。
通过根据目标图像与参考图像的相似度,确定目标图像的图像质量,可以利用参考图像来对目标图像的图像质量进行更加准确客观地评价和判断。
在一些可能的实现方式中,本公开实施例中提出的图像处理方法,还可以通过目标神经网络进行实现,其中,目标神经网络的实现形式可以根据实际情况灵活决定。在一种可能的实现方式中,目标神经网络可以包括依次连接的特征提取网络、特征差值计算网络以及回归网络等。其中,特征提取网络以及回归网络的实现形式可以参考上述各公开实施例,在此不再赘述。特征差值计算网络可以通过一个或多个网络层进行实现,其结构在本公开实施例中不做限制。特征差值计算网络的处理方式可以参考上述各公开实施例,在此不再赘述。
在一种可能的实现方式中,目标神经网络可以通过训练数据进行训练,其中,训练数据可以包括从相关的图像数据集中获得的包含质量评分标注的目标图像以及参考图像。目标图像的质量评分标注的获取方式在本公开实施例中不做限制,不局限于下述各公开实施例。在一种可能的实现方式中,该质量评分标注可以通过人工手动打分进行获取;在一种可能的实现方式中,也可以通过相关的图像质量的评分方法,比如Elo评分算法等,来得到目标图像的质量评分标注。
训练数据所选取的图像数据集可以根据实际情况灵活选择,不局限于下述各公开实施例。在一个示例中,可以通过开源的图像处理数据集BAPPS来获取训练数据,在一个示例中,也可以通过图像处理数据集BAPPS和感知图像处理算法数据集(PIPAL,PerceptualImage Processing ALgorithms)来共同获取训练数据。
在一种可能的实现方式中,目标神经网络的训练过程可以包括:
将包含质量评分标注的目标图像以及参考图像输入至目标神经网络中,通过上述各公开实施例中提出的图像处理方法进行处理,得到目标神经网络输出的目标图像的图像质量;
根据目标神经网络输出的目标图像的图像质量,与目标图像的质量评分标注确定目标神经网络的误差损失;
根据误差损失,对目标神经网络中的至少一个网络参数进行调整,得到训练后的目标神经网络。
其中,误差损失的计算方式可以根据实际情况灵活选择,不局限于下述各公开实施例。在一个示例中,可以选用Rank loss损失函数来作为误差损失的计算方式。
在对目标神经网络中的网络参数进行调整的过程中,可以根据实际情况确定调整目标神经网络中哪些神经网络的网络参数。在一种可能的实现方式中,可以共同调整特征提取网络、特征差值计算网络以及回归网络的网络参数;在一种可能的实现方式中,在一次训练的过程中,也可以仅调整其中某个或某些神经网络的参数,在一个示例中,在一次训练的过程中,也可以保持特征提取网络的网络参数不变,仅调整特征差值计算网络以及回归网络的网络参数等。
通过目标神经网络来实现本公开实施例中提出的图像处理方法,可以实现端到端地图像质量评价,提升确定的图像质量的便捷性、效率和精确度。同时,本公开实施例中提出的方法还可以对目标神经网络中包含的各神经网络进行共同或分别训练,大大提升了训练的灵活程度,且可以进一步增强训练后得到的目标神经网络的精度,有效提升目标神经网络确定目标图像质量的客观性和住青年学习。
应用场景示例
随着图像处理技术的快速发展,生成的图像可能会存在各种形式的失真,如何对这些图像进行客观地质量判断,成为目前一个亟待解决的问题。
图4示出根据本公开一应用示例的示意图,如图所示,本公开实施例提出了一种图像处理方法,这一处理方法可以基于参考图像客观地确定目标图像的图像质量,该图像处理的过程可以为:
第一步,获取图片及预处理
本公开实施例中提出的方法可以通过向目标神经网络输入目标图像以及参考图像进行实现。如图所示,在一种可能的实现方式中,目标神经网络可以包括用于进行特征抓取的特征提取网络、用于计算特征差值的特征差值计算网络以及用于分数计算的回归网络。在一种可能的实现方式中,可以将用户提供的待进行质量评判的失真图作为目标图像,以及将用户用于评判失真图质量的参考图作为参考图像。目标神经网络将根据参考图像对目标图像的质量进行分数评测。在一种可能的实现方式中,用户提供的失真图与参考图可能不符合目标神经网络的输入需求,因此可以对用户提供的失真图与参考图进行图像预处理。在一个示例中,可以将失真图与参考图通过PyTorch转成张量格式后,分别进行正则化预处理,来得到预处理后的目标图像和参考图像,以此匹配后续特征提取网络的使用。在一个示例中,三通道RGB的正则化参数可以为:均值=[0.485,0.456,0.406],标准差=[0.229,0.224,0.225]。
第二步,特征抓取
如上述应用示例所述,在一种可能的实现方式中,特征抓取可以通过目标神经网络中的特征提取网络进行实现。在一种可能的实现方式中,特征提取网络的输入数据可以为第一步中得到的目标图像以及参考图像,特征提取网络的输出可以为从目标图像以及参考图像中提取的不同提取深度的特征向量。
特征提取网络的实现形式可以根据实际情况灵活选择。在一个示例中,特征提取网络可以是Alex网络,本公开应用示例可以分别获取第2、5、7、9以及12层等网络层的输出特征(即除第一层卷积层以外的卷积层输出特征);在一个示例中,特征提取网络可以是VGG网络,本公开应用示例可以分别获取第4、9、16、23以及30层等网络层的输出特征。上述两个应用示例所获取的输出特征,均可以囊括图像中的低频特征信息(图片背景等)以及中高频特征信息(纹理细节、外形轮廓等)。在一个示例中,本公开应用示例提出的特征提取网络可以为训练后的神经网络;在一个示例中,也可以通过训练数据对本公开应用示例中提出的特征提取网络进行训练。在一种可能的实现方式中,在训练过程中,在训练后续其余的回归网络等神经网络的情况下,特征提取网络的参数可以固定住,不与其余的神经网络共同进行训练。
第三步,特征差值计算
通过上述过程,可以通过特征提取网络多个深度下的特征提取,分别得到目标图像五个尺度下的五组第一特征图作为第一特征信息,以及参考图像五个尺度下的五组第二特征图作为第二特征信息。而后,特征差值计算网络可以分别对第一特征信息中每组第一特征图分别进行处理,在一个示例中,可以将各尺度下的第一特征图分别向四周八个位点方向(即左上,上,右上,左,右,左下,下,右下)进行位移,在每个尺度下分别得到包括原第一特征图在内共9个特征向量图作为第三特征信息。然后分别在各尺度下,将参考图像在该尺度下的第二特征图,分别与第三特征信息中包含的9个特征向量图依次做差,并遍历特征向量图中的各像素点,找出在每个像素点中参考图像的第二特征信息在9个特征差中最小差值的曼哈顿距离,作为该尺度下该像素点的特征差值。分别汇总五个尺度下各像素点的特征差值,可以得到五个尺度下第二特征信息与第一特征信息之间的特征差值。
第四步,目标图像与参考图像相似度的回归计算
通过上述过程,在经过特征差值计算网络后,可以得到五个不同尺度的特征差值。这五个特征差值分别进入五个回归网络,可以得到每个尺度的特征相似程度分,这些特征相似程度分均可以反映目标图像与参考图像的相似度。
在一个示例中,可以将上述五个特征相似程度分,直接相加,得到最终确定的目标图像与参考图像的相似度,并作为目标图像的图像质量分数。
在一个示例中,本公开应用示例中提出的目标神经网络可以通过训练数据进行训练,训练数据可以根据实际情况灵活选择,在一个示例中,可以使用训练数据集BAPPS进行训练,在一个示例中,也可以同时使用训练数据集PIPAL和训练数据集BAPPS进行训练。训练中选择的损失函数同样可以灵活决定,在一个示例中,可以通过Rank loss损失函数进行训练。
通过上述过程,可以对输入的参考图像和失真图像在空间扭曲类失真上进行更客观的评测,本公开应用示例提出的方法对GAN网络等新技术带来的新型失真效果更具有鲁棒性;而且该方法借助神经网络可以及时进行迭代更新,能够迅速应对产生空间扭曲型失真的任意图像生成方法,以此进行更客观的图像质量评价。
经过实验验证,在对基于对抗生成网络进行超分辨率处理所生成的图像进行质量评测的情况下,本公开应用示例提出的方法相比于相关的图像处理方法来说,斯皮尔曼秩相关性高出8%,因此本公开应用示例提出的方法在评价空间扭曲类失真图像的质量上具有较好的客观性,同时在对包含其他类型失真的图像进行质量评测的情况下,本公开应用示例提出的方法相比于相关的图像处理方法来说,确定的质量也较为客观准确。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了图像处理装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种图像处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图5示出根据本公开实施例的图像处理装置的框图。该图像处理装置可以为终端设备、服务器或者其他处理设备等。其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal DigitalAssistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。
在一些可能的实现方式中,该图像处理装置可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
如图5所示,所述图像处理装置20可以包括:
特征提取模块21,用于分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,目标图像与参考图像对应于同一场景。
特征差值获取模块22,用于根据目标图像中的多个第一像素点与参考图像中的第二像素点,获取第二特征信息与第一特征信息之间的特征差值,其中,多个第一像素点与第二像素点在空间中的距离不超过预设范围。
相似度确定模块23,用于根据特征差值,确定目标图像与参考图像的相似度。
图像质量确定模块24,用于根据目标图像与参考图像的相似度,确定目标图像的图像质量。
在一种可能的实现方式中,特征差值获取模块用于:将第一特征信息在预设范围内向至少一个方向进行移动,得到至少一个第三特征信息,其中,第三特征信息包括目标图像中的多个第一像素点;根据参考图像中的第二像素点,获取第二特征信息与至少一个第三特征信息之间的第一中间特征差值;根据至少一个第一中间特征差值,确定第二特征信息与第一特征信息之间的特征差值。
在一种可能的实现方式中,特征差值获取模块用于:将参考图像中的至少一个像素点分别作为第二像素点,并将目标图像中与第二像素点之间的位置距离在预设范围内的至少一个像素点,作为第一像素点;根据第二像素点在第二特征信息中对应的特征信息,与至少一个第一像素点在第一特征信息中对应的特征信息,得到至少一个第二中间特征差值;根据至少一个第二中间特征差值,确定第二像素点的特征差值;根据至少一个第二像素点的特征差值,确定第二特征信息与第一特征信息之间的特征差值。
在一种可能的实现方式中,第一特征信息包括至少一个尺度下的第一特征信息,第二特征信息包括至少一个尺度下的第二特征信息;特征差值获取模块用于:根据参考图像中的第二像素点与目标图像中的多个第一像素点,分别确定至少一个尺度下的第二特征信息与具有相同尺度的第一特征信息之间的特征差值,得到至少一个尺度下的特征差值。
在一种可能的实现方式中,特征提取模块用于:将目标图像输入特征提取网络,根据特征提取网络中至少一个网络层的输出,获取目标图像在至少一个尺度下的第一特征信息;将参考图像输入特征提取网络,根据特征提取网络中至少一个网络层的输出,获取参考图像在至少一个尺度下的第二特征信息。
在一种可能的实现方式中,相似度确定模块用于:将特征差值输入回归网络,根据回归网络的输出,确定目标图像与参考图像的相似度。
在一种可能的实现方式中,特征差值包括至少一个尺度下的特征差值;相似度确定模块用于:将至少一个尺度下的特征差值分别输入回归网络,得到至少一个回归网络的输出结果;将至少一个回归网络的输出结果进行融合,根据融合结果确定目标图像与参考图像的相似度。
在一种可能的实现方式中,目标图像通过对初始目标图像进行图像预处理所获得,参考图像通过对初始参考图像进行图像预处理所获得;图像预处理包括:正则化处理和/或格式变换。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,当计算机可读代码在设备上运行时,设备中的处理器执行用于实现如上任一实施例提供的图像处理方法的指令。
本公开实施例还提供了另一种计算机程序产品,用于存储计算机可读指令,指令被执行时使得计算机执行上述任一实施例提供的图像处理方法的操作。
电子设备可以被提供为终端、服务器或其它形态的设备。
图6示出根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图6,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理***,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图7示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图7,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作***,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在一些可能的实现方式中,图像处理装置20中包含的各模块,与被提供为终端、服务器或其他形态的设备的电子设备中所包含的各硬件模块相互对应,对应方式可以根据电子设备的设备形态灵活决定,不局限于下述各公开实施例。举例来说,在一个示例中,图像处理装置20中所包含的各模块可以与终端形态的电子设备中的处理组件802对应;在一个示例中,图像处理装置20中所包含的各模块也可以与服务器形态的电子设备中的处理组件1922对应。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (11)
1.一种图像处理方法,其特征在于,包括:
分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,所述目标图像与所述参考图像对应于同一场景;
根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,其中,所述多个第一像素点与所述第二像素点在空间中的距离不超过预设范围;
根据所述特征差值,确定所述目标图像与所述参考图像的相似度;
根据所述目标图像与所述参考图像的相似度,确定所述目标图像的图像质量。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,包括:
将所述第一特征信息在所述预设范围内向至少一个方向进行移动,得到至少一个第三特征信息,其中,所述第三特征信息包括所述目标图像中的多个第一像素点;
根据所述参考图像中的第二像素点,获取所述第二特征信息与至少一个第三特征信息之间的第一中间特征差值;
根据至少一个所述第一中间特征差值,确定所述第二特征信息与所述第一特征信息之间的特征差值。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,包括:
将所述参考图像中的至少一个像素点分别作为第二像素点,并将所述目标图像中与所述第二像素点之间的位置距离在预设范围内的至少一个像素点,作为所述第一像素点;
根据所述第二像素点在所述第二特征信息中对应的特征信息,与至少一个所述第一像素点在所述第一特征信息中对应的特征信息,得到至少一个第二中间特征差值;
根据所述至少一个第二中间特征差值,确定所述第二像素点的特征差值;
根据至少一个所述第二像素点的特征差值,确定所述第二特征信息与所述第一特征信息之间的特征差值。
4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述第一特征信息包括至少一个尺度下的第一特征信息,所述第二特征信息包括至少一个尺度下的第二特征信息;
所述根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,包括:
根据所述参考图像中的第二像素点与所述目标图像中的多个第一像素点,分别确定所述至少一个尺度下的第二特征信息与具有相同尺度的所述第一特征信息之间的特征差值,得到至少一个尺度下的特征差值。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,包括:
将所述目标图像输入特征提取网络,根据所述特征提取网络中至少一个网络层的输出,获取所述目标图像在至少一个尺度下的第一特征信息;
将所述参考图像输入特征提取网络,根据所述特征提取网络中至少一个网络层的输出,获取所述参考图像在至少一个尺度下的第二特征信息。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述根据所述特征差值,确定所述目标图像与所述参考图像的相似度,包括:
将所述特征差值输入回归网络,根据所述回归网络的输出,确定所述目标图像与所述参考图像的相似度。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述特征差值包括至少一个尺度下的特征差值;
所述根据所述特征差值,确定所述目标图像与所述参考图像的相似度,包括:
将所述至少一个尺度下的特征差值分别输入回归网络,得到至少一个所述回归网络的输出结果;
将所述至少一个回归网络的输出结果进行融合,根据融合结果确定所述目标图像与所述参考图像的相似度。
8.根据权利要求1至7中任意一项所述的方法,其特征在于,所述目标图像通过对初始目标图像进行图像预处理所获得,所述参考图像通过对初始参考图像进行图像预处理所获得;
所述图像预处理包括:正则化处理和/或格式变换。
9.一种图像处理装置,其特征在于,包括:
特征提取模块,用于分别获取目标图像的第一特征信息,以及参考图像的第二特征信息,其中,所述目标图像与所述参考图像对应于同一场景;
特征差值获取模块,用于根据所述目标图像中的多个第一像素点与所述参考图像中的第二像素点,获取所述第二特征信息与所述第一特征信息之间的特征差值,其中,所述多个第一像素点与所述第二像素点在空间中的距离不超过预设范围;
相似度确定模块,用于根据所述特征差值,确定所述目标图像与所述参考图像的相似度;
图像质量确定模块,用于根据所述目标图像与所述参考图像的相似度,确定所述目标图像的图像质量。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至8中任意一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至8中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011337518.6A CN112529846A (zh) | 2020-11-25 | 2020-11-25 | 图像处理方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011337518.6A CN112529846A (zh) | 2020-11-25 | 2020-11-25 | 图像处理方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112529846A true CN112529846A (zh) | 2021-03-19 |
Family
ID=74993282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011337518.6A Withdrawn CN112529846A (zh) | 2020-11-25 | 2020-11-25 | 图像处理方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112529846A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450323A (zh) * | 2021-06-22 | 2021-09-28 | 深圳盈天下视觉科技有限公司 | 质量检测方法、装置、电子设备及计算机可读存储介质 |
WO2023142753A1 (zh) * | 2022-01-27 | 2023-08-03 | 华为技术有限公司 | 图像相似性度量方法及其装置 |
CN116843690A (zh) * | 2023-09-01 | 2023-10-03 | 荣耀终端有限公司 | 图像质量评估方法、设备及*** |
-
2020
- 2020-11-25 CN CN202011337518.6A patent/CN112529846A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450323A (zh) * | 2021-06-22 | 2021-09-28 | 深圳盈天下视觉科技有限公司 | 质量检测方法、装置、电子设备及计算机可读存储介质 |
WO2023142753A1 (zh) * | 2022-01-27 | 2023-08-03 | 华为技术有限公司 | 图像相似性度量方法及其装置 |
CN116843690A (zh) * | 2023-09-01 | 2023-10-03 | 荣耀终端有限公司 | 图像质量评估方法、设备及*** |
CN116843690B (zh) * | 2023-09-01 | 2024-03-01 | 荣耀终端有限公司 | 图像质量评估方法、设备及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310616B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110647834B (zh) | 人脸和人手关联检测方法及装置、电子设备和存储介质 | |
CN110674719B (zh) | 目标对象匹配方法及装置、电子设备和存储介质 | |
CN110688951B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109697734B (zh) | 位姿估计方法及装置、电子设备和存储介质 | |
CN111783986B (zh) | 网络训练方法及装置、姿态预测方法及装置 | |
CN110287874B (zh) | 目标追踪方法及装置、电子设备和存储介质 | |
CN110503689B (zh) | 位姿预测方法、模型训练方法及装置 | |
CN105809704A (zh) | 识别图像清晰度的方法及装置 | |
CN112529846A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111435432B (zh) | 网络优化方法及装置、图像处理方法及装置、存储介质 | |
CN109145970B (zh) | 基于图像的问答处理方法和装置、电子设备及存储介质 | |
CN111243011A (zh) | 关键点检测方法及装置、电子设备和存储介质 | |
CN115100472B (zh) | 展示对象识别模型的训练方法、装置和电子设备 | |
CN111523485A (zh) | 位姿识别方法及装置、电子设备和存储介质 | |
CN111931844A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112967264A (zh) | 缺陷检测方法及装置、电子设备和存储介质 | |
CN111340048A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112184787A (zh) | 图像配准方法及装置、电子设备和存储介质 | |
CN111339880A (zh) | 一种目标检测方法及装置、电子设备和存储介质 | |
CN109903252B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112016443A (zh) | 同行识别方法及装置、电子设备和存储介质 | |
CN114066856A (zh) | 模型训练方法及装置、电子设备和存储介质 | |
CN113538310A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111311588B (zh) | 重定位方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20210319 |
|
WW01 | Invention patent application withdrawn after publication |