CN112868228A - 自适应dct锐化器 - Google Patents

自适应dct锐化器 Download PDF

Info

Publication number
CN112868228A
CN112868228A CN201980068474.0A CN201980068474A CN112868228A CN 112868228 A CN112868228 A CN 112868228A CN 201980068474 A CN201980068474 A CN 201980068474A CN 112868228 A CN112868228 A CN 112868228A
Authority
CN
China
Prior art keywords
image
encoded
factors
coefficients
encoded image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980068474.0A
Other languages
English (en)
Other versions
CN112868228B (zh
Inventor
佩曼·米兰法
杨峰
崔盛中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN112868228A publication Critical patent/CN112868228A/zh
Application granted granted Critical
Publication of CN112868228B publication Critical patent/CN112868228B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

提供了用于锐化或以其它方式修改压缩图像而无需对图像解压缩和重新编码的方法。整体图像质量是基于压缩图像的源、压缩图像的量化表或者一些其它因素来确定的,并且与图像质量相对应的缩放因数的集合被选择。所选择的缩放因数随后被应用于图像的量化表的对应量化因数或者描述压缩图像的图像内容的压缩图像的其它参数。给定缩放因数的集合中的缩放因数可以由机器学习过程来确定,所述机器学习过程涉及到基于训练图像来训练缩放因数,所述训练图像通过解压缩并且随后锐化或以其它方式修改压缩图像的源集合来确定。这些方法可以关于编码图像大小和图像修改方法的计算成本提供改善。

Description

自适应DCT锐化器
相关申请的交叉引用
本申请要求于2018年12月05日提交的美国申请序列号16/210,900的权益,所述申请通过引用全文结合于此。
背景技术
数字图像可以被压缩以便提供诸如减少数字图像的存储和/或传输成本的优势。存在用于图像压缩的各种有损和无损方法。有损图像压缩方法导致了输入图像的压缩版本,其无法被用来精确地重新生成输入图像。然而,这样的有损压缩方法允许生成对于人类感知而言表现为与输入图像充分相似的输出图像,从而在至少一些场境中是能够被接受的。一些有损图像压缩技术可以允许以这种程度的相似度来换取有所提高的压缩比,从而作为所输出的、压缩图像的图像质量降低的回报而允许较小的压缩图像文件大小。
发明内容
本公开的第一方面涉及一种用于有效增强压缩图像(例如,改善其锐度)的方法,该方法包括:(i)获取编码图像,所述编码图像包括(a)指示相应空间频率处编码图像的图像内容的系数的集合,和(b)指示应用于系数的集合中的相应系数的缩放程度的量化因数的集合;(ii)获取编码图像的质量值;(iii)基于质量值,从多个缩放因数的集合中选择缩放因数的集合;(iv)通过应用所选择的缩放因数的集合以缩放编码图像的量化因数的集合来生成经修改的编码图像;以及(v)将经修改的编码图像的指示传送至请求方设备。
系数的集合可以是离散余弦变换系数。所选择的缩放因数的集合可以包括N个缩放因数,其中该N个缩放因数中的每一个对应于相应不同的空间频率,并且其中应用所选择的缩放因数的集合以缩放编码图像的量化因数的集合包括将N个缩放因数中的每个给定缩放因数应用于量化因数的集合中与该给定缩放因数的空间频率相对应的一个或多个量化因数。N可以是15。获取编码图像的质量值可以包括确定编码图像是由用户提交还是从视频提取。获取编码图像的质量值可以包括基于量化因数确定质量值。编码图像的量化因数可以被存储在编码图像的量化表中。获取编码图像可以包括从视频流的帧中提取编码图像。编码图像可以根据JPEG图像压缩格式被编码。
本公开的第二方面涉及一种方法,该方法包括:(i)获取图像的训练集合,其中图像的训练集合中的每个图像具有相应的质量值;(ii)基于训练集合中的图像的质量值来从训练集合中选择具有与特定质量值相对应的相应质量值的一个或多个图像;并且针对一个或多个图像中的每个给定图像:(iii)获取该给定图像的编码版本和该给定图像的参考版本,其中该给定图像的编码版本包括(i)指示相应空间频率处该给定图像的图像内容的系数的集合,和(ii)指示应用于系数的集合中的相应系数的缩放程度的量化因数的集合;(iv)应用与该特定质量值相对应的缩放因数的集合以缩放该给定图像的编码版本的量化因数的集合;(v)通过使用已经被缩放因数的集合缩放的量化因数对系数的集合进行解码来生成该给定图像的增强解码版本;以及(vii)基于该给定图像的增强解码版本和该给定图像的参考版本之间的比较关系来更新缩放因数的集合。
更新缩放因数的集合可以包括:将给定图像的增强解码版本和该给定图像的参考版本相比较。该方法可以进一步包括:获取编码图像,其中编码图像包括:(i)表示相应空间频率处编码图像的图像内容的系数的集合,和(ii)指示应用于系数的集合中的相应系数的缩放程度的量化因数的集合,并且其中编码图像的质量值对应于该特定质量值;生成经修改的编码图像,其中生成经修改的编码图像包括应用所更新的缩放因数的集合以缩放编码图像的量化因数的集合;以及将经修改的编码图像的指示传送至请求方设备。图像的训练集合可以包括编码图像的集合。获取该给定图像的参考版本可以包括:解码该给定图像的编码版本;以及锐化所解码的该给定图像的编码版本。该给定图像的编码版本可以根据JPEG图像压缩格式进行编码。该给定图像的编码版本的系数的集合可以是离散余弦变换系数。对应于该特定质量值的缩放因数的集合可以包括N个缩放因数,其中该N个缩放因数中的每一个对应于相应不同的空间频率,并且其中应用与该特定质量值相对应的缩放因数的集合以缩放该给定图像的编码版本的量化因数的集合包括将该N个缩放因数中的每个给定缩放因数应用于量化因数的集合中对应于该给定缩放因数的空间频率的一个或多个量化因数。
本公开的又一个方面涉及一种非瞬时性计算机可读介质,其被配置为至少存储计算机可读指令,所述计算机可读指令在被计算设备的一个或多个处理器执行时使得该计算设备执行计算机操作,所述计算机操作包括:(i)获取编码图像,所述编码图像包括(a)指示相应空间频率处该编码图像的图像内容的系数的集合,和(ii)指示应用于系数的集合中的相应系数的缩放程度的量化因数的集合;(ii)获取编码图像的质量值;(iii)基于质量值,从多个缩放因数的集合中选择缩放因数的集合;(iv)通过应用所选择的缩放因数的集合以缩放编码图像的量化因数的集合来生成经修改的编码图像;并且(v)将经修改的编码图像的指示传送至请求方设备。
将要意识到的是,方面可以以任何常规形式来实施。例如,方面可以通过适当的计算机程序来实施,所述计算机程序可以被承载于适当的载体介质上,所述载体介质可以是有形的载体介质(例如,磁盘)或非有形载体介质(例如,通信信号)。方面也可以使用适合的装置来实施,所述装置可以采用运行被布置为实施本发明的计算机程序的可编程计算机的形式。方面可以被组合,使得在一个方面的上下文中所描述的特征可以在另一个方面中被实施。例如,将要意识到的是,第一方面的缩放因数可以根据第二方面来生成。
通过在适当的情况下参考附图阅读以下详细描述,这些以及其它的方面、优势和替换对于本领域技术人员而言将会变得显而易见。进一步地,应当理解的是,在该发明内容部分以及本文的其它地方所提供的描述意在通过示例而非限制方式来说明所请求保护的主题。
附图说明
图1A是根据示例实施例的方法的流程图。
图1B是根据示例实施例的方法的流程图。
图1C是根据示例实施例的方法的流程图。
图2A图示了示例图像。
图2B图示了对图2A的图像中一部分的示例基于频率的分解。
图2C图示了示例量化表。
图2D图示了在缩放和量化之后图2B的基于频率的分解。
图3是根据示例实施例的方法的流程图。
图4是示出示例***的一些部件的简化框图。
图5是根据示例实施例的方法的流程图。
图6是根据示例实施例的方法的流程图。
具体实施方式
本文描述的方法和***的示例。应当理解的是,词语“示例性”、“示例”和“说明性”在本文被用来表示“充当示例、实例或说明”。在本文被描述为“示例性”、“示例”或“说明性”的任何实施例或特征都并不一定要被理解为相比其它实施例或特征是优选的或有利的。进一步地,本文所描述的示例性实施例并非意在作为限制。将会轻易理解的是,所公开的***和方法的某些方面可以以各种不同配置进行布置和组合。
I.概述
在各种应用中,对图像或其它信息进行编码而使得图像或其它信息的大小可以有所减小会是有益的。作为这样的编码的结果,可以使用较少的存储空间和/或带宽来存储、传送、复制或以其它方式操纵或使用图像或其它信息。编码(或压缩)可以是无损或有损的。无损压缩以允许信息后续被精确还原为其压缩前状态的方式减小信息的大小。有损压缩则并非如此。相反地,有损压缩可以允许可能的压缩程度和后续可以从图像或其它信息的压缩版本恢复的图像或其它信息的“质量”之间有所权衡。
这样的权衡可以基于被压缩信息的预期用途来实施。例如,在压缩图像时,压缩方法可以考虑人类视力的属性(例如,相对于色度,眼睛对于亮度有所提高的敏感度),而使得压缩过程可以以人眼不太能够检测到的方式从图像丢弃信息或使其失真。因此,被压缩图像的大小可以有所减小,同时保持表面上图像质量的整体水平。
被压缩图像(例如,从云视听共享服务的用户所接收的JPEG图像或者从这样的用户所接收的视频的压缩帧)可以被处理以便改善被压缩图像所表示的图像。例如,被压缩图像可以被解压缩和/或解码,并且被解码图像随后可以根据应用被锐化、模糊或以其它方式被滤波和/或增强。例如,这些图像处理步骤可以被执行以便改善被用作缩略图的图像的外观,所述缩略图诸如作为视频共享服务的一部分所提供的缩略图,以便提供所共享视频的内容的指示。经滤波的图像随后可以被压缩以便减少存储该图像所需的空间和/或减少将该图像传送至请求该图像的那些人(例如,传送至被用来浏览视频共享网站的设备)所需的带宽。
然而,这样的经滤波和重新压缩的图像的大小可能比源压缩图像更大。这可能是由于滤波过程降低了图像的“可压缩性”(例如,通过引入高空间频率信息),压缩和解压缩过程引入了伪像(例如,被压缩图像的瓦片(tile)之间的边界处的边缘伪像),或者一些其它机制。因此,可能有益的是直接对被压缩图像实施这样的锐化、滤波或其它增强步骤,而无需首先对被压缩图像解压缩并且随后在滤波之后重新压缩该图像。这样的方法可能另外具有关于计算成本的益处(例如,由于去除了解压缩和重新压缩的步骤)。
这样的方法可以包括通过直接修改被压缩图像的参数(例如,量化表的量化因数、离散余弦变换系数)来对被编码(例如,被压缩)图像执行锐化、增强或其它图像处理功能,所述参数例如在空间频域、核域、图像金字塔域或者在以促进图像的编码和解码的一些其它方式指示图像的内容的一些其它格式或域指示图像内容。例如,图像的编码版本可以包括表示相应空间频率(例如,相对于图像的帧的两个或更多个方向中的不同空间频率)处图像内容的系数的集合,以及指示在编码期间(例如,在有损编码过程的量化步骤之前)被应用于系数的缩放程度并且可以被(例如,逆向地)应用于解码系数以便生成解码图像的量化因数的集合(例如,形成编码图像的量化表的一部分)。
在一种示例实施方式中,量化因数和/或系数可以被缩放或以其它方式***纵以实现在被缩放(或以其它方式***纵)的量化因数被应用于系数以便对编码图像进行解码时所生成图像的锐化、模糊、增强或其它修改。经修改的编码图像的大小可以与缩放之前的编码图像的大小基本上相似(例如,相同),因为编码图像尚未被解码以及随后被重新编码。被应用于缩放量化因数(例如,离散余弦变换系数)的缩放因数的集合可以基于编码图像的一个或多个属性来从多个潜在的缩放系数的集合中选择。例如,缩放系数的集合可以基于图像的质量被选择。特别地,以不同方式锐化或以其它方式增强具有不同质量水平的图像会是有益的,例如从而较低质量的图像经受更大幅度的锐化和/或在不同空间频率被缩放到不同程度。
缩放因数的集合可以以各种方式来生成。在一些示例中,缩放因数的集合可以被人工确定。附加地或替选地,可以应用自动算法来生成缩放因数的集合。例如,可以应用梯度下降、遗传算法或其它方法来确定缩放因数的集合,例如通过行动以最小化编码图像经解码和锐化(或者以其它方式被增强)的版本与在应用缩放因数之后被解码的那些编码图像的版本之间所确定的差异。为了使用这样的方法来训练缩放因数的集合,具有相似质量值(例如,具有指定质量值范围内的质量值)的编码图像的集合可以被用来训练缩放因数的集合,所述缩放因数的集合随后被用来缩放具有与编码图像的集合的质量值相对应的质量值的附加编码图像。可以根据这样的方法对与相应不同的质量值和/或质量值范围相对应的多个缩放因数的集合进行训练。
应当理解的是,以上实施例以及本文所描述的其它实施例是出于解释的目的被提供,而并非意在作为限制。
II.编码空间中的示例图像改善
为了减少用来存储图像的空间、减少用来传送图像的带宽,或者为了提供一些其它益处,可以对图像进行编码(例如,压缩)以便减小该图像的大小。这样的编码可以是无损的(在这种情况下,原图像可以通过解码被编码图像来被恢复而没有修改)或者有损的(在这种情况下,通过解码被编码图像所生成的图像与原图像有所不同)。
图1A中通过示例图示了图像编码过程,其图示了对源图像110进行编码(“编码”)以生成编码图像120的示例过程100a。编码图像120随后可以被存储、传送、复制,或者以一些其它方式被使用。编码图像120(例如,已经传送了针对其的请求之后被传送至设备的编码图像120的副本)随后可以被解码(“解码”)以生成解码图像130a。这样的解码例如可以由请求方设备来执行,所述请求方设备向其上已经存储有编码图像120的服务器或其它***传送请求。因此,使得源图像110的表示(例如,具有降低的分辨率、降低的色彩深度、表现出压缩伪像或者以与编码和解码过程有关的一些其它方式有所不同的版本)对请求方设备可用,同时使用比将要用来传送未压缩源图像110的更少带宽。
一旦图像被编码,源图像的图像内容(例如,在多个不同空间频率处的图像的特定瓦片或区域的内容)可以以各种方式在编码图像中进行表示。例如,离散余弦变换系数、核系数、表示源图像的局部区域的滤波版本的值或者源图像的一些其它表示可以被包含在编码图像之内。这些代表性值可以是舍入、量化、稀疏化、最大化或最小化操作或者导致有关源图像的一些信息的损失的一些其它操作的结果,例如以便促进源图像被压缩为大小比源图像小的编码图像。该编码图像可以另外包括(例如,存储在量化表中的)量化因数或者指示用来编码和/或解码系数的一些其它信息。因此,这样的量化因数或其它信息也表示图像内容,因为该信息是根据该系数生成与编码图像相关的图像域信息(例如,像素值)所需要的。
可以通过对编码图像进行解码、对解码图像执行图像处理(例如,锐化、模糊、滤波、增强,或者一些其它图像操纵任务)并且随后将经处理的解码图像进行编码来对编码图像执行某些图像处理任务。这在图1B中通过示例被图示,其图示了对编码图像120进行解码(“解码”)以生成解码图像130b的示例过程100b。解码图像130b随后被锐化(“锐化”)或者经受一些其它图像处理任务。经锐化的解码图像135b随后被编码(“编码”)以生成锐化编码图像125b。该锐化编码图像125b随后可以被使用,例如被传送至向其上已经存储有锐化编码图像125b的服务器或其它***传送请求的请求方设备。
这样的锐化或其它图像处理任务可以被执行以便增强被用作缩略图的图像。这样的缩略图例如可以是从视频或视频流的帧提取的低质量图像。缩略图可以在搜索网站、视频托管网站或者编码图像在其中被传送至请求方设备的一些其它服务上被呈现。通过对编码图像执行锐化或其它图像处理步骤并且对它们重新编码,所提供的缩略图或其它锐化编码图像相对于经编码的、未处理图像在审美上会更加令人愉悦或者以其它方式有所改善。通过改善图像的审美或其它属性,用户将与图像交互(例如访问锐化编码图像所表示的视频)的可能性可以有所提高。
然而,这样的(解码、图像处理和重新编码)过程所生成的经编码的处理图像的大小可能比它们从其所生成的编码图像更大。这可能是由于图像处理降低了解码图像的“可压缩性”(例如,通过引入高空间频率信息),编码和解码过程引入了增加经处理的编码图像大小的伪像(例如,被解码图像的瓦片之间的边界处的边缘伪像),或者一些其它机制。此外,解码和重新编码图像的过程可能具有高的计算成本。
因此,对编码图像实施增强(例如,锐化)或其它图像处理而无需首先解码图像会是有益的,例如通过直接对编码图像的量化因数进行操作,所述量化因数被用来解码编码图像并且因此表示编码图像的图像内容。这样的方法可以降低锐化编码图像或者对编码图像应用一些其它图像处理的计算成本(例如,通过避免了解码和重新编码步骤)。进一步地,例如通过“适当地”操纵编码图像的量化因数或其它内容(例如,通过缩放)而使得经处理的编码图像的大小基本上与编码图像相同(例如,完全与其大小相同)、通过避免对可能在编码图像的解码版本中存在的压缩伪像进行编码或者由于一些其它因素,这样的方法可以减少所产生的经处理编码图像的大小。
图1C图示了对编码图像120进行重新代码化(“重新代码化”)以生成经锐化或以其它方式增强的编码图像125c的示例过程100c。相对于对编码图像120进行解码所生成的解压缩图像,通过解码锐化编码图像125c所生成的解压缩图像可以关于锐度、审美质量或者一些其它感兴趣因素得到增强。锐化编码图像120c随后可以被使用,例如被传送至向其上已经存储有编码锐化图像125c的服务器或其它***传送请求的请求方设备。
有各种方式来实施这种对编码图像进行“重新代码化”的方法,以在能够通过对编码图像解码而无需对编码图像解码并随后重新编码来生成的图像中实现某些所期望的变换(例如,增加的锐度和/或审美质量)。这样的方法可以包括对表示解码图像的图像内容的编码图像的系数、量化因数、参数或其它值应用缩放因数,所述图像内容例如是处于相应空间频率和/或图像内的位置的图像内容、表示该图像的内容与图像内各种位置处的相应核函数或滤波器的相似性的内容、表示应用于相应空间频率处的图像内容的缩放程度的内容或者在与用来编码源图像的方法有关的一些空间中的图像内容的一些其它表示。编码图像的这样的系数、量化因数、参数或其它值可以被缩放(例如,以取决于该值的空间频率的方式),使得当编码图像被解码时(例如,通过应用经缩放量化因数的集合以重新缩放编码图像的其它系数),所产生的解码图像相对于从源编码图像解码的图像关于锐度、审美或者一些其它感兴趣因素有所改善。
这样的缩放因数的集合可以以各种方式来生成。在一些示例中,缩放因数可以人工地被确定,例如经由改变缩放因数并且观察这样的改变对于所产生的缩放解码图像的影响的人工过程。附加地或替选地,可以应用自动方法来生成这样的缩放因数的集合。这样的方法可以对输入图像的集合(例如,所输入的编码图像)进行操作以生成缩放因数的集合,使得在缩放因数被应用于编码图像时,从其所生成的解码图像与一些所期望的图像和/或图像属性相符合。
例如,可以针对每个编码图像获取“参考图像”(例如,通过解码和滤波编码图像、通过使用被用来生成编码图像的原始或以其它方式未被压缩的图像或者一些其它方法),并且从给定编码图像所确定的经缩放解码图像可以与对应于给定图像的参考图像相比较。随后可以根据该比较或者根据一些其它感兴趣因素(例如,经缩放解码图像的锐度或对比度的量度)更新被用来生成经缩放解码图像的缩放因数的集合。可以应用梯度下降、遗传算法或者一些其它机器学习技术来更新缩放因数的集合。
这样的缩放因数的集合中的每个缩放因数可以对应于表示编码图像的图像内容和/或表示用来编码和/或解码图像的方法的编码图像的量化因数、系数、参数或其它值中的一个或多个。在一些示例中,编码图像可以具有系数的集合,每一个所述系数的集合表示在编码图像的相应不同区域(例如,非重叠的图像瓦片)内的编码图像的图像内容(例如,相应空间频率处的内容)。编码图像可以附加地包括一个或多个量化因数的集合,所述量化因数的集合表示应用于这样的系数以便编码图像的缩放程度(例如,在量化步骤之前应用的缩放程度)和/或应用于这样的系数以便解码图像的缩放程度。缩放因数的集合可以被生成使得针对每个量化因数确定单独缩放因数。替选地,缩放因数的集合中的每个缩放因数可以例如根据空间频率、定向、核大小或者量化因数的一些其它特性而对应于量化因数的子集。
例如,(例如,根据JPEG图像压缩格式被编码的)编码图像的每个区域可以由指示相应空间频率处的编码图像的内容的系数的集合(例如,多个不同空间频率处的离散余弦变换系数)所表示。为了对编码图像进行解码,系数的集合中的每一个系数的集合内的每个系数可以被缩放至编码图像的相应量化因数所指定的程度。可以向量化因数应用N个缩放因数的集合,每个因数对应于相应不同的空间频率(例如,从DC到编码图像的每个区域所能够表示的最高空间频率的频率范围)。缩放因数中的每一个可以被应用于关于空间频率与缩放因数相对应的编码图像的相应的量化因数的集合。这些经缩放的量化因数随后可以被应用以重新缩放编码图像的系数,以便对编码图像进行解码。
在一个示例中,编码图像可以根据JPEG图像压缩格式被编码,使得源图像的每个8乘8像素区域(或瓦片)在编码图像中由8乘8离散余弦变换系数的集合所表示(由于量化、行程编码或其它因素,它们中的一些可以从编码图像内的明确表达式中被省去)。编码图像另外包括量化表,所述量化表包含指示每个区域的系数应当被缩放的程度以解码编码图像的量化因数的集合。8乘8离散余弦变换系数的集合中的每一个表示相应空间频率处的源图像的对应像素的集合内的内容,例如,第一系数表示源图像的DC分量,第二个表示水平方向的第一、最低频率以及垂直方向的DC,第三个表示水平方向的第二、较高频率以及垂直方向的DC,进一步的系数表示垂直方向的第一、最低频率以及水平方向的DC,又一个系数表示在垂直和水平方向两者上的第一、最低频率等等。因此,第一缩放因数可以被应用于被用来缩放表示DC空间频率的系数的那些量化因数,第二缩放因数可以被应用于被用来缩放表示第一、最低空间频率的系数的那些量化因数等等。
在这样的示例中,在源图像的区域(例如,8乘8像素区域)在编码图像中由对应的8乘8系数的集合(例如,离散余弦变换系数)所表示的情况下,缩放因数的集合可以包括针对从DC到8乘8系数的集合中所表示的最高频率的每个空间频率的八个缩放因数。在另一个示例中,可以针对水平和垂直空间频率确定独立的缩放因数。在这样的示例中,缩放因数的集合可以包括15个缩放因数(其中水平和垂直DC空间频率由单个“DC”缩放因数所表示)。替选地,可以针对8乘8系数的集合中的每个系数确定独立的缩放因数。本领域技术人员将会认识到,基于8乘8系数的集合和/或8乘8像素区域,这些示例可以适配区域的其它大小和形状和/或对应的系数的集合。
这样的缩放因数的集合有效地锐化或以其它方式增强编码图像的能力可以与编码图像的整体“质量”有关。例如,低质量编码图像(例如,通过来自上传视频文件的提取的帧所获取的编码图像)可能通过比较高质量的编码图像(例如,由用户操作静态图像相机所生成并且将它们上传以充当同样由用户所上传的视频的缩略图的编码图像)所可能的更多地放大高空间频率来被锐化或以其它方式被增强。因此,可以针对图像的不同“质量值”确定不同的缩放因数的集合。例如,可以基于质量值从训练图像的集合中选择编码图像的子集,并且每个子集可以被用来训练(例如,经由自动的机器学习过程)与用于训练的训练图像的子集的质量值相对应的缩放因数的集合。
编码图像的“质量值”可以以各种方式来定义和/或获取。在一些示例中,特定图像的质量值可以基于图像源而被确定。例如,从视频流提取的图像可以是“低质量”图像,并且特意从用户接收的图像(例如,用于充当那些用户所上传视频的缩略图)可以是“高质量”图像。在另一个示例中,编码图像的质量可以基于编码图像和/或由其所表示的解码图像的属性来确定。例如,编码图像的高空间频率内容量或者从编码图像解码的图像的锐度可以被确定,并且被用来针对编码图像生成质量值。在又一个示例中,质量值可以是编码图像的显式编码参数(例如,EXIF数据),和/或从图像的量化因数(例如,从包含这样的量化因数的量化表)或者描述编码图像和/或用来生成编码图像的过程的其它参数所确定。
这些方法可以被用来对根据JPEG图像压缩格式编码的图像进行锐化或者以其它方式增强提供显著的改善。当被应用于“高质量”图像(例如,从视频共享网站的用户接收以充当共享视频的缩略图的图像)时,与通过对编码图像进行解码,对被解码图像应用锐化图像过程并且重新编码经锐化图像而被锐化的图像相比,使用本文所描述的方法被锐化的编码图像的大小通常小27%。当被应用于“低质量”图像(例如,从接收自视频共享网站的用户的视频文件的帧所提取的图像)时,与通过对编码图像进行解码,对被解码图像应用锐化图像过程并且重新编码经锐化图像而被锐化的图像相比,使用本文所描述的方法被锐化的编码图像的大小通常小29%。此外,针对高质量和低质量图像二者,与对编码图像进行解码,对被解码图像应用锐化图像过程并且重新编码经锐化图像相比,对编码图像应用缩放因数的集合通常要求少9%的计算时间。
III.示例编码和解码
图像可以被编码,使得图像的大小有所减小。因此,可以使用更少的存储空间和/或带宽来存储、传送、复制或以其它方式操纵或使用被编码图像。该编码(或压缩)可以是无损的或有损的。有损压缩可以允许可能的压缩程度和后续可以从图像或其它信息的压缩版本恢复的图像或其它信息的“质量”之间有所权衡。这样的权衡可以基于与人类视觉***感知图像的方式相关的知识来实施,使得图像中人眼对于其不太敏感的方面可以被更多地压缩,而不会影响到解压缩图像的主观体验。例如,编码方法可以通过对色度信息降采样、通过相对于亮度信息减少色度信息被存储的比特深度和/或通过相对于亮度信息使用不同的、较低质量的量化表或其它参数以便编码色度信息来考虑人眼相对于色度对于亮度的增加的敏感度。在另一个示例中,与较低空间频率的内容相比,图像中较高空间频率的内容可以在编码期间被量化、舍入或以其它方式被退化到更大程度。因此,压缩图像的大小可以被减小,同时保持表面上图像质量的整体水平。
图像的编码可以部分地通过首先将图像变换为不同颜色的表示而被实施。例如,具有红-绿-蓝(RGB)表示的图像可以被转换为亮度-色度(YUV)表示。替选地或附加地,编码可以涉及到在应用图像数据从图像的二维像素空间到空间频率空间或一些其它空间的任何变换之前对源图像降采样(例如,对图像的色度通道降采样)、应用线性或非线性滤波器、对图像的像素值量化/舍入或者对“图像空间中的”图像执行一些其它操纵。该预处理的图像数据随后可以被转化到另一个域,例如其中可以进行进一步压缩的空间频率域。
这样的替选空间可以被选取,使得图像在替选空间中的表示是“稀疏的”。也就是说,替选空间中的表示可以包括代表性系数的小子集,其包含图像的“大部分”(例如,具有基本上非零的值),而代表性系数的更多的大量剩余子集则具有等于或接近零的值并且因此表示源图像的图像内容的小部分。因此,剩余子集可以被丢弃,从而减小了编码图像的总体大小,同时保留了源图像的大多数可感知内容。这样的过程可以包括例如在缩放过程之后对系数进行量化或以其它方式进行舍入(例如,向下舍入),以强调被发现对于人类视觉感知更加“重要”的那些系数(例如,较低空间频率)。这样的替选空间可以包括空间频率空间(例如,由图像空间数据的离散余弦变换系数所表示)、基于核的空间或者一些其它变换空间。
图2A图示了可以被编码的示例图像200或者这样的图像的特定颜色通道(例如,亮度通道、色度通道)。图像200由多个像素组成(其样本由图2A中的小方块图示)。为了编码(例如,压缩)图像200(例如,根据JPEG图像压缩格式),像素的非重叠集合(例如,图2A中所示出的示例集合215)可以被单独变换(例如,使用离散余弦变换)为变换域中的相应系数的集合。对图像的受限子集而不是对图像整体(例如,一次从整个图像生成离散余弦变换系数)执行这样的变换可以关于存储器使用、编码器的普遍性(例如,跨不同大小的图像)、编码器的优化或者关于与图像编码有关的一些其它考虑提供益处。如所示出的,非重叠集合是像素的8乘8瓦片,但是可以使用其它形状和大小的非重叠集合。
所图示的图像200的像素的集合215可以被变换为系数的集合,所述系数的集合表示相应空间频率处的像素的集合215的内容。例如,系数可以是跨水平和垂直空间频率的范围所确定的离散余弦变换系数。图2B中图示了示例的系数的集合220。每个系数表示垂直和水平方向的相应空间频率处的像素的集合215的内容。例如,左上角的系数(“-415”)表示像素的集合215的DC内容。在另一个示例中,顶行从左侧的第四系数(“56”)表示像素的集合215中不垂直地变化(即,其关于垂直方向为DC)而是水平地以中间空间频率变化的内容。
为了压缩这些系数,系数可以被舍入(例如,向下舍入)。这可以允许用来存储系数的值的比特深度减小。此外,可以被向下舍入为零的系数可以被省略而不在所产生的编码图像中特意存储(例如,通过采用行程编码)。为了提高压缩水平,可以在向下舍入(或“量化”)被缩放系数之前应用量化因数的集合以对系数220进行缩放。因此,量化因数指示要被应用于系数220中的一个或多个的缩放程度。单个量化因数可以被应用于所述系数。替选地,来自量化表的量化因数可以被单独地应用于相应系数。这样的量化表中的因数可以基于与人类主观视觉感知相关的信息来指定,以通过向被发现对于人类视觉感知更加“重要”的那些系数(例如,较低空间频率)应用较小幅度的缩放因数来强调这样的系数(因此通过根据更加精细分级的缩放量化系数来保留系数中存在的更多信息)。相反地,“不太重要”的系数可以通过向这样的系数应用较大幅度的缩放因数来不被强调(因此,通过根据更加粗糙的缩放量化系数和/或通过提高系数将通过被向下舍入为零而被完全省略的可能性来保留系数中存在的更少信息)。
图2C示出了示例量化表230。这样的量化表可以由用来生成编码图像的软件(例如,在相机上运行的软件、作为图像处理套件的一部分的软件)预先指定。特定编码图像可以包括这样的量化表的副本以促进对编码图像进行解码。例如,解码软件可以将编码图像中的图像-内容系数与量化表230中的对应元素相乘,以便“放大”经量化的系数,使得它们可以(例如,经由离散余弦变换)被变换为解码图像的像素值(例如,亮度值、色度值)。
图2D示出了已经由根据量化表230(即,根据量化表230内的相应量化因数)的相应程度被缩放并且随后被量化(例如,向下舍入)的经量化系数的集合240。因此,系数240中的大多数具有零值。因此,系数的集合240可以使用行程编码被有效存储。经行程编码的系数随后可以在被包含于最终编码图像内之前被进一步压缩(例如,使用无损Huffman代码化)。
本文所描述的用于改善锐度或以其它方式操纵编码图像而无需对那些图像进行解码的方法可以被应用于这样的编码图像的量化因数(例如,被应用于量化表230)。这可以包括(例如,根据缩放因数的空间频率与量化表230内的量化因数的空间频率之间的对应性)应用缩放因数的集合以修改量化因数,使得当经修改的量化因数在经编码系数240的解码期间被用来缩放(例如,“放大”)经编码系数240时,从其所生成的解码图像相对于使用未修改量化因数生成的图像更加锐利或者以其它方式有所增强。
IV.缩放因数的示例训练
被用来锐化、增强或以其它方式操纵编码图像而无需对编码图像完全解码的缩放因数的集合可以以各种方式被生成。在一些示例中,缩放因数的集合可以被人工确定。附加地或替选地,可以应用自动算法来生成缩放因数的集合。这样的自动方法可以包括使用梯度下降、遗传算法或者一些其它机器学习方法来训练缩放因数的集合,使得在被解码时,其量化因数已经使用缩放因数的集合被修改的编码图像生成关于一些感兴趣因素有所改善的解码图像。这样的感兴趣因素可以包括确定的解码图像的整体锐度、解码图像和以一些其它方式生成的参考图像(例如,在应用缩放因数之前用来生成编码图像的原始图像、使用常规方法被锐化或以其它方式增强的解码图像)之间的对应性或者一些其它因素。
图3图示了用于生成这样的缩放因数的集合的方法300的要素。编码图像310(例如,从编码图像的集合中选择的编码图像)被解码(“解码”)以生成解码图像320a。解码图像320a随后根据应用被锐化(“锐化”)或者以其它方式被处理以生成参考图像320b,所述参考图像320b表示所要训练的缩放因数的集合的所期望效果。可以应用附加的步骤来生成参考图像320b,例如,经解码的锐化图像可以经受附加的压缩和解码以模仿替选解码-锐化-编码过程的整体效果。
还通过(例如,根据空间频率)向量化因数应用缩放因数的集合305来对编码图像310的量化因数进行缩放,以生成经修改的编码图像330。经修改的编码图像330然后被解码(“解码”)以生成经解码的修改图像320c。这可以包括在使用变换(例如,离散余弦变换)将重新缩放的系数变换为像素值(例如,红色通道像素值、亮度像素值)之前,使用经缩放的量化因数来对编码图像的图像-编码系数(例如,编码图像的离散余弦变换系数)重新缩放。该经解码的修改图像320c随后与参考图像320相比较(“比较”)以生成缩放因数的集合305在实现编码图像的所期望增强中的有效程度的量度。这样的比较可以包括确定参考图像320b和经解码的修改图像320c的像素之间(例如,参考图像320b和经解码的修改图像320c的亮度和/或色度通道之间)的平方差之和,或者执行一些其它比较以生成可以被用来训练缩放因数的集合的反馈信息。
比较的结果(例如,成本函数的输出、梯度信息等)随后被用来更新(“更新”)缩放因数的集合305。这样的更新可以根据梯度下降、遗传算法或者一些其它机器学习方法基于比较来执行。过程300随后可以被重复以进一步更新缩放因数的集合305,例如,直至缩放因数的集合305收敛。
注意到,虽然方法300图示了使用单个编码图像310来训练缩放因数的集合305,但是预见到的是,编码图像的大集合(例如,来自这样的图像的在线数据库)将被用来训练缩放因数的集合305。因此,可以对多个编码图像执行方法300以连续地(例如,基于来自单个编码图像的比较数据生成针对缩放因数的集合的单独更新)或者并行地(例如,组合来自编码图像的集合的比较数据以实现针对缩放因数的集合的每个单独更新)更新缩放因数的集合。
进一步地,预见到的是,根据本文所描述的方法(例如,方法300)所生成的缩放因数的集合将尤其适用于关于一个或多个因素与用来训练或以其它方式生成缩放因数的集合的编码图像的集合相似的编码图像。因此,可以从这样的编码图像的数据库中选择关于图像内容、图像压缩因数、图像质量或者一些其它因素相似的编码图像的集合,并且所选择的图像可以被用来生成缩放因数的集合,所述缩放因数的集合随后可以被应用于关于所选取的因素与用来生成缩放因数的集合的编码图像的集合相对应的附加编码图像。可以基于对应的编码图像的集合生成与所选取因素的相应不同范围或值相对应的多个不同的缩放因数的集合。
例如,编码图像的数据库中的每个编码图像可以具有对应的质量值。这样的“质量值”可以以各种方式被定义和/或获取。在一些示例中,特定图像的质量值可以基于图像源来确定。例如,从视频流所提取的图像可以是“低质量”图像,并且从用户特意接收的图像(例如,用于充当那些用户所上传的视频的缩略图)可以是“高质量”图像。在另一个示例中,编码图像的质量可以基于编码图像和/或由其所表示的解码图像的属性来确定。例如,编码图像的高空间频率内容量或者从编码图像解码的图像的锐度可以被确定,并且被用来针对编码图像生成质量值。在又一个示例中,质量值可以是编码图像的显式编码参数(例如,EXIF数据)和/或从描述编码图像和/或用来生成编码图像的过程的量化表或其它参数所确定。
随后可以从多个可用的编码图像中选择与这样不同的质量值和/或不同的质量值范围相对应的多个不同的编码图像的集合。例如,第一编码图像的集合可以包括从视频所提取的编码图像,而第二编码图像的集合可以包括由用户特意提供以充当缩略图或者要以其它方式被用来指示视频的内容的图像。所生成的缩放因数的每个集合随后可以被应用于关于质量值与缩放因数的集合相对应的编码图像。
V.示例***
本文所描述的计算功能(例如,用于根据缩放因数的集合对编码图像的量化因数进行缩放的功能、用于生成这样的缩放因数的集合的方法)可以由一个或多个计算***来执行。这样的计算***可以被集成到计算设备中或者采用计算设备的形式,所述计算设备诸如移动电话、平板计算机、膝上计算机、服务器、家庭自动化元件、独立视频捕捉和处理设备、云计算网络和/或可编程逻辑控制器。出于示例的目的,图4是示出示例计算设备400的一些部件的简化框图。
作为示例而非限制,计算设备400可以是蜂窝移动电话(例如,智能电话)、视频相机、计算机(诸如台式、笔记本、平板或手持计算机)、个人数字助理(PDA)、可穿戴计算设备、服务器、云计算***(例如,联网的多个服务器或其它计算单元),或者一些其他类型的设备或设备的组合。应当理解的是,计算设备400可以表示物理设备、应用在其上以软件进行操作的特定物理硬件平台或者被配置为实施映射、训练和/或音频处理功能的硬件和软件的其它组合。
如图4所示,计算设备400可以包括通信接口402、用户接口404、处理器406和数据存储408,它们全部都可以通过***总线、网络或其它连接机制410通信地链接在一起。
通信接口402可以工作以允许计算设备400使用电、磁、电磁、光学或其它信号的模拟或数字调制来与其它设备、接入网络和/或传输网络进行通信。因此,通信接口402可以促进电路交换和/或分组交换通信,诸如普通老式电话服务(POTS)通信和/或互联网协议(IP)或其它分组化通信。例如,通信接口402可以包括被布置用于与无线电接入网络或接入点进行无线通信的芯片组和天线。而且,通信接口402可以采用有线线路接口的形式或者包括有线线路接口,诸如以太网、通用串行总线(USB)或高清多媒体接口(HDMI)端口。通信接口402还可以采用无线接口的形式或者包括无线接口,诸如WiFi、
Figure BDA0003024015130000201
全球定位***(GPS)或广域无线接口(例如,WiMAX或3GPP长期演进(LTE))。然而,可以在通信接口402上使用其它形式的物理层接口以及其它类型的标准或专用通信协议。此外,通信接口402可以包括多个物理通信接口(例如,WiFi接口、
Figure BDA0003024015130000202
接口和广域无线接口)。
在一些实施例中,通信接口402可以工作以允许通信设备400与其它设备、远程服务器、接入网络和/或传输网络进行通信。例如,通信接口402可以工作以从请求方设备(例如,蜂窝电话、台式或膝上计算机)接收针对图像(例如,网站的图像、用作缩略图以指示与请求方设备所请求的其它内容有关的视频的内容的图像)的请求、传送已经根据本文所描述的方法被修改的编码图像的指示、从用户接收要被用作用户所上传视频的缩略图的图像的指示或者一些其它信息。例如,计算设备400可以是服务器、云计算***或者被配置为执行本文所描述方法的其它***,并且该远程***可以是蜂窝电话、数字相机或者被配置为请求信息(例如,可以具有缩略图或嵌入其中的其它图像的网页)并且从计算设备400接收可能已经如本文所描述的被修改(例如,以对编码图像进行锐化或以其它方式增强而无需完全解码图像)的一个或多个编码图像或者从计算设备400接收一些其它信息的其它设备。
用户接口404可以工作以允许计算设备400与用户交互,例如从用户接收输入和/或向用户提供输出。因此,用户接口404可以包括输入部件,诸如小键盘、键盘、触摸敏感或存在敏感面板、计算机鼠标、轨迹球、操纵杆、麦克风等。用户接口404还可以包括诸如显示屏的一个或多个输出部件,所述显示屏例如可以与存在敏感面板组合。显示屏可以基于CRT、LCD和/或LED技术,或者目前已知或后续研发的其它技术。用户接口404还可以被配置为经由扬声器、扬声器插口、音频输出端口、音频输出设备、耳机和/或其它类似设备生成可听输出。
在一些实施例中,用户接口404可以包括用来向用户呈现视频或其它图像的显示器。此外,用户接口404可以包括促进计算设备400的配置和操作的一个或多个按钮、开关、旋钮和/或拨盘。这些按钮、开关、旋钮和/或拨盘中的一些或全部可能被实施为触摸敏感或存在敏感面板上的功能。
处理器406可以包括一个或多个通用处理器——例如微处理器——和/或一个或多个专用处理器——例如数字信号处理器(DSP)、图形处理单元(GPU)、浮点单元(FPU)、网络处理器或专用集成电路(ASIC)。在一些实例中,除其它应用或功能之外,专用处理器可以能够进行图像处理和神经网络计算。数据存储408可以包括一个或多个易失性和/或非易失性存储部件,诸如磁、光学、闪存或有机存储,并且可以整体或部分地与处理器406集成。数据存储408可以包括可移除和/或非可移除的部件。
处理器406可以能够执行存储在数据存储408中的程序指令418(例如,编译或非编译的程序逻辑和/或机器代码)从而实施本文所描述的各种功能。因此,数据存储408可以包括具有存储于其上的程序指令的非暂时性计算机可读介质,所述程序指令在被计算设备400执行时使得计算设备400实施本说明书和/或附图中所公开的任何方法、过程或功能。
作为示例,程序指令418可以包括操作***422(例如,操作***内核、设备驱动器和/或其它模块)以及安装在计算设备400上的一个或多个应用程序420(例如,图像处理、神经网络或其它机器学习训练算法)。
在一些示例中,本文所描述方法的部分可以根据应用由不同设备来执行。例如,***的不同设备可以具有不同计算资源量(例如,存储器、处理器周期)以及用于设备之间通信的不同信息带宽。本文所描述方法的不同部分可以根据这样的考虑进行分配。
VI.示例方法
图5是用于有效改善压缩图像的锐度的方法500的流程图。方法500包括获取编码图像(510)。该编码图像包括(i)指示相应空间频率处的编码图像的图像内容的系数的集合,和(ii)指示应用于系数的集合中的相应系数的缩放程度的量化因数的集合。方法500附加地包括获取编码图像的质量值(520)。这可以包括(例如,从存储编码图像和相关联的质量值的数据库)接收质量值,或者例如基于编码图像的源、编码图像编码的图像的属性、编码图像的参数(例如,如编码图像的量化表所表示的量化因数)的属性或者基于一些其它考虑来确定质量值。
方法500又进一步包括基于质量值从多个缩放因数的集合中选择缩放因数的集合(530)。方法500附加地包括生成经修改的编码图像(540)。生成经修改的编码图像包括应用所选择的缩放因数的集合以缩放编码图像的量化因数的集合。方法500进一步包括将经修改的编码图像的指示传送至请求方设备(550)。
图6是方法600的流程图。该方法包括获取图像的训练集合,其中图像的训练集合中的每个图像具有相应的质量值(610)。方法600附加地包括基于训练集合中的图像的质量值从训练集合中选择具有与特定质量值相对应的相应质量值的一个或多个图像(620)。
方法600又进一步包括针对一个或多个图像中的每个给定图像:获取该给定图像的编码版本和该给定图像的参考版本(630);应用与该特定质量值相对应的缩放因数的集合以缩放该给定图像的编码版本的量化因数的集合(640);通过使用已经被缩放因数的集合缩放的量化因数对系数的集合进行解码来生成该给定图像的增强解码版本(650);并且将该给定图像的增强解码版本与该给定图像的参考版本相比较。该给定图像的编码版本包括(i)指示相应空间频率处的该给定图像的图像内容的系数的集合,和(ii)指示应用于系数的集合中的相应系数的缩放程度的量化因数的集合。
方法600附加地包括基于该给定图像的增强解码版本与该给定图像的参考版本之间的比较来更新缩放因数的集合(670)。
方法500、600中的任一者或两者可以包括附加的要素或特征。
VII.结论
以上详细描述参考附图对所公开***、设备和方法的各种特征和功能进行了描述。在附图中,除非上下文另外有所指示,否则相似的符号通常标识相似的部件。详细描述、附图和权利要求中所描述的说明性实施例并非意在作为限制。可以采用其它的实施例,并且可以作出其它的改变,而并不背离本文所给出主题的范围。将会轻易理解的是,如本文总体上描述以及在附图中图示的本公开的方面可以以各种不同配置进行布置、替换、组合、拆分和设计,所有这些都在本文被明确考虑。
关于附图中以及如本文所讨论的任何或全部的消息流图、方案和流程图,每个步骤、框和/或通信可以表示依据示例实施例的信息处理和/或信息传输。替选实施例可以被包括在这些示例实施例的范围之内。例如,在这些替选实施例中,根据所涉及到的功能,被描述为步骤、框、传输、通信、请求、响应和/或消息的功能可以以不同于所示出或讨论的顺序来执行,包括以基本上同时或相反的顺序来执行。进一步地,可以随本文所讨论的任何的消息流图、方案和流程图使用更多或更少的步骤、框和/或功能,并且这些消息流图、方案和流程图可以部分或整体地互相组合。
表示信息处理的步骤或框可以对应于电路,所述电路可以被配置为执行本文所描述的方法或技术的具体逻辑功能。替选地或附加地,表示信息处理的步骤或框可以对应于程序代码(包括相关数据)的模块、分段或部分。该程序代码可以包括能够有处理器所执行以便实施该方法或技术中的具体逻辑功能或动作的一个或多个指令。该程序代码和/或相关数据可以被存储在任何类型的计算机可读介质上,诸如存储设备,包括磁盘驱动器、硬盘驱动器或者其它存储介质。
计算机可读介质还可以包括非暂时性的计算机可读介质,诸如在短时期内存储数据的计算机可读介质,如寄存器存储器、处理器高速缓存和/或随机访问存储器(RAM)。计算机可读介质还可以包括非暂时性的计算机可读介质,其在较长时段内存储程序代码和/或数据,诸如次要或持久的长期存储,例如,如只读存储器(ROM)、光盘或磁盘和/或紧致盘只读存储器(CD-ROM)。计算机可读介质也可以是任何其它的易失性或非易失性存储***。计算机可读介质可以被认为例如是计算机可读存储介质或者有形存储介质。
此外,表示一个或多个信息传输的步骤或框可以对应于相同物理设备中的软件和/或硬件模块之间的信息传输。然而,其它信息传输可以是在不同物理设备中的软件模块和/或硬件模块之间。
虽然本文已经公开了各个方面和实施例,但是其它方面和实施例对于本领域技术人员而言将是显而易见的。本文所公开的各个方面和实施例是出于说明的目的而并非意在作为限制,其中实际的范围由以下权利要求所指示。

Claims (21)

1.一种用于增强压缩图像的方法,所述方法包括:
获取编码图像,其中所述编码图像包括:(i)指示相应空间频率处所述编码图像的图像内容的系数的集合,和(ii)指示应用于所述系数的集合中的相应系数的缩放程度的量化因数的集合;
获取所述编码图像的质量值;
基于所述质量值,从多个缩放因数的集合中选择缩放因数的集合;
生成经修改的编码图像,其中生成所述经修改的编码图像包括:应用所选择的缩放因数的集合以缩放所述编码图像的所述量化因数的集合;以及
将所述经修改的编码图像的指示传送至请求方设备。
2.根据权利要求1所述的方法,其中所述系数的集合是离散余弦变换系数。
3.根据权利要求2所述的方法,其中所选择的缩放因数的集合包括N个缩放因数,其中所述N个缩放因数中的每个缩放因数与相应不同的空间频率相对应,并且其中应用所选择的缩放因数的集合以缩放所述编码图像的量化因数的集合包括:将所述N个缩放因数中的每个给定缩放因数应用于所述量化因数的集合中的与所述给定缩放因数的空间频率相对应的一个或多个量化因数。
4.根据权利要求3所述的方法,其中N是15。
5.根据任一项前述权利要求所述的方法,其中获取所述编码图像的质量值包括:确定所述编码图像是由用户提交的还是从视频中提取的。
6.根据任一项前述权利要求所述的方法,其中获取所述编码图像的质量值包括:基于所述量化因数来确定所述质量值。
7.根据任一项前述权利要求所述的方法,其中所述编码图像的所述量化因数被存储在所述编码图像的量化表中。
8.根据任一项前述权利要求所述的方法,其中获取所述编码图像包括:从视频流的帧中提取所述编码图像。
9.根据任一项前述权利要求所述的方法,其中所述编码图像是根据JPEG图像压缩格式被编码的。
10.一种方法,包括:
获取图像的训练集合,其中所述图像的训练集合中的每个图像具有相应的质量值;
基于所述训练集合中的所述图像的质量值,从所述训练集合中选择具有与特定质量值相对应的相应质量值的一个或多个图像;
针对所述一个或多个图像中的每个给定图像:
获取所述给定图像的编码版本和所述给定图像的参考版本,其中所述给定图像的编码版本包括:(i)指示相应空间频率处所述给定图像的图像内容的系数的集合,和(ii)指示应用于所述系数的集合中的相应系数的缩放程度的量化因数的集合;
应用与所述特定质量值相对应的缩放因数的集合以缩放所述给定图像的编码版本的所述量化因数的集合;以及
通过使用已经被所述缩放因数的集合缩放的量化因数对所述系数的集合进行解码,来生成所述给定图像的增强解码版本;以及
基于所述给定图像的增强解码版本和所述给定图像的参考版本之间的关系来更新所述缩放因数的集合。
11.根据权利要求10所述的方法,其中更新所述缩放因数的集合包括:将所述给定图像的增强解码版本和所述给定图像的参考版本相比较。
12.根据权利要求10或11所述的方法,进一步包括:
获取编码图像,其中所述编码图像包括:(i)表示相应空间频率处所述编码图像的图像内容的系数的集合,和(ii)指示应用于所述系数的集合中的相应系数的缩放程度的量化因数的集合,并且其中所述编码图像的质量值与所述特定质量值相对应;
生成经修改的编码图像,其中生成所述经修改的编码图像包括:应用所更新的缩放因数的集合以缩放所述编码图像的所述量化因数的集合;以及
将所述经修改的编码图像的指示传送至请求方设备。
13.根据权利要求10至12中任一项所述的方法,其中所述图像的训练集合包括编码图像的集合,并且其中获取所述给定图像的参考版本包括:
解码所述给定图像的所述编码版本;以及
锐化所述给定图像的所解码的编码版本。
14.根据权利要求10至13中任一项所述的方法,其中所述给定图像的所述编码版本是根据JPEG图像压缩格式被编码的。
15.根据权利要求10至14中任一项所述的方法,其中所述给定图像的编码版本的所述系数的集合是离散余弦变换系数。
16.根据权利要求15所述的方法,其中与所述特定质量值相对应的所述缩放因数的集合包括N个缩放因数,其中所述N个缩放因数中的每个缩放因数与相应不同的空间频率相对应,并且其中应用与所述特定质量值相对应的所述缩放因数的集合以缩放所述给定图像的编码版本的所述量化因数的集合包括:将所述N个缩放因数中的每个给定缩放因数应用于所述量化因数的集合中与所述给定缩放因数的所述空间频率相对应的一个或多个量化因数。
17.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质被配置为至少存储计算机可读指令,所述计算机可读指令在被计算设备的一个或多个处理器执行时使得所述计算设备执行计算机操作,所述计算机操作包括:
获取编码图像,其中所述编码图像包括:(i)指示相应空间频率处所述编码图像的图像内容的系数的集合,和(ii)指示应用于所述系数的集合中的相应系数的缩放程度的量化因数的集合;
获取所述编码图像的质量值;
基于所述质量值,从多个缩放因数的集合中选择缩放因数的集合;
生成经修改的编码图像,其中生成所述经修改的编码图像包括:应用所选择的缩放因数的集合以缩放所述编码图像的所述量化因数的集合;以及
将所述经修改的编码图像的指示传送至请求方设备。
18.根据权利要求17所述的非暂时性计算机可读介质,其中获取所述编码图像的质量值包括:基于所述量化因数来确定所述质量值。
19.根据权利要求17或18所述的非暂时性计算机可读介质,其中所述系数的集合是离散余弦变换系数。
20.根据权利要求17至19中任一项所述的非暂时性计算机可读介质,其中获取所述编码图像的质量值包括:确定所述编码图像是由用户提交的还是从视频中提取的。
21.根据权利要求17至20中任一项所述的非暂时性计算机可读介质,其中所述编码图像是根据JPEG图像压缩格式被编码的。
CN201980068474.0A 2018-12-05 2019-08-06 自适应dct锐化器 Active CN112868228B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/210,900 US11178430B2 (en) 2018-12-05 2018-12-05 Adaptive DCT sharpener
US16/210,900 2018-12-05
PCT/US2019/045257 WO2020117328A2 (en) 2018-12-05 2019-08-06 Adaptive dct sharpener

Publications (2)

Publication Number Publication Date
CN112868228A true CN112868228A (zh) 2021-05-28
CN112868228B CN112868228B (zh) 2024-04-26

Family

ID=70554158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980068474.0A Active CN112868228B (zh) 2018-12-05 2019-08-06 自适应dct锐化器

Country Status (4)

Country Link
US (1) US11178430B2 (zh)
EP (1) EP3861730A2 (zh)
CN (1) CN112868228B (zh)
WO (1) WO2020117328A2 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11714955B2 (en) 2018-08-22 2023-08-01 Microstrategy Incorporated Dynamic document annotations
US11500655B2 (en) 2018-08-22 2022-11-15 Microstrategy Incorporated Inline and contextual delivery of database content
US11907281B2 (en) * 2020-02-03 2024-02-20 Microstrategy Incorporated Methods and systems for displaying relevant data based on analyzing electronic images of faces
US20230028736A1 (en) * 2021-07-22 2023-01-26 Qualcomm Incorporated Configurable image enhancement
TWI789187B (zh) * 2021-12-29 2023-01-01 瑞昱半導體股份有限公司 壓縮方法與相關的電子裝置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130051694A1 (en) * 2011-08-26 2013-02-28 Csr Technology Inc. Method and apparatus for shift dct-based sharpening of a video image
US20140056516A1 (en) * 2012-08-22 2014-02-27 Fingram Co.,Ltd Adaptive image compression system and method
CN103947204A (zh) * 2011-06-28 2014-07-23 三星电子株式会社 用于使用自适应量化参数差的图像编码和解码的方法和设备
CN105474642A (zh) * 2014-05-22 2016-04-06 微软技术许可有限责任公司 使用频域差对图像集合进行重新编码

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7403561B2 (en) * 2003-04-04 2008-07-22 Avid Technology, Inc. Fixed bit rate, intraframe compression and decompression of video
JP5844263B2 (ja) * 2009-10-05 2016-01-13 ビーマル イメージング リミテッドBeamr Imaging Ltd. デジタル画像を再圧縮するための装置および方法
WO2018140158A1 (en) * 2017-01-30 2018-08-02 Euclid Discoveries, Llc Video characterization for smart enconding based on perceptual quality optimization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103947204A (zh) * 2011-06-28 2014-07-23 三星电子株式会社 用于使用自适应量化参数差的图像编码和解码的方法和设备
US20130051694A1 (en) * 2011-08-26 2013-02-28 Csr Technology Inc. Method and apparatus for shift dct-based sharpening of a video image
US20140056516A1 (en) * 2012-08-22 2014-02-27 Fingram Co.,Ltd Adaptive image compression system and method
CN105474642A (zh) * 2014-05-22 2016-04-06 微软技术许可有限责任公司 使用频域差对图像集合进行重新编码

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
K. KONSTANTINIDES ET AL: "Image sharpening in the JPEG domain" *
MARTINEZ-RACH MIGUEL ONOFRE ET AL: "Impact of dead zone size on the rate/distortion performance of wavelet一 based perceptual image encoders" *
NOSRATINIA A: "ENHANCEMENT OF JPEG-COMPRESSED IMAGES BY RE-APPLICATION OF JPEG" *

Also Published As

Publication number Publication date
WO2020117328A2 (en) 2020-06-11
EP3861730A2 (en) 2021-08-11
CN112868228B (zh) 2024-04-26
US11178430B2 (en) 2021-11-16
WO2020117328A3 (en) 2020-09-24
US20200186836A1 (en) 2020-06-11

Similar Documents

Publication Publication Date Title
CN112868228B (zh) 自适应dct锐化器
US11272181B2 (en) Decomposition of residual data during signal encoding, decoding and reconstruction in a tiered hierarchy
CN108028941B (zh) 用于通过超像素编码和解码数字图像的方法和装置
US10182235B2 (en) Hardware efficient sparse FIR filtering in layered video coding
CN111429357B (zh) 训练数据确定方法、视频处理方法、装置、设备及介质
US11303932B2 (en) Image compression
WO2014053982A2 (en) Video compression method
US20200366938A1 (en) Signal encoding
US20110317755A1 (en) Systems and methods for highly efficient compression of video
Yoshida et al. Two-layer lossless coding for high dynamic range images based on range compression and adaptive inverse tone-mapping
US20230147376A1 (en) Adaptive Quantization and Dead Zone Modulation
US11792439B2 (en) Systems, methods, and apparatuses for processing video
WO2023246655A1 (zh) 一种图像编码、解码方法及编码、解码装置
US11503341B1 (en) Perceptually motivated video pre-filter
WO2023130899A1 (zh) 环路滤波方法、视频编解码方法、装置、介质及电子设备
US20240195959A1 (en) Subblock-based adaptive interpolation filter in digital video coding
JP4331992B2 (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,それらのプログラムおよびそれらのプログラム記録媒体
Zhang et al. H. 264 based screen content coding with HSV quantization
Shah Wavelet based image compression on the Texas Instrument video processing board TMS320DM6437

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant