CN102693538A - 生成高动态范围图像的全局对准 - Google Patents

生成高动态范围图像的全局对准 Download PDF

Info

Publication number
CN102693538A
CN102693538A CN2012100453619A CN201210045361A CN102693538A CN 102693538 A CN102693538 A CN 102693538A CN 2012100453619 A CN2012100453619 A CN 2012100453619A CN 201210045361 A CN201210045361 A CN 201210045361A CN 102693538 A CN102693538 A CN 102693538A
Authority
CN
China
Prior art keywords
image
benchmark image
benchmark
pixel sample
sample values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100453619A
Other languages
English (en)
Other versions
CN102693538B (zh
Inventor
R.詹亚拉
吴勇军
孙式军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102693538A publication Critical patent/CN102693538A/zh
Application granted granted Critical
Publication of CN102693538B publication Critical patent/CN102693538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/70Circuitry for compensating brightness variation in the scene
    • H04N23/741Circuitry for compensating brightness variation in the scene by increasing the dynamic range of the image compared to the dynamic range of the electronic image sensors

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本文描述了用于高动态范围(“HDR”)图像生成和渲染的技术和工具。在几个描述的实施例中,对准具有不同曝光等级的图像。在特定实施例中,基准图像到非基准图像的对准至少部分地基于使用协方差计算而确定的运动矢量。此外,在某些实施例中,在图像对准过程期间忽略或者实质上地忽略饱和区域、曝光不足区域和/或活动对象。此外,在某些实施例中,将基于分层的金字塔块的方案用于在基准图像和非基准图像之间执行局部运动估算。

Description

生成高动态范围图像的全局对准
技术领域
本技术涉及生成和渲染数字图像,并且更尤其涉及生成和渲染高动态范围(“HDR”)数字图像。
背景技术
在数字成像***中,通常由在具有三个或更多个通道的多维“色彩空间”中的坐标表示色彩。常见示例包括众所周知的RGB和YUV色彩空间。在RGB色彩空间中,使用坐标(也被称为像素样本值或者样本值)来指定像素,这些坐标分别表示红光、绿光和蓝光的强度。在YUV色彩空间中,使用坐标(像素样本值或者样本值)来指定像素,所述坐标表示一个亮度值和两个色度值。
当前,许多图像捕获、处理和显示装置只能处理具有每个通道256(28)个离散值的小的动态范围的像素样本值,其被表示为8位。这样的图像可以被称作具有8位的“比特深度”。在红色、绿色和蓝色色彩通道中具有每通道8位(8bpc)的典型的RGB数字图像中,对于红色、绿色和蓝色像素样本值的每一个来说,仅可能存在256个不同的值。其他值(例如,α或者暗度值,亮度值及其他这样的值)同样也受限于低动态范围限制。一些装置可以处理高达每通道10位或者12位的动态范围。然而,人类视觉***可以检测14数量级宽的亮度范围,体现为大约46位。实际上,亮度值在明亮的日光下可以高达108 candela/m2,并且在没有月亮的黑夜的岩石的下侧上可以低到10-6 candela/m2
高动态范围(“HDR”)成像呈现了符合人类视觉***的更加通用和自然的图像表示。HDR图像可以呈现比传统的8位,10位和12位表示更高的动态范围,以实现极高的图像质量。可以将HDR图像用于处理传统图像的相同类型的装置和软件工具中,如果HDR图像格式符合所述装置或工具的话。已经开发出几种HDR图像格式,并且照相机、计算机图形学和显示装置已经开始产生、处理和显示具有增加的动态范围的图像。
发明内容
本文描述了用于高动态范围(“HDR”)图像生成和渲染(rendering)的技术和工具。在某些实施例中,从较低的动态范围图像的集合中建造HDR图像。例如,可以通过合并相同照相机针对相同场景在不同曝光获得的图像来生成HDR图像。然而,由于手的摇动或者环境条件,在每个图片之间应该预料到一些照相机运动(典型地转动和/或平移的运动)。当从较低的动态范围图像中建造HDR图像时,对准(align)图像是HDR图像生成过程的一个方面。然而,这个对准过程可能是有挑战的,起因于由照相机运动造成的图像和由获得各种图像的不同曝光造成的图像之间的差别。因此,在几个所描述的实施例之间是用于对准具有不同曝光的图像的技术和工具。在特定实施例中,图像的对准至少部分地基于使用图像之间的协方差计算而确定的运动矢量。此外,在某些实施例中,在图像对准过程期间忽略或者实质上地忽略饱和区域、曝光不足区域和/或具有局部运动的活动对象。例如,在某些实现方式中,将随机抽样一致(“RANSAC:Random Sample Consensus”)方法用来检测和消除由于活动对象、饱和和/或曝光不足而异常的运动矢量。
在所公开的技术的一些实施例中,在图像生成之前不需要对图像捕获装置的响应曲线的了解。此外,在对准之前,所公开的技术的实施例不规格化所述图像,并且因此保存更多信息以更加精确地对准图像。所公开的技术的实施例可以用于校正平移的,转动的两者,或者平移并且转动的运动两者。此外,所公开的技术的实施例比先前的HDR生成技术在计算上更加有效。
在本文所公开的一个示范性实施例中,在基准图像和一个或多个非基准图像的集合之间执行运动分析。所述运动分析可以包含计算基准图像中像素样本值的集合和来自所述集合的非基准图像之一中的像素样本值的集合之间的一个或多个协方差值。此外,至少部分地基于所述运动分析,可以将来自所述集合的所述非基准图像至少之一与所述基准图像进行合并,以形成较高动态范围数字图像。
在本文公开的另一个实施例中,接收基准图像,所述基准图像包含处于第一曝光等级和第一时间的数字图像。还接收非基准图像,所述基准图像包含处于第二曝光等级和第二时间的数字图像,所述第二曝光等级不同于所述第一曝光等级,并且所述第二时间不同于所述第一时间。相对于所述基准图像为非基准图像估算两个或更多个局部运动矢量。在特定实现方式中,所述两个或更多个局部运动矢量的估算包含一次或多次地下采样所述非基准图像和所述基准图像,以形成多种分辨率的多个版本的非基准图像和基准图像,其中,最低分辨率版本的非基准图像具有以金字塔形结构关联到每个较高分辨率版本的非基准图像的相应位置上的连续的较大量块的多个块,并且其中最低分辨率版本的基准图像具有以金字塔形结构关联到每个较高分辨率版本的基准图像的相应位置上的连续的较大量块的多个块。此外,对于最低分辨率版本的非基准图像,可以通过对关联的最低分辨率版本的基准图像中的运动矢量执行完整搜索来估算非基准图像的块的运动矢量;并且对于每个连续的较高分辨率版本的非基准图像,可以使用依照所述金字塔形结构从在前的较低分辨率版本的非基准图像的关联块估算的运动矢量开始的精确搜索(refinement search)来估算连续的较高分辨率版本的非基准图像的块的运动矢量。
本文公开的另一个实施例包含存储图像对准程序的存储器、至少一个数字信号处理部件、和可操作以执行所述图像对准程序的处理单元。在某些实施例中,所述图像对准程序使得所述处理单元:输入基准图像,所述基准图像包含处于第一曝光等级和第一时间的数字图像;输入非基准图像,所述非基准图像包含处于第二曝光等级和第二时间的数字图像;并且计算所述非基准图像中的像素样本值的块的局部运动矢量,所述局部运动矢量指示所述块与所述基准图像中的像素样本值的相应块的相对运动。在特定实现方式中,至少部分地使用估量所述非基准图像的块中的像素样本值如何与所述基准图像的块中的像素样本值一起改变的度量标准来确定所述局部运动矢量。
提供本发明内容而以简化形式对精选的概念进行介绍,在以下具体实施方式中将进一步描述这些概念。本发明内容没有打算标识所要求保护的主题的关键特征或必要特征,也没有打算用来帮助确定所要求保护的主题的范围。根据以下参照附图继续进行的实施例的详细描述,将可以明了所公开的技术的附加特征和优点。
附图说明
图1是计算环境的结构图,其中,可以实施高动态范围(“HDR”)图像生成、渲染和对准技术的实施例。
图2和3是云计算网络环境的结构图,其中,可以实施所公开的HDR图像生成、渲染和对准技术的实施例。
图4是示例依照一个或多个描述的实施例的概括的HDR图像处理***的结构图。
图5是示出包括依照一个或多个描述的实施例的HDR图像生成和HDR图像渲染的示范性的HDR成像工作流程的流程图。
图6是示出依照一个或多个描述的实施例从SDR图像的集合生成HDR图像的示例性技术的流程图。
图7是示出依照一个或多个描述的实施例渲染HDR图像的示例性技术的流程图。
图8是示出可以与图6的实施例一起使用的示例性图像对准技术的流程图。
图9-13是图示可以与图8的图像对准技术一起使用的基于金字塔块的局部运动估算技术的图。
图14是图示全局运动转换模型的图,所述全局运动转换模型包括可以与图8的图像对准技术一起使用的全局运动转换的类似性模型。
图15是图示可以与图8的图像对准技术一起使用的用于估算全局运动转换的过程的流程图。
具体实施方式
I.总则
以下公开的是用于执行HDR图像处理的方法、设备和***的代表性实施例,包括具有不同曝光的数字图像的对准。所公开的方法、设备和***不能看作是以任何方式进行限定。相反,单独地和以不同组合以及彼此之间的子组合,本公开的目的在于各种公开实施例的所有新颖的和非显而易见的特征和方面。此外,可以单独地或者以不同组合和彼此之间的子组合使用所公开的实施例的任何特征或方面。所公开的方法、设备和***不局限于它们的任何具体方面或特征或组合,所公开的实施例也要求任意一个或多个具体的优点或者解决问题必须存在。
尽管为了便于表示而以特定、连续的次序描述了一些所公开的方法的操作,但是应当理解的是,这种描述方式包含重新排序,除非通过以下阐述的具体语言而要求特定排序。例如,在某些情形下可以重新排列或者同时执行按顺序描述的操作。此外,为了简化起见,附图不用示出结合其他方法、设备和***使用所公开的方法、设备和***的各种方式。此外,本文中所使用的术语“和/或”意指所述短语中的任意一项或多项的组合。
可以使用存储在一个或多个计算机可读介质(例如,非临时性计算机可读介质,例如一个或多个光学介质盘、易失性存储部件(例如,DRAM或SRAM)、或非易失性存储或储存部件(例如,硬盘驱动器))并且运行在计算机(例如,任何市场上可买到的计算机或嵌入在装置中的计算机或图像处理器,例如,膝上型计算机、娱乐控制台、网本(net book)、上网本(web book)、平板计算装置、智能电话、或其他移动计算装置)上的计算机可执行指令来实现所公开的方法。还可以将所公开的方法或***实施期间创建和使用的任意中间或最终数据存储在一个或多个计算机可读介质(例如,非临时性计算机可读介质)上,并且将其认为是处于所公开的技术的范围内。
为了清楚起见,仅描述了基于软件的实施例的某些精选的方面。省略了本领域公知的其他细节。例如,应当理解的是,基于软件的实施例不局限于任何具体的计算机语言或程序。同样,所公开的技术的实施例不局限于任何特定的计算机或任何特定类型的硬件。以下将介绍适于执行所公开的基于软件的方法的任意一个的示范性计算环境。
还可以使用被配置为执行任意一个所公开的方法的专用计算硬件来实现所公开的方法。例如,可以通过被具体设计或配置成实施任一所公开的方法的集成电路(例如,专用集成电路(“ASIC”)(例如,ASIC数字信号处理单元(“DSP”),图形处理单元(“GPU”),或可编程逻辑装置(“PLD”),例如现场可编程门阵列(“FPGA”))来实现所公开的方法(例如,被配置用于执行任一所公开的图像处理技术的专用硬件)。
还可以在多种用法和计算方案中使用所公开的HDR图像生成、HDR图像渲染或数字图像对准技术,包括在专用图像捕获装置(例如,数字照相机或带有数字照相机的移动装置)上的图像处理、在独立计算机上的图像处理、在网络客户端计算机上的图像处理、或在服务器计算机上的图像处理。此外,可以在多个计算装置上并行或协作地执行所公开的HDR图像生成、HDR图像渲染或数字图像对准技术的各部分技术,所述计算装置例如客户端-服务器、网络“云”业务或对等计算设置及其他。因此,应当认识到,可以在各种不同电子和计算装置上实现所述技术,包括终端用户消费操作装置以及可以提供作为提供给顾客的业务的一部分的技术的服务器计算机两者。
II.示例性计算环境
图1图示了适当的计算装置环境或计算硬件环境100的概括示例,其中,可以实现所公开的技术的实施例。计算硬件环境100并没有暗示对所公开技术的使用或功能范围的任何限定,因为可以以各种通用或专用计算环境实现本技术。例如,可以用其他计算机***配置来实现所公开技术,包括手持装置、多处理器***、基于微处理器或可编程的消费电子设备、网络PC、小型计算机、大型计算机等。还可以在分布式计算环境中实施所公开的技术,其中由通过通信网络(例如,云计算网络)链接的远程处理装置执行任务。在分布式计算环境中,程序模块可以位于本地和远程内存存储装置两者中。
参照图1,计算硬件环境100包括至少一个处理单元110和存储器120。在图1中,在虚线内包括最基本的配置130。处理单元110执行计算机可执行指令。在多处理器***中,多个处理单元执行计算机可执行指令以提高处理能力。存储器120可以是易失性存储器(例如,寄存器,高速缓冲存储器,RAM,DRAM,SRAM)、非易失性存储器(例如,ROM,EEPROM,闪速存储器)、或者上述两者的某种组合。存储器120可以存储用于实现一个或多个所公开的HDR图像处理或图像对准技术的软件180。例如,存储器120可以存储用于实现任意一个所公开的方法的软件180。
除了中央处理单元110之外,所述计算环境可以包括其他处理资源,例如,数字信号处理DSP或多媒体部件115。DSP部件115可以是可有利地用于本文所公开的数字图像对准技术的任意资源。例如,所述DSP部件可以包括多媒体DSP ASIC单元,GPU着色器(shader)单元,多核CPU,用于CPU的先进多媒体指令集合等。
所述计算硬件环境可以具有另外的功能部件。例如,计算硬件环境100包括存储装置140,一个或多个输入装置150,一个或多个输出装置160和一个或多个通信连接170。诸如总线、控制器或网络的互连机构(未示出)使计算硬件环境100的部件互相连接。典型地,操作***软件(未示出)提供了在计算硬件环境100中执行的其他软件的操作环境,并且协调计算硬件环境100的各部件的动作。
存储装置140是一种非易失性存储器,并且可以是可拆卸的或者不可拆卸的。例如,存储装置140包括非临时性计算机可读介质,例如磁盘(例如,硬盘驱动器),磁带或磁盒,光学存储介质(例如,CD-ROM或DVD),或任何其他有形的非临时性存储媒介,其可用于存储信息,并且可以在计算硬件环境100内或通过计算硬件环境100访问。存储装置140还可以存储用于实现任意一个所述技术的软件180。
输入装置150可以是触摸式输入装置,例如键盘、鼠标、触摸屏、笔、跟踪球、声音输入装置、扫描装置、或将输入提供到计算环境100的另一个装置(例如,图像感测装置)。输出装置160可以是显示装置、触摸屏、打印机、扬声器、或从计算环境100提供输出的另一个装置。
通信连接170通过通信媒介实现与另一个计算实体的通信。通信媒介传送信息,例如计算机可执行指令,任意一个实现所公开的技术的实施例所使用的中间或最终消息或数据。作为示例而非限制,通信媒介包括用电、光、RF、红外线、声、或其他载体实现的有线或无线技术。
可以在存储在一个或多个计算机可读存储介质(例如,有形的非临时性计算机可读存储介质,例如存储器120和存储器140)上的计算机可执行指令的常见环境中描述这里公开的各种方法(例如,所公开的HDR图像处理或图像对准技术中的任意一个)。同样应当容易理解到,术语计算机可读存储介质或非临时性计算机可读介质包括用于存储数据和程序指令(例如存储器120和存储器140)而非单独的调制数据信号的介质。
还可以在计算机可执行指令的常见环境中描述本文所公开的各种方法,例如包括在程序模块中、由计算环境中的处理器执行的那些计算机可执行指令。通常,程序模块包括例行程序、程序、程序库、对象、类、部件、数据结构及执行特定任务或实现特定抽象数据类型的其他这样的软件元件。在不同实施例中,可以按照需要在程序模块之间组合或划分所述程序模块的功能。还可以使用分布式计算环境(例如,客户端-服务器网络,云计算环境,广域网或局域网)执行任意一种所公开的方法。
图2和3图示了用于云计算的适当的联网环境200的概括示例,其中,可以实施本文所描述的HDR图像处理和/或图像对准技术。
在示例性的云计算网络环境200中,通过网络可访问的计算和存储资源的集合提供用于HDR图像共享、生成、存储或分配(例如,图像共享,生成或社交联网站点)的各种类型的计算业务,其被称为云210。例如,云210可以包含可以位于中心或者分布式位置的服务器计算装置的集合,所述服务器计算装置可以将基于云的业务提供给经由网络(例如因特网)连接的各种类型的用户和装置。
在示例性环境200中,云210提供用于用户计算装置的业务220(例如,HDR图像存储,HDR图像生成,HDR图像渲染,图像对准,HDR图像共享,或社交联网业务,及其他示例)。可以通过云计算业务供应者,或通过其他在线业务的供应者在云210中提供业务。例如,基于云的业务220可以包括HDR图像生成业务,HDR图像渲染业务,图像对准业务,图像存储业务,图像共享站点,社交联网站点,或经由其为别人可以在连接装置220A-N上观看而分配源自用户的图像的其他业务。
所述用户可以使用各种图像捕获装置来捕获一个或多个图像(例如,不同曝光的图像或HDR图像),例如数字照相机,移动电话和手持计算装置。所述用户可以将所述一个或多个数字图像上传到云210上的业务220,或者直接(例如,使用远程通信网络的数据传输业务)或通过首先将所述一个或多个图像传送到本地计算机230,例如膝上型计算机、个人计算机或者其他网络连接的计算装置。
如图3中所示,可以稍后下载或访问基于云的图像存储器或者共享站点的一个或多个数字图像(例如,具有不同曝光的图像或HDR图像)到其他连接的计算装置,所述计算装置可以具有多种屏幕显示尺寸因数(factor)220A-N。
连接装置220A表示具有中尺寸显示屏的装置,例如可用于个人计算机、膝上型计算机、平板或其他类似的网络连接装置。连接装置220B表示具有设计成非常便携(例如,小尺寸屏幕)的形状因数的显示屏的装置。例如,连接装置220B可以是移动电话,智能电话,个人数字助理等。连接装置220N表示具有大的观看屏的连接装置。例如,连接装置220N可以是电视屏(例如,智能电视)或将图像输出提供给电视或图像投影仪(例如,机顶盒或游戏控制台)或具有类似图像显示输出的其他装置的另一个装置。
在所图示的云计算网络环境200中,可以根据期望的使用方案在图像共享、存储和分配的各个阶段以及通过所描述的装置的各个装置实现和执行本文所公开的任意一个HDR处理和/或图像对准技术。在一个示例性的方案中,以本地计算机230上的软件实现任意一个HDR处理和/或图像对准技术,并且当开始将图像传送到所述本地计算机或者当将图像上传到基于云的业务220时应用上述技术。在另一个方案中,在云中实现任意一个HDR处理和/或图像对准技术,并且当图像被上传到并且存储在所述云中时对图像应用所述技术。在另一个方案中,通过云计算业务实现任意一个HDR处理和/或图像对准技术,并且当所述图像被访问、传送或分配给另一个连接装置或业务时应用该技术。在又一其他方案中,在从云210下载或者访问所述图像之后,在所述连接装置上执行任意一个HDR处理和/或图像对准技术。
III.高动态范围成像-概述
尽管人类视觉***能够检测到非常宽的动态范围中的细节,尤其在亮度方面,但是人类通常不能同时获得跨越这个动态范围整个宽度的细节。例如,对于人来说困难的是同时在非常明亮的区域和非常黑暗的区域获得细节。然而,通过聚焦到场景中的各种局部区域上,所述人类视觉***可以非常迅速地适应局部区域中的亮度,以便看到明亮区域(例如天空)以及较黑暗区域(例如,阴影)中的细节。
许多现有的数字照相机(包括大多数DSLR(数字单镜反光)照相机)缺乏直接的HDR图像捕获能力,并且仅能够在标准动态范围传送来自单一景色的每个照片。因此,在人可以感知的细节等级和可以在SDR图像中表示的细节等级之间存在巨大的缺口。所述问题可行的解决方案是高动态范围(HDR)成像。HDR图像可以捕获场景中丰富的信息,并且当正确渲染时可以提供非常真实的视觉体验。由于所述人类视觉***的非线性和局部适应性质,可以用正常的打印输出或现有的显示器实现大部分HDR图像体验,使得针对HDR图像的市场可能是非常大的。因此近来,HDR成像技术已经引起了用户更多的注意,包括专业摄影师和业余爱好者。
A.示范性的HDR图像格式
本文所描述的数字图像可以是彩色的、灰阶的或其他类型的图像,并且可以以各种文件格式表示(例如,GIF、PNG、BMP、TIFF、TIFF Float32、JP2、HDR、OpenEXR、JPEG XR、辉光RGBE(Radiance RGBE)和/或其他格式)。本部分提供了关于一些可以与所描述的用于生成HDR图像、渲染HDR和/或对准数字图像的技术和工具一起使用的图像格式的细节。例如,所描述的技术和工具可以处理JPEG XR格式的HDR图像。
JPEG XR是用于编码HDR图像、支持多大32位浮点数的灵活且强大的格式。JPEG XR支持HDR图像编码,同时仅需要针对压缩和解压缩两者的整数运算(不需要除法)。JPEG XR与文件容件(container)兼容以通过IFD标签存储图像数据和元数据,其可以包括HD照片元数据,XMP元数据和Exif元数据。相比于现有的HDR格式,例如TIFF Float,OpenEXR和辉光RGBE,所述JPEG XR格式提供更高的压缩能力,同时保持合理的图像质量。所述JPEG XR文件格式是可扩展的,因此可以将另外的元数据(或者私有的,或者标准的)***JPEG XR文件,而不需要改变图像位流。
辉光RGBE是用于传送HDR图像数据的另一种格式。在RGBE图像中,由32位表示每个像素:一组位(例如,一个字节)用于红色尾数(R),一组位(例如,一个字节)用于绿色尾数(G),一组位(例如,一个字节)用于蓝色尾数(B),以及剩余的位(例如,一个字节)用于公共指数(E),将所述公共指数(E)用于由每个R、G和B通道的尾数(mantissa)表示的值。在RGBE中,有效的像素值(fR,fG,fB)是浮点数,其中,fR=R*2(E-128);fG=G*2(E-128);以及fB=B*2(E-128)。RGBE规则将最大的8位尾数限制到范围[128,255]内,同时其余两个8位尾数是无限制的(所述范围是[0,255])。因此,从RGB到RGBE的映射是唯一的。RGBE可以呈现的动态范围是[2-127,2+127],其大约是76个数量级。从RGBE像素重构的RGB值是无符号的-所有的非零值都是正的。然而,因为这三个颜色分量共享相同的指数,所以牺牲了两个较小分量的精度。E=0是一种特例,其指示相应的像素值是零。
辉光RGBE的一种变体(9:9:9:5)分别指定9位给红色、绿色和蓝色尾数通道,并且指定5位给所述指数,从而与以上所述的8:8:8:8格式一样以32位表示每个像素。RGBE的其他表示也是可能的,不同数量的位被分配给尾数和指数。
32位浮点(“32位浮点数”)通常用于表示浮点图像数据。定义32位浮点图像的容件格式包括可移植的浮点映射(“PFM”:Portable Float Map)和标签图像文件格式(“TIFF”)。IEEE 754 32位单精度浮点数包括用于符号(s)的1位,用于指数(e)的8位和用于尾数(m)的23位。16位浮点(也被认为是“一半”)具有一个符号位,五个指数位和十个尾数位。因为除了字段长度上的具体差别之外,16位和32位浮点表示在结构上是相同的,所以一般可将它们都认为是“浮点”。
通过国际标准指定一些图像格式。例如,JPEG和JPEG2000标准阐述了对解码器的要求,以分别解码以JPEG和JPEG2000格式编码的图像。适应JPEG2000的编码器和解码器(“编解码器”)提供了具有优良压缩效率的高质量图像。由Windows Media Photo(视窗媒体照片)和HD Photo(HD 照片)产生JPEG XR标准,由微软公司开发的作为Windows Media(视窗媒体)技术族的一部分而开发的私有图像压缩格式。在国际标准ISO/IEC 29199-2:2009中描述了JPEG XR。
所公开的技术可以适用于和用来以任意一种所公开的格式生成HDR图像。
IV.高动态范围图像生成和渲染
A.概括的HDR成像***
在本文所描述的示例中,SDR图像是每色彩通道8位(bpc)的图像,并且HDR图像是16bpc图像,32bpc或更多。一般来说,“标准动态范围”或SDR指的是具有比HDR图像更窄或更低的动态范围的显示器,图像或格式。(SDR图像还可以被称为较低的动态范围,或LDR图像。)同样,“高动态范围”或HDR指的是具有比SDR图像更宽或更高的动态范围的显示器,图像或格式。例如,所描述的实施例可用于从8bpc SDR图像生成32bpc HDR图像,或者用于渲染32bpc HDR图像以在16bpc或8bpc监视器上显示。
通常,可以由能够捕获数字图像的任何装置(例如,数字静止图像照相机,数字视频照相机,扫描仪或带有图像捕获能力的多用途装置,例如照相电话)或能够存储数字图像的任何媒介(例如,易失性存储器或非易失性存储器)来捕获或存储本文所描述的数字图像。
图4是图示概括的HDR图像处理***410的框图400。可以使用以上公开的任意一个计算环境来实现HDR图像处理***。图4示出了具有较低动态范围以及变化的曝光的非HDR(例如,SDR或LDR)图像432,434和436的集合430被输入到HDR图像处理***410中。此外,在图4中,图像432具有比图像434低的曝光,并且图像434具有比436低的曝光。因此,图像432,434,436有时被称为低曝光图像432,中曝光图像434,和高曝光图像436。通常,输入到***410的图像可以是两个或更多个图像的集合(例如,两个或更多个具有改变的曝光但成像于相同场景的LDR图像的集合),可选地连同其他信息一起,例如关于所述图像的元数据或者用户偏好数据(未示出)。例如,元数据可以包括表示照相机设置的信息。例如,用户偏好数据可以包括用于观看或修改图像的用户控制的参数设置。元数据和用户偏好数据可以包含于图像文件中或者分别提供。
图4进一步示出了可操作用于生成HDR图像的HDR图像生成器440和可操作用于渲染HDR图像以进行显示的HDR图像渲染器450。尽管***410示出了HDR图像生成器440和HDR图像渲染器450,但是***410可以执行HDR图像生成而无需渲染,例如当生成HDR图像用于存储或用于进一步地处理而不对其进行显示时。
在图4所示的示例中,HDR图像生成器440合成来自图像集合430(例如,稍微不同时间间隔获得的相同场景的图像,其每一个都具有不同的曝光设置)的信息。在某些实施例中,HDR图像生成器440使用以下参照图6公开的方法,以生成HDR图像。然后,HDR图像渲染器450可以将生成的HDR图像映射到SDR图像,并且准备将所述SDR图像输出到显示器460。在某些实施例中,HDR图像渲染器450使用以下参照图7公开的方法,以渲染HDR图像。还可能的是,渲染HDR图像而无需重新映射到标准动态范围,例如当显示器能够以其完整的动态范围显示HDR图像而无需重新映射时。
在***410内的模块之间所示的关系表示所述***中一般的信息流;为了简化起见而没有示出其他关系。典型地,特定实施例使用变化或补充版本的概括的***410。取决于所期望的实现方式和处理类型,可以增加、省略、分成多个模块、与其他模块组合、和/或以类似模块替换所述***的模块。在备选的实施例中,带有另外或不同的模块和/或模块的其他配置的***执行所描述的技术的一个或多个。例如,***410可以包括预处理器,其使用低通滤波器或其他滤波器平滑输入的数字图像,以便选择性地移除高频分量。或者,所述预处理器执行其他预处理任务。
***410还可以包括一个或多个编码器,其压缩图像数据,输出压缩的数字图像信息的位流。由编码器执行的确切操作可以根据压缩格式而不同。例如,编码器可以依照HDR图像格式压缩HDR图像信息,所述HDR图像格式例如JPEG XR,或者编码器可以依照一个格式(例如JPEG)压缩SDR图像信息。***410还可以包括一个或多个解码器,其解压缩被压缩的图像数据,输出解压缩的数字图像信息的位流。由解码器执行的精确操作可以根据压缩格式而变化。例如,适应JPEG XR的解码器可以解压缩JPEG XR文件中的HDR图像信息,或者适应JPEG的解码器可以解压缩JPEG文件中的SDR图像信息。
B.概括的HDR生成和渲染
图5是包括HDR图像生成510和HDR图像渲染520的示范性的概括的数字HDR成像方法的流程图500。例如,可以通过图4中所示的HDR图像处理***410或者其他***执行所述方法。在HDR图像生成510中,生成HDR图像。例如,可以通过合成来自多个SDR图像的信息(例如,稍微不同时间间隔获得的相同场景的图像,每一个都具有不同的曝光设置)来生成HDR图像。在某些实施例中,使用以下参照图6所公开的方法执行HDR图像生成510。还可能直接生成HDR图像而无需组合多个图像,例如通过使用图像捕获装置捕获图像,所述图像捕获装置能够捕获具有HDR位深度的原始图像。HDR图像生成510可以包括预处理(例如,手动或者自动的操作)以移除不期望的图像伪痕(例如,当压缩将用于形成HDR图像的源图像时引入的伪痕)。
在HDR图像渲染520中,将HDR图像信息转换成另一种格式。例如,可以将HDR图像渲染为SDR图像(例如,JPEG图像),并且显示在SDR显示器上。在某些实施例中,使用以下参照图7所公开的方法执行HDR图像渲染520。图像渲染可以包括色调映射过程(例如,自动的或者半自动的色调映射过程)。可以公布或者存档渲染后的图像。然而,典型地,当将HDR图像转换成SDR图像时,会丢失图像数据。因此,有益的是存档原始版本的HDR图像(例如,在以后的阶段中对所述原始图像执行进一步的修改)。还可能的是渲染HDR图像而无需重新映射到标准的动态范围,例如当显示器能够渲染HDR图像的整个动态范围而无需重新映射时。
尽管示范性的流程图500示出HDR图像生成510后面是HDR图像渲染520,但是HDR图像处理***可以生成HDR图像而无需渲染它们,例如当生成HDR图像用于存储或者用于进一步处理而不对其进行显示时。HDR图像处理***还可以渲染HDR图像渲染而无需生成它们,例如当所述HDR图像处理***从一些其他源获得HDR图像信息(例如,经由通信媒介)而无需首先生成所述HDR图像时。
C.高动态范围图像生成的示范性方法
图6是图示执行HDR图像生成的示范性方法600的流程图。诸如图4所示的HDR图像处理***410的***或者其他***执行方法600。然而,所图示的方法不应被看作是限定,因为可以单独地或者以彼此或与其他HDR图像生成过程一起的不同组合和子组合来执行所图示的动作的一个或多个。
在610,输入LDR图像信息。在所图示的实施例中,LDR图像的集合包含低曝光图像612,中曝光图像614,高曝光图像616,它们都是带有一个或多个不同曝光设置的一个场景的图像,当处理和集成这些图像时,可以产生较高动态范围的图像690。例如,LDR图像612,614,616是利用不同曝光设置在不同时间间隔(time instance)获得的场景的图像。
在620,执行图像对准。例如,当SDR图像612,614,616表示不同时间间隔的场景的视觉状态时,在620,分析存在于图像序列中的运动,并且对准所述图像,以便允许合并图像以形成HDR图像。当以不同时间间隔获得对象或场景的图像时,在所述对象或场景的不同照片之间很可能存在图像运动(典型地,转动,平移,或者缩放)。执行在620执行的图像对准,以便量化所述运动,以致于当执行进一步的处理时可以考虑这种运动。
以下参照图8-15详细地讨论用于执行图像对准的示范性方法。作为以下参照图8-15更加全面解释的,在所公开的技术的某些实施例中,将中曝光图像用作基准图像。在这样的实施例中,低曝光图像与所述基准中曝光图像对准(在622示出),并且高曝光图像独立地与所述基准中曝光图像对准(在624示出)。典型地,所述基准图像是具有中曝光范围(在输入图像的集合中不是最亮的或最暗的曝光设置或范围)的图像,但是也可以将其他曝光等级的图像用作基准图像。在一个实现方式中,基于输入图像集合中的哪个图像在某一范围内(被称为“中间”或者“正常”范围)具有最多的像素样本值来选择所述基准图像。正常曝光范围的限度和确定正常范围的方式可以改变。例如,可以为所有图像预先确定正常曝光范围,或者为每个图像或输入图像集合(例如,基于图像信息和/或用户偏好)适应性地确定正常曝光范围。可以自动地(例如,基于图像信息和/或用户偏好信息)执行基准图像的选择,或者可以将一幅图像指定(例如,经由用户)为基准图像。
在特定实施例中,将全局运动分析作为图像对准处理的一部分来执行。例如,对低曝光图像和中曝光图像执行一次以下参照图8-15所讨论的全局运动分析方法,获得将低曝光图像对准到中曝光图像的全局运动转换,并且对高曝光图像和中曝光图像执行一次以下参照图8-15所讨论的全局运动分析方法,获得将高曝光图像对准到中曝光图像的全局运动转换。
通常,全局运动分析(global motion analysis)指的是旨在对运动(例如遥摄、闪烁、转动、缩放或其他影响整个图像的其他运动)进行建模的分析。全局运动分析可以包括在像素位置中或像素位置的组(例如,块)中寻找匹配的像素样本值,其符合特定类型的全局运动。例如,在非基准图像中寻找遥摄运动可以包括在基准图像中的主要水平的方向上搜索匹配的像素样本值(或者像素样本值的组,例如块)。局部运动分析指的是旨在对所述图像的个别部分中的运动(例如对象或者受试人的运动)进行建模的分析。
在检测从特定像素位置(或者像素位置的组,例如块)到另一个的运动后,所述图像对准处理包括量化所述运动。在特定实现方式中,相对于基准图像,为图像中的像素样本或像素组(例如,块)计算运动矢量。例如,相对于基准图像,运动矢量可以指示水平维度中的位移以及垂直维度中的位移。零的运动矢量可用于指示没有为特定像素或像素组(例如,块)检测到运动。
在示例性实现方式中,在运动分析中不考虑异常低的像素样本值或者异常高的像素样本值,因为它们常常是不可靠的;例如,所述像素样本值的高或低值可能是由于图像噪声,或者所述值可能由于所述图像捕获装置中的图像传感器的动态范围限制而不是精确的测量值。在运动分析所使用的可接受的像素样本值的范围和确定该范围的方式可以改变。例如,可以为所有图像预先确定运动分析所使用的可接受的像素样本值的范围,或者为每个图像或输入图像集合适应性地确定该范围(例如,基于图像信息和/或用户偏好)。
在630,将图像转换到线性空间。典型地,图像612,614,616处于非线性空间(例如,RGB),并且没有可靠的方式来合并它们。在一些实施例中,使用每个图像的ICC简档(ICC profile)将所述图像转换到线性空间(例如,转换到线性发光空间)。例如,可以将伽马线性转换器用于将不在线性域的输入图像信号转换到线性域。典型地,静止图像文件(例如,JPEG文件)中的数据包括伽马编码的值。因此,在一个实现方式中,依照每个图像中传送的色彩简档(例如,ICC简档)将RGB样本转换到线性域。
在640,规格化所述图像。例如,在某些实施例中,基于所述图像的相对曝光等级规格化(或者缩放)所述图像。通常,规格化包括增加低曝光图像的像素样本值以及减少高曝光图像的像素样本值,以免高曝光图像主导包含在HDR图像生成中的最终计算。在某些实施例中,非基准图像的像素样本值(例如,低曝光图像612和高曝光图像616的像素样本值)乘以或除以对应于各个图像的相对曝光等级的缩放因数。在这样的实施例中,缩放因数将像素样本值转换到用基准图像(例如,中曝光图像614)规格化的等级。在一些实施例中,将缩放操作用于从方法动作630输出的线性数据,同一缩放因数被应用于图像的R,G和B像素样本值。备选地,在图像对准前执行缩放,并且在缩放后的图片上执行与图像对准相关联的运动分析。在某些实现方式中,计算两个规格化比率(或者缩放因数),第一个规格化比率用于将低曝光图像612规格化到中曝光图像614,并且第二个规格化比率用于将高曝光图像616规格化到中曝光图像614。在一个特定实现方式中,通过用平均中曝光图像像素样本值(例如,所述中曝光图像的所有R,G和B值的平均值)除以平均低曝光图像像素样本值(例如,所述低曝光图像的所有R,G和B值的平均值)来计算第一个比率(ratioLow)。因此,ratioLow=平均值(中曝光)/平均值(低曝光)。同样,通过用平均中曝光图像像素样本值(例如,所述中曝光图像的所有R,G和B值的平均值)除以平均高曝光图像像素样本值(例如,所述高曝光图像的所有R,G和B值的平均值)来计算第二个比率(ratioHigh)。因此,ratioHigh=平均值(中曝光)/平均值(高曝光)。为了完成图像规格化过程,所述线性空间低曝光图像的RGB像素样本值乘以所述ratioLow值,并且所述线性空间高曝光图像的RGB像素样本值乘以所述ratioHigh值(其典型地小于1,并且因此在计算上可以作为除法执行)。尽管示范性的实施例在一起对R,G和B值进行平均,但是备选的实施例可以计算R,G和B值的每一个的不同的平均值,从而产生多个缩放因数。
在650,合并所述图像。尤其是当输入图像612,614,616时,对于图像中的每个像素位置具有多个样本值。因此,在650,根据在图像612,614,616相应位置的多个像素样本值中为HDR图像中的像素位置计算单像素样本值(例如,单个R像素样本值,单个G像素样本值和单个G像素样本值)。在650的合并过程期间使用的像素样本值可以是对准之后(例如,在应用620处计算的所述全局运动转换之后)并且在将所述像素值转换到线性空间并且规格化(例如,在630和640)之后的图像612,614,616的像素样本值。
在一个实现方式中,为每个像素位置计算所述像素样本值的加权平均值(例如,加权算术平均)。应用到加权平均值中的像素样本值的加权因数(例如,在所考虑的像素位置应用到低曝光图像的像素样本值的加权因数,在所考虑的像素位置应用到中曝光图像的像素样本值的加权因数,和在所考虑的像素位置应用到高曝光图像的像素样本值的加权因数)是基于线性转换和规格化之前的原始像素值是否可靠。通常,加权因数与所述像素值可靠的可信度(confidence level)成正比:越高的可信度,越高的加权因数。例如,典型地,在高曝光图像中具有比较高的值(例如,超过240)的像素样本值是不可靠的,就像在低曝光图像中具有比较低的值(例如,低于15)的像素样本值。这样的值对应于黑暗或者饱和的图像区域。
可以使用各种技术确定应用到特定像素样本值的加权,但是在某些实施例中可以使用帽(hat)函数计算上述加权。表1中示出了适当的hat函数的示例。表1中示例性的帽函数产生取决于输入像素值(i)的加权因数(wt_lut8)。表1中所示的帽函数产生加权因数,所述加权因数有助于确保将具有非常低和非常高的值的像素认为是不可靠的,并且因此更少地贡献于最终的图像像素样本值。应当理解的是,不应当将示范性的帽函数的变量和性能看作是限定,而是可以在实现方式之间进行改变。
Figure DEST_PATH_IMAGE001
在计算HDR像素位置的加权平均值之前,还可以为可能存在的伽马校正量化误差校正图像612,614,616的转换和规格化的像素样本值。表2示出了适当的伽马量化误差函数的示例。所述示例性的伽马量化误差函数计算取决于输入像素值(i)的伽马误差(gm_error)。应当理解的是,不应当将示范性的伽马量化误差函数的变量看作是限定,而是可以在实现方式之间进行改变。
Figure 205715DEST_PATH_IMAGE002
在660,将合并的图像转换为适当的HDR格式。例如,可以将来自过程块650的合并的像素数据编码成RGBE或者JPEG XR图像文件。也可以将所述合并的像素数据编码成其他格式,例如“半浮点”(half float)文件或者适于表示HDR图像数据的另一种文件。在某些实施例中,不用执行到HDR格式的转换,例如当原始的HDR像素数据是期望输出的时,并且不需要专门的格式化或者编码。
可以以各种不同方式修改图6的方法,以提供附加或备选的特征。例如,在某些实施例中,可以预处理输入图像612,614,616(例如,在过程块620之前)。所述预处理可以包括应用低通滤波器或者其他滤波器以便选择性地移除高频分量。或者,所述预处理可以包括应用滤波器(例如,平滑滤波器)以移除图像伪痕,例如,块伪痕、带状伪痕、环状伪痕、或者由图像捕获装置中的去马赛克操作引起的伪痕。
D.高动态范围图像渲染的示范性方法
图7是图示用于执行HDR图像渲染的示范性方法700的流程图。诸如图4所示的HDR图像处理***410的***或者其他***可以执行方法700。本文所使用的术语“渲染(rendering)”指的是将HDR图像数据转换为不同的格式。用于渲染HDR图像数据的应用的示例包括准备HDR图像以在具有较低动态范围的监视器显示,或者将HDR图像数据转换到HDR图像文件以用于存储在SDR图像文件中。然而,所图示的方法不应被看作是限定,因为可以单独地或者以彼此或与其他HDR图像渲染过程的不同组合和子组合来执行所图示的动作的一个或多个。
在710,将HDR数字图像中的像素样本值色调映射到各自的较低动态范围值。可以使用全局色调映射、或者全局色调映射和一个或多个局部色调映射来执行色调映射。通常,色调映射指的是函数g,其将图像像素样本值映射到像素样本值g(s)。全局色调映射是将全局色调映射应用到给定图像I中的像素样本值的每一个的过程。例如,可以将全局色调映射应用到图像以按照用户期望修改图像的亮度和/或对比度质量,从而产生色调映射的图像G(I)。局部色调映射涉及函数L,其将图像I转换为色调映射的图像L(I)。如同全局色调映射一样,可以将局部色调映射应用到图像,其目标是调整所述图像中的亮度和对比度。然而,局部色调映射可以考虑不用均匀地应用到所述图像的局部调整。在某些实施例中,可以在全局或局部色调映射查找表中识别出各自的LDR值,并且可以将其存储在LDR图像缓冲器中。
在720,为色调映射的像素样本值的每一个计算局部对比度值。例如,基于线性域中的图像数据计算局部对比度值。
在730,至少部分地基于各自的局部对比度值,为色调映射的像素样本值的每一个导出剩余信号。例如,所述***将LDR图像缓冲器中的像素样本值乘以相应的局部对比度值。
在740,至少部分地基于色调映射的样本值和各自的剩余信号为LDR数字图像计算像素样本值。例如,所述***把LDR缓冲器中的样本值、相应的剩余信号和高频抖动信号加在一起。
V.高动态范围图像生成中使用的图像对准技术
A.示范性概括的对准方法
图8是图示示范性的数字图像对准技术的流程图800。例如,所图示的技术可以用在以上图6的过程块620上。然而,所图示的方法不应被看作是限定,因为可以单独地或者以彼此或与其他HDR图像处理动作的不同组合和子组合来执行所图示的动作的一个或多个。
在810,输入(例如,装载、缓冲到存储器、或访问或准备进一步的处理)基准图像和非基准图像(待对准的图像)。在某些实施例中,所述基准图像是中曝光图像,并且待对准的图像是低曝光图像或者高曝光图像。例如,在一个特定实施例中,所述方法800 被执行一次以将低曝光图像对准到基准中曝光图像,并且执行一次以将高曝光图像对准到基准中曝光图像。为低和高曝光图像执行方法800的次序可以改变。
在820,执行局部运动估算。例如并且如以下更加全面的解释,基于金字塔的块作为使用协方差的运动矢量估算步骤的基础。
在830,移除异常的运动矢量。例如并且如以下更加全面的解释,可以将随机抽样一致(“RANSAC”)方法用于检测和消除由于移动对象具有局部运动,饱和,和/或曝光不足而异常的运动矢量。
在840,估算全局运动转换。例如,可以通过处理在过程块820计算的运动矢量来估算全局运动矢量,并且可以将其用于补偿待对准图像的平移,旋转和/或缩放(例如,由于手的摇动而产生的抖动)。
在850,对非基准图像(待对准的图像)执行图像扭曲(warping)。例如,当所述低曝光图像是待对准的图像时,可以扭曲所述低曝光图像,并且当高曝光图像是待对准的图像时,可以扭曲所述高曝光图像。
典型地,局部运动估算820和图像扭曲850过程是计算密集的,并且使用目标计算装置上可用的多媒体DSP部件(例如,使用专用ASIC单元(例如,Nvidia的Tesla GPU,或者Intel的Larabee单元)、带有着色器能力的图形处理单元(“GPU”)、或者具有先进多媒体指令(例如,SSEx指令)的多核处理器或者中央处理单元)按照期望执行上述过程。例如,可以实现并且使用特别适合于利用GPU着色器进行处理的局部运动估算820,以实施数字图像对准方法800的局部运动估算部分,当所述目标计算装置在它可用的多媒体DPS部件之间具有GPU着色器能力时。所述全局对准程序还可以包括使用带有双线性插值的D3D API调用执行图像扭曲的功能,当确定所估算的目标计算装置在它的可用多媒体DSP部件之间拥有该能力时。可以通过专用硬件执行在840执行的全局转换估算,但是典型地由CPU执行。
B.基于金字塔块的(pyramid block-based)使用协方差的运动矢量估算
在一个示例性实现方式中,如图9-13中所图示的,使用具有协方差分析的基于金字塔块的运动估算技术来执行所述局部运动估算(例如,过程块830处的局部运动估算)。所图示的技术特别恰当地适用于GPU着色器中的处理(如果在所述目标计算装置上被确定可用的话)。相比于单独地为全分辨率数字图像的各个块估算局部运动,所述基于金字塔块的运动估算技术还着重于所述数字图像的全局运动,其非常适合于估算两个数字图像之间全部的全局运动。
所述基于金字塔块的运动估算在基准图像和待对准的非基准图像之间(例如,在中曝光图像(基准图像)和低曝光图像(待对准的图像)之间,或者在中曝光图像(基准图像)和高曝光图像(待对准的图像)之间)执行运动估算。对于所述运动估算,将两个图像分为块的规则格栅,例如16×16的块,并且所述运动估算计算待对准的图像的每个块相对于基准图像中紧密匹配的图像内容的运动矢量或者位移。
基于金字塔块的运动估算开始于重复地并且对半地下采样非基准图像和基准图像两者的分辨率(例如,使用所述计算装置的GPU上的下采样着色器)。在图9所示的示例中,连续三次对半地下采样所述待对准的非基准图像和所述基准图像,以产生完整分辨率、一半分辨率、四分之一分辨率和八分之一分辨率版本的非基准图像和基准图像。可以在分辨率方面对待对准的非基准图像和基准图像下采样固定次数,或者取决于所述图像的尺寸和原始分辨率和/或依照所述计算装置可用的图像缓冲空间和处理资源,可以下采样变量次数。备选地,可以比图9中所示的示例更少或更多次地下采样非基准图像和基准图像。应当理解的是,图9中所图示的示例仅是例证性的,并且由所公开的对准方法处理的实际数字图像将比所图示的具有更多的像素和更高的原始分辨率。
对于所述数字图像的每个分辨率,基于金字塔块的运动估算将所述数字图像分为块的格栅。在每个分辨率处使用相同尺寸的块。优选地,使用相对大的块尺寸,例如16×16或者8×8像素。这样,最低分辨率图像的每个块在下一个较高分辨率图像中的相应位置处将分成相同块尺寸的4个块,其实际上提供了一种所述最低分辨率图像中的块与所述较高分辨率图像中相应位置的那些块之间的金字塔形结构,或者分层结构关系。为了例示起见,在图9的粗线边界内示出了较高分辨率版本的数字图像(例如,1/1,1/2和1/4分辨率)中的块,其与所述1/8分辨率图像左上部的块呈金字塔形结构关系。
接下来,基于金字塔块的运动估算基于最低分辨率图像中每个块上的协方差分析、在整个基准图像上执行完整的运动矢量搜索,以找到所述基准图像中最佳匹配(或者最接近匹配)的图像内容的位置。例如,可以通过一下方式执行所述搜索:搜索块位置附近的匹配块(例如,使用协方差分析),然后逐渐地扩展所述搜索区域(例如,使用扩展的螺旋模式),以将待对准的图像中的块与基准图像中的块进行匹配。 典型地,所述运动矢量指示所述待对准的图像中的块相对于所述基准图像在水平维度中的位移和在垂直方向中的位移。可以将零的运动矢量用于指示对于特定块,没有检测到运动。这个过程为最低分辨率版本的待对准图像中的每个块的产生局部运动矢量,所述图像与所述基准图像中匹配(或者最接近匹配)的图像内容对应相关。在特定实施例中,仅在最低分辨率版本的图像和最低分辨率版本的基准图像之间执行完整的搜索,如图10所示。
如所指示的,在所公开的技术的某些实施例中,将协方差分析用来确定待对准的非基准图像中的运动矢量,其能最佳地指示针对基准图像中的匹配图像内容的相对位移(或者反之亦然)。这个协方差计算与差的总和计算形成对比。仅考虑具有不同曝光的两个图像的像素样本值之间的差不是一种用于匹配具有不同曝光等级的图像之间的图像内容的有效机制,因为曝光等级差别固有地使图像具有不同的像素值(即使图像被完美地对准)。协方差分析是所希望的,因为协方差测量两个值的集合一共改变了多少,而不管集合中值的相对大小。因此,协方差在检测和关联图像内容两个块之间的纹理和边缘上是有效的。因此,协方差是匹配具有不同曝光等级的图像之间的块的有用工具。例如,在一个实施例中,计算在基准图像的块中的像素样本值和待对准的非基准图像的候选块中的像素样本值之间的协方差(或者反之亦然,以便计算在非基准的块中的像素样本值和基准图像的候选块中的像素样本值之间的协方差)。然后,将具有最大协方差值的非基准图像的块选作匹配(或者在最接近匹配)的块,并且计算和使用相应的运动矢量。
在一个示例中,如下地计算在两个块(例如,所述基准图像的块和待对准的非基准图像的候选块,或者反之亦然)之间的协方差:
               (1)
其中,X是对应于来自第一块(例如,基准图像的块)的像素样本值的变量(variate),以及Y是对应于来自第二块(例如,待对准图像的候选块)的像素样本值的变量。此外,
Figure 185173DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
都是用于x和y的相应均值。等式(1)可以更加明确地写成:
Figure 27227DEST_PATH_IMAGE006
              (2)
其中,i是下标值,N是样本大小并且对应于用作协方差计算一部分的块中的像素样本值的数量,
Figure DEST_PATH_IMAGE007
是第一块中的像素样本值的均值,以及
Figure 484753DEST_PATH_IMAGE008
是第二块中的像素样本值的均值。在某些实施例中,为两个块之间的R,G和B样本值计算各自的协方差值。然后,可以平均各自的协方差值,或加以利用,以得到单个协方差值(例如,可以使用加权平均值)。例如,可以执行在16×16的块的R,G和B样本值之间的各自的协方差计算,在这样的情况下N=256。在其他实施例中,计算单个协方差值,其考虑了两个块之间的所有R,G和B样本值或其子集。例如,可以在16×16的块中的所有R,G和B样本值之间执行协方差计算,在这样的情况下N=256(3)=768。
如同图11-13中所图示的,然后,使用协方差的基于金字塔块的运动估算相对于基准数字图像在每个连续的较高分辨率版本的数字图像上执行精确的运动估算,直到所述数字图像的原始分辨率。如前所述,较低分辨率图像的每个块在该数字图像下一个较高分辨率版本的相应位置处分成四个块。将针对较低分辨率图像的块经由运动估算搜索计算的运动矢量用作精确运动估算搜索的起点,以用于在该数字图像的下一个较高分辨率版本的金字塔形结构中的四个块的每一个块。这个精确搜索还可以使用协方差分析来确定具有最接近地匹配的图像内容的块。在某些实施例中,所述精确搜索计算基准图像块和通过来自较低分辨率图像的运动矢量识别出的待对准的非基准图像的块之间的协方差,并且还计算基准图像块和非基准图像的相邻候选块之间的协方差。如果相邻的块没有一个产生更高的协方差值,则可以终止所述精确搜索。如果相邻的块之一产生了更高的协方差值,则可以将它选作匹配块,并且针对新选择的块的相邻块,可以继续所述精确搜索。
较低分辨率数字图像的块与下一个较高分辨率数字图像的四个相应块的金字塔形结构关系强调了相邻块之间的运动估算计算的一致性。由于对该数字图像的每个连续的较高分辨率版本重复所述精确搜索,所以在相邻块之间所强调的一致性为原始分辨率图像的块提供了更一致的局部运动矢量集合,接着作为以下讨论的全局运动转换估算的基础。
一旦以原始图像分辨率结束局部运动估算,就复制、缓冲或存储原始分辨率图像的每个块的运动矢量(可选地,连同协方差结果一起),以用于全局运动估算。
C.全局转换估算和无关(outlying)运动矢量的移除
图14图示了可用于估算不同曝光等级获得的图像和由手摇动或者时间演变引起的图像之间的差别的各种全局运动转换模型。可能的全局运动转换模型包括平移类似性,欧几里得几何学,投影和仿射几何学运动转换模型。在某些希望的实施例中,全局运动转换处理使用具有平移、旋转和缩放参数的类似性全局转换模型,如以下等式(3)所示:
Figure DEST_PATH_IMAGE009
            (3)
其中,xy是原始位置,x’y’是转换后的位置,以及sβt x t y 分别是缩放、旋转和平移参数。
通常,大部分用户仅将体验平移,旋转和缩放上的摇动运动效果。因此,等式(3)的类似性运动转换模型非常适合于说明不同曝光等级的图像之间的手摇动或者时间演变,然后其被用于创建单个HDR图像。然而,所述全局运动转换估算备选的实现方式可以使用其他模型,所述其他模型对于来自手的摇动或者时间演变的图像抖动的另外的或者极少的方面进行建模。
图15是图示用于估算图像之间的全局运动转换的示范性方法1500的流程图,其适合于将非基准图像(例如,低曝光图像或者高曝光图像)对准到基准图像(例如,中曝光图像),以作为图6中所图示的HDR图像生成方法的一部分。特别是,估算全局运动转换的方法1500可以用在图8的过程块840处。
在1510,接收非基准图像和基准图像之间的运动矢量信息(例如,装载、缓冲到存储器、或访问或准备进一步的处理)。在某些实现方式中,协方差信息(例如,在图8的过程块820的局部运动估算期间产生的、图像的每个块的协方差信息)和/或原始的方差信息(例如,关于原始图像的每个块的方差信息)。
在1520,选择运动矢量的集合,以其为基础进行全局运动转换估算。所选择的运动矢量可以是被确定为比其他运动矢量更加可靠的运动矢量。在一个示例性实现方式中,方法1500基于一个或多个规则选择运动矢量。例如,一个规则可以是图片边界上的运动矢量是不可靠的,并且因此不选择这些运动矢量。例如,发生在图像间的照相机运动可能造成边界块被部分丢失。一个另外的规则可以是具有低于某一阈值的原始方差值的块是不可靠的,并且因此不选择这些块。原始的方差值测量块中的像素样本值之间的相对差。低值指示在相应块中的像素样本值基本上是类似的或者彼此相同。典型地,这种低方差值存在于具有大面积的类似颜色的场景区域中(例如,蓝天)。由于缺乏纹理或者边缘,这种块不是用于产生可靠的运动矢量的优良候选。所述阈值在实现方式之间可以不同,但是被选择用于帮助消除与图像中的大的平滑空间相关联的运动矢量。在某些实施例中,可以使用所有这三个规则,但是还可以使用较少或其它的可靠性标准。
在1530,为图像计算所述全局运动转换的估算(例如,为非基准图像相对于基准图像的相对运动,或者反之亦然)。在某些实施例中,使用以上所讨论的类似性全局运动模型的等式(3)估算全局运动转换。备选地,可以基于另一个运动模型估算所述全局运动转换。
为了估算所述全局运动转换,方法1500的实施例还使用随机抽样一致(“RANSAC”)方法来检测并且消除异常的运动矢量。在所述RANSAC方法中,随机从1520处选择的运动矢量的集合中选择两个运动矢量。然后所述运动矢量处理使用最小均方差(“LMSE”)拟合来求解等式(3),以确定这两个随机选择的运动矢量的sβt x t y 参数的值。然后,所述RANSAC方法若干其它运动矢量,这些运动矢量也符合全局运动转换等式参数的这个解。所述RANSAC方法重复其他对运动矢量的随机选择,直到得到符合所述解的最大组的运动矢量。这样消除了被认为是异常的、或者不符合全局运动转换参数的一致LMSE解的运动矢量。
D.具有全局运动转换的图像扭曲
再次参照图8,数字图像对准过程800基于所述全局运动转换(例如,来自方法1500的全局运动转换)执行图像扭曲850,并且产生非基准图像的对准版本。例如,可以通过具有双线性插值的GPU(例如,使用GPU D3D API)和/或使用定制的双立体顶点(bi-cubic vertex)着色器来执行所述图像扭曲,以将图像扭曲应用于对应于由于抖动运动的全局运动估算的方向上。此外,在某些实现方式中,在扭曲之后缺失的像素不被用于HDR图像生成。
VI.结束语
本文所描述的方法的任意一种都可以通过存储在一个或多个非临时性的计算机可读介质(例如,存储器或者其他有形介质)上的计算机可执行指令来执行。操作可以是全自动的,半自动的,或者包括人工干预。
参照所描述的实施例已经描述和图示了我们的发明的原理,应当意识到,可以在安排和细节上对所描述的实施例进行修改而不脱离这些原理。例如,应该理解的是,本文所描述的程序,过程或者方法不涉及或局限于任何特定类型的计算环境,除非另外指出。各种类型的通用或者专用计算环境可以依据本文所描述的教导而被使用或者执行操作。所描述的实施例中被示为软件的元件也可以用硬件实现,并且反之亦然。
鉴于我们的发明的原理可以应用到的许多可能实施例,我们要求保护落入随后权利要求及其等价物的范围和精神的所有这些实施例都属于我们的发明。

Claims (10)

1.一种生成高动态范围数字图像的方法,所述方法包括:
使用计算装置,
在基准图像和一个或更多个非基准图像的集合之间执行运动分析(620,820),所述运动分析包括计算所述基准图像中的像素样本值的集合和来自所述集合的所述非基准图像之一中的像素样本值的集合之间的一个或多个协方差值;以及
至少部分地基于所述运动分析,将来自所述集合的所述非基准图像的至少之一与所述基准图像进行合并(650),以形成较高动态范围的数字图像。
2.如权利要求1所述的方法,其中,所述一个或多个非基准图像的集合包括具有比所述基准图像低的曝光等级的非基准图像以及具有比所述基准图像高的曝光等级的非基准图像。
3.如权利要求1所述的方法,其中,所述执行运动分析包括:
为所述集合的非基准图像之一中的相应块,估算相对于所述基准图像的两个或更多个局部运动矢量;以及
至少部分地基于所述两个或更多个局部运动矢量,估算全局运动转换。
4.如权利要求3所述的方法,其中,所述估算所述两个或更多个局部运动矢量包括:
一次或多次地下采样所述非基准图像之一和所述基准图像,以形成所述非基准图像之一和所述基准图像在多个分辨率的多个版本,其中,非基准图像之一的最低分辨率版本具有以金字塔形结构关联到所述非基准图像之一的每个较高分辨率版本的相应位置上的连续的较大量块的多个块,并且其中,基准图像的最低分辨率版本具有以金字塔形结构关联到基准图像的每个较高分辨率版本的相应位置上的连续的较大量块的多个块。
5.如权利要求4所述的方法,其中,所述估算所述两个或多个局部运动矢量还包括:
对于所述非基准图像之一的最低分辨率版本,通过对基准图像的相关联的最低分辨率版本中的运动矢量执行完整搜索来估算所述非基准图像之一的块的运动矢量;以及
对于所述非基准图像之一的每个连续的较高分辨率版本,依照所述金字塔形结构使用从在前的所述非基准图像之一的最低分辨率版本的关联块估算的运动矢量开始的精确搜索,来估算所述非基准图像之一的连续的较高分辨率版本的块的运动矢量。
6.如权利要求1所述的方法,其中,所述合并包括加权来自所述非基准图像之一的像素样本值,以便所述像素样本值对较高动态范围数字图像中相应的最终像素样本值的影响小于所述基准图像中的相应像素样本值。
7.如权利要求6所述的方法,其中,所述加权包括相对于所述像素样本值的范围中间的像素样本值,将较低的加权分配给处于所述像素样本值范围的上限或下限附近的像素样本值。
8.一个或多个存储计算机可执行指令的非临时性计算机可读介质,当由计算机执行所述计算机可执行指令时,使得计算机执行一种方法,所述方法包括:
接收(810)基准图像,所述基准图像包括处于第一曝光等级和第一时间的数字图像;
接收(810)非基准图像,所述基准图像包括处于第二曝光等级和第二时间的数字图像,所述第二曝光等级不同于所述第一曝光等级,并且所述第二时间不同于所述第一时间;
为所述非基准图像估算(820)相对于所述基准图像的两个或更多个局部运动矢量,所述两个或更多个局部运动矢量的估算包括:
一次或多次地下采样所述非基准图像和所述基准图像,以形成所述非基准图像之一和所述基准图像在多个分辨率的多个版本,其中,非基准图像的最低分辨率版本具有以金字塔形结构关联到所述非基准图像的每个较高分辨率版本的相应位置上的连续的较大量块的多个块,并且其中,基准图像的最低分辨率版本具有以金字塔形结构关联到基准图像的每个较高分辨率版本的相应位置上连续的较大量块的多个块;
对于非基准图像的所述最低分辨率版本,通过对基准图像的相关联的最低分辨率版本中的运动矢量执行完整搜索来估算(1000)所述非基准图像的块的运动矢量;以及
对于所述非基准图像的每个连续的较高分辨率版本,依照所述金字塔形结构使用从所述非基准图像的在前的较低分辨率版本的关联块估算的运动矢量开始的精确搜索,来估算(1100,1200,1300)所述非基准图像的连续的较高分辨率版本的块的运动矢量。
9.如权利要求8所述的一个或多个计算机可读介质,其中,所述方法还包括:
至少部分地基于所述两个或更多个局部运动矢量估算全局运动转换,其中,所述估算全局运动转换包括选择在估算所述全局运动转换中使用的所述两个或更多个运动矢量的子集,所述选择所述运动矢量的子集包括以下一个或多个:(a)排除图像边界上的运动矢量;(b)排除具有未能超过协方差阈值的相关联的协方差值的块的运动矢量;或者(c)排除具有未能超过内容变化阈值的图像内容变化值的块的运动矢量。
10.一种用于生成HDR图像的数字图像处理装置,所述数字图像处理装置包括:
存储图像对准程序的存储器;
至少一个数字信号处理部件;
可操作地执行所述图像对准程序的处理单元,其中,执行所述图像对准程序使得所述处理单元:
输入(810)基准图像,所述基准图像包括处于第一曝光等级和第一时间的数字图像;
输入(810)非基准图像(810),所述基准图像包括处于第二曝光等级和第二时间的数字图像,所述第二曝光等级不同于所述第一曝光等级,并且所述第二时间不同于所述第一时间;以及
计算(820)所述非基准图像中的像素样本值的块的局部运动矢量,其指示所述块到所述基准图像中的像素样本值的相应块的相对运动,至少部分地使用估量所述非基准图像的块中的像素样本值与所述基准图像的块中的像素样本值总的改变程度的度量标准来确定所述局部运动矢量。
CN201210045361.9A 2011-02-25 2012-02-27 生成高动态范围图像的全局对准方法和装置 Active CN102693538B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/035,883 US8711248B2 (en) 2011-02-25 2011-02-25 Global alignment for high-dynamic range image generation
US13/035883 2011-02-25
US13/035,883 2011-02-25

Publications (2)

Publication Number Publication Date
CN102693538A true CN102693538A (zh) 2012-09-26
CN102693538B CN102693538B (zh) 2017-03-01

Family

ID=46718763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210045361.9A Active CN102693538B (zh) 2011-02-25 2012-02-27 生成高动态范围图像的全局对准方法和装置

Country Status (2)

Country Link
US (1) US8711248B2 (zh)
CN (1) CN102693538B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103297657A (zh) * 2013-05-14 2013-09-11 李小林 一种基于gpu的视频稳定方法
CN103413285A (zh) * 2013-08-02 2013-11-27 北京工业大学 基于样本预测的hdr和hr图像重建方法
CN103413286A (zh) * 2013-08-02 2013-11-27 北京工业大学 一种基于学习的高动态范围与高分辨率图像联合重建方法
CN103973958A (zh) * 2013-01-30 2014-08-06 阿里巴巴集团控股有限公司 图像处理方法及设备
CN104349066A (zh) * 2013-07-31 2015-02-11 华为终端有限公司 一种生成高动态范围图像的方法、装置
CN106686320A (zh) * 2017-01-22 2017-05-17 宁波星帆信息科技有限公司 一种基于数密度均衡的色调映射方法
CN106797437A (zh) * 2014-09-25 2017-05-31 英特尔公司 使用多个图像的高动态范围图像合成
CN107527360A (zh) * 2017-08-23 2017-12-29 维沃移动通信有限公司 一种图像对齐方法及移动终端
US9888186B2 (en) 2014-03-13 2018-02-06 Beijing Zhigu Rui Tuo Tech Co., Ltd Image acquisition method and image acquisition apparatus
CN108352076A (zh) * 2015-08-24 2018-07-31 汤姆逊许可公司 编码和解码方法及对应设备
US10055872B2 (en) 2014-11-21 2018-08-21 SZ DJI Technology Co., Ltd. System and method of fast adaptive blending for high dynamic range imaging
CN109391772A (zh) * 2017-08-14 2019-02-26 佳能株式会社 图像模糊校正设备及其控制方法
US10321072B2 (en) 2014-03-13 2019-06-11 Beijing Zhigu Rui Tuo Tech Co., Ltd Image obtaining apparatus and method for obtaining an image based on pixel binning
CN110213459A (zh) * 2014-06-10 2019-09-06 松下知识产权经营株式会社 显示方法和显示装置
CN112243091A (zh) * 2020-10-16 2021-01-19 微创(上海)医疗机器人有限公司 三维内窥镜***、控制方法和存储介质
CN114503541A (zh) * 2019-08-06 2022-05-13 三星电子株式会社 用于多帧融合的有效率的正则化图像对准的装置和方法
CN115578255A (zh) * 2022-09-22 2023-01-06 北京航空航天大学 一种基于帧间亚像素块匹配的超分辨率重建方法

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010118177A1 (en) * 2009-04-08 2010-10-14 Zoran Corporation Exposure control for high dynamic range image capture
US8525900B2 (en) 2009-04-23 2013-09-03 Csr Technology Inc. Multiple exposure high dynamic range image capture
WO2010123923A1 (en) 2009-04-23 2010-10-28 Zoran Corporation Multiple exposure high dynamic range image capture
US8570396B2 (en) * 2009-04-23 2013-10-29 Csr Technology Inc. Multiple exposure high dynamic range image capture
US8896715B2 (en) 2010-02-11 2014-11-25 Microsoft Corporation Generic platform video image stabilization
JP2012019392A (ja) * 2010-07-08 2012-01-26 Nikon Corp 画像処理装置、電子カメラおよび画像処理プログラム
US9077910B2 (en) * 2011-04-06 2015-07-07 Dolby Laboratories Licensing Corporation Multi-field CCD capture for HDR imaging
JP5701664B2 (ja) * 2011-04-07 2015-04-15 オリンパス株式会社 撮像装置
EP2509044B1 (en) * 2011-04-08 2018-10-03 Dolby Laboratories Licensing Corporation Local definition of global image transformations
US8933985B1 (en) 2011-06-06 2015-01-13 Qualcomm Technologies, Inc. Method, apparatus, and manufacture for on-camera HDR panorama
US9824426B2 (en) 2011-08-01 2017-11-21 Microsoft Technology Licensing, Llc Reduced latency video stabilization
US20130044237A1 (en) * 2011-08-15 2013-02-21 Broadcom Corporation High Dynamic Range Video
WO2013054446A1 (ja) 2011-10-14 2013-04-18 株式会社モルフォ 画像合成装置、画像合成方法、画像合成プログラム及び記録媒体
WO2013100791A1 (en) * 2011-12-30 2013-07-04 Intel Corporation Method of and apparatus for scalable frame rate up-conversion
KR101664158B1 (ko) * 2012-01-18 2016-10-11 인텔 코포레이션 지능형 계산 촬영 시스템
JP5950678B2 (ja) * 2012-04-27 2016-07-13 キヤノン株式会社 撮像装置、制御方法、及びプログラム
KR101930235B1 (ko) * 2012-05-15 2018-12-18 삼성전자 주식회사 디지털 이미지 안정화 방법, 장치 및 시스템
KR101939628B1 (ko) * 2012-05-30 2019-01-17 삼성전자주식회사 모션 검출 방법 및 모션 검출기
US9489706B2 (en) * 2012-07-02 2016-11-08 Qualcomm Technologies, Inc. Device and algorithm for capturing high dynamic range (HDR) video
CN102779334B (zh) * 2012-07-20 2015-01-07 华为技术有限公司 一种多曝光运动图像的校正方法及装置
US9525825B1 (en) * 2012-09-25 2016-12-20 Amazon Technologies, Inc. Delayed image data processing
DE102013110899B4 (de) * 2012-10-04 2019-07-04 Cognex Corporation Symbologie-Lesegerät mit Multicore-Prozessor und Systeme und Verfahren zum Betrieb desselben
US10154177B2 (en) * 2012-10-04 2018-12-11 Cognex Corporation Symbology reader with multi-core processor
US9129388B2 (en) 2012-11-21 2015-09-08 Apple Inc. Global approximation to spatially varying tone mapping operators
US9955084B1 (en) 2013-05-23 2018-04-24 Oliver Markus Haynold HDR video camera
US10015515B2 (en) * 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
US8957984B2 (en) * 2013-06-30 2015-02-17 Konica Minolta Laboratory U.S.A., Inc. Ghost artifact detection and removal in HDR image processsing using multi-scale normalized cross-correlation
US9100631B2 (en) * 2013-08-05 2015-08-04 Cable Television Laboratories, Inc. Dynamic picture quality control
KR102144394B1 (ko) * 2013-08-20 2020-08-13 한화테크윈 주식회사 영상 정합 장치 및 이를 이용한 영상 정합 방법
WO2015061335A2 (en) 2013-10-22 2015-04-30 Dolby Laboratories Licensing Corporation Guided color grading for extended dynamic range
JP6289044B2 (ja) * 2013-11-15 2018-03-07 オリンパス株式会社 観察装置
US20150142884A1 (en) * 2013-11-21 2015-05-21 Microsoft Corporation Image Sharing for Online Collaborations
WO2015098669A1 (en) * 2013-12-26 2015-07-02 Canon Kabushiki Kaisha Image processing apparatus and imaging apparatus
US9883197B2 (en) 2014-01-09 2018-01-30 Qualcomm Incorporated Intra prediction of chroma blocks using the same vector
US9668367B2 (en) 2014-02-04 2017-05-30 Microsoft Technology Licensing, Llc Wearable computing systems
WO2016004006A1 (en) * 2014-06-30 2016-01-07 The University Of North Carolina At Chapel Hill Methods, systems, and computer readable for performing image compression
KR20160003502A (ko) * 2014-07-01 2016-01-11 삼성전자주식회사 병렬화 방법 및 전자 장치
US9355439B1 (en) * 2014-07-02 2016-05-31 The United States Of America As Represented By The Secretary Of The Navy Joint contrast enhancement and turbulence mitigation method
US9525804B2 (en) 2014-08-30 2016-12-20 Apple Inc. Multi-band YCbCr noise modeling and noise reduction based on scene metadata
US9667842B2 (en) 2014-08-30 2017-05-30 Apple Inc. Multi-band YCbCr locally-adaptive noise modeling and noise reduction based on scene metadata
US9349162B1 (en) 2014-10-24 2016-05-24 Matrox Electronic Systems Ltd. System and method for image color correction
US9747673B2 (en) * 2014-11-05 2017-08-29 Dolby Laboratories Licensing Corporation Systems and methods for rectifying image artifacts
US9589313B2 (en) * 2015-01-09 2017-03-07 Vixs Systems, Inc. Dynamic range converter with pipelined architecture and methods for use therewith
US9860504B2 (en) 2015-01-09 2018-01-02 Vixs Systems, Inc. Color gamut mapper for dynamic range conversion and methods for use therewith
JP6390512B2 (ja) * 2015-05-21 2018-09-19 株式会社デンソー 車載カメラ装置
US9665927B2 (en) * 2015-06-03 2017-05-30 Samsung Electronics Co., Ltd. Method and apparatus of multi-frame super resolution robust to local and global motion
US9641820B2 (en) 2015-09-04 2017-05-02 Apple Inc. Advanced multi-band noise reduction
US9883112B1 (en) * 2016-09-22 2018-01-30 Pinnacle Imaging Corporation High dynamic range imaging
US10218952B2 (en) 2016-11-28 2019-02-26 Microsoft Technology Licensing, Llc Architecture for rendering high dynamic range video on enhanced dynamic range display devices
US10176561B2 (en) 2017-01-27 2019-01-08 Microsoft Technology Licensing, Llc Content-adaptive adjustments to tone mapping operations for high dynamic range content
US10104334B2 (en) * 2017-01-27 2018-10-16 Microsoft Technology Licensing, Llc Content-adaptive adjustment of display device brightness levels when rendering high dynamic range content
US10863105B1 (en) * 2017-06-27 2020-12-08 Amazon Technologies, Inc. High dynamic range imaging for event detection and inventory management
US10319079B2 (en) 2017-06-30 2019-06-11 Microsoft Technology Licensing, Llc Noise estimation using bracketed image capture
CN111316629B (zh) * 2017-08-02 2022-04-19 索尼公司 图像处理装置和方法、成像装置和程序
JP6897431B2 (ja) * 2017-08-30 2021-06-30 オムロン株式会社 画像処理装置、設定支援方法、および設定支援プログラム
JP7022544B2 (ja) * 2017-09-13 2022-02-18 キヤノン株式会社 画像処理装置及び方法、及び撮像装置
US10497104B2 (en) 2017-10-24 2019-12-03 Adobe Inc. Empirical exposure normalization
CN108702512B (zh) * 2017-10-31 2020-11-24 深圳市大疆创新科技有限公司 运动估计方法和装置
US10957024B2 (en) 2018-10-30 2021-03-23 Microsoft Technology Licensing, Llc Real time tone mapping of high dynamic range image data at time of playback on a lower dynamic range display
JP6785456B2 (ja) * 2018-11-30 2020-11-18 パナソニックIpマネジメント株式会社 画像処理装置、画像処理方法及びプログラム
US11128809B2 (en) * 2019-02-15 2021-09-21 Samsung Electronics Co., Ltd. System and method for compositing high dynamic range images
JP2020184669A (ja) * 2019-05-07 2020-11-12 シャープ株式会社 画像処理装置、撮像装置、画像処理方法、プログラム
US11004232B2 (en) 2019-07-12 2021-05-11 Mediatek Inc. Method and apparatus for performing object detection according to bounding box distribution that is determined by considering lens configuration
JP7137544B2 (ja) * 2019-09-26 2022-09-14 キヤノン株式会社 画像処理装置および画像処理方法、プログラム
KR20210101941A (ko) * 2020-02-11 2021-08-19 삼성전자주식회사 전자 장치 및 그의 hdr 영상 생성 방법
US11430094B2 (en) 2020-07-20 2022-08-30 Samsung Electronics Co., Ltd. Guided multi-exposure image fusion
US11012630B1 (en) * 2020-09-24 2021-05-18 Panasonic Intellectual Property Management Co., Ltd. Image processor and image processing method
US11778335B2 (en) * 2020-10-23 2023-10-03 Black Sesame Technologies Inc. Generating high dynamic range video using low dynamic range image sensor
US11373281B1 (en) * 2021-02-23 2022-06-28 Qualcomm Incorporated Techniques for anchor frame switching
US11508331B1 (en) * 2021-04-28 2022-11-22 Novatek Microelectronics Corp. Image uniformity compensation device
KR20230043318A (ko) 2021-09-24 2023-03-31 삼성전자주식회사 영상 내 객체를 분류하는 객체 분류 방법 및 장치
CN116452454B (zh) * 2023-04-19 2023-10-03 哈尔滨理工大学 一种基于多分辨率金字塔的色阶映射方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070242900A1 (en) * 2006-04-13 2007-10-18 Mei Chen Combining multiple exposure images to increase dynamic range
CN101815166A (zh) * 2009-02-19 2010-08-25 索尼公司 图像处理设备、相机运动分量计算方法和图像处理程序

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5259040A (en) 1991-10-04 1993-11-02 David Sarnoff Research Center, Inc. Method for determining sensor motion and scene structure and image processing system therefor
ES2258311T3 (es) 1993-06-04 2006-08-16 Sarnoff Corporation Sistema y procedimiento para la estabilizacion electronica de imagenes.
US5973733A (en) 1995-05-31 1999-10-26 Texas Instruments Incorporated Video stabilization system and method
US6097854A (en) 1997-08-01 2000-08-01 Microsoft Corporation Image mosaic construction system and apparatus with patch-based alignment, global block adjustment and pair-wise motion-based local warping
US7084905B1 (en) 2000-02-23 2006-08-01 The Trustees Of Columbia University In The City Of New York Method and apparatus for obtaining high dynamic range images
US7227896B2 (en) 2001-10-04 2007-06-05 Sharp Laboratories Of America, Inc. Method and apparatus for global motion estimation
US7061524B2 (en) 2001-11-13 2006-06-13 The Board Of Trustees Of The Leland Stanford Junior University Motion/saturation detection system and method for synthesizing high dynamic range motion blur free images from multiple captures
US7119837B2 (en) 2002-06-28 2006-10-10 Microsoft Corporation Video processing system and method for automatic enhancement of digital video
US6879731B2 (en) 2003-04-29 2005-04-12 Microsoft Corporation System and process for generating high dynamic range video
US7346109B2 (en) 2003-12-23 2008-03-18 Genesis Microchip Inc. Motion vector computation for video sequences
US7649549B2 (en) 2004-09-27 2010-01-19 Texas Instruments Incorporated Motion stabilization in video frames using motion vectors and reliability blocks
US7489341B2 (en) 2005-01-18 2009-02-10 Primax Electronics Ltd. Method to stabilize digital video motion
US7755667B2 (en) 2005-05-17 2010-07-13 Eastman Kodak Company Image sequence stabilization method and camera having dual path image sequence stabilization
US7894528B2 (en) 2005-05-25 2011-02-22 Yissum Research Development Company Of The Hebrew University Of Jerusalem Fast and robust motion computations using direct methods
US7433514B2 (en) 2005-07-13 2008-10-07 Canon Kabushiki Kaisha Tone mapping of high dynamic range images
US7454136B2 (en) 2005-07-28 2008-11-18 Mitsubishi Electric Research Laboratories, Inc. Method and apparatus for acquiring HDR flash images
US7557832B2 (en) 2005-08-12 2009-07-07 Volker Lindenstruth Method and apparatus for electronically stabilizing digital images
US8014445B2 (en) 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
US8644643B2 (en) 2006-06-14 2014-02-04 Qualcomm Incorporated Convolution filtering in a graphics processor
US8340185B2 (en) 2006-06-27 2012-12-25 Marvell World Trade Ltd. Systems and methods for a motion compensated picture rate converter
WO2008012822A2 (en) 2006-07-26 2008-01-31 Human Monitoring Ltd Image stabilizer
KR101392732B1 (ko) 2007-08-20 2014-05-08 삼성전자주식회사 손떨림에 의한 움직임 추정 장치 및 방법, 그를 이용한영상 촬상 장치
US8750390B2 (en) 2008-01-10 2014-06-10 Microsoft Corporation Filtering and dithering as pre-processing before encoding
US8213706B2 (en) 2008-04-22 2012-07-03 Honeywell International Inc. Method and system for real-time visual odometry
US8406569B2 (en) 2009-01-19 2013-03-26 Sharp Laboratories Of America, Inc. Methods and systems for enhanced dynamic range images and video from multiple exposures
WO2010123923A1 (en) * 2009-04-23 2010-10-28 Zoran Corporation Multiple exposure high dynamic range image capture
KR101614914B1 (ko) * 2009-07-23 2016-04-25 삼성전자주식회사 모션 적응적 고대비 영상 획득 장치 및 방법
US8531535B2 (en) * 2010-10-28 2013-09-10 Google Inc. Methods and systems for processing a video for stabilization and retargeting

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070242900A1 (en) * 2006-04-13 2007-10-18 Mei Chen Combining multiple exposure images to increase dynamic range
CN101815166A (zh) * 2009-02-19 2010-08-25 索尼公司 图像处理设备、相机运动分量计算方法和图像处理程序

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103973958B (zh) * 2013-01-30 2018-04-03 阿里巴巴集团控股有限公司 图像处理方法及设备
CN103973958A (zh) * 2013-01-30 2014-08-06 阿里巴巴集团控股有限公司 图像处理方法及设备
CN103297657B (zh) * 2013-05-14 2016-08-10 李小林 一种基于gpu的视频稳定方法
CN103297657A (zh) * 2013-05-14 2013-09-11 李小林 一种基于gpu的视频稳定方法
CN104349066A (zh) * 2013-07-31 2015-02-11 华为终端有限公司 一种生成高动态范围图像的方法、装置
CN104349066B (zh) * 2013-07-31 2018-03-06 华为终端(东莞)有限公司 一种生成高动态范围图像的方法、装置
CN103413286B (zh) * 2013-08-02 2017-05-03 北京工业大学 一种基于学习的高动态范围与高分辨率图像联合重建方法
CN103413286A (zh) * 2013-08-02 2013-11-27 北京工业大学 一种基于学习的高动态范围与高分辨率图像联合重建方法
CN103413285A (zh) * 2013-08-02 2013-11-27 北京工业大学 基于样本预测的hdr和hr图像重建方法
US10321072B2 (en) 2014-03-13 2019-06-11 Beijing Zhigu Rui Tuo Tech Co., Ltd Image obtaining apparatus and method for obtaining an image based on pixel binning
US9888186B2 (en) 2014-03-13 2018-02-06 Beijing Zhigu Rui Tuo Tech Co., Ltd Image acquisition method and image acquisition apparatus
CN110213459A (zh) * 2014-06-10 2019-09-06 松下知识产权经营株式会社 显示方法和显示装置
CN110213459B (zh) * 2014-06-10 2021-11-30 松下知识产权经营株式会社 显示方法和显示装置
CN106797437A (zh) * 2014-09-25 2017-05-31 英特尔公司 使用多个图像的高动态范围图像合成
US10055872B2 (en) 2014-11-21 2018-08-21 SZ DJI Technology Co., Ltd. System and method of fast adaptive blending for high dynamic range imaging
CN108352076B (zh) * 2015-08-24 2021-09-17 交互数字麦迪逊专利控股公司 编码和解码方法及对应设备
US11070830B2 (en) 2015-08-24 2021-07-20 Interdigital Madison Patent Holdings, Sas Coding and decoding method with color conversion and corresponding devices
CN108352076A (zh) * 2015-08-24 2018-07-31 汤姆逊许可公司 编码和解码方法及对应设备
CN106686320A (zh) * 2017-01-22 2017-05-17 宁波星帆信息科技有限公司 一种基于数密度均衡的色调映射方法
CN106686320B (zh) * 2017-01-22 2019-06-18 宁波星帆信息科技有限公司 一种基于数密度均衡的色调映射方法
US10778894B2 (en) 2017-08-14 2020-09-15 Canon Kabushiki Kaisha Imaging apparatus and control method for the same
CN109391772A (zh) * 2017-08-14 2019-02-26 佳能株式会社 图像模糊校正设备及其控制方法
CN109391772B (zh) * 2017-08-14 2021-12-28 佳能株式会社 图像模糊校正设备及其控制方法
CN107527360B (zh) * 2017-08-23 2019-05-17 维沃移动通信有限公司 一种图像对齐方法及移动终端
CN107527360A (zh) * 2017-08-23 2017-12-29 维沃移动通信有限公司 一种图像对齐方法及移动终端
CN114503541A (zh) * 2019-08-06 2022-05-13 三星电子株式会社 用于多帧融合的有效率的正则化图像对准的装置和方法
CN112243091A (zh) * 2020-10-16 2021-01-19 微创(上海)医疗机器人有限公司 三维内窥镜***、控制方法和存储介质
CN112243091B (zh) * 2020-10-16 2022-12-16 上海微创医疗机器人(集团)股份有限公司 三维内窥镜***、控制方法和存储介质
CN115578255A (zh) * 2022-09-22 2023-01-06 北京航空航天大学 一种基于帧间亚像素块匹配的超分辨率重建方法

Also Published As

Publication number Publication date
US20120218442A1 (en) 2012-08-30
CN102693538B (zh) 2017-03-01
US8711248B2 (en) 2014-04-29

Similar Documents

Publication Publication Date Title
CN102693538A (zh) 生成高动态范围图像的全局对准
CN102741883B (zh) 高动态范围图像生成和渲染
US11558558B1 (en) Frame-selective camera
JP6255063B2 (ja) Hdr画像のための画像処理
Bandoh et al. Recent advances in high dynamic range imaging technology
CN106204474B (zh) 局部多等级色调映射运算器
Banterle et al. High dynamic range imaging and low dynamic range expansion for generating HDR content
WO2020220516A1 (zh) 图像生成网络的训练及图像处理方法、装置、电子设备、介质
WO2017101561A1 (zh) 高动态范围图像的生成方法、拍照装置和终端、成像方法
CN107818553B (zh) 图像灰度值调整方法和装置
Singh et al. Weighted least squares based detail enhanced exposure fusion
CN115115516A (zh) 基于Raw域的真实世界视频超分辨率算法
KR101106910B1 (ko) 큰 스틸 사진 처리 방법 및 디바이스와 컴퓨터 판독가능 저장 매체
Li et al. Efficient visual computing with camera raw snapshots
CN115049559A (zh) 模型训练、人脸图像处理、人脸模型处理方法及装置、电子设备及可读存储介质
Marnerides et al. High Dynamic Range in Cultural Heritage Applications
Guo et al. Efficient high dynamic range video using multi-exposure CNN flow
Sekmen et al. A Compact Multi-Exposure File Format for Backward and Forward Compatible HDR Imaging
Jeevanandham et al. Video Synthesis Strategies for IoRT Environments: Research Challenges and Opportunities
WO2023139395A1 (en) Image compression and reconstruction using machine learning models
CN117115593A (zh) 模型训练方法、图像处理方法及其装置
Ahmad et al. Pragmatic Manifestation of High Dynamic Range Imaging–A Review
Mantiuk High dynamic range imaging: towards the limits of the human visual perception
CN118302789A (zh) 具有低动态范围兼容性的高动态范围图像格式
CN117097983A (zh) 图像处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1174724

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150618

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150618

Address after: Washington State

Applicant after: Micro soft technique license Co., Ltd

Address before: Washington State

Applicant before: Microsoft Corp.

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1174724

Country of ref document: HK