CN111434114B - 处理图像 - Google Patents

处理图像 Download PDF

Info

Publication number
CN111434114B
CN111434114B CN201880077821.1A CN201880077821A CN111434114B CN 111434114 B CN111434114 B CN 111434114B CN 201880077821 A CN201880077821 A CN 201880077821A CN 111434114 B CN111434114 B CN 111434114B
Authority
CN
China
Prior art keywords
correction factor
chrominance
component
components
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880077821.1A
Other languages
English (en)
Other versions
CN111434114A (zh
Inventor
M-J.科莱蒂斯
D.图泽
N.卡拉梅利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
InterDigital VC Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by InterDigital VC Holdings Inc filed Critical InterDigital VC Holdings Inc
Publication of CN111434114A publication Critical patent/CN111434114A/zh
Application granted granted Critical
Publication of CN111434114B publication Critical patent/CN111434114B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6058Reduction of colour to a range of reproducible colours, e.g. to ink- reproducible colour gamut
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20208High dynamic range [HDR] image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

编码能够涉及根据表示用于降低或增加输入图像的亮度分量的动态范围的亮度分量的映射的第一分量、以及表示所述第一分量的逆映射的重构分量,来校正表示所述输入图像的色度的色度分量。还可以获得和传送根据所述至少一个缩放的色度分量的至少一个校正因子。解码能够涉及通过将图像的色度分量乘以取决于所述至少一个校正因子的至少一个校正后的色度校正函数,而获得缩放的色度分量。然后可以根据所述缩放的色度分量、以及取决于理论颜色空间矩阵变换的逆和至少一个校正因子的校正后的矩阵,而导出重构图像的分量。

Description

处理图像
技术领域
至少一个实施例一般涉及视频或图像的处理。
背景技术
本部分旨在向读者介绍本领域的各个方面,这些方面可能与以下描述和/或要求保护的至少一个实施例的各个方面有关。相信该讨论有助于向读者提供背景信息,以促进更好地理解至少一个实施例的各个方面。
高效视频编码(HEVC)标准(ITU-T H.265ITU的电信标准化部门(02/2018),系列H:audiovisual and multimedia systems,infrastructure of audiovisual services-coding of moving video,High efficiency video coding,ITU-T H.265建议书)的出现使得可能部署具有增强观看体验的新视频服务,例如超HD服务。除了提高空间分辨率之外,超HD格式还可以带来比当前部署的高清格式的标准色域(SCG)和标准动态范围(SDR)更宽的色域(WCG)和更高的动态范围(HDR)。已经提出了用于HDR/WCG视频的编码和表示的不同解决方案,例如感知转移函数感知量化器(PQ)(SMPTE ST 2084,“High Dynamic RangeElectro-Optical Transfer Function of Mastering Reference Displays,or Diaz,R.,Blinstein,S.and Qu,S.“Integrating HEVC Video Compression with a High DynamicRange Video Pipeline”,SMPTE Motion Imaging Journal,Vol.125,Issue 1.Feb,2016,pp 14-21)。通常,SMPTE ST 2084允许仅使用10或12比特来表示至多10000cd/m2峰值亮度的HDR视频信号。
SDR与解码和渲染设备的向后兼容性是某些视频分发***(例如广播或多播***)中的重要功能。基于单层编码/解码过程的解决方案可以向后兼容,例如与SDR兼容,并且可以利用已经存在的传统分发网络和服务。
这种基于单层的分发解决方案既可以使能在启用HDR的消费电子(CE)装置上的高质量HDR渲染,又可以使能在启用SDR的CE装置上的高质量SDR渲染。这种解决方案基于编码信号(例如SDR信号)、以及来自解码信号的能用来重构另一信号(例如SDR或HDR信号)的相关联的元数据(通常仅在每个视频帧或场景中使用几个字节)。
在ETSI技术规范TS 103 433-1 V1.2.1(2017年8月)中可以找到基于单层的分发解决方案的示例。这种基于单层的分发解决方案在下文中标注为SL-HDR1。
另外,可能已经部署了HDR分发***(工作流,还有解码和渲染设备)。实际上,存在包括HDR内容的许多全球视频服务提供商。但是,分布式HDR材料可能以与消费者终端设备特性不匹配的格式或特性表示。通常,消费者终端设备使解码后的材料适应其自身的特性。但是,由于与生产环境中用于对原始内容进行分级(grade)的母带显示设备相比的消费者终端设备特性之间的差异,HDR电视中采用的技术的多功能性在演绎(rendition)方面引起了重要差异。对于内容制作者而言,艺术意图的逼真度及其对消费者的演绎至关重要。因此,“显示适配”元数据既可以在分级处理期间的生产阶段生成,也可以在发行之前在质量检查操作员的控制下生成。当解码信号要适应终端设备特性时,元数据使得能够将艺术意图传达到消费者。
可以在ETSI技术规范TS 103 433-2 V.0.0.4(2017年11月)中找到实现显示适配的基于单层的分发解决方案的示例。这种基于单层的分发解决方案在下文中标注为SL-HDR2。
这种基于单层的分发解决方案SL-HDR1或SL-HDR2生成元数据作为用于信号的重构或适配的参数。元数据可以是静态的也可以是动态的。
静态元数据是指表示视频内容或其格式的参数,所述参数例如对于视频(图像集)和/或程序保持不变。
静态元数据对整个视频内容(场景、电影、剪辑...)均有效,并且可能取决于图像内容本身或图像内容的表示格式。静态元数据可以定义例如图像格式、颜色空间、或色域。例如,SMPTE ST 2086:2014“Mastering Display Color Volume Metadata SupportingHigh Luminance and Wide Color Gamut Images”定义了静态元数据,该元数据描述了用于在生产环境中对材料进行分级的母带显示。对于H.264/AVC(“Advanced video codingfor generic audiovisual Services”,系列H:视听和多媒体***,ITU-T H.264建议书,ITU的电信标准化部门,2017年4月)和HEVC视频编解码器两者,母带显示色量(MDCV)SEI(补充增强信息)消息对应于ST 2086。
动态元数据是与取决于内容的信息,使得元数据可以随图像/视频内容而变化,例如对于每个图像或对于每个图像组。例如,SMPTE ST 2094:2016“Dynamic Metadata forColor Volume Transform”定义了通常在生产环境中生成的动态元数据。可以使用例如颜色重映射信息(CRI)SEI消息在HEVC和AVC编码的视频流中分发SMPTE ST 2094-30。
这种基于单层的分发解决方案SL-HDR1或SL-HDR2包括编码阶段和解码阶段。
在编码阶段,通过预处理阶段将传入的HDR视频转换为使用任何传统视频编解码器编码的中间视频和随附(accompanying)元数据,并遍布现有的传统分发网络携带比特流,随附元数据在特定信道上传递或嵌入在比特流中。
在解码阶段,将比特流解码为带有随附元数据的中间视频,它们被馈送到后处理阶段,以生成与传入HDR视频类似的重构HDR视频,然后可用于HDR消费电子(CE)显示。
也可以从中间HDR视频以及从特定信道或从比特流获得的随附元数据来重构另一HDR或SDR视频。
更准确地,在预处理阶段,通过将光电转移函数(OETF)应用于代表传入HDR视频的图像的线性光HDR值,而获得由亮度(luma)分量和两个色度分量表示的图像。所述由亮度(luma)分量和两个色度分量表示的图像然后被编码和传送。
在后处理阶段,从比特流获得解码图像。然后,通过将解码图像的所述两个色度分量乘以取决于解码图像的亮度(luma)的色度校正函数,来对解码图像的两个色度分量进行色度校正。然后导出两个校正的色度分量。
实际上,使用后处理阶段的整数实现。此整数实现固定(fixes)每个内部信号的比特深度,从而固定其精度。
尤其是,色度校正函数是通过颜色校正查找表(LUT)来实现的,所述查找表的内部值以例如11比特(0到2047之间的值)的精度编码,并且两个校正后的色度分量具有例如9比特+符号(-512和511之间的值)的精度。
有时,所述颜色校正LUT的11b精度还不够。这是由于以下事实:所使用的OETF曲线在明亮区域(亮度高时)可能“平坦”。
这种OETF曲线的示例是例如ITU-R Rec.BT.2100中定义的PQ和HLG转移函数。
由于在亮度高时色度校正函数的形状也可能非常平坦,因此这会给两个校正后的色度分量带来较低的精度,并且一些伪像变得可见,例如条带、色块和怪异的色标(绿色和黄色)。
发明内容
以下呈现了至少一个实施例的简化概述,以便提供对至少一个实施例的一些方面的基本理解。该概述不是实施例的广泛概述。其并非旨在标识实施例的关键或重要元素。以下概述仅以简化形式呈现至少一个实施例的一些方面,作为本申请中其他地方提供的更详细描述的序言。
根据至少一个实施例的一般方面,在编码侧,提供了一种用于根据表示用于降低或增加输入图像的亮度分量的动态范围的亮度分量的映射的第一分量、以及表示所述第一分量的逆映射的重构分量、来校正表示所述输入图像的色度的色度分量的方法。还获得和传送根据所述至少一个缩放的色度分量的至少一个校正因子。在解码侧,通过将图像的色度分量乘以取决于所述至少一个校正因子的至少一个校正后的色度校正函数,而获得缩放的色度分量。然后可以根据所述缩放的色度分量、以及取决于理论颜色空间矩阵变换的逆和至少一个校正因子的校正后的矩阵,而导出重构图像的分量。
本实施例中的一个或多个还提供了一种装置,包括:处理器,用于实现所述方法;信号,携带有包括图像数据的比特流;计算机程序,其包括指令,所述指令当由一个或多个处理器执行时,促使所述一个或多个处理器执行以上方法。本实施例中的一个或多个还提供了一种包括指令的计算机可读存储介质,所述指令当由计算机执行时,促使所述计算机执行以上方法。
通过以下结合附图对示例的描述,至少一个实施例的特定性质以及至少一个实施例的其他目的、优点、特征和用途将变得显而易见。
附图说明
在附图中,图示了至少一个实施例的示例。其示出了:
-图1示出了根据至少一个实施例的用于显示图像/视频的支持内容输送的端到端工作流的高级表示;
-图2示出了根据基于单层的分发解决方案的支持向HDR和SDR CE显示器的输送的图1的端到端工作流的示例;
-图3示出了感知转移函数的示例的图示;
-图4示出了用于映射的分段曲线的示例;
-图4a示出了用于将感知统一信号变换为线性光域的曲线的示例;
-图5图示了其中实现各个方面和实施例的***的示例的框图;
-图6示出了根据第一实施例的用于在预定时间段内收集每个校正因子的值的方法的框图;和
-图7示出了根据第二实施例的用于在预定时间段内收集每个校正因子的值的方法的框图。
用相同的附图标记指代相似或相同的元素。
具体实施方式
在下文中,参考附图更全面地描述至少一个实施例,在附图中示出了至少一个实施例的示例。然而,实施例可以以许多替代形式来体现,并且不应被解释为限于在此阐述的示例。因此,应当理解,无意将实施例限制为所公开的特定形式。相反,本公开旨在覆盖落入由权利要求限定的本申请的精神和范围内的所有修改、等效形式、和替代形式。
本文所使用的术语仅出于描述特定示例的目的,并不旨在进行限制。如本文所使用的,单数形式“一”、“一个”和“该”也意图包括复数形式,除非上下文另外明确指出。将进一步理解的是,术语“包含”和/或“包括”当在本说明书中使用时,指定存在例如所陈述的特征、整数、步骤、操作、元件和/或组件,但不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。此外,当元件被称为“响应”或“连接”到另一元件时,它可以直接响应或连接到另一元件,或者可以存在居间元件。相反,当元件被称为“直接响应”或“直接连接”到其他元件时,不存在居间元件。如本文所使用的,术语“和/或”包括一个或多个相关联的所列项目的任何和所有组合,并且可以缩写为“/”。将理解的是,尽管在本文中可以使用术语第一、第二等来描述各种元件,但是这些元件不受这些术语的限制。这些术语仅用于区分一个元件和另一元件。例如,在不脱离本申请的教导的情况下,第一元件可以被称为第二元件,并且类似地,第二元件可以被称为第一元件。尽管一些图在通信路径上包括箭头以示出通信的主要方向,但是应当理解,通信可以在与所描绘的箭头相反的方向上发生。关于框图和操作流程图描述了一些示例,其中每个框代表电路元件、模块或代码的一部分,其包括用于实现(多个)指定的逻辑功能的一个或多个可执行指令。还应该注意的是,在其他实现方式中,在方框中标注的(多个)功能可以不按所指示的顺序发生。例如,取决于所涉及的功能,实际上可以基本上并发执行连续示出的两个框,或者有时可以以相反的顺序执行这些框。本文中提及“根据示例”或“在示例中”是指结合示例所描述的特定特征、结构或特性可以被包括在至少一个实现方式中。在说明书中的各个地方出现“根据示例”或“在示例中”的表述不一定全部指的是同一示例,也不是必须与其他示例相互排斥的单独或替代示例。出现在权利要求中的附图标记仅是说明性的,并且不应对权利要求的范围具有限制作用。尽管没有明确描述,但是可以按照任何组合或子组合来采用本示例和变型。
在下文中,图像数据是指特定图像/视频格式的数据,例如,一个或几个样本的阵列(例如,像素值),其指定与图像(或视频)的像素值有关的信息和/或例如显示器和/或任何其他设备可以用来可视化和/或解码图像(或视频)的信息。图像通常包括以第一样本阵列的形式的第一分量,通常代表图像的亮度(或luma),以及以其他样本阵列的形式的第二分量和第三分量,通常代表图像的色度(或chroma)。一些实施例使用颜色样本阵列的集合来表示相同信息,例如传统的三色RGB表示。
在一个或多个实施例中,像素值由C值的向量表示,其中C是分量的数目。向量的每个值通常用多个比特表示,这些比特可以定义像素值的动态范围。
标准动态范围图像(SDR图像)是这样的图像,其亮度值通常用比高动态范围图像(HDR图像)更少数目的比特(通常为8)来表示。因此,SDR和HDR图像的动态范围之间的差异是相对的,并且SDR图像可以具有例如多于8比特。由于较小的比特数目,因此SDR图像通常不允许正确渲染小信号变化,或者不能覆盖高范围的亮度值,尤其是在黑暗和明亮的亮度范围内。在HDR图像中,通常会扩展信号表示,以在其全部或部分范围内保持较高的信号精度。例如,至少一个实施例使用用于亮度的10比特来表示HDR图像,并提供比8比特表示多4倍的值。附加值允许表示较大的亮度范围,并且还可以允许表示较精细的亮度差。在HDR图像中,像素值通常以浮点格式(通常每个分量至少10比特,即浮点或半浮点)表示,最流行的格式是openEXR半浮点格式(例如,每个像素48比特),或以长表示形式的整数,通常在对信号进行线性光编码时至少为16比特(例如,在使用建议ST 2084非统一编码时至少为10比特)。
通常,两个不同的图像具有不同的亮度动态范围。图像亮度的动态范围是图像亮度值的最大值与最小值之比。
通常,当图像亮度的动态范围低于1000(例如500:例如,100cd/m2相对于0.2cd/m2)时,该图像标注为标准动态范围(SDR)图像,并且当图像亮度的动态范围等于或大于1000(例如10000:例如1000cd/m2相对于0.1cd/m2)时,该图像被标注为HDR图像。亮度以每平方米的坎德拉(candela)(cd/m2)的单位表达。该单位取代也可以使用的术语“尼特”。
描述了用于预处理、编码、解码和后处理图像的至少一个实施例,但是由于图像(视频)序列的每个图像被顺序地预处理、编码、解码和后处理,所以扩展到预处理、编码、解码和后处理该序列。
在下文中,分量指定图像n的分量m。这些分量/>其中m=1,2,3,以特定图像格式表示图像In。通常,图像格式的特征在于颜色量(例如色度和动态范围)和颜色编码***(例如RGB、YCbCr……)。
图1示出了根据至少一个实施例的用于显示图像/视频的支持内容输送的端到端工作流的高级表示。
图1包括设备A1、A2和A3。
远程设备A1和A2在分发网络NET上通信,所述分发网络NET至少被配置为从设备A1向设备A2提供比特流。
根据示例,分发网络NET可以是广播网络,适于将静止图像或视频图像从设备A1广播到多个设备A2。基于DVB和基于ATSC的网络是这种广播网络的示例。
根据另一示例,分发网络NET可以是适于将静止图像或视频图像从设备A1输送到多个设备A2的宽带网络。基于互联网的网络、GSM网络、或基于IP的电视网络是此类宽带网络的示例。
在替代实施例中,分发网络NET可以由其上存储有编码图像或视频流的物理封装介质代替。
例如,物理封装介质包括例如蓝光盘和超高清蓝光盘的光学封装介质、以及例如在OTT和VoD服务中使用的基于存储器的封装介质。
设备A1包括至少一个装置,被配置为预处理输入图像/视频,并且在传送的比特流中编码图像/视频以及由所述预处理产生的相关联的格式化的元数据。
设备A2包括至少一个装置,被配置为从接收到的比特流中解码图像/视频,并且通过未压缩的数字接口(例如,HDMI或显示端口)将所述解码的图像/视频和相关联的格式化的元数据传送到设备A3。
设备A3包括至少一个装置,被配置为接收从比特流获得的解码的图像/视频和相关联的格式化的元数据。在设备A3中包括的至少一个装置i还可以被配置为通过解析所述相关联的格式化的元数据来获得参数,通过使用所述参数对(从设备A2接收的)解码图像/视频进行后处理来重构另一图像/视频。
设备A1、A2和A3的至少一个装置可以属于这样的装置的集合,包括例如移动装置、通信装置、游戏装置、平板(或平板电脑)、诸如膝上型计算机、静止图像相机、视频相机、编码芯片、静止图像服务器、和视频服务器(例如,广播服务器、视频点播服务器、或Web服务器)之类的计算机装置、计算机装置、机顶盒、电视机(或电视)、平板(或平板计算机)、显示器、头戴式显示器、和渲染/显示芯片。
元数据的格式可以根据取决于数据编码的所传送的比特流的格式而不同。通常,可以在诸如CTA-861-G中指定的未压缩接口(例如,作为扩展的infoFrame)上提取并传递从所传送的比特流获得的元数据。通常,当在HEVC比特流内传递编码的图像/画面时,元数据可以被嵌入在HEVC SEI消息中。例如,这样的SEI消息可以在ETSI TS 103 433-1的附录A中定义。当在AVC比特流中传递时,元数据可以如ETSI TS 103 433-1的附录B中所定义的被嵌入在AVC SEI消息中。
至少一个实施例的范围可以不限于HEVC或AVC格式的SEI消息,而是可以扩展到涵盖与SEI消息具有相同意图的任何消息,例如AVS2(第二代音频视频标准,GY/T 299.1-2016或IEEE P1857.4第1部分)中定义的“扩展数据”。
通常,在未压缩的数字接口上传送的数据中不存在指示与解码的图像/视频关联的格式化的元数据是否符合特定SEI消息的格式(即符合AVC/H.264或HEVC/H.265格式)的信令。
因此,当利用相关联的和解码的图像/视频流通过未压缩的接口承载以特定格式传输的元数据时,设备A3无法标识那些元数据的格式。例如,设备A3无法确定元数据的格式承载在AVC SEI消息还是HEVC SEI消息上。由于设备A3可能假定要解析的特定格式而未根据所述特定格式对元数据进行格式化,因此这可能创建互操作性问题。然后,解析的元数据可能会完全损坏并且无法使用,或者如果使用解析的元数据,则可能会从接收到的解码图像/视频和那些更改的元数据中重构很不一样的图像/视频。
一种直接的方案可以是将元数据的格式固定为唯一的预定格式。这可以被设置为利益相关者遵循的建议或指南文件。但是,这意味着,如果元数据的格式化不是固定的,则在设备A2中将发生转变/变换机制,以使元数据的格式化适配未压缩接口上承载的预期格式化。这需要在设备A2中进行额外的处理,这与通过未压缩的接口直接传送格式化的元数据的最初意图相反。如果未操作格式变换,则元数据运输会中断。
另一种方案可以是发信号通知元数据的格式化,以使设备A3可以响应于该信令信息来操作解析。例如,这可以在CTA-861-G规范的规范修订版或修改版中实现。但是,该方案可能需要更新指定设备A3(也称为信宿装置)和设备A2(也称为信源装置)之间的运输的每个规范或文档或产品。
根据至少一个实施例,提供了一种设备A3中包括的装置,该装置被配置为将接收到的格式化的元数据的有效载荷的第一比特集与标识所述接收到的格式化的元数据的特定格式的至少一个给定的第二比特集进行比较,并根据与所述格式化的元数据相关联的图像数据、和通过根据从所述比较结果所标识的特定格式来解析所述接收的格式化的元数据而获得的参数,来重构图像/视频。
然后,这样的装置通过比较比特集,来确定/标识在未压缩的接口上承载的要解析的元数据的格式。
该解决方案是高效的实现方式,因为它涉及的逻辑少、比较少,并且被包含在解析处理的一开始。该解决方案需要较小的固件更新(CE友好),并且与现有的接口规范兼容,从而避免所述(多个)规范的任何更新/修改。
图2示出了根据基于单层的分发解决方案的支持向HDR和SDR CE显示器的输送的图1的端到端工作流的示例。图2中未明确示出图1的端到端工作流的分发和解析部分。
这种基于单层的分发解决方案可以解决SDR直接向后兼容性。也就是说,该解决方案利用已经存在的SDR分发网络和服务,并使能在启用HDR的CE装置上的高质量的HDR渲染,包括在SDR CE装置上的高质量的SDR渲染。
SL-HDR1是这种基于单层的分发解决方案的一个示例。
这种基于单层的分发解决方案还可以涉及在分发网络上使用的解决方案,针对所述分发网络输送显示适配动态元数据。例如,这可以允许内容适配用户的显示特性。例如,动态元数据可以与PQ HDR视频信号一起输送。PQ意味着ITU-R BT.2100建议书“Recommendation ITU-R BT.2100-1,Image parameter values for high dynamic rangetelevision for use in production and international programme exchange”中规定的“感知量化”。
图2所示的工作流涉及具有关联的SL-HDR元数据的基于单层的分发解决方案。这样的方法图示了用于重构表示输入图像的三个分量的三个分量/>的方法的使用示例。这样的重构基于例如在SL-HDR1或SL-HDR2中规定的表示解码图像和元数据的三个解码分量/>
信息数据ID确定使用基于单层的分发解决方案(例如SL-HDR1或SL-HDR2)中的哪一个。通常,在实践中,可以仅使用一个基于单层的分发解决方案,并且信息数据ID可以是给定(预定)值。如果可以使用多于一个基于单层的分发解决方案,则信息数据ID可以指示使用这些基于单层的分发解决方案中的哪一个。
通常,可以使用SL-HDR1和SL-HDR2,并且信息数据ID指示必须使用SL-HDR1还是SL-HDR2。
如所示的,图2所示的基于单层的分发解决方案包括预处理步骤20、编码步骤23、解码步骤25和26、以及后处理步骤28。
预处理步骤20的输入和输出分别是分量和/>的三元组,而后处理步骤28的输入和输出分别是分量/>和/>的三元组。
图2所示的基于单层的分发解决方案可以包括可选的格式适配步骤21、22、27、29,以使得三个分量的格式适配将应用于这些分量的进一步处理的输入。
例如,在步骤21中,三个分量的格式可以适配与预处理步骤20的输入格式或编码步骤23的输入格式相符的格式。在步骤22(可选),三个分量/>的格式可适配与编码步骤23的输入格式相符的格式。
在步骤27(可选)中,三个分量的格式可以适配与后处理步骤28的输入相符的格式,并且在步骤29中,三个分量/>的格式可以适配可以根据目标设备30(例如机顶盒、连接的电视、使能HDR/SDR的CE装置、超高清蓝光盘播放器)的至少一个特性定义的格式。
格式适配步骤(21、22、27、29)可以包括颜色空间变换和/或色域映射(和/或逆色域映射)。例如,当三个解码分量和输出图像的三个分量/>或输入图像的三个分量/>在不同的颜色空间和/或色域中表示时,可以使用逆色域映射。
可以使用通常的格式适配处理,例如R'G'B'到Y'CbCr或Y'CbCr到R'G'B'变换、BT.709到BT.2020或BT.2020-到BT.709、下采样或上采样色度分量等。
例如,SL-HDR1可以使用ETSI技术规范TS 103 433-1V1.2.1(2017年8月)的附录D中规定的格式适配处理和逆色域映射。
输入格式适配步骤21还可以包括例如通过对三个分量施加诸如PQ或HLG转移函数或其逆的转移函数,而将三个分量/>的比特深度适配为诸如10比特的比特深度。建议书ITU-R BT.2100提供了此类转移函数的示例。
在预处理步骤20中,将三个输入分量分解为三个分量/>和由来自步骤21、200、201、203和/或204的参数形成的参数集SP。在步骤22期间,可以可选地适配三个分量/>的格式,以获得三个分量/>切换步骤24确定三个分量/>等于三个分量还是等于三个分量/>
在步骤23中,可以用任何视频编解码器对三个分量进行编码,并且输出是包括比特流B的信号。输出信号可以遍布整个分发网络承载。
根据步骤23的变型,参数集SP和/或信息数据ID可以作为相关联的静态和/或动态元数据在比特流B中或在带外(例如,使用SIP或H.323协议,不是在比特流B中,而是作为接收方已知的预定值或作为另一通信信道上的另一流的一部分)传递。
根据变型,参数集SP和/或信息数据ID可以作为关联的静态和/或动态元数据在特定信道上传递。
旨在由图1的设备A2解码的至少一个信号承载可以包括随附的元数据的比特流B。
在变型中,例如,比特流B被存储在诸如(超高清)蓝光盘或硬盘或机顶盒的存储器的存储介质上。
在变型中,至少一些随附的相关联的元数据被存储在例如(超高清)蓝光盘或硬盘或机顶盒的存储器的存储介质上。
在至少一个实现方式中,在步骤23中,利用视频编解码器(例如,H.265/HEVC编解码器或H.264/AVC编解码器)对分量的至少一个三元组的序列(每个分量表示图像)以及可能的关联的元数据进行编码。
在步骤25中,至少部分地从比特流B或从另一特定信道获得参数集SP。该参数集SP中的至少一个参数也可以从单独的存储介质中获得。
在步骤26中,从比特流B获得三个解码分量
后处理步骤28是预处理步骤20的功能逆,或者基本上是功能逆。在后处理步骤28中,从三个解码分量和获得的参数集SP重构三个分量/>
更详细地,预处理步骤20包括步骤200-204。
在步骤200中,通过在三个分量的分量/>上应用映射函数,来获得分量分量/>表示输入图像的亮度。
从数学上讲,
其中MF是可以减少或增加图像亮度的动态范围的映射函数。注意,其逆标注为IMF,可以分别增加或减小图像亮度的动态范围。
在步骤202中,通过在分量上应用逆映射函数,而获得重构分量/>
其中IMF是映射函数MF的功能逆。因此,重构分量的值属于该分量/>的值的动态范围。
在步骤201中,通过根据分量和重构分量/>校正表示输入图像的色度的分量/>和/>来导出分量/>和/>
该步骤201允许控制从三个分量获得的颜色,并且允许对输入图像的颜色进行感知匹配。可以通过调整色度校正和逆映射步骤的参数,来维持分量/>和/>(通常标注为色度分量)的校正处于控制之下。因此,从这三个分量/>获得的颜色饱和度和色相可以处于控制之下。通常,当使用非参数化映射函数(步骤200)时,这种控制是不可能的。
在步骤204中,可以根据分量(或相应地分量/>)获得至少一个校正因子CFU(或相应地CFV)。
根据实施例,对于分量的每个值/>
如果
否则
CFU=fct(CFU(i),CFU)
如果
否则
CFV=fct(CFV(i),CFV)
其中MaxValU=MaxValV=511,而fct(.)是表示当前计算的校正因子CFU(i)(相应地CFV(i))和当前参考校正因子CFU(相应地CFV)之间的依赖关系的函数。
根据实施例,函数fct(.)是当前计算的校正因子CFU(i)(相应地CFV(i))和当前参考校正因子CFU(相应地CFV)之间的最大化函数。
根据实施例,针对色度分量的当前像素i的邻居获得校正因子CFU(相应地CFV),并然后通过对所述校正因子进行过滤,来获得针对所述当前像素的校正因子CFU(相应地CFV)。
例如,针对当前像素的的校正因子CFU(相应地CFV)是针对邻居计算的的校正因子CFU(相应地CFV)的平均值。
根据所述变型的实施例,考虑空间邻居,并且根据另一实施例,考虑时间邻居。
在变型中,也可以考虑空间和时间邻居两者。
根据实施例,计算针对分量(相应地/>)的像素所计算的校正因子CFU(相应地CFV)的不同值的直方图。
使用直方图允许检测由于分量中存在的噪声而可能不规律出现的校正因子的一些高值。在那种情况下,不需要在所有像素上应用所述校正因子的对应的高值。可以通过从最高仓(bin)开始对直方图中存在的仓的数目进行计数来强制所述校正因子的值的固定最小计数,而估算所述校正因子的一致值。
根据实施例,使用单个校正系数CF。例如,CF等于校正因子CFU和校正因子CFV的最大值或平均值。
可选地,在步骤203中,可以调整分量以进一步控制感知的饱和度,如下:
其中a和b是两个参数。
该步骤203允许控制亮度(由分量表示)以允许从三个分量/>获得的颜色(饱和度和色相)与输入图像的颜色之间的感知颜色匹配。
参数集SP可以包括与映射函数或其逆有关的信息数据(步骤200、202和282)、与色度校正有关的信息数据(步骤201、204和281)、与至少一个校正因子(CFU、CFV或CF)有关的信息、与饱和度调整函数有关的信息数据(特别是它们的参数a和b(步骤203))、和/或与在格式适配阶段21、22、27、29使用的可选变换有关的信息(例如,色域映射和/或逆色域映射参数)。
根据实施例,与至少一个校正因子(CFU、CFV或CF)有关的所述信息数据可以定义所述至少一个校正因子(CFU、CFV或CF)和理论颜色空间变换矩阵的逆A-1的系数。
理论颜色空间变换矩阵的逆A-1可以由下式给出:
其中mi i=0,1,2,3通常标注为矩阵A-1的理论系数。
例如,该矩阵A-1可以是ITU-R Rec.BT.2020中规定的典型3x3RGB到YUV变换矩阵A的逆矩阵。矩阵A=[A1A2A3]T可以是典型3x3RGB到YUV变换矩阵,A1A2A3是1x3矩阵。然后矩阵A-1由下式给出:
当在ITU-R Rec.BT.709中规定时,矩阵A-1由下式给出:
根据所述实施例,在步骤23中,可以通过元数据来传递校正因子CFU和CFV、或单个校正系数CF、以及矩阵A-1的系数。
根据实施例,与至少一个校正因子(CFU、CFV或CF)有关的信息数据可以定义校正后的矩阵Ac-1的系数。
校正后的矩阵Ac-1是矩阵A-1的校正后的版本,其是根据至少一个校正因子CFU、CFV或通过单个校正因子CF所校正的矩阵A-1的理论系数。
根据步骤23的所述实施例的变型,校正矩阵Ac-1可以由下式给出:
其中m′i是通过将矩阵A-1的理论系数mi除以校正因子CFU或CFV而获得的矩阵Ac-1的系数。
根据步骤23的实施例的变型,校正矩阵Ac-1然后由下式给出:
其中m′i是通过将矩阵A-1的理论系数mi除以校正因子CF而获得的矩阵Ac-1的系数。
根据所述实施例,在步骤23中,可以通过用于所传递的校正矩阵Ac-1的系数的元数据,来传递校正因子CFU和CFV或单个校正系数CF(技术规范ETSI TS 103 433-1 V1.2.1的条款6.3.2.6和附录A.2.3.2.6)。
然后,在步骤23中,生成用于传递校正因子CFU和CFV或单个校正系数CF的元数据、以及矩阵A-1的系数或校正后的矩阵Ac-1的系数,并将其添加到比特流B。
注意,解码器所需的其他元数据也可以由比特流B或任何其他比特流来传递,诸如相对于色原和/或色域的定义的元数据。
该参数集SP还可以包括输出图像的信息数据ID和信息特性,例如代表输出图像的三个分量的格式(图2的步骤29、284)。
更详细地,后处理步骤28包括步骤280-282,其取参数集SP中的至少一个参数作为输入。
在可选步骤280中,可以如下调整三个分量中的分量/>(步骤27的输出):
其中a和b是参数集SP中的两个参数。
例如,当信息数据ID指示必须考虑SL-HDR1时,执行步骤280,而当信息数据ID指示必须考虑SL-HDR2时,不执行步骤280。
在步骤282中,通过在分量上应用映射函数,而获得三个分量/>的分量
或者,可选地,
其中MF1是从参数集SP中的至少一个参数导出的映射函数。
在步骤281中,可以通过将三个分量中的分量/>乘以取决于分量/>(或可选地/>)的至少一个校正后的色度校正(缩放)函数,而导出三个分量/>中的分量/>
根据实施例,色度校正函数β(.)被实现为例如由技术规范ETSI TS 103 433-1V.1.2.1的条款7.2.3.2(2017年8月)所定义的1D查找表lutCC。
根据实施例,可以通过将色度校正函数β(.)乘以至少一个校正因子CFU、CFV或CF,而导出所述至少一个校正后的色度校正函数。
根据实施例,在步骤281中,通过将色度校正函数β(.)乘以校正因子CFU而获得校正后的色度校正函数βcu(.),并且通过将色度校正函数β(.)乘以校正因子CFV而获得校正后的色度校正函数βcv(.)。然后从校正后的色度校正函数βcu(.)导出分量并然后从校正后的色度校正函数βcv(.)导出分量/>
从数学上讲,这些分量由下式给出:
或者可选地,
/>
校正后的色度校正函数βcu(.)、βcv(.)允许独立控制由这些分量形成的图像的色度分量,并保证它们与由这些分量/>形成的图像的颜色匹配。
根据实施例,在步骤281中,通过将色度校正函数β(.)乘以单个校正因子CF,来获得单个校正后的色度校正函数βc(.)。
然后从校正后的色度校正函数βc(.)中导出分量和/>
从数学上讲,这些分量由下式给出:
或者可选地,
校正后的色度校正函数βc(.)允许控制由这些分量形成的图像的颜色,并保证它们与由这些分量/>形成的图像的颜色匹配。
在步骤283中,通过考虑参数集SP的参数,而从分量和/>(步骤281的输出)中获得标注为(R1,G1,B1)的三个分量:
其中,m′i i=0,1,2,3是从作为元数据在比特流B中承载的信息数据中获得的校正矩阵Ac-1的系数,并且S0是从也作为元数据在比特流B中的承载的分量和/>以及参数集SP中的其他参数导出的。
使用校正后的矩阵Ac-1补偿在色度校正函数β(.)上应用的校正。
根据实施例,从定义至少一个校正因子CFU、CFV或CF的信息数据以及理论颜色空间变换矩阵的逆A-1的系数中获得校正矩阵Ac-1的系数m′i
根据所述实施例的变型,校正矩阵Ac-1可以由下式给出:
其中m′i是通过将矩阵A-1的理论系数mi除以校正因子CFU或CFV而获得的矩阵Ac-1的系数。
根据实施例的变型,校正矩阵Ac-1然后由下式给出:
/>
其中m′i是通过将矩阵A-1的理论系数mi除以校正因子CF而获得的矩阵Ac-1的系数。
根据实施例,从定义校正矩阵Ac-1的所述系数的信息数据,获得校正矩阵Ac-1的系数。
在步骤284中,然后通过根据分量(步骤282的输出)缩放三个分量(R1,G1,B1)来获得三个分量/>
根据图2的端到端工作流的第一实施例,信息数据ID指示必须考虑SL-HDR1。
等式(1)中的映射函数MF(.)减小输入图像的亮度的动态范围,等式(2)中的它的逆IMF(.)增加分量的动态范围,而等式(5)中的映射函数MF1(.)增加分量/>的动态范围。
根据第一实施例的第一变型,该分量是非线性信号,在文献中标注为luma,其是通过下式从输入图像的伽玛压缩的RGB分量获得的(步骤21):
其中γ可以是伽玛因子,在某些实现中可能等于2.4。
根据第一变型,通过对输入图像的RGB分量施加伽玛压缩,而获得分量(步骤21):
在步骤201中,根据第一变型,通过下式从分量与伽玛压缩的重构分量/>的乘积之间的比率,来校正分量/>和/>
其中是取决于分量/>的值,但也可以是取决于三个分量/>的原色的恒定值。例如对于Rec.BT.2020,/>可能等于1.2。可能地,/>还可取决于ETSI TS 103 433-1 V.1.2.1条款C.1.2和C.2.3中规定的参数。/>也可以是参数集SP中的参数。
此外,根据第一变型,三个分量可以表示Y'CbCr 4:2:0伽玛转移特性视频信号。/>
例如,可以如条款C.3.2(ETSI技术规范TS 103 433-1 V1.2.1)中规定的那样,来确定相对于映射函数MF和/或其逆IMF和/或映射函数MF1(.)的控制参数。可以如条款C.2.3和C.3.4(ETSI技术规范TS 103 433-1 V1.2.1)中规定的那样,来确定色度校正函数β(.)及其参数。与控制参数有关的信息数据、与映射函数或其逆有关的信息数据、以及与色度校正函数β(.)及其参数有关的信息数据、与校正因子CFU和CFV或单个校正系数CF有关的信息数据是参数集SP中的参数。例如,可以在附录F(ETSI技术规范TS 103 433-1 V1.2.1的表F.1)中找到参数集SP的参数的数值的示例。
可以如ETSI技术规范TS 103 433-1 V1.2.1的第6.3.2.6条(matrixCoefficient[i])和第6.3.2.8条(使用kCoefficient[i]来构造S0)规定的那样,来确定矩阵A-1的系数mi和S0,并可以如同第7.2.4条(ETSI技术规范TS 103 433-1 V1.2.1)中规定的那样来确定其重构用途。
根据第一实施例的第二变型,该分量是通过下式从输入图像I1的RGB分量获得的线性光亮度分量L:
根据第二变型,通过对输入图像I1的RGB分量施加伽玛压缩,来导出分量(步骤21):
根据第二变型,通过根据第一分量与伽玛压缩的重构分量/>和/>的乘积之间的比率校正分量/>和/>而导出分量/>(步骤201)。
其中是取决于分量/>的值,并且可能从ETSI TS 103 433-1V.1.2.1条款C.1.2和C.3.4.2中规定的参数中获得,其中在等式(22)中/>
也可以是参数集SP中的参数。
此外,根据第二变型,三个分量可以表示Y'CbCr 4:2:0伽玛转移特性视频信号。
例如,可以如条款C.3.2(ETSI技术规范TS 103 433-1 V1.2.1)中规定的那样,来确定与映射函数MF和/或其逆IMF和/或映射函数MF1(.)有关的控制参数。可以如条款7.2.3.2(ETSI技术规范TS 103 433-2 V.0.0.4)等式(25)中规定的那样确定色度校正函数β(.)及其参数,其中fsgf(Yn)=1。与控制参数有关的信息数据、与校正因子CFU、CFV或CF有关的信息、与映射函数或其逆有关的信息数据、以及与色度校正函数β(.)及其参数有关的信息数据是参数集SP的参数。
可以如ETSI技术规范TS 103 433-1 V1.2.1的第6.3.2.6条(matrixCoefficient[i])和第6.3.2.8条(使用kCoefficient[i]来构造S0)规定的那样,来确定矩阵A-1的系数mi和S0。可以如第7.2.4条(ETSI技术规范TS 103 433-1 V1.2.1)中规定的那样,来确定用于重构的参数的用途。
根据图2的端到端工作流的第二实施例,信息数据ID指示必须考虑SL-HDR2。
在第二实施例中,这三个分量可以表示为Y'CbCr 4:4:4全范围PQ10(PQ 10比特)视频信号(在ITU-R BT.2100建议书中规定)。提供三个分量/>其表示从三个分量计算出的PQ 10比特图像数据和(多个)关联参数(通常为10、12或16比特)。使用例如HEVC Main 10简档编码方案,对所提供的分量进行编码(步骤23)。那些参数被设置到参数集SP。
根据变型,等式(5)中的映射函数MF1(.)可以增加或减小分量的动态范围。
例如,当所连接的HDR CE显示器的峰值亮度高于内容的峰值亮度时,映射函数MF1(.)会增加动态范围。当所连接的HDR或SDR CE显示器的峰值亮度低于内容的峰值亮度时,映射函数MF1(.)会减小动态范围。例如,峰值亮度可以是参数集SP中的参数。
例如,可以如条款C.3.2(ETSI技术规范TS 103 433-1 V1.2.1)中规定的那样,来确定与映射函数MF1有关的控制参数。可以如条款7.2.3.2(ETSI技术规范TS 103 433-2V.0.0.4)等式(25)中规定的那样,来确定色度校正函数β(.)及其参数,其中fsgf(Yn)=1。与控制参数有关的信息数据、与映射函数有关的信息数据、以及与色度校正函数β(.)及其参数有关的信息数据、与校正因子CFU和CFV或单一校正系数CF有关的信息是参数集SP的参数。例如,可以在附录F(表F.1)(ETSI技术规范TS 103 433-2 V.0.0.4)中找到参数集SP的参数的数值的示例。
可以如第7.2.4条(ETSI技术规范TS 103 433-2 V.0.0.4)中规定的那样,确定矩阵A-1的系数mi(在ETSI技术规范TS 103 433-2 V.0.0.4中由matrixCoefficient[i]定义)和S0(在ETSI技术规范TS 103 433-2 V.0.0.4中用kCoefficient[i]构造)。
根据第二实施例的第一变型,表示输出图像的三个分量是三个分量/>
根据第二实施例的第二变型,在后处理步骤28中,在解码(步骤25)之后根据三个分量和参数集SP的参数来重构三个分量/>
这三个分量可用于启用SDR或HDR的CE显示器。如上所述,可能适配(步骤29)三个分量/>的格式。
映射函数MF(.)或MF1(.)基于感知转移函数。感知转移函数的目标是将输入图像的分量变换为输出图像的分量,从而减小(或增大)其亮度值的动态范围。因此,输出图像的分量的值属于比输入图像的分量的值更低(或更大)的动态范围。感知转移函数使用控制参数的有限集合。
图3示出了可以用于映射亮度分量的感知转移函数的示例的图示,但是可以使用用于映射亮度分量的类似的感知转移函数。该映射由母带显示峰值亮度参数(在图3中等于5000cd/m2)控制。为了更好地控制黑白电平,应用取决于内容的黑白电平之间的信号延伸。然后,使用由三部分组成的分段曲线来映射变换后的信号,如图4所示。下部和上部是线性的,陡度分别由阴影增益(shadowGain)控制和高亮增益(HighlightGain)控制参数确定。中间部分是抛物线,其提供两个线性部分之间的连续且平滑的桥梁。交叉处的宽度由中色调宽度调整因子(midToneWidthAdjFactor)参数确定。例如,可以通过使用ETSI TS 103 433-1附录A.2元数据中规定的SEI消息,传递控制映射的所有参数作为元数据。
图4a示出了感知转移函数TM(图3)的逆的示例,以图示如何基于目标传统显示最大亮度(例如100cd/m2)将感知优化的亮度信号变换回线性光域。
在步骤25(图2)中,获得参数集SP,以从三个分量重构三个分量/>可以从自比特流(例如比特流B)获得的元数据获得这些参数。
ETSI TS 103 433-1 V1.2.1第6条和附录A.2提供了元数据的语法的示例。描述了用于从SDR视频重构HDR视频的该ETSI建议的语法,但是该语法可以扩展到从任何解码的分量重构任何图像。作为示例,TS 103 433-2 V.0.0.4使用相同的语法,用于从HDR视频信号(具有不同的动态范围)重构显示适配的HDR视频。
根据ETSI TS 103 433-1 V1.2.1,可以根据所谓的基于参数的模式或基于表的模式,来传递动态元数据。基于参数的模式对于分发工作流可能是令人感兴趣的,分发工作流的目标是,例如提供直接SDR向后兼容的服务,该服务具有非常低的额外有效载荷或带宽使用量,用于承载动态元数据。对于配备有低端终端的工作流,或者当需要更高级别的适配用于正确表示HDR和SDR流两者时,基于表的模式可能会引起人们的兴趣。在基于参数的模式下,要传递的动态元数据包括表示要在后处理步骤应用的逆映射函数的亮度映射参数,即tmInputSignalBlackLevelOffset;tmInputSignalWhiteLevelOffset;shadowGain;HighlightGain;midToneWidthAdjFactor;tmOutputFineTuning参数。
此外,要传递的其他动态元数据包括颜色校正参数(saturationGainNumVal、saturationGainX(i)和saturationGainY(i)),这些参数用于微调默认色度校正函数β(.),如ETSI TS 103 433-1 V1.2.1条款6.3.5和6.3.6中规定的那样。如上所述,参数a和b可以分别承载在saturationGain函数参数中。可以使用例如HEVC SL-HDR信息(SL-HDRI)用户数据注册的SEI消息(请参阅ETSI TS 103 433-1 V1.2.1附录A.2)或另一扩展数据机制(诸如在AVS2/IEEE1857.4规范中指定),来传递这些动态元数据。每个画面或场景的典型动态元数据有效载荷尺寸小于100字节。
返回图2,在步骤25中,对SL-HDRI SEI消息进行解析,以获得参数集SP中的至少一个参数。
在步骤282和202中,从获得的映射参数中重构(或导出)逆映射函数(所谓的lutMapY)(更多详细信息,请参阅ETSI TS 103 433-1 V1.2.1条款7.2.3.1;TS 103 433-2V.0.0.4的相同条款)。
在步骤282和202中,还从获得的颜色校正参数中重构(或导出)色度校正函数β(.)(所谓的lutCC)(更多详细信息,请参见ETSI TS 103 433-1 V1.2.1条款7.2.3.2;TS 103433-2 V.0.0.4的相同条款)。
在基于表的模式中,要传递的动态数据包括代表映射函数的分段线性曲线的枢轴点。例如,动态元数据是:指示枢轴点的数目的luminanceMappingNumVal、指示枢轴点的横坐标(x)值的luminanceMappingX、和指示枢轴点的纵坐标(y)值的luminanceMappingY(更多详细信息,请参见ETSI TS 103 433-1 V1.2.1第6.2.7和6.3.7条)。此外,要传递的其他动态元数据可以包括代表色度校正函数β(.)的分段线性曲线的枢轴点。例如,动态元数据是指示枢轴点的数目的的colorCorrectionNumVal、指示枢轴点的x值的colorCorrectionX、以及指示枢轴点的y值的colorCorrectionY(更多详细信息,请参见ETSI TS 103 433-1 V1.2.1的6.2.8和6.3.8条)。可以使用例如HEVC SL-HDRI SEI消息(在ETSI TS 103 433-1 V1.2.1的附录A.2.3中提供在第6条参数与附录A分发元数据之间的映射),来传递这些动态元数据。
在步骤25中,解析SL-HDRI SEI消息,以获得代表逆映射函数的分段线性曲线的枢轴点和代表色度校正函数β(.)的分段线性曲线的枢轴点、以及色度至亮度注入参数a和b。
在步骤282和202中,从相对于代表逆映射函数ITM的分段线性曲线的那些枢轴点,导出逆映射函数(更多详细信息,请参见ETSI TS 103 433-1 V1.2.1第7.2.3.3条;ETSI TS103 433-2 V.0.0.4的相同条款)。
在步骤281和201中,还从相对于代表色度校正函数β(.)的分段线性曲线的那些枢轴点,导出色度校正函数(更多详细信息,请参见ETSI TS 103 433-1 V1.2.1第7.2.3.4条;TS 103 433-2V.0.0.4的相同条款)。
注意,也可以通过SEI消息,来传递也由后处理步骤使用的静态元数据。例如,基于参数的模式或基于表的模式的选择可以由ETSI TS 103 433-1 V1.2.1(条款A.2.2)规定的有效载荷模式(payloadMode)信息来承载。静态元数据(例如色原或最大母带显示亮度)由AVC、HEVC中规定的母带显示色量(MDCV)SEI消息传递、或如ETSI TS 103 433-1 V1.2.1附录A.2中规定的那样嵌入SL-HDRI SEI消息中。
根据步骤25的实施例,信息数据ID由比特流中的语法元素显式地用信号通知,并因此通过解析比特流而获得。例如,语法元素是SEI消息的一部分,例如SL-HDRI SEI消息中包含的sl_hdr_mode_value_minus1语法元素。
根据实施例,信息数据ID标识将被应用于输入图像以处理参数集SP的处理。根据该实施例,然后可以使用信息数据ID,来推断如何使用参数来重构这三个分量(步骤25)。
例如,当等于1时,信息数据ID指示已经通过将SL-HDR1预处理步骤(步骤20)应用于输入的HDR图像而获得了参数集SP,并且这三个分量代表SDR图像。当等于2时,信息数据ID指示已通过将SL-HDR2预处理步骤(步骤20)应用于HDR 10比特图像(步骤20的输入)而获得了参数,并且这三个分量/>代表HDR10图像。
根据集合25的实施例,当从由元数据传递的信息数据获得校正矩阵Ac-1的系数时,从通过解析接收到的元数据而获得的所述校正矩阵Ac-1获得至少一个校正因子。
根据步骤25的实施例,校正因子CFU是矩阵Ac-1的系数m1/CFu与其理论值m1之比、和系数m3/CFu与其理论值m3之比的平均值,并且校正因子CFV是系数m0/CFv与其理论值m0之比、和系数m2/CFv与其理论值m2之比的平均值。
根据实施例,校正因子CFU是m1/CFu和之间的最高系数与其理论值的比率,而校正因子CFV是m0/CFv和m2/CFv之间的最高系数与其理论值的比率。
根据实施例,校正因子CF是m1/CF、m3/CF、m0/CF和m2/CF之间的最高系数与其理论值的比率。
如果未应用时间稳定,则校正因子CFU和CFV(或CF)可能会波动,这可能会使后处理器重构的HDR数据在视觉上不稳定,或者由于削波或非最佳精度而可能不正确。
如果基于场景切换(scene-cut)检测的时间稳定,即仅当检测到场景切换时才允许修改校正因子CFU和CFV(或校正因子CF),则该处理无法适配低于场景切换检测器阈值的内容中的细微变化,并且由此这可能会产生不适配当前图像的校正因子CFU和CFV(或校正因子CF),并且会产生由于削波或非最佳精度而导致的重构不良的HDR数据。换句话说,这会使场景切换内部的处理效率低下。
根据实施例,在当前时间之前的预定时间段内收集校正因子CFU和CFV(或校正因子CF)中的每一个的值,并且在当前时间输送这些校正因子中的每一个的过滤版本。
图6示出了根据第一实施例的用于在预定时间段内收集每个校正因子的值的方法的框图。
每当***已经检测到场景切换时,都会为每个校正因子初始化可配置的缓冲区,如下:
例如,当使用两个校正因子时,对缓冲区CFU_buf[.]和CFV_buf[.]进行初始化;或者当使用单个校正因子时,对单个缓冲区CF_buf[.]进行初始化。缓冲区尺寸n(或长度)表示计算校正因子的过滤版本所分析的连续帧的数目。
当使用两个校正因子时,两个校正因子的缓冲区尺寸n可以相同,也可以取决于校正因子值而不同。
每个缓冲区的每个值都使用校正因子CFU、CFV或CF的传入值进行初始化:
●CFU_buf[0]=CFU,CFU_buf[1]=CFU,……,CFU_buf[n-1]=CFU
●CFV_buf[0]=CFV,CFV_buf[1]=CFV,……,CFV_buf[n-1]=CFV
●CF_buf[0]=CF,CF_buf[1]=CF,……,CF_buf[n-1]=CF
对于每个校正因子,计算代表对应缓冲区的所有值的累加值:cum_value=f(缓冲区的所有值)。函数f(.)可以是简单和、向缓冲区中的特定位置给予更大权重的加权和:
■cum_CFU=f(CFU_buf[i],i=0……n-1)
■cum_CFV=f(CFV_buf[i],i=0……n-1)
例如,如果两个校正因子的缓冲区尺寸n相同,并且如果累加值是用于两个校正因子的简单和,则累加值是:
■cum_CFU=CFU*n
■cum_CFV=CFV*n
■cum_CF=CF*n
对代表缓冲区中的当前帧位置的索引进行初始化:
■如果两个缓冲区尺寸相同,则初始化单个索引:indexfilterIndex=0
■如果两个缓冲区尺寸不同,则每个缓冲区尺寸都需要由特定索引进行索引,并且每个特定索引都被初始化为0(indexFilterU=0,indexFilterV=0)
在场景切换中,校正因子如下被过滤:
对于每个校正因子:
-通过以下方式更新累加值cum_CFU、cum_CFV(或cum_CF):
■减去与当前索引处找到的值对应的最老的传入校正因子值。减法可以是最老的校正因子值与后面任一个校正因子值之间的组合的简单或加权减法
■添加最新的传入校正因子值。加法可以是最新校正因子值与任一先前校正因子值之间的组合的简单或加权加法。
-用最新的传入校正因子更新当前索引处的缓冲区。
-计算每个校正因子的过滤值。过滤值可以是例如:
■对应累加值与对应缓冲区尺寸的简单除法;
■对应累加值与和当计算累加值时所考虑的加权帧之和对应的数字的除法;
图7示出了根据第二实施例的用于在预定时间段内收集每个校正因子的值的方法的框图。
在该实施例中,场景切换检测器在该***中不使用或不可用。当接收到第一帧时,初始化***,并然后过滤所有值。
在图1-4a和6-7中,模块是功能单元。在各个实施例中,这些功能单元的全部、一些或不对应于可区分的物理单元。例如,这些模块或其中的一些模块可以集合到唯一的组件或电路中,或者有助于软件的功能。作为另一示例,一些模块可以由单独的物理实体组成。使用纯硬件(例如使用专用硬件,例如ASIC或FPGA或VLSI,分别是《特定用途集成电路》、《现场可编程门阵列》、《超大规模集成电路》)、或从设备中嵌入的几个集成电子组件、或从硬件和软件组件的混合,来实现各种实施例。
图5图示了其中实现各个方面和实施例的***的示例的框图。***5000可以实施为包括以下描述的各种组件的装置,并且被配置为执行本申请中描述的一个或多个方面。这样的装置的示例包括但不限于各种电子装置,例如个人计算机、膝上型计算机、智能电话、平板计算机、数字多媒体机顶盒、数字电视接收机、个人视频记录***、连接的家用电器、和服务器。***5000的元件可以单独地或组合地实施在单个集成电路、多个IC、和/或分立组件中。例如,在至少一个实施例中,***5000的处理和编码器/解码器元件分布在多个IC和/或分立组件上。在各种实施例中,***5000经由例如通信总线或通过专用输入和/或输出端口,而可通信地耦合到其他类似***或其他电子装置。在各种实施例中,***5000被配置为实现本文档中描述的一个或多个方面。
***5000包括至少一个处理器5010,被配置为执行其中加载的指令,用于实现例如本文档中描述的各个方面。处理器5010可以包括嵌入式存储器、输入输出接口、和本领域已知的各种其他电路。***5000包括至少一个存储器5020(例如,易失性存储器件和/或非易失性存储器件)。***5000包括储存装置5040,其可以包括非易失性存储器和/或易失性存储器,包括但不限于EEPROM、ROM、PROM、RAM、DRAM、SRAM、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,储存装置5040可以包括内部储存装置、附接的储存装置和/或网络可访问的储存装置。
***5000包括编码器/解码器模块5030,被配置为例如处理数据以提供编码的视频或解码的视频,并且编码器/解码器模块5030可以包括其自己的处理器和存储器。编码器/解码器模块5030表示可以被包括在装置中以执行编码和/或解码功能的(多个)模块。众所周知,装置可以包括编码和解码模块之一或两者。另外,编码器/解码器模块5030可以被实现为***5000的单独的元件,或者可以作为本领域技术人员已知的硬件和软件的组合并入处理器5010内。
可以将要在处理器5010或编码器/解码器5030上加载以执行本文档中描述的各个方面的程序代码存储在储存装置5040中,并随后加载到存储器5020上用于由处理器5010执行。根据各种实施例,一个或多个处理器5010、存储器5020、储存装置5040、和编码器/解码器模块5030可以在执行本文档中描述的处理期间存储各种项目中的一项或多项。这样存储的项目可以包括但不限于输入视频、解码视频或解码视频的一部分、比特流、矩阵、变量、以及来自等式、公式、运算、和运算逻辑的处理的中间或最终结果。
在几个实施例中,处理器5010和/或编码器/解码器模块5030内部的存储器用于存储指令,并为编码或解码期间所需的处理提供工作存储器。
然而,在其他实施例中,处理装置外部的存储器(例如,处理装置可以是处理器5010或编码器/解码器模块5030)用于这些功能中的一个或多个。外部存储器可以是存储器5020和/或储存装置5040,例如,动态易失性存储器和/或非易失性闪存。在一些实施例中,外部非易失性闪存用于存储电视的操作***。在至少一个实施例中,诸如RAM的快速外部动态易失性存储器被用作用于视频编码和解码操作(诸如用于MPEG-2、HEVC、或VVC(通用视频编码))的工作存储器。
如框5030所指示的,可以通过各种输入装置来提供对***5000的元件的输入。这样的输入装置包括但不限于(i)RF部分,该RF部分接收例如由广播装置在空中传送的RF信号,(ii)复合输入端,(iii)USB输入端,和/或(iv)HDMI输入端。
在各个实施例中,框5030的输入装置具有本领域中已知的相关联的相应输入处理元件。例如,RF部分可以与进行以下操作必需的元素相关联:(i)选择期望频率(也称为选择信号、或将信号的频带限制为一频带),(ii)对所选的信号进行下变频,(iii)将频带再次限制到较窄的频带,以选择(例如)在某些实施例中可以称为信道的信号频带,(iv)解调所述被下变频且频带限制的信号,(v)执行纠错,和(vi)解多路复用以选择数据分组的期望流。各种实施例的RF部分包括执行这些功能的一个或多个元件,例如,频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器、和解多路复用器。RF部分可以包括执行各种这些功能的调谐器,包括例如将接收到的信号下变频到较低频率(例如,中频或近基带频率)或基带。
在一个机顶盒实施例中,RF部分及其相关联的输入处理元件接收通过有线(例如,线缆)介质传送的RF信号,并通过滤波、下变频、和再次滤波到期望的频带,来执行频率选择。
各种实施例重新布置上述(和其他)元件的顺序,移除这些元件中的一些,和/或添加执行类似或不同功能的其他元件。
添加元件可以包括在现有元件之间***元件,例如,***放大器和模数变换器。在各个实施例中,RF部分包括天线。
另外,USB和/或HDMI端可以包括相应的接口处理器,用于通过USB和/或HDMI连接将***5000连接到其他电子装置。应当理解,可以在必要时例如在单独的输入处理IC内或在处理器5010内实现输入处理的各个方面,例如里德-所罗门纠错。类似地,USB或HDMI接口处理的各方面可以在必要时在单独的接口IC内或在处理器5010内实现。已解调、纠错、和解多路复用的流被提供到各种处理元件,包括例如处理器5010、和与存储器和储存元件组合操作以在必要时处理数据流用于在输出装置上呈现的编码器/解码器503。
可以在集成壳体内提供***5000的各种元件。在该集成壳体内,可以使用合适的连接布置来互连各种元件并在它们之间传送数据,例如,本领域中已知的内部总线,包括I2C总线、布线、和印刷电路板。
***5000包括使得能够经由通信信道5060与其他装置进行通信的通信接口5050。通信接口5050可以包括但不限于配置为在通信信道5060上传送和接收数据的收发器。通信接口5050可以包括但不限于调制解调器或网卡,并且通信信道5060可以例如在有线和/或无线介质内实现。
在各种实施例中,使用诸如IEEE 802.11的Wi-Fi网络将数据流式传输到***5000。这些实施例的Wi-Fi信号在适于Wi-Fi通信的通信信道5060和通信接口5050上被接收。这些实施例的通信信道5060通常连接到接入点或路由器,该接入点或路由器提供对包括因特网的外部网络的访问,用于允许流式应用和其他云上(over-the-top)通信。
其他实施例使用机顶盒向***5000提供流式传输的数据,该机顶盒通过输入块5030的HDMI连接来输送数据。
还有其他实施例使用输入块5030的RF连接将流式传输的数据提供到***5000。
应当理解,可以以各种方式来完成信令。例如,在各个实施例中,一个或多个语法元素、标志等用来将信息用信号通知到对应的解码器。
***5000可以向包括显示器5100、扬声器5110、和其他***装置5120的各种输出装置提供输出信号。在实施例的各种示例中,其他***装置5120包括独立DVR、盘播放器、立体声***、照明***、和提供基于***5000的输出的功能的其他装置中的一个或多个。
在各种实施例中,使用诸如AV.Link、CEC、或在有用户干预或没有用户干预的情况下使能装置到装置控制的其他通信协议的信令,在***5000与显示器5100、扬声器5110、或其他***装置5120之间传递控制信号。
输出装置可以经由专用连接通过相应接口5070、5080和5090通信耦合到***5000。
可替代地,可以经由通信接口5050使用通信信道5060将输出装置连接到***5000。在电子装置(例如电视机)中,显示器5100和扬声器5110可以与***5000的其他组件集成在单个单元中。
在各种实施例中,显示接口5070包括显示驱动器,例如,时序控制器(TCon)芯片。
例如,如果输入5130的RF部分是单独的机顶盒的一部分,则显示器5100和扬声器5110可以可替代地与一个或多个其他组件分开。在显示器5100和扬声器5110是外部组件的各种实施例中,可以经由专用输出连接(包括例如HDMI端口、USB端口、或COMP输出)来提供输出信号。
本文描述的各种处理和特征的实现方式可以体现在各种不同的设备或应用中。这种设备的示例包括编码器、解码器、处理来自解码器的输出的后处理器、向编码器提供输入的预处理器、视频编码器、视频解码器、视频编解码器、Web服务器、机顶盒、膝上型计算机、个人计算机、手机、PDA、用于处理图像或视频的任何其他装置、以及任何其他通信设备。应当清楚,设备可以是移动的,并且甚至可以安装在移动车辆中。
另外,可以通过由处理器执行的指令来实现所述方法,并且可以将这样的指令(和/或由实现方式产生的数据值)存储在计算机可读存储介质上。计算机可读存储介质可以采取在一个或多个计算机可读介质中体现的计算机可读程序产品的形式,并且在其上包含可由计算机执行的计算机可读程序代码。在此使用的计算机可读存储介质被认为是被给予在其中存储信息的固有能力以及从中提供信息检索的固有能力的非瞬时存储介质。计算机可读存储介质可以是例如但不限于电子、磁、光、电磁、红外、或半导体***、设备、或装置、或前述的任何合适的组合。应当理解,以下内容,尽管提供了可计算机可读存储介质的更具体的示例,但是仅仅是本领域的普通技术人员容易理解的说明性列表而不是穷尽性列表:便携式计算机;软盘;硬盘;只读存储器(ROM);可擦除可编程只读存储器(EPROM或闪存);便携式致密盘只读存储器(CD-ROM);光储存装置;磁储存装置;或上述内容的任何适当组合。
这些指令可以形成有形地体现在处理器可读介质(也称为计算机可读介质或计算机可读存储介质)上的应用程序。指令可以是例如硬件、固件、软件、或组合。指令可以在例如操作***、单独的应用、或两者的组合中找到。因此,处理器的特征可以在于,例如,被配置为执行处理的设备、和包括具有用于执行处理的指令的处理器可读介质的设备(例如储存设备)。此外,除了或代替指令,处理器可读介质可以存储由实现方式产生的数据值。
对于本领域技术人员将显而易见的是,实现方式可以产生各种信号,这些信号被格式化以携带例如可以被存储或传送的信息。该信息可以包括例如用于执行方法的指令、或由所描述的实现方式之一产生的数据。例如,信号可以被格式化为携带用于写入或读取所描述的示例的语法的规则作为数据,或者携带由所描述的示例所写入的实际语法值作为数据。这样的信号可以被格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。所述格式化可以包括例如对数据流进行编码并且利用编码的数据流来调制载波。信号携带的信息可以是例如模拟或数字信息。众所周知,所述信号可以通过各种不同的有线或无线链路传送。信号可以存储在处理器可读介质上。
已经描述了多个实现方式。然而,将理解,可以进行各种修改。例如,不同实现方式的元素可以被组合、补充、修改、或移除,以产生其他实现方式。此外,本领域普通技术人员将理解,可以用其他结构和处理代替所公开的结构和处理,并且所得到的实现方式将以至少基本上相同的(多个)方式执行至少基本上相同的(多个)功能,以至少实现与所公开的实现方式基本上相同的(多个)结果。因此,本申请预期了这些和其他实现方式。

Claims (12)

1.一种用于SL-HDR编码的方法,包括:
-通过基于第一校正因子β执行第一色度校正而导出缩放的色度分量和/>所述第一校正因子β用于根据通过应用输入图像的亮度分量的映射函数获得的第一分量/>和表示所述第一分量/>的逆映射的重构分量/>来校正表示所述输入图像的色度的色度分量/>和/>其中所述映射函数用于降低或增加所述亮度分量的动态范围;
-根据所述缩放的色度分量和/>确定第二校正因子对CFU,CFV;以及
-在比特流B中编码数据,所述数据包括表示至少所述缩放的色度分量和/>的信息、用于传递表示所述第一校正因子β和所述第二校正因子对CFU,CFV的信息数据的元数据;
其中所述第二校正因子CFU是所述输入图像的像素的所述缩放的色度分量的值除以最大值MaxValU的结果中的最大值,并且所述第二校正因子CFv是所述输入图像的所述像素的所述缩放的色度分量/>的值除以最大值MaxValV的结果中的最大值。
2.根据权利要求1所述的方法,其中通过将理论色彩空间矩阵变换A-1的值除以所述第二校正因子对CFU,CFV的校正因子,在校正后的色彩空间矩阵变换Ac-1中对所述第二校正因子对CFU,CFV的所述校正因子进行编码。
3.根据权利要求1或2所述的方法,其中考虑单一第二校正因子CF代替CFU和CFV,CF等于校正因子CFU和校正因子CFV的最大值或平均值。
4.一种用于SL-HDR编码的设备,包括处理器,所述处理器被配置为:
-通过基于第一校正因子β执行第一色度校正而导出缩放的色度分量和/>所述第一校正因子β用于根据通过应用输入图像的亮度分量的映射函数获得的第一分量/>和表示所述第一分量/>的逆映射的重构分量/>来校正表示所述输入图像的色度的色度分量/>和/>其中所述映射函数用于降低或增加所述亮度分量的动态范围;
-根据所述缩放的色度分量和/>确定第二校正因子对CFU,CFV;以及
-在比特流B中编码数据,所述数据包括表示至少所述缩放的色度分量和/>的信息、用于传递表示所述第一校正因子β和所述第二校正因子对CFU,CFV的信息数据的元数据;
其中所述第二校正因子CFU是所述输入图像的像素的所述缩放的色度分量的值除以最大值MaxValU的结果中的最大值,并且所述第二校正因子CFv是所述输入图像的所述像素的所述缩放的色度分量/>的值除以最大值MaxValV的结果中的最大值。
5.根据权利要求4所述的设备,其中通过将理论色彩空间矩阵变换A-1的值除以所述第二校正因子对CFU,CFV的校正因子,在校正后的色彩空间矩阵变换Ac-1中对所述第二校正因子对CFU,CFV的所述校正因子进行编码。
6.根据权利要求4或5所述的设备,其中考虑单一第二校正因子CF代替CFU和CFV,CF等于校正因子CFU和校正因子CFV的最大值或平均值。
7.一种用于SL-HDR解码的方法,包括:
-从比特流B至少获得表示至少缩放的色度分量 的信息、和用于传递表示第一色度校正因子和第二校正因子对CFU,CFV的信息数据的元数据;
-通过将所述第一色度校正因子β乘以所述第二校正因子对CFU,CFV,而获得校正后的色度校正因子对βcu,βcv;
-通过将图像的色度分量乘以所述校正后的色度校正因子对βcu,βcv,而获得缩放的色度分量/>以及
-根据所述缩放的色度分量和校正后的矩阵Ac-1导出重构图像的分量其中m=1,2,3,所述校正后的矩阵Ac-1是将理论颜色空间矩阵变换的逆的系数除以第二校正因子CF,CFU,CFV中的至少一个的结果。
8.根据权利要求7所述的方法,其中在当前时间之前的预定时间段内收集所述第二校正因子对的值,并且在所述当前时间处输送所收集的第二校正因子对的过滤版本。
9.根据权利要求7或8所述的方法,其中考虑单一第二校正因子CF代替CFU和CFV,CF等于校正因子CFU和校正因子CFV的最大值或平均值。
10.一种用于SL-HDR解码的设备,包括处理器,所述处理器被配置为:
-从比特流B至少获得表示至少缩放的色度分量的信息、和用于传递表示第一色度校正因子和第二校正因子对CFU,CFV的信息数据的元数据;
-通过将所述第一色度校正因子β乘以所述第二校正因子对CFU,CFV,而获得校正后的色度校正因子对βcu,βcv;
-通过将图像的色度分量乘以所述校正后的色度校正因子对βcu,βcv,而获得缩放的色度分量/>以及
-根据所述缩放的色度分量和校正后的矩阵Ac-1导出重构图像的分量其中m=1,2,3,所述校正后的矩阵Ac-1是将理论颜色空间矩阵变换的逆的系数除以第二校正因子CF,CFU,CFV中的至少一个的结果。
11.根据权利要求10所述的设备,其中在当前时间之前的预定时间段内收集所述第二校正因子对的值,并且在所述当前时间处输送所收集的第二校正因子对的过滤版本。
12.根据权利要求10或11所述的设备,其中考虑单一第二校正因子CF代替CFU和CFV,CF等于校正因子CFU和校正因子CFV的最大值或平均值。
CN201880077821.1A 2017-12-01 2018-11-30 处理图像 Active CN111434114B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP17306694 2017-12-01
EP17306694.5 2017-12-01
EP17306838.8 2017-12-20
EP17306838 2017-12-20
PCT/US2018/063218 WO2019108882A1 (en) 2017-12-01 2018-11-30 Processing an image

Publications (2)

Publication Number Publication Date
CN111434114A CN111434114A (zh) 2020-07-17
CN111434114B true CN111434114B (zh) 2024-06-11

Family

ID=64664546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880077821.1A Active CN111434114B (zh) 2017-12-01 2018-11-30 处理图像

Country Status (4)

Country Link
US (1) US11928796B2 (zh)
EP (1) EP3718304A1 (zh)
CN (1) CN111434114B (zh)
WO (1) WO2019108882A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111434114B (zh) * 2017-12-01 2024-06-11 交互数字Vc控股公司 处理图像
US11641469B2 (en) * 2020-01-13 2023-05-02 Qualcomm Incorporated Signaling scaling matrices in video coding
US11317137B2 (en) * 2020-06-18 2022-04-26 Disney Enterprises, Inc. Supplementing entertainment content with ambient lighting
EP4229869A1 (en) * 2020-10-14 2023-08-23 Dolby Laboratories Licensing Corporation Color transformation for hdr video with a coding-efficiency constraint

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4488245A (en) 1982-04-06 1984-12-11 Loge/Interpretation Systems Inc. Method and means for color detection and modification
US5565931A (en) 1994-10-31 1996-10-15 Vivo Software. Inc. Method and apparatus for applying gamma predistortion to a color image signal
JP4120414B2 (ja) 2003-02-07 2008-07-16 三菱電機株式会社 投写型表示装置及び画像信号の変換方法
US8064110B2 (en) 2005-12-08 2011-11-22 Qualcomm Incorporated Adaptive auto white balance
KR20130058524A (ko) * 2011-11-25 2013-06-04 오수미 색차 인트라 예측 블록 생성 방법
US9129445B2 (en) * 2012-03-14 2015-09-08 Dolby Laboratories Licensing Corporation Efficient tone-mapping of high-bit-depth video to low-bit-depth display
US20160065974A1 (en) * 2013-04-05 2016-03-03 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding video with respect to filtering
US9544560B2 (en) * 2015-01-09 2017-01-10 Vixs Systems, Inc. Dynamic range converter with generic architecture and methods for use therewith
US9589313B2 (en) 2015-01-09 2017-03-07 Vixs Systems, Inc. Dynamic range converter with pipelined architecture and methods for use therewith
EP3051488A1 (en) * 2015-01-30 2016-08-03 Thomson Licensing A method and apparatus for inverse-tone mapping a picture
US11279768B1 (en) * 2015-04-03 2022-03-22 Precision Biologics, Inc. Anti-cancer antibodies, combination therapies, and uses thereof
KR102509504B1 (ko) * 2015-08-24 2023-03-13 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 코딩 및 디코딩 방법과 대응하는 디바이스
EP3338450A1 (en) * 2015-09-23 2018-06-27 ARRIS Enterprises LLC System and method for reshaping and adaptation of high dynamic range video data
US20170105014A1 (en) 2015-10-08 2017-04-13 Qualcomm Incorporated Luma-driven chroma scaling for high dynamic range and wide color gamut contents
US10080005B2 (en) 2015-11-09 2018-09-18 Netflix, Inc. High dynamic range color conversion correction
BR112017016037A2 (pt) * 2015-12-17 2018-03-20 Koninklijke Philips N.V. decodificador e codificador de vídeo em hdr; método de decodificação de vídeo; método para codificação de vídeo em hdr; e memória legível por computador
EP3242482A1 (en) * 2016-05-04 2017-11-08 Thomson Licensing Method and apparatus for encoding/decoding a high dynamic range picture into a coded bitstream
EP3456047B1 (en) 2016-05-10 2020-02-26 Dolby Laboratories Licensing Corporation Chroma reshaping of hdr video signals
US10462334B2 (en) 2016-11-04 2019-10-29 Disney Enterprises, Inc. Pipeline for high dynamic range video coding based on luminance independent chromaticity preprocessing
EP3367658A1 (en) * 2017-02-24 2018-08-29 Thomson Licensing Method and device for reconstructing an hdr image
JP7086587B2 (ja) * 2017-02-24 2022-06-20 インターデジタル ヴイシー ホールディングス, インコーポレイテッド 復号された画像データから画像データを再構成する方法および装置
US11310532B2 (en) * 2017-02-24 2022-04-19 Interdigital Vc Holdings, Inc. Method and device for reconstructing image data from decoded image data
EP3383017A1 (en) * 2017-03-31 2018-10-03 Thomson Licensing Method and device for color gamut mapping
BR112020009563A2 (pt) * 2017-11-24 2020-11-03 Interdigital Vc Holdings, Inc. método e aparelho para correção de cor durante conversão hdr para sdr
EP3493150A1 (en) * 2017-11-30 2019-06-05 InterDigital VC Holdings, Inc. Tone mapping adaptation for saturation control
CN111434114B (zh) * 2017-12-01 2024-06-11 交互数字Vc控股公司 处理图像

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Single-Layer HDR Video Coding Framework with SDR Compatibility;Edouard François等;SMPTE MOTION IMAGING JOURNAL;第16-22页 *
Edouard François等.A Single-Layer HDR Video Coding Framework with SDR Compatibility.SMPTE MOTION IMAGING JOURNAL.2017,第16-22页. *
High-Performance Single Layer High Dynamic Range (HDR) System for use in Consumer Electronics devices;EBU;ETSI TS 103 433-1 V1.2.1;第1-123页 *

Also Published As

Publication number Publication date
WO2019108882A1 (en) 2019-06-06
EP3718304A1 (en) 2020-10-07
CN111434114A (zh) 2020-07-17
US20210042892A1 (en) 2021-02-11
US11928796B2 (en) 2024-03-12

Similar Documents

Publication Publication Date Title
CN111434114B (zh) 处理图像
CN110574376B (zh) 用于解码高动态范围图像的方法和设备
US11902595B2 (en) Method and apparatus for processing a medium dynamic range video signal in SL-HDR2 format
US10600163B2 (en) Method and device for reconstructing a display adapted HDR image
CN111386704B (zh) 用于在hdr到sdr转换期间的颜色校正的方法和装置
WO2019203973A1 (en) Method and device for encoding an image or video with optimized compression efficiency preserving image or video fidelity
CN111466117B (zh) 处理图像
CA2986520A1 (en) Method and device for reconstructing a display adapted hdr image
RU2802304C2 (ru) Способ и оборудование для кодирования изображения
US11575944B2 (en) Method and apparatus for encoding an image
US20210176471A1 (en) Processing an image
CN113228670A (zh) 对图像进行解码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant