CN115442636A - 直播视频流转换方法、装置、设备及存储介质 - Google Patents

直播视频流转换方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115442636A
CN115442636A CN202210850922.6A CN202210850922A CN115442636A CN 115442636 A CN115442636 A CN 115442636A CN 202210850922 A CN202210850922 A CN 202210850922A CN 115442636 A CN115442636 A CN 115442636A
Authority
CN
China
Prior art keywords
live video
image data
video image
video stream
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210850922.6A
Other languages
English (en)
Inventor
徐懿
巢娅
袁浩期
黄俊森
于和新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Boguan Information Technology Co Ltd
Original Assignee
Guangzhou Boguan Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Boguan Information Technology Co Ltd filed Critical Guangzhou Boguan Information Technology Co Ltd
Priority to CN202210850922.6A priority Critical patent/CN115442636A/zh
Publication of CN115442636A publication Critical patent/CN115442636A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4854End-user interface for client configuration for modifying image parameters, e.g. image brightness, contrast

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及计算机技术领域,公开了一种直播视频流转换方法、装置、设备及存储介质,用于提高视频转换速度和转换效果,并消除视频编码的色度失真。所述直播视频流转换方法包括:获取标准动态范围直播视频流,并对标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;对解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;基于预设的查找表对转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;查找表包括至少一种图像参数的映射关系;映射关系用于将图像参数从第一参数范围映射至第二参数范围;通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。

Description

直播视频流转换方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种直播视频流转换方法、装置、设备及存储介质。
背景技术
高动态范围HDR是近年图像与视频领域新兴的一种技术,目的是展现更加生动细腻的画面。相比于标准动态范围SDR格式,HDR具有更深的色深,更广的色彩范围,更高的亮度对比,因此,HDR能够传达高动态画面并展现更多的细节,营造沉浸式的观看体验。随着移动设备硬件技术的发展,HDR视频的受众范围也逐渐扩大。目前,HDR技术主要应用于影视作品的播放,直播领域对于HDR画质的支持较少,而观众对于直播尤其是游戏赛事直播增强画质与观看体验的需求又不断增高。但是大多数游戏直播的游戏画面本身是SDR格式,如何将SDR格式的主播游戏画面,扩展为高动态的HDR格式,经过实时高效编码与传输后提供给观众观看,是其中的重点与难点。
在现有技术中,将SDR转换为HDR的方法可以分为两大类,一类是利用传统逆色调映射算法,即建立一个函数模型对图像进行全局映射或局部映射。比较典型的有线性缩放模型、幂函数模型以及反向色调映射算子TMO等。考虑到图像的局部信息特征,加强对高频细节的保护,一些方法在基本逆色调映射模型的基础上加入双边滤波将图像中的细节层分离出来处理。另一类则利用基于深度学习的人工智能模型进行SDR到HDR的自动转换。而将现有转换方法应用于HDR格式的视频流,均存在视频转换速度慢、转换效果差以及视频编码造成色度失真的问题。
发明内容
本发明提供了一种直播视频流转换方法、装置、设备及存储介质,用于提高视频转换速度和转换效果,以及消除视频编码的色度失真。
为实现上述目的,本发明第一方面提供了一种直播视频流转换方法,包括:获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
一种可行的实施方式中,所述对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据,包括:获取所述标准动态范围直播视频流对应的视频编码格式;将所述标准动态范围直播视频流输入至与所述视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。
一种可行的实施方式中,所述对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据,包括:对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据;对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据;通过感知量化映射函数将所述转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
一种可行的实施方式中,所述对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据,包括:根据所述标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数;按照所述目标线性转换函数对所述解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。
一种可行的实施方式中,所述对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据,包括:按照预设色域转换算法将所述线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,所述第一色彩空间为BT.709色彩空间,所述第二色彩空间为BT.2020色彩空间。
一种可行的实施方式中,所述基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据,包括:从所述预设的查找表中提取所述至少一种图像参数的映射关系,所述图像参数包括:亮度、色相、饱和度中的一种或多种;根据所述至少一种图像参数的映射关系对所述转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。
一种可行的实施方式中,所述通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,包括:将所述处理后的直播视频图像数据输入至预设的编码器,并通过所述编码器从所述处理后的直播视频图像数据中提取色度分量和亮度分量;其中,所述编码器为基于图形处理器的高效视频编码器,且所述编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,所述色度量化偏移参数用于调节所述亮度量化参数和所述色度量化参数之间的平衡关系;基于所述亮度量化参数、所述色度量化参数和所述色度量化偏移参数对所述色度分量和所述亮度分量进行视频编码处理,输出高动态范围直播视频流。
一种可行的实施方式中,在所述获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据之前,所述直播视频流转换方法还包括:基于直播游戏场景中的场景视频图像数据构建所述预设的查找表;获取视频编码码率,并根据所述视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到所述预设的编码器。
一种可行的实施方式中,所述基于直播游戏场景中的场景视频图像数据构建所述预设的查找表,包括:从直播游戏场景中获取场景视频图像数据,并对所述场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据;通过预设调色软件对所述高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到所述预设的查找表。
本发明第二方面提供了一种直播视频流转换装置,包括:解码模块,用于获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;转换模块,用于对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;映射模块,用于基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;编码模块,用于通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
一种可行的实施方式中,所述解码模块具体用于:获取所述标准动态范围直播视频流对应的视频编码格式;将所述标准动态范围直播视频流输入至与所述视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。
一种可行的实施方式中,所述转换模块还包括:处理单元,用于对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据;第一转换单元,用于对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据;第二转换单元,用于通过感知量化映射函数将所述转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
一种可行的实施方式中,所述处理单元具体用于:根据所述标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数;按照所述目标线性转换函数对所述解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。
一种可行的实施方式中,所述第二转换单元具体用于:按照预设色域转换算法将所述线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,所述第一色彩空间为BT.709色彩空间,所述第二色彩空间为BT.2020色彩空间。
一种可行的实施方式中,所述映射模块具体用于:从所述预设的查找表中提取所述至少一种图像参数的映射关系,所述图像参数包括:亮度、色相、饱和度中的一种或多种;根据所述至少一种图像参数的映射关系对所述转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。
一种可行的实施方式中,所述编码模块具体用于:将所述处理后的直播视频图像数据输入至预设的编码器,并通过所述编码器从所述处理后的直播视频图像数据中提取色度分量和亮度分量;其中,所述编码器为基于图形处理器的高效视频编码器,且所述编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,所述色度量化偏移参数用于调节所述亮度量化参数和所述色度量化参数之间的平衡关系;基于所述亮度量化参数、所述色度量化参数和所述色度量化偏移参数对所述色度分量和所述亮度分量进行视频编码处理,输出高动态范围直播视频流。
一种可行的实施方式中,所述直播视频流转换装置还包括:构建模块,用于基于直播游戏场景中的场景视频图像数据构建所述预设的查找表;设置模块,用于获取视频编码码率,并根据所述视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到所述预设的编码器。
一种可行的实施方式中,所述构建模块具体用于:从直播游戏场景中获取场景视频图像数据,并对所述场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据;通过预设调色软件对所述高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到所述预设的查找表。
本发明第三方面提供了一种直播视频流转换设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述直播视频流转换设备执行上述的直播视频流转换方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的直播视频流转换方法。
本发明提供的技术方案中,获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
附图说明
图1为本发明实施例中直播视频流转换方法的一个实施例示意图;
图2为本发明实施例中直播视频流转换方法的另一个实施例示意图;
图3为本发明实施例中直播视频流转换装置的一个实施例示意图;
图4为本发明实施例中直播视频流转换装置的另一个实施例示意图;
图5为本发明实施例中直播视频流转换设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种直播视频流转换方法、装置、设备及存储介质,用于提高视频转换速度和转换效果,以及消除视频编码的色度失真。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中直播视频流转换方法的一个实施例包括:
101、获取标准动态范围直播视频流,并对标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据。
需要说明的是,标准动态范围直播视频流来源于实时直播场景,其中,实时直播场景包括游戏直播场景、电商直播场景以及教育直播场景等。实时直播场景对应的原始直播视频数据需要压缩后才能进行网络传输,压缩的过程称为编码,编码格式有多种,例如H264、H265等。当对标准动态范围直播视频流进行图像操作时,服务器根据标准动态范围直播视频流对应的编码格式进行解码。在一些实时例中,服务器从实时直播场景中获取标准动态范围直播视频流;服务器获取标准动态范围直播视频流对应的视频编码格式,具体的,服务器通过预设视频编码格式识别模型从标准动态范围直播视频流中提取视频类型数据,并对视频类型数据进行格式分析,得到视频编码格式,其中,视频类型数据包括I帧、B帧、P帧以及NALU类型帧等;服务器将标准动态范围直播视频流输入至与视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。例如,视频编码格式为H264的标准动态范围直播视频流,服务器调用H264解码器对标准动态范围直播视频流解码。
在本实施例中,以游戏直播场景为例进行说明。在步骤101之前,服务器基于直播游戏场景中的场景视频图像数据构建预设的查找表;服务器获取视频编码码率,并根据视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到预设的编码器。色度量化参数的设置公式为:
Figure BDA0003753443460000071
其中,bitrate表示视频编码码率,单位是兆(M),色度量化偏移参数包括第一色度量化偏移参数qp_cb_offset和第二色度量化偏移参数qp_cr_offset,分别表示Cb通道的色度量化偏移值以及Cr通道的色度量化偏移值。例如,服务器设置qp_cb_offset和qp_cr_offset为负数,具体偏移值大小可以根据视频编码码率确定,若视频编码码率小于10M,则服务器设置为最小值-12,来实现最大程度的偏移保护。
进一步地,服务器在执行获取标准动态范围直播视频流,并对标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据步骤时,服务器从直播游戏场景中获取场景视频图像数据,并对场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据,其中,场景视频图像数据包括白天图像数据、黑夜图像数据、打斗图像数据以及草坪图像数据等;服务器通过预设调色软件对高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到预设的查找表。需要说明的是,在构建查找表的过程中,以增强人眼感受效果为调色目标,主要调节标准包括增强高动态范围格式的图像数据中高亮处与黑暗处的亮度差,以提高亮度对比,可以提高到超出标准动态范围内的亮度也不会过曝;调节高动态范围格式的图像数据对应的色彩饱和度与色相,以增强色彩表现,充分利用高动态范围宽色域的特点,使得图像更具冲击力,观感更加鲜明。实际应用中,通过调节色温、色调、曝光量、对比度、高光、阴影、白色、黑色、自然饱和度与饱和度这些参数达到增强人眼感受效果的目的,预设的查找表应匹配直播游戏的基调氛围,并能够应用于大多数游戏直播场景中。
可以理解的是,本发明的执行主体可以为直播视频流转换装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
102、对解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据。
具体的,首先,服务器对解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据。其中,服务器对解码后的直播视频图像数据采用的线性化处理方式(也就是,非线性转换函数的逆变换)取决于标准动态范围直播视频流产生时所采用的非线性转换函数,例如,若BT.1886格式的标准动态范围直播视频流在生产时可以采用非线性转换函数为gamma2.4或者gamma2.2,也有其他特殊格式的标准动态范围直播视频流采用log变换等,相对应的线性化处理方式为gamma2.4、gamma2.2或log变换的逆变换。其次,服务器对线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据,也就是,将线性直播视频图像数据从标准动态范围对应的BT.709色域转换至高动态范围对应BT.2020色域,进一步地,服务器通过预设的色域转换模型对线性直播视频图像数据进行色彩空间转换与颜色矫正处理,得到转换后的RGB色彩空间图像数据,预设的色域转换模型为预先训练好的色彩空间变换模型。最后,服务器将转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据,进一步地,服务器通过感知量化器电光传递函数将转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。服务器还可以通过其他方式进行色彩空间转换和亮度线性空间转换处理,具体此处不做限定。
103、基于预设的查找表对转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,查找表中包括至少一种图像参数的映射关系;映射关系用于将图像参数从第一参数范围映射至第二参数范围;第二参数范围大于第一参数范围。
其中,查找表应用于调色领域称为颜色查找表,也就是对输入像素的RGB值,通过查找表得到输出的RGB值。查找表中包括至少一种图像参数的映射关系,查找表包括一维查找表、二维查找表和三维查找表,一维查找表中RGB数据相互独立,只能影响R、G、B三个通道的线性对比度亮度调节。二维查找表可以控制颜色的两个图像参数,即饱和度和亮度,并在完整的色彩空间中进行线性缩放,通过二维坐标记录颜色的映射关系。三维查找表输出的RGB每一个色彩分量都和输入的R、G、B三个分量相关,通过三维查找表包括亮度、色相和饱和度三个图像参数对应的映射关系,在实际应用场景中,可以根据业务需求选择不同的查找表。由此可见,映射关系用于将图像参数(也就是亮度、色相和/或饱和度)从第一参数范围映射至第二参数范围,第二参数范围大于第一参数范围。也就是,服务器基于预设的查找表将转换后的直播视频图像数据中的亮度、色相和/或饱和度从第一参数范围映射至第二参数范围,第二参数比第一参数范围具有更高的亮度范围、更宽的色域范围以及更深的位深。本实施例中,以三维查找表为例进行说明,服务器基于三维查找表中的映射关系对转换后的直播视频图像数据进行亮度范围扩展与色彩增强,得到处理后的直播视频图像数据,进一步地,服务器在实际应用中通过图形处理器GPU加速查找表渲染,耗时可控制在1ms以内,提高了视频转换速度和转换效果。
104、通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
需要说明的是,高动态范围直播视频流与标准动态范围直播视频流相比,亮度线性空间和BT.2020色彩基色的组合使得处理后的直播视频图像数据中色度分量的取值更加紧密地聚集在零附近,在量化过程中易出现丢失,此时比特分配从色度分量向亮度分量偏移。如果没有为色度分量分配足够多的比特,就会产生色度失真,例如,白色区域中会出现青色和品红色。因此,预设的编码器为基于图形处理器GPU的高效视频编码器HEVC,且基于GPU的HEVC中引入编码参数优化,也就是服务器预先设置了对编码器中色度量化偏移参数,通过色度量化偏移参数调节亮度分量(Y通道)与色度分量(Cb通道和Cr通道)之间的平衡关系,也就是,控制Cb通道和Cr通道分配的色度分量值比Y通道分配的亮度分量值低,以减少或消除视频编码的色度失真。
本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
请参阅图2,本发明实施例中直播视频流转换方法的另一个实施例包括:
201、获取标准动态范围直播视频流,并对标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据。
该步骤201的具体执行过程与步骤101的具体执行过程相似,具体此处不再赘述。
202、对解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据。
也就是,服务器将解码后的直播视频图像数据中像素颜色值以还原为自然场景中的真实颜色值。可以理解是,人类视觉***对亮度的感知是非线性的,自然场景中的画面经过相机记录为数字图像时,需要将自然场景中的颜色值转换为用于传输的非线性颜色值,以使得图片存储的精度尽可能模拟人眼的敏感度,并为人眼敏感度较高的区域分配更多的带宽。例如,假设亮度范围是0-1,人眼其实感觉不出0.95-0.950001的变化,在数字图像存储时就可以对亮度较高的区间分配少点空间,而对亮度较低的区域分配更多空间。其中,解码后的直播视频图像数据对应的图像RGB值是经过非线性转换处理后的值,则服务器通过标准动态范围直播视频流对应的非线性转换函数的逆变换对解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据。
在一些实施例中,服务器根据标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数(也就是,非线性转换函数的逆变换);服务器按照目标线性转换函数对解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。目标线性转换函数与非线性转换函数存在一一对应关系。例如,若非线性转换函数为BT.1886标准中的gamma 2.4,具体公式为
Figure BDA0003753443460000101
目标线性转换函数对应的具体公式为
Figure BDA0003753443460000111
其中,Clinear表示归一化的线性R、G、B值,Cnon-linear表示归一化的非线性R、G、B值,R、G、B值表示解码后的直播视频图像数据中某点的像素值。
203、对线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据。
可以理解的是,标准动态范围直播视频流中图像格式标准对应的色彩空间通常为BT.709色域(也就是,色彩空间),而高动态范围直播视频流中图像格式标准对应的色彩空间则属于BT.2020色域,为满足高动态范围直播视频流的图像格式标准,匹配显示终端的高动态范围颜色空间标准,在本实施例中,服务器进行色彩空间转换过程中,将标准动态范围直播视频流的色彩空间中包含的颜色特征,转变成高动态范围直播视频流的色彩空间中所能体现的颜色。
在一些实施例中,服务器按照预设色域转换算法将线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,第一色彩空间为BT.709色彩空间,第二色彩空间为BT.2020色彩空间。其中,将BT.709色彩空间的RGB值转换为BT.2020色彩空间的预设色域转换算法如下所示:
Figure BDA0003753443460000112
其中,Crgb709表示BT.709色彩空间,Crgb2020表示BT.2020色彩空间。
204、通过感知量化映射函数将转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
也就是,根据高动态范围HDR格式标准,服务器将转换后的RGB色彩空间图像数据映射到感知量化曲线PQ空间。可以理解的是,与标准动态范围直播视频流对应的非线性映射函数(例如,感知量化映射函数)不同,高动态范围直播视频流所采用的HDR格式适用亮度范围更广的非线性映射函数,不同HDR格式采用不同的非线性映射函数,HDR10格式标准要求采用PQ转换。具体的,服务器通过感知量化映射函数将转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。其中,感知量化映射函数为
Figure BDA0003753443460000113
其中,x表示归一化的线性R、G、B像素值,m1=2610/4096×1/4=0.1593017578125,m2=2523/4096×128=78.84375,c1=3424/4096=0.8359375=c3-c2+1,c2=2413/4096×32=18.8515625,c3=2392/4096×32=18.6875,感知量化映射函数描述了人眼对于不同亮度和空间的频率的响应情况。
205、基于预设的查找表对转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,查找表中包括至少一种图像参数的映射关系;映射关系用于将图像参数从第一参数范围映射至第二参数范围;第二参数范围大于第一参数范围。
其中,预设的查找表LUT相当于一个离散函数,查找表中包括至少一种图像参数的映射关系;映射关系用于将图像参数从第一参数范围映射至第二参数范围;第二参数范围大于第一参数范围,第二参数范围用于指示处理后的直播视频图像数据中RGB像素值表示的颜色数量,第一参数范围用于指示转换后的直播视频图像数据中RGB像素值表示的颜色数量。在一些实施例中,服务器从预设的查找表中提取至少一种图像参数的映射关系,图像参数包括:亮度、色相、饱和度中的一种或多种;服务器根据至少一种图像参数的映射关系对转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。服务器通过查找表的动态范围扩展提高了视频转换速度和转换效果。
206、通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
其中,高动态范围直播视频流具有高动态、宽色域、高帧率、高位宽以及高分辨率的特点。在一些实施例中,服务器将处理后的直播视频图像数据输入至预设的编码器,并通过编码器从处理后的直播视频图像数据中提取色度分量和亮度分量;其中,编码器为基于图形处理器的高效视频编码器,且编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,色度量化偏移参数用于调节亮度量化参数和色度量化参数之间的平衡关系;服务器基于亮度量化参数、色度量化参数和色度量化偏移参数对色度分量和亮度分量进行视频编码处理,输出高动态范围直播视频流。例如,对于打斗画面激烈,场景复杂的游戏直播视频流,对应的视频编码码率分配很高,若仅提高平均码率,降低亮度量化参数导致带宽负载过高,加大卡顿概率。为解决色度失真问题,服务器通过对Cb通道和Cr通道分别单独设置一个大的色度量化偏移参数,进而确保在视频编码码率有限的情况下,Y通道对应亮度量化参数较高时,色度量化参数仍然维持在一个正常的水平,使得在量化期间不会发生较为严重的色度信息丢失,有效解决了色度失真的问题。
本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
上面对本发明实施例中直播视频流转换方法进行了描述,下面对本发明实施例中直播视频流转换装置进行描述,请参阅图3,本发明实施例中直播视频流转换装置一个实施例包括:
解码模块301,用于获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;
转换模块302,用于对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;
映射模块303,用于基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;
编码模块304,用于通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
请参阅图4,本发明实施例中直播视频流转换装置另一个实施例包括:
解码模块301,用于获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;
转换模块302,用于对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;
映射模块303,用于基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;
编码模块304,用于通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
一种可行的实施方式中,所述解码模块301具体用于:
获取所述标准动态范围直播视频流对应的视频编码格式;
将所述标准动态范围直播视频流输入至与所述视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。
一种可行的实施方式中,所述转换模块302还包括:
处理单元3021,用于对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据;
第一转换单元3022,用于对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据;
第二转换单元3023,用于通过感知量化映射函数将所述转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
一种可行的实施方式中,所述处理单元3021具体用于:
根据所述标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数;
按照所述目标线性转换函数对所述解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。
一种可行的实施方式中,所述第二转换单元3022具体用于:
按照预设色域转换算法将所述线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,所述第一色彩空间为BT.709色彩空间,所述第二色彩空间为BT.2020色彩空间。
一种可行的实施方式中,所述映射模块303具体用于:
从所述预设的查找表中提取所述至少一种图像参数的映射关系,所述图像参数包括:亮度、色相、饱和度中的一种或多种;
根据所述至少一种图像参数的映射关系对所述转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。
一种可行的实施方式中,所述编码模块304具体用于:
将所述处理后的直播视频图像数据输入至预设的编码器,并通过所述编码器从所述处理后的直播视频图像数据中提取色度分量和亮度分量;其中,所述编码器为基于图形处理器的高效视频编码器,且所述编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,所述色度量化偏移参数用于调节所述亮度量化参数和所述色度量化参数之间的平衡关系;
基于所述亮度量化参数、所述色度量化参数和所述色度量化偏移参数对所述色度分量和所述亮度分量进行视频编码处理,输出高动态范围直播视频流。
一种可行的实施方式中,所述直播视频流转换装置还包括:
构建模块305,用于基于直播游戏场景中的场景视频图像数据构建所述预设的查找表;
设置模块306,用于获取视频编码码率,并根据所述视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到所述预设的编码器。
一种可行的实施方式中,所述构建模块305具体用于:
从直播游戏场景中获取场景视频图像数据,并对所述场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据;
通过预设调色软件对所述高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到所述预设的查找表。
本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
上面图3和图4从模块化的角度对本发明实施例中的直播视频流转换装置进行详细描述,下面从硬件处理的角度对本发明实施例中直播视频流转换设备进行详细描述。
图5是本发明实施例提供的一种直播视频流转换设备的结构示意图,该直播视频流转换设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对直播视频流转换设备500中的一系列计算机程序操作。更进一步地,处理器510可以设置为与存储介质530通信,在直播视频流转换设备500上执行存储介质530中的一系列计算机程序操作,以使得所述库文件的生成设备500执行所述直播视频流转换方法的步骤,例如:
获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
一种可行的实施方式中,所述对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据,包括:获取所述标准动态范围直播视频流对应的视频编码格式;将所述标准动态范围直播视频流输入至与所述视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。
一种可行的实施方式中,所述对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据,包括:对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据;对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据;通过感知量化映射函数将所述转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
一种可行的实施方式中,所述对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据,包括:根据所述标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数;按照所述目标线性转换函数对所述解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。
一种可行的实施方式中,所述对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据,包括:按照预设色域转换算法将所述线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,所述第一色彩空间为BT.709色彩空间,所述第二色彩空间为BT.2020色彩空间。
一种可行的实施方式中,所述基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据,包括:从所述预设的查找表中提取所述至少一种图像参数的映射关系,所述图像参数包括:亮度、色相、饱和度中的一种或多种;根据所述至少一种图像参数的映射关系对所述转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。
一种可行的实施方式中,所述通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,包括:将所述处理后的直播视频图像数据输入至预设的编码器,并通过所述编码器从所述处理后的直播视频图像数据中提取色度分量和亮度分量;其中,所述编码器为基于图形处理器的高效视频编码器,且所述编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,所述色度量化偏移参数用于调节所述亮度量化参数和所述色度量化参数之间的平衡关系;基于所述亮度量化参数、所述色度量化参数和所述色度量化偏移参数对所述色度分量和所述亮度分量进行视频编码处理,输出高动态范围直播视频流。
一种可行的实施方式中,在所述获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据之前,所述直播视频流转换方法还包括:基于直播游戏场景中的场景视频图像数据构建所述预设的查找表;获取视频编码码率,并根据所述视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到所述预设的编码器。
一种可行的实施方式中,所述基于直播游戏场景中的场景视频图像数据构建所述预设的查找表,包括:从直播游戏场景中获取场景视频图像数据,并对所述场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据;通过预设调色软件对所述高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到所述预设的查找表。
直播视频流转换设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作***531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的直播视频流转换设备结构并不构成对直播视频流转换设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述直播视频流转换方法的步骤,例如:
获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
本发明实施例中,通过对标准动态范围直播视频流进行解码和图像格式转换处理,得到转换后的直播视频图像数据,基于预设的查找表将转换后的直播视频图像数据中的至少一种图像参数从第一参数范围映射至第二参数范围,得到处理后的直播视频图像数据,通过预设的编码器对处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,通过查找表的动态范围扩展提高了视频转换速度和转换效果,以及通过预设的编码器消除了视频编码的色度失真。
一种可行的实施方式中,所述对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据,包括:获取所述标准动态范围直播视频流对应的视频编码格式;将所述标准动态范围直播视频流输入至与所述视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。
一种可行的实施方式中,所述对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据,包括:对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据;对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据;通过感知量化映射函数将所述转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
一种可行的实施方式中,所述对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据,包括:根据所述标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数;按照所述目标线性转换函数对所述解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。
一种可行的实施方式中,所述对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据,包括:按照预设色域转换算法将所述线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,所述第一色彩空间为BT.709色彩空间,所述第二色彩空间为BT.2020色彩空间。
一种可行的实施方式中,所述基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据,包括:从所述预设的查找表中提取所述至少一种图像参数的映射关系,所述图像参数包括:亮度、色相、饱和度中的一种或多种;根据所述至少一种图像参数的映射关系对所述转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。
一种可行的实施方式中,所述通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,包括:将所述处理后的直播视频图像数据输入至预设的编码器,并通过所述编码器从所述处理后的直播视频图像数据中提取色度分量和亮度分量;其中,所述编码器为基于图形处理器的高效视频编码器,且所述编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,所述色度量化偏移参数用于调节所述亮度量化参数和所述色度量化参数之间的平衡关系;基于所述亮度量化参数、所述色度量化参数和所述色度量化偏移参数对所述色度分量和所述亮度分量进行视频编码处理,输出高动态范围直播视频流。
一种可行的实施方式中,在所述获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据之前,所述直播视频流转换方法还包括:基于直播游戏场景中的场景视频图像数据构建所述预设的查找表;获取视频编码码率,并根据所述视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到所述预设的编码器。
一种可行的实施方式中,所述基于直播游戏场景中的场景视频图像数据构建所述预设的查找表,包括:从直播游戏场景中获取场景视频图像数据,并对所述场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据;通过预设调色软件对所述高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到所述预设的查找表。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种直播视频流转换方法,其特征在于,所述直播视频流转换方法包括:
获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;
对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;
基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;
通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
2.根据权利要求1所述的直播视频流转换方法,其特征在于,所述对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据,包括:
获取所述标准动态范围直播视频流对应的视频编码格式;
将所述标准动态范围直播视频流输入至与所述视频编码格式对应的解码器进行解码,得到解码后的直播视频图像数据。
3.根据权利要求1所述的直播视频流转换方法,其特征在于,所述对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据,包括:
对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据;
对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据;
通过感知量化映射函数将所述转换后的RGB色彩空间图像数据转换至亮度线性空间,得到转换后的直播视频图像数据。
4.根据权利要求3所述的直播视频流转换方法,其特征在于,所述对所述解码后的直播视频图像数据进行线性化处理,得到线性直播视频图像数据,包括:
根据所述标准动态范围直播视频流对应的非线性转换函数确定目标线性转换函数;
按照所述目标线性转换函数对所述解码后的直播视频图像数据中的像素颜色值进行转换,得到线性直播视频图像数据。
5.根据权利要求3所述的直播视频流转换方法,其特征在于,所述对所述线性直播视频图像数据进行色彩空间转换,得到转换后的RGB色彩空间图像数据,包括:
按照预设色域转换算法将所述线性直播视频图像数据中的RGB像素值从第一色彩空间转换至第二色彩空间,得到转换后的RGB色彩空间图像数据,所述第一色彩空间为BT.709色彩空间,所述第二色彩空间为BT.2020色彩空间。
6.根据权利要求1所述的直播视频流转换方法,其特征在于,所述基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据,包括:
从所述预设的查找表中提取所述至少一种图像参数的映射关系,所述图像参数包括:亮度、色相、饱和度中的一种或多种;
根据所述至少一种图像参数的映射关系对所述转换后的直播视频图像数据中的RGB像素值进行映射处理,得到处理后的直播视频图像数据。
7.根据权利要求1所述的直播视频流转换方法,其特征在于,所述通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流,包括:
将所述处理后的直播视频图像数据输入至预设的编码器,并通过所述编码器从所述处理后的直播视频图像数据中提取色度分量和亮度分量;其中,所述编码器为基于图形处理器的高效视频编码器,且所述编码器包括亮度量化参数、色度量化参数和色度量化偏移参数,所述色度量化偏移参数用于调节所述亮度量化参数和所述色度量化参数之间的平衡关系;
基于所述亮度量化参数、所述色度量化参数和所述色度量化偏移参数对所述色度分量和所述亮度分量进行视频编码处理,输出高动态范围直播视频流。
8.根据权利要求1-7中任一项所述的直播视频流转换方法,其特征在于,在所述获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据之前,所述直播视频流转换方法还包括:
基于直播游戏场景中的场景视频图像数据构建所述预设的查找表;
获取视频编码码率,并根据所述视频编码码率对基于图形处理器的高效视频编码器优化设置色度量化偏移参数,得到所述预设的编码器。
9.根据权利要求8所述的直播视频流转换方法,其特征在于,所述基于直播游戏场景中的场景视频图像数据构建所述预设的查找表,包括:
从直播游戏场景中获取场景视频图像数据,并对所述场景视频图像数据进行图像格式转换处理,得到高动态范围格式的图像数据;
通过预设调色软件对所述高动态范围格式的图像数据进行亮度对比度增强与色彩调节,得到所述预设的查找表。
10.一种直播视频流转换装置,其特征在于,所述直播视频流转换装置包括:
解码模块,用于获取标准动态范围直播视频流,并对所述标准动态范围直播视频流进行解码,得到解码后的直播视频图像数据;
转换模块,用于对所述解码后的直播视频图像数据进行图像格式转换处理,得到转换后的直播视频图像数据;
映射模块,用于基于预设的查找表对所述转换后的直播视频图像数据进行映射处理,得到处理后的直播视频图像数据;其中,所述查找表中包括至少一种图像参数的映射关系;所述映射关系用于将所述图像参数从第一参数范围映射至第二参数范围;所述第二参数范围大于所述第一参数范围;
编码模块,用于通过预设的编码器对所述处理后的直播视频图像数据进行编码处理,得到高动态范围直播视频流。
11.一种直播视频流转换设备,其特征在于,所述直播视频流转换设备包括:存储器和至少一个处理器,所述存储器中存储有计算机程序;
所述至少一个处理器调用所述存储器中的所述计算机程序,以使得所述直播视频流转换设备执行如权利要求1-9中任意一项所述的直播视频流转换方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9中任意一项所述的直播视频流转换方法。
CN202210850922.6A 2022-07-19 2022-07-19 直播视频流转换方法、装置、设备及存储介质 Pending CN115442636A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210850922.6A CN115442636A (zh) 2022-07-19 2022-07-19 直播视频流转换方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210850922.6A CN115442636A (zh) 2022-07-19 2022-07-19 直播视频流转换方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115442636A true CN115442636A (zh) 2022-12-06

Family

ID=84240826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210850922.6A Pending CN115442636A (zh) 2022-07-19 2022-07-19 直播视频流转换方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115442636A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107154059A (zh) * 2017-06-26 2017-09-12 杭州当虹科技有限公司 一种高动态范围视频处理方法
CN108882028A (zh) * 2018-07-05 2018-11-23 华为技术有限公司 视频信号的处理方法及装置
US20190318448A1 (en) * 2018-04-17 2019-10-17 Grass Valley Canada System and method for mapped splicing of a three-dimensional look-up table for image format conversion
CN111918066A (zh) * 2020-09-08 2020-11-10 北京字节跳动网络技术有限公司 视频编码方法、装置、设备及存储介质
CN113068034A (zh) * 2021-03-25 2021-07-02 Oppo广东移动通信有限公司 视频编码方法及装置、编码器、设备、存储介质
CN113518185A (zh) * 2020-12-30 2021-10-19 腾讯科技(深圳)有限公司 视频转换处理方法、装置、计算机可读介质及电子设备
CN114363702A (zh) * 2021-12-28 2022-04-15 上海网达软件股份有限公司 Sdr视频转换为hdr视频的方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107154059A (zh) * 2017-06-26 2017-09-12 杭州当虹科技有限公司 一种高动态范围视频处理方法
US20190318448A1 (en) * 2018-04-17 2019-10-17 Grass Valley Canada System and method for mapped splicing of a three-dimensional look-up table for image format conversion
CN108882028A (zh) * 2018-07-05 2018-11-23 华为技术有限公司 视频信号的处理方法及装置
CN111918066A (zh) * 2020-09-08 2020-11-10 北京字节跳动网络技术有限公司 视频编码方法、装置、设备及存储介质
CN113518185A (zh) * 2020-12-30 2021-10-19 腾讯科技(深圳)有限公司 视频转换处理方法、装置、计算机可读介质及电子设备
CN113068034A (zh) * 2021-03-25 2021-07-02 Oppo广东移动通信有限公司 视频编码方法及装置、编码器、设备、存储介质
CN114363702A (zh) * 2021-12-28 2022-04-15 上海网达软件股份有限公司 Sdr视频转换为hdr视频的方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
JP7114653B2 (ja) 高ダイナミックレンジおよび広色域シーケンスを符号化するシステム
US11183143B2 (en) Transitioning between video priority and graphics priority
KR102488954B1 (ko) 영상 처리 장치 및 그의 영상 처리 방법
JP6608067B2 (ja) 映像復号化器における高ダイナミックレンジ適応演算
CN107211130B (zh) 对彩色画面进行编码和解码的方法和装置
US10972759B2 (en) Color appearance preservation in video codecs
KR101346008B1 (ko) 고 동적 범위, 가시 동적 범위, 및 광색역 비디오의 층상 압축
JP6694439B2 (ja) 色マッピング情報を符号化し且つ色マッピング情報に基づきピクチャを処理する方法及び装置
KR102176398B1 (ko) 영상처리장치 및 영상처리방법
KR102523233B1 (ko) 컬러 픽처를 디코딩하는 방법 및 디바이스
KR102509504B1 (ko) 코딩 및 디코딩 방법과 대응하는 디바이스
EP3493150A1 (en) Tone mapping adaptation for saturation control
US20200296428A1 (en) A method and a device for encoding a high dynamic range picture, corresponding decoding method and decoding device
KR20120107429A (ko) 구역 기반의 톤 매핑
GB2568326A (en) Video image processing
US20090060324A1 (en) Image enhancement and compression
JP2018530031A (ja) パラメトリック・トーン調整関数を使用してピクチャをトーン・マッピングする方法およびデバイス
EP3453175B1 (en) Method and apparatus for encoding/decoding a high dynamic range picture into a coded bistream
TW201626801A (zh) 使用顯著圖之視訊編碼技術
WO2019203973A1 (en) Method and device for encoding an image or video with optimized compression efficiency preserving image or video fidelity
EP3026908A1 (en) Method and device for quantizing and de-quantizing a picture using scaling factors for chrominance based on luminance
CN115442636A (zh) 直播视频流转换方法、装置、设备及存储介质
CN114205586A (zh) 基于多色彩空间进行率失真优化的视频处理方法及应用
CN116167950B (zh) 图像处理方法、装置、电子设备及存储介质
Okuda et al. Raw image encoding based on polynomial approximation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination