CN110225339A - 一种hevc视频序列编解码加速方法 - Google Patents
一种hevc视频序列编解码加速方法 Download PDFInfo
- Publication number
- CN110225339A CN110225339A CN201910390721.0A CN201910390721A CN110225339A CN 110225339 A CN110225339 A CN 110225339A CN 201910390721 A CN201910390721 A CN 201910390721A CN 110225339 A CN110225339 A CN 110225339A
- Authority
- CN
- China
- Prior art keywords
- frame
- coding unit
- unit
- coding
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Discrete Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种HEVC视频序列编解码加速方法,包括对原始视频流进行解码,提取最大编码单元LCU以及预测单元PU1,计算当前预测单元PU1的复杂度;根据预测单元PU1的复杂度进行块大小划分,得到解码后的原始视频流编码单元CU1;根据编码单元CU1及预测单元PU1,记录原始视频流量化步长QP1;对解码后的视频流进行再编码,设定再编码流量化步长QP2,同时提取待编码帧前一帧的编码单元CU2和编码后的1~N‑1帧的编码单元CU3;根据编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元;根据预测单元PU1确定最终的预测单元模式;根据当前编码帧的编码单元的深度信息类别,决定当前编码帧的编码单元划分模式。本发明大幅减少了CU模式和PU模式的计算复杂度。
Description
技术领域
本发明涉及视频编解码技术领域,更具体的说是涉及一种HEVC视频序列编解码加速方法。
背景技术
当前社会是一个信息交互高度发达的社会,相比于传统的文本图片等形式,视频展现出的信息具有更加生动、直观的优势,因而受到更广泛的关注。随着人们对视频质量要求的不断提高,以H.264为代表的第二代视频编码标准已经逐渐无法满足对高清、超高清视频的压缩要求。2013年1月,ISO/IEC Moving Picture Experts Group(MPEG)和ITU-TVideo Coding Experts Group(VCEG)联合制定了新一代视频编码标准HEVC(HighEfficiency Video Coding)。与上一代编码标准相比,HEVC展现出了显著的优势。在得到视频质量相同的情况下,仅需要原来50%的码率,具有广阔的应用前景。
因此,如何提供一种HEVC视频序列编解码加速方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种HEVC视频序列编解码加速方法,降低了编解码时间。
为了实现上述目的,本发明采用如下技术方案:
一种HEVC视频序列编解码加速方法,包括以下步骤:
步骤1:对原始视频流进行解码,提取最大编码单元LCU以及预测单元PU1,将最大编码单元LCU内部可进行操作的点进行梯度计算,得到当前点周边像素值的变化情况;
步骤2:将预测单元模式信息PU1内所有点的梯度计算结果相加,得到当前预测单元PU1的复杂度;
步骤3:根据当前预测单元PU1的复杂度进行块大小划分,得到解码后的原始视频流编码单元CU1;
步骤4:根据原始视频流编码单元CU1及预测单元PU1,记录原始视频流量化步长QP1,其中,解码后的视频流1~N帧为训练帧,剩余帧为加速帧,0<N<M,M为解码后的视频流总帧数;
步骤5、对解码后的视频流进行再编码,设定再编码流量化步长QP2,同时提取待编码帧前一帧的编码单元CU2和编码后的1~N-1帧的编码单元CU3;
步骤6、根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元;
步骤7、根据解码后的预测单元PU1确定最终的预测单元模式;
步骤8、根据步骤6得到的当前编码帧的编码单元的深度信息类别,决定当前编码帧的编码单元划分模式。
进一步,引入梯度算法,大致获得当前预测单元PU1的图像复杂度,具体计算过程为:
基于sobel算子的计算,获得当前像素点在X、Y两个不同方向上的梯度值;
基于sobel算子的梯度计算步骤为:
将当前像素点左侧和右侧的3个点像素值按1∶2∶1加权后相减,得到X方向的梯度变化情况Gx,将当前像素点上下两侧3个点像素值按1∶2∶1加权后相减,得到Y方向的梯度变化情况Gy,Gx及Gy的计算如下:
Gx=Pi-1,j-1+2*Pi-1,j+Pi-1,j+1-Pi+1,j-1-2*Pi+1,j-Pi+1,j+1
Gy=Pi-1,j-1+2*Pi,j-1+Pi+1,j-1-Pi-1,j+1-2*Pi,j+1-Pi+1,j+1 (1)
式中,Px,y指不同像素点的数值,下标i,j分别代表其在X、Y轴方向上与中心点的位置关系;
对某一个预测单元PU1,将其中所有点的梯度值相加得到当前PU1的图像复杂度K,其公式如公式(2)所示:
K=∑(|Gx|+|Gy|) (2)
依据图像复杂度信息,确定原始视频流编码单元CU1。
进一步,步骤6中根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元,具体方法为:
步骤6.1、以解码后的原始视频流第2~N帧的编码单元及待编码帧前一帧的编码单元CU2即1~N-1帧的编码单元信息作为adaboost分类器的两个特征,以编码后的1~N-1帧的编码单元CU3为训练结果,对adaboost分类器进行训练,得到训练完成的adaboost分类器;
步骤6.2、取解码后的视频流加速帧中的编码单元信息和待编码帧前一帧编码单元信息为分类器的两个特征,利用训练完成的分类器,训练得到当前编码帧的编码单元信息。
进一步,步骤6中得到的当前编码帧的编码单元深度信息为0,1,2,3四类。
进一步,步骤7中根据解码后的预测单元模式PU1确定最终的预测单元模式,具体确定方法为:
步骤7.1、设定预测单元模式信息PU候选列表,所述候选列表包括原有预测单元模式和2N*2N预测单元模式;
步骤7.2、利用率失真函数计算两种预测单元模式信息PU的率失真代价,选择率失真代价小的模式作为最终的PU模式。
进一步,步骤7.2中利用率失真函数计算两种预测单元模式信息PU的率失真代价,具体为:
J=D(Motion)+λModeR(Motion) (3)
式中,J为率失真代价,D(Motion)、R(Motion)分别表示运动模式下的失真数和比特数;λMode表示拉格朗日因子,为常数。
进一步,步骤8中根据步骤6得到的当前编码帧的编码单元的深度信息类别,决定当前编码帧的编码单元划分模式,具体决定方法为:
若深度信息为0类,则设定标志:在64*64尺寸时不进行编码单元分割,深度信息为0类为最优编码单元信息深度;
若深度信息为1类,则跳过64*64大小的率失真代价计算,并设定标志:当尺寸为32*32时,不进行编码单元信息分割;
若深度信息为2类,则跳过64*64及32*32大小的率失真代价计算,并设定标志:当尺寸为16*16时,不进行编码单元信息分割;
若深度信息为3类,则跳过64*64、32*32及16*16大小的率失真代价计算,无需设定flag终止编码单元信息划分。
进一步,N的取值为10。
进一步,QP2>;QP1。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种HEVC视频序列编解码加速方法,具有以下优点:
1)本发明综合考量CU和PU的编码计算复杂度,从两方面着手降低编码时间。
2)本发明从原始码流中包含的信息出发,在解码端获取所需模式信息,在编码端加以处理利用,流程科学合理,方法易于理解。
3)本发明通过分析实验结果,对CU和PU模式分两种方法处理。CU选用adaboost分类器,通过训练学习,对当前帧CU模式进行分类,免除了冗杂的CU模式率失真代价计算;PU通过实验数据,分析出PU size大量集中的两种模式,大幅减少PU模式的计算复杂度。
4)在处理CU模式时,选取与当前编码帧关联性最大的两个CU模式,原始码流对应帧和当前码流前一帧的信息作为adaboost分类器的输入特征,保证了结果的高精确度。
5)将视频编码与机器学习结合起来,选用的adaboost分类器是所有机器学习方法中表现较好的分类器之一,并且且该类分类器具有便于实现,泛化错误率低且无参数调整等优势。
6)处理PU模式时,将其分为帧内帧间两部分处理,使两种类别的模式决定均能实现时间节省。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的基于HEVC视频序列编解码加速方法的流程图。
图2附图为本发明编码单元信息模式的结构划分及对应深度示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种HEVC视频序列编解码加速方法,包括以下步骤:
步骤1:对原始视频流进行解码,提取最大编码单元LCU以及预测单元PU1,将最大编码单元LCU内部可进行操作的点进行梯度计算,得到当前点周边像素值的变化情况;
步骤2:将预测单元模式信息PU1内所有点的梯度计算结果相加,得到当前预测单元PU1的复杂度;具体为:
引入梯度算法,大致获得当前预测单元PU1的图像复杂度,具体计算过程为:
基于sobel算子的计算,获得当前像素点在X、Y两个不同方向上的梯度值;
基于sobel算子的梯度计算步骤为:
将当前像素点左侧和右侧的3个点像素值按1∶2∶1加权后相减,得到X方向的梯度变化情况Gx,将当前像素点上下两侧3个点像素值按1∶2∶1加权后相减,得到Y方向的梯度变化情况Gy,Gx及Gy的计算如下:
Gx=Pi-1,j-1+2*Pi-1,j+Pi-1,j+1-Pi+1,j-1-2*Pi+1,j-Pi+1,j+1
Gy=Pi-1,j-1+2*Pi,j-1+Pi+1,j-1-Pi-1,j+1-2*Pi,j+1-Pi+1,j+1 (1)
式中,Px,y指不同像素点的数值,下标i,j分别代表其在X、Y轴方向上与中心点的位置关系;
对某一个预测单元PU1,将其中所有点的梯度值相加得到当前PU1的图像复杂度K,其公式如公式(2)所示:
K=∑(|Gx|+|Gy|) (2)
依据图像复杂度信息,得出最有可能的块大小划分方法。这里的判断可以根据经验阈值完成,下面给出一种基于经验阈值,从大块到小块依次判断的划分方法。
以64x64块为例,如果64x64块中每一个32x32子块的图像复杂度均小于某一阈值,则可认为这个64x64块图像复杂度较低,不需要划分,此时选用64x64作为最有可能的块大小划分;若不满足,则将64x64块划分为4个32x32子块,并对四个32x32子块依次进行图像复杂度分析。依次类推,可以完成32x32、16x16、8x8块的划分选择,并最后得到最有可能的块大小划分方案。这里的经验阈值与图像特性相关,一个可能的经验阈值方案如下表所示
预测单元大小 | 经验阈值 |
64x64 | 13000 |
32x32 | 5000 |
16x16 | 4000 |
8x8 | 3000 |
通过梯度算法,可以快速得出PU1的图像复杂度,继而依据图像复杂度数据可以完成一个最大编码单元(LCU)的块大小划分,得到解码后的原始视频流编码单元CU1。
步骤3:根据当前预测单元PU1的复杂度进行块大小划分,得到解码后的原始视频流编码单元CU1;
步骤4:根据原始视频流编码单元CU1及预测单元PU1,记录原始视频流量化步长QP1,其中,解码后的视频流1~N帧为训练帧,剩余帧为加速帧,0<N<M,M为解码后的视频流总帧数;
步骤5、对解码后的视频流进行再编码,设定再编码流量化步长QP2,同时提取待编码帧前一帧的编码单元CU2和编码后的1~N-1帧的编码单元CU3;
步骤6、根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元;具体为:
步骤6.1、以解码后的原始视频流第2~N帧的编码单元及待编码帧前一帧的编码单元CU2即1~N-1帧的编码单元信息作为adaboost分类器的两个特征,以编码后的1~N-1帧的编码单元CU3为训练结果,对adaboost分类器进行训练,得到训练完成的adaboost分类器;
步骤6.2、取解码后的视频流加速帧中的编码单元信息和待编码帧前一帧编码单元信息为分类器的两个特征,利用训练完成的分类器,训练得到当前编码帧的编码单元信息。
当前编码帧的编码单元深度信息为0,1,2,3四类。
步骤7、根据解码后的预测单元PU1确定最终的预测单元模式;具体为:
步骤7.1、设定预测单元模式信息PU候选列表,所述候选列表包括原有预测单元模式和2N*2N预测单元模式;
步骤7.2、利用率失真函数计算两种预测单元模式信息PU的率失真代价,选择率失真代价小的模式作为最终的PU模式,其计算公式为:
J=D(Motion)+λModeR(Motion) (3)
式中,J为率失真代价,D(Motion)、R(Motion)分别表示运动模式下的失真数和比特数;λMode表示拉格朗日因子,为常数。
步骤8、根据步骤6得到的当前编码帧的编码单元的深度信息类别,决定当前编码帧的编码单元划分模式。具体决定方法为:
若深度信息为0类,则设定标志:在64*64尺寸时不进行编码单元分割,深度信息为0类为最优编码单元信息深度;
若深度信息为1类,则跳过64*64大小的率失真代价计算,并设定标志:当尺寸为32*32时,不进行编码单元信息分割;
若深度信息为2类,则跳过64*64及32*32大小的率失真代价计算,并设定标志:当尺寸为16*16时,不进行编码单元信息分割;
若深度信息为3类,则跳过64*64、32*32及16*16大小的率失真代价计算,无需设定flag终止编码单元信息划分。
进一步,N的取值为10。
本发明公开的一种HEVC视频序列编解码加速方法适用于各种特征的视频编解码,包括不同视频分辨率(包括高分辨率,中分辨率,低分辨率);不同视频运动类型(包括高速运动,中速运动,低速运动),不同视频纹理(包括细致纹理,粗糙纹理等多种类型)等。
本发明在同一视频序列中既实现了数据的提取训练过程,同时利用预测出的结果进行编码,即做到了视频的训练和加速编码过程的一体化,不需要预先训练分类器,保证了结果的准确性和实时性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种HEVC视频序列编解码加速方法,其特征在于,包括以下步骤:
步骤1:对原始视频流进行解码,提取最大编码单元LCU以及预测单元PU1,将最大编码单元LCU内部可进行操作的点进行梯度计算,得到当前点周边像素值的变化情况;
步骤2:将预测单元模式信息PU1内所有点的梯度计算结果相加,得到当前预测单元PU1的复杂度;
步骤3:根据当前预测单元PU1的复杂度进行块大小划分,得到解码后的原始视频流编码单元CU1;
步骤4:根据原始视频流编码单元CU1及预测单元PU1,记录原始视频流量化步长QP1,其中,解码后的视频流1~N帧为训练帧,剩余帧为加速帧,0<N<M,M为解码后的视频流总帧数;
步骤5、对解码后的视频流进行再编码,设定再编码流量化步长QP2,同时提取待编码帧前一帧的编码单元CU2和编码后的1~N-1帧的编码单元CU3;
步骤6、根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元;
步骤7、根据解码后的预测单元PU1确定最终的预测单元模式;
步骤8、根据步骤6得到的当前编码帧的编码单元的深度信息类别,决定当前编码帧的编码单元划分模式。
2.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,引入梯度算法,大致获得当前预测单元PU1的图像复杂度,具体计算过程为:
基于sobel算子的计算,获得当前像素点在X、Y两个不同方向上的梯度值;
基于sobel算子的梯度计算步骤为:
将当前像素点左侧和右侧的3个点像素值按1∶2∶1加权后相减,得到X方向的梯度变化情况Gx,将当前像素点上下两侧3个点像素值按1∶2∶1加权后相减,得到Y方向的梯度变化情况Gy,Gx及Gy的计算如下:
Gx=Pi-1,j-1+2*Pi-1,j+Pi-1,j+1-Pi+1,j-1-2*Pi+1,j-Pi+1,j+1
Gy=Pi-1,j-1+2*Pi,j-1+Pi+1,j-1-Pi-1,j+1-2*Pi,j+1-Pi+1,j+1 (1)
式中,Px,y指不同像素点的数值,下标i,j分别代表其在X、Y轴方向上与中心点的位置关系;
对某一个预测单元PU1,将其中所有点的梯度值相加得到当前PU1的图像复杂度K,其公式如公式(2)所示:
K=∑(|Gx|+|Gy|) (2)
依据图像复杂度信息,确定原始视频流编码单元CU1。
3.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,步骤6中根据解码后的原始视频流编码单元CU1、待编码帧前一帧的编码单元CU2得到当前编码帧的编码单元,具体方法为:
步骤6.1、以解码后的原始视频流第2~N帧的编码单元及待编码帧前一帧的编码单元CU2即1~N-1帧的编码单元信息作为adaboost分类器的两个特征,以编码后的1~N-1帧的编码单元CU3为训练结果,对adaboost分类器进行训练,得到训练完成的adaboost分类器;
步骤6.2、取解码后的视频流加速帧中的编码单元信息和待编码帧前一帧编码单元信息为分类器的两个特征,利用训练完成的分类器,训练得到当前编码帧的编码单元信息。
4.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,步骤6中得到的当前编码帧的编码单元深度信息为0,1,2,3四类。
5.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,步骤7中根据解码后的预测单元模式PU1确定最终的预测单元模式,具体确定方法为:
步骤7.1、设定预测单元模式信息PU候选列表,所述候选列表包括原有预测单元模式和2N*2N预测单元模式;
步骤7.2、利用率失真函数计算两种预测单元模式信息PU的率失真代价,选择率失真代价小的模式作为最终的PU模式。
6.根据权利要求5所述的一种HEVC视频序列编解码加速方法,其特征在于,步骤7.2中利用率失真函数计算两种预测单元模式信息PU的率失真代价,具体为:
J=D(Motion)+λModeR(Motion) (3)
式中,J为率失真代价,D(Motion)、R(Motion)分别表示运动模式下的失真数和比特数;λMode表示拉格朗日因子,为常数。
7.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,步骤8中根据步骤6得到的当前编码帧的编码单元的深度信息类别,决定当前编码帧的编码单元划分模式,具体决定方法为:
若深度信息为0类,则设定标志:在64*64尺寸时不进行编码单元分割,深度信息为0类为最优编码单元信息深度;
若深度信息为1类,则跳过64*64大小的率失真代价计算,并设定标志:当尺寸为32*32时,不进行编码单元信息分割;
若深度信息为2类,则跳过64*64及32*32大小的率失真代价计算,并设定标志:当尺寸为16*16时,不进行编码单元信息分割;
若深度信息为3类,则跳过64*64、32*32及16*16大小的率失真代价计算,无需设定flag终止编码单元信息划分。
8.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,N的取值为10。
9.根据权利要求1所述的一种HEVC视频序列编解码加速方法,其特征在于,QP2>;QP1。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910390721.0A CN110225339A (zh) | 2019-05-10 | 2019-05-10 | 一种hevc视频序列编解码加速方法 |
US16/969,947 US11212518B2 (en) | 2019-05-10 | 2019-05-14 | Method for accelerating coding and decoding of an HEVC video sequence |
PCT/CN2019/086747 WO2020227911A1 (zh) | 2019-05-10 | 2019-05-14 | 一种hevc视频序列编解码加速方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910390721.0A CN110225339A (zh) | 2019-05-10 | 2019-05-10 | 一种hevc视频序列编解码加速方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110225339A true CN110225339A (zh) | 2019-09-10 |
Family
ID=67820779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910390721.0A Pending CN110225339A (zh) | 2019-05-10 | 2019-05-10 | 一种hevc视频序列编解码加速方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11212518B2 (zh) |
CN (1) | CN110225339A (zh) |
WO (1) | WO2020227911A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113573067A (zh) * | 2021-07-07 | 2021-10-29 | 网宿科技股份有限公司 | 一种视频编码的方法及装置 |
CN116600119A (zh) * | 2023-07-18 | 2023-08-15 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、计算机设备和存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115941962A (zh) * | 2021-09-30 | 2023-04-07 | 深圳市中兴微电子技术有限公司 | 视频编码单元划分方法、装置、计算机设备和可读介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104883566A (zh) * | 2015-05-27 | 2015-09-02 | 复旦大学 | 一种适用于hevc标准的帧内预测块大小划分的快速算法 |
CN107734331A (zh) * | 2017-11-17 | 2018-02-23 | 南京理工大学 | 一种基于hevc标准的视频转码方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5973434B2 (ja) * | 2011-06-23 | 2016-08-23 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 画像フィルタ装置、フィルタ方法および動画像復号装置 |
US9232237B2 (en) * | 2011-08-05 | 2016-01-05 | Texas Instruments Incorporated | Block-based parallel deblocking filter in video coding |
WO2013068564A1 (en) * | 2011-11-11 | 2013-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Effective wedgelet partition coding using spatial prediction |
KR20230098693A (ko) * | 2011-11-11 | 2023-07-04 | 지이 비디오 컴프레션, 엘엘씨 | 분할 코딩을 이용한 효과적인 예측 |
IN2014KN01047A (zh) * | 2011-11-11 | 2015-10-09 | Fraunhofer Ges Forschung | |
EP2777286B1 (en) * | 2011-11-11 | 2017-01-04 | GE Video Compression, LLC | Effective wedgelet partition coding |
US9924183B2 (en) | 2014-03-20 | 2018-03-20 | Nanjing Yuyan Information Technology Ltd. | Fast HEVC transcoding |
CN105430407B (zh) * | 2015-12-03 | 2018-06-05 | 同济大学 | 应用于h.264到hevc转码的快速帧间模式决策方法 |
BR112019018922A8 (pt) * | 2017-03-16 | 2023-02-07 | Mediatek Inc | Método e aparelho de refinamento de movimento com base em fluxo óptico bi-direcional para codificação de vídeo |
WO2018235405A1 (ja) * | 2017-06-23 | 2018-12-27 | ソニー株式会社 | 画像処理装置と画像処理方法 |
CN107483931B (zh) * | 2017-08-01 | 2019-10-08 | 南京邮电大学 | 一种基于显著度的hevc帧内编码深度划分快速决策方法 |
AU2019242247B2 (en) * | 2018-03-30 | 2022-12-22 | FG Innovation Company Limited | Systems and methods for applying deblocking filters to reconstructed video data |
US10867414B2 (en) * | 2018-04-10 | 2020-12-15 | Apple Inc. | Point cloud attribute transfer algorithm |
EP3709644A1 (en) * | 2019-03-12 | 2020-09-16 | Ateme | Method for image processing and apparatus for implementing the same |
JP7231727B2 (ja) * | 2018-11-05 | 2023-03-01 | 北京字節跳動網絡技術有限公司 | 精緻化を伴うインター予測のための補間 |
US20200329233A1 (en) * | 2019-04-12 | 2020-10-15 | Frank Nemirofsky | Hyperdata Compression: Accelerating Encoding for Improved Communication, Distribution & Delivery of Personalized Content |
-
2019
- 2019-05-10 CN CN201910390721.0A patent/CN110225339A/zh active Pending
- 2019-05-14 US US16/969,947 patent/US11212518B2/en active Active
- 2019-05-14 WO PCT/CN2019/086747 patent/WO2020227911A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104883566A (zh) * | 2015-05-27 | 2015-09-02 | 复旦大学 | 一种适用于hevc标准的帧内预测块大小划分的快速算法 |
CN107734331A (zh) * | 2017-11-17 | 2018-02-23 | 南京理工大学 | 一种基于hevc标准的视频转码方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113573067A (zh) * | 2021-07-07 | 2021-10-29 | 网宿科技股份有限公司 | 一种视频编码的方法及装置 |
CN116600119A (zh) * | 2023-07-18 | 2023-08-15 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、计算机设备和存储介质 |
CN116600119B (zh) * | 2023-07-18 | 2023-11-03 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20210203919A1 (en) | 2021-07-01 |
US11212518B2 (en) | 2021-12-28 |
WO2020227911A1 (zh) | 2020-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104735454B (zh) | 通过使用大变换单元对图像进行编码和解码的方法和设备 | |
TWI445411B (zh) | 在譯碼單元之視頻譯碼中執行局部運動向量推導之方法與相應裝置 | |
CN103797800B (zh) | 推导参考模式值以及编码和解码表示预测模式的信息 | |
CN107371022B (zh) | 应用于hevc医学影像无损编码的帧间编码单元快速划分方法 | |
CN108174204B (zh) | 一种基于决策树的帧间快速模式选择方法 | |
CN108495135A (zh) | 一种屏幕内容视频编码的快速编码方法 | |
CN105306947B (zh) | 基于机器学习的视频转码方法 | |
Hu et al. | Fast HEVC intra mode decision based on logistic regression classification | |
CN110225339A (zh) | 一种hevc视频序列编解码加速方法 | |
CN108174208B (zh) | 一种基于特征分类的高效视频编码方法 | |
CN1262496A (zh) | 使用正交变换域中的块匹配进行运动估测的方法和装置 | |
CN103297781A (zh) | 一种基于纹理方向的hevc帧内编码方法、装置和*** | |
Ma et al. | Convolutional neural network-based arithmetic coding for HEVC intra-predicted residues | |
CN105027560A (zh) | 确定用于变换系数的二进制码字的方法 | |
Islam et al. | Image compression with recurrent neural network and generalized divisive normalization | |
JP2006165840A (ja) | 動き補償画像符号化装置及び符号化方法 | |
CN109068142A (zh) | 基于纹理特征的360度视频帧内预测快速决策 | |
CN106937116A (zh) | 基于随机训练集自适应学习的低复杂度视频编码方法 | |
CN107710763A (zh) | 用于对数字图像进行编码的方法、解码方法、装置和相关计算机程序 | |
CN108353175A (zh) | 使用系数引起的预测处理视频信号的方法和装置 | |
CN109936742A (zh) | 对视频序列进行编码的方法、编码装置和存储介质 | |
CN104883566A (zh) | 一种适用于hevc标准的帧内预测块大小划分的快速算法 | |
CN107734331A (zh) | 一种基于hevc标准的视频转码方法 | |
CN110149512A (zh) | 帧间预测加速方法、控制装置、电子装置、计算机存储介质及设备 | |
CN103828366B (zh) | 一种编码和解码方法、编码和解码设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190910 |
|
RJ01 | Rejection of invention patent application after publication |