CN110784713B - 一种可变有效图像尺寸的编码及解码方法 - Google Patents
一种可变有效图像尺寸的编码及解码方法 Download PDFInfo
- Publication number
- CN110784713B CN110784713B CN201911286945.3A CN201911286945A CN110784713B CN 110784713 B CN110784713 B CN 110784713B CN 201911286945 A CN201911286945 A CN 201911286945A CN 110784713 B CN110784713 B CN 110784713B
- Authority
- CN
- China
- Prior art keywords
- coding
- image size
- effective image
- frame
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种可变有效图像尺寸的编码及解码方法。它具体包括如下步骤:(1)编码器中:分析文件每帧的复杂度,将文件按复杂度来切段,评估每段适合的有效图像尺寸,并写入配置文件中,Resize模块根据配置文件中的帧级高宽设置决定图像是否resize,编码内核负责编码,码流合成器将编码内核出来的视频流和图像有效区域的信息打包成最终视频流输出;(2)解码器中:视频流解析器分析当前帧是否带有有效图像尺寸信息,解码内核负责解码,Resize模块根据有效图像尺寸和视频编码图像尺寸来决定是否resize。本发明的有益效果是:不改变编码图像尺寸,既保证观看效果,且适用于任何编解码器内核,对于编码器和解码器内核也没有任何影响,保证了其稳定性。
Description
技术领域
本发明涉及视频处理相关技术领域,尤其是指一种可变有效图像尺寸的编码及解码方法。
背景技术
在实际应用中,给编码器设置固定图像尺寸、码率或最大码率,这样会导致视频中复杂段质量很差,出现很多块,影响观看。如果复杂段采用更小编码图像尺寸来编码,可以改善观看效果,但是同一视频,编码图像尺寸的变化将要求编码器和解码器删除、重建,这将使得编码装置和解码装置很可能不稳定性,并且播放时可能卡顿,特别是有硬件编码器和解码器情况下(NVidia编解码器创建有时候需要2-3秒以上)。
发明内容
本发明是为了克服现有技术中存在上述的不足,提供了一种稳定性好的可变有效图像尺寸的编码及解码方法。
为了实现上述目的,本发明采用以下技术方案:
一种可变有效图像尺寸的编码及解码方法,具体包括如下步骤:
(1)编码器中:分析文件每帧的复杂度,将文件按复杂度来切段,评估每段适合的有效图像尺寸,并写入配置文件中,Resize模块根据配置文件中的帧级高宽设置决定图像是否resize,编码内核负责编码,码流合成器将编码内核出来的视频流和图像有效区域的信息打包成最终视频流输出;
(2)解码器中:视频流解析器分析当前帧是否带有有效图像尺寸信息,解码内核负责解码,Resize模块根据有效图像尺寸和视频编码图像尺寸来决定是否resize。
编码器在视频中复杂段将改变有效图像尺寸、无效区域填黑,从而不改变编码图像尺寸,这样既保证观看效果,且适用于任何编解码器内核,对于编码器和解码器内核也没有任何影响,保证了其稳定性。这个编解码器还可用于其它想改变有效图像尺寸的场合,比方说网络实时转码或实时通讯场合。
作为优选,在步骤(1)中,编码的具体步骤如下:
(11)一帧编码开始,读取配置文件,根据配置文件中的帧级高宽设置判断当前帧是否有有效图像尺寸改变的信息设置,如果没有则直接进入到下一步;如果有则为当前帧更新有效图像尺寸,然后进入到下一步;
(12)判断有效图像尺寸和编码图像尺寸是否相等,如果相等则直接到编码内核继续进行编码,然后进入到下一步;如果不相等则通过Resize模块将图像帧resize到有效图像尺寸,放置编码图像内存左上角,编码图像内存其它区域填黑色,然后将编码图像内存送给编码内核,编码内核将这帧编成IDR帧,以IDR帧型编码,然后进入到下一步;
(13)判断当前帧的有效图像尺寸是否更新,如果不更新则码流合成器输出编码内核给的码流;如果更新则有效图像尺寸信息按照HEVC中sei的user_data_unregisterd格式打包,码流合成器将编码内核输出码流和有效图像尺寸信息打包成新的视频码率输出。
作为优选,在步骤(11)中,配置文件中的帧级高宽设置方法如下:
先以固定Qp场景自适应加IDR帧配置转码,转完后计算两个IDR帧之间的所有帧平均压缩像素压缩比bpp和给定码率的平均像素压缩比bitrate_bpp;
如果bitrate_bpp≥bpp,采用原来的高宽;
如果bpp>bitrate_bpp≥0.5*bpp,有效图像的高不变,宽采用新宽:
如果bitrate_bpp<0.5*bpp,有效图像的高宽都需要采用新高宽,新宽:
new_width = (old_width/2+15)/16*16
新高:
作为优选,在步骤(2)中,解码的具体步骤如下:
(21)一帧解码开始,视频流解析器解析码流,查看视频帧是否带有有效图像尺寸信息,如果有,更新有效图像尺寸信息,进入到解码内核;如果没有,则直接进入到解码内核;
(22)解码内核进行解码操作;
(23)判断有效图像尺寸和编码图像尺寸是否一致,如果不一致,通过Resize模块将有效图像尺寸的图像resize到编码图像尺寸,再输出视频图像;如果一致,则直接输出视频图像。
本发明的有益效果是:不改变编码图像尺寸,既保证观看效果,且适用于任何编解码器内核,对于编码器和解码器内核也没有任何影响,保证了其稳定性。
附图说明
图1是本发明的编码框架图;
图2是本发明的编码流程图;
图3是本发明的解码框架图;
图4是本发明的解码流程图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
一种可变有效图像尺寸的编码及解码方法,具体包括如下步骤:
(1)编码器中:分析文件每帧的复杂度,将文件按复杂度来切段,评估每段适合的有效图像尺寸,并写入配置文件中,Resize模块根据配置文件中的帧级高宽设置决定图像是否resize,编码内核负责编码,码流合成器将编码内核出来的视频流和图像有效区域的信息打包成最终视频流输出,如图1所示;
如图2所示,编码的具体步骤如下:
(11)一帧编码开始,读取配置文件,根据配置文件中的帧级高宽设置判断当前帧是否有有效图像尺寸改变的信息设置,如果没有则直接进入到下一步;如果有则为当前帧更新有效图像尺寸,然后进入到下一步;
配置文件中的帧级高宽设置方法如下:
先以固定Qp场景自适应加IDR帧配置转码,转完后计算两个IDR帧之间的所有帧平均压缩像素压缩比bpp和给定码率的平均像素压缩比bitrate_bpp;
如果bitrate_bpp≥bpp,采用原来的高宽;
如果bpp>bitrate_bpp≥0.5*bpp,有效图像的高不变,宽采用新宽:
如果bitrate_bpp<0.5*bpp,有效图像的高宽都需要采用新高宽,新宽:
new_width = (old_width/2+15)/16*16
新高:
(12)判断有效图像尺寸和编码图像尺寸是否相等,如果相等则直接到编码内核继续进行编码,然后进入到下一步;如果不相等则通过Resize模块将图像帧resize到有效图像尺寸,放置编码图像内存左上角,编码图像内存其它区域填黑色,然后将编码图像内存送给编码内核,编码内核将这帧编成IDR帧,以IDR帧型编码,然后进入到下一步;
(13)判断当前帧的有效图像尺寸是否更新,如果不更新则码流合成器输出编码内核给的码流;如果更新则有效图像尺寸信息按照HEVC中sei的user_data_unregisterd格式打包,码流合成器将编码内核输出码流和有效图像尺寸信息打包成新的视频码率输出。
(2)解码器中:视频流解析器分析当前帧是否带有有效图像尺寸信息,解码内核负责解码,Resize模块根据有效图像尺寸和视频编码图像尺寸来决定是否resize,如图3所示;
如图4所示,解码的具体步骤如下:
(21)一帧解码开始,视频流解析器解析码流,查看视频帧是否带有有效图像尺寸信息,如果有,更新有效图像尺寸信息,进入到解码内核;如果没有,则直接进入到解码内核;
(22)解码内核进行解码操作;
(23)判断有效图像尺寸和编码图像尺寸是否一致,如果不一致,通过Resize模块将有效图像尺寸的图像resize到编码图像尺寸,再输出视频图像;如果一致,则直接输出视频图像。
这里需要说明的是:有效图像尺寸是指实际图像尺寸,编码图像尺寸是指实际图像尺寸加上填黑色的其它区域尺寸。在步骤(11)中,配置文件中的帧级高宽设置公式里面,除以16的部分是整除、小数部分去除的意思,所以后面必须乘以16。
编码器在视频中复杂段将改变有效图像尺寸、无效区域填黑,从而不改变编码图像尺寸,这样既保证观看效果,且适用于任何编解码器内核,对于编码器和解码器内核也没有任何影响,保证了其稳定性。这个编解码器还可用于其它想改变有效图像尺寸的场合,比方说网络实时转码或实时通讯场合。
Claims (3)
1.一种可变有效图像尺寸的编码及解码方法,其特征是,具体包括如下步骤:
(1)编码器中:分析文件每帧的复杂度,将文件按复杂度来切段,评估每段适合的有效图像尺寸,并写入配置文件中,Resize模块根据配置文件中的帧级高宽设置决定图像是否resize,编码内核负责编码,码流合成器将编码内核出来的视频流和图像有效区域的信息打包成最终视频流输出;编码的具体步骤如下:
(11)一帧编码开始,读取配置文件,根据配置文件中的帧级高宽设置判断当前帧是否有有效图像尺寸改变的信息设置,如果没有则直接进入到下一步;如果有则为当前帧更新有效图像尺寸,然后进入到下一步;
(12)判断有效图像尺寸和编码图像尺寸是否相等,如果相等则直接到编码内核继续进行编码,然后进入到下一步;如果不相等则通过Resize模块将图像帧resize到有效图像尺寸,放置编码图像尺寸左上角,编码图像尺寸其它区域填黑色,然后将编码图像尺寸送给编码内核,编码内核将这帧编成IDR帧,以IDR帧型编码,然后进入到下一步;
(13)判断当前帧的有效图像尺寸是否更新,如果不更新则码流合成器输出编码内核给的码流;如果更新则有效图像尺寸信息按照HEVC中sei的user_data_unregisterd格式打包,码流合成器将编码内核输出码流和有效图像尺寸信息打包成新的视频码率输出;
(2)解码器中:视频流解析器分析当前帧是否带有有效图像尺寸信息,解码内核负责解码,Resize模块根据有效图像尺寸和视频编码图像尺寸来决定是否resize。
3.根据权利要求1所述的一种可变有效图像尺寸的编码及解码方法,其特征是,在步骤(2)中,解码的具体步骤如下:
(21)一帧解码开始,视频流解析器解析码流,查看视频帧是否带有有效图像尺寸信息,如果有,更新有效图像尺寸信息,进入到解码内核;如果没有,则直接进入到解码内核;
(22)解码内核进行解码操作;
(23)判断有效图像尺寸和编码图像尺寸是否一致,如果不一致,通过Resize模块将有效图像尺寸的图像resize到编码图像尺寸,再输出视频图像;如果一致,则直接输出视频图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911286945.3A CN110784713B (zh) | 2019-12-14 | 2019-12-14 | 一种可变有效图像尺寸的编码及解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911286945.3A CN110784713B (zh) | 2019-12-14 | 2019-12-14 | 一种可变有效图像尺寸的编码及解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110784713A CN110784713A (zh) | 2020-02-11 |
CN110784713B true CN110784713B (zh) | 2022-02-22 |
Family
ID=69394599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911286945.3A Active CN110784713B (zh) | 2019-12-14 | 2019-12-14 | 一种可变有效图像尺寸的编码及解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110784713B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101742296A (zh) * | 2008-11-14 | 2010-06-16 | 北京中星微电子有限公司 | 降低码流数据量波动的视频编解码方法及装置 |
JP2015032924A (ja) * | 2013-07-31 | 2015-02-16 | 日本電信電話株式会社 | 変換量子化方法、変換量子化装置及び変換量子化プログラム |
CN109257601A (zh) * | 2012-07-03 | 2019-01-22 | 夏普株式会社 | 图像解码装置以及图像编码装置 |
CN110024408A (zh) * | 2016-10-04 | 2019-07-16 | 金起佰 | 图像数据编码/解码方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201318658D0 (en) * | 2013-10-22 | 2013-12-04 | Microsoft Corp | Controlling resolution of encoded video |
-
2019
- 2019-12-14 CN CN201911286945.3A patent/CN110784713B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101742296A (zh) * | 2008-11-14 | 2010-06-16 | 北京中星微电子有限公司 | 降低码流数据量波动的视频编解码方法及装置 |
CN109257601A (zh) * | 2012-07-03 | 2019-01-22 | 夏普株式会社 | 图像解码装置以及图像编码装置 |
JP2015032924A (ja) * | 2013-07-31 | 2015-02-16 | 日本電信電話株式会社 | 変換量子化方法、変換量子化装置及び変換量子化プログラム |
CN110024408A (zh) * | 2016-10-04 | 2019-07-16 | 金起佰 | 图像数据编码/解码方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110784713A (zh) | 2020-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113168718B (zh) | 视频解码方法、装置和存储介质 | |
US7924917B2 (en) | Method for encoding and decoding video signals | |
US10298937B2 (en) | Method, device, computer program, and information storage means for encoding or decoding a video sequence | |
CN116320409A (zh) | 一种帧内预测的方法、装置、设备和存储介质 | |
CN113678457B (zh) | 视频编解码方法、计算机***和电子设备 | |
US20150262404A1 (en) | Screen Content And Mixed Content Coding | |
TW201415896A (zh) | 寫碼用於視訊寫碼之隨機存取圖像 | |
EP3817389A1 (en) | Image encoding method, decoding method, encoder, decoder and storage medium | |
US20190045185A1 (en) | Coding tools for subjective quality improvements in video codecs | |
CN114009051A (zh) | 用于v-pcc的假设参考解码器 | |
KR20230125723A (ko) | 비디오 코딩에서의 서브픽쳐 시그널링 | |
WO2019179401A1 (zh) | 图像滤波方法、装置及视频编解码器 | |
US11438611B2 (en) | Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding | |
CN114071161B (zh) | 图像编码方法、图像解码方法及相关装置 | |
CN110784713B (zh) | 一种可变有效图像尺寸的编码及解码方法 | |
CN111193928B (zh) | 用于传递视频中的感兴趣区域信息的方法和设备 | |
WO2021056575A1 (zh) | 一种低延迟信源信道联合编码方法及相关设备 | |
FR2894739A1 (fr) | Procede de codage, procede de decodage, dispositif de codage et dispositif de decodage de donnees video | |
US11616983B2 (en) | Joint component secondary transform | |
CN116248895B (zh) | 虚拟现实全景漫游的视频云转码方法及*** | |
Carmo et al. | Binary tree decomposition depth coding for 3D video applications | |
US20090003433A1 (en) | Transcoder and transcoding method | |
US12034944B2 (en) | Video encoding method and apparatus, video decoding method and apparatus, electronic device and readable storage medium | |
WO2024077806A1 (zh) | 一种编解码方法、装置、编码器、解码器及存储介质 | |
US20230007281A1 (en) | Video Encoding or Decoding Methods and Apparatuses with Scaling Ratio Constraint |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |