CN101350920A - 一种面向全景视频的全局运动估计方法 - Google Patents
一种面向全景视频的全局运动估计方法 Download PDFInfo
- Publication number
- CN101350920A CN101350920A CN 200710130318 CN200710130318A CN101350920A CN 101350920 A CN101350920 A CN 101350920A CN 200710130318 CN200710130318 CN 200710130318 CN 200710130318 A CN200710130318 A CN 200710130318A CN 101350920 A CN101350920 A CN 101350920A
- Authority
- CN
- China
- Prior art keywords
- global motion
- motion
- panoramic video
- towards
- estimating method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种面向全景视频的全局运动估计方法,包括以下步骤:(1)把每一帧全景视频分割成互不重叠的16×16块;(2)使用一种快速运动估计方法对全景视频帧里的16×16宏块分别做局部运动估计,得到面向宏块的运动矢量;(3)建立全局运动估计参数模型;(4)使用高斯牛顿迭代方法得到全局运动估计的运动参数;(5)传输当前帧的全局运动参数,在解码端对当前帧做全局运动补偿。本发明的优点在于:针对全景视频的特点,设计了一种适合全景视频编码的全局运动估计参数模型,比传统的平移运动模型节省更多的码率,同时主观编码质量更好。
Description
技术领域
本发明涉及图象视频压缩技术,特别涉及全景视频的全局运动估计方法。
背景技术
全景视频(panoramic video)也称为沉浸式视频(immersive video)。观察者视点不能随意变,改变观察方向能够观察到周围的全部场景。普通的二维视频只反应了全方位视频的某个局部,难以使人产生身临其境的沉浸感,利用全景视频可以建立起供用户观察的虚拟环境。用户通过在其中的漫游,能够交互地从不同观察点和方向了解环境。全景视频摄像机的示意图如图1所示,由多个摄像机对同一视点周围的场景进行采集处理。任何一个视角的二维场景都可以由这些采集的图像绘制出来。全景视频可以应用于广播、存储和交互式的在线应用等。
全景视频的生成是面向一种图象拼接技术。首先用若干个摄像机采集不同角度的实时图像(需要的摄像机个数与采集的角度有关),然后把同一时间内采集到的不同角度的图象用一种无缝的图像拼接技术缝合成一幅360度的全景图。然后再把这幅全景图用柱面或者球面算法映射到一个二维的平面上。由于全景视频图像是由多幅采集图像缝合而成,因此,一般来说,全景图像的分辨率非常大,譬如说,2048×768。考虑一个每秒25帧的全景视频序列,则一秒的数据量达到112M。如此庞大的数据,不经过有效压缩,是无法进行存储,更不用说实时传输。因此,研究研究全景视频的压缩技术,尤其具有理论和现实意义。
目前在大多数视频编码标准中,采用的传统的运动补偿估计方法是面向平移运动参数模型的。该模型假设刚性物体只在二维空间里的水平和垂直方向上做平移运动,并没有充分考虑摄像机的旋转和缩放运动。而在全景视频里,摄像机的旋转和缩放运动是占有很重要位置的视觉流运动。采用传统的平移运动参数模型,无法有效的精确估计物体的实际运动,必将使得运动补偿后的图像残差大大增加,从而达不到有效压缩全景视频的目的。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于仿射运动模型的运动估计方法,用于有效压缩全景视频
为了达到上述目的,本发明采取如下技术方案:
一种面向全景视频的运动估计方法,包括以下步骤:
(1)把每一帧全景视频分割成互不重叠的16×16宏块;
(2)使用一种快速运动估计方法对全景视频帧里的16×16宏块分别做局部运动估计,得到面向宏块的运动矢量;
(3)建立全局运动估计参数模型;
(4)使用高斯牛顿迭代方法得到全局运动估计的运动参数;
(5)传输当前帧的全局运动参数,在解码端对当前帧做全局运动补偿。
进一步地,步骤(1)中,块的划分大小为16×16。
进一步地,步骤(2)中,所使用的快速运动估计方法是三步快速运动估计算法。
进一步地,搜索范围是64×64,半像素精度搜索。
进一步地,步骤(3)中,全局运动估计参数模型是仿射运动参数模型。
进一步地,该仿射运动参数模型是模拟全景视频中的平移、旋转和缩放运动。
进一步地,所述步骤(4)中,运动参数估计算法是基于高斯牛顿迭代算法。
进一步地,该高斯牛顿算法是基于最小化预测残差迭代计算的,预测残差是指原始帧和预测帧之间的差。
进一步地,所述步骤(5)中,全局运动参数的编码是基于三维VLC变长编码。
进一步地,该三维VLC变长编码使用的是36个码本。
本发明方法的优点在于:
(1)针对全景视频的特点,设计了一种有效的全局运动估计方法,相对传统的运动补偿估计方法,编码码率大大降低,主观重构视频质量得到提高;
(2)在估计全局运动参数时,使用高斯牛顿迭代算法,有效节省运算时间。
附图说明
图1是本发明实施例中由多个摄像机对同一视点周围场景进行采集处理的示意图;
图2是本发明实施例中基于菱形算法的大小搜索模板示意图;
图3是本发明实施例中基于菱形算法的快速运动搜索示意图;
图4是本发明实施例中面向全景视频的全局运动估计***流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细描述:
如图4所示,为本发明的一种面向全景视频的全局运动估计方法的操作流程图。该方法的操作步骤包括:
步骤10中,划分每一帧图像为若干个16×16的宏块。若亮度的预测值和原始值的差,即亮度残差大于一个设定的阀值MSEsplitThr,见以下公式,则16×16块再度划分为8×8块:
步骤20,在该步骤中,使用了一种快速运动估计方法,称为菱形搜索法。菱形搜索法使用两种搜索模板,分别是9个检测点的大模板和5个检测点的小模板,两种模板如图2所示。开始搜索时使用大模板,当最佳点位于中心点时,再使用小模板。搜索过程如图2所示。
步骤30,建立一种适合全景视频的运动估计模型。该模型公式如下所示:
Δx(xl,yl)=a0f0(xl,yl)+a1f1(xl,yl)+a2f2(xl,yl)
Δy(xl,yl)=a3f0(xl,yl)+a4f1(xl,yl)+a5f2(xl,yl)
同时可用率失真优化算法在四参数、八参数中选取一种运动模型代替以上运动模型。
步骤40,计算运动模型参数。先估计平移运动参数,然后再估计旋转和缩放运动参数。根据以下公式进行计算:
步骤50,编码传送运动参数。使用3维VLC游程编码,具体的编码方法是对出现概率多的码字分配短的符号,对出现概率少的码字分配长的符号。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1、一种面向全景视频的全局运动估计方法,包括以下步骤:
(1)把每一帧全景视频分割成互不重叠的16×16块;
(2)使用一种快速运动估计方法对全景视频帧里的16×16宏块分别做局部运动估计,得到面向宏块的运动矢量;
(3)建立全局运动估计参数模型;
(4)使用高斯牛顿迭代方法得到全局运动估计的运动参数;
(5)传输当前帧的全局运动参数,在解码端对当前帧做全局运动补偿。
2、根据权利要求1所述面向全景视频的全局运动估计方法,其特征是,步骤(1)中,块大小的划分为16×16。
3、根据权利要求1所述面向全景视频的全局运动估计方法,其特征是,步骤(2)中,使用三步快速运动估计算法。
4、根据权利要求1所述面向全景视频的全局运动估计方法,其特征是,步骤(3)中,全局运动估计参数模型是仿射运动参数模型。
5、根据权利要求1所述面向全景视频的全局运动估计方法,其特征是,步骤(4)中,运动参数估计算法是基于高斯牛顿迭代算法。
6、根据权利要求1所述面向全景视频的全局运动估计方法,其特征是,步骤(5)中,全局运动参数的编码是基于三维VLC变长编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710130318 CN101350920A (zh) | 2007-07-17 | 2007-07-17 | 一种面向全景视频的全局运动估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710130318 CN101350920A (zh) | 2007-07-17 | 2007-07-17 | 一种面向全景视频的全局运动估计方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101350920A true CN101350920A (zh) | 2009-01-21 |
Family
ID=40269465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200710130318 Pending CN101350920A (zh) | 2007-07-17 | 2007-07-17 | 一种面向全景视频的全局运动估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101350920A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771878B (zh) * | 2010-01-14 | 2011-05-25 | 广西大学 | 面向全景视频编码的自适应选择全局运动估计方法 |
CN102355581A (zh) * | 2011-09-22 | 2012-02-15 | 山东大学 | 用于视频编码芯片硬件***中的多级稳定性处理方法 |
CN104539966A (zh) * | 2014-09-30 | 2015-04-22 | 华为技术有限公司 | 图像预测方法及相关装置 |
CN105681805A (zh) * | 2016-01-19 | 2016-06-15 | 北京大学深圳研究生院 | 视频编码、解码方法及其帧间预测方法和装置 |
CN106060515A (zh) * | 2016-07-14 | 2016-10-26 | 腾讯科技(深圳)有限公司 | 全景媒体文件推送方法及装置 |
WO2017125030A1 (en) * | 2016-01-22 | 2017-07-27 | Mediatek Inc. | Apparatus of inter prediction for spherical images and cubic images |
TWI617185B (zh) * | 2016-03-15 | 2018-03-01 | 聯發科技股份有限公司 | 具有仿射運動補償的視訊編碼的方法以及裝置 |
US10834389B2 (en) | 2016-09-30 | 2020-11-10 | Interdigital Vc Holdings, Inc. | Method and apparatus for omnidirectional video coding with adaptive intra most probable modes |
CN113454999A (zh) * | 2019-01-02 | 2021-09-28 | 北京字节跳动网络技术有限公司 | 划分模式之间的运动矢量推导 |
US11812066B2 (en) | 2016-09-30 | 2023-11-07 | Interdigital Vc Holdings, Inc. | Methods, devices and stream to encode global rotation motion compensated images |
US11871022B2 (en) | 2018-05-31 | 2024-01-09 | Beijing Bytedance Network Technology Co., Ltd | Concept of interweaved prediction |
-
2007
- 2007-07-17 CN CN 200710130318 patent/CN101350920A/zh active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101771878B (zh) * | 2010-01-14 | 2011-05-25 | 广西大学 | 面向全景视频编码的自适应选择全局运动估计方法 |
CN102355581A (zh) * | 2011-09-22 | 2012-02-15 | 山东大学 | 用于视频编码芯片硬件***中的多级稳定性处理方法 |
CN104539966A (zh) * | 2014-09-30 | 2015-04-22 | 华为技术有限公司 | 图像预测方法及相关装置 |
WO2016050051A1 (zh) * | 2014-09-30 | 2016-04-07 | 华为技术有限公司 | 图像预测方法及相关装置 |
US10827194B2 (en) | 2014-09-30 | 2020-11-03 | Huawei Technologies Co., Ltd. | Picture prediction method and related apparatus |
CN104539966B (zh) * | 2014-09-30 | 2017-12-22 | 华为技术有限公司 | 图像预测方法及相关装置 |
CN105681805B (zh) * | 2016-01-19 | 2019-05-21 | 北京大学深圳研究生院 | 视频编码、解码方法及其帧间预测方法和装置 |
CN105681805A (zh) * | 2016-01-19 | 2016-06-15 | 北京大学深圳研究生院 | 视频编码、解码方法及其帧间预测方法和装置 |
WO2017125030A1 (en) * | 2016-01-22 | 2017-07-27 | Mediatek Inc. | Apparatus of inter prediction for spherical images and cubic images |
TWI617185B (zh) * | 2016-03-15 | 2018-03-01 | 聯發科技股份有限公司 | 具有仿射運動補償的視訊編碼的方法以及裝置 |
CN106060515B (zh) * | 2016-07-14 | 2018-11-06 | 腾讯科技(深圳)有限公司 | 全景媒体文件推送方法及装置 |
CN106060515A (zh) * | 2016-07-14 | 2016-10-26 | 腾讯科技(深圳)有限公司 | 全景媒体文件推送方法及装置 |
US10834389B2 (en) | 2016-09-30 | 2020-11-10 | Interdigital Vc Holdings, Inc. | Method and apparatus for omnidirectional video coding with adaptive intra most probable modes |
US11812066B2 (en) | 2016-09-30 | 2023-11-07 | Interdigital Vc Holdings, Inc. | Methods, devices and stream to encode global rotation motion compensated images |
US11871022B2 (en) | 2018-05-31 | 2024-01-09 | Beijing Bytedance Network Technology Co., Ltd | Concept of interweaved prediction |
CN113454999A (zh) * | 2019-01-02 | 2021-09-28 | 北京字节跳动网络技术有限公司 | 划分模式之间的运动矢量推导 |
US11930182B2 (en) | 2019-01-02 | 2024-03-12 | Beijing Bytedance Network Technology Co., Ltd | Motion vector derivation between dividing patterns |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101350920A (zh) | 一种面向全景视频的全局运动估计方法 | |
CN104363451B (zh) | 图像预测方法及相关装置 | |
CN100527842C (zh) | 基于背景的运动估计编码方法 | |
CN102970529B (zh) | 一种基于对象的多视点视频分形编码压缩与解压缩方法 | |
CN101980537B (zh) | 一种基于对象和分形的双目立体视频压缩编解码方法 | |
CN100355272C (zh) | 一种交互式多视点视频***中虚拟视点的合成方法 | |
CN102905150B (zh) | 一种新的多视点视频分形编码压缩与解压缩方法 | |
CN101521823B (zh) | 空间相关的全景数据压缩方法 | |
CN102291579B (zh) | 一种快速的多目立体视频分形压缩与解压缩方法 | |
CN108012155A (zh) | 预拼接图像的视频编码方法、视频解码方法和相关的装置 | |
TW201545545A (zh) | 用於次世代視訊編碼之投射式內插預測產生之技術 | |
CN104715496B (zh) | 云环境下基于三维点云模型的图像预测方法、***及装置 | |
CN103141092B (zh) | 针对视频压缩使用运动补偿的基于示例的超分辨率来编码视频信号的方法和设备 | |
CN101980538B (zh) | 一种基于分形的双目立体视频压缩编解码方法 | |
CN100581265C (zh) | 一种多视点视频的处理方法 | |
WO2016155070A1 (zh) | 一种面向多纹理多深度视频的相邻视差矢量获取方法 | |
Chen et al. | Compressed domain deep video super-resolution | |
CN106534853B (zh) | 基于混合扫描顺序的光场图像压缩方法 | |
CN102316323B (zh) | 一种快速的双目立体视频分形压缩与解压缩方法 | |
CN109640097A (zh) | 自适应因子的视频仿射运动估计方法 | |
CN116542889A (zh) | 一种拥有稳定视点的全景视频增强方法 | |
CN101350921A (zh) | 一种面向全景视频的运动搜索方法 | |
CN106791869A (zh) | 基于光场子孔径图像相对位置关系的快速运动搜索方法 | |
CN109120940A (zh) | 自适应因子的视频缩放运动估计方法 | |
CN106961605B (zh) | 一种基于宏像素边界匹配的光场图像压缩方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20090121 |