CN103716642B - 用于多视点视频编码/解码的方法 - Google Patents

用于多视点视频编码/解码的方法 Download PDF

Info

Publication number
CN103716642B
CN103716642B CN201410026092.0A CN201410026092A CN103716642B CN 103716642 B CN103716642 B CN 103716642B CN 201410026092 A CN201410026092 A CN 201410026092A CN 103716642 B CN103716642 B CN 103716642B
Authority
CN
China
Prior art keywords
video
depth information
coding
information
engineer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410026092.0A
Other languages
English (en)
Other versions
CN103716642A (zh
Inventor
方健
严基纹
金泰源
张恩荣
许南淏
金镇雄
李寿寅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of CN103716642A publication Critical patent/CN103716642A/zh
Application granted granted Critical
Publication of CN103716642B publication Critical patent/CN103716642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种用于多视点视频编码/解码的方法,该方法包括:控制与多视点视频对应的第一和第二深度信息视频的比例尺,从而使所述比例尺相同;以及通过参考其比例尺被控制的第一深度信息视频,来对其比例尺被控制的第二深度信息视频进行编码。

Description

用于多视点视频编码/解码的方法
本专利申请是下列专利申请的分案申请:
申请号:200980156340.0
申请日:2009年12月08日
发明名称:多视点视频编码/解码方法和设备
技术领域
本发明的示范实施例涉及一种多视点(multi-view)视频编码/解码方法和设备,该方法和设备使用编码和解码的多视点视频来对与所述多视点视频对应的深度信息视频进行编码和解码。
背景技术
近年来,已经进行了用于通过数字电视(DTV)来对多视点视频进行广播的研究。为了对与利用人眼所看到的真实视频相似的多视点视频进行广播,应该创建和传送多视点视频。然后,应该通过显示设备来接收和再现所述多视点视频。然而,由于多视点视频具有大量的数据,所以难以按照在当前的数字广播***中使用的信道的带宽来接收多视点视频。相应地,正在对用于对多视点视频进行编码和解码的技术进行研究。
多视点视频编码(MVC)是一种以下技术,其对从具有不同视图的多个相机获取的多个视频、以及与所述多个视频对应的多个深度信息视频(即,多视点视频)进行编码。针对同一对象,所述多个相机被布置为根据距离和方向上的预定规则而彼此间隔开。作为结果,在具有不同视图并且组成多视点视频的相应视频之间存在高相关性。当恰当地使用相应视频之间的高相关性时,可能显著地改善MVC的编码效率。然而,由于从同一对象反射的光可能取决于方向而彼此不同,所以可以考虑所述光以使编码效率最大化。
正在积极地进行其标准化的MVC基于H.264/MPEG部分10高级视频编码(在下文中,称作H.264/AVC),该H.264/MPEG部分10高级视频编码是现有的国际运动图像编码标准。在MVC中,考虑多视点视频的上述特性,以寻找一种用于改善编码效率的方法。例如,将分级B画面编码处理应用于视图内预测编码,执行该分级B画面编码处理以支持在H.264/AVC中定义的联合可伸缩视频编码(JSVC)中的时间可伸缩性。此外,与视图内预测编码并排地(sideby side)执行视图间预测编码,以改善MVC中的编码效率。相应地,研究三维(3D)视频的关联团体正在对通过DTV广播进行的3D视频的接收和传送进行大量研究。当前,该研究正针对高清晰度(HD)立体视频的传送和接收。HD立体视频是指具有1920×1080尺寸的隔行视频或者具有1024×720尺寸的逐行视频。
图1是解释了传统的多视点视频编码/解码***的框图。
参考图1,传统的多视点视频编码/解码***包括第一视频编码单元101、第一视频解码单元103、第一深度信息视频编码单元105、第一深度信息视频解码单元107、第二视频编码单元109、第二视频解码单元111、第二深度信息视频编码单元113、和第二深度视频信息解码单元115。
分别将第一和第二视频以及第一和第二深度信息视频输入到第一和第二视频编码单元101和109以及第一和第二深度信息视频编码单元105和113。第一和第二视频具有彼此不同的视图,并且第一和第二深度信息视频分别对应于所述第一和第二视频,并包括深度信息。在传统的多视点视频编码/解码***中,可以使用两个或更多视频,并且深度信息视频的数目可以对应于视频的数目。此时,可以使用具有不同视图的视频来对多视点视频进行编码。即,在多视点视频之间存在高相关性。因此,当首先对第一视频进行编码时,第二视频编码单元109可以通过参考编码的第一视频来对第二视频进行编码。可以按照相同的方式来对深度信息视频进行编码。
将相应的编码的视频输入到第一和第二视频解码单元103和111以及第一和第二深度信息视频解码单元107和115,并然后进行解码。
二维(2D)视频是通过对编码的第一或第二视频进行解码所获得的视频,而3D视频是通过对编码的第一和第二视频以及编码的第一深度信息视频进行解码所获得的视频。第一视频可以是具有参考视图的视频。多视点视频是通过对编码的第一和第二视频以及编码的第一和第二深度信息视频进行解码所获得的视频。
即,在传统的多视点视频编码/解码***中,独立地执行多视点视频和深度信息视频的编码和解码。
发明内容
技术问题
本发明的实施例针对一种多视点视频编码/解码方法和设备,该方法和设备有效地对与多视点视频对应的深度信息视频进行编码和解码,由此有效地对该多视点视频进行编码和解码。
可以通过以下描述来理解本发明的其他目的和优点,并且通过参考本发明的实施例,它们将变得明显。同样,对于本发明所属技术领域的技术人员来说明显的是,可以通过所要求保护的部件及其组合来实现本发明的目的和优点。
技术解决方案
根据本发明的实施例,一种多视点视频编码方法包括:通过执行帧间预测(interprediction)和帧内预测(intra prediction)来对多视点视频进行编码;以及根据帧间预测和帧内预测中的至少一个来对与该多视点视频对应的深度信息视频进行编码。
根据本发明的另一实施例,一种多视点视频编码方法包括:控制与多视点视频对应的第一和第二深度信息视频的比例尺(scale),从而使所述比例尺相同;以及通过参考其比例尺被控制的第一深度信息视频来对其比例尺被控制的第二深度信息视频进行编码。
根据本发明的另一实施例,一种多视点视频编码设备包括:视频编码块,被配置为通过帧间预测和帧内预测来对多视点视频进行编码;以及深度信息视频编码块,被配置为使用该视频编码块所生成的帧间预测信息和帧内预测信息中的一条或多条,来对与该多视点视频对应的深度信息视频进行编码。
根据本发明的另一实施例,一种多视点视频编码设备包括:比例尺控制块,被配置为控制与多视点视频对应的第一和第二深度信息视频的比例尺,从而使所述比例尺彼此相等;以及深度信息视频编码块,被配置为通过参考其比例尺被控制的第一深度信息视频来对其比例尺被控制的第二深度信息视频进行编码。
根据本发明的另一实施例,一种多视点视频解码方法包括:接收通过帧间预测和帧内预测所编码的多视点视频、以及通过使用根据帧间预测的预测信息和根据帧内预测的预测信息中的一条或多条所编码的深度信息视频;对编码的多视点视频进行解码;以及使用在深度信息视频编码期间所使用的预测信息来对编码的深度信息视频进行解码。
具体来讲,按照本发明一个方面,提供了一种用于多视点视频编码的方法,该方法包括:控制与多视点视频对应的第一和第二深度信息视频的比例尺,从而使所述比例尺相同;以及通过参考其比例尺被控制的第一深度信息视频,来对其比例尺被控制的第二深度信息视频进行编码。
按照本发明另一方面,提供了一种用于多视点视频解码的方法,该方法包括:接收通过帧间预测和帧内预测中的至少一个所编码的多视点视频、通过使用根据帧间预测和帧内预测中的至少一个的预测信息中的一条或多条所编码的深度信息视频、以及指示出是否使用了根据至少一个帧间预测和帧内预测的预测信息的标志比特,其中根据帧间预测的预测信息包括根据帧间预测的运动向量;对所编码的多视点视频进行解码;使用在深度信息视频的编码期间所使用的预测信息,来对所编码的深度信息视频进行解码;以及控制所解码的深度信息视频的比例尺,其中通过参考其比例尺被控制的第二深度信息视频,来对所解码的深度信息视频的比例尺进行控制。
有益效果
根据本发明的实施例,当对用于多视点视频的深度信息视频进行编码时,可以通过使用在多视点视频编码期间所生成的预测信息来执行该编码,这使得可能增加编码效率。此外,可以在深度信息视频的解码期间使用在多视点视频解码期间所使用的预测信息。因此,可能增加用于多视点视频的解码效率。
附图说明
图1是解释了传统的多视点视频编码/解码***的框图。
图2示出了用于解释根据本发明实施例的多视点视频编码方法的构思的视频。
图3是解释了根据本发明另一实施例的多视点视频编码/解码***的图。
图4是解释了其中在根据本发明实施例的多视点视频编码设备301中使用预测信息的处理的图。
图5图示了根据本发明另一实施例的多视点视频编码设备301。
图6图示了根据本发明另一实施例的多视点视频编码设备301。
图7图示了根据本发明另一实施例的多视点视频编码方法。
图8图示了根据本发明另一实施例的多视点视频编码方法。
图9图示了根据本发明另一实施例的多视点视频解码方法。
具体实施方式
下面,将参考附图来更加详细地描述本发明的示范实施例。然而,本发明可以按照不同的形式来实施,并且不应被构造为限于在这里提出的实施例。相反地,提供这些实施例,使得本公开将是彻底和完全的,并将向本领域技术人员充分地传达本发明的范围。贯穿整个公开中,贯穿本发明的各个图和实施例中,同样的附图标记表示同样的部分。附图不必按照比例尺,并且在一些实例中,可能已经对比例进行了扩大,以便清楚地图示所述实施例的特征。
图2示出了用于解释根据本发明实施例的多视点视频编码方法的构思的视频。
在图2中,第一深度信息视频203对应于第一视频201,而第二深度信息视频207对应于第二视频205。第一和第二视频201和205是由同一相机所拍摄的,并且是用于具有时间差的不同帧的视频。
参考图2,在时间轴上,第一视频201和第一深度信息视频203以及第二视频205和第二深度信息视频207分别在对象的轮廓和对象的运动上具有相似性。这是因为深度信息是通过表达图中视频的对象与相机之间的距离所获得的,并且深度信息视频表现了该深度信息。
具体地,编码期间的视频和深度信息视频中的对象轮廓与根据帧内预测的帧中预测模式紧密相关,而对象运动与运动向量紧密相关。即,当对视频和与该视频对应的深度信息视频进行编码时,视频中的预测模式和运动向量非常可能与深度信息视频中的预测模式和运动向量相似。因此,并不独立地执行视频和深度信息视频的编码,而是使用视频与深度信息视频之间的相似性来执行该编码,这使得可能增加编码效率。即,当在对深度信息视频进行编码时、通过在视频编码期间所生成的预测信息来执行多视点视频的编码时,整个编码量可能降低,以增加编码效率。预测信息包括预测模式和运动向量。可以将此原理扩展到多视点视频。
图3是解释了根据本发明另一实施例的多视点视频编码/解码***的图。
参考图3,根据本发明实施例的多视点视频编码和解码***包括多视点视频编码设备301和多视点视频解码设备303。图3图示了以下情况,其中分别对第一和第二视频以及与所述第一和第二视频对应的第一和第二深度信息视频进行编码和解码。
多视点视频编码设备301接收并编码第一和第二视频以及第一和第二深度信息视频。第一和第二视频是由具有彼此不同视图的相机所拍摄的多视点视频,而第一和第二深度信息视频可以通过立体匹配或深度相机来获取。
多视点视频编码设备301通过帧间预测和帧内预测来对多视点视频(即,第一和第二视频以及第一和第二深度信息视频)进行编码。此时,多视点视频编码设备301可以使用在视频编码期间生成的根据帧间预测的预测信息和根据帧内预测的预测信息中的一条或多条,来对与该视频对应的深度信息视频进行编码。预测信息可以包括根据帧间预测的视频的运动向量和根据帧内预测的视频的预测模式。
如上面在图2中所描述的,视频的运动向量和预测模式与深度信息视频的运动向量和预测模式相似。因此,多视点视频编码设备301可以使用视频的运动向量和预测模式中的一者或两者来对深度信息视频进行编码。多视点视频编码设备301可以传送编码的视频和编码的深度信息视频,作为一个比特流。
多视点视频解码设备303从多视点视频编码设备301接收编码的视频和编码的深度信息视频,并然后对接收到的视频进行解码。多视点视频解码设备303使用在多视点视频编码期间所使用的预测信息来对编码的深度信息视频进行解码。由于多视点视频编码设备301使用多视点视频的预测信息来对深度信息视频进行编码,所以需要通过使用该多视点视频的预测信息来对编码的深度信息视频进行解码。在此情况下,在深度信息视频的编码期间使用了多视点视频的预测信息的信息可以被包括在由多视点视频编码设备301所生成的比特流中并然后被提供到多视点视频解码设备303,或者被单独地提供到多视点视频解码设备303。
多视点视频编码设备301和多视点视频解码设备303两者都可以根据H.264/AVC标准来分别执行编码和解码。
多视点视频编码/解码***可以包括分离器303。分离器303对解码的第一和第二视频以及解码的第一和第二深度信息视频进行分离,使得可以使用分离的视频用于再现2D、3D或多视点视频。
此外,多视点视频编码设备301可以使用先前编码的视频和深度信息视频,来对与先前编码的视频和深度信息视频具有不同视图的视频和深度信息视频进行编码。具体地,当通过参考先前编码的深度信息视频来对与先前编码的深度信息视频具有不同视图的深度信息视频进行编码时,根据本发明实施例的多视点视频编码设备301可以通过控制深度信息视频之间的比例尺来执行该编码。下面,将参考图5来详细地描述此内容。
图4是解释了其中在根据本发明实施例的多视点视频编码设备301中使用预测信息的处理的图。
参考图4,视频和深度信息视频包括I帧、P帧和B帧。在I帧中,执行通过帧内预测的编码。可以通过I帧来执行对于运动图像的随机访问。在将先前编码的I帧或P帧设置为参考视频的情况下,P帧估计单一方向中的运动向量,并且B帧使用I帧、P帧和B帧来估计两个方向中的运动向量。即,在P和B帧中,执行通过帧间预测的编码。在图4中,箭头指示出参考帧。
帧内预测是基于单一帧中相邻像素的灰度级之间的高相关性的编码技术。在帧内预测中,并不使用参考帧来对当前帧的块进行编码,而是使用要编码的当前帧的先前编码区域来计算当前块的预测值。将帧内预测模式划分为4×4亮度(luma)帧内预测模式、8×8亮度帧内预测模式、和16×16亮度帧内预测模式、以及色度帧内预测模式。取决于帧内预测模式的类别(即,各种尺寸和各种帧内预测方向)来对当前块执行帧内预测,并且根据从它们之中选择的最佳帧内预测模式来生成预测值。当生成预测值时,对关于残差(residue)和预测模式的信息进行编码,以增加视频编码的压缩率。残差是当前块的像素值与预测值之间的差值。
帧间预测是基于视频序列中相继帧之间的相似性的编码技术。使用一个或多个参考帧来按照块为单位估计和补偿当前帧的运动,以便对视频进行编码。在参考帧中,搜索当前帧的相似块,并且提取运动向量。对参考帧中当前块与相似块之间的残差进行编码,以便增加视频编码的压缩率。此时,需要运动向量,以对根据帧间预测所编码的视频进行解码。因此,对运动向量一起进行编码。
根据本发明的实施例,当对深度信息视频进行编码时,使用根据视频的编码的预测信息。即,如图4所图示的,可以通过使用根据视频的I帧的编码的预测信息来对深度信息视频的I帧进行编码。此外,可以通过使用根据视频B帧和P帧的编码的预测信息来对深度信息视频的B和P帧进行编码。在此情况下,当对深度信息视频进行编码时,可以执行该编码,而无需包括关于预测模式或运动向量的信息。因此,编码效率可以增加。
即,当对深度信息视频进行编码时,***标志比特,该标志比特包括使用根据视频的编码的预测信息的这种信息。然后,当对编码的深度信息视频进行解码时,可以使用标志比特,以使用视频的解码信息。因此,可以不对根据深度信息视频的编码的预测模式和运动向量进行编码。由于标志比特的信息量小于根据深度信息视频的编码的预测模式和运动向量的信息量,所以编码效率可以增加。
此时,可以在深度信息视频之前对视频进行编码。此外,由于使用视频与深度信息视频之间的相似性,所以可以通过使用关于同一视图和同一帧的预测信息来对深度信息视频进行编码。
其间,如图4中所图示的,当对视频进行编码时,可以参考具有不同视图的视频的帧。此外,当对深度信息视频进行编码时,可以参考具有不同视图的深度信息视频的帧。可以通过参考具有不同视图的视频的帧来对B帧和P帧进行编码。例如,针对第二视频的P帧,可以通过参考第一视频的I帧来执行根据帧间预测的编码。下面,将参考图6来详细地描述此内容。
图5图示了根据本发明另一实施例的多视点视频编码设备301。
参考图5,根据本发明实施例的多视点视频编码设备301包括视频编码块501和深度信息视频解码块503。
视频编码块501执行帧间预测和帧内预测,以对多视点视频进行编码。图5图示了以下情况,其中视频编码块501对多视点视频之中的第一视频进行编码。
深度信息视频编码块503使用根据帧间预测和帧内预测的预测信息中的一条或多条,来对与多视点视频对应的深度信息视频进行编码。视频编码块501对第一视频进行编码,而深度信息视频编码块503对第一深度信息视频进行编码。
如上所述,预测信息可以是根据帧间预测的视频的运动向量、和根据帧内预测的视频的预测模式。
更具体地,深度信息视频编码块503包括运动向量生成单元505、一致性(identity)判断单元507、标志比特编码单元509和编码单元511。
运动向量生成单元505使用参考帧来生成用于第一深度信息视频的当前帧的运动向量。如上所述,运动向量生成单元505在将B帧和P帧设置为当前帧的情况下,设置参考帧,并且生成运动向量。
一致性判断单元507判断用于当前帧的运动向量是否与根据帧间预测的运动向量一致。即,一致性判断单元507对视频编码块501所生成的运动向量与运动向量生成单元505所生成的运动向量进行比较。作为结果,当确认了运动向量之间的一致性时,在深度信息视频的编码期间使用视频编码块501所生成的运动向量。
标志比特编码单元509生成指示出一致性判断单元507的一致性判断结果的标志比特,并然后对生成的标志比特进行编码。例如,当确认了一致性时,标志比特可以指示出“1”。另一方面,当没有确认一致性时,标志比特可以指示出“0”。
编码单元511取决于该标志比特来对包括了用于当前帧的运动向量的深度信息视频进行编码。即,当确认了一致性时,编码单元511对包括了用于深度信息视频的运动向量的深度信息视频进行编码。另一方面,当没有确认一致性时,编码单元511对排除了用于深度信息视频的运动向量的深度信息视频进行编码。
根据本发明的实施例,当确认了一致性时,可以仅仅对标志比特进行编码,该标志比特比运动向量具有更少量的信息量。因此,编码效率可以增加。此外,当判断出视频编码块501所生成的运动向量与运动向量生成单元505所生成的运动向量一致时,可以使用视频编码块501所生成的运动向量来增加编码的精度。
在I帧中,并不生成运动向量,而是根据预测模式来执行编码。多视点视频编码设备301可以使用根据帧内模式的视频的预测模式来对深度信息视频进行编码。更具体地,标志比特编码单元509可以进一步生成和编码指示出视频编码块501是否使用在帧内预测期间所使用的预测模式来对深度信息视频进行编码的标志比特。
编码单元511可以执行根据预测模式的帧内预测,并且进一步对深度信息视频的当前帧进行编码。即,编码单元511在第一视频的I帧的预测模式与深度信息视频的I帧的预测模式一致的前提下,使用第一视频的I帧内的预测模式来对深度信息视频进行编码。
因此,由于可以仅仅对比预测模式的信息具有更少信息量的标志比特进行编码,所以编码效率增加。取决于该设计,多视点视频编码设备301可以使用预测模式和运动向量中的一者或两者来对深度信息视频进行编码。此外,当深度信息视频编码块503使用视频编码块501的运动向量来对深度信息视频进行编码时,多视点视频编码设备301可以不判断一致性,而是在确认了该一致性的前提下对深度信息视频进行编码。
可以取决于宏块类型来执行帧间预测和帧内预测。多视点视频编码设备301首先判断宏块类型之间的一致性。当确认了该一致性时,多视点视频编码设备301可以使用视频编码块501的预测信息来对深度信息视频进行编码。
其间,多视点视频编码设备301可以进一步包括未图示的过滤器块。过滤器块取决于视频与深度信息视频之间的分辨率或帧频的差异来控制预测信息,使得深度信息视频编码块503可使用该预测信息。例如,当一致性判断单元507判断出运动向量之间的一致性时,过滤器块可以控制输入到一致性判断单元507的运动向量的比例尺。即,当视频的帧频不同于深度信息视频的帧频时,过滤器块可以执行重采样(sub sampling),以控制运动向量的比例尺。替换地,当视频的分辨率不同于深度信息视频的分辨率时,过滤器块可以执行欠采样(down sampling),以控制运动向量的比例尺。
图6图示了根据本发明另一实施例的多视点视频编码设备301。
参考图6,根据本发明实施例的多视点视频编码设备301包括比例尺控制块601和深度信息视频编码块603。图6图示了以下情况,其中对第一和第二深度信息视频进行编码。第二深度信息视频是对应于与第一深度信息视频具有不同视图的视频的深度信息视频。
比例尺控制块601控制与多视点视频对应的第一和第二深度信息视频的比例尺,从而使所述比例尺彼此相同。如上所述,深度信息视频包括深度信息,并且该深度信息是通过表达图中视频的对象与相机之间的距离所获得的。因此,可能存在相对于同一对象的第一和第二深度信息视频之间的深度值。即,可能存在比例尺上的差异。当在第二深度信息视频编码期间、参考第一深度信息视频时,第一深度信息视频与第二深度信息视频之间的比例尺上的差异可能导致误差。比例尺控制块601可以基于第二深度信息视频来控制第一深度信息视频的比例尺,或者利用其平均值来控制第一和第二深度信息视频的比例尺。
深度信息视频编码块603通过参考由比例尺控制块601来控制其比例尺的第一深度信息深度图像,来对其比例尺被控制的第二深度信息视频进行编码。参考图4,当对于第二深度信息视频的P帧执行根据帧间预测的编码时,可以参考第一深度信息视频的I帧。尽管在图4中未图示,但是当对于第二深度信息视频的B帧执行根据帧间预测的编码时,可以参考第一深度信息视频的B帧。此时,深度信息视频编码块603可以通过参考其比例尺被控制的第一深度信息视频来对其比例尺被控制的第二深度信息视频进行编码。
其间,多视点视频可以由图5中所图示的视频编码块501来进行编码。此外,根据本发明实施例的包括比例尺控制块601和深度信息视频编码块603的多视点视频编码设备301可以控制两个或更多深度信息视频的比例尺,并然后对所述深度信息视频进行编码。
图7图示了根据本发明另一实施例的多视点视频编码方法。
参考图7,根据本发明实施例的多视点视频编码方法从步骤S701开始。在步骤S701中,视频编码块501执行帧间预测和帧内预测,以对多视点视频进行编码。在步骤S703中,深度信息视频编码块503使用根据帧间预测和帧内预测的预测信息中的一条或多条,来对与多视点视频对应的深度信息视频进行编码。
在下文中,将详细地描述步骤S703。
在步骤S705中,运动向量生成单元505使用参考帧来生成用于深度信息视频的当前帧的运动向量。在步骤S707中,一致性判断单元507判断根据视频编码块501的帧间预测的运动向量是否与用于当前帧的运动向量一致。此时,当在视频与深度信息视频之间存在帧频或分辨率上的差异时,过滤器块可以控制根据视频编码块501的帧间预测的运动向量的比例尺。
在步骤S709中,标志比特编码单元509生成和编码指示出一致性判断结果的标志比特。在步骤S711中,编码单元509取决于该标志比特来对包括用于当前帧的运动向量的深度信息视频进行编码。当在步骤S707中判断出没有确认运动向量之间的一致性时,在步骤S711中对包括了运动向量的深度信息视频进行编码。另一方面,当在步骤S707中判断出确认了该一致性时,在步骤S711中对排除了运动向量的深度信息视频进行编码。
根据本发明的实施例,可以通过使用在步骤S701中生成的根据帧内预测的预测模式来执行深度信息视频的编码。更具体地,可以将在步骤S701中生成的根据帧内预测的预测模式传输到标志比特编码单元509,并且标志比特编码单元509使用该预测模式来生成和编码指示出是否对深度信息视频进行编码的标志比特。编码单元509执行根据该预测模式的帧内预测,并然后,对深度信息视频进行编码。
图8图示了根据本发明另一实施例的多视点视频编码方法。
参考图8,根据本发明实施例的多视点视频编码方法从步骤S801开始。
在步骤S801中,比例尺控制块601控制与多视点视频对应的第一和第二深度信息视频的比例尺,从而使所述比例尺彼此相同。这是因为当在第二深度信息视频编码期间、参考第一深度信息视频时,第一深度信息视频与第二深度信息视频之间的比例尺上的差异可能导致误差。
在步骤S803中,深度信息视频编码块603通过参考在步骤S801中控制其比例尺的第一深度信息视频来对第二深度信息视频进行编码。在步骤S801中,可以控制两个或更多深度信息视频的比例尺。在步骤S803中,可以对其比例尺被控制的两个或更多深度信息视频进行编码。
图9图示了根据本发明另一实施例的多视点视频解码方法。
参考图9,根据本发明实施例的多视点视频解码方法从步骤S901开始。
在步骤S901中,接收通过帧间预测和帧内预测所编码的多视点视频、以及通过使用根据帧间预测和帧内预测的预测信息中的一条或多条所编码的深度信息视频。即,在步骤S901中接收根据本发明上述实施例所编码的视频和深度信息视频。可以作为一个比特流来传送所编码的多视点视频和所编码的深度信息视频。
在步骤S903中,对编码的多视点视频进行解码。然后,在步骤S905中,使用在深度信息视频编码期间所使用的预测信息来对编码的深度信息视频进行解码。由于在深度信息视频的编码处理中使用了根据多视点视频的编码的预测信息,所以可以在步骤S905中使用根据多视点视频的编码的预测信息。在步骤S905中,可以通过参考在深度信息视频的编码处理中生成的标志比特,来使用根据多视点视频的编码的预测信息。
此外,可以根据H.264/AVC标准来执行在步骤S903和S905中的解码。
同样,可以将上述的多视点视频编码/解码方法和设备实施为计算机程序。本发明所属技术领域的计算机程序员可以容易地诠释出用于构成该程序的代码和代码段。此外,可以将创建的程序存储在计算机可读记录介质或数据存储介质中,并且可以通过计算机来读出和运行。计算机可读记录介质的示例包括任何计算机可读记录介质,例如,诸如载波之类的无形介质、以及诸如CD或DVD之类的有形介质。
尽管已经针对特定实施例而描述了本发明,但是对于本领域技术人员将显而易见的是,可以做出各种改变和修改,而不脱离由以下权利要求限定的本发明的精神和范围。

Claims (5)

1.一种用于多视点视频编码的方法,该方法包括:
控制与多视点视频对应的第一和第二深度信息视频的比例尺,从而使所述比例尺相同;
通过参考其比例尺被控制的第一深度信息视频,来对其比例尺被控制的第二深度信息视频进行编码;和
通过执行帧间预测和帧内预测中的至少一个来对多视点视频进行编码。
2.根据权利要求1的方法,其中所述第一和第二深度信息视频包括深度信息。
3.根据权利要求1的方法,其中该方法还包括:
传送关于该比例尺的信息。
4.根据权利要求1的方法,其中通过使用根据帧间预测和帧内预测中的至少一个的预测信息中的一条或多条、来对该第二深度信息视频进行处理,其中***标志比特,其中该标志比特包括根据帧间预测和帧内预测中的至少一个的预测信息,其中根据帧间预测的预测信息包括根据帧间预测的运动向量。
5.一种用于多视点视频解码的方法,该方法包括:
接收通过帧间预测和帧内预测中的至少一个所编码的多视点视频、通过使用根据帧间预测和帧内预测中的至少一个的预测信息中的一条或多条所编码的深度信息视频、以及指示出是否使用了根据至少一个帧间预测和帧内预测的预测信息的标志比特,其中根据帧间预测的预测信息包括根据帧间预测的运动向量;
对所编码的多视点视频进行解码;
使用在深度信息视频的编码期间所使用的预测信息,来对所编码的深度信息视频进行解码;以及
控制所解码的深度信息视频的比例尺,其中通过参考其比例尺被控制的第二深度信息视频,来对所解码的深度信息视频的比例尺进行控制。
CN201410026092.0A 2008-12-08 2009-12-08 用于多视点视频编码/解码的方法 Active CN103716642B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2008-0124321 2008-12-08
KR20080124321 2008-12-08
KR1020090037007A KR101158491B1 (ko) 2008-12-08 2009-04-28 다시점 영상 부호화, 복호화 방법 및 그 장치.
KR10-2009-0037007 2009-04-28
CN200980156340.0A CN102308585B (zh) 2008-12-08 2009-12-08 多视点视频编码/解码方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200980156340.0A Division CN102308585B (zh) 2008-12-08 2009-12-08 多视点视频编码/解码方法和设备

Publications (2)

Publication Number Publication Date
CN103716642A CN103716642A (zh) 2014-04-09
CN103716642B true CN103716642B (zh) 2017-09-05

Family

ID=42365418

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201410026265.9A Active CN103796027B (zh) 2008-12-08 2009-12-08 用于多视点视频编码/解码的设备
CN201410026092.0A Active CN103716642B (zh) 2008-12-08 2009-12-08 用于多视点视频编码/解码的方法
CN200980156340.0A Active CN102308585B (zh) 2008-12-08 2009-12-08 多视点视频编码/解码方法和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201410026265.9A Active CN103796027B (zh) 2008-12-08 2009-12-08 用于多视点视频编码/解码的设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200980156340.0A Active CN102308585B (zh) 2008-12-08 2009-12-08 多视点视频编码/解码方法和设备

Country Status (5)

Country Link
US (1) US9143796B2 (zh)
EP (1) EP2375752A4 (zh)
KR (2) KR101158491B1 (zh)
CN (3) CN103796027B (zh)
WO (1) WO2010068020A2 (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101893559B1 (ko) 2010-12-14 2018-08-31 삼성전자주식회사 다시점 비디오 부호화/복호화 장치 및 방법
JP2012147332A (ja) * 2011-01-13 2012-08-02 Sony Corp 符号化装置および符号化方法、並びに復号装置および復号方法
WO2012099352A2 (ko) * 2011-01-20 2012-07-26 삼성전자주식회사 다시점 영상 부호화/복호화 장치 및 방법
KR101303719B1 (ko) * 2011-02-03 2013-09-04 브로드콤 코포레이션 깊이 정보를 강화 계층으로 이용하기 위한 방법 및 시스템
US9521418B2 (en) 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US20130188013A1 (en) * 2011-07-22 2013-07-25 Qualcomm Incorporated Mvc based 3dvc codec supporting inside view motion prediction (ivmp) mode
US11496760B2 (en) 2011-07-22 2022-11-08 Qualcomm Incorporated Slice header prediction for depth maps in three-dimensional video codecs
US9402066B2 (en) 2011-08-09 2016-07-26 Samsung Electronics Co., Ltd. Method and device for encoding a depth map of multi viewpoint video data, and method and device for decoding the encoded depth map
CN103858431A (zh) * 2011-08-09 2014-06-11 三星电子株式会社 多视点数据编码方法和装置以及解码方法和装置
US9288505B2 (en) 2011-08-11 2016-03-15 Qualcomm Incorporated Three-dimensional video with asymmetric spatial resolution
EP2742688A1 (en) * 2011-08-12 2014-06-18 Telefonaktiebolaget LM Ericsson (PUBL) Signaling of camera and/or depth parameters
KR20130022923A (ko) * 2011-08-26 2013-03-07 삼성전자주식회사 가상 시점 합성 예측을 이용한 부호화/복호화 장치 및 부호화/복호화 방법
US9485503B2 (en) 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
KR20130056684A (ko) * 2011-11-22 2013-05-30 삼성전자주식회사 컬러 영상과 깊이 영상에 관한 부가정보를 부호화/복호화 하는 장치 및 방법
KR20130056803A (ko) * 2011-11-22 2013-05-30 삼성전자주식회사 칼라영상을 이용해서 다시점 깊이영상을 부호화/복호화 하는 장치 및 방법
CN104601976A (zh) * 2012-01-31 2015-05-06 索尼公司 图像处理装置和图像处理方法
WO2013115609A1 (ko) * 2012-02-02 2013-08-08 한국전자통신연구원 영상신호의 계층간 예측 방법 및 그 장치
WO2013157822A1 (ko) * 2012-04-16 2013-10-24 삼성전자주식회사 깊이 영상의 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
EP2838262A4 (en) * 2012-04-16 2016-01-06 Samsung Electronics Co Ltd METHOD FOR MULTIPLE VIEW VIDEO CODING BASED ON A TREE STRUCTURE CODING UNIT AND DEVICE THEREFOR AND METHOD FOR MULTIPLE VIDEO VIDEO DECODING BASED ON A TREE STRUCTURE CODING UNIT AND DEVICE THEREFOR
US9961368B2 (en) 2012-04-24 2018-05-01 Lg Electronics Inc. Method and device for determining a unit of a transform unit used in video signal processing
WO2014065546A1 (ko) * 2012-10-22 2014-05-01 (주)휴맥스 3차원 비디오에서의 뷰간 움직임 예측 방법 및 뷰간 병합 후보 결정 방법
CN103795996B (zh) * 2012-11-01 2016-08-03 上海贝尔股份有限公司 3d视频传递方法和设备
KR20150090031A (ko) * 2012-11-27 2015-08-05 인텔렉추얼디스커버리 주식회사 깊이 정보를 이용한 부호화/복호화 방법 및 장치
CN107318027B (zh) 2012-12-27 2020-08-28 日本电信电话株式会社 图像编码/解码方法、图像编码/解码装置、以及图像编码/解码程序
CN104854862A (zh) * 2012-12-27 2015-08-19 日本电信电话株式会社 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、图像解码程序以及记录介质
WO2014107038A1 (ko) * 2013-01-04 2014-07-10 삼성전자주식회사 깊이 영상의 부호화 장치 및 복호화 장치, 부호화 방법 및 복호화 방법
WO2014110452A1 (en) 2013-01-11 2014-07-17 Futurewei Technologies Co., Ltd. Method and apparatus of depth prediction mode selection
KR101452625B1 (ko) * 2013-04-01 2014-10-24 한양대학교 산학협력단 3차원 영상의 인트라 예측 방법 및 장치
WO2014168444A1 (ko) * 2013-04-11 2014-10-16 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR102105323B1 (ko) * 2013-04-15 2020-04-28 인텔렉추얼디스커버리 주식회사 객체 기반 적응적 밝기 보상 방법 및 장치
KR102060857B1 (ko) 2013-07-24 2019-12-30 퀄컴 인코포레이티드 3d-hevc 를 위한 단순화된 진보된 모션 예측
CN105393539B (zh) * 2013-07-24 2019-03-29 高通股份有限公司 用于纹理及深度译码的子pu运动预测
WO2015131387A1 (en) 2014-03-07 2015-09-11 Qualcomm Incorporated Simplified sub-prediction unit (sub-pu) motion parameter inheritence (mpi)
US20160050440A1 (en) * 2014-08-15 2016-02-18 Ying Liu Low-complexity depth map encoder with quad-tree partitioned compressed sensing
US11496747B2 (en) * 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
JP7105062B2 (ja) * 2017-12-21 2022-07-22 株式会社ソニー・インタラクティブエンタテインメント 画像処理装置、コンテンツ処理装置、コンテンツ処理システム、および画像処理方法
CN108924553B (zh) 2018-06-20 2021-10-08 腾讯科技(深圳)有限公司 视频编码、解码方法、装置、计算机设备和存储介质
US11132819B2 (en) * 2018-12-13 2021-09-28 Konkuk University Industrial Cooperation Corp Method and apparatus for decoding multi-view video information
CA3152728A1 (en) * 2019-10-03 2021-04-08 Han GAO Coding process for geometric partition mode

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6384859B1 (en) 1995-03-29 2002-05-07 Sanyo Electric Co., Ltd. Methods for creating an image for a three-dimensional display, for calculating depth information and for image processing using the depth information
KR20060059769A (ko) * 2004-11-29 2006-06-02 엘지전자 주식회사 영상신호의 엔코딩시에 베이스 레이어 픽처의 벡터를이용하기 위한 미세정보를 코딩하는 방법과 그 미세정보를이용하는 디코딩 방법
US7728878B2 (en) * 2004-12-17 2010-06-01 Mitsubishi Electric Research Labortories, Inc. Method and system for processing multiview videos for view synthesis using side information
US20060153300A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for motion vector prediction in scalable video coding
EP1905244A4 (en) 2005-07-18 2010-12-01 Korea Electronics Telecomm PREDICTIVE ENCODING / DECODING DEVICE THROUGH SPATIO-TEMPORAL DIMENSIONAL REFERENCE IMAGE PADS AND METHOD OF USE
CN101292538B (zh) * 2005-10-19 2012-11-28 汤姆森特许公司 使用可缩放的视频编码的多视图视频编码
US7667808B2 (en) 2005-12-28 2010-02-23 Lg Display Co., Ltd. Liquid crystal display device and method of driving the same
JP2007178907A (ja) * 2005-12-28 2007-07-12 Lg Philips Lcd Co Ltd 液晶表示装置
US20070177671A1 (en) 2006-01-12 2007-08-02 Lg Electronics Inc. Processing multiview video
AU2007232607B2 (en) * 2006-03-30 2010-09-16 Lg Electronics Inc. A method and apparatus for decoding/encoding a video signal
KR20080006495A (ko) * 2006-07-12 2008-01-16 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치
EP2083571A4 (en) 2006-10-30 2010-11-10 Nippon Telegraph & Telephone DYNAMIC PICTURE CODING METHOD, DECODING METHOD, DEVICE THEREFOR, PROGRAM THEREFOR AND THE PROGRAM CONTAINING STORAGE MEDIUM
CN101222639B (zh) * 2007-01-09 2010-04-21 华为技术有限公司 多视点视频技术中的视间预测方法、编码器和解码器
CN101222627A (zh) * 2007-01-09 2008-07-16 华为技术有限公司 一种多视点视频编解码***以及预测向量的方法和装置
EP2105021A4 (en) * 2007-01-17 2011-03-02 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING A VIDEO SIGNAL
JP2010520697A (ja) * 2007-03-02 2010-06-10 エルジー エレクトロニクス インコーポレイティド ビデオ信号のデコーディング/エンコーディング方法及び装置
KR101396948B1 (ko) 2007-03-05 2014-05-20 경희대학교 산학협력단 하이브리드 다시점 및 계층화 비디오 코딩 방법과 장치
US8548261B2 (en) 2007-04-11 2013-10-01 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-view image
KR101301181B1 (ko) 2007-04-11 2013-08-29 삼성전자주식회사 다시점 영상의 부호화, 복호화 방법 및 장치
EP2149262A4 (en) * 2007-04-25 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
CN101911700A (zh) 2008-01-11 2010-12-08 汤姆逊许可证公司 视频和深度编码
EP2348732A4 (en) * 2008-11-10 2012-05-09 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING VIDEO SIGNAL BY INTER-VIEW PREDICTION

Also Published As

Publication number Publication date
WO2010068020A3 (ko) 2011-10-27
KR20100066304A (ko) 2010-06-17
US20110261883A1 (en) 2011-10-27
EP2375752A2 (en) 2011-10-12
CN103796027A (zh) 2014-05-14
CN103716642A (zh) 2014-04-09
WO2010068020A9 (ko) 2010-08-05
CN102308585B (zh) 2014-02-26
KR101158491B1 (ko) 2012-06-20
EP2375752A4 (en) 2014-03-19
WO2010068020A2 (ko) 2010-06-17
KR101466849B1 (ko) 2014-12-03
CN102308585A (zh) 2012-01-04
US9143796B2 (en) 2015-09-22
KR20110133532A (ko) 2011-12-13
CN103796027B (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN103716642B (zh) 用于多视点视频编码/解码的方法
CN103069800B (zh) 用于编码视频的方法和设备、以及解码方法和设备
CN104995916B (zh) 视频数据解码方法和视频数据解码设备
CN101573985B (zh) 用于视频预测编码的方法和装置以及用于视频预测解码的方法和装置
JP4663792B2 (ja) 多視点動映像を符号化及び復号化する装置及び方法
CN106105191A (zh) 用于处理多视图视频信号的方法和装置
US20150172714A1 (en) METHOD AND APPARATUS of INTER-VIEW SUB-PARTITION PREDICTION in 3D VIDEO CODING
KR20070036611A (ko) 카메라 파라미터를 이용하여 시차 벡터를 예측하는 방법,그 방법을 이용하여 다시점 영상을 부호화 및 복호화하는장치 및 이를 수행하기 위한 프로그램이 기록된 기록 매체
KR20120080122A (ko) 경쟁 기반의 다시점 비디오 부호화/복호화 장치 및 방법
KR101928851B1 (ko) 템플릿 매칭을 이용한 영상 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
KR20080114482A (ko) 다시점 비디오 코딩에서 휘도 보상 방법 및 장치
CN104704832A (zh) 用于预测运动矢量和视差矢量的图像处理方法和设备
CN103370934A (zh) 多视点视频编码/解码装置和方法
CN101242530B (zh) 运动估计方法、基于运动估计的多视编解码方法及装置
US10057598B2 (en) Method, device, and computer readable medium for encoding and decoding of three dimensional video of a current block of fixed images involving coding a current block as a function of coding information and coding process using selective inheritance
CN104782126B (zh) 用于对多视点图像进行编码/解码的设备和方法
KR20080006494A (ko) 비디오 신호의 디코딩 방법 및 장치
KR20110136014A (ko) 다시점 깊이영상을 부호화/복호화 하는 장치 및 방법
KR101261577B1 (ko) 다시점 동영상을 부호화 및 복호화하는 장치 및 방법
KR20130116777A (ko) 움직임 벡터와 변이 벡터를 예측하는 영상 처리 방법 및 장치
KR20070076392A (ko) 비디오 신호의 디코딩/인코딩 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant