CN1864406B - 用于运动估计的方法和设备 - Google Patents

用于运动估计的方法和设备 Download PDF

Info

Publication number
CN1864406B
CN1864406B CN2004800287735A CN200480028773A CN1864406B CN 1864406 B CN1864406 B CN 1864406B CN 2004800287735 A CN2004800287735 A CN 2004800287735A CN 200480028773 A CN200480028773 A CN 200480028773A CN 1864406 B CN1864406 B CN 1864406B
Authority
CN
China
Prior art keywords
frame
hunting zone
pixels
nuclear line
semantic accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800287735A
Other languages
English (en)
Other versions
CN1864406A (zh
Inventor
S·维杜拉
R·普里
A·J·塔巴塔拜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Electronics Inc
Original Assignee
Sony Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Electronics Inc filed Critical Sony Electronics Inc
Publication of CN1864406A publication Critical patent/CN1864406A/zh
Application granted granted Critical
Publication of CN1864406B publication Critical patent/CN1864406B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)

Abstract

描述用于多视图序列视频编码的运动估计方法和设备。在一个实施例中,运动估计方法包括:标识多视图视频序列第一帧中的一个或多个像素,以及基于有效编码和语义精确度之间期望相关性的指示,限制与多视图视频序列第二帧相关联的搜索范围。语义精确度取决于捕获多视图视频序列的摄像机的几何构型的使用。该方法还包括在限制的搜索范围内搜索第二帧以匹配在第一帧中标识的像素。

Description

用于运动估计的方法和设备
相关申请
本申请要求2003年8月7日提交的美国临时申请No.60/493,883的优先权,其全部内容通过引用结合于本文中。
技术领域
本发明一般涉及视频编码。更具体地说,本发明涉及执行用于多视图视频编码的运动估计。
版权通知/许可
本专利文档的部分公开包括受版权保护的材料。版权所有者不反对任何人拓制本专利文档或专利公开,因为它出现在专利和商标局专利文件或记录中,但在其他方面无论如何保留所有版权权利。下面通知应用于如下所述以及附图中的软件和数据:SonyElectronics,Inc.,保留所有权利。
背景技术
已经证明运动估计和补偿是减少视频序列总比特率的有效方法。运动估计是用于估计帧之间图像采样(例如像素)运动的过程。使用运动估计,编码器试图将一个帧中的像素块与另一个帧中相应的像素相匹配。在给定搜索区域中发现最相似块之后,相应像素位置的变化接近于并表示为运动数据,诸如运动向量。运动补偿是用于确定预测图像并计算预测图像和原始图像之间误差的过程。使用运动补偿,编码器将运动数据应用到图像,并计算预测图像。预测图像和输入图像之间的不同称为误差信号。
常规运动估计和补偿方法已经由各种编码器(例如MPEG-x编码器、H.26x编码器等)所使用,实现单个视图视频序列的有效交叉时间压缩。不过,虽然从压缩的角度看这些方法产生的匹配可能是有效的,但是因为它们不需要表示视频序列中底层的“真实”运动,所以它们通常在语义上不正确。
发明内容
描述了用于多视图序列视频编码的运动估计方法和设备。示例性运动估计方法包括:标识多视图视频序列第一帧中的一个或多个像素,以及基于有效编码和语义精确度之间期望相关性的指示,限制与多视图视频序列第二帧相关联的搜索范围。语义精确度取决于捕获多视图视频序列的摄像机几何构型(configuration)的使用。该方法还包括在限制的搜索范围内搜索第二图像,以匹配在第一帧中标识的像素。
根据本发明的一个方面,提供了一种运动估计方法,包括:
标识多视图视频序列第一帧中的一个或多个像素;
将与所述多视图视频序列的第二帧相关联的搜索范围限制到相对于该第二帧中的核线的位置的区域,其中所述核线对应于所述第一帧中的一个或多个像素,所述区域由有效编码与语义精确度之间的期望相关性限定,以及所述语义精确度依赖于捕获所述多视图视频序列的摄像机的几何构型的使用,以及其中限制所述搜索范围包括利用差异向量找到核线上的初始种子的位置;以及
在限制的搜索范围内搜索第二帧,以匹配在第一帧中标识的所述一个或多个像素,以供在随后计算所述一个或多个像素的运动向量时使用。
根据本发明的另一方面,提供了一种运动估计设备,包括:
块标识器,标识多视图视频序列第一帧中的一个或多个像素;
搜索范围确定器,将与所述多视图视频序列第二帧相关联的搜索范围限制到相对于该第二帧中的核线位置的区域,其中所述核线对应于所述第一帧中的一个或多个像素,所述区域由有效编码与语义精确度之间的期望相关性限定,以及所述语义精确度依赖于捕获所述多视图视频序列的摄像机的几何构型的使用,以及其中所述搜索范围确定器通过利用差异向量找到所述核线上的初始种子的位置来限制所述搜索范围;以及
搜索器,在限制的搜索范围内搜索第二图像,以匹配在第一帧中标识的所述一个或多个像素,以供运动向量计算器在计算所述一个或多个像素的运动向量时使用。
附图说明
从下面给出的详细描述和本发明各种实施例的附图中,将更全面地理解本发明,不过,这些实施例不应用于将本发明限制在具体实施例上,而只是用于解释和理解。
图1是编码***一个实施例的框图。
图2是用于对多视图视频序列执行运动估计的过程的一个实施例的流程图。
图3是使用播种方法定义运动估计的搜索范围的过程的一个实施例的流程图。
图4举例说明多视图视频序列的两个示例帧。
图5举例说明对多视图视频序列尝试用不同运动估计方法所获得的比特率的比较。
图6是适用于实践本发明实施例的计算机环境的框图。
具体实施方式
在本发明实施例的下列详细描述中,附图中相同标号指示相同元件,并通过举例说明的方式,示出可实践本发明的具体实施例。这些实施例描述得相当详细,以使本领域专业技术人员能够实践本发明,并且要理解,可利用其他实施例,并可在不脱离本发明范围的情况下进行逻辑的、机械的、电子的、功能的和其他变化。因此,下列详细描述没有限制的意思,并且本发明的范围仅由所附权利要求书定义。
从本发明的操作概述开始,图1举例说明了编码***100的一个实施例。编码***100根据诸如MPEG-x和H-26x等视频编码标准执行多视图编码。编码***100可用硬件、软件或二者的组合来实现。在软件实现中,可以在各种常规计算机可读介质上存储和分配编码***100。在硬件实现中,可用数字逻辑(例如集成电路)实现编码***100的模块。可在计算机外设中的专用数字逻辑装置中优化一些功能,以从主计算机上卸载处理负担。
编码***100包括信号接收器102、运动估计器104、运动补偿器106、编码模块108、缓冲器110和帧重建器112。帧接收器102负责接收带有多视图视频序列的视频信号,并将多视图视频序列中所包含的各个帧转发到运动估计器104。
运动估计器104负责将多视图视频序列的当前帧与从以前帧重建的并存储在缓冲器110中的帧相比较,并估计当前帧相对于以前帧的运动。具体地说,运动估计器104搜索重建的以前帧,以匹配当前帧的每个像素(或像素块),来计算每个像素或块的运动向量。所得到的运动向量传递到编码***100的输出。
运动补偿器106负责读取运动向量和重建的以前帧,计算当前帧的预测图像,并从当前帧中减去预测图像,结果产生剩余帧。
编码模块108负责使剩余帧经历各种编码操作,以压缩信号,并将压缩信号传递到编码***100的输出。编码操作的示例可包括,例如离散余弦变换(DCT)与自适应量化相结合、差分编码、游程长度编码(RLC)、可变长度编码(VLC)等。
帧重建器112负责将剩余帧加到预测图像上,以获得重建的当前帧,并在缓冲器110中存储重建的当前帧,以由运动估计器104和运动补偿器106的进一步使用。
在一个实施例中,运动估计器104包括块标识器114、搜索范围确定器116、搜索器118和运动向量计算器120。块标识器114负责从信号接收器102接收多视图视频序列的帧,将该当前帧分成块(或各个像素),并将每个块(或像素)传递到搜索范围确定器116。
搜索范围确定器116负责在正在编码的多视图视频序列的以前帧内定义搜索范围,以为了匹配块执行搜索。搜索范围确定器116基于用于捕获多视图序列的摄像机几何构型来确定搜索范围。在用于确定搜索范围时,摄像机的几何构型定义多视图的几何限制,其能够使匹配的语义精确度更高,并有助于降低搜索的复杂性。
在一个实施例中,通过核面几何描述多视图几何限制。具体地说,根据核面几何,对于观看相同景物的一对视图来说,真实语义匹配沿核线(epipolar line)对应于第二视图中像素的第一视图中的任何像素。因此,搜索确定器116使用以前帧中核线的位置来确定相关块的搜索范围。更具体地说,搜索确定器116基于有效编码和匹配的语义精确度之间的期望相关性来确定如何相对于核线的位置限制搜索范围。也就是说,对于较高语义精确度,搜索确定器116将搜索范围限制为较接近核线。对于较高的编码有效性,搜索确定器116将搜索范围定义为覆盖核线周围的较大区域。在一个实施例中,有效编码和匹配的语义精确度之间的期望相关性由用户指定(例如,根据编码***100所用于的应用的需要),并且可在任一时间进行修改。
搜索器118负责在确定的搜索范围内为了匹配块搜索以前帧,并且运动向量计算器120负责计算该块的运动向量。
因此,编码***100将多视图几何限制与基于块的匹配结合起来,以实现更好的匹配语义精确度。这里将该方法称为基于语义的运动估计。另外,编码***100可以改变限制的硬度,以允许用户控制有效压缩和匹配的语义精确度之间的相关性。
图2和图3是根据本发明的各种实施例可由图1所示运动估计器104执行的运动估计过程的流程图。该过程可由可包括硬件(例如电路、专用逻辑等)、软件(诸如在通用计算机***或专用机器上运行)、或二者的组合的处理逻辑来执行。对于软件实现的过程来说,流程图的描述能够使本领域专业技术人员开发这种包括在适当配置的计算机(计算机的处理器执行来自包括存储器的计算机可读介质的指令)上执行该过程的指令的程序。计算机可执行指令可用计算机编程语言来编写,或可用固件逻辑来实施。如果用遵循公认标准的编程语言编写,那么这种指令可以在各种硬件平台上执行,并用于到各种操作***的接口。此外,本发明实施例的描述没有参考任何特定编程语言。要理解到,可用各种编程语言来实现本文所描述的发明。此外,在本领域中,通常说到以一种形式或另一种形式的软件(例如程序、过程、进程、应用、模块、逻辑等)用来采取行动或产生结果。这种表达只不过是说明软件是由使计算机处理器执行动作或产生结果的计算机来执行的简述方式。要理解到,在不脱离本发明范围的情况下,可将更多或更少的操作结合到图2和图3所说明的过程中,并且这里所示和描述的块排列并没有暗示特定顺序。
图2是用于对多视图视频序列执行运动估计的过程200的一个实施例的流程图。
参考图2,处理逻辑始于标识多视图视频序列第一帧中的一个或多个像素(处理块202)。第一帧是当前在处理的帧。一个或多个像素可以表示块或单个像素。
在处理块204中,处理逻辑访问多视图视频序列的第二帧,并计算第二帧中对应于第一帧上述像素的核线。第二帧是以前处理的帧(例如由运动估计器104重建并存储在缓冲器110中)。在一个实施例中,其中对第一帧的各个像素执行运动估计,核线对应相关像素。在另一个实施例中,其中对第一帧中的块执行运动估计,核线对应相关块中预定义位置的像素。在一个实施例中,利用基本矩阵(已知的F矩阵)计算核线,这是核面几何的代数表示。核线的计算可表示为:
l1=Fx0
其中l1是对应第一图像中像素x0的第二图像中的核线。
本领域专业技术人员要理解,在不缺少一般性原则的情况下,可以使用任何其他已知的方法计算核线。接下来,处理逻辑利用所计算的核线来定义搜索范围,以找到第二图像中的匹配像素。具体地说,在处理块206中,处理逻辑基于有效编码和匹配的语义精确度之间期望相关性的指示,来限制相对于核线的搜索范围。具体地说,期望相关性定义搜索范围到核线的接近度(例如,如果语义精确度的重要性超过有效编码的重要性,则处理逻辑将搜索范围限制为更接近核线,反之亦然)。在一个实施例中,有效编码和语义精确度之间期望相关性的指示由用户通过处理逻辑提供的用户界面来指定。在一个实施例中,初始种子用于进一步相对于核线上具***置限制搜索范围,下面将进行更详细描述。在另一个实施例中,不使用种子。而是,调整(rectify)第一和第二帧以满足帧中任一像素的性质,在另一帧中的相应核线必须是水平的,并且扫描线与像素的位置对准。调整是计算单应性或两个帧中每个帧的2D投影扭曲(warp)并应用这些扭曲的过程。可使用各种算法来计算调整单应性,并由此扭曲这些帧。
在处理块208中,处理逻辑在处理块208确定的搜索范围内搜索第二帧,以匹配来自第一帧的一个或多个像素。
然后,在处理块210中,处理逻辑基于像素位置的变化计算运动向量。
图3是使用播种方法为运动估计定义搜索范围的过程300的一个实施例的流程图。
参考图3,处理逻辑开始于从用户那接收有效编码和匹配的语义精确度之间期望相关性的指示(处理块302)。在一个实施例中,通过向用户传递允许用户指示这两个因子之间期望相关性的用户界面来接收指示。例如,用户界面可给出两个因子的累积权重或百分比(例如100%),并允许用户在两个因子之间分配累积权重或百分比(例如,用户可将20%分配给有效编码因子而将80%分配给语义精确度因子)。备选地,用户界面可提供由用户激活的滑尺,以指定两个因子之间的期望相关性。
在处理块304中,处理逻辑为正编码的块找到核线上初始种子的位置。在一个实施例中,利用差异向量找到初始种子。通过立体算法对第一图像的每个像素计算差异向量,以在另一视图中找到语义上最精确的匹配,另一视图以相同快照及时但从不同角度捕获同一景物。当可得到这种差异向量时,相关差异向量用作初始种子。
在处理块306中,处理逻辑基于有效编码和匹配的语义精确度之间的期望相关性,确定初始种子和核线周围窗口的参数。在一个实施例中,辨别正编码的块的最佳匹配的度量可表示如下:
mv → best = arg min mv → ∈ S disp w [ SAD ( mv → ) + λ x . mvbit s x ( mv d x ) + λ y . mvbit s y ( mv d y ) ]
其中mvx d、mvy d对应于从差异向量播种位置的运动向量位移,分别平行和垂直于核线。Sw disp对应于由差异向量提供的种子位置周围搜索窗口(大小w×w)中所有候选预测值的集合。SAD表示要编码的块和由候选
Figure G2004800287735D00082
指示的预测值块之间绝对差的逐像素总和。mvbits(mvd)表示对差分运动向量(其是运动向量大小的增函数)进行编码所需的比特数。λ是对应于目标质量的适当拉格朗日乘子。
通过减小λx相对于λy的相对值,处理逻辑可以强制匹配更接近核线,确保更好的语义正确性。λy=∞的情况对应于沿核线的搜索。该特殊情况涉及只使用多视图几何形状来获得核线,排除了获得差异向量的需要。
将差异向量用作运动搜索的种子使得种子周围的搜索窗口相当小,并使匹配具有好的压缩效率和语义精确度。另外,使用较小的搜索窗口使得搜索过程复杂度降低了。此外,因为好的语义匹配通常接近核线,因此搜索主要变成1-D(而不是标准运动估计中的2-D搜索),由此进一步降低了搜索过程的复杂度。
图4举例说明多视图视频序列两个示例帧。对于帧402中正在编码的点来说,在以前帧404中找到差异种子。窗口406举例说明常规的运动估计,其中在差异种子周围定义的搜索范围不基于核线的位置限制。窗口408举例说明了结合核面几何限制以影响在差异种子周围并接近于核线定义的搜索范围的运动估计。窗口410举例说明了通过将搜索范围限定在沿核线而把高语义精确度作为目标的运动估计。
图5举例说明对多视图视频序列尝试不同运动估计方法所获得的比特率的比较。第一个柱形示出标准运动估计情况下的比特率,其中运动搜索将差异向量用作运动搜索的种子。该方法使用种子周围的小搜索窗口,并提供具有好压缩效率的匹配。其对应于当水平和垂直拉格朗日乘子的相对权重相似时的情况,产生最大压缩。
柱形2和柱形3示出的情况是极其偏向(bias towards)保持匹配接近于核线(较大的水平拉格朗日乘子)。这些使得语义精确度更好,因为匹配限制于更接近核限制,不过从而降低了压缩效率。
图6的下列描述打算提供计算机硬件和其他适于实现本发明的操作组件的概述,而不打算限定可适用的环境。图6举例说明适于用作编码***100或只用作图1运动估计器104的计算机***的一个实施例。
计算机***640包括耦合到***总线665的处理器650、存储器655和输入/输出性能660。存储器655配置为存储当由处理器650执行时完成这里所述方法的指令。输入/输出660也包括各种类型的计算机可读介质,包括可由处理器650访问的任何类型的存储装置。本领域专业技术人员会立即认识到,术语“计算机可读介质”还包括对数据信号进行编码的载波。还要注意的是,***640由在存储器655中执行的操作***软件控制。输入/输出和相关的介质660存储本发明操作***和方法的计算机可执行指令。图1所示运动估计器104可以是耦合到处理器650的单独组件,或者可以用由处理器650执行的计算机可执行指令实施。在一个实施例中,计算机***640可为ISP(因特网服务供应商)的一部分,或通过输入/输出660耦合到ISP以通过因特网传送或接收图像数据。非常明显的是,本发明不限于因特网访问和基于因特网Web的站点;也考虑直接耦合以及专用网络。
要理解到,计算机***640是许多可能的具有不同体系结构的计算机***的一个示例。典型的计算机***通常至少会包括处理器、存储器和将存储器耦合到处理器的总线。本领域的专业技术人员将立即理解到,本发明可以用其他包括多处理器***、小型计算机、大型计算机等计算机***配置实践。本发明也可在分布式计算环境中实践,在这种环境中由通过通信网络链接的远程处理装置执行任务。
已经描述了选择最佳比例因子的各种方面。虽然这里已经举例说明和描述了具体实施例,但是本领域的那些专业技术人员将要理解到,实现相同目的而计算的任何配置可代替所示的具体实施例。该申请意欲含盖本发明的任何修改或变体。

Claims (16)

1.一种运动估计方法,包括:
标识多视图视频序列第一帧中的一个或多个像素;
将与所述多视图视频序列的第二帧相关联的搜索范围限制到相对于该第二帧中的核线的位置的区域,其中所述核线对应于所述第一帧中的一个或多个像素,所述区域由有效编码与语义精确度之间的期望相关性限定,以及所述语义精确度依赖于捕获所述多视图视频序列的摄像机的几何构型的使用,以及其中限制所述搜索范围包括利用差异向量找到核线上的初始种子的位置;以及
在限制的搜索范围内搜索第二帧,以匹配在第一帧中标识的所述一个或多个像素,以供在随后计算所述一个或多个像素的运动向量时使用。
2.如权利要求1所述的方法,其中所述核线的位置取决于所述摄像机的所述几何构型。
3.如权利要求1所述的方法,其中所述第一帧中的所述一个或多个像素表示块。
4.如权利要求1所述的方法,还包括:
计算所述第二帧中的所述核线。
5.如权利要求4所述的方法,其中利用基本矩阵计算所述核线。
6.如权利要求1所述的方法,其中限制所述搜索范围包括:
基于有效编码和语义精确度之间的所述期望相关性,确定覆盖所述初始种子和所述核线的窗口的参数。
7.如权利要求1所述的方法,还包括:
接收来自用户的有效编码和语义精确度之间的所述期望相关性。
8.如权利要求7所述的方法,还包括:
向用户传递便于用户输入有效编码和语义精确度之间的所述期望相关性的用户界面。
9.如权利要求8所述的方法,其中所述用户界面提供滑尺,以使所述用户能够指定有效编码和语义精确度之间的所述期望相关性。
10.如权利要求8所述的方法,其中所述用户界面允许所述用户在任何时候修改之前指定的有效编码和语义精确度之间的相关性。
11.一种运动估计设备,包括:
块标识器,标识多视图视频序列第一帧中的一个或多个像素;
搜索范围确定器,将与所述多视图视频序列第二帧相关联的搜索范围限制到相对于该第二帧中的核线位置的区域,其中所述核线对应于所述第一帧中的一个或多个像素,所述区域由有效编码与语义精确度之间的期望相关性限定,以及所述语义精确度依赖于捕获所述多视图视频序列的摄像机的几何构型的使用,以及其中所述搜索范围确定器通过利用差异向量找到所述核线上的初始种子的位置来限制所述搜索范围;以及
搜索器,在限制的搜索范围内搜索第二帧,以匹配在第一帧中标识的所述一个或多个像素,以供运动向量计算器在计算所述一个或多个像素的运动向量时使用。
12.如权利要求11所述的设备,其中所述核线的位置取决于所述摄像机的所述几何构型。
13.如权利要求11所述的设备,其中第一帧中的所述一个或多个像素表示块。
14.如权利要求11所述的设备,其中所述搜索范围确定器还将计算第二帧中的所述核线。
15.如权利要求11所述的设备,其中所述搜索范围确定器还将通过如下方式限制所述搜索范围:基于有效编码和语义精确度之间的所述期望相关性,确定覆盖所述初始种子和所述核线的窗口的参数。
16.如权利要求11所述的设备,其中所述搜索范围确定器还将向用户传递便于用户输入有效编码和语义精确度之间的所述期望相关性的用户界面。
CN2004800287735A 2003-08-07 2004-08-02 用于运动估计的方法和设备 Expired - Fee Related CN1864406B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US49388303P 2003-08-07 2003-08-07
US60/493,883 2003-08-07
US10/816,051 US7778328B2 (en) 2003-08-07 2004-03-31 Semantics-based motion estimation for multi-view video coding
US10/816,051 2004-03-31
PCT/US2004/025123 WO2005018217A2 (en) 2003-08-07 2004-08-02 Semantics-based motion estimation for multi-view video coding

Publications (2)

Publication Number Publication Date
CN1864406A CN1864406A (zh) 2006-11-15
CN1864406B true CN1864406B (zh) 2010-06-02

Family

ID=34119149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800287735A Expired - Fee Related CN1864406B (zh) 2003-08-07 2004-08-02 用于运动估计的方法和设备

Country Status (6)

Country Link
US (1) US7778328B2 (zh)
EP (1) EP1661384B1 (zh)
JP (1) JP2007502053A (zh)
KR (1) KR20060055534A (zh)
CN (1) CN1864406B (zh)
WO (1) WO2005018217A2 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8823821B2 (en) * 2004-12-17 2014-09-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for processing multiview videos for view synthesis using motion vector predictor list
KR100779875B1 (ko) * 2005-01-14 2007-11-27 주식회사 휴맥스 다-시점 코딩을 위한 참조 프레임 순서 설정 방법 및 그방법을 기록한 기록매체
ZA200805337B (en) * 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
EP2424245B1 (en) 2006-01-09 2019-09-04 Dolby International AB Methods and apparatus for illumination and color compensation for multi-view video coding
KR101276847B1 (ko) 2006-01-12 2013-06-18 엘지전자 주식회사 다시점 비디오의 처리
EP1982518A4 (en) 2006-01-12 2010-06-16 Lg Electronics Inc PROCESSING MORE VIEW VIDEO
CN101895744B (zh) * 2006-01-12 2013-03-20 Lg电子株式会社 处理多视图视频
EP2005361A1 (de) * 2006-03-22 2008-12-24 Daimler AG Multisensorieller hypothesen-basierter objektdetektor und objektverfolger
AU2012203039B2 (en) * 2006-03-29 2013-09-26 Interdigital Vc Holdings, Inc. Methods and apparatus for use in a multi-view video coding system
EP1999967A2 (en) * 2006-03-29 2008-12-10 Thomson Licensing Multi-view video coding method and device
AU2007269575B2 (en) * 2006-07-06 2012-08-16 Interdigital Vc Holdings, Inc. Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding
TWI344792B (en) 2006-07-12 2011-07-01 Lg Electronics Inc A method and apparatus for processing a signal
CA2663672C (en) * 2006-09-20 2014-08-12 Nippon Telegraph And Telephone Corporation Image encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
CA2663084C (en) * 2006-09-20 2014-08-12 Nippon Telegraph And Telephone Corporation Image encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
EP2083571A4 (en) 2006-10-30 2010-11-10 Nippon Telegraph & Telephone DYNAMIC PICTURE CODING METHOD, DECODING METHOD, DEVICE THEREFOR, PROGRAM THEREFOR AND THE PROGRAM CONTAINING STORAGE MEDIUM
KR101023263B1 (ko) 2006-10-30 2011-03-21 니폰덴신뎅와 가부시키가이샤 예측 참조 정보 생성방법, 동영상 부호화 및 복호방법, 그들의 장치 및 그들의 프로그램을 기록한 기억매체
RU2446618C2 (ru) * 2006-12-28 2012-03-27 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования и способ декодирования видео, устройства для их осуществления и носители памяти, хранящие программы
US7822280B2 (en) * 2007-01-16 2010-10-26 Microsoft Corporation Epipolar geometry-based motion estimation for multi-view image and video coding
CN101291434A (zh) * 2007-04-17 2008-10-22 华为技术有限公司 多视编解码方法及装置
JP2010527216A (ja) * 2007-05-16 2010-08-05 トムソン ライセンシング マルチビュー・ビデオ符号化(mvc)情報の符号化においてスライス群を使用する方法及び装置
US8953684B2 (en) * 2007-05-16 2015-02-10 Microsoft Corporation Multiview coding with geometry-based disparity prediction
TW200910975A (en) * 2007-06-25 2009-03-01 Nippon Telegraph & Telephone Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
CN101478672B (zh) * 2008-01-04 2012-12-19 华为技术有限公司 视频编码、解码方法及装置和视频处理***
CA2767794A1 (en) * 2008-10-07 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Multi-view media data
PT2594077E (pt) * 2010-07-15 2016-03-01 Ge Video Compression Llc Codificação de vídeo híbrida para suporte a síntese de visualização intermédia
CN101917619B (zh) * 2010-08-20 2012-05-09 浙江大学 一种多视点视频编码快速运动估计方法
KR101669840B1 (ko) * 2010-10-21 2016-10-28 삼성전자주식회사 다시점 비디오로부터 일관성 있는 변이를 추정하는 변이 추정 시스템 및 방법
RU2480941C2 (ru) * 2011-01-20 2013-04-27 Корпорация "Самсунг Электроникс Ко., Лтд" Способ адаптивного предсказания кадра для кодирования многоракурсной видеопоследовательности
TWI461066B (zh) * 2011-11-03 2014-11-11 Ind Tech Res Inst 彈性調整估算搜尋範圍的移動估算方法及視差估算方法
WO2014010584A1 (ja) * 2012-07-09 2014-01-16 日本電信電話株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、画像符号化プログラム、画像復号プログラム及び記録媒体
RU2550544C1 (ru) * 2013-12-16 2015-05-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Способ компенсации движения в цифровых динамических стереовидеоизображениях
US9965861B2 (en) * 2014-12-29 2018-05-08 Intel Corporation Method and system of feature matching for multiple images
JP6702796B2 (ja) * 2016-05-16 2020-06-03 キヤノン株式会社 画像処理装置、撮像装置、画像処理方法および画像処理プログラム
CN111372081B (zh) * 2020-03-17 2022-06-17 四川大学 基于丢失块修复的分布式多视点视频解码的方法和装置
WO2023084601A1 (ja) * 2021-11-09 2023-05-19 日本電気株式会社 算出装置、算出方法、カメラパラメータ推定装置、及び非一時的なコンピュータ可読媒体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154600A (en) * 1996-08-06 2000-11-28 Applied Magic, Inc. Media editor for non-linear editing system
CN1333634A (zh) * 2001-01-12 2002-01-30 北京航空航天大学 快速视频运动估计方法
US6353678B1 (en) * 1999-07-14 2002-03-05 Sarnoff Corporation Method and apparatus for detecting independent motion in three-dimensional scenes

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6597818B2 (en) 1997-05-09 2003-07-22 Sarnoff Corporation Method and apparatus for performing geo-spatial registration of imagery
US6043838A (en) * 1997-11-07 2000-03-28 General Instrument Corporation View offset estimation for stereoscopic video coding
US6278890B1 (en) * 1998-11-09 2001-08-21 Medacoustics, Inc. Non-invasive turbulent blood flow imaging system
US6301370B1 (en) 1998-04-13 2001-10-09 Eyematic Interfaces, Inc. Face recognition from video images
JP2000308064A (ja) * 1999-04-22 2000-11-02 Mitsubishi Electric Corp 動きベクトル検出装置
US6571024B1 (en) 1999-06-18 2003-05-27 Sarnoff Corporation Method and apparatus for multi-view three dimensional estimation
JP3587506B2 (ja) * 1999-08-30 2004-11-10 富士重工業株式会社 ステレオカメラの調整装置
US6671399B1 (en) * 1999-10-27 2003-12-30 Canon Kabushiki Kaisha Fast epipolar line adjustment of stereo pairs
US6606406B1 (en) 2000-05-04 2003-08-12 Microsoft Corporation System and method for progressive stereo matching of digital images
US7203693B2 (en) 2001-06-12 2007-04-10 Lucent Technologies Inc. Instantly indexed databases for multimedia content analysis and retrieval
GB0125774D0 (en) * 2001-10-26 2001-12-19 Cableform Ltd Method and apparatus for image matching
KR100481732B1 (ko) * 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154600A (en) * 1996-08-06 2000-11-28 Applied Magic, Inc. Media editor for non-linear editing system
US6353678B1 (en) * 1999-07-14 2002-03-05 Sarnoff Corporation Method and apparatus for detecting independent motion in three-dimensional scenes
CN1333634A (zh) * 2001-01-12 2002-01-30 北京航空航天大学 快速视频运动估计方法

Also Published As

Publication number Publication date
JP2007502053A (ja) 2007-02-01
US7778328B2 (en) 2010-08-17
CN1864406A (zh) 2006-11-15
EP1661384A4 (en) 2012-01-25
WO2005018217A2 (en) 2005-02-24
EP1661384A2 (en) 2006-05-31
WO2005018217A3 (en) 2006-08-03
KR20060055534A (ko) 2006-05-23
US20050031035A1 (en) 2005-02-10
EP1661384B1 (en) 2018-10-03

Similar Documents

Publication Publication Date Title
CN1864406B (zh) 用于运动估计的方法和设备
US8107748B2 (en) Adaptive motion search range
CN102326391B (zh) 多视点图像编码装置及方法、多视点图像译码装置及方法
AU2019275631B2 (en) Motion vector field coding and decoding method, coding apparatus, and decoding apparatus
EP0614318B1 (en) Video encoder and decoder
US8787445B2 (en) Allocation of available bits to represent different portions of video frames captured in a sequence
EP3267693B1 (en) Real time video summarization
CN102742267B (zh) 自适应运动估计
CN110268716B (zh) 由球面投影处理等量矩形对象数据以补偿畸变
CN101325715A (zh) 亮度补偿方法和装置及编码和解码图像的方法和装置
CN103210645A (zh) 使用运动补偿的基于实例的超分辨率的视频解码
US20200380290A1 (en) Machine learning-based prediction of precise perceptual video quality
US9294676B2 (en) Choosing optimal correction in video stabilization
US6909748B2 (en) Method and system for image compression using block size heuristics
CN114651270A (zh) 通过时间可变形卷积进行深度环路滤波
US11570471B2 (en) Prediction for light-field coding and decoding
CN111583345A (zh) 一种相机参数的获取方法、装置、设备及存储介质
Kovačević et al. Block-matching correlation motion estimation for frame-rate up-conversion
US7885335B2 (en) Variable shape motion estimation in video sequence
Gapon et al. Video block error recovery using modified patch-based inpainting
Zhang et al. Mutual information-based context template modeling for bitplane coding in remote sensing image compression
US11711540B2 (en) Method for encoding video using effective differential motion vector transmission method in omnidirectional camera, and method and device
US20060176961A1 (en) Method for reducing bit rate requirements for encoding multimedia data
CN117094896A (zh) 对双目图像进行任意尺度缩放的方法、模型训练方法
Frajka et al. Disparity estimation window size

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100602