CN115136602A - 具有多个测量结果的3d点云增强 - Google Patents

具有多个测量结果的3d点云增强 Download PDF

Info

Publication number
CN115136602A
CN115136602A CN202180016033.3A CN202180016033A CN115136602A CN 115136602 A CN115136602 A CN 115136602A CN 202180016033 A CN202180016033 A CN 202180016033A CN 115136602 A CN115136602 A CN 115136602A
Authority
CN
China
Prior art keywords
point cloud
quantizer
shifts
data
refined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180016033.3A
Other languages
English (en)
Inventor
庞家豪
张学
G·张
田东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
PCMS Holdings Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PCMS Holdings Inc filed Critical PCMS Holdings Inc
Publication of CN115136602A publication Critical patent/CN115136602A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/56Particle system, point based geometry or rendering

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Length Measuring Devices By Optical Means (AREA)

Abstract

本发明描述了用于至少使用第二点云数据和一组或多组量化器移位来细化第一点云数据的***和方法。示例性点云解码方法包括:获得至少表示第一点云和第二点云的数据;获得至少识别与该第一点云相关联的第一组量化器移位的信息;以及至少基于该第一点云、该第一组量化器移位和该第二点云来获得细化的点云数据。获得该细化的点云数据可包括至少基于该第一组量化器移位来执行减法。还描述了对应的编码***和方法。

Description

具有多个测量结果的3D点云增强
相关申请的交叉引用
本申请是2020年2月6日提交的名称为“具有多个测量结果的3D点云增强(3DPoint Cloud Enhancement with Multiple Measurements)”的美国临时专利申请号62/970,956的非临时提交,并且根据35U.S.C.§119(e)要求该美国临时专利申请的权益,该美国临时专利申请全文以引用方式并入本文。
背景技术
本公开涉及点云处理和压缩的领域。本领域涉及点云信号的分析、内插和表示。
作为3D空间中连续表面的离散表示,点云可被分类为包括以下项的类别:有组织的点云,诸如由类相机的3D传感器或3D激光扫描仪收集并布置在网格上的点云;和无组织的点云,诸如由于其复杂结构而从多个视点扫描并随后融合在一起从而导致索引排序丢失的点云。有组织的点云可更容易处理,因为底层的网格意味着可反映感测顺序的自然空间连通性。相反,对无组织的点云的处理可能更具挑战性。这是由于无组织的点云不同于与规则点阵相关联的1D语音数据或2D图像的事实。相反,它们往往稀疏且不规则地散布在3D空间中;这使得传统的基于点阵的算法难以处理3D点云。例如,卷积算子在规则点阵上被很好地定义,但不能直接应用于3D点云。
此外,点云可表示包含多个移动对象的相同场景的顺序表示。与从静态场景或静态对象捕获的静态点云相比,它们被称为动态点云。动态点云可被组织成帧,其中不同的帧在不同的时间被捕获。
点云可用于各种目的,诸如表示文化遗产的对象,其中如雕像或建筑物的对象以3D形式扫描,以便在不发送或访问对象的情况下共享该对象的空间构型。而且,这是一种确保在对象可能被破坏的情况下保存其知识的方式;例如,地震后的寺庙。此类点云通常是静态的、有色的并且往往包括大量的点。
另一种用例是在地形图和制图中,其中使用3D表示,地图不限于平面并且可包括地形凹凸。谷歌地图现在是3D地图的良好示例,但其通常使用网格而不是点云。然而,点云可以是用于3D地图的合适的数据格式,并且此类点云通常是静态的、有色的并且往往包括大量的点。
汽车工业和自动驾驶汽车技术也是可使用点云的领域。自动驾驶汽车应该能够“探测”其环境,以基于其紧邻区域的实际情况采取良好的驾驶决策。典型的传感器如激光雷达产生由决策引擎使用的动态点云。这些点云并非旨在被人看到,并且它们通常是小的,不一定是彩色的,并且是动态的,具有高的捕获频率。点云可具有其他属性,如由激光雷达提供的反射率,因为该属性良好地指示被感测对象的材料,并且可有助于做出决策。
虚拟现实和沉浸式世界越来越受到关注。此类技术试图使观察者沉浸在其周围的环境中,而不像标准TV那样只能看着面前的虚拟世界。根据观察者在环境中的自由度,沉浸感有若干层次。点云是分布虚拟现实(或VR)世界的良好格式候选。它们可以是静态的或动态的,并且通常具有平均大小,比如一次不超过数百万个点。
期望能够以合理的比特率消耗向最终用户分布动态点云,同时保持可接受的(或优选非常好的)体验质量。这些动态点云的有效压缩可有助于使沉浸式世界的分布链变得实用。
发明内容
根据一些实施方案的点云解码方法包括:获得至少表示第一点云和第二点云的数据;获得至少识别与第一点云相关联的第一组量化器移位的信息;以及至少基于第一点云、第一组量化器移位和第二点云来获得细化的点云数据。
根据一些实施方案的点云解码器装置包括被配置为至少执行以下操作的处理器:获得至少表示第一点云和第二点云的数据;获得至少识别与第一点云相关联的第一组量化器移位的信息;以及至少基于第一点云、第一组量化器移位和第二点云来获得细化的点云数据。
在一些实施方案中,获得细化的点云数据包括至少基于第一组量化器移位来执行减法。
一些实施方案还包括获得识别与第二点云相关联的第二组量化器移位的信息,该第二组量化器移位不同于第一组量化器移位;其中获得细化的点云数据还基于第二组量化器移位。在一些此类实施方案中,获得细化的点云数据包括至少基于第一组量化器移位和第二组量化器移位来执行减法。
在一些实施方案中,第一点云表示场景的左视图,并且第二点云表示场景的右视图。
在一些实施方案中,第一点云和第二点云是与不同的时间相关联的帧。
在一些实施方案中,第一组量化器移位至少包括与第一点云中的第一点相关联的第一移位和与第一点云中的第二点相关联的不同的第二移位。
在一些实施方案中,表示第一点云的数据包括具有第一量化范围的第一参数(y1),表示第二点云的数据包括具有第二量化范围的第二参数(y2),并且其中获得细化的点云数据包括获得第一参数(y1)和第二参数(y2)两者的量化范围中的第三参数
Figure BDA0003808952680000031
在一些实施方案中,基于第一点云(yl)和第二点云(yr)来获得细化的点云数据(xl)包括选择细化的第一点云(xl)以基本上最大化包括以下因子中的一个或多个因子的因子的乘积:
·给定细化的第一点云(xl)的第一点云(yl)的条件概率Pr(yl|xl),
·给定第二细化的点云(xr)的估计值g(xl)的第二点云(yr)的条件概率Pr(yr|g(xl)),其中估计值g(xl)基于第一细化的点云(xl),
·第一细化的点云数据(xl)的先验概率Pr(xl),和
·第二细化的点云(xr)的估计值g(xl)的先验概率Pr(g(xl))。
根据一些实施方案的点云编码方法包括:获得至少表示第一点云和第二点云的数据;量化第一点云和第二点云,其中量化点云数据包括向第一点云数据至少添加第一组量化器移位;以及在比特流中编码经量化的第一点云和第二点云。
根据一些实施方案的点云编码装置包括被配置为至少执行以下操作的处理器:获得至少表示第一点云和第二点云的数据;量化第一点云和第二点云,其中量化点云数据包括向第一点云数据至少添加第一组量化器移位;以及在比特流中编码经量化的第一点云和第二点云。
一些实施方案还包括在比特流中编码指示第一组量化器移位的信息。
在一些实施方案中,量化第一点云和第二点云还包括向第二点云添加第二组量化器移位,还包括在比特流中编码指示该第二组量化器移位的信息。
在一些实施方案中,第一点云表示场景的左视图,并且第二点云表示场景的右视图。
在一个示例性实施方案中,方法包括:接收初始第一点云数据(yl)和至少初始第二点云数据(yr);以及选择细化的第一点云数据(xl)以基本上最大化因子的乘积,其中该因子至少包括:给定细化的第一点云数据(xl)的初始第一点云数据(yl)的条件概率Pr(yl|xl);给定细化的第二点云数据(xr)的估计值g(xl)的初始第二点云数据(yr)的条件概率Pr(yr|g(xl)),其中估计值g(xl)基于细化的第一点云数据xl;细化的第一点云数据(xl)的先验概率Pr(xl);和细化的第二点云数据(xr)的估计值g(xl)的先验概率Pr(g(xl))。
一些实施方案还包括,在选择细化的第一点云数据(xl)之后,从细化的第一点云数据中减去量化器移位δl
在一些实施方案中,迭代地执行选择细化的第一点云数据(xl)。
在一些实施方案中,选择细化的第一点云数据(xl)以基本上最大化因子的乘积包括选择细化的第一点云数据(xl)以基本上最小化因子的负对数之和。可使用梯度下降方法来执行选择细化的第一点云数据(xl)以基本上最小化因子的负对数之和。
在一些实施方案中,给定细化的第一点云数据(xl)的初始第一点云数据(yl)的条件概率Pr(yl|xl)由初始第一点云数据(yl)与细化的第一点云数据(xl)之间的差值的线性函数来表示。
在一些实施方案中,细化的第二点云数据(xr)的估计值g(xl)是细化的第二点云数据(xr)的线性函数。
在一些实施方案中,给定细化的第二点云数据(xr)的估计值g(xl)的初始第二点云数据(yr)的条件概率Pr(yr|g(xl))由初始第二点云数据(yr)与细化的第二点云数据(xr)的估计值g(xl)之间的差值的线性函数来表示。
在一些实施方案中,细化的第一点云数据(xl)的先验概率Pr(xl)由
Figure BDA0003808952680000051
表示,其中Ll是图拉普拉斯矩阵。
在一些实施方案中,细化的第二点云数据(xr)的估计值g(xl)的先验概率Pr(g(xl))由exp(-g(xl)TLrg(xl)/σ2)表示,其中Lr是图拉普拉斯矩阵。
一些实施方案还包括接收第一点云数据和至少第二点云数据;以及至少使用第二点云数据来细化第一点云数据。一些此类实施方案还包括,在细化第一点云数据之后,从细化的第一点云数据中减去量化器移位。在一些实施方案中,量化器移位是预定的量化器移位。
在一些实施方案中,编码方法包括:接收初始第一点云数据和至少初始第二点云数据;通过包括向第一点云数据添加第一组量化器移位δ1的方法来处理初始第一点云数据和初始第二点云数据;以及对经处理的第一点云数据和第二点云数据进行编码。
在一些实施方案中,处理初始第一点云数据和初始第二点云数据还包括向第二点云数据添加第二组量化器移位δ2。第一组量化器移位δ1可不同于第二组量化器移位δ2
在一些实施方案中,该编码方法还包括提供识别(i)第一组量化器移位δ1或(ii)第二组量化器移位δ2中的至少一者的信息以及经编码的第一点云数据和第二点云数据。
在一些实施方案中,解码方法包括:接收经编码的第一点云数据和至少经编码的第二点云数据;接收至少识别第一组量化器移位δ1的信息;解码第一点云数据和至少第二点云数据;使用经解码的第二点云数据来细化经解码的第一点云数据;以及从第一点云数据中减去第一组量化器移位δ1
在一些实施方案中,本文所述的***或方法中的任一者可用于以点云格式以外的格式来细化深度数据。例如,本文所述的***和方法可用于细化RGB-D或其他深度图格式的深度数据(例如,深度数据xl、xr)。
装置的一些实施方案包括被配置为执行本文所述的方法中的至少一种或多种方法的处理器。
装置的一些实施方案包括处理器和计算机可读介质,该计算机可读介质存储操作用于执行本文所述的方法中的至少一种或多种方法的指令。计算机可读介质可以是非暂态计算机可读介质。
一些实施方案包括计算机可读介质,该计算机可读介质存储使用本文所述的方法中的一种或多种方法编码的点云数据。该介质可以是非暂态计算机可读介质。
附图说明
图1A是示出在其中一个或多个所公开的实施方案可得以实施的示例性通信***的***图。
图1B是根据实施方案的示出可在图1A所示的通信***内使用的示例性无线发射/接收单元(WTRU)的***图。
图2A是提供对来自相同点的两个独立测量结果的点云数据进行细化的示例的示意图。
图2B是示出当两个相机视图形成立体钻塔形时,如果量化bin对准良好则无法实现深度细化的示意图。
图3是示出根据一些实施方案,当两个相机视图形成立体钻塔形时,移位量化bin可用于实现深度细化的示意图。
图4是示出根据一些实施方案,在相同的观察中,当将移位引入到单个测量结果的量化bin时,对于高度相关的测量结果可实现细化的示意图。
图5示出了在一些实施方案中使用的相机***的示例。
图6示出了使用高斯分布的线性近似的示例。
图7是在一些实施方案中使用的用于点云压缩的示例性编码器的框图。
图8是根据一些实施方案的使用联合细化的解码器的框图。
图9是根据一些实施方案的当不应用细化时的解码器的框图。
图10是示出根据一些实施方案的解码器的细化模块的部件的框图。
图11是在一些实施方案中使用的视频编码器的框图。
图12是在一些实施方案中使用的视频解码器的框图。
图13是其中实现了各个方面和实施方案的***的示例的框图。
图14是根据一些实施方案的示例性点云编码方法的流程图。
图15是根据一些实施方案的示例性点云解码方法的流程图。
用于实现实施方案的示例性网络
图1A是示出在其中一个或多个所公开的实施方案可得以实现的示例性通信***100的示意图。通信***100可为向多个无线用户提供诸如语音、数据、视频、消息、广播等内容的多址接入***。通信***100可使多个无线用户能够通过***资源(包括无线带宽)的共享来访问此类内容。例如,通信***100可采用一个或多个信道接入方法,诸如码分多址接入(CDMA)、时分多址接入(TDMA)、频分多址接入(FDMA)、正交FDMA(OFDMA)、单载波FDMA(SC-FDMA)、零尾唯一字DFT扩展OFDM(ZT UW DTS-s OFDM)、唯一字OFDM(UW-OFDM)、资源块滤波OFDM、滤波器组多载波(FBMC)等。
如图1A所示,通信***100可包括无线发射/接收单元(WTRU)102a、102b、102c、102d、RAN 104、CN 106、公共交换电话网(PSTN)108、互联网110和其他网络112,但是应当理解,所公开的实施方案设想了任意数量的WTRU、基站、网络和/或网络元件。WTRU 102a、102b、102c、102d中的每一者可以是被配置为在无线环境中操作和/或通信的任何类型的设备。作为示例,WTRU 102a、102b、102c、102d(其中任何一个均可被称为“站”和/或“STA”)可被配置为传输和/或接收无线信号,并且可包括用户设备(UE)、移动站、固定或移动用户单元、基于订阅的单元、寻呼机、蜂窝电话、个人数字助理(PDA)、智能电话、膝上型电脑、上网本、个人计算机、无线传感器、热点或Mi-Fi设备、物联网(IoT)设备、手表或其他可穿戴设备、头戴式显示器(HMD)、车辆、无人机、医疗设备和应用(例如,远程手术)、工业设备和应用(例如,在工业和/或自动处理链环境中操作的机器人和/或其他无线设备)、消费电子设备、在商业和/或工业无线网络上操作的设备等。WTRU 102a、102b、102c和102d中的任一者可互换地称为UE。
通信***100还可包括基站114a和/或基站114b。基站114a、114b中的每一者可为任何类型的设备,其被配置为与WTRU 102a、102b、102c、102d中的至少一者无线对接以促进对一个或多个通信网络(诸如CN 106、互联网110和/或其他网络112)的访问。作为示例,基站114a、114b可为基站收发台(BTS)、节点B、演进节点B、家庭节点B、家庭演进节点B、gNB、NR节点B、站点控制器、接入点(AP)、无线路由器等。虽然基站114a、114b各自被描绘为单个元件,但应当理解,基站114a、114b可包括任何数量的互连基站和/或网络元件。
基站114a可以是RAN 104的一部分,该RAN还可包括其他基站和/或网络元件(未示出),诸如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等。基站114a和/或基站114b可被配置为在一个或多个载波频率(其可称为小区(未示出))上发射和/或接收无线信号。这些频率可在许可频谱、未许可频谱或许可和未许可频谱的组合中。小区可向特定地理区域提供无线服务的覆盖,该特定地理区域可为相对固定的或可随时间改变。小区可进一步被划分为小区扇区。例如,与基站114a相关联的小区可被划分为三个扇区。因此,在一个实施方案中,基站114a可包括三个收发器,小区的每个扇区一个收发器。在一个实施方案中,基站114a可采用多输入多输出(MIMO)技术并且可针对小区的每个扇区利用多个收发器。例如,可使用波束成形在所需的空间方向上传输和/或接收信号。
基站114a、114b可通过空中接口116与WTRU 102a、102b、102c、102d中的一者或多者通信,该空中接口可为任何合适的无线通信链路(例如,射频(RF)、微波、厘米波、微米波、红外(IR)、紫外(UV)、可见光等)。可使用任何合适的无线电接入技术(RAT)来建立空中接口116。
更具体地讲,如上所指出,通信***100可为多址接入***,并且可采用一个或多个信道接入方案,诸如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等。例如,RAN 104中的基站114a和WTRU 102a、102b、102c可实现诸如通用移动通信***(UMTS)陆地无线电接入(UTRA)之类的无线电技术,其可使用宽带CDMA(WCDMA)来建立空中接口115/116/117。WCDMA可包括诸如高速分组接入(HSPA)和/或演进的HSPA(HSPA+)之类的通信协议。HSPA可包括高速下行链路(DL)分组接入(HSDPA)和/或高速UL分组接入(HSUPA)。
在一个实施方案中,基站114a和WTRU 102a、102b、102c可实现诸如演进的UMTS陆地无线电接入(E-UTRA)的无线电技术,其可使用长期演进(LTE)和/高级LTE(LTE-A)和/或高级LTE Pro(LTE-A Pro)来建立空中接口116。
在一个实施方案中,基站114a和WTRU 102a、102b、102c可实现诸如NR无线电接入之类的无线电技术,其可使用新无线电(NR)来建立空中接口116。
在实施方案中,基站114a和WTRU 102a、102b、102c可实现多种无线电接入技术。例如,基站114a和WTRU 102a、102b、102c可例如使用双连接(DC)原理一起实现LTE无线电接入和NR无线电接入。因此,WTRU 102a、102b、102c所使用的空中接口可由多种类型的无线电接入技术和/或向/从多种类型的基站(例如,eNB和gNB)发送的传输来表征。
在其他实施方案中,基站114a和WTRU 102a、102b、102c可实现诸如IEEE 802.11(无线保真(WiFi))、IEEE 802.16(全球微波接入互操作性(WiMAX))、CDMA2000、CDMA20001X、CDMA2000 EV-DO、暂行标准2000(IS-2000)、暂行标准95(IS-95)、暂行标准856(IS-856)、全球移动通信***(GSM)、增强数据率的GSM演进(EDGE)、GSM EDGE(GERAN)等无线电技术。
图1A中的基站114b可为例如无线路由器、家庭节点B、家庭演进节点B或接入点,并且可利用任何合适的RAT来促进诸如商业场所、家庭、车辆、校园、工业设施、空中走廊(例如,供无人机使用)、道路等局部区域中的无线连接。在实施方案中,基站114b和WTRU 102c、102d可实现诸如IEEE 802.11之类的无线电技术以建立无线局域网(WLAN)。在实施方案中,基站114b和WTRU 102c、102d可实现诸如IEEE 802.15之类的无线电技术以建立无线个域网(WPAN)。在又一个实施方案中,基站114b和WTRU 102c、102d可利用基于蜂窝的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NR等)来建立微微小区或毫微微小区。如图1A所示,基站114b可具有与互联网110的直接连接。因此,基站114b可不需要经由CN 106访问互联网110。
RAN 104可与CN 106通信,该CN可以是被配置为向WTRU 102a、102b、102c、102d中的一者或多者提供语音、数据、应用和/或互联网协议语音技术(VoIP)服务的任何类型的网络。数据可具有不同的服务质量(QoS)要求,诸如不同的吞吐量要求、延迟要求、误差容限要求、可靠性要求、数据吞吐量要求、移动性要求等。CN 106可提供呼叫控制、账单服务、基于移动位置的服务、预付费呼叫、互联网连接、视频分发等,和/或执行高级安全功能,诸如用户认证。尽管未在图1A中示出,但是应当理解,RAN 104和/或CN 106可与采用与RAN 104相同的RAT或不同RAT的其他RAN进行直接或间接通信。例如,除了连接到可利用NR无线电技术的RAN 104之外,CN 106还可与采用GSM、UMTS、CDMA 2000、WiMAX、E-UTRA或WiFi无线电技术的另一RAN(未示出)通信。
CN 106也可充当WTRU 102a、102b、102c、102d的网关,以访问PSTN 108、互联网110和/或其他网络112。PSTN 108可包括提供普通老式电话服务(POTS)的电路交换电话网络。互联网110可包括使用常见通信协议(诸如传输控制协议(TCP)、用户数据报协议(UDP)和/或TCP/IP互联网协议组中的互联网协议(IP))的互连计算机网络和设备的全球***。网络112可包括由其他服务提供商拥有和/或运营的有线和/或无线通信网络。例如,网络112可包括连接到一个或多个RAN的另一个CN,其可采用与RAN 104相同的RAT或不同的RAT。
通信***100中的一些或所有WTRU 102a、102b、102c、102d可包括多模式能力(例如,WTRU 102a、102b、102c、102d可包括用于通过不同无线链路与不同无线网络通信的多个收发器)。例如,图1A所示的WTRU 102c可被配置为与可采用基于蜂窝的无线电技术的基站114a通信,并且与可采用IEEE 802无线电技术的基站114b通信。
图1B是示出示例性WTRU 102的***图。如图1B所示,WTRU 102可包括处理器118、收发器120、发射/接收元件122、扬声器/麦克风124、小键盘126、显示器/触摸板128、不可移动存储器130、可移动存储器132、电源134、全球定位***(GPS)芯片组136和/或其他***设备138等。应当理解,在与实施方案保持一致的同时,WTRU 102可包括前述元件的任何子组合。
处理器118可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其他类型的集成电路(IC)、状态机等。处理器118可执行信号编码、数据处理、功率控制、输入/输出处理和/或任何其他功能,这些其他功能使WTRU 102能够在无线环境中工作。处理器118可耦合到收发器120,该收发器可耦合到发射/接收元件122。虽然图1B将处理器118和收发器120描绘为单独的部件,但是应当理解,处理器118和收发器120可在电子封装或芯片中集成在一起。
发射/接收元件122可被配置为通过空中接口116向基站(例如,基站114a)发射信号或从基站接收信号。例如,在一个实施方案中,发射/接收元件122可以是被配置为发射和/或接收RF信号的天线。在一个实施方案中,发射/接收元件122可以是被配置为发射和/或接收例如IR、UV或可见光信号的发射器/检测器。在又一个实施方案中,发射/接收元件122可被配置为发射和/或接收RF和光信号两者。应当理解,发射/接收元件122可被配置为发射和/或接收无线信号的任何组合。
尽管发射/接收元件122在图1B中被描绘为单个元件,但是WTRU 102可包括任何数量的发射/接收元件122。更具体地讲,WTRU 102可采用MIMO技术。因此,在一个实施方案中,WTRU 102可包括用于通过空中接口116发射和接收无线信号的两个或更多个发射/接收元件122(例如,多个天线)。
收发器120可被配置为调制将由发射/接收元件122发射的信号并且解调由发射/接收元件122接收的信号。如上所指出,WTRU 102可具有多模式能力。例如,因此,收发器120可包括多个收发器,以便使WTRU 102能够经由多种RAT(诸如NR和IEEE 802.11)进行通信。
WTRU 102的处理器118可耦合到扬声器/麦克风124、小键盘126和/或显示器/触摸板128(例如,液晶显示器(LCD)显示单元或有机发光二极管(OLED)显示单元)并且可从其接收用户输入数据。处理器118还可将用户数据输出到扬声器/麦克风124、小键盘126和/或显示器/触摸板128。此外,处理器118可从任何类型的合适存储器(诸如不可移动存储器130和/或可移动存储器132)访问信息,并且将数据存储在其中。不可移动存储器130可包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘或任何其他类型的存储器存储设备。可移动存储器132可包括用户身份模块(SIM)卡、记忆棒、安全数字(SD)存储卡等。在其他实施方案中,处理器118可从未物理上定位在WTRU 102上(诸如,服务器或家用计算机(未示出)上)的存储器访问信息,并且将数据存储在该存储器中。
处理器118可从电源134接收电力,并且可被配置为向WTRU 102中的其他部件分配和/或控制电力。电源134可以是用于为WTRU 102供电的任何合适的设备。例如,电源134可包括一个或多个干电池组(例如,镍镉(NiCd)、镍锌(NiZn)、镍金属氢化物(NiMH)、锂离子(Li-ion)等)、太阳能电池、燃料电池等。
处理器118还可耦合到GPS芯片组136,该GPS芯片组可被配置为提供关于WTRU 102的当前位置的位置信息(例如,经度和纬度)。除了来自GPS芯片组136的信息之外或代替该信息,WTRU 102可通过空中接口116从基站(例如,基站114a、114b)接收位置信息和/或基于从两个或更多个附近基站接收到信号的定时来确定其位置。应当理解,在与实施方案保持一致的同时,WTRU 102可通过任何合适的位置确定方法来获取位置信息。
处理器118还可耦合到其他***设备138,该其他***设备可包括提供附加特征、功能和/或有线或无线连接的一个或多个软件模块和/或硬件模块。例如,***设备138可包括加速度计、电子指南针、卫星收发器、数字相机(用于照片和/或视频)、通用串行总线(USB)端口、振动设备、电视收发器、免提头戴式耳机、
Figure BDA0003808952680000121
模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏播放器模块、互联网浏览器、虚拟现实和/或增强现实(VR/AR)设备、活动***等。***设备138可包括一个或多个传感器,该传感器可为以下一者或多者:陀螺仪、加速度计、霍尔效应传感器、磁力计、方位传感器、接近传感器、温度传感器、时间传感器;地理位置传感器;测高计、光传感器、触摸传感器、磁力计、气压计、手势传感器、生物识别传感器和/或湿度传感器。
WTRU 102可包括全双工无线电台,对于该全双工无线电台,一些或所有信号的发射和接收(例如,与用于UL(例如,用于发射)和下行链路(例如,用于接收)的特定子帧相关联)可为并发的和/或同时的。全双工无线电台可包括干扰管理单元,该干扰管理单元用于经由硬件(例如,扼流圈)或经由处理器(例如,单独的处理器(未示出)或经由处理器118)进行的信号处理来减少和/或基本上消除自干扰。在一个实施方案中,WTRU 102可包括半双工无线电台,对于该半双工无线电台,一些或所有信号的发射和接收(例如,与用于UL(例如,用于发射)或下行链路(例如,用于接收)的特定子帧相关联)可为并发的和/或同时的。
尽管WTRU在图1A至图1B中被描述为无线终端,但是可以设想,在某些代表性实施方案中,此类终端可(例如,临时或永久)使用与通信网络的有线通信接口。
在代表性实施方案中,其他网络112可为WLAN。
鉴于图1A至图1B以及对应描述,本文参照以下中的一者或多者描述的功能中的一个或多个功能或全部功能可由一个或多个仿真设备(未示出)执行:WTRU 102a-102d、基站114a-114b和/或本文所述的任何其他设备。仿真设备可以是被配置为模仿本文所述的一个或多个或所有功能的一个或多个设备。例如,仿真设备可用于测试其他设备和/或模拟网络和/或WTRU功能。
仿真设备可被设计为在实验室环境和/或运营商网络环境中实现其他设备的一个或多个测试。例如,该一个或多个仿真设备可执行一个或多个或所有功能,同时被完全或部分地实现和/或部署为有线和/或无线通信网络的一部分,以便测试通信网络内的其他设备。该一个或多个仿真设备可执行一个或多个功能或所有功能,同时临时被实现/部署为有线和/或无线通信网络的一部分。仿真设备可直接耦合到另一个设备以用于测试目的和/或可使用空中无线通信来执行测试。
该一个或多个仿真设备可执行一个或多个(包括所有)功能,同时不被实现/部署为有线和/或无线通信网络的一部分。例如,仿真设备可在测试实验室和/或非部署(例如,测试)有线和/或无线通信网络中的测试场景中使用,以便实现一个或多个部件的测试。该一个或多个仿真设备可为测试装备。经由RF电路(例如,其可包括一个或多个天线)进行的直接RF耦合和/或无线通信可由仿真设备用于传输和/或接收数据。
具体实施方式
3D点云数据可表示对象或场景的表面上的样本。当收集/处理动态点云时,相同对象的数据样本往往出现在不同的观察中,其通过2D到3D投影强相关。换句话讲,在不同观察之间的重叠区域中,对相同3D场景具有多个测量结果,例如图2B。在给定测量结果高度相关的信息的情况下,即使对于出现在相同观察中的测量结果,也可将它们视为相同对象的不同测量结果,例如图4。示例性实施方案操作用于利用点云中的不同观察之间的相关性来改善点云的质量。
一些实施方案经由来自多个观察的相关测量结果来联合执行3D点云数据的去噪和解量化。不仅是量化的观察,而且每个测量结果的噪声破坏的观察也可被认为是用于重构性能的经编码的量化bin。一些实施方案有意地移位应用于噪声破坏的点云数据的量化bin。通过如此操作,当考虑多个观察的相关性时,与其中量化bin严格对准的情况相比,这可进一步缩小测量结果的合理范围。
示例性实施方案不限于从任何特定类型的深度传感器获得的点云数据。从低端传感器(如飞行时间(ToF)传感器和结构化光传感器)到高端传感器(如激光雷达、激光扫描仪等)的各种不同的深度传感器或使用计算机图形的合成数据都是可用于各种实施方案的数据源。
在一些实施方案中,本文所公开的***和方法用于在使用深度传感器进行采集期间增强3D点云质量。在其他实施方案中,本文的***和方法被应用于点云压缩(PCC)。在一些现有的PCC方法中,要处理的当前帧可使用一个或多个参考帧进行压缩。在一些实施方案中,参考帧还使用来自当前帧的信息来增强其自身的重构,使得点云帧可彼此参考以进行重构。在编码器侧,有能力有意地移位被应用于点云数据的量化bin;而在解码器侧,可组合多个相关观察以增强点云数据,从而导致更高精度的重构。如本文所述的***和方法具有各种基于PCC的用例。一些实施方案操作用于提高使用帧间编码或帧内编码进行编码的点云数据的精度。一些实施方案在于编码器处使用任何特定编码结构(例如,八叉树)时应用。如果对点云视频的编码采用变换编码,则一些实施方案直接在变换域中操作以提供更高的精度。
虽然深度传感器现在重量轻并且常见,但所获得的测量结果往往在精度上是粗糙的并且可被噪声破坏。然而,当捕获3D数据(特别是特定场景中的3D数据序列)时,相同的(或高度相关的)场景(或对象)可能已被捕获多次。换句话讲,可能已对大致相同的对象进行了不同的观察。因此,示例性实施方案在点云数据的深度测量结果中使用相同对象的不同观察来共同提高观察的精度,而这些观察可能被噪声破坏并且经历量化误差。此类技术在一些实施方案中可应用于点云压缩。
示例性实施方案的概述
示例性实施方案在点云数据中使用不同的观察来共同提高测量结果的质量。图2A示出了由两个不同的观察(观察1和观察2)对点P的深度的测量。这里的观察可以是在采集期间由深度传感器测量的视图,或者其在点云压缩的情况下可以是点云序列中的帧。在该示例中,为了简化描述,假设测量是无噪声的。测量结果由两个量化器Q1和Q2量化,以便用一定数量的比特表示。量化导致了两个不同的不确定性范围。假定相机位姿是已知的(或者可通过所获得的点云数据或其他方式来估计),则可考虑这两个不确定性范围的交集,从而导致更窄的不确定性范围,并且继而导致更高的准确度。示例性实施方案不限于仅两个观察:当对相同的对象进行三个或更多个观察或测量时,可应用类似的推理。
当使用两个相机来测量场景时,它们可被布置为立体钻塔形,如图2B所示。在这种情况下,当量化器具有对准的量化bin时,取不确定性范围的交集并不导致更高的准确度。为了解决这一问题,一些实施方案提供了移位量化bin的选项,如图3所示,这可缩小不确定性范围。
一些实施方案未采用多个观察。图4示出了其中仅进行一次观察的实施方案。在这种情况下,假定被测量的两个点A和B是高度相关的,具有非常相似的测量结果,则可将操作用于移位量化bin的实施方案分别应用于这两个点。因此,当取两个不确定性范围的交集时,可提高深度精度。
示例性实施方案可采用有损点云压缩。在编码器侧,点云数据(在其原始空间域中或在变换域中)被量化,其中量化bin被有意地移位,并且量化的信号随后被编码。指示量化器的移位的信息可用于编码器和解码器两者。例如,编码器可向解码器发信号通知移位。在解码器侧,可通过考虑量化器移位来处理测量相同场景的点云数据。用于点云压缩的此类技术的应用的示例在下文的“点云压缩”部分中进行描述。
经由多个观察的点云增强
下面描述使用来自两个相机视图的不精确深度测量来增强3D点云数据的实施方案。示例性实施方案利用了凸优化。虽然关于来自两个相机视图的测量结果描述了示例,但应当指出的是,所述技术在其他实施方案中也适用于使用三个或更多个视图的实施方案。
因为从相同3D对象到两个图像平面上的2D投影是彼此的相关映射,所以示例性实施方案操作用于通过同时优化两个视图的似然和先验来提高重构3D点的质量。在数学上,像素行中的信号和噪声相关性可使用图形来建模,该图形是使用来自先前行的数据经由受约束的l1范数最小化来学习的。可能形成最大后验(MAP)问题,其在适当的线性近似之后产生无约束的凸可微目标,可使用快速梯度方法(FGM)来解决。
立体捕获***
示例性实施方案使用从相机***收集的数据,其中相同的3D对象由两个深度相机从不同的视点观察;具体地,存在来自两个相机的重叠视场(FoV),使得存在对相同2D对象表面的至少两次观察。图5示出了如在一些实施方案中使用的相机***。每个深度相机返回尺寸H×W和有限精度的深度图作为输出:每个像素是相机和感知的3D对象之间的物理距离的噪声破坏的观察,量化为B位表示。
考虑其中两个捕获的深度图被校正的情况,使得左视图中的行i中的像素对应于右视图中的相同行i中的不同像素。在执行点云增强之前,可执行校正过程作为预处理步骤。可在一些实施方案中采用的校正技术的示例包括在以下出版物中的一个或多个出版物中描述的那些:C.Loop和Z.Zhang,“Computing rectifying homographies for stereovision”,发表于《Proceedings,1999IEEE Computer Society Conference on ComputerVision and Pattern Recognition》(类别号PR00149),第1卷,第125–131页,IEEE,1999;Y.-S.Kang和Y.-S.Ho,“An efficient image rectification method for parallelmulti-camera arrangement”,《IEEE transactions on Consumer Electronics》,57(3):1041–1048,2011;和Zhengyou Zhang,“A flexible new technique for cameracalibration”,《IEEE Transactions on pattern analysis and machineintelligence》,22,2000。
示例性实施方案不限于使用任何特定的相机位姿。对于除立体钻塔形之外的更复杂的情况,仍然可使用所测量的深度图和多视图几何形状来找出视图到视图的映射关系。
示例性图像形成模型
在一些实施方案中,通过由两个不同的相机捕获的两个经校正的深度图(左和右)来记录3D对象。(其他实施方案可通过从该示例中描述的技术外推来实现,例如处理从多于两个相机收集的数据。)用yl∈RN(yr∈RN)表示左(右)视图中的观察到的深度像素行i。详见图5。(为了简化符号,索引i未在yl,yr中示出。)观察到的像素yl,yr表示各个基本真值信号xl,xr的量化和噪声破坏的版本。(当输入测量结果被映射到B位表示时,发生量化。)观察yl与基本真值信号xl之间的关系可经由以下形成模型来表示:
Figure BDA0003808952680000171
其中Q∈R+是量化参数,并且nl∈RN是零均值加性噪声。项δl∈RN是添加到xl的预定义向量。将向量δl添加到xl相当于将量化bin移位-δl的量。这种移位允许对正在进行的测量进行主动干预,这可提供更好的机会来使用所获得的测量结果进行增强,如图3所示。由于δl可被吸收到xl中,因此在以下推导中忽略δl,因为理解到δl最终将从细化结果中被减去。相同的形成过程可应用于右相机的测量结果yr。在给定观察Y={yl,yr}的情况下,示例性实施方案操作用于估计基本真值X={xl,xr}。该估计值用
Figure BDA0003808952680000172
表示。
视图到视图映射
经校正的左视图xl和右视图xr的像素行i从相同3D对象投影到两个不同的相机平面上,并且因此是相关的。考虑其中将3D对象投影到两个相机视图时没有遮挡的用例。可执行1D翘曲过程以使xl和xr相关。翘曲过程可以是如以下出版物中的一个或多个出版物中所述的翘曲过程:D.Scharstein和R.Szeliski,“High-accuracy stereo depth maps usingstructured light”,发表于《2003IEEE Computer Society Conference on ComputerVision and Pattern Recognition,2003,Proceedings》,第1卷,第I–I页,IEEE,2003;以及J.Jin,A.Wang,Y.Zhao,C.Lin和B.Zeng,“Region-aware 3-D warping for DIBR.《IEEETransactions on Multimedia》,18(6):953–966,2016。对于左视图中的第j个像素xl,j,其在投影之后在右视图中的水平位置s(j,xl,j)为
s(j,xl,j)=j-d(xl,j)
Figure BDA0003808952680000181
其中d为(非整数)视差,f为相机焦距,并且D为表示左视图与右视图之间的距离的基线。需注意,s是左像素位置j和值xl,j两者的函数。
假设对象表面是平滑的,在给定左像素xl的情况下将右像素xr内插为
xr=Wxl=g(xl) (3)其中W∈RN×N是具有元素ωij的权重矩阵。具体地,xr,i与xl,j之间的权重ωij可被建模为
Figure BDA0003808952680000182
在该示例中,如果xl,j中的像素j的投影位置s(j,xl,j)与xr中的目标像素位置i之间的距离较小,则权重ωij较大。
可通过使用归一化常数来简化公式(4)
Figure BDA0003808952680000183
与(2)相结合,(4)可被重写为
Figure BDA0003808952680000191
由于g(xl)是可微的,所以一阶泰勒级数展开式可被定义为约
Figure BDA0003808952680000192
以得到线性近似,其中
Figure BDA0003808952680000193
是第一估计值。因此,
Figure BDA0003808952680000194
其中
Figure BDA0003808952680000195
是g(xl)在
Figure BDA0003808952680000196
处的一阶导数,并且
Figure BDA0003808952680000197
是常数向量。
似然项和信号先验
示例性实施方案在零均值加性噪声nl∈RN遵循联合高斯分布的假设下操作,其中nl的概率密度函数(PDF)为
Figure BDA0003808952680000198
其中P是正定(PD)精度矩阵,并且
Figure BDA0003808952680000199
是噪声方差。给定观察yl,似然项Pr(yl|xl)为
Figure BDA00038089526800001910
其中执行积分(8)的区域Rl
Figure BDA00038089526800001911
其为与yl,i相关联的量化bin。在该示例中,假设噪声项nl和nr是独立的。
(8)中对联合高斯PDF的积分是非平凡的。然而,Pr(nl)可在区域Rl上近似为仿射函数
Figure BDA0003808952680000204
其中a∈RN和b∈R是可经由给定(7)的yl-xl处的泰勒级数展开式计算的常数。出于说明的目的,在图6中示出了一维示例。公式(8)然后可表示为
Figure BDA0003808952680000201
有了线性形式的似然项,现在让我们在公式化MAP问题之前转向信号。已经观察到,深度图是分段平滑的(PWS)。假设先前的K行已经被重构,并且下一个像素行i遵循类似的图像结构。在该示例中,选择使用图拉普拉斯正则器作为信号先验,例如使用如在GeneCheung,Enrico Magli,Yuichi Tanaka和Michael K Ng,“Graph spectral imageprocessing”,Proceedings of the IEEE,106(5):907–930,2018中描述的技术。拉普拉斯正则器的使用使得信号xl相对于某个图形G(具有被表示为Ll的相关联的图拉普拉斯矩阵)应当是平滑的假设生效,使得项
Figure BDA0003808952680000202
是小的。在该示例中,左行xl的先验可表示为
Figure BDA0003808952680000203
在该示例中,不限制图形G的构造。可基于先前重构的结果或当前被破坏的测量结果yl来构建适当的图形。其他实施方案可使用其他技术来确定先验Pr(xl)。在一些此类实施方案中,Pr(xl)的值随着xl的平滑度(或分段平滑度)的水平的增加而增加,其中可使用一种或多种不同的技术来表示平滑度。
最大后验(MAP)公式
在一些实施方案中,如下公式化MAP问题以获得估计值
Figure BDA0003808952680000211
Figure BDA0003808952680000212
其中在(15)中用g(xl)替换xr,并且在(16)中拆分第一项,因为左噪声nl和右噪声nr是独立的。
为了便于优化,改为最小化(17)的负对数:
Figure BDA0003808952680000213
公式(19)是无约束的凸可微目标;其可使用梯度下降方法求解。当应用上述公式(19)时,不需要限制拉普拉斯矩阵的选择和估计噪声参数的方法。在已求解(19)之后,可从估计值
Figure BDA0003808952680000214
中减去量化器移位δl。在一些实施方案中,向量
Figure BDA0003808952680000215
可用作估计值
Figure BDA0003808952680000216
在其他实施方案中,可通过在反转下标l和r的同时执行上述方法来获得估计值
Figure BDA0003808952680000217
在一些实施方案中,可使用多于两个测量结果来执行细化。例如,一些实施方案可采用一组K个测量结果(例如,来自K个不同的相机位置)。可定义一组函数gi(·),以便根据公式xi=gi(x1)将来自参考视图x1的测量结果映射到任何其他测量结果xi(i≥2)。在一些实施方案中,可根据公式20生成细化的点云数据
Figure BDA0003808952680000218
Figure BDA0003808952680000221
一些实施方案中,公式(20)可根据公式(17)、(18)和(19)中所示的过程使用一阶近似来公式化,从而导致可有效解决的无约束的凸优化问题。
点云压缩
使用如上所述的***和方法,示例性实施方案用于在采集期间提高3D点云数据的精度。另外的实施方案在执行有损点云压缩(PCC)时采用此类***和方法。
在PCC中,通常执行量化。PCC的量化具有与在采集期间执行的量化类似的效果。如上文所指出的,移位量化bin的操作类似于将预先设计的量添加到正在编码的点云信号。
图7是示例性点云编码器的功能框图。在图7中,
Figure BDA0003808952680000222
表示要编码的点云数据的n帧。数据可在其原始空间域或变换域中。模块Q表示量化器,而E表示编码器模块,其可包括熵编码或诸如信道编码的其他后处理步骤。量
Figure BDA0003808952680000223
可被预定义并且在量化之前被添加到点云数据。将该量添加到
Figure BDA0003808952680000224
类似于将Q的量化bin移位
Figure BDA0003808952680000225
Figure BDA0003808952680000226
的添加可被称为量化移位。量
Figure BDA0003808952680000227
为编码器和解码器两者所知,类似于量化表。编码器的输出表示为
Figure BDA0003808952680000228
在解码器侧,在接收到经编码的点云
Figure BDA0003808952680000229
之后,可向用户提供使用细化(图8)或不使用细化(图9)对其进行解码的选项。图9示出了不应用细化的情况。在这种情况下,经编码的点云
Figure BDA00038089526800002210
最初通过应用E的逆运算(表示为E-1)来解码。然后使用Q-1对其进行解量化。此后,由于在编码期间将量化移位
Figure BDA00038089526800002211
添加到点云信号,因此减去这些量化移位以获得最终的解码信号
Figure BDA00038089526800002212
在该解码实施方案中,尽管在精度方面没有增益,但计算成本相对较低。
如图8所示,当在解码阶段中应用细化时,
Figure BDA00038089526800002213
最初由E-1解码。此后,
Figure BDA00038089526800002214
内的相关帧(和/或
Figure BDA00038089526800002215
的任何一个帧中的相关区域)通过经由多视图几何形状考虑它们的相关性来联合细化。在一些实施方案中,还采用额外的边信息(SI),诸如相机参数和量化移位
Figure BDA00038089526800002216
这里的SI可使用各种不同技术中的任一种技术或以各种不同语法元素来提供,诸如以序列参数集、图片参数集或补充增强信息消息来提供。量化移位和任何边信息的应用由图8中的模块R表示,并且其输出可以是最终解码的点云
Figure BDA0003808952680000231
模块R可采用MAP公式来细化像素行xl和xr,如(19)中所示,这考虑了噪声和量化两者的影响。
在一些实施方案中,可使用如图10所示的部件来实现图8的模块R。一个模块执行相关信号的识别。该模块可操作用于识别输入点云数据中的相关帧或相关区域。一个示例是如上所述的立体相机中的视图映射。该步骤可利用额外的边信息,如相机参数和位姿信息。图10所示的另一模块可执行联合精度增强。精度增强可包括组合量化移位
Figure BDA0003808952680000232
和点云数据中的相关观察两者来生成更精确的深度测量结果。该步骤可基于不同的过程来执行,诸如使用公式(19)进行的优化,或对点云数据进行的联合过滤,以及其他可能性。
在一些情况下,量化移位δi可被设置为零。在这种情况下,只要可识别不同点云帧中的多个观察,应用细化R(图8)就仍然可提供更高精度的深度测量结果。例如,参考图2A的说明,其中两个相机视点不平行,可通过取得两个测量结果的不确定性范围的交集来提高精度。
在一些实施方案中,点云数据的编码和解码可如下进行。针对第一点云中的点获得第一参数x1,并且针对第二点云中的点获得第二参数x2。例如,参数x1和x2都可以是深度值,或者它们可以是其他类型的值(例如,表示水平或垂直位置)。参数x1和x2是相关的,例如它们可使用由相同或不同的相机在相同或不同的时间捕获的值来表示对象的表面上的相同或附近的点。
在一些实施方案中,这些参数x1和x2通过包括添加量化器移位δ1和δ2的方法被量化为值y1和y2。例如,在量化步长为1的情况下,参数x1和x2可如下量化:
y1=round(x11)
y2=round(x22)
可使用大小不为1的量化步长,并且对于两个参数,步长不必相同。在一些实施方案中,移位中的一者(δ1或δ2)可以是零。在一些实施方案中,相同的移位δ1可用于第一点云中的所有点,并且相同的移位δ2可用于第二点云中的所有点;在其他实施方案中,可对点云内的不同点(或对不同参数)使用不同的量化器移位。
一旦已经获得经量化的点云参数y1和y2,就可将它们编码到例如比特流中,用于存储和/或传输到解码器。在一些实施方案中,量化器移位δ1和δ2也可被编码到比特流中。在一些实施方案中,量化器移位δ1和δ2可例如在一个或多个补充增强信息消息中被单独提供给解码器。
根据一些实施方案,在解码器处获得点云参数y1和y2以及量化器移位δ1和δ2。例如,参数y1和y2可以编码形式接收,并且可由解码器解码。
给定提供给解码器的信息,可认为以下上限和界限适用于被移位的参数(x11)和(x22):
Figure BDA0003808952680000241
Figure BDA0003808952680000242
其中根据不同的量化技术(例如,不为1的量化步长大小)进行适当调整。使用基于量化移位的减法,得出下列上限和下限适用于原始参数x1和x2
Figure BDA0003808952680000243
Figure BDA0003808952680000244
第一量化范围可对应于例如图3或图4所示的“y1的范围”,并且第二量化范围可对应于例如相同附图的“y2的范围”。在一些实施方案中,通过在这些范围重叠的区域中选择点云数据(例如,参数
Figure BDA0003808952680000245
)来获得细化的点云数据。这样的区域可对应于例如图3或图4所示的“细化后的范围”。根据哪个范围更高,重叠范围是
Figure BDA0003808952680000251
或者
Figure BDA0003808952680000252
在一些实施方案中,可执行细化的点云参数x的选择,使得参数x落在重叠范围内(在y1和y2两者的量化范围内)。使用基于量化移位的减法获得重叠范围的中点为
Figure BDA0003808952680000253
在一些实施方案中,细化的参数
Figure BDA0003808952680000254
可被选择为等于中点,使得
Figure BDA0003808952680000255
在一些实施方案中,解码器可使用多种技术中的一种或多种技术来细化所接收的点云数据,包括但不限于上述最大先验(MAP)细化。
图14示出了示例性解码方法。在该示例性解码方法中,获得至少表示第一点云和第二点云的数据(1402)。获得至少识别与第一点云相关联的第一组量化器移位的信息(1404)。在第一组量化器移位中,移位对于不同的点或不同的参数可以是相同的,或者对于不同的点或不同的参数可以是不同的。基于第一点云和第二点云来获得细化的点云数据(1406),其中获得细化的点云数据包括至少基于第一组量化器移位来执行减法。
图15示出了示例性编码方法。在该示例性编码方法中,获得至少表示第一点云和第二点云的数据(1502)。通过包括向第一点云添加第一组量化器移位的方法来量化第一点云和第二点云(1504)。在比特流中编码经量化的第一点云和第二点云以及指示第一组量化器移位的信息(1506)。
示例性应用
使用PCC的各种实施方案包括以下各项。
一些实施方案与帧间编码一起使用。当使用其他帧对来自点云视频的帧进行编码时,一些实施方案共同考虑量化移位和在已经观察到相同场景的该当前帧之前或之后的其他辅助帧。来自其他帧的信息可用于提高解码器处的重构精度。
一些实施方案与帧内编码一起使用。当来自点云视频的帧被单独编码时,一些实施方案考虑所引入的量化移位和相同点云帧中的高度相关的区域以增加重构的精度。
一些实施方案与基于八叉树的点云压缩一起使用。当八叉树被用作点云的编码结构时,示例性实施方案操作用于主动地构造具有小量化移位的不同树根。然后,解码器可执行重构和优化,不管帧是被编码为帧间的还是帧内的。
一些实施方案与变换编码一起使用。当使用变换编码并且将量化应用于变换系数时,一些实施方案操作用于在变换系数待优化的变换域中执行精度增强。
另外的实施方案和信息
在一些实施方案中,点云解码方法包括:接收初始第一点云数据(yl)和至少初始第二点云数据(yr);以及选择细化的第一点云数据(xl)以基本上最大化包括以下各项中的一项或多项的因子的乘积:给定细化的第一点云数据(xl)的初始第一点云数据(yl)的条件概率Pr(yl|xl);给定细化的第二点云数据(xr)的估计值g(xl)的初始第二点云数据(yr)的条件概率Pr(yr|g(xl)),其中估计值g(xl)基于细化的第一点云数据(xl);细化的第一点云数据(xl)的先验概率Pr(xl);和细化的第二点云数据(xr)的估计值g(xl)的先验概率Pr(g(xl))。
一些此类实施方案包括,在选择细化的第一点云数据(xl)之后,从细化的第一点云数据中减去量化器移位δl
在一些实施方案中,迭代地执行选择细化的第一点云数据(xl)。
在一些实施方案中,选择细化的第一点云数据(xl)以基本上最大化因子的乘积包括选择细化的第一点云数据(xl)以基本上最小化因子的负对数之和。
在一些实施方案中,使用梯度下降方法来执行选择细化的第一点云数据(xl)以基本上最小化因子的负对数之和。
在一些实施方案中,给定细化的第一点云数据(xl)的初始第一点云数据(yl)的条件概率Pr(yl|xl)由初始第一点云数据(yl)与细化的第一点云数据(xl)之间的差值的线性函数来表示。
在一些实施方案中,细化的第二点云数据(xr)的估计值g(xl)是细化的第二点云数据(xr)的线性函数。
在一些实施方案中,给定细化的第二点云数据(xr)的估计值g(xl)的初始第二点云数据(yr)的条件概率Pr(yr|g(xl))由初始第二点云数据(yr)与细化的第二点云数据(xr)的估计值g(xl)之间的差值的线性函数来表示。
在一些实施方案中,细化的第一点云数据(xl)的先验概率Pr(xl)由
Figure BDA0003808952680000271
表示,其中Ll是图拉普拉斯矩阵。
在一些实施方案中,细化的第二点云数据(xr)的估计值g(xl)的先验概率Pr(g(xl))由exp(-g(xl)TLrg(xl)/σ2)表示,其中Lr是图拉普拉斯矩阵。
根据一些实施方案的方法包括:接收第一点云数据和至少第二点云数据;以及至少使用第二点云数据来细化第一点云数据。
一些此类实施方案还包括,在细化第一点云数据之后,从细化的第一点云数据中减去量化器移位。在一些实施方案中,量化器移位是预定的量化器移位。
根据一些实施方案的编码方法包括:接收初始第一点云数据和至少初始第二点云数据;通过包括向第一点云数据添加第一组量化器移位δ1的方法来处理初始第一点云数据和初始第二点云数据;以及对经处理的第一点云数据和第二点云数据进行编码。
在一些实施方案中,处理初始第一点云数据和初始第二点云数据还包括向第二点云数据添加第二组量化器移位δ2
在一些实施方案中,第一组量化器移位δ1不同于第二组量化器移位δ2
一些实施方案还包括提供识别(i)第一组量化器移位δ1或(ii)第二组量化器移位δ2中的至少一者的信息以及经编码的第一点云数据和第二点云数据。
根据一些实施方案的解码方法包括接收经编码的第一点云数据和至少经编码的第二点云数据;接收至少识别第一组量化器移位δ1的信息;解码第一点云数据和至少第二点云数据;使用经解码的第二点云数据来细化经解码的第一点云数据;以及从第一点云数据中减去第一组量化器移位δ1
根据一些实施方案的装置包括处理器,该处理器被配置为至少执行根据本文所述的过程中的任何过程的方法。
根据一些实施方案的装置包括处理器和计算机可读介质,该计算机可读介质存储操作用于至少执行根据本文所述的过程中的任何过程的方法的指令。在一些此类实施方案中,计算机可读介质是非暂态计算机可读介质。
一些实施方案包括计算机可读介质,该计算机可读介质存储使用本文所述的方法中的任何方法编码的点云数据。在一些此类实施方案中,计算机可读介质是非暂态计算机可读介质。
本说明书描述了各个方面,包括工具、特征、实施方案、模型、方法等。具体描述了这些方面中的许多方面,并且至少示出个体特性,通常以可能听起来有限的方式描述。然而,这是出于描述清楚的目的,并且不限制本公开或那些方面的范围。实际上,所有不同的方面可组合和互换以提供进一步的方面。此外,这些方面也可与先前提交中描述的方面组合和互换。
本公开中描述和设想的方面可以许多不同的形式实现。下面的图11、图12和图13提供了一些实施方案,但是设想了其他实施方案,并且图11、图12和图13的讨论不限制实施方式的广度。这些方面中的至少一个方面通常涉及视频编码和解码,并且至少一个其他方面通常涉及发射生成或编码的比特流。这些和其他方面可实现为方法、装置、其上存储有用于根据所述方法中任一种对视频数据编码或解码的指令的计算机可读存储介质,和/或其上存储有根据所述方法中任一种生成的比特流的计算机可读存储介质。
在本公开中,术语“重构的”和“解码的”可互换使用,术语“像素”和“样本”可互换使用,术语“图像”、“画面”和“帧”可互换使用。通常,但不一定,术语“重构”在编码端使用,而“解码”在解码端使用。
本文描述了各种方法,并且每种方法包括用于实现方法的一个或多个步骤或动作。除非正确操作方法需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或用途。此外,术语诸如“第一”、“第二”等可用于各种实施方案以修改元件、分量、步骤、操作等,诸如“第一解码”和“第二解码”。除非特定需要,否则使用此类术语并不暗示对修改操作的排序。因此,在这个示例中,第一解码不需要在第二解码之前执行,并且可例如在第二解码之前、期间或重叠的时间段发生。
本公开中所述的各种方法和其他方面可用于修改视频编码器100和解码器200的模块(例如,帧内预测、熵编码和/或解码模块(160、360、145、330)),如图11和图12所示。此外,本发明方面不限于VVC或HEVC,并且可应用于例如其他标准和推荐(无论是预先存在的还是未来开发的)以及任何此类标准和推荐的扩展(包括VVC和HEVC)。除非另外指明或在技术上排除,否则本公开中描述的方面可单独或组合使用。
在本公开中使用各种数值。具体值是为了示例目的,并且所述方面不限于这些具体值。
图11示出了编码器200。设想了这一编码器200的变型,但是为了清楚起见,下文描述了编码器200而不描述所有预期的变型。
在编码之前,视频序列可经过预编码处理(204),例如,将颜色变换应用于输入彩色图片(例如,从RGB 4:4:4到YCbCr 4:2:0的转换),或执行输入图片分量的重新映射,以便获得对压缩更具弹性的信号分布(例如,使用颜色分量中的一个颜色分量的直方图均衡化)。元数据可与预处理相关联并且附加到比特流。
在编码器200中,图片由编码器元件进行编码,如下所述。以例如CU为单位对要编码的图片进行分区(206)和处理。例如,使用帧内模式或帧间模式对每个单元进行编码。当单元以帧内模式进行编码时,其执行帧内预测(208)。在帧间模式中,执行运动估计和补偿(210)。编码器决定(214)帧内模式或帧间模式中的哪一者用于对单元进行编码,并且通过例如预测模式标记来指示帧内/帧间决策。例如通过从原始图像块减去(216)预测块来计算预测残差。
然后,对预测残差进行变换(218)和量化(220)。对经量化的变换系数以及运动向量和其他语法元素进行熵编码(232),以输出比特流。编码器可跳过变换,并对未变换的残余信号直接应用量化。编码器可绕过变换和量化两者,在这种情况下,直接对残差进行编码而不应用变换或量化过程。
编码器对编码块进行解码以提供用于进一步预测的参考。对经量化的变换系数进行解量化(222)和逆变换(224)以对预测残差进行解码。组合(226)经解码的预测残差和预测块,重构图像块。将环路滤波器(228)应用到重构的图片,以执行例如去块/SAO(样本自适应偏移)滤波,从而减少编码伪影。经滤波的图像存储在参考图片缓冲器(212)中。
图12示出了视频解码器250的框图。在解码器250中,比特流由解码器元件进行解码,如下所述。视频解码器250通常执行与如图11所述的编码过程相反的解码过程。编码器200通常还执行视频解码作为对视频数据编码的一部分。
具体地,解码器的输入包括视频比特流,该视频比特流可由视频编码器200生成。首先对比特流进行熵解码(254)以获得变换系数、运动向量和其他经编码的信息。图片分区信息指示如何对图片进行分区。因此,解码器可以根据解码图片分区信息划分(256)图片。对变换系数进行解量化(262)和逆变换(264)以对预测残差进行解码。组合(266)经解码的预测残差和预测块,重构图像块。可从帧内预测(258)或运动补偿预测(即帧间预测)(260)获得(271)预测块。向重构图像应用环路滤波器(268)。经滤波的图像存储在参考图片缓冲器(270)中。
经解码的图片还可经过解码后处理(274),例如,逆颜色变换(例如,从YCbCr 4:2:0到RGB 4:4:4的变换)或执行在预编码处理(204)中执行的重新映射的逆过程的逆重新映射。解码后处理可使用在预编码处理中导出并且在比特流中发信号通知的元数据。
图13是其中实现了各个方面和实施方案的***的示例的框图。***1000可体现为包括下文所述的各个部件的设备,并且被配置为执行本文档中所述的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板电脑、数字多媒体机顶盒、数字电视机接收器、个人视频录制***、连接的家用电器和服务器。***1000的元件可单独地或组合地体现在单个集成电路(IC)、多个IC和/或分立部件中。例如,在至少一个实施方案中,***1000的处理和编码器/解码器元件分布在多个IC和/或分立元件上。在各种实施方案中,***1000经由例如通信总线或通过专用输入和/或输出端口通信地耦接到一个或多个其他***或其他电子设备。在各种实施方案中,***1000被配置为实现本文档中所述的一个或多个方面。
***1000包括至少一个处理器1010,该至少一个处理器被配置为执行加载到其中的指令,以用于实现例如本文档中所述的各个方面。处理器1010可包括嵌入式存储器、输入输出接口和本领域已知的各种其他电路。***1000包括至少一个存储器1020(例如,易失性存储器设备和/或非易失性存储器设备)。***1000包括存储设备1040,该存储设备可包括非易失性存储器和/或易失性存储器,包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备1040可包括内部存储设备、附接存储设备(包括可拆和不可拆的存储设备)和/或网络可访问的存储设备。
***1000包括编码器/解码器模块1030,该编码器/解码器模块被配置为例如处理数据以提供编码视频或解码视频,并且编码器/解码器模块1030可包括其自身的处理器和存储器。编码器/解码器模块1030表示可被包括在设备中以执行编码和/或解码功能的模块。众所周知,设备可包括编码模块和解码模块中的一者或两者。此外,编码器/解码器模块1030可实现为***1000的独立元件,或者可结合在处理器1010内作为本领域技术人员已知的硬件和软件的组合。
要加载到处理器1010或编码器/解码器1030上以执行本文档中所述的各个方面的程序代码可存储在存储设备1040中,并且随后被加载到存储器1020上以供处理器1010执行。根据各种实施方案,处理器1010、存储器1020、存储设备1040和编码器/解码器模块1030中的一者或多者可在本文档中所述过程的执行期间存储各个项目中的一个或多个项目。此类存储项目可包括但不限于输入视频、解码的视频或部分解码的视频、比特流、矩阵、变量以及处理等式、公式、运算和运算逻辑的中间或最终结果。
在一些实施方案中,处理器1010和/或编码器/解码器模块1030内部的存储器用于存储指令和提供工作存储器以用于在编码或解码期间需要的处理。然而,在其他实施方案中,处理设备外部的存储器(例如,处理设备可以是处理器1010或编码器/解码器模块1030)用于这些功能中的一个或多个功能。外部存储器可以是存储器1020和/或存储设备1040,例如动态易失性存储器和/或非易失性闪存存储器。在若干实施方案中,外部非易失性闪存存储器用于存储例如电视机的操作***。在至少一个实施方案中,快速外部动态易失性存储器诸如RAM用作视频编码和解码操作的工作存储器,诸如MPEG-2(MPEG是指运动图片专家组,MPEG-2也称为ISO/IEC 13818,并且13818-1也称为H.222,13818-2也称为H.262)、HEVC(HEVC是指高效视频编码,也称为H.265和MPEG-H部分2)或VVC(通用视频编码,由联合视频专家小组(JVET)开发的新标准)。
对***1000的元件的输入可通过如框1130中所示的各种输入设备提供。此类输入设备包括但不限于:(i)射频(RF)部分,其接收例如由广播器通过空中发射的RF信号;(ii)分量(COMP)输入端子(或一组COMP输入端子);(iii)通用串行总线(USB)输入端子;和/或(iv)高清晰度多媒体接口(HDMI)输入端子。图10中未示出的其他示例包括复合视频。
在各种实施方案中,框1130的输入设备具有如本领域已知的相关联的相应输入处理元件。例如,RF部分可与适用于以下的元件相关联:(i)选择所需的频率(也称为选择信号,或将信号频带限制到一个频带),(ii)下变频选择的信号,(iii)再次频带限制到更窄频带以选择(例如)在某些实施方案中可称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用以选择所需的数据包流。各种实施方案的RF部分包括用于执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可包括执行这些功能中的各种功能的调谐器,这些功能包括例如下变频接收信号至更低频率(例如,中频或近基带频率)或至基带。在一个机顶盒实施方案中,RF部分及其相关联的输入处理元件接收通过有线(例如,电缆)介质发射的RF信号,并且通过滤波、下变频和再次滤波至所需的频带来执行频率选择。各种实施方案重新布置上述(和其他)元件的顺序,移除这些元件中的一些元件,和/或添加执行类似或不同功能的其他元件。添加元件可包括在现有元件之间***元件,例如,***放大器和模数变换器。在各种实施方案中,RF部分包括天线。
此外,USB和/或HDMI端子可包括用于跨USB和/或HDMI连接将***1000连接到其他电子设备的相应接口处理器。应当理解,输入处理(例如Reed-Solomon纠错)的各个方面可根据需要例如在单独的输入处理IC内或在处理器1010内实现。类似地,USB或HDMI接口处理的方面可根据需要在单独的接口IC内或在处理器1010内实现。将解调流、纠错流和解复用流提供给各种处理元件,包括例如处理器1010以及编码器/解码器1030,该处理元件与存储器和存储元件结合操作以根据需要处理数据流以呈现在输出设备上。
***1000的各种元件可设置在集成壳体内。在集成壳体内,各种元件可使用合适的连接布置1140(例如,本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并且在这些元件之间传输数据。
***1000包括能够经由通信信道1060与其他设备通信的通信接口1050。通信接口1050可包括但不限于被配置为通过通信信道1060发射和接收数据的收发器。通信接口1050可包括但不限于调制解调器或网卡,并且通信信道1060可例如在有线和/或无线介质内实现。
在各种实施方案中,使用无线网络诸如Wi-Fi网络例如IEEE 802.11(IEEE是指电气和电子工程师协会)将数据流式发射或以其他方式提供给***1000。这些实施方案的Wi-Fi信号通过适用于Wi-Fi通信的通信信道1060和通信接口1050接收。这些实施方案的通信信道1060通常连接到接入点或路由器,该接入点或路由器提供对包括互联网的外部网络的访问,以用于允许流式应用和其他云上通信。其他实施方案使用通过输入块1130的HDMI连接传递数据的机顶盒向***1000提供流式数据。还有其他实施方案使用输入块1130的RF连接向***1000提供流式数据。如上所述,各种实施方案以非流式的方式提供数据。此外,各种实施方案使用除了Wi-Fi以外的无线网络,例如蜂窝网络或蓝牙网络。
***1000可将输出信号提供到各种输出设备,包括显示器1100、扬声器1110和其他***设备1120。各种实施方案的显示器1100包括例如触摸屏显示器、有机发光二极管(OLED)显示器、曲面显示器和/或可折叠显示器中的一者或多者。显示器1100可用于电视机、平板、笔记本、蜂窝电话(移动电话)或其他设备。显示器1100还可与其他部件集成在一起(例如,如在智能电话中),或者是单独的(例如,笔记本电脑的外部监视器)。在实施方案的各种示例中,其他***设备1120包括独立数字视频光盘(或数字多功能光盘,两个术语都是DVR)、光盘播放器、立体声***和/或照明***中的一者或多者。各种实施方案使用提供基于***1000的输出的功能的一个或多个***设备1120。例如,盘播放器执行播放***1000的输出的功能。
在各种实施方案中,控制信号使用诸如AV.Link、消费电子产品控制(CEC)或其他通信协议的信令在***1000与显示器1100、扬声器1110或其他***设备1120之间传送,该其他通信协议使得能够在有或没有用户干预的情况下进行设备到设备控制。输出设备可通过相应接口1070、1080和1090经由专用连接通信地耦接到***1000。另选地,输出设备可使用通信信道1060经由通信接口1050连接到***1000。显示器1100和扬声器1110可与电子设备(诸如电视机)中的***1000的其他部件集成在单个单元中。在各种实施方案中,显示接口1070包括显示驱动器,诸如例如定时控制器(T Con)芯片。
另选地,如果输入1130的RF部分是单独机顶盒的一部分,则显示器1100和扬声器1110可选地与其他部件中的一个或多个部件分开。在显示器1100和扬声器1110为外部部件的各种实施方案中,输出信号可经由专用输出连接(包括例如HDMI端口、USB端口或COMP输出)提供。
这些实施方案可由处理器1010或由硬件或由硬件和软件的组合实现的计算机软件执行。作为非限制性示例,这些实施方案可由一个或多个集成电路实现。作为非限制性示例,存储器1020可以是适合于技术环境的任意类型,并且可使用任何适当的数据存储技术来实现,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。作为非限制性示例,处理器1010可以是适合于技术环境的任意类型,并且可涵盖微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一者或多者。
各种具体实施参与解码。如本公开中所用,“解码”可涵盖例如对接收的编码序列执行的全部或部分过程,以便产生适用于显示的最终输出。在各种实施方案中,此类过程包括通常由解码器执行的一个或多个过程,例如熵解码、逆量化、逆变换和差分解码。在各种实施方案中,此类过程还包括或另选地包括由本公开中描述的各种具体实施的解码器执行的过程,例如,细化点云数据和/或从点云数据应用或移除量化器移位。
作为进一步的示例,在实施方案中,“解码”仅是指熵解码,在另一个实施方案中,“解码”仅是指差分解码,并且在又一个实施方案中,“解码”是指熵解码和差分解码的组合。短语“解码过程”是具体地指代操作的子集还是广义地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
各种具体实施参与编码。以与上文关于“解码”的讨论类似的方式,如在本公开中使用的“编码”可涵盖例如对输入视频序列执行以便产生编码的比特流的全部或部分过程。在各种实施方案中,此类过程包括通常由编码器执行的一个或多个过程,例如,分区、差分编码、变换、量化和熵编码。在各种实施方案中,此类过程还包括或另选地包括由本公开中描述的各种具体实施的编码器执行的过程,例如,细化点云数据和/或从点云数据应用或移除量化器移位。
作为进一步的示例,在实施方案中,“编码”仅是指熵编码,在另一个实施方案中,“编码”仅是指差分编码,并且在又一个实施方案中,“编码”是指差分编码和熵编码的组合。短语“编码过程”是具体地指代操作的子集还是广义地指代更广泛的编码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
需注意,如本文所用的语法元素,例如序列参数集、图片参数集或补充增强信息消息是描述性术语。因此,它们不排除使用其他语法元素名称。
当附图呈现为流程图时,应当理解,其还提供了对应装置的框图。类似地,当附图呈现为框图时,应当理解,其还提供了对应的方法/过程的流程图。
本文所述的具体实施和方面可在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单个形式的具体实施的上下文中讨论(例如,仅作为方法讨论),讨论的特征的具体实施也可以其他形式(例如,装置或程序)实现。装置可在例如适当的硬件、软件和固件中实现。方法可在例如一般是指处理设备的处理器中实现,
该处理设备包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,诸如例如计算机、手机、便携式/个人数字助理(“PDA”)以及便于最终用户之间信息通信的其他设备。
提及“一个实施方案”或“实施方案”或“一个具体实施”或“具体实施”以及它们的其他变型,意味着结合实施方案描述的特定的特征、结构、特性等包括在至少一个实施方案中。因此,短语“在一个实施方案中”或“在实施方案中”或“在一个具体实施中”或“在具体实施中”的出现以及出现在本公开通篇的各个地方的任何其他变型不一定都是指相同的实施方案。
此外,本公开可指“确定”各条信息。确定信息可包括例如估计信息、计算信息、预测信息或从存储器检索信息中的一者或多者。
此外,本公开可指“访问”各条信息。访问信息可包括例如接收信息、检索信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一者或多者。
此外,本公开可指“接收”各条信息。与“访问”一样,接收旨在为广义的术语。接收信息可包括例如访问信息或检索信息(例如,从存储器)中的一者或多者。此外,在诸如例如存储信息、处理信息、发射信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,“接收”通常以一种方式或另一种方式参与。
应当理解,例如,在“A/B”、“A和/或B”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”和“至少一种”中的任一种旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”的情况下,此类短语旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一列出的选项和第二列出的选项(A和B),或仅选择第一列出的选项和第三列出的选项(A和C),或仅选择第二列出的选项和第三列出的选项(B和C),或选择所有三个选项(A和B和C)。如对于本领域和相关领域的普通技术人员显而易见的是,这可扩展到所列出的尽可能多的项目。
而且,如本文所用,词语“发信号通知”是指(除了别的以外)向对应解码器指示某物。例如,在某些实施方案中,编码器发信号通知特定的量化bin移位或移位集合。这样,在一个实施方案中,在编码器侧和解码器侧两者均使用相同的参数。因此,例如,编码器可将特定参数发射(显式信令)到解码器,使得解码器可使用相同的特定参数。相反,如果解码器已具有特定参数以及其他,则可在不发射(隐式信令)的情况下使用信令,以简单允许解码器知道和选择特定参数。通过避免发射任何实际功能,在各种实施方案中实现了位节省。应当理解,信令可以各种方式实现。例如,在各种实施方案中,使用一个或多个语法元素、标记等将信息发信号通知至对应解码器。虽然前面涉及词语“signal(发信号通知)”的动词形式,但是词语“signal(信号)”在本文也可用作名词。
对于本领域的普通技术人员将显而易见的是,具体实施可产生格式化为携带例如可存储或可传输的信息的各种信号。信息可包括例如用于执行方法的指令或由所述具体实施中的一个具体实施产生的数据。例如,可格式化信号以携带所述实施方案的比特流。可格式化此类信号例如为电磁波(例如,使用频谱的射频部分)或基带信号。格式化可包括例如对数据流编码并且用编码的数据流调制载体。信号携带的信息可以是例如模拟或数字信息。已知的是,信号可通过各种不同的有线或无线链路发射。信号可存储在处理器可读介质上。
我们描述了多个实施方案。这些实施方案的特征可在各种权利要求类别和类型中单独地或以任何组合提供。此外,实施方案可包括以下特征、设备或方面中的一者或多者,单独地或以任何组合,跨各种权利要求类别和类型:实施方案包括:包括一个或多个所描述的语法元素或其变型的比特流或信号;包括根据所描述的实施方案中的任一实施方案生成的语法传达信息的比特流或信号;创建和/或发射和/或接收和/或解码包括一个或多个所描述的语法元素或其变型的比特流或信号;根据所描述的实施方案中的任一实施方案创建和/或发射和/或接收和/或解码;以及根据所描述的实施方案中的任一实施方案的方法、过程、装置、存储指令的介质、存储数据的介质或信号。
需注意,所述实施方案中的一个或多个实施方案的各种硬件元件被称为进行(例如,执行、实行等)本文结合相应模块所述的各种功能的“模块”。如本文所用,模块包括相关领域的技术人员认为适合于给定具体实施的硬件(例如,一个或多个处理器、一个或多个微处理器、一个或多个微控制器、一个或多个微芯片、一个或多个专用集成电路(ASIC)、一个或多个现场可编程门阵列(FPGA)、一个或多个存储器设备)。每个所述的模块还可包括用于执行被描述为由相应模块执行的一个或多个功能的可执行指令,并且需注意,这些指令可采取以下指令的形式或包括以下指令:硬件(即,硬连线)指令、固件指令、软件指令等,并且可被存储在任何合适的一个或多个非暂态计算机可读介质(诸如通常称为RAM、ROM等)中。
尽管上文以特定组合描述了特征和元件,但是本领域的普通技术人员将理解,每个特征或元件可单独使用或以与其他特征和元件的任何组合来使用。另外,本文所述的方法可在结合于计算机可读介质中以供计算机或处理器执行的计算机程序、软件或固件中实现。计算机可读存储介质的示例包括但不限于只读存储器(ROM)、随机存取存储器(RAM)、寄存器、高速缓存存储器、半导体存储器设备、磁介质(诸如内置硬盘和可移动磁盘)、磁光介质和光介质(诸如CD-ROM磁盘和数字通用光盘(DVD)。与软件相关联的处理器可用于实现用于WTRU、UE、终端、基站、RNC或任何主计算机的射频收发器。

Claims (15)

1.一种点云解码方法,所述点云解码方法包括:
获得至少表示第一点云和第二点云的数据;
获得至少识别与所述第一点云相关联的第一组量化器移位的信息;以及
至少基于所述第一点云、所述第一组量化器移位和所述第二点云来获得细化的点云数据。
2.一种点云解码器装置,所述点云解码器装置包括处理器,所述处理器被配置为至少执行:
获得至少表示第一点云和第二点云的数据;
获得至少识别与所述第一点云相关联的第一组量化器移位的信息;以及
至少基于所述第一点云、所述第一组量化器移位和所述第二点云来获得细化的点云数据。
3.根据权利要求1所述的方法或根据权利要求2所述的装置,其中获得所述细化的点云数据包括至少基于所述第一组量化器移位来执行减法。
4.根据权利要求1所述的方法或根据权利要求2所述的装置,还包括:
获得识别与所述第二点云相关联的第二组量化器移位的信息,所述第二组量化器移位不同于所述第一组量化器移位;
其中获得所述细化的点云数据还基于所述第二组量化器移位。
5.根据从属于权利要求1的权利要求4所述的方法,或根据从属于权利要求2的权利要求4所述的装置,其中获得所述细化的点云数据包括至少基于所述第一组量化器移位和所述第二组量化器移位来执行减法。
6.根据权利要求1所述的方法或根据权利要求2所述的装置,其中所述第一点云表示场景的左视图,并且所述第二点云表示所述场景的右视图。
7.根据权利要求1所述的方法或根据权利要求2所述的装置,其中所述第一点云和所述第二点云是与不同的时间相关联的帧。
8.根据权利要求1所述的方法或根据权利要求2所述的装置,其中所述第一组量化器移位至少包括与所述第一点云中的第一点相关联的第一移位和与所述第一点云中的第二点相关联的不同的第二移位。
9.根据权利要求1所述的方法或根据权利要求2所述的装置,其中表示所述第一点云的所述数据包括具有第一量化范围的第一参数(y1),表示所述第二点云的所述数据包括具有第二量化范围的第二参数(y2),并且其中获得所述细化的点云数据包括获得所述第一参数(y1)和所述第二参数(y2)两者的所述量化范围中的第三参数
Figure FDA0003808952670000021
10.根据权利要求1所述的方法或根据权利要求2所述的装置,其中基于所述第一点云(yl)和所述第二点云(yr)来获得所述细化的点云数据(xl)包括选择细化的第一点云(xl)以基本上最大化包括以下因子中的一个或多个因子的因子的乘积:
给定所述细化的第一点云(xl)的所述第一点云(yl)的条件概率Pr(yl|xl),
给定第二细化的点云(xr)的估计值g(xl)的所述第二点云(yr)的条件概率Pr(yr|g(xl)),其中所述估计值g(xl)基于所述第一细化的点云(xl),
所述第一细化的点云数据(xl)的先验概率Pr(xl),和
所述第二细化的点云(xr)的所述估计值g(xl)的先验概率Pr(g(xl))。
11.一种点云编码方法,所述点云编码方法包括:
获得至少表示第一点云和第二点云的数据;
量化所述第一点云和所述第二点云,其中量化所述点云数据包括向所述第一点云数据至少添加第一组量化器移位;以及
在比特流中编码经量化的第一点云和第二点云。
12.一种点云编码装置,所述点云编码装置包括处理器,所述处理器被配置为至少执行:
获得至少表示第一点云和第二点云的数据;
量化所述第一点云和所述第二点云,其中量化所述点云数据包括向所述第一点云数据至少添加第一组量化器移位;以及
在比特流中编码经量化的第一点云和第二点云。
13.根据权利要求11所述的方法或根据权利要求12所述的装置,还包括在所述比特流中编码指示所述第一组量化器移位的信息。
14.根据权利要求11所述的方法或根据权利要求12所述的装置,其中量化所述第一点云和所述第二点云包括向所述第二点云添加第二组量化器移位,还包括在所述比特流中编码指示所述第二组量化器移位的信息。
15.根据权利要求11所述的方法或根据权利要求12所述的装置,其中所述第一点云表示场景的左视图,并且所述第二点云表示所述场景的右视图。
CN202180016033.3A 2020-02-06 2021-02-05 具有多个测量结果的3d点云增强 Pending CN115136602A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062970956P 2020-02-06 2020-02-06
US62/970,956 2020-02-06
PCT/US2021/016895 WO2021158974A1 (en) 2020-02-06 2021-02-05 3d point cloud enhancement with multiple measurements

Publications (1)

Publication Number Publication Date
CN115136602A true CN115136602A (zh) 2022-09-30

Family

ID=74845089

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180016033.3A Pending CN115136602A (zh) 2020-02-06 2021-02-05 具有多个测量结果的3d点云增强

Country Status (6)

Country Link
US (1) US20230056576A1 (zh)
EP (1) EP4101173A1 (zh)
JP (1) JP2023512668A (zh)
CN (1) CN115136602A (zh)
MX (1) MX2022009490A (zh)
WO (1) WO2021158974A1 (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170347100A1 (en) * 2016-05-28 2017-11-30 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
CN108961320A (zh) * 2017-05-25 2018-12-07 通用汽车环球科技运作有限责任公司 确定移动物体速度的方法和***
CA3070678A1 (en) * 2017-07-28 2019-01-31 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
WO2019050931A1 (en) * 2017-09-06 2019-03-14 Apple Inc. COMPRESSION OF THE GEOMETRY OF A POINT CLOUD
WO2019182811A1 (en) * 2018-03-20 2019-09-26 Pcms Holdings, Inc. System and method for dynamically adjusting level of details of point clouds
WO2019183113A1 (en) * 2018-03-20 2019-09-26 Pcms Holdings, Inc. System and method for optimizing dynamic point clouds based on prioritized transformations
US20190311502A1 (en) * 2018-04-10 2019-10-10 Apple Inc. Point cloud attribute transfer algorithm
CN110691243A (zh) * 2019-10-10 2020-01-14 叠境数字科技(上海)有限公司 一种基于深度卷积网络的点云几何压缩方法
US20200021844A1 (en) * 2018-07-10 2020-01-16 Tencent America LLC Method and apparatus for video coding
US20200021856A1 (en) * 2018-07-10 2020-01-16 Apple Inc. Hierarchical point cloud compression

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10916041B2 (en) * 2018-03-30 2021-02-09 Samsung Electronics Co., Ltd. Method for depth image di coding
US11348284B2 (en) * 2019-01-08 2022-05-31 Apple Inc. Auxiliary information signaling and reference management for projection-based point cloud compression
US10713841B1 (en) * 2019-01-18 2020-07-14 Unkie Oy System for generating point cloud map and method therefor
JP2022063882A (ja) * 2019-02-28 2022-04-25 ソニーグループ株式会社 情報処理装置および方法、並びに、再生装置および方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170347100A1 (en) * 2016-05-28 2017-11-30 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
CN108961320A (zh) * 2017-05-25 2018-12-07 通用汽车环球科技运作有限责任公司 确定移动物体速度的方法和***
CA3070678A1 (en) * 2017-07-28 2019-01-31 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
WO2019050931A1 (en) * 2017-09-06 2019-03-14 Apple Inc. COMPRESSION OF THE GEOMETRY OF A POINT CLOUD
WO2019182811A1 (en) * 2018-03-20 2019-09-26 Pcms Holdings, Inc. System and method for dynamically adjusting level of details of point clouds
WO2019183113A1 (en) * 2018-03-20 2019-09-26 Pcms Holdings, Inc. System and method for optimizing dynamic point clouds based on prioritized transformations
US20190311502A1 (en) * 2018-04-10 2019-10-10 Apple Inc. Point cloud attribute transfer algorithm
US20200021844A1 (en) * 2018-07-10 2020-01-16 Tencent America LLC Method and apparatus for video coding
US20200021856A1 (en) * 2018-07-10 2020-01-16 Apple Inc. Hierarchical point cloud compression
CN110691243A (zh) * 2019-10-10 2020-01-14 叠境数字科技(上海)有限公司 一种基于深度卷积网络的点云几何压缩方法

Also Published As

Publication number Publication date
EP4101173A1 (en) 2022-12-14
US20230056576A1 (en) 2023-02-23
JP2023512668A (ja) 2023-03-28
WO2021158974A1 (en) 2021-08-12
MX2022009490A (es) 2022-11-09

Similar Documents

Publication Publication Date Title
TWI805788B (zh) 降低解碼器側運動精化的寫碼潛時的方法及裝置
US10939096B2 (en) Control-point based intra direction representation for intra coding
US20220038679A1 (en) Complexity reduction and bit-width control for bi-directional optical flow
US20220261616A1 (en) Clustering-based quantization for neural network compression
US11961264B2 (en) System and method for procedurally colorizing spatial data
US20240107024A1 (en) Affine motion model derivation method
EP3987778B1 (en) Precision refinement for motion compensation with optical flow
US20220182634A1 (en) Methods and systems for post-reconstruction filtering
EP4082204A1 (en) Estimating weighted-prediction parameters
US20230056576A1 (en) 3d point cloud enhancement with multiple measurements
US20220132136A1 (en) Inter prediction bandwidth reduction method with optical flow compensation
WO2024083754A1 (en) Point based attribute transfer for textured meshes
RU2803895C2 (ru) Уточнение прогнозирования с компенсацией движения с помощью оптического потока
WO2023208808A1 (en) Providing segmentation information for immersive video
CN113273211B (zh) 用于对空间数据进行程序化着色的***和方法
WO2024015400A1 (en) Deep distribution-aware point feature extractor for ai-based point cloud compression
WO2023133350A1 (en) Coordinate refinement and upsampling from quantized point cloud reconstruction
WO2024012810A1 (en) Film grain synthesis using encoding information
WO2024086165A1 (en) Context-aware voxel-based upsampling for point cloud processing
WO2024083566A1 (en) Encoding and decoding methods using directional intra prediction and corresponding apparatuses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240407

Address after: Delaware, USA

Applicant after: Interactive Digital VC Holdings

Country or region after: U.S.A.

Address before: Wilmington, Delaware, USA

Applicant before: PCMS HOLDINGS, Inc.

Country or region before: U.S.A.