TWI714153B - 零單元的定義 - Google Patents

零單元的定義 Download PDF

Info

Publication number
TWI714153B
TWI714153B TW108123153A TW108123153A TWI714153B TW I714153 B TWI714153 B TW I714153B TW 108123153 A TW108123153 A TW 108123153A TW 108123153 A TW108123153 A TW 108123153A TW I714153 B TWI714153 B TW I714153B
Authority
TW
Taiwan
Prior art keywords
block
video
item
patent application
scope
Prior art date
Application number
TW108123153A
Other languages
English (en)
Other versions
TW202002630A (zh
Inventor
張凱
張莉
劉鴻彬
莊孝強
王悅
Original Assignee
大陸商北京字節跳動網絡技術有限公司
美商字節跳動有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商北京字節跳動網絡技術有限公司, 美商字節跳動有限公司 filed Critical 大陸商北京字節跳動網絡技術有限公司
Publication of TW202002630A publication Critical patent/TW202002630A/zh
Application granted granted Critical
Publication of TWI714153B publication Critical patent/TWI714153B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了在視頻和影像編碼中使用零單元的裝置、系統和方法。在一個代表性方面,用於視頻編碼的方法包括基於至少一個維度是非二的冪,而確定具有該維度的視頻資料塊是零單元(ZU)塊;回應於確定視頻資料塊是ZU塊,編碼ZU塊資料而不使用變換係數編碼;以及在位元流中信號通知編碼的ZU。在另一代表性方面,一種視頻編碼方法包括,接收對應於視頻資料塊的位元流,視頻資料塊具有維度,接收指示視頻資料塊是零單元(ZU)塊的信號,並且基於信號,解碼對應於ZU塊的位元流,以在不使用變換係數解碼的情況下重建視頻資料塊,其中ZU塊的至少一個維度是非二的冪。

Description

零單元的定義
本專利文件一般地涉及影像和視頻編碼技術。
[相關申請的交叉引用]
根據適用的專利法和/或依據巴黎公約的規則,本發明及時要求於2018年6月29日提交的國際專利申請第PCT/CN2018/093631號和於2018年7月2日提交的美國臨時專利申請第62/693,415號的優先權和權益。該國際專利申請第PCT/CN2018/093631號和美國臨時申請第62/693,415號的全部公開內容通過引用併入作為本發明的公開內容的一部分。
數位視頻佔據網際網路和其它數位通信網路上最大的頻寬使用。隨著能夠接收和顯示視頻的所連接的使用者設備的數量增加,預計數位視頻使用的頻寬需求將繼續增長。
描述了與專用編碼單元(CU)和/或編碼樹單元 (CTU)相關的用於提高編碼效率的設備、系統和方法。具體地,本公開的技術公開了提供增強例如處理位於視頻資料塊的邊界處的子塊(例如,在圖片(picture)、條帶(slice)、片(tile)等中)的零單元。所描述的方法可以應用於現有的視頻編碼標準(例如,高效視頻編碼(HEVC))和未來的視頻編碼標準或視頻編解碼器兩者。
在一個示例方面中,公開了一種視頻處理的方法。該方法包括基於至少一個維度是非二的冪數來確定視頻資料塊是零單元(ZU)塊,回應於確定視頻資料塊是ZU塊,對所有殘差被設為零的ZU塊進行編碼;以及在位元流中信號通知編碼的ZU塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括接收對應於視頻資料塊的位元流;由於塊的至少一個維度為非二的冪數,確定視頻資料塊被編碼為所有殘差設為零的零單元(ZU)塊;以及基於決定而解碼視頻資料塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括基於塊的維度是二的冪數,確定視頻資料塊是零單元(ZU)塊;基於確定該塊為ZU塊,對位元流中的視頻資料塊進行編碼;以及在位元速率中信號通知ZU塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括接收對應於視頻資料塊的位元流;基於塊的維度為二的冪數來確定視頻資料塊為零單元(ZU)塊;以及基於信號解碼位元 流以重建視頻資料塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括,基於具有小於或等於第一整數的寬度並具有小於或等於第二整數的高度,確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將視頻資料塊編碼為ZU塊;以及在位元流中信號通知ZU塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於第一整數的寬度並具有大於或等於第二整數的高度來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括基於具有大於或等於第一整數的寬度並且具有大於或等於第二整數的高度來確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將視頻資料塊編碼為ZU塊;以及在位元流中信號通知ZU塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於第一整數的寬度或具有大於或等於第二整數的高度來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
在另一示例方面中,公開了另一種視頻處理方法。該方 法包括,基於具有大於或等於整數的寬度和高度的乘積,確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將視頻資料塊編碼為ZU塊;以及在位元流中信號通知ZU塊。
在另一示例方面中,公開了另一種視頻處理方法。該方法包括接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於整數的寬度和高度的乘積來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
在另一代表性方面中,上述方法以儲存用於實現該方法的處理器可執行代碼的電腦可讀介質的形式體現。
在另一代表性方面中,公開了一種配置為或可操作為執行上述方法的設備。該設備可以包括處理器,該處理器被程式設計以實現該方法。
在另一代表性方面中,視頻解碼器裝置可實現如本文所述的方法。
在附圖、說明書和申請專利範圍中更詳細地描述了本公開的技術的上述和其它方面和特徵。
502:分割
504:突出顯示的CTB
506:圖片邊界
700、750、800、850、900、950、960、1400、1500:方法
702、704、752、754、802、804、806、808、852、854、856、858、902、904、906、908、910、952、954、956、962、964、966、1410、1420、1510、1520、1530:步驟
1600:電腦系統
1605:處理器
1610:儲存器
1615:網路適配器
1625:通過互連
1700:移動設備
1701:處理器
1702:儲存器
1703:輸入/輸出(I/O)單元
1704:顯示裝置
圖1示出了典型的高效視頻編碼(HEVC)視頻編解碼器和 解碼器的示例方塊圖。
圖2示出了H.264/AVC中的宏塊(MB)劃分的示例。
圖3示出了將編碼塊(CB)分割成預測塊(PB)的示例。
圖4A和4B分別示出了將編碼樹塊(CTB)細分為CB和變換塊(TB)以及相應的四叉樹的示例。
圖5示出了一幀的劃分結構的示例。
圖6A和6B分別示出了在圖5中的示例性幀中突出顯示的CTB的細分和信號方法。
圖7A至7B是視頻處理方法示例的流程圖。
圖8A至8B是視頻處理方法示例的流程圖。
圖9A至9C是視頻處理方法示例的流程圖。
圖10A至10I示出了基於QTBT的CB的細分示例。
圖11示出了樹類型信號的示例。
圖12A至12C示出了跨越圖片邊界的CTB的示例。
圖13示出了圖片邊界處的零單元的示例。
圖14示出了根據本公開的技術的用於視頻編碼的示例方法的流程圖。
圖15示出了根據本公開的技術的用於視頻解碼的另一示例方法的流程圖。
圖16是示出可用於實現本公開技術的各個部分的電腦系統或其它控制設備的架構的示例的方塊圖。
圖17示出了可用於實現本公開技術的各個部分的移動設備 的示例實施例的方塊圖。
圖18A和18B示出了將ZU塊分割為子塊以進行自適應環路控制(ALF)開/關控制的示例。
由於對更高解析度視頻的需求日益增加,視頻編碼方法和技術在現代技術中無處不在。視頻編解碼器通常包括壓縮或解壓縮數位視頻的電子電路或軟體,並且視頻編解碼器被不斷改進以提供更高的編碼效率。視頻編解碼器將未壓縮視頻轉換為壓縮格式,或反之亦然。視頻品質、用於表示視頻的資料量(由位元速率確定)、編碼和解碼演算法的複雜性、對資料丟失和錯誤的敏感性、編輯便利性、隨機訪問以及端到端延遲(遲延)之間存在複雜的關係。壓縮格式通常符合標準視頻壓縮規範,例如高效視頻編碼(HEVC)標準(也稱為H.265或MPEG-H第2部分)、即將最終確定的通用視頻編碼標準,或其它當前和/或未來的視頻編碼標準。
所公開的技術的實施例可以應用於現有的視頻編碼標準(例如,HEVC,H.265)和未來的標準以改善壓縮性能。在本文件中使用章節標題來提高描述的可讀性而不是以任何方式將討論或實施例(和/或實現方式)僅限於各個章節。
在本文件中使用章節標題以便於理解,並且不將章節中公開的實施例僅限於該章節。此外,雖然參考通用視頻編碼或其 它特定視頻編解碼器描述了某些實施例,但是所公開的技術還可應用於其它視頻編碼技術。此外,雖然一些實施例詳細描述了視頻編碼步驟,但是應當理解的是,撤銷編碼的相應解碼步驟將由解碼器實現。此外,術語視頻處理包括視頻編碼或壓縮、視頻解碼或解壓縮以及視頻轉碼,其中視頻畫素從一種壓縮格式表示為另一壓縮格式或以不同的壓縮位元速率表示。
視頻編碼的示例實施例
圖1示出了典型HEVC視頻編解碼器和解碼器的示例性方塊圖。產生符合HEVC的位元流的編碼演算法通常如下進行。每個圖片被分割為塊狀區域,其中精確的塊劃分被傳送到解碼器。視頻序列的第一圖片(以及在對視頻序列的每個乾淨隨機訪問點處的第一圖片)僅使用幀內預測(在同一圖片內使用區域到區域的空間上的資料的一些預測,而不基於其它圖片)進行編碼。對於序列的所有剩餘圖片或隨機訪問點之間的圖片,對於大多數塊通常使用幀間時間預測編碼模式。幀間預測的編碼過程包括選擇包含選定的參考圖片和運動向量(MV)的運動資料,該參考圖片和運動向量(MV)將被應用於預測每個塊的樣本。編碼器和解碼器通過應用運動補償(MC)來生成相同的幀間預測訊號,該運動補償(MC)使用作為輔助資訊發送的MV和模式確定資料。
通過線性空間變換對幀內預測或幀間預測的殘差訊號進行變換,其中該殘差訊號是原始塊與其預測之間的差異。然後對 變換係數進行縮放、量化、熵編碼並與預測資訊一起發送。
編碼器複製解碼器處理環路(見圖1中的灰色陰影框),使得兩者都將為後續資料生成相同的預測。因此,量化的變換係數通過逆縮放構造,並且然後進行逆變換以複製殘差訊號的解碼的近似值。然後將殘差加入到預測中,並且然後可以將該加法的結果輸入一個或兩個環路濾波器,以平滑由逐塊處理和量化引起的偽影(artifact)。最終的圖片表示(即解碼器輸出的複製)儲存在解碼的圖片緩衝器中以用於後續圖片的預測。通常,圖片的編碼或解碼處理的順序常常不同於它們從來源到達的順序,需要區分解碼器的解碼順序(即位元流順序)和輸出順序(即顯示順序)。
通常期望將由HEVC編碼的視頻材料作為逐行掃描影像輸入(由於源視頻源自該格式或者由於由編碼之前的去隔行(deinterlacing)產生)。在HEVC設計中不存在顯式編碼特徵以支援隔行掃描的使用,因為隔行掃描不再用於顯示器,並且在分佈時變得非常不常見。但是,已經在HEVC中提供了中繼資料語法以允許編碼器指示,隔行掃描的視頻已經通過將隔行掃描視頻的每個場(即每個視頻幀的偶數或奇數行)編碼為單獨的圖片而被發送,或者隔行掃描的視頻已經通過將每個隔行掃描的幀編碼為HEVC編碼的圖片而被發送。這提供了一種有效的編碼隔行掃描的視頻的方法,而無需加重解碼器需支援隔行掃描的視頻的特殊的解碼過程的負擔。
1.1. H.264/AVC中的劃分樹結構的示例
先前標準中的編碼層的核心是巨集塊,包含16×16的亮度(luma)樣本塊、以及在4:2:0顏色採樣的通常情況下的兩個對應的8×8的彩度(chroma)樣本塊。
幀內編碼塊使用空間預測來利用畫素之間的空間相關性。兩種劃分被定義為:16x16和4x4。
幀間編碼塊通過估計圖片之間的運動來使用時間預測而不是空間預測。可以對於16x16宏塊或其任何子宏塊劃分16x8、8x16、8x8、8x4、4x8、4x4來獨立地估計運動,如圖2所示。每子宏塊劃分僅允許一個運動向量(MV)。
1.2. HEVC中的劃分樹結構的示例
在HEVC中,通過使用表示為編碼樹的四叉樹結構將編碼樹單元(CTU)劃分成編碼單元(CU),以適應各種局部特性。使用幀間(時間)預測還是幀內(空間)預測來對圖片區域進行編碼的確定是在CU級做出的。根據預測單元(PU)劃分類型,每個CU可以進一步劃分成一個、兩個或四個PU。在一個PU內部,應用相同的預測過程,並且在PU的基礎上將相關資訊發送到解碼器。在通過基於PU劃分類型應用預測過程而獲得了殘差塊之後,可以根據類似於CU的編碼樹的另一個四叉樹結構將CU劃分為變換單元(TU)。HEVC結構的關鍵特徵之一是它具有多個劃分概念,包括CU、PU和TU。
對使用HEVC的混合視頻編碼中涉及的某些特徵包括:
(1)編碼樹單元(CTU)和編碼樹塊(CTB)結構:HEVC中的類似結構是編碼樹單元(CTU),其具有由編碼器選擇的尺寸並且可以大於傳統宏塊。CTU由亮度CTB和相應的彩度CTB以及語法元素組成。亮度CTB的尺寸L×L可以被選擇為L=16、32或64個樣本,較大的尺寸通常能夠實現更好的壓縮。然後,HEVC支援使用樹結構和類似四叉樹的信號來將CTB劃分為更小的塊。
(2)編碼單元(CU)和編碼塊(CB):CTU的四叉樹語法指定其亮度CB和彩度CB的尺寸和位置。四叉樹的根與CTU相關聯。因此,亮度CTB的尺寸是亮度CB的最大支持尺寸。將CTU劃分成亮度CB和彩度CB是信號聯合的。一個亮度CB和通常兩個彩度CB以及相關聯的語法一起形成編碼單元(CU)。CTB可以僅包含一個CU或者可以被劃分以形成多個CU,並且每個CU具有相關聯的、向預測單元(PU)以及變換單元(TU)的樹的劃分。
(3)預測單元和預測塊(PB):使用幀間圖片預測還是幀內圖片預測來對圖片區域編碼的決策是在CU級進行的。PU劃分結構的根在CU級。取決於基本預測類型決策,然後可以在尺寸上進一步劃分亮度CB和彩度CB,並根據亮度和彩度預測塊(PB)對其進行預測。HEVC支援從64×64到4×4樣本的可變PB尺寸。圖3示出了對於MxM CU所允許的PB的示例。
(4)變換單元(TU)和變換塊:使用塊變換對預測殘 差進行編碼。TU樹結構的根在CU級。亮度CB殘差可以與亮度變換塊(TB)相同,或者可以被進一步劃分成更小的亮度TB。這同樣適用於彩度TB。對於正方形TB尺寸4×4、8×8、16×16和32×32,定義類似於離散餘弦變換(DCT)的整數基函數。對於亮度幀內圖片預測殘差的4×4變換,可以替代地指定從離散正弦變換(DST)的形式導出的整數變換。
1.2.1. 樹結構的劃分到TBTU的示例
對於殘差編碼,可以將CB遞迴地劃分為變換塊(TB)。由殘差四叉樹信號通知劃分。僅指定正方形CB和TB劃分,其中塊可以被遞迴地劃分到象限(quadrant),如圖4A到4B所示。對於尺寸為M×M的給定亮度CB,標誌(flag)表明是否將該CB劃分成四個尺寸為M/2×M/2的塊。如果如SPS中指示的殘差四叉樹的最大深度所信號通知的,每個象限能夠進一步劃分,則為每個象限分配標誌,該標誌指示是否將其劃分成四個象限。由殘差四叉樹產生的葉節點塊是變換塊,通過變換編碼對其進一步處理。編碼器指示它將使用的最大和最小亮度TB尺寸。當CB尺寸大於最大TB尺寸時,劃分是隱含的。當劃分將導致亮度TB尺寸小於所指示的最小值時,不劃分是隱含的。除了當亮度TB尺寸為4×4時,彩度TB尺寸在每個維度上是亮度TB尺寸的一半,在亮度TB尺寸為4×4的情況下,單個4×4彩度TB被用於由四個4×4亮度TB覆蓋的區域。在幀內圖片預測的CU的情況下,最近鄰的TB(在CB內或在CB外)的解碼後樣本被 用作用於幀內圖片預測的參考資料。
與先前的標準相反,HEVC設計允許TB跨越多個PB以用於幀間預測的CU,以使四叉樹結構的TB劃分的潛在編碼效率益處最大化。
1.2.2. 圖片邊界碼的示例
圖片的邊界以最小允許的亮度CB大小為單位定義。因此,在圖片的右邊界和底邊界,一些CTU可能會覆蓋部分位於圖片邊界之外的區域。該條件被解碼器檢測到,並且CTU四叉樹根據需要被隱式地分割,以將CB大小減小到整個CB將適合到圖片中的程度。
圖5示出了一個幀的劃分結構的示例,其中解析度為416×240畫素,尺寸為7 CTB×4 CTB,其中CTB的大小為64×64。如圖5所示,部分位於右邊界和底邊界之外的CTB具有隱含的分割(虛線,表示為502),並且完全落在外面的CU就被跳過(不被編碼)。
在圖5所示的示例中,突出顯示的CTB(504),其行CTB索引等於2且列CTB索引等於3,在當前圖片內具有64×48畫素,並且不適合64×64 CTB。因此,它被強制分割為32x32而沒有分割標誌訊號。對於左上角的32x32,它被幀完全覆蓋。當它選擇根據速率-失真成本以較小的塊編碼時(對於左上角的16x16用8x8,並且其餘的以16x16編碼),需要編碼幾個分割標誌。這些分割標誌(用於是否將左上角的32x32分割為四個 16x16塊的一個標誌,以及用於信號通知一個16x16是否被進一步分割,以及對於在左上角的16x16中的四個8x8塊中的每一個是否進一步分割8x8的標誌)必須被明確地信號通知。右上角的32x32塊存在類似情況。對於兩個底部32x32塊,因為它們部分位於圖片邊界(506)的外部,需要應用進一步的QT分割而不用信號通知。圖6A和6B分別示出了圖5中突出顯示的CTB(504)的細分和信號方法。
1.2.3. CTB大小指示的示例
表1中示出了用於一般序列參數集的示例RBSP(原始位元組序列有效載荷)語法表。
Figure 108123153-A0305-02-0015-1
相應的語義包括:log2_min_luma_coding_block_size_minus3加3指定最 小亮度編碼塊大小;以及log2_diff_max_min_luma_coding_block_size指定最大亮度編碼塊大小和最小亮度編碼塊大小之間的差異。
變數:MinCbLog2SizeY,CtbLog2SizeY,MinCbSizeY,CtbSizeY,PicWidthInMinCbsY,PicWidthInCtbsY,PicHeightInMinCbsY,PicHeightInCtbsY,PicSizeInMinCbsY,PicSizeInCtbsY,PicSizeInSamplesY,PicWidthInSamplesC and PicHeightInSamplesC通過以下得到:MinCbLog2SizeY=log2_min_luma_coding_block_size_minus3+3
CtbLog2SizeY=MinCbLog2SizeY+log2_diff_max_min_luma_coding_block_size
MinCbSizeY=1<<MinCbLog2SizeY
CtbSizeY=1<<CtbLog2SizeY
PicWidthInMinCbsY=pic_width_in_luma_samples/MinCbSizeY
PicWidthInCtbsY=Ceil(pic_width_in_luma_samples÷CtbSizeY)
PicHeightInMinCbsY=pic_height_in_luma_samples/MinCbSizeY
PicHeightInCtbsY=Ceil(pic_height_in_luma_samples÷CtbSizeY)
PicSizeInMinCbsY=PicWidthInMinCbsY * PicHeightInMinCbsY
PicSizeInCtbsY=PicWidthInCtbsY * PicHeightInCtbsY
PicSizeInSamplesY=pic_width_in_luma_samples * pic_height_in_luma_samples
PicWidthInSamplesC=pic_width_in_luma_samples/SubWidthC
PicHeightInSamplesC=pic_height_in_luma_samples/SubHeightC
變數CtbWidthC和CtbHeightC,其分別指定每個彩度CTB陣列的寬度和高度,通過以下得到:如果chroma_format_idc等於0(單色)或者separate_colour_plane_flag等於1,則CtbWidthC和CtbHeightC都等於0;否則,CtbWidthC和CtbHeightC通過以下得到:CtbWidthC=CtbSizeY/SubWidthC
CtbHeightC=CtbSizeY/SubHeightC
1.3.JEM中具有較大CTU的四叉樹加二叉樹塊結構的示例
在一些實施例中,使用被稱為聯合探索模型(JEM)(參考[4])的參考軟體探索未來的視頻編碼技術(參考[3])。除二叉樹結構外,JEM還描述了四叉樹加二叉樹(QTBT)和三叉樹 (TT)結構。
1.5.替代視頻編碼技術中的分割結構的示例
在一些實施例中,支持稱為多樹類型(MTT)的樹結構(其是QTBT的一般化)。在QTBT中,如圖11所示,首先用四叉樹結構劃分編碼樹單元(CTU)。四叉樹葉節點進一步由二叉樹結構劃分。
MTT的結構由兩種類型的樹節點構成:區域樹(RT)和預測樹(PT),支援九種類型的劃分,如圖10A至10I所示。區域樹可以遞迴地將CTU分割成方形塊,直到4×4大小的區域的樹葉節點。在區域樹中的每個節點處,可以從三種樹類型中的一個形成預測樹:二叉樹,三叉樹和非對稱二叉樹。在PT分割中,禁止在預測樹的分支中具有四叉樹劃分。與在JEM中一樣,亮度樹和彩度樹在I切片中分開。
通常,除了上下文推導之外,RT信號與JEM中的QT信號相同。對於PT信號,需要多達4個額外的二進位位元(bin),如圖11所示。第一個二進位位元指示PT是否被進一步分割。該二進位位元的上下文基於對進一步分割的可能性與當前塊與其相鄰塊的相對大小高度相關的觀察來計算。如果進一步分割PT,則第二個二進位位元指示其是水平劃分還是垂直劃分。在一些實施例中,中心側三叉樹和非對稱二叉樹(ABT)的存在增加了“高”塊或“寬”塊的出現。第三個二進位位元表示劃分的樹的類型,即它是二叉樹/三叉樹還是非對稱二叉樹。在二叉樹/三 叉樹的情況下,第四個二進位位元表示樹的類型。在非對稱二叉樹的情況下,第四個二進位位元指示對於水平劃分樹的向上或向下類型,對於垂直劃分樹的向右或向左類型。
1.5.1.圖片邊界處的限制的示例
在一些實施例中,如果CTB/LCU大小由M×N指示(通常M等於N,如HEVC/JEM中所定義),並且對於位於圖片(或圖塊或條帶或其它類型)邊界的CTB,K x L個樣本處於圖片邊界內。
在圖片底邊界和右邊界上的CU分割規則可以應用於任何編碼樹配置QTBT+TT、QTBT+ABT或QTBT+TT+ABT。它們包括以下兩個方面:
(1)如果給定編碼樹節點(CU)的一部分部分地位於圖片外部,則總是允許沿著相關邊界方向(沿著底邊界的水平分割定向,如圖12A所示,沿右邊界的垂直分割定向,如圖12B所示)的CU的二元對稱分割。如果當前CU的右下角在幀外(如圖12C所示),則只允許CU的四叉樹分割。另外,如果當前二叉樹深度大於最大二叉樹深度並且當前CU在幀邊界上,則啟用二元分割以確保到達幀邊界。
(2)關於三叉樹分割過程,在產生的子CU之間的第一邊界或第二邊界恰好位於圖片的邊界上的情況下,允許三叉樹分割。如果分割線(由分割產生的兩個子CU之間的邊界)與圖片邊界完全匹配,則允許不對稱二叉樹分割。
2.現有實現方式的示例
現有實現方式,CTU或CU的寬度或高度可能不等於2N,其中N是正整數。這些情況很難處理。具體來說,如果行數或列數不是2N的形式,則可能難以設計具有不包括除法的整數運算的變換。
在一個示例中,為了避免CTU或CU具有不等於2N的寬度或高度,CTU或CU被強制分割為更小,直到寬度和高度兩者都是2N的形式或通過填充或使用變換跳過。如果以更靈活的方式處理這些塊,則可以進一步改善編碼增益。
在另一個示例中,對於寬度或高度不是2N形式的CU定義變換。這種變換在實際的視頻編碼應用中是不期望的。
3.使用基於本公的技術的零單元的示例方法
本公開的技術的實施例克服了現有實施方式的缺點,從而為視頻編碼提供了更高的效率。具體地,提出零單元塊作為特殊的CU/CTU,並且塊在當且僅當其高度和/或寬度不是2N的形式時被解釋為零單元。
在以下針對各種實現方式所描述的示例中闡明了使用零單元來提高視頻編碼效率並增強現有和未來的視頻編碼標準。下面提供的本公開的技術的示例解釋了一般概念,並不意欲被解釋為限制。在示例中,除非明確地相反指示,否則可以組合這些示例中描述的各種特徵。在另一示例中,這些示例中描述的各種特徵可以應用於使用向後相容的塊大小的圖片邊界編碼和使用劃分 樹進行可視媒體編碼的方法。
示例1. 在一個示例中,塊的寬度、高度或兩者都可以等於不是2N的形式的任意正整數。這樣的塊被定義為零單元(ZU),其中所有殘差被設置為0。圖13示出了圖片邊界處的零單元的示例。
(a)在一個示例中,ZU的寬度和高度必須是偶數(以2N的形式)。
(b)在一個示例中,ZU的寬度和高度必須是2KN的形式(例如,K等於1,2,3,4等)。
示例2. 在一個示例中,提出對於零單元,不調用變換、逆變換、量化和去量化操作。
(a)在一個示例中,零單元被推斷為用Skip模式編碼;在這種情況下,不需要信號通知skip標誌、以及幀內或幀間或其它模式的指示。
(b)可替代地,此外,也可以跳過merge索引。
(i)零塊可以從其相鄰塊之中的一個繼承運動資訊,該相鄰塊的大小等於2N x 2M
(ii)在一個示例中,相鄰塊被定義為與邊界平行的塊,例如對於位於底邊界的零單元,它可以從其上面的塊繼承運動資訊。
(iii)在一個示例中,可以應用某些規則來選擇其相鄰塊的一個,諸如零單元與其相鄰塊之間的連續性。
(iv)在一個示例中,運動資訊可以從相鄰塊的運動資訊得到。
(c)在一個示例中,零單元可以用Skip模式或non-skip模式、和/或幀內或幀間模式編碼。在這種情況下,模式資訊的傳統信號保持不變,但是,不信號通知cbf_flag並且零單元的所有cbf_flag都被推斷為零。對零單元,不信號通知諸如量化係數或transform_skip_flag的殘差資訊。
示例3. 在一個示例中,零單元中可能存在殘差。但是對於零單元沒有變換和逆變換操作。
(a)在一個示例中,零單元的殘差總是用transform-skip模式編碼。對於零單元,不信號通知Transform_skip_flag並且Transform_skip_flag被推斷為一。
示例4. ABT劃分中的分割CU可以是零單元。
示例5. 圖片/條帶/片邊界處的CTU或CU可以是零單元。
(a)在一個示例中,不需要信號通知用於邊界CTU/CU的標誌。對於位於圖片邊界上的CU,只允許ZU。
(b)在一個示例中,所有邊界CTU/CU需要標誌來區分正常CU和ZU。在另一個示例中,該標誌可以結合示例6和7中描述的對大小的限制條件來考慮。
示例6. 可以預先定義零塊的寬度/高度的最大值和最小值,或者可以從編碼器向解碼器發信號通知零塊的寬度/高度的最 大值和最小值。在一個示例中,它們可以在視頻參數集(VPS)、序列參數集(SPS)、圖片參數集(PPS)、條帶標頭、編碼樹單元(CTU)或編碼單元(CU)中信號通知。
示例7. 零單元可以進一步分割為兩個單元(BT或ABT)、三個單元(TT、FTT)或四個單元(QT、EQT)。從零單元分割的分割單元可以是零單元,或者它可以是正常CU,其具有2N的形式的寬度或高度。假設零單位Z的大小為S×T。
(a)在一個示例中,Z可以用BT分割為兩個單元,二者具有大小為S/2×T。
(b)在一個示例中,Z可以用BT分割為兩個單元,二者具有大小為S×T/2。
(c)在一個示例中,假設2N<S
Figure 108123153-A0305-02-0023-3
2N+1,Z可以用BT分割為兩個單元,其具有大小為2N×T和(S-2N)×T,或(S-2N)×T和2N×T。
(d)在一個示例中,假設2N<T
Figure 108123153-A0305-02-0023-4
2N+1,Z可以用BT分割為兩個單元,其具有大小為S×2N和S×(T-2N),或S×(T-2N)和S×2N
(e)在一個示例中,Z可以用TT分割為三個單元,其具有大小為S/4×T、S/2×T和S/4×T。
(f)在一個示例中,Z可以用TT分割為三個單元,其具有大小為S×T/4、S×T/2和S×T/4。
(g)在一個示例中,假設2N<S<2N+1,Z可以用TT分 割為三個單元,其具有大小為2N-1×T、2N-1×T和(S-2N)×T,或2N-1×T、(S-2N)×T和2N-1×T,或(S-2N)×T、2N-1×T和2N-1×T。
(h)在一個示例中,假設2N<T
Figure 108123153-A0305-02-0024-5
2N+1,Z可以用TT分割為三個單元,其具有大小為S×2N-1、S×2N-1和S×(T-2N),或S×2N-1、S×(T-2N)和S×2N-1,或S×(T-2N)、S×2N-1和S×2N-1
(i)在一個示例中,Z可以用QT分割為四個單元,均具有大小為S/2×T/2。
(j)在一個示例中,假設2N<S
Figure 108123153-A0305-02-0024-6
2N+1,Z可以用QT分割為四個單元,具有大小為2N×T/2、2N×T/2、(S-2N)×T/2和(S-2N)×T/2,或(S-2N)×T/2、(S-2N)×T/2、2N×T/2和2N×T/2。
(k)在一個示例中,假設2N<T
Figure 108123153-A0305-02-0024-7
2N+1,Z可以用QT分割為四個單元,具有大小為S/2×2N、S/2×2N、S/2×(T-2N)和S/2×(T-2N),或S/2×(T-2N)、S/2×(T-2N)、S/2×2N和S/2×2N
(l)在一個示例中,假設2N<S
Figure 108123153-A0305-02-0024-8
2N+1和2M<T
Figure 108123153-A0305-02-0024-9
2M+1,Z可以用QT分割為四個單元,具有大小為2N×2M、2N×2M、(S-2N)×(T-2M)和(S-2N)×(T-2M),或(S-2N)×(T-2M)、(S-2N)×(T-2M)、2N×2M和2N×2M,或2N×(T-2M)、2N×(T-2M)、(S-2N)×2M和(S-2N)×2M,或(S-2N)×2M、(S-2N)×2M、2N×(T-2M)和2N×(T-2M)。
(m)在一個示例中,所有分割單元的寬度/高度應為偶 數。如果一個劃分結構導致單元的寬度或高度為奇數,則自動禁止這樣的劃分結構。
或者,此外,跳過這種劃分結構的信號。
(n)在一個示例中,Z可以用TT分割為三個單元。
在一個示例中,假設3*2N<S<=3*2N+1,三個單元的大小分別為2N×T、2N+1×T和(S-3*2N)×T。
在一個示例中,假設3*2N<T<=3*2N+1,三個單元的大小分別為Sx2N、Sx2N+1和S×(T-3*2N)。
(o)在一個示例中,所有分割單元的寬度和/或高度應為K * M的形式,其中M是允許的編碼單元/預測單元的最小寬度和/或高度,諸如4;K是大於0的整數。如果一個劃分結構導致單元的寬度或高度不是這樣的形式,則自動禁止該劃分結構。
例如,假設劃分結構中分割單元的寬度和高度為W和H,如果W<M或H<M或(W&(M-1)!=0)或(H&(M-1)!=0),則禁止該劃分結構。
或者,此外,跳過這種劃分結構的信號。
或者,所有分割的非ZU的寬度和/或高度應為K*M的形式,其中M是允許的編碼單元/預測單元的最小寬度和/或高度,諸如4。在這種情況下,如果分割的零單元不遵循此限制但非ZU遵循此限制,則仍允許劃分結構。
示例8. ZU的分割信號方法與正常CU的分割信號方法相同。
a.在一個示例中,可以使用不同的上下文來編碼ZU或非ZU。
b.或者,對於ZU,僅允許正常CU的部分分割方法。
i.對ZU所允許的正常CU的分割方法的子集由ZU大小和/或圖片/條帶/片邊界位置(底部、右部、右下部等)和/或條帶類型確定。
ii.在一個示例中,對於ZU只允許QT和BT劃分結構。
iii.或者,此外,在ZU分割資訊中不發訊號通知是否使用TT以及如何使用TT(以及除QT/BT之外的其它種類的劃分結構)。
iv.或者,此外,ZU的分割信號方法仍然與正常CU的分割信號方法保持相同,然而,TT(或其它類型的劃分結構)的指示的上下文可以進一步取決於當前塊是否是ZU。
示例9. 在一個實施例中,寬度和高度均等於(2N×2M)的塊也可以定義為ZU。
(a)在這種情況下,與其它ZU(其中寬度或高度不等於2N)一樣,如第2項所述,不調用變換、逆變換、量化和去量化操作。
(b)假設CU的大小是W×H,則當以下條件成立時,CU被視為ZU,
(i)W>=T0且H>=T1。T0和/或T1是諸如128 或256的整數。
(ii)W>=T0或H>=T1。T0和/或T1是諸如128或256的整數。
(iii)W×H>=T。T是諸如16384或65536的整數。
示例10. 在一個實施例中,ZU必須是幀間編碼的塊。
(a)在一個示例中,ZU只能用於P/B圖片/條帶中。
(b)在一個示例中,對於ZU,不信號通知prediction_mode_flag,並且總是被推斷為被幀間編碼。
(c)在一個示例中,ZU可以與用於運動預測的幾何劃分結合使用(參考[6]),使得幀間預測可以生成更好地適合於視頻的運動和紋理的預測器。
(i)在一個示例中,允許的劃分類型可以取決於父劃分的形狀。例如,如果塊的橫縱比大於或等於4(寬度)比1(高度),應禁止接近水平線的角度。如果橫縱比小於或等於4(寬度)比1(高度),則應禁止接近垂直線的角度。
(ii)在一個示例中,僅Merge模式可用於子運動劃分以節省開銷位元。
(iii)在一個示例中,Merge模式和常規AMVP模式都可用於子運動劃分。是否允許常規AMVP模式也可以通過條帶標頭來信號通知,使得有效編碼模式可以適應於視頻內容。
(d)在一個示例中,可以使用運動單元的更小的組來 更好地預測ZU。例如,可以允許2x2 ATMVP和2x2仿射模式用於ZU。這也有助於當ZU的寬度或高度為2時,最小化角落情況的影響。
示例11. 在一個示例中,ZU必須被劃分為I條帶或幀內編碼的圖片。
(a)在一個示例中,ZU的寬度或高度不是2N的形式。
(b)在一個示例中,當以下條件成立時,CU被視為ZU,
i. W>=T0且H>=T1。T0和/或T1是諸如128或256的整數。
ii. W>=T0或H>=T1。T0和/或T1是諸如128或256的整數。
iii. W×H>=T。T是諸如16384或65536的整數。
示例12. 對於ZU,環路過濾的強度應設置為強。
(a)在一個示例中,用於去方塊(de-blocking)的強濾波器應該被用於ZU。
(b)在一個示例中,強雙邊濾波器應該被用於ZU。
(c)在一個示例中,可以使用運動補償平滑濾波器(例如,重疊塊運動補償)。
示例13. 對於ZU和正常CU,可以以不同方式實現啟用/禁用適應性環路濾波器(ALF)。
(a)在一個示例中,如果CTU是ZU,則整個ZU被控制為整體上進行ALF或不進行ALF,而不是分割成子塊來進行ALF開/關控制。相應地,對於這樣的CTU,僅信號通知一個alf_control_flag。
(b)在另一個示例中,如果CTU是ZU,則ZU被分割為N個子塊以進行ALF開/關控制。該分割不依賴於CTU內的ZU或CU劃分。相應地,對於這樣的CTU,信號通知多個(例如,高達N個)alf_control_flag。
(i)例如,如果CTU大小是W×H,則子塊大小是w×h。
(1)在一個示例中,CTU被分割為(W+w-1)/w列和(H+h-1)/h行的子塊(所有除法均是在C語言中定義的整除)。最後一行/最後一列中的子塊可能比其它塊更小。
(2)在一個示例中,CTU被分割為W/w列和H/h行的子塊(所有除法均是在C語言中定義的整除)。最後一行/最後一列中的子塊可能比其它塊更大。
圖18A和18B示出了將ZU塊劃分成子塊以用於自適應環路控制(ALF)開/關控制的示例。
(c)如果一個ZU位於影像邊界處,則ALF將被自動禁用而無需任何信號通知。
(d)上述方法可以擴展到需要塊級開/關控制標誌的信號通知的其它種類的濾波方法。
示例14. 對於位於影像邊界處的CU/PU/TU,可以自動禁用ALF或需要塊級開/關控制標誌的其它種類的濾波方法。
(a)在這種情況下,對於這些塊的開/關控制標誌的信號被跳過。
上述示例可以結合在下面描述的方法的上下文中--例如,方法1400和1500,其可以在視頻解碼器和/或視頻編解碼器處實現。
圖14示出了用於視頻編碼的示例性方法的流程圖,其可以在視頻編解碼器中實現。方法1400包括,在步驟1410處,確定視頻資料塊的維度。
方法1400包括,在步驟1420處,在確定至少一個維度是非二的冪時,將視頻資料塊作為零單元(ZU)塊來信號通知,其是不可變換的。
在一些實施例中,非二的冪是不能以2N的形式表示的任何非零數字。例如,不包括二的冪的整數(例如,1,3,5,6,7,9,10,11,12,13,14,15,17,18,...)的每個都是非二的冪。
在一些實施例中,可以定義不可變換,使得不對零單元調用變換、逆變換、量化和去量化操作。例如,零單元的不可變換屬性是其被推斷為用跳過模式進行編碼,並且因此,不需要明確地用信號通知跳過模式。在其它實施例中,可以在示例3的上下文中定義不可變換,使得儘管可能存在非零殘差,但對於零單 元沒有定義變換和逆變換操作。
圖15示出了用於視頻編碼的另一示例性方法的流程圖,該方法可以在視頻解碼器中實現。該流程圖包括與圖14中所示並且在上面描述的類似的一些特徵和/或步驟。本章節中可能未單獨描述這些特徵和/或步驟中的至少一些。
方法1500包括,在步驟1510處,接收對應於視頻資料塊的位元流。
方法1500包括,在步驟1520處,接收信號,其指示視頻資料塊是零單元(ZU)塊,該零單元(ZU)塊是不可變換的,並且具有非二的冪的至少一個維度。
方法1500包括,在步驟1530處,基於信號解碼位元流以重建視頻資料塊。
在一些實施例中,方法1400和1500,以及如在示例1的上下文中所描述的,可以進一步包括視頻資料塊的維度是偶數,具有2N形式,或者具有2KN的形式,其中K=1,2,3,4...。在其它實施例中,信號可以不包括合併索引或跳過標記、和/或不包括prediction_mode_flag、和/或包括ZU塊的至少一個維度的最大值或最小值。在示例中,信號在視頻參數集(VPS)、序列參數集(SPS)、圖片參數集(PPS)、條帶標頭、編碼樹單元(CTU)或編碼單元(CU)中。
在一些實施例中,ZU塊的運動資訊從大小為2N×2M的相鄰塊的運動資訊繼承。
在一個實施例中,並且如在示例7的上下文中所描述的,ZU塊被分割為兩個或更多個單元。在示例中,兩個或更多個單元中的至少一個是零單元。在另一個示例中,在兩個或更多個單元中的至少一個是尺寸為2N×2M的編碼單元(CU)。
在一些實施例中,並且如在示例10的上下文中所描述的,ZU塊的環路濾波強度被設置為強。在HEVC標準的示例中,“強”濾波器修改所感興趣畫素的每一側上的三個畫素,而“弱”濾波器修改每一側上的一個或兩個畫素。例如,環路濾波包括雙邊濾波、去方塊濾波和/或使用運動補償的平滑濾波器。
4.所公開的技術的示例實現方式
圖16是示出可以用於實現本公開的技術的各個部分的電腦系統或其它控制設備1600的架構的示例的方塊圖,本公開的技術包括(但不限於)方法1400和1500。在圖16中,電腦系統1600包括經由互連1625連接的一個或多個處理器1605和儲存器1610。互連1625可以代表通過適當的橋接器、適配器連接的任何一個或多個單獨的物理匯流排、點對點連接或兩者。因此,互連1625可以包括例如,系統匯流排、周邊元件連接(PCI)匯流排、雙向傳輸匯流排(HyperTransport)或工業標準架構(ISA)匯流排、小型電腦系統介面(SCSI)匯流排、通用序列匯流排(USB)、IIC(I2C)匯流排或電氣和電子工程師協會(IEEE)標準674匯流排,有時也稱為“Firewire”。
(一個或多個)處理器1605可以包括中央處理單元 (CPU)以控制例如主機電腦的整體操作。在某些實施例中,(一個或多個)處理器1605通過執行儲存器1610中儲存的軟體或韌體來實現這一點。(一個或多個)處理器1605可以是或可以包括一個或多個可程式設計通用或專用微處理器、數位訊號處理器(DSP)、可程式設計控制器、專用積體電路(ASIC)、可程式設計邏輯器件(PLD)等,或這些器件的組合。
儲存器1610可以是或可以包括電腦系統的主儲存器。儲存器1610表示任何合適形式的隨機存取儲存器(RAM)、唯讀儲存器(ROM)、快閃儲存器等,或其組合。在使用中,儲存器1610可以包含機器指令集,當由處理器1605執行該機器指令集時,使得處理器1605進行操作以實現本公開技術的實施例。
通過互連1625也連接到(一個或多個)處理器1605的是(可選的)網路適配器1615。網路適配器1615向電腦系統1600提供與遠端設備通信的能力,遠端設備例如儲存器用戶端和/或其它儲存器伺服器,並且網路適配器1615可以是例如乙太網適配器或光纖通道適配器。
圖17示出了可用於實現本公開技術的各個部分的移動設備1700的示例實施例的方塊圖,包括(但不限於)方法700、750、800、850、900、950、600、1400和1500。移動設備1700可以是膝上型電腦、智慧型電話、平板電腦、可攜式攝像機或能夠處理視頻的其它類型的設備。移動設備1700包括用於處理資料的處理器或控制器1701,以及與處理器1701通信以儲存和/或 緩衝資料的儲存器1702。例如,處理器1701可以包括中央處理單元(CPU)或微控制器單元(MCU)。在一些實現方式中,處理器1701可以包括現場可程式設計閘陣列(FPGA)。在一些實現方式中,移動設備1700包括用於智慧型電話設備的各種可視和/或通信資料處理功能的圖形處理單元(GPU)、視頻處理單元(VPU)和/或無線通訊單元或與之通信。例如,儲存器1702可以包括並儲存處理器可執行代碼,其在由處理器1701執行時配置移動設備1700以執行各種操作,例如接收資訊、命令和/或資料,處理資訊和資料,並且將處理後的資訊/資料發送或提供給諸如致動器或外部顯示器的另一個設備。
為了支援移動設備1700的各種功能,儲存器1702可以儲存資訊和資料,諸如指令、軟體、值、影像以及由處理器1701處理或參考的其它資料。例如,各種類型的隨機存取儲存器(RAM)設備、唯讀儲存器(ROM)設備、快閃儲存器設備和其它合適的儲存介質可已被用於實現儲存器1702的儲存功能。在一些實現方式中,移動設備1700包括輸入/輸出(I/O)單元1703,以將處理器1701和/或儲存器1702與其它模組、單元或設備介面。例如,I/O單元1703可以利用與典型資料通信標準(例如,在雲中的一個或多個電腦與使用者設備之間的)相容的各種類型的無線介面,以將處理器1701與儲存器1702介面。在一些實現方式中,移動設備1700可以經由I/O單元1703使用有線連接與其它設備介面。移動設備1700還可以與其它外部介面(例 如資料儲存器)和/或視覺或音訊顯示裝置1704介面,以取回和傳送資料和資訊,該資料和資訊可由處理器處理、儲存在儲存器中或在顯示裝置1704或外部設備的輸出單元上展示。例如,顯示裝置1704可以顯示包括塊(CU、PU或TU)的視頻幀,該塊基於是否使用運動補償演算法並根據所公開的技術對塊進行編碼來應用塊內複製。
在一些實施例中,視頻解碼器設備可以實現使用如本文中所描述的零單元的方法以用於視頻解碼。該方法的各種特徵可以類似於上述方法1500。
在一些實施例中,視頻解碼方法可以使用解碼設備來實現,該解碼設備在如圖16和圖17中所述的硬體平臺上實現。
可以使用以下示例解決方案的列表來捕獲本文描述的一些實施例。在解決方案中,接收操作可以包括通過網路連接或從儲存位元流的儲存單元(儲存器、光碟驅動器等)接收位元流。
1.一種視頻編碼方法,包括:基於至少一個維度是非二的冪數來確定視頻資料塊是零單元(ZU)塊;回應於確定視頻資料塊是ZU塊,對所有殘差被設為零的ZU塊進行編碼;以及在位元流中信號通知編碼的ZU塊。
2.一種視頻解碼方法,包括:接收對應於視頻資料塊的位元流;由於塊的至少一個維度為非二的冪數,確定視頻資料塊被編碼為所有殘差設為零的零單元(ZU)塊;以及基於決定來解碼視頻資料塊。
3.如解決方案1或2所述的方法,其中,視頻資料塊的維度的任一個是2N形式的偶數。
4.如解決方案1或2所述的方法,其中,視頻資料塊的維度的任一個為2KN形式,其中K是整數。
5.如解決方案1或2所述的方法,其中,不在ZU塊上進行變換操作或逆變換操作。
6.如解決方案1或2所述的方法,其中,不在ZU塊上進行量化操作或去量化操作。
7.如解決方案1或2所述的方法,其中,信號不包括任何指示預測模式的語法元素。
8.如解決方案7所述的方法,其中,推斷ZU塊以Skip模式編碼。
9.如解決方案7或8所述的方法,其中,信號不包括merge索引。
10.如解決方案1或2所述的方法,其中,ZU塊的運動資訊從相鄰塊的運動資訊繼承。
11.如解決方案1或2所述的方法,其中,ZU塊的運動資訊從大小為2N×2M的相鄰塊的運動資訊繼承。
12.如解決方案11所述的方法,其中,相鄰塊的側邊與接觸圖片邊界的ZU塊的側邊平行。
13.如解決方案11所述的方法,其中,ZU塊與相鄰塊具有連續性。
14.如解決方案1或2所述的方法,其中,信號不包括cbf_flag並且ZU塊的cbf_flag被推斷為零。
15.如解決方案1或2所述的方法,其中,信號不包括殘差資訊。
16.如解決方案1或2所述的方法,其中,ZU塊具有殘差並且未在ZU塊上進行變換或逆變換操作。
17.如解決方案1或2所述的方法,其中,用transform-skip模式編碼ZU塊中的殘差。
18.如解決方案1或2所述的方法,其中,信號不包括transform-skip標誌。
19.如解決方案1或2所述的方法,其中,ZU塊是在非對稱二叉樹(ABT)劃分中分割的編碼單元(CU)。
20.如解決方案1或2所述的方法,其中,ZU塊是圖片、條帶或片邊界處的塊。
21.如解決方案1或2所述的方法,其中,在圖片、條帶或片的邊界處的每個編碼單元是ZU塊。
22.如解決方案19所述的方法,其中,信號包括區分CU和ZU塊的標誌。
23.如解決方案1或2所述的方法,其中,信號包括ZU塊的至少一個維度的最大值或最小值。
24.如解決方案23所述的方法,其中,信號在視頻參數集(VPS)、序列參數集(SPS)、圖片參數集(PPS)、條帶標 頭、編碼樹單元(CTU)或編碼單元(CU)中。
25.如解決方案1或2所述的方法,其中,ZU塊可以僅是幀間編碼的塊。
26.如解決方案25所述的方法,其中,ZU塊可以僅在P/B圖片/條帶中使用。
27.如解決方案25所述的方法,其中,信號不包括預測模式標誌。
28.如解決方案25所述的方法,其中,ZU塊結合幾何劃分實現。
29.如解決方案28所述的方法,其中,幾何劃分包括基於父劃分的形狀的劃分。
30.如解決方案28所述的方法,其中,幾何劃分包括僅使用Merge模式。
31.如解決方案28所述的方法,其中,信號包括指示用於自運動劃分的Merge模式或常規AMVP模式的一個的標誌。
32.如解決方案25所述的方法,其中,使用2x2 ATMVP模式預測ZU塊。
33.如解決方案25所述的方法,其中,使用2x2仿射模式預測ZU塊。
如上所述的示例1-7提供了解決方案1至33的附加特徵和變化。
34.一種視頻編碼方法,包括:基於塊的維度是二的冪數,確定視頻資料塊是零單元(ZU)塊;基於決定該塊為ZU 塊,對位元流中的視頻資料塊進行編碼;以及在位元速率中信號通知ZU塊。
35.一種視頻解碼方法,包括:接收對應於視頻資料塊的位元流;基於塊的維度為二的冪數來確定視頻資料塊為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
36.如解決方案34或35所述的方法,其中,不在ZU塊上進行變換操作或逆變換操作。
37.如解決方案34或35所述的方法,其中,不在ZU塊上進行量化操作或去量化操作。
38.如解決方案34到37的任一個所述的方法,其中,確定還包括由於視頻資料塊的樣本的總數大於或等於閾值數T,確定視頻資料塊為ZU塊。
39.如解決方案34到37的任一個所述的方法,其中,確定還包括由於維度進一步大於視頻資料塊的寬度的第一閾值或者視頻資料塊的高度的第二閾值,確定視頻資料塊是ZU塊。
如上所述的示例8提供了解決方案34至39的附加特徵和變化。
40.一種視頻編碼方法,包括:基於具有小於或等於第一整數的寬度並具有小於或等於第二整數的高度來確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將視頻資料塊編碼為ZU塊;以及在位元流中信號通知ZU塊。
41.一種視頻解碼方法,包括:接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於第一整數的寬度並具有大於或等於第二整數的高度來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
42.如解決方案40或41所述的方法,其中,第一整數和第二整數為128或256的一個。
43.一種視頻編碼方法,包括:基於具有大於或等於第一整數的寬度並且具有大於或等於第二整數的高度來確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將視頻資料塊編碼為ZU塊;以及在位元流中信號通知ZU塊。
44.一種視頻解碼方法,包括:接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於第一整數的寬度或具有大於或等於第二整數的高度來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
45.如解決方案43或44所述的方法,其中,第一整數和第二整數為128或256的一個。
46.一種視頻編碼方法,包括:基於具有大於或等於整數的寬度和高度的乘積來確定具該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將視頻資料 塊編碼為ZU塊;以及在位元流中信號通知ZU塊。
47.一種視頻解碼方法,包括:接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於整數的寬度和高度的乘積來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於信號解碼位元流以重建視頻資料塊。
48.如解決方案46或47所述的方法,其中,整數是16384或65536的一個。
如上所述的示例1-8提供了解決方案40至48的附加特徵和變化。
49.一種視頻系統中的裝置,包括處理器和其上具有指令的非暫態性的儲存器,其中,當由處理器執行指令時,使得處理器實現如解決方案1到48中的任一個所述的方法。
50.一種儲存在非暫態性的電腦可讀介質上的電腦程式產品,電腦程式產品包括用於執行解決方案1到48中的任一個中的方法的程式碼。
51.如本文件中所描述的方法、裝置或系統。
從前述內容可以理解,本文已經出於說明的目的描述了本公開技術的具體實施例,但是可以在不脫離本發明範圍的情況下進行各種修改。因此,本公開的技術除了所附申請專利範圍外不受限制。
本專利文件中描述的主題和功能操作的實現方式可以以各種系統、數位電子電路實現,或者以電腦軟體、韌體或硬體實 現,包括說明書中公開的結構及其結構等同物,或者以它們中的一個或多個的組合實現。公開和其它實施例可以實現為一個或多個電腦程式產品,即,在有形且非暫態性的電腦可讀介質上編碼的一個或多個電腦程式指令模組,用於由資料處理裝置執行或控制資料處理裝置的操作。電腦可讀介質可以是機器可讀存放裝置、機器可讀儲存基板、儲存器設備、影響機器可讀傳播訊號的物質組合、或者它們中的一個或多個的組合。術語“資料處理單元”或“資料處理裝置”涵蓋用於處理資料的所有裝置、設備和機器,包括例如可程式設計處理器、電腦或多個處理器或電腦。除了硬體之外,該裝置還可以包括為所討論的電腦程式創建執行環境的代碼,例如,構成處理器韌體、協定棧、資料庫管理系統、作業系統、或者它們中的一個或多個的組合的代碼。
電腦程式(也稱為程式、軟體、軟體應用、腳本或代碼)可以用任何形式的程式設計語言編寫,包括編譯或解釋語言,並且可以以任何形式來部署電腦程式,包括獨立程式或適合在計算環境中使用的模組、元件、子常式或其它單元。電腦程式並不必需對應於檔案系統中的文件。程式可以儲存在文件的保存其它程式或資料(例如,儲存在標記語言文件中的一個或多個腳本)的部分中,儲存在專用於所討論的程式的單個文件中,或儲存在多個協調文件中(例如,儲存一個或多個模組、副程式或代碼部分的文件)。可以部署電腦程式以在一個電腦上或在位於一個網站上或分佈在多個網站上並通過通信網路互連的多個電腦上 執行。
本說明書中描述的過程和邏輯流程可以由執行一個或多個電腦程式的一個或多個可程式設計處理器執行,以通過對輸入資料進行操作並生成輸出來執行功能。過程和邏輯流程也可以由專用邏輯電路執行,並且裝置也可以實現為專用邏輯電路,例如FPGA(現場可程式設計閘陣列)或ASIC(專用積體電路)。
舉例來說,適合於執行電腦程式的處理器包括通用和專用微處理器、以及任何種類的數位電腦的任何一個或多個處理器。通常,處理器將從唯讀儲存器或隨機存取儲存器或兩者接收指令和資料。電腦的基本元件是用於執行指令的處理器和用於儲存指令和資料的一個或多個儲存器設備。通常,電腦還將包括或可操作地耦合到用於儲存資料的一個或多個大型存放區設備,例如磁片、磁光碟或光碟,以從該一個或多個大型存放區設備接收資料,或將資料傳輸到該一個或多個大型存放區設備,或者既接收又傳遞資料。然而,電腦不需要具有這樣的設備。適用於儲存電腦程式指令和資料的電腦可讀介質包括所有形式的非揮發性儲存器、介質和儲存器設備,包括例如半導體儲存器設備,例如EPROM、EEPROM和快閃儲存器設備。處理器和儲存器可以由專用邏輯電路補充或併入專用邏輯電路中。
說明書和附圖旨在被認為僅是示例性的,其中示例性意味著示例。如這裡所使用的,單數形式的“一”,“一個”和“該”旨在也包括複數形式,除非上下文另有明確說明。另外,除非上下 文另有明確說明,否則“或”的使用旨在包括“和/或”。
雖然本專利文件包含許多細節,但這些細節不應被解釋為對任何發明或可要求保護的範圍的限制,而是作為特定於特定發明的特定實施例的特徵的描述。在本專利文件中,在單獨的實施例的上下文中描述的某些特徵也可以在單個實施例中組合實現。相反,在單個實施例的上下文中描述的各種特徵也可以單獨地或以任何合適的子組合在多個實施例中實現。此外,儘管上面的特徵可以描述為以某些組合起作用並且甚至最初如此要求權利保護,但是在某些情況下,可以從所要求保護的組合中去除來自該組合的一個或多個特徵,並且所要求保護的組合可以指向子組合或子組合的變型。
類似地,雖然在附圖中以特定順序描繪了操作,但是這不應該被理解為要求以所示的特定順序或按循序執行這樣的操作,或者執行所有示出的操作,以實現期望的結果。此外,在本專利文件中描述的實施例中的各種系統元件的分離不應被理解為在所有實施例中都要求這種分離。
僅描述了幾個實現方式和示例,並且可以基於本專利文件中描述和示出的內容來做出其它實現方式、增強和變型。
1400‧‧‧方法
1410、1420‧‧‧步驟

Claims (48)

  1. 一種視頻編碼方法,包括:基於至少一個維度是非二的冪數來確定視頻資料塊是零單元(ZU)塊,其中,不對所述ZU塊執行變換操作或逆變換操作;回應於確定所述視頻資料塊是ZU塊,對所有殘差被設為零的所述ZU塊進行編碼;以及在位元流中信號通知被編碼的ZU塊。
  2. 一種視頻解碼方法,包括:接收對應於視頻資料塊的位元流;由於所述塊的至少一個維度為非二的冪數,確定所述視頻資料塊被編碼為所有殘差設為零的零單元(ZU)塊,其中,不對所述ZU塊執行變換操作或逆變換操作;以及基於所述決定解碼所述塊。
  3. 如申請專利範圍第1或2項所述的方法,其中,所述視頻資料塊的維度的任一個是2N形式的偶數。
  4. 如申請專利範圍第1或2項所述的方法,其中,所述視頻資料塊的維度的任一個為2KN形式,其中K是整數。
  5. 如申請專利範圍第1或2項所述的方法,其中,不對所述ZU塊執行量化操作或去量化操作。
  6. 如申請專利範圍第1或2項所述的方法,其中,所述信號不包括任何指示預測模式的語法元素。
  7. 如申請專利範圍第6項所述的方法,其中,推斷所述ZU塊以Skip模式編碼。
  8. 如申請專利範圍第6項所述的方法,其中,所述信號不包括merge索引。
  9. 如申請專利範圍第1或2項所述的方法,其中,所述ZU塊的運動資訊從相鄰塊的運動資訊繼承。
  10. 如申請專利範圍第1或2項所述的方法,其中,所述ZU塊的運動資訊從大小為2N×2M的相鄰塊的運動資訊繼承。
  11. 如申請專利範圍第10項所述的方法,其中,所述相鄰塊的側邊與接觸圖片邊界的所述ZU塊的側邊平行。
  12. 如申請專利範圍第10項所述的方法,其中,所述ZU塊與所述相鄰塊具有連續性。
  13. 如申請專利範圍第1或2項所述的方法,其中,所述信號不包括cbf_flag並且所述ZU塊的cbf_flag被推斷為零。
  14. 如申請專利範圍第1或2項所述的方法,其中,所述信號不包括殘差資訊。
  15. 如申請專利範圍第1或2項所述的方法,其中,所述ZU塊具有殘差並且未對所述ZU塊執行變換或逆變換操作。
  16. 如申請專利範圍第1或2項所述的方法,其中,用變換跳過(transform-skip)模式編碼所述ZU塊中的殘差。
  17. 如申請專利範圍第1或2項所述的方法,其中,所述信號不包括transform-skip標誌。
  18. 如申請專利範圍第1或2項所述的方法,其中,所述ZU塊是在非對稱二叉樹(ABT)劃分中分割的編碼單元(CU)。
  19. 如申請專利範圍第1或2項所述的方法,其中,所述ZU塊是圖片、條帶或片的邊界處的塊。
  20. 如申請專利範圍第1或2項所述的方法,其中,在圖片、條帶或片的邊界處的每個編碼單元是ZU塊。
  21. 如申請專利範圍第18項所述的方法,其中,所述信號包括區分所述CU和所述ZU塊的標誌。
  22. 如申請專利範圍第1或2項所述的方法,其中,所述信號包括所述ZU塊的至少一個維度的最大值或最小值。
  23. 如申請專利範圍第22項所述的方法,其中,所述信號在視頻參數集(VPS)、序列參數集(SPS)、圖片參數集(PPS)、條帶標頭、編碼樹單元(CTU)或編碼單元(CU)中。
  24. 如申請專利範圍第1或2項所述的方法,其中,所述ZU塊可以僅是幀間編碼的塊。
  25. 如申請專利範圍第24項所述的方法,其中,所述ZU塊可以僅在P/B圖片/條帶中使用。
  26. 如申請專利範圍第24項所述的方法,其中,所述信號不包括預測模式標誌。
  27. 如申請專利範圍第24項所述的方法,其中,所述ZU塊結合幾何劃分實現。
  28. 如申請專利範圍第27項所述的方法,其中,所述幾何劃分包括基於父劃分的形狀的劃分。
  29. 如申請專利範圍第27項所述的方法,其中,所述幾何劃分包括僅使用Merge模式。
  30. 如申請專利範圍第27項所述的方法,其中,所述信號包括指示用於子運動劃分的Merge模式或常規AMVP模式之一的標誌。
  31. 如申請專利範圍第24項所述的方法,其中,使用2x2 ATMVP模式預測所述ZU塊。
  32. 如申請專利範圍第24項所述的方法,其中,使用2x2仿射模式預測所述ZU塊。
  33. 一種視頻編碼方法,包括:基於塊的維度是二的冪數,確定視頻資料塊是零單元(ZU)塊;基於決定該塊為ZU塊,對位元流中的所述視頻資料塊進行編碼;以及在位元速率中信號通知所述ZU塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  34. 一種視頻解碼方法,包括:接收對應於視頻資料塊的位元流;基於所述塊的維度為二的冪數來確定所述視頻資料塊為零單元(ZU)塊;以及 基於所述信號解碼所述位元流以重建所述視頻資料塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  35. 如申請專利範圍第33或34項所述的方法,其中,不對所述ZU塊執行量化操作或去量化操作。
  36. 如申請專利範圍第33或34項所述的方法,其中,所述確定還包括由於所述視頻資料塊的樣本的總數大於或等於閾值數T,確定所述視頻資料塊為所述ZU塊。
  37. 如申請專利範圍第33或34項所述的方法,其中,所述確定還包括由於所述維度進一步大於所述視頻資料塊的寬度的第一閾值或者所述視頻資料塊的高度的第二閾值,確定所述視頻資料塊是所述ZU塊。
  38. 一種視頻編碼方法,包括:基於具有小於或等於第一整數的寬度並具有小於或等於第二整數的高度來確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將所述視頻資料塊編碼為ZU塊;以及在位元流中信號通知所述ZU塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  39. 一種視頻解碼方法,包括:接收對應於具有寬度和高度的視頻資料塊的位元流; 基於具有大於或等於第一整數的寬度並具有大於或等於第二整數的高度來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於所述信號解碼所述位元流以重建所述視頻資料塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  40. 如申請專利範圍第38或39項所述的方法,其中,所述第一整數和所述第二整數為128或256的一個。
  41. 一種視頻編碼方法,包括:基於具有大於或等於第一整數的寬度並且具有大於或等於第二整數的高度來確定具有該寬度和高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將所述視頻資料塊編碼為ZU塊;以及在位元流中信號通知所述ZU塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  42. 一種視頻解碼方法,包括:接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於第一整數的寬度或具有大於或等於第二整數的高度來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於所述信號解碼所述位元流以重建所述視頻資料塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  43. 如申請專利範圍第41或42項所述的方法,其中,所述第一整數和所述第二整數為128或256的一個。
  44. 一種視頻編碼方法,包括:基於具有大於或等於整數的寬度和高度的乘積,確定具有所述寬度和所述高度的視頻資料塊將被編碼為零單元(ZU)塊,基於決定該塊為ZU塊,將所述視頻資料塊編碼為ZU塊;以及在位元流中信號通知所述ZU塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  45. 一種視頻解碼方法,包括:接收對應於具有寬度和高度的視頻資料塊的位元流;基於具有大於或等於整數的所述寬度和所述高度的乘積來確定視頻資料塊將被解碼為零單元(ZU)塊;以及基於所述信號解碼所述位元流以重建所述視頻資料塊,其中,不對所述ZU塊執行變換操作或逆變換操作。
  46. 如申請專利範圍第44或45項所述的方法,其中,所述整數是16384或65536中的一個。
  47. 一種視頻系統中的裝置,包括處理器和其上具有指令的非暫態性的儲存器,其中,當所述指令由所述處理器執行時,使得所述處理器實現如申請專利範圍第1到46項中的任一項所述的方法。
  48. 一種儲存在非暫態性的電腦可讀介質上的電腦程式產品,所述電腦程式產品包括用於執行如申請專利範圍第1到46項中的任一項所述的方法的程式碼。
TW108123153A 2018-06-29 2019-07-01 零單元的定義 TWI714153B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
WOPCT/CN2018/093631 2018-06-29
CN2018093631 2018-06-29
US201862693415P 2018-07-02 2018-07-02
US62/693,415 2018-07-02

Publications (2)

Publication Number Publication Date
TW202002630A TW202002630A (zh) 2020-01-01
TWI714153B true TWI714153B (zh) 2020-12-21

Family

ID=67226318

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108123153A TWI714153B (zh) 2018-06-29 2019-07-01 零單元的定義

Country Status (3)

Country Link
CN (1) CN110662050B (zh)
TW (1) TWI714153B (zh)
WO (1) WO2020003268A2 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112640460B (zh) * 2018-08-29 2024-05-03 华为技术有限公司 用于边界划分的装置及方法
CN117044213A (zh) * 2021-02-23 2023-11-10 抖音视界有限公司 对非二元块的变换与量化
WO2022218280A1 (en) * 2021-04-12 2022-10-20 Beijing Bytedance Network Technology Co., Ltd. Transforms and sign prediction

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103004192A (zh) * 2010-07-15 2013-03-27 高通股份有限公司 用于视频译码中的固定点变换的可变局部位深增加
CN105103549A (zh) * 2013-04-08 2015-11-25 索尼公司 根据重要系数的参数的重要系数编码和解码
US20180109812A1 (en) * 2016-10-14 2018-04-19 Media Tek Inc. Block partitioning using tree structures

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2018013461A (es) * 2016-05-13 2019-03-28 Sony Corp Aparato y metodo de procesamiento de imagenes.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103004192A (zh) * 2010-07-15 2013-03-27 高通股份有限公司 用于视频译码中的固定点变换的可变局部位深增加
CN105103549A (zh) * 2013-04-08 2015-11-25 索尼公司 根据重要系数的参数的重要系数编码和解码
US20180109812A1 (en) * 2016-10-14 2018-04-19 Media Tek Inc. Block partitioning using tree structures

Also Published As

Publication number Publication date
CN110662050B (zh) 2022-06-14
WO2020003268A3 (en) 2020-02-27
TW202002630A (zh) 2020-01-01
WO2020003268A2 (en) 2020-01-02
US20210120233A1 (en) 2021-04-22
CN110662050A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
TWI723433B (zh) 改進的邊界分割
TWI815927B (zh) 視頻編解碼的塊尺寸限制
TWI759604B (zh) 廣義三叉樹
US20180139453A1 (en) Method of processing video signal and device for same
TWI714153B (zh) 零單元的定義
TWI707576B (zh) 用於微塊的約束
TWI719520B (zh) 零單元的濾波
TWI707580B (zh) 零單元的劃分
US12034911B2 (en) Definition of zero unit