TW202114428A

TW202114428A - 編碼樹分割

Info

Publication number: TW202114428A
Application number: TW109126517A
Authority: TW
Inventors: 坦吉波里爾; 法蘭克加平; 法布里斯厄班; 法布里斯里林奈克; 菲利浦拉蘭吉
Original assignee: 法商內數位Ｖｃ控股法國公司
Priority date: 2019-09-23
Filing date: 2020-08-05
Publication date: 2021-04-01
Also published as: KR20220061948A; US20220321883A1; WO2021058380A1; MX2022003469A; AU2020354401A1; JP2023501026A; EP4035364A1; CN114175642A

Abstract

為了編碼一畫面，畫面中的編碼樹單元(coding tree unit，CTU)被四元樹結構分割，且四元樹葉節點可以被多類型樹(multi-type tree，MTT)結構進一步分割。為了增加可到達編碼樹節點與葉之集合，吾等提出增加最大允許MTT階層深度到CTU大小與最小可允許CU大小之間的差值之兩倍。可對所有QT層級指定最大允許MTT階層深度，以在拆分樹中提供更高的靈活性。替代地，只有發訊兩個層級之最大允許MTT深度：當QT拆分被允許時，發訊一個層級；而當沒有更多QT拆分被允許時，發訊另一個層級。此外，基於編碼樹單元大小或最大允許變換大小，可對最小允許的編碼區塊大小設定上界。

Description

編碼樹分割

本實施例一般相關於用於在視訊編碼或解碼中將編碼樹分割之方法與設備。

為了達到高壓縮效率，影像與視訊編碼方案通常採用預測與變換，以利用視訊內容中的空間與時間冗餘。一般而言，使用框內(intra)或框間預測(inter prediction)來利用框內或框間畫面相關性(correlation)，接著，將原始區塊與預測區塊之間的差值(通常被表示成預測誤差(prediction error)或預測殘差(prediction residual))變換、量化與熵編碼。為了重建視訊，壓縮資料被與熵編碼、量化、變換與預測對應之反向處理進行解碼。

為了編碼一畫面，畫面中的編碼樹單元(coding tree unit，CTU)被四元樹結構分割，且四元樹葉節點可以被多類型樹(multi-type tree，MTT)結構進一步分割。為了增加可到達編碼樹節點與葉之集合，吾等提出增加最大允許MTT階層深度到CTU大小與最小可允許CU大小之間的差值之兩倍。可對所有QT層級指定最大允許MTT階層深度，以在拆分樹中提供更高的靈活性。替代地，只有發訊兩個層級之最大允許MTT深度：當QT拆分被允許時，發訊一個層級；而當沒有更多QT拆分被允許時，發訊另一個層級。此外，基於編碼樹單元大小或最大允許變換大小，可對最小允許的編碼區塊大小設定上界(uppder bound)。此外，可使用旗標來指示針對MTT是否允許二元樹(binary tree，BT)以及是否賦能三元樹(ternary tree，TT)。針對框內/框間切片與亮度/色度分量，指示是否賦能BT或TT之旗標可以被個別傳送。

圖1描繪系統實例之方塊圖，其中在該系統內可實作各種態樣與實施例。系統100可實作成包括下述各種組件且被組態以執行本申請案中所述一或多態樣之裝置。此種裝置之實例包括但不限於諸如個人電腦、膝上型電腦、智慧型電話、平板電腦、數位多媒體機上盒、數位電視接收器、個人視訊記錄系統、連接家用設備與伺服器等各種電子裝置。系統100之元件(單一或組合)可實作在單一積體電路、多IC及/或離散組件中。舉例而言，在至少一實施例中，系統100之處理與編碼器/解碼器元件經分配橫跨多IC及/或離散組件。在各種實施例中，經由例如通訊匯流排或通過專用輸入及/或輸出埠等，系統100通訊耦接到其他系統或到其他電子裝置。在各種實施例中，系統100經組態以實作本申請案中所述一或多態樣。

系統100包括至少一處理器110，該處理器經組態以執行載入該處理器內用於實作例如本申請案所述各種態樣之指令。處理器110可包括嵌入式記憶體、輸入輸出介面、以及該技藝中習知各種其他電路。系統100包括至少一記憶體120(例如，揮發性記憶體裝置及/或非揮發性記憶體裝置)。系統100包括儲存裝置140，該儲存裝置包括非揮發性記憶體及/或揮發性記憶體，該記憶體包括但不限於EEPROM、ROM、PROM、RAM、DRAM、SRAM、快閃記憶體、磁性磁碟驅動機、及/或光碟驅動機。作為非限制性實例，儲存裝置140可包括內部儲存裝置、附接儲存裝置、及/或網路可存取儲存裝置。

系統100包括編碼器/解碼器模組130，該編碼器/解碼器模組例如經組態以處理資料並提供編碼的視訊或解碼的視訊，以及該編碼器/解碼器模組130可包括其自身處理器與記憶體。編碼器/解碼器模組130表示可包括在裝置中以執行編碼及/或解碼功能的(一或多)模組。如已知，一裝置可包括編碼與解碼模組之一或兩者。額外地，編碼器/解碼器模組130可實作成系統100之單獨元件，或者可以被結合於處理器110內作為該技術領域中具有通常知識者所習知的硬體與軟體之組合。

要被載入到處理器110上或編碼器/解碼器130並用以執行本申請案中所述各種態樣之程式碼可以被儲存於儲存裝置140中並在由處理器110執行其時被接續載入記憶體120上。根據各種實施例，處理器110、記憶體120、儲存裝置140、以及編碼器/解碼器模組130中一或多者可儲存在本申請案中所述處理的執行期間的一或多各種項目(item)。此種儲存項目可包括，但不限於，輸入視訊、解碼的視訊或解碼的視訊之部分、位元流、矩陣、變數、以及方程式、公式、操作與操作邏輯之處理的中間或最終結果。

在些許實施例中，處理器110及/或編碼器/解碼器模組130內的記憶體被用以儲存指令並用以提供用於處理之工作記憶體，該工作記憶體在編碼或解碼期間是必須的。然而，在其他實施例中，在處理裝置(例如，該處理裝置可以是處理器110或編碼器/解碼器模組130之任一者)外部之記憶體被使用於此等功能中一或多者。外部記憶體可以是例如動態揮發性記憶體及/或非揮發性快閃記憶體等記憶體120及/或儲存裝置140。在些許實施例中，外部非揮發性快閃記憶體被用以儲存電視機之作業系統。在至少一實施例中，諸如RAM的快速外部動態揮發性記憶體被用作針對視訊編碼與解碼操作(諸如，MPEG-2、HEVC或VVC)之工作記憶體。

對系統100元件之輸入可以透過在區塊105中所指示的各種輸入裝置而提供。此種輸入裝置包括，但不限於：(i)RF部分，其接收例如由廣播器空中傳輸之RF訊號；(ii)複合輸入端子；(iii)USB輸入端子；及/或(iv)HDMI輸入端子。

在各種實施例中，區塊105之輸入裝置具有該技藝中習知的相關聯各別的輸入處理元件。舉例而言，RF部分可與適用於執行下述者之元件相關：(i)選擇期望的頻率(亦稱作選擇訊號、或將訊號頻帶限制到一頻帶)；(ii)降轉換所選訊號；(iii)再次頻帶限制到較窄頻帶，以選擇(例如)其可在特定實施例中被稱為通道(channel)之訊號頻帶；(iv)解調該降轉換與頻帶限制之訊號；(v)執行誤差校正；以及(vi)解多工以選擇期望的資料封包流。各種實施例之RF部分包括一或多元件，以執行例如頻率選擇器、訊號選擇器、頻帶限制器、通道選擇器、濾波器、降轉換器、解調器、誤差校正器、以及解多工器之此等功能。RF部分可包括執行調諧器，其執行此等功能中各式功能，包括例如將接收到訊號降轉換到較低頻率(例如，中間頻率或近基頻頻率)或到基頻。在一機上盒實施例中，RF部分與其相關聯輸入處理元件接收透過線路(例如電纜)媒體傳輸之RF訊號，並透過濾波、降轉換、以及再次濾波到期望的頻帶以執行頻率選擇。各種實施例重新配置上述(以及其他)元件之順序，移除此等元件中若干者，及/或新增其他執行相似或不同功能之元件。新增元件可包括在現存元件之間***元件，例如***放大器與類比到數位轉換器。在各種實施例中，RF部分包括天線。

額外地，USB及/或HDMI端子可包括各別的介面處理器，用於將系統100連接到跨USB及/或HDMI連接之其他電子裝置。應瞭解，輸入處理之各種態樣(例如，里德-索羅門誤差校正)可以視需求被實作於例如單獨的輸入處理IC內或在處理器110內。相似的，USB或HDMI介面處理之態樣可以視需求被實作於單獨的介面IC內或在處理器110內。該解調、誤差校正、以及解多工的串流被提供到各種處理元件，包括例如被提供到處理器110、以及結合記憶體與儲存器元件操作之編碼器/解碼器130，以視需求處理該資料流用於在輸出裝置上呈現。

系統100之各種元件可以被設置在整合殼體內，在該整合殼體內各種元件可使用適當連接配置115(例如該技藝中習知內部匯流排，包括I2C匯流排、佈線與印刷電路板)來互連並在其間傳輸資料。

系統100包括賦能經由通訊通道190來與其他裝置通訊之通訊介面150。通訊介面150可包括，但不限於，經組態以透過通訊通道190傳輸與接收資料之收發器。通訊介面150可包括，但不限於，數據機或網路卡，以及通訊通道190可例如被實作在有線及/或無線媒體中。

在各種實施例中，透過使用諸如IEEE 802.11之Wi-Fi網路來將資料串流到系統100。此等實施例之Wi-Fi訊號透過通訊通道190與適應於Wi-Fi通訊之通訊介面150以被接收。此等實施例之通訊通道190典型上連接到存取點或路由器，該存取點或路由器提供到諸如網際網路等外部網路之存取以用於允許串流應用與其他頂層通訊。其他實施例透過使用機上盒將串流資料提供到系統100，該機上盒透過輸入區塊105之HDMI連接來傳遞資料。仍，其他實施例透過使用輸入區塊105之RF連接將串流資料提供到系統100。

系統100可提供輸出訊號到各種輸出裝置，包括顯示器165、揚聲器175、以及其他週邊裝置185。在各種實施例之實例中，其他的週邊裝置185包括獨立DVR、碟片播放器、音響系統、照明系統，以及其他基於系統100輸出提供功能之裝置等中一或多者。在各種實施例中，透過使用AV.Link、CEC、或其他無論有無使用者介入皆賦能裝置對裝置控制之通訊協定，在系統100與顯示器165、揚聲器175、或其他週邊裝置185之間通訊控制訊號。經由禿過各別的介面160、170與180之專用連接，輸出裝置可通訊耦接到系統100。替代地，透過使用通訊通道190經由通訊介面150，輸出裝置可連接到系統100。顯示器165與揚聲器175可以與系統100中的其他組件被整合於電子裝置(例如電視機)之單一單元中。在各種實施例中，顯示器介面160包括顯示器驅動器，例如計時控制器(T Con)晶片。

替代地，若輸入105之RF部分是單獨機上盒之部分，舉例而言，則顯示器165與揚聲器175可分離自一或多其他組件。在各種其中顯示器165與揚聲器175為外部組件之實施例中，輸出訊號可經由專用輸出連接(包括例如，HDMI埠、USB埠、或COMP輸出)而被提供。

圖2描繪例示性視訊編碼器200，諸如高效率視訊編碼(HEVC)編碼器。圖2亦描繪其中有對HEVC標準改善之編碼器或採用相似於HEVC的技術之編碼器，諸如受JVET(聯合視訊探索小組)研發之VVC(多功能視訊編碼)編碼器。

在本申請案中，術語「重建」與「解碼的」可交替使用，術語「編碼的」與「編碼」可交替使用，以及術語「影像」、「畫面」與「訊框」可交替使用。通常，但並非必須，在編碼器側使用術語「重建」而在解碼器測使用「解碼的」。

在經編碼之前，視訊序列可通過預編碼處理(201)，例如，對輸入顏色畫面應用顏色轉換(例如，從RGB 4：4：4變換成YCbCr 4：2：0)，或執行輸入畫面分量之重映射以獲得更具壓縮靈活性(例如，使用顏色分量之一的長條圖等效化)之訊號分佈。元資料可與預處理相關聯，並且被附加到位元流。

為了編碼具有一或多畫面之視訊序列，畫面被例如分割(202)成一或多切片，其中各切片可包括一或多切片片段。在HEVC中，切片片段被組織成編碼單元，預測單元與變換單元。HEVC規範區別化「區塊」與「單元」，其中「區塊」指向樣本陣列(例如，亮度，Y)中特定區域，且「單元」包括並置區塊之所有編碼的顏色分量(Y，Cb，Cr或單色)、語法元素與預測資料(與區塊相關聯(例如，運動向量))。

針對根據HEVC之編碼，畫面被分割成方形形狀且具有可組態大小(典型上為64x64、128x128或256x256像素)之編碼樹區塊(coding tree block，CTB)，以及連續集合之編碼樹區塊被劃群組成一切片。編碼樹單元(Coding Tree Unit，CTU)(亦被稱為最大編碼單元(Largest Coding Unit，LCU))包含編碼的顏色分量之CTB。CTB(亦被稱為最大編碼區塊(LCB))是如圖4所描繪四元樹之根，該四元樹分割成編碼區塊(Coding Block，CB)，以及編碼區塊可被分割成一或多預測區塊(Prediction Block，PB)並形成四元樹之根，該四元樹分割成變換區塊(Transform Block，TB)，如圖5所描繪。

對應於編碼區塊、預測區塊與變換區塊，編碼單元(Coding Unit，CU)包括預測單元(Prediction Unit，PU)與樹狀結構之集合的變換單元(Transform Unit，TU)，PU包括針對所有顏色分量之預測資訊，以及TU包括針對各顏色分量之殘差編碼語法結構。亮度分量之CB、PB、與TB之大小適用於對應CU、PU、與TU。在本申請案中，術語「區塊」可用以參照例如CTU、CU、PU、TU、CB、PB與TB之任意者。此外，術語「區塊」亦可用以指稱巨集區塊以及分割被指定於H.264/AVC中或其他視訊編碼標準中，且更一般而言指稱各種大小之資料的陣列。

在編碼器200中，透過下述編碼器元件將畫面進行編碼。將被編碼的畫面以例如CU之單元進行處理。各編碼單元是透過使用框內或框間模式而進行編碼。當編碼單元是在框內模式中進行編碼時，其執行框內預測(260)。在框間模式中，執行運動估計(275)與補償(270)。編碼器決定(205)要使用框內模式或框間模式用於將編碼單元編碼，並透過預測模式旗標指示框內/框間決策。預測殘差是透過從原始影像區塊減去(210)預測區塊來計算出。

預測殘差接著被變換(225)與量化(230)。量化的變換係數(以及運動向量與其他語法元素)被熵編碼(245)，以輸出位元流。作為非限制實例，基於情境之適應性二元算數編碼(context-based adaptive binary arithmetic coding，CABAC)可用以將語法元素編碼到位元流中。

編碼器也可跳過變換並直接對未變換殘差訊號，例如基於4x4 TU，應用量化。編碼器也可旁路變換與量化兩者，亦即，殘差被直接編碼而無應用變換或量化處理。在直接PCM編碼中，沒有應用預測且編碼單元樣本被直接編碼到位元流中。

編碼器將編碼的區塊進行解碼，以提供用於進一步預測之參考。量化的變換係數被反量化(240)與反變換(250)以將預測殘差解碼。結合(255)該解碼的預測殘差與預測區塊，得以重建出影像區塊。迴路內濾波器(265)被應用到重建的畫面，例如以執行去區塊/SAO(樣本適應性偏移)濾波以降低編碼失真(artifact)。濾波的影像被儲存在參考畫面緩衝器(280)中。

圖3描繪例示性視訊解碼器300(諸如HEVC解碼器)之方塊圖。在編碼器300中，透過下述解碼器元件將位元流進行解碼。視訊解碼器300通常執行與圖2所述之編碼遍歷相互對應之解碼遍歷，其中該解碼器執行視訊解碼作為編碼視訊資料之一部分。圖3亦描繪其中有對HEVC標準改善之解碼器或採用相似於HEVC的技術之解碼器，諸如VVC解碼器。

明確而言，解碼器之輸入包括視訊位元流，該視訊位元流由視訊編碼器200所產生。位元流首先被熵解碼(330)，以獲得變換係數、運動向量、畫面分割資訊以及其他的編碼資訊。畫面分割資訊指示畫面是如何被分割，例如指示CTU大小、以及CTU被拆分成CU之方式、以及在可應用處還可指示劃分成PU之方式。根據解碼的畫面分割資訊，解碼器可因此例如將畫面劃分(335)成CTU，以及將各CTU劃分成CU。變換係數被反量化(340)與反變換(350)以將預測殘差解碼。

結合(355)該解碼的預測殘差與預測區塊，得以重建出影像區塊。可從框內預測(360)或運動補償預測(亦即，框間預測)(375)，獲得(370)預測區塊。迴路內濾波器(365)被應用到重建的影像。濾波的影像被儲存在參考畫面緩衝器(380)中。

解碼的畫面可進一步進入解碼後處理(385)，例如，反向顏色變換(例如，從YCbCr 4：2：0轉換成RGB 4：4：4)或執行預編碼處理(201)中執行的重映射處理的反向操作之反向重映射。解碼後處理可使用在預編碼處理中導出並在位元流中發訊之元資料。

VVC中新視訊壓縮工具包括壓縮域中的編碼樹單元表示法，其可以更有靈活性的方式表示畫面資料。在VVC中，使用二元和三元拆分分割結構的帶有巢套多類型樹(multi-type tree，MTT)的四元樹取代了多個分區單元類型的概念，亦即，VVC除去了CU、PU和TU概念的分隔，但在幾種特殊情況下除外。在VVC編碼樹結構中－CU可具有方形或矩形形狀。編碼樹單元(coding tree unit，CTU)先被四元樹結構分割。接著四元樹葉節點可以被多類型樹進一步分割。

明確而言，CTU之樹分解分為不同階段：首先，以四元樹方式拆分CTU，接著，各四元樹葉可被進一步以二元或三元方式劃分。這亦描繪於圖6右側，其中實線表示四元樹分解相位且虛線表示二元分解，其中該二元分解被空間嵌入於四元樹葉中。在框內切片中，當啟用雙樹模式時，亮度與色度區塊分割結構是分離的且被獨立決定。

如圖7所示，在多類型樹結構中有四種拆分類型，包括垂直二元拆分(vertical binary splitting，VER)、水平二元拆分(horizontal binary splitting，HOR)、垂直三元拆分(vertical ternary splitting，VER_TRIPLE)、以及水平三元拆分(horizontal ternary splitting，HOR_TRIPLE)。HOR_TRIPLE或VER_TRIPLE拆分(水平或垂直三元組樹拆分模式)包括將編碼單元(CU)劃分成3個次編碼單元(sub-CU)，其個別大小等於在考慮空間劃分方向中的上代CU大小之¼、½、¼。

多類型樹葉節點被稱作編碼單元(CU)，以及除了些許特殊狀況外，此等分割被用於預測與變換處理而無任何進一步分割。該例外情況發生條件如以下所述： - 若CU在寬度或高度方面大於64，則執行將CU分塊成具有與最大支援變換大小相等的大小之TU。典型上，最大變換大小可等於64。 - 若框內CU被編碼於ISP(intra sub-partition，框內次分割)模式中，則CU被拆分成2或4個變換單元，其取決於所用ISP模式之類型以及CU之形狀。 - 若框間CU被編碼於SBT(sub-block transform，次區塊變換)模式中，則CU被拆分成2個變換單元，其中一個產生TU具有必須等於零之殘差資料。 - 若框間CU被編碼於三角形預測合併(Triangle Prediction Merge，TPM)模式中時，CU事由2個三角形預測單元所構成，其中各PU被指定有其特有的運動資料。

根據VVC草案6，與拆分相關的語法被編碼於序列參數集(Sequence Parameter Set，SPS)中。若partition_constraints_override_enabled_flag為真，則在切片標頭(slice header，SH)中，與分割相關之語法可以被置換(override)。用於VVC草案6中的SPS語法與SH語法被示出於表1與表2中。

若干SPS語法元素之語意(semantic)描述如下：

log2_ctu_size_minus5 加5指定各CTU的亮度編碼樹區塊大小。位元流一致性之要求為log2_ctu_size_ minus5之值必須小於或等於2。

log2_min_luma_coding_block_size_minus2 加2指定最小亮度編碼區塊大小。

變數CtbLog2SizeY, CtbSizeY, MinCbLog2SizeY, MinCbSizeY, IbcBufWidthY, IbcBufWidthC及Vsize導出方式如下：

變數CtbWidthC與CtbHeightC(其分別指定針對各色度CTB之陣列的寬度與高度)導出方式如下： - 若chroma_format_idc等於0(單色)或separate_colour_plane_flag等於1，則CtbWidthC與CtbHeightC皆等於0。 - 否則，CtbWidthC與CtbHeightC導出方式如下：

sps_log2_diff_min_qt_min_cb_intra_slice_ luma 指定「在CTU的四元樹分割導致的亮度葉區塊的亮度樣本中最小大小的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中亮度CU的亮度樣本中最小編碼區塊大小的基數2的對數」之間的預設差值。當partition_constraints_override_flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_min_qt_min_cb_luma置換。 sps_log2_diff_min_qt_min_cb_intra_slice_luma之值應在0 (含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。從CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小的基數2的對數的導出方式如下：

sps_log2_diff_min_qt_min_cb_inter_slice 指定「在CTU的四元樹分割導致的亮度葉區塊的亮度樣本中最小大小的基數2的對數」與「參照SPS具有slice_type等於0(B)或1(P)的切片中亮度CU的亮度樣本中最小亮度編碼區塊大小的基數2的對數」之間的預設差值。當partition_constraints_override_flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_ diff_min_qt_min_cb_luma置換。sps_log2_diff_min_qt_ min_cb_inter_slice之值應在0(含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。從CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小的基數2的對數的導出方式如下：

sps_max_mtt_hierarchy_depth_inter_slice 指定在參照SPS具有slice_type等於0(B)或1(P)的切片中從四元樹葉之多類型樹拆分所導致的編碼單元之預設最大階層深度。當partition_constraints_override_flag等於1時，預設最大階層深度可被在參照SPS的切片之切片標頭中存在的slice_max_mtt_hierarchy_depth_luma置換。 sps_max_mtt_hierarchy_depth_inter_slice之值應在0(含)到 CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。

sps_max_mtt_hierarchy_depth_intra_slice_ luma 指定在參照SPS具有slice_type等於2(I)的切片中從四元樹葉之多類型樹拆分所導致的編碼單元之預設最大階層深度。當partition_constraints_override_flag等於1時，預設最大階層深度可被在參照SPS的切片之切片標頭中存在的slice_max_mtt_hierarchy_depth_luma置換。 sps_max_mtt_hierarchy_depth_intra_slice_luma之值應在0 (含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。

sps_log2_diff_max_bt_min_qt_intra_slice_ luma 指定「可使用二元拆分予以拆分之亮度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小(寬度或高度)」之間的預設差值。當partition_constraints_override_ flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_bt_min_qt_luma置換。sps_log2_diff_max_bt_min_qt_intra_slice_luma之值應在0(含)到CtbLog2SizeY-MinQtLog2SizeIntraY(含)之範圍內。當sps_log2_diff_max_bt_min_qt_intra_slice_luma不存在時，sps_log2_diff_max_bt_min_qt_intra_slice_luma之值被推斷成等於0。

sps_log2_diff_max_tt_min_qt_intra_slice_ luma 指定「可使用三元拆分予以拆分之亮度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小(寬度或高度)」之間的預設差值。當partition_constraints_override_ flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_tt_min_qt_luma置換。sps_log2_diff_max_tt_min_qt_intra_slice_luma之值應在0(含)到CtbLog2SizeY-MinQtLog2SizeIntraY(含)之範圍內。當sps_log2_diff_max_tt_min_qt_intra_slice_luma不存在時，sps_log2_diff_max_tt_min_qt_intra_slice_luma之值被推斷成等於0。

sps_log2_diff_max_bt_min_qt_inter_slice 指定「可使用二元拆分予以拆分之亮度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於0(B)或1(P)的切片中CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小(寬度或高度)」之間的預設差值。當partition_constraints_override_flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_bt_min_qt_luma置換。sps_log2_ diff_max_bt_min_qt_inter_slice之值應在0(含)到CtbLog2SizeY-MinQtLog2SizeInterY(含)之範圍內。當sps_log2_diff_max_bt_min_qt_inter_slice不存在時，sps_log2_diff_max_bt_min_qt_inter_slice之值被推斷成等於0。

sps_log2_diff_max_tt_min_qt_inter_slice 指定「可使用三元拆分予以拆分之亮度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於0(B)或1(P)的切片中CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小(寬度或高度)」之間的預設差值。當partition_constraints_override_flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_tt_min_qt_luma置換。sps_log2_ diff_max_tt_min_qt_inter_slice之值應在0(含)到CtbLog2SizeY-MinQtLog2SizeInterY(含)之範圍內。當sps_ log2_diff_max_tt_min_qt_inter_slice不存在時，sps_log2_ diff_max_tt_min_qt_inter_slice之值被推斷成等於0。

sps_log2_diff_min_qt_min_cb_intra_slice_ chroma 指定「在具有等於DUAL_TREE_CHROMA之treeType的色度CTU的四元樹分割導致的色度葉區塊的亮度樣本中最小大小的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中具有等於DUAL_TREE_ CHROMA之treeType的色度CU的亮度樣本中最小編碼區塊大小的基數2的對數」之間的預設差值。當partition_ constraints_override_flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_min_ qt_min_cb_chroma置換。sps_log2_diff_min_qt_min_cb_ intra_slice_chroma之值應在0(含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。當不存在時，sps_log2_ diff_min_qt_min_cb_intra_slice_ chroma之值被推斷成等於0。從具有等於DUAL_TREE_CHROMA之treeType的CTU之四元樹拆分所導致的色度葉區塊之亮度樣本中最小大小的基數2的對數的導出方式如下：

sps_max_mtt_hierarchy_depth_intra_slice_ chroma 指定在參照SPS具有slice_type等於2(I)的切片中從具有等於DUAL_TREE_CHROMA之treeType的色度四元樹葉之多類型樹拆分所導致的色度編碼單元之預設最大階層深度。當partition_constraints_override_flag等於1時，預設最大階層深度可被在參照SPS的切片之切片標頭中存在的slice_max_mtt_hierarchy_depth_chroma置換。sps_max_ mtt_hierarchy_depth_intra_slice_chroma之值應在0(含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。當不存在時，sps_max_mtt_hierarchy_depth_intra_slice_chroma之值被推斷成等於0。

sps_log2_diff_max_bt_min_qt_intra_slice_ chroma 指定「可使用二元拆分予以拆分之色度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中具有等於DUAL_TREE_CHROMA之treeType的色度CTU之四元樹拆分所導致的色度葉區塊之亮度樣本中最小大小(寬度或高度)」之間的預設差值。當partition_constraints_override_ flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_bt_min_qt_chroma置換。sps_log2_diff_max_bt_min_qt_intra_slice_chroma之值應在0(含)到 CtbLog2SizeY-MinQtLog2SizeIntraC(含)之範圍內。當sps_log2_diff_max_bt_min_qt_intra_slice_chroma不存在時，sps_log2_diff_max_bt_min_qt_intra_slice_chroma之值被推斷成等於0。

sps_log2_diff_max_tt_min_qt_intra_slice_ chroma 指定「可使用三元拆分予以拆分之色度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中具有等於DUAL_TREE_CHROMA之treeType的色度CTU之四元樹拆分所導致的色度葉區塊之亮度樣本中最小大小(寬度或高度)」之間的預設差值。當partition_constraints_override_ flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_tt_min_qt_chroma置換。sps_log2_diff_max_tt_min_qt_intra_slice_chroma之值應在0(含)到CtbLog2SizeY-MinQtLog2SizeIntraC(含)之範圍內。當sps_log2_diff_max_tt_min_qt_intra_slice_chroma不存在時，sps_log2_diff_max_tt_min_qt_intra_slice_chroma之值被推斷成等於0。

sps_max_luma_transform_size_64_flag 等於1將指定亮度樣本中最大變換大小是等於64。sps_max_luma_transform_size_64_flag等於0將指定亮度樣本中最大變換大小是等於32。

當CtbSizeY小於64時，sps_max_luma_ transform_size_64_flag之值應等於0。

變數MinTbLog2SizeY, MaxTbLog2SizeY, MinTbSizeY,及MaxTbSizeY導出方式如下：

在下文中，描述從四元樹葉拆分而得的多類型樹之最大允許階層深度(max_mtt_hierarchy_depth)，透過使用針對框間切片之亮度顏色分量的語法元素sps_max_mtt_hierarchy_depth_inter_slice作為實例。惟，現行準則亦可應用到框內切片或色度顏色分量(例如，語法元素sps_max_mtt_hierarchy_depth_intra_slice_luma與sps_log2_diff_min_qt_min_cb_intra_slice_chroma)。

在VVC草案6中，sps_max_mtt_hierarchy_ depth_inter_slice之值應在0(含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。典型上，MinCbLog2SizeY等於2，對應於4x4區塊；以及CtbLog2SizeY等於7，對應於128x128 CTU。在本組態中，max_mtt_hierarchy_depth應在0到5之範圍內。若最小QT大小(i.e., 1＜＜ MinQtLog2SizeInterY)等於32且僅使用BT，則當BT拆分深度是5時，可達到之最小區塊大小是4x8及8x4，如以下圖8所示。亦即，編碼器缺乏支援本實例中4x4區塊大小之靈活性。更一般而言，編碼器將僅支援由VVC指定之拆分模式的子集。

為了強調此缺乏靈活性處，吾等使用一組態其中CTU大小等於32，最小Cb大小為8且最小QT大小為32。這代表只可使用BT與TT。在本組態中，max_mtt_ hierarchy_depth被設定成2。若僅使用BT，則最小區塊大小可達到16x16或8x32：若僅使用TT，則若干區可僅被拆分成16x16，如圖9與圖10所示。

為了更佳描繪與拆分相關的語法元素，圖11描繪CTU大小、最小編碼區塊大小、最大變換大小、最小QT大小與最大BT/TT大小之可能數值。亦描繪在VTM6.0中用於通用測試條件(CTC)之實際數值。可看出最小編碼區塊大小(min_luma_coding_block_size)僅受CTU大小約束有界(bounded)。

如上述，由於結合使用允許進行BT或TT拆分的最大區塊大小和最大多類型樹階層深度之緣故，編碼樹深度在規範上被約束有界之方式使得VVC壓縮方案在給定固定最大區塊大小與最小區塊大小前提下在編碼效率方面潛在地是次最佳的。另一種問題在於log2_min_luma_ coding_block_size_minus2語法元素不與其他語法元素相關且不具有最大值。這造成其中編碼器產生的VVC位元流具有大於最大區塊大小的log2_min_luma_coding_block_size_ minus2之值的情況，使得事情不一致。

為了解決在VVC中對最大拆分深度缺乏靈活性之問題，針對框內切片與框間切片分別界定最大二元樹(BT)大小、最大三元樹(TT)大小與最大階層深度資訊。在雙樹之情況下，對框內切片中的色度樹界定最大BT大小/最大TT大小與最大MTT深度。提出方法可在預固定的最大和最小編碼區塊大小的約束下增加可到達編碼樹節點與葉之集合，並因此透過在允許編碼樹表示法中的較高靈活度來改進壓縮效率。

在一實施例中，sps_max_mtt_hierarchy_ depth_inter_slice與sps_max_mtt_hierarchy_depth_intra_ slice_luma之最大值增加。在下文中，為易於註明，max_mtt_hierarchy_depth被用作用以指稱與最大MTT階層深度相關之語法元素的通用術語，該諸如最大MTT階層深度諸如sps_max_mtt_hierarchy_depth_inter_slice與sps_ max_mtt_hierarchy_depth_intra_slice_luma。在另一實施例中，針對所有可用QT深度描述max_mtt_hierarchy_ depth，以便為了描述拆分樹提供更大靈活性。在另一實施例中，當針對給定深度可用QT拆分時與當針對給定深度不可用QT拆分時，max_mtt_hierarchy_depth不同。

在另一實施例中，語法元素sps_max_luma_ transform_size_64_flag被移動到log2_min_luma_coding_ block_size_minus2之前，並根據最大變換大小(sps_max_ luma_transform_size_64_flag)來界定編碼區塊大小之最大值(log2_min_luma_coding_block_size_minus2)。

在下文中，將進一步詳細說明不同實施例。

在VVC草案6中的最大階層深度

在本實施例中，吾等提出增加連續拆分(亦即，拆分深度或MTT階層深度)之允許數量到CTU尺寸與最小CU尺寸之間的差值之兩倍。透過此增加，在最壞情況中，其中QT並沒有被使用(最小QT被界定成CTU大小)且BT與TT是只有被使用之拆分，吾等可達到最小CU大小。

本說明書文字中有所改變者將在下文中劃底線：

sps_max_mtt_hierarchy_depth_inter_slice 指定在參照SPS具有slice_type等於0(B)或1(P)的切片中從四元樹葉之多類型樹拆分所導致的編碼單元之預設最大階層深度。當partition_constraints_override_flag等於1時，預設最大階層深度可被在參照SPS的切片之切片標頭中存在的slice_max_mtt_hierarchy_depth_luma置換。sps_max_ mtt_hierarchy_depth_inter_slice之值應在0(含)到2* (CtbLog2SizeY-MinCbLog2SizeY)(含)之範圍內。

slice_max_mtt_hierarchy_depth_luma 指定在當前切片中從四元樹葉之多類型樹拆分所導致的編碼單元之最大階層深度。slice_max_mtt_hierarchy_depth_luma 之值應在0(含)到2*(CtbLog2SizeY-MinCbLog2SizeY)(含)之範圍內。當不存在時，slice_max_mtt_hierarchy_depth_ luma之值被推斷成如下：

若slice_type等於2(I)，則slice_max_mtt_ hierarchy_depth_luma之值被推斷成等於sps_max_mtt_ hierarchy_depth_intra_slice_luma。

否則(slice_type等於0 (B)或1 (P))，則slice_ max_mtt_hierarchy_depth_luma之值被推斷成等於sps_ max_mtt_hierarchy_depth_inter_slice。

在VVC草案6中指定數值2*(CtbLog2SizeY-MinCbLog2SizeY)而非(CtbLog2SizeY-MinCbLog2SizeY)之原因在於：這使其可達到最小允許的區塊大小，無論是使用QT、BT或TT拆分類型。明確而言，只能透過二元樹(BT)拆分來達到此目的，而VVC草案6中當前指定的規範約束則不是這種情況。因此，所提出方案之優勢為在受最大與最小編碼區塊大小之約束下，其最大化VVC編碼器可實現之壓縮性能。

適應性最大MTT深度

在本實施例中，對所有QT層級規範地指定max_mtt_hierarchy_depth，以在拆分樹中提供更高的靈活性。指定由四元樹葉可到達之各層級相關的最大多類型樹深度之優勢在於其賦能以精細方式分配編碼器率畸變之組合。當然，對最佳化編碼樹之率畸變搜尋暗示編碼器搜尋空間之大量的組合。因此，有必要對多類型編碼樹搜尋的組合進行微調，以便在所有組合的編碼器搜尋與壓縮性能之間取得良好的取捨。分配針對各四元樹層級之最大mtt階層深度提供一種在RD搜尋結合與壓縮性能之間取得較佳取捨之方式。因此，在針對各四元樹層級規範地發訊最大mtt編碼樹深度中教高的靈活度潛在會導致在當前使用VVC草案6規範無法達到的編碼器複雜度/壓縮效率之權衡。

在此，將語法元素發訊，該語法元素指示mtt樹相對於最小四元樹大小可以開始之最大大小，sps_log2_diff_max_mtt_size_min_qt_size_inter_slice_luma。其中mtt可開始之最大大小被推斷如下： max_mtt_size = 1 ＜＜ (sps_log2_diff_max_mtt_size_ min_qt_size_inter_slice_luma + MinQtLog2SizeInterY)。

sps_log2_diff_max_mtt_size_min_qt_size_ inter_slice_luma之最大值是CtbLog2SizeY-MinQtLog2SizeInterY。

若sps_log2_diff_max_mtt_size_min_qt_size_ inter_slice_luma等於0，則其代表無mtt拆分被允許。若不為空(null)，則針對其允許mtt之各QT層級，針對BT與TT之最大深度被發訊。針對各層級，sps_max_bt_depth_ inter_slice_luma[i]之允許範圍是從0到2 x (i+ MinQtLog2SizeInterY- MinCbLog2SizeY)。此最終數值對應當前考慮四元樹葉節點大小之log2與最小編碼區塊大小之log2之間差值的兩倍。其確保可透過二元樹拆分之手段，達到最小編碼區塊大小。

在一實例中，在VVC中可將拆分樹界定成以下：

- 透過發訊以下數值： - log2_ctu_size_minus5=2(CTU大小為128) - log2_min_luma_coding_block_size_minus2= 0 (最小CU大小為4) - sps_log2_diff_min_qt_min_cb_intra_slice_luma=1 (QT拆分產生的最小CU大小為8) - sps_log2_diff_max_mtt_size_min_qt_size=2(mtt拆分之最大CU大小是32) - sps_max_bt_depth_inter_slice_luma[0]=2(對8x8 CU允許2 BT拆分) - sps_max_bt_depth_inter_slice_luma[1]=4(對16x16 CU允許4 BT拆分) - sps_max_bt_depth_inter_slice_luma[2]=2(對32x32 CU允許2 BT拆分) 相同原理可應用於intra_slice_luma與intra_slice_ chroma。

在另一實施例中，對四元樹葉之多類型樹拆分進行規範指定最大允許的階層深度，其與允許BT或TT拆分四元樹葉的各四元樹層級相關聯。基本上，與對其進行MTT拆分之四元樹葉對應的編碼單元必須是方形CU，其大小的log2包括在MinQtLog2SizeIntraY與(MinQtLog2SizeIntraY + log2_diff_max_mtt_min_qt_intra_ slice_luma)之間。

在此，透過在發訊值sps_log2_diff_max_bt_ min_qt_intra_slice_luma與sps_log2_diff_max_tt_min_qt_ intra_slice_luma之間的最大值界定log2_diff_max_mtt_ min_qt_intra_slice_luma。針對各區塊大小(其log2被包括在MinQtLog2SizeIntraY與(MinQtLog2SizeIntraY + log2_ diff_max_mtt_min_qt_intra_slice_luma)之間)，最大多類型樹深度被發訊。

sps_max_mtt_hierarchy_depth_intra_slice_ luma[i]之值指定用於拆分對應於四元樹葉之CU的多類型樹之最大階層深度。

與對log2_diff_max_mtt_min_qt_intra_slice_ luma相同方式，參數log2_diff_max_mtt_min_qt_inter_ slice被界定成是在發訊值sps_log2_diff_max_bt_min_qt_ inter_slice_luma與sps_log2_diff_max_tt_min_qt_inter_ slice_luma之間的最大值。針對各區塊大小(其log2被包括在MinQtLog2SizeInterY與(MinQtLog2SizeInterY + log2_ diff_max_mtt_min_qt_inter_slice)之間)，最大多類型樹深度被發訊。

與對log2_diff_max_mtt_min_qt_intra_slice_ luma相同方式，參數log2_diff_max_mtt_min_qt_intra_ slice_chroma被界定成是在發訊值sps_log2_diff_max_bt_ min_qt_intra_slice_chroma與sps_log2_diff_max_tt_min_ qt_intra_slice_chroma之間的最大值。針對各區塊大小(其log2被包括在MinQtLog2SizeIntraC與(MinQtLog2SizeIntraC + log2_diff_max_mtt_min_qt_intra_slice)之間)，最大多類型樹深度被發訊。

根據表5實施例的變體，語法元素sps_max_ mtt_hierarchy_depth_intra_slice_luma_present_flag、sps_ max_mtt_hierarchy_depth_inter_slice_luma_present_flag與sps_max_mtt_hierarchy_depth_intra_slice_chroma_present_flag並沒有被包括在SPS規範中。此變體可採取以下表6之形式。

在另一變體中，由四元樹深度取代四元樹葉大小之log2，來將最大MTT階層深度之編碼定索引。此可能採取與表7些微不同之形式。

在表7之變體中，數量strat_qt_depth_inter_ slice被界定成： start_qt_depth_inter_slice= CtbLog2SizeY-max (MaxBtLog2SizeY, MaxTtLog2SizeY) 其中： MaxBtLog2SizeY=(MinQtLog2SizeInterY + sps_log2_ diff_max_bt_min_qt_inter_slice) MaxTtLog2SizeY=(MinQtLog2SizeY + sps_log2_diff_ max_bt_min_qt_inter_slice) 此外，max_qt_depth_inter_slice被界定成： max_qt_depth_inter_slice = CtbLog2SizeY- MinQtLog2SizeInterY

如start_qt_depth_inter_slice與max_qt_depth_ inter_slice般，量start_qt_depth_intra_slice_luma、max_qt_ depth_intra_slice_luma、start_qt_depth_intra_slice_chroma及max_qt_depth_intra_slice_chroma以類比方式界定，但是是各別針對框內切片Luma與框內切片Chrom(在雙樹之情形)之情況。

仍又在另一實施例中，本文所呈任何前述變體亦用於切片標頭之編碼中。理當而言，在VVC草案6規範中，在SPS中發訊的編碼樹參數在切片標頭中可以被置換，例如根據如表2所示之語法表來置換。

應註明，在編碼器側，編碼最大MTT階層深度可以是根據考慮的四元樹葉節點之大小的log2與最小編碼區塊大小之大小的log2之間的深度差值約束有上界。這亦可採取以下形式。給定深度值i(表7的迴圈之一中的索引)，要編碼的最大mtt階層深度可以由值2* (CtbLog2SizeY-i-MinCbLog2SizeY)定為上界，其中2* (CtbLog2SizeY-i-MinCbLog2SizeY) 表示僅使用BT拆分即可達到寬度和高度的最小區塊大小所需的拆分次數。實際上，從給定區塊到拆分，僅剛好需要2個對稱二元拆分級來獲得寬度和高度大小為一半的區塊。在SPS與切片標頭之編碼的位元節省方面而言，按上界2*(CtbLog2SizeY-i-MinCbLog2SizeY)截割該值可以是有益。

此外，應註明透過規範的允許最大mtt階層深度在0到值2* (CtbLog2SizeY – i - MinCbLog2SizeY)之範圍內能確保可以透過BT拆分之手段達到最小編碼區塊大小。

最終，在CU拆分資訊之CU層級的解碼器側剖析處理期間，考慮到針對各四元樹層級的所提出之最大MTT階層深度的高層級發訊。

為此，若針對給定CTU之編碼樹的當前節點允許給定二元或三元拆分模式時解碼器進行評估，其在與當前編碼樹節點相關之四元樹深度處，比較當前編碼樹節點之多類型樹深度與最大多類型樹深度。若在考慮的四元樹深度處，多類型樹深度高於或等於最大允許多類型樹深度，則針對當前樹節點之所有的二元與三元拆分模式皆被禁止。因此，解碼器推斷考慮之樹節點之拆分模式不同於任何二元或三元拆分模式。

拆分資訊之VVC草案6剖析處理的不同在於在VVC草案6中，針對當前樹節點之最大允許多類型樹深度並非取決於與考慮的編碼樹節點相關之四元樹深度。在框內切片類型之情況下，其僅取決於切片類型與分量類型。

二元/三元拆分賦能

在本實施例中，兩個新旗標被引入(introduced) SPS中，以發訊是否使用BT與TT拆分。接著，若兩種類型之拆分中至少一種被使用，則sps_max_mtt_hierarchy_ depth語法元素被編碼成表8所示者。在表8之實施例的變體中，sps_bt_enabled_flag被界定成： sps_bt_enabled_flag等於1指定在編碼區塊拆分之處理中，二元拆分是被允許的。

在另一變體中，針對框內亮度、框間與框內色度，BT與TT拆分被不同地賦能或去能，以允許更高的靈活性。在表9所示之實施例中，sps_bt_enabled_flag被界定成： sps_bt_enabled_flag等於1指定在參照SPS具有等於slice_type之2(I)的切片中四元樹葉中的編碼區塊拆分之處理中，二元拆分是被允許的。

在另一變體中，sps_log2_diff_max_bt_min_ qt或sps_log2_diff_max_tt_min_qt語法元素被用以去能BT或TT。在當前VVC草案6中，透過將大於0之值設定成sps_max_mtt_hierarchy_depth語法元素，BT與TT拆分一起被賦能。在表9之變體中，首先界定sps_log2_diff_max_ bt_min_qt與sps_log2_diff_max_bt_min_qt，接著sps_max_ mtt_hierarchy_depth被有條件的剖析。sps_log2_diff_max_ bt_min_qt(sps_log2_diff_max_tt_min_qt)被改變成sps_ log2_diff_max_bt_min_qt_plus_one(sps_log2_diff_max_tt_min_qt_plus_one)，0之值指示BT/TT被去能。在本情況中理當而言最大BT大小嚴格小於最小QT大小，因此從未使用過其。sps_log2_diff_max_bt _min_qt_plus_one (sps_ log2_diff_max_tt _min_qt_plus_one)語法元素被界定成： sps_log2_diff_max_bt_min_qt_plus_one_intra_slice_ luma指定「可使用二元拆分予以拆分之亮度編碼區塊的亮度樣本中最大大小(寬度或高度)的基數2的對數」與「參照SPS具有slice_type等於2(I)的切片中CTU之四元樹拆分所導致的亮度葉區塊之亮度樣本中最小大小加一(寬度或高度)」之間的預設差值。當partition_constraints_ override_flag等於1時，預設差值可被在參照SPS的切片之切片標頭中存在的slice_log2_diff_max_bt_min_qt_luma置換。sps_log2_diff_max_bt_min_qt_minus_one_intra_slice_ luma之值應在0(含)到CtbLog2SizeY-MinQtLog2SizeIntraY + 1(含)之範圍內。當sps_log2_diff_max_bt_min_qt_minus_ intra_slice_luma不存在時，sps_log2_diff_max_bt_min_qt_ intra_slice_luma之值被推斷成等於0。

簡化之適應性最大MTT深度

在另一變體中，只有發訊兩個層級之最大MTT深度(以取代先前實施例中每QT層級發訊一個)：是當QT拆分被允許時，發訊最大MTT深度；而當沒有更多QT拆分被允許時，發訊最大MTT深度。

在本實施例中，首先將語法元素sps_max_ mtt_hierarchy_depth_before_minqt_inter_slice發訊。

sps_max_mtt_hierarchy_depth_before_ minqt_inter_slice 指定當在參照SPS具有slice_type等於0(B)或1(P)的切片中四元樹葉大小不等於(嚴格大於)MinQtLog2SizeInterY時，從此四元樹葉之多類型樹拆分所導致的編碼單元之預設最大階層深度。當partition_constraints_override_flag等於1時，預設最大階層深度可被在參照SPS的切片之切片標頭中存在的slice_max_mtt_hierarchy_depth_before_minqt_luma置換。sps_max_mtt_hierarchy_depth_before_min_qt_inter_slice之值應在0(含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。

若sps_log2_diff_min_qt_min_cb_inter_slice 不等於0，則其代表在到達最小編碼區塊大小之前QT樹將停止，因此我們需要使用更多的二元/三元拆分以達到最小編碼區塊大小。因此，此sps_log2_diff_min_qt_min_ cb_inter_slice 值是用於剖析sps_log2_diff_max_ hierarchy_depth_after_minqt_intra_slice_luma 語法元素之條件。

sps_max_mtt_hierarchy_depth_after_ minqt_inter_slice 指定當在參照SPS具有slice_type等於0(B)或1(P)的切片中四元樹葉大小等於MinQtLog2SizeInterY時，從此四元樹葉之多類型樹拆分所導致的編碼單元之預設最大階層深度。當partition_ constraints_override_flag等於1時，預設最大階層深度可被在參照SPS的切片之切片標頭中存在的slice_max_mtt_ hierarchy_depth_after_minqt_luma置換。sps_max_mtt_ hierarchy_depth_after_min_qt_inter_slice之值應在0(含)到CtbLog2SizeY-MinCbLog2SizeY(含)之範圍內。

相同原理可應用於intra_slice_luma與intra_ slice_chroma。

可單獨使用或結合使用先前實施例。舉例而言，將如前所述使階層深度加倍的實施例與如表11中所述的實施例組合。這典型上代表相較於VVC草案6中其最大允許值，最大MTT階層深度加倍。這可採取以下形式。

值sps_max_mtt_hierarchy_depth_before_ minqt_inter_slice 範圍在0(無拆分被允許)到2* (CtbLog2SizeY-MinCbLog2SizeY)之間。

值sps_max_mtt_hierarchy_depth_before_ minqt_intra_slice_luma 範圍在0(無拆分被允許)到2* (CtbLog2SizeY-MinCbLog2SizeY)之間。

值sps_max_mtt_hierarchy_depth_after_ minqt_inter_slice 範圍從0(無拆分被允許)改變成2* (MinQtLog2SizeY-MinCbLog2SizeY)。

值sps_max_mtt_hierarchy_depth_after_ minqt_intra_slice_luma 範圍從0(無拆分被允許)改變成2*(MinQtLog2SizeY-MinCbLog2SizeY)。

值sps_max_mtt_hierarchy_depth_before_ minqt_intra_slice_chroma 範圍從0(無拆分被允許)改變成2*(MinQtLog2SizeY-MinCbLog2SizeY)。

值sps_max_mtt_hierarchy_depth_after_ minqt_intra_slice_chroma 範圍從0(無拆分被允許)改變成2*(MinQtLog2SizeY-MinCbLog2SizeY)。

在一實例中，可以定義一個拆分樹，如表12所示。

log2_min_luma_coding_block_size_minus2語法元素之最大值

在本實施例中，sps_max_luma_transform_ size_64_flag語法元素被移到log2_ctu_size_minus5之後與log2_min_luma_coding_block_size_minus2之前，如表13所示。

sps_max_luma_transform_size_64_flag等於1將指定亮度樣本中最大變換大小是等於64。sps_max_ luma_transform_size_64_flag等於0將指定亮度樣本中最大變換大小是等於32。

在VVC草案6中，沒有指定針對log2_min_ luma_coding_block_size_minus2語法元素之上界。

變數CtbWidthC與CtbHeightC(其分別指定針對各色度CTB之陣列的寬度與高度)導出方式如下： - 若chroma_format_idc等於0(單色)或separate_ colour_plane_flag等於1，則CtbWidthC與CtbHeightC皆等於0。 - 否則，CtbWidthC與CtbHeightC導出方式如下：

由圖12描繪所提出對語法元素log2_min_ luma_coding_block_size_minus2之允許範圍之規範的調整。如圖12可見，在本實施例中，最小編碼區塊大小之允許範圍從4到最大變換大小。

根據指定語法元素log2_min_luma_coding_ block_size_minus2之上下界的替代方式，提出基於CTU大小指定針對log2_min_luma_coding_block_size_minus2之最大可能數值。

因此，在此log2_min_luma_coding_block_ size_minus2之值應該落在0到(CtbLog2SizeY - 2)之範圍內。此確保各編碼區塊具有之大小最多等於CTU大小。其可大於最大變換大小。在此種情況下，VVC規範已提及一編碼區塊，其大小大於最大變換大小，以及其沒有被拆分成次編碼單元，該編碼區塊應該被分塊成變換單元以為了要將其殘差資料編碼/解碼。

由圖13描繪所提出對語法元素log2_min_luma_coding_block_size_minus2之允許範圍之規範的調整。如可見，在本實施例中，最小編碼區塊大小之允許範圍從4到CTU大小。

根據指定語法元素log2_min_luma_coding_ block_size_minus2之上下界的進一步實施例，提出基於CTU大小與虛擬管線解碼單元(VPDU)大小來指定針對log2_min_luma_coding_block_size_minus2之最大可能數值。VPDU表示在VVC解碼器硬體實作中之解碼單元。VVC解碼處理被設計成在每個64x64畫面區域中，使得可以在開始解碼和重建被考慮的畫面中的下一個64x64區域之前，將該當前畫面區域中的所有亮度和色度資料都被完全解碼和重建。

在本實施例中，log2_min_luma_coding_ block_size_minus2之值應該落在0到(min(CtbLog2SizeY,6) - 2))之範圍內。換言之，最小編碼區塊大小應落變數在0到min(CtbSizeY,64)之範圍內，該大小恰等於VVC草案6中指定之VSize (VPDU 大小)。

本實施例之優勢如下。根據VVC草案6規範，CtbSize可等於128且最小編碼區塊大小(MinCbSizeY)也可等於128。透過所提出基於VPDU大小對最小編碼區塊大小之約束，各128x128 CTU需要在亮度分量中被拆分成4個64x64亮度CU。同步地，其對應於128x128亮度CTU之64x64色度區塊必須被拆分成4個32x32色度CU。相應的，編碼區塊大小將符合VPDU約束。

本實施例解決在對將最小區塊大小之上界對準最大變換大小的先前實施例之替代方式中的上述問題。

緊密切片層級分割約束置換

本揭露之另一實施例包括使得切片標頭分割資訊編碼之編碼比VVC草案6中者更為緊密。

在VVC草案6中，切片標頭旗標partition_ constraints_override_flag 被編碼以指示在考慮切片中的該編碼樹組態被置換，該編碼樹組態被發訊於序列參數集中。若此置換旗標為真(true)，則與最小四元樹節點大小、最大BT大小、最大TT大小、以及最大MTT階層深度層級相關之參數被發訊於切片標頭中。它們分別針對所考慮切片的亮度分量和在雙樹編碼為有效的情況下的色度分量進行編碼。

然而，在VTM6編碼器策略中，此等編碼樹參數中若干者在若干切片中被改變，但其他從未被改變。因此，針對若干特定編碼策略，VVC草案6之切片標頭語法規範可能導致冗餘資料之重複。典型上，最大MTT階層深度資訊總來不改變。

在本實施例中，提出發訊一旗標max_mtt_ hierarchy_depth_override_flag ，該旗標指示(一或多)最大階層深度參數是否在切片標頭中被置換。若屬實，則切片層級的最大階層深度資訊被編碼於切片標頭中。否則，個別針對亮度分量與針對色度分量(在雙樹之情況下)，切片層級最大階層深度數值被設定成等於SPS之對應者。此外，最大BT大小與最大MTT大小(其在語法元素slice_ log2_diff_max_bt_min_qt_luma 與slice_log2_diff_max_ tt_min_qt_luma 之形式下)之切片層級編碼不再如同在VVC草案6之情況中般取決於最大MTT階層深度之值。在雙樹編碼的情況下，也消除了色度分量的這種依賴性。提出的切片標頭語法調整已描繪於下表。本實施例之優勢在於更緊密之切片標頭語法，導致針對小視訊序列節省高達0.1%位元率，該小視訊序列中連接到高層級語法之負擔不可忽略。

根據本實施例之進一步變體，基於旗標maximum_hierarchy_depth_override 旗標(其之前在切片標頭中被發訊)，最小四元樹節點大小資訊(其與最大四元樹深度等效)亦在切片層級上被編碼。因此，本旗標maximum_hierarchy_depth_override 控制最小QT大小與最大MTT階層深度參數之發訊。相較於VVC草案6，此變體之優勢在於更進一步緊密之切片標頭。

本文描述了各種方法，並且每種方法包括用於實現所描述的方法的一個或多個步驟或動作。除非方法的正確適當操作需要特定的步驟或動作順序，否則可以調整或組合特定步驟及/或動作的順序及/或使用。額外地，在各種實施例中可使用諸如「第一」、「第二」等術語來調整一元件、分量、步驟、操作等，例如「第一解碼」與「第二解碼」。此種術語之使用並不暗示調整操作之順序，除非有特別對此之需求。因此，在本例示性中，第一解碼不需要在第二解碼之前被予以執行，且例如第一編碼可在第二解碼之前、其間、或在與該第二編碼重疊之時間週期內發生。

各種方法與其他在本申請案所述之態樣可用以調整圖2與圖3中視訊編碼器200與解碼器300之模組，例如分割、熵編碼與解碼模組(202, 335, 245, 330)。此外，本態樣不受限於VVC或HEVC，且可例如應用於其他標準與建議，以及任何此種標準與建議之擴展。除非另外指明，或技術上排除者，否則在本申請案中所述之態樣可被獨立使用或組合使用。

在本申請案中使用各種數值。特定值是出於例示性目的，並且所描述的態樣並不限於這些特定值。

各種實作涉及解碼。如本申請案中所使用的「解碼」可以包括例如對接收到的編碼序列執行的全部或部分處理，以便產生適合於顯示的最終輸出。在各種實施例中，此等處理包括典型上由解碼器執行之一或多處理，例如，熵解碼、反量化、反變換與差分解碼。基於特定描述的上下文，短語「解碼處理」是旨在專門指代操作的子集還是廣義上指的是更廣泛的解碼處理將是顯而易見的，並且被本領域技術人員理解。

各種實作涉及編碼。與前述針對「解碼」論述相似方式，如本申請案中所使用的「編碼」可以包括例如對輸入視訊序列執行的全部或部分處理，以便產生編碼的位元流。

應注意，本文所用之語法元素為說明性術語。如此一來，其並沒有排除使用其他語法元素之名稱。在上文中，針對SPS與SH之語法元素主要用於描繪各種實施例。應註明，此等語法元素可置於其他語法結構中。

本文所述之實作與態樣可例如實作於方法或處理、設備、軟體程式、資料串流、或訊號中。即使僅在單一形式的實現方式中進行討論(例如，僅作為一種方法進行討論)，所討論的特徵之實現也可以其他形式(例如，設備或程式)來實現。設備可例如實作於適當硬體、軟體與韌體中。該方法可舉例而言實作於設備中，例如作為處理器，其廣義指稱處理裝置，其包括例如電腦、微處理器、積體電路或可程式邏輯裝置。處理器亦包括通訊裝置，例如包括電腦、蜂巢式電話、可攜式/個人數位助理(PDA)與其他促進在終端使用者之間資訊的通訊之裝置。

對「一實施例」或「實施例」或「一實作」或「實作」以及其他變體之參考代表結合該實施例所述之特定特徵、結構、或特性等被包括在至少一實施例中。因此，「在一個實施例中」或「在實施例中」或「在一個實作中」或「在實作中」，以及其任意其他變體，之該用語在申請案全文中各處的出現並不全然指向該同一實施例。

額外地，本申請案可參照「判定」各種資訊塊。判定該資訊可包括以下一或多者，例如，估計資訊、計算資訊、預測資訊、或從記憶體取回該資訊。

進一步，本申請案可參照「存取」各種資訊塊。存取該資訊可包括以下一或多者，例如，接收資訊、取回資訊(例如從記憶體)、儲存資訊、移動資訊、複製資訊、計算資訊、判定資訊、預測資訊、或估計資訊。

額外地，本申請案可參照「接收」各種資訊塊。與「存取」同理，所述接收旨在是廣義術語。接收該資訊可包括以下一或多者，例如，存取資訊、或(從記憶體)取回該資訊。進一步，「接收」典型上以一種方式或另一種方式涉及在操作期間例如，儲存資訊、處理資訊、傳輸資訊、移動資訊、複製資訊、抹除資訊、計算資訊、判定資訊、預測資訊、或估計資訊。

應瞭解，例如在「A/B」、「A及/或B」、與「A與B之至少一者」該等情況中以下用語「/」、「及/或」、與「至少一者」之任意者之使用目的在於僅涵蓋第一所列選項(A)之選擇、或僅涵蓋第二所列選項(B)之選擇、或兩選項(A與B)之選擇。作為進一步實例，在「A、B及/或C」與「A、B及C中至少一者」之情況中，此等用語目的在於僅涵蓋第一所列選項(A)之選擇或僅涵蓋第二所列選項(B)之選擇、或僅涵蓋第三所列選項(C)之選擇、或第一與第二所列選項(A與B)之選擇、或第一與第三所列選項(A與C)之選擇、或第二與第三所列選項(B與C)之選擇、或全部三選項(A與B與C)之選擇。如對於本技術領域和相關技術領域中具通常知識者顯而易見的那樣，對於列出的盡可能多的項目，這可以擴展。

亦對於本技術領域中具通常知識者顯而易見那般，實作可產生各式各樣訊號，其格式化以攜有例如可被儲存或傳輸之資訊。該資訊可例如包括用於執行方法之指令、或由一或多所述實作產生之資料。舉例而言，一訊號可以被格式化以攜有所述實施例之位元流。此種訊號可以被格式化，例如成電磁波(例如，使用頻譜中射頻部分)或成基頻訊號。該格式化可例如包括編碼資料串流與調變具有編碼的資料串流之載波。訊號所攜之該資訊可例如為類比或數位資訊。該訊號可透過已知各式各樣不同有線或無線鏈接來進行傳輸。該訊號可以被儲存在處理器可讀媒體上。

100:系統 105:輸入區塊 110:處理器 115:連接配置 120:記憶體 130:編碼器/解碼器模組 140:儲存裝置 150:通訊介面 160:顯示器介面 165:顯示器 170:音訊介面 175:揚聲器 180:週邊裝置介面 185:週邊裝置 190:通訊通道 200:視訊編碼器 201:功能模組 202:功能模組 205:功能模組 210:功能模組 225:功能模組 230:功能模組 240:功能模組 245:功能模組 250:功能模組 255:功能模組 260:功能模組 265:功能模組 270:功能模組 275:功能模組 280:功能模組 300:視訊解碼器 330:功能模組 335:功能模組 340:功能模組 350:功能模組 355:功能模組 360:功能模組 365:功能模組 370:功能模組 375:功能模組 380:功能模組 385:功能模組

[圖1]描繪系統之方塊圖，在該系統內可實作本實施例中數態樣。

[圖2]描繪視訊編碼器的實施例之方塊圖。

[圖3]描繪視訊解碼器的實施例之方塊圖。

[圖4]描繪根據HEVC標準將CTU拆分成CU的過程。

[圖5]描繪根據HEVC標準將CTU拆分成CU、PU與TU的過程。

[圖6]描繪VVC中四元樹加上二元樹(QTBT) CTU表示法。

[圖7]描繪在VVC草案6中所支援的所有編碼單元拆分模式之集合。

[圖8]描繪僅使用具有深度5之BT將32x32區塊拆分。

[圖9]描繪僅使用具有深度2之BT將32x32區塊拆分。

[圖10]描繪僅使用具有深度2之TT將32x32區塊拆分。

[圖11]描繪在VVC草案6中用於拆分相關語法元素之最小、最大與通用測試條件(Common Test Condition，CTC)數值。

[圖12]描繪根據實施例之基於允許的最大變換大小的最小編碼區塊之調整的最大允許數值。

[圖13]描繪根據另一實施例之基於CTU大小的最小編碼區塊之調整的最大允許數值。

Claims

一種方法，其包含：將指示樹結構之最大允許深度的值進行編碼或解碼，其中該最大允許深度是由第一值與第二值之間的差值之至少兩倍所約束有界，該第一值指示最大編碼區塊之大小，以及該第二值指示最小允許編碼區塊大小；以及透過該樹結構，將表示該最大編碼區塊或該最大編碼區塊之分割的節點分割成編碼區塊，其中該樹結構使用水平拆分與垂直拆分中至少一者。
如請求項1所述之方法，其中該樹結構使用下述至少一者：水平二元拆分、垂直二元拆分、水平三元拆分、與垂直三元拆分。
如請求項1或2所述之方法，其中該樹結構排除四元樹拆分。
如請求項1或2所述之方法，其進一步包含：透過四元樹結構將該最大編碼區塊分割成四元樹葉節點，該四元樹葉節點包括該表示該最大編碼區塊之該分割的節點。
如請求項1所述之方法，其中該第一值對應該最大編碼區塊之該大小的基數2的對數。
如請求項1所述之方法，其中該第二值對應該最小允許編碼區塊大小的基數2的對數。
一種方法，其包含：透過四元樹結構將最大編碼區塊分割成四元樹葉節點；透過第二樹結構將四元樹葉節點分割成編碼區塊，其中該第二樹結構使用下述至少一者：水平二元拆分、垂直二元拆分、水平三元拆分、與垂直三元拆分；以及將指示該第二樹結構之最大允許深度的值進行編碼或解碼，其中該最大允許深度取決於該四元樹葉節點之四元樹層級。
如請求項7所述之方法，其中針對允許透過該第二樹結構進行拆分之各四元樹層級，發訊該最大深度。
如請求項7或8所述之方法，其中針對二元樹發訊該最大允許深度。
如請求項7或8所述之方法，其中針對三元樹發訊該最大允許深度。
一種方法，其包含：透過四元樹重構將最大編碼區塊分割成四元樹葉節點；透過第二樹結構將四元樹葉節點分割成編碼區塊，其中該第二樹結構使用下述至少一者：水平二元拆分、垂直二元拆分、水平三元拆分、與垂直三元拆分；以及將指示該第二樹結構之最大允許深度的值進行編碼或解碼，其中該最大允許深度取決於該四元樹葉節點是否等於最小允許四元樹節點大小。
如請求項11所述之方法，其中當該四元樹葉節點大於該最小允許四元樹樹節點大小時，該第二樹結構之該最大允許深度的上界是基於該最大編碼區塊之大小與最小允許編碼區塊大小。
如請求項11或12所述之方法，其中當該四元樹葉節點等於該最小允許四元樹樹節點大小時，該第二樹結構之該最大允許深度的上界是基於該最小允許四元樹樹節點大小與最小允許編碼區塊大小。
一種方法，其包含：將最大編碼區塊分割成編碼區塊；以及將指示最小允許編碼區塊大小之值進行編碼或解碼，其中該最小編碼區塊大小之上界取決於該最大編碼區塊之大小與值的較小值。
如請求項14所述之方法，其中該數值指示虛擬管線解碼單元(VPDU)之大小。
一種方法，其包含：透過四元樹結構將編碼樹區塊分割成四元樹葉節點；透過第二樹結構將四元樹葉節點分割成編碼區塊，其中該第二樹結構使用下述至少一者：水平二元拆分、垂直二元拆分、水平三元拆分、與垂直三元拆分；以及將下述至少一者進行編碼或解碼：(1)第一訊號，其指示在該第二樹結構中是否使用二元拆分；或(2)第二訊號，其指示在該第二樹結構中是否使用三元拆分。
如請求項16所述的方法，進一步包含：將指示該第二樹結構之最大允許深度的值進行編碼或解碼，以回應所使用之二元拆分與三元拆分中至少一者。
如請求項16或17所述之方法，其中針對框內與框間分別發訊是否使用二元拆分。
如請求項16或17所述之方法，其中針對亮度與色度分別發訊是否使用二元拆分。
如請求項16所述之方法，其中該第一訊號取決於第一值與第二值，該第一值指示可使用二元拆分進行拆分的編碼區塊之最大允許大小，該第二值指示四元樹葉節點之最小允許大小。
如請求項16所述之方法，其中該第二訊號取決於第三值與第四值，該第三值指示可使用三元拆分進行拆分的編碼區塊之最大允許大小，該第四值指示四元樹葉節點之最小允許大小。
一種方法，其包含：透過四元樹重構將最大編碼區塊分割成四元樹葉節點；透過第二樹結構將四元樹葉節點分割成編碼區塊，其中該第二樹結構使用下述至少一者：水平二元拆分、垂直二元拆分、水平三元拆分、與垂直三元拆分；以及將旗標進行編碼或解碼，該旗標指示在當前語法結構中，指示一或多最大階層深度參數之參數是否被置換。
如請求項22所述之方法，其中該當前語法結構對應於切片標頭。
一種方法，其包含：透過四元樹重構將最大編碼區塊分割成四元樹葉節點；透過第二樹結構將四元樹葉節點分割成編碼區塊，其中該第二樹結構使用下述至少一者：水平二元拆分、垂直二元拆分、水平三元拆分、與垂直三元拆分；以及將指示最小四元樹節點大小之訊號進行編碼或解碼。
一種非暫態儲存媒體，其儲存有使用根據請求項1-24中任一項所述之方法所進行編碼的視訊。
一種設備，其包含處理器與儲存指令之非暫態電腦可讀儲存媒體，當該指令在該處理器上執行時將執行根據請求項1-24中任一項所述之方法，用於將視訊進行編碼或解碼。