TWI677234B

TWI677234B - 二次轉換核心尺寸選擇

Info

Publication number: TWI677234B
Application number: TW107112089A
Authority: TW
Inventors: 江嫚書; Man Shu Chiang; 徐志瑋; Chih Wei Hsu; 莊子德; Tzu Der Chuang; 陳慶曄; Ching Yeh Chen
Original assignee: 聯發科技股份有限公司; Mediatek Inc.
Priority date: 2017-04-14
Filing date: 2018-04-09
Publication date: 2019-11-11
Also published as: WO2018188648A1; TW201842770A; US20180302631A1; CN110546954A; US10855997B2; EP3607748A1; CN110546954B; EP3607748A4

Abstract

一種關於二次轉換操作的方法及裝置。其中，像素塊的轉換係數的特定子集內的非零轉換係數被計數並與一特定閾值比較，以決定是否對該像素塊執行二次轉換。另外，最佳二次轉換核心尺寸是基於塊的尺寸隱性獲取，或透過使用一適應性碼字基於一旗標來明確獲取。

Description

二次轉換核心尺寸選擇

【相關申請的交叉引用】

本申請是要求2017年04月14日提交的申請號為62/485,406的美國臨時專利申請案的優先權的美國正式專利申請案的部分。上述列出的申請案內容以引用方式併入本文。

本申請大體關於視訊處理。具體地，本申請係有關於對轉換操作的選擇進行發信。

除非此處另有說明外，本部分所描述的方法相對於下面列出的申請專利範圍而言不是先前技術，並且本部分的引入並非承認其是先前技術。

高效率視訊編碼(High-Efficiency Video Coding，HEVC)是由視訊編碼聯合協作小組(Joint Collaborative Team on Video Coding，JCT-VC)開發的新型視訊編解碼標準。HEVC是基於混合的基於塊的運動向量補償的類DCT編解碼架構。壓縮的基本單元，稱為編解碼單元(CU)，是2Nx2N的方塊，且每個CU可被遞歸地分割為四個更小CU直到達到預定的最小尺寸。每個CU包含一個或多個預測單元(prediction units，PUs)。在預測之後，一個CU被進一步分割為用於轉換及量化的轉換單元(transform units，TUs)。

如許多其他先前標準，HEVC採用了離散餘弦轉換類型II(DCT-II)作為其核心轉換，因為其具有較好”功耗節約”的屬性。Most of the signal information tends to be concentrated in a few low-frequency components of the DCT-II,which approximates the Karhunen-Loève Transform(KLT,which is optimal in the decorrelation sense)for signals based on certain limits of Markov processes.大多數信號資訊傾向於聚焦在DCT-II的幾個低頻分量上，其基於馬爾可夫過程的一些限制讓信號逼近於K-L轉換(Karhunen-Loève Transform，KLT，其在去相關方面是最佳的)。

對於TU，除了用DCT轉換作為核心轉換，還採用了二次轉換來進一步降低係數的功耗並改善編解碼效率。如JVET-D1001中，使用基於Hypercube-Givens轉換(Hypercube-Givens Transform，HyGT)的不可分離轉換作為二次轉換，其被稱為不可分離二次轉換(non-separable secondary transform，NSST)。正交轉換的基本元素為Givens旋轉，其由正交矩陣G(m,n,θ)定義，其具有下面定義的元素：

HyGT透過於一超立方體排列內合併Givens旋轉組來實施。

以下發明內容僅是說明性的，不打算以任何方式加以限制。也就是說，以下發明內容被提供以介紹此處所描述的新且非明顯的技術的概念、重點、好處和優勢。選擇而不是所有的實施方式在下面的詳細說明中進行進一步描述。因此，以下發明內容不用於決定所要求主題的本質特徵，也不用於決定所要求主題的範圍。

本發明之一些實施例提供一種於編碼或解碼一像素塊時發信二次轉換核心尺寸的方法。一編碼器或解碼器決定該像素塊之轉換係數之一特定子集中非零轉換係數之一計數。當該計數大於一特定閾值時，編碼器或解碼器透過為該像素塊執行不可分離二次轉換來編解碼該像素塊。當該計數小於該特定閾值時，編碼器或解碼器編解碼該像素塊，而不為該像素塊執行不可分離二次轉換。該子集之外的轉換係數並不包含於該計數內。一些實施例中，轉換係數之該特定子集包含該像素塊一轉換單元之左上4x4或8x8的轉換係數。

當該塊的尺寸大於該閾值時，編碼器明確發信用於對該像素塊執行NSST的核心尺寸。該旗標是編碼於該碼流的片頭中，序列頭中，或圖片頭中。一些實施例中，當該轉換係數之一子集內的非零係數的一計數大於一閾值時，編碼器可透過編碼一旗標來發信該核心尺寸。

編碼器可隱性發信該核心尺寸而不於碼流內編碼該核心尺寸。當該塊尺寸大於一第一閾值時，編碼器或解碼器可用固定值做為核心尺寸。一些實施例中，核心尺寸是基於該像素塊的幀內預測模式決定的。

一些實施例中，該核心尺寸基於用於編解碼該像素塊之該等核心尺寸之每一相關之開銷來從多個可能核心尺寸中選擇。選擇的核心尺寸是與最低開銷相關的核心尺寸。與一核心尺寸相關的開銷是透過重建該塊的子塊的複數像素以及透過比較重建子塊與該塊之相鄰像素來計算。一些實施例中，識別核心尺寸的碼字被編解碼。不同可能核心尺寸基於該可能核心尺寸的每一計算的開銷被分配不同碼字。最低開銷的核心尺寸被分配一最短碼字。

200‧‧‧像素塊

210‧‧‧預測像素組

220‧‧‧殘差組

230‧‧‧轉換係數組

250‧‧‧區域

300‧‧‧TU

310‧‧‧轉換係數組

315‧‧‧子集

320‧‧‧轉換係數組

330‧‧‧重建殘值組

340‧‧‧重建像素組

600‧‧‧視訊編碼器

605‧‧‧視訊源

610‧‧‧轉換模組

611‧‧‧量化模組

614‧‧‧逆量化模組

615‧‧‧逆轉換模組

620‧‧‧圖片內估計模組

625‧‧‧圖片內預測模組

630‧‧‧運動補償模組

635‧‧‧運動估計償模組

645‧‧‧迴路濾波器

650‧‧‧重建圖片緩存

665‧‧‧MV緩存

675‧‧‧MV預測模組

690‧‧‧熵編碼器

695‧‧‧碼流

700‧‧‧二次轉換控制模組

710‧‧‧核心尺寸碼字編碼模組

800‧‧‧核心尺寸開銷分析模組

900‧‧‧視訊解碼器

905‧‧‧逆量化模組

915‧‧‧逆轉換模組

925‧‧‧圖片內預測模組

935‧‧‧運動補償模組

945‧‧‧迴路濾波器

950‧‧‧解碼圖片緩存

955‧‧‧顯示設備

965‧‧‧MV緩存

975‧‧‧MV預測模組

990‧‧‧碼流解析器

995‧‧‧碼流

1000‧‧‧二次轉換控制模組

1010‧‧‧核心尺寸碼字解碼模組

1100‧‧‧核心尺寸開銷分析模組

1200‧‧‧流程

1210-1250‧‧‧步驟

下列圖式用以提供本發明的進一步理解，並被納入且構成本發明的一部分。這些圖式說明瞭本發明的實施方式，並與說明書一起用以解釋本發明的原理。為了清楚地說明本發明的概念，與實際實施方式中的尺寸相比，一些元件可以不按照比例被示出，這些圖式無需按照比例繪製。

第1圖顯示選擇像素塊的二次轉換核心尺寸的架構。

第2圖顯示對一像素塊的非零轉換係數計數以決定是否對該像素塊執行NSST。

第3圖顯示基於候選NSST核心尺寸與相鄰重建塊的重建像素的開銷的計算。

第4圖顯示基於當前塊的重建像素與相鄰塊的重建像素之間的相關來計算TU的開銷。

第5圖顯示基於測量重建殘值的能量對TU 500開銷的計算。

第6圖顯示一隱性及明確發信二次轉換核心尺寸的示例視訊編碼器600。

第7圖顯示明確及隱性發信二次轉換的核心尺寸的編碼器600的部分。

第8圖概念性地顯示核心尺寸開銷分析模組800執行的開銷分析與碼字分配操作。

第9圖顯示可明確或隱性接收二次轉換核心尺寸的發信的示例視訊解碼器900。

第10圖顯示解碼器900處理二次轉換核心尺寸的明確及隱性發信的部分。

第11圖概念性顯示核心尺寸開銷分析模組1100執行的開銷分析及碼字分配操作。

第12圖概念性顯示發信二次轉換核心尺寸的流程1200。

第13圖概念性示出在本申請一些實施例中實現的電子系統1300。

在下面詳細的說明書中，為了透徹理解相關教示內容，透過舉例的方式進行大量具體的細節描述。基於本文所描述的教示內容的任何改變、推導和/或拓展均在本發明的保護範圍內。在一些例子中，為了避免不必要地混淆本發明的教示內容的方面，在相對較高的級別而無細節上描述已知的方法、程式、元件和/或關於此處所公開的一個或者複數個示例性實施方式的電路。

於JEM-4.0中，不可分離二次轉換(NSST)尺寸的選擇取決於轉換尺寸。例如，若轉換的寬度及高度都大於4，則採用8x8 NSST；否則，採用4x4 NSST。另外，當非零係數的數量大於一閾值時，採用二次轉換。當採用時，於轉換係數塊的左上8x8或更小區域，即min(8,W)×min(8,H)，上執行不可分離轉換。同時對量度與色度分量兩者採用上述轉換選擇規則且NSST核心尺寸取決於當前編解碼塊尺寸。根據JEM-4.0，NSST僅對TU的左上min(8,width)x min(8,height)區域執行NSST，即便非零係數處於該左上區域之外。這可能會導致於TU的左上min(8,width)x min(8,height)係數子集上執行多餘的NSST操作，即使非零係數處於左上min(8,width)x min(8,height)區域之外。

第1圖顯示選擇像素塊的二次轉換核心尺寸的架構。如圖所示，只要整個像素塊的非零係數的數量大於一閾值且當NSST索引不為0時，執行NSST。若塊尺寸小於8x8，則總是選擇4x4的NSST核心尺寸。若塊尺寸為8x8或更大，一旗標(NSST_kernel_size_flag)明確地於4x4的NSST核心尺寸或8x8的NSST核心尺寸之間選擇。

可是，透過經驗可決定對大於8x8的塊選擇NSST核心尺寸會帶來微小編解碼增益(碼率-失真增益，bitrate-distortion gain)但是會大幅增加編碼時間。具體地，總是使用一旗標來為大於8x8塊發信NSST核心尺寸的選擇可因為採用太多額外碼率-失真優化(rate-distortion optimization，RDO)檢查或旗標而限制了碼率-失真改善。而且，更大的塊(8x8或更大)可具有聚焦於例如4x4子塊區域的低頻區域的非零係數，使得最佳二次轉換不總是8x8 NSST。

一些本發明的實施例在解碼像素塊時提供發信二次轉換核心尺寸(例如NSST核心尺寸)之方法。二次轉換核心尺寸於特定條件下隱性推導以降低碼率。該方法也允許對除了4x4及8x8之外的二次轉換核心尺寸的選擇進行發信。當二次轉換僅施加於該TU的特定區域(或轉換係數之一特定子集)(例如左上4x4或8x8)時，僅當該特定區域內的非零轉換係數的數量大於一閾值時執行二次轉換。於該特定區域外的非零轉換係數並不計數來觸發二次轉換操作。像素塊可用幀內預測編解碼。

一些實施例中，操作該發信方法之編碼器或解碼器接收一像素塊。編碼器或解碼器決定該像素塊的轉換係數之一特定子集內的非零轉換係數的計數。當該計數大於一特定閾值時，編碼器或解碼器透過對該像素塊執行不可分離二次轉換(NSST)來編解碼該像素塊。當該計數小於該特定閾值時，編碼器或解碼器編解碼該像素塊而無需對像素塊執行NSST。

第2圖顯示對一像素塊的非零轉換係數計數以決定是否對該像素塊執行NSST。該圖顯示了示例8x8像素塊200。於編碼或解碼中，編碼器或解碼器透過幀間預測或幀內預測產生對應該塊的8x8預測像素(或預測因子)組210。像素塊200與其對應的預測像素組210之間的差值是一8x8殘差組220(每一殘差標示為‘r’)。於殘差組220上執行核心轉換(可為DCT或DST)以獲取8x8轉換係數組230。轉換係數組230被量化使得部分轉換係數量化為零。每一非零係數標示為‘C’。零係數未標示。

對於此例子，二次轉換或NSST僅對左上4x4轉換係數(區域250)執行。對於在左上4x4係數之外的係數並不執行NSST。(所示例子中，是NSST部分的係數並無陰影，而不是NSST部分的係數有陰影)。對於一些實施例，左上4x4係數(區域250)代表施加NSST於上的轉換係數的最重要子集或前16係數(前向掃描)。

為了決定是否對像素塊200執行NSST，一些實施例中的編碼器或解碼器僅對NSST會施加於上的轉換係數的子集中的非零轉換係數進行計數，所述子集即最重要或左上4x4係數(非陰影區域250內)。左上4x4外的陰影區域內的非零係數並未計數。於此例子中，在所有8x8轉換係數組230中總共有12個非零係數，可僅有7個在左上4x4中計數以決定是否對塊200執行NSST。在左上4x4之外的5個非零係數被認為是無關的且不被計數。.這樣最小化或避免對非零係數不在最重要/左上4x4內的像素塊執行NSST操作。

當子集內的非零係數計數大於一閾值時，編碼器或解碼器執行NSST(例如當計數等於或大於2時執行NSST)。若該計數小於閾值，編碼器或解碼器則不對該塊執行NSST，即使該子集外有更多非零係數。基於非零係數的計數，編碼器或解碼器推導是否執行NSST，而無需在碼流中有任何明確旗標。

所属技術領域內具有通常知識者可了解選擇8x8的像素塊200以及4x4的轉換係數子集250僅僅是用於說明。對非零轉換係數計數的技術可用於任何其他尺寸的像素塊，例如左上8x8，最重要8x8，前向掃描中的前16，48，或64轉換係數，或左上或最重要16x16或32x32，其中NSST施加於轉換係數的8x8子集上。

一些實施例中，編碼器或解碼器透過編碼/解碼一明確旗標來選擇核心尺寸，以指示/決定二次轉換的核心尺寸。發信核心尺寸的旗標並不總是需要的且在特定條件下採用，例如特定塊尺寸。一些實施例中，用於選擇核心尺寸的明確旗標當塊尺寸大於一閾值時存在。該旗標可被編碼於碼流的一片頭中，序列頭中，或圖片頭中。當塊尺寸小於閾值時，編碼器並不編碼該旗標進碼流中且解碼器並不需要碼流中有該旗標。

例如，對於8x8塊，該旗標被採用且用於選擇較佳的NSST核心尺寸。對於尺寸大於8x8的塊，NSST核心尺寸可固定為8x8或透過一SPS，PPS，或片段層(例如在對應頭中)的旗標來決定。尺寸大於8x8的塊的NSST核心尺寸也可隱性推導/得到。

一些實施例中，是否對二次轉換核心尺寸的選擇明確發信一旗標是基於塊的複雜度。換句話說，當塊的複雜度大於一閾值時，編碼器明確發信二次轉換核心尺寸的選擇的一明確旗標，解碼器也需要該旗標；否則，使用隱性機制來發信該核心尺寸選擇。更概括地，旗標是否發信/需要是由被編解碼的塊的屬性決定的。例如，一些實施例中，當轉換係數的子集的非零係數的計數大於一閾值時，核心尺寸選擇的一明確旗標被發信/需要。轉換係數的子集可為轉換係數的左上或第一子集(例如，左上或第一4x4或8x8係數)，或轉換係數的任何其他子集，或被編碼的塊的整個轉換係數。

一些實施例中，用於二次轉換核心尺寸的選擇的旗標藉由一識別核心尺寸的碼字明確發信。對於每個編碼的像素塊，編碼器與解碼器動態分配不同長度的碼字給不同可能的核心尺寸。一些實施例中，根據在不同可能核心尺寸下編解碼像素塊的相關開銷來分配碼字。最低開銷的核心尺寸被認定為預測核心尺寸並分配給最短碼字。更高開銷的核心尺寸被分配給更長碼字。換句話說，根據計算的不同核心尺寸的開銷所決定的順序來分配不同碼字給不同核心尺寸。例如，當有4個可能核心尺寸(例如4x4，8x8，16x16，及32x32)，最低開銷的核心尺寸被分配最短碼字‘0’，第二低開銷的被分配碼字‘10’，第三低開銷的被分配碼字‘110’，最高的被分配碼字‘111’。

當編碼器選擇二次轉換核心尺寸來執行二次轉換時，選擇的二次轉換核心尺寸透過被分配給選擇的二次轉換核心尺寸的碼字被發信到解碼器。解碼器透過執行與像素塊的編碼器一樣的開銷計算與碼字分配來映射接收的碼字到正確的二次轉換核心尺寸。

每當編碼器選擇來執行二次轉換的二次核心尺寸匹配預測核心尺寸時，碼率會降低因為最短碼字用來發信核心尺寸的選擇。因為基於開銷的碼字分配機制成功地為更多塊預測核心尺寸，由於二次轉換核心尺寸的明確發信所增加的碼率會降低。不同二次轉換核心尺寸的開銷計算與碼字分配會在下文參考第8至11圖進一步進行說明。

不同的實施例中的發信方法計算開銷是不一樣的。一些實施例中，透過測量重建殘值的特徵來獲取開銷。一些實施例中，透過測量塊邊界的重建像素與相鄰塊的重建像素之間的差值來獲取。一些實施例中，在計算開銷時僅測量重建殘值的子集或重建像素的子集(例如左上8x8，4x4或任何其他像素子集)。一些實施例中，每個核心尺寸的開銷透過施加該核心尺寸的逆NSST到轉換係數的子集上(例如前向掃描的前16，48，或64轉換係數，或任何其他轉換係數子集)。在子集外的轉換係數不會用來計算開銷。

編碼器與解碼器兩者都能獲取當前塊的重建殘值與重建像素。當前塊的量化轉換係數(由核心及/或二次轉換產生)被去量化然後被逆轉換(由逆二次及/核心轉換)來生成重建殘值。(殘值是指塊的源像素值與藉由幀內或幀間預測生成的塊的預測像素值之間的像素值差值；重建殘值是從轉換係數重建而來的殘值)。透過將重建殘值與塊的幀間或幀內預測生成的預測子或預測像素相加，當前塊的像素可被重建。如此的編碼器與解碼器的例子會參考下面的第6圖與第9圖進行說明。

圖中顯示了16x16像素塊的示例TU 300。該TU具有16x16轉換係數，但是只有左上8x8的轉換係數(或掃描順序中的第一64轉換係數)被用於二次轉換。如圖所示，對於TU 300，編碼器已經編碼(或解碼器已經接收)一16x16量化轉換係數組310。係數的左上8x8子集315被核心尺寸的二次轉換逆轉換為一中間轉換係數組320。子集315之外的轉換係數並未用於二次轉換的逆轉換。逆核心轉換被施加到中間轉換係數組320上以生成一16x16重建殘值組330。重建殘值組330與一組預測像素(圖未示)合併來重建一16x16重建像素組340。

一些實施例中，核心尺寸相關的開銷是基於重建殘值330計算的。一些實施例中，核心尺寸相關的開銷可基於重建殘值的子集計算，例如，重建殘值330的左上8x8子塊。子集也可用其他形狀或包含不同於左上8x8不同數量的殘值。

一些實施例中，核心尺寸相關的開銷是基於重建像素340計算的。一些實施例中，核心尺寸相關的開銷可基於重建像素的子集計算，例如，重建像素340的左上8x8子塊。子集也可用其他形狀或包含不同於左上8x8不同數量的像素。

一些實施例中，使用邊界匹配(boundary-matching)方法來計算開銷。假定重建像素與重建相鄰像素高度相關，一特定轉換核心尺寸的開銷可藉由測量邊界相似度(boundary similarity)來計算。第4圖顯示基於當前塊的重建像素與相鄰塊的重建像素(每個像素值標示為p)之間的相關來計算TU 400的開銷。一些實施例中，僅重建像素的一子集(例如重建像素340的左上8x8子塊)用來計算一特定二次轉換核心尺寸的開銷。基於重建像素的核心尺寸相關的開銷如下計算：

此開銷計算是基於沿TU上面與左面邊界(與之前重建塊的邊界)的像素。於此邊界匹配過程中，僅重建邊界像素。一些實施例中，轉換係數可被適應性縮放或選擇來進行重建。於另一實施例中，重建殘值可被適應性縮放或選擇來進行重建。

於另一實施例中，用於計算開銷的重建像素的子集可具有不同形狀且包含不同數量的像素(例如僅上面(only top)，僅上方(only above)，僅左面或其他像素集合)。於另一實施例中，使用不同開銷函數來測量邊界相似度。例如，一些實施例中，邊界匹配開銷函數可將NSST的對應幀內預測模式的方向計算在內。(每一幀內預測模式以不同旋轉角度映射到一組NSST轉換。)

一些實施例中，不同於基於重建像素執行邊界匹配，開銷是基於重建殘值的特徵來計算，例如，透過測量重建殘值的能量。第5圖顯示基於測量重建殘值的能量對TU 500開銷的計算。一些實施例，僅生成重建殘值的一子集來計算一特定二次轉換核心尺寸的開銷。開銷被計算為子集內重建殘值的絕對值之和。(每一像素處的殘值標示為r。)

不同形狀與尺寸的子集可用於生成開銷。對應於開銷計算的Cost1，Cost2，及Cost3是基於三個不同重建殘值的子集。

Cost1具體地被計算為上面列與左面的殘值的絕對值之和：

Cost2具體地被計算為殘值中心區域的絕對值之和：

Cost3具體地被計算為殘值的右下角區域的絕對值之和：

二次轉換的核心尺寸在特定條件下可被隱性地發信。一些實施例中，編碼器或解碼器在該塊的尺寸大於一閾值時，透過對該核心尺寸使用一固定值來決定該核心尺寸。例如，一些實施例中，對於尺寸大於8x8的塊，NSST核心尺寸被隱性固定在8x8所以並不明確發信。一些實施例中，像素塊的二次轉換核心尺寸可基於預測模式及/或用於編解碼像素塊的二次轉換模式來被隱性獲取，(二次轉換模式可為對應一特定旋轉角度下的HyGT轉換的索引)。例如，使用DC/Planar幀內預測模式編解碼的塊隱性地選擇4x4核心尺寸而其他預測模式編解碼的其他塊隱性地選擇8x8核心尺寸。

一些實施例中，二次轉換核心尺寸可用一預定流程來隱性發信。計算每一後選二次轉換核心尺寸的開銷。最小開銷的核心尺寸可直接被大於或等於8x8的塊採用。在解碼器側，選擇的NSST核心尺寸可藉由與編碼器使用的一樣的流程來獲取。對一些實施例而言，使用二次轉換核心尺寸相關的開銷是基於重建殘值的特徵或重建像素與相鄰塊的像素之間的邊界匹配計算的。基於重建像素或重建殘值的開銷計算已在上面參考第4與5圖進行說明。

示例視訊編碼器

第6圖顯示一隱性及明確發信二次轉換核心尺寸的示例視訊編碼器600。如圖所示，視訊編碼器600從視訊源605接收輸入視訊信號並將該信號編碼進碼流695。視訊編碼器600包含多個組件或模組，用於編碼視訊信號605，包含轉換模組610，量化模組611，逆量化模組614，逆轉換模組615，圖片內估計模組620，圖片內預測模組625，運動補償模組630，運動估計償模組635，迴路濾波器645，重建圖片緩存650，MV緩存665，MV預測模組675，熵編碼器690。

一些實施例中，模組610-690是軟體指令模組，由一計算裝置或電子設備的一或多個處理單元(例如處理器)。一些實施例中，模組610-690是硬體電路，由一電子裝置的一或多個積體電路實施。雖然模組610-690圖示為分離的模組，一些模組可合併進一個模組。

視訊源605提供原始視訊信號，其代表未經壓縮的每一視訊幀的像素資料。減法器608計算視訊源605的原始視訊像素資料與來自運動補償630或圖片內預測625的預測像素資料613之間的差值。轉換610將該差值(或殘餘像素資料或殘值信號609)轉換為轉換係數(例如執行分離餘弦轉換，或DCT)。量化器611將轉換係數量化為量化資料(或量化係數)612，其透過熵編碼器690被編碼進碼流695。

逆量化模組614逆量化該量化資料(或量化係數)612以獲取轉換係數，且該逆轉換模組615對轉換係數執行逆轉換來產生重建殘值619。重建殘值619與預測像素資料613相加，來產生重建像素資料617。一些實施例中，重建像素資料617被暫存於線緩存(圖未示)內，以用於圖片內預測與空間MV預測。重建像素透過迴路濾波器645過濾並儲存於重建圖片緩存650中。一些實施例中，重建圖片緩存650是視訊編碼器600之外的存儲器。一些實施例中，重建圖片緩存650是視訊編碼器600之內的存儲器。

圖片內估計模組620基於重建像素資料617執行幀內預測來產生幀內預測資料。幀內預測資料被提供給熵編碼器690以被編碼進碼流695。幀內預測資料也被圖片內預測模組625使用來產生預測像素資料613。

運動估計模組635透過產生MV去參考儲存於重建圖片緩存650內的先前解碼幀的像素資料來執行幀間預測。這些MV被提供給運動補償模組630來產生預測像素資料。不同於將完整實際MV編碼進碼流695，視訊編碼器600使用MV預測來生成預測MV，運動補償使用的MV與預測MV之間的差值被編碼為殘餘運動資料並存儲於碼流695內。

MV預測模組675基於用於編碼先前視訊幀而生成的參考MV生成預測MV，即用於執行運動補償的運動補償MV。MV預測模組675從來自MV緩存665的先前視訊幀取回參考MV。視訊編碼器600將從當前視訊幀生成的MV儲存到MV緩存665中作為用於生成預測MV的參考MV。

MV預測模組675使用參考MV來創建預測MV。預測MV可由空間MV預測或時間MV預測來計算。預測MV與當前幀的運動補償MV(MC MV)(殘餘運動資料)之間的差值被熵編碼器690編碼進碼流695。

熵編碼器690藉由例如上下文二進制算術編碼(context-adaptive binary arithmetic coding，CABAC)或霍夫曼編碼(Huffman encoding)的熵編碼技術將各種參數及資料編碼進碼流695。熵編碼器690將例如量化轉換資料及殘餘運動資料的參數編碼進碼流695。碼流695反過來被儲存到存儲裝置或透過例如網路的通訊媒介發送給解碼器。

迴路濾波器645對重建像素資料617執行濾波或平滑操作來減少編解碼的偽影，特別在像素塊的邊界上。一些實施例中，執行的濾波操作包含取樣適應性偏移(sample adaptive offset，SAO)。一些實施例中，濾波操作包含適應性迴路濾波器(adaptive loop filter，ALF)。

第7圖顯示明確及隱性發信二次轉換的核心尺寸的編碼器600的部分。具體地，對於每一像素塊，編碼器600決定是否執行二次轉換以及是否明確發信該二次轉換的核心尺寸。編碼器600還決定二次轉換的核心尺寸，計算不同核心尺寸的開銷，並映射碼字到不同核心尺寸。

如圖所示，轉換模組610對殘值信號609執行核心轉換與二次轉換(NSST)兩者，逆轉換模組615執行對應的逆核心轉換與逆二次轉換。編碼器600為轉換模組610與逆轉換模組615選擇核心轉換與二次轉換。編碼器600還決定二次轉換與逆二次轉換的核心尺寸。

編碼器600包含二次轉換控制模組700，核心尺寸碼字編碼模組710，以及核心尺寸開銷分析模組800。二次轉換控制模組700決定是否執行二次轉換以及是否明確或隱性地發信用於當前像素塊的二次轉換核心尺寸。二次轉換控制模組700可還決定核心尺寸。二次轉換控制模組700基於塊的尺寸(例如TU的尺寸)以及基於轉換係數的子集中的非零轉換係數的計數做出這些決定。二次轉換控制模組700賦能或禁用轉換模組610中的二次轉換與逆轉換模組615中的逆二次轉換。二次轉換控制模組700透過控制核心尺寸碼字編碼模組710來控制是否明確編碼核心尺寸。

核心尺寸碼字編碼模組710從核心尺寸開銷分析模組800接收不同核心尺寸的碼字映射890-893。核心尺寸碼字編碼模組710接收由編碼器600決定的二次轉換的核心尺寸。核心尺寸碼字編碼模組710映射選擇的核心尺寸到分配給不同可能核心尺寸的碼字其中之一。若二次轉換控制700已決定明確發信該核心尺寸而非隱性發信該核心尺寸，映射的碼字被提供給熵編碼器690以被包含於碼流695內。

第8圖概念性地顯示核心尺寸開銷分析模組800執行的開銷分析與碼字分配操作。如圖所示，核心尺寸開銷分析模組800接收當前塊的逆量化模組614的輸出，其包含逆量化轉換係數636。核心尺寸開銷分析模組800基於每個後選核心尺寸810-813(例如4x4，8x8，16x16，32x32)對轉換係數636執行逆轉換操作。核心尺寸開銷分析模組800可進一步執行其他必要的逆轉換820(例如逆核心轉換)。每個後選核心尺寸下的逆轉換的結果被作為該後選核心尺寸的重建殘值(分別是核心尺寸810-813的重建殘值830-833)。核心尺寸開銷分析模組800接著計算每個後選核心尺寸的開銷(分別為核心尺寸810-813的開銷840-843)。基於逆轉換的重建殘值及/或從重建圖片緩存650取回的像素值計算開銷。後選核心尺寸的開銷計算參考上面第3-5圖進行說明。

基於後選核心尺寸的計算的開銷的結果，核心尺寸開銷分析模組800為不同核心尺寸執行碼字分配850與碼字映射890-893。具有最小計算的開銷的後選核心尺寸被選擇或辨識為預測核心尺寸，並被分配最短碼字，這樣當預測核心尺寸與二次轉換實際使用的核心尺寸匹配時會降低碼率。其他候選核心尺寸的碼字分配是基於各自不同開銷的不同後選核心尺寸的順序。

示例視訊解碼器

第9圖顯示可明確或隱性接收二次轉換核心尺寸的發信的示例視訊解碼器900。如圖所示，視訊解碼器900是一個圖像解碼或視訊解碼電路，其接收碼流995並解碼碼流的內容為視訊幀的像素資料以輸出(如透過顯示設備955顯示)。視訊解碼器900具有用於解碼碼流995的多個組件，包含逆量化模組905，逆轉換模組915，圖片內預測模組925，運動補償模組935，迴路濾波器945，解碼圖片緩存950，MV緩存965，MV預測模組975，以及碼流解析器990。

一些實施例中，模組910-990是由計算設備的一或更多處理單元(例如處理器)執行的軟體指令模組。一些實施例中，模組910-990是由電子裝置的一個或更多IC實施的硬體電路模組。雖然模組910-990顯示為分離模組，一些模組可合並為一個模組。

解析器990(或熵解碼器entropy decoder)接收碼流995並根據由一視訊編解碼或圖像編解碼標準定義的語法執行初始解析。解析的語法元素包含各種頭元素，旗標，以及量化資料(或量化係數)912。解析器990藉由例如CABAC或霍夫曼編解碼的熵編解碼技術解析出各種語法元素。

逆量化模組905逆量化該量化資料(或量化係數)912來獲取轉換係數，且逆轉換模組915對轉換係數916執行逆轉換來產生重建殘值信號919。重建殘值信號919與來自幀內預測模組925或運動補償模組935的預測像素資料相加以產生解碼像素資料917。解碼的像素資料被迴路濾波器945濾波並儲存於解碼圖像緩存950。一些實施例中，解碼圖像緩存950是視訊解碼器900之外的存儲器。一些實施例中，解碼圖像緩存950是視訊解碼器900之內的存儲器。

圖片內預測模組925從碼流995接收幀內預測資料並根據其，從存儲於解碼圖像緩存950內的解碼像素資料917產生預測像素資料913。一些實施例中，解碼像素資料917也存儲於一線緩存(圖未示)內以用於圖片內預測與空間MV預測。

一些實施例中，解碼圖像緩存950的內容是用於顯示。顯示設備955或者直接從解碼圖像緩存950取回內容以用於顯示，或者將解碼圖像緩存的內容交給顯示緩存。一些實施例中，顯示設備955透過一像素運輸(pixel transport)從解碼圖像緩存950的接收像素值。

運動補償模組935根據運動補償MV(MC MV)從解碼圖像緩存950儲存的解碼像素資料917產生預測像素資料913。這些運動補償MV是透過將來自碼流995接收的殘值運動資料與從MV預測模組975接收的預測MV相加來被解碼。

MV預測模組975基於用於解碼先前視訊幀而生成的參考MV來生成預測MV，例如用於執行運動補償的運動補償MV。MV預測模組975從MV緩存965取回先前視訊幀的參考MV。視訊解碼器900存儲用於解碼當前視訊幀的運動補償MV進MV緩存965以做為產生預測MV的參考MV。

迴路濾波器945於解碼像素資料917上執行濾波或平滑操作以減少編解碼的偽影，特別是在像素塊的邊界處的偽影。一些實施例中，執行的濾波操作包含取樣適應性偏移(sample adaptive offset，SAO)。一些實施例中，執行的濾波操作包含適應性迴路濾波(adaptive loop filter，ALF)。

具體地，對於每個像素塊，解碼器900決定是否執行二次轉換以及是否隱性獲取核心尺寸。解碼器900還決定二次轉換的核心尺寸，計算不同核心尺寸的開銷，並分配映射到不同核心尺寸的碼字。

解碼器900包含二次轉換控制模組1000，核心尺寸碼字解碼模組1010，以及核心尺寸開銷分析模組1100。

二次轉換控制模組1000決定是否執行二次轉換並決定是否需要明確發信的核心尺寸或隱性獲取核心尺寸。二次轉換控制模組1000基於塊的尺寸(例如TU的尺寸)以及/或轉換係數的一特定子集中非零轉換係數的數量做這些決定。二次轉換控制模組1000透過對逆轉換模組915中的逆二次轉換賦能或跳過來控制是否執行該二次轉換。二次轉換控制模組1000還提供實際核心尺寸1014給逆轉換915。該實際核心尺寸1014可為由核心尺寸解碼模組1000藉由從碼流995解析核心尺寸1013的碼字而解碼的明確發信的核心尺寸1012，或是從塊尺寸及/或由二次轉換控制模組1000決定的塊內非零轉換係數的數量而獲取的隱性發信的核心尺寸。

熵解碼器990解碼碼流995且可獲得用於編碼當前像素塊的二次轉換(NSST)的核心尺寸的碼字1013。核心尺寸碼字解碼模組1010透過查找核心尺寸的碼字映射1190-1193來映射解析的碼字1013到明確發信的核心尺寸1012。

核心尺寸開銷分析模組1100透過執行不同後選核心尺寸的開銷分析提供碼字映射1190-1193，以識別分配給後選核心尺寸的碼字。第11圖概念性顯示核心尺寸開銷分析模組1100執行的開銷分析及碼字分配操作。

如圖所示，核心尺寸開銷分析模組1100接收用於當前塊的逆量化模組914的輸出，其包含逆量化轉換係數916。

核心尺寸開銷分析模組1100於轉換係數916上為每一後選核心尺寸1110-1113(例如4x4，8x8，16x16，32x32)執行逆轉換操作。核心尺寸開銷分析模組1100可進一步執行其他必要逆轉換1120(例如每一逆二次轉換後的逆核心轉換)。每一後選核心尺寸下的逆轉換結果被作為該後選核心尺寸的重建殘值(核心尺寸1110-1113分別的重建殘值1130-1133)。核心尺寸開銷分析模組1100然後計算後選核心尺寸每一的開銷(核心尺寸1110-1113分別的開銷1140-1143)。開銷的計算是基於逆轉換的重建殘值及/或從重建圖片緩存950取回的像素值(例如相鄰塊的重建像素)。後選核心尺寸的開銷計算在上面參考第3-5圖進行說明。

基於後選核心尺寸計算開銷的結果，核心尺寸開銷分析模組1100為不同核心尺寸執行碼字分配1140並產生碼字映射1190-1193。映射分配一碼字給每一後選核心尺寸。具有最低計算開銷的後選核心尺寸被選擇或識別為該預測核心尺寸並被分配最短碼字，其當預測核心尺寸與二次轉換實際使用的核心尺寸匹配時降低碼率。其他候選核心尺寸的碼字分配是基於各自不同開銷的不同後選核心尺寸的順序。

第12圖概念性顯示發信二次轉換核心尺寸的流程1200。一些實施例中，實施該編碼器600或解碼器900的一計算設備的一或多個處理單元(例如處理器)透過執行儲存於一計算機可讀媒介中的指令執行流程1200。一些實施例中，實施該編碼器600或解碼器900的一電子裝置執行流程1200。

一些實施例中，當編碼器600為儲存或傳輸而編碼一像素塊進碼流695時執行該流程1200。一些實施例中，當解碼器900從碼流995解碼一像素塊時執行該流程1200。執行該流程1200的編碼器或解碼器決定是否執行二次轉換(NSST) 以及/或逆二次轉換，是否該核心尺寸明確被發信或隱性發信，以及二次轉換的核心尺寸。

編碼器或解碼器決定(步驟1210)該像素塊的轉換係數的一特定子集(例如315)內非零係數的數量的計數。一些實施例中，轉換係數的特定子集對應於其上操作NSST轉換的轉換係數的該子集。在該子集外的轉換係數不包含在計數中因為它們不是NSST轉換的部分。該特定子集可為左上4x4或8x8轉換係數或前向掃描順序中前16，48，或64轉換係數。

該編碼器或解碼器決定(步驟1215)是否非零轉換係數的計數是否大於一閾值。一些實施例中，該閾值為二。若該計數大於一閾值，即特定子集中存在足夠的非零係數，流程進行到步驟1230。若該計數不大於該閾值，編碼器或解碼器對像素塊編碼或解碼(步驟1220)，而並不執行二次轉換。

步驟1230中，編碼器或解碼器基於一特定程序決定一NSST核心尺寸。一些實施例中，這種程序是基於塊的屬性，例如塊的尺寸，非零係數的數量，以及/或不同可能核心尺寸的開銷。一些實施例中，當塊的尺寸大於一閾值時編碼器或解碼器使用固定值用於核心尺寸。一些實施例中，編碼器或解碼器基於用來編碼該像素塊的幀內預測模式選擇核心尺寸。一些實施例中，編碼器或解碼器計算用於編解碼該像素塊的不同可能核心尺寸的每一的開銷，然後選擇對應最低開銷的核心尺寸。核心尺寸對應的開銷可透過重建該塊的一子塊的像素來計算以及透過比較重建子塊與該塊的相鄰像素來計算。

編碼器或解碼器決定(步驟1240)是否NSST核心尺寸是明確發信或隱性發信。一些實施例中，這樣的程序是基於塊的尺寸。一些實施例中，這樣的決定是基於塊的屬性，例如塊的尺寸，非零係數的數量，以及/或不同可能核心尺寸的開銷。一些實施例中，當塊的尺寸大於一閾值時，存在用於選擇核心尺寸的一明確旗標。一些實施例中，當轉換係數的一子集的非零係數的計數大於一閾值時，存在用於選擇核心尺寸的一明確旗標(這樣的閾值與決定是否有用於執行NSST的足夠數量的非零轉換係數的閾值可能相同或可能不相同)。若該核心尺寸要被隱性發信，流程進行到1260而並不明確發信。若核心尺寸要被明確發信，流程進行到1250。

步驟1250中，編碼器編碼(或解碼器解碼)識別選擇的NSST核心尺寸的碼字。不同可能的核心尺寸基於每一可能核心尺寸計算的開銷被分配不同碼字。最低開銷的核心尺寸被分配最短碼字。一些實施例中，碼字可為一旗標的部分，該旗標可編碼於一碼流的一片頭，一序列頭，或圖片頭中。流程然後進行到步驟1260。

示例電子系統

很多上述的特徵和應用可以被實現為軟體處理，其被指定為記錄在電腦可讀存儲介質(computer readable storage medium)(也被稱為電腦可讀介質)上的指令集。當這些指令由一個或者複數個計算單元或者處理單元(例如，一個或者複數個處理器、處理器核或者其他處理單元)來執行時，則這些指令使得該處理單元執行這些指令所表示的動作。電腦可讀介質的示例包括但不限於CD-ROM、快閃記憶體驅動器 (flash drive)、隨機存取記憶體(random access memory，RAM)晶片、硬碟、可讀寫可程式設計唯讀記憶體(erasable programmable read only memory，EPROM)，電可擦除可程式設計唯讀記憶體(electrically erasable programmable read-only memory，EEPROM)等。該電腦可讀介質不包括透過無線或有線連接的載波和電信號。

在本說明書中，術語“軟體”意味著包括唯讀記憶體中的韌體或者存儲在磁存儲裝置中的應用程式，該應用程式可以被讀入到記憶體中以用於處理器進行處理。同時，在一些實施例中，複數個軟體發明可以作為更大程式的子部分來實現，而保留不同的軟體發明。在一些實施例中，複數個軟體發明可以作為獨立的程式來實現。最後，一起實現此處所描述的軟體發明的獨立的程式的任何結合是在本發明的範圍內。在一些實施例中，當被安裝以在一個或者複數個電子系統上進行操作時，軟體程式定義了一個或者複數個特定的機器實現方式，該機器實現方式執行和實施該軟體程式的操作。

第13圖概念性示出在本申請一些實施例中實現的電子系統1300。電子系統1300可以是電腦(例如，臺式電腦、個人電腦、平板電腦等)、電話、PDA或者其他種類的電子設備。這個電子系統包括各種類型的電腦可讀媒質和用於各種其他類型的電腦可讀媒質的介面。電子系統1300包括匯流排1305、處理單元1310、影像處理單元((graphics-processing unit，GPU)1315、系統記憶體1320、網路1325、唯讀記憶體(read-only memory，ROM)1330、永久存儲裝置1335、輸入設備1340和輸出設備1345。

匯流排1305集體表示與大量的電子系統1300通信連接的內部設備的所有系統匯流排、外設匯流排和晶片組匯流排。例如，匯流排1305透過影像處理單元1315、唯讀記憶體1330、系統記憶體1320和永久存儲裝置1335，與處理單元1310通信連接。

對於這些各種記憶體單元，處理單元1310取回執行的指令和處理的資料，以為了執行本發明的處理。在不同實施例中，該處理單元可以是單個處理器或者多核處理器。某些指令被傳輸影像處理單元1315和並被其執行。該影像處理單元1315可以卸載各種計算或補充由處理單元1310提供的影像處理。

唯讀記憶體1330存儲處理單元1310或者電子系統的其他模組所需要的靜態資料和指令。另一方面，永久存儲裝置1335是一種讀寫記憶體設備(read-and-write memory)。這個設備是一種非易失性(non-volatile)記憶體單元，其即使在電子系統1300關閉時也存儲指令和資料。本發明的一些實施例使用大容量存儲設備(例如磁片或光碟及其相應的磁碟機)作為永久存儲裝置1335。

其他實施例使用卸載式存儲裝置設備(如軟碟、快閃記憶體設備等，以及其相應的磁碟機)作為該永久存儲裝置。與永久存儲裝置1335一樣，系統記憶體1320是一種讀寫記憶體設備。但是，與存儲裝置1335不一樣的是，該系統記憶體1320是一種易失性(volatile)讀寫記憶體，例如隨機讀取記憶體。系統記憶體1320存儲一些處理器在運行時需要的指令和資料。在一些實施例中，根據本發明的處理被存儲在該系統記憶體1320、永久存儲裝置1335和/或唯讀記憶體1330中。例如，各種記憶體單元包括用於根據一些實施例的處理多媒體剪輯的指令。對於這些各種記憶體單元，處理單元1310取回執行的指令和處理的資料，以為了執行某些實施例的處理。

匯流排1305也連接到輸入設備1340和輸出設備1345。該輸入設備1340使得使用者溝通資訊並選擇指令到該電子系統上。該輸入設備1340包括字母數位元鍵盤和指點設備(也被稱為“遊標控制設備”)，攝像機(如網路攝像機(webcam))，用於接收語音命令的麥克風或類似的設備等。輸出設備1345顯示由電子系統生成的圖像或以其他方式輸出的資料。輸出設備1345包括印表機和顯示裝置，例如陰極射線管(cathode ray tube，CRT)或液晶顯示器(liquid crystal display，LCD)，以及揚聲器或類似的音訊輸出設備。一些實施例包括諸如同時用作輸入設備和輸出設備的觸控式螢幕等設備。

最後，如第13圖所示，匯流排1305也透過網路介面卡(未示出)將電子系統1300耦接到網路1325。在這個方式中，電腦可以是電腦網路(例如，局域網(local area network，LAN)、廣域網路(wide area network，WAN)或者內聯網)或者網路的網路(例如互聯網)的一部分。電子系統1300的任一或者所有元件可以與本發明結合使用。

一些實施例包括電子元件，例如，微處理器、存儲裝置和記憶體，其將電腦程式指令存儲到機器可讀介質或者電腦可讀介質(可選地被稱為電腦可讀存儲介質、機器可讀介質或者機器可讀存儲介質)。電腦可讀介質的一些實例包括RAM、ROM、唯讀光碟(read-only compact disc，CD-ROM)，可燒錄光碟(recordable compact disc，CD-R)、可讀寫光碟(rewritable compact disc，CD-RW)、唯讀數位通用光碟(read-only digital versatile disc)(例如，DVD-ROM，雙層DVD-ROM)、各種可記錄/可讀寫DVD(例如DVD RAM、DVD-RW、DVD+RW等)、快閃記憶體(如SD卡、迷你SD卡，微SD卡等)、磁性和/或固態硬碟、唯讀和可燒錄藍光®(Blu-Ray®)盤、超高密度光碟和其他任何光學介質或磁介質，以及軟碟。電腦可讀介質可以存儲由至少一個處理單元執行的電腦程式，並且包括用於執行各種操作的指令集。電腦程式或電腦代碼的示例包括機器代碼，例如編譯器產生的機器代碼，以及包含由電腦、電子元件或微處理器使用注釋器(interpreter)而執行的高級代碼的文檔。

當以上討論主要是指執行軟體的微處理器或多核處理器時，很多上述的功能和應用程式由一個或複數個積體電路執行，如特定應用的積體電路(application specific integrated circuit，ASIC)或現場可程式設計閘陣列(field programmable gate array，FPGA)。在一些實施例中，這種積體電路執行存儲在該電路本身上的指令。此外，一些實施例執行存儲在可程式設計邏輯器件(programmable logic device，PLD)，ROM或 RAM設備中的軟體。

如本發明的說明書和任一請求項中所使用，術語“電腦”、“伺服器”、“處理器”和“記憶體”均指電子設備或其他技術設備。這些術語不包括人或群體。為了本說明書的目的，術語顯示或顯示裝置指在電子設備上進行顯示。如本發明的說明書和任一請求項中所使用，術語“電腦可讀介質”、“電腦可讀媒質”和“機器可讀介質”完全局限於有形的、實體的物體，其以電腦可讀的形式存儲資訊。這些術語不包括任何無線信號、有線下載信號和其他任何短暫信號。

在結合許多具體細節的情況下描述了本發明時，本領域通常知識者將認識到，本發明可以以其他具體形式而被實施，而不脫離本發明的精神。此外，大量的圖(包括第1圖和第12圖)概念性示出了處理。這些處理的具體操作可以不以所示以及所描述的確切順序來被執行。這些具體操作可用不在一個連續的操作系列中被執行，並且不同的具體操作可以在不同的實施例中被執行。另外，該處理透過使用幾個子處理而被實現，或者作為更大巨集處理的部分。因此，本領域通常知識者將能理解的是，本發明不受前述說明性細節的限制，而是由請求項加以界定。

附加的說明

本文所描述的主題有時表示不同的元件，其包含在或者連接到其他不同的元件。可以理解的是，所描述的結構僅是示例，實際上可以由許多其他結構來實施，以實現相同的功能。從概念上講，任何實現相同功能的組件的排列實際上是 “相關聯的”，以便實現所需的功能。因此，不論結構或中間部件，為實現特定的功能而組合的任何兩個元件被視為“相互關聯”，以實現所需的功能。同樣，任何兩個相關聯的元件被看作是相互“可操作連接”或“可操作耦接”，以實現特定功能。能相互關聯的任何兩個組件也被視為相互“可操作地耦合”以實現特定功能。可操作連接的具體例子包括但不限於物理可配對和/或物理上相互作用的元件，和/或無線可交互和/或無線上相互作用的元件，和/或邏輯上相互作用和/或邏輯上可交互的元件。

此外，關於基本上任何複數和/或單數術語的使用，本領域的技術人員可以根據上下文和/或應用從複數轉換為單數和/或從單數到複數。為清楚起見，本文明確規定了不同的單數/複數排列。

此外，本領域的通常知識者可以理解，通常，本發明所使用的術語特別是請求項中的，如請求項的主題，通常用作“開放”術語，例如，“包括”應解釋為“包括但不限於，“有”應理解為“至少有”“包括”應解釋為“包括但不限於”等。本領域的通常知識者可以進一步理解，若計畫介紹特定數量的請求項內容，將在請求項內明確表示，並且，在沒有這類內容時將不顯示。例如，為幫助理解，下面請求項可能包含短語“至少一個”和“一個或複數個”，以介紹請求項內容。然而，這些短語的使用不應理解為暗示使用不定冠詞“a”或“an”介紹請求項內容，而限制了任何特定的請求項。甚至當相同的請求項包括介紹性短語“一個或複數個”或“至少有一個”，不定冠詞，例如“a”或“an”，則應被解釋為表示至少一個或者更多，對於用於介紹請求項的明確描述的使用而言，同樣成立。此外，即使明確引用特定數量的介紹性內容，本領域通常知識者可以認識到，這樣的內容應被解釋為表示所引用的數量，例如，沒有其他修改的“兩個引用”，意味著至少兩個引用，或兩個或兩個以上的引用。此外，在使用類似於“A、B和C中的至少一個”的表述的情況下，通常如此表述是為了本領域通常知識者可以理解該表述，例如，“系統包括A、B和C中的至少一個”將包括但不限於單獨具有A的系統，單獨具有B的系統，單獨具有C的系統，具有A和B的系統，具有A和C的系統，具有B和C的系統，和/或具有A、B和C的系統，等。本領域通常知識者進一步可理解，無論在說明書中、請求項中或者附圖中，由兩個或兩個以上的替代術語所表現的任何分隔的單詞和/或短語應理解為，包括這些術語中的一個，其中一個，或者這兩個術語的可能性。例如，“A或B”應理解為，“A”，或者“B”，或者“A和B”的可能性。

從前述可知，為了說明目的，此處已描述了各種實施方案，並且在不偏離本發明的範圍和精神的情況下，可以進行各種變形。因此，此處所公開的各種實施方式不用於限制，專利申請範圍表示真實的範圍和精神。

Claims

一種執行不可分離二次轉換方法，包含：接收一像素塊；決定該像素塊之轉換係數之一特定子集中非零轉換係數之一計數；當該計數大於一特定閾值時，透過為該像素塊執行不可分離二次轉換來編解碼該像素塊以輸出；以及當該計數小於該特定閾值時，編解碼該像素塊以輸出，而不為該像素塊執行不可分離二次轉換；從複數可能核心尺寸中為該像素塊選擇用於該不可分離二次轉換之一核心尺寸；當該塊的尺寸不大於第一閾值時，基於該塊的該尺寸隱性獲取該核心尺寸。
如申請專利範圍第1項所述之方法，其中該像素塊由幀內預測所編碼。
如申請專利範圍第1項所述之方法，其中該子集之外的轉換係數並不包含於該計數內。
如申請專利範圍第1項所述之方法，其中轉換係數之該特定子集包含於前向掃描中前16，48或64轉換係數，或該像素塊一轉換單元之左上4x4或8x8的轉換係數。
如申請專利範圍第1項所述之方法，其中轉換係數之該特定子集包含不可分離二次轉換執行於其上的轉換係數。
一種執行不可分離二次轉換方法，包含：接收一像素塊；編解碼該像素塊以輸出，其中採用不可分離二次轉換來轉換該像素塊之系數；以及從複數可能核心尺寸中為該像素塊選擇用於該不可分離二次轉換之一核心尺寸；當該塊的尺寸不大於第一閾值時，基於該塊的該尺寸隱性獲取該核心尺寸。
如申請專利範圍第6項所述之方法，其中選擇該核心尺寸的步驟包含：當該塊的尺寸大於第二閾值時，隱性獲取該核心尺寸之一固定值。
如申請專利範圍第6項所述之方法，其中該核心尺寸基於該像素塊的一幀內預測模式隱性獲取。
如申請專利範圍第6項所述之方法，其中該核心尺寸基於用於編解碼該像素塊之該等核心尺寸之每一相關之開銷來隱性獲取，其中該選擇的核心尺寸是與一最低開銷相關之核心尺寸。
如申請專利範圍第9項所述之方法，其中計算與一核心尺寸相關的開銷包含：對轉換係數的一子集採用具有該核心尺寸的逆不可分離二次轉換。
如申請專利範圍第9項所述之方法，其中與一核心尺寸相關的開銷是透過基於具有該核心尺寸的不可分離二次轉換來重建該塊的複數像素以及透過比較該塊之該等重建像素與一相鄰塊之重建像素來計算。
如申請專利範圍第9項所述之方法，其中與一核心尺寸相關的開銷是透過基於具有該核心尺寸的不可分離二次轉換來重建該塊的複數殘值以及透過測量該等重建殘值之一能量來計算。
如申請專利範圍第6項所述之方法，其中選擇該核心尺寸的步驟包含：包括指示一碼流內之該選擇核心尺寸之一旗標，或當該塊的尺寸大於該閾值時從該碼流解析指示該選擇核心尺寸之該旗標。
如申請專利範圍第13項所述之方法，其中該旗標是位於該碼流的片頭中，序列頭中，或圖片頭中。
如申請專利範圍第13項所述之方法，其中選擇該核心尺寸的步驟包含：當該塊的該尺寸不大於該閾值時，不包含或解析該旗標。
如申請專利範圍第13項所述之方法，其中選擇該核心尺寸的步驟包含：基於一預定準則獲取該核心尺寸而不包含或解析該旗標。
如申請專利範圍第6項所述之方法，其中選擇該核心尺寸的步驟包含：當該轉換係數之一子集內的非零係數的一計數大於一閾值時，包括指示該選擇核心尺寸的一旗標進一碼流或從該碼流解析指示該選擇核心尺寸的該旗標。
如申請專利範圍第6項所述之方法，其中選擇該核心尺寸的步驟包含對識別該核心尺寸的一碼字編碼或解碼，其中不同可能核心尺寸基於該可能核心尺寸的每一計算的開銷被分配不同碼字，其中最低開銷的核心尺寸被分配一最短碼字。
如申請專利範圍第18項所述之方法，其中與一核心尺寸相關之開銷是透過對轉換係數的一子集採用具有該核心尺寸的逆不可分離二次轉換來計算。
如申請專利範圍第18項所述之方法，其中與一核心尺寸相關的開銷是透過基於具有該核心尺寸的不可分離二次轉換來重建該塊的複數像素以及透過比較該塊之該等重建像素與一相鄰塊之重建像素來計算。
如申請專利範圍第9項所述之方法，其中與一核心尺寸相關的開銷是透過基於具有該核心尺寸的不可分離二次轉換來重建該塊的複數殘值以及透過測量該等重建殘值之一能量來計算。
一種電子裝置，包含：一視訊編碼器電路，用於：編碼一像素塊為一組轉換係數；決定該轉換係數的一特定子集內非零轉換係數之計數；當該計數大於一特定閾值時，基於該組轉換係數，透過執行不可分離二次轉換來編碼該像素塊；當該計數小於該特定閾值時，編碼該像素塊而不為該像素塊執行不可分離二次轉換；從複數可能核心尺寸中為該像素塊選擇用於該不可分離二次轉換之一核心尺寸；當該塊的尺寸不大於第一閾值時，基於該塊的該尺寸隱性獲取該核心尺寸；以及儲存或傳數編碼之該像素塊進一碼流。
一種電子裝置，包含：一視訊解碼器電路，用於：接收包含一編碼像素塊之一碼流；決定該像素塊的轉換係數的一特定子集內非零轉換係數之計數；當該計數大於一特定閾值時，透過對該像素塊執行不可分離二次轉換來解碼該像素塊；當該計數小於該特定閾值時，解碼該像素塊而不為該像素塊執行不可分離二次轉換；從複數可能核心尺寸中為該像素塊選擇用於該不可分離二次轉換之一核心尺寸；當該塊的尺寸不大於第一閾值時，基於該塊的該尺寸隱性獲取該核心尺寸；以及輸出解碼之該像素塊。
一種電子裝置，包含：一視訊解碼器電路，用於：接收一像素塊；編碼該像素塊以傳輸或解碼該像素塊以輸出，其中採用不可分離二次轉換來轉換該像素塊之系數；以及發信一核心尺寸的選擇，該核心尺寸是從複數可能核心尺寸中為該像素塊用於該不可分離二次轉換而選擇的；當該塊的尺寸不大於第一閾值時，基於該塊的該尺寸隱性獲取該核心尺寸。