TWI520584B - 用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素 - Google Patents

用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素 Download PDF

Info

Publication number
TWI520584B
TWI520584B TW101123629A TW101123629A TWI520584B TW I520584 B TWI520584 B TW I520584B TW 101123629 A TW101123629 A TW 101123629A TW 101123629 A TW101123629 A TW 101123629A TW I520584 B TWI520584 B TW I520584B
Authority
TW
Taiwan
Prior art keywords
subset
syntax element
video
zero coefficients
coefficients
Prior art date
Application number
TW101123629A
Other languages
English (en)
Other versions
TW201309032A (zh
Inventor
馬塔 卡茲維克茲
王翔林
郭立威
Original Assignee
高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 高通公司 filed Critical 高通公司
Publication of TW201309032A publication Critical patent/TW201309032A/zh
Application granted granted Critical
Publication of TWI520584B publication Critical patent/TWI520584B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素
本發明係關於視訊編碼及壓縮。更特定言之,本發明係針對用於掃描經量化之轉換係數之技術。
本申請案主張2011年6月30日申請之美國臨時申請案第61/503,541號及2011年10月27日申請之美國臨時申請案第61/552,341號之權利,該等申請案中每一者之全文以引用的方式併入本文中。
數位視訊能力可併入至廣泛範圍之器件中,該等器件包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、平板型電腦、電子書閱讀器、數位攝影機、數位記錄器件、數位媒體播放器、視訊遊戲器件、視訊遊戲控制台、蜂巢式或衛星無線電電話、所謂的「智慧型電話」、視訊電傳會議器件、視訊串流器件,及其類似者。數位視訊器件實施諸如描述於以下各者中之視訊壓縮技術的視訊壓縮技術:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(進階視訊編碼(AVC))定義之標準、目前在開發中的高效率視訊編碼(HEVC)標準,及此等標準之擴展。視訊器件可藉由實施此等視訊壓縮技術而較有效率地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中所固有之冗餘。對於基於區 塊之視訊編碼,可將一視訊切片(亦即,視訊圖框或視訊圖框之一部分)分割成多個視訊區塊,視訊區塊亦可被稱作樹型區塊、編碼單元(CU)及/或編碼節點。使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測來編碼圖像之框內編碼(I)切片中的視訊區塊。圖像之框間編碼(P或B)切片中之視訊區塊可使用相對於同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於其他參考圖像中之參考樣本之時間預測。圖像可被稱作圖框,且參考圖像可被稱作參考圖框。
空間或時間預測產生待編碼之區塊的預測性區塊。殘餘資料表示待編碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經編碼區塊與預測性區塊之間的差異之殘餘資料來編碼框間編碼區塊。根據框內編碼模式及殘餘資料來編碼框內編碼區塊。為進行進一步壓縮,可將殘餘資料自像素域轉換至轉換域,從而產生殘餘轉換係數,可接著量化殘餘轉換係數。可掃描最初配置成二維陣列之經量化之轉換係數以便產生轉換係數之一維向量,且可應用熵編碼以達成甚至更多的壓縮。
在視訊編碼中,為了壓縮用以表示視訊資料之資料之量,視訊編碼器可熵編碼視訊資料。根據本文中所描述之技術,作為熵編碼之部分,視訊編碼器將視訊資料之葉層級單元劃分成複數個轉換係數子集。如本文中所描述之葉 層級單元指代視訊資料結構之未***單元,其之一個實例為四分樹資料結構之最後未***子代節點,如下文所進一步詳細描述。
針對子集中之至少一者,編碼器產生指示該子集是否包括任何非零係數之語法元素作為經熵編碼之位元串流之部分。編碼器判定是否用信號發送用於複數個轉換係數子集中之一子集的語法元素。舉例而言,編碼器可基於子集內之潛在非零係數之數目或基於子集之非零係數之平均數目而判定是否用信號發送語法元素,該平均數目係基於對視訊資料之一或多個先前經編碼之葉層級單元的統計。
解碼器可讀取經熵編碼之位元串流,且基於語法元素判定是否解碼子集之轉換係數。在一些實例中,解碼器可基於經熵編碼之位元串流是否包括與轉換係數之子集相關聯的語法元素而判定是否解碼該子集。舉例而言,若該子集不包括相關聯之語法元素,則解碼器解碼該子集。然而,若該子集確實包括相關聯之語法元素,則解碼器基於該語法元素之值判定是否解碼該子集。舉例而言,若該語法元素具有第一值,則解碼器解碼該子集;但若該語法元素具有第二不同值,則解碼器不解碼該子集。
在一些實例中,本發明之技術可改良編碼器或解碼器之編碼效率。舉例而言,本文中所描述之技術可減少由編碼器使用以產生表示視訊資料之經熵編碼之位元串流的位元之數目。
在一實例中,一種用於編碼視訊資料之一單元的方法包 含:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;及針對該複數個轉換係數子集中之一子集產生指示該子集是否包括任何非零係數之一語法元素。
在另一實例中,一種器件可經組態以編碼視訊資料之至少一葉層級單元。該器件可包含一處理器,該處理器經組態以將視訊資料之一葉層級單元劃分成複數個轉換係數子集,且針對該複數個轉換係數子集中之一子集產生指示該子集是否包括任何非零係數之一語法元素。
在另一實例中,一種器件可經組態以編碼視訊資料之至少一葉層級單元,該器件包含:用於將視訊資料之一葉層級單元劃分成複數個轉換係數子集之構件;及用於針對該複數個轉換係數子集中之一子集產生指示該子集是否包括任何非零係數之一語法元素之構件。
在另一實例中,一種用於解碼視訊資料之一單元的方法包含:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定該子集是否包括指示該子集是否包括任何非零係數之一相關聯之語法元素;基於該語法元素判定是否解碼該子集。
在另一實例中,一種器件可經組態以解碼視訊資料之一單元,該器件包含一處理器,該處理器經組態以執行以下操作:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定該子集是否包括指示該子集是否包括任何非零係數之一相關聯之語法元素;及基於該語法元素判定是否解碼該子集。
在另一實例中,一種器件可經組態以解碼視訊資料之一單元,該器件包含:用於將視訊資料之一葉層級單元劃分成複數個轉換係數子集之構件;用於針對該複數個轉換係數子集中之一子集判定該子集是否包括指示該子集是否包括任何非零係數之一語法元素之構件;及用於基於該語法元素判定是否解碼該子集之構件。
可以硬體、軟體、韌體或其任何組合來實施本發明中所描述之技術。舉例而言,各種技術可藉由一或多個處理器來實施或執行。如本文中所使用,處理器可指代微處理器、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、數位信號處理器(DSP),或其他等效的整合或離散邏輯電路。軟體可藉由一或多個處理器來執行。包含用以執行該等技術之指令的軟體可最初儲存於電腦可讀媒體中且藉由處理器載入並執行。
因此,本發明亦預期包含指令之電腦可讀儲存媒體,該等指令用以使處理器(或其他計算器件)執行本發明中所描述之任何技術。在一些狀況下,該電腦可讀儲存媒體可形成一電腦程式儲存產品之部分,可將該電腦程式儲存產品售賣給製造商及/或用於器件中。該電腦程式產品可包括該電腦可讀媒體,且在一些狀況下亦可包括封裝材料。
在一實例中,本發明描述一種儲存指令之電腦可讀儲存媒體,該等指令在執行時使一計算器件執行以下操作:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;及針對該複數個轉換係數子集中之一子集產生指示該子集是 否包括任何非零係數之一語法元素。
在另一實例中,本發明描述一種儲存指令之電腦可讀儲存媒體,該等指令在執行時使一計算器件執行以下操作:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定該子集是否包括指示該子集是否包括任何非零係數之一相關聯之語法元素;及基於該語法元素判定是否解碼該子集。
在隨附圖式及下文之描述中闡述一或多個實例之細節。本發明之其他特徵、目標及優點將自描述及圖式以及自申請專利範圍顯而易見。
圖1為說明可利用本發明中所描述之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1中所展示,系統10包括源器件12,源器件12產生稍後待由目的地器件14解碼之經編碼視訊資料。源器件12及目的地器件14可包含廣泛範圍之器件中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板型電腦、機上盒、電話手機(諸如,所謂的「智慧型」電話)、所謂的「智慧型」板(smart pad,即平板電腦)、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件,或其類似者。在一些狀況下,可裝備源器件12及目的地器件14來進行無線通信。
目的地器件14可經由鏈路16接收待解碼之經編碼視訊資料。鏈路16可包含能夠將經編碼視訊資料自源器件12移至 目的地器件14之任何類型的媒體或器件。在一實例中,鏈路16可包含用以使源器件12能夠將經編碼視訊資料直接即時傳輸至目的地器件14之通信媒體。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將經編碼視訊資料傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全球網路)的部分。通信媒體可包括路由器、交換器、基地台,或可用以促進自源器件12至目的地器件14之通信的任何其他設備。
或者,可將經編碼資料自輸出介面22輸出至儲存器件32。類似地,可藉由輸入介面28自儲存器件32存取經編碼資料。儲存器件32可包括多種分散式或本端存取之資料儲存媒體中的任一者,諸如硬碟、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體,或用於儲存經編碼視訊資料之任何其他合適的數位儲存媒體。在另一實例中,儲存器件32可對應於檔案伺服器或可保存由源器件12產生之經編碼視訊之另一中間儲存器件。目的地器件14可經由串流傳輸或下載而自儲存器件32存取經儲存視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將該經編碼視訊資料傳輸至目的地器件14之任何類型的伺服器。實例檔案伺服器包括web伺服器(例如,針對網站)、FTP伺服器、網路附接儲存(NAS)器件,或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連 接)而存取經編碼視訊資料。此資料連接可包括適合於存取儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等),或兩者之組合。經編碼視訊資料自儲存器件32之傳輸可為串流傳輸、下載傳輸,或兩者之組合。
本發明之技術未必限於無線應用或設定。該等技術可應用於支援諸如以下應用的多種多媒體應用中之任一者的視訊編碼:空中電視廣播、有線電視傳輸、衛星電視傳輸、(例如)經由網際網路之串流視訊傳輸、儲存於資料儲存媒體上之數位視訊之編碼、儲存於資料儲存媒體上之數位視訊之解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸以支援諸如視訊串流傳輸、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些狀況下,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源器件12中,視訊源18可包括諸如以下各者之源:視訊俘獲器件(例如,視訊攝影機)、含有先前俘獲之視訊的視訊封存檔、用以自視訊內容提供者接收視訊之視訊饋入介面,及/或用於產生電腦圖形資料作為源視訊之電腦圖形系統,或此等源之組合。作為一實例,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的攝影機電話或視訊電話。然而,本發明中所描述之技術可一般適用於視訊編碼,且可應用於無線及/或有線應用。
可藉由視訊編碼器20編碼經俘獲之視訊、經預先俘獲之視訊或電腦產生之視訊。可經由源器件12之輸出介面22將經編碼視訊資料直接傳輸至目的地器件14。亦可(或替代地)將經編碼視訊資料儲存至儲存器件32上以供目的地器件14或其他器件稍後存取以用於解碼及/或播放。
目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些狀況下,輸入介面28可包括接收器及/或數據機。目的地器件14之輸入介面28經由鏈路16接收經編碼視訊資料。經由鏈路16而傳達或提供於儲存器件32上之經編碼視訊資料可包括由視訊編碼器20產生的供視訊解碼器(諸如,視訊解碼器30)用於解碼視訊資料的多種語法元素。此等語法元素可包括於在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器上之經編碼視訊資料中。
顯示器件32可與目的地器件14整合或在目的地器件14外部。在一些實例中,目的地器件14可包括整合式顯示器件,且亦經組態以與外部顯示器件介接。在其他實例中,目的地器件14可為顯示器件。一般而言,顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中之任一者,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據諸如目前在開發中的高效率視訊編碼(HEVC)標準之視訊壓縮標準而操作,且可符合HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準之其他專屬或工 業標準或此等標準之擴展而操作,H.264標準替代地被稱作MPEG-4第10部分(進階視訊編碼(AVC))。然而,本發明之技術不限於任何特定編碼標準。視訊壓縮標準之其他實例包括MPEG-2及ITU-T H.263。
儘管未在圖1中展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當的多工器-解多工器(MUX-DEMUX)單元或其他硬體及軟體,以處置一共同資料串流或若干單獨資料串流中之音訊及視訊兩者的編碼。在一些實例中,若適用,則MUX-DEMUX單元可符合ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
視訊編碼器20及視訊解碼器30各自可實施為諸如以下各者之多種合適編碼器電路中之任一者:一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分地以軟體實施時,器件可將軟體指令儲存於合適的非暫時電腦可讀媒體中,且使用一或多個處理器以硬體執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,其中之任一者可整合為各別器件中之組合式編碼器/解碼器(CODEC)的部分。
JCT-VC致力於HEVC標準之開發。HEVC標準化努力係基於視訊編碼器件之演進模型,其被稱作HEVC測試模型(HM)。HM假設視訊編碼器件相對於根據(例如)ITU-T H.264/AVC之現有器件的若干額外能力。舉例而言,H.264提供九個框內預測編碼模式,而HM可提供多達三十三個框內預測編碼模式。
一般而言,HM之工作模型描述視訊圖框或圖像可劃分成包括明度樣本及色度樣本兩者之樹型區塊或最大編碼單元(LCU)之序列。樹型區塊之用途與H.264標準之巨集區塊類似。切片包括按編碼次序之多個連續樹型區塊。視訊圖框或圖像可分割成一或多個切片。每一樹型區塊可根據四分樹而***成若干編碼單元(CU)。舉例而言,樹型區塊(作為四分樹之根節點)可***成四個子代節點,且每一子代節點可又為父節點且***成另外四個子代節點。最後未***之子代節點(作為四分樹之葉節點)包含編碼節點,亦即,經編碼視訊區塊。視訊資料結構之此最後未***之子代節點在本文被稱作葉層級單元。與經編碼位元串流相關聯之語法資料可定義樹型區塊可***之最大次數,且亦可定義編碼節點之最小大小。
一CU包括一編碼節點及與該編碼節點相關聯之若干預測單元(PU)及轉換單元(TU)。CU之大小對應於編碼節點之大小,且形狀必須為正方形。CU之大小可在自8×8像素直至具有最大64×64像素或大於64×64像素的樹型區塊之大小的範圍內。每一CU可含有一或多個PU及一或多個TU。與CU相關聯之語法資料可描述(例如)CU至一或多個PU之分割。在CU經跳過或直接模式編碼、經框內預測模式編碼抑或經框間預測模式編碼之間,分割模式可不同。PU可 分割成非正方形形狀。與CU相關聯之語法資料亦可描述(例如)CU根據四分樹而至一或多個TU之分割。TU之形狀可為正方形或非正方形。
HEVC標準允許根據TU之轉換,其針對不同CU可不同。通常基於針對經分割LCU所定義之給定CU內之PU的大小而設定TU大小,但可能並非總是如此。TU通常具有與PU相同的大小,或小於PU。在一些實例中,可使用稱為「殘餘四分樹」(RQT)之四分樹結構將對應於CU之殘餘樣本再分成若干較小單元。RQT之葉節點可被稱作轉換單元(TU)。此葉節點TU為如本文中所描述之葉層級單元之一實例。可轉換與TU相關聯之像素差值以產生轉換係數,可量化該等轉換係數。
一般而言,PU包括與預測程序有關之資料。舉例而言,當PU經框內模式編碼時,PU可包括描述該PU之框內預測模式之資料。作為另一實例,當PU經框間模式編碼時,PU可包括定義該PU之運動向量之資料。定義PU之運動向量之資料可描述(例如)運動向量之水平分量、運動向量之垂直分量、運動向量之解析度(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖像,及/或運動向量之參考圖像清單(例如,清單0、清單1或清單C)。
一般而言,TU用於轉換程序及量化程序。具有一或多個PU之給定CU亦可包括一或多個轉換單元(TU)。在預測之後,視訊編碼器20可計算對應於PU之殘餘值。殘餘值包 含可轉換成轉換係數之像素差值,使用TU量化及掃描轉換係數以產生串列化之轉換係數從而用於熵編碼。本發明通常使用術語「視訊區塊」來指代CU之編碼節點。在一些特定狀況下,本發明亦可使用術語「視訊區塊」來指代包括一編碼節點及若干PU及TU的樹型區塊(亦即,LCU或CU)。
視訊序列通常包括一系列視訊圖框或圖像。圖像群組(GOP)一般包含一系列一或多個視訊圖像。GOP可在GOP之標頭、圖像中之一或多者之標頭中或在別處包括語法資料,該語法資料描述包括於GOP中之圖像的數目。圖像之每一切片可包括描述該各別切片之編碼模式的切片語法資料。視訊編碼器20通常對個別視訊切片內之視訊區塊進行操作,以便編碼視訊資料。視訊區塊可對應於CU內之編碼節點。視訊區塊可具有固定或變化之大小,且可根據指定編碼標準而在大小方面不同。
作為一實例,HM支援以各種PU大小進行預測。假定特定CU之大小為2N×2N,則HM支援以2N×2N或N×N之PU大小進行框內預測,及以2N×2N、2N×N、N×2N或N×N之對稱PU大小進行框間預測。HM亦支援以2N×nU、2N×nD、nL×2N及nR×2N之PU大小進行框間預測之不對稱分割。在不對稱分割中,CU之一方向未分割,而另一方向分割成25%及75%。CU之對應於25%分割之部分由「n」繼之以「U(上)」、「D(下)」、「L(左)」或「R(右)」之指示來指示。因此,例如,「2N×nU」指代在水平方向上以頂部 2N×0.5N PU及底部2N×1.5N PU分割之2N×2N CU。
在本發明中,「N×N」與「N乘N」可互換使用以指代視訊區塊在垂直尺寸與水平尺寸方面之像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16區塊將在垂直方向上具有16個像素(y=16)且在水平方向上具有16個像素(x=16)。同樣地,N×N區塊一般在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示非負整數值。可以列及行配置區塊中之像素。此外,區塊未必需要在水平方向上具有與垂直方向上相同數目個像素。舉例而言,區塊可包含N×M個像素,其中M未必等於N。
在使用CU之PU進行框內預測性或框間預測性編碼之後,視訊編碼器20可計算CU之TU之殘餘資料。PU可包含空間域(亦被稱作像素域)中之像素資料,且TU可包含在將例如離散餘弦轉換(DCT)、整數轉換、小波轉換或概念上類似之轉換的轉換應用於殘餘視訊資料之後轉換域中之係數。殘餘資料可對應於未經編碼圖像之像素與對應於PU之預測值之間的像素差。視訊編碼器20可形成包括CU之殘餘資料的TU,且接著轉換該等TU以產生CU之轉換係數。
在用以產生轉換係數之任何轉換之後,視訊編碼器20可執行轉換係數之量化。量化一般指代如下程序:將轉換係數量化以可能地減少用以表示該等係數之資料之量,從而提供進一步壓縮。量化程序可減小與該等係數中之一些或全部相關聯的位元深度。舉例而言,n位元值在量化期間可降值捨位至m位元值,其中n大於m
在一些實例中,視訊編碼器20可利用預定義之掃描次序來掃描經量化之轉換係數以產生可經熵編碼之串列化向量。在其他實例中,視訊編碼器20可執行自適應性掃描。在掃描經量化之轉換係數以形成一維向量之後,視訊編碼器20可(例如)根據內容脈絡自適應性可變長度編碼(CAVLC)、內容脈絡自適應性二進位算術編碼(CABAC)、基於語法之內容脈絡自適應性二進位算術編碼(SBAC)、機率區間分割熵(PIPE)編碼或另一熵編碼方法而熵編碼一維向量。視訊編碼器20亦可熵編碼與經編碼視訊資料相關聯之語法元素以供視訊解碼器30用於解碼視訊資料。
為了執行CABAC,視訊編碼器20可將內容脈絡模型內之內容脈絡指派給待傳輸之符號。該內容脈絡可能係關於(例如)符號之相鄰值是否為非零。為了執行CAVLC,視訊編碼器20可針對待傳輸之符號選擇一可變長度碼。可將VLC中之碼字建構成使得相對較短碼對應於更有可能的符號,而較長碼對應於較不可能的符號。以此方式,相較於(例如)針對待傳輸之每一符號使用相等長度之碼字,使用VLC可達成位元節省。機率判定可基於指派給符號之內容脈絡而進行。
根據本發明,源器件12之視訊編碼器20可將包括轉換係數(例如,其各自對應於所顯示影像之像素)之二維矩陣的視訊資料之葉層級單元(例如,四分樹或其他資料結構之葉節點)之轉換係數掃描至表示該等轉換係數之一維向量中。根據本文中所描述之技術,在執行此掃描時,視訊編 碼器20可將視訊資料之葉層級單元劃分成複數個轉換係數子集。針對葉層級單元之該等子集中的每一者,編碼器20可判定是否將指示該子集是否包括任何非零係數之語法元素作為經熵編碼之位元串流之部分來用信號發送至解碼器。編碼器20可基於判定出用信號發送特定子集之語法元素是否將改良編碼效率而判定是否用信號發送該語法元素。為了判定用信號發送語法元素是否將改良編碼效率,編碼器20可應用一或多個規則,如下文進一步詳細描述。編碼器20可輸出包括視訊資料之區塊的經熵編碼之位元串流。可接著藉由解碼器讀取及解碼經熵編碼之位元串流,以重建構表示視訊資料之葉層級單元之二維矩陣。
亦可藉由目的地器件14之視訊解碼器30執行互逆轉換係數解碼。亦即,視訊解碼器30可將表示視訊資料之區塊的轉換係數之一維向量的係數映射至轉換係數之二維矩陣內之位置,以重建構轉換係數之二維矩陣。根據本文中所描述之技術,解碼器30可讀取表示視訊資料之葉層級單元之一維矩陣,且將該葉層級單元劃分成複數個轉換係數子集。針對該等子集中之每一者,解碼器30可判定是否解碼該子集之轉換係數。舉例而言,若解碼器30不讀取經熵編碼之位元串流中的指示特定子集是否具有非零係數之語法元素,則解碼器30解碼該子集之係數。然而,若解碼器30確實讀取與特定子集相關聯之此語法元素,則解碼器30可基於該語法元素之值判定是否解碼該子集之轉換係數。舉例而言,若語法元素指示該子集確實包括非零係數,則解 碼器30解碼該子集之轉換係數。然而,若語法元素指示該子集不包括任何非零係數,則解碼器30不解碼該子集之轉換係數。
本文中所描述之技術可改良視訊編碼之效率。舉例而言,將視訊資料之區塊劃分成複數個轉換係數子集且用信號發送指示該等子集是否包括非零係數之語法元素(如本文所描述)可減少表示視訊資料所需之位元數目,此情形可改良編碼器/解碼器之效率等級。
圖2為說明可實施本發明中所描述之框間預測技術的實例視訊編碼器20的方塊圖。視訊編碼器20可執行視訊切片內之視訊區塊之框內編碼及框間編碼。框內編碼依賴於空間預測以減少或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間編碼依賴於時間預測以減少或移除視訊序列之鄰近圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指代若干基於空間之壓縮模式中的任一者。諸如單向預測(P模式)或雙向預測(B模式)之框間模式可指代若干基於時間之壓縮模式中的任一者。
在圖2之實例中,視訊編碼器20包括分割單元35、預測模組41、參考圖像記憶體64、求和器50、轉換模組52、量化單元54,及熵編碼單元56。預測模組41包括運動估計單元42、運動補償單元44,及框內預測模組46。為了進行視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反轉換模組60,及求和器62。亦可包括解區塊濾波器(圖2中未展示)以對區塊邊界進行濾波從而自經重建構之視訊移除 方塊效應假影。必要時,解區塊濾波器將通常對求和器62之輸出進行濾波。除瞭解區塊濾波器以外,亦可使用額外迴路濾波器(迴路內或迴路後)。
如圖2中所展示,視訊編碼器20接收視訊資料,且分割單元35將資料分割成視訊區塊。此分割亦可包括分割成切片、影像塊或其他較大單元,以及(例如)根據LCU及CU之四分樹結構之視訊區塊分割。視訊編碼器20一般說明編碼待編碼之視訊切片內之視訊區塊的組件。切片可劃分成多個視訊區塊(且可能地劃分成被稱作影像塊的視訊區塊集合)。預測模組41可基於誤差結果(例如,編碼速率及失真位準)選擇當前視訊區塊之複數個可能編碼模式中之一者,諸如複數個框內編碼模式中之一者或複數個框間編碼模式中之一者。預測模組41可將所得框內編碼區塊或框間編碼區塊提供至求和器50以產生殘餘區塊資料,且提供至求和器62以重建構經編碼區塊來用作參考圖像。
預測模組41內之框內預測模組46可執行當前視訊區塊相對於處於與待編碼之當前區塊相同的圖框或切片中之一或多個相鄰區塊的框內預測性編碼,以提供空間壓縮。預測模組41內之運動估計單元42及運動補償單元44執行當前視訊區塊相對於一或多個參考圖像中之一或多個預測性區塊的框間預測性編碼,以提供時間壓縮。
運動估計單元42可經組態以根據視訊序列之預定型樣判定視訊切片之框間預測模式。預定型樣可將序列中之視訊切片指定為P切片、B切片或GPB切片。可高度整合運動估 計單元42及運動補償單元44,但出於概念性目的而對其單獨予以說明。由運動估計單元42執行之運動估計為產生運動向量之程序,運動向量估計視訊區塊之運動。運動向量(例如)可指示當前視訊圖框或圖像內之視訊區塊之PU相對於參考圖像內之預測性區塊的移位。
預測性區塊為依據像素差而被認為與待編碼之視訊區塊之PU緊密匹配的區塊,可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度來判定像素差。在一些實例中,視訊編碼器20可計算儲存於參考圖像記憶體64中之參考圖像之次整數(sub-integer)像素位置的值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分率像素位置之值。因此,運動估計單元42可執行相對於全像素位置及分率像素位置之運動搜尋,且以分率像素精度輸出運動向量。
運動估計單元42藉由比較框間編碼切片中之視訊區塊的PU之位置與參考圖像之預測性區塊之位置而計算該PU之運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),其中之每一者識別儲存於參考圖像記憶體64中之一或多個參考圖像。運動估計單元42將所計算之運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於藉由運動估計所判定之運動向量取得或產生預測性區塊,從而可能執行至子像素精度之內插。在接收到當前視訊區塊之PU之運動向量後,運動補償單元44可將運動向量所指向的預測 性區塊定位於參考圖像清單中之一者中。視訊編碼器20藉由以下操作形成殘餘視訊區塊:自正編碼之當前視訊區塊之像素值減去預測性區塊之像素值,從而形成像素差值。像素差值形成區塊之殘餘資料,且可包括明度差分量與色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊切片相關聯的供由視訊解碼器30用於解碼視訊切片之視訊區塊的語法元素。
在運動補償單元44產生當前視訊區塊之預測性區塊之後,視訊編碼器20藉由自該當前視訊區塊減去該預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個TU中且應用於轉換模組52。轉換模組52使用諸如離散餘弦轉換(DCT)或概念上類似轉換之轉換將殘餘視訊資料轉換成殘餘轉換係數。轉換模組52可將殘餘視訊資料自像素域變換至轉換域(諸如,頻域)。
轉換模組52可將所得轉換係數發送至量化單元54。量化單元54量化該等轉換係數以進一步減小位元速率。量化程序可減小與該等係數中之一些或全部相關聯的位元深度。可藉由調整量化參數而修改量化程度。
在量化之後,熵編碼單元56熵編碼經量化之轉換係數。舉例而言,熵編碼單元56可執行內容脈絡自適應性可變長度編碼(CAVLC)、內容脈絡自適應性二進位算術編碼(CABAC)、基於語法之內容脈絡自適應性二進位算術編碼(SBAC)、機率區間分割熵(PIPE)編碼,或另一熵編碼方法 或技術。在藉由熵編碼單元56進行之熵編碼之後,可將經編碼位元串流傳輸至視訊解碼器30,或將其封存以供稍後傳輸或由視訊解碼器30擷取。熵編碼單元56亦可熵編碼正編碼之當前視訊切片之運動向量及其他語法元素。在一些實例中,熵編碼單元56可接著執行包括經量化之轉換係數之矩陣的掃描以產生經熵編碼之位元串流之轉換係數的一維向量。
根據本發明之技術,當掃描轉換係數之矩陣以產生一維向量時,熵編碼單元56可將視訊資料之葉層級單元(諸如,如上文所描述之四分樹結構之未***子代節點)劃分成小於葉層級單元的複數個轉換係數子集。舉例而言,熵編碼單元56可將視訊資料之葉層級單元劃分成各自包含該葉層級單元內之幾何形狀的複數個子集。在一些實例中,熵編碼單元56可將葉層級單元之轉換係數劃分成視訊資料之較小矩形配置。在其他實例中,熵編碼單元56可將葉層級單元之轉換係數劃分成轉換係數之三角形子集。在又其他實例中,熵編碼單元56可將葉層級單元之轉換係數劃分成具有其他形狀之子集,或甚至不對應於任何特定幾何形狀之子集。實情為,熵編碼單元56可根據葉層級單元之複數個轉換係數之掃描次序(其可為固定或自適應性的)來劃分該等轉換係數。舉例而言,熵編碼單元56可基於葉層級單元之複數個轉換係數之掃描次序(例如,自適應性或固定掃描次序)而將該等轉換係數劃分成轉換係數之複數個子集。在不同實例中,該等子集可具有類似或相同數目個 係數。
根據本文中所描述之技術,一旦轉換係數之葉層級單元已劃分成複數個子集,熵編碼單元56就可針對該複數個子集中之至少一些產生指示各別子集是否包括任何非零係數之語法元素。在一些實例中,熵編碼單元56可針對轉換係數之複數個子集中之每一子集產生此語法元素。在其他實例中,熵編碼單元56可針對複數個子集中之每一子集選擇性地判定是否產生此語法元素。是否產生此語法元素之決策可基於此發信是否提供額外壓縮或改良之編碼效率。若是,則可產生語法元素,但若否,則編碼器20及解碼器30兩者可經程式化而知曉在該例子中不用信號發送該指示。
根據本發明之技術,為了判定產生此語法元素是否將改良壓縮或編碼效率,熵編碼單元56可應用一或多個規則,如下文進一步詳細描述。作為一實例,熵編碼單元56可針對特定子集基於該子集之潛在非零係數之數目而判定是否產生語法元素。舉例而言,熵編碼單元56可基於比較子集之潛在非零係數之數目與臨限值而判定是否產生語法元素。
作為此技術之一實例,為了判定子集之潛在非零係數之數目,熵編碼單元56判定該子集之具有比葉層級單元之最後非零係數早的位置之係數之數目,且比較係數之該經判定數目與臨限值thNoCoeff,如圖6之實例中所展示且在下文進一步詳細描述。根據此實例,若潛在非零係數之經判定數目大於臨限值thNoCoeff,則熵編碼單元56產生指示 子集是否包括任何非零係數之語法元素。然而,若潛在非零係數之經判定數目小於或等於臨限值thNoCoeff,則熵編碼單元56可不產生語法元素。作為一實例,熵編碼單元56基於以下之實例1之偽碼判定是否用信號發送指示特定子集是否包括任何非零係數之語法元素:
實例1
noCoeff[xS][yS]>thNoCoeff其中noCoeff[xS][yS]指示子集之潛在非零係數之數目,且thNoCoeff為臨限值。
在其他實例中,熵編碼單元56可基於其他規則判定是否用信號發送指示轉換係數之子集是否包括任何非零係數之語法元素。舉例而言,熵編碼單元56可針對子集基於該子集之非零係數之平均數目而判定是否用信號發送語法元素,如下文關於圖7之實例進一步詳細描述。根據此實例,在視訊資料之葉層級單元正經編碼時,熵編碼單元56可收集並儲存指示每一子集內之位置處之係數多久一次為非零的統計。基於此等所儲存統計,熵編碼單元56可判定是否產生語法元素。舉例而言,熵編碼單元56可比較子集之非零係數之平均數目與臨限值thAvrgCoeff。若子集之非零係數之平均數目小於臨限值,則熵編碼單元56產生語法元素。然而,若子集之非零係數之平均數目大於或等於臨限值thAvrgCoeff,則熵編碼單元56基於在此狀況下該子集極有可能含有至少一非零係數之假定而不產生語法元素。
作為另一實例,對於含有葉層級單元之最後非零係數 (相對於z字形掃描,反z字形掃描之第一非零係數)之子集,子集含有最後非零係數之事實意謂該子集必須包括至少一非零係數,且因此,可假定包括最後非零係數之任何子集必須包括至少一非零係數。因此,針對包括最後非零係數之子集不需要產生語法元素,此係因為可假定此子集包括至少一非零係數。
作為一實例,熵編碼單元56可基於以下之實例2之偽碼判定是否用信號發送指示特定子集是否包括任何非零係數之語法元素:
實例2
(noCodedCoeff[xS][yS]+noSubBlks[xS][yS]/2)/noSubBlks<thAvrgCoeff此處,noCodedCoeff[xS][yS]指示子集中之非零係數之數目。
根據實例1之偽碼,熵編碼單元56在編碼視訊資料區塊之葉層級單元之前將可變陣列noCoeff[xS][yS]中之值初始化成0,且基於lastPos語法元素之值將值指派給該陣列,lastPos語法元素指示視訊資料之葉層級單元內之最後非零係數位置: 根據實例2之偽碼,在編碼葉層級單元之後,熵編碼單元 56可如下更新可變陣列noSubBlks及noCodedCoeff:
藉由使用以上之實例2之偽碼,熵編碼單元56可基於視訊資料之先前經編碼之葉層級單元的子集之非零係數的平均數目而判定是否用信號發送指示葉層級單元之轉換係數之子集是否包括任何非零係數之語法元素。
反量化單元58及反轉換模組60分別應用反量化及反轉換,以在像素域中重建構殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊加至參考圖像清單中之一者內的參考圖像中之一者的預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波 器應用於經重建構之殘餘區塊以計算次整數像素值以用於運動估計中。求和器62將經重建構之殘餘區塊加至由運動補償單元44所產生之運動補償預測區塊,以產生參考區塊以供儲存於參考圖像記憶體64中。參考區塊可由運動估計單元42及運動補償單元44用作參考區塊以對後續視訊圖框或圖像中之區塊進行框間預測。
圖3為說明可實施本發明中所描述之框間預測技術的實例視訊解碼器30的方塊圖。在圖3之實例中,視訊解碼器30包括熵解碼單元80、預測模組81、反量化單元86、反轉換單元88、求和器90,及參考圖像記憶體92。預測模組81包括運動補償單元82及框內預測模組84。在一些實例中,視訊解碼器30可執行一般與關於來自圖2之視訊編碼器20所描述之編碼遍次互逆的解碼遍次。
在解碼程序期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊切片之視訊區塊及相關聯之語法元素的經編碼之視訊位元串流。視訊解碼器30之熵解碼單元80熵解碼該位元串流以產生經量化之係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測模組81。視訊解碼器30可在視訊切片層級及/或視訊區塊層級處接收語法元素。
熵解碼單元80可讀取由熵解碼單元解碼之轉換係數之一維向量,且自該一維向量重建構轉換係數之二維矩陣。根據本文中所描述之技術,熵解碼單元80可讀取表示視訊資料之葉層級單元之一維矩陣,且將該葉層級單元劃分成複 數個轉換係數子集。轉換係數子集可具有矩形、三角形或任何其他形狀或配置。針對子集中之每一者,熵解碼單元80判定是否解碼子集之轉換係數。舉例而言,若熵解碼單元80不讀取指示特定子集是否具有非零係數之語法元素,則反量化單元86解碼該子集之係數。然而,若熵解碼單元80確實讀取與特定子集相關聯之此語法元素,則熵解碼單元80可基於該語法元素之值判定是否解碼該子集之轉換係數。舉例而言,若語法元素指示子集確實包括非零係數,則熵解碼單元80解碼該子集之轉換係數。然而,若語法元素指示子集不包括任何非零係數,則熵解碼單元80不解碼該子集之轉換係數。
當視訊切片經編碼為框內編碼(I)切片時,預測模組81之框內預測模組84可基於用信號發送之框內預測模式及來自當前圖框或圖像之先前經解碼區塊之資料而產生當前視訊切片之視訊區塊之預測資料。當視訊圖框經編碼為框間編碼(亦即,B、P或GPB)切片時,預測模組81之運動補償單元82基於自熵解碼單元80接收之運動向量及其他語法元素而產生當前視訊切片之視訊區塊之預測性區塊。可自參考圖像清單中之一者內的參考圖像中之一者產生預測性區塊。視訊解碼器30可基於儲存於參考圖像記憶體92中之參考圖像使用預設建構技術來建構參考圖框清單:清單0及清單1。
運動補償單元82藉由剖析運動向量及其他語法元素而判定當前視訊切片之視訊區塊之預測資訊,且使用該預測資 訊以產生正解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元82使用一些所接收之語法元素以判定用以編碼視訊切片之視訊區塊之預測模式(例如,框內預測或框間預測)、框間預測切片類型(例如,B切片、P切片或GPB切片)、切片之參考圖像清單中之一或多者的建構資訊、切片之每一框間編碼視訊區塊之運動向量、切片之每一框間編碼視訊區塊之框間預測狀態,及用以解碼當前視訊切片中之視訊區塊之其他資訊。
運動補償單元82亦可基於內插濾波器執行內插。運動補償單元82可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之次整數像素的內插值。在此狀況下,運動補償單元82可自所接收之語法元素判定由視訊編碼器20使用之內插濾波器,且使用該等內插濾波器來產生預測性區塊。反量化單元86反量化(亦即,解量化)位元串流中所提供且由熵解碼單元80解碼的經量化之轉換係數。
在一些實例中,反量化程序可包括使用由視訊編碼器20所計算之用於視訊切片中之每一視訊區塊的量化參數,以判定量化程度及(同樣地)應應用之反量化的程度。反轉換模組88將反轉換(例如,反DCT、反整數轉換或概念上類似之反轉換程序)應用於轉換係數,以便在像素域中產生殘餘區塊。
在運動補償單元82基於運動向量及其他語法元素產生當前視訊區塊之預測性區塊之後,視訊解碼器30藉由對來自 反轉換模組88之殘餘區塊與由運動補償單元82產生之對應預測性區塊求和而形成經解碼視訊區塊。求和器90表示執行此求和運算之一或多個組件。必要時,亦可應用解區塊濾波器以對經解碼區塊進行濾波,以便移除方塊效應假影。其他迴路濾波器(編碼迴路中或編碼迴路後)亦可用以使像素轉變平穩,或以其他方式改良視訊品質。接著將給定圖框或圖像中之經解碼視訊區塊儲存於參考圖像記憶體92中,參考圖像記憶體92儲存用於後續運動補償之參考圖像。參考圖像記憶體92亦儲存經解碼視訊以用於稍後在顯示器件(諸如,圖1之顯示器件32)上呈現。
圖4為描繪與本文中所描述之技術一致的劃分成複數個轉換係數子集之葉層級單元410之一實例的概念圖。圖4中所描繪之葉層級單元410可包含視訊資料之未***子代節點,例如,四分樹(RQT)結構之葉節點。如圖4中所展示,複數個子集420中之每一者包括複數個轉換係數412(在圖1之實例中為十六個轉換係數),其可能為或可能不為幅度大於零之非零係數。圖4中亦展示,葉層級單元410之最後非零係數(相對於z字形掃描,反z字形掃描之第一非零係數)具有葉層級單元410之子集(1,1)內之位置(7,7)。
如上文所描述,一旦視訊編碼器20已將葉層級單元410劃分成複數個轉換係數子集420,視訊編碼器20就可判定是否產生指示子集是否包括任何非零係數之語法元素。舉例而言,視訊編碼器20可基於特定區塊中之潛在非零係數之數目而判定是否產生與該區塊相關聯之語法元素。
根據圖4之實例,在位置(7,7)處之係數為葉層級單元410之最後非零係數,意謂根據z字形掃描次序在位置(7,7)之後的所有轉換係數(在圖4之實例中之未加陰影之係數)具有幅度零。根據一實例,視訊編碼器20可基於葉層級單元410內之最後非零係數位置而判定子集中之潛在非零係數之數目。
視訊編碼器20可針對葉層級單元410之各別子集中的每一者判定非零係數(例如,在該子集之位置(7,7)處之掃描的最後非零係數之後的反z字形掃描之係數)之潛在數目。舉例而言,視訊編碼器20可判定圖4中所描繪之子集(0,0)、(0,1)、(1,0)、(1,1)及(2,0)中之每一者的所有十六個係數為潛在非零係數,此係因為該等子集之所有係數在掃描時在最後非零係數之前。視訊編碼器亦可判定子集(0,2)中之十五個係數可潛在地為非零係數,子集(2,1)及(3,0)中之每一者之六個係數可潛在地為非零係數,且子集(1,2)及(0,3)中之三個係數可潛在地為非零係數。
編碼器20可針對圖4中所描繪之該等子集420基於每一子集之潛在非零係數之數目而判定是否產生語法元素。舉例而言,編碼器20可比較每一子集之潛在非零係數之經判定數目與臨限值thNoCoeff。若潛在非零係數之經判定數目大於臨限值,則編碼器20可產生指示子集是否包括非零係數之語法元素。然而,若潛在非零係數之經判定數目小於或等於臨限值,則編碼器20可不產生語法元素。
根據一特定實例,臨限值thNoCoeff可具有值五(5)。參 看圖4之實例,編碼器20將用信號發送指示子集(0,0)、(0,1)、(1,0)、(1,1)、(0,2)、(2,0)、(2,1)及(3,0)是否包括非零係數之語法元素,此係因為此等子集420中之每一者包括比為五之臨限值thNoCoeff多的潛在非零係數。然而,對於子集(1,2)、(0,3)、(3,1)、(2,2)、(1,3)、(3,2)、(2,3)及(3,3),視訊編碼器20將不產生語法元素,此係因為該等子集包括少於五個的潛在非零係數。舉例而言,視訊編碼器20可編碼子集(1,1)及(0,2)之轉換係數且判定該等子集是否包括任何非零係數。若視訊編碼器20判定子集(1,2)及(0,3)中之任一者包括任何非零係數,則視訊編碼器可產生與該子集相關聯之具有值一(1)的語法元素。另外,若視訊編碼器20判定子集(1,1)及(0,2)中之任一者皆不包括任何非零係數,則視訊編碼器20亦可產生與該子集相關聯之具有值零(0)的語法元素。視訊編碼器20亦可產生與子集(0,0)、(0,1)、(1,0)、(2,0)、(2,1)及(3,0)中之每一者相關聯的具有值(0)或(1)之語法元素。
指示子集(0,0)、(0,1)、(1,0)、(1,1)、(0,2)、(2,0)、(2,1)及(3,0)是否具有非零係數之語法元素(例如,針對每一各別子集所定義之單獨語法元素)可作為經熵編碼之位元串流之部分由視訊編碼器20輸出,且由解碼器30讀取。作為重建構葉層級單元410之部分,解碼器30可將表示單元410之資料劃分成複數個子區塊。對於每一子區塊,解碼器30可判定經熵編碼之位元串流是否包括指示該子集是否包括非零係數之語法元素。若解碼器30讀取不包括此語 法元素之子區塊,則解碼器30解碼該子集之係數。然而,若解碼器30確實讀取與子集相關聯之此語法元素,則解碼器30可使用該語法元素之值以判定是否解碼子集之係數。舉例而言,根據上文所闡述之實例,若解碼器30讀取子集(1,1)之語法元素值一(1),則解碼器可解碼該子集。然而,若解碼器30讀取子集(1,1)之語法元素值零(0),則解碼器30不解碼子區塊之轉換係數。
圖5為說明與本發明之一或多個態樣一致的編碼視訊資料之方法之一實例的流程圖。圖5之方法被描述為係藉由圖1及圖2中所描繪之編碼器20來執行,然而,任何其他器件可用以執行圖5之方法。
如圖5中所展示,編碼器20將視訊資料之葉區塊劃分成各自包括多個轉換係數之複數個子集(501)。作為一實例,複數個子集可包含如描繪於圖4之實例中的矩形子集,或任何其他幾何形狀或型樣。視訊資料之葉層級單元可包含視訊編碼標準之最低層級編碼單元,諸如,如上文所描述之四分樹結構之未***子代節點。
亦如圖5中所展示,編碼器20針對複數個子集中之至少一者產生指示該子集是否包括非零係數之語法元素(502)。在一些實例中,編碼器20可產生與複數個子集中之每一者相關聯的此語法元素。在其他實例中,編碼器20可針對子集中之每一者選擇性地判定是否產生此語法元素。舉例而言,編碼器20可基於產生語法元素是否將改良編碼效率及/或壓縮而選擇性地判定是否產生語法元素。在一些狀況下 與指示特定子集實際上包括非零係數相關聯的耗用可使壓縮降級,且在此等狀況下,可避免此耗用發信,且編碼器及解碼器可在無該子集是否包括非零係數之任何判定的情況下編碼/解碼該子集。
在一些實例中,編碼器20可基於子集中之潛在非零係數之數目(如下文關於圖6進一步詳細描述)或基於如下文進一步詳細描述的每一子集之係數之平均數目(如下文關於圖7進一步詳細描述)而判定產生語法元素是否將改良編碼效率。若編碼器20產生與子集相關聯之語法元素,則編碼器20可輸出該語法元素作為經熵編碼之位元串流之部分。可由解碼器30讀取經熵編碼之位元串流(如描繪於圖3中),且可由解碼器30使用語法元素以解碼葉層級單元,如下文關於圖8進一步詳細描述。
圖6為說明與本發明之一或多個態樣一致的編碼視訊資料之方法之一實例的流程圖。圖6之方法被描述為係藉由圖2中所描繪之編碼器20來執行,然而,任何器件可用以執行圖6之技術。根據圖6之實例,編碼器20基於轉換係數子集之潛在非零係數之數目而判定產生與該子集相關聯的語法元素是否將改良編碼效率。
如圖6之實例中所展示,編碼器20將視訊資料之葉層級單元劃分成複數個轉換係數子集(601)。作為一實例,複數個子集可包含如描繪於圖4之實例中的矩形子集,或任何其他幾何形狀或型樣。視訊資料之葉層級單元可包含視訊編碼標準之最低層級編碼單元,諸如,如上文所描述之四 分樹結構之未***子代節點。
根據圖6之實例,視訊編碼器20基於複數個子集中之每一者的潛在非零係數之數目而判定是否產生與每一子集相關聯之語法元素。舉例而言,如圖6中所展示,編碼器20針對每一子集判定該子集之潛在非零係數之數目(602)。為了判定潛在非零係數之數目,編碼器20可判定每一子集之多少係數具有在葉層級單元之最後非零係數之前的位置,如上文關於圖4之實例所描述。
亦如圖6中所展示,編碼器20可比較潛在非零係數之經判定數目與臨限值thNoCoeff(603)。圖6中亦展示,若潛在非零係數之經判定數目大於臨限值thNoCoeff,則編碼器20產生與子集相關聯之語法元素(604)。然而,若潛在非零係數之經判定數目小於或等於臨限值thNoCoeff,則編碼器20不產生與子集相關聯之語法元素(605)。根據此等實例,若潛在非零係數之數目小於或等於臨限值thNoCoeff,則可假定應執行編碼/解碼該子集。以此方式,針對包括極少潛在非零係數之彼等子集不產生語法元素,此情形可減少由編碼器20用信號發送以表示視訊資料之葉層級單元的資訊位元之數目。此係因為當子集含有極少潛在非零係數時,用信號發送彼等非零係數所需之位元數目相對小,此又導致在用信號發送指示該子集是否具有非零係數之語法元素時的耗用相對較大。結果,較佳在子集含有極少潛在非零係數(亦即,小於thNoCoeff)時不用信號發送語法元素而替代地直接編碼該子集之係數。
圖7為說明與本發明之一或多個態樣一致的編碼視訊資料之方法之另一實例的流程圖。圖7之方法被描述為係由圖2中所描繪之編碼器20來執行,然而,任何器件可用以執行圖7之技術。根據圖7之實例,編碼器20基於每一子集之非零係數之平均數目判定產生語法元素是否將改良編碼效率。
如圖7中所展示,編碼器20將視訊資料之葉層級單元劃分成複數個轉換係數子集(701)。圖7中亦展示,針對每一子集,編碼器20判定該子集之非零係數之平均數目。因為編碼器20可經組態以收集指示視訊資料之先前經編碼葉層級單元之每一子集內的位置處之係數多常包括非零係數的統計。舉例而言,編碼器20可保有一或多個計數器,該一或多個計數器在葉層級單元經編碼時用來對每一子集內之係數多常為非零及/或每一子集之多少係數為非零進行計數。根據此實例,當編碼器20編碼視訊資料之一新的葉層級單元時,編碼器20可存取此一計數器以判定每一子集之非零係數之平均數目。在一些實例中,可(諸如)針對每一視訊圖框或切片週期性地重設(例如,初始化)每一子集之計數器。
亦如圖7中所展示,編碼器20比較非零係數之經判定平均數目與臨限值thAvrgCoeff(703)。亦如圖7中所展示,若非零係數之經判定平均數目小於臨限值thAvrgCoeff,則編碼器20產生與子集相關聯之語法元素(704)。然而,若非零係數之經判定平均數目大於或等於臨限值,則編碼器20不 產生與子集相關聯之語法元素(705)。
如上文所描述,編碼器20可產生包括指示轉換係數之子集是否包括任何非零係數之至少一語法元素的經熵編碼之位元串流。編碼器20可基於如圖6中所展示之子集的潛在非零係數之數目或基於如圖7中所展示之非零係數之平均數目而判定是否產生語法元素。解碼器30可讀取包括至少一語法元素之經熵編碼之位元串流,且使用該至少一語法元素解碼該經熵編碼之位元串流。
圖8為說明與本發明之一或多個態樣一致的可藉由解碼器執行之方法之一實例的流程圖。圖8之方法被描述為係藉由圖3中所描繪之解碼器30來執行,然而,任何器件可用以執行圖8之方法。
如圖8中所展示,解碼器30可將視訊資料之葉層級單元劃分成各自包括多個轉換係數之複數個子集(801)。作為一實例,複數個子集可包含如描繪於圖4之實例中的矩形子集,或任何其他幾何形狀或型樣。視訊資料之葉層級單元可包含視訊編碼標準之最低層級編碼單元,諸如,如上文所描述之四分樹結構之未***子代節點。資料之葉層級單元係藉由經熵編碼之位元串流表示,經熵編碼之位元串流包括指示複數個子集中之一子集是否包括任何非零係數之至少一語法元素。
亦如圖8中所展示,針對子集中之每一者,解碼器30判定經熵編碼之位元串流是否包括與子集相關聯之語法元素(802)。亦如圖8中所展示,若子集不包括此相關聯之語法 元素,則解碼器30解碼該子集(例如,該子集之轉換係數)(803)。亦如圖8中所展示,若子集確實包括此相關聯之語法元素,則解碼器30可使用該相關聯之語法元素判定是否解碼該子集(804)。舉例而言,若語法元素具有第一值(例如,一(1)),則解碼器30解碼該子集。然而,若語法元素具有第二值(例如,零(0)),則解碼器30不解碼該子集。
在一或多個實例中,可至少部分地以硬體(諸如,特定硬體組件或處理器)來實施本文所描述之功能。更大體而言,可以硬體、處理器、軟體、韌體或其任何組合來實施該等技術。若以軟體實施,則該等功能可作為一或多個指令或程式碼而儲存於電腦可讀媒體上或經由電腦可讀媒體而傳輸,且藉由基於硬體之處理單元執行。電腦可讀媒體可包括對應於有形媒體(諸如,資料儲存媒體)之電腦可讀儲存媒體或通信媒體,通信媒體包括促進(例如)根據通信協定將電腦程式自一處傳送至另一處之任何媒體。以此方式,電腦可讀媒體一般可對應於(1)非暫時性的有形電腦可讀儲存媒體或(2)諸如信號或載波之通信媒體。資料儲存媒體可為可由一或多個電腦或一或多個處理器存取以擷取指令、程式碼及/或資料結構用於實施本發明中所描述之技術的任何可用媒體。電腦程式產品可包括電腦可讀媒體。
藉由實例而非限制,此等電腦可讀儲存媒體可包含RAM、ROM、EEPROM、CD-ROM或其他光碟儲存器、磁碟儲存器或其他磁性儲存器件、快閃記憶體,或可用以儲存呈指令或資料結構之形式的所要程式碼且可由電腦存取 之任何其他媒體。又,任何連接被適當地稱為電腦可讀媒體,亦即,電腦可讀傳輸媒體。舉例而言,若使用同軸電纜、光纖纜線、雙絞線、數位用戶線(DSL)或諸如紅外線、無線電及微波之無線技術而自網站、伺服器或其他遠端源傳輸指令,則同軸電纜、光纖纜線、雙絞線、DSL或諸如紅外線、無線電及微波之無線技術包括於媒體之定義中。然而,應理解,電腦可讀儲存媒體及資料儲存媒體不包括連接、載波、信號或其他暫態媒體,而是替代地針對非暫態有形儲存媒體。如本文中所使用,磁碟及光碟包括緊密光碟(CD)、雷射光碟、光學光碟、數位影音光碟(DVD)、軟碟及藍光光碟,其中磁碟通常以磁性方式再生資料,而光碟藉由雷射以光學方式再生資料。上述各者之組合亦應包括於電腦可讀媒體之範疇內。
可由諸如下各者之一或多個處理器執行指令:一或多個中央處理單元(CPU)、數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效整合或離散邏輯電路。因此,如本文中所使用之術語「處理器」可指代前述結構或適於實施本文中所描述之技術之任何其他結構中的任一者。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態以用於編碼及解碼的專用硬體及/或軟體模組內,或併入組合式編碼解碼器中。又,該等技術可完全實施於一或多個電路或邏輯元件中。
可在包括無線手機、積體電路(IC)或一組IC(例如,晶片 組)之廣泛多種器件或裝置中實施本發明之技術。在本發明中描述各種組件、模組或單元以強調經組態以執行所揭示之技術之器件的功能態樣,但未必需要藉由不同硬體單元實現。更確切而言,如上文所描述,各種單元可組合於編碼解碼器硬體單元中或由交互操作之硬體單元的集合(包括如上文所描述之一或多個處理器)結合合適軟體及/或韌體來提供。
已描述各種實例。此等及其他實例在以下申請專利範圍之範疇內。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧鏈路
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧儲存器件/顯示器件
35‧‧‧分割單元
41‧‧‧預測模組
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測模組
50‧‧‧求和器
52‧‧‧轉換模組
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反轉換模組
62‧‧‧求和器
64‧‧‧參考圖像記憶體
80‧‧‧熵解碼單元
81‧‧‧預測模組
82‧‧‧運動補償單元
84‧‧‧框內預測模組
86‧‧‧反量化單元
88‧‧‧反轉換單元/反轉換模組
90‧‧‧求和器
92‧‧‧參考圖像記憶體
410‧‧‧葉層級單元
412‧‧‧轉換係數
420‧‧‧轉換係數子集
圖1為說明經組態以根據本發明之技術操作的視訊編碼及解碼系統之一實例的方塊圖。
圖2為說明經組態以根據本發明之技術操作的視訊編碼器之一實例的方塊圖。
圖3為說明經組態以根據本發明之技術操作的視訊解碼器之一實例的方塊圖。
圖4為說明與本發明之一或多個態樣一致的劃分成複數個轉換係數子集之視訊資料的葉層級單元之一實例的概念圖。
圖5為說明與本發明之一或多個態樣一致的編碼視訊資料之葉層級單元的方法之一實例的流程圖。
圖6為說明與本發明之一或多個態樣一致的編碼視訊資料之葉層級單元的方法之另一實例的流程圖。
圖7為說明與本發明之一或多個態樣一致的編碼視訊資 料之葉層級單元的方法之另一實例的流程圖。
圖8為說明與本發明之一或多個態樣一致的解碼視訊資料之葉層級單元的方法之一實例的流程圖。

Claims (52)

  1. 一種用於編碼視訊資料之一單元的方法,其包含:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定是否產生一語法元素,該語法元素指示該子集是否包括任何非零係數;及基於該判定及針對該複數個轉換係數子集中之該子集產生該語法元素。
  2. 如請求項1之方法,其中針對該子集判定是否產生該語法元素包含判定產生該語法元素是否將改良編碼效率。
  3. 如請求項1之方法,其中判定是否產生該語法元素包含將該子集之潛在非零係數之一數目與至少一臨限值進行比較;及若該子集之潛在非零係數之該數目大於該臨限值,則產生該語法元素。
  4. 如請求項3之方法,其進一步包含:基於該子集之多少係數具有在該葉層級單元以一掃描次序之一最後非零係數之後的一位置而判定潛在非零係數之該數目。
  5. 如請求項1之方法,其中判定是否產生該語法元素包含:針對視訊資料之複數個先前經編碼之葉層級單元判定包括於該子集中之非零係數之一平均數目; 將包括於該子集中之非零係數之該平均數目與一臨限值進行比較;及若非零係數之該平均數目小於該臨限值,則產生該語法元素。
  6. 如請求項1之方法,其中判定是否產生該語法元素包含:判定該子集是否包括視訊資料之該葉層級單元之一最後非零係數,其中若該子集包括該最後非零係數則不產生指示該子集是否包括任何非零係數之該語法元素。
  7. 如請求項1之方法,其進一步包含:針對該複數個轉換係數子集中之每一子集判定是否產生該語法元素。
  8. 一種經組態以編碼視訊資料之至少一葉層級單元的器件,其包含:一記憶體,其經組態以儲存視訊資料;及一處理器,其經組態以執行以下操作:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定是否產生一語法元素,該語法元素指示該子集是否包括任何非零係數;及基於該判定及針對該複數個轉換係數子集中之該子集產生該語法元素。
  9. 如請求項8之器件,其中該處理器經進一步組態以: 針對該子集基於產生該語法元素是否將改良編碼效率而判定是否產生該語法元素。
  10. 如請求項8之器件,其中該處理器經進一步組態以執行以下操作:基於將該子集之潛在非零係數之一數目與至少一臨限值進行比較而判定是否產生該語法元素;及若該子集之潛在非零係數之該數目大於該臨限值,則產生該語法元素。
  11. 如請求項10之器件,其中該處理器經進一步組態以:基於該子集之多少係數具有在該葉層級單元以一掃描次序之一最後非零係數之後的一位置而判定潛在非零係數之該數目。
  12. 如請求項8之器件,其中該處理器經進一步組態以執行以下操作:針對視訊資料之複數個先前經編碼之葉層級單元判定包括於該子集中之非零係數之一平均數目;將包括於該子集中之非零係數之該平均數目與一臨限值進行比較;及若非零係數之該平均數目小於該臨限值,則產生該語法元素。
  13. 如請求項8之器件,其中該處理器經進一步組態以:針對該複數個轉換係數子集中之每一子集判定是否產生該語法元素。
  14. 如請求項8之器件,其中該處理器經進一步組態以: 判定該子集是否包括視訊資料之該葉層級單元以一掃描次序之一最後非零係數,其中若該子集包括該最後非零係數,則不產生指示該子集是否包括任何非零係數之該語法元素。
  15. 一種儲存指令之電腦可讀儲存媒體,該等指令在執行時使一計算器件執行以下操作:將視訊資料之一葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定是否產生一語法元素,該語法元素指示該子集是否包括任何非零係數;及基於該判定及針對該複數個轉換係數子集中之該子集產生該語法元素。
  16. 如請求項15之電腦可讀儲存媒體,其中該等指令進一步使該計算器件:針對該子集基於產生該語法元素是否將改良編碼效率而判定是否產生該語法元素。
  17. 如請求項15之電腦可讀儲存媒體,其中該等指令進一步使該計算器件執行以下操作:基於將該子集之潛在非零係數之一數目與至少一臨限值進行比較而判定是否產生該語法元素;及若該子集之潛在非零係數之該數目大於該臨限值,則產生該語法元素。
  18. 如請求項17之電腦可讀儲存媒體,其中該等指令進一步 使該計算器件:基於該子集之多少係數具有在該葉層級單元以一掃描次序之一最後非零係數之後的一位置而判定潛在非零係數之該數目。
  19. 如請求項15之電腦可讀儲存媒體,其中該等指令進一步使該計算器件執行以下操作:針對視訊資料之複數個先前經編碼之葉層級單元判定包括於該子集中之非零係數之一平均數目;將包括於該子集中之非零係數之該平均數目與一臨限值進行比較;及若非零係數之該平均數目小於該臨限值,則產生該語法元素。
  20. 如請求項15之電腦可讀儲存媒體,其中該等指令進一步使該計算器件:針對該複數個轉換係數子集中之每一子集判定是否產生該語法元素。
  21. 如請求項15之電腦可讀儲存媒體,其中該等指令進一步使該計算器件:判定該子集是否包括視訊資料之該葉層級單元以一掃描次序之一最後非零係數,其中若該子集包括該最後非零係數,則不產生指示該子集是否包括任何非零係數之該語法元素。
  22. 一種經組態以編碼視訊資料之至少一葉層級單元的器件,其包含: 用於將視訊資料之一葉層級單元劃分成複數個轉換係數子集之構件;用於針對該複數個轉換係數子集中之一子集判定是否產生一語法元素之構件,該語法元素指示該子集是否包括任何非零係數;及用於基於該判定及針對該複數個轉換係數子集中之該子集產生該語法元素之構件。
  23. 如請求項22之器件,其進一步包含:用於針對該子集基於產生該語法元素是否將改良編碼效率而判定是否產生該語法元素之構件。
  24. 如請求項22之器件,其進一步包含:用於基於將該子集之潛在非零係數之一數目與至少一臨限值進行比較而判定是否產生該語法元素之構件;及用於若該子集之潛在非零係數之該數目大於該臨限值,則產生該語法元素之構件。
  25. 如請求項24之器件,其進一步包含:用於基於該子集之多少係數具有在該葉層級單元以一掃描次序之一最後非零係數之後的一位置而判定潛在非零係數之該數目之構件。
  26. 如請求項22之器件,其中用於判定是否產生該語法元素之該構件包含:用於針對視訊資料之複數個先前經編碼之葉層級單元判定包括於該子集中之非零係數之一平均數目的構件;用於將包括於該子集中之非零係數之該平均數目與一 臨限值進行比較之構件;及用於若非零係數之該平均數目小於該臨限值,則產生該語法元素之構件。
  27. 如請求項22之器件,其進一步包含:用於針對該複數個轉換係數子集中之每一子集判定是否產生該語法元素之構件。
  28. 如請求項22之器件,其進一步包含:用於判定該子集是否包括視訊資料之該葉層級單元以一掃描次序之一最後非零係數的構件,其中若該子集包括該最後非零係數,則不產生指示該子集是否包括任何非零係數之該語法元素。
  29. 一種用於解碼視訊資料之一單元的方法,其包含:接收一經編碼視訊位元串流,其包括用於視訊資料之一葉層級單元的多個語法元素;將視訊資料之該葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定包含於該經編碼視訊位元串流中的該等語法元素包含指示該子集是否包括任何非零係數之一語法元素;及基於該語法元素判定是否解碼該子集。
  30. 如請求項29之方法,其進一步包含:若該子集不包括該語法元素,則解碼該子集。
  31. 如請求項30之方法,其進一步包含:若資料之該子集確實包括該語法元素,則基於該指示 判定是否解碼該子集。
  32. 如請求項31之方法,其進一步包含:若與該子集相關聯之該語法元素具有一第一值,則解碼該子集;及若該語法元素具有不同於該第一值之一第二值,則不解碼該子集。
  33. 如請求項29之方法,其進一步包含:針對該複數個轉換係數子集中之每一各別子集判定該各別子集是否包括一相關聯之語法元素,該相關聯之語法元素指示該各別子集是否包括任何非零係數;及針對每一各別子集基於該語法元素判定是否解碼該各別子集。
  34. 如請求項29之方法,其進一步包含:若該子集不包括該語法元素,則判定該子集是否包括指示在一掃描次序中之一最後非零係數包括於該子集中之一單獨語法元素;及若該子集包括指示一最後非零係數包括於該子集中之該單獨語法元素,則解碼該子集。
  35. 一種經組態以解碼視訊資料之一單元的器件,其包含:一記憶體,其經組態以儲存視訊資料之一葉層級單元;一處理器,其經組態以執行以下操作:接收一經編碼視訊位元串流,其包括用於視訊資料之該葉層級單元的多個語法元素; 將視訊資料之該葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定包含於該經編碼視訊位元串流中的該等語法元素包含指示該子集是否包括任何非零係數之一語法元素;及基於該語法元素判定是否解碼該子集。
  36. 如請求項35之器件,其中該處理器經進一步組態以:若該子集不包括該語法元素,則解碼該子集。
  37. 如請求項36之器件,其中該處理器經進一步組態以:若資料之該子集確實包括該語法元素,則基於該指示判定是否解碼該子集。
  38. 如請求項37之器件,其中該處理器經進一步組態以執行以下操作:若與該子集相關聯之該語法元素具有一第一值,則解碼該子集;及若該語法元素具有不同於該第一值之一第二值,則不解碼該子集。
  39. 如請求項35之器件,其中該處理器經進一步組態以執行以下操作:針對該複數個轉換係數子集中之每一各別子集判定該子集是否包括指示該各別子集是否包括任何非零係數之一相關聯之語法元素,該相關聯之語法元素指示該各別子集是否包括任何非零係數;及針對每一各別子集基於該語法元素判定是否解碼該各 別子集。
  40. 如請求項35之器件,其中該處理器經進一步組態以執行以下操作:若該子集不包括該語法元素,則判定該子集是否包括指示在一掃描次序中之一最後非零係數包括於該子集中之一單獨語法元素;及若該子集包括指示一最後非零係數包括於該子集中之該單獨語法元素,則解碼該子集。
  41. 一種儲存指令之電腦可讀儲存媒體,該等指令在執行時使一計算器件執行以下操作:接收一經編碼視訊位元串流,其包括用於視訊資料之一葉層級單元的多個語法元素;將視訊資料之該葉層級單元劃分成複數個轉換係數子集;針對該複數個轉換係數子集中之一子集判定包含於該經編碼視訊位元串流中的該等語法元素包含指示該子集是否包括任何非零係數之一語法元素;及基於該語法元素判定是否解碼該子集。
  42. 如請求項41之電腦可讀儲存媒體,其中該等指令進一步使該計算器件:若該子集不包括該語法元素,則解碼該子集。
  43. 如請求項42之電腦可讀儲存媒體,其中該等指令進一步使該計算器件:若資料之該子集確實包括該語法元素,則基於該指示 判定是否解碼該子集。
  44. 如請求項43之電腦可讀儲存媒體,其中該等指令進一步使該計算器件執行以下操作:若與該子集相關聯之該語法元素具有一第一值,則解碼該子集;及若該語法元素具有不同於該第一值之一第二值,則不解碼該子集。
  45. 如請求項42之電腦可讀儲存媒體,其中該等指令進一步使該計算器件執行以下操作:針對該複數個轉換係數子集中之每一子集判定該子集是否包括指示該子集是否包括任何非零係數之一相關聯之語法元素;及基於該語法元素判定是否解碼該子集。
  46. 如請求項41之電腦可讀儲存媒體,其中該等指令進一步使該計算器件執行以下操作:若該子集不包括該語法元素,則判定該子集是否包括指示在一掃描次序中之一最後非零係數包括於該子集中之一單獨語法元素;及若該子集包括指示一最後非零係數包括於該子集中之該單獨語法元素,則解碼該子集。
  47. 一種經組態以解碼視訊資料之一單元的器件,其包含:用於接收一經編碼視訊位元串流之構件,該經編碼視訊位元串流包括編碼視訊資料之一葉層級單元的多個語法元素; 用於將視訊資料之該葉層級單元劃分成複數個轉換係數子集之構件;用於針對該複數個轉換係數子集中之一子集判定包含於該經編碼視訊位元串流中的該等語法元素包含指示該子集是否包括任何非零係數之一語法元素之構件;及用於基於該語法元素判定是否解碼該子集之構件。
  48. 如請求項47之器件,其進一步包含:用於若該子集不包括該語法元素,則解碼該子集之構件。
  49. 如請求項48之器件,其進一步包含:用於若資料之該子集確實包括該語法元素,則基於該指示判定是否解碼該子集之構件。
  50. 如請求項49之器件,其進一步包含:用於若與該子集相關聯之該語法元素具有一第一值,則解碼該子集之構件;及用於若該語法元素具有不同於該第一值之一第二值,則不解碼該子集之構件。
  51. 如請求項47之器件,其進一步包含:用於針對該複數個轉換係數子集中之每一子集判定該子集是否包括指示該子集是否包括任何非零係數之一相關聯之語法元素的構件;及用於基於該語法元素判定是否解碼該子集之構件。
  52. 如請求項47之器件,其進一步包含:若該子集不包括該語法元素,則用於判定該子集是否 包括指示在一掃描次序中之一最後非零係數包括於該子集中之一單獨語法元素之構件;及用於若該子集包括指示一最後非零係數包括於該子集中之該單獨語法元素,則解碼該子集之構件。
TW101123629A 2011-06-30 2012-06-29 用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素 TWI520584B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161503541P 2011-06-30 2011-06-30
US201161552341P 2011-10-27 2011-10-27
US13/413,475 US9826238B2 (en) 2011-06-30 2012-03-06 Signaling syntax elements for transform coefficients for sub-sets of a leaf-level coding unit

Publications (2)

Publication Number Publication Date
TW201309032A TW201309032A (zh) 2013-02-16
TWI520584B true TWI520584B (zh) 2016-02-01

Family

ID=47390655

Family Applications (1)

Application Number Title Priority Date Filing Date
TW101123629A TWI520584B (zh) 2011-06-30 2012-06-29 用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素

Country Status (22)

Country Link
US (1) US9826238B2 (zh)
EP (1) EP2727352B1 (zh)
JP (1) JP5955955B2 (zh)
KR (1) KR101536541B1 (zh)
CN (1) CN103636225B (zh)
AU (1) AU2012275120C1 (zh)
BR (1) BR112013033645B1 (zh)
CA (1) CA2840598C (zh)
DK (1) DK2727352T3 (zh)
ES (1) ES2750124T3 (zh)
HU (1) HUE045792T2 (zh)
IL (1) IL230044A (zh)
MX (1) MX343033B (zh)
MY (1) MY166739A (zh)
PL (1) PL2727352T3 (zh)
PT (1) PT2727352T (zh)
RU (1) RU2580082C2 (zh)
SI (1) SI2727352T1 (zh)
TW (1) TWI520584B (zh)
UA (1) UA111492C2 (zh)
WO (1) WO2013003747A1 (zh)
ZA (1) ZA201400699B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3120561B1 (en) 2014-03-16 2023-09-06 VID SCALE, Inc. Method and apparatus for the signaling of lossless video coding
US10708164B2 (en) * 2016-05-03 2020-07-07 Qualcomm Incorporated Binarizing secondary transform index
CN114339228B (zh) * 2016-05-04 2024-04-12 夏普株式会社 用于对变换数据进行编码的***和方法
EP4236321A3 (en) * 2016-08-31 2023-09-13 KT Corporation Method and device for processing video signal
KR20230008911A (ko) * 2017-12-15 2023-01-16 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
CN108322749B (zh) * 2018-03-15 2021-03-16 北京数码视讯科技股份有限公司 Rdoq的系数优化方法、rdoq的加速方法及装置
US10848775B2 (en) 2018-11-02 2020-11-24 Fungible, Inc. Memory layout for JPEG accelerator
US10931958B2 (en) 2018-11-02 2021-02-23 Fungible, Inc. JPEG accelerator using last-non-zero (LNZ) syntax element
US10827191B2 (en) * 2018-11-02 2020-11-03 Fungible, Inc. Parallel coding of syntax elements for JPEG accelerator
US10827192B2 (en) 2018-11-02 2020-11-03 Fungible, Inc. Work allocation for JPEG accelerator
JP7425808B2 (ja) 2019-06-04 2024-01-31 北京字節跳動網絡技術有限公司 動き候補リスト構築プロセスの条件付き実行
JP7346599B2 (ja) 2019-06-04 2023-09-19 北京字節跳動網絡技術有限公司 ビデオ・データ処理方法、装置、記憶媒体及び記憶方法
CN114615506B (zh) * 2019-06-13 2023-07-04 北京达佳互联信息技术有限公司 视频解码方法、计算设备、存储介质
WO2021008514A1 (en) * 2019-07-14 2021-01-21 Beijing Bytedance Network Technology Co., Ltd. Indication of adaptive loop filtering in adaptation parameter set
CN112449184B (zh) * 2019-08-28 2022-01-25 腾讯科技(深圳)有限公司 变换系数优化方法、编解码方法、装置、介质及电子设备
CN114450959A (zh) 2019-09-28 2022-05-06 北京字节跳动网络技术有限公司 视频编解码中的几何分割模式
WO2023235588A1 (en) * 2022-06-02 2023-12-07 Innopeak Technology, Inc. Region-based coefficient coding for video

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101010722B1 (ko) 2002-04-02 2011-01-24 노키아 코포레이션 영상의 코딩 변환 계수/비디오 인코더 및/또는 디코더
US20040218669A1 (en) 2003-04-30 2004-11-04 Nokia Corporation Picture coding method
US7599435B2 (en) 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
JP4612831B2 (ja) 2004-11-15 2011-01-12 キヤノン株式会社 可変長符号化装置及び可変長符号化方法
EP1768415A1 (en) 2005-09-27 2007-03-28 Matsushita Electric Industrial Co., Ltd. Adaptive scan order of DCT coefficients and its signaling
EP1879401A4 (en) 2005-05-03 2012-03-28 Panasonic Corp DYNAMIC IMAGE ENCODING METHOD, DYNAMIC IMAGE DECODING METHOD, AND DEVICE THEREFOR
JP4495034B2 (ja) 2005-06-01 2010-06-30 パナソニック株式会社 可変長符号化方式および可変長符号化装置
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
KR101366093B1 (ko) 2007-03-28 2014-02-21 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
JP5092558B2 (ja) 2007-06-08 2012-12-05 株式会社日立製作所 画像符号化方法、画像符号化装置、画像復号化方法及び画像復号化装置
US20100027663A1 (en) 2008-07-29 2010-02-04 Qualcomm Incorporated Intellegent frame skipping in video coding based on similarity metric in compressed domain
US8619856B2 (en) * 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8340448B2 (en) * 2009-10-06 2012-12-25 Cisco Technology, Inc. Locally variable quantization and hybrid variable length coding for image and video compression
KR101457894B1 (ko) 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
US8446301B2 (en) * 2011-04-15 2013-05-21 Research In Motion Limited Methods and devices for coding and decoding the position of the last significant coefficient

Also Published As

Publication number Publication date
KR101536541B1 (ko) 2015-07-13
SI2727352T1 (sl) 2019-10-30
AU2012275120C1 (en) 2016-09-08
RU2014102961A (ru) 2015-08-10
CA2840598C (en) 2017-10-17
JP2014521256A (ja) 2014-08-25
EP2727352A1 (en) 2014-05-07
CN103636225A (zh) 2014-03-12
BR112013033645B1 (pt) 2022-06-07
UA111492C2 (uk) 2016-05-10
WO2013003747A1 (en) 2013-01-03
ZA201400699B (en) 2020-02-26
DK2727352T3 (da) 2019-10-14
PT2727352T (pt) 2019-10-31
US9826238B2 (en) 2017-11-21
US20130003821A1 (en) 2013-01-03
TW201309032A (zh) 2013-02-16
CN103636225B (zh) 2018-06-01
JP5955955B2 (ja) 2016-07-20
HUE045792T2 (hu) 2020-01-28
MX2013014931A (es) 2014-04-16
BR112013033645A2 (pt) 2017-01-24
EP2727352B1 (en) 2019-07-24
CA2840598A1 (en) 2013-01-03
IL230044A (en) 2017-12-31
RU2580082C2 (ru) 2016-04-10
AU2012275120A1 (en) 2014-01-09
ES2750124T3 (es) 2020-03-25
KR20140028124A (ko) 2014-03-07
AU2012275120B2 (en) 2016-04-21
MX343033B (es) 2016-10-21
MY166739A (en) 2018-07-19
PL2727352T3 (pl) 2020-01-31

Similar Documents

Publication Publication Date Title
JP6882560B2 (ja) 画像予測方法および装置
TWI520584B (zh) 用信號發送用於一葉層級編碼單元之子集的轉換係數的語法元素
RU2584498C2 (ru) Видеокодирование интра-режима
TWI507017B (zh) 在視訊寫碼中之係數掃描
JP5869108B2 (ja) メモリ効率的コンテキストモデリング
TWI528788B (zh) 用於寫碼視訊資料之方法、裝置及電腦可讀媒體
TWI520588B (zh) 在視訊寫碼中用於視訊時序之時脈刻度求導資訊之發信
TW201729595A (zh) 針對視訊寫碼使用與位置相關之預測組合之改良視訊幀內預測
TWI527440B (zh) 在視訊寫碼中針對高效率視訊寫碼(hevc)延伸之多層之低複雜度支援
TW201742458A (zh) 二值化二次轉換指數
TW201352004A (zh) 轉換係數寫碼
TW201444350A (zh) 方形區塊預測
TW201517599A (zh) 內部運動補償延伸
TW201342920A (zh) 在視訊寫碼中用於色度分量之變換單位分割
TWI523530B (zh) 導出最末位置寫碼之上下文以供視訊寫碼
TWI558174B (zh) 用於寫碼視訊資訊之裝置、方法及非暫時性電腦可讀媒體
KR20140030326A (ko) 비디오 코딩을 위한 다수 구역 스캐닝 순서
US20210289224A1 (en) Inter prediction method and related apparatus