TW201906414A - 用於在視訊寫碼中之候選列表之建構的以運動為基礎之優先級 - Google Patents

用於在視訊寫碼中之候選列表之建構的以運動為基礎之優先級 Download PDF

Info

Publication number
TW201906414A
TW201906414A TW107121579A TW107121579A TW201906414A TW 201906414 A TW201906414 A TW 201906414A TW 107121579 A TW107121579 A TW 107121579A TW 107121579 A TW107121579 A TW 107121579A TW 201906414 A TW201906414 A TW 201906414A
Authority
TW
Taiwan
Prior art keywords
block
candidate
list
motion vector
candidate motion
Prior art date
Application number
TW107121579A
Other languages
English (en)
Inventor
張凱
陳建樂
馬塔 卡茲維克茲
Original Assignee
美商高通公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商高通公司 filed Critical 美商高通公司
Publication of TW201906414A publication Critical patent/TW201906414A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

實施例包括用於產生用於框間預測之候選運動向量清單之技術。舉例而言,根據一些實施例,產生具有基於該等候選運動向量中之每一者之運動資訊的一次序之一候選運動向量清單。作為一重分類,在部分地產生該清單之後或在產生該清單之後,可在該清單產生時應用該次序。

Description

用於在視訊寫碼中之候選列表之建構的以運動為基礎之優先級
本申請案係關於視訊編解碼器中之運動向量預測。更特定言之,本申請案係關於自其中選擇參考區塊以用於預測之候選清單之建構。
視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264 (亦稱為ISO/IEC MPEG-4 AVC),包括其可調式視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴展。MVC的最新聯合草案描述於2010年3月的「Advanced video coding for generic audiovisual services」(ITU-T標準H.264)中。另外,存在新近開發的視訊寫碼標準,亦即由ITU-T視訊寫碼專家組(VCEG)及ISO/IEC動畫專家組(MPEG)之視訊寫碼聯合合作小組(JCT-VC)開發的高效率視訊寫碼(HEVC)。最新的HEVC草案可自http://phenix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip獲得。[HEVC] G. J. Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (2012年12月)。「Overview of the High Efficiency Video Coding (HEVC) Standard」(PDF)。IEEE Transactions on Circuits and Systems for Video Technology (IEEE) 22 (12)。2012-09-14檢索。需要支援更高解析度及更高位元深度之視訊編解碼器。
實施例包括用於產生用於框間預測之候選運動向量清單之技術。舉例而言,根據一些實施例,產生具有基於候選運動向量中之每一者之運動資訊的次序之候選運動向量清單。
一個實施例包括建構用於視訊編碼器或解碼器中之當前圖像之區塊的框間預測之候選清單的方法。該方法包括:產生用於對圖像之區塊進行框間預測之候選運動向量清單,其中產生具有基於候選運動向量中之每一者之運動資訊的次序之清單;自清單選擇候選運動向量;以及基於所選候選運動向量對區塊執行框間預測。
一個實施例包括用於建構用於當前圖像之區塊的框間預測的候選清單之器件。器件可包括視訊編碼器或視訊解碼器。器件包括經組態以儲存與圖像之複數個區塊相關聯之運動向量的記憶體。器件進一步包括處理器,其經組態以產生用於對圖像區塊進行框間預測之候選運動向量清單,其中產生具有基於候選運動向量中之每一者之運動資訊的次序之清單;自清單選擇候選運動向量;以及基於所選候選運動向量對區塊執行框間預測。
一個實施例包括用於建構用於當前圖像之區塊的框間預測的候選清單之器件。器件可包括視訊編碼器或視訊解碼器。器件包括用於儲存與圖像之複數個區塊相關聯之運動向量的構件。器件進一步包括用於處理視訊資料之構件,其經組態以產生用於對圖像區塊進行框間預測之候選運動向量清單,其中產生具有基於候選運動向量中之每一者之運動資訊的次序之清單;自清單選擇候選運動向量;以及基於所選候選運動向量對區塊執行框間預測。
一個實施例包括其上儲存有指令之非暫時性電腦可讀媒體,該等指令在由處理器執行時使得處理器產生用於對圖像區塊進行框間預測之候選運動向量清單,其中產生具有基於候選運動向量中之每一者之運動資訊的次序之清單;自清單選擇候選運動向量;以及基於所選候選運動向量對區塊執行框間預測。
根據 35 U.S.C.§119 之優先權主張 本專利申請案主張2017年6月23日申請之美國臨時申請案第62/524,420號及2018年6月21日申請之美國非臨時申請案第16/014,947號的優先權,且讓與此處之受讓人且在此以引用之方式明確地併入本文中。
如在下文更詳細地論述,視訊編解碼器通常包括使用框間預測技術來獲得實質性寫碼增益。特定言之,框間預測技術包括運動補償之框間預測,其中基於參考圖像之區塊中的全部或一部分預測當前經寫碼圖像之區塊。框間預測經運動補償,此係由於參考區塊可位於參考圖像中之不同位置。參考區塊像素及指示位置差異之運動向量共同用於預測當前區塊。
為了實現框間預測參數之更有效發信,編碼器及解碼器使用對應程序產生自其中選擇一或多個運動向量以寫碼當前區塊之候選運動向量清單。現有框間預測技術可以基於相鄰區塊之位置判定的預定次序產生此等候選清單。視訊編碼器編碼視訊位元串流中之資料,該資料向視訊解碼器指示將使用候選運動向量中的哪一個來編碼/解碼區塊。
實施例包括用於基於運動資訊對候選區塊進行排序以判定優先級或***次序之技術。實施例包括使用運動資訊來判定建構例如合併候選清單及/或進階運動向量預測子(AMVP)候選清單之候選清單的優先級或***次序。如下文更詳細地論述,此運動資訊可包括與候選運動向量之參考區塊相關聯之資訊,諸如與參考區塊或其圖像相關聯之量化參數。運動資訊亦可,或替代地包括候選區塊之參考圖像與當前圖像之間的時間距離。運動資訊亦可,或替代地包括與候選運動向量之參考區塊或參考圖像相關聯之寫碼類型。運動資訊亦可,或替代地包括基於待預測之當前區塊之同置參考區塊及至少一個相鄰區塊之同置參考區塊計算的相似性度量。
此類排序之優勢包括能夠更早將更可能的候選者置放於候選清單中。在一些實施例中,此可減少編碼器將資料寫碼成至解碼器的位元串流所需的位元數目,以指示將選擇哪一個候選者用於寫碼區塊。
如更詳細地論述實例及實施例之上下文,圖1為說明可利用本發明中所描述之技術之實例視訊編碼及解碼系統10的方塊圖。如圖1中所展示,系統10包括源器件12,其產生稍後待由目的地器件14解碼之經編碼視訊資料。源器件12及目的地器件14可包含廣泛範圍的器件中之任一者,包括桌上型電腦、筆記型(亦即,膝上型)電腦、平板電腦、機上盒、電話手持機(諸如,所謂的「智慧型」電話)、所謂的「智慧型」墊片、電視、攝影機、顯示器件、數位媒體播放器、視訊遊戲控制台、視訊串流器件或其類似者。在一些情況下,源器件12及目的地器件14可能經裝備以用於無線通信。
目的地器件14可經由鏈路16接收待解碼之經編碼視訊資料。鏈路16可包含能夠將經編碼視訊資料自源器件12移動至目的地器件14的任何類型之媒體或器件。在一個實例中,鏈路16可包含使源器件12能夠將經編碼視訊資料直接即時傳輸至目的地器件14之通信媒體。可根據通信標準(諸如,無線通信協定)調變經編碼視訊資料,且將其傳輸至目的地器件14。通信媒體可包含任何無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全域網路)之部分。通信媒體可包括路由器、交換器、基地台或可用於促進自源器件12至目的地器件14的通信之任何其他設備。
在另一實例中,經編碼資料可自輸出介面22輸出至儲存器件26。類似地,可藉由輸入介面自儲存器件26存取經編碼資料。儲存器件26可包括多種分佈式或本端存取式資料儲存媒體中之任一者,諸如,硬碟機、藍光光碟、DVD、CD-ROM、快閃記憶體、揮發性或非揮發性記憶體或用於儲存經編碼視訊資料之任何其他適合數位儲存媒體。在另一實例中,儲存器件26可對應於檔案伺服器或可保持由源器件12產生的經編碼視訊之另一中間儲存器件。目的地器件14可經由串流或下載而自儲存器件26存取所儲存之視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將彼經編碼視訊資料傳輸至目的地器件14的任何類型之伺服器。實例檔案伺服器包括網頁伺服器(例如,用於網站)、FTP伺服器、網路附加儲存(NAS)器件或本端磁碟機。目的地器件14可經由任何標準資料連接(包括網際網路連接)存取經編碼視訊資料。此資料連接可包括無線通道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線數據機等)或適用於存取儲存於檔案伺服器上之經編碼視訊資料之兩者的組合。經編碼視訊資料自儲存器件26之傳輸可為串流傳輸、下載傳輸或兩者之組合。
本發明之技術不必限於無線應用或設定。該等技術可應用於支援多種多媒體應用(諸如,(例如)經由網際網路之空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸)中之任一者的視訊寫碼、供儲存於資料儲存媒體上之數位視訊的編碼、儲存於資料儲存媒體上之數位視訊的解碼,或其他應用。在一些實例中,系統10可經組態以支援單向或雙向視訊傳輸從而支援諸如視訊串流、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源器件12包括視訊源18、視訊編碼器20及輸出介面22。在一些情況下,輸出介面22可包括調變器/解調器(數據機)及/或傳輸器。在源器件12中,視訊源18可包括諸如視訊捕捉器件(例如,視訊攝影機)、含有先前所捕捉視訊之視訊存檔、用以自視訊內容提供者接收視訊之視訊饋入介面,及/或用於產生電腦圖形資料作為源視訊之電腦圖形系統之源,或此等源之組合。作為一個實例,若視訊源18為視訊攝影機,則源器件12及目的地器件14可形成所謂的智慧型電話、攝影機電話或視訊電話。然而,本發明中所描述之技術一般可適用於視訊寫碼,且可應用於無線及/或有線應用。
經捕捉、預先捕捉或電腦產生之視訊可由視訊編碼器20編碼。經編碼視訊資料可經由源器件12之輸出介面22直接傳輸至目的地器件14。經編碼視訊資料亦可(或替代地)儲存至儲存器件26上以供稍後由目的地器件14或其他器件存取,用於解碼及/或播放。
目的地器件14包括輸入介面28、視訊解碼器30及顯示器件32。在一些情況下,輸入介面28可包括接收器及/或數據機。目的地器件14之輸入介面28經由鏈路16接收經編碼視訊資料。經由鏈路16傳達或在儲存器件26上所提供之經編碼視訊資料可包括由視訊編碼器20產生之多種語法元素,其供諸如視訊解碼器30之視訊解碼器在解碼該視訊資料時使用。傳輸於通信媒體上、儲存於儲存媒體上,或儲存於檔案伺服器之經編碼視訊資料內可包括此等語法元素。
顯示器件32可與目的地器件14整合或在目的地器件14的外部。在一些實例中,目的地器件14可包括整合式顯示器件且亦經組態以與外部顯示器件介接。在其他實例中,目的地器件14可為顯示器件。大體而言,顯示器件32向使用者顯示經解碼視訊資料,且可包含多種顯示器件中的任一者,諸如液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器或另一類型之顯示器件。
視訊編碼器20及視訊解碼器30可根據與新近定案之高效率視訊寫碼(HEVC)標準類似地操作的較新視訊壓縮標準操作。特定言之,本發明之技術可使用HEVC術語以便於解釋。然而,並未假定本發明之技術受限於HEVC,而實際上,明確預期本發明之技術可實施於HEVC之後續標準及其擴展中。
儘管圖1中未展示,但在一些態樣中,視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當MUX-DEMUX單元或其他硬體及軟體,以處置共同資料串流或單獨資料串流中之音訊及視訊兩者之編碼。若適用,則在一些實例中,MUX-DEMUX單元可遵照ITU H.223多工器協定或 諸如,使用者資料報協定(UDP)的其他協定。
視訊編碼器20及視訊解碼器30各自可實施為多種合適之編碼器電路或解碼器電路中之任一者,諸如一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、軟體、硬體、韌體或其任何組合。當該等技術部分以軟體實施時,器件可將用於軟體之指令儲存於合適之非暫時性電腦可讀媒體中,且使用一或多個處理器在硬體中執行指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括在一或多個編碼器或解碼器中,編碼器或解碼器中之任一者可整合為各別器件中之組合式編碼器/解碼器(CODEC)之部分。
在HEVC及其他視訊寫碼規範中,視訊序列通常包括一系列圖像。圖像亦可被稱為「圖框」。在一個實例途徑中,圖像可包括三個樣本陣列,表示為SL 、SCb 及SCr 。在此實例途徑中,SL 為亮度樣本之二維陣列(亦即,區塊)。SCb 為Cb色度樣本之二維陣列。SCr 為Cr色度樣本之二維陣列。色度樣本亦可在本文中被稱作「色度(chroma)」樣本。在其他情況下,圖像可為單色的,且可僅包括亮度樣本陣列。
圖2為說明可實施本發明中所描述之技術之實例視訊編碼器20的方塊圖。視訊編碼器20可執行視訊圖塊內之視訊區塊之框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減小或移除給定視訊圖框或圖像內之視訊的空間冗餘。框間寫碼依賴於時間預測以減少或移除視訊序列之相鄰圖框或圖像內之視訊的時間冗餘。框內模式(I模式)可指若干基於空間之壓縮模式中的任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可指若干基於時間之壓縮模式中的任一者。
在圖2之實例中,視訊編碼器20包括視訊資料記憶體33、分割單元35、預測處理單元41、求和器50、變換處理單元52、量化單元54、熵編碼單元56。預測處理單元41包括運動估計單元(MEU) 42、運動補償單元(MCU) 44及框內預測單元46。對於視訊區塊重建構,視訊編碼器20亦包括反量化單元58、反變換處理單元60、求和器62、濾波器單元64及經解碼圖像緩衝器(DPB) 66。
如圖2中所展示,視訊編碼器20接收視訊資料且將所接收視訊資料儲存於視訊資料記憶體33中。視訊資料記憶體33可儲存待由視訊編碼器20之組件編碼的視訊資料。可(例如)自視訊源18獲得儲存於視訊資料記憶體33中之視訊資料。DPB 66可為儲存參考視訊資料供視頻編碼器20用於(例如)在框內寫碼模式或框間寫碼模式下編碼視訊資料之參考圖像記憶體。視訊資料記憶體33及DPB 66可由各種記憶體器件中之任一者形成,諸如動態隨機存取記憶體(DRAM),包括同步DRAM (SDRAM)、磁阻式RAM (MRAM)、電阻式RAM (RRAM)或其他類型之記憶體器件。視訊資料記憶體33及DPB 66可由同一記憶體器件或分開的記憶體器件提供。在各種實例中,視訊資料記憶體33可與視訊編碼器20之其他組件一起在晶片上,或相對於彼等組件在晶片外。
分割單元35自視訊資料記憶體33擷取視訊資料且將視訊資料分割成視訊區塊。此分割亦可包括分割成圖塊、圖像塊或其他較大單元以及(例如)根據LCU及CU之四分樹結構分割的視訊區塊。視訊編碼器20大體上說明編碼待編碼之視訊圖塊內之視訊區塊的組件。圖塊可劃分成多個視訊區塊(且可能劃分成被稱為圖像塊之視訊區塊集合)。預測處理單元41可針對基於錯誤結果(例如,寫碼速率及失真程度)針對當前視訊區塊選擇複數個可能寫碼模式中之一者,諸如複數個框內寫碼模式中之一者或複數個框間寫碼模式中之一者。預測處理單元41可將所得經框內或框間寫碼區塊提供至求和器50以產生殘餘區塊資料且提供至求和器62以重建構經編碼區塊以用作參考圖像。
預測處理單元41內之框內預測單元46可執行當前視訊區塊相對於與待寫碼之當前區塊在同一圖框或圖塊中的一或多個相鄰區塊之框內預測性寫碼,以提供空間壓縮。預測處理單元41內之運動估計單元42及運動補償單元44執行當前視訊區塊相對於一或多個參考圖像中之一或多個預測性區塊之框間預測性寫碼,以提供時間壓縮。
運動估計單元42可經組態以根據視訊序列之預定圖案來判定用於視訊圖塊之框間預測模式。預定圖案可將序列中之視訊圖塊指定為P圖塊或B圖塊。運動估計單元42及運動補償單元44可高度整合,但出於概念目的而分開說明。由運動估計單元42執行之運動估計為產生運動向量之過程,該等運動向量估計視訊區塊之運動。舉例而言,運動向量可指示將當前視訊圖框或圖像內之視訊區塊的PU相對於參考圖像內之預測性區塊的移位。
預測性區塊為就像素差而言被發現緊密地匹配待寫碼的視訊區塊之PU之區塊,該像素差可由絕對差和(SAD)、平方差和(SSD)或其他差度量判定。在一些實例中,視訊編碼器20可計算儲存於DPB 66中之參考圖像的子整數像素位置之值。舉例而言,視訊編碼器20可內插參考圖像之四分之一像素位置、八分之一像素位置或其他分數像素位置的值。因此,運動估計單元42可關於全像素位置及分數像素位置執行運動搜尋且輸出具有分數像素精確度之運動向量。
運動估計單元42藉由比較PU之位置與參考圖像之預測性區塊的位置而計算經框間寫碼圖塊中之視訊區塊的PU的運動向量。參考圖像可選自第一參考圖像清單(清單0)或第二參考圖像清單(清單1),參考圖像清單中之每一者識別儲存於DPB 66中之一或多個參考圖像。如在下文更詳細地論述,區塊之運動向量可藉由來自相鄰區塊之候選清單的運動向量預測子判定。運動估計單元42將所計算運動向量發送至熵編碼單元56及運動補償單元44。
由運動補償單元44執行之運動補償可涉及基於由運動估計(可能執行內插至子像素精確密度)判定之運動向量而提取或產生預測性區塊。在接收當前視訊區塊之PU的運動向量之後,運動補償單元44可在參考圖像清單中之一者中定位運動向量所指向之預測性區塊。視訊編碼器20藉由自正經寫碼之當前視訊區塊的像素值減去預測性區塊之像素值來形成殘餘視訊區塊,從而形成像素差值。像素差形成用於區塊之殘餘資料且可包括亮度及色度差分量兩者。求和器50表示執行此減法運算之一或多個組件。運動補償單元44亦可產生與視訊區塊及視訊圖塊相關聯之語法元素以供視訊解碼器30用於在解碼視訊圖塊之視訊區塊時使用。
在預測處理單元41經由框內預測或框間預測產生當前視訊區塊之預測性區塊之後,視訊編碼器20藉由自當前視訊區塊減去預測性區塊而形成殘餘視訊區塊。殘餘區塊中之殘餘視訊資料可包括於一或多個變換單元(TU)中,其含有每一亮度或色度分量之變換區塊;且應用至變換處理單元52。變換處理單元52使用諸如離散餘弦轉換(DCT)或概念上類似之變換的變換將殘餘視訊資料變換為殘餘變換係數。變換處理單元52可將殘餘視訊資料自像素域轉換至變換域(諸如,頻域)。
變換處理單元52可將所得變換係數發送至量化單元54。量化單元54量化變換係數以進一步降低位元率。量化過程可減小與係數中之一些或所有相關聯的位元深度。可藉由調整量化參數來修改量化程度。在一些實例中,量化單元54可接著執行對包括經量化變換係數之矩陣的掃描。在另一實例中,熵編碼單元56可執行該掃描。
在量化之後,熵編碼單元56對經量化變換係數進行熵編碼。舉例而言,熵編碼單元56可執行上下文自適應性可變長度寫碼(CAVLC)、上下文自適應性二進位算術寫碼(CABAC)、基於語法之上下文自適應性二進位算術寫碼(SBAC)、機率區間分割熵(PIPE)寫碼或另一熵編碼方法或技術。在由熵編碼單元56熵編碼之後,經編碼位元串流可傳輸至視訊解碼器30,或經存檔以供視訊解碼器30稍後傳輸或擷取。熵編碼單元56亦可熵編碼當前正寫碼之視訊圖塊的運動向量及其他語法元素。
反量化單元58及反變換處理單元60分別應用反量化及反變換以重建構像素域中之殘餘區塊以供稍後用作參考圖像之參考區塊。運動補償單元44可藉由將殘餘區塊添加至參考圖像清單中之一者內的參考圖像中之一者之預測性區塊來計算參考區塊。運動補償單元44亦可將一或多個內插濾波器應用於經重建構殘餘區塊以計算子整數像素值以用於運動估計。求和器62將經重建構殘餘區塊添加至藉由運動補償單元44產生之運動補償預測區塊以產生經重建構區塊。
濾波器單元64對經重構區塊(例如,求和器62之輸出)進行濾波且將經濾波之經重構區塊儲存於DPB 66中以供用作參考區塊。參考區塊可由運動估計單元42及運動補償單元44用作參考區塊以對後續視訊圖框或圖像中之區塊進行框間預測。儘管未明確展示於圖2中,但視頻編碼器20可包括額外濾波器,諸如解塊濾波器、樣本自適應偏移(SAO)過濾器或其他類型的迴路濾波器。解塊濾波器可例如將解塊濾波應用於濾波器區塊邊界,以自經重建構視訊移除區塊效應假影。SAO濾波器可將偏移應用於經重建構像素值,以便改良總體寫碼品質。亦可使用額外迴路濾波器(迴路中或迴路後)。
圖3為說明可實施本發明中所描述之技術之實例視訊解碼器30的方塊圖。圖3之視訊解碼器30可例如經組態以接收上文關於圖2之視訊編碼器20描述的發信。在圖3之實例中,視訊解碼器30包括視訊資料記憶體78、熵解碼單元80、預測處理單元81、反量化單元86、反變換處理單元88、求和器90、濾波器單元92及DPB 94。預測處理單元81包括運動補償單元82及框內預測處理單元84。在一些實例中,視訊解碼器30可執行與關於來自圖2之視訊編碼器20所描述之編碼遍次大體上互逆的解碼遍次。
在解碼過程期間,視訊解碼器30自視訊編碼器20接收表示經編碼視訊圖塊之視訊區塊及相關聯語法元素的經編碼視訊位元串流。視訊解碼器20將所接收之經編碼視訊位元串流儲存於視訊資料記憶體78中。視訊資料記憶體78可儲存待由視訊解碼器30之組件解碼之視訊資料,諸如經編碼視訊位元串流。儲存於視訊資料記憶體78中之視訊資料可例如經由鏈路16自儲存器件26或自本端視訊源(諸如攝影機)或藉由存取實體資料儲存媒體而獲得。視訊資料記憶體78可形成儲存來自經編碼視訊位元串流之經編碼視訊資料的經寫碼圖像緩衝器(CPB)。DPB 94可為儲存參考視訊資料以供視訊解碼器30用於(例如)在框內寫碼模式或框間寫碼模式下解碼視訊資料之參考圖像記憶體。視訊資料記憶體78及DPB 94可由各種記憶體器件中之任一者形成,該等記憶體器件諸如DRAM、SDRAM、MRAM、RRAM或其他類型之記憶體器件。視訊資料記憶體78及DPB 94可由同一記憶體器件或分開的記憶體器件提供。在各種實例中,視訊資料記憶體78可與視訊解碼器30之其他組件一起在晶片上,或相對於彼等組件在晶片外。
視訊解碼器30之熵解碼單元80熵解碼儲存於視訊資料記憶體78中之視訊資料以產生經量化係數、運動向量及其他語法元素。熵解碼單元80將運動向量及其他語法元素轉遞至預測處理單元81。視訊解碼器30可在視訊圖塊層級及/或視訊區塊層級接收語法元素。
當視訊圖塊經寫碼為經框內寫碼(I)圖塊時,預測處理單元81之框內預測處理單元84可基於經發信框內預測模式及來自當前圖框或圖像之先前經解碼區塊的資料而產生當前視訊圖塊之視訊區塊的預測資料。當視訊圖框經寫碼為經框間寫碼圖塊(例如,B圖塊或P圖塊)時,預測處理單元81之運動補償單元82基於自熵解碼單元80接收到之運動向量及其他語法元素而生產當前視訊圖塊之視訊區塊的預測性區塊。預測性區塊可自參考圖像清單中之一者內的參考圖像中之一者產生。視訊解碼器30可基於儲存於DPB 94中之參考圖像使用預設建構技術來建構參考圖框清單、清單0及清單1。
運動補償單元82藉由剖析運動向量及其他語法元素來判定用於當前視訊圖塊之視訊區塊的預測資訊,並使用該預測資訊來產生正經解碼之當前視訊區塊之預測性區塊。舉例而言,運動補償單元82使用所接收語法元素中的一些來判定用於寫碼視訊圖塊之視訊區塊的預測模式(例如,框內預測或框間預測)、框間預測圖塊類型(例如,B圖塊或P圖塊)、圖塊之參考圖像清單中之一或多者之建構資訊、圖塊之每一經框間編碼視訊區塊的運動向量、圖塊之每一經框間寫碼視訊區塊之框間預測狀態,及用以解碼當前視訊圖塊中之視訊區塊的其他資訊。
運動補償單元82亦可基於內插濾波器執行內插。運動補償單元82可使用如由視訊編碼器20在視訊區塊之編碼期間使用的內插濾波器,以計算參考區塊之子整數像素的內插值。在此情況下,運動補償單元82可自所接收之語法元素判定由視訊編碼器20使用之內插濾波器並使用該等內插濾波器以產生預測性區塊。
反量化單元86反量化(亦即,解量化)位元串流中所提供並由熵解碼單元80解碼之經量化變換係數。反量化過程可包括使用由視訊編碼器20針對視訊圖塊中之每一視訊區塊計算之量化參數,以判定量化程度及(同樣地)應應用之反量化程度。反變換處理單元88將反變換(例如,反DCT、反整數變換或另一頻率變換過程)應用於變換係數,以便產生像素域中之殘餘區塊。
在預測處理單元81使用例如框內或框間預測產生當前視訊區塊之預測性區塊後,視訊解碼器30藉由將來自反變換處理單元88之殘差區塊與由運動補償單元82產生之對應預測性區塊求和而形成經重新建構視訊區塊。求和器90表示執行此求和運算之該或該等組件。濾波器單元92使用例如ALF技術、SAO技術、解塊技術或其他此類濾波技術中之一或多者對經重建構之視訊區塊進行濾波。
儘管未明確展示於圖2中,但視訊解碼器30亦可包括解塊濾波器、SAO濾波器或其他類型的濾波器中之一或多者。亦可使用其他迴路濾波器(在寫碼迴路內或在寫碼迴路之後)使像素轉變平滑,或以其他方式改良視訊品質。給定圖框或圖像中之經解碼視訊區塊接著儲存於DPB 94中,該DPB儲存用於後續運動補償之參考圖像。DPB 94可為額外記憶體的部分或與其分離,該額外記憶體儲存用於稍後呈現於顯示器件(諸如圖1之顯示器件32)上之經解碼視訊。
特定言之,參考框間預測處理單元44及運動補償單元82之操作,為了寫碼區塊(例如,視訊資料之預測單元(PU)之區塊),首先導出區塊之預測子。預測子可經由框內(I)預測(亦即空間預測)或框間(P或B)預測(亦即時間預測)導出。因此,一些預測單元可關於同一圖像中之相鄰參考區塊使用空間預測進行框內寫碼(I),且其他預測單元可關於其他圖像中之參考區塊進行框間寫碼(P或B)。在一些情況下,參考區塊可處於同一圖像中。應注意,術語「圖像」及「圖框」在當前申請案中通常可互換使用。
在識別預測子之後,即刻計算原始視訊資料區塊與其預測子之間的差值。此差值亦稱為預測殘餘,且係指待寫碼之區塊之像素與參考區塊之對應像素(亦即,預測子)之間的像素值差值。為實現更佳的壓縮,通常(例如)使用離散餘弦變換(DCT)、整數變換、Karhunen-Loeve (K-L)變換或其他變換來變換預測殘餘(亦即,像素差值陣列)。
使用框間預測寫碼區塊涉及計算當前區塊與參考圖像中之區塊之間的運動向量。運動資訊因此包括運動向量及參考圖像之指示兩者。運動向量經由稱為運動估計(或運動搜尋)之過程而計算。舉例而言,運動向量可指示當前圖中像之預測單元相對於參考圖像之參考樣本的移位。參考樣本可為就像素差而言被發現緊密匹配包括經寫碼之PU的CU之部分的區塊,該像素差可藉由絕對差總和(SAD)平方差總和(SSD)或其他差異度量判定。參考樣本可出現在參考圖像或參考圖塊內之任何位置。在一些實例中,參考樣本可出現在分數像素位置處。在發現最佳地匹配當前部分之參考圖像的一部分之後,編碼器即刻將當前部分之當前運動向量判定為自當前部分至參考圖像之匹配部分(亦即,自當前部分之中心至匹配部分之中心)的位置差。
在一些實例中,編碼器可在經編碼視訊位元串流中發信每一部分之運動向量。經發信運動向量由解碼器使用以執行運動補償以便解碼視訊資料。然而,直接發信原始運動向量可導致不太有效寫碼,此係由於通常需要大量位元來傳達資訊。
編碼器可預測每一分割區(亦即,每一PU)之運動向量,而非直接發信原始運動向量。在執行此運動向量預測時,編碼器可選擇自作為當前部分之同一圖像中之空間相鄰區塊判定的候選運動向量集合或自參考圖像中之同置區塊判定的候選運動向量。編碼器可執行運動向量預測,且視需要,發信預測差值而非發信原始運動向量以降低發信之位元速率。來自空間相鄰區塊之候選運動向量可稱為空間MVP候選者,而來自另一參考圖框中之同置區塊之候選運動向量可稱為時間MVP候選者。 運動資訊
對於每一區塊,各種類型之運動資訊可供使用。運動資訊包括用於前向及後向預測方向之運動資訊。在一些實施例中,前向及後向預測方向為對應於不同參考圖像清單(例如,當前圖像或圖塊之參考圖像清單0 (RefPicList0)及參考圖像清單1 (RefPicList1))的兩個預測方向。術語「前向」及「後向」未必具有幾何結構含義。替代地,其用以區分運動向量係基於哪一參考圖像清單。前向預測意謂基於參考清單0形成之預測,而後向預測意謂基於參考清單1形成之預測。在參考清單0及參考清單1兩者皆用以形成給定區塊之預測的情況下,其稱為雙向預測。
對於給定圖像或圖塊,若使用僅一個參考圖像清單,則在圖像或圖塊內部之每一區塊經前向預測。若兩個參考圖像清單皆用於給定圖像或圖塊,則在圖像或圖塊內部之區塊可經前向預測,或經後向預測,或經雙向預測。
對於每一預測方向,運動資訊含有參考索引及運動向量。參考索引用以識別對應參考圖像清單(例如,RefPicList0或RefPicList1)中之參考圖像。運動向量具有水平及豎直分量兩者,其中每一者分別指示沿水平及豎直方向的偏移值。在一些描述中,為簡單起見,字組「運動向量」可與運動資訊互換使用以指示運動向量及其相關連聯參考索引兩者。
圖像次序計數(POC)廣泛用於視訊寫碼標準中以識別圖像之顯示次序。雖然存在一個經寫碼視訊序列內之兩個圖像可具有相同POC值的情況,但經寫碼視訊序列內通常不發生此類情況。當位元串流中存在多個經寫碼視訊序列時,就解碼次序而言,具有同一POC值之圖像可更接近於彼此。
圖像之POC值通常用於參考圖像清單建構、如HEVC中之參考圖像集之導出及運動向量按比例調整。 視訊編解碼器中的區塊結構之實例
在H.264/AVC中,每一框間巨集區塊(MB)可以四種不同方式分割: ● 一個16×16 MB分割區 ● 兩個16×8 MB分割區 ● 兩個8×16 MB分割區 ● 四個8×8 MB分割區
一個MB中之不同MB分割區針對每一方向可具有不同參考索引值(RefPicList0或RefPicList1)。
當MB不被分割成四個8×8 MB分割區時,其在每一方向上針對每一MB分割區僅具有一個運動向量。
當MB被分割成四個8×8 MB分割區時,每一8×8 MB分割區可進一步被分割成子區塊,該等子區塊中之每一者在每一方向上可具有不同運動向量。存在自8×8 MB分割區得到子區塊的四種不同方式:一個8×8子區塊、兩個8×4子區塊、兩個4×8子區塊或四個4×4子區塊。每一子區塊在每一方向上可具有不同運動向量。因此,運動向量存在於等於或高於子區塊之層級中。AVC之其他細節可發現於[AVC] Wiegand, Thomas; Sullivan, Gary J.; Bjøntegaard, Gisle; Luthra, Ajay (2003年7月)中。「H.264/AVC視訊寫碼標準之概述」(PDF)。IEEE Transactions on Circuits and Systems for Video Technology 13 (7)。2011年1月31日檢索。
在AVC中,可在B圖塊中針對跳過或直接模式而在MB或MB分割區層級啟用時間直接模式。對於每一MB分割區,與當前區塊之RefPicList1[0]中之當前MB分割區同置的區塊之運動向量可用以導出運動向量。同置區塊中之每一運動向量可基於POC距離而按比例調整。在AVC中,直接模式亦可自來自空間相鄰者之資訊預測運動資訊。HEVC 區塊結構
在HEVC中,圖塊中之最大寫碼單元被稱作寫碼樹型區塊(CTB)或寫碼樹型單元(CTU)。CTB含有四分樹,該四分樹之節點為寫碼單元。
CTB之大小可介於HEVC主規範中之16×16至64×64的範圍(儘管技術上可支援8×8 CTB大小)。然而,寫碼單元(CU)可與CTB具有相同大小,且小如8×8。每一寫碼單元使用一個模式寫碼。當CU經框間寫碼時,其可進一步分割成2個或4個預測單元(PU)或當不應用進一步分割時變為僅一個PU。當兩個PU存在於一個CU中時,其可為CU之一半大小的矩形或具有CU之¼或¾大小的兩個矩形大小。
當CU經框間寫碼時,針對每一PU提供運動資訊之一個集合。另外,每一PU使用唯一框間預測模式來寫碼以導出運動資訊集合。
在HEVC規範中,對於預測單元(PU)存在兩個框間預測模式,分別命名為合併(跳過被視為合併之特殊狀況)及進階運動向量預測(AMVP)模式。在合併模式中,編碼器經由預測語法之位元串流發信指導解碼器來複製運動向量、參考索引(在圖像中識別運動向量指向的在給定參考圖像清單中之參考圖像)及來自圖像之當前部分的所選候選運動向量之運動預測方向(其識別參考圖像清單(清單0或清單1),亦即,依據參考圖像在時間上在當前圖像之前抑或在當前圖像之後)。為在合併模式中重建構區塊,解碼器使用當前部分之經導出運動資訊獲得預測性區塊,且將殘餘資料添加至預測性區塊以重建構經寫碼區塊。
在AMVP中,編碼器經由位元串流發信來指導解碼器僅複製來自候選部分之運動向量且使用經複製向量作為當前部分之運動向量的預測子,且發信運動向量差(MVD)。分開發信參考圖像及與當前部分之運動向量相關聯的預測方向。MVD為當前部分之當前運動向量與自候選部分導出的運動向量預測子之間的差。在此情況下,編碼器使用運動估計判定待寫碼區塊之實際運動向量,且接著將實際運動向量與運動向量預測子之間的差判定為MVD值。以此方式,解碼器不使用候選運動向量之準確複本作為當前運動向量(如在合併模式中),而是實際上可使用值可「接近於」自運動估計判定之當前運動向量的候選運動向量且添加MVD以再生當前運動向量。為了在AMVP模式下重建構區塊,解碼器添加對應殘餘資料以重建構經寫碼區塊。
在AMVP或合併模式中,針對多個運動向量預測子維持運動向量(MV)候選清單。當前PU之運動向量(以及合併模式中之參考索引)藉由自MV候選清單獲取一個候選者而產生。
MV候選清單含有用於合併模式之至多5個候選者及用於AMVP模式之僅僅兩個候選者。合併候選者可含有運動資訊(例如,對應於參考圖像清單(清單0及清單1)及參考索引兩者之運動向量)集合。若由合併索引識別合併候選者,則參考圖像用於當前區塊之預測,以及判定相關聯之運動向量。然而,在AMVP模式下,對於自清單0或清單1之每一可能預測方向,需要明確地將參考索引連同針對MV候選清單之MVP索引一起發信,此係因為AMVP候選者僅含有運動向量。在AMVP模式中,可進一步改進經預測運動向量。
如可自上文看出,合併候選者對應於運動資訊之整個集合,而AMVP候選者僅含有用於特定預測方向之一個運動向量及參考索引。
以類似方式自相同空間及時間相鄰區塊導出用於兩個模式之候選者。 空間相鄰候選者
圖4a及圖4b說明根據運動向量候選清單之導出次序所標記之位置處的兩個PU 401及402以及相鄰區塊之實例。實例空間MV候選者自圖4a上展示之用於特定PU (例如,與相鄰PU 402一起展示之PU 401)的相鄰區塊導出,但自區塊產生候選者之技術對於合併及AMVP模式而言不同。在合併模式中,在此實例中,可使用圖4a上展示的具有數字之次序導出達四個空間MV候選者,且該次序如下:左(0, A1)、上(1, B1)、右上(2, B0)、左下(3, A0)及左上(4, B2),如圖4a中所展示。
在AMVP模式中,相鄰區塊分為兩個群組:如圖4b上所展示之包含標記為0及1之位置處的區塊之左群組及包含標記為2、3及4之位置處的區塊之上群組。對於每一群組,參考與由經發信參考索引指示之參考圖像相同的參考圖像之相鄰區塊中之潛在候選者具有待選擇之最高優先級以形成群組之最終候選者。有可能所有相鄰區塊均不含有指向相同參考圖像的運動向量。因此,若無法發現此類候選者,則將按比例調整第一可用候選者以形成最終候選者,因此可補償時間距離差。 HEVC中之時間運動向量預測
時間運動向量預測子(TMVP)候選者(若啟用且可用)在空間運動向量候選者之後添加至MV候選清單中。用於TMVP候選者之運動向量導出之過程可對於合併及AMVP模式兩者相同,然而,合併模式中之TMVP候選者之目標參考索在HEVC中引始終設定為0。
圖5為說明關於TMVP候選者產生之兩個實例PU 501及502的圖。用於TMVP候選者推導之主要區塊位置為同置PU 501外部的右下方區塊,如圖5中展示為區塊「T」之位置,以補償用以產生空間相鄰候選者之上方及左側區塊的偏差。然而,若區塊定位於當前CTB列之外部或運動資訊不可用,則區塊被PU之中央區塊取代。
圖6為說明運動向量606與TMVP候選者616之間的關係之圖。用於TMVP候選者616之運動向量自圖塊層級中所指示之同置圖像604之同置PU導出。同置PU之運動向量識別為同置MV 606。類似於AVC中之時間直接模式,為了導出TMVP候選運動向量,按比例調整同置MV以補償距離差。 HEVC中之運動預測之其他態樣
合併及AMVP模式之若干態樣提供為如下內容:運動向量按比例調整 :假定運動向量之值與呈現時間中之圖像之距離成比例。運動向量使兩個圖像相關聯,參考圖像及含有運動向量之圖像(即含有圖像)。當利用一運動向量預測另一運動向量時,基於圖像次序計數(POC)值而計算含有圖像與參考圖像之距離。
對於待預測之運動向量,其相關聯之含有圖像及參考圖像可不同。因此,計算新距離(基於POC)。且運動向量基於此等兩個POC距離而按比例調整。對於空間相鄰候選者,用於兩個運動向量之含有圖像相同,而參考圖像不同。在HEVC中,運動向量按比例調整適用於空間及時間相鄰候選者之TMVP及AMVP兩者。人工運動向量候選者產生 :若運動向量候選清單不完整,則產生人工運動向量候選者並將其***該清單末端,直至清單將具有所有候選者為止。
在合併模式中,存在兩種類型之人工MV候選者:僅針對B圖塊導出之組合雙向預測候選者及默認固定候選者。若第一類型未提供足夠人工候選者,則針對AMVP僅使用零候選者。
對於已在候選清單中且具有必要運動資訊之每一對候選者,雙向合併運動向量候選者藉由參考清單0中之圖像之第一候選者的運動向量與參考清單1中之圖像之第二候選者的運動向量之組合導出。用於候選者***之精簡程序 :來自不同區塊之候選者可恰好相同,此降低合併/AMVP候選清單之效率。應用精簡處理程序以解決此問題。精簡處理程序比較當前候選清單中之一個候選者與其他,以在一定程度上避免***相同候選者。為減小複雜度,應用僅受限制數目個精簡處理程序,而非比較每一潛在候選者與所有其他現有候選者。
圖7說明區塊701及經標記相鄰區塊A0、A1、B0、B1及B2。如上文所描述,存在許多基於優先級之候選清單。根據預定優先級將每一候選者***候選清單中。舉例而言,在HEVC中,合併候選清單或AMVP候選清單藉由基於預定次序(或根據預定優先級)***候選者而建構。
圖8為說明用於產生合併候選清單之實例技術之流程圖。如圖8中所展示,編碼器20之框內預測處理單元44或區塊802處之解碼器30的MCU藉由以預定次序(A1àB1àB0àA0àB2->TMVP)將空間合併候選者***該清單末端而產生合併候選清單。圖8說明根據如HEVC中之技術之合併候選清單的建構過程。逐個地檢查每一空間或時間相鄰區塊以識別區塊是否可提供有效合併候選者。術語「有效」意謂區塊存在,經框間寫碼,候選清單不完整,且區塊中之運動資訊並不藉由在當前候選清單中存在候選者而精簡。舉例而言,具有重複運動向量之候選者可視實施例而定來精簡。在區塊804處,若在檢查所有空間及時間相鄰區塊之後合併候選清單不完整,則將產生人工候選者以實現合併候選清單。人工候選者可如上文所提及般產生。
理想地,若更可能的候選者更早,例如在候選清單中具有較高優先級(且因此可經由較小索引選擇),則寫碼效率可提高。特定言之,根據一些實施例,候選清單根據與候選運動向量相關聯之運動資訊經排序,或在一些實施例中經重排序。
在一個實施例中,候選清單根據檢查次序來建構,隨後根據候選清單中每一候選者之運動資訊以不同的經限定次序添加候選者。在另一實施例中,首先建構整個候選清單,隨後將清單中之所有候選者根據每一候選者之運動資訊重排序。可使用任何適合之分類方法(諸如本領域中已知的彼等方法)進行重排序。圖9說明在重排序之前的合併清單910的實例及在重排序之後彼清單920之說明。在此實例中,合併候選清單中之總候選者數目為五個,如HEVC中所限定,但相同技術可與候選清單之其他大小一起使用。在重排序之後,每一候選者將在重分類清單920中具有新位置,亦即,C2將為候選清單中的第一個,其將以最短碼字提供。
圖10為說明產生候選清單之方法之另一實施例的流程圖。特定言之,在建構候選清單之一部分或若干部分之後,隨後候選清單之該部分/該等部分根據該部分/該等部分中之每一候選者的運動資訊重排序。特定言之,在區塊1002處,對於相鄰區塊之第一部分,對於第一部分中之每一區塊,編碼器20之框內預測處理單元44或解碼器30之MCU根據經限定檢查次序來判定相鄰候選者是否有效,且若有效,則將該候選者附加至候選清單之第一部分。接著在區塊1004處,編碼器20之框內預測處理單元44或解碼器30之MCU根據基於候選清單之第一部分中之候選者的運動資訊之次序而重排序候選清單之第一部分。舉例而言,在一個實例中,合併候選清單可在前四個空間相鄰區塊(A1、B1、B0、A0)已檢查之後重排序。接著在區塊1006處,對於相鄰區塊之剩餘部分,對於該剩餘部分中之每一區塊,根據經限定檢查次序,若有效,則編碼器20之框內預測處理單元44或解碼器30之MCU將區塊附加至候選清單。剩餘部分可包括添加至清單中之任何額外人工候選者。為了繼續先前實例,在前四個空間相鄰區塊已檢查之後候選清單中存在三個候選者(C0、C1、C2)。在重排序之後,每一候選者將在清單中具有新位置,亦即,C2將為候選清單中的第一個,其將以最短碼字提供。在重排序之後,以預定次序檢查其他空間/時間相鄰區塊,其將產生置於經重排序之前三個候選者之後的C3及C4。
圖11說明根據圖10之過程之實例候選清單。特定言之,候選清單1102說明在圖10之區塊1002之後的候選清單。候選清單1104說明根據圖10之區塊1004重排序之後的實例候選清單。候選清單1106說明在區塊1006自候選清單之剩餘部分***候選之後的實例候選清單。
一或多種類型之運動資訊可用於排序候選清單。視情況,在一個實施例中,框間預測方向用作重排序候選清單之準則。如本文中所用,術語「框間預測方向」係指運動補償預測方向。舉例而言,其可為來自參考圖像清單0或參考圖像清單1中之單一參考圖像的「單向預測」。或其可為來自兩個參考圖像之加權和的「雙向預測」。視情況,如在一個實例中,部分排序經限定,其中具有雙向預測之候選者將置於具有單向預測之候選者前。
在一些實例中,候選清單之重排序係穩定的。亦即,若就與候選清單相關聯之部分排序而言兩個候選者具有相同資訊,則重排序不會改變彼等候選者之次序。舉例而言,若候選者X及候選者Y具有相同框間預測方向且在重排序之前候選者X在候選者Y的前面,則在重排序之後候選者X應在候選者Y的前面。
圖12說明根據框間預測方向重排序前四個候選者之實例。此部分實例說明已檢查候選清單完成之後的重排序及前4個空間區塊之後的重排序。特定言之,在檢查清單1150中的前四個空間相鄰區塊(左、上、右上及右下,或簡稱L、T、TR及LB)之後,四個候選者按L、T、TR及LB之次序置於候選清單1150中。在重排序之後,候選清單1150在圖12中呈現為清單1160。由於T及TR經雙向預測且L及LB經單向預測,因此T及TR將置於L及LB前,如候選清單1160中所說明。由於在重排序之前在清單中T在TR的前面,因此在重排序之後T仍在TR的前面。由於在重排序之前在清單中L在LB的前面,因此在重排序之後L仍在LB的前面。因此,最終次序為T、TR、L及LB,如候選清單1160中所說明。
在一些實施例中,用於排序/重排序區塊之運動資訊包含與參考圖像/參考區塊相關聯的資訊。舉例而言,參考圖像/參考區塊之量化參數(QP)可用於重排序候選清單。在一些此等實例中,對於雙向預測,可使用自兩個相關QP計算之值。作為雙向預測之此等實例,兩個參考圖像/參考區塊之QP的平均值或最小值或最大值可視為待考慮之QP。在一個實施例中,部分排序經限定以使得具有QP值較低之參考圖像/參考區塊的候選者將置於具有QP較高之參考圖像/參考區塊的候選者前。
作為另一實例,當前圖像與參考圖像之間的時間距離可用於重排序候選清單。在一些此等實例中,對於雙向預測,可使用自兩個相關時間距離計算之值。作為雙向預測之此等實例,當前圖像與兩個參考圖像之間的時間距離的平均值或最小值或最大值可視為待考慮之時間距離。當前圖像與參考圖像之間的時間距離可經計算為|POCcur-POCref|,其中POCcur為當前圖像之POC且POCref為參考圖像之POC。
在一個實施例中,具有低於當前圖像之時間距離之參考圖像的候選者將置於具有高於當前圖像之時間距離之參考圖像的候選者前。
再舉例而言,參考圖像/參考區塊之寫碼類型可用於重排序候選清單。術語「寫碼類型」係指圖像之寫碼類型,諸如I圖框、P圖框及B圖框(例如在HEVC中);或區塊之寫碼類型,諸如經框內寫碼區塊及經框間寫碼區塊。在一個實施例中,具有如I圖框之參考圖像的候選者將置於具有P圖框或B圖框之參考圖像的候選者前。在一個實施例中,具有經框內寫碼之參考區塊的候選者將置於具有經框間寫碼之參考區塊的候選者前。再舉例而言,運動相似性度量經計算用於每一空間相鄰候選者。在合併候選清單中具有較高相似度之候選者將置於具有較低相似度之候選者前。
作為一實施例,可基於計算當前區塊之同置參考區塊與相鄰區塊之同置參考區塊的運動向量相似度排序候選清單。圖13說明如何計算當前圖像1206中區塊1204之相鄰區塊A0 1202之MV相似度的實例。在A0之運動向量的情況下,參考圖像1226中的區塊A0 1202之同置參考區塊1222定位於參考圖像1226中。類似地,同樣在A0之運動向量的情況下,當前區塊1204之同置參考區塊1224定位於參考圖像1226中。隨後可在圖像1230中發現區塊A0之同置參考區塊的運動(標記為MV0)及當前區塊之同置參考區塊的運動(標記為MV1)。可計算相鄰區塊A0與MV0及MV1之MV相似度(標記為S)。在一個實施例中,若MV0與MV1不同,則將運動相似度(S)設定為0,且若MV0與MV1相同,則將S設定為1。在另一實施例中,MV0與MV1之絕對差經計算為D = |MV0x-MV1x|+|MV0y-MV1y|。隨後S可計算為D之遞減函數,諸如S = 1 - D或S = 1/D。在另一實施例中,若A0區塊1222之同置參考區塊或當前區塊1204之同置參考區塊1224經框內寫碼,則S設定為最小值(例如0)。
在另一實施例中,若相鄰區塊A0 1202經雙向預測,則可分別計算參考清單0及參考清單1之運動向量的運動相似度,標註為S0及S1。S可經計算為S0與S1之平均值、S0與S1之最小值或S0與S1之最大值。
應瞭解,在一些實施例中,限定候選清單之排序或重排序的部分排序可基於上文所論述之部分排序中之兩者或更多者之組合。在一些實施例中,藉由檢查候選區塊之次序或運動資訊所限定之候選者之第一部分可根據一個部分排序及剩餘部分藉由另一部分排序來排序。
結合本文中揭示之實施例所描述的各種說明性邏輯區塊、模塊、電路及演算法步驟可實施為電子硬體、電腦軟體,或兩者的組合。為了清楚地說明硬體與軟體之此可互換性,各種說明性組件、區塊、模組、電路及步驟已在上文大體按其功能性加以描述。此功能性實施為硬體抑或軟體取決於特定應用及強加於整個系統之設計約束而定。熟習此項技術者可針對每一特定應用以不同方式實施所描述之功能性,但不應將此等實施決策解釋為導致脫離本發明之範疇。
因此,本文中描述之技術可以硬體、軟體、韌體或其任何組合實施。此等技術可實施於多種器件中之任何者中,諸如,通用電腦、無線通信器件手機或具有多種用途(包括在無線通信器件手機及其他器件中之應用)之積體電路器件。可將描述為模組或組件之任何特徵共同實施於整合式邏輯器件中或分開實施為離散但可互操作之邏輯器件。若以軟體實施,則該等技術可至少部分地由包含程式碼之電腦可讀資料儲存媒體實現,該程式碼包括在被執行時執行上文所描述之方法中之一或多者的指令。電腦可讀資料儲存媒體可形成電腦程式產品之部分,電腦程式產品可包括封裝材料。電腦可讀媒體可包含記憶體或資料儲存媒體,諸如,隨機存取記憶體(RAM),諸如,同步動態隨機存取記憶體(SDRAM)、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電可抹除可程式化唯讀記憶體(EEPROM)、快閃記憶體、磁性或光學資料儲存媒體及其類似者。另外或替代地,該等技術可至少部分地由電腦可讀通信媒體實現,該電腦可讀通信媒體載送或傳達呈指令或資料結構之形式且可由電腦存取、讀取及/或執行的程式碼,諸如,傳播之信號或波。
程式碼可由可包括一或多個處理器之處理器執行,諸如,一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA)或其他等效積體或離散邏輯電路。此處理器可經組態以執行本發明中所描述之技術中之任一者。通用處理器可為微處理器;但在替代例中,處理器可為任何習知處理器、控制器、微控制器或狀態機。處理器亦可實施為計算器件之組合,例如,DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器或任何其他此類組態。因此,如本文中所使用之術語「處理器」可指前述結構中之任一者、前述結構之任何組合或適合於實施本文中所描述之技術的任何其他結構或設備。此外,在一些態樣中,本文中描述之功能性可提供於經組態用於編碼及解碼之專用軟體模組或硬體模組,或併入於組合之視訊編碼器-解碼器(編解碼器)中。已描述本發明之各種實施例。
10‧‧‧視訊編碼及解碼系統
12‧‧‧源器件
14‧‧‧目的地器件
16‧‧‧鏈路
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
26‧‧‧儲存器件
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示器件
33‧‧‧視訊資料記憶體
35‧‧‧分割單元
41‧‧‧預測處理單元
42‧‧‧運動估計單元
44‧‧‧運動補償單元
46‧‧‧框內預測單元
50‧‧‧求和器
52‧‧‧變換處理單元
54‧‧‧量化單元
56‧‧‧熵編碼單元
58‧‧‧反量化單元
60‧‧‧反變換處理單元
62‧‧‧求和器
64‧‧‧濾波器單元
66‧‧‧經解碼圖像緩衝器
78‧‧‧視訊資料記憶體
80‧‧‧熵解碼單元
81‧‧‧預測處理單元
82‧‧‧運動補償單元
84‧‧‧框內預測處理單元
86‧‧‧反量化單元
88‧‧‧反變換處理單元
90‧‧‧求和器
92‧‧‧濾波器單元
94‧‧‧DPB
401‧‧‧PU
402‧‧‧PU
501‧‧‧PU
502‧‧‧PU
604‧‧‧同置圖像
606‧‧‧運動向量
616‧‧‧TMVP候選者
701‧‧‧區塊
802‧‧‧區塊
804‧‧‧區塊
910‧‧‧合併清單
920‧‧‧清單
1002‧‧‧區塊
1004‧‧‧區塊
1006‧‧‧區塊
1102‧‧‧候選清單
1104‧‧‧候選清單
1106‧‧‧候選清單
1150‧‧‧候選清單
1160‧‧‧候選清單
1202‧‧‧相鄰區塊A0
1204‧‧‧區塊
1206‧‧‧當前圖像
1222‧‧‧同置參考區塊
1224‧‧‧同置參考區塊
1226‧‧‧參考圖像
1230‧‧‧圖像
A0‧‧‧相鄰區塊
A1‧‧‧相鄰區塊
B0‧‧‧相鄰區塊
B1‧‧‧相鄰區塊
B2‧‧‧相鄰區塊
C0‧‧‧候選者
C1‧‧‧候選者
C2‧‧‧候選者
C3‧‧‧候選者
C4‧‧‧候選者
圖1為說明可利用本發明中所描述之技術之實例視訊編碼及解碼系統的方塊圖。
圖2為說明可實施本發明中所描述之技術之實例視訊編碼器的方塊圖。
圖3為說明可實施本發明中所描述之技術之實例視訊解碼器的方塊圖。
圖4a及圖4b說明根據運動向量候選清單之導出次序標記之位置處的兩個預測單元以及相鄰區塊之實例。
圖5為說明關於時間運動向量預測子(TMVP)候選者產生之兩個實例預測單元的圖。
圖6為說明運動向量606與TMVP候選者616之間的關係之圖。
圖7說明區塊及相鄰區塊。
圖8為說明用於產生合併候選清單之實例技術之流程圖。
圖9為說明在重排序之前及之後的實例合併清單之圖。
圖10為說明產生候選清單之方法之另一實施例的流程圖。
圖11說明根據圖10之過程之實例候選清單。
圖12說明根據每一候選者之框間預測方向重排序前四個候選者之實例。
圖13說明如何計算當前圖像中的另一區塊之相鄰區塊之MV相似度的實例。

Claims (38)

  1. 一種建構用於一當前圖像之一區塊的框間預測之候選清單的方法,其包含: 產生用於對一圖像之一區塊進行框間預測之一候選運動向量清單,其中產生具有基於該等候選運動向量中之每一者之運動資訊的一次序之該清單; 自該清單選擇一候選運動向量;及 基於所選候選運動向量執行該區塊的框間預測。
  2. 如請求項1之方法,其中該等候選運動向量中之每一者包含一運動向量、一參考索引及一運動預測方向。
  3. 如請求項1之方法,其中執行框間預測包含根據一合併模式執行框間預測。
  4. 如請求項1之方法,其中該等候選運動向量中之每一者包含一運動向量、一參考索引及一運動預測方向,且其中執行框間預測包含根據一進階運動向量預測模式執行框間預測。
  5. 如請求項1之方法,其進一步包含基於該區塊之該框間預測將該區塊編碼至一視訊位元串流,其中編碼該區塊包含: 基於該圖像之該區塊及作為執行該框間預測之部分產生的一預測區塊產生一殘餘;及 將資料編碼至該視訊位元串流以用於執行該框間預測,且編碼該殘餘。
  6. 如請求項1之方法,其進一步包含基於該區塊之該框間預測自一經編碼視訊位元串流解碼該區塊,其中解碼該區塊包含: 自該經編碼視訊位元串流解碼一殘餘;及 基於作為執行該框間預測之部分產生的一預測區塊及該殘餘解碼該圖像之該區塊,且其中自該清單選擇該候選運動向量係基於來自該經編碼視訊位元串流之資訊。
  7. 如請求項1之方法,其中按基於每一候選運動向量之運動資訊之該次序產生該候選運動清單包含: 根據一第一次序建構該整個候選清單;及 根據基於每一候選運動向量之運動資訊之該次序重排序該候選清單。
  8. 如請求項1之方法,其中按基於每一候選運動向量之運動資訊之該次序產生該候選運動清單包含: 根據將至少一個候選運動向量包含包括在該候選清單中之一第一次序建構該候選清單之一第一部分; 根據基於該候選清單之第一部分中的該等候選運動向量中之每一者之運動資訊的該次序重排序該候選清單之第一部分; 建構該候選清單之一剩餘部分,其包含在該候選清單中添加至少一個額外候選運動向量。
  9. 如請求項9中任一項之方法,其中執行該重排序以使得在與該候選清單之該次序相關聯的一部分排序中具有相同值之候選者不重排序。
  10. 如請求項1之方法,其中該次序係基於該等候選運動向量中之至少一者之該預測方向。
  11. 如請求項1之方法,其中該次序係基於與該等候選運動向量中之至少一者之該參考圖像相關聯的資訊。
  12. 如請求項1之方法,其中該次序係基於與該等候選運動向量中之至少一者之該參考區塊相關聯的資訊。
  13. 如請求項11之方法,其中與該等候選運動向量中之至少一者之該參考區塊相關聯的該資訊包含與該等候選運動向量中之該至少一者之該參考圖像或該參考區塊中之一者相關聯的一量化參數。
  14. 如請求項11之方法,其中該次序係基於該等候選區塊中之至少一者之該參考圖像與該當前圖像之間的時間距離。
  15. 如請求項1之方法,其中該次序係基於與一寫碼類型相關聯之資訊,該寫碼類型與該等候選運動向量中之至少一者相關聯。
  16. 如請求項15之方法,其中與該等候選運動向量中之至少一者相關聯的該寫碼類型為與該等候選運動向量中之該至少一者相關聯的該參考圖像之該寫碼類型。
  17. 如請求項15之方法,其中與該等候選運動向量中之至少一者相關聯的該寫碼類型為與該等候選運動向量中之該至少一者相關聯的該參考區塊之該寫碼類型。
  18. 如請求項1之方法,其進一步包含計算與該清單中之至少一個空間相鄰候選者相關聯的一運動向量相似性度量,其中該次序係基於該經計算之運動向量相似性度量。
  19. 如請求項18之方法,其中基於待預測之該當前區塊之同置參考區塊及該至少一個相鄰區塊之同置參考區塊計算該運動向量相似性度量。
  20. 一種用於建構用於一當前圖像之一區塊的框間預測之候選清單的器件,其包含: 一記憶體,其經組態以儲存與一圖像之複數個區塊相關聯的運動向量;及 一處理器,其經組態以: 產生用於對該圖像之一區塊進行框間預測之一候選運動向量清單,其中產生具有基於該等候選運動向量中之每一者之運動資訊的一次序之該清單; 自該清單選擇一候選運動向量;及 基於所選候選運動向量執行該區塊的框間預測。
  21. 如請求項20之器件,其中該等候選運動向量中之每一者包含一運動向量、一參考索引及一運動預測方向。
  22. 如請求項20之器件,其中該處理器經組態以根據一合併模式執行框間預測。
  23. 如請求項20之器件,其中該等候選運動向量中之每一者包含一運動向量、一參考索引及一運動預測方向,且其中該處理器經組態以根據一進階運動向量預測模式執行框間預測。
  24. 如請求項20之器件,其中該處理器經組態以基於該區塊之該框間預測將該區塊編碼至一視訊位元串流,其中該處理器進一步經組態以: 基於該圖像之該區塊及作為執行該框間預測之部分產生的一預測區塊產生一殘餘;及 將指示如何執行該框間預測及指示該殘餘之資料編碼至該視訊位元串流。
  25. 如請求項20之器件,其中該處理器經組態以基於該區塊之該框間預測自一經編碼視訊位元串流解碼該區塊,其中該處理器進一步經組態以: 自該經編碼視訊位元串流解碼一殘餘;及 基於作為執行該框間預測之部分產生的一預測區塊及該殘餘解碼該圖像之該區塊,且其中該處理器經組態以基於來自該經編碼視訊位元串流之資訊自該清單選擇該候選運動向量。
  26. 如請求項20之器件,其中為了按基於每一候選運動向量之運動資訊之該次序產生該候選運動清單,該處理器經組態以: 根據一第一次序建構該整個候選清單;及 根據基於每一候選運動向量之運動資訊之該次序重排序該候選清單。
  27. 如請求項20之器件,其中為了按基於每一候選運動向量之運動資訊之該次序產生該候選運動清單,該處理器經組態以: 根據將至少一個候選運動向量包含包括在該候選清單中之一第一次序建構該候選清單之一第一部分; 根據基於該候選清單之第一部分中的該等候選運動向量中之每一者之運動資訊的該次序重排序該候選清單之第一部分;及 建構該候選清單之一剩餘部分,其包含在該候選清單中添加至少一個額外候選運動向量。
  28. 如請求項27之器件,其中執行該重排序以使得在與該候選清單之該次序相關聯的一部分排序中具有相同值之候選者不重排序。
  29. 如請求項20之器件,其中該次序係基於該等候選運動向量中之至少一者之該預測方向。
  30. 如請求項20之器件,其中該次序係基於與該等候選運動向量中之至少一者之該參考圖像相關聯的資訊。
  31. 如請求項20之器件,其中該次序係基於與該等候選運動向量中之至少一者之該參考區塊相關聯的資訊。
  32. 如請求項31之器件,其中與該等候選運動向量中之至少一者之該參考區塊相關聯的該資訊包含與該等候選運動向量中之該至少一者之該參考圖像或該參考區塊中之一者相關聯的一量化參數。
  33. 如請求項20之器件,其中該次序係基於該等候選區塊中之至少一者之該參考圖像與該當前圖像之間的時間距離。
  34. 如請求項20之器件,其中該次序係基於與一寫碼類型相關聯之資訊,該寫碼類型與該等候選運動向量中之至少一者相關聯。
  35. 如請求項34之器件,其中與該等候選運動向量中之至少一者相關聯的該寫碼類型為與該等候選運動向量中之該至少一者相關聯的該參考圖像之該寫碼類型。
  36. 如請求項34之器件,其中與該等候選運動向量中之至少一者相關聯的該寫碼類型為與該等候選運動向量中之該至少一者相關聯的該參考區塊之該寫碼類型。
  37. 如請求項20之器件,其中該處理器進一步經組態以計算與該清單中之至少一個空間相鄰候選者相關聯的一運動向量相似性度量,其中該次序係基於該經計算之運動向量相似性度量。
  38. 如請求項37之器件,其中基於待預測之該當前區塊之同置參考區塊及該至少一個相鄰區塊之同置參考區塊計算該運動向量相似性度量。
TW107121579A 2017-06-23 2018-06-22 用於在視訊寫碼中之候選列表之建構的以運動為基礎之優先級 TW201906414A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201762524420P 2017-06-23 2017-06-23
US62/524,420 2017-06-23
US16/014,947 US10911769B2 (en) 2017-06-23 2018-06-21 Motion-based priority for the construction of candidate lists in video coding
US16/014,947 2018-06-21

Publications (1)

Publication Number Publication Date
TW201906414A true TW201906414A (zh) 2019-02-01

Family

ID=64692947

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107121579A TW201906414A (zh) 2017-06-23 2018-06-22 用於在視訊寫碼中之候選列表之建構的以運動為基礎之優先級

Country Status (5)

Country Link
US (1) US10911769B2 (zh)
EP (1) EP3643070A1 (zh)
CN (1) CN110800304B (zh)
TW (1) TW201906414A (zh)
WO (1) WO2018237304A1 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018205914A1 (en) * 2017-05-10 2018-11-15 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
US20200014918A1 (en) * 2018-07-08 2020-01-09 Mellanox Technologies, Ltd. Application accelerator
US11252464B2 (en) 2017-06-14 2022-02-15 Mellanox Technologies, Ltd. Regrouping of video data in host memory
US20200014945A1 (en) * 2018-07-08 2020-01-09 Mellanox Technologies, Ltd. Application acceleration
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
CN114125450B (zh) 2018-06-29 2023-11-17 北京字节跳动网络技术有限公司 一种用于处理视频数据的方法、装置和计算机可读介质
KR20240007298A (ko) 2018-06-29 2024-01-16 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut에서의 모션 후보들의 검사 순서
GB2588531B (en) 2018-06-29 2023-02-01 Beijing Bytedance Network Tech Co Ltd Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
TWI728390B (zh) 2018-06-29 2021-05-21 大陸商北京字節跳動網絡技術有限公司 查找表尺寸
CN114466197A (zh) 2018-06-29 2022-05-10 北京字节跳动网络技术有限公司 用于查找表更新的编码的运动信息的选择
CN110662063B (zh) 2018-06-29 2020-12-15 北京字节跳动网络技术有限公司 视频处理方法、装置和计算机可读存储介质
EP3794824A1 (en) 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Conditions for updating luts
KR102627814B1 (ko) 2018-06-29 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 룩업 테이블의 업데이트: fifo, 제약된 fifo
TWI719526B (zh) 2018-07-02 2021-02-21 大陸商北京字節跳動網絡技術有限公司 查找表的更新
US10645380B2 (en) * 2018-07-09 2020-05-05 Tencent America LLC Method and apparatus for video coding
TWI820211B (zh) 2018-09-12 2023-11-01 大陸商北京字節跳動網絡技術有限公司 取決於總數減去k的開始檢查hmvp候選的條件
WO2020084554A1 (en) 2018-10-24 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Searching based motion candidate derivation for sub-block motion vector prediction
CN109889838B (zh) * 2018-12-29 2021-02-12 北京佳讯飞鸿电气股份有限公司 一种基于roi区域的hevc快速编码方法
US10764603B2 (en) * 2018-12-31 2020-09-01 Alibaba Group Holding Limited Resolution-adaptive video coding
JP7275286B2 (ja) 2019-01-10 2023-05-17 北京字節跳動網絡技術有限公司 Lut更新の起動
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
WO2020147772A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Motion candidates derivation
CN110809161B (zh) * 2019-03-11 2020-12-29 杭州海康威视数字技术股份有限公司 运动信息候选者列表构建方法及装置
CN113615193B (zh) 2019-03-22 2024-06-25 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
CN114390289A (zh) * 2020-10-18 2022-04-22 腾讯科技(深圳)有限公司 参考像素候选列表构建方法、装置、设备及存储介质
US11477437B2 (en) * 2021-01-28 2022-10-18 Lemon Inc. Coding of motion information
WO2023284817A1 (en) * 2021-07-15 2023-01-19 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
WO2023052489A1 (en) * 2021-09-29 2023-04-06 Canon Kabushiki Kaisha Video coding and decoding
WO2023237025A1 (en) * 2022-06-07 2023-12-14 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing
KR20230175110A (ko) * 2022-06-22 2023-12-29 현대자동차주식회사 메타 정보를 이용하는 비디오 코딩방법 및 장치

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022555B (zh) * 2007-02-12 2010-12-08 清华大学 帧间预测编码的模式快速选择方法
WO2009115901A2 (en) * 2008-03-19 2009-09-24 Nokia Corporation Combined motion vector and reference index prediction for video coding
KR101449679B1 (ko) * 2010-08-18 2014-10-15 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법, 및 참조픽처 인덱싱 장치 및 방법
CN102075762B (zh) * 2010-12-31 2012-12-05 北京大学深圳研究生院 用于视频编码器的帧间预测电路及其实现方法
US9866859B2 (en) * 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
JP5786478B2 (ja) * 2011-06-15 2015-09-30 富士通株式会社 動画像復号装置、動画像復号方法、及び動画像復号プログラム
US9282338B2 (en) * 2011-06-20 2016-03-08 Qualcomm Incorporated Unified merge mode and adaptive motion vector prediction mode candidates selection
JP5706264B2 (ja) * 2011-08-01 2015-04-22 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラムおよび画像復号プログラム
US20130188715A1 (en) * 2012-01-09 2013-07-25 Qualcomm Incorporated Device and methods for merge list reordering in video coding
US20130329007A1 (en) * 2012-06-06 2013-12-12 Qualcomm Incorporated Redundancy removal for advanced motion vector prediction (amvp) in three-dimensional (3d) video coding
US9325990B2 (en) 2012-07-09 2016-04-26 Qualcomm Incorporated Temporal motion vector prediction in video coding extensions
CN102946536B (zh) * 2012-10-09 2015-09-30 华为技术有限公司 候选矢量列表构建的方法及装置
CN102984521B (zh) * 2012-12-12 2015-04-08 四川大学 基于时域相关性的高性能视频编码帧间模式判决方法
US10021388B2 (en) * 2012-12-26 2018-07-10 Electronics And Telecommunications Research Institute Video encoding and decoding method and apparatus using the same
US9674542B2 (en) * 2013-01-02 2017-06-06 Qualcomm Incorporated Motion vector prediction for video coding
WO2018205914A1 (en) * 2017-05-10 2018-11-15 Mediatek Inc. Method and apparatus of reordering motion vector prediction candidate set for video coding
CN111263147B (zh) * 2018-12-03 2023-02-14 华为技术有限公司 帧间预测方法和相关装置

Also Published As

Publication number Publication date
US10911769B2 (en) 2021-02-02
US20180376160A1 (en) 2018-12-27
WO2018237304A1 (en) 2018-12-27
EP3643070A1 (en) 2020-04-29
CN110800304A (zh) 2020-02-14
CN110800304B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
US10911769B2 (en) Motion-based priority for the construction of candidate lists in video coding
TWI826546B (zh) 對以歷史為基礎之運動向量預測器之改良
TWI803563B (zh) 改良的解碼器側之運動向量推導
KR102343699B1 (ko) 디코더-측 모션 벡터 도출에 기초한 mvp 도출의 제한
JP6740243B2 (ja) ビデオコーディングにおける動きベクトル導出
CN112956190B (zh) 仿射运动预测
TWI501611B (zh) 用於3d視訊之視圖間預測之運動向量
WO2019075375A1 (en) MOTION VECTOR PREDICTORS USING MOTION MODELS AFFINED IN VIDEO CODING
CN110771163A (zh) 视频译码中的帧间预测与帧内预测的组合
CN111201793A (zh) 用于fruc的低复杂度设计
TW201817238A (zh) 用於視訊寫碼之適應性運動向量精準度
TW201711463A (zh) 判定用於視訊寫碼之照明補償狀態之系統及方法
TW201907724A (zh) 用於運動向量推導之基於部份重建構之模板匹配
TW201703531A (zh) 判定用於視訊寫碼之照明補償狀態之系統及方法
TW201924345A (zh) 寫碼用於視頻寫碼之仿射預測移動資訊
JP2022521979A (ja) デコーダ側動きベクトル改良に対する制約
US11582475B2 (en) History-based motion vector prediction
JP2015510358A (ja) Bスライス中の予測単位の単方向インター予測への制限
JP2023017760A (ja) ビデオデータインター予測方法及び装置
TW202025727A (zh) 向量預測器清單之產生
JP6359681B2 (ja) 3d−hevcのための簡略化された高度残差予測
CN114363611B (zh) 用于视频编码的方法和计算设备
WO2019237287A1 (zh) 视频图像的帧间预测方法、装置及编解码器
CN118339832A (zh) 解码器侧运动信息推导
TW202038611A (zh) 用於視訊寫碼之三角運動資訊