TWI827681B - 具有自適應運動矢量分辨率的仿射模式的語法重用 - Google Patents

具有自適應運動矢量分辨率的仿射模式的語法重用 Download PDF

Info

Publication number
TWI827681B
TWI827681B TW108133899A TW108133899A TWI827681B TW I827681 B TWI827681 B TW I827681B TW 108133899 A TW108133899 A TW 108133899A TW 108133899 A TW108133899 A TW 108133899A TW I827681 B TWI827681 B TW I827681B
Authority
TW
Taiwan
Prior art keywords
mode
motion
affine
block
affine inter
Prior art date
Application number
TW108133899A
Other languages
English (en)
Other versions
TW202025736A (zh
Inventor
劉鴻彬
張莉
張凱
王悅
Original Assignee
大陸商北京字節跳動網絡技術有限公司
美商字節跳動有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商北京字節跳動網絡技術有限公司, 美商字節跳動有限公司 filed Critical 大陸商北京字節跳動網絡技術有限公司
Publication of TW202025736A publication Critical patent/TW202025736A/zh
Application granted granted Critical
Publication of TWI827681B publication Critical patent/TWI827681B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公開涉及具有自適應運動向量解析度的仿射模式的語 法重用,公開了一種用於視頻處理的方法,包括:對於視頻的當前塊的編解碼表示與當前塊之間的轉換,從適用於含有該當前視頻塊的視頻區域的允許的多個運動向量差異(MVD)精度的集合中確定運動向量差異(MVD)精度以用於該轉換;並且基於該MVD精度執行該轉換。

Description

具有自適應運動矢量分辨率的仿射模式的語法重用
本專利文件涉及視頻處理技術、設備和系統。
[相關申請的交叉引用]
根據適用的專利法和/或依據巴黎公約的規則,本申請要求於2018年9月19日提交的國際專利申請第PCT/CN2018/106513號和於2019年2月1日提交的國際專利申請第PCT/CN2019/074433號的優先權和權益。出於所有目的,上述申請的所有公開內容通過引用併入作為本申請的公開內容的一部分。
儘管視頻壓縮有所進步,但數位視頻仍占因特網和其它數位通信網路上最大的頻寬使用。隨著能夠接收和顯示視頻的所連接的用戶設備的數量增加,預計數位視頻使用的頻寬需求將繼續增長。
描述了與數位視頻編解碼有關的設備、系統和方法,並且具體地,描述了具有自適應運動向量解析度(AMVR)的仿射模式的運動向量預測(MVP)推導和信令。所描述的方法可以應用於現有視頻編解碼標準(例如,高效視頻編解碼(HEVC))和未來視頻編解碼標準或視頻編解碼器。
在一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:對於視頻的當前塊的編解碼表示與當前塊之間的轉換,從適用於含有該當前視頻塊的視頻區域的允許的多個運動向量差異(MVD)精度的集合中確定用於該轉換的運動向量差異(MVD)精度;並且基於該MVD精度執行轉換。
在一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:對於包括視頻的一個或多個視頻塊的視頻區域和視頻的編解碼表示,確定多個運動向量差異(MVD)精度的使用以用於視頻區域中的一個或多個視頻塊的轉換;並且基於該確定執行轉換。
在另一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:對於包括視頻的一個或多個視頻塊的視頻區域和視頻的編解碼表示,確定是否將自適應運動向量解析度(AMVR)過程應用於當前視頻塊以用於當前視頻塊與視頻的編解碼表示之間的轉換;並且基於該確定執行轉換。
在另一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:對於包括視頻的一個或多個視頻塊的視頻區域和視頻的編解碼表示,確定如何將自適應運動向量解析度(AMVR)過程應用於當前視頻塊以用於當前視頻塊與視頻的編解碼表示之間的轉換;並且基於該確定執行轉換。
在一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:基於使用仿射編解碼模式的當前編解碼單元的父代編解碼單元的編解碼模式或該仿射編解碼模式的速率失真(RD)成本,確定自適應運動向量解析度(AMVR)的使用以用於視頻當前塊的編解碼表示與當前塊之間的轉換;並且根據該確定的結果執行轉換。
在一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:確定自適應運動向量解析度(AMVR)的使用以用於視頻的當前塊的編解碼表示與使用高級運動向量預測(AMVP)編解碼模式的當前塊之間的轉換,該確定基於AMVP編解碼模式的速率失真(RD)成本;並且根據該確定的結果執行轉換。
在一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:使用4參數仿射模型或6參數仿射模型生成運動向量(MV)精度的集合以用於視頻的當前塊的編解碼表示與當前塊之間的轉換;並且基於該MV精度的集合執行轉換。
在一個代表性方面,所公開的技術可以用於提供視頻處 理的方法。該方法包括:基於使用仿射編解碼模式的當前塊的父代塊的編解碼模式,確定自適應運動向量解析度(AMVR)工具是否用於轉換,其中AMVR工具用於在解碼期間細化運動向量解析度;並且根據該確定的結果執行轉換。
在一個代表性方面,所公開的技術可以用於提供視頻處理的方法。該方法包括:基於先前已經使用仿射編解碼模式編解碼的先前塊的MV精度的使用,確定使用該仿射編解碼模式的當前塊的MV精度的速率失真(RD)計算的終止以用於當前塊的編解碼表示與當前塊之間的轉換;並且根據該確定的結果執行轉換。
在另一個代表性方面,上述方法以處理器可執行代碼的形式實施並儲存在電腦可讀程式介質中。
在又一個代表性方面,公開了一種被配置或可操作以執行上述方法的設備。該設備可以包括被編程為實現該方法的處理器。
在又一個代表性方面,視頻解碼器裝置可以實現如本文中所描述的方法。
在附圖、說明書和申請專利範圍中更詳細地描述了所公開技術的上述方面和特徵以及其它方面和特徵。
710:原始列表
720:最終列表
1000、1800、1900、2000:當前CU
1001:子CU
1050、1910、1911、2010:參考圖片
1051:對應塊
1100:CU
1101~1104:子CU
1111~1114、1400、1500、1600、2300:塊
1801:左方
1802:上方
1803:右上方
1804:左底方
1805:左上方
1901、1902、MV0、MV0’、MV1、MV1’、mv0、mv1、mv2、V0、V1、V2、V3、V4:運動向量
1903、1904、TD0、TD1:時域距離
2100:單向運動估計
2301:填充區域
2600、2610、2620、2630、2640、2650、2660、2670、2680:方法
2602、2604、2612、2614、2622、2624、2632、2634、2642、2644、2652、2654、2662、2664、2672、2674、2682、2684:步驟
2700:視頻處理裝置
2702:處理器
2704:儲存器
2706:視頻處理電路
2900:視頻處理系統
2902:輸入
2904:編碼組件
2906、2908:組件
2910:顯示介面
A、B、C、D、E:子塊
A0、A1、B0、B1、B2、C0、C1:位置
tb、td:POC距離
圖1示出了構建Merge候選列表的示例。
圖2示出了空域候選的位置的示例。
圖3示出了經受空域Merge候選的冗餘校驗的候選對的示例。
圖4A和圖4B示出了基於當前塊的尺寸和形狀的第二預測單元PU的位置的示例。
圖5示出了用於時域Merge候選的運動向量縮放的示例。
圖6示出了用於時域Merge候選的候選位置的示例。
圖7示出了生成組合的雙向預測Merge候選的示例。
圖8示出了構建運動向量預測候選的示例。
圖9示出了用於空域運動向量候選的運動向量縮放的示例。
圖10示出了使用用於編解碼單元(CU)的替代時域運動向量預測(ATMVP)算法的運動預測的示例。
圖11示出了具有由空域-時域運動向量預測(STMVP)算法使用的子塊和相鄰塊的編解碼單元(CU)的示例。
圖12示出了用於使用不同的MV精度進行編碼的示例流程圖。
圖13A和圖13B示出了當使用重疊塊的運動補償(OBMC)算法時子塊的示例快照。
圖14示出了用於導出局部亮度補償(LIC)算法的參數的相鄰樣本的示例。
圖15示出了簡化的仿射運動模型的示例。
圖16示出了每個子塊的仿射運動向量場(MVF)的示例。
圖17示出了用於AF_INTER仿射運動模式的運動向量預測(MVP)的示例。
圖18A和18B分別示出了4參數仿射模型和6參數仿射模型的示例。
圖19A和19B示出了用於AF_MERGE仿射運動模式的示例候選。
圖20示出了在模式匹配運動向量推導(PMMVD)模式中的雙邊匹配的示例,模式匹配運動向量推導(PMMVD)模式是基於幀速率上轉換(FRUC)算法的特殊Merge模式。
圖21示出了在FRUC算法中的模板匹配的示例。
圖22示出了在FRUC算法中的單向運動估計的示例。
圖23示出了由雙向光流(BIO)算法使用的光流軌跡的示例。
圖24A和24B示出了使用不具有塊擴展的雙向光流(BIO)算法的示例快照。
圖25示出了基於雙邊模板匹配的解碼器側運動向量細化(DMVR)算法的示例。
圖26A-26I示出了基於所公開的技術的實現方式的用於視頻處理的示例方法的流程圖。
圖27是用於實現本文件中描述的視覺媒體解碼或視覺媒體編碼技術的硬體平臺的示例的方塊圖。
圖28示出了對稱模式的示例。
圖29示出了用於實現本文件中描述的視頻處理系統的硬體平臺的示例的另一個方塊圖。
由於對更高解析度視頻的需求的增加,視頻編解碼方法和技術在現代技術中普遍存在。視頻編解碼器通常包括壓縮或解壓縮數位視頻的電子電路或軟體,並且被不斷改進以提供更高的編解碼效率。視頻編解碼器將未壓縮視頻轉換為壓縮格式,反之亦然。視頻質量、用於表示視頻的數據量(由位元率確定)、編碼和解碼算法的複雜度、對數據丟失和錯誤的敏感性、編輯的簡易性,隨機存取和端到端延遲(時延)之間存在複雜的關係。壓縮格式通常符合標準視頻壓縮規範,例如,高效視頻編解碼(HEVC)標準(也稱為H.265或MPEG-H第2部分)、待最終確定的通用視頻編解碼標準、或其它當前和/或未來的視頻編解碼標準。
所公開的技術的實施例可以應用於現有視頻編解碼標準(例如,HEVC,H.265)和未來的標準以改進壓縮性能。在本文件中使用節標題以改進描述的可讀性,並且不以任何方式將討論或實施例(和/或實現方式)限制於僅相應的節。
1.在HEVC/H.265中的幀間預測的示例
多年來,視頻編解碼標準已經顯著改進,並且現在部分地提供高編解碼效率和對更高解析度的支持。諸如HEVC和 H.265的最新標準基於混合視頻編解碼結構,其中使用時域預測加變換編解碼。
1.1 幀間預測模式的示例
每個幀間預測的預測單元(PU)具有對於一個或兩個參考圖片列表的運動參數。在一些實施例中,運動參數包括運動向量和參考圖片索引。在其它實施例中,也可以使用inter_pred_idc來信令通知對兩個參考圖片列表中一個的使用。在另外的其它實施例中,運動向量可以明確地被編解碼為相對於預測器的增量(delta)。
當使用跳過(skip)模式來編解碼編解碼單元(CU)時,一個PU與該CU相關聯,並且不存在顯著的殘差係數,不存在編解碼的運動向量增量或參考圖片索引。指定Merge模式,由此從相鄰PU──包括空域和時域候選──獲得用於當前PU的運動參數。Merge模式可以應用於任何幀間預測的PU,而不僅適用於跳過模式。Merge模式的替代方案是運動參數的顯式傳輸(explicit transmission),其中運動向量、每個參考圖片列表的對應參考圖片索引、參考圖片列表使用對每個PU被顯式信令通知。
當信令指示要使用兩個參考圖片列表中的一個時,PU從一個樣本塊產生。這被稱為“單向預測”。單向預測可用於P條帶和B條帶。
當信令指示要使用兩個參考圖片列表時,PU從兩個樣 本塊產生。這被稱為“雙向預測”。雙向預測僅可用於B條帶。
1.1.1 構建Merge模式的候選的實施例
當使用Merge模式預測PU時,從位元流解析出指向Merge候選列表(merge candidates list)中的條目的索引,並且該索引被用於檢索運動信息。該列表的構建可以根據以下步驟順序進行總結:
步驟1:初始候選推導
步驟1.1:空域候選推導
步驟1.2:空域候選的冗餘校驗
步驟1.3:時域候選推導
步驟2:附加候選***
步驟2.1:創建雙向預測候選
步驟2.2:***零運動候選
圖1示出了基於上面總結的步驟順序構建Merge候選列表的示例。對於空域Merge候選推導,在位於五個不同位置的候選中選擇最多四個Merge候選。對於時域Merge候選推導,在兩個候選中選擇最多一個Merge候選。由於在解碼器處假設每個PU的候選的數量為常數,因此當候選的數量未達到在條帶標頭中信令通知的最大Merge候選數量(MaxNumMergeCand)時,生成附加的候選。由於候選的數量是恆定的,因此使用二進制一元截斷(TU)來編碼最佳Merge候選的索引。如果CU的尺寸等於8,則當前CU的所有PU共享單個Merge候選列表,該單個 Merge候選列表與2N×2N預測單元的Merge候選列表相同。
1.1.2 構建空域Merge候選
在空域Merge候選的推導中,在位於圖2中描繪的位置中的候選中選擇最多四個Merge候選。推導的順序是A1、B1、B0、A0和B2。僅當位置A1、B1、B0、A0的任何PU不可用時(例如,因為該PU屬於另一個條帶(slice)或片(tile))或者是幀內編解碼時,才考慮位置B2。在添加位置A1處的候選之後,對剩餘候選的添加進行冗餘校驗,該冗餘校驗確保具有相同運動信息的候選被排除在列表之外,從而改進編解碼效率。
為了降低計算複雜度,在所提到的冗餘校驗中並未考慮所有可能的候選對。相反,僅考慮與圖3中的箭頭鏈接的對,並且僅當如果用於冗餘校驗的對應候選具有不同的運動信息時,則該候選才被添加到列表中。重複的運動信息的另一個來源是與不同於2Nx2N的分割相關聯的“第二PU”。作為示例,圖4A和4B分別描繪了針對N×2N和2N×N的情況的第二PU。當當前PU被分割為N×2N時,位置A1處的候選不被考慮用於列表構建。在一些實施例中,添加該候選可以導致具有相同運動信息的兩個預測單元,這對於在編解碼單元中僅具有一個PU是冗餘的。類似地,當前PU被分割為2N×N時,不考慮位置B1
1.1.3 構建時域Merge候選
在此步驟中,只有一個候選被添加到列表中。特別地,在該時域Merge候選的推導中,基於共位(co-located)的 PU來導出縮放的運動向量,該共位的PU屬於相對於給定參考圖片列表內的當前圖片具有最小圖片順序計數(POC)差異的圖片。在條帶標頭中明確地信令通知用於共位的PU的推導的參考圖片列表。
圖5示出了用於時域Merge候選(如虛線)的縮放的運動向量的推導的示例,該用於時域Merge候選(如虛線)的縮放的運動向量使用POC距離tb和td而從共位的PU的運動向量被縮放,其中tb被定義為當前圖片的參考圖片與該當前圖片之間的POC差異,並且td被定義為共位圖片的參考圖片與該共位圖片之間的POC差異。時域Merge候選的參考圖片索引被設置為等於零。對於B條帶,獲得兩個運動向量並將其組合以產生雙向預測Merge候選,該兩個運動向量中的一個用於參考圖片列表0(list 0)而另一個用於參考圖片列表1(list 1)。
如圖6所示,在屬於參考幀的共位的PU(Y)中,在候選C0和C1之間選擇用於時域候選的位置。如果位置C0處的PU不可用、被幀內編解碼的或在當前CTU之外,則使用位置C1。否則,在時域Merge候選的推導中使用位置C0
1.1.4 構建附加類型的Merge候選
除了空域-時域Merge候選之外,還存在兩種附加類型的Merge候選:組合的雙向預測Merge候選和零Merge候選。通過利用空域-時域Merge候選來生成組合的雙向預測Merge候選。組合的雙向預測Merge候選僅用於B條帶。通過將初始候選 的第一參考圖片列表運動參數與另一個候選的第二參考圖片列表運動參數組合來生成組合的雙向預測候選。如果這兩個元組(tuple)提供不同的運動假設,則它們將形成一個新的雙向預測候選。
圖7示出了該過程的示例,在該過程中原始列表(710,在左方)中具有mvL0和refIdxL0或mvL1和refIdxL1的兩個候選被用於創建組合的雙向預測Merge候選,該組合的雙向預測Merge候選被添加到最終列表(720,在右方)。
零運動候選被***以填充Merge候選列表中的剩餘條目,並且因此達到MaxNumMergeCand容量。這些候選具有零空域位移和參考圖片索引,該參考圖片索引從零開始並且每當新的零運動候選被添加到列表時則增加。這些候選使用的參考幀的數量是分別用於單向和雙向預測的1和2。在一些實施例中,不對這些候選執行冗餘校驗。
1.1.5 用於並行處理的運動估計區域的示例
為了加速編碼過程,可以並行執行運動估計,由此同時導出給定區域內的所有預測單元的運動向量。來自空域相鄰的Merge候選的推導可能干擾並行處理,因為一個預測單元直到其相關聯的運動估計完成才能從相鄰PU導出運動參數。為了減輕編解碼效率和處理等待時域之間的折衷,可以定義運動估計區域(MER)。MER的尺寸可以在圖片參數集(PPS)中使用“log2_parallel_merge_level_minus2”語法元素來信令通知。當 MER被定義時,落入同一區域的Merge候選被標記為不可用,並且因此在列表構建中也不被考慮。
1.2 高級運動向量預測(AMVP)的實施例
AMVP利用運動向量與相鄰PU的空域-時域相關性,該空域-時域相關性用於運動參數的顯式傳輸。通過下述操作來構建運動向量候選列表:首先校驗左方、上方在時域上相鄰PU位置的可用性,移除冗餘候選,並添加零向量,以使候選列表為恆定長度。然後,編碼器可以從候選列表中選擇最佳預測器,並傳輸指示所選候選的對應索引。與Merge索引信令類似,使用一元截斷來編碼最佳運動向量候選的索引。在這種情況下要編碼的最大值是2(參見圖8)。在以下的節中,提供了關於運動向量預測候選的推導過程的細節。
1.2.1 構建運動向量預測候選的示例
圖8總結了用於運動向量預測候選的推導過程,並且可以針對具有refidx作為輸入的每個參考圖片列表來實現。
在運動向量預測中,考慮兩種類型的運動向量候選:空域運動向量候選和時域運動向量候選。如圖2先前示出的,對於空域運動向量候選推導,最終基於位於五個不同位置的每個PU的運動向量來導出兩個運動向量候選。
對於時域運動向量候選推導,從基於兩個不同的共位位置導出的兩個候選中選擇一個運動向量候選。在製作空域-時域候選的第一列表之後,移除列表中的重複的運動向量候選。如 果潛在候選的數量大於2,則從列表中移除其在相關聯的參考圖片列表內的參考圖片索引大於1的運動向量候選。如果空域-時域運動向量候選的數量小於2,則將附加的零運動向量候選添加到列表中。
1.2.2 構建空域運動向量候選
在空域運動向量候選的推導中,在五個潛在候選中考慮最多兩個候選,該五個潛在候選來自位於如圖2先前示出的位置的PU,這些位置與運動Merge的那些位置相同。當前PU的左側的推導順序被定義為A0、A1以及縮放的A0、縮放的A1。當前PU的上側的推導順序被定義為B0、B1、B2、縮放的B0、縮放的B1、縮放的B2。因此,對於每一側,存在四種可用作運動向量候選的情況,其中兩種情況不需要使用空域縮放,並且兩種情況使用空域縮放。四種不同的情況總結如下。
無空域縮放
(1)相同的參考圖片列表,以及相同的參考圖片索引(相同的POC)
(2)不同的參考圖片列表,但是相同的參考圖片索引(相同的POC)
空域縮放
(3)相同的參考圖片列表,但是不同的參考圖片索引(不同的POC)
(4)不同的參考圖片列表,以及不同的參考圖片索引 (不同的POC)
首先校驗無空域縮放情況,接下來校驗允許空域縮放的情況。不管參考圖片列表如何,當POC在相鄰PU的參考圖片與當前PU的參考圖片之間是不同的時,考慮空域縮放。如果左方候選的所有PU都不可用或者是被幀內編解碼的,則允許對上方運動向量進行縮放,以幫助左方和上方MV候選的並行推導。否則,對上側運動向量不允許空域縮放。
如圖9中的示例所示,對於空域縮放情況,以與時域縮放類似的方式縮放相鄰PU的運動向量。一個差異在於當前PU的參考圖片列表和索引被給定為作為輸入;實際縮放過程與時域縮放過程相同。
1.2.3 構建時域運動向量候選
除了參考圖片索引推導之外,用於時域Merge候選的推導的所有過程與用於空域運動向量候選的推導的過程相同(如圖6中的示例所示)。在一些實施例中,將參考圖片索引信令通知給解碼器。
2.在聯合探索模型(JEM)中的幀間預測方法的示例
在一些實施例中,使用稱為聯合探索模型(JEM)的參考軟體來探索未來的視頻編解碼技術。在JEM中,在數個編解碼工具中採用基於子塊的預測,諸如仿射預測、可選時域運動向量預測(ATMVP)、空域-時域運動向量預測(STMVP)、雙向光流(BIO)、幀速率上轉換(FRUC)、局部自適應運動向量解析度 (LAMVR)、重疊塊的運動補償(OBMC)、局部亮度補償(LIC)和解碼器側運動向量細化(DMVR)。
2.1 基於子CU的運動向量預測的示例
在具有四叉樹加二叉樹(QTBT)的JEM中,每個CU可以具有針對每個預測方向的至多一個運動參數的集合。在一些實施例中,通過將大CU劃分為子CU並且導出大CU的所有子CU的運動信息,在編碼器中考慮兩個子CU級別運動向量預測方法。可選時域運動向量預測(ATMVP)方法允許每個CU從比共位參考圖片中的當前CU小的多個塊中獲取運動信息的多個集合。在空域-時域運動向量預測(STMVP)方法中,通過使用時域運動向量預測和空域相鄰運動向量來遞迴地導出子CU的運動向量。在一些實施例中,並且為了保留用於子CU運動預測的更準確的運動場,可以禁用參考幀的運動壓縮。
2.1.1 可選時域運動向量預測(ATMVP)的示例
在ATMVP方法中,通過從小於當前CU的塊中取回運動信息(包括運動向量和參考索引)的多個集合來修改時域運動向量預測(TMVP)方法。
圖10示出了CU 1000的ATMVP運動預測過程的示例。ATMVP方法以兩個步驟預測CU 1000內的子CU 1001的運動向量。第一步驟是使用時域向量識別參考圖片1050中的對應塊1051。參考圖片1050也稱為運動源圖片。第二步驟是將當前CU 1000劃分為子CU 1001,並從對應於每個子CU的塊中獲得 運動向量以及每個子CU的參考索引。
在第一步驟中,參考圖片1050和對應塊由當前CU 1000的空域相鄰塊的運動信息確定。為了避免相鄰塊的重複掃描過程,使用當前CU 1000的Merge候選列表中的第一Merge候選。第一可用運動向量及其相關聯的參考索引被設置為時域向量和運動源圖片的索引。這樣,與TMVP相比,可以更準確地識別對應塊,其中對應塊(有時稱為共位塊)總是相對於當前CU處於右下或中心位置。
在第二步驟中,通過向當前CU的坐標添加時域向量,由運動源圖片1050中的時域向量識別子CU 1051的對應塊。對於每個子CU,其對應塊的運動信息(例如,覆蓋中心樣本的最小運動網格)用於導出子CU的運動信息。在識別出對應的N×N塊的運動信息之後,以與HEVC的TMVP相同的方式將其轉換為當前子CU的運動向量和參考索引,在該方式中應用運動縮放和其它過程。例如,解碼器校驗是否滿足低延遲條件(例如,當前圖片的所有參考圖片的POC小於當前圖片的POC)並且可能使用運動向量MVx(例如,對應於參考圖片列表X的運動向量)用於預測每個子CU的運動向量MVy(例如,其中X等於0或1並且Y等於1-X)。
2.1.2 空域-時域運動向量預測(STMVP)的示例
在STMVP方法中,按照光柵掃描順序遞迴地導出子CU的運動向量。圖11示出了具有四個子塊和相鄰塊的一個CU 的示例。考慮包括四個4×4子CU A(1101)、B(1102)、C(1103)和D(1104)的8×8 CU 1100。當前幀中的相鄰4×4塊標記為(1111)、b(1112)、c(1113)和d(1114)。
子CU A的運動推導通過識別其兩個空域鄰域(neighbor)開始。第一鄰域是子CU A 1101上方的N×N塊(塊c 1113)。如果該塊c(1113)不可用或者是幀內編解碼,則校驗(從左到右,從塊c 1113開始)子CU A(1101)上方的其它N×N塊。第二鄰域是子CU A 1101左側的塊(塊b 1112)。如果塊b(1112)不可用或者是幀內編解碼,則校驗子CU A 1101左側的其它塊(從上到下,從塊b 1112開始)。對每個列表從相鄰塊獲得的運動信息被縮放到給定列表的第一參考幀。接下來,通過遵循與HEVC中指定的TMVP推導相同的過程來導出子塊A 1101的時域運動向量預測(TMVP)。在塊D 1104處的共位塊的運動信息被相應地取回和縮放。最後,在提取和縮放運動信息之後,對每個參考列表分開平均所有可用運動向量。平均運動向量被指定為當前子CU的運動向量。
2.1.3 子CU運動預測模式信令通知的示例
在一些實施例中,子CU模式被啟用作為附加的Merge候選,並且不需要附加的語法元素來信令通知模式。添加兩個附加的Merge候選以合併每個CU的候選列表以表示ATMVP模式和STMVP模式。在其它實施例中,如果序列參數集指示啟用了ATMVP和STMVP,則可以使用多達七個Merge候選。附加 Merge候選的編碼邏輯與HM中的Merge候選的編解碼邏輯相同,這意味著,對於P或B條帶中的每個CU,兩個附加Merge候選可能需要再進行兩次RD校驗。在一些實施例中,例如JEM,Merge索引的所有二進制位由CABAC(基於上下文的自適應二進制算術編解碼)進行上下文編解碼。在其它實施例中,例如,HEVC,僅對第一個二進制數(bin)進行上下文編解碼,並且對剩餘的二進制數進行上下文旁路編解碼。
2.2 自適應運動向量差異解析度的示例
在一些實施例中,當條帶標頭中的use_integer_mv_flag等於0時,以四分之一亮度樣本為單位,信令通知(PU的運動向量與預測的運動向量之間的)運動向量差異(MVD)。在JEM中,引入了局部自適應運動向量解析度(LAMVR)。在JEM中,MVD可以以四分之一亮度樣本、整數亮度樣本或四個亮度樣本為單位進行編解碼。在編解碼單元(CU)級別控制MVD解析度,並且向具有至少一個非零MVD分量的每個CU,有條件地信令通知MVD解析度標誌。
對於具有至少一個非零MVD分量的CU,信令通知第一標記,以指示是否在CU中使用四分之一亮度樣本MV精度。當第一標誌(等於1)指示未使用四分之一亮度樣本MV精度時,信令通知另一個標誌,以指示是否使用整數亮度樣本MV精度或四個亮度樣本MV精度。
當CU的第一MVD解析度標誌為零,或未針對CU編 解碼(意味著CU中的所有MVD均為零)時,四分之一亮度樣本MV解析度被用於該CU。當CU使用整數亮度樣本MV精度或四個亮度樣本MV精度時,該CU的AMVP候選列表中的MVP被取整到對應的精度。
在編碼器中,使用CU級別RD校驗來確定將哪個MVD解析度將用於CU。換言之,對於每個MVD解析度,執行CU級RD校驗三次。為了加快編碼器速度,在JEM中應用以下編碼方案。
●在具有正常四分之一亮度樣本MVD解析度的CU的RD校驗期間,儲存該當前CU的運動信息(整數亮度樣本精度)。對於具有整數亮度樣本和4個亮度樣本MVD解析度的相同CU,儲存的運動信息(取整後)被用作RD校驗期間進一步小範圍運動向量細化的起點,使得耗時的運動估計過程不重複三次。
●有條件地調用具有4個亮度樣本MVD解析度的CU的RD校驗。對於CU,當整數亮度樣本MVD解析度的RD成本遠大於四分之一亮度樣本MVD解析度的RD成本時,跳過該CU的4個亮度樣本MVD解析度的RD校驗。
編碼過程在圖12中示出。首先,測試1/4像素MV並計算RD成本並將RD成本表示為RDCost0,然後測試整數MV並將RD成本表示為RDCost1。如果RDCost1<th*RDCost0(其中th是正值閾值),則測試4像素MV;否則,跳過4像素MV。基本上,當校驗整數或4像素MV時,已知1/4像素MV 的運動信息和RD成本等,其可以重複使用來加速整數或4像素MV的編碼過程。
2.3 較高的運動向量儲存精度的示例
在HEVC中,運動向量精度是四分之一像素(pel)(用於4:2:0視頻的四分之一亮度樣本和八分之一彩度樣本)。在JEM中,內部運動向量儲存和Merge候選的精度增加到1/16像素。較高的運動向量精度(1/16像素)用於以跳過模式/Merge模式編解碼的CU的運動補償幀間預測。對於使用正常AMVP模式編解碼的CU,使用整數像素或四分之一像素運動。
具有與HEVC運動補償插值濾波器相同的濾波器長度和歸一化因子的SHVC上採樣插值濾波器,被用作附加分數像素位置的運動補償插值濾波器。在JEM中彩度分量運動向量精度是1/32樣本,通過使用兩個相鄰1/16像素分數位置的濾波器的平均值,來導出1/32像素分數位置的附加插值濾波器。
2.4 重疊塊的運動補償(OBMC)的示例
在JEM中,OBMC可以在CU級別使用語法元素進行開關。當JEM中使用OBMC時,對除去CU的右側邊界和底部邊界的所有運動補償(MC)塊邊界執行OBMC。此外,它應用於亮度和彩度分量。JEM中,MC塊對應於編解碼塊。當使用子CU模式(包括子CU Merge、仿射以及FRUC模式)對CU進行編解碼時,CU的每個子塊是MC塊。為了統一處理CU的邊界,在子塊的尺寸設置為4x4的情況下,對所有MC塊邊界以子 塊級別執行OBMC,如圖13A和圖13B所示。
圖13A示出了CU/PU邊界處的子塊,並且陰影子塊是應用OBMC的位置。類似地,圖13B示出了ATMVP模式中的子PU。
當OBMC應用於當前子塊時,除了當前MV之外,四個相鄰子塊的向量(如果可用且與當前運動向量不完全相同)也會被用於導出當前子塊的預測塊。組合這些基於多個運動向量的多個預測塊以生成當前子塊的最終預測信號。
基於相鄰子塊的運動向量的預測塊被表示為PN,其中N指示相鄰上方、下方、左側和右側的子塊的索引,並且基於當前子塊的運動向量的預測塊被表示為PC。當PN基於相鄰子塊的運動信息且該運動信息與當前子塊的運動信息相同時,不從PN執行OBMC。否則,將PN的每個樣本添加到PC中的相同樣本中,即將四行/列PN添加到PC。加權因子{1/4,1/8,1/16,1/32}用於PN,並且加權因子{3/4,7/8,15/16,31/32}用於PC。例外是對於小MC塊(即,當編解碼塊的高度或寬度等於4或CU使用子CU模式編解碼時)僅將PN的兩行/列添加到PC。在這種情況下,加權因子{1/4,1/8}用於PN,並且加權因子{3/4,7/8}用於PC。對於基於垂直(水平)相鄰子塊的運動向量生成的PN,將PN的相同行(列)中的樣本添加到具有相同加權因子的PC。
在JEM中,對於尺寸小於或等於256個亮度樣本的CU,信令通知CU級別標誌以指示是否對當前CU應用OBMC。 對於尺寸大於256個亮度樣本或未使用AMVP模式編解碼的CU,默認情況下應用OBMC。在編碼器處,當OBMC應用於CU時,在運動估計階段期間考慮其影響。由OBMC使用頂部相鄰塊和左相鄰塊的運動信息形成的預測信號用於補償當前CU的原始信號的頂部邊界和左側邊界,並且然後應用正常運動估計過程。
2.5 局部亮度補償(LIC)的示例
LIC基於用於亮度變化的線性模型,使用縮放因子a和偏移b。並且,針對每個幀間模式編解碼的編解碼單元(CU)自適應地啟用或禁用LIC。
當LIC應用於CU時,採用最小平方誤差方法,通過使用當前CU的相鄰樣本及其對應的參考樣本來導出參數ab。圖14示出了用於導出IC算法的參數的相鄰樣本的示例。具體地,並且如圖14所示,使用了該CU的子採樣(2:1子採樣)的相鄰樣本和參考圖片中的對應樣本(其由當前CU或子CU的運動信息識別)。IC參數被導出並被分別應用於每個預測方向。
當使用Merge模式對CU進行編解碼時,以類似於Merge模式中的運動信息複製的方式從相鄰塊複製LIC標誌;否則,向該CU信令通知LIC標誌以指示LIC是否適用。
當對圖片啟用LIC時,需要附加的CU級別RD校驗以確定是否對CU應用LIC。當對CU啟用LIC時,分別對整數像素運動搜索和分數像素運動搜索,使用均值移除的絕對差和(mean-removed sum of absolute diffefference,MR-SAD)以及均 值移除的絕對哈達瑪變換差和(mean-removed sum of absolute Hadamard-transformed difference,MR-SATD),而不是SAD和SATD。
為了降低編碼複雜度,在JEM中應用以下編碼方案。
當當前圖片與其參考圖片之間不存在明顯的亮度變化時,對整個圖片禁用LIC。為了識別這種情況,在編碼器處,計算當前圖片與該當前圖片的每個參考圖片的直方圖。如果當前圖片與該當前圖片的每個參考圖片之間的直方圖差異小於給定閾值,則對當前圖片禁用LIC;否則,對當前圖片啟用LIC。
2.6 仿射運動補償預測的示例
在HEVC中,僅將平移運動模型應用於運動補償預測(MCP)。然而,相機和對象可以具有多種運動,例如放大/縮小、旋轉、透視運動和其它不規則的運動。在另一方面,JEM應用簡化的仿射變換運動補償預測。圖15示出了由兩個控制點運動向量V0和V1描述的塊1400的仿射運動場的示例。塊1400的運動向量場(MVF)可以由以下等式描述:
Figure 108133899-A0305-02-0026-1
如圖15所示,(v 0x ,v 0y )是左頂角控制點的運動向量,並且(v 1x ,v 1y )是右頂角控制點的運動向量。為了簡化運動補償預測,可以應用基於子塊的仿射變換預測。子塊尺寸M×N如下導出:
Figure 108133899-A0305-02-0027-2
其中MvPre是運動向量分數精度(例如,在JEM中為1/16)。(v 2x ,v 2y )是左下控制點的運動向量,根據等式(1)計算。如果需要,可以向下調整M和N,以使其分別為w和h的除數。
圖16示出了塊1500的每個子塊的仿射MVF的示例。為了導出每個M×N子塊的運動向量,可以根據等式(1)計算每個子塊的中心樣本的運動向量,並將其取整到運動向量分數精度(例如,在JEM中為1/16)。然後,可以應用運動補償插值濾波器,以利用導出的運動向量生成每個子塊的預測。在MCP之後,每個子塊的高精度運動向量以與正常運動向量相同的精度被取整並保存。
2.6.1 AF_INTER模式的實施例
在JEM中,存在兩種仿射運動模式:AF_INTER模式和AF_MERGE模式。對於寬度和高度均大於8的CU,可以應用AF_INTER模式。在位元流中信令通知CU級別中的仿射標誌,以指示是否使用AF_INTER模式。在AF_INTER模式中,使用相鄰塊構建具有運動向量對{(v0,v1)|v0={vA,vB,vc},v1={vD,vE}}的候選列表。
圖17示出了用於在AF_INTER模式中的塊1600的運動向量預測(MVP)的示例。如圖17所示,從子塊A、B或C 的運動向量中選擇v0。來自相鄰塊的運動向量可以根據參考列表來縮放。運動向量還可以根據相鄰塊的參考的圖片順序計數(POC)、當前CU的參考的POC和當前CU的POC之間的關係來縮放。從相鄰子塊D和E中選擇v1的方法是類似的。如果候選列表的數量小於2,則由通過重複每個AMVP候選而構建的運動向量對來填充該列表。當候選列表大於2時,首先可以根據相鄰運動向量(例如,基於候選對中的兩個運動向量的相似性)對候選進行分類。在一些實現方式中,保留前兩個候選。在一些實現方式中,使用速率失真(RD)成本校驗來確定選擇哪個運動向量對候選作為當前CU的控制點運動向量預測(CPMVP)。可以在位元流中信令通知指示候選列表中的CPMVP的位置的索引。在確定當前仿射CU的CPMVP之後,應用仿射運動估計,並找到控制點運動向量(CPMV)。然後在位元流中信令通知CPMV與CPMVP的差異。
在AF_INTER模式中,當使用4/6參數仿射模式時,需要2/3控制點,並且因此需要為這些控制點編解碼2/3 MVD,如圖18A和18B所示。在現有實現方式中,MV可以如下導出,例如,它從mvd0預測mvd1和mvd2。
Figure 108133899-A0305-02-0028-3
Figure 108133899-A0305-02-0028-4
Figure 108133899-A0305-02-0028-5
在本文中,
Figure 108133899-A0305-02-0028-6
、mvdi和mv1分別是左頂像素(i= 0)、右頂像素(i=1)或左底像素(i=2)的預測運動向量、運動向量差異和運動向量,如圖18B所示。在一些實施例中,兩個運動向量(例如,mvA(xA,yA)和mvB(xB,yB))的相加等於單獨地兩個分量的求和。例如,newMV=mvA+mvB意味著newMV的兩個分量分別設置為(xA+xB)和(yA+yB)。
2.6.2 AF_INTER模式中的快速仿射ME算法的示例
在仿射模式的一些實施例中,需要聯合確定2個或3個控制點的MV。直接聯合搜索多個MV在計算上是複雜的。在示例中,快速仿射ME算法被提出並被採用到VTM/BMS中。
例如,針對4參數仿射模型描述快速仿射ME算法,並且該想法可以擴展到6參數仿射模型:
Figure 108133899-A0305-02-0029-7
Figure 108133899-A0305-02-0029-8
使用a’替換(a-1)使得運動向量能夠被重寫為:
Figure 108133899-A0305-02-0029-9
如果假設兩個控制點(0,0)和(0,w)的運動向量是已知的,則根據等式(5),仿射參數可以被導出為:
Figure 108133899-A0305-02-0029-10
可以以向量形式將運動向量重寫為:
Figure 108133899-A0305-02-0029-11
在本文中,P=(x,y)是像素位置,
Figure 108133899-A0305-02-0030-12
並且
Figure 108133899-A0305-02-0030-15
在一些實施例中,並且在編碼器處,可以迭代地導出AF_INTER的MVD。將MVi(P)表示為在位置P的第i次迭代中導出的MV,並且將dMVC i表示為在第i次迭代中針對MVC更新的增量。然後在第(i+1)次迭代中,
Figure 108133899-A0305-02-0030-16
將Picref表示為參考圖片並將Piccur表示為當前圖片並表示Q=P+MV i (P)。如果MSE用作匹配準則,則需要最小化的函數可以寫為:
Figure 108133899-A0305-02-0030-17
如果假設
Figure 108133899-A0305-02-0030-18
足夠小,則可以基於1階泰勒展開將
Figure 108133899-A0305-02-0030-19
重寫為近似值,如:
Figure 108133899-A0305-02-0030-20
在本文中,
Figure 108133899-A0305-02-0030-21
。如果採用記號法E1+1(P)=Pic cur (P)-Pic ref (Q),則
Figure 108133899-A0305-02-0030-22
Figure 108133899-A0305-02-0031-23
術語
Figure 108133899-A0305-02-0031-24
可以通過將誤差函數的導數設置為零,並且然後根據
Figure 108133899-A0305-02-0031-25
計算控制點(0,0)和(0,w)的增量MV而導出,如下:
Figure 108133899-A0305-02-0031-26
Figure 108133899-A0305-02-0031-27
Figure 108133899-A0305-02-0031-28
Figure 108133899-A0305-02-0031-29
在一些實施例中,該MVD推導過程可以迭代n次,並且最終MVD可以如下計算:
Figure 108133899-A0305-02-0031-30
Figure 108133899-A0305-02-0031-31
Figure 108133899-A0305-02-0031-32
Figure 108133899-A0305-02-0031-33
在上述實現方式[5]中,從由mvd0表示的控制點(0,0)的增量MV預測由mvd1表示的預測控制點(0,w)的增量MV導致
Figure 108133899-A0305-02-0031-34
僅針對mvd 1 而被編碼。
2.6.3 AF_MERGE模式的實施例
當在AF_MERGE模式中應用CU時,它從有效的相鄰重建塊獲得使用仿射模式編解碼的第一塊。圖19A示出了當前 CU 1800的候選塊的選擇順序的示例。如圖19A所示,選擇順序可以是從當前CU 1800的左方(1801)、上方(1802)、右上方(1803)、左底方(1804)到左上方(1805)。圖19B示出了在AF_MERGE模式中的當前CU 1800的候選塊的另一示例。如圖19B所示,如果相鄰左下塊1801以仿射模式編解碼,則導出包含子塊1801的CU的左頂角、右上角和左底角的運動向量v2、v3和v4。基於v2、v3和v4來計算當前CU 1800的左頂角的運動向量v0。可以相應地計算當前CU的右上方的運動向量v1
在根據等式(1)中的仿射運動模型計算當前CU v0和v1的CPMV之後,可以生成該當前CU的MVF。為了識別當前CU是否使用AF_MERGE模式編解碼,當存在至少一個相鄰塊以仿射模式編解碼時,可以在位元流中信令通知仿射標誌。
2.7 模式匹配的運動向量推導(PMMVD)的示例
PMMVD模式是一種基於幀速率上轉換(FRUC)方法的特殊Merge模式。使用該模式,塊的運動信息不被信令通知,而是在解碼器側導出。
當CU的Merge標誌為真時,可以向該CU信令通知FRUC標誌。當FRUC標誌為假時,可以信令通知Merge索引,並使用常規Merge模式。當FRUC標誌為真時,可以信令通知附加的FRUC模式標誌以指示將使用哪種方法(例如,雙邊匹配或模板匹配)來導出該塊的運動信息。
在編碼器側,關於是否對CU使用FRUC Merge模式的 決定是基於如對正常Merge候選那樣所做的RD成本選擇。例如,通過使用RD成本選擇來校驗CU的多種匹配模式(例如,雙邊匹配和模板匹配)。導致最小成本的匹配模式與其它CU模式進一步比較。如果FRUC匹配模式是最有效的模式,則對於CU將FRUC標誌設置為真,並且使用有關匹配模式。
通常,FRUC Merge模式中的運動推導過程有兩個步驟。首先執行CU級別運動搜索,接下來執行子CU級別運動細化。在CU級別,基於雙邊匹配或模板匹配為整個CU導出初始運動向量。首先,生成MV候選列表,並且選擇導致最小匹配成本的候選作為進一步CU級別細化的起點。然後,圍繞起始點執行基於雙邊匹配或模板匹配的局部搜索。將導致最小匹配成本的MV作為整個CU的MV。隨後,運動信息在子CU級別進一步細化,其中導出的CU運動向量作為起點。
例如,針對W×H CU運動信息推導執行以下推導處理。在第一階段,導出整體W×H CU的MV。在第二階段,CU進一步劃分為M×M子CU。如等式(22)中計算M的值,D是預定義的劃分深度,其在JEM中默認設置為3。然後導出每個子CU的MV。
Figure 108133899-A0305-02-0033-35
圖20示出了幀速率上轉換(FRUC)方法中使用的雙邊匹配的示例。雙邊匹配用於通過在兩個不同參考圖片(1910,1911)中沿當前CU(1900)的運動軌跡找到兩個塊之間 的最接近匹配,來導出當前CU的運動信息。在連續運動軌跡的假設下,指向兩個參考塊的運動向量MV0(1901)和MV1(1902)與在當前圖片和兩個參考圖片之間的時域距離──例如TD0(1903)和TD1(1904)──成比例。在一些實施例中,當當前圖片(1900)在時域上在兩個參考圖片(1910,1911)之間並且從當前圖片到兩個參考圖片的時域距離相同時,雙邊匹配變為基於鏡像的雙向MV。
圖21示出了幀速率上轉換(FRUC)方法中使用的模板匹配的示例。模板匹配可以用於通過找到在當前圖片中的模板(例如,當前CU的頂部相鄰塊和/或左方相鄰塊)與參考圖片2010中的塊(例如,具有與模板相同的尺寸)之間的最接近匹配,來導出當前CU 2000的運動信息。除了上述FRUC Merge模式之外,模板匹配也可以適用於AMVP模式。在JEM和HEVC兩者中,AMVP有兩個候選。使用模板匹配方法,可以導出新的候選。如果由模板匹配的新導出的候選與第一現有AMVP候選不同,則將其***AMVP候選列表的最開始,並且然後將列表尺寸設置為2(例如,通過移除第二現有AMVP候選)。當應用於AMVP模式時,僅應用CU級別搜索。
CU級別的MV候選集合可以包括:(1)如果當前CU處於AMVP模式,則為原始AMVP候選,(2)所有Merge候選,(3)插值MV場(稍後描述)中的數個MV,以及頂部和左方相鄰的運動向量。
當使用雙邊匹配時,Merge候選的每個有效MV可以被用作輸入,以在假設雙邊匹配的情況下生成MV對。例如,Merge候選的一個有效MV是在參考列表A中的(MVa,refa)。然後,在其它參考列表B中找到其配對雙邊MV的參考圖片refb,使得refa和refb在時域上位於當前圖片的不同側。如果參考列表B中這樣的refb不可用,則refb被確定為與refa不同的參考,並且refb到當前圖片的時域距離是列表B中的最小的一個。在確定refb之後,基於當前圖片與refa、refb之間的時域距離,通過縮放MVa來導出MVb。
在一些實現方式中,來自插值MV場的四個MV也可以被添加到CU級別候選列表。更具體地,添加當前CU的位置(0,0)、(W/2,0)、(0,H/2)和(W/2,H/2)處的插值MV。當FRUC應用於AMVP模式時,原始AMVP候選也被添加到CU級別MV候選集合。在一些實現方式中,在CU級別,用於AMVP CU的15個MV、用於Merge CU的13個MV可以被添加到候選列表。
子CU級別的MV候選集合包括:(1)從CU級別搜索確定的MV,(2)頂部、左方、左頂和右頂的相鄰MV,(3)來自參考圖片的並列MV的縮放版本,(4)一個或多個ATMVP候選(例如,最多四個),以及(5)一個或多個STMVP候選(例如,最多四個)。來自參考圖片的縮放MV如下導出。遍歷兩個列表中的參考圖片。參考圖片中的子CU的並列位置處的MV被縮放到起始CU級別MV的參考。ATMVP和STMVP候選可以是 前四個候選。在子CU級別,一個或多個MV(例如,最多十七個)被添加到候選列表中。
插值MV場的生成
在對幀進行編解碼之前,基於單邊ME為整個圖片生成插值運動場。然後,運動場可以稍後用作CU級別或子CU級別MV候選。
在一些實施例中,兩個參考列表中的每個參考圖片的運動場以4×4塊級別遍歷。圖22示出了在FRUC方法中的單向運動估計(ME)2100的示例。對於每個4×4塊,如果與塊相關聯的運動通過當前圖片中的4×4塊並且該塊尚未被分配任何插值運動,則參考塊的運動根據時域距離TD0和TD1(與HEVC中的TMVP的MV縮放的方式相同的方式)縮放到當前圖片,並且將縮放的運動分配給當前幀中的塊。如果無縮放的MV被分配到4×4塊,則在插值的運動場中將塊的運動標記為不可用。
插值和匹配成本
當運動向量指向分數樣本位置時,需要運動補償插值。為了降低複雜度,雙邊匹配和模板匹配兩者可以使用雙線性插值而不是常規的8抽頭HEVC插值。
匹配成本的計算在不同的步驟略有不同。當從CU級別的候選集合中選擇候選時,匹配成本可以是雙邊匹配或模板匹配的絕對差之和(SAD)。在確定起始MV之後,如下計算子CU級別搜索的雙邊匹配的匹配成本C
Figure 108133899-A0305-02-0037-36
其中w是一個加權因子。在一些實施例中,w根據經驗設置為4,MV和MVs分別指示當前MV和起始MV。SAD可以仍用作子CU級別搜索的模板匹配的匹配成本。
在FRUC模式中,僅通過使用亮度樣本來導出MV。導出的運動將用於MC幀間預測的亮度和彩度兩者。在確定MV之後,使用用於亮度的8抽頭插值濾波器和用於彩度的4抽頭插值濾波器來執行最終MC。
MV細化是以雙邊匹配成本或模板匹配成本為準則的基於模式的MV搜索。在JEM中,支持兩種搜索模式──分別用於CU級別和子CU級別的MV細化的無限制的中心偏置菱形搜索(unrestricted center-biased diamond search,UCBDS)和自適應交叉搜索(adaptive cross search)。對於CU級別和子CU級別MV細化,以四分之一亮度樣本MV精度直接搜索MV,並且接下來以八分之一亮度樣本MV細化。對於CU步驟和子CU步驟的MV細化的搜索範圍被設置為等於8個亮度樣本。
在雙邊匹配Merge模式中,應用雙向預測,因為基於在兩個不同參考圖片中沿當前CU的運動軌跡的兩個塊之間的最接近匹配來導出CU的運動信息。在模板匹配Merge模式中,編碼器可以在針對CU的來自列表0的單向預測、來自列表1的單向預測或者雙向預測之中進行選擇。選擇可以基於模板匹配成本,如下: 如果costBi<=factor*min(cost0,cost1)
使用雙向預測;否則,如果cost0<=cost1
使用來自列表0的單向預測;否則,使用來自列表1的單向預測;其中cost0是列表0模板匹配的SAD,cost1是列表1模板匹配的SAD,並且costBi是雙向預測模板匹配的SAD。例如,當factor的值等於1.25時,這意味著選擇過程偏向於雙向預測。幀間預測方向選擇可以應用於CU級別模板匹配過程。
2.8 雙向光流(BIO)的示例
雙向光流(BIO)方法是在用於雙向預測的逐塊運動補償之上執行的逐樣本運動細化。在一些實現方式中,樣本級別運動細化不使用信令通知。
讓I(k)是在塊運動補償之後的參考k(k=0,1)的亮度值,並且將
Figure 108133899-A0305-02-0038-37
Figure 108133899-A0305-02-0038-38
分別表示為I(k)梯度的水平分量和垂直分量。假設光流有效,則運動向量場(vx,vy)由以下等式給定。
Figure 108133899-A0305-02-0038-39
將此光流等式與用於每個樣本的運動軌跡的埃爾米特(Hermite)插值組合,其結果是在末端匹配函數值I (k)和導數
Figure 108133899-A0305-02-0038-40
Figure 108133899-A0305-02-0038-41
的唯一的三階多項式。在t=0時此多項式的值是BIO預測:
Figure 108133899-A0305-02-0039-42
圖23示出了雙向光流(BIO)方法中的光流軌跡的示例。其中,τ0和τ1表示到參考幀的距離。距離τ0和τ1基於Ref0和Ref1的POC來計算:τ0=POC(當前)-POC(Ref0),τ1=POC(Ref1)-POC(當前)。如果兩個預測都來自相同的時域方向(既可以是來自過去的,也可以是來自未來的),則符號是不同的(例如,τ0.τ1<0)。在這種情況下,如果預測不是來自相同的時刻(例如,τ0≠τ1),則應用BIO。兩個參考區域都具有非零運動(例如,MVx 0,MVy 0,MVx 1,MVy 1≠0)並且塊運動向量與時域距離(例如,MVx 0/MVx 1=MVy 0/MVy 1=-τ01)成比例。
通過最小化點A和點B中的值之間的差異△來確定運動向量場(v x ,v y )。圖23示出了運動軌跡和參考幀平面的交點的示例。模型僅使用對於△的局部泰勒展開的第一線性項:
Figure 108133899-A0305-02-0039-43
上述等式中的所有值都取決於表示為(i′,j′)的樣本位置。假設運動在局部周圍區域是一致的,可以在以當前預測點(i,j)為中心的(2M+1)×(2M+1)方形窗口Ω內最小化△,其中M等於2:
Figure 108133899-A0305-02-0040-44
對於此優化問題,JEM使用簡化方法,首先在垂直方向上進行最小化,並且然後在水平方向上進行最小化。這導致
Figure 108133899-A0305-02-0040-45
Figure 108133899-A0305-02-0040-46
其中,
Figure 108133899-A0305-02-0040-47
為了避免除以零或非常小的值,在等式(28)和等式(29)中引入正則化參數rm
r=500.4 d-8 (31)
m=700.4 d-8 (32)
其中d是視頻樣本的位深度。
為了保持BIO的儲存器存取與常規雙向預測運動補償相同,針對當前塊內的位置計算所有預測和梯度值I (k)
Figure 108133899-A0305-02-0040-48
Figure 108133899-A0305-02-0040-49
。圖24A示出了塊2300外部的存取位置的示例。如圖24A所示,在等式(28)中,以預測塊的邊界上的當前 預測點為中心的(2M+1)×(2M+1)方形窗口Ω需要存取塊外的位置。在JEM中,塊外的I (k)
Figure 108133899-A0305-02-0041-51
Figure 108133899-A0305-02-0041-52
的值被設置為等於塊內最近的可用值。例如,這可以實現為填充區域2301,如圖24B所示。
使用BIO,可以針對每個樣品來細化運動場是可能的。為了降低計算複雜度,可以在JEM中使用基於塊的BIO設計。可以基於4×4塊來計算運動細化。在基於塊的BIO中,可以聚合4×4塊中的所有樣本在等式(28)中的s n 值,並且然後將聚合的s n 值用於4×4塊的導出的BIO運動向量偏移。更具體地,以下公式可以用於基於塊的BIO推導:
Figure 108133899-A0305-02-0041-53
其中bk表示屬於預測塊的第k個4×4塊的樣品的集合。由((s n,bk )>>4)替換等式(28)和等式(29)中的s n 以導出相關聯的運動向量偏移。
在一些情況下,BIO的MV團(regiment)可能由於噪聲或不規則運動而不可靠。因此,在BIO中,MV團的量級被修剪為閾值。基於當前圖片的參考圖片是否都來自一個方向來確定 閾值。例如,如果當前圖片的所有參考圖片都來自一個方向,則閾值被設置為12×214-d ;否則,它被設置為12×213-s
可以同時計算BIO的梯度與運動補償插值,該運動補償插值使用與HEVC運動補償過程一致的操作(例如,2D可分離有限脈衝響應(FIR))。在一些實施例中,2D可分離FIR的輸入是與根據塊運動向量的分數部分的分數位置(fracX,fracY)和運動補償過程相同的參考幀樣本。對於水平梯度
Figure 108133899-A0305-02-0042-107
,首先對應於具有去縮放偏移d-8的分數位置fracY,使用BIOfilterS對信號進行垂直地插值。然後對應於具有去縮放偏移18-d的分數位置fracX,在水平方向上應用梯度濾波器BIOfilterG。對於垂直梯度
Figure 108133899-A0305-02-0042-108
,首先對應於具有去縮放偏移d-8的分數位置fracY,使用BIOfilterG垂直應用梯度濾波器。然後對應於具有去縮放偏移18-d的分數位置fracX,在水平方向上使用BIOfilterS來執行信號位移。用於梯度計算BIOfilterG和信號位移BIOfilterF的插值濾波器的長度可以較短(例如,6抽頭)以維持合理的複雜度。表格1示出了可以用於BIO中塊運動向量的不同分數位置的梯度計算的示例濾波器。表格2示出了可以用於BIO中預測信號生成的示例插值濾波器。
Figure 108133899-A0305-02-0042-54
Figure 108133899-A0305-02-0043-55
Figure 108133899-A0305-02-0043-56
在JEM中,當兩個預測來自不同的參考圖片時,BIO可以應用於所有雙向預測的塊。當對CU啟用局部亮度補償(LIC)時,可以禁用BIO。
在一些實施例中,在普通MC過程之後,對塊應用OBMC。為了降低計算複雜度,在OBMC過程期間不可以應用 BIO。這意味著當使用其自己的MV時BIO應用於塊的MC過程,當在OBMC過程中使用相鄰塊的MV時BIO不應用於MC過程。
2.9 解碼器側運動向量細化(DMVR)的示例
在雙向預測操作中,為了預測一個塊區域,分別使用列表0的運動向量(MV)和列表1的MV形成的兩個預測塊被組合以形成單個預測信號。在解碼器側運動向量細化(DMVR)方法中,雙向預測的兩個運動向量通過雙邊模板匹配過程進一步細化。雙邊模板匹配應用於解碼器中,以在雙邊模板和參考圖片中的重建樣本之間執行基於失真的搜索,以便在不傳輸附加的運動信息的情況下獲得細化的MV。
如圖25所示,在DMVR中,雙邊模板分別從列表0的初始MV0和列表1的MV1生成為兩個預測塊的加權組合(即平均)。模板匹配操作包括計算生成的模板與參考圖片中的樣本區域(在初始預測塊周圍)之間的成本度量。對於兩個參考圖片中的每一個,產生最小模板成本的MV被視為該列表的更新MV以替換原始模板。在JEM中,對於每個列表,搜索九個MV候選。該九個MV候選包括原始MV和8個周圍MV,該周圍的MV具有相對於原始MV的在水平方向上或垂直方向上或兩者上的一個亮度樣本的偏移。最後,如圖25所示,兩個新的MV,即MV0'和MV1',被用於生成最終的雙向預測結果。絕對差之和(SAD)用作成本度量。
DMVR被應用於雙向預測的Merge模式,在不傳輸附加的語法元素的情況下使用來自過去的參考圖片中的一個MV和來自將來的參考圖片中的另一個MV。在JEM中,當為CU啟用LIC、仿射運動、FRUC或子CU Merge候選時,不應用DMVR。
2.10 對稱運動向量差異的示例
提出對稱運動向量差異(SMVD)以將MVD更有效地編碼。
首先,在條帶級別中,變量BiDirPredFlag、RefIdxSymL0和RefIdxSymL1如下導出: 搜索參考圖片列表0中最接近當前圖片的前向參考圖片。如果找到,則將RefIdxSymL0設置為等於前向圖片的參考索引。
搜索參考圖片列表1中最接近當前圖片的後向參考圖片。如果找到,則將RefIdxSymL1設置為等於後向圖片的參考索引。
如果前向和後向圖片兩者均被找到,則將BiDirPredFlag設置為等於1。
否則,以下適用:搜索參考圖片列表0中最接近當前參考圖片的後向參考圖片。如果找到,則將RefIdxSymL0設置為等於後向圖片的參考索引。
搜索參考圖片列表1中最接近當前參考圖片的前向參 考圖片。如果找到,則將RefIdxSymL1設置為等於前向圖片的參考索引。
如果前向和後向圖片兩者均被找到,則將BiDirPredFlag設置為等於1。否則,將BiDirPredFlag設置為等於0。
其次,在CU級別,如果CU的預測方向是雙向預測並且BiDirPredFlag等於1,則明確地信令通知對稱模式標誌,該對稱模式標誌指示是否使用對稱模式。
當該標誌為真時,僅明確地信令通知mvp_l0_flag、mvp_l1_flag和MVD0。對於列表0和列表1,將參考索引分別設置為等於RefIdxSymL0、RefIdxSymL1。將MVD1設置為等於-MVD0。最終的運動向量如下式所示。
Figure 108133899-A0305-02-0046-57
圖28示出了對稱模式的示例。
編解碼單元語法的修改在表格3中示出。
Figure 108133899-A0305-02-0046-58
Figure 108133899-A0305-02-0047-59
Figure 108133899-A0305-02-0048-60
Figure 108133899-A0305-02-0049-61
2.10.1 仿射雙向預測編解碼的對稱MVD
提議了仿射模式的SMVD,將對稱MVD模式擴展到了仿射雙向預測。當對仿射雙向預測編解碼應用對稱MVD模式時,控制點的MVD不是信令發送,而是推導的。基於線性運動的假設,從List0中推導出List1的左上控制點的MVD。List0的其他控制點的MVD設置為0
2.11 基於上下文的自適應二進制算術編解碼(CABAC)
2.11.1 HEVC中的CABAC設計
2.11.1.1 HEVC中的上下文表示和初始化過程
在HEVC中,對於每個上下文變量,初始化兩個變量pStateIdx和valMps。
從8位元表格條目initValue,兩個4位元變量slopeIdx和offsetIdx如下導出:slopeIdx=initValue>>4 offsetIdx=initValue&15 (34)
在上下文變量的初始化中使用的變量m和n從slopeIdx和offsetIdx如下導出: m=slopeIdx*5-45 n=(offsetIdx<<3)-16 (35)
分配給pStateIdx和valMps用於初始化的兩個值從由SliceQpY表示的條帶的亮度的量化參數導出。給定變量m和n,初始化指定如下:preCtxState=Clip3(1,126,((mClip3(0,51,SliceQpY))>>4)+n)valMps=(preCtxState<=63)?0:1 pStateIdx=valMps?(preCtxState-64):(63-preCtxState)(36)
2.11.1.2 HEVC中的狀態轉變過程
該過程的輸入是與ctxTable和ctxIdx相關聯的上下文變量的當前pStateIdx、解碼值binVal和valMps值。
該過程的輸出是與ctxIdx相關聯的上下文變量的更新pStateIdx和更新valMps。
取決於解碼值binVal,與ctxIdx相關聯的兩個變量pStateIdx和valMps的更新如在(37)中導出:
Figure 108133899-A0305-02-0050-109
Figure 108133899-A0305-02-0051-110
2.11.2 VVC中的CABAC設計
VVC中的基於上下文的自適應二進制算術編解碼器(BAC)已經在VVC中改變,其在上下文更新過程和算術編解碼器方面與HEVC中的不同。
以下是最近採用的提議(JVET-M0473,CE測試5.1.13)的概述。
Figure 108133899-A0305-02-0051-64
Figure 108133899-A0305-02-0052-65
2.11.2.1 VVC中的上下文初始化過程
在VVC中,分配給pStateIdx0和pStateIdx1用於初始化的兩個值從SliceQpY導出。給定變量m和n,初始化指定如下:preCtxState=Clip3(0,127,((mClip3(0,51,SliceQpY))>>4)+n) pStateIdx0=initStateIdxToState[preCtxState]>>4 pStateIdx1=initStateIdxToState[preCtxState] (38)
2.11.2.2 VVC中的狀態轉變過程
該過程的輸入是當前pStateIdx0和當前pStateIdx1以及解碼值binVal。
該過程的輸出是與的ctxIdx相關聯的上下文變量的更新pStateIdx0和更新pStateIdx1。
變量shift0(對應於VVC表格4中的CABAC修改的概述中的變量a)和shift1(對應於VVC表格4中的CABAC修改的概述中的變量b)是從與ctxTable和ctxInc相關聯的shiftIdx值導出的。
shift0=(shiftIdx>>2)+2 shift1=(shiftIdx&3)+3+shift0 (39)
取決於解碼值binVal,與ctxIdx相關聯的兩個變量pStateIdx0和pStateIdx1的更新如下導出:pStateIdx0=pStateIdx0-(pStateIdx0>> shift0)+(1023*binVal>>shift0) pStateIdx1=pStateIdx1-(pStateIdx1>>shift1)+(16383*binVal>>shift1)(40)
3.現有實現方式的缺點
在一些現有的實現方式中,當可以從用於仿射編解碼塊的多個MV/MVD精度的集合中選擇MV/MV差異(MVD)時,仍然無法確定如何獲得更準確的運動向量。
在其它現有的實現方式中,MV/MVD精度信息在確定應用於仿射模式的AMVR的整體編解碼增益方面也起著重要作用,但實現該目標仍然無法確定。
4.具有AMVR的仿射模式的MV預測(MVP)的示例方法
當前公開的技術的實施例克服了現有實現方式的缺點,從而提供具有更高編解碼效率的視頻編解碼。基於所公開的技術,用於具有自適應運動向量解析度(AMVR)的仿射模式的運動向量預測的推導和信令可以增強現有和未來的視頻編解碼標準,在以下針對各種實現方式所描述的示例中闡明。以下提供的所公開技術的示例解釋了一般概念,並不意味著被解釋為限制性的。在示例中,除非明確地相反指示,否則可以組合這些示例中描述的各種特徵。
在一些實施例中,當應用AMVR時,以下示例可以應用於仿射模式或正常模式。這些示例假設精度Prec(即,MV具 有1/(2^Prec)精度)用於在AF_INTER模式中編碼MVD或用於在正常幀間模式中編碼MVD。運動向量預測(例如,從相鄰塊MV繼承)及其精度分別由MVPred(MVPred X ,MVPred Y )和PredPrec表示。
支持AMVR的仿射模式的改進
1.允許的MVD精度的集合可能隨圖片而不同、隨條帶而不同或隨塊而不同。
a.在一個示例中,該允許的MVD精度的集合可以取決於編解碼信息,例如塊尺寸、塊形狀等。
b.可以預定義允許的MV精度的集合,諸如{1/16,1/4,1}。
c.可以在SPS/PPS/VPS/序列標頭/圖片標頭/條帶標頭/CTU組等中信令通知允許的MV精度的指示。
d.來自允許的MV精度的集合的所選MV精度的信令進一步取決於塊的允許MV精度的數量。
2.向解碼器信令通知語法元素以指示仿射幀間模式中使用的MVD精度。
a.在一個示例中,僅使用一個單個語法元素來指示應用於仿射模式和AMVR模式的MVD精度。
i.在一個示例中,使用相同的語義,即,對於AMVR和仿射模式,將語法元素的相同值映射到相同MVD精度。
ii.替代地,單個語法元素的語義對於AMVR模式和仿射模式是不同的。換言之,對於AMVR和仿射模式,可以將語法元素的 相同值映射到不同MVD精度。
b.在一個示例中,當仿射模式使用與AMVR相同的MVD精度的集合(例如,MVD精度設置為{1,1/4,4}像素)時,在仿射模式中重用AMVR中的MVD精度語法元素,即,僅使用一個單個語法元素。
i.替代地,此外,當在CABAC編碼器/解碼器中對該語法元素進行編碼/解碼時,相同或不同的上下文模型可以用於AMVR和仿射模式。
ii.替代地,此外,該語法元素在AMVR和仿射模式中可以具有不同的語義。例如,等於0、1和2的語法元素在AMVR中分別指示1/4像素、1像素和4像素MV精度,而在仿射模式中,等於0、1和2的語法元素分別指示1/4像素、1/16像素和1像素MV精度。
c.在一個示例中,當仿射模式使用與AMVR相同的數目的MVD精度但是不同的MVD精度的集合(例如,對於AMVR的MVD精度設置為{1,1/4,4}像素,而對於仿射的MVD精度設置為{1/16,1/4,1}像素)時,在仿射模式中重用AMVR中的MVD精度語法元素,即,僅使用一個單個語法元素。
i.替代地,此外,當在CABAC編碼器/解碼器中對該語法元素進行編碼/解碼時,相同或不同的上下文模型可以用於AMVR和仿射模式。
ii.替代地,此外,該語法元素在AMVR和仿射模式中可以具有 不同的語義。
d.在一個示例中,仿射模式使用比AMVR更少的MVD精度,在仿射模式中重用AMVR中的MVD精度語法元素。然而,僅語法元素值的子集對仿射模式有效。
i.替代地,此外,當在CABAC編碼器/解碼器中對該語法元素進行編碼/解碼時,相同或不同的上下文模型可以用於AMVR和仿射模式。
ii.替代地,此外,該語法元素在AMVR和仿射模式中可以具有不同的語義。
e.在一個示例中,仿射模式使用比AMVR更多的MVD精度,在仿射模式中重用AMVR中的MVD精度語法元素。然而,擴展這樣的語法元素以允許仿射模式中的更多值。
i.替代地,此外,當在CABAC編碼器/解碼器中對該語法元素進行編碼/解碼時,相同或不同的上下文模型可以用於AMVR和仿射模式。
ii.替代地,此外,該語法元素在AMVR和仿射模式中可以具有不同的語義。
f.在一個示例中,新語法元素用於編解碼仿射模式的MVD精度,即,兩個不同的語法元素用於編解碼AMVR和仿射模式的MVD精度。
g.用於指示仿射模式的MVD精度的語法可以在以下一個或所有條件下信令通知:
i.所有控制點的MVD均非零。
ii.至少一個控制點的MVD非零。
iii.一個控制點(例如,第一CPMV)的MVD非零在這種情況下,當上述條件中的任何一個或它們所有都失敗時,不需要信令通知MVD精度。
h.用於指示仿射模式或AMVR模式的MVD精度的語法元素可以使用上下文編解碼,並且上下文取決於編解碼信息。
i.在一個示例中,當僅存在一個單個語法元素時,上下文可以取決於當前塊是否使用仿射模式編解碼。
i.在一個示例中,上下文可以取決於塊尺寸/塊形狀/相鄰塊的MVD精度/時域層索引/預測方向等。
j.可以在SPS/PPS/VPS/序列標頭/圖片標頭/條帶標頭/CTU組等中信令通知是否啟用或禁用仿射模式的多個MVD精度的使用。
i.在一個示例中,是否信令通知啟用或禁用仿射模式的多個MVD精度的使用的信息可以取決於其它語法元素。例如,當啟用仿射模式時,信令通知啟用或禁用仿射模式的多個MV和/或MVP和/或MVD精度的使用的信息;當禁用仿射模式時,不信令通知啟用或禁用仿射模式的多個MV和/或MVP和/或MVD精度的使用的信息並將其推斷為0。
k.替代地,可以信令通知多個語法元素以指示在仿射幀間模式中使用的MV和/或MVP和/或MVD精度(在下面的討論中,它們都被稱為“MVD精度”)。
i.在一個示例中,用於指示在仿射幀間模式和正常幀間模式中使用的MVD精度的語法元素可以是不同的。
1.指示在仿射幀間模式和正常幀間模式中使用的MVD精度的語法元素的數目可以是不同的。
2.指示在仿射幀間模式和正常幀間模式中使用的MVD精度的語法元素的語義可以是不同的。
3.在算術編解碼中用於編解碼一個語法元素以指示在仿射幀間模式和正常幀間模式中使用的MVD精度的上下文模型可以是不同的。
4.在算術編解碼中導出上下文模型以編解碼一個語法元素以指示在仿射幀間模式和正常幀間模式中使用的MVD精度的方法可以是不同的。
ii.在一個實例中,可以信令通知第一語法元素(例如,amvr_flag)以指示是否在仿射編解碼塊中應用AMVR。
1.有條件地信令通知第一語法元素。
a.在一個示例中,當使用某一模式(例如,CPR/IBC模式)編解碼當前塊時,跳過第一語法元素(amvr_flag)的信令通知。
b.在一個示例中,當所有CPMV的MVD(包括水平和垂直分量)都為零時,跳過第一語法元素(amvr_flag)的信令通知。
c.在一個示例中,當一個所選擇的CPMV的MVD(包括水平和垂直分量)都為零時,跳過第一語法元素(amvr_flag)的信令通知。
i.在一個示例中,所選擇的CPMV的MVD是要被編碼/解碼的第一CPMV的MVD。
d.在一個示例中,當啟用仿射編解碼塊的多個MVD精度的使用為假時,跳過第一語法元素(amvr_flag)的信令通知。
e.在一個示例中,可以在以下條件下信令通知第一語法元素:
i.啟用仿射編解碼塊的多個MVD精度的使用為真,並且當前塊使用仿射模式編解碼;
ii.替代地,啟用仿射編解碼塊的多個MVD精度的使用為真,當前塊使用仿射模式編解碼,並且CPMV的MVD的至少一個分量不等於0。
iii.替代地,啟用仿射編解碼塊的多個MVD精度的使用為真,當前塊使用仿射模式編解碼,並且所選擇的CPMV的MVD的至少一個分量不等於0。
1.在一個示例中,所選擇的CPMV的MVD是要被編碼/解碼的第一CPMV的MVD。
2.當AMVR未應用於仿射編解碼塊或者不存在第一語法元素時,採用默認MV和/或MVD精度。
a.在一個示例中,默認精度是1/4像素(1/4-pel)。
b.替代地,默認精度設置為仿射編解碼塊的運動補償中使用的精度。
3.例如,如果amvr_flag等於0,則仿射模式的MVD精度為1/4像素;否則仿射模式的MVD精度可以是其它值。
a.替代地,此外,可以經由第二語法元素進一步信令通知附加MVD精度。
iii.在一個實例中,可以信令通知第二語法元素(例如amvr_coarse_precision_flag)以指示仿射模式的MVD精度。
1.在一個示例中,是否信令通知第二語法元素可以取決於第一語法元素。例如,僅當第一語法元素是1時信令通知第二語法元素。
2.在一個示例中,如果第二語法元素是0,則仿射模式的MVD精度是1像素;否則,仿射模式的MVD精度是1/16像素。
3.在一個示例中,如果第二語法元素是0,則仿射模式的MVD精度是1/16像素;否則,仿射模式的MVD精度為全像素。
iv.在一個示例中,用於指示在仿射幀間模式中使用的MVD精度的語法元素與具有相同名稱但用於指示在正常幀間模式中使用的MVD精度的語法元素共享相同的上下文模型。
1.替代地,用於指示在仿射幀間模式中使用的MVD精度的語法元素與具有相同名稱但用於指示在正常幀間模式中使用的MVD精度的語法元素使用不同的上下文模型。
3.在仿射編解碼塊上是否應用或如何應用AMVR可以取決於當前塊的參考圖片。
i.在一個示例中,如果參考圖片是當前圖片,則不應用AMVR,即,在當前塊中應用幀內塊複製。
編碼器仿射模式中的AVMR的快速算法
將仿方模式和AMVP模式的RD成本(實際RD成本,或SATD/SSE/SAD成本加粗位元成本)表示為IMV=i的affineCosti和amvpCosti,其中i=0,1或2。在本文中,IMV=0意味著1/4像素MV,並且IMV=1意味著AMVP模式的整數MV和仿射模式的1/16像素MV,並且IMV=2意味著AMVP模式的4像素MV和仿射模式的整數MV。將Merge模式的RD成本表示為mergeCost
4.如果其父代CU的最佳模式不是AF_INTER模式或AF_MERGE模式,則提議對當前CU的仿射模式禁用AMVR。
a.替代地,如果其父代CU的最佳模式不是AF_INTER模式,則對當前CU的仿射模式禁用AMVR。
5.如果affineCost0>th1*amvpCost0,其中th1是正閾值,則提議對仿射模式禁用AMVR。
a.替代地,另外,如果min(affineCost0,amvpCost0)>th2*mergeCost,其中th2是正閾值,則對仿射模式禁用AMVR。
b.替代地,另外,如果affineCost0>th3*affineCost1,其中th3是正閾值,則對仿射模式禁用整數MV。
6.如果amvpCost0>th4*affineCost0,其中th4正閾值,則建議對AMVP模式禁用AMVR。
a.替代地,如果min(affineCost0,amvpCost0)>th5*mergeCost,其中th5是正閾值,則對AMVP模式禁用AMVR。
7.提議在一個MV精度中獲得的4/6參數仿射模型可以用作其它 MV精度的候選開始搜索點。
a.在一個示例中,在1/16 MV中獲得的4/6參數仿射模型可以用作其它MV精度的候選開始搜索點。
b.在一個示例中,在1/4 MV中獲得的4/6參數仿射模型可以用作其它MV精度的候選開搜索點。
8.如果當前塊的父代塊未選擇仿射模式,則對當前塊不在編碼器處校驗用於仿射模式的AMVR。
9.可以利用先前編解碼的幀/條帶/片/CTU列中的仿射編解碼塊的不同MV精度的使用的統計來提前終止當前條帶/片/CTU列中的仿射編解碼塊的MV精度的速率失真計算。
a在一個示例中,記錄具有某一MV精度的仿射編解碼塊的百分比。如果百分比太低,則跳過校驗對應的MV精度。
b.在一個示例中,利用具有相同時域層的先前編解碼幀來決定是否跳過某一MV精度。
10.可以在某些條件下應用上面提議的方法,諸如塊尺寸、條帶/圖片/片類型或運動信息。
a.在一個示例中,當塊尺寸包含小於M*H個樣本(例如,16或32或64個亮度樣本)時,不允許提議的方法。
b.替代地,當塊的寬度或/和高度的最小尺寸小於或不大於X時,不允許提議的方法。在一個示例中,X設置為8。
c.替代地,當塊的寬度或/和高度的最小尺寸不小於X時,不允許提議的方法。在一個示例中,X設置為8。
d.替代地,當塊的寬度>th1或>=th1和/或塊的高度>th2或>=th2時,不允許提議的方法。在一個示例中,th1和/或th2設置為8。
e.替代地,當塊的寬度<th1或<=th1和/或塊的高度<th2或<=th2時,不允許提議的方法。在一個示例中,th1和/或th2設置為8。
f.替代地,是否啟用或禁用上述方法和/或應用哪種方法可以取決於塊尺寸、視頻處理數據單元(VPDU)、圖片類型、低延遲校驗標誌、當前塊的編解碼信息(諸如參考圖片、單向或雙向預測)或先前編解碼的塊。
11.當應用或不應用幀內塊複製(IBC,也稱為當前圖片參考(CPR))時,可以以不同方式執行用於仿射模式的AMVR方法。
a.在一個示例中,如果塊由IBC編解碼,則不可以使用用於仿射模式的AMVR。
b.在一個示例中,如果塊由IBC編解碼,則可以使用用於仿射模式的AMVR,但是候選MV/MVD/MVP精度可以與用於非IBC編解碼的仿射編解碼塊的精度不同。
12.文件中的所有術語“條帶”可以由“片組”或“片”代替。
13.在VPS/SPS/PPS/條帶標頭/片組標頭中,等於1的語法元素(例如,no_amvr_constraint_flag)指定對位元流一致性的要求是,指示是否啟用AMVR的語法元素(例如, sps_amvr_enabled_flag)和指示是否啟用仿射AMVR的語法元素(例如,sps_affine_avmr_enabled_flag)兩者應該等於0。語法元素(例如,no_amvr_constraint_flag)等於0不施加約束。
14.在VPS/SPS/PPS/條帶標頭/片組標頭或其它視頻數據單元中,可以信令通知語法元素(例如,no_affine_amvr_constraint_flag)。
a.在一個示例中,no_affine_amvr_constraint_flag等於1指定對位元流一致性的要求是,指示是否啟用仿射AMVR的語法元素(例如,sps_affine_avmr_enabled_flag)應當等於0。語法元素(例如,no_affine_amvr_constraint_flag)等於0不施加約束。
5.實施例
5.1實施例1:仿射AMVR模式的使用的指示
可以在SPS/PPS/VPS/APS/序列標頭/圖片標頭/片組標頭等中信令通知該指示。本節介紹SPS中的信令。
5.1.1 SPS語法表格
Figure 108133899-A0305-02-0064-66
Figure 108133899-A0305-02-0065-67
給定替代SPS語法表格如下:
Figure 108133899-A0305-02-0065-68
Figure 108133899-A0305-02-0066-69
語義:
sps_affine_amvr_enabled_flag等於1指定在仿射幀間模式的運動向量編解碼中使用自適應運動向量差異解析度。amvr_enabled_flag等於0指定在仿射幀間模式的運動向量編解碼中不使用自適應運動向量差異解析度。
5.2 AMVR模式信息的解析過程
仿射AMVR模式信息的語法可以將其重用於AMVR模式信息(應用於正常幀間模式)。替代地,可以使用不同的語法元素。
可以有條件地信令通知仿射AMVR模式信息。下面的不同實施例示出了條件的一些示例。
5.2.1 實施例#1:CU語法表格
Figure 108133899-A0305-02-0066-70
Figure 108133899-A0305-02-0067-71
Figure 108133899-A0305-02-0068-72
Figure 108133899-A0305-02-0069-74
Figure 108133899-A0305-02-0070-76
Figure 108133899-A0305-02-0071-77
Figure 108133899-A0305-02-0072-78
5.2.2 實施例2:替代的CU語法表格設計
Figure 108133899-A0305-02-0072-79
Figure 108133899-A0305-02-0073-81
Figure 108133899-A0305-02-0074-84
Figure 108133899-A0305-02-0075-85
Figure 108133899-A0305-02-0076-86
5.2.3 實施例3:第三CU語法表格設計
Figure 108133899-A0305-02-0076-87
Figure 108133899-A0305-02-0077-89
Figure 108133899-A0305-02-0078-90
Figure 108133899-A0305-02-0079-91
Figure 108133899-A0305-02-0080-92
Figure 108133899-A0305-02-0081-94
5.2.4 實施例4:具有AMVR和仿射AMVR模式的不同語法的語法表格設計
Figure 108133899-A0305-02-0081-95
Figure 108133899-A0305-02-0082-96
Figure 108133899-A0305-02-0083-97
Figure 108133899-A0305-02-0084-99
Figure 108133899-A0305-02-0085-101
在一個示例中,conditionsA定義如下:(sps_affine_amvr_enabled_flag && inter_affine_flag == 1 && (MvdCpL0[x0][y0][0][0]!=0 || MvdCpL0[x0][y0][0][1]!=0 || MvdCpL1[x0][y0][0][0]!=0 || MvdCpL1[x0][y0][0][1]!=0 || MvdCpL0[x0][y0][1][0]!=0 || MvdCpL0[x0][y0][1][1]!=0 || MvdCpL1[x0][y0][1][0]!=0 || MvdCpL1[x0][y0][1][1]!=0 || MvdCpL0[x0][y0][2][0]!=0 || MvdCpL0[x0][y0][2][1]!=0 || MvdCpL1[x0][y0][2][0]!=0 || MvdCpL1[x0][y0][2][1]!=0))替代地,conditionsA定義如下: (sps_affine_amvr_enabled_flag && inter_affine_flag == 1 && (MvdCpL0[x0][y0][0][0]!=0 || MvdCpL0[x0][y0][0][1]!=0 || MvdCpLl[x0][y0][0][0]!=0 || MvdCpL1[x0][y0][0][1]!=0)替代地,conditionsA定義如下:(sps_affine_amvr_enabled_flag && inter_affine_flag == 1 && (MvdCpLX[x0][y0][0][0]!=0 || MvdCpLX[x0][y0][0][1]!=0)其中X是0或1。替代地,conditionsA定義如下:(sps_affine_amvr_enabled_flag && inter_affine_flag == 1)
在一個示例中,conditionsB定義如下:!sps_cpr_enabled_flag || !(inter_pred_idc[x0][y0] == PRED_L0 && ref_idx_l0[x0][y0] == num_ref_idx_l0_active_minus1)
替代地,conditionsB定義如下:!sps_cpr_enabled_flag || !(pred_mode[x0][y0] == CPR)
替代地,conditionsB定義如下:!sps_ibc_enabled_flag || !(pred_mode[x0][y0] == IBC)
當利用不同的語法元素來編解碼AMVR或仿射AMVR時,可以相應地應用用於5.5中的實施例的應用於仿射AMVR的 上下文建模和/或上下文。
5.2.5 語義
amvr_flag[x0][y0]指定運動向量差異的解析度。數組索引x0、y0指定所考慮的編解碼塊的左頂亮度樣本相對於圖片的左頂亮度樣本的位置(x0,y0)。amvr_flag[x0][y0]等於0指定運動向量差異的解析度是亮度樣本的1/4。amvr_flag[x0][y0]等於1指定運動向量差異的解析度由amvr_coarse_precisoin_flag[x0][y0]進一步指定。
當amvr_flag[x0][y0]不存在時,推斷如下:
──如果sps_cpr_enabled_flag等於1,則推斷amvr_flag[x0][y0]等於1。
──否則(sps_cpr_enabled_flag等於0),則推斷amvr_flag[x0][y0]等於0。
amvr_coarse_precisoin_flag[x0][y0]等於1指定當inter_affine_flag等於0時運動向量差異的解析度是4個亮度樣本,並且當inter_affine_flag等於1時運動向量差異的解析度是1個亮度樣本。數組索引x0、y0指定所考慮的編解碼塊的左頂亮度樣本相對於圖片的左頂亮度樣本的位置(x0,y0)。
當amvr_coarse_precisoin_flag[x0][y0]不存在時,推斷其等於0。
如果inter_affine_flag[x0][y0]等於0,則變量MvShift設置為等於 (amvr_flag[x0][y0]+amvr_coarse_precisoin_flag[x0][y0])<<1,並且變量MvdL0[x0][y0][0]、MvdL0[x0][y0][1]、MvdL1[x0][y0][0]、MvdL1[x0][y0][1]修改如下:MvdL0[x0][y0][0]=MvdL0[x0][y0][0]<<(MvShift+2) (7-70)
MvdL0[x0][y0][1]=MvdL0[x0][y0][1]<<(MvShift+2) (7-71)
MvdL1[x0][y0][0]=MvdL1[x0][y0][0]<<(MvShift+2) (7-72)
MvdL1[x0][y0][1]=MvdL1[x0][y0][1]<<(MvShift+2) (7-73)
如果inter_affine_flag[x0][y0]等於1,變量MvShift設置為等於(amvr_coarse_precisoin_flag?(amvr_coarse_precisoin_flag<<1):(-(amvr_flag<<1))),並且變量MvdCpL0[x0][y0][0][0]、MvdCpL0[x0][y0][0][1]、MvdCpL0[x0][y0][1][0]、MvdCpL0[x0][y0][1]1l]、MvdCpL0[x0][y0][2][0]、MvdCpL0[x0][y0][2][1]修改如下:MvdCpL0[x0][y0][0][0]=MvdCpL0[x0][y0][0][0]<<(MvShift+2) (7-73)
MvdCpL1[x0][y0][0][1]= MvdCpL1[x0][y0][0][1]<<(MvShift+2) (7-67)
MvdCpL0[x0][y0][1][0]=MvdCpL0[x0][y0][1][0]<<(MvShift+2) (7-66)
MvdCpL1[x0][y0][1][1]=MvdCpL1[x0][y0][1][1]<<(MvShift+2) (7-67)
MvdCpL0[x0][y0][2][0]=MvdCpL0[x0][y0][2][0]<<(MvShift+2) (7-66)
MvdCpL1[x0][y0][2][1]=MvdCpL1[x0][y0][2][1]<<(MvShift+2) (7-67)
替代地,如果inter_affine_flag[x0][y0]等於1,則變量MvShift設為等於(affine_amvr_coarse_precisoin_flag?(affine_amvr_coarse_precisoin_flag<<1):(-(affine_amvr_flag<<1)))。
5.3 運動向量的取整過程
修改取整過程,當給定的rightShift值等於0(發生於1/16像素精度)時,取整偏移設置為0而不是(1<<(rightShift-1))。
例如,MV的取整過程的子條款修改如下:該過程的輸入是:運動向量mvX,用於取整的右移位參數rightShift,用於解析度增加的左移位參數leftShift。
該過程的輸出是取整的運動向量mvX。
對於mvX的取整,以下適用:offset=(rightShift==0)?0:(1<<(rightShift-1)) (8-371)
mvX[0]=(mvX[0]>=0?(mvX[0]+offset)>>rightShift:-((-mvX[0]+offset)>>rightShift))<<leftShift(8-372)
mvX[1]=(mvX[1]>=0?(mvX[1]+offset)>>rightShift:-((-mvX[1]+offset)>>rightShift))<<leftShift(8-373)
5.4 解碼過程
在仿射運動向量推導過程中調用的取整過程是使用(MvShift+2)而不是固定為2的輸入來執行的。
亮度仿射控制點運動向量預測的推導過程
該過程的輸入是:當前亮度編解碼塊的左頂樣本相對於當前圖片的左頂亮度樣本的亮度位置(xCb,yCb),指定當前亮度編解碼塊的寬度和高度的兩個變量cbWidth和cbHeight,當前編解碼單元refIdxLX的參考索引,其中X為0或1,控制點運動向量的數目numCpMv。
該過程的輸出是亮度仿射控制點運動向量預測mvpCpLX[cpIdx],其中X為0或1,並且cpIdx=0..numCpMv-1。
為了推導控制點運動向量預測候選列表、cpMvpListLX,其中X為0或1,應用以下有序步驟:列表numCpMvpCandLX中的控制點運動向量預測候選的數目設置為等於0。
變量availableFlagA和availableFlagB兩者設置為FALSE。
……
調用8.4.2.14條款中指定的運動向量的取整過程,其中mvX設置為等於cpMvpLX[cpIdx]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的cpMvpLX[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
……
變量availableFlagA設置為等於TRUE
調用8.4.4.5條款中指定的來自相鄰塊的亮度仿射控制點運動向量的推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度和高度(cbWidth,cbHeight)、相鄰亮度編解碼塊位置(xNb,yNb)、相鄰亮度編解碼塊寬度和高度(nbW,nbH)、以及控制點運動向量的數目numCpMv作為輸入,控制點運動向量 預測候選cpMvpLY[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
調用8.4.2.14條款中指定的運動向量的取整過程,其中mvX設置為等於cpMvpLY[cpIdx]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的cpMvpLY[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
……
調用8.4.4.5條款中規定的來自相鄰塊的亮度仿射控制點運動向量的推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度和高度(cbWidth,cbHeight)、相鄰亮度編解碼塊位置(xNb,yNb)、相鄰亮度編解碼塊寬度和高度(nbW,nbH)、以及控制點運動向量的數目numCpMv作為輸入,控制點運動向量預測候選cpMvpLX[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
調用8.4.2.14條款中指定的運動向量的取整過程,其中mvX設置為等於cpMvpLX[cpIdx]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的cpMvpLX[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
做出以下分配:cpMvpListLX[numCpMvpCandLX][0]=cpMvpLX [0] (8-618)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLX[1] (8-619)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLX[2] (8-620)
numCpMvpCandLX=numCpMvpCandLX+1 (8-621)
否則,如果PrcdFlagLY[xNbBk][yNbBk](with Y=!X)等於1且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbBk][yNbBk]],Ref PicListX[refIdxLX])等於0,則應用以下:
變量availableFlagB設置為TRUE
調用8.4.4.5條款中指定的來自相鄰塊的亮度仿射控制點運動向量的推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度和高度(cbWidth,cbHeight)、相鄰亮度編解碼塊位置(xNb,yNb)、相鄰亮度編解碼塊寬度和高度(nbW,nbH)、以及控制點運動向量的數目numCpMv作為輸入,控制點運動向量預測候選cpMvpLY[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
調用8.4.2.14條款中指定的運動向量的取整過程,其中mvX設置為等於cpMvpLY[cpIdx]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸 入,並且取整的cpMvpLY[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
做出以下分配:cpMvpListLX[numCpMvpCandLX][0]=cpMvpLY[0](8-622)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLY[1](8-623)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLY[2](8-624)
numCpMvpCandLX=numCpMvpCandLX+1 (8-625)
當numCpMvpCandLX小於2時,應用以下:調用8.4.4.8條款中指定的用於構建的仿射控制點運動向量預測候選的推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度cbWidth、亮度編解碼塊高度cbHeight、以及當前編解碼單元的參考索引refIdxLX作為輸入,並且可用性標誌availableConsFlagLX和cpMvpLX[cpIdx](其中cpIdx=0..numCpMv-1)作為輸出。
當availableConsFlagLX等於1且numCpMvpCandLX等於0時,做出以下分配:cpMvpListLX[numCpMvpCandLX][0]=cpMvpLX[0] (8-626)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLX[1] (8-627)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLX[2] (8-628)
numCpMvpCandLX=numCpMvpCandLX+1(8-629)
對於cpIdx=0..numCpMv-1應用以下:當numCpMvpCandLX小於2且availableFlagLX[cpIdx]等於1時,做出以下分配: cpMvpListLX[numCpMvpCandLX][0]=cpMvpLX[cpIdx] (8-630)
cpMvpListLX[numCpMvpCandLX][1]=cpMvpLX[cpIdx] (8-631)
cpMvpListLX[numCpMvpCandLX][2]=cpMvpLX[cpIdx] (8-632)
numCpMvpCandLX=numCpMvpCandLX+1(8-633)
當numCpMvpCandLX小於2,應用以下:調用8.4.2.11條款中指定的時域亮度運動向量預測的推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度cbWidth、亮度編解碼塊高度cbHeight以及refIdxLX作為輸入,並且其中輸出為可用性標誌availableFlagLXCol和時域運動向量 預測mvLXCol。
當availableFlagLXCol等於1時,應用以下:調用8.4.2.14條款中指定的運動向量的取整過程,其中mvX設置為等於mvLXCol、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的mvLXCol作為輸出。
做出以下分配:cpMvpListLX[numCpMvpCandLX][0]=mvLXCol(8-634)
cpMvpListLX[numCpMvpCandLX][1]=mvLXCol(8-635)
cpMvpListLX[numCpMvpCandLX][2]=mvLXCol(8-636)
numCpMvpCandLX=numCpMvpCandLX+1(8-637)
當numCpMvpCandLX小於2時,重複以下步驟直到numCpMvpCandLX等於2,其中mvZero[0]和mvZero[1]兩者等於0:cpMvpListLX[numCpMvpCandLX][0]=mvZero(8-638)
cpMvpListLX[numCpMvpCandLX][1]=mvZero(8-639)
cpMvpListLX[numCpMvpCandLX][2]=mvZero(8-640)
numCpMvpCandLX=numCpMvpCandLX+1(8-641)
仿射控制點運動向量預測cpMvpLX(其中X為0或1)如下導出:cpMvpLX=cpMvpListLX[mvp_lX_flag[xCb][yCb]] (8-642)
構建的仿射控制點運動向量預測候選的推導過程
該過程的輸入是:指定相對於當前圖片的左頂亮度樣本的當前亮度編解碼塊的左頂樣本的亮度位置(xCb,yCb),指定當前亮度編解碼塊的寬度和高度的兩個變量cbWidth和cbHeight,當前預測單元分區的參考索引refIdxLX,其中X為0或1,該過程的輸出是:構建的仿射控制點運動向量預測候選的可用性標誌availableConsFlagLX,其中X為0或1,可用性標誌availableFlagLX[cpIdx],其中cpIdx=0..2並且X為0或1,構建的仿射控制點運動向量預測候選 cpMvLX[cpIdx],其中cpIdx=0..numCpMv-1並且X為0或1。
第一(左頂)控制點運動向量cpMvLX[0]和可用性標誌availableFlagLX[0]在以下有序步驟中導出:分別將樣本位置(xNbB2,yNbB2)、(xNbB3,yNbB3)和(xNbA2,yNbA2)設置為等於(xCb-1,yCb-1)、(xCb,yCb-1)和(xCb-1,yCb)。
將可用性標誌availableFlagLX[0]設置為等於0,並且將cpMvLX[0]的兩個分量都設置為等於0。
對於(xNbTL,yNbTL)應用以下步驟,其中TL由B2、B3和A2替換:調用條款中指定的編解碼塊的可用性推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度cbWidth、亮度編解碼塊高度cbHeight、亮度位置(xNbY,yNbY)設置為等於(xNbTL,yNbTL)作為輸入,並且輸出被分配給編解碼塊可用性標誌availableTL。
當availableTL等於TRUE且availableFlagLX[0]等於0時,應用以下步驟:如果PredFlagLX[xNbTL][yNbTL]等於1,並且DiffPicOrderCnt(RefPicListX[RefIdxLX[xNbTL][yNbTL]]、RefPicListX[refIdxLX])等於0,並且對應於RefIdxLX[xNbTL][yNbTL]的參考圖片不是當前圖片,則將 availableFlagLX[0]設置為等於1並做出以下分配:epMvLX[0]=MvLX[xNbTL][yNbTL] (8-643)
否則,當PredFlagLY[xNbTL][yNbTL](with Y=!X)等於1,並且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbTL][yNbTL]]、RefPicListX[refIdxLX])等於0,並且對應於RefIdxLY[xNbTL][yNbTL]的參考圖片不是當前圖片時,則將availableFlagLX[0]設置為等於1並做出以下分配:cpMvLX[0]=MvLY[xNbTL][yNbTL] (8-644)
當availableFlagLX[0]等於1時,調用條款8.4.2.14中指定的運動向量的取整過程,其中mvX設置為等於cpMvLX[0]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的cpMvLX[0]作為輸出。
第二(右頂)控制點運動向量cpMvLX[1]和可用性標誌availableFlagLX[1]在以下有序步驟中導出:分別將樣本位置(xNbB1,yNbB1)和(xNbB0,yNbB0)設置為等於(xCb+cbWidth-1,yCb-1)和(xCb+cbWidth,yCb-1)。
將可用性標誌availableFlagLX[1]設置為等於0,並且將cpMvLX[1]的兩個分量都設置為等於0。
對於(xNbTR,yNbTR)應用以下步驟,其中TR由B1 和B0替換:調用條款6.4.X中指定的編解碼塊的可用性推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度cbWidth、亮度編解碼塊高度cbHeight、亮度位置(xNbY,yNbY)設置為等於(xNbTR,yNbTR)作為輸入,並且輸出被分配給編解碼塊可用性標誌availableTR。
當availableTR等於TRUE且availableFlagLX[1]等於0時,應用以下步驟:如果PredFlagLX[xNbTR][yNbTR]等於1,並且DiffPicOrderCnt(RefPicListX[RefIdxLX[xNbTR][yNbTR]]、RefPicListX[refIdxLX])等於0,並且對應於RefIdxLX[xNbTR][yNbTR]的參考圖片不是當前圖片,則將availableFlagLX[1]設置為等於1並做出以下分配:cpMvLX[1]=MvLX[xNbTR][yNbTR] (8-645)
否則,當PredFlagLY[xNbTR][yNbTR](with Y=!X)等於1,並且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbTR][yNbTR]]、RefPicListX[refIdxLX])等於0,並且對應於RefIdxLY[xNbTR][yNbTR]的參考圖片不是當前圖片時,則將availableFlagLX[1]設置為等於1並做出以下分配:cpMvLX[1]=MvLY[xNbTR][yNbTR] (8-646)
當availableFlagLX[1]等於1時,調用條款8.4.2.14中 指定的運動向量的取整過程,其中mvX設置為等於cpMvLX[1]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的cpMvLX[1]作為輸出。
第三(左底)控制點運動向量cpMvLX[2]和可用性標誌availableFlagLX[2]在以下有序步驟中導出:分別將樣本位置(xNbA1,yNbA1)和(xNbA0,yNbA0)設置為等於(xCb-1,yCb+cbHeight-1)和(xCb-1,yCb+cbHeight)。
將可用性標誌availableFlagLX[2]設置為等於0,並且將cpMvLX[2]的兩個分量都設置為等於0。
對於(xNbBL,yNbBL)應用以下步驟,其中BL由A1和A0替換:調用條款6.4.X中指定的編解碼塊的可用性推導過程,其中亮度編解碼塊位置(xCb,yCb)、亮度編解碼塊寬度cbWidth、亮度編解碼塊高度cbHeight、亮度位置(xNbY,yNbY)設置為等於(xNbBL,yNbBL)作為輸入,並且輸出被分配給編解碼塊可用性標誌availableBL。
當availableBL等於TRUE且availableFlagLX[2]等於0時,應用以下步驟:如果PredFlagLX[xNbBL][yNbBL]等於1,並且DiffPicOrderCnt(RefPicListX[RefIdxLX[xNbBL][yNbBL]]、 RefPicListX[refIdxLX])等於0,並且對應於RefIdxLY[xNbBL][yNbBL]的參考圖片不是當前圖片,則將availableFlagLX[2]設置為等於1並做出以下分配:cpMvLX[2]=MvLX[xNbBL][yNbBL] (8-647)
否則,當PredFlagLY[xNbBL][yNbBL](with Y=!X)等於1,並且DiffPicOrderCnt(RefPicListY[RefIdxLY[xNbBL][yNbBL]]、RefPicListX[refIdxLX])等於0,並且對應於RefIdxLY[xNbBL][yNbBL]的參考圖片不是當前圖片時,則將availableFlagLX[2]設置為等於1並做出以下分配:cpMvLX[2]=MvLY[xNbBL][yNbBL] (8-648)
當availableFlagLX[2]等於1時,調用條款8.4.2.14中指定的運動向量的取整過程,其中mvX設置為等於cpMvLX[2]、rightShift設置為等於(MvShift+2)、以及leftShift設置為等於(MvShift+2)作為輸入,並且取整的cpMvLX[2]作為輸出。
5.5 上下文建模
使用上下文編解碼的二進制數將ctxInc分配給語法元素:
Figure 108133899-A0305-02-0103-102
使用左方和上方的語法元素指定ctxInc:在一個示例中,上下文增加偏移ctxInc=(condL && availableL)+(condA && availableA)+ctxSetIdx*3。
替代地,ctxInc=((condL && availableL)||(condA && availableA))+ctxSetIdx*3。
ctxInc=(condL && availableL)+M*(condA && availableA)+ctxSetIdx*3.(例如,M=2)
ctxInc=M*(condL && availableL)+(condA && availableA)+ctxSetIdx*3.(例如,M=2)
Figure 108133899-A0305-02-0103-103
Figure 108133899-A0305-02-0104-104
amvr_flag的ctxIdx的initValue值:當當前塊為仿射或非仿射時使用不同的上下文。
Figure 108133899-A0305-02-0104-105
amvr_coarse_precisoin_flag的ctxIdx的initValue值:當當前塊為仿射或非仿射時使用不同的上下文。
Figure 108133899-A0305-02-0104-106
上述示例可以併入在下面描述的方法的上下文中,例如,方法2600至2680,其可以在視頻解碼器或視頻編碼器處實現。
圖26A示出了用於視頻處理的示例性方法的流程圖。方法2600包括,在步驟2602處,對於視頻的當前塊的編解碼表示與當前塊之間的轉換,從適用於含有該當前視頻塊的視頻區域的允許的多個MVD精度的集合中確定運動向量差異(MVD)精度以用於該轉換。方法2600包括,在步驟2604處,基於該MVD精度執行轉換。
圖26B圖示了用於視頻處理的示例性方法的流程圖。如圖26B所示的方法2610包括,在步驟2612處,對於包括視頻的一個或多個視頻塊的視頻區域和視頻的編解碼表示,確定多個運動向量差異(MVD)精度的使用以用於視頻區域中的一個或多個視頻塊的轉換。方法2610包括,在步驟2614處,基於該確定執行轉換。
圖26C示出了用於視頻處理的示例性方法的流程圖。如圖26C所示的方法2620包括,在步驟2622處,對於包括視頻的一個或多個視頻塊的視頻區域和視頻的編解碼表示,確定是否將自適應運動向量解析度(AMVR)過程應用於當前視頻塊以用於當前視頻塊與視頻的編解碼表示之間的轉換。方法2620包括,在步驟2624處,基於該確定執行轉換。
圖26D示出了用於視頻處理的示例性方法的流程圖。如圖26D所示的方法2630包括,在步驟2632處,對於包括視頻的一個或多個視頻塊的視頻區域和視頻的編解碼表示,確定如何將自適應運動向量解析度(AMVR)過程應用於當前視頻塊以用 於當前視頻塊與視頻的編解碼表示之間的轉換。方法2630包括,在步驟2634處,基於該確定執行轉換。
圖26E圖示了用於視頻處理的示例性方法的流程圖。如圖26E所示的方法2640包括,在步驟2642處,基於使用仿射編解碼模式的當前編解碼單元的父代編解碼單元的編解碼模式或該仿射編解碼模式的速率失真(RD)成本,確定自適應運動向量解析度(AMVR)的使用以用於視頻當前塊的編解碼表示與當前塊之間的轉換。方法2640包括,在步驟2644處,根據該確定的結果執行轉換。
圖26F示出了用於視頻處理的示例性方法的流程圖。如圖26F所示的方法2650包括,在步驟2652處,確定自適應運動向量解析度(AMVR)的使用以用於視頻的當前塊的編解碼表示與使用高級運動向量預測(AMVP)編解碼模式的當前塊之間的轉換,該確定基於AMVP編解碼模式的速率失真(RD)成本。方法2650包括,在步驟2654,根據該確定的結果執行轉換。
圖26G圖示了用於視頻處理的示例性方法的流程圖。如圖26G所示的方法2660包括,在步驟2662處,使用4參數仿射模型或6參數仿射模型生成運動向量(MV)精度的集合以用於視頻的當前塊的編解碼表示與當前塊之間的轉換。方法2660包括,在步驟2664處,基於該MV精度的集合執行轉換。
圖26H圖示了用於視頻處理的示例性方法的流程圖。 如圖26H所示的方法2670包括,在步驟2672處,基於使用仿射編解碼模式的當前塊的父代塊的編解碼模式,確定自適應運動向量解析度(AMVR)工具是否用於轉換,其中AMVR工具用於在解碼期間細化運動向量解析度。方法2670包括,在步驟2674處,根據該確定的結果執行轉換。
圖26I圖示了用於視頻處理的示例性方法的流程圖。如圖26I所示的方法2680包括,在步驟2682處,基於先前已經使用仿射編解碼模式編解碼的先前塊的MV精度的使用,確定使用該仿射編解碼模式的當前塊的MV精度的速率失真(RD)計算的終止以用於當前塊的編解碼表示與當前塊之間的轉換。方法2680包括,在步驟2684處,根據該確定的結果執行轉換。
5.所公開的技術的示例實現方式
圖27是視頻處理裝置2700的方塊圖的示例。裝置2700可以用於實現本文描述的一種或多種方法。裝置2700可以實施在智能手機、平板電腦、電腦、物聯網(IoT)接收器等中。裝置2700可以包括一個或多個處理器2702、一個或多個儲存器2704和視頻處理硬體2706。(一個或多個)處理器2702可以被配置為實現本文件中描述的一種或多種方法(包括但不限於方法2610至2680)。(一個或多個)儲存器2704可以用於儲存用於實現本文描述的方法和技術的數據和代碼。視頻處理硬體2706可以用於在硬體電路中實現本文件中描述的一些技術。
圖29是可以實現所公開的技術的視頻處理系統的方塊 圖的另一個示例。圖29是示出可以實現本文公開的各種技術的示例視頻處理系統2900的方塊圖。各種實現可以包括系統2900的一些或所有組件。系統2900可以包括用於接收視頻內容的輸入2902。可以以例如8或10位元多分量像素值的原始或未壓縮格式接收視頻內容,或者可以以壓縮或編碼格式接收視頻內容。輸入2902可以表示網路介面、外圍總線介面或儲存介面。網路介面的示例包括諸如以太網、無源光網路(PON)等的有線介面和諸如Wi-Fi或蜂窩介面的無線介面。
系統2900可以包括編解碼組件2904,其可以實現本文件中描述的各種編解碼(coding)或字符編碼(encoding)方法。編解碼組件2904可以降低從輸入2902到編解碼組件2904的輸出的視頻的平均位元率以生成視頻的編解碼表示。因此,編解碼技術有時被稱為視頻壓縮或視頻轉碼技術。編解碼組件2904的輸出可以被儲存,或者經由連接的通信被傳輸,如組件2906所示。在輸入2902處接收的視頻的儲存或傳送的位元流(或編解碼)表示可以由組件2908使用,以用於生成發送到顯示介面2910的像素值或可顯示視頻。從位元流表示生成用戶可視視頻的過程有時被稱為視頻解壓縮。此外,雖然某些視頻處理操作被稱為“編解碼”操作或工具,但是應當理解,編解碼工具或操作在編碼器處使用,並且對應的解碼工具或反轉編解碼結果的操作將由解碼器執行。
外圍總線介面或顯示介面的示例可以包括通用串行總 線(USB)或高清晰度多媒體介面(HDMI)或Displayport等。儲存介面的示例包括SATA(串行高級技術附件)、PCI、IDE介面等。本文件中描述的技術可以實施在各種電子設備中,諸如移動電話、膝上型電腦、智能手機或能夠執行數位數據處理和/或視頻顯示的其它設備。
在一些實施例中,視頻處理方法可以使用在如關於圖27或29所描述的硬體平臺上實現的裝置來實現。
可以使用以下基於條款的格式來描述各種技術和實施例。這些條款可以實現為一些實施例的優選特徵。
條款的第一集合使用先前節中描述的一些技術,包括例如先前節中的項目1、2和13-15。
1.一種視頻處理方法,包括: 對於視頻的當前塊的編解碼表示與當前塊之間的轉換,從適用於含有當前視頻塊的視頻區域的允許的多個運動向量差異(MVD)精度的集合中確定運動向量差異(MVD)精度以用於轉換;並且基於MVD精度執行轉換。
2.根據條款1的方法,其中允許的多個MVD精度的集合取決於視頻數據的圖片、條帶或塊。
3.根據條款1的方法,其中允許的多個MVD精度的集合取決於當前塊的編解碼信息。
4.根據條款1的方法,其中,允許的多個MVD精度 的集合是預定義的。
5.根據條款1的方法,其中在序列參數集(SPS)、圖片參數集(PPS)、視頻參數集(VPS)、序列標頭、圖片標頭、條帶標頭、編解碼樹單元(CTU)組中信令通知允許的多個MVD精度的集合。
6.根據條款1的方法,進一步包括基於當前塊的允許的MV精度的數目,信令通知從允許的多個MVD精度的集合中確定的MVD精度。
7.根據條款1的方法,其中確定MVD精度是基於一個或多個語法元素,並且其中使用仿射模式對當前塊進行編解碼。
8.根據條款3或7的方法,其中相同的語法元素用於指示應用於仿射模式和非仿射模式的從允許的多個MVD精度的集合中確定的MVD精度。
9.根據條款3、7或8的方法,其中仿射模式和非仿射模式使用允許的多個MVD精度的相同的集合。
10.根據條款3、7或8的方法,其中仿射編解碼塊使用與在非仿射模式中使用的允許的多個MVD精度的集合不同的允許的多個MVD精度的集合。
11.根據條款10的方法,其中不同的集合具有與在非仿射模式中使用的允許的多個MVD精度相同數目的允許的多個MVD精度,在仿射模式中重用非仿射模式中使用的語法元素。
12.根據條款10的方法,其中不同的集合具有至少一個與在非仿射模式中使用的MVD精度不同的MVD精度。
13.根據條款3、7或8的方法,其中在非仿射模式和仿射模式中使用的語法元素的語義是不同的,並且語法元素具有被解釋為不同MVD精度的相同解碼值。
14.根據條款3、7或8的方法,其中在仿射模式中使用的允許的多個MVD精度的數目小於在非仿射模式中使用的允許的多個MVD精度的數目。
15.根據條款8的方法,其中非仿射模式的語法元素值的一個或多個子集在仿射模式下無效。
16.根據條款8或14的方法,其中在非仿射模式和仿射模式中使用的語法元素的語義是不同的,並且具有相同值的語法元素被解釋為不同的MVD精度。
17.根據條款3或7的方法,其中在仿射模式中使用的允許的多個MVD精度的數目多於在非仿射模式中使用的允許的多個MVD精度的數目。
18.根據條款17的方法,其中擴展非仿射模式中的一個或多個語法元素以允許更多的用於仿射模式的值。
19.根據條款7的方法,其中附加語法元素被用於處理仿射模式的MVD精度,附加語法元素與用於處理非仿射模式的MVD精度的語法元素不同。
20.根據條款7的方法,其中選擇性地信令通知仿射模 式的MVD精度的指示。
21.根據條款20的方法,其中當所有控制點運動向量(CPMV)的MVD非零時,信令通知仿射模式的MVD精度的指示。
22.根據條款20的方法,其中當至少一個CPMV的MVD非零時,信令通知仿射模式的MVD精度的指示。
23.根據條款20的方法,其中當一個所選擇的CPMV的MVD非零時,信令通知仿射模式的MVD精度的指示。
24.根據條款20的方法,其中當第一CPMV的MVD非零時,信令通知仿射模式的MVD精度的指示。
25.根據條款20的方法,其中當一個或多個預定條件不滿足時,不信令通知仿射模式的MVD精度的指示。
26.根據條款7的方法,其中使用取決於當前塊的編解碼信息的上下文,對與仿射模式或非仿射模式中任一者相關聯的MVD精度指示的語法元素進行編解碼。
27.根據條款7的方法,其中與仿射模式或非仿射模式相關聯的MVD精度指示的語法元素的上下文選擇取決於當前塊是否使用仿射模式編解碼。
28.根據條款7的方法,其中一個上下文用於仿射編解碼塊的MVD精度指示的語法元素,並且另一個上下文用於非仿射編解碼塊。
29.根據條款7的方法,其中基於相鄰塊的尺寸、形狀 或MVD精度、時域層索引或預測方向來確定用於MVD精度指示的上下文。
30.根據條款7的方法,其中在序列參數集(SPS)、圖片參數集(PPS)、視頻參數集(VPS)、序列標頭、圖片標頭、條帶標頭或編解碼樹單元(CTU)組中信令通知是否啟用或禁用仿射模式的允許的多個MVD精度的使用。
31.根據條款7的方法,其中對於仿射模式是否啟用或禁用允許的多個MVD精度的使用取決於一個或多個語法元素。
32.根據條款7的方法,其中當啟用仿射模式時,信令通知是否啟用或禁用允許的多個MVD精度的信息;並且當禁用仿射模式時,不信令通知是否啟用或禁用允許的多個MVD精度的信息。
33.根據條款7至32中任一項的方法,其中一個或多個語法元素被包括在條帶級別、圖片級別或序列級別。
34.根據條款5、30或33的方法,其中條帶使用片組或片替換。
35.根據條款1至34中任一項的方法,其中在VPS、SPS、PPS、條帶標頭或片組標頭中,等於1的語法元素指定符合編解碼表示的要求,要求要求第一語法元素和第二語法元素兩者為0,第一語法元素指示對於非仿射模式是否啟用多個MVD精度的第一集合,第二語法元素指示對於仿射模式是否啟用多個MVD精度的第二集合。
36.根據條款1至34中任一項的方法,其中在VPS、SPS、PPS、條帶標頭、片組標頭或其它視頻數據單元中信令通知語法元素。
37.根據條款36的方法,其中等於1的語法元素指定符合編解碼表示的要求,要求要求指示對於仿射模式是否啟用多個MVD精度的語法元素等於0。
38.根據條款7至37中任一項的方法,其中對於仿射編解碼塊,以與MVD精度相同的精度使用運動向量預測。
39.根據條款7至37中任一項的方法,其中對於仿射編解碼塊,以與MVD精度相同的精度使用當前塊的最終的運動向量。
40.根據條款1至39中任一項的方法,其中執行轉換包括從當前塊生成編解碼表示。
41.根據條款1至39中任一項的方法,其中執行轉換包括從編解碼表示生成當前塊。
42.一種視頻系統中的裝置,包括處理器和其上具有指令的非暫時性儲存器,其中指令在由處理器執行時使處理器實現條款1至41中的一項或多項的方法。
43.一種非暫時性電腦可讀介質,其上儲存有的電腦程式代碼,當執行所述電腦程式代碼時,實施條款1至41中的一項或多項的方法的程式代碼。
條款的第二集合使用先前節中描述的一些技術,包括 例如先前節中的項目3、4和12。
1.一種視頻處理方法,包括:對於包括視頻的一個或多個視頻塊的視頻區域和所述視頻的編解碼表示,確定多個運動向量差異(MVD)精度的使用以用於所述視頻區域中的一個或多個視頻塊的轉換;並且基於所述確定執行所述轉換。
2.根據條款1所述的方法,其中所述一個或多個視頻塊中的至少一些視頻塊的所述轉換基於仿射模式編解碼。
3.根據條款1或2所述的方法,其中在所述編解碼表示中指示所述使用,所述編解碼表示包括序列參數集(SPS)、圖片參數集(PPS)、視頻參數集(VPS)、序列標頭、圖片標頭、條帶標頭或編解碼樹單元(CTU)組。
4.根據條款3所述的方法,其中取決於用於指示所述MVD精度的語法元素來指示所述使用。
5.一種視頻處理方法,包括:對於包括視頻的一個或多個視頻塊的視頻區域和所述視頻的編解碼表示,確定是否將自適應運動向量解析度(AMVR)過程應用於當前視頻塊以用於所述當前視頻塊與所述視頻的編解碼表示之間的轉換;並且基於所述確定執行所述轉換。
6.一種視頻處理方法,包括:對於包括視頻的一個或多個視頻塊的視頻區域和所述 視頻的編解碼表示,確定如何將自適應運動向量解析度(AMVR)過程應用於當前視頻塊以用於所述當前視頻塊與所述視頻的編解碼表示之間的轉換;並且基於所述確定執行所述轉換。
7.根據條款5或6所述的方法,其中所述當前視頻塊的轉換基於仿射模式編解碼。
8.根據條款7所述的方法,其中所述確定取決於所述當前視頻塊的參考圖片。
9.根據條款8所述的方法,其中在所述參考圖片是當前圖片的情況下,所述確定確定不應用所述AMVR過程。
10.根據條款5或6所述的方法,其中所述確定取決於所述當前塊是否應用幀內塊複製(IBC)。
11.根據條款10所述的方法,其中所述確定確定將所述AMVR過程應用於由所述IBC編解碼的所述當前塊。
12.根據條款11所述的方法,其中用於IBC編解碼塊的候選運動向量(MV)、MVD或運動向量預測(MVP)精度與用於未由所述IBC編解碼的另一個視頻塊的候選運動向量(MV)、MVD或運動向量預測(MVP)精度不同.
13.根據條款11所述的方法,其中用於IBC編解碼塊的候選運動向量(MV)、MVD或運動向量預測(MVP)精度與用於使用仿射模式編解碼的另一個視頻塊的候選運動向量(MV)、MVD或運動向量預測(MVP)精度不同。
14.根據條款1至13中任一項所述的方法,其中執行所述轉換包括從所述當前塊生成所述編解碼表示。
15.根據條款1至13中任一項所述的方法,其中執行所述轉換包括從所述編解碼表示生成所述當前塊。
16.一種視頻系統中的裝置,包括處理器和其上具有指令的非暫時性儲存器,其中所述指令在由所述處理器執行時使所述處理器實現條款1至15中的一項或多項所述的方法。
17.一種非暫時性電腦可讀介質,其上儲存有的電腦程式代碼,當執行所述電腦程式代碼時,實施條款1至15中的一項或多項所述的方法的程式代碼。
條款的第三集合使用先前節中描述的一些技術,包括例如先前節中的項目5-10和13。
1.一種視頻處理方法,包括:基於使用仿射編解碼模式的當前編解碼單元的父代編解碼單元的編解碼模式或仿射編解碼模式的速率失真(RD)成本,確定自適應運動向量解析度(AMVR)的使用以用於視頻當前塊的編解碼表示與當前塊之間的轉換;並且根據確定的結果執行轉換。
2.根據條款1的方法,其中在父代編解碼單元的編解碼模式不是AF_Inter模式或AF_MERGE模式的情況下,則確定對當前編解碼單元禁用AMVR的使用。
3.根據條款1的方法,其中在父代編解碼單元的編解 碼模式不是AF_Inter模式的情況下,則確定對當前編解碼單元禁用AMVR的使用。
4.根據條款1的方法,其中在仿射編解碼模式的RD大於正閾值和高級運動向量預測(AMVP)模式的RD成本的乘積的情況下,則確定對當前編解碼單元禁用AMVR的使用。
5.根據條款4的方法,其中確定應用於1/4像素MV精度。
6.根據條款1的方法,其中在最小RD成本大於正閾值和Merge模式的RD成本的乘積的情況下,則確定對當前編解碼單元禁用AMVR的使用,其中最小RD成本是仿射編解碼模式的RD成本和高級運動向量預測(AMVP)模式的RD成本的最小值。
7.根據條款6的方法,其中確定應用於1/4像素MV精度。
8.一種視頻處理方法,包括:確定自適應運動向量解析度(AMVR)的使用以用於視頻的當前塊的編解碼表示與使用高級運動向量預測(AMVP)編解碼模式的當前塊之間的轉換,確定基於AMVP編解碼模式的速率失真(RD)成本;並且根據確定的結果執行轉換。
9.根據條款8的方法,其中在AMVP編解碼模式的RD成本大於正閾值和仿射模式的RD成本的乘積的情況下,確 定禁用AMVR的使用。
10.根據條款8的方法,其中確定應用於1/4像素MV精度。
11.根據條款8的方法,其中在最小RD成本大於正閾值和Merge模式的RD成本的乘積的情況下,確定禁用AMVR的使用,並且其中最小RD成本是仿射模式的RD成本和AMVP編解碼模式的RD成本的最小值。
12.根據條款11的方法,其中確定應用於1/4像素MV精度。
13.一種視頻處理方法,包括:使用4參數仿射模型或6參數仿射模型生成運動向量(MV)精度的集合以用於視頻的當前塊的編解碼表示與當前塊之間的轉換;並且基於MV精度的集合執行轉換。
14.根據條款13的方法,其中在單個MV精度中獲得的4參數仿射模型或6參數仿射模型被用作其它MV精度的候選開始搜索點。
15.根據條款14的方法,其中單個MV精度包括1/16 MV精度。
16.根據條款14的方法,其中單個MV精度包括1/4 MV精度。
17.一種視頻處理方法,包括: 基於使用仿射編解碼模式的當前塊的父代塊的編解碼模式,確定自適應運動向量解析度(AMVR)工具是否用於轉換,其中AMVR工具用於在解碼期間細化運動向量解析度;以及根據確定的結果執行轉換。
18.根據條款17的方法,其中在當前塊的父代塊不是仿射編解碼模式的情況下,確定使得對當前塊不校驗AMVR。
19.一種視頻處理方法,包括:基於先前已經使用仿射編解碼模式編解碼的先前塊的MV精度的使用,確定使用仿射編解碼模式的當前塊的MV精度的速率失真(RD)計算的終止以用於當前塊的編解碼表示與當前塊之間的轉換;並且根據確定的結果執行轉換。
20.根據條款19的方法,其中當前塊和先前塊分別包括在當前圖像片段和先前圖像片段中,並且當前圖像片段和先前圖像片段是圖片、條帶、片或編解碼樹單元(CTU)列。
21.根據條款1至20中任一項的方法,其中執行轉換包括從當前塊生成編解碼表示。
22.根據條款1至20中任一項的方法,其中執行轉換包括從編解碼表示生成當前塊。
23.一種視頻系統中的裝置,包括處理器和其上具有指令的非暫時性儲存器,其中指令在由處理器執行時使處理器實現 條款1至22中的一項或多項的方法。
24.一種非暫時性電腦可讀介質,其上儲存有的電腦程式代碼,當執行所述電腦程式代碼時,實施條款1至22中的一項或多項的方法的程式代碼。
從前述內容可以理解,本文已經出於說明的目的描述了本公開技術的具體實施例,但是在不脫離本發明的範圍的情況下可以進行各種修改。因此,除了所附申請專利範圍之外,本發明所公開的技術不受限制。
本專利文件描述的主題和功能操作的實現方式可以以各種系統實現,以數位電子電路實現,或者以電腦軟體、韌體或硬體實現,包括本說明書中公開的結構及其結構等同物,或者以它們中的一個或多個的組合實現。本說明書所描述的主題的實現方式可以實現為一個或多個電腦程式產品,即,在有形和非暫時性電腦可讀介質上編碼的一個或多個電腦程式指令模組,用於由數據處理裝置執行或控制數據處理裝置的操作。電腦可讀介質可以是機器可讀儲存設備、機器可讀儲存基板、儲存器設備、影響機器可讀傳播信號的物質組合、或者它們中的一個或多個的組合。術語“數據處理單元”或“數據處理裝置”涵蓋用於處理數據的所有裝置、設備和機器,包括例如可編程處理器、電腦或多個處理器或電腦。除了硬體之外,該裝置還可以包括為所討論的電腦程式創建執行環境的代碼,例如,構成處理器韌體、協議棧、數據庫管理系統、操作系統、或者它們中的一個或多個的組 合的代碼。
電腦程式(也稱為程式、軟體、軟體應用、腳本或代碼)可以以任何形式的編程語言編寫,包括編譯或解釋語言,並且可以以任何形式來部署電腦程式,包括作為獨立程式或作為適合在計算環境中使用的模組、組件、子例程或其它單元。電腦程式不一定對應於文件系統中的文件。程式可以儲存在保存其它程式或數據的文件的一部分中(例如,儲存在標記語言文件中的一個或多個腳本),儲存在專用於所討論的程式的單個文件中,或儲存在多個協調文件中(例如,儲存一個或多個模組、子程式或代碼部分的文件)。可以部署電腦程式以在一個電腦上或在位於一個站點上或分佈在多個站點上並由通信網路互連的多個電腦上執行。
本說明書中描述的過程和邏輯流程可以由執行一個或多個電腦程式的一個或多個可編程處理器執行,以通過對輸入數據進行操作並生成輸出來執行功能。過程和邏輯流程也可以由專用邏輯電路執行,並且裝置也可以實現為專用邏輯電路,例如FPGA(現場可編程門陣列)或ASIC(專用積體電路)。
舉例來說,適合於執行電腦程式的處理器包括通用和專用微處理器、以及任何種類的數位電腦的任何一個或多個處理器。通常,處理器將從只讀儲存器或隨機存取儲存器或兩者接收指令和數據。電腦的基本元件是用於執行指令的處理器和用於儲存指令和數據的一個或多個儲存器設備。通常,電腦還將包括或 可操作地耦合到用於儲存數據的一個或多個大容量儲存設備,例如磁盤、磁光盤或光盤,以從該一個或多個大容量儲存設備接收數據,或將數據傳遞到該一個或多個大容量儲存設備,或者既接收又傳遞數據。然而,電腦不需要具有這樣的設備。適用於儲存電腦程式指令和數據的電腦可讀介質包括所有形式的非揮發性儲存器、介質和儲存器設備,舉例來說,包括半導體儲存器設備,例如EPROM、EEPROM和快閃記憶體。處理器和儲存器可以由專用邏輯電路補充或併入專用邏輯電路中。
旨在將說明書與附圖一起僅視為示例性的,其中示例性意味著示例。如本文所使用的,除非上下文另有明確指示,否則“或”的使用旨在包括“和/或”。
雖然本專利文件包含許多細節,但這些細節不應被解釋為對任何發明或可要求保護的範圍的限制,而是作為特定於特定發明的特定實施例的特徵的描述。在本專利文件中,在分開的實施例的上下文中描述的某些特徵也可以在單個實施例中組合實現。相反,在單個實施例的上下文中描述的各種特徵也可以分開地或以任何合適的子組合在多個實施例中實現。此外,儘管上面的特徵可以描述為以某些組合起作用並且甚至最初如此要求保護,但是在一些情況下,可以從所要求保護的組合中去除來自該組合的一個或多個特徵,並且所要求保護的組合可以指向子組合或子組合的變型。
類似地,雖然在附圖中以特定順序描繪了操作,但是 這不應該被理解為要求以所示的特定順序或按順序執行這樣的操作,或者執行所有示出的操作,以實現期望的結果。此外,在本專利文件中描述的實施例中的各種系統組件的分離不應被理解為在所有實施例中都要求這樣的分離。
僅描述了幾個實現方式和示例,並且可以基於本專利文件中描述和示出的內容來做出其它實現方式、增強和變型。
2600:方法
2602、2604:步驟

Claims (20)

  1. 一種視頻處理方法,包括:確定視頻的當前塊的模式是仿射幀間模式和非仿射幀間模式中的一個;對於所述當前塊的運動信息,從允許的多個運動精度的集合確定運動精度;其中所述允許的多個運動精度的集合基於所述當前塊是否以所述仿射幀間模式或所述非仿射幀間模式編解碼,並且對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合不同於對於以所述非仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合;以及使用所述確定的模式和所確定的運動精度編解碼所述當前塊,其中,一個或多個語法元素用於指示對於以所述仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度,並且相同的所述一個或多個語法元素用於指示對於以所述非仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度。
  2. 如申請專利範圍第1項所述的方法,其中對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的數目少於對於以所述非仿射幀間模式編解碼的塊的所述允許的多個運動精度的數目。
  3. 如申請專利範圍第1項所述的方法,其中啟用對於以所述仿射幀間模式編解碼的塊的允許的多個運動精度的數目與對於以所述非仿射幀間模式編解碼的塊的允許的多個運動精度的數目 相同,並且對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的至少一個不同於對於以所述非仿射幀間模式編解碼的塊的至少一個。
  4. 如申請專利範圍第1項所述的方法,其中,所述允許的多個運動精度的集合是預定義的。
  5. 如申請專利範圍第1項所述的方法,其中對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合包括1/16亮度樣本、1/4亮度樣本和1亮度樣本。
  6. 如申請專利範圍第1項所述的方法,其中所述運動精度的確定基於一個或多個語法元素。
  7. 如申請專利範圍第1項所述的方法,其中非仿射幀間模式中使用的至少一個語法元素的語義不同於所述仿射幀間模式中使用的所述至少一個語法元素的語義,並且具有相同值的所述至少一個語法元素被解釋為所述非仿射幀間模式和所述仿射幀間模式的不同的運動精度。
  8. 如申請專利範圍第7項所述的方法,其中所述至少一個語法元素的值的子集在所述非仿射幀間模式中是有效的並且在所述仿射幀間模式中不是有效的。
  9. 如申請專利範圍第1項所述的方法,其中當編解碼所述一個或多個語法元素的上下文編解碼的語法元素時,第一上下文被用於以所述非仿射幀間模式編解碼的塊並且第二上下文被用於以所述仿射幀間模式編解碼的塊,並且所述第一上下文不同於所述第二上下文。
  10. 如申請專利範圍第1項所述的方法,其中所述仿射幀間模式的所述運動精度的指示在位元流中選擇性地存在。
  11. 如申請專利範圍第10項所述的方法,其中如果所述當前塊的至少一個控制點運動矢量的至少一個運動矢量差為非零,則所述仿射幀間模式的所述運動精度的所述指示存在。
  12. 如申請專利範圍第1項所述的方法,其中指示是否在所述仿射幀間模式中啟用或禁用所述允許的多個MVD精度的使用的語法元素存在於序列參數集SPS中。
  13. 如申請專利範圍第12項所述的方法,其中指示是否在所述仿射幀間模式中啟用或禁用所述允許的多個MVD精度的使用的所述語法元素,在啟用所述仿射幀間模式時存在,並且在禁用所述仿射幀間模式時不存在。
  14. 如申請專利範圍第1項所述的方法,其中所述運動信息包括所述當前塊的運動矢量差MVD、運動矢量預測器MVP和運動矢量MV的至少一個。
  15. 如申請專利範圍第1項所述的方法,其中所述編解碼包括解碼所述當前塊。
  16. 如申請專利範圍第1項所述的方法,其中所述編解碼包括編碼所述當前塊。
  17. 一種視頻處理裝置,包括處理器和其上具有指令的非暫時性儲存器,其中所述指令在由所述處理器執行時,使所述處理器:確定視頻的當前塊的模式是仿射幀間模式和非仿射幀間模式中的一個; 對於所述當前塊的運動信息,從允許的多個運動精度的集合確定運動精度;其中所述允許的多個運動精度的集合基於所述當前塊是否以所述仿射幀間模式或所述非仿射幀間模式編解碼,並且對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合不同於對於以所述非仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合;以及使用所確定的模式和所確定的運動精度編解碼所述當前塊,其中,一個或多個語法元素用於指示對於以所述仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度,並且相同的所述一個或多個語法元素用於指示對於以所述非仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度。
  18. 如申請專利範圍第17項所述的裝置,其中對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的數目少於對於以所述非仿射幀間模式編解碼的塊的所述允許的多個運動精度的數目。
  19. 一種非暫時性電腦可讀介質,其上儲存有指令,所述指令使得處理器:確定視頻的當前塊的模式是仿射幀間模式和非仿射幀間模式中的一個;對於所述當前塊的運動信息,從允許的多個運動精度的集合確定運動精度;其中所述允許的多個運動精度的集合基於所述當前塊是否以所述仿射幀間模式或所述非仿射幀間模式編解碼,並且對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精 度的集合不同於對於以所述非仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合;以及使用所確定的模式和所確定的運動精度編解碼所述當前塊,其中,一個或多個語法元素用於指示對於以所述仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度,並且相同的所述一個或多個語法元素用於指示對於以所述非仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度。
  20. 一種儲存視頻位元流的方法,包括:確定視頻的當前塊的模式是仿射幀間模式和非仿射幀間模式中的一個;對於所述當前塊的運動信息,從允許的多個運動精度的集合確定運動精度;其中所述允許的多個運動精度的集合基於所述當前塊是否以所述仿射幀間模式或所述非仿射幀間模式編解碼,並且對於以所述仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合不同於對於以所述非仿射幀間模式編解碼的塊的所述允許的多個運動精度的集合;使用所確定的模式和所確定的運動精度編解碼所述當前塊;以及基於所述確定生成位元流,並且將所述位元流存儲在非暫時性計算機可讀儲存介質中,其中,一個或多個語法元素用於指示對於以所述仿射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度,並且相同的所述一個或多個語法元素用於指示對以所述非仿 射幀間模式編解碼的塊的所述允許的多個MVD精度的集合中的所述運動精度。
TW108133899A 2018-09-19 2019-09-19 具有自適應運動矢量分辨率的仿射模式的語法重用 TWI827681B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN2018106513 2018-09-19
WOPCT/CN2018/106513 2018-09-19
CN2019074433 2019-02-01
WOPCT/CN2019/074433 2019-02-01

Publications (2)

Publication Number Publication Date
TW202025736A TW202025736A (zh) 2020-07-01
TWI827681B true TWI827681B (zh) 2024-01-01

Family

ID=68051876

Family Applications (3)

Application Number Title Priority Date Filing Date
TW108133901A TWI815967B (zh) 2018-09-19 2019-09-19 仿射模式編解碼的模式相關自適應調整運動矢量分辨率
TW108133899A TWI827681B (zh) 2018-09-19 2019-09-19 具有自適應運動矢量分辨率的仿射模式的語法重用
TW108133900A TW202025737A (zh) 2018-09-19 2019-09-19 仿射模式中自適應運動矢量分辨率的快速算法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW108133901A TWI815967B (zh) 2018-09-19 2019-09-19 仿射模式編解碼的模式相關自適應調整運動矢量分辨率

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW108133900A TW202025737A (zh) 2018-09-19 2019-09-19 仿射模式中自適應運動矢量分辨率的快速算法

Country Status (7)

Country Link
US (5) US20200213612A1 (zh)
EP (2) EP4325859A3 (zh)
JP (2) JP7212150B2 (zh)
KR (2) KR102635047B1 (zh)
CN (4) CN116546213A (zh)
TW (3) TWI815967B (zh)
WO (3) WO2020058888A1 (zh)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2497256C1 (ru) * 2012-06-07 2013-10-27 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Новосибирский государственный технический университет" Устройство дифференциальной защиты силового трансформатора
KR102472053B1 (ko) * 2017-08-03 2022-11-28 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
US11082721B2 (en) * 2017-09-07 2021-08-03 Lg Electronics Inc. Method and apparatus for entropy-encoding and entropy-decoding video signal
WO2020065520A2 (en) 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Extended merge prediction
WO2019154417A1 (en) * 2018-02-12 2019-08-15 Mediatek Inc. Method and apparatus of current picture referencing for video coding using adaptive motion vector resolution and sub-block prediction mode
WO2019234598A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Interaction between ibc and stmvp
TWI723430B (zh) 2018-06-19 2021-04-01 大陸商北京字節跳動網絡技術有限公司 不同精度的多個候選
KR20210022617A (ko) 2018-06-21 2021-03-03 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 칼라 컴포넌트 간의 서브 블록 mv 상속
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
CN116033150A (zh) 2018-09-08 2023-04-28 北京字节跳动网络技术有限公司 不同视频块尺寸的仿射模式计算
CN116546213A (zh) * 2018-09-19 2023-08-04 北京字节跳动网络技术有限公司 具有自适应运动矢量分辨率的仿射模式的语法重用
US11483567B2 (en) * 2018-09-22 2022-10-25 Lg Electronics Inc. Method and apparatus for processing video signals on basis of inter prediction
WO2020058954A1 (en) 2018-09-23 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. Representation of affine model
TWI821408B (zh) 2018-09-23 2023-11-11 大陸商北京字節跳動網絡技術有限公司 塊級別的運動向量平面模式
WO2020058956A1 (en) 2018-09-23 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. Non-affine blocks predicted from affine motion
WO2020084470A1 (en) 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Storage of motion parameters with clipping for affine mode
WO2020094149A1 (en) 2018-11-10 2020-05-14 Beijing Bytedance Network Technology Co., Ltd. Rounding in triangular prediction mode
US11178396B2 (en) * 2018-11-14 2021-11-16 Tencent America LLC Constrained intra prediction and unified most probable mode list generation
CN113170192B (zh) 2018-11-15 2023-12-01 北京字节跳动网络技术有限公司 仿射的merge与mvd
CN113039802B (zh) 2018-11-16 2024-05-14 北京字节跳动网络技术有限公司 基于历史的仿射参数的使用
CN113039796B (zh) 2018-11-17 2023-09-19 北京字节跳动网络技术有限公司 视频处理中的广义双向预测模式
CN113196747B (zh) 2018-12-21 2023-04-14 北京字节跳动网络技术有限公司 当前图片参考模式下的信息信令通知
WO2020143772A1 (en) 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Affine based merge with mvd
KR20210121021A (ko) 2019-01-31 2021-10-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 어파인 모드 적응적 움직임 벡터 해상도 코딩 문맥
CN113491125A (zh) 2019-02-22 2021-10-08 北京字节跳动网络技术有限公司 基于历史的仿射模式子表
US11962807B2 (en) * 2019-03-11 2024-04-16 Interdigital Vc Holdings, Inc. Entropy coding for video encoding and decoding
US11178399B2 (en) * 2019-03-12 2021-11-16 Qualcomm Incorporated Probability initialization for video coding
CN111698515B (zh) * 2019-03-14 2023-02-14 华为技术有限公司 帧间预测的方法及相关装置
CN113661708B (zh) 2019-04-02 2023-12-15 北京字节跳动网络技术有限公司 基于双向光流的视频编解码和解码
CN113728630B (zh) 2019-04-19 2023-11-17 北京字节跳动网络技术有限公司 不同运动矢量细化中的基于区域的梯度计算
WO2020211867A1 (en) 2019-04-19 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Delta motion vector in prediction refinement with optical flow process
CN113711608B (zh) 2019-04-19 2023-09-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程的适用性
KR20220002897A (ko) 2019-04-25 2022-01-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 모션 벡터 차에 대한 제한
CN113767637B (zh) 2019-04-28 2023-09-22 北京字节跳动网络技术有限公司 对称运动矢量差编解码
US20220053206A1 (en) * 2019-05-15 2022-02-17 Wilus Institute Of Standards And Technology Inc. Video signal processing method and apparatus using adaptive motion vector resolution
EP3954119A4 (en) 2019-05-21 2022-06-22 Beijing Bytedance Network Technology Co., Ltd. SYNTAX SIGNALING IN A SUBBLOCK MERGE MODE
CN114026863A (zh) * 2019-06-24 2022-02-08 交互数字Vc控股公司 使用高级语法元素发信号通知解码数据的方法和装置
WO2020259681A1 (en) 2019-06-25 2020-12-30 Beijing Bytedance Network Technology Co., Ltd. Restrictions on motion vector difference
CN114073090A (zh) * 2019-07-01 2022-02-18 交互数字Vc控股法国公司 仿射运动补偿的双向光流细化
CN114365490B (zh) 2019-09-09 2024-06-18 北京字节跳动网络技术有限公司 高精度图像和视频编解码的系数缩放
CN114731392A (zh) 2019-09-21 2022-07-08 北京字节跳动网络技术有限公司 用于图像和视频编解码的高精度变换和量化
CN114631317B (zh) 2019-10-18 2024-03-15 北京字节跳动网络技术有限公司 子图片的参数集信令中的语法约束
US20220385910A1 (en) * 2019-11-11 2022-12-01 Hfi Innovation Inc. Method and Apparatus of Signaling Adaptive Motion Vector Difference Resolution in Video Coding
WO2021202104A1 (en) * 2020-03-29 2021-10-07 Alibaba Group Holding Limited Enhanced decoder side motion vector refinement
WO2021200658A1 (ja) * 2020-04-02 2021-10-07 シャープ株式会社 動画像復号装置及び動画像復号方法
WO2021207055A1 (en) 2020-04-05 2021-10-14 Bytedance Inc. High level control of filtering in video coding
CN115443650A (zh) * 2020-06-06 2022-12-06 阿里巴巴(中国)有限公司 用于帧间预测的角度加权预测
CN114071147B (zh) * 2020-07-29 2023-04-11 四川大学 一种基于双线性模型的vvc运动补偿方法
US20220201315A1 (en) * 2020-12-22 2022-06-23 Qualcomm Incorporated Multi-pass decoder-side motion vector refinement
US11671616B2 (en) 2021-03-12 2023-06-06 Lemon Inc. Motion candidate derivation
US11936899B2 (en) * 2021-03-12 2024-03-19 Lemon Inc. Methods and systems for motion candidate derivation
WO2022214244A1 (en) * 2021-04-09 2022-10-13 Interdigital Vc Holdings France, Sas Intra block copy with template matching for video encoding and decoding
CN113242427B (zh) * 2021-04-14 2024-03-12 中南大学 一种基于vvc中自适应运动矢量精度的快速方法及装置
US11917165B2 (en) * 2021-08-16 2024-02-27 Tencent America LLC MMVD signaling improvement
US20230103405A1 (en) * 2021-10-04 2023-04-06 Tencent America LLC Method and apparatus for intra block copy prediction with sample padding
CN114157868B (zh) * 2022-02-07 2022-07-19 杭州未名信科科技有限公司 视频帧的编码模式筛选方法、装置及电子设备
US20230300364A1 (en) * 2022-03-15 2023-09-21 Tencent America LLC Temporal based subblock type motion vector predictor
US20230328225A1 (en) * 2022-04-11 2023-10-12 Tencent America LLC Bilateral matching with affine motion
WO2023207649A1 (en) * 2022-04-29 2023-11-02 Mediatek Inc. Method and apparatus for decoder-side motion derivation in video coding system
US20240137539A1 (en) * 2022-10-18 2024-04-25 Tencent America LLC Method and apparatus for affine motion refinement
CN116866638B (zh) * 2023-07-31 2023-12-15 联通沃音乐文化有限公司 一种基于影像的智能视频处理方法和***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180098063A1 (en) * 2016-10-05 2018-04-05 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3651941B2 (ja) 1994-11-28 2005-05-25 キヤノン株式会社 画像再生装置
EP1469682A4 (en) 2002-01-24 2010-01-27 Hitachi Ltd SIGNAL CODING METHOD FOR MOVABLE IMAGES, DECODING METHOD, CODING DEVICE AND DECODING DEVICE
WO2007003340A2 (en) 2005-07-01 2007-01-11 Nero Ag Video encoder and video decoder
US20070025442A1 (en) * 2005-07-28 2007-02-01 Sanyo Electric Co., Ltd. Coding method for coding moving images
JP2009089332A (ja) 2007-10-03 2009-04-23 Sony Corp 動き予測方法及び動き予測装置
US8542727B2 (en) 2007-12-31 2013-09-24 Intel Corporation Systems and apparatuses for performing CABAC parallel encoding and decoding
KR101356613B1 (ko) 2009-08-21 2014-02-06 에스케이텔레콤 주식회사 적응적 움직임 벡터 해상도를 이용한 영상 부호화/복호화 방법 및 장치
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
US9237355B2 (en) 2010-02-19 2016-01-12 Qualcomm Incorporated Adaptive motion resolution for video coding
US8837592B2 (en) 2010-04-14 2014-09-16 Mediatek Inc. Method for performing local motion vector derivation during video coding of a coding unit, and associated apparatus
JP2012060208A (ja) 2010-09-06 2012-03-22 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法,動画像符号化装置,動画像復号方法,動画像復号装置およびそれらのプログラム
KR101952103B1 (ko) 2010-10-08 2019-02-27 지이 비디오 컴프레션, 엘엘씨 블록 분할 및 블록 병합을 지원하는 픽처 코딩
US10327008B2 (en) 2010-10-13 2019-06-18 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
WO2012134246A2 (ko) 2011-04-01 2012-10-04 엘지전자 주식회사 엔트로피 디코딩 방법 및 이를 이용하는 디코딩 장치
US10123053B2 (en) 2011-05-23 2018-11-06 Texas Instruments Incorporated Acceleration of bypass binary symbol processing in video coding
CN106713910B (zh) 2011-06-14 2019-12-10 三星电子株式会社 对图像进行解码的设备
KR20140057683A (ko) 2011-08-29 2014-05-13 주식회사 아이벡스피티홀딩스 머지 모드에서 영상 부호화 방법
CN102291581B (zh) 2011-09-09 2013-09-25 西安电子科技大学 支持帧场自适应运动估计的实现方法
US9736489B2 (en) 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
US9088796B2 (en) 2011-11-07 2015-07-21 Sharp Kabushiki Kaisha Video decoder with enhanced CABAC decoding
US20130177084A1 (en) 2012-01-10 2013-07-11 Qualcomm Incorporated Motion vector scaling in video coding
US9538172B2 (en) 2012-04-11 2017-01-03 Qualcomm Incorporated Grouping bypass coded syntax elements in video coding
US9325991B2 (en) 2012-04-11 2016-04-26 Qualcomm Incorporated Motion vector rounding
WO2013168407A1 (en) 2012-05-09 2013-11-14 Panasonic Corporation Method of performing motion vector prediction, encoding and decoding methods, and apparatuses thereof
EP3139616A1 (en) 2012-05-29 2017-03-08 HFI Innovation Inc. Method and apparatus for coding of sample adaptive offset information
US9635356B2 (en) 2012-08-07 2017-04-25 Qualcomm Incorporated Multi-hypothesis motion compensation for scalable video coding and 3D video coding
US9319684B2 (en) 2012-08-21 2016-04-19 Qualcomm Incorporated Alternative transform in scalable video coding
US9313500B2 (en) 2012-09-30 2016-04-12 Microsoft Technology Licensing, Llc Conditional signalling of reference picture list modification information
EP2952003B1 (en) 2013-01-30 2019-07-17 Intel Corporation Content adaptive partitioning for prediction and coding for next generation video
WO2015069734A1 (en) 2013-11-05 2015-05-14 Arris Enterprises, Inc. Bit depth variable for high precision data in weighted prediction syntax and semantics
CN103561263B (zh) 2013-11-06 2016-08-24 北京牡丹电子集团有限责任公司数字电视技术中心 基于运动矢量约束和加权运动矢量的运动补偿预测方法
US20150189321A1 (en) 2014-01-02 2015-07-02 Mediatek Inc. Method of Binarization and Context Adaptive Binary Arithmetic Coding of Depth Coding Syntax
US9749642B2 (en) 2014-01-08 2017-08-29 Microsoft Technology Licensing, Llc Selection of motion vector precision
US10531116B2 (en) 2014-01-09 2020-01-07 Qualcomm Incorporated Adaptive motion vector resolution signaling for video coding
EP3085085A4 (en) 2014-01-29 2017-11-08 MediaTek Inc. Method and apparatus for adaptive motion vector precision
KR20170018838A (ko) 2014-06-16 2017-02-20 퀄컴 인코포레이티드 3d―hevc 에서의 간략화된 병합 후보의 시프팅 및 병합 리스트 유도
US10327001B2 (en) 2014-06-19 2019-06-18 Qualcomm Incorporated Systems and methods for intra-block copy
CN114554199B (zh) 2014-09-30 2023-11-10 寰发股份有限公司 用于视频编码的自适应运动向量分辨率的方法
US9918105B2 (en) 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
CN104363451B (zh) * 2014-10-27 2019-01-25 华为技术有限公司 图像预测方法及相关装置
CN111741311B (zh) 2014-10-31 2024-04-02 三星电子株式会社 用于对运动矢量进行编码/解码的方法和装置
CN107113424B (zh) 2014-11-18 2019-11-22 联发科技股份有限公司 以帧间预测模式编码的块的视频编码和解码方法
KR20170084251A (ko) * 2014-11-20 2017-07-19 에이치에프아이 이노베이션 인크. 모션 벡터 및 블록 벡터 해상도 제어의 방법
CN107809642B (zh) 2015-02-16 2020-06-16 华为技术有限公司 用于视频图像编码和解码的方法、编码设备和解码设备
US11330284B2 (en) 2015-03-27 2022-05-10 Qualcomm Incorporated Deriving motion information for sub-blocks in video coding
US20160323600A1 (en) 2015-04-30 2016-11-03 Zhan Ma Methods and Apparatus for Use of Adaptive Prediction Resolution in Video Coding
CN109005407B (zh) * 2015-05-15 2023-09-01 华为技术有限公司 视频图像编码和解码的方法、编码设备和解码设备
US10148961B2 (en) 2015-05-29 2018-12-04 Qualcomm Incorporated Arithmetic coder with multiple window sizes
GB2539212A (en) * 2015-06-08 2016-12-14 Canon Kk Handling of non-correct block vectors generated for intra block copy coding mode
US10306240B2 (en) 2015-06-08 2019-05-28 Vid Scale, Inc. Intra block copy mode for screen content coding
CN106331722B (zh) 2015-07-03 2019-04-26 华为技术有限公司 图像预测方法和相关设备
CN108600749B (zh) * 2015-08-29 2021-12-28 华为技术有限公司 图像预测的方法及设备
WO2017041271A1 (en) * 2015-09-10 2017-03-16 Mediatek Singapore Pte. Ltd. Efficient context modeling for coding a block of data
WO2017052009A1 (ko) * 2015-09-24 2017-03-30 엘지전자 주식회사 영상 코딩 시스템에서 amvr 기반한 영상 코딩 방법 및 장치
KR20180059443A (ko) 2015-09-24 2018-06-04 엘지전자 주식회사 영상 코딩 시스템에서 움직임 벡터 정제 기반 인터 예측 방법 및 장치
US10812822B2 (en) 2015-10-02 2020-10-20 Qualcomm Incorporated Intra block copy merge mode and padding of unavailable IBC reference region
US10560699B2 (en) 2015-11-13 2020-02-11 Lg Electronics Inc. Method and apparatus for adaptively predicting image using threshold value in image coding system
GB2561507B (en) * 2016-01-07 2021-12-22 Mediatek Inc Method and apparatus for affine merge mode prediction for video coding system
EP3413563A4 (en) 2016-02-03 2019-10-23 Sharp Kabushiki Kaisha DEVICE FOR DECODING MOVEMENT PICTURES, APPARATUS FOR CODING MOVEMENT IMAGES AND DEVICE FOR GENERATING FORECAST PICTURES
US10638152B2 (en) * 2016-03-15 2020-04-28 Mediatek Inc. Method and apparatus of video coding with affine motion compensation
WO2017156705A1 (en) * 2016-03-15 2017-09-21 Mediatek Inc. Affine prediction for video coding
KR102480088B1 (ko) 2016-03-17 2022-12-23 삼성디스플레이 주식회사 양자점 발광 소자
CN109417620B (zh) 2016-03-25 2021-04-27 松下知识产权经营株式会社 用于使用信号依赖型自适应量化将运动图像编码及解码的方法及装置
US10911773B2 (en) 2016-05-13 2021-02-02 Telefonaktiebolaget Lm Ericsson (Publ) Motion vector difference coding and decoding
US10560712B2 (en) 2016-05-16 2020-02-11 Qualcomm Incorporated Affine motion prediction for video coding
CN115037939B (zh) 2016-05-27 2024-02-13 松下电器(美国)知识产权公司 编码装置及解码装置
EP3264768A1 (en) * 2016-06-30 2018-01-03 Thomson Licensing Method and apparatus for video coding with adaptive motion information refinement
US20190215534A1 (en) 2016-09-12 2019-07-11 Sony Corporation Image processing apparatus and image processing method
WO2018049594A1 (en) * 2016-09-14 2018-03-22 Mediatek Inc. Methods of encoder decision for quad-tree plus binary tree structure
US11356693B2 (en) 2016-09-29 2022-06-07 Qualcomm Incorporated Motion vector coding for video coding
US10462462B2 (en) 2016-09-29 2019-10-29 Qualcomm Incorporated Motion vector difference coding technique for video coding
US10778999B2 (en) 2016-09-30 2020-09-15 Qualcomm Incorporated Frame rate up-conversion coding mode with affine motion model
EP3301918A1 (en) * 2016-10-03 2018-04-04 Thomson Licensing Method and apparatus for encoding and decoding motion information
US10979732B2 (en) 2016-10-04 2021-04-13 Qualcomm Incorporated Adaptive motion vector precision for video coding
US20200045322A1 (en) * 2016-10-04 2020-02-06 Mediatek Inc. Method and apparatus for intra chroma coding in image and video coding
CN109964484B (zh) 2016-11-22 2021-11-09 联发科技股份有限公司 视频编码中用于运动向量符号预测的方法及装置
CN117528107A (zh) * 2016-11-28 2024-02-06 英迪股份有限公司 图像编码方法、图像解码方法及用于传送比特流的方法
US10694202B2 (en) 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
CN108235007B (zh) 2016-12-12 2023-06-27 上海天荷电子信息有限公司 各模式使用不同精度同种编码参数的数据压缩方法和装置
WO2018110203A1 (ja) 2016-12-16 2018-06-21 シャープ株式会社 動画像復号装置、および動画像符号化装置
CN116320476A (zh) 2016-12-22 2023-06-23 株式会社Kt 对视频进行解码或编码的方法和发送视频数据的方法
US10757412B2 (en) 2017-01-03 2020-08-25 Avago Technologies International Sales Pte. Limited Architecture flexible binary arithmetic coding system
US10523964B2 (en) 2017-03-13 2019-12-31 Qualcomm Incorporated Inter prediction refinement based on bi-directional optical flow (BIO)
US10595035B2 (en) 2017-03-22 2020-03-17 Qualcomm Incorporated Constraining motion vector information derived by decoder-side motion vector derivation
US10560723B2 (en) 2017-05-08 2020-02-11 Qualcomm Incorporated Context modeling for transform coefficient coding
US11272207B2 (en) 2017-06-12 2022-03-08 Futurewei Technologies, Inc. Selection and signaling of motion vector (MV) precisions
US10602180B2 (en) * 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
KR20200015885A (ko) 2017-07-04 2020-02-13 삼성전자주식회사 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
WO2019011292A1 (en) 2017-07-14 2019-01-17 Mediatek Inc. METHOD AND APPARATUS FOR RANGE CALCULATION IN CONTEXT-ADAPTIVE BITARY ARITHMETIC ENCODING SYSTEM
CN109391814B (zh) * 2017-08-11 2023-06-06 华为技术有限公司 视频图像编码和解码的方法、装置及设备
US10609384B2 (en) 2017-09-21 2020-03-31 Futurewei Technologies, Inc. Restriction on sub-block size derivation for affine inter prediction
JPWO2019069602A1 (ja) 2017-10-03 2020-09-10 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法、プログラムおよび映像システム
US11172201B2 (en) 2017-12-18 2021-11-09 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
US11172229B2 (en) 2018-01-12 2021-11-09 Qualcomm Incorporated Affine motion compensation with low bandwidth
US10757417B2 (en) 2018-01-20 2020-08-25 Qualcomm Incorporated Affine motion compensation in video coding
US11012715B2 (en) 2018-02-08 2021-05-18 Qualcomm Incorporated Intra block copy for video coding
KR20190108506A (ko) 2018-03-14 2019-09-24 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US10873748B2 (en) * 2018-05-12 2020-12-22 Qualcomm Incorporated Storage of high precision motion vectors in video coding
US11509924B2 (en) 2018-06-01 2022-11-22 Panasonic Intellectual Property Corporation Of America Encoder, decoder, encoding method, and decoding method
WO2019234598A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Interaction between ibc and stmvp
CN112237001B (zh) 2018-06-07 2024-04-12 韦勒斯标准与技术协会公司 使用自适应运动矢量分辨率的视频信号处理方法及装置
US11303923B2 (en) 2018-06-15 2022-04-12 Intel Corporation Affine motion compensation for current picture referencing
US20190387247A1 (en) 2018-06-19 2019-12-19 Qualcomm Incorporated Signaling sub-prediction unit motion vector predictor
TWI723430B (zh) 2018-06-19 2021-04-01 大陸商北京字節跳動網絡技術有限公司 不同精度的多個候選
US20190045193A1 (en) 2018-06-29 2019-02-07 Intel Corporation Region-based motion estimation and modeling for accurate region-based motion compensation for efficient video processing or coding
WO2020009446A1 (ko) 2018-07-02 2020-01-09 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하기 위한 방법 및 장치
WO2020031062A1 (en) 2018-08-04 2020-02-13 Beijing Bytedance Network Technology Co., Ltd. Interaction between different dmvd models
US11582458B2 (en) 2018-08-29 2023-02-14 Vid Scale, Inc. Adaptive motion vector precision for affine motion model based video coding
CN116033150A (zh) 2018-09-08 2023-04-28 北京字节跳动网络技术有限公司 不同视频块尺寸的仿射模式计算
KR102408695B1 (ko) 2018-09-10 2022-06-14 엘지전자 주식회사 영상 코딩 시스템에서 어파인 mvp 후보 리스트를 사용하는 어파인 움직임 예측에 기반한 영상 디코딩 방법 및 장치
CN116546213A (zh) 2018-09-19 2023-08-04 北京字节跳动网络技术有限公司 具有自适应运动矢量分辨率的仿射模式的语法重用
CN118055251A (zh) 2018-09-22 2024-05-17 Lg 电子株式会社 使用间预测处理视频信号的方法和装置
CN110944195B (zh) 2018-09-23 2023-05-09 北京字节跳动网络技术有限公司 具有自适应运动矢量分辨率的运动矢量的修改
WO2020084510A1 (en) 2018-10-23 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Adaptive control point selection for affine coding
CN117241017A (zh) 2018-11-05 2023-12-15 北京字节跳动网络技术有限公司 数字视频编解码的方法、设备和***
CN113366851A (zh) 2019-01-31 2021-09-07 北京字节跳动网络技术有限公司 对称运动矢量差编解码模式的快速算法
KR20210121021A (ko) 2019-01-31 2021-10-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 어파인 모드 적응적 움직임 벡터 해상도 코딩 문맥
CN113383548A (zh) * 2019-02-03 2021-09-10 北京字节跳动网络技术有限公司 Mv精度和mv差编解码之间的相互作用
US11962807B2 (en) * 2019-03-11 2024-04-16 Interdigital Vc Holdings, Inc. Entropy coding for video encoding and decoding
WO2020211867A1 (en) * 2019-04-19 2020-10-22 Beijing Bytedance Network Technology Co., Ltd. Delta motion vector in prediction refinement with optical flow process
JP2022529735A (ja) 2019-04-25 2022-06-23 オーピー ソリューションズ, エルエルシー 大域的運動ベクトルの効率的なコーディング
EP4128795A4 (en) * 2020-05-01 2023-08-30 Beijing Bytedance Network Technology Co., Ltd. ENTROPY ENCODING FOR PARTITION SYNTAX

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180098063A1 (en) * 2016-10-05 2018-04-05 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
網路文獻 Chen-Yen Lai et.al CE4.3.4: Removal of AMVR flag constraint Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Ljubljana, SI 10–18 July 2018 https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0247-v2.zip; *
網路文獻 Yu Han et.al CE4.1.3: Affine motion compensation prediction Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Ljubljana, SI 10–18 July 2018 https://jvet-experts.org/doc_end_user/documents/11_Ljubljana/wg11/JVET-K0337-v1.zip *

Also Published As

Publication number Publication date
JP7212150B2 (ja) 2023-01-24
KR102635047B1 (ko) 2024-02-07
US20210211707A1 (en) 2021-07-08
CN110933427A (zh) 2020-03-27
WO2020058886A1 (en) 2020-03-26
WO2020058888A1 (en) 2020-03-26
US20200213612A1 (en) 2020-07-02
CN116546213A (zh) 2023-08-04
CN110933427B (zh) 2023-05-12
EP4325859A2 (en) 2024-02-21
EP3827586A1 (en) 2021-06-02
WO2020058890A1 (en) 2020-03-26
TW202025781A (zh) 2020-07-01
JP2022500909A (ja) 2022-01-04
KR20240005178A (ko) 2024-01-11
US20200213594A1 (en) 2020-07-02
KR20210059708A (ko) 2021-05-25
US11265573B2 (en) 2022-03-01
JP2023052336A (ja) 2023-04-11
US20210289225A1 (en) 2021-09-16
TWI815967B (zh) 2023-09-21
CN110933421B (zh) 2023-06-30
EP4325859A3 (en) 2024-05-15
CN110933420A (zh) 2020-03-27
US20240015320A1 (en) 2024-01-11
TW202025737A (zh) 2020-07-01
CN110933420B (zh) 2023-09-01
US11653020B2 (en) 2023-05-16
TW202025736A (zh) 2020-07-01
CN110933421A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
TWI827681B (zh) 具有自適應運動矢量分辨率的仿射模式的語法重用
TWI815974B (zh) 具有自適應運動矢量分辨率的運動矢量的修改
CN111357294B (zh) 基于子块的运动信息列表的简化熵编解码
JP7235877B2 (ja) アフィンモード適応型動きベクトル解像度を符号化するためのコンテキスト
US20210360279A1 (en) Fast algorithms for symmetric motion vector difference coding mode
CN110740332B (zh) 基于更新的运动矢量的运动预测
CN113678444B (zh) 具有自适应运动矢量分辨率的仿射模式的熵编解码
WO2020156525A1 (en) Multiple syntax elements for adaptive motion vector resolution
CN111010580B (zh) 基于运动信息的尺寸限制
TWI846727B (zh) 兩步幀間預測