TW201440502A - 用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法 - Google Patents

用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法 Download PDF

Info

Publication number
TW201440502A
TW201440502A TW103100517A TW103100517A TW201440502A TW 201440502 A TW201440502 A TW 201440502A TW 103100517 A TW103100517 A TW 103100517A TW 103100517 A TW103100517 A TW 103100517A TW 201440502 A TW201440502 A TW 201440502A
Authority
TW
Taiwan
Prior art keywords
motion vector
candidate
base layer
video
block
Prior art date
Application number
TW103100517A
Other languages
English (en)
Other versions
TWI532369B (zh
Inventor
Vadim Seregin
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of TW201440502A publication Critical patent/TW201440502A/zh
Application granted granted Critical
Publication of TWI532369B publication Critical patent/TWI532369B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本發明提供一種經組態以對視訊資訊進行寫碼之設備,其包括一記憶體單元及與該記憶體單元通信之一處理器。該記憶體單元經組態以儲存一候選者清單,該候選者清單經產生以用於對該視訊資訊進行寫碼。該候選者清單包含至少一個基礎層運動向量候選者。該處理器經組態以:判定用於產生該至少一個基礎層運動向量候選者之一行為;根據該所判定之行為而針對一特定寫碼單元(CU)中之一當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,其中該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至該候選者清單。該處理器可對該視訊資訊進行編碼或解碼。

Description

用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法
本發明係關於視訊寫碼及壓縮、基於高效率視訊寫碼(HEVC)之可擴縮寫碼及基於HEVC之多視圖及3DV(三維視訊)寫碼的領域。
數位視訊能力可併入至廣泛範圍之裝置中,該等裝置包括數位電視、數位直播系統、無線廣播系統、個人數位助理(PDA)、膝上型或桌上型電腦、數位相機、數位記錄裝置、數位媒體播放器、視訊遊戲裝置、視訊遊戲控制台、蜂巢式或衛星無線電電話、視訊電傳會議裝置及其類似者。數位視訊裝置實施視訊壓縮技術,諸如在由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4部分10進階視訊寫碼(AVC)所定義之標準、目前正在開發之高效率視訊寫碼(HEVC)標準及此等標準之擴縮中所描述的視訊壓縮技術。視訊裝置可藉由實施此等視訊寫碼技術來更有效地傳輸、接收、編碼、解碼及/或儲存數位視訊資訊。
視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼而言,可將視訊切片(例如,視訊圖框、視訊圖框之一部分等)分割成視訊區塊,該等視訊區塊亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節 點。使用相對於在同一圖像中之相鄰區塊中之參考樣本的空間預測來對圖像之框內寫碼(I)切片中的視訊區塊進行編碼。圖像之框間寫碼(P或B)切片中之視訊區塊可使用相對於在同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於在其他參考圖像中之參考樣本之時間預測。可將圖像稱作圖框,且可將參考圖像稱作參考圖框。
空間預測或時間預測導致用於待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差的殘餘資料來對框間寫碼區塊進行編碼。根據框內寫碼模式及殘餘資料來對框內寫碼區塊進行編碼。為達成進一步之壓縮,可將殘餘資料自像素域變換至變換域,從而產生殘餘變換係數,可接著量化該等殘餘變換係數。可掃描最初配置成二維陣列之經量化之變換係數以便產生變換係數之一維向量,且可應用熵編碼以達成甚至更大壓縮。
可擴縮視訊寫碼(SVC)係指使用基礎層(BL)(有時稱作參考層(RL))及一或多個可擴縮之增強層(EL)的視訊寫碼。對於SVC而言,基礎層可攜載具有基礎品質位準之視訊資料。該一或多個增強層可攜載額外視訊資料以支援較高之空間、時間及/或信雜SNR位準。可相對於一先前編碼之層來定義增強層。
舉例而言,底層可充當BL,而頂層可充當EL。中間層可充當EL抑或RL,或充當EL與RL兩者。舉例而言,位於中間的層對於位於其下面之層(諸如,基礎層或任何介入增強層)而言可為EL,且同時可充當位於其上面之一或多個增強層的RL。類似地,在HEVC標準之多視圖或3D擴縮中,可存在多個視圖,且可利用一個視圖之資訊來對另一視圖之資訊(例如,運動估計、運動向量預測及/或其他冗餘)進行寫 碼(例如,編碼或解碼)。
在HEVC擴縮中,增強層或另一視圖中之當前區塊可使用基礎層或視圖中之對應區塊加以預測。舉例而言,當前區塊之語法元素、運動資訊(例如,運動向量)或模式資訊(例如,框內模式)可基於基礎層中之對應區塊。舉例而言,可將基礎層運動向量(MV)用作增強層合併/AMVP(進階運動向量預測)候選者清單中之候選者。候選者清單係待由寫碼器(例如,編碼器或解碼器)利用以預測當前區塊的空間及時間運動向量預測子之陣列。此清單可包括空間相鄰區塊之運動向量,該等空間相鄰區塊為當前區塊之空間相鄰者且係在包括當前區塊之同一圖像內。該清單亦可包括來自時間同置型區塊之運動向量(其亦可稱作時間運動向量預測子或TMVP)。時間同置型區塊係指在不同於包括當前區塊之圖像之圖像中的區塊,且位於該另一圖像內之與當前區塊在其圖像中所在之位置相同的位置處。在一些實例中,該清單亦可包括另一層或另一視圖中之同置型區塊的運動向量。舉例而言,區塊可在增強層中之圖像中,且同置型區塊(自其導出運動向量)可在基礎層中之圖像中。作為另一實例,區塊可在相依性視圖中之圖像中,且同置型區塊可在基礎視圖中之圖像中。
當將空間及時間候選者添加至候選者清單時,此等候選者被產生及添加至候選者清單之方式可不同。舉例而言,在一個實施例中,可針對每一PU而產生空間候選者,且可針對特定CU而產生時間候選者僅一次。然而,舉例而言,當將基礎層運動向量(BL MV)添加至候選者清單且藉由在使用並行運動估計(PME)時所定義的運動估計區域(MER)來致能單一候選者清單產生(例如,針對空間候選者而取消對相鄰PU之相依性,且針對一CU或一群CU中之所有PU而產生空間候選者僅一次)時,需要定義用於處理此等BL MV之方法。藉由在BL MV被添加至候選者清單時定義如何處理此等BL MV(例如)以用於達 成單一候選者清單產生,本發明中所描述之技術可改良與對視訊資料進行寫碼之方法相關聯的寫碼效率及/或降低計算複雜性。
本發明之系統、方法及裝置各自具有若干創新態樣,該等態樣中無單一態樣完全負責本文中所揭示之所要屬性。
在一個實施例中,一種經組態以對視訊資訊進行寫碼之設備包括一記憶體單元及與該記憶體單元通信之一處理器。該記憶體單元經組態以儲存一運動向量候選者清單(或簡稱為候選者清單),其經產生以用於對視訊資訊進行寫碼。該候選者清單包含至少一個基礎層運動向量候選者。該處理器經組態以:判定用於產生該至少一個基礎層運動向量候選者之行為;根據所判定之行為針對特定寫碼單元(CU)中之當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,其中該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至候選者清單。可在合併模式抑或進階運動向量預測(AMVP)模式中完成候選者清單產生。舉例而言,編碼器可選擇該等模式中之一者用於每一PU且在位元串流中用旗標傳信該模式。在一些實施例中,候選者清單可進一步包括空間候選者及時間運動向量預測子(TMVP)。在一個實施例中,可針對每一PU而產生基礎層(BL)運動向量(MV)候選者,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在另一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在又一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對特定CU而導出TMVP僅一次。可在BL MV候選者與空間候選者之間應用修剪。或者,防止修剪被應用於BL MV候選者與空間候選者之間。可自位於基礎層中之同置型區塊內部或外部的任何位置導出BL MV。舉例而言,其可為中心區塊或任何轉角,或為位於同置型區塊 外部之右下區塊。
在另一實施例中,一種對視訊資訊進行編碼之方法包括:儲存用於對視訊資訊進行編碼之一候選者清單;判定用於產生該至少一個基礎層運動向量候選者之行為;根據所判定之行為針對特定寫碼單元(CU)中之當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至候選者清單。可在合併模式抑或進階運動向量預測(AMVP)模式中完成候選者清單產生。在一些實施例中,候選者清單可進一步包括空間候選者及時間運動向量預測子(TMVP)。在一個實施例中,可針對每一PU而產生基礎層(BL)運動向量(MV)候選者,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在另一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在又一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對特定CU而導出TMVP僅一次。可在BL MV候選者與空間候選者之間應用修剪。或者,防止修剪被應用於BL MV候選者與空間候選者之間。可自位於基礎層中之同置型區塊內部或外部的任何位置導出BL MV。舉例而言,其可為中心區塊或任何轉角,或為位於同置型區塊外部之右下區塊。
在另一實施例中,一種對視訊資訊進行解碼之方法包括:接收自一經編碼視訊位元串流所提取之語法元素,其中該等語法元素包含與包含至少一個基礎層運動向量候選者之候選者清單相關聯的視訊資訊;判定用於產生該至少一個基礎層運動向量候選者之行為;根據所判定之行為針對一特定寫碼單元(CU)中之當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至候選者清單。可在合併模式 抑或進階運動向量預測(AMVP)模式中完成候選者清單產生。在一些實施例中,候選者清單可進一步包括空間候選者及時間運動向量預測子(TMVP)。在一個實施例中,可針對每一PU而產生基礎層(BL)運動向量(MV)候選者,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在另一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在又一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對特定CU而僅導出TMVP一次。修剪可被應用於BL MV候選者與空間候選者之間。或者,防止修剪被應用於BL MV候選者與空間候選者之間。可自位於基礎層中之同置型區塊內部或外部的任何位置來導出BL MV。舉例而言,其可為中心區塊或任何轉角,或為位於同置型區塊外部之右下區塊。
在另一實施例中,一種非暫時性電腦可讀媒體包括程式碼,該程式碼在執行時使一設備:儲存一候選者清單,該候選者清單包含至少一個基礎層運動向量候選者;判定用於產生該至少一個基礎層運動向量候選者之行為;根據所判定之行為針對一特定寫碼單元(CU)中之當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至候選者清單。在一些實施例中,該候選者清單可進一步包括空間候選者及時間運動向量預測子(TMVP)。在一個實施例中,可針對每一PU而產生基礎層(BL)運動向量(MV)候選者,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在另一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在又一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間 候選者僅一次,且可針對特定CU而導出TMVP僅一次。
在另一實施例中,一種經組態以對視訊資訊進行寫碼之視訊寫碼裝置包括:用於儲存一候選者清單的構件,該候選者清單包含至少一個基礎層運動向量候選者;用於判定用於產生該至少一個基礎層運動向量候選者之行為的構件;用於根據所判定之行為針對一特定寫碼單元(CU)中之當前預測單元(PU)而產生該至少一個基礎層運動向量候選者的構件,該特定CU具有一或多個PU;及用於將該至少一個基礎層運動向量候選者添加至候選者清單的構件。在一些實施例中,該候選者清單可進一步包括空間候選者及時間運動向量預測子(TMVP)。在一個實施例中,可針對每一PU而產生基礎層(BL)運動向量(MV)候選者,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在另一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對每一PU而導出TMVP。在又一實施例中,可針對特定CU而產生BL MV候選者僅一次,可針對特定CU而產生空間候選者僅一次,且可針對特定CU而導出TMVP僅一次。
10‧‧‧視訊寫碼系統
12‧‧‧源裝置
14‧‧‧目的地裝置
16‧‧‧頻道
18‧‧‧視訊源
20‧‧‧視訊編碼器
22‧‧‧輸出介面
28‧‧‧輸入介面
30‧‧‧視訊解碼器
32‧‧‧顯示裝置
100‧‧‧預測單元
102‧‧‧殘餘產生單元
104‧‧‧變換單元
106‧‧‧量化單元
108‧‧‧反量化單元
110‧‧‧反變換單元
112‧‧‧重建構單元
113‧‧‧濾波單元
114‧‧‧經解碼圖像緩衝器
116‧‧‧熵編碼單元
121‧‧‧框間預測單元
122‧‧‧運動估計單元
124‧‧‧運動補償單元
126‧‧‧框內預測單元
150‧‧‧熵解碼單元
152‧‧‧預測單元
154‧‧‧反量化單元
156‧‧‧反變換單元
158‧‧‧重建構單元
159‧‧‧濾波單元
160‧‧‧經解碼圖像緩衝器
162‧‧‧運動補償單元
164‧‧‧框內預測單元
400‧‧‧子區塊
410‧‧‧清單
411‧‧‧空間運動向量
412‧‧‧空間運動向量
413‧‧‧空間運動向量
414‧‧‧空間運動向量
415‧‧‧時間運動向量預測子(TMVP)
A‧‧‧相鄰區塊
AR‧‧‧空間區塊
BL‧‧‧相鄰區塊
L‧‧‧相鄰區塊
LA‧‧‧相鄰區塊
PU0至PU3‧‧‧子區塊
RA‧‧‧相鄰區塊
T‧‧‧區塊
圖1為說明視訊編碼及解碼系統之實例的方塊圖,該視訊編碼及解碼系統可利用根據本發明中所描述之態樣之技術。
圖2為說明視訊編碼器之實例的方塊圖,該視訊編碼器可實施根據本發明中所描述之態樣之技術。
圖3為說明視訊解碼器之實例的方塊圖,該視訊解碼器可實施根據本發明中所描述之態樣之技術。
圖4A為說明待加以預測之子區塊之實例的方塊圖。
圖4B為說明子區塊之候選運動向量之清單的概念圖。
圖5A至圖5I為說明針對不同分割模式之候選者位置之實例的方 塊圖。
圖6A至圖6E為說明針對不同分割模式之不同候選者位置之實例的方塊圖。
圖7為說明在並行運動估計區域內之寫碼單元及預測單元的圖式。
圖8為說明根據本發明之一個實施例的對視訊資訊進行寫碼之方法的流程圖。
圖9為說明根據本發明之一個實施例的對視訊資訊進行寫碼之方法的流程圖。
圖10為說明根據本發明之一個實施例的對視訊資訊進行寫碼之方法的流程圖。
本文中所描述之某些實施例係關於用於在進階視訊編碼解碼器之內容脈絡中之可擴縮視訊寫碼(諸如,HEVC(高效率視訊寫碼))的層間預測。更具體言之,本發明係關於用於在HEVC之可擴縮視訊寫碼(SVC)擴縮中達成層間預測之經改良之效能的系統及方法。在以下描述中,描述了與某些實施例相關之H.264/AVC技術;亦論述了HEVC標準及相關技術。雖然本文中在HEVC及/或H.264標準之內容脈絡中來描述某些實施例,但一般熟習此項技術者可瞭解,本文中所揭示之系統及方法可適用於任何合適之視訊寫碼標準。舉例而言,本文中所揭示之實施例可適用於以下標準中之一或多者:ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦稱為ISO/IEC MPEG-4 AVC)(包括該ITU-T H.264之可擴縮視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴縮)。
視訊壓縮技術執行空間(圖像內)預測及/或時間(圖像間)預測以減 少或移除視訊序列中固有之冗餘。對於基於區塊之視訊寫碼而言,可將視訊切片(例如,視訊圖框、視訊圖框之一部分等)分割成視訊區塊,該等視訊區塊亦可被稱作樹型區塊、寫碼單元(CU)及/或寫碼節點。使用相對於在同一圖像中之相鄰區塊中之參考樣本的空間預測來對圖像之框內寫碼(I)切片中的視訊區塊進行編碼。圖像之框間寫碼(P或B)切片中之視訊區塊可使用相對於在同一圖像中之相鄰區塊中之參考樣本的空間預測或相對於在其他參考圖像中之參考樣本之時間預測。可將圖像稱作圖框,且可將參考圖像稱作參考圖框。
空間預測或時間預測導致用於待寫碼區塊之預測性區塊。殘餘資料表示待寫碼之原始區塊與預測性區塊之間的像素差。根據指向形成預測性區塊之參考樣本之區塊的運動向量及指示經寫碼區塊與預測性區塊之間的差的殘餘資料來對框間寫碼區塊進行編碼。根據框內寫碼模式及殘餘資料來對框內寫碼區塊進行編碼。為達成進一步之壓縮,可將殘餘資料自像素域變換至變換域,從而產生殘餘變換係數,可接著量化該等殘餘變換係數。可掃描最初配置成二維陣列之經量化之變換係數以便產生變換係數之一維向量,且可應用熵編碼以達成甚至更多壓縮。
如上文所論述,在HEVC擴縮中,可存在兩個運動向量預測模式:合併模式及AMVP模式。舉例而言,合併模式係指一或多個視訊寫碼模式,其中待寫碼之當前視訊區塊的運動資訊(諸如,運動向量、參考圖框索引、預測方向或其他資訊)係繼承自含有當前視訊區塊之同一圖像中的空間相鄰視訊區塊或不同圖像(例如,時間圖像、另一層中之圖像或另一視圖中之圖像)中之同置型視訊區塊。可將同一圖像中之空間相鄰區塊稱作空間候選區塊。可將一不同圖像中之同置型區塊稱作同置型候選區塊。可使用索引值來識別空間相鄰區塊或同置型區塊(例如,相對於當前區塊之頂部區塊、右上區塊、左下區 塊,或來自時間鄰近圖像之同置型區塊、來自另一層之區塊或來自另一視圖之區塊),當前視訊區塊自該空間相鄰區塊或該同置型區塊繼承其運動資訊。
跳過模式可包含一種類型之合併模式(或類似於合併模式之模式)。在跳過模式中,繼承運動資訊,但未對殘餘資訊進行寫碼。殘餘資訊可大體係指像素差資訊,該像素差資訊指示待寫碼之區塊與由繼承自空間相鄰區塊或同置型區塊之運動資訊所識別的預測性區塊之間的像素差。直接模式可為另一類型之合併模式(或類似於合併模式之模式)。直接模式可類似於跳過模式,類似之處在於繼承運動資訊,但在直接模式中,視訊區塊經寫碼以包括殘餘資訊。本文中使用片語「合併模式」來指此等模式中之任一者,該等模式可被稱為跳過模式、直接模式或合併模式。
AMVP模式可類似於合併模式。然而,在AMVP模式中,視訊寫碼器亦將參考索引寫碼至識別用於框間預測之圖像的參考圖像清單(其不同於候選運動向量預測子)中。換言之,在AMVP模式中,視訊寫碼器可不繼承參考圖框索引;而是,可傳信參考圖框索引。又,在一些實施例中,在AMVP模式中,視訊寫碼器可對運動向量差(MVD)進行寫碼。MVD係區塊之實際運動向量與運動向量預測子之間的差,其由候選運動向量預測子之清單中的索引來識別。
因此,視訊編碼器(例如,圖2之視訊編碼器20)可編碼及傳達關於一已知(或可知)之運動向量之運動向量差(MVD),而非編碼及傳達運動向量自身。在H.264/AVC中,已知之運動向量(其可與MVD一起用來定義當前運動向量)可由所謂之運動向量預測子(MVP)來定義,該MVP被導出作為與相鄰區塊相關聯之運動向量的中值。然而,較進階之MVP技術可允許視訊編碼器選擇相鄰者,將自該相鄰者來定義MVP。
僅為了說明之目的,藉由僅包括兩個層(例如,諸如基礎層之較低層級之層,及諸如增強層之較高層級之層)之實例來描述本文中所揭示之某些實施例。應理解,此等實例可適用於包括多個基礎層及/或增強層之組態。另外,為了解釋之容易性,以下揭示內容包括參考某些實施例之術語「圖框」或「區塊」。然而,此等術語並不意欲為限制性的。舉例而言,可將下文所描述之技術與任何合適之視訊單元(諸如,區塊(例如,CU、PU、TU、巨集區塊等)、切片、圖框等)一起使用。
HEVC大體在許多方面遵循先前視訊寫碼標準之構架。HEVC中之預測單元與某些先前視訊寫碼標準中之預測單元(例如,巨集區塊)不同。事實上,巨集區塊之概念並不如在某些先前視訊寫碼標準中所理解般而存在於HEVC中。巨集區塊係由基於四分樹方案之階層式結構來代替,該四分樹方案可提供高靈活性以及其他可能益處。舉例而言,在HEVC方案內,定義了三種類型之區塊(寫碼單元(CU)、預測單元(PU)及變換單元(TU))。CU可係指區域***之基本單元。可將CU視為類似於巨集區塊之概念,但CU並不限制最大大小且可允許遞歸地***成四個相等大小之CU以改良內容自適應性。可將PU視為框間/框內預測之基本單元,且PU可含有單一PU內之多個任意形狀之分割區以有效地對不規則影像圖案進行寫碼。可將TU視為變換之基本單元。可獨立於PU來定義TU;然而,TU之大小可受限於其所屬之CU。將區塊結構以此方式分成三種不同概念可允許每一者根據其作用而被最佳化,從而可導致改良之寫碼效率。
視訊寫碼標準
數位影像(諸如,視訊影像、TV影像、靜態影像或由視訊記錄器或電腦所產生之影像)可由以水平行及垂直行而配置之像素組成。單一影像中之像素的數目通常以數萬計。每一像素通常含有照度及色度 資訊。在不壓縮的情況下,待自影像編碼器輸送至影像解碼器之資訊的量係如此龐大以致於其使得不可能進行即時影像傳輸。為減少待傳輸之資訊的量,已開發了諸多不同壓縮方法(諸如,JPEG、MPEG及H.263標準)。
視訊寫碼標準包括ITU-T H.261、ISO/IEC MPEG-1 Visual、ITU-T H.262或ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual及ITU-T H.264(亦稱為ISO/IEC MPEG-4 AVC)(包括該ITU-T H.264之可擴縮視訊寫碼(SVC)及多視圖視訊寫碼(MVC)擴縮),以上各者皆以全文引用之方式而併入。
另外,正由ITU-T視訊寫碼專家群(VCEG)及ISO/IEC運動圖像專家群(MPEG)之視訊寫碼聯合協作小組(JCT-VC)開發一種新穎的視訊寫碼標準(即,高效率視訊寫碼(HEVC))。HEVC之新近草案可自2013年11月15日起自http://phenix.it-sudparis.eu/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip獲得,該草案係以全文引用之方式而併入。HEVC草案10之完整引用係Bross等人之文件JCTVC-L1003「High Efficiency Video Coding(HEVC)Text Specification Draft 10」(ITU-T SG16 WP3及ISO/IEC JTC1/SC29/WG11之視訊寫碼聯合協作小組(JCT-VC),第12次會議:瑞士日內瓦,2013年1月14日至2013年1月23日)。
下文中參看隨附圖式來更充分地描述新穎系統、設備及方法之各種態樣。然而,本發明可以許多不同形式體現且不應解釋為受限於貫穿本發明所呈現之任何特定結構或功能。而是,提供此等態樣以使得本發明將為詳盡且完整的,且將向熟習此項技術者充分地傳達本發明之範疇。基於本文中之教示,熟習此項技術者應瞭解,本發明之範疇意欲涵蓋本文中所揭示之新穎系統、設備及方法之任何態樣,而不管該態樣係獨立於本發明之任何其他態樣而實施或是與本發明之任何 其他態樣相組合來實施。舉例而言,使用本文中所闡述之任何數目之態樣,可實施一種設備或可實踐一種方法。另外,本發明之範疇意欲涵蓋使用其他結構、功能性或除了本文中所闡述之本發明之各種態樣以外或不同於本文中所闡述之本發明之各種態樣的結構及功能性加以實踐的此設備或方法。應理解,可藉由申請專利範圍之一或多個元件來體現本文中所揭示之任何態樣。
雖然本文中描述了特定態樣,但此等態樣之許多變化及排列係在本發明之範疇內。雖然提及了較佳態樣之一些益處及優點,但本發明之範疇並不意欲受限於特定益處、用途或目標。而是,本發明之態樣意欲廣泛適用於不同無線技藝、系統組態、網路及傳輸協定,以上各者中之一些作為實例而說明於諸圖中及較佳態樣之以下描述中。該詳細描述及該等圖式僅僅說明本發明而非限制本發明,本發明之範疇係由附加之申請專利範圍及其等效物來定義。
附圖說明實例。由附圖中之參考數字所指示的元件對應於由以下描述中之相同參考數字所指示的元件。
視訊寫碼系統
圖1為說明一實例視訊寫碼系統10之方塊圖,該視訊寫碼系統10可利用根據本發明中所描述之態樣之技術。如本文中所描述而使用,術語「視訊寫碼器」大體係指視訊編碼器與視訊解碼器兩者。在本發明中,術語「視訊寫碼」或「寫碼」可大體係指視訊編碼及視訊解碼。
如圖1中所示,視訊寫碼系統10包括源裝置12及目的地裝置14。源裝置12產生經編碼視訊資料。目的地裝置14可對由源裝置12所產生之經編碼視訊資料進行解碼。源裝置12及目的地裝置14可包含廣泛範圍之裝置,該等裝置包括桌上型電腦、筆記型(例如,膝上型等)電腦、平板型電腦、機上盒、諸如所謂之「智慧型」電話的電話手機、 所謂之「智慧型」板(pad)、電視、相機、顯示裝置、數位媒體播放器、視訊遊戲控制台、車載電腦或其類似者。在一些實例中,源裝置12及目的地裝置14可經配備以用於達成無線通信。
目的地裝置14可經由頻道16而自源裝置12接收經編碼視訊資料。頻道16可包含能夠將經編碼視訊資料自源裝置12移至目的地裝置14的任何類型之媒體或裝置。在一個實例中,頻道16可包含使得源裝置12能夠即時地直接將經編碼視訊資料傳輸至目的地裝置14的通信媒體。在此實例中,源裝置12可根據通信標準(諸如,無線通信協定)來調變經編碼視訊資料,且可將經調變之視訊資料傳輸至目的地裝置14。通信媒體可包含無線或有線通信媒體,諸如,射頻(RF)頻譜或一或多個實體傳輸線。通信媒體可形成基於封包之網路(諸如,區域網路、廣域網路或諸如網際網路之全域網路)之部分。通信媒體可包括路由器、開關、基地台,或促進自源裝置12至目的地裝置14之通信的其他裝備。
在另一實例中,頻道16可對應於儲存由源裝置12產生之經編碼視訊資料的儲存媒體。在此實例中,目的地裝置14可經由磁碟存取或卡存取來存取該儲存媒體。該儲存媒體可包括多種本端存取之資料儲存媒體,諸如,藍光光碟、DVD、CD-ROM、快閃記憶體或用於儲存經編碼視訊資料之任何其他合適之數位儲存媒體。在另一實例中,頻道16可包括儲存由源裝置12產生之經編碼視訊的檔案伺服器或另一中間儲存裝置。在此實例中,目的地裝置14可經由串流傳輸或下載來存取被儲存於檔案伺服器或其他中間儲存裝置處的經編碼視訊資料。檔案伺服器可為能夠儲存經編碼視訊資料且將經編碼視訊資料傳輸至目的地裝置14之伺服器類型。實例檔案伺服器包括web伺服器(例如,用於網站等)、FTP伺服器、網路附接儲存(NAS)裝置及本端磁碟機。目的地裝置14可經由任何標準資料連接(包括網際網路連接)來存取經編 碼視訊資料。資料連接之實例類型可包括適合於存取被儲存於檔案伺服器上之經編碼視訊資料的無線頻道(例如,Wi-Fi連接等)、有線連接(例如,DSL、纜線數據機等)或兩者之組合。經編碼視訊資料自檔案伺服器之傳輸可為串流傳輸、下載傳輸或兩者之組合。
本發明之技術並不限於無線應用或設定。可將該等技術應用於支援多種多媒體應用(諸如,(例如)經由網際網路(經由HTTP之動態自適應性串流(DASH)等)之空中電視廣播、有線電視傳輸、衛星電視傳輸、串流視訊傳輸)中之任一者的視訊寫碼、供儲存於資料儲存媒體上之數位視訊的編碼、儲存於資料儲存媒體上之數位視訊的解碼,或其他應用。在一些實例中,視訊寫碼系統10可經組態以支援單向或雙向視訊傳輸從而支援諸如視訊串流傳輸、視訊播放、視訊廣播及/或視訊電話之應用。
在圖1之實例中,源裝置12包括視訊源18、視訊編碼器20及輸出介面22。在一些狀況下,輸出介面22可包括調變器/解調變器(數據機)及/或傳輸器。在源裝置12中,視訊源18可包括諸如以下各者之源:視訊俘獲裝置,例如,視訊攝影機;含有先前俘獲之視訊資料的視訊封存檔;用以自視訊內容提供者接收視訊資料之視訊饋入介面;及/或用於產生視訊資料之電腦圖形系統;或此等源之組合。
視訊編碼器20可經組態以對經俘獲、經預先俘獲或電腦產生之視訊資料進行編碼。經編碼視訊資料可經由源裝置12之輸出介面22而被直接傳輸至目的地裝置14。經編碼視訊資料亦可儲存至儲存媒體或檔案伺服器上以供目的地裝置14稍後存取從而進行解碼及/或播放。
在圖1之實例中,目的地裝置14包括輸入介面28、視訊解碼器30及顯示裝置32。在一些狀況下,輸入介面28可包括接收器及/或數據機。目的地裝置14之輸入介面28經由頻道16來接收經編碼視訊資料。經編碼視訊資料可包括由視訊編碼器20產生之表示視訊資料的多種語 法元素。該等語法元素可描述區塊及其他經寫碼單元(例如,圖像群組(GOP))之特性及/或處理。可將此等語法元素與在通信媒體上傳輸、儲存於儲存媒體上或儲存於檔案伺服器處之經編碼視訊資料包括在一起。
顯示裝置32可與目的地裝置14整合或位於目的地裝置14外部。在一些實例中,目的地裝置14可包括整合之顯示裝置且亦可經組態以與外部顯示裝置介接。在其他實例中,目的地裝置14可為顯示裝置。一般而言,顯示裝置32向使用者顯示經解碼視訊資料。顯示裝置32可包含諸如以下各者之多種顯示裝置中之任一者:液晶顯示器(LCD)、電漿顯示器、有機發光二極體(OLED)顯示器,或另一類型之顯示裝置。
視訊編碼器20及視訊解碼器30可根據一視訊壓縮標準(諸如,目前正在開發之高效率視訊寫碼(HEVC)標準)來操作,且可遵照HEVC測試模型(HM)。或者,視訊編碼器20及視訊解碼器30可根據諸如ITU-T H.264標準(或者被稱作MPEG-4部分10進階視訊寫碼(AVC))之其他專屬或工業標準或此等標準之擴縮來操作。然而,本發明之技術並不限於任何特定寫碼標準。視訊壓縮標準之其他實例包括MPEG-2及ITU-T H.263。
雖然在圖1之實例中未展示,但視訊編碼器20及視訊解碼器30可各自與音訊編碼器及解碼器整合,且可包括適當之MUX-DEMUX單元或其他硬體及軟體,以處置共同之資料流或分開之資料流中之音訊與視訊兩者的編碼。若適用,則在一些實例中,MUX-DEMUX單元可遵照ITU H.223多工器協定或諸如使用者資料報協定(UDP)之其他協定。
再次,圖1僅僅為一實例,且本發明之技術可應用於未必包括編碼裝置與解碼裝置之間的任何資料通信的視訊寫碼設定(例如,視訊編碼或視訊解碼)。在其他實例中,資料可自本端記憶體加以擷取、 經由網路加以串流傳輸或其類似者。編碼裝置可對資料進行編碼並將資料儲存至記憶體,及/或解碼裝置可自記憶體擷取資料並對資料進行解碼。在許多實例中,編碼及解碼係由彼此不通信之裝置來執行,但該等裝置僅將資料編碼至記憶體及/或擷取及解碼來自記憶體之資料。
視訊編碼器20及視訊解碼器30各自可實施為諸如以下各者之多種合適電路中之任一者:一或多個微處理器、數位信號處理器(DSP)、特殊應用積體電路(ASIC)、場可程式化閘陣列(FPGA)、離散邏輯、硬體或其任何組合。當該等技術部分地在軟體中實施時,裝置可將軟體之指令儲存於合適之非暫時性電腦可讀儲存媒體中且可在硬體中使用一或多個處理器來執行該等指令以執行本發明之技術。視訊編碼器20及視訊解碼器30中之每一者可包括於一或多個編碼器或解碼器中,該一或多個編碼器或解碼器中之任一者可整合為各別裝置中之組合式編碼器/解碼器(CODEC)的部分。包括視訊編碼器20及/或視訊解碼器30之裝置可包含積體電路、微處理器及/或無線通信裝置(諸如,蜂巢式電話)。
如上文簡要地提及,視訊編碼器20對視訊資料進行編碼。視訊資料可包含一或多個圖像。該等圖像中之每一者為形成視訊之部分的靜態影像。在一些情況下,可將圖像稱作視訊「圖框」。當視訊編碼器20對視訊資料進行編碼時,視訊編碼器20可產生位元串流。該位元串流可包括形成視訊資料之經寫碼表示的位元序列。該位元串流可包括經寫碼圖像及相關聯資料。經寫碼圖像為圖像之經寫碼表示。
為產生位元串流,視訊編碼器20可對視訊資料中之每一圖像執行編碼操作。當視訊編碼器20對圖像執行編碼操作時,視訊編碼器20可產生一系列經寫碼圖像及相關聯資料。該相關聯資料可包括序列參數集、圖像參數集、調適參數集及其他語法結構。序列參數集(SPS) 可含有適用於零或多個圖像序列之參數。圖像參數集(PPS)可含有適用於零或多個圖像之參數。調適參數集(APS)可含有適用於零或多個圖像之參數。APS中之參數可為比PPS中之參數更可能改變的參數。
為產生經寫碼圖像,視訊編碼器20可將一圖像分割成大小相等之視訊區塊。視訊區塊可為樣本之二維陣列。該等視訊區塊中之每一者與一樹型區塊相關聯。在一些情況下,可將樹型區塊稱作最大寫碼單元(LCU)。HEVC之樹型區塊可廣泛地類似於諸如H.264/AVC之先前標準的巨集區塊。然而,樹型區塊未必限於特定大小且可包括一或多個寫碼單元(CU)。視訊編碼器20可使用四分樹分割以將樹型區塊之視訊區塊分割成與CU相關聯之視訊區塊,因此得名「樹型區塊」。
在一些實例中,視訊編碼器20可將一圖像分割成複數個切片。該等切片中之每一者可包括整數個CU。在一些情況下,一切片包含整數個樹型區塊。在其他情況下,切片之邊界可在樹型區塊內。
作為對圖像執行編碼操作的部分,視訊編碼器20可對該圖像之每一切片執行編碼操作。當視訊編碼器20對切片執行編碼操作時,視訊編碼器20可產生與該切片相關聯之經編碼資料。可將與該切片相關聯之經編碼資料稱作「經寫碼切片」。
為產生經寫碼切片,視訊編碼器20可對切片中之每一樹型區塊執行編碼操作。當視訊編碼器20對樹型區塊執行編碼操作時,視訊編碼器20可產生經寫碼樹型區塊。該經寫碼樹型區塊可包含表示樹型區塊之經編碼型式的資料。
當視訊編碼器20產生經寫碼切片時,視訊編碼器20可根據光柵掃描次序對樹型區塊執行編碼操作(例如,編碼)。換言之,視訊編碼器20可以跨越切片中之樹型區塊之最上列而自左邊進行至右邊、接著跨越樹型區塊之下一較低列而自左邊進行至右邊且以此類推的次序來對該切片之樹型區塊進行編碼,直至視訊編碼器20已對該切片中之樹 型區塊中的每一者進行編碼為止。
作為根據光柵掃描次序來對樹型區塊進行編碼的結果,位於一給定樹型區塊之左上方的樹型區塊可能已得以編碼,但位於該給定樹型區塊之右下方的樹型區塊卻尚未得以編碼。因此,視訊編碼器20可能能夠在對給定樹型區塊進行編碼時存取藉由對位於該給定樹型區塊之左上方的樹型區塊進行編碼而產生之資訊。然而,視訊編碼器20可能不能夠在對給定樹型區塊進行編碼時存取藉由對位於該給定樹型區塊之右下方的樹型區塊進行編碼而產生之資訊。
為產生經寫碼樹型區塊,視訊編碼器20可遞歸地對樹型區塊之視訊區塊執行四分樹分割以將該視訊區塊劃分成漸次較小之視訊區塊。該等較小之視訊區塊中之每一者可與一不同CU相關聯。舉例而言,視訊編碼器20可將樹型區塊之視訊區塊分割成四個大小相等之子區塊、將該等子區塊中之一或多者分割成四個大小相等之子子區塊,以此類推。經分割之CU可為其視訊區塊被分割成與其他CU相關聯之視訊區塊的CU。非經分割之CU可為其視訊區塊未被分割成與其他CU相關聯之視訊區塊的CU。
位元串流中之一或多個語法元素可指示視訊編碼器20可分割樹型區塊之視訊區塊的最大次數。CU之視訊區塊的形狀可為正方形。CU之視訊區塊之大小(例如,CU之大小)的範圍可自8×8像素直至具有最大值為64×64像素或更大的樹型區塊之視訊區塊之大小(例如,樹型區塊之大小)。
視訊編碼器20可根據z形掃描次序對樹型區塊之每一CU執行編碼操作(例如,編碼)。換言之,視訊編碼器20可以左上、右上、左下及接著右下之次序來對左上CU、右上CU、左下CU及接著右下CU進行編碼。當視訊編碼器20對經分割CU執行編碼操作時,視訊編碼器20可根據z形掃描次序來對與該經分割CU之視訊區塊之子區塊相關聯的 CU進行編碼。換言之,視訊編碼器20可以左上、右上、左下及接著右下之次序來對與左上子區塊相關聯之CU、與右上子區塊相關聯之CU、與左下子區塊相關聯之CU及接著與右下子區塊相關聯之CU進行編碼。
作為根據z形掃描次序來對樹型區塊之CU進行編碼的結果,位於一給定CU之上方、左上、右上、左邊及左下的CU可能已得以編碼。位於該給定CU之右下方的CU卻尚未得以編碼。因此,視訊編碼器20可能能夠在對給定CU進行編碼時存取藉由對與該給定CU相鄰之一些CU進行編碼而產生的資訊。然而,視訊編碼器20可能不能夠在對給定CU進行編碼時存取藉由對與該給定CU相鄰之其他CU進行編碼而產生的資訊。
當視訊編碼器20對非經分割CU進行編碼時,視訊編碼器20可產生用於該CU之一或多個預測單元(PU)。該CU之該等PU中之每一者可與該CU之視訊區塊內的一不同視訊區塊相關聯。視訊編碼器20可產生該CU之每一PU的預測型視訊區塊。PU之預測型視訊區塊可為樣本之區塊。視訊編碼器20可使用框內預測或框間預測來產生PU之預測型視訊區塊。
當視訊編碼器20使用框內預測來產生一PU之預測型視訊區塊時,視訊編碼器20可基於與該PU相關聯之圖像之經解碼樣本而產生該PU之預測型視訊區塊。若視訊編碼器20使用框內預測來產生一CU之PU之預測型視訊區塊,則該CU為框內預測型CU。當視訊編碼器20使用框間預測來產生PU之預測型視訊區塊時,視訊編碼器20可基於不同於與該PU相關聯之圖像的一或多個圖像之經解碼樣本而產生該PU之預測型視訊區塊。若視訊編碼器20使用框間預測來產生一CU之PU之預測型視訊區塊,則該CU為框間預測型CU。
此外,當視訊編碼器20使用框間預測來產生一PU之預測型視訊 區塊時,視訊編碼器20可產生該PU之運動資訊。PU之運動資訊可指示該PU之一或多個參考區塊。該PU之每一參考區塊可為參考圖像內之視訊區塊。該參考圖像可為不同於與PU相關聯之圖像的圖像。在一些情況下,亦可將PU之參考區塊稱作該PU之「參考樣本」。視訊編碼器20可基於PU之參考區塊而產生該PU之預測型視訊區塊。
在視訊編碼器20產生一CU之一或多個PU之預測型視訊區塊之後,視訊編碼器20可基於該CU之該等PU之預測型視訊區塊來產生該CU之殘餘資料。CU之殘餘資料可指示該CU之PU之預測型視訊區塊與CU之原始視訊區塊中之樣本之間的差。
此外,作為對非經分割CU執行編碼操作的部分,視訊編碼器20可對CU之殘餘資料執行遞歸四分樹分割以將CU之殘餘資料分割成與CU之變換單元(TU)相關聯之一或多個殘餘資料區塊(亦即,殘餘視訊區塊)。CU之每一TU可與一不同之殘餘視訊區塊相關聯。
視訊寫碼器20可將一或多種變換應用於與TU相關聯之殘餘視訊區塊以產生與TU相關聯之變換係數區塊(例如,變換係數之區塊)。概念上,變換係數區塊可為變換係數之二維(2D)矩陣。
在產生變換係數區塊之後,視訊編碼器20可對該變換係數區塊執行量化程序。量化大體係指如下之程序:將變換係數量化以可能地減少用以表示變換係數之資料之量,從而提供進一步之壓縮。量化程序可減少與變換係數中之一些或所有變換係數相關聯之位元深度。舉例而言,可在量化期間將n位元變換係數捨去至m位元變換係數,其中n大於m
視訊編碼器20可使每一CU與量化參數(QP)值相關聯。與CU相關聯之QP值可判定視訊編碼器20如何量化與該CU相關聯之變換係數區塊。視訊編碼器20可藉由調整與CU相關聯之QP值來調整被應用於與該CU相關聯之變換係數區塊的量化之程度。
在視訊編碼器20量化變換係數區塊之後,視訊編碼器20可產生若干組語法元素,該等語法元素表示經量化之變換係數區塊中的變換係數。視訊編碼器20可將諸如上下文自適應性二進位算術寫碼(CABAC)操作之熵編碼操作應用於此等語法元素中之一些語法元素。亦可使用其他熵寫碼技術,諸如內容自適應性可變長度寫碼(CAVLC)、機率區間分割熵(PIPE)寫碼或其他二進位算術寫碼。
由視訊編碼器20所產生之位元串流可包括一系列網路提取層(NAL)單元。該等NAL單元中之每一者可為一語法結構,其含有NAL單元中之資料之類型及含有該資料之位元組的指示。舉例而言,NAL單元可含有表示以下各者之資料:序列參數集、圖像參數集、經寫碼切片、補充增強資訊(SEI)、存取單元定界符、濾波資料或另一類型之資料。NAL單元中之資料可包括各種語法結構。
視訊解碼器30可接收由視訊編碼器20所產生之位元串流。該位元串流可包括由視訊編碼器20所編碼之視訊資料之經寫碼表示。當視訊解碼器30接收到位元串流時,視訊解碼器30可對位元串流執行剖析操作。當視訊解碼器30執行剖析操作時,視訊解碼器30可自位元串流提取語法元素。視訊解碼器30可基於自位元串流所提取之語法元素來重建構視訊資料之圖像。用以基於語法元素來重建構視訊資料的程序可大體與由視訊編碼器20所執行之用以產生語法元素的程序互反。
在視訊解碼器30提取到與CU相關聯之語法元素之後,視訊解碼器30可基於該等語法元素來產生CU之PU之預測型視訊區塊。另外,視訊解碼器30可反量化與CU之TU相關聯的變換係數區塊。視訊解碼器30可對變換係數區塊執行反變換以重建構與CU之TU相關聯的殘餘視訊區塊。在產生預測型視訊區塊及重建構殘餘視訊區塊之後,視訊解碼器30可基於該等預測型視訊區塊及該等殘餘視訊區塊來重建構CU之視訊區塊。以此方式,視訊解碼器30可基於位元串流中之語法 元素來重建構CU之視訊區塊。
視訊編碼器
圖2為說明視訊編碼器之實例之方塊圖,該視訊編碼器可實施根據本發明中所描述之態樣之技術。視訊編碼器20可經組態以執行本發明之技術中之任一者或全部。作為一個實例,預測單元100可經組態以執行本發明中所描述之技術中之任一者或全部。然而,本發明之態樣不限於此。在一些實例中,可在視訊編碼器20之各種組件之間共用本發明中所描述之技術。在一些實例中,除上述情況之外或代替上述情況,一處理器(未圖示)可經組態以執行本發明中所描述之技術中之任一者或全部。
為了解釋之目的,本發明在HEVC寫碼之內容脈絡中描述視訊編碼器20。然而,本發明之技術可適用於其他寫碼標準或方法。
視訊編碼器20可執行視訊切片內之視訊區塊的框內寫碼及框間寫碼。框內寫碼依賴於空間預測以減少或移除給定視訊圖框或圖像內之視訊中的空間冗餘。框間寫碼依賴於時間預測以減少或移除視訊序列之鄰近圖框或圖像內之視訊中的時間冗餘。框內模式(I模式)可係指若干基於空間之寫碼模式中之任一者。框間模式(諸如,單向預測(P模式)或雙向預測(B模式))可係指若干基於時間之寫碼模式中之任一者。
在圖2之實例中,視訊編碼器20包括複數個功能組件。視訊編碼器20之功能組件包括預測單元100、殘餘產生單元102、變換單元104、量化單元106、反量化單元108、反變換單元110、重建構單元112、濾波單元113、經解碼圖像緩衝器114及熵編碼單元116。預測單元100包括框間預測單元121、運動估計單元122、運動補償單元124及框內預測單元126。在其他實例中,視訊編碼器20可包括更多、更少或不同之功能組件。此外,運動估計單元122及運動補償單元124可經 高度整合,但為解釋之目的而在圖2之實例中單獨地加以表示。
視訊編碼器20可接收視訊資料。視訊編碼器20可自各種源接收視訊資料。舉例而言,視訊編碼器20可自視訊源18(圖1)或另一源接收視訊資料。視訊資料可表示一系列圖像。為對視訊資料進行編碼,視訊編碼器20可對該等圖像中之每一者執行編碼操作。作為對圖像執行編碼操作的部分,視訊編碼器20可對該圖像之每一切片執行編碼操作。作為對切片執行編碼操作的部分,視訊編碼器20可對該切片中之樹型區塊執行編碼操作。
作為對樹型區塊執行編碼操作的部分,預測單元100可對該樹型區塊之視訊區塊執行四分樹分割以將視訊區塊劃分成漸次較小之視訊區塊。該等較小之視訊區塊中之每一者可與一不同CU相關聯。舉例而言,預測單元100可將樹型區塊之視訊區塊分割成四個大小相等之子區塊、將該等子區塊中之一或多者分割成四個大小相等之子子區塊,等等。
與CU相關聯之視訊區塊之大小的範圍可自8×8樣本直至具有最大值為64×64樣本或更大的樹型區塊之大小。在本發明中,「N×N」與「N乘N」可互換地使用以指視訊區塊在垂直尺寸與水平尺寸方面之樣本尺寸,例如,16×16樣本或16乘16樣本。一般而言,16×16視訊區塊在垂直方向上具有十六個樣本(y=16)且在水平方向上具有十六個樣本(x=16)。同樣地,N×N區塊大體在垂直方向上具有N個樣本且在水平方向上具有N個樣本,其中N表示非負整數值。
此外,作為對樹型區塊執行編碼操作的部分,預測單元100可產生該樹型區塊之階層式四分樹資料結構。舉例而言,樹型區塊可對應於四分樹資料結構之根節點。若預測單元100將樹型區塊之視訊區塊分割成四個子區塊,則根節點在四分樹資料結構中具有四個子代節點。該等子代節點中之每一者對應於與該等子區塊中之一者相關聯的 CU。若預測單元100將該等子區塊中之一者分割成四個子子區塊,則對應於與該子區塊相關聯之CU的節點可具有四個子代節點,該等子代節點中之每一者對應於與子子區塊中之一者相關聯的CU。
四分樹資料結構之每一節點可含有用於對應之樹型區塊或CU的語法資料(例如,語法元素)。舉例而言,四分樹中之節點可包括一***旗標,該***旗標指示對應於該節點之CU之視訊區塊是否被分割(例如,***)成四個子區塊。可遞歸地定義CU之語法元素,且該等語法元素可取決於CU之視訊區塊是否被***成子區塊。視訊區塊未被分割之CU可對應於四分樹資料結構中之葉節點。經寫碼樹型區塊可包括基於對應之樹型區塊之四分樹資料結構的資料。
視訊編碼器20可對樹型區塊之每一非經分割CU執行編碼操作。當視訊編碼器20對非經分割CU執行編碼操作時,視訊編碼器20產生表示該非經分割CU之經編碼表示的資料。
作為對CU執行編碼操作的部分,預測單元100可在該CU之一或多個PU之間分割該CU之視訊區塊。視訊編碼器20及視訊解碼器30可支援各種PU大小。假定特定CU之大小為2N×2N,視訊編碼器20及視訊解碼器30可支援2N×2N或N×N之PU大小及以2N×2N、2N×N、N×2N、N×N、2N×nU、nL×2N、nR×2N或其類似者之對稱PU大小進行的框間預測。視訊編碼器20及視訊解碼器30亦可支援針對2N×nU、2N×nD、nL×2N及nR×2N之PU大小的不對稱分割。在一些實例中,預測單元100可執行幾何分割以沿不以直角與CU之視訊區塊之邊相交的邊界而在CU之PU之間分割CU之視訊區塊。
框間預測單元121可對CU之每一PU執行框間預測。框間預測可提供時間壓縮。為對PU執行框間預測,運動估計單元122可產生PU之運動資訊。運動補償單元124可基於運動資訊及不同於與CU相關聯之圖像的圖像(例如,參考圖像)之經解碼樣本而產生PU之預測型視訊區 塊。在本發明中,可將由運動補償單元124所產生之預測型視訊區塊稱作框間預測型視訊區塊。
切片可為I切片、P切片或B切片。運動估計單元122及運動補償單元124可取決於PU係位於I切片、P切片或是B切片中而針對CU之PU來執行不同操作。在I切片中,所有PU被框內預測。因此,若PU位於I切片中,則運動估計單元122及運動補償單元124不對該PU執行框間預測。
若PU位於P切片中,則含有該PU之圖像與參考圖像之清單(稱作「清單0」)相關聯。清單0中之參考圖像中的每一者含有可用於其他圖像之框間預測的樣本。當運動估計單元122相對於P切片中之PU來執行運動估計操作時,運動估計單元122可針對該PU之參考區塊來搜尋清單0中之參考圖像。PU之參考區塊可為最密切地對應於PU之視訊區塊中之樣本的一組樣本(例如,樣本區塊)。運動估計單元122可使用多種量度來判定參考圖像中之一組樣本如何密切地對應於PU之視訊區塊中之樣本。舉例而言,運動估計單元122可藉由絕對差和(SAD)、平方差和(SSD)或其他差量度來判定參考圖像中之一組樣本如何密切地對應於PU之視訊區塊中之樣本。
在識別P切片中之PU之參考區塊之後,運動估計單元122可產生:一參考索引,其指示清單0中之含有參考區塊的參考圖像;及一運動向量,其指示PU與參考區塊之間的空間位移。在各種實例中,運動估計單元122可以不同之精度產生運動向量。舉例而言,運動估計單元122可以四分之一樣本精度、八分之一樣本精度或其他分率樣本精度來產生運動向量。在分率樣本精度之狀況下,可自參考圖像中之整數位置樣本值來內插參考區塊值。運動估計單元122可輸出參考索引及運動向量以作為PU之運動資訊。運動補償單元124可基於由PU之運動資訊所識別的參考區塊來產生PU之預測型視訊區塊。
若PU位於B切片中,則含有該PU之圖像可與參考圖像之兩個清單(稱作「清單0」及「清單1」)相關聯。在一些實例中,含有B切片之圖像可與一清單組合(其為清單0及清單1之組合)相關聯。
此外,若PU位於B切片中,則運動估計單元122可針對該PU執行單向預測或雙向預測。當運動估計單元122針對該PU執行單向預測時,運動估計單元122可針對該PU之參考區塊來搜尋清單0或清單1之參考圖像。運動估計單元122可接著產生:一參考索引,其指示清單0或清單1中之含有參考區塊的參考圖像;及一運動向量,其指示PU與參考區塊之間的空間位移。運動估計單元122可輸出參考索引、預測方向指示符及運動向量以作為PU之運動資訊。預測方向指示符可指示參考索引指示清單0或是清單1中之參考圖像。運動補償單元124可基於由PU之運動資訊所指示的參考區塊來產生PU之預測型視訊區塊。
當運動估計單元122針對PU執行雙向預測時,運動估計單元122可針對PU之參考區塊來搜尋清單0中之參考圖像,且亦可針對PU之另一參考區塊來搜尋清單1中之參考圖像。運動估計單元122可接著產生:參考索引,其指示清單0及清單1中之含有參考區塊的參考圖像;及運動向量,其指示參考區塊與PU之間的空間位移。運動估計單元122可輸出PU之參考索引及運動向量以作為PU之運動資訊。運動補償單元124可基於由PU之運動資訊所指示的參考區塊來產生PU之預測型視訊區塊。
如下文參看圖8至圖10予以進一步論述,預測單元100可經組態以藉由執行圖8至圖10中所說明之方法來執行運動估計。
在一些情況下,運動估計單元122並不將PU之一組完整的運動資訊輸出至熵編碼單元116。而是,運動估計單元122可參考另一PU之運動資訊來傳信PU之運動資訊。舉例而言,運動估計單元122可判定 PU之運動資訊充分類似於一相鄰PU之運動資訊。在此實例中,運動估計單元122可在與該PU相關聯之語法結構中指示一值,該值向視訊解碼器30指示該PU具有與該相鄰PU相同之運動資訊。在另一實例中,運動估計單元122可在與該PU相關聯之語法結構中識別相鄰PU及運動向量差(MVD)。該運動向量差指示PU之運動向量與所指示之相鄰PU之運動向量之間的差。視訊解碼器30可使用所指示之相鄰PU之運動向量及運動向量差來判定該PU之運動向量。藉由在傳信第二PU之運動資訊時參考第一PU之運動資訊,視訊編碼器20可能能夠使用較少位元來傳信第二PU之運動資訊。
作為對CU執行編碼操作的部分,框內預測單元126可對該CU之PU執行框內預測。框內預測可提供空間壓縮。當框內預測單元126對PU執行框內預測時,框內預測單元126可基於同一圖像中之其他PU之經解碼樣本而產生該PU之預測資料。PU之預測資料可包括預測型視訊區塊及各種語法元素。框內預測單元126可對I切片、P切片及B切片中之PU執行框內預測。
為對PU執行框內預測,框內預測單元126可使用多種框內預測模式來產生PU之多組預測資料。當框內預測單元126使用一框內預測模式來產生PU之一組預測資料時,框內預測單元126可在與該框內預測模式相關聯之方向及/或梯度上使來自相鄰PU之視訊區塊的樣本延伸跨越PU之視訊區塊。假定PU、CU及樹型區塊之左-右、頂-底編碼次序,相鄰PU可位於PU之上方、右上、左上或左邊。框內預測單元126可取決於PU之大小而使用各種數目之框內預測模式(例如,33種定向框內預測模式)。
預測單元100可從由運動補償單元124針對PU所產生之預測資料或由框內預測單元126針對PU所產生之預測資料當中選擇PU之預測資料。在一些實例中,預測單元100基於該等組預測資料之速率/失真量 度來選擇PU之預測資料。
若預測單元100選擇由框內預測單元126所產生之預測資料,則預測單元100可傳信用以產生PU之預測資料的框內預測模式(例如,所選之框內預測模式)。預測單元100可以各種方式來傳信所選之框內預測模式。舉例而言,所選之框內預測模式很有可能與相鄰PU之框內預測模式相同。換言之,相鄰PU之框內預測模式可為當前PU之最有可能模式。因此,預測單元100可產生一語法元素以指示所選之框內預測模式與相鄰PU之框內預測模式相同。
在預測單元100選擇CU之PU的預測資料之後,殘餘產生單元102可藉由自CU之視訊區塊減去CU之PU的預測型視訊區塊來產生CU之殘餘資料。CU之殘餘資料可包括2D殘餘視訊區塊,該等2D殘餘視訊區塊對應於CU之視訊區塊中之樣本的不同樣本分量。舉例而言,殘餘資料可包括一殘餘視訊區塊,該殘餘視訊區塊對應於CU之PU之預測型視訊區塊中的樣本之照度分量與CU之原始視訊區塊中的樣本之照度分量之間的差。另外,CU之殘餘資料可包括殘餘視訊區塊,該等殘餘視訊區塊對應於CU之PU之預測型視訊區塊中的樣本之色度分量與CU之原始視訊區塊中的樣本之色度分量之間的差。
預測單元100可執行四分樹分割以將CU之殘餘視訊區塊分割成子區塊。每一未劃分之殘餘視訊區塊可與CU之一不同TU相關聯。與CU之TU相關聯之殘餘視訊區塊的大小及位置可基於或可不基於與CU之PU相關聯之視訊區塊的大小及位置。稱為「殘餘四分樹」(RQT)之四分樹結構可包括與殘餘視訊區塊中之每一者相關聯的節點。CU之TU可對應於RQT之葉節點。
變換單元104可針對CU之每一TU而藉由將一或多種變換應用於與該TU相關聯之殘餘視訊區塊來產生一或多個變換係數區塊。該等變換係數區塊中之每一者可為變換係數之2D矩陣。變換單元104可將 各種變換應用於與TU相關聯之殘餘視訊區塊。舉例而言,變換單元104可將離散餘弦變換(DCT)、定向變換或概念上類似之變換應用於與TU相關聯之殘餘視訊區塊。
在變換單元104產生與TU相關聯之變換係數區塊之後,量化單元106可量化該變換係數區塊中之變換係數。量化單元106可基於與CU相關聯之QP值來量化與該CU之TU相關聯的變換係數區塊。
視訊編碼器20可以各種方式使QP值與CU相關聯。舉例而言,視訊編碼器20可對與CU相關聯之樹型區塊執行速率-失真分析。在速率-失真分析中,視訊編碼器20可藉由對樹型區塊執行編碼操作多次來產生樹型區塊之多個經寫碼表示。當視訊編碼器20產生樹型區塊之不同經編碼表示時,視訊編碼器20可使不同QP值與CU相關聯。視訊編碼器20可在樹型區塊之具有最低位元速率及失真量度之經寫碼表示中傳信一給定QP值與CU相關聯(當該給定QP值與該CU相關聯時)。
反量化單元108及反變換單元110可分別將反量化及反變換應用於變換係數區塊,以自該變換係數區塊重建構殘餘視訊區塊。重建構單元112可將經重建構之殘餘視訊區塊加至來自由預測單元100所產生之一或多個預測型視訊區塊的對應樣本以產生與TU相關聯之經重建構之視訊區塊。藉由以此方式重建構CU之每一TU的視訊區塊,視訊編碼器20可重建構CU之視訊區塊。
在重建構單元112重建構CU之視訊區塊之後,濾波單元113可執行解塊操作以減少與CU相關聯之視訊區塊中的成塊假影。在執行了一或多個解塊操作之後,濾波單元113可將CU之經重建構之視訊區塊儲存於經解碼圖像緩衝器114中。運動估計單元122及運動補償單元124可使用含有經重建構之視訊區塊的參考圖像以對後續圖像之PU執行框間預測。另外,框內預測單元126可使用經解碼圖像緩衝器114中之經重建構之視訊區塊以對與CU相同之圖像中的其他PU執行框內預 測。
熵編碼單元116可自視訊編碼器20之其他功能組件接收資料。舉例而言,熵編碼單元116可自量化單元106接收變換係數區塊且可自預測單元100接收語法元素。當熵編碼單元116接收到資料時,熵編碼單元116可執行一或多個熵編碼操作以產生經熵編碼資料。舉例而言,視訊編碼器20可對資料執行上下文自適應性可變長度寫碼(CAVLC)操作、CABAC操作、變長至變長(V2V)寫碼操作、基於語法之上下文自適應性二進位算術寫碼(SBAC)操作、機率區間分割熵(PIPE)寫碼操作或另一類型之熵編碼操作。熵編碼單元116可輸出包括經熵編碼資料之位元串流。
作為對資料執行熵編碼操作的部分,熵編碼單元116可選擇上下文模型。若熵編碼單元116正執行CABAC操作,則上下文模型可指示特定二進位位元(bin)具有特定值之機率的估計。在CABAC之內容脈絡中,術語「二進位位元」用來指語法元素之二進位化型式之位元。
視訊解碼器
圖3為說明視訊解碼器之實例之方塊圖,該視訊解碼器可實施根據本發明中所描述之態樣之技術。視訊解碼器30可經組態以執行本發明之技術中之任一者或全部。作為一個實例,運動補償單元162及/或框內預測單元164可經組態以執行本發明中所描述之技術中之任一者或全部。然而,本發明之態樣不限於此。在一些實例中,可在視訊解碼器30之各種組件之間共用本發明中所描述之技術。在一些實例中,除上述情況之外或代替上述情況,一處理器(未圖示)可經組態以執行本發明中所描述之技術中之任一者或全部。
在圖3之實例中,視訊解碼器30包括複數個功能組件。視訊解碼器30之功能組件包括熵解碼單元150、預測單元152、反量化單元154、反變換單元156、重建構單元158、濾波單元159及經解碼圖像緩 衝器160。預測單元152包括運動補償單元162及框內預測單元164。在一些實例中,視訊解碼器30可執行與關於圖2之視訊編碼器20所描述之編碼遍次大體互反的解碼遍次。在其他實例中,視訊解碼器30可包括更多、更少或不同之功能組件。
視訊解碼器30可接收包含經編碼視訊資料之位元串流。該位元串流可包括複數個語法元素。當視訊解碼器30接收到位元串流時,熵解碼單元150可對位元串流執行剖析操作。作為對位元串流執行剖析操作的結果,熵解碼單元150可自位元串流提取語法元素。作為執行剖析操作的部分,熵解碼單元150可對位元串流中之經熵編碼語法元素進行熵解碼。預測單元152、反量化單元154、反變換單元156、重建構單元158及濾波單元159可執行重建構操作,該重建構操作基於自位元串流所提取之語法元素而產生經解碼視訊資料。
如上文所論述,位元串流可包含一系列NAL單元。位元串流之NAL單元可包括序列參數集NAL單元、圖像參數集NAL單元、SEI NAL單元等等。作為對位元串流執行剖析操作的部分,熵解碼單元150可執行自序列參數集NAL單元提取及熵解碼序列參數集、自圖像參數集NAL單元提取及熵解碼圖像參數集、自SEI NAL單元提取及熵解碼SEI資料等等的剖析操作。
另外,位元串流之NAL單元可包括經寫碼切片NAL單元。作為對位元串流執行剖析操作的部分,熵解碼單元150可執行自經寫碼切片NAL單元提取及熵解碼經寫碼切片的剖析操作。該等經寫碼切片中之每一者可包括切片標頭及切片資料。切片標頭可含有關於切片之語法元素。切片標頭中之語法元素可包括識別與含有該切片之圖像相關聯之圖像參數集的語法元素。熵解碼單元150可對經寫碼切片標頭中之語法元素執行諸如CABAC解碼操作之熵解碼操作以恢復切片標頭。
作為自經寫碼切片NAL單元提取切片資料的部分,熵解碼單元 150可執行自切片資料中之經寫碼CU提取語法元素的剖析操作。所提取之語法元素可包括與變換係數區塊相關聯之語法元素。熵解碼單元150可接著對該等語法元素中之一些語法元素執行CABAC解碼操作。
在熵解碼單元150對非經分割CU執行剖析操作之後,視訊解碼器30可對非經分割CU執行重建構操作。為對非經分割CU執行重建構操作,視訊解碼器30可對CU之每一TU執行重建構操作。藉由針對CU之每一TU來執行重建構操作,視訊解碼器30可重建構與該CU相關聯之殘餘視訊區塊。
作為對TU執行重建構操作的部分,反量化單元154可反量化(例如,解量化)與TU相關聯之變換係數區塊。反量化單元154可以類似於針對HEVC所提議或由H.264解碼標準所定義之反量化程序的方式來反量化變換係數區塊。反量化單元154可使用由視訊編碼器20針對變換係數區塊之CU所計算的量化參數QP來判定量化之程度且同樣地判定供反量化單元154應用之反量化之程度。
在反量化單元154反量化變換係數區塊之後,反變換單元156可產生與變換係數區塊相關聯之TU之殘餘視訊區塊。反變換單元156可將反變換應用於變換係數區塊以便產生TU之殘餘視訊區塊。舉例而言,反變換單元156可將反DCT、反整數變換、反卡忽南-拉維變換(inverse Karhunen-Loeve transform,KLT)、反旋轉變換、反定向變換或另一反變換應用於變換係數區塊。在一些實例中,反變換單元156可基於來自視訊編碼器20之信令來判定待應用於變換係數區塊之反變換。在此等實例中,反變換單元156可基於在與變換係數區塊相關聯之樹型區塊之四分樹之根節點處的已傳信之變換來判定反變換。在其他實例中,反變換單元156可自一或多個寫碼特性(諸如,區塊大小、寫碼模式或其類似者)來推斷反變換。在一些實例中,反變換單元156可應用級聯反變換。
在一些實例中,運動補償單元162可藉由基於內插濾波器執行內插來改進PU之預測型視訊區塊。待用於以子樣本精度進行運動補償之內插濾波器的識別符可被包括於語法元素中。運動補償單元162可使用由視訊編碼器20在產生PU之預測型視訊區塊期間所使用之相同內插濾波器來計算參考區塊之子整數樣本之內插值。運動補償單元162可根據所接收之語法資訊來判定由視訊編碼器20所使用之內插濾波器且使用該等內插濾波器來產生預測型視訊區塊。
如下文參看圖8至圖10予以進一步論述,預測單元152(例如,經由運動補償單元162)可藉由執行圖8至圖10中所說明之方法來執行運動補償。
若PU係使用框內預測而加以編碼,則框內預測單元164可執行框內預測以產生PU之預測型視訊區塊。舉例而言,框內預測單元164可基於位元串流中之語法元素來判定PU之框內預測模式。位元串流可包括框內預測單元164可用來判定PU之框內預測模式的語法元素。
在一些情況下,語法元素可指示框內預測單元164將使用另一PU之框內預測模式來判定當前PU之框內預測模式。舉例而言,當前PU之框內預測模式可很有可能與相鄰PU之框內預測模式相同。換言之,相鄰PU之框內預測模式可為當前PU之最有可能模式。因此,在此實例中,位元串流可包括一小語法元素,該小語法元素指示PU之框內預測模式與相鄰PU之框內預測模式相同。框內預測單元164可接著使用該框內預測模式以基於空間相鄰PU之視訊區塊來產生PU之預測資料(例如,所預測之樣本)。
重建構單元158可在適用時使用與CU之TU相關聯之殘餘視訊區塊及CU之PU之預測型視訊區塊(例如,框內預測資料抑或框間預測資料)來重建構CU之視訊區塊。因此,視訊解碼器30可基於位元串流中之語法元素來產生預測型視訊區塊及殘餘視訊區塊,且可基於該預測 型視訊區塊及該殘餘視訊區塊來產生視訊區塊。
在重建構單元158重建構CU之視訊區塊之後,濾波單元159可執行解塊操作以減少與CU相關聯之成塊假影。在濾波單元159執行解塊操作以減少與CU相關聯之成塊假影之後,視訊解碼器30可將CU之視訊區塊儲存於經解碼圖像緩衝器160中。經解碼圖像緩衝器160可提供用於後續運動補償、框內預測及在顯示裝置(諸如,圖1之顯示裝置32)上呈現的參考圖像。例如,視訊解碼器30可基於經解碼圖像緩衝器160中之視訊區塊來對其他CU之PU執行框內預測操作或框間預測操作。
候選者清單建構
圖4A說明待加以預測之子區塊400之實例,且圖4B為說明子區塊400之候選運動向量之清單410(例如,合併候選者清單)的概念圖。可類似地如圖4B中所示來導出AMVP候選者清單。子區塊400之實例包括(但不限於)最大寫碼單元(LCU)、寫碼單元(CU)、預測單元(PU)、變換單元(TU)或任何子區塊層級。子區塊400可為較大區塊之一部分(因此稱為子區塊)。舉例而言,子區塊400可為CU之PU。在此實例中,可將該CU稱作當前區塊且可將該PU稱作子區塊。當前區塊可包括一或多個子區塊。然而,子區塊400可有可能為最大可能區塊,且在此狀況下,可僅將子區塊400視為區塊。
在圖4A中,LA、L、BL、A及RA係指子區塊400之相鄰區塊。此等相鄰區塊中之每一者的運動向量可潛在地為合併清單410之候選者。舉例而言,圖4B說明空間運動向量411至414。此等運動向量中之每一者可對應於圖4A中所示之相鄰區塊LA、L、BL、A及RA中之一者的運動向量。
圖4A說明區塊T。不應將此區塊T解釋為意謂其為子區塊400之相鄰區塊。相反,此區塊T係指子區塊400之時間同置型區塊。該時間同 置型區塊駐留於不同於包括當前區塊(例如,子區塊400)之圖像的圖像(例如,在相同層或視圖中或在基礎層或基礎視圖中之另一圖像)中。該時間同置型區塊可位於該另一圖像中之與子區塊400位於其圖像中之位置相同的位置中。舉例而言,若子區塊400位於第一圖像中,則時間同置型區塊位於第二圖像中。區塊T可指示存在時間運動向量預測子(TMVP)。
在一些實施例中,區塊T可係指同置型區塊,其中該同置型區塊位於在與包括子區塊400之圖像(例如,第一圖像)不同之層中的圖像(例如,第二圖像)中。在其他實施例中,區塊T可指同置型區塊,其中該同置型區塊位於在與包括子區塊400之圖像(例如,第一圖像)不同之視圖中的圖像(例如,第二圖像)中。
如圖4B中所說明,合併清單410可包括TMVP 415。可類似地導出AMVP之清單。TMVP 415為第二圖像中之時間同置型區塊的運動向量。在一些實施例中,清單(諸如,圖4B中所示之清單410)可包括另一層中或另一視圖中之同置型區塊的運動向量。
在一些情況下,視訊寫碼器(例如,編碼器或解碼器)可能需要判定第二圖像之某些資訊以使得視訊寫碼器可寫碼(例如,編碼或解碼)子區塊400。舉例而言,一旦視訊寫碼器判定第二圖像之此資訊,視訊寫碼器便可判定同置型區塊(該同置型區塊係在第二圖像中)之運動向量指向何處。在視訊寫碼器判定同置型區塊之運動向量指向何處之後,視訊寫碼器可基於同置型區塊之運動向量所指向之區塊來對子區塊400進行寫碼。因此,視訊寫碼器可使用一不同層或視圖中之其同置型區塊的運動資訊來對子區塊400進行寫碼。
針對第二圖像所判定之此資訊可為參考圖框(例如,圖像)索引。舉例而言,子區塊400可為PU。在當前HEVC測試模型中,自位於圖4A中之位置L處的左相鄰者PU之參考索引來導出TMVP候選者之參考 圖框索引(其亦被稱為參考索引)。若位於位置L處之左相鄰者PU的參考索引不可用(例如,PU為單向預測型或其為框內寫碼型),則將彼參考索引設定至零。
在當前HEVC測試模型中可存在潛在無效率。舉例而言,可能需要針對每一子區塊層級而產生合併候選者清單。僅為了說明之目的及理解之容易性,藉由CU中之PU之實例來描述技術。然而,此等技術適用於LCU、CU、PU、TU、一群LCU、一群CU、一群PU及一群TU或任何子區塊層級。
可針對CU中之每一PU而產生清單,因此亦可針對每一PU來導出同置型區塊(例如,時間圖像中之區塊、一不同視圖中之圖像中的區塊,或一不同層中之圖像中的區塊)之運動向量。判定同置型區塊之運動向量可為複雜的,因為此判定包括:定位參考圖框中之對應區塊(例如,同置型區塊);基於圖像次序計數(POC)距離來擴縮區塊之運動向量(MV);及導出參考圖框(例如,圖像)索引。
在一些實施例中,視訊寫碼器(例如,編碼器或解碼器)可每CU僅導出同置型區塊之運動向量資訊一次且將其用作CU中之所有PU的共同運動向量預測子候選者。在一些實施例中,自同置型區塊僅產生一個運動向量候選者且針對所有PU來共用該一個運動向量候選者可潛在地降低複雜性。
在一些實施例中,空間MV候選者位置可與在HEVC工作草案中之當前定義中所指定的空間MV候選者位置相同。換言之,CU中之每一PU可具有一組不同之空間MV候選者。然而,在一些實施例中,將單一同置型運動向量預測子候選者用於CU中之每一PU。術語「同置型運動向量預測子」意謂同置型區塊之運動向量,其形成用於預測當前區塊之運動向量的預測子。
圖5A至圖5I為說明針對不同分割模式之候選者位置之實例的方 塊圖。圖5A至圖5I可說明針對不同分割模式之單一同置型區塊候選者。又,雖然圖5A至圖5I中未予以具體說明,但該等技術亦可應用於AMP(非對稱運動分割)模式或其他區塊分割。又,在此等實例中,該等技術可應用於任何分割區組態(例如,任何大小及任何數目之分割區)。舉例而言,可將該等分割區視為分割單元或預測單元。
例如,在圖5A至圖5I之實例中,子區塊400(例如,展示於圖4A中)在第二圖像(例如,不同於含有子區塊400之圖像的圖像)中之同置型區塊的位置可為相同的而不管分割模式如何。此由區塊T加以說明,該區塊T位於圖5A至圖5I中之每一者中的相同位置中。又,在一些實例中,可基於由空間相鄰者L(例如,展示於圖4A中)之運動向量所參考的參考圖像來識別第二圖像。然而,本發明之態樣不限於此,且可使用空間相鄰之子區塊中的任一者來識別第二圖像。此外,可有可能傳信第二圖像之識別碼,該第二圖像再次可為時間圖像、另一層(例如,基礎層)中之圖像或另一視圖(例如,基礎視圖)中之圖像。
以此方式,視訊寫碼器可識別第二圖像。視訊寫碼器可接著識別第二圖像內之與第一圖像中之當前區塊同置的同置型區塊。視訊寫碼器可判定第二圖像內之同置型區塊的運動向量,且將彼運動向量指派為第一圖像之當前區塊內之所有子區塊的同置型運動向量預測子候選者。再次,「同置型運動向量預測子」意謂同置型區塊之運動向量,其形成用於預測當前區塊之運動向量的預測子。
舉例而言,圖5A至圖5I說明當前區塊(例如,CU)具有一個子區塊(例如,圖5A中之PU0)、兩個子區塊(例如,圖5B至圖5E中之PU0及PU1)或四個子區塊(例如,圖5F至圖5I中之PU0至PU3)。舉例而言,圖5A至圖5I之CU係在第一圖像中,如上文所論述。在一些實施例中,視訊寫碼器可針對圖5A至圖5I中所示之分割模式中之每一者而基於第二圖像中之同置型區塊來識別整個CU之同置型運動向量預測 子。視訊寫碼器可接著將此同置型運動向量預測子指派給PU中之每一者而不管分割情況(例如,分割區之大小及數目)如何。
在圖5A至圖5I中,根據本發明之一實施例,不管分割模式如何,同置型區塊之位置可始終為固定的。應理解,圖5A至圖5I中所示之位置僅為一個實例。在其他實施例中,可將與當前CU相鄰之其他位置用作用於判定同置型運動向量預測子的位置。在一些實施例中,具有單一同置型區塊位置而不管分割模式如何的優點可為所有分割模式可共用相同模組用於導出同置型運動向量預測子(例如,同置型區塊之運動向量,其形成用於預測當前區塊之運動向量的預測子)。
在一些實施例中,單一同置型區塊之位置可基於分割模式而不同。舉例而言,對於一給定分割模式而言,可使用固定位置來導出待在CU中之所有PU之間共用的同置型運動向量預測子。然而,對於一不同分割模式而言,可將一不同之固定位置用於導出待在具有彼分割模式之CU中之所有PU之間共用的同置型運動向量預測子。
舉例而言,對於2N×2N模式而言,可使用圖5A中所示之同置型區塊之位置。然而,對於N×2N模式而言,可使用同置型區塊之不同位置,如圖6A及圖6B中所說明。圖6A及圖6B為說明不同分割單元之不同合併候選者位置之實例的方塊圖,且對於AMVP模式而言相同原理可適用。圖6A及圖6B可說明針對N×2N模式之PU0的單一同置型區塊位置。類似於圖5A至圖5I,圖6A及圖6B中所說明之同置型區塊的位置僅為一個實例。亦可將與當前CU相鄰之其他位置用作用於在此分割模式下判定同置型運動向量預測子(例如,同置型區塊之運動向量,其形成用於預測當前區塊之運動向量的預測子)的位置。
如上文所論述,在一些實施例中,同置型區塊之位置可基於分割模式。圖6C至圖6E為說明基於分割模式之不同合併候選者位置之實例的方塊圖,且對於AMVP模式而言相同原理可適用。如圖6C至圖 6E中所示,T區塊(例如,表示時間同置型區塊)之位置對於圖6C至圖6E之各種分割模式中之每一者而言係不同的。
如上文所論述,在一些實施例中,可傳信同置型區塊之位置。舉例而言,視訊編碼器可傳信同置型區塊之位置,且視訊解碼器可接收同置型區塊之位置。為傳信該位置,視訊編碼器可對該位置進行編碼,且為接收該位置,視訊解碼器可對經編碼信號進行解碼。可通常將此程序稱作視訊寫碼器對該位置進行寫碼(例如,視訊編碼器對信號進行編碼,且視訊解碼器對信號進行解碼)。可在CU標頭、切片標頭、圖像層級、序列參數集(SPS)、圖像參數集(PPS)或任何其他層級中傳信同置型區塊之位置。
本發明之技術亦可提供用以重設TMVP之參考索引的機制,但此等技術可適用於其中同置型區塊位於基礎層或基礎視圖中的實例。舉例而言,在當前HEVC測試模型(HM)中,對於兩個參考清單L0及L1而言,當前PU之TMVP參考索引係自其左相鄰者PU的參考索引導出。 在一些實例中,若其左相鄰者PU之參考索引不可用,則將TMVP之對應參考索引設定至0;否則,將TMVP之對應參考索引設定成等於其左相鄰者PU之參考索引。
在本發明中所描述之實例技術中,當導出當前PU之雙向預測型TMVP(例如,參考兩個圖像加以預測)的參考索引時,若其左相鄰者PU之一個參考清單(例如,L0)的參考索引不可用,則並不立即將TMVP之對應參考索引設定至0。實情為,檢查來自左相鄰者PU之另一清單(例如,L1)的參考索引可為有益之舉。若此參考索引可用,則視訊寫碼器可將彼參考索引值指派給當前清單(例如,L0)之TMVP參考索引。
一個可能之實施可為如下:
1.自左PU導出參考索引refIdx0refIdx1
2.若refIdx0不可用但refIdx1可用,則設定refIdx0=refIdx1,否則設定refIdx0=0
3.若refIdx1不可用但refIdx0可用,則設定refIdx1=refIdx0,否則設定refIdx1=0
在以上之實例中,將左相鄰者PU用於TMVP參考索引導出。然而,若將不同於左相鄰者PU之不同空間或時間位置用於TMVP參考索引導出,則本發明之技術亦適用於此狀況。
並行運動估計(PME)
在當前HEVC中,存在兩個運動向量候選者清單建構程序;一個為規則程序,且另一個為並行運動估計(PME)樣式程序。對於規則候選者清單建構程序而言,自候選者清單建構跳過不可用之運動向量(MV)候選者。舉例而言,若對應區塊不具有運動資訊(例如,經框內寫碼)或尚未加以寫碼,或運動資訊類似於或等於業已***至清單中之MV候選者(其亦稱為被修剪掉之MV候選者),則MV候選者可為不可用的。
將PME樣式候選者清單建構程序用於並行運動估計。舉例而言,可藉由傳信PME區域之大小來致能並行運動估計(PME),且若其為非零(例如,大小大於4×4),則針對位於如圖7上所示之PME區域700內部的區塊來應用PME樣式合併或AMVP候選者清單建構。
PME樣式候選者清單建構與規則候選者清單建構之間的差異使得不能將完全位於PME區域(例如,圖7中所示之PME區域700)內部之空間候選者用作候選者。僅可使用在PME區域外部之空間候選者。舉例而言,位於圖7之PME區域700之邊界處的區塊(例如,圖7中之CU「A」及「B」)可具有在PME區域700外部之空間候選者,如由位於圖7中之PME區域700外部的空間區塊AL、L、A及AR所說明。不共用PME區域700之邊界的區塊(例如,CU「C」)可僅具有時間運動向量 預測子(TMVP)候選者。若在所有空間及時間候選者已被添加之後仍未完成候選者清單(例如,該清單為空的或含有小於預定數目之候選者),則可將假造的MV候選者(例如,0,0向量)添加至候選者清單。
由於PME樣式候選者清單建構消除了PME區域內之任何候選者清單相依性,所以可針對任何特定PME區域來並行地完成運動估計。
舉例而言,對於諸如8×8 CU(其中MER(運動估計區域,例如,圖7中所示之區域700)被致能)之特定區塊大小而言,可應用單一候選者清單建構(例如,針對一CU或一群CU中之所有PU而產生空間候選者僅一次)。亦即,對於任何受影響之CU而言,針對CU內之所有PU而導出PU之空間候選者僅一次,且針對每一PU而僅導出TMVP。舉例而言,若CU為8×8且其係在2N×N分割的情況下被寫碼,則導出PU1及PU2之空間候選者一次(如同對於CU 8×8 2N×2N之情況),且針對每一PU而僅導出TMVP。
基礎層運動向量
在HEVC擴縮中,可將基礎層運動向量(BL MV)用作合併模式或AMVP模式之候選者。然而,當將BL MV包括至候選者清單中且藉由運動估計區域(MER)來致能單一候選者清單產生(例如,針對一CU或一群CU中之所有PU而僅產生空間候選者一次)時,需要定義添加彼等BL MV之方法。
本文中所揭示之實施例適用於諸如SVC、MVC或3DV之HEVC擴縮。在一些實施例中,除空間及時間候選者之外,亦可將來自基礎層/視圖之運動場用於對增強層/視圖進行寫碼(例如,編碼或解碼)。對於SVC狀況而言,可根據空間縱橫比來按比例調整基礎層運動場,且假定在基礎層及增強層具有不同解析度的情況下應用按比例調整而描述實施例。對於3DV及MVC狀況而言,可以類似於SVC擴縮之方式的方式來應用基礎視圖差異運動向量。
為了說明之目的,針對SVC擴縮來描述實施例。然而,其他實施例包括3DV、MVC或其他擴縮,其中額外非空間及非時間運動場可用於當前圖像寫碼,且可以類似之方式將本文中所描述之技術應用於此等實施例。
在一個實施例中,揭示一種寫碼系統及一種方法,該方法包括定義在單一候選者清單建構被致能時產生及添加BL MV之行為。應瞭解,可在無MER(運動估計區域,例如,圖7之區域700)的情況下致能單一候選者清單建構。然而,在當前HEVC中,僅結合MER來致能單一清單建構。
圖8為根據本發明之一實施例之說明用於對視訊資訊進行寫碼之方法800的流程圖。可藉由編碼器(例如,如圖2中所示之視訊編碼器20)、解碼器(例如,如圖3中所示之視訊解碼器30)或任何其他組件來執行圖8中所說明之方法800。為了方便性,將方法800描述為藉由寫碼器來執行,該寫碼器可為編碼器、解碼器或另一組件。
方法800始於區塊805處。在區塊810處,寫碼器判定用於產生基礎層運動向量候選者之行為。該行為可指定基礎層運動向量候選者將如何經產生並被添加至候選者清單。舉例而言,可針對每一預測單元(PU)來指定此行為。在一些實施例中,可添加一個以上之BL MV。在區塊815中,寫碼器根據由該寫碼器所判定之行為針對一特定寫碼單元(CU)中之當前PU而產生基礎層運動向量候選者。舉例而言,該行為可指定應針對每一PU而產生BL MV候選者或針對特定CU而產生BL MV候選者僅一次。在區塊820中,將所產生之BL MV候選者添加至候選者清單。方法800在區塊825處結束。
如上文所簡短論述,對於單一候選者清單產生而言,BL MV(一個或多個)可以諸多不同方式經產生並被添加至候選者清單。在一個實施例中,針對每一PU而產生一或多個BL MV候選者,且針對特定 CU(例如,8×8)而產生空間候選者僅一次,且再次針對每一PU而導出TMVP。在另一實施例中,針對特定PU(例如,8×8)而產生一或多個BL MV候選者及空間候選者僅一次,且再次針對每一PU而導出TMVP。在又一實施例中,針對特定CU(例如,8×8)而產生一或多個BL MV候選者、空間候選者及TMVP僅一次。因此,根據本發明之實施例,定義了用於在單一候選者清單建構之狀況下當BL MV候選者經判定並被添加至候選者清單時用於處理該等BL MV候選者的方法。在一個實施例中,可將BL MV候選者處理為空間候選者、時間候選者或任何其他候選者。
然而,在某些實施例中,並非所有候選者可存在於候選者清單中。舉例而言,空間候選者及/或TMVP可為不可用的,此係因為對應區塊(及其相鄰區塊)係經框內寫碼。因此,上文所論述之候選者產生及導出經受了運動資訊之不可用性。
基礎層運動向量之其他使用 實例1:對於不可用之運動向量候選者而言,自來自基礎層之對應區塊導出運動資訊
舉例而言,對於在PME區域內部之區塊而言,空間候選者為不可用的。對於規則合併模式而言,若相鄰區塊係經框內寫碼,則候選者可能為不可用的。
代替此等不可用之空間候選者,可自基礎層同置型區塊來導出基礎層候選者,該等基礎層同置型區塊對應於增強層中之空間相鄰區塊的位置。舉例而言,代替左空間候選者,可使用位於基礎層中之同置型區塊的左候選者。
舉例而言,可調用與合併清單建構之單一層程序相同的程序,但僅代替使用增強層中之當前區塊的空間相鄰候選者,可使用同置型區塊之空間相鄰候選者。
或者,可使用不同於空間相鄰者之同置型區塊的位置以自基礎層導出運動資訊。一般而言,可將在同置型區塊內部或外部之任何子區塊用於基礎層運動資訊產生。舉例而言,可使用同置型區塊之任何中心子區塊或任何轉角子區塊。在另一實例中,可使用在同置型(類似於TMVP產生)區塊外部之右下子區塊。
可僅針對規則候選者清單建構抑或僅針對PME樣式候選者清單建構或針對兩種狀況來完成用基礎層運動候選者代替不可用之合併候選者。
實例2:用基礎層運動向量代替TMVP
除空間候選者代替之外(或作為空間候選者代替之替代方案),可用基礎層運動向量候選者來代替不可用之TMVP候選者。類似地,可使用任何子區塊,但為了統一目的,僅在同置型區塊外部之右下子區塊可被用於TMVP代替。
可僅針對規則候選者清單建構抑或僅針對PME樣式候選者清單建構或針對兩種狀況來完成用基礎層運動候選者代替不可用之TMVP候選者。
或者,即使當前TMVP可用,仍可僅針對PME樣式合併而用基礎層候選者(例如,以上實例中所提及之右下者)來代替TMVP。在另一實施例中,僅針對PME區域及針對完全在該區域內部(例如,無邊界共用)之區塊來完成此TMVP代替。由於對於此等區塊而言規則空間候選者不參與候選者清單建構,且若TMVP亦被代替,則可使用基礎層中之同置型區塊來執行完整之候選者清單建構。
實例3:補充運動向量候選者
對於B切片而言,若運動向量候選者為單向型,則可自基礎層導出另一方向。為了導出目的,可使用任何子區塊,但為了統一目的,可使用對應之同置型區塊。
舉例而言,當前區塊之空間左候選者可僅具有來自參考清單L0之單向MV。接著,可自同置型基礎層區塊之空間左候選者導出參考清單L1之運動向量,且該運動向量可補充當前運動向量候選者,從而使其為雙向型。其可改良效能,此係因為眾所周知,雙向運動補償要好於單向運動補償。
對於TMVP狀況而言,可將基礎層中之同置型區塊的右下子區塊用於MV導出。
可僅針對規則候選者清單建構抑或僅針對PME樣式候選者清單建構或針對兩種狀況來完成補充運動向量候選者。
圖9為說明用於對視訊資訊進行寫碼之方法900的流程圖。可藉由編碼器(例如,如圖2中所示之視訊編碼器20)、解碼器(例如,如圖3中所示之視訊解碼器30)或任何其他組件來執行圖9中所說明之步驟。為了方便性,將該等步驟描述為藉由寫碼器來執行,該寫碼器可為編碼器、解碼器或另一組件。
方法900始於區塊905處。在區塊910中,寫碼器判定是否應導出基礎層運動向量候選者。舉例而言,如上文所論述,可基於相鄰區塊之運動資訊是否不可用(例如,由於PME區域緣故或因為相鄰區塊為框內寫碼型)而做出此判定。在另一實例中,當將用基礎層運動向量候選者來代替TMVP時,可基於當前區塊在PME區域內之位置(例如,區塊是否完全在PME區域內而使得其不與PME之邊界共用任何邊界)來做出判定。若判定不應導出基礎層運動向量候選者,則方法900在區塊925處結束。若判定應導出基礎層運動向量候選者,則寫碼器自對應之基礎層區塊導出基礎層運動向量候選者,如在圖9之區塊915中所示。舉例而言,對應區塊可為基礎層中之同置型區塊或基礎層中之同置型區塊的相鄰區塊。在區塊920中,寫碼器將基礎層運動向量候選者添加至候選者清單以用於對增強層(或相依性視圖)中之區塊進行 寫碼。方法900在區塊925處結束。
導出一群區塊之基礎層資訊
如本發明中所論述,可將來自SVC中之基礎層或3DV/MVC中之基礎視圖的語法資訊用於對增強層進行寫碼(對於SVC而言)或用於對另一視圖進行寫碼(對於3DV/MVC而言)。舉例而言,可將運動資訊(諸如,來自基礎層或基礎視圖之運動向量及參考索引)用作合併/AMVP模式中之運動向量候選者。在另一實例中,可將來自基礎層或基礎視圖之框內模式用作增強層或另一視圖寫碼(例如,相依性視圖)中之最有可能模式或框內模式預測子。
舉例而言,此基礎層或基礎視圖資訊係自同置型區塊或對應區塊導出,因此每一區塊(不管多麼小)均需要此導出,該導出可為不必要地複雜。額外複雜性可與使用基礎層/視圖語法相關聯,此係因為不得不存取基礎層/視圖資訊。又,在可將一或多個運動向量用於對增強層或相依性視圖進行寫碼之前,該一或多個運動向量可能需要按比例調整。
本發明中所描述之技術可解決由使用基礎層/視圖語法資訊產生之額外複雜性。例如,以下為可解決上述問題之實例技術(例如,解決與使用基礎層/視圖資訊來預測增強層或相依性視圖中之區塊相關之複雜性的技術)。
在一個實施例中,可針對增強層或增強視圖(例如,相依性視圖)中之每區塊或每群區塊來導出基礎層/視圖資訊一次。在一些實施例中,增強層/視圖(例如,增強層或相依性視圖)中之區塊分割可藉由分割模式(如HEVC中之2N×2N、N×2N、2N×N、N×N或AMP)加以傳信,或可自基礎層/視圖分割區而被導出。
在一個實施例中,可針對某些區塊大小來限制基礎層/視圖語法導出。應理解,可單獨地或一同實施針對增強層/視圖中之一區塊或 一群區塊而自基礎層/視圖導出運動資訊一次的技術及針對某些區塊大小來限制基礎層/視圖語法導出的技術。換言之,以上實例技術並不互相排斥,且可有可能單獨實施以上兩個實例技術中之任一者或組合地實施該等技術。
因此,如上文所論述,諸如運動資訊或框內模式之資訊可自基礎層導出且可用於對增強層中之當前區塊(例如,預測單元)進行寫碼。在一些實施例中,可每寫碼單元(CU)而非針對每一預測單元(PU)來執行此導出一次。或者,可針對每群CU或最大寫碼單元(LCU)而導出基礎層/視圖語法資訊一次。
可至少在標頭(例如,SPS、PPS、切片)中之一者中將基礎層/視圖語法導出區域之大小作為高層級旗標來傳信。又,是否將針對每群區塊來導出基礎層/視圖資訊一次亦可在該等標頭中之至少一者中藉由另一高層級旗標予以傳信或可在諸如LCU/CU之區塊層級處予以傳信。例如,可在該等標頭中及/或在區塊層級處傳信指示將共用基礎層/視圖資訊之一群區塊的資訊。
可自基礎層/視圖中之同置型或對應區域之任何子區塊來導出用於增強層或另一視圖(例如,相依性視圖,有時被稱作增強視圖)中之一群區塊的基礎層/視圖語法。舉例而言,基礎層/視圖中之同置型或對應區域可為由增強層/相依性視圖中之該群區塊所涵蓋的區域之中心或轉角。替代地或另外,可在同置型或對應區域外部導出基礎層/視圖語法。
舉例而言,可自位於同置型CU外部之右下子區塊來導出基礎層運動資訊,或替代地或另外,可每CU自同置型CU之中心子區塊來導出基礎層運動資訊一次,且可將基礎層運動資訊用於增強層中之CU之每一PU。可應用類似方法來導出相依性視圖之基礎視圖運動資訊。可應用類似方法來導出框內模式或其他語法資訊。
舉例而言,若將一個以上基礎層語法元素用於當前增強層寫碼,則可達成複雜性之更大降低,且可針對用於當前相依性視圖寫碼之基礎視圖語法元素來達成類似之降低。舉例而言,在一些其他技術(例如,未必為根據本發明中所描述之技術的彼等技術)中,可針對增強層或相依性視圖中之PU而將多個基礎層/視圖運動資訊用作合併/AMVP模式中之運動候選者,因此不得不導出一個以上基礎層/視圖運動向量,且針對每一PU來完成此可為繁重的。根據本發明中所描述之技術,可針對增強層/相依性視圖中之每群區塊來導出此多個基礎層/視圖運動向量一次,例如,針對CU而非針對每一PU(例如,針對CU而非該CU內之每一PU)來導出此多個基礎層/視圖運動向量一次。
作為上文所論述之基礎層/視圖語法導出複雜性降低的額外或替代性實施例,可僅針對某一大小(例如,針對大於臨限值(例如,經預定或在需要時加以計算)之大小)之區塊(PU或CU)來導出基礎層/視圖語法資訊。在一個實施例中,若當前PU大於8×4或4×8,則針對彼區塊來導出基礎層/視圖運動資訊;否則,不將基礎層/視圖資訊用於增強層區塊/相依性視圖區塊以進行寫碼。
可將本文中所描述之一或多個想法(例如,基於僅針對某一大小之區塊來導出基礎層/視圖語法的技術)與針對一群區塊之基礎層/視圖語法導出的想法相組合。舉例而言,對於在臨限值以下之一些區塊而言,針對一群區塊來導出基礎層/視圖語法,且對於大於臨限正常值之區塊而言,可應用每區塊或每PU基礎層/視圖語法導出。或者,對於小於臨限值之區塊而言,無基礎層/視圖資訊可被用於對此等區塊進行寫碼,且對於大於臨限值之區塊而言,可每群區塊來導出基礎層/視圖資訊一次(例如,基於CU之導出)。
在以上之描述中將運動資訊及框內模式用作一實例。本發明中 所描述之技術適用於其他語法元素。又,該等技術可適用於SVC及3DV/MVC擴縮而無限制。
圖10為說明用於對視訊資訊進行寫碼之方法1000的流程圖。可藉由編碼器(例如,如圖2中所示之視訊編碼器20)、解碼器(例如,如圖3中所示之視訊解碼器30)或任何其他組件來執行圖10中所說明之方法1000。為了方便性,將方法1000描述為藉由寫碼器來執行,該寫碼器可為編碼器、解碼器或另一組件。
方法1000始於區塊1005處。在區塊1010中,寫碼器判定是否應自基礎層導出資訊。若寫碼器判定不應自基礎層導出資訊,則方法1000在區塊1025處結束。若寫碼器判定應自基礎層導出資訊,則在區塊1015中,寫碼器判定應如何自基礎層導出資訊。雖然分開地展示區塊1010及1015,但可將對是否將自基礎層導出資訊及如何自基礎層導出資訊的判定組合至單一判定中。寫碼器可基於當前正被寫碼之特定PU是否具有大於一預定臨限值之大小(例如,大於8×4或4×8)來做出此判定(或一系列判定)。舉例而言,若PU經判定為具有大於臨限值之大小,則可針對每一此PU自基礎層導出資訊。另一方面,若PU具有小於臨限值之大小,則可針對該PU而不自基礎層來導出資訊。在另一實例中,若PU具有小於臨限值之大小,則寫碼器可針對每一群區塊(例如,針對包括特定PU之每一CU)自基礎層導出資訊;否則,寫碼器可針對每一PU自基礎層導出資訊。在又一實例中,若PU具有小於臨限值之大小,則寫碼器可針對該特定PU而不自基礎層導出任何資訊;否則,寫碼器可針對每一群區塊自基礎層導出資訊(例如,針對包括特定PU之每一CU自基礎層導出資訊一次)。在一些實施例中,寫碼器可判定應針對每一子區塊、針對每一區塊或針對每一群區塊自基礎層導出資訊,或針對每一預測型子區塊/區塊不管其大小如何根本不自基礎層導出資訊。雖然在圖10之實例中正自基礎層導出資訊,但 可將任何其他層或視圖用於執行方法1000。如圖10之區塊1020中所示,一旦寫碼器判定應如何自基礎層導出資訊(例如,運動資訊或預測資訊),便根據此判定而自基礎層來導出資訊。方法1000在區塊1025處結束。
BL MV候選者與空間候選者之間的修剪
除上述方法之外,在一些實施例中,可應用BL MV候選者與空間候選者之間的修剪(例如,移除冗餘候選者)。在其他實施例中,可防止修剪被應用於BL MV候選者與空間候選者之間。
其他實施例
在一些實施例中,可自位於基礎層中之同置型區塊內部或外部的任何位置來導出BL MV。其可為中心區塊或任何轉角、在當前同置型區塊外部之右下區塊等等。在一些實施例中,可將BL MV(一個或多個)包括為清單中之第一候選者且在TMVP後面或在候選者清單中之任何位置處。在一些實施例中,BL MV導出可包括自基礎層/視圖中之對應同置型區塊導出運動向量或參考索引。
可使用多種不同技藝及技術中之任一者來表示本文中所揭示之資訊及信號。舉例而言,可由電壓、電流、電磁波、磁場或磁粒子、光場或光粒子或其任何組合來表示可貫穿以上描述所引用之資料、指令、命令、資訊、信號、位元、符號及碼片。
結合本文中所揭示之實施例而描述之各種說明性邏輯區塊、模組、電路及演算法步驟可經實施為電子硬體、電腦軟體或兩者之組合。為了清楚地說明硬體與軟體之此可互換性,上文已大體在功能性方面描述了各種說明性組件、區塊、模組、電路及步驟。此功能性係實施為硬體或是軟體取決於特定應用及強加於整個系統之設計約束。熟習此項技術者可針對每一特定應用而以變化之方式來實施所描述之功能性,但此等實施決策不應解釋為導致背離本發明之範疇。
可將本文中所描述之技術實施於硬體、軟體、韌體或其任何組合中。可將此等技術實施於諸如以下各者之多種裝置中之任一者中:通用電腦、無線通信裝置手機或具有多種用途(包括在無線通信裝置手機及其他裝置中之應用)之積體電路裝置。可將被描述為模組或組件之任何特徵一同實施於整合之邏輯裝置中或單獨實施為離散但可互操作之邏輯裝置。若實施於軟體中,則可至少部分地藉由電腦可讀資料儲存媒體來實現該等技術,該電腦可讀資料儲存媒體包含包括指令之程式碼,該程式碼在加以執行時執行上文所描述之方法中之一或多者。電腦可讀資料儲存媒體可形成電腦程式產品之部分,該電腦程式產品可包括封裝材料。電腦可讀媒體可包含記憶體或資料儲存媒體,諸如隨機存取記憶體(RAM)(諸如同步動態隨機存取記憶體(SDRAM))、唯讀記憶體(ROM)、非揮發性隨機存取記憶體(NVRAM)、電可抹除可程式化唯讀記憶體(EEPROM)、FLASH記憶體、磁性或光學資料儲存媒體,及其類似者。替代地或另外,可至少部分地藉由電腦可讀通信媒體來實現該等技術,該電腦可讀通信媒體攜載或傳達呈指令或資料結構之形式且可由電腦存取、讀取及/或執行之程式碼(諸如,所傳播之信號或波)。
程式碼可由處理器執行,該處理器可包括一或多個處理器,諸如一或多個數位信號處理器(DSP)、通用微處理器、特殊應用積體電路(ASIC)、場可程式化邏輯陣列(FPGA),或其他等效之整合或離散邏輯電路。此處理器可經組態以執行本發明中所描述之技術中之任一者。通用處理器可為微處理器;但在替代例中,處理器可為任何習知之處理器、控制器、微控制器或狀態機。亦可將處理器實施為計算裝置之組合,例如DSP與微處理器之組合、複數個微處理器、結合DSP核心之一或多個微處理器,或任何其他此組態。因此,如本文中所使用,術語「處理器」可係指上述結構中之任一者、上述結構之任一組 合,或適合於實施本文中所描述之技術之任何其他結構或設備。另外,在一些態樣中,可將本文中所描述之功能性提供於經組態用於編碼及解碼之專用軟體模組或硬體模組內或併入於組合式視訊編碼器-解碼器(CODEC)中。又,可將該等技術充分地實施於一或多個電路或邏輯元件中。
可將本發明之技術實施於廣泛多種裝置或設備中,該等裝置或設備包括無線手機、一積體電路(IC)或一組IC(例如,晶片組)。本發明中描述了各種組件、模組或單元以強調經組態以執行所揭示之技術之裝置的功能態樣,但各種組件、模組或單元未必需要藉由不同硬體單元來實現。相反,如上文所描述,各種單元可經組合於編碼解碼器硬體單元中或藉由互操作之硬體單元之集合結合合適之軟體及/或韌體來提供,該等硬體單元包括如上文所描述之一或多個處理器。
已描述本發明之各種實施例。此等及其他實施例係在以下申請專利範圍之範疇內。

Claims (60)

  1. 一種經組態以對視訊資訊進行寫碼之設備,該設備包含:一記憶體,其經組態以儲存一候選者清單,該候選者清單包含至少一個基礎層運動向量候選者;及與該記憶體通信之一處理器,該處理器經組態以:判定用於產生該至少一個基礎層運動向量候選者之一行為;根據該所判定之行為而針對一特定寫碼單元(CU)中之一當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至該候選者清單。
  2. 如請求項1之設備,其中該設備包含一編碼器,且其中該處理器進一步經組態以使用該所儲存之候選者清單來對一視訊區塊進行編碼。
  3. 如請求項1之設備,其中該設備包含一解碼器,且其中該處理器進一步經組態以使用該所儲存之候選者清單來對一視訊區塊進行解碼。
  4. 如請求項1之設備,其中該設備包含選自由以下各者中之一或多者組成之一群組的一裝置:電腦、筆記型電腦、膝上型電腦、電腦、平板電腦、機上盒、電話手機、智慧型電話、智慧型板、電視、相機、顯示裝置、數位媒體播放器、視訊遊戲控制台,及車載電腦。
  5. 如請求項1之設備,其中該候選者清單進一步包括一空間候選者及一時間運動向量預測子(TMVP)。
  6. 如請求項5之設備,其中該至少一個基礎層運動向量候選者係針對每一PU而產生,該空間候選者針對該特定CU而僅產生一次,且該TMVP係針對每一PU而導出。
  7. 如請求項5之設備,其中該至少一個基礎層運動向量候選者針對該特定CU而僅產生一次,該空間候選者針對該特定CU而僅產生一次,且該TMVP係針對每一PU而導出。
  8. 如請求項5之設備,其中該至少一個基礎層運動向量候選者針對該特定CU而僅產生一次,該空間候選者針對該特定CU而僅產生一次,且該TMVP係針對該特定CU而僅導出一次。
  9. 如請求項1之設備,其中該候選者清單係一合併候選者清單。
  10. 如請求項1之設備,其中該候選者清單係一進階運動向量預測子(AMVP)候選者清單。
  11. 如請求項5之設備,其中修剪被應用於該至少一個基礎層運動向量候選者與該空間候選者之間。
  12. 如請求項5之設備,其中修剪在該至少一個基礎層運動向量候選者與該空間候選者之間被停用。
  13. 如請求項1之設備,其中該至少一個基礎層運動向量候選者作為一第一候選者而被添加於該候選者清單中。
  14. 如請求項5之設備,其中該至少一個基礎層運動向量候選者被添加在該TMVP後面。
  15. 如請求項1之設備,其中該至少一個基礎層運動向量候選者係自位於一基礎層中之一同置型區塊內部的一位置導出。
  16. 如請求項1之設備,其中該至少一個基礎層運動向量候選者係自位於一基礎層中之一同置型區塊外部的一位置導出。
  17. 如請求項1之設備,其中該至少一個基礎層運動向量候選者僅在該當前PU之一大小大於一預定臨限值的情況下才產生。
  18. 如請求項1之設備,其中當該當前PU之一大小小於一預定臨限值時,該至少一個基礎層運動向量候選者針對該特定CU而僅產生一次或針對包括該特定CU之一群CU而僅產生一次。
  19. 如請求項1之設備,其中該至少一個基礎層運動向量候選者僅在該當前PU之一或多個空間候選者經判定為不可用的情況下才產生。
  20. 如請求項1之設備,其中該至少一個基礎層運動向量候選者僅當(i)該當前PU之一時間運動向量預測子(TMVP)經判定為不可用或(ii)包括該當前PU之一並行運動估計(PME)區域被指定且該當前PU完全位於該PME區域內部時才產生。
  21. 一種對視訊資訊進行編碼之方法,該方法包含:儲存用於對該視訊資訊進行編碼之一候選者清單,該候選者清單包含至少一個基礎層運動向量候選者;判定用於產生該至少一個基礎層運動向量候選者之一行為;根據該所判定之行為而針對一特定寫碼單元(CU)中之一當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至該候選者清單。
  22. 如請求項21之方法,其進一步包含將一空間候選者及一時間運動向量預測子(TMVP)添加至該候選者清單。
  23. 如請求項22之方法,其進一步包含:針對每一PU而產生該至少一個基礎層運動向量候選者;針對該特定CU而產生該空間候選者僅一次;及針對每一PU而產生該TMVP。
  24. 如請求項22之方法,其進一步包含:針對該特定CU而產生該至少一個基礎層運動向量候選者僅一 次;針對該特定CU而產生該空間候選者僅一次;及針對每一PU而產生該TMVP。
  25. 如請求項22之方法,其進一步包含:針對該特定CU而產生該至少一個基礎層運動向量候選者僅一次;針對該特定CU而產生該空間候選者僅一次;及針對該特定CU而產生該TMVP僅一次。
  26. 如請求項21之方法,其中該候選者清單係一合併候選者清單。
  27. 如請求項21之方法,其中該候選者清單係一進階運動向量預測子(AMVP)候選者清單。
  28. 如請求項22之方法,其中修剪被應用於該至少一個基礎層運動向量候選者與該空間候選者之間。
  29. 如請求項22之方法,其中修剪在該至少一個基礎層運動向量候選者與該空間候選者之間被停用。
  30. 如請求項21之方法,其中該至少一個基礎層運動向量候選者作為一第一候選者而被添加於該候選者清單中。
  31. 如請求項22之方法,其中該至少一個基礎層運動向量候選者被添加在該TMVP後面。
  32. 如請求項21之方法,其中該至少一個基礎層運動向量候選者係自位於一基礎層中之一同置型區塊內部的一位置導出。
  33. 如請求項21之方法,其中該至少一個基礎層運動向量候選者係自位於一基礎層中之一同置型區塊外部的一位置導出。
  34. 如請求項21之方法,其進一步包含:僅在該當前PU之一大小大於一預定臨限值的情況下才產生該至少一個基礎層運動向量候選者。
  35. 如請求項21之方法,其進一步包含:當該當前PU之一大小小於一預定臨限值時,針對該特定CU而產生該至少一個基礎層運動向量候選者僅一次,或針對包括該特定CU之一群CU而產生該至少一個基礎層運動向量候選者僅一次。
  36. 如請求項21之方法,其進一步包含:僅在該當前PU之一或多個空間候選者經判定為不可用的情況下才產生該至少一個基礎層運動向量候選者。
  37. 如請求項21之方法,其進一步包含:僅當(i)該當前PU之一時間運動向量預測子(TMVP)經判定為不可用或(ii)包括該當前PU之一並行運動估計(PME)區域被指定且該當前PU完全位於該PME區域內部時才產生該至少一個基礎層運動向量候選者。
  38. 一種對視訊資訊進行解碼之方法,該方法包含:接收自一經編碼視訊位元串流所提取之語法元素,其中該等語法元素包含與包含至少一個基礎層運動向量候選者之一候選者清單相關聯的視訊資訊;判定用於產生該至少一個基礎層運動向量候選者之一行為;根據該所判定之行為而針對一特定寫碼單元(CU)中之一當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及用於將該至少一個基礎層運動向量候選者添加至該候選者清單的構件。
  39. 如請求項38之方法,其進一步包含將一空間候選者及一時間運動向量預測子(TMVP)添加至該候選者清單。
  40. 如請求項39之方法,其進一步包含:針對每一PU而產生該至少一個基礎層運動向量候選者;針對該特定CU而產生該空間候選者僅一次;及 針對每一PU而產生該TMVP。
  41. 如請求項39之方法,其進一步包含:針對該特定CU而產生該至少一個基礎層運動向量候選者僅一次;針對該特定CU而產生該空間候選者僅一次;及針對每一PU而產生該TMVP。
  42. 如請求項39之方法,其進一步包含:針對該特定CU而產生該至少一個基礎層運動向量候選者僅一次;針對該特定CU而產生該空間候選者僅一次;及針對該特定CU而產生該TMVP僅一次。
  43. 如請求項38之方法,其中該候選者清單係一合併候選者清單。
  44. 如請求項38之方法,其中該候選者清單係一進階運動向量預測子(AMVP)候選者清單。
  45. 如請求項39之方法,其中修剪被應用於該至少一個基礎層運動向量候選者與該空間候選者之間。
  46. 如請求項39之方法,其中修剪在該至少一個基礎層運動向量候選者與該空間候選者之間被停用。
  47. 如請求項38之方法,其中該至少一個基礎層運動向量候選者作為一第一候選者而被添加於該候選者清單中。
  48. 如請求項39之方法,其中該至少一個基礎層運動向量候選者被添加在該TMVP後面。
  49. 如請求項38之方法,其中該至少一個基礎層運動向量候選者係自位於一基礎層中之一同置型區塊內部的一位置導出。
  50. 如請求項38之方法,其中該至少一個基礎層運動向量候選者係自位於一基礎層中之一同置型區塊外部的一位置導出。
  51. 如請求項38之方法,其進一步包含:僅在該當前PU之一大小大於一預定臨限值的情況下才產生該至少一個基礎層運動向量候選者。
  52. 如請求項38之方法,其進一步包含:當該當前PU之一大小小於一預定臨限值時,針對該特定CU而產生該至少一個基礎層運動向量候選者僅一次,或針對包括該特定CU之一群CU而產生該至少一個基礎層運動向量候選者僅一次。
  53. 如請求項38之方法,其進一步包含:僅在該當前PU之一或多個空間候選者經判定為不可用的情況下才產生該至少一個基礎層運動向量候選者。
  54. 如請求項38之方法,其進一步包含:僅當(i)該當前PU之一時間運動向量預測子(TMVP)經判定為不可用或(ii)包括該當前PU之一並行運動估計(PME)區域被指定且該當前PU完全位於該PME區域內部時才產生該至少一個基礎層運動向量候選者。
  55. 一種包含程式碼之非暫時性電腦可讀媒體,該程式碼在執行時使一設備執行一程序,該程序包含:儲存一候選者清單,該候選者清單包含至少一個基礎層運動向量候選者;判定用於產生該至少一個基礎層運動向量候選者之一行為;根據該所判定之行為而針對一特定寫碼單元(CU)中之一當前預測單元(PU)而產生該至少一個基礎層運動向量候選者,該特定CU具有一或多個PU;及將該至少一個基礎層運動向量候選者添加至該候選者清單。
  56. 如請求項55之媒體,該程序進一步包含將一空間候選者及一時間運動向量預測子(TMVP)添加至該候選者清單。
  57. 如請求項56之媒體,該程序進一步包含: 針對該特定CU或針對每一PU而產生該至少一個基礎層運動向量候選者僅一次;針對該特定CU而產生該空間候選者僅一次;及針對該特定CU或針對每一PU而產生該TMVP僅一次。
  58. 一種經組態以對視訊資訊進行寫碼之視訊寫碼裝置,該視訊寫碼裝置包含:用於儲存一候選者清單的構件,該候選者清單包含至少一個基礎層運動向量候選者;用於判定用於產生該至少一個基礎層運動向量候選者之一行為的構件;用於根據該所判定之行為而針對一特定寫碼單元(CU)中之一當前預測單元(PU)而產生該至少一個基礎層運動向量候選者的構件,該特定CU具有一或多個PU;及用於將該至少一個基礎層運動向量候選者添加至該候選者清單的構件。
  59. 如請求項58之裝置,其進一步包含用於將一空間候選者及一時間運動向量預測子(TMVP)添加至該候選者清單的構件。
  60. 如請求項59之裝置,其進一步包含:用於針對該特定CU或針對每一PU而產生該至少一個基礎層運動向量候選者僅一次的構件;用於針對該特定CU而產生該空間候選者僅一次的構件;及用於針對該特定CU或針對每一PU而產生該TMVP僅一次的構件。
TW103100517A 2013-01-08 2014-01-07 用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法 TWI532369B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361750259P 2013-01-08 2013-01-08
US201361751784P 2013-01-11 2013-01-11
US201361754559P 2013-01-19 2013-01-19
US14/137,510 US9826244B2 (en) 2013-01-08 2013-12-20 Device and method for scalable coding of video information based on high efficiency video coding

Publications (2)

Publication Number Publication Date
TW201440502A true TW201440502A (zh) 2014-10-16
TWI532369B TWI532369B (zh) 2016-05-01

Family

ID=51060934

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103100517A TWI532369B (zh) 2013-01-08 2014-01-07 用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法

Country Status (7)

Country Link
US (1) US9826244B2 (zh)
EP (1) EP2944084A2 (zh)
JP (1) JP6293788B2 (zh)
KR (1) KR20150105372A (zh)
CN (1) CN105519116A (zh)
TW (1) TWI532369B (zh)
WO (1) WO2014109901A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI744660B (zh) * 2018-06-29 2021-11-01 大陸商北京字節跳動網絡技術有限公司 運動估計區域改進

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2488815C (en) * 2011-03-09 2018-03-28 Canon Kk Video decoding
CA2925183C (en) 2013-10-14 2020-03-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
EP3058736B1 (en) 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
KR102257269B1 (ko) 2013-10-14 2021-05-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐
JP6355744B2 (ja) 2014-01-03 2018-07-11 マイクロソフト テクノロジー ライセンシング,エルエルシー ビデオ及び画像符号化/デコーディングにおけるブロックベクトル予測
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
EP3158734A4 (en) 2014-06-19 2017-04-26 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes
CA2959682C (en) 2014-09-30 2022-12-06 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
CN104751779A (zh) * 2014-11-25 2015-07-01 上海和辉光电有限公司 显示装置、oled像素驱动电路及其驱动方法
WO2016197314A1 (en) 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
CN116567212A (zh) * 2016-08-11 2023-08-08 Lx 半导体科技有限公司 编码/解码设备以及发送图像数据的设备
JP6620079B2 (ja) * 2016-09-08 2019-12-11 株式会社ソニー・インタラクティブエンタテインメント 画像処理システム、画像処理方法およびコンピュータプログラム
CN118214853A (zh) * 2017-10-26 2024-06-18 英迪股份有限公司 用于基于非对称子块的图像编码/解码的方法及装置
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
CN111869214A (zh) * 2018-03-19 2020-10-30 高通股份有限公司 对高级时间运动矢量预测的改进
US10715812B2 (en) * 2018-07-13 2020-07-14 Tencent America LLC Method and apparatus for video coding
WO2020030183A1 (en) 2018-08-10 2020-02-13 Huawei Technologies Co., Ltd. Coding method, device, system with merge mode
WO2020035029A1 (en) * 2018-08-17 2020-02-20 Mediatek Inc. Method and apparatus of simplified sub-mode for video coding
EP3837841A4 (en) 2018-09-03 2021-10-20 Huawei Technologies Co., Ltd. CODIFICATION PROCESS, DEVICE AND SYSTEM WITH MERGING MODE
CN114205594B (zh) * 2018-09-14 2022-12-27 北京达佳互联信息技术有限公司 用于视频编码的方法和装置及用于视频解码的方法和装置
CN111093080B (zh) * 2018-10-24 2024-06-04 北京字节跳动网络技术有限公司 视频编码中的子块运动候选
JP7506063B2 (ja) * 2018-11-06 2024-06-25 インターデイジタル ヴィーシー ホールディングス インコーポレイテッド ビデオ符号化および復号のための複数のコーディングユニットの中でグループ化するパラメータ
CN112970258B (zh) * 2018-11-13 2023-08-18 北京字节跳动网络技术有限公司 用于子块预测块的多假设
KR20210089153A (ko) 2018-11-13 2021-07-15 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 화면 내 블록 복사를 위한 히스토리 기반 움직임 후보 리스트 구성
WO2020114404A1 (en) 2018-12-03 2020-06-11 Beijing Bytedance Network Technology Co., Ltd. Pruning method in different prediction mode
CN110832869B (zh) * 2019-01-02 2023-04-14 深圳市大疆创新科技有限公司 用于视频编码或解码的运动信息获取方法与装置
CN110084374A (zh) * 2019-04-24 2019-08-02 第四范式(北京)技术有限公司 构建基于pu学习的模型的方法、装置及预测方法、装置
CN114788274A (zh) * 2019-10-10 2022-07-22 北京达佳互联信息技术有限公司 利用三角分区的视频编解码方法和装置
JP7499854B2 (ja) * 2019-12-30 2024-06-14 鴻穎創新有限公司 ビデオデータをコーディングするデバイス及び方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100904442B1 (ko) * 2006-01-09 2009-06-24 엘지전자 주식회사 영상 신호의 레이어 간 예측 방법
CN101198064A (zh) * 2007-12-10 2008-06-11 武汉大学 一种分辨率分层技术中的运动矢量预测方法
JP4697275B2 (ja) * 2008-07-30 2011-06-08 ソニー株式会社 動きベクトル検出装置、動きベクトル検出方法及びプログラム
US8537200B2 (en) * 2009-10-23 2013-09-17 Qualcomm Incorporated Depth map generation techniques for conversion of 2D video data to 3D video data
CN102025995B (zh) * 2010-12-10 2012-10-31 浙江大学 一种可伸缩视频编码的空间增强层快速模式选择方法
CN107105281B (zh) * 2010-12-14 2019-11-12 M&K控股株式会社 用于解码运动画面的设备
US8737480B2 (en) * 2011-01-14 2014-05-27 Motorola Mobility Llc Joint spatial and temporal block merge mode for HEVC
US20140029672A1 (en) 2011-01-21 2014-01-30 Thomson Licensing Method of coding a sequence of images and corresponding reconstruction method
US9319716B2 (en) * 2011-01-27 2016-04-19 Qualcomm Incorporated Performing motion vector prediction for video coding
US9288501B2 (en) * 2011-03-08 2016-03-15 Qualcomm Incorporated Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
US9516379B2 (en) 2011-03-08 2016-12-06 Qualcomm Incorporated Buffer management in video codecs
US9143795B2 (en) * 2011-04-11 2015-09-22 Texas Instruments Incorporated Parallel motion estimation in video coding
US9247266B2 (en) * 2011-04-18 2016-01-26 Texas Instruments Incorporated Temporal motion data candidate derivation in video coding
CN106851319B (zh) 2011-06-10 2020-06-19 寰发股份有限公司 推导方法及推导装置
EP3057326A1 (en) * 2011-06-10 2016-08-17 MediaTek, Inc Method and apparatus of scalable video coding
WO2013009441A2 (en) * 2011-07-12 2013-01-17 Vidyo, Inc. Scalable video coding using multiple coding technologies
US10237565B2 (en) * 2011-08-01 2019-03-19 Qualcomm Incorporated Coding parameter sets for various dimensions in video coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI744660B (zh) * 2018-06-29 2021-11-01 大陸商北京字節跳動網絡技術有限公司 運動估計區域改進

Also Published As

Publication number Publication date
JP6293788B2 (ja) 2018-03-14
JP2016507966A (ja) 2016-03-10
US9826244B2 (en) 2017-11-21
EP2944084A2 (en) 2015-11-18
KR20150105372A (ko) 2015-09-16
CN105519116A (zh) 2016-04-20
US20140192883A1 (en) 2014-07-10
WO2014109901A3 (en) 2015-07-23
TWI532369B (zh) 2016-05-01
WO2014109901A2 (en) 2014-07-17

Similar Documents

Publication Publication Date Title
TWI532369B (zh) 用於基於高效率視訊寫碼之可擴縮寫碼視訊資訊之裝置及方法
US9560358B2 (en) Device and method for scalable coding of video information
JP6542239B2 (ja) ビデオ情報のスケーラブルコーディングのためのデバイスおよび方法
US9491458B2 (en) Scalable video coding prediction with non-causal information
KR102314587B1 (ko) 비디오 정보의 스케일러블 코딩을 위한 디바이스 및 방법
US9584808B2 (en) Device and method for scalable coding of video information
TWI535273B (zh) 經組態以寫碼視訊資訊之設備及視訊寫碼裝置、編碼及解碼視訊資訊之方法與非暫態電腦可讀媒體
TWI504239B (zh) 針對基於高效率視訊寫碼之可縮放寫碼之運動場升頻取樣
JP2018514985A (ja) ビデオデータを処理するためのデバイスおよび方法
US10194146B2 (en) Device and method for scalable coding of video information
JP2018511238A (ja) 高速レートひずみ最適量子化

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees