TWI733986B - 用以編碼和解碼視頻資料之方法、設備及系統 - Google Patents

用以編碼和解碼視頻資料之方法、設備及系統 Download PDF

Info

Publication number
TWI733986B
TWI733986B TW107105162A TW107105162A TWI733986B TW I733986 B TWI733986 B TW I733986B TW 107105162 A TW107105162 A TW 107105162A TW 107105162 A TW107105162 A TW 107105162A TW I733986 B TWI733986 B TW I733986B
Authority
TW
Taiwan
Prior art keywords
wavelet
mode
sub
bit planes
subband
Prior art date
Application number
TW107105162A
Other languages
English (en)
Other versions
TW201836353A (zh
Inventor
克里斯多福 羅斯沃恩
安德魯 多雷爾
Original Assignee
日商佳能股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日商佳能股份有限公司 filed Critical 日商佳能股份有限公司
Publication of TW201836353A publication Critical patent/TW201836353A/zh
Application granted granted Critical
Publication of TWI733986B publication Critical patent/TWI733986B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一種從視頻位元流解碼視頻資料之範圍的一組最大已編碼線指標值之系統及方法,視頻資料之該範圍包括一或更多子頻帶。該方法包含:從該視頻位元流解碼各子頻帶之最大已編碼線指標預測模式;使用該子頻帶之該最大已編碼線指標預測模式以從該視頻位元流解碼各子頻帶之複數最大已編碼線指標差量值;及使用該子頻帶之該些複數最大已編碼線指標差量值和該最大已編碼線指標預測模式以產生各子頻帶之該最大已編碼線指標值。

Description

用以編碼和解碼視頻資料之方法、設備及系統
[0001] 本發明一般係有關於數位視頻信號處理,而特別是有關於用以編碼和解碼視頻資料之方法、設備及系統。本發明亦有關於一種電腦程式產品,包括電腦可讀取媒體,其上記錄有用以編碼和解碼視頻資料之電腦程式。
[0002] 目前存在許多針對視頻編碼之應用程式,包括用於視頻資料之傳輸及儲存的應用程式。許多視頻編碼標準已被開發,而其他則目前正在開發中。視頻壓縮研究之許多強調係指向「分佈編碼解碼器」,亦即,為了將壓縮視頻資料分佈至地理上散佈的觀眾之編碼解碼器。然而,新興的研究領域係指向「夾層(mezzanine)編碼解碼器」。夾層編碼解碼器被用於高度局部化的分佈(亦即,於廣播工作室內),且特徵在於超低潛時之需求(通常顯著地於一框之下),並大大地減少複雜度(針對編碼器和解碼器兩者),相較於傳統的視頻編碼解碼器。於標準化之國際組織/國際電工委員會聯合技術委員會1/子委員會29/工作群組1(ISO/IEC JTC1/SC29/WG1),亦已知為聯合照相專家群(JPEG),內之此編碼中的最近發展已導致稱為「JPEG XS」之標準化工作項目。JPEG XS之目標係用以產生一種編碼解碼器,其具有不超過32線視頻資料之端至端潛時、及用以實施於相對適度的實施科技(例如,來自諸如 Xilinx®等供應商之中距離FPGA)內之能力。JPEG XS之潛時需求係委託嚴格的速率控制技術之使用以確保已編碼資料不會相對於其攜載壓縮視頻資料之頻道的容量而過度地改變。   [0003] 於廣播工作室中,視頻可由相機所擷取在經歷數個變換前,包括即時編輯、圖形和重疊***以及將不同內容的來源混合入一最終輸出。一旦視頻已被足夠地處理,分佈編碼器便被用以編碼視頻資料以利最終分佈至終端消費者。於工作室內,視頻資料通常被傳送以未壓縮格式。傳送未壓縮視頻資料需要使用極高速鏈結。串列數位介面(SDI)協定之變體可傳送不同的視頻格式。例如,3G-SDI(以3Gbps電鏈結操作)可傳送1080p HDTV(1920×1080解析度)於30fps及每樣本8位元。具有固定位元率介面適於傳送具有恆定位元率(CBR)之資料。未壓縮視頻資料通常為CBR,而壓縮視頻資料(於超低潛時編碼之背景下)通常被預期亦為CBR。   [0004] 隨著位元率增加,可達成的佈纜長度減少,其針對透過工作室之纜線路由變為有問題的。例如,UHDTV(3840×2160)需要頻寬之4倍增加,相較於1080p HDTV,隱含12Gbps介面。增加單一電頻道之資料速率係減少了佈纜之可達成長度。於3 Gbps,纜線通常延伸不超過150m,針對工作室應用之最小可用長度。一種達成更高速率鏈結之方法係藉由複製佈纜(例如,藉由使用四條3G-SDI鏈結),利用框填磚或某其他多工方案。然而,佈纜複製方法增加了纜線路由複雜度(其需要更多實體空間),且可能減少可靠度(相較於使用單一纜線)。因此,產業上需要一種編碼解碼器,其可以相對低的壓縮比(例如,4:1)履行壓縮而同時留存「視覺上無損失」(亦即,相較於原始視頻資料不具有可察覺的加工)等級的性能。壓縮比亦可被表達為其提供給壓縮串之「每像素位元」(bpp)的數目,注意其轉換回至壓縮比需要未壓縮信號之位元深度、及色度格式的知識。例如,8b 4:4:4視頻資料佔有24bpp未壓縮,因此4bpp隱含6:1壓縮比。   [0005] 視頻資料包括一或更多顏色頻道。通常有一個主要顏色頻道及兩個次要顏色頻道。主要顏色頻道通常被稱為「亮度(luma)」頻道而次要顏色頻道通常被稱為「色度」頻道。視頻資料係使用顏色空間(諸如「YCbCr」或「RGB」)來表示。某些應用程式需要電腦圖形卡之輸出的視覺上無損失壓縮,或從平板中之系統單晶片(SOC)至平板中之LCD面板的傳輸。來自圖形卡或SOC之內容常具有不同的統計性質(來自從相機所擷取的內容),由於使用渲染構件、文字、圖像等等。相關的應用程式可被稱為「螢幕內容應用程式」。針對螢幕內容應用程式,「RGB」常被使用,因為「RGB」是通常被用以驅動LCD面板之格式。最大信號強度出現在「G」(綠)頻道,因此通常G頻道係使用主要顏色頻道來編碼,而餘留的頻道(亦即,「B」和「R」)係使用次要顏色頻道來編碼。該配置可被稱為「GBR」。當「YCbCr」顏色空間正使用中時,「Y」頻道係使用主要顏色頻道來編碼而「Cb」和「Cr」頻道係使用次要顏色頻道來編碼。   [0006] 視頻資料亦使用特定色度格式來表示。主要顏色頻道及次要顏色頻道被空間地取樣以相同的空間密度,當4:4:4色度格式正使用中時。針對螢幕內容,常用的色度格式為4:4:4,因為通常LCD面板係以4:4:4色度格式提供像素。位元深度係定義個別顏色頻道中之樣本的位元寬度,其係隱含可用樣本值之範圍。通常,所有顏色頻道係具有相同的位元深度,雖然顏色頻道可能替代地具有不同的位元深度。其他色度格式亦是可能的。例如,假如色度頻道被取樣以水平上的速率之一半(相較於亮度頻道),則4:2:2色度格式被認為是使用中。同時,假如色度頻道被取樣以水平上及垂直上的速率之一半(相較於亮度頻道),則4:2:0色度格式被認為是使用中。這些色度格式係利用人類視覺系統之特性,其對強度之敏感度係高於對顏色之敏感度。如此一來,減少顏色頻道之取樣而不造成過度的視覺影響是有可能的。然而,對於顏色頻道之取樣的減少較少應用於工作室環境,其中編碼和解碼之多重產生是常見的。同時,針對螢幕內容,除了4:4:4之外的色度格式之使用可能是有問題的,因為失真被引入至子像素渲染的(或「反別名的」)文字及尖銳物件邊緣。   [0007] 框資料亦可含有螢幕內容及相機擷取內容之混合。例如,電腦螢幕可包括各種視窗、圖像及控制按鈕、文字,且亦含有播放中的視頻、或觀看中的影像。該內容(就電腦螢幕之完整性而言)可被稱為「混合內容」。此外,內容之細節(或「紋理」)的位準係於框之內變化。通常,詳細紋理之區(例如,樹葉、文字)、或含有雜訊之區(例如,來自相機感應器)是難以壓縮的。詳細紋理僅可被編碼以低壓縮比而不損失細節。反之,具有少數細節(例如,平坦區、天空、來自電腦應用程式之背景)之區可被編碼以高壓縮比,具有極少的細節損失。   [0008] 就低複雜度而言,一種受歡迎的解決方式是應用「小波」變換,其被階層式地應用遍及一影像。小波變換被深入研究於JPEG2000影像編碼標準之背景下。跨越影像之小波變換應用係不同於區塊為基的編碼解碼器(諸如H.264/AVC),其係應用多種離散的餘弦變換(DCT)遍及各框之空間範圍。H.264/AVC中之各區塊係使用多種方法之一而被預測,達成高等級的局部調適性,以增加編碼器複雜度之代價(由於應做出模式決定之需求)。反之,小波變換被應用涵蓋寬廣的空間區域,而因此可用於區塊為基的編碼解碼器之預測模式通常是不可用的,導致在編碼器與解碼器之複雜度上顯著減少的差異。   [0009] 於小波為基的壓縮技術之背景下,達成遍及一含有多種類型的內容(混合的)之框的高視覺品質是有問題的。當需要嚴格的局部速率控制以滿足超低潛時需求時,達成遍及一具有混合內容之框的高視覺品質可能是特別有問題的。
[0010] 本發明之一目的係實質上克服(或至少改善)現存配置之一或更多缺點。   [0011] 本發明之一形態係提供一種從視頻位元流解碼視頻資料之範圍的一組最大已編碼線指標值之方法,視頻資料之該範圍包括一或更多子頻帶,該方法包含:從該視頻位元流解碼各子頻帶之最大已編碼線指標預測模式;使用該子頻帶之該最大已編碼線指標預測模式以從該視頻位元流解碼各子頻帶之複數最大已編碼線指標差量值;及使用該子頻帶之該些複數最大已編碼線指標差量值和該最大已編碼線指標預測模式以產生各子頻帶之該最大已編碼線指標值。   [0012] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0013] 本發明之另一形態係提供一種將視頻資料之範圍的一組最大已編碼線指標值編碼入視頻位元流之方法,視頻資料之該範圍包括一或更多子頻帶,該方法包含:將各子頻帶之最大已編碼線指標預測模式編碼入該視頻位元流;及使用該子頻帶之該最大已編碼線指標預測模式以將各子頻帶之複數最大已編碼線指標差量值編碼入該視頻位元流。   [0014] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0015] 本發明之另一形態係提供一種電腦可讀取媒體,其上儲存有程式,用以從視頻位元流解碼視頻資料之範圍的一組最大已編碼線指標值,視頻資料之該範圍包括一或更多子頻帶,該程式包含:用以從該視頻位元流解碼各子頻帶之最大已編碼線指標預測模式的碼;用以使用該子頻帶之該最大已編碼線指標預測模式以從該視頻位元流解碼各子頻帶之複數最大已編碼線指標差量值的碼;及用以使用該子頻帶之該些複數最大已編碼線指標差量值和該最大已編碼線指標預測模式以產生各子頻帶之該最大已編碼線指標值的碼。   [0016] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0017] 本發明之另一形態係提供一種電腦可讀取媒體,其上儲存有程式,用以將視頻資料之範圍的一組最大已編碼線指標值編碼入視頻位元流,視頻資料之該範圍包括一或更多子頻帶,該程式包含:用以將各子頻帶之最大已編碼線指標預測模式編碼入該視頻位元流的碼;及用以使用該子頻帶之該最大已編碼線指標預測模式以將各子頻帶之複數最大已編碼線指標差量值編碼入該視頻位元流的碼。   [0018] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0019] 本發明之另一形態係提供一種用以從視頻位元流解碼視頻資料之範圍的一組最大已編碼線指標值之系統,視頻資料之該範圍包括一或更多子頻帶,該系統包含:記憶體,用以儲存資料和電腦可讀取媒體;處理器,其係耦合至該記憶體以執行電腦程式,該程式具有指令以:從該視頻位元流解碼各子頻帶之最大已編碼線指標預測模式;使用該子頻帶之該最大已編碼線指標預測模式以從該視頻位元流解碼各子頻帶之複數最大已編碼線指標差量值;及使用該子頻帶之該些複數最大已編碼線指標差量值和該最大已編碼線指標預測模式以產生各子頻帶之該最大已編碼線指標值。   [0020] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0021] 本發明之另一形態係提供一種用以將視頻資料之範圍的一組最大已編碼線指標值編碼入視頻位元流之系統,視頻資料之該範圍包括一或更多子頻帶,該系統包含:記憶體,用以儲存資料和電腦可讀取媒體;處理器,其係耦合至該記憶體以執行電腦程式,該程式具有指令以:將各子頻帶之最大已編碼線指標預測模式編碼入該視頻位元流;及使用該子頻帶之該最大已編碼線指標預測模式以將各子頻帶之複數最大已編碼線指標差量值編碼入該視頻位元流。   [0022] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0023] 本發明之另一形態係提供一種解碼器,組態成:從視頻位元流接收視頻資料之範圍,視頻資料之該範圍包括一或更多子頻帶;從該視頻位元流解碼各子頻帶之最大已編碼線指標預測模式;使用該子頻帶之該最大已編碼線指標預測模式以從該視頻位元流解碼各子頻帶之複數最大已編碼線指標差量值;及使用該子頻帶之該些複數最大已編碼線指標差量值和該最大已編碼線指標預測模式以產生各子頻帶之該最大已編碼線指標值。   [0024] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0025] 本發明之另一形態係提供一種視頻編碼器,組態成:接收視頻資料之範圍,視頻資料之該範圍包括一或更多子頻帶;將各子頻帶之最大已編碼線指標預測模式編碼入該視頻位元流;及使用該子頻帶之該最大已編碼線指標預測模式以將各子頻帶之複數最大已編碼線指標差量值編碼入該視頻位元流。   [0026] 依據另一形態,各最大已編碼線指標值係表示該視頻位元流中所編碼的一群係數之中的最重要位元平面。   [0027] 本發明之另一形態提供一種用以從視頻位元流產生視頻資料之範圍的方法,視頻資料之該範圍包括一或更多子頻帶,該方法包含:從該視頻位元流解碼 (802)補償表,該補償表係定義一組非均勻量化補償,該組非均勻量化補償之各量化補償係應用於該視頻資料之一群子頻帶係數,其中該補償表被產生(706) 以減少其給予含有較大數值係數之該子頻帶的部分之子頻帶係數的精確度,相對於含有相對較低數值係數之該子頻帶的部分;從該視頻位元流碼值解碼一子頻帶之一群子頻帶係數,其係藉由應用該已解碼補償表以根據該群子頻帶係數之該量化補償來判定針對各係數應讀取的位元數 (804);及應用反小波變換於該已解碼群子頻帶係數以產生視頻資料之該範圍 (808)。   [0028] 於另一形態中,該補償表被應用於從固定階向下至第0階之子頻帶。   [0029] 於另一形態中,該補償表被侷限於使用零或一之補償值於該些量化補償之各者。   [0030] 於另一形態中,該補償表被儲存於該視頻位元流中而成為固定長度序列的位元,具有每補償一位元。   [0031] 於另一形態中,該補償表係藉由測試補償值並產生錯誤來產生。   [0032] 於另一形態中,該補償表之產生係相關於應用正補償,其中係存在已知含有高頻能量的內容之區。   [0033] 於另一形態中,該補償映圖產生對於其給予該範圍之整體位元率是敏感的。   [0034] 本發明之另一形態提供一種電腦可讀取媒體,其上儲存有程式,用以從視頻位元流產生視頻資料之範圍,視頻資料之該範圍包括一或更多子頻帶,該程式包含:用以從該視頻位元流解碼 (802)補償表的碼,該補償表係定義一組非均勻量化補償,該組非均勻量化補償之各量化補償係應用於該視頻資料之一群子頻帶係數,其中該補償表被產生(706) 以減少其給予含有較大數值係數之該子頻帶的部分之子頻帶係數的精確度,相對於含有相對較低數值係數之該子頻帶的部分;用以從該視頻位元流碼值解碼一子頻帶之一群子頻帶係數的碼,其係藉由應用該已解碼補償表以根據該群子頻帶係數之該量化補償來判定針對各係數應讀取的位元數 (804);及用以應用反小波變換於該已解碼群子頻帶係數以產生視頻資料之該範圍的碼 (808)。   [0035] 本發明之另一形態提供一種用以從視頻位元流產生視頻資料之範圍的系統,視頻資料之該範圍包括一或更多子頻帶,該系統包含:記憶體,用以儲存資料和電腦可讀取媒體;處理器,其係耦合至該記憶體以執行電腦程式,該程式具有指令以:從該視頻位元流解碼 (802)補償表,該補償表係定義一組非均勻量化補償,該組非均勻量化補償之各量化補償係應用於該視頻資料之一群子頻帶係數,其中該補償表被產生(706) 以減少其給予含有較大數值係數之該子頻帶的部分之子頻帶係數的精確度,相對於含有相對較低數值係數之該子頻帶的部分;從該視頻位元流解碼一子頻帶之一群子頻帶係數,其係藉由應用該已解碼補償表以根據該群子頻帶係數之該量化補償來判定針對各係數應讀取的位元數 (804);及應用反小波變換於該已解碼群子頻帶係數以產生視頻資料之該範圍 (808)。   [0036] 本發明之另一形態提供一種視頻解碼器,組態成:接收視頻位元流,其中該視頻位元流的視頻資料之範圍包括一或更多子頻帶;從該視頻位元流解碼 (802)補償表,該補償表係定義一組非均勻量化補償,該組非均勻量化補償之各量化補償係應用於該視頻資料之一群子頻帶係數,其中該補償表被產生(706) 以減少其給予含有較大數值係數之該子頻帶的部分之子頻帶係數的精確度,相對於含有相對較低數值係數之該子頻帶的部分;從該視頻位元流碼值解碼一子頻帶之一群子頻帶係數,其係藉由應用該已解碼補償表以根據該群子頻帶係數之該量化補償來判定針對各係數應讀取的位元數 (804);及應用反小波變換於該已解碼群子頻帶係數以產生視頻資料之該範圍 (808)。   [0037] 其他形態亦被揭露。
[0050] 於附圖之任何一或更多者中係參考其具有相同參考數字之步驟及/或特徵,那些步驟及/或特徵為了本說明書之目的而具有相同的功能或操作,除非出現相反的意圖。   [0051] 圖1為概略方塊圖,其顯示一種子框潛時視頻編碼及解碼系統100之功能模組。系統100可使用一種空間局部化係數編碼方式以增進整體視覺品質,藉由減少局部位元率消耗(其中此消耗是視覺上較不明顯的)。   [0052] 速率控制及緩衝器管理機制確保其沒有緩衝區欠載運行及所導致的無法遞送已解碼視頻發生(例如,由於針對進入視頻資料至視頻編碼器114之可能模式的編碼器搜尋之複雜度及所花費時間的變化),以致其來自視頻解碼器134之已解碼視頻框係依據一介面(於其上遞送視頻框)之時序而被遞送。視頻框所被遞送於其上之介面可為(例如)SDI。介面(諸如SDI)具有被同步化至時脈來源之樣本時序,具有水平及垂直遮沒週期。如此一來,已解碼視頻之樣本需依據SDI鏈結之框時序來遞送。針對透過SDI之傳輸而格式化的視頻資料亦可被運送透過乙太網路,例如,使用如SMPTE ST. 2022-6中所指明的方法。於其樣本未依據所需時序而被遞送的情況下,將導致可察覺的視覺加工(例如,來自其無效資料被下游裝置解讀為樣本值)。因此,速率控制機制確保其沒有緩衝區過載運行及所導致的無法處理進入視頻資料發生。類似的限制存在於進來的SDI鏈結至視頻編碼器114,其需依據到達時序以編碼樣本且無法推遲進入視頻資料至視頻編碼器114,例如,由於針對編碼框之不同區的變化處理需求。   [0053] 如上所述,視頻編碼及解碼系統100具有少於視頻資料之一框的潛時。特別地,某些應用程式要求不超過32線的視頻資料之潛時,從視頻編碼器114之輸入至視頻解碼器134之輸出。潛時可包括於視頻資料之輸入/輸出及部分編碼視頻資料之儲存期間所花費的時間,在透過通訊頻道之運送以前及以後。通常,視頻資料係以光柵掃描順序來傳輸及接收,例如,透過SDI鏈結。各框被劃分為「範圍」,各範圍通常為高度上兩條線的亮度樣本且具有等於該框之寬度的寬度。接著,一或更多範圍之速率平坦化窗被應用以設定目前範圍之目標速率。位元流被寫入至緩衝器,以致其針對一壓縮範圍之資料被組合於緩衝器中,在傳輸之前。   [0054] 系統100包括來源裝置110及目的地裝置130。通訊頻道120被用以傳遞已編碼視頻資訊從來源裝置110至目的地裝置130。於某些配置中,來源裝置110及目的地裝置130包含個別廣播工作室配備,諸如重疊***和即時編輯模組,於此情況下通訊頻道120可為SDI鏈結。典型地,通訊頻道120為「CBR」頻道。通訊頻道120因此賦予固定限制於可用頻寬。針對未壓縮視頻資料,通訊頻道120之頻寬僅被設為匹配該未壓縮視頻資料之頻寬。針對壓縮視頻資料,需求的頻寬通常係暫時地改變,隨著各範圍被允許改變其壓縮大小於由數個範圍之速率控制預看窗所設定的限制內。涵蓋許多範圍之平均後,固定大小必須被維持。缺乏速率控制預看窗之較低複雜度的實施方式係使用固定大小於各壓縮範圍的視頻資料。該些壓縮範圍的視頻資料係透過通訊頻道120而被運送。通訊頻道120可利用一種欲用以運送未壓縮資料之介面(諸如SDI或HDMI),即使於系統100中,壓縮資料被運送。   [0055] 於其他配置中,來源裝置110及目的地裝置130包含圖形驅動程式為系統單晶片(SOC)及LCD面板之部分(例如,如智慧型手機、平板或膝上型電腦中所發現者)。於SOC配置中,通訊頻道120通常是有線頻道,諸如PCB軌道作業及相關的連接器。此外,來源裝置110及目的地裝置130可包含寬廣範圍的裝置之任一者,包括透過以下各者而支援的裝置:空中電視廣播、有線電視應用程式、網際網路視頻應用程式以及其中已編碼視頻資料被擷取於某儲存媒體或檔案伺服器上之應用程式。來源裝置110亦可為數位相機,其係擷取視頻資料並以壓縮格式(其提供視覺上無損的壓縮)輸出該視頻資料,如此一來其性能可被視為等同於真實無損的格式(例如,未壓縮)。   [0056] 如圖1中所示,來源裝置110包括視頻來源112、視頻編碼器114及傳輸器116。視頻來源112通常包含未壓縮視頻資料113之來源。視頻來源112可為成像感應器、儲存在非暫態記錄媒體上之先前擷取的視頻序列、或饋送自遠端成像感應器之視頻,舉例而言。未壓縮視頻資料113係透過CBR頻道而從視頻來源112被傳輸至視頻編碼器114,以該視頻資料之遞送的固定時序。視頻資料通常被遞送以光柵掃描格式,利用發信以描繪於線(「水平同步」)與框(「垂直同步」)之間。視頻來源112亦可為電腦圖形卡之輸出,例如,顯示其執行於計算裝置(例如,平板電腦)上之作業系統及各種應用程式的視頻輸出。來自圖形卡之內容輸出為「螢幕內容」之範例。來源裝置110(其可包括成像感應器為視頻來源112)之範例包括智慧型手機、視頻攝影機及網路視頻相機。因為螢幕內容可包括平緩渲染的圖形及各個區中之自然內容的播放,所以螢幕內容亦常為「混合內容」之形式。視頻編碼器114係將未壓縮視頻資料113從視頻來源112轉換為已編碼視頻資料,如將參考圖3而進一步描述者。   [0057] 視頻編碼器114係編碼進入的未壓縮視頻資料113。視頻編碼器114必須即時地編碼進入視頻資料。亦即,視頻編碼器114無法推遲進入的未壓縮視頻資料113,假如(例如)處理該進入資料之速率將下降低於輸入資料速率的話。視頻編碼器114係以恆定位元率輸出壓縮視頻資料115(「位元流」)。於典型的視頻串流應用中,整個位元流未被儲存於任一位置中。取代地,該些範圍的壓縮視頻資料正持續地由視頻編碼器114所產生且由視頻解碼器134所消耗,利用中間儲存,例如,於(CBR)通訊頻道120中。CBR串流壓縮視頻資料係由傳輸器116透過通訊頻道120(例如,SDI鏈結)來傳輸。於其他配置中,壓縮視頻資料被儲存於非暫態儲存裝置122(諸如「快閃」記憶體或硬碟驅動)中,直到稍後透過通訊頻道120而被傳輸,或者替代其透過通訊頻道120之傳輸。   [0058] 目的地裝置130包括接收器132、視頻解碼器134及顯示裝置136。接收器132從通訊頻道120接收已編碼視頻資料並將已接收視頻資料133傳輸至視頻解碼器134。視頻解碼器134接著將已解碼框資料輸出至顯示裝置136。顯示裝置136之範例包括陰極射線管、液晶顯示(諸如智慧型手機中的)、平板電腦、電腦監視器或獨立型電視機。於其他配置中,來源裝置110及目的地裝置130之各者的功能被實施於單一裝置中。範例配置(其中裝置110及130之功能被實施於單一裝置上)包括行動電話手機和平板電腦、或者於廣播工作室(包括重疊***單元)內之設備。   [0059] 儘管以上所提之範例裝置,來源裝置110及目的地裝置130之各者可被組態於通用計算系統內,通常透過硬體與軟體組件之組合。圖2A闡明此一電腦系統200,其包括:電腦模組201;輸入裝置,諸如鍵盤202、滑鼠指針裝置203、掃描器226、相機227(其可被組態成視頻來源112)、及麥克風280;及輸出裝置,包括印表機215、顯示裝置214(其可被組態成顯示裝置136)、及揚聲器217。外部調變器-解調器(數據機)收發器裝置216可由電腦模組201所使用,以經由連接221而通訊至及自通訊網路220。通訊網路220(其可代表通訊頻道120)可為廣域網路(WAN)(諸如網際網路)、胞狀電信網路、或私人WAN。當連接221為電話線時,數據機216可為傳統的「撥接」數據機。替代地,當連接221為高容量(例如,電纜)連接時,則數據機216可為寬頻數據機。無線數據機亦可被用於無線連接至通訊網路220。收發器裝置216可提供傳輸器116及接收器132之功能,而通訊頻道120可被實施於連接221中。   [0060] 電腦模組201通常包括至少一處理器單元205、及記憶體單元206。例如,記憶體單元206可具有半導體隨機存取記憶體(RAM)及半導體唯讀記憶體(ROM)。電腦模組201亦包括數個輸入/輸出(I/O)介面,包括:音頻-視頻介面207,其係耦合至視頻顯示214、揚聲器217及麥克風280;I/O介面213,其係耦合至鍵盤202、滑鼠203、掃描器226、相機227及選擇性地搖桿或其他人類介面裝置(未顯示);以及用於外部數據機216和印表機215之介面208。從音頻-視頻介面207至電腦監視器214之信號通常為電腦圖形卡之輸出並提供「螢幕內容」之範例。於某些實施方式中,數據機216可被結合入電腦模組201內,例如於介面208內。電腦模組201亦具有局部網路介面211,其允許經由連接223之電腦系統200的耦合至局部區域通訊網路222,已知為區域網路(LAN)。如圖2A中所示,本地通訊網路222亦可經由連接224而耦合至廣域網路220,該連接224通常將包括所謂的「防火牆」裝置或類似功能的裝置。局部網路介面211可包含Ethernet™電路卡、 Bluetooth™無線配置或IEEE 802.11無線配置;然而,多種其他類型的介面可被實施於介面211。局部網路介面211亦可提供傳輸器116及接收器132之功能,而通訊頻道120可被實施於局部通訊網路222中。   [0061] I/O介面208及213可提供串列及平行連接之一者或兩者,前者通常係依據通用串列匯流排(USB)標準而被實施並具有相應的USB連接器(未顯示)。儲存裝置209被提供且通常包括硬碟驅動(HDD)210。諸如軟碟驅動及磁帶驅動(未顯示)等其他儲存裝置亦可被使用。光碟驅動212通常被提供以作用為資料之非揮發性來源。可攜式記憶體裝置(諸如光碟(例如,CD-ROM,DVD,Blu‑ray Disc™)、USB-RAM、可攜式、外部硬碟驅動、及軟碟,舉例而言)可被使用為針對電腦系統200之資料的適當來源。通常,HDD 210、光碟驅動212、網路220及222之任一者亦可被組態成操作為視頻來源112、或者為已解碼視頻資料之目的地以被儲存而供經由顯示214之再生。系統100之來源裝置110及目的地裝置130、或系統100之來源裝置110及目的地裝置130可被實施於電腦系統200中。   [0062] 電腦模組201之組件205至213通常係經由互連匯流排204來通訊,且係以一種方式,其導致相關技術中那些熟悉本領域人士所已知的電腦系統200之操作的傳統模式。例如,處理器205係使用連接218而被耦合至系統匯流排204。同樣地,記憶體206及光碟驅動212係藉由連接219而被耦合至系統匯流排204。所述配置可被實行於其上之電腦的範例包括IBM-PC及相容者、Sun SPARC站、Apple Mac™或類似的電腦系統。   [0063] 當適當或想要時,視頻編碼器114及視頻解碼器134(以及以下所述之方法)可使用電腦系統200而被實施,其中視頻編碼器114、視頻解碼器134以及將被描述之方法可被實施為一或更多可被執行於電腦系統200內之軟體應用程式233。特別地,視頻編碼器114、視頻解碼器134及所述方法之步驟係由軟體233(其被執行於電腦系統200內)中之指令231(參見圖2B)所實現。軟體指令231可被形成為一或更多碼模組,各用以履行一或更多特定工作。軟體亦可被劃分為兩個分離部分,其中第一部分及相應的碼模組係履行所述的方法而第二部分及相應的碼模組係管理介於第一部分與使用者之間的使用者介面。   [0064] 軟體可被儲存於電腦可讀取媒體中,包括以下所述之儲存裝置,舉例而言。軟體係從電腦可讀取媒體被載入電腦系統200,且接著由電腦系統200所執行。具有此軟體或電腦程式(其係記錄於電腦可讀取媒體上)之電腦可讀取媒體為一種電腦程式產品。電腦系統200中之電腦程式產品的使用最好是實現一種有利的設備,用以實施視頻編碼器114、視頻解碼器134及所述方法。   [0065] 軟體233通常被儲存於HDD 210或記憶體206中。軟體係從電腦可讀取媒體被載入電腦系統200,且由電腦系統200所執行。因此,例如,軟體233可被儲存於光學可讀取碟儲存媒體(例如,CD-ROM)225上,其係由光碟驅動212所讀取。   [0066] 於某些例子中,應用程式233可被供應至使用者,其係被編碼於一或更多CD-ROM 225上並經由相應的驅動212來讀取;或者替代地可由使用者從網路220或222所讀取。再者,軟體亦可從其他電腦可讀取媒體被載入電腦系統200。電腦可讀取儲存媒體係指稱任何非暫態有形儲存媒體,其係提供已記錄指令及/或資料至電腦系統200以供執行及/或處理。此儲存媒體之範例包括軟碟、磁帶、CD-ROM、DVD、Blu-ray Disc™、硬碟驅動、ROM或積體電路、USB記憶體、磁光碟、或電腦可讀取卡(諸如PCMCIA卡)等等,無論此類裝置係位於電腦模組201之內部或外部。暫態或非有形電腦可讀取傳輸媒體(其亦可參與軟體、應用程式、指令及/或視頻資料或已編碼視頻資料之提供至電腦模組401)的範例包括無線電或紅外線傳輸頻道以及網路連接至另一電腦或網連裝置、及網際網路或內部網路(包括記錄於網站上之e-mail傳輸和資訊,等等)。   [0067] 上述應用程式233之第二部分及相應的碼模組可被執行以實施一或更多圖形使用者介面(GUI)以被渲染或者表示於顯示214上。透過典型地鍵盤202及滑鼠203之調處,電腦系統200及應用程式之使用者可以一種功能上可調適的方式調處該介面來提供控制命令及/或輸入至其與GUI相關的應用程式。功能上可調適的使用者介面之其他形式亦可被實施,諸如音頻介面,其係利用經由揚聲器217而輸出之語音提示及經由麥克風280而輸入之使用者聲音命令。   [0068] 圖2B為處理器205及「記憶體」234之詳細的概略方塊圖。記憶體234代表所有記憶體模組(包括HDD 209及半導體記憶體206)之邏輯聚合,其可由圖2A中之電腦模組201所存取。   [0069] 當電腦模組201被初始地啟動時,開機自我測試(POST)程式250便執行。POST程式250通常被儲存於圖2A之半導體記憶體206的ROM 249中。儲存軟體之硬體裝置(諸如ROM 249)有時被稱為韌體。POST程式250係檢查電腦模組201內之硬體以確保適當的作用且通常係檢查處理器205、記憶體234(209、206)、及基本輸入輸出系統軟體(BIOS)模組251(通常亦儲存於ROM 249中)以利正確操作。一旦POST程式250已成功地運行,則BIOS 251便啟動圖2A之硬碟驅動210。硬碟驅動210之啟動造成自舉載入器程式252,其係駐存在硬碟驅動210上以經由處理器205而執行。如此便將作業系統253載入RAM記憶體206,作業系統253便於其上開始操作。作業系統253為系統階應用程式(可由處理器205所執行),用以完成各種高階功能,包括處理器管理、記憶體管理、裝置管理、儲存管理、軟體應用程式介面、及一般使用者介面。   [0070] 作業系統253係管理記憶體234(209、206)以確保其運行於電腦模組201上之各程序或應用程式具有足夠的記憶體,其中用以執行而不與其配置給其他程序之記憶體衝突。再者,可用於圖2A之電腦系統200中的不同類型的記憶體需被適當地使用以致其各程序可有效地運行。因此,聚合記憶體234不是想要闡明記憶體之特定片段如何被配置(除非另有聲明),而是提供可由電腦系統200所存取之記憶體以及其如何被使用的一般性視圖。   [0071] 如圖2B中所示,處理器205包括數個功能性模組,包括:控制單元239、算術邏輯單元(ALU)240、及本地或內部記憶體248(有時稱為快取記憶體)。快取記憶體248通常包括數個儲存暫存器244-246於暫存器區段中。一或更多內部匯流排241功能地互連這些功能模組。處理器205通常亦具有一或更多介面242,用以經由系統匯流排204而與外部裝置通訊,使用連接218。記憶體234係使用連接219而被耦合至匯流排204。   [0072] 應用程式233包括指令231之序列,其可包括條件式分支及迴路指令。程式233亦可包括資料232,其被用於程式233之執行。指令231及資料232被個別地儲存於記憶體位置228、229、230及235、236、237中。根據指令231及記憶體位置228-230之相對大小,特別指令可被儲存於單一記憶體位置(如由記憶體位置230中所示之指令所描述者)中。另一方面,指令可被分割為數個部分,其各者被儲存於分離的記憶體位置中,如由記憶體位置228及229中所示之指令片段所描述者。   [0073] 通常,處理器205被提供一組被執行於其中之指令。處理器205等待後續輸入,處理器205係藉由執行另一組指令而對該輸入做出反應。各輸入可被提供自數個來源之一或更多者,包括由輸入裝置202、203之一或更多者所產生的資料、從跨越網路220、202之一的外部來源所接收的資料、從儲存裝置206、209之一所擷取的資料或者從其***相應讀取器212之儲存媒體225所擷取的資料,均描述於圖2A中。一組指令之執行可(於某些情況下)導致資料之輸出。執行亦可涉及將資料或變數儲存至記憶體234。   [0074] 視頻編碼器114、視頻解碼器134及所述方法可使用輸入變數254,其被儲存於相應記憶體位置255、256、257中之記憶體234中。視頻編碼器114、視頻解碼器134及所述方法係產生輸出變數261,其被儲存於相應記憶體位置262、263、264中之記憶體234中。中間變數258可被儲存於記憶體位置259、260、266及267中。   [0075] 參考圖2B之處理器205,暫存器244、245、246、算術邏輯單元(ALU)240、及控制單元239係一起工作以履行微操作之序列,該些微操作是用以履行針對指令集(其組成程式233)中之每一指令的「提取、解碼、及執行」循環所需的。各提取、解碼、及執行循環包含:   (a)提取操作,其係從記憶體位置228、229、230提取或讀取指令231;   (b)解碼操作,其中控制單元239係判定哪個指令已被提取;及   (c)執行操作,其中控制單元239及/或ALU 240係執行該指令。   [0076] 之後,針對下一指令之進一步提取、解碼、及執行循環可被執行。類似地,儲存循環可被履行,控制單元239係藉由該儲存循環以將一值儲存或寫入至記憶體位置232。   [0077] 圖7及8之方法中的各步驟或子程序(將被描述)係與程式233之一或更多片段相關且通常係由處理器205中之暫存器區段244、245、247、ALU 240、及控制單元239所履行,處理器205中之該些單元係一起工作以履行針對程式233之所述片段的指令集中之每一指令的提取、解碼、及執行循環。   [0078] 圖3為概略方塊圖,其顯示視頻編碼器114之功能性模組。圖4為概略方塊圖,其顯示視頻解碼器134之功能性模組。視頻編碼器114及視頻解碼器134可使用通用電腦系統200(如圖2A及2B中所示者)來實施,其中各個功能性模組可藉由以下方式來實施:電腦系統200內之專屬硬體、電腦系統200內可執行之軟體,諸如其駐存在硬碟驅動205上且由處理器205於其執行時所控制的軟體應用程式233之一或更多軟體碼模組、或(替代地)電腦系統200內之專屬硬體與可執行之軟體的組合。視頻編碼器114、視頻解碼器134及所述方法可替代地被實施於專屬硬體中,諸如其履行所述方法之功能或子功能的一或更多積體電路。此專屬硬體可包括圖形處理器、數位信號處理器、特定應用積體電路(ASIC)、場可編程閘極陣列(FPGA)或者一或更多微處理器及相關記憶體。特別地,視頻編碼器114包含模組310、314、315、318、320、324、328及330;而視頻解碼器134包含模組410、414、418、422、426及430。視頻編碼器114及視頻解碼器134之模組的各者可各被實施為軟體應用程式233之一或更多軟體碼模組、或者FPGA「位元流檔」,其係組態FPGA中之內部邏輯區塊以實現視頻編碼器114及視頻解碼器134。   [0079] 雖然圖3之視頻編碼器114為低潛時視頻編碼器之範例,但其他視頻編碼解碼器亦可被使用以履行文中所述之處理級。視頻編碼器114係接收已擷取的框資料,諸如資料一連串的框,各框包括一或更多顏色頻道。   [0080] 參考圖3,變換模組310係從視頻來源112接收未壓縮視頻資料113並使用一組分析過濾器庫以履行階層小波前向變換。通常,5/3 Le Gall小波被使用,雖然其他小波變換可被使用,諸如Haar小波或Cohen-Daubechies-Feauveau 9/7小波。變換模組310係產生小波係數。小波係數係依據小波分解結構而被群集為子頻帶。變換模組310係輸出群集的小波係數312。小波分解結構係參考圖5A及5B而被進一步描述於下。   [0081] 由於超低潛時需求,垂直上分解的數個階被高度地限制,經常是不超過兩階(通常僅一階,因為兩階係減少速率控制預看可用的範圍之數目)。水平上,分解之階的數目是相對不受限的,通常係使用五階。考量一階垂直分解之情況,於各子頻帶內為一組係數,其被配置為高度上之一係數及寬度上之數個係數的陣列。係數之配置可被視為列表,相反於編碼解碼器中之典型使用(諸如JPEG2000),其中各子頻帶中之係數通常為方形陣列。各子頻帶內之係數的列表可接著被掃描。然而,首先群集操作被應用,亦即,各子頻帶被劃分為一組相等大小群組的係數以供熵編碼之目的。雖然各種群組大小可被使用,且群組大小無須橫跨所有子頻帶均為恆定的,但針對所有子頻帶之四的固定群組大小通常係提供接近於最佳性能(於多種測試資料之下)。因此,變換模組產生群集係數312。   [0082] 群集係數312被傳遞至最大編碼的線指標(GCLI)提取器模組314。群集係數312被編碼為一連串位元平面(或「線」),亦即,該群組內之各係數的位元「n」係由模組314所編碼為四個位元的單元。首先,含有一係數群組內之係數的最高最重要位元之位元平面的位元平面指標被判定。位元平面指標被稱為最大編碼線指標(GCLI)。集體地(亦即,橫跨所有係數群組及子頻帶),該些指標係形成最大編碼線指標(GCLI)316。GCLI 316被傳遞至GCLI預測模組315。預測模式319被模組315所選擇給GCLI,涵蓋該範圍中之所有子頻帶。於替代配置中,分離的GCLI預測模式可針對各子頻帶而被獨立地判定。於針對各子頻帶而判定GCLI預測模式之配置中,各子頻帶之GCLI預測模式被分離地通知於已編碼位元流115中。可用的預測模式包括水平、垂直及原始(無預測)。其他預測模式亦為可用的,包括「HSIG」及「VSIG」模式,藉此多輪的連續零值GCLI被送信。其他配置可使用橫跨子頻帶而操作之「Z樹」預測模式,致能從上述分解階之子頻帶的零值GCLI之存在來預測針對較低分解階之子頻帶的零值GCLI。假如分離的GCLI預測模式可用於各子頻帶,則GCLI預測模式搜尋被侷限以致其所有子頻帶均使用Z樹預測或者無任何子頻帶使用Z樹預測。   [0083] 根據GCLI預測,GCLI差量值317係由模組315所產生。預測模式319及GCLI差量值317被傳遞至熵編碼器模組318以利編碼入一已編碼位元流115。GCLI預測模組315亦產生GCLI編碼成本327。GCLI編碼成本係指示編碼GCLI差量值317之位元成本。子頻帶內之係數群組的表示為一組位元平面係參考圖5C而被進一步討論。   [0084] 群集係數312亦被輸入至補償導出器模組330。補償導出器模組330係導出補償表332。補償表332致能針對子頻帶內之係數群組的最小位元平面上之變化。子頻帶內之變化係容許特定組係數群組之減少的編碼成本,為此較低品質是可接受的。針對某些係數群組之編碼成本的減少係提供整體較大的速率給該範圍中之剩餘的係數群組。補償表332包括補償之列表,各補償係應用至係數群組在及低於特定的子頻帶階。補償表(亦稱為補償映圖)有效地定義一組補償,亦稱為量化補償。該些補償之各者係應用至一組子頻帶係數。量化補償通常是非均勻的。高於該特定子頻帶階之係數不被影響。較高的子頻帶階具有較低少係數,因此減少較高子頻帶階之係數的精確度對於節省位元率做出相對較少的貢獻,相較於減少在較低子頻帶階之係數的精確度。補償表332通常被應用橫跨整個範圍,以各補償應用至在特定子頻帶階之係數,及應用至在較低子頻帶階之係數(其在重疊過濾器支援之意義上被共同配置)。相關過濾器支援之重疊可被定義相關於真實過濾器支援,例如,針對5/3 Le Gall小波。替代地,即使5/3 Le Gall小波被使用,該重疊可被定義相關於Haar小波之較簡單的支援,達成具有實質上相同功效之減少的複雜度。   [0085] 速率控制模組320接收補償表332及GCLI編碼成本327,並判定針對該範圍之速率控制參數322。該範圍係依據範圍維度及每像素值之目標位元而被提供特定的位元預算。此外,針對該範圍之位元預算可使用涵蓋數個範圍之平坦化窗來判定。針對超低潛時操作,平坦化窗之大小被嚴格地限制(例如,利用垂直分解之一階),僅四個範圍可用於平坦化窗而同時滿足32線的視頻資料之端至端潛時。從GCLI預測模組315所接收的GCLI編碼成本327被扣除自該範圍位元預算,以餘留的位元預算可用於係數群組位元平面之編碼。接著,速率控制參數322被選擇以致其針對該範圍之位元預算的最大量被使用。速率控制參數322包括兩個參數─「情境」及「精鍊」參數。情境及精鍊參數均被用於群集係數312之量化。小波係數之截斷為一種機制,藉由此機制使得目標位元預算不被超過。「情境」係設定針對所有子頻帶之整體截斷點。橫跨所有子頻帶之總體截斷係提供粗略的機制。接著,速率控制之較精細粒度係由「精鍊」階所提供。精鍊階係指明數個子頻帶,針對該些子頻帶低於由「情境」所指示者的一位元亦被編碼。精鍊階係消耗如餘留位元預算般多,直到有不足的餘留位元預算給其值得被編碼之精鍊位元平面的額外子頻帶。   [0086] 以下資訊被包括於導出編碼成本中,當選擇情境及精鍊參數時。首先,針對一範圍之GCLI的編碼成本被判定,以餘留的預算可用於係數群組位元平面編碼。GCLI編碼成本係由情境參數選擇所影響,因為提升情境係導致未編碼位元平面之更高的「地板」(如參考圖5C而進一步描述者)。針對其中所有重要位元平面均低於該地板之係數群組,無位元平面被編碼。針對跳過係數群組之發信因此受到選定的情境所影響。接著,各係數群組之位元平面的成本被判定自:針對該係數群組之GCLI值及針對該係數群組之經修改的最大截斷線指標(GTLI)值,其中得自候選情境之GTLI係依據來自補償表332之相應補償而被調整。速率控制參數322被提供至量化器模組324及封裝器模組328,且被編碼入已編碼位元流115。   [0087] 量化器模組324係依據速率控制參數322(亦即,針對該子頻帶之情境及精鍊)及補償表332以將來自各群組之小波係數量化。針對一子頻帶中之係數的截斷點係由該情境及精鍊所設定,且被稱為「最大截斷線指標」(GTLI)。GTLI係藉由加入其選自補償表332之補償而被進一步修改。   [0088] 補償表332被應用以致其一補償係應用於橫跨多數子頻帶之小波係數(僅考量分解之水平方向)。補償映圖從固定階(例如第N階)被應用向下至第零階。例如,針對高於第N階之子頻帶階,無補償被應用;接著針對在第N階之子頻帶,一補償被應用於每係數群組;及針對第N階以下之子頻帶(例如在第M階),各補償係應用至2N-M 係數群組。例如,假如補償映圖被產生在第二階(於五階中),則一補償係應用至在第二階之一個係數群組而相同的補償係應用至在第零階之四個係數群組。在依據最終GTLI以截斷係數之前,捨入補償被應用以致其經截斷的係數值更接近於截斷前之值。通常,均勻捨入提供良好的性能於低複雜度。最後,量化器模組324輸出經截斷的係數群組326至封裝器模組328。   [0089] 熵編碼器模組318係接收並編碼GCLI差量317及GCLI預測模式319。用以預測GCLI值之數種模式為可用的,以選定的模式被應用至涵蓋該範圍內之所有子頻帶的所有係數群組。GCLI預測模式之範例包括水平預測(其中預測器是在子頻帶內之左邊相鄰係數群組)及垂直預測(其中預測器是上方相鄰係數群組,亦即,在來自上述範圍之相應子頻帶中的係數群組)。「原始」模式亦為可用的,其中針對各係數之GCLI值被編碼,而不使用預測器。因為係數群組之數目可從選定的小波分解及範圍維度得知,所以GCLI 316係使用GCLI差量之一連串一元編碼數值(且包括GCLI差量之符號的額外位元)而被編碼。所得組的編碼GCLI差量317係使用各值之一元碼及符號位元而被寫入至已編碼位元流115。   [0090] 封裝器模組328係封裝資料,包括將從各係數群組被編碼為已編碼位元流115之位元平面。針對各係數群組,從指示的GCLI向下至經修改的GTLI之位元平面被封裝入已編碼位元流115。針對其中經修改的GTLI已從速率控制參數322被增加超過如由該情境所指示的GTLI之情況,導致了針對係數位元平面資料之減少的編碼成本。速率控制模組320已將減少的編碼成本列入考量,並可能已選擇了用於精鍊之額外子頻帶、或者選擇了較高的情境,由於位元率節省。   [0091] 所得的已編碼位元流115係經由傳輸器116、通訊頻道120、及接收器132而被傳輸至視頻解碼器134以成為已接收位元流133。所得的已編碼位元流115亦可被儲存於非暫態儲存122中。非暫態儲存可存在,除了(或取代)通訊頻道120之外(或成為其部分)。   [0092] 參考圖4,熵解碼器模組410係接收該已接收位元流133。首先,框標頭係由模組410所解碼。框標頭係告知包括框維度及已編碼範圍大小之項目。從該框標頭,該些範圍被接著解碼。   [0093] 針對各範圍,情境及精鍊(如由速率控制模組320所判定者)被解碼自已接收位元流133。從情境及精鍊,該範圍之餘留的已編碼結構可被判定。此外,針對各範圍,補償提取器模組418係從已接收位元流133解碼或判定補償表420(相應於補償表332)。熵解碼模組410係解碼差量GCLI值412及GCLI預測模式413。差量GCLI值412及GCLI預測模式413被輸出至GCLI重建器模組414。GCLI重建器模組414係依據該範圍之GCLI預測模式413(如從已接收位元流133所獲得者)以重建GCLI值416。於其中各子頻帶具有獨立GCLI預測模式之配置中,分離的GCLI預測模式係針對各子頻帶而被解碼。接著,針對各係數群組,預測的GCLI係依據該子頻帶之GCLI預測模式而被判定,且GCLI差量被加入以重建該係數群組之GCLI值。   [0094] 使用GCLI值416及補償表420,解封裝器模組422係操作以將範圍中該些子頻帶之係數群組的位元平面提取為已解碼係數424。去量化器模組426係履行反量化於已解碼係數424上,以產生小波係數428。反量化操作涉及應用適當的反量化步驟以將已解碼係數轉換為小波係數(適於由合成小波過濾器庫所使用)。反量化步驟係依據該子頻帶之GTLI來判定,依據來自補償表420之相應補償而針對該子頻帶中之各係數群組來修改。以下之方程式[1]可被用於量化步驟大小之導出,利用包括來自補償表420之補償的「gtli」。因為來自補償表之補償係影響量化步驟大小,所以該補償亦可被稱為「量化補償」。
Figure 02_image001
[0095] 接著,反變換模組430將合成小波過濾器庫應用至小波係數428以產生已解碼視頻135。   [0096] 圖5A為概略方塊圖,其顯示針對視頻資料之一範圍500的小波子頻帶分解。圖5B為概略方塊圖,其顯示小波分析過濾器庫550。於圖5B中,針對一範圍之視頻樣本552被供應至一組小波分析過濾器,諸如過濾器553、554、556、558及560,其係相應於針對水平分解之第零至第五階。小波分析過濾器庫550中之各過濾器產生兩組係數,低通係數(「L」)及高通係數(「H」)。低通係數L被傳遞至過濾器庫550中之下一階(亦即,從第N階至第N+1階)。低通係數「L」被進一步分解為「H」及「L」組(在過濾器庫550之下一階),直到最後階(亦即,圖5B中之第四階),「H」及「L」係數兩者在該最後階被輸出。集體地,該些組係數被輸出為子頻帶係數570。圖5B顯示五階水平分解。因此,子頻帶係數570包括六個子頻帶。   [0097] 垂直分解之一階係加入係數之另兩個子頻帶,如圖5A中所示。各組係數係藉由其用以產生該組之過濾器的階來識別,且成為「H」或「L」,其形成不同的子頻帶。各顏色成分之樣本係使用分離的過濾器而被處理,將子頻帶數乘以三倍(假設其相同分解結構係橫跨所有顏色成分而被使用)。再者,雖然圖5B顯示小波解壓縮操作之一維度,但對於視頻資料之操作通常需要垂直地及水平地履行分解。接著,各子頻帶被識別為兩個字母序列,其係指示垂直及水平維度中之「H」及「L」組,接續以分解階。圖5A中之子頻帶配置502顯示針對視頻處理系統100中之視頻資料的範圍之子頻帶識別。子頻帶配置502顯示一階垂直分解及五階水平分解,導致針對顏色成分之八個子頻帶。因此,當使用4:4:4色度格式並應用子頻帶配置502於各顏色成分時,子頻帶之總數為24。如圖5A中所示,各子頻帶係依據其中所含有之係數的數目而被縮放,且該些子頻帶被顯示在一起,其係佔據一匹配該些提供至分析過濾器庫550(圖5B)之樣本的區域之空間區域。來自一階垂直分解之兩個所得子頻帶被顯示為「LH0」及「HH0」而來自五階水平分解之六個所得子頻帶被顯示為「HL0」、「HL1」、「HL2」、「HL3」、「HL4」、及「LL 4」。   [0098] 圖5C顯示用於位元流中之表示的子頻帶係數群集,具有固定截斷臨限值。子頻帶之一部分5100包括數個係數5102,其被配置入一連串群組,例如圖5C中之群組5104、5106及5108。該些群組之各者含有固定數目的係數,例如,四個係數。各係數之二元表示亦被顯示於所示之部分5100。針對部分5100之一組位元平面510亦被顯示。為了編碼各係數,GCLI值被導出。如圖5C中所見,群組5104、5106及5108含有個別地導致位元平面5、4及7中之重要位元(significant bits)的係數。於圖5C之範例中,水平預測方案被顯示,其導致差量GCLI值5120及5122,個別地為-1及+3。各群組中高於GCLI位元平面的位元平面僅含有零值(指示為位元5110)且不被編碼。位元5110被認為是不重要的且不被編碼。針對子頻帶內之係數群組,特定GTLI臨限值5114存在。GTLI臨限值5114為:應用至該範圍中之所有子頻帶的情境之結果、用以控制介於不同子頻帶間之位元的相對加權子頻帶寬階補償、及藉由將該子頻帶包括於「精鍊」通道中以編碼額外位元平面之可能性。   [0099] 精鍊通道係導致針對該些子頻帶之子集的GTLI臨限值5114之降低。該子集被導出自精鍊順序表,且該精鍊被應用至該精鍊順序表中之第一個零或更多項目。使用精鍊通道係容許速率控制之較精細的粒度,相較於情境選擇機制,而因此減少既定範圍中之未使用位元的量。再者,將來自補償表之補償應用於各係數群組係容許針對該子頻帶內之不同係數群組的GTLI臨限值5114之變化。如圖5C中所見,群組5108之GTLI臨限值被提升以一位元平面,相對於群組5104及5106之GTLI臨限值。針對所考量的係數群組之低於GTLI臨限值的係數位元平面(亦即,位元5116)是重要的(該些位元含有有用的資訊),但未被編碼而因此喪失。因此,僅有位元5112(由連續線所圍繞之群組5104、5106及5108的各者之位元)是重要的且編碼的。假定其視頻處理系統100無法留存所有重要位元(亦即,情境無法永遠指示位元0),則最好是配置其對於已解碼視頻資料(視頻資料135)之主觀品質產生較大貢獻的位元。GTLI臨限值5114有可能導致不具有重要位元平面的係數群組被編碼,其影響GCLI差量值,利用特殊處置於其中無任何位元平面針對係數群組被編碼的情況。因此,情境選擇具有對於GCLI編碼成本之影響。各子頻帶亦可具有獨立的子頻帶「增益」被應用。子頻帶增益之集合被已知為加權表。   [0100] 介於子頻帶間之GTLI臨限值的加權亦可被調整,具有兩個常見的加權定義為:「visual」及「psnr」。「psnr」加權係補償在各階小波分解上所見之增益的差異,其導致各係數具有一致的影響而因此使已解碼位元流之PSNR最大化。「visual」加權係提供較大的精確度給其被認為對於視頻品質產生較大貢獻的子頻帶,以其他子頻帶被認為視覺上較不重要為代價。使用加權方案之缺點是一致的應用橫跨整個子頻帶而因此一致的應用橫跨該範圍。具有子頻帶內精確度之GTLI補償映圖的判定提供了較高程度的調適性且減輕了不利的速率控制行為(當出現明確不同的小波係數統計資料於一範圍之子頻帶的不同部分中時)。   [0101] 增益表值(「gain[sb_idx]」)及精鍊表值(「priority[sb_idx]」)被考量。GTLI臨限值5114被判定如以下之方程式[2]中所示:   [0102] 於方程式[2]中,coeff_group_idx係識別所考量的子頻帶內之係數群組而map_offsets將係數群組指標轉換為補償表指標。在既定分解階(例如,第3階)上,map_offsets為1:1映射;接著,在較低的分解階(例如,第2階)上,map_offsets將每2係數群組指標映射至單一補償表指標,依此類推。接著,offset_table為補償表或映圖,如於圖7之步驟706中所判定且於圖8之步驟802中所解碼。針對較高階的分解(例如,第4階),則補償表不被使用且方程式[2]中之offset_table被忽略。map_offsets關係是藉由依據介於所考量的階與該補償表被產生於其上的階之間的分解階之差異以將係數群組指標位元移位來實施。因此,map_offsets關係不需要明確的查找表。此map_offsets關係允許圖7之步驟706中所產生的單一補償表被使用橫跨多階的小波分解。圖5D顯示針對已編碼範圍5202之位元流5200分解。已編碼範圍5202使用特定的排序及群集以編碼小波子頻道,如下。針對各顏色成分之水平分解子頻帶(亦即,LL4、HL4、HL3、HL1、及HL0)被群集入子封包5208,而針對各顏色成分之垂直分解子頻帶(亦即,LH0及HH0)被群集入子封包5210。子封包5208因此包括十八(18)個子頻帶之係數資料而子封包5210包括六(6)個子頻帶之係數資料。於已編碼範圍5202中配置子頻帶係數資料之其他方法亦為可能的。於各子封包(亦即,5208及5210)內,已編碼GCLI差量5214及係數資料5216係存在於所有相關子頻帶。   [0103] 已編碼範圍5202包括已編碼速率控制參數5204、已編碼補償表5206、及已編碼GCLI 5208。速率控制參數5204係定義針對該範圍中之子頻帶的情境及精鍊。速率控制參數5204(結合已編碼補償表5206)係容許針對該範圍之各子頻帶中的各係數群組之GTLI被判定。補償表5206允許GTLI於一子頻帶內的係數群組之間變化,導致針對特定係數群組之減少的編碼成本。接著,使用已編碼GCLI 5208,則針對該範圍中之各係數群組的已編碼位元平面之數目被判定、且被編碼為係數資料5210。因為速率控制參數5204、已編碼GCLI 5208及係數資料5210不太可能佔據整個已編碼範圍5202,所以未使用的資料部分5212通常亦存在。未使用的資料部分5212之大小係由於適當速率控制參數5204之選擇而被最小化,例如,藉由選擇可達成之用於精鍊的盡可能多子頻帶於已編碼範圍5202之大小的限制內。   [0104] 圖6顯示位元流之表示600。表示600顯示用於位元流中之表示的子頻帶係數群集,具有可變截斷臨限值。範例空間領域602係代表一框中之像素資料且包括某範例文字614及具有更精細細節616之某區,諸如某紋理視頻資料(例如,諸如玻璃或樹木等某自然內容)。因為更精細細節616不是平坦區(例如,無雲的天空,其具有內容中極平坦的變化且因此顯著地佔據低頻率或較高的子頻帶係數能量),所以於小波領域中有某些高頻率資訊值得保存以供維持高視覺品質在解碼器上。文字614包括大的係數數值橫跨小波領域中之多數子頻帶,而因此消耗其提供給所考量範圍之位元率的顯著部分。   [0105] 圖6顯示五個子頻帶,其為LL4 604、LH4 606、LH3 608、LH2 610及LH1 612。針對子頻帶604、606、608、610、及612之各者,顯示一具有標記之軸,該些標記將係數劃分為係數群組。針對子頻帶604、606、608、610、及612之各者,係數數值被顯示為遍及該子頻帶而改變之係數數值(為了說明性之目的,顯示一連續線,而事實上,各係數具有離散的數值及符號,且固定數目的係數係存在於各係數群組內)。各係數群組含有固定數目的係數,而介於針對小波分解之較高階(例如,針對子頻帶604、606)的標記之間的較寬間隔係反映其有較少的係數、且各係數具有較大的支援於空間領域602中,相較於小波分解之較低階(例如,針對子頻帶610、612)。針對各子頻帶,各係數群組之GCLI的臨限值被顯示,例如,針對子頻帶610之臨限值620。因為GCLI被設定於每係數群組,所以GCLI臨限值(例如,620)之改變僅發生在針對所考量子頻帶之係數群組邊界上(針對圖6中所示之各子頻帶604、606、608、610及612此為明顯的)。再者,針對各子頻帶,各係數群組之GCLI的臨限值被顯示,例如,針對子頻帶610之622。   [0106] 如圖6中所示,GTLI臨限值係遍及該子頻帶而改變。介於GCLI臨限值620與GTLI臨限值622之間的間隙係指示針對一子頻帶內之所考量係數群組的位元平面編碼成本及精確度。如圖6中所見,子頻帶610及612中之一連串係數群組係應用了正補償。該補償係符合其橫跨涵蓋所有子頻帶(空間上與文字614相對應)之係數的增加的小波係數能量。寬(增加的)頻譜能量係提升相關係數群組之GCLI,且具有橫跨該子頻帶之固定GTLI亦將因此提升針對該些係數群組之係數的量化水準。提升量化水準減少了高能量係數之精確度,導致編碼成本之隨後減少。編碼成本可被視覺化為介於GCLI臨限值620與GTLI臨限值622之間的間隙。由於應用補償表中之正補償所導致之子頻帶的部分之編碼成本的減少係容許速率控制模組320提供橫跨該子頻帶之精確度的整體增加(GTLI臨限值622之減少)。特別地,具有低能量之子頻帶的部分易具有較低的GTLI臨限值,導致在這些低能量部分中之增進的精確度。低能量部分是視覺上顯著的,因為低能量部分可能含有其否則將會遺失或污染的細節。   [0107] 因為針對整個範圍之編碼成本不得超過位元預算,所以當缺乏針對係數群組之提升的GTLI臨限值時,該些群組之其他係數的較不重要位元將被編碼而因此較少的精確度將被提供給其他係數。該精確度對於其他係數之視覺品質產生較大的貢獻。例如,必須使較少的子頻帶接受精鍊通道,其提升針對受影響的子頻帶之GTLI值。於某些例子中,選擇器較高的情境將是需要的,其提升針對所有子頻帶之GTLI臨限值。如其符合紋理細節616之係數中所示,提升針對一子頻帶(例如,子頻帶612)之GTLI臨限值將實質上減少已編碼係數之精確度,因為其符合細節616之係數數值是較小的,因此相應的GCLI是較低的,且位元平面之遺失具有視覺上相對較大的影響。於一子頻帶內之非一致GTLI補償表的應用可被視為平衡其遍及該子頻帶之係數的精確度。   [0108] 圖7為概略流程圖,其顯示一種編碼一子頻帶內之具有可變截斷補償的位元流之方法700。方法700可被實施為應用程式233之一或更多模組(諸如圖3之模組),其被儲存於記憶體206中且係藉由處理器205之執行來控制。   [0109] 方法700之執行係導致已編碼位元流115(圖1)具有係數之精確度的減少於其具有較高能量之子頻帶的部分中,而因此導致較嚴格的量化。精確度之減少係容許該子頻帶中(以及其他子頻帶中)之別處的係數之精確度的增加。方法700之執行係應用試探以判定補償表,用以調整針對子頻帶中之各係數群組的GTLI臨限值,在分解之既定階上。方法700係開始於小波分析變換步驟702。   [0110] 於小波分析變換步驟702上,變換模組310(於處理器205之控制下)係應用小波過濾器或小波變換(諸如5/3 Le Gall小波變換)至一範圍的視頻資料。針對超低潛時操作,該範圍被侷限於大小為兩條視頻線高度,以及框之全寬度。步驟702係執行以產生多組小波係數,其係依據小波分解而被群集入子頻帶,如參考圖5A及5B所述者。模組314係執行以判定GCLI(諸如GCLI 316)於步驟702,藉由判定針對各子頻帶之各係數群組的GCLI位元平面。處理器205中之控制接著將方法700傳遞至係數能量檢測步驟704。   [0111] 於係數能量檢測步驟704上,補償導出器模組330(於處理器205之控制下)產生範圍係數能量指示。範圍係數能量指示將該範圍空間地劃分為區段,通常為相等大小的。橫跨該範圍之區段計數可相應與在水平小波分解之特定階N上(例如,在5階分解之第2階上)的係數群組之數目。於各區段中,局部係數能量指示被導出。局部係數能量指示係藉由考量該範圍之數個子頻帶中的係數之數值而被導出,例如,從第N階向下至第0階。在第N階上,相應於該區段(例如,區段i)之單一係數群組的係數被考量。在第N-1階上,相應於區段2i至2i+1之係數群組的係數被考量;以及在第N-2階上,相應於區段4i至4i+3之係數群組的係數被考量,依此類推。因此,針對既定區段之能量指示係相關與總高頻能量(如由來自其空間上與該區段重疊的分解之較低階的小波係數之總和所指示者)。針對5/3 Le Gall小波之五個樣本的支援係暗示與區段之相鄰係數群組的某額外重疊,然而為了補償表產生之目的此無須被考量。   [0112] 所考量的子頻帶通常是在分解之較低階上,而因此具有其具有較小空間支援之係數。所考量的係數係擷取進入視頻資料113中之高頻能量(尖銳邊緣)。涵蓋多數子頻帶之高能量的集中係指示視頻資料113中之空間上尖銳邊緣,具有所得之相對高GCLI值。接著,涵蓋多數子頻帶之相對高能量的區段被標記為高能量區段。具有相對較低數值係數、或假能量(其橫跨多數子頻帶為較不明顯的)之區段被標記為低能量區段。將該範圍分類為高能量及低能量區段係致能了補償表之產生。處理器205中之控制接著使方法700前進至子頻帶內補償表產生步驟706。   [0113] 於子頻帶內補償表產生步驟706,補償導出器模組330(於處理器205之控制下)係執行以產生針對該範圍之補償表(諸如表332)。補償表係從該範圍之分類為高能量及低能量之區來產生,藉由將該分類平坦化為多輪或多組補償。來自步驟704之各區段係藉由應用臨限值而被首先分類為局部低能量或局部高能量。此第一分類係導致「雜訊」分類,由於其在顯著低能量群組的區段中之高能量區段的假檢測(反之亦然)是可能的。為了產生較平坦的分類,水平過濾器被應用。於應用水平過濾器時,針對各區段之分類係根據空間上相鄰區段之分類而被再評估(於水平方向上,因為該評估被侷限於操作以範圍接範圍為基的)。例如,大部分(5中之3)過濾器可被應用,大大地去除了分類時之假變遷。過濾器可被實施為五分接頭FIR過濾器(其具有,例如,一致的係數),接續以臨限值操作。大部分過濾器可用於高係數能量之區(具有間歇性中斷),例如具有介於字元間之某些間隔的文字。   [0114] 低能量之區段被接著指定零值補償而高能量之區被指定正整數補償。平坦化函數之應用可導致補償值被侷限於零與一之值,以致其間歇性高能量之區係接收一之補償值。此外,恆定高能量分類之區可接收二之補償值。例如,除了先前的過濾規則之外,5/5大部分過濾器可導致二之補償。步驟706係操作以產生補償表來減少其可提供至具有較大數值之係數的子頻帶之部分(相對於具有較低數值係數的子頻帶之部分)的精確度。GCLI預測模組315可執行為步驟706之部分以判定GCLI差量值。GCLI預測模組315選擇預測模式,用以預測各GCLI值。針對各係數群組,產生預測的GCLI,例如,自相鄰係數群組。接著,差量GCLI被編碼以產生所需的GCLI。處理器205中之控制接著使方法700前進至情境選擇步驟708。   [0115] 在情境選擇步驟708,速率控制模組320(於處理器205之控制下)選擇「情境」以供編碼該範圍。情境係設定一可應用於該範圍中之所有子頻帶的基本GTLI臨限值,以致該情境係指明針對其不會導致超過該範圍之位元預算的係數位元平面編碼之最低位元平面。步驟706之補償表的影響被列入考量以判定編碼成本。處理器205中之控制接著使方法700傳遞至精鍊選擇步驟710。   [0116] 在精鍊選擇步驟710,速率控制模組320(於處理器205之控制下)選擇「精鍊」以供編碼該範圍。精鍊為一整數,其指明一額外位元平面將針對多少子頻帶而被編碼。選擇最大精鍊,其不會導致超過在步驟708後餘留的位元預算。子頻帶之「優先權列表」係建立子頻帶將被考量(針對精鍊)之順序。針對既定精鍊值,優先權列表中之最前面的零或更多子頻帶被選擇以供精鍊。處理器205中之控制接著使方法700傳遞至係數量化步驟712。   [0117] 在係數量化步驟712,量化器模組324(於處理器205之控制下)係依據量化臨限值以量化係數群組312,以產生截斷的係數群組326。針對各子頻帶之量化臨限值被判定自情境及精鍊。應用至特定係數群組之量化臨限值係依據補償表中之相應項目而被進一步調整。因為低於量化臨限值之位元平面的截斷導致資料之損失,所以補償被應用以確保均勻分佈的捨入。其他補償亦為可能的,使用非均勻捨入以考量相對於有效量化器步驟大小(亦即,量化臨限值之二次方)之係數的統計分佈。處理器205中之控制接著使方法700傳遞至編碼補償表步驟714。   [0118] 在編碼補償表步驟714,熵編碼器模組318(於處理器205之控制下)將補償表編碼為已編碼位元流115。針對每範圍之固定數目的「n」區段(且補償表侷限於值零及一),補償表可被編碼為n位元之固定長度序列。因為補償表傾向於具有零或一之相對長的輪(或其他值,假如多於兩個補償被允許的話),所以針對補償表之輪長度編碼可被使用。輪長度編碼導致更簡潔的表示,雖然位元之所得字串將具有可變長度。處理器205中之控制接著使方法700傳遞至編碼重要位元平面步驟716。   [0119] 在編碼重要位元平面步驟716,封裝器模組328(於處理器205之控制下)將係數資料編碼為已編碼位元流115。針對各係數群組,從GCLI值向下至GTLI之位元平面(依據補償表中之相應項目而被修改)被編碼(或「封裝」)入已編碼位元流115。如此一來,涵蓋數個子頻帶且含有相對高能量(因此較大的GCLI值)之係數群組具有相對於所考量子頻帶中之其他係數群組而被截斷的最低位元平面之一或更多者。此額外截斷係導致那些係數群組(其被利用於步驟708及710中以選擇針對該範圍之整體較高的品質)之減少的編碼成本。換言之,位元已被配置遠離其中該些位元對於視覺品質產生相對較小貢獻之該範圍的部分並朝向其中該些位元對於整體視覺品質可產生相對較大貢獻之該範圍的其他部分。橫跨具有混合內容之框的視覺品質可因此被增進。方法700接著終止。   [0120] 圖8為概略流程圖,其顯示一種解碼一子頻帶內之具有可變截斷補償的位元流之方法800。方法800可被實施為應用程式233之一或更多模組(諸如圖4之模組),其被儲存於記憶體206中且係藉由處理器205之執行來控制。方法800係開始於解碼補償表步驟802。   [0121] 在解碼補償表步驟802,熵解碼器模組410、補償提取器模組418(於處理器205之控制下)將補償表解碼自已接收位元流133。補償表係依據圖7之步驟714的編碼方法而被解碼。補償表指明一組補償,用於設定針對所考量範圍之一或更多子頻帶中之各係數群組的GTLI臨限值之目的。該組補償(在圖7之步驟706所導出)係減少多組較高能量小波係數之編碼成本,其提供更多速率給該範圍中之別處的係數。因此,整體視頻品質被增進,相對於使用從針對該範圍之情境及精鍊值所得的恆定臨限值。處理器205中之控制接著使方法800傳遞至解碼係數群組步驟803。   [0122] 在解碼GCLI步驟803,熵解碼器模組410及GCLI重建器模組414(於處理器205之控制下)係從已接收位元流133解碼GCLI預測模式及GCLI差量以產生GCLI值416。處理器205中之控制接著使方法800前進至解碼係數群組步驟804。   [0123] 在解碼係數群組步驟804,解封裝器模組422(於處理器205之控制下)係從來自已接收位元流133之係數群組解碼(或「解封裝」)位元平面,以產生針對一係數群組之已解碼係數424。涵蓋從針對該係數群組之GCLI值向下至GTLI臨限值的位元平面(其係依據來自針對該係數群組之補償表的補償而被修改)被解封裝自該位元流。處理器205中之控制接著使方法800傳遞至係數去量化步驟806。   [0124] 在係數去量化步驟806,去量化器模組426(於處理器205之控制下)履行反量化於各係數群組內之係數上。反量化操作需要以反量化步驟大小來擴縮已解碼係數(如參考方程式[1]所述者)、依據子頻帶之GTLI值來導出、及依據來自補償表(相應於所考量的係數群組)之補償來調整。步驟804及806係一起操作以解碼針對來自位元流之一子頻帶的子頻帶係數之群組,藉由應用該補償表以根據子頻帶係數之該群組的補償來判定針對各係數應讀取之數個位元。處理器205中之控制接著使方法800傳遞至小波合成過濾器步驟808。   [0125] 在小波合成過濾器步驟808,反變換模組430(於處理器205之控制下)將小波係數428變換為已解碼視頻135,藉由應用小波合成過濾器庫,反轉其發生於小波分析過濾器庫中(亦即,於變換模組310中)之分解。步驟808係應用圖7之步驟702上所應用的小波前向變換之反變換。由於步驟808之執行,針對所考量範圍中之各像素的樣本被產生,且因此可用於從視頻解碼器134之輸出。方法800接著終止。   [0126] 視頻處理系統100之補償映圖係容許針對一子頻帶之最不重要已編碼位元平面的部分編碼。位元平面被部分地編碼在於其對於補償表中之非零補償的任何係數群組映射具有一或更多最不重要位元平面未被編碼(相對於其針對具有零之補償值的係數群組而被編碼的最不重要位元平面)。相較之下,JPEG2000影像編碼標準(雖然具有位元平面編碼)係剖析位元平面之整體,通常係使用如輪長度編碼或算術編碼等技術以達成壓縮。視頻處理系統100之低複雜度本質係排除了算術編碼之使用。再者,係數群組中之係數的群集係提供四位元之原子資料單元,促成高速的實施方式,例如,於FPGA中。   [0127] 方法700係描述一種用以導出相關於步驟706之補償表的試探方法,其容許低複雜度實施方式。針對其他應用(其中增加的編碼效率比低複雜度有更高的優先權),補償表可使用搜尋功能而被導出。於方法700之配置中,補償表係藉由逐步地測試特定補償值(例如,0和1)、並履行搜尋來產生。取代履行完整搜尋(其就複雜度而言將是禁止的),遍及該表之逐步搜尋可被利用。於使用逐步搜尋之配置中,隨著各補償被測試,合成小波被履行且錯誤被產生。將所產生的錯誤減至最少之補償被使用,且該搜尋前進至下一補償。   [0128] 此外,視頻來源112可藉由其描述不同內容類型的位置之元資料出現在何處之方法而被產生。例如,裝置可將文字重疊至其他內容上。文字區可被視為過度地消耗速率,其在重疊範圍中之別處是需要的。於方法700之配置中,係數能量檢測步驟704被補充以(或替換以)元資料之接收。接著,該補償表之產生係相關於應用正補償,其中係存在已知含有過度高頻能量的內容之區。其部分地或完全地與指定區重疊之小波係數可接收一之補償。另一方面,其部分地與指定區重疊之小波係數可接收一之補償,而其完全地與指定區重疊之小波係數可接收二之補償。   [0129] 於方法700之另一配置中,補償映圖導出(例如,步驟706)對於其提供給該範圍之整體位元率亦為敏感的(除了小波係數312之外)。於其中補償映圖產生對於提供給該範圍之整體位元率為敏感的配置中,針對高資料速率操作(例如,利用超過八BPP之每像素速率的位元),補償表被部分地偏移以利完全地朝向零補償。該些配置係減少小波係數之附加的截斷,當多餘的壓縮位元率可用於該位元流時。 產業可利用性 [0130] 所述之配置可應用於電腦及資料處理產業,而特別是針對低潛時(子框)視頻編碼系統之信號(諸如視頻信號)的編碼及解碼之數位信號處理產業。藉由應用子頻帶內之係數的可變量化,則可增進其橫跨具有混合內容之框的視覺品質。所述之方法可被用以增進低潛時系統中具有混合內容之框的視覺內容。   [0131] 以上僅描述本發明之某些實施例,並可進行修飾及/或改變而不背離本發明之範圍及精神,該些實施例為說明性且非限制性的。
[0132]100‧‧‧系統110‧‧‧來源裝置112‧‧‧視頻來源113‧‧‧未壓縮視頻資料114‧‧‧視頻編碼器115‧‧‧壓縮視頻資料116‧‧‧傳輸器120‧‧‧通訊頻道122‧‧‧儲存裝置130‧‧‧目的地裝置132‧‧‧接收器133‧‧‧已接收視頻資料134‧‧‧視頻解碼器135‧‧‧已解碼視頻136‧‧‧顯示裝置200‧‧‧電腦系統201‧‧‧電腦模組202‧‧‧鍵盤203‧‧‧滑鼠指針裝置204‧‧‧互連匯流排205‧‧‧處理器單元206‧‧‧記憶體單元207‧‧‧音頻-視頻介面208‧‧‧I/O介面209‧‧‧儲存裝置210‧‧‧硬碟驅動(HDD)211‧‧‧局部網路介面212‧‧‧光碟驅動213‧‧‧I/O介面214‧‧‧顯示裝置215‧‧‧印表機216‧‧‧外部調變器-解調器(數據機)收發器裝置217‧‧‧揚聲器218‧‧‧連接219‧‧‧連接220‧‧‧通訊網路221‧‧‧連接222‧‧‧局部區域通訊網路223‧‧‧連接224‧‧‧連接225‧‧‧光學可讀取碟儲存媒體(例如,CD-ROM)226‧‧‧掃描器227‧‧‧相機228,229,230,235,236,237‧‧‧記憶體位置231‧‧‧指令232‧‧‧資料233‧‧‧軟體應用程式234‧‧‧記憶體239‧‧‧控制單元240‧‧‧算術邏輯單元(ALU)241‧‧‧內部匯流排242‧‧‧介面244-246‧‧‧儲存暫存器247‧‧‧暫存器區段248‧‧‧記憶體249‧‧‧ROM250‧‧‧開機自我測試(POST)程式251‧‧‧基本輸入輸出系統軟體(BIOS)模組252‧‧‧自舉載入器程式253‧‧‧作業系統254‧‧‧輸入變數255,256,257‧‧‧記憶體位置258‧‧‧中間變數259,260‧‧‧記憶體位置261‧‧‧輸出變數262,263,264‧‧‧記憶體位置266,267‧‧‧記憶體位置280‧‧‧麥克風310‧‧‧變換模組312‧‧‧小波係數314‧‧‧最大編碼的線指標(GCLI)提取器模組315‧‧‧GCLI預測模組316‧‧‧最大編碼線指標(GCLI)317‧‧‧GCLI差量值318‧‧‧熵編碼器模組319‧‧‧預測模式320‧‧‧速率控制模組322‧‧‧速率控制參數324‧‧‧量化器模組326‧‧‧經截斷的係數群組327‧‧‧GCLI編碼成本328‧‧‧封裝器模組330‧‧‧補償導出器模組332‧‧‧補償表410‧‧‧熵解碼器模組412‧‧‧差量GCLI值413‧‧‧GCLI預測模式414‧‧‧GCLI重建器模組416‧‧‧GCLI值418‧‧‧補償提取器模組420‧‧‧補償表422‧‧‧解封裝器模組424‧‧‧已解碼係數426‧‧‧去量化器模組428‧‧‧小波係數430‧‧‧反變換模組500‧‧‧範圍502‧‧‧子頻帶配置550‧‧‧小波分析過濾器庫552‧‧‧視頻樣本553,554,556,558,560‧‧‧過濾器570‧‧‧子頻帶係數600‧‧‧表示602‧‧‧空間領域604,606,608,610,612‧‧‧子頻帶614‧‧‧範例文字616‧‧‧更精細細節620‧‧‧GCLI臨限值622‧‧‧GTLI臨限值5100‧‧‧部分5102‧‧‧係數5104,5106,5108‧‧‧群組5110‧‧‧位元5112‧‧‧位元5114‧‧‧GTLI臨限值5116‧‧‧位元5120,5122‧‧‧差量GCLI值5200‧‧‧位元流5202‧‧‧已編碼範圍5204‧‧‧已編碼速率控制參數5206‧‧‧已編碼補償表5208‧‧‧已編碼GCLI5210‧‧‧子封包5212‧‧‧未使用的資料部分5214‧‧‧已編碼GCLI差量5216‧‧‧係數資料
[0038] 現在將參考以下圖形及附錄來描述本發明之至少一實施例,其中:   [0039] 圖1為概略方塊圖,其顯示一種子框潛時視頻編碼及解碼系統;   [0040] 圖2A和2B係形成一種通用電腦系統之概略方塊圖,於該系統上可實現圖1之視頻編碼及解碼系統的一者或兩者;   [0041] 圖3為概略方塊圖,其顯示一種視頻編碼器之功能性模組;   [0042] 圖4為概略方塊圖,其顯示一種視頻解碼器之功能性模組;   [0043] 圖5A為概略方塊圖,其顯示針對一範圍之小波子頻帶分解;   [0044] 圖5B為概略方塊圖,其顯示小波分析過濾器庫;   [0045] 圖5C為概略方塊圖,其顯示用於位元流中之表示的子頻帶係數群集,具有固定截斷臨限值;   [0046] 圖5D為概略方塊圖,其顯示針對一範圍之位元流分解;   [0047] 圖6為概略方塊圖,其顯示用於位元流中之表示的子頻帶係數群集,具有可變截斷臨限值;   [0048] 圖7為概略方塊圖,其顯示一種編碼一子頻帶內之具有可變截斷補償的位元流之方法;   [0049] 圖8為概略方塊圖,其顯示一種解碼一子頻帶內之具有可變截斷補償的位元流之方法。

Claims (18)

  1. 一種用以從位元流產生影像框之影像解碼設備,該影像框係藉由劃分為複數小波子頻帶而被編碼入該位元流,該等複數小波子頻帶之各者包括多組小波係數,該影像解碼設備包含:解碼單元,組態成解碼用以從該位元流判定該小波子頻帶之模式的資訊,該模式被用以判定該等小波子頻帶之最重要位元平面,該模式係選自至少一使用垂直方向上之預測的第一模式及一不使用預測的第二模式;第一判定單元,組態成根據該資訊以判定該小波子頻帶之該模式;第二判定單元,組態成依據由該第一判定單元所判定的該小波子頻帶之該模式以判定該小波子頻帶中之該等多組小波係數的該等最重要位元平面;及產生單元,組態成藉由依據由該第二判定單元所判定之該等最重要位元平面以從該位元流解碼該等小波係數來產生該影像框,其中,在該第二判定單元依據該第一模式以判定該等最重要位元平面的情況下,該解碼單元係從該位元流解碼該小波子頻帶中之該等多組小波係數的該等最重要位元平面的預測之差量值,及該第二判定單元預測垂直方向上之該等最重要位元平面並依據該等預測的最重要位元平面及由該解碼單元所解 碼的該等差量值以判定該等最重要位元平面,及其中,該第一判定單元能夠根據該資訊來判定以小波子頻帶接小波子頻帶為基的該模式。
  2. 如申請專利範圍第1項之影像解碼設備,其中,該模式係選自該第一模式、該第二模式及一使用水平方向上之預測的第三模式。
  3. 如申請專利範圍第1項之影像解碼設備,其中,在該第二判定單元依據該第二模式以判定該等最重要位元平面的情況下,該解碼單元解碼其直接地指示該等最重要位元平面之資訊,及該第二判定單元依據其直接地指示該等最重要位元平面之該資訊以判定該等最重要位元平面。
  4. 如申請專利範圍第1項之影像解碼設備,其中,該等複數小波子頻帶之各者係個別地相應於該影像框之頻帶的各者。
  5. 一種用以將影像框編碼入位元流之影像編碼設備,該影像框係藉由劃分為複數小波子頻帶而被編碼入該位元流,該等複數小波子頻帶之各者包括多組小波係數,該影像編碼設備包含: 第一判定單元,組態成判定該小波子頻帶之模式,該模式被用以編碼該等小波子頻帶之最重要位元平面,且該模式係選自至少一使用垂直方向上之預測的第一模式及一不使用預測的第二模式;第二判定單元,組態成判定該小波子頻帶中之該等多組小波係數的該等最重要位元平面;及編碼單元,組態成藉由將用以指示該小波子頻帶之該模式的資訊編碼入該位元流來編碼該影像框,其中,該編碼單元係依據由該第一判定單元所判定的該模式及由該第二判定單元所判定的該等最重要位元平面來編碼該等小波係數,及其中,在該編碼單元依據該第一模式以編碼該等最重要位元平面的情況下,該編碼單元係將該小波子頻帶中之該等多組小波係數的該等最重要位元平面在垂直方向上的預測之差量值編碼入該位元流、並編碼其用以指示該第一模式之該資訊,及其中,該第一判定單元能夠判定以小波子頻帶接小波子頻帶為基的該小波子頻帶之該模式。
  6. 如申請專利範圍第5項之影像編碼設備,其中該模式係選自該第一模式、該第二模式及一使用水平方向上之預測的第三模式。
  7. 如申請專利範圍第5項之影像編碼設備, 其中,在該編碼單元依據該第二模式以編碼該等最重要位元平面的情況下,該編碼單元係編碼其直接地指示該等最重要位元平面之資訊、並編碼其用以指示該第二模式之資訊。
  8. 如申請專利範圍第5項之影像編碼設備,其中,該等複數小波子頻帶之各者係個別地相應於該影像框之頻帶的各者。
  9. 一種用以從位元流產生影像框之影像解碼方法,該影像框係藉由劃分為複數小波子頻帶而被編碼入該位元流,該等複數小波子頻帶之各者包括多組小波係數,該影像解碼方法包含:解碼用以從該位元流判定該小波子頻帶之模式的資訊,該模式被用以判定該等小波子頻帶之最重要位元平面,該模式係選自一使用垂直方向上之預測的第一模式及一不使用預測的第二模式;根據該資訊以判定該小波子頻帶之該模式;依據該小波子頻帶之該模式以判定該小波子頻帶中之該等多組小波係數的該等最重要位元平面;及藉由依據該等多組小波係數的該等最重要位元平面以從該位元流解碼該等小波係數來產生該影像框,其中,在依據該第一模式以判定該等最重要位元平面的情況下,該影像解碼方法包含: 從該位元流解碼該小波子頻帶中之該等多組小波係數的該等最重要位元平面的預測之差量值;預測垂直方向上之該等最重要位元平面;及依據該等預測的最重要位元平面及該等差量值以判定該等最重要位元平面,其中,該模式能夠根據該資訊而以小波子頻帶接小波子頻帶為基來判定。
  10. 如申請專利範圍第9項之影像解碼方法,其中,該模式係選自該第一模式、該第二模式及一使用水平方向上之預測的第三模式。
  11. 如申請專利範圍第9項之影像解碼方法,其中,在依據該第二模式以判定該等最重要位元平面的情況下,該影像解碼方法包含:解碼其直接地指示該等最重要位元平面之資訊,及依據其直接地指示該等最重要位元平面之該資訊以判定該等最重要位元平面。
  12. 如申請專利範圍第9項之影像解碼方法,其中,該等複數小波子頻帶之各者係個別地相應於該影像框之頻帶的各者。
  13. 一種用以將影像框編碼入位元流之影像編碼方法,該 影像框係藉由劃分為複數小波子頻帶而被編碼入該位元流,該等小波子頻帶之各者包括多組小波係數,該影像編碼方法包含:判定該小波子頻帶之模式,該模式被用以編碼該等小波子頻帶之最重要位元平面,且該模式係選自至少一使用垂直方向上之預測的第一模式或一不使用預測的第二模式;判定該小波子頻帶中之該等多組小波係數的該等最重要位元平面;及藉由將用以指示該小波子頻帶之該模式的資訊編碼入該位元流來編碼該影像框,其中,該等小波係數係依據該小波子頻帶之該模式及該等多組小波係數的該等最重要位元平面來編碼,及其中,在該等最重要位元平面係依據該第一模式來編碼的情況下,該影像編碼方法包含:將該小波子頻帶中之該等多組小波係數的該等最重要位元平面在垂直方向上的預測之差量值編碼入該位元流;及編碼其用以指示該第一模式之該資訊,及其中,該小波子頻帶之該模式能夠以小波子頻帶接小波子頻帶為基來判定。
  14. 如申請專利範圍第13項之影像編碼方法,其中該模式係選自該第一模式、該第二模式及一使用 水平方向上之預測的第三模式。
  15. 如申請專利範圍第13項之影像編碼方法,其中,在該等最重要位元平面係依據該第二模式來編碼的情況下,該影像編碼方法包含:編碼其直接地指示該等最重要位元平面之資訊;及編碼其用以指示該第二模式之資訊。
  16. 如申請專利範圍第13項之影像編碼方法,其中,該等複數小波子頻帶之各者係個別地相應於該影像框之頻帶的各者。
  17. 一種電腦可讀取儲存媒體,其係儲存用以執行一影像解碼方法之程式,該影像解碼方法係用以從位元流產生影像框,該影像框係藉由劃分為複數小波子頻帶而被編碼入該位元流,該等複數小波子頻帶之各者包括多組小波係數,該方法包含:解碼用以從該位元流判定該小波子頻帶之模式的資訊,該模式被用以判定該等小波子頻帶之最重要位元平面,該模式係選自至少一使用垂直方向上之預測的第一模式及一不使用預測的第二模式;根據該資訊以判定該小波子頻帶之該模式;依據該小波子頻帶之該模式以判定該小波子頻帶中之該等多組小波係數的該等最重要位元平面;及 藉由依據該等多組小波係數的該等最重要位元平面以從該位元流解碼該等小波係數來產生該影像框,其中,在依據該第一模式以判定該等最重要位元平面的情況下,該影像解碼方法包含:從該位元流解碼該小波子頻帶中之該等多組小波係數的該等最重要位元平面的預測之差量值;預測垂直方向上之該等最重要位元平面;及依據該等預測的最重要位元平面及該等差量值以判定該等最重要位元平面,其中,該模式能夠根據該資訊而以小波子頻帶接小波子頻帶為基來判定。
  18. 一種電腦可讀取儲存媒體,其係儲存用以執行一影像編碼方法之程式,該影像編碼方法係用以將影像框編碼入位元流,該影像框係藉由劃分為複數小波子頻帶而被編碼入該位元流,該等複數小波子頻帶之各者包括多組小波係數,該方法包含:判定該小波子頻帶之模式,該模式被用以編碼該等小波子頻帶之最重要位元平面,且該模式係選自至少一使用垂直方向上之預測的第一模式及一不使用預測的第二模式;判定該小波子頻帶中之該等多組小波係數的該等最重要位元平面;及藉由將用以指示該小波子頻帶之該模式的資訊編碼入 該位元流來編碼該影像框,其中,該等小波係數係依據該小波子頻帶之該模式及該等多組小波係數的該等最重要位元平面來編碼,及其中,在該等最重要位元平面係依據該第一模式來編碼的情況下,該影像編碼方法包含:將該小波子頻帶中之該等多組小波係數的該等最重要位元平面在垂直方向上的預測之差量值編碼入該位元流;及編碼其用以指示該第一模式之該資訊,及其中,該小波子頻帶之該模式能夠以小波子頻帶接小波子頻帶為基來判定。
TW107105162A 2017-03-15 2018-02-13 用以編碼和解碼視頻資料之方法、設備及系統 TWI733986B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
AU2017201760 2017-03-15
??2017201760 2017-03-15
AU2017201760A AU2017201760B2 (en) 2017-03-15 2017-03-15 Method, apparatus and system for encoding and decoding video data

Publications (2)

Publication Number Publication Date
TW201836353A TW201836353A (zh) 2018-10-01
TWI733986B true TWI733986B (zh) 2021-07-21

Family

ID=63521621

Family Applications (2)

Application Number Title Priority Date Filing Date
TW107105163A TW201836354A (zh) 2017-03-15 2018-02-13 用以編碼和解碼視頻資料之方法、設備及系統
TW107105162A TWI733986B (zh) 2017-03-15 2018-02-13 用以編碼和解碼視頻資料之方法、設備及系統

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW107105163A TW201836354A (zh) 2017-03-15 2018-02-13 用以編碼和解碼視頻資料之方法、設備及系統

Country Status (7)

Country Link
US (1) US11323745B2 (zh)
EP (1) EP3596927A4 (zh)
JP (1) JP6979075B2 (zh)
CN (1) CN110419222A (zh)
AU (1) AU2017201760B2 (zh)
TW (2) TW201836354A (zh)
WO (2) WO2018165694A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102361206B1 (ko) * 2016-12-19 2022-02-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 Gcli 엔트로피 코딩을 위한 부대역 의존 예측 적응을 사용하여 인코딩 또는 디코딩하기 위한 방법 및 장치
US11936859B2 (en) * 2018-07-02 2024-03-19 Telefonaktiebolaget Lm Ericsson (Publ) Bilateral high frequency boost
CN110827206B (zh) * 2018-08-14 2024-05-28 钰创科技股份有限公司 过滤信号的数位滤波器
WO2020153506A1 (ko) * 2019-01-21 2020-07-30 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
US20220132123A1 (en) * 2019-03-26 2022-04-28 Vid Scale, Inc. Content adaptive transform precision for video coding
US10931293B1 (en) 2019-12-27 2021-02-23 Seagate Technology Llc Transform domain analytics-based channel design
KR20220096624A (ko) * 2020-12-31 2022-07-07 엘지디스플레이 주식회사 표시 장치
CN114286106B (zh) * 2021-12-29 2024-02-13 苏州长风航空电子有限公司 一种基于MPSoC的多路SDI视频极低延时编码***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040213347A1 (en) * 2003-04-24 2004-10-28 Canon Kabushiki Kaisha Moving image decoding apparatus, moving image decoding method, image decoding method, and image decoding apparatus
US20050053296A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Bitplane coding for macroblock field/frame coding type information
US20050100229A1 (en) * 2003-10-31 2005-05-12 Canon Kabushiki Kaisha Digital video compression
US20140247999A1 (en) * 2013-03-01 2014-09-04 intoPIX SA Method and device for display stream compression
TW201642253A (zh) * 2013-03-05 2016-12-01 Nec Corp 訊號處理裝置、訊號處理方法以及訊號處理程式

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6865291B1 (en) * 1996-06-24 2005-03-08 Andrew Michael Zador Method apparatus and system for compressing data that wavelet decomposes by color plane and then divides by magnitude range non-dc terms between a scalar quantizer and a vector quantizer
US6411740B1 (en) * 1998-11-04 2002-06-25 Sharp Laboratories Of America, Incorporated Method for non-uniform quantization in a resolution hierarchy by use of a nonlinearity
US6658162B1 (en) * 1999-06-26 2003-12-02 Sharp Laboratories Of America Image coding method using visual optimization
WO2011013192A1 (ja) * 2009-07-27 2011-02-03 株式会社東芝 画像符号化方法および画像復号方法
GB2546187B (en) * 2013-01-28 2017-11-01 Jaguar Land Rover Ltd Vehicle path prediction and obstacle indication system and method
EP2773122A1 (en) * 2013-03-01 2014-09-03 intoPIX s.a. Method and device for display stream compression
WO2018041840A1 (en) * 2016-08-29 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improvements for greatest common line index (gcli) video coding
KR102361206B1 (ko) 2016-12-19 2022-02-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 Gcli 엔트로피 코딩을 위한 부대역 의존 예측 적응을 사용하여 인코딩 또는 디코딩하기 위한 방법 및 장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040213347A1 (en) * 2003-04-24 2004-10-28 Canon Kabushiki Kaisha Moving image decoding apparatus, moving image decoding method, image decoding method, and image decoding apparatus
US20050053296A1 (en) * 2003-09-07 2005-03-10 Microsoft Corporation Bitplane coding for macroblock field/frame coding type information
US20050100229A1 (en) * 2003-10-31 2005-05-12 Canon Kabushiki Kaisha Digital video compression
US20140247999A1 (en) * 2013-03-01 2014-09-04 intoPIX SA Method and device for display stream compression
TW201642253A (zh) * 2013-03-05 2016-12-01 Nec Corp 訊號處理裝置、訊號處理方法以及訊號處理程式

Also Published As

Publication number Publication date
WO2018165695A1 (en) 2018-09-20
JP6979075B2 (ja) 2021-12-08
CN110419222A (zh) 2019-11-05
EP3596927A4 (en) 2020-05-13
WO2018165694A1 (en) 2018-09-20
AU2017201760B2 (en) 2023-03-09
TW201836353A (zh) 2018-10-01
EP3596927A1 (en) 2020-01-22
AU2017201760A1 (en) 2018-10-04
US20200014956A1 (en) 2020-01-09
US11323745B2 (en) 2022-05-03
TW201836354A (zh) 2018-10-01
JP2020515113A (ja) 2020-05-21

Similar Documents

Publication Publication Date Title
TWI733986B (zh) 用以編碼和解碼視頻資料之方法、設備及系統
TWI811706B (zh) 用於編碼及解碼視訊資料的方法、設備及系統
CN109076226B (zh) 图像处理装置和方法
US9838715B2 (en) Image processing apparatus and method
US20180352257A1 (en) Methods and devices for encoding and decoding a color picture
EP3484137A1 (en) Method and device for generating a second image from a first image
CN105850128B (zh) 对高动态范围图像编码和/或对比特流解码的方法和设备
JP2002010216A (ja) 復号化装置及びその制御方法並びに記憶媒体
Descampe et al. JPEG XS, a new standard for visually lossless low-latency lightweight image compression
TW201725905A (zh) 用於非4:4:4色度子採樣之顯示串流壓縮(dsc)之熵寫碼技術
CN110574376A (zh) 用于解码高动态范围图像的方法和设备
US20160173884A1 (en) Device and a method for encoding an image and corresponding decoding method and decoding device
US7643700B2 (en) Processing of coded data according to user preference
US20230396801A1 (en) Learned video compression framework for multiple machine tasks
CN111316644A (zh) 图像的编码方法、解码方法及所适用的设备、***
AU2017201933A1 (en) Method, apparatus and system for encoding and decoding video data
AU2017204642A1 (en) Method, apparatus and system for encoding and decoding video data
AU2017225027A1 (en) Method, apparatus and system for encoding and decoding video data