TWI646823B - 視訊壓縮方法及視訊壓縮裝置 - Google Patents

視訊壓縮方法及視訊壓縮裝置 Download PDF

Info

Publication number
TWI646823B
TWI646823B TW106114035A TW106114035A TWI646823B TW I646823 B TWI646823 B TW I646823B TW 106114035 A TW106114035 A TW 106114035A TW 106114035 A TW106114035 A TW 106114035A TW I646823 B TWI646823 B TW I646823B
Authority
TW
Taiwan
Prior art keywords
blocks
prediction
video compression
picture
module
Prior art date
Application number
TW106114035A
Other languages
English (en)
Other versions
TW201840186A (zh
Inventor
何嘉強
洪偉翔
Original Assignee
晨星半導體股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 晨星半導體股份有限公司 filed Critical 晨星半導體股份有限公司
Priority to TW106114035A priority Critical patent/TWI646823B/zh
Priority to US15/943,834 priority patent/US20180316931A1/en
Publication of TW201840186A publication Critical patent/TW201840186A/zh
Application granted granted Critical
Publication of TWI646823B publication Critical patent/TWI646823B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一種視訊壓縮方法,包含將一畫面分割成複數個第一區塊,其中該複數個第一區塊之一第一最大區塊大小為N×N,N為一正整數;對該複數個第一區塊進行一合併模式運算,以產生複數個第一預測結果;將該畫面分割成複數個第二區塊,其中該複數個第二區塊之一第二最大區塊大小為M×M,其中M為小於N之一正整數;對該複數個第二區塊進行一動量估計運算,以產生複數個第二預測結果;以及根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行一視訊壓縮編碼。

Description

視訊壓縮方法及視訊壓縮裝置
本發明係指一種視訊壓縮方法及視訊壓縮裝置,尤指一種降低複雜度的視訊壓縮方法及視訊壓縮裝置。
為了因應人們對視訊影像品質的要求,視訊壓縮標準已由MPEG-2、MPEG-4、H.263、先進視訊編碼(Advanced Video Coding,AVC)/H.264,逐漸發展至新一代的高效率視訊編碼(High Efficiency Video Coding,HEVC)標準架構。
於H.264/AVC的標準中,視訊壓縮裝置可將畫面切割成同樣大小的巨區塊(Macroblock,MB)以進行編碼,另外,視訊壓縮裝置可選擇使用畫面內預測(Intra Prediction)或畫面間預測(Inter Prediction)的技術,得到影像殘餘值(Residue),並將此該殘餘值經過一離散餘弦轉換(Discrete Cosine Transform,DCT)及一量化(Quantization)運算,最後編碼成為視訊位元串流(Bitstream)進行傳輸。更進一步地,視訊壓縮裝置可針對不同區塊大小來進行預測,可針對16×16、16×8、8×16、8×8、8×4、4×8及4×4等不同大小的區塊進行預測。舉例來說,如果欲壓縮的畫面是較平坦的區域(紋理複雜度較低),可使用較大的區塊進行預測;相反地,如果欲壓縮的畫面是較複雜的區域(紋理複雜度較低), 可使用較小的區塊進行預測。另外,不同區塊的動量向量(Motion Vector)可達到二分之一及四分之一的精確度,使得畫面預測較準確。
近年來,隨著畫面解析度提高,資料量處理越來越龐大,視訊壓縮專家團隊遂以H.264為基礎,開發新一代的HEVC標準架構。HEVC的視訊編碼操作與H.264大致類似,具體來說,請參考第4圖,第4圖為HEVC標準架構下之一視訊壓縮裝置40之方塊圖。視訊壓縮裝置40可透過一畫面間預測模組400及一畫面內預測模組402,對一畫面Fn進行畫面間預測及畫面內預測,以取得一預測畫面Pn。視訊壓縮裝置40可將預測畫面Pn與原始欲編碼畫面Fn進行比對,以取得一影像殘餘值Rn。視訊壓縮裝置40透過一轉換及量化模組404以及一熵編碼(Entropy Coding)模組406,對影像殘餘值Rn進行離散餘弦轉換、量化運算以及熵編碼運算,以產生已壓縮編碼之一視訊位元串流VBS。
相較於H.264將畫面切割為16×16大小的巨區塊,HEVC下之視訊壓縮裝置40係將畫面Fn切割為64×64大小的樹區塊(Tree Block)以進行編碼,也就是說,HEVC標準架構下之視訊壓縮裝置40所切割出的編碼區塊較大。另外,HEVC標準架構下之視訊壓縮裝置40更利用迴路濾波器以及更佳的畫面間預測、畫面內預測技術,使得HEVC標準架構下之視訊壓縮裝置40可達到更加的壓縮效率。然而,HEVC標準架構下之視訊壓縮裝置40的運算複雜度也大幅提昇。
因此,如何提供一種降低複雜度的視訊壓縮方法及視訊壓縮裝置,也就成為業界所努力的目標之一。
因此,本發明之主要目的即在於提供一種降低複雜度的視訊壓縮方法及視訊壓縮裝置,以改善習知技術的缺點。
本發明揭露一種視訊壓縮方法,包含將一畫面分割成複數個第一區塊,其中該複數個第一區塊之一第一最大區塊大小(Maximum Block Size)為N×N,N為一正整數;對該複數個第一區塊進行一合併模式(Merge Mode)運算,以產生複數個第一預測結果;將該畫面分割成複數個第二區塊,其中該複數個第二區塊之一第二最大區塊大小為M×M,其中M為小於N之一正整數;對該複數個第二區塊進行一動量估計(Motion Estimation)運算,以產生複數個第二預測結果;以及根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行一視訊壓縮編碼。
本發明另揭露一種視訊壓縮裝置,包含一合併(Merge)模組,用來對一畫面之複數個第一區塊進行一合併模式(Merge Mode)運算,以產生複數個第一預測結果,其中該複數個第一區塊之一第一最大區塊大小(Maximum Block Size)為N×N,N為一正整數;一動量估計(Motion Estimation)模組,用來對該畫面之複數個第二區塊進行一動量估計(Motion Estimation)運算,以產生複數個第二預測結果,其中該複數個第二區塊之一第二最大區塊大小為M×M,M為小於N之一正整數;以及一編碼模組,用來根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行一視訊壓縮編碼。
10、40‧‧‧視訊壓縮裝置
20‧‧‧視訊壓縮流程
100、300、400‧‧‧畫面間預測模組
102‧‧‧殘餘值計算模組
104、404‧‧‧轉換及量化模組
106‧‧‧最佳模式選擇模組
108、406‧‧‧熵編碼模組
120、320‧‧‧合併模組
122、322‧‧‧動量估計模組
140‧‧‧編碼模組
200~214‧‧‧步驟
324‧‧‧整數點動量估計模組
326‧‧‧非整數點動量微調模組
402‧‧‧畫面內預測模組
F、Fn‧‧‧畫面
IDX‧‧‧指標
MVAMVP‧‧‧動量向量
Pn‧‧‧預測畫面
Pmerge、PAMVP‧‧‧預測區塊
Rn‧‧‧影像殘餘值
Rmerge、RAMVP‧‧‧殘餘值
TQmerge、TQAMVP‧‧‧轉換量化結果
VBS、VBS1‧‧‧視訊位元串流
第1圖為本發明實施例一視訊壓縮裝置之方塊圖。
第2圖為本發明實施例一視訊壓縮裝置之操作流程圖。
第3圖為本發明實施例一畫面間預測模組之方塊圖。
第4圖為習知一視訊壓縮裝置之方塊圖。
本發明著重於改善視訊壓縮過程中畫面間預測(Inter Prediction)的技術,以降低視訊壓縮裝置整體的複雜度。具體來說,請參考第1圖,第1圖為本發明實施例一視訊壓縮裝置10之方塊圖。視訊壓縮裝置10可為符合高效率視訊編碼(High Efficiency Video Coding,HEVC)標準架構的視訊壓縮裝置,其用來對一未編碼視訊資料流進行一視訊壓縮編碼。視訊壓縮裝置10包含一畫面間預測(Inter Prediction)模組100以及一編碼模組140,其中畫面間預測模組100包含一合併(Merge)模組120以及一動量估計(Motion Estimation)模組122,而編碼模組140包含一殘餘值(Residue)計算模組102、一轉換及量化模組104、一最佳模式選擇模組106以及一熵編碼(Entropy Coding)模組108。為求簡潔,第1圖僅繪示與畫面間預測相關之模組,而未繪示視訊壓縮裝置10所需之畫面內預測模組、反轉換及反量化模組、迴路濾波器、畫面緩衝模組等模組。
合併模組120用來將欲編碼之一畫面F切割成複數個第一區塊BKmerge,並對複數個第一區塊BKmerge進行一合併模式(Merge Mode)運算,以產生對應於複數個第一區塊BKmerge的複數個第一預測區塊Pmerge,另外,合併模組120可根據鄰近於第一區塊BKmerge的複數個第一動量向量(Motion Vector)MVmerge,取得對應於複數個第一動量向量MVmerge之複數個指標(Index)IDX(複數個第一預測區塊Pmerge或複數個指標IDX可對應至複數個第一預測結果)。合併模組120可將複數個第一區塊BKmerge的複數個第一預測區塊Pmerge輸出 至殘餘值計算模組102,並將對應於複數個第一動量向量MVmerge之複數個指標IDX輸出至最佳模式選擇模組106。需注意的是,複數個第一區塊BKmerge之一第一最大區塊大小(Maximum Block Size)為N×N(N為一正整數)。舉例來說,當複數個第一區塊BKmerge之第一最大區塊大小為64×64時(即當正整數N為64時),合併模組120可將畫面F切割為64×64、32×32、16×16、8×8等不同大小的複數個第一區塊BKmerge,並對不同大小的複數個第一區塊BKmerge進行合併模式運算。
其餘合併模組120對複數個第一區塊BKmerge進行合併模式運算的細節,已詳述於HEVC標準的合併模式(Merge Mode)中,於此不另贅述。
另外,動量估計模組122用來將欲編碼之畫面F切割成複數個第二區塊BKAMVP,並對複數個第二區塊BKAMVP進行一動量估計(Motion Estimation)運算,以產生對應於複數個第二區塊BKAMVP的複數個第二預測區塊PAMVP以及對應於複數個第二區塊BKAMVP的複數個第二動量向量MVAMVP(複數個第二預測區塊PAMVP或複數個第二動量向量MVAMVP可對應至複數個第二預測結果)。動量估計模組122可將複數個第二預測區塊PAMVP輸出至殘餘值計算模組102,並將複數個第二動量向量MVAMVP輸出至最佳模式選擇模組106。需注意的是,在複數個第一區塊BKmerge之第一最大區塊大小為N×N的前提下,複數個第二預測區塊PAMVP之一第二最大區塊大小為M×M(M為一正整數),其中正整數M為小於正整數N。舉例來說,當複數個第一區塊BKmerge之第一最大區塊大小為64×64時(即當正整數N為64時),動量估計模組122僅可將畫面F切割為小於M×M之複數個第二區塊BKAMVP,即複數個第二區塊BKAMVP之區塊大小最大為M×M,其中正整數M小於64。於一實施例中,在複數個第一區塊BKmerge之第一最大區塊大小為64×64的前提下,動量估計模組122可將畫面F切割為32×32、32×16、16×32、 16×16、16×8、8×16、8×8、8×4、4×8等不同大小的複數個第二區塊BKAMVP,並對不同大小的複數個第二區塊BKAMVP進行動量估計運算。於一實施例中,該正整數N為該正整數M之一整數倍,即正整數N可表示為N=jM,而j代表一正整數(如j=2)。
另外,動量估計運算可為HEVC之一進階動量向量預測模式(Advanced Motion Vector Prediction Mode,AMVP Mode)運算,當動量估計模組122對複數個第二區塊BKAMVP中一區塊BK_k’進行進階動量向量預測運算時,動量估計模組122可直接產生對應於區塊BK_k’之第二動量向量MVAMVP以及第二預測區塊Pmerge,其餘動量估計模組122對複數個第二區塊BKmerge進行動量估計運算/進階移動向量預測運算的細節,已詳述於HEVC標準的進階動量向量預測模式(AMVP Mode)中,於此不另贅述。
另外,編碼模組140根據複數個第一預測區塊Pmerge、複數個第二預測區塊PAMVP、複數個指標IDX以及複數個第二動量向量MVAMVP,對畫面F進行一視訊壓縮編碼。詳細來說,殘餘值計算模組102接收畫面F、複數個第一預測區塊Pmerge以及複數個第二預測區塊PAMVP,殘餘值計算模組102根據畫面F以及複數個第一預測區塊Pmerge,產生對應於複數個第一預測區塊Pmerge之複數個第一殘餘值Rmerge,另外,殘餘值計算模組102根據畫面F以及複數個第二預測區塊PAMVP,產生對應於複數個第二預測區塊PAMVP之複數個第二殘餘值RAMVP。其餘關於殘餘值計算模組102的操作細節為本領域所熟知,於此不另贅述。
另外,轉換及量化模組104分別對複數個第一殘餘值Rmerge以及複數個第二殘餘值RAMVP進行一離散餘弦轉換(Discrete Cosine Transform,DCT)及一量 化(Quantization)運算,以產生對應於複數個第一殘餘值Rmerge之複數個轉換量化結果TQmerge以及對應於複數個第二殘餘值RAMVP之複數個轉換量化結果TQAMVP。其餘關於轉換及量化模組104的操作細節為本領域技術人員所熟知,於此不另贅述。
另外,最佳模式選擇模組106接收複數個轉換量化結果TQmerge、複數個轉換量化結果TQAMVP、複數個指標IDX以及複數個第二動量向量MVAMVP,並根據複數個轉換量化結果TQmerge、複數個轉換量化結果TQAMVP、複數個指標IDX以及複數個第二動量向量MVAMVP,選擇一率失真成本(Rate Distortion Cost,RD Cost)為最低之一最佳模式。熵編碼模組108遂根據該最佳模式,對畫面F進行一熵編碼,以產生對應於畫面F已壓縮編碼之一視訊位元串流VBS1。其中,熵編碼模組108可利用一內容適應性二位元算數編碼(Context-Based Adaptive Binary Arithmetic Coding,CABAC)演算法,對畫面F進行熵編碼。其餘關於CABAC演算法、最佳模式選擇模組106及熵編碼模組108的操作細節為本領域技術人員所熟知,於此不另贅述。
需注意的是,對於區塊大小(Block Size)較大的區塊(如區塊大小為64×64的區塊)來說,動量估計運算需要相當高的硬體複雜度,更進一步地,對於區塊大小較大的區塊(如區塊大小為64×64的區塊)來說,相較於合併模式運算,動量估計運算僅能達到較低的壓縮增益(Compression Gain)。換句話說,若對區塊大小較大的區塊進行動量估計運算,其壓縮增益既無法達到合併模式運算所能達到的壓縮增益,亦徒增硬體複雜度。
習知技術中,當視訊壓縮裝置進行合併模式運算所切割之複數個第 一區塊之第一最大區塊大小為N×N時,視訊壓縮裝置進行動量估計運算所切割之複數個第二區塊之第二最大區塊大小必須同為N×N,在此情形下,習知視訊壓縮裝置之硬體複雜度較高。相較之下,當本發明實施例之合併模組120進行合併模式運算所切割之複數個第一區塊BKmerge之第一最大區塊大小為N×N時,動量估計模組122僅需對區塊大小為小於或等於M×M之複數個第二區塊BKAMVP進行動量估計運算即可,其中正整數M小於正整數N。如此一來,可大幅降低視訊壓縮裝置10所需之硬體複雜度,同時視訊壓縮裝置10可保有與習知技術相當之壓縮增益。另外,動量估計模組122僅能對區塊大小為小於或等於M×M之複數個第二區塊BKAMVP進行動量估計運算,而使得最佳模式選擇模組106的選擇範圍縮小,進而縮短最佳模式選擇模組106運作所需的時間。
關於視訊壓縮裝置10的操作,可進一步歸納為一視訊壓縮流程。請參考第2圖,第2圖為本發明實施例一視訊壓縮流程20之示意圖。視訊壓縮流程20可由視訊壓縮裝置10來執行,視訊壓縮流程20包含以下步驟:
步驟200:將畫面F分割成複數個第一區塊BKmerge,其中複數個第一區塊BKmerge之第一最大區塊大小為N×N,N為正整數。
步驟202:對複數個第一區塊BKmerge進行合併模式運算,以產生取得複數個第一預測結果,其中複數個第一預測結果為對應於複數個第一動量向量MVmerge之複數個指標IDX及對應於複數個第一區塊BKmerge之複數個第一預測區塊Pmerge
步驟204:將畫面F分割成複數個第二區塊塊BKAMVP,其中複數個第二區塊塊BKAMVP之第二最大區塊大小為M×M,其中正整數M小於正整數N。
步驟206:對複數個第二區塊BKAMVP進行動量估計運算,以產生複數個第二預測結果,其中複數個第二預測結果為對應於複數個第二區塊BKAMVP之 複數個第二動量向量MVAMVP及複數個第二預測區塊PAMVP
步驟208:根據畫面F以及複數個第一預測區塊Pmerge,產生對應於複數個第一預測區塊Pmerge之複數個第一殘餘值Rmerge;並根據畫面F以及複數個第二預測區塊PAMVP,產生對應於複數個第二預測區塊PAMVP之複數個第二殘餘值RAMVP
步驟210:分別對複數個第一殘餘值Rmerge以及複數個第二殘餘值RAMVP進行離散餘弦轉換及量化運算,以產生對應於複數個第一殘餘值Rmerge之複數個轉換量化結果TQmerge以及對應於複數個第二殘餘值RAMVP之複數個轉換量化結果TQAMVP
步驟212:根據複數個轉換量化結果TQmerge、複數個轉換量化結果TQAMVP、複數個指標IDX以及複數個第二動量向量MVAMVP,選擇率失真成本為最低之最佳模式。
步驟214:根據該最佳模式,對畫面F進行熵編碼,以產生對應於畫面F已壓縮編碼之視訊位元串流VBS1。
關於視訊壓縮流程20的操作細節,請參考前述相關段落,於此不另贅述。另外,本領域技術人員當知第1圖內的模組/功能單元可由數位電路(如RTL電路)或一數位訊號處理器(Digital Signal Processor,DSP)來實現或進行實作,於此不再贅述。
需注意的是,前述實施例係用以說明本發明之概念,本領域具通常知識者當可據以做不同之修飾,而不限於此。舉例來說,於視訊壓縮裝置10中,合併模組120產生對應於複數個第一區塊BKmerge的複數個第一預測區塊Pmerge,並取得對應於複數個第一動量向量MVmerge之複數個指標IDX,而不限於此。請參 考第3圖,第3圖為本發明實施例一畫面間預測模組300之方塊圖。畫面間預測模組300包含一合併模組320以及一動量估計模組322,動量估計模組322包含一整數點動量估計模組(Integer Motion Estimation Module)324以及一非整數點動量微調模組(Fractional Motion Refinement Module)326。畫面間預測模組300與畫面間預測模組100的運作相似,與畫面間預測模組100不同之處在於,相較於合併模組120,合併模組320僅輸出對應於複數個第一動量向量MVmerge之複數個指標IDX;相較於動量估計模組122,動量估計模組322除了產生對應於複數個第二區塊BKAMVP的複數個第二預測區塊PAMVP以及對應於複數個第二區塊BKAMVP的複數個第二動量向量MVAMVP之外,動量估計模組322另利用非整數點動量微調模組326根據複數個指標IDX產生對應於複數個第一區塊BKmerge的複數個第一預測區塊Pmerge。只要當合併模組320進行合併模式運算所切割之複數個第一區塊BKmerge之第一最大區塊大小為N×N時,動量估計模組322僅能對區塊大小為小於M×M之複數個第二區塊BKAMVP進行動量估計運算(其中正整數M為小於正整數N),即滿足本發明之需求而屬於本發明之範疇。其餘關於整數點動量估計模組324及非整數點動量微調模組326的操作細節為本領域技術人員所熟知,於此不另贅述。
綜上所述,本發明藉由降低進行動量估計運算時對欲編碼畫面所切割出複數個第二區塊之第二最大區塊大小,來降低本發明之視訊壓縮裝置所需之硬體複雜度,同時本發明之視訊壓縮裝置可保有與習知技術相當之壓縮增益;具體而言,在相同的編碼速度下,可保有約98~99%的壓縮增益,但節省約20%的電路面積。另外,本發明之最佳模式選擇模組的選擇範圍因第二最大區塊大小縮小而隨之縮小,進而縮短本發明之最佳模式選擇模組運作所需的時間。 以上所述僅為本發明之較佳實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。

Claims (12)

  1. 一種視訊壓縮方法,包含:將一畫面分割成複數個第一區塊,其中該複數個第一區塊之一第一最大區塊大小(Maximum Block Size)為N×N,N為一正整數;對該複數個第一區塊進行一合併模式(Merge Mode)運算,以產生複數個第一預測結果;將該畫面分割成複數個第二區塊,其中該複數個第二區塊之一第二最大區塊大小為M×M,其中M為小於N之一正整數;僅對區塊大小小於或等於該第二最大區塊大小的該複數個第二區塊進行一動量估計(Motion Estimation)運算,以產生複數個第二預測結果;以及根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行一視訊壓縮編碼。
  2. 如請求項1所述之視訊壓縮方法,其中該正整數N為該正整數M之一整數倍。
  3. 如請求項2所述之視訊壓縮方法,其中該整數倍為2。
  4. 如請求項1所述之視訊壓縮方法,另包含:對該複數個第一區塊進行該合併模式運算,以取得該複數個第一預測結果為對應於複數個第一動量向量(Motion Vector)之複數個指標(Index)或對應於該複數個第一區塊之複數個第一預測區塊;以及對該複數個第二區塊進行該動量估計運算,以產生該複數個第二預測結果 為對應於該複數個第二區塊之複數個第二動量向量或複數個第二預測區塊。
  5. 如請求項4所述之視訊壓縮方法,其中根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行該視訊壓縮編碼的步驟包含:根據該畫面及該複數個第一預測區塊,產生對應於該複數個第一預測區塊之複數個第一殘餘值(Residue);以及根據該畫面及該複數個第二預測區塊,產生對應於該複數個第二預測區塊之複數個第二殘餘值。
  6. 如請求項4所述之視訊壓縮方法,其中根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行該視訊壓縮編碼的步驟包含:根據該複數個指標及該複數個第二動量向量,選擇一最佳模式;以及根據該最佳模式,對該畫面進行一熵編碼(Entropy Coding),以產生對應於該畫面之一視訊位元串流。
  7. 一種視訊壓縮裝置,包含:一合併(Merge)模組,用來對一畫面之複數個第一區塊進行一合併模式(Merge Mode)運算,以產生複數個第一預測結果,其中該複數個第一區塊之一第一最大區塊大小(Maximum Block Size)為N×N,N為一正整數;一動量估計(Motion Estimation)模組,僅對該畫面中區塊大小小於或等於一第二最大區塊大小之複數個第二區塊進行一動量估計(Motion Estimation)運算,以產生複數個第二預測結果,其中該複數個第二區 塊之該第二最大區塊大小為M×M,M為小於N之一正整數;以及一編碼模組,用來根據該複數個第一預測結果以及該複數個第二預測結果,對該畫面進行一視訊壓縮編碼。
  8. 如請求項7所述之視訊壓縮裝置,其中該正整數N為該正整數M之一整數倍。
  9. 如請求項8所述之視訊壓縮裝置,其中該整數倍為2。
  10. 如請求項7所述之視訊壓縮裝置,其中該複數個第一預測結果為對應於複數個第一動量向量(Motion Vector)之複數個指標(Index)或對應於該複數個第一區塊之複數個第一預測區塊,該複數個第二預測結果為對應於該複數個第二區塊之複數個第二動量向量或複數個第二預測區塊。
  11. 如請求項7所述之視訊壓縮裝置,其中該編碼模組包含一殘餘值(Residue)計算模組,用來根據該畫面及該複數個第一預測區塊產生對應於該複數個第一預測區塊之複數個第一殘餘值,以及根據該畫面及該複數個第二預測區塊產生對應於該複數個第二預測區塊之複數個第二殘餘值。
  12. 如請求項7所述之視訊壓縮裝置,其中該編碼模組包含:一最佳模式選擇模組,用來根據該複數個指標及該複數個第二動量向量,選擇一最佳模式;以及一熵編碼(Entropy Coding)模組,用來根據該最佳模式,對該畫面進行一熵編碼,以產生對應於該畫面之一視訊位元串流。
TW106114035A 2017-04-27 2017-04-27 視訊壓縮方法及視訊壓縮裝置 TWI646823B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW106114035A TWI646823B (zh) 2017-04-27 2017-04-27 視訊壓縮方法及視訊壓縮裝置
US15/943,834 US20180316931A1 (en) 2017-04-27 2018-04-03 Video compression method and video compression device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106114035A TWI646823B (zh) 2017-04-27 2017-04-27 視訊壓縮方法及視訊壓縮裝置

Publications (2)

Publication Number Publication Date
TW201840186A TW201840186A (zh) 2018-11-01
TWI646823B true TWI646823B (zh) 2019-01-01

Family

ID=63917601

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106114035A TWI646823B (zh) 2017-04-27 2017-04-27 視訊壓縮方法及視訊壓縮裝置

Country Status (2)

Country Link
US (1) US20180316931A1 (zh)
TW (1) TWI646823B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI243615B (en) * 2004-10-11 2005-11-11 Ind Tech Res Inst System for enhancing compression ratio of scalable video coding and method thereof
US20110249959A1 (en) * 2010-04-09 2011-10-13 Korea Electronics Technology Institute Video storing method and device based on variable bit allocation and related video encoding and decoding apparatuses
US20150117526A1 (en) * 2012-04-23 2015-04-30 Samsung Electronics Co., Ltd. Method for encoding multiview video using reference list for multiview video prediction and device therefor, and method for decoding multiview video using reference list for multiview video prediction and device therefor
US20160219278A1 (en) * 2015-01-26 2016-07-28 Qualcomm Incorporated Sub-prediction unit based advanced temporal motion vector prediction
TWI586176B (zh) * 2014-10-01 2017-06-01 大猩猩科技股份有限公司 基於壓縮視訊之縮時概要產出系統與方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8297191B2 (en) * 2009-07-31 2012-10-30 The United States Of America As Represented By The Secretary Of The Navy Pressure seal
PL400344A1 (pl) * 2012-08-13 2014-02-17 Politechnika Poznanska Sposób wyznaczania predyktora wektora ruchu

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI243615B (en) * 2004-10-11 2005-11-11 Ind Tech Res Inst System for enhancing compression ratio of scalable video coding and method thereof
US20110249959A1 (en) * 2010-04-09 2011-10-13 Korea Electronics Technology Institute Video storing method and device based on variable bit allocation and related video encoding and decoding apparatuses
US20150117526A1 (en) * 2012-04-23 2015-04-30 Samsung Electronics Co., Ltd. Method for encoding multiview video using reference list for multiview video prediction and device therefor, and method for decoding multiview video using reference list for multiview video prediction and device therefor
TWI586176B (zh) * 2014-10-01 2017-06-01 大猩猩科技股份有限公司 基於壓縮視訊之縮時概要產出系統與方法
US20160219278A1 (en) * 2015-01-26 2016-07-28 Qualcomm Incorporated Sub-prediction unit based advanced temporal motion vector prediction

Also Published As

Publication number Publication date
US20180316931A1 (en) 2018-11-01
TW201840186A (zh) 2018-11-01

Similar Documents

Publication Publication Date Title
JP4927207B2 (ja) 符号化方法、復号化方法及び装置
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP4545388B2 (ja) フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法
KR20050045746A (ko) 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
JP2009094828A (ja) 画像符号化装置及び画像符号化方法、画像復号化装置及び画像復号化方法
KR20070032111A (ko) 동영상의 무손실 부호화, 복호화 방법 및 장치
JP2006304307A5 (zh)
JP2004007649A (ja) フェーディング補償のためのパラメータ化
KR20170045013A (ko) 데이터 인코딩 장치 및 데이터 인코딩 방법
JP6042001B2 (ja) 動画像符号化装置及び動画像符号化方法
CN110351552B (zh) 视频编码中一种快速编码方法
JP2011166592A (ja) 画像符号化装置及び画像復号装置
JP6708211B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP6176044B2 (ja) ブロック構造決定回路および情報圧縮回路
TWI646823B (zh) 視訊壓縮方法及視訊壓縮裝置
JP5832263B2 (ja) 画像符号化装置及び画像符号化方法
US8811474B2 (en) Encoder and encoding method using coded block pattern estimation
JP2015027097A (ja) 動画像復号方法
JP2006237765A (ja) 画像符号化装置
WO2019150435A1 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
US9635372B2 (en) Coding format converter partially halting search for coding candidates
JP2015186120A (ja) 符号化方式変換装置及びプログラム
JP2005236584A (ja) 動画像情報変換符号化装置
KR101096619B1 (ko) 데이터 인코딩, 디코딩 방법 및 그 장치
KR0130167B1 (ko) 동영상 압축 부호화 장치

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees