TWI381329B - 影像壓縮方法及其裝置 - Google Patents

影像壓縮方法及其裝置 Download PDF

Info

Publication number
TWI381329B
TWI381329B TW097134454A TW97134454A TWI381329B TW I381329 B TWI381329 B TW I381329B TW 097134454 A TW097134454 A TW 097134454A TW 97134454 A TW97134454 A TW 97134454A TW I381329 B TWI381329 B TW I381329B
Authority
TW
Taiwan
Prior art keywords
pixel
value
image
pixels
image compression
Prior art date
Application number
TW097134454A
Other languages
English (en)
Other versions
TW201011698A (en
Inventor
jing ming Guo
Original Assignee
Univ Nat Taiwan Science Tech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ Nat Taiwan Science Tech filed Critical Univ Nat Taiwan Science Tech
Priority to TW097134454A priority Critical patent/TWI381329B/zh
Priority to US12/266,569 priority patent/US8270746B2/en
Publication of TW201011698A publication Critical patent/TW201011698A/zh
Application granted granted Critical
Publication of TWI381329B publication Critical patent/TWI381329B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

影像壓縮方法及其裝置
本發明是關於一種影像壓縮方法及其裝置,且特別是關於一種影像壓縮方法及其裝置,其以錯誤擴散為基礎進行區塊截斷編碼之影像壓縮方法及其裝置。
影像壓縮意指將數位影像之資料量減小至可由儲存或者傳輸媒體支援之程度。其中,區塊截斷編碼(block truncation coding,BTC)便是一種具有高壓縮率且低複雜度的影像壓縮方法。區塊截斷編碼將原影像區分為多個不重複之子影像,並且透過統計方式萃取子影像特徵來量化子影像內的像素,藉以降低影像之資料量。
在典型的區塊截斷編碼中,各子影像的像素平均值及標準差為兩個非常重要的參數,且這些參數會隨著子影像的不同而有所變化,以反映子影像的特徵。以4×4像素之子影像為例,當子影像內像素值大於或等於像素平均值時,此像素值則編碼為”1”,反之則為”0”。”1”及”0”分別表示兩量化值”a”及”b”,且”a”及”b”與子影像的像素平均值及標準差相關。在此以數學式表示則,其中分別為像素平均值及標準差,且m及q分別為子影像內像素個數以及子影像內大於或等於平均值之像素個數。
因此,對每一子影像而言,只需儲存4×4位元的點陣 圖(bit map)、子影像的像素平均值及標準差,便可據以重建影像。簡言之,此影像壓縮方法參考各像素所屬子影像的像素平均值作為臨界值,據以量化各像素值為兩量化值其中之一,而量化值為透過加以計算各像素所屬子影像的像素平均值及標準差所獲得之。
區塊截斷編碼演算法的複雜度相較於其他影像壓縮方法為較低,但是在計算子影像之像素平均值及標準差時,還是需要大量的加法、乘法以及根號運算,因而較難以硬體實現之。另外,區塊截斷編碼可以設計不同子影像的大小來控制影像壓縮率,但所壓縮之影像品質也會隨壓縮率的提升而降低,甚至產生區塊效應(blocking effect)。區塊效應為兩鄰近子影像之間所出現的不連續性現象。由於每一子影像會採用其像素平均值作重建影像之依據,因此隨著子影像尺寸變大,壓縮後之影像也變得越模糊,造成人眼無法察覺原影像之特徵,例如:假邊(false contour)現象。
本發明提供一種影像壓縮方法及其裝置,其具有低複雜度、高壓縮率及高影像品質等多項優點,且其所壓縮之影像亦能符合人眼視覺的低通特性。
本發明提出一種影像壓縮方法。首先,接收一區塊影像,其中區塊影像具有多個像素。接著,將第一像素之調整值與一臨界值進行比較,並據以量化第一像素之調整值 為第一參數值或第二參數值,以獲得第一像素之量化值。之後,依據錯誤擴散核心,將第一像素之調整值與第一像素之量化值之間的誤差值,分配至鄰近第一像素的至少一第二像素,並據以產生第二像素之調整值。其中第一像素及第二像素分別為上述像素其中之一。
本發明提出一種影像壓縮裝置包括擷取模組、量化模組以及錯誤擴散模組。擷取模組接收區塊影像,其中區塊影像具有多個像素。量化模組耦接擷取模組,其比較第一像素之調整值與臨界值,並依據比較結果,量化第一像素之調整值為第一參數值或第二參數值,以獲得第一像素之量化值。錯誤擴散模組耦接量化模組,其依據錯誤擴散核心,將第一像素之調整值與第一像素之量化值之間的誤差值,分配至鄰近第一像素的至少一第二像素,並據以產生第二像素之調整值。其中第一像素及第二像素分別為上述像素其中之一。
上述之影像壓縮方法及影像壓縮裝置,在一實施例中臨界值為區塊影像內像素之平均值。
上述之影像壓縮方法及影像壓縮裝置,在一實施例中第一參數值為區塊影像內像素之最大值,且第二參數值為區塊影像內像素之最小值。
本發明依據像素所屬區塊影像之特徵,將像素之調整值量化為第一參數值或第二參數值,以降低所壓縮之影像的資料量。另外,像素量化前後之誤差值則分配至鄰近的像素,以保留像素所屬區塊影像的平均色調,以及降低區 塊效應的影響,使得所壓縮之影像品質較佳。
為讓本發明之上述和其他目的、特徵和優點能更明顯易懂,下文特舉本發明之較佳實施例,並配合所附圖式,作詳細說明如下。
圖1為本發明之一實施例之影像壓縮裝置的示意圖。請參照圖1,影像壓縮裝置100包括擷取模組110、量化模組120以及錯誤擴散模組130。擷取模組110接收一區塊影像。如圖2所示,影像200可區分為多個不重複之區塊影像B(X,Y),例如:區塊影像B(0,0)及B(0,1),且區塊影像具有M×N個像素,例如:M=4且N=4。為便於說明,區塊影像內像素之值標示為Pi,j ,其中0[i[M-1,且0[j[N-1。
量化模組120耦接擷取模組110,其分析區塊影像B(X,Y)內像素之平均值,以作為一臨界值THB(X,Y) 。接著,量化模組120將像素之調整值P' i,j 與臨界值THB(X,Y) 進行比較,並據以量化像素之調整值P' i,j 為第一參數值或第二參數值,以獲得像素之量化值Qi,j 。其中,像素之調整值P' i,j 為經錯誤擴散模組130處理後所獲得之,於後詳述。當像素之調整值P' i,j 大於或者等於臨界值THB(X,Y) 時,量化模組120量化像素之調整值P' i,j 為第一參數值。反之,當像素之調整值P' i,j 小於臨界值THB(X,Y) 時,量化模組120量化像素之調整值P' i,j 為第二參數值。在此,第一參數值為區塊 影像B(X,Y)內像素之最大值Pmax ,且第二參數值為區塊影像B(X,Y)內像素之最小值Pmin 。臨界值THB(X,Y) 以及像素之量化值Qi,j 以數學式表示如下:
本實施例採用區塊截斷編碼方式,將像素之調整值P' i,j 量化為第一參數值或第二參數值,也因此像素在量化前後會產生誤差。基於區塊影像內相鄰的像素通常具有高度的相關性,錯誤擴散模組130依據錯誤擴散核心,將像素量化前後之誤差值Ei,j 分配至鄰近的像素,以消除區塊效應以及保留各區塊的平均色調。其中,誤差值Ei,j 為像素之調整值P' i,j 與像素之量化值Qi,j 之間的差值。
圖3A、圖3B及圖3C分別為本發明之一實施例的錯誤擴散核心。請參照圖3A、圖3B及圖3C,錯誤擴散核心310、320及330分別為Floyd擴散核心、Jarvis擴散核心以及Stucki擴散核心。在錯誤擴散核心310、320及330內,標示為“ ”之元素對應區塊影像B(X,Y)內目前進行量化處理的像素,而此像素量化前後之誤差值Ei,j 會分配至鄰近的像素。而且,在錯誤擴散核心310內,標示為“-”之元素對應到經量化處理的像素,是故無需對此像素進行錯誤擴散。為便於說明,以錯誤擴散核心310為例說明,且錯誤擴散核心310內的元素標示為Hq,r ,其中0[q[1, 且-1[r[1。
依據錯誤擴散核心310,錯誤擴散模組130將像素量化前後之誤差值Ei,j 乘上元素Hq,r 後所獲得之值,作為調整像素之值Pi+q ,j+r 之參考依據。也就是說,依據錯誤擴散核心310,量化前後之誤差值Ei ,j 分別乘上7/12、1/12、3/12及5/12後所獲得之值,用來調整像素之值Pi,j+1 、Pi+1,j-1 、Pi+1,j 及Pi+1,j+1 。換句話說,依據錯誤擴散核心310,像素之值Pi,j 從鄰近像素經錯誤擴散所得之擴散值Di,j 為Ei,j-1 ×H0,1 +Ei-1,j+1 ×H1,-1 +Ei-1,j ×H1,0 +Ei-1,j-1 ×H1,1 。其中,擴散值Di,j 及像素之調整值Pi,j 以數學式表示如下: P'i,j =Pi,j +Di,j
同理亦可類推至錯誤擴散核心320及330。如上述實施例之敘述,在此可歸納為下列的方法流程。圖4為本發明之一實施例之影像壓縮方法的流程圖。請參照圖4,首先,接收一區塊影像(步驟S401),此區塊影像具有多個像素。接著,將第一像素之調整值與臨界值進行比較(步驟S402),並依據比較結果將第一像素之調整值量化為第一參數值或者第二參數值,以獲得第一像素之量化值(步驟S403)。其中第一像素為上述像素其中之一。之後,將第一像素之調整值與第一像素之量化值之間的誤差值,分配至鄰近第一像素之至少一第二像素,以產生第二像素之調整值(步驟S404)。其中第二像素為上述像素其中之一
綜上所述,上述實施例採用區塊影像內像素之平均值作為臨界值,據以量化像素之調整值為第一參數值或者第二參數值。為了有效地降低影像壓縮之複雜度及運算量,在此第一參數值及第二參數值分別為區塊影像內像素之最大值及最小值。另外,像素於量化過程中會產生誤差,使得人眼容易察覺所壓縮之影像與原影像之間的差異。因此,上述實施例將像素量化前後之誤差值分配至鄰近的像素,藉以透過鄰近的像素來進行補償。藉此,不僅可以保留像素所屬區塊影像的平均色調,也大大地降低了區塊效應的影響,進而提升壓縮影像的品質。
雖然本發明已以較佳實施例揭露如上,然其並非用以限定本發明,任何所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100‧‧‧影像壓縮裝置
110‧‧‧擷取模組
120‧‧‧量化模組
130‧‧‧錯誤擴散模組
200‧‧‧影像
310、320、330‧‧‧錯誤擴散核心
TH‧‧‧臨界值
Pi,j ‧‧‧像素之值
P' i,j ‧‧‧像素之調整值
Qi,j ‧‧‧像素之量化值
Ei,j ‧‧‧像素之誤差值
Di,j ‧‧‧像素之擴散值
B(0,0)、B(0,1)‧‧‧區塊影像
圖1為本發明之一實施例之影像壓縮裝置的示意圖。
圖2為本發明之一實施例之影像的示意圖。
圖3A~圖3C為本發明之一實施例的錯誤擴散核心。
圖4為本發明之一實施例之影像壓縮方法的流程圖。
100‧‧‧影像壓縮裝置
110‧‧‧擷取模組
120‧‧‧量化模組
130‧‧‧錯誤擴散模組
TH‧‧‧臨界值
Pi,j ‧‧‧像素之值
P' i,j ‧‧‧像素之調整值
Qi,j ‧‧‧像素之量化值
Ei,j ‧‧‧像素之誤差值
Di,j ‧‧‧像素之擴散值

Claims (12)

  1. 一種影像壓縮方法,包括:接收一區塊影像,其中該區塊影像具有多個像素;比較一臨界值與一第一像素之一調整值,其中該第一像素為該些像素其中之一;依據該第一像素之比較結果,量化該第一像素之該調整值為一第一參數值或一第二參數值,以獲得該第一像素之一量化值,其中該第一參數值為該區塊影像內該些像素之最大值,且該第二參數值為該區塊影像內該些像素之最小值;以及依據一錯誤擴散核心,將該第一像素之該調整值與該第一像素之該量化值之間的一誤差值,分配至鄰近該第一像素之至少一第二像素,並產生該第二像素之該調整值,其中該第二像素為該些像素其中之一。
  2. 如申請專利範圍第1項所述之影像壓縮方法,其中依據該第一像素之比較結果,量化該第一像素之該調整值為該第一參數值或該第二參數值的步驟包括:當該第一像素之值大於或等於該臨界值時,則量化該第一像素之該調整值為該第一參數值;以及當該第一像素之值小於該臨界值時,則量化該第一像素之該調整值為該第二參數值。
  3. 如申請專利範圍第1項所述之影像壓縮方法,其中該臨界值為該區塊影像內該些像素之平均值。
  4. 如申請專利範圍第1項所述之影像壓縮方法,其中 該錯誤擴散核心為Floyd擴散核心。
  5. 如申請專利範圍第1項所述之影像壓縮方法,其中該錯誤擴散核心為Jarvis擴散核心。
  6. 如申請專利範圍第1項所述之影像壓縮方法,其中該錯誤擴散核心為Stucki擴散核心。
  7. 一種影像壓縮裝置,包括:一擷取模組,接收一區塊影像,其中該區塊影像具有多個像素;一量化模組,耦接該擷取模組,比較一臨界值與一第一像素之一調整值,據以量化該第一像素之該調整值為一第一參數值或一第二參數值,以獲得該第一像素之一量化值,其中該第一像素為該些像素其中之一,其中該第一參數值為該區塊影像內該些像素之最大值,且該第二參數值為該區塊影像內該些像素之最小值;以及一錯誤擴散模組,耦接該量化模組,依據一錯誤擴散核心,將該第一像素之該調整值與該第一像素之該量化值之間的一誤差值,分配至鄰近該第一像素之至少一第二像素,並產生該第二像素之該調整值,其中該第二像素為該些像素其中之一。
  8. 如申請專利範圍第7項所述之影像壓縮裝置,其中當該第一像素之值大於或等於該臨界值時,該量化模組量化該第一像素之值為該第一參數值,且當該第一像素之值小於該臨界值時,該量化模組量化該第一像素之值為該第二參數值。
  9. 如申請專利範圍第7項所述之影像壓縮裝置,其中該臨界值為該區塊影像內該些像素之平均值。
  10. 如申請專利範圍第7項所述之影像壓縮裝置,其中該錯誤擴散核心為Floyd擴散核心。
  11. 如申請專利範圍第7項所述之影像壓縮裝置,其中該錯誤擴散核心為Jarvis擴散核心。
  12. 如申請專利範圍第7項所述之影像壓縮裝置,其中該錯誤擴散核心為Stucki擴散核心。
TW097134454A 2008-09-08 2008-09-08 影像壓縮方法及其裝置 TWI381329B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW097134454A TWI381329B (zh) 2008-09-08 2008-09-08 影像壓縮方法及其裝置
US12/266,569 US8270746B2 (en) 2008-09-08 2008-11-07 Image compression method and device thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW097134454A TWI381329B (zh) 2008-09-08 2008-09-08 影像壓縮方法及其裝置

Publications (2)

Publication Number Publication Date
TW201011698A TW201011698A (en) 2010-03-16
TWI381329B true TWI381329B (zh) 2013-01-01

Family

ID=41799358

Family Applications (1)

Application Number Title Priority Date Filing Date
TW097134454A TWI381329B (zh) 2008-09-08 2008-09-08 影像壓縮方法及其裝置

Country Status (2)

Country Link
US (1) US8270746B2 (zh)
TW (1) TWI381329B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201128574A (en) * 2010-02-11 2011-08-16 Univ Nat Taiwan Science Tech Image data processing systems for hiding secret information and data hiding methods thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6661470B1 (en) * 1997-03-31 2003-12-09 Matsushita Electric Industrial Co., Ltd. Moving picture display method and apparatus
US7212677B2 (en) * 2000-01-11 2007-05-01 Minolta Co., Ltd. Coder, coding method, program, and image forming apparatus for improving image data compression ratio
JP4381360B2 (ja) * 2005-08-30 2009-12-09 シャープ株式会社 画像処理方法、画像処理装置、画像形成装置、コンピュータプログラム及び記録媒体
JP4975002B2 (ja) * 2007-12-20 2012-07-11 キヤノン株式会社 画像処理装置、画像形成装置および画像処理方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Delp, E.J., and Mitchell, O.R.: 'Image compression using block truncation coding', IEEE Trans. Commun., 1979, COMM-27, pp. 1335-1342。 *
Donald E. Knuth: ‘Digital Halftones by Dot Diffusion’, ACM Transactions on Graphics (TOG) TOG Homepage archive Volume 6 Issue 4, Oct. 1987 ACM New York, NY, USA., pp. 245–273。 *
Victor Ostromoukhov:‘A Simple and Efficient Error-Diffusion Algorithm’, SIGGRAPH '01 Proceedings of the 28th annual conference on Computer graphics and interactive techniques ACM New York, NY, USA., 2001, pp. 567–572。 *
連國珍,2007,數位影像處理MATLAB,台北:儒林圖書公司。 *

Also Published As

Publication number Publication date
US20100061647A1 (en) 2010-03-11
TW201011698A (en) 2010-03-16
US8270746B2 (en) 2012-09-18

Similar Documents

Publication Publication Date Title
RU2666234C1 (ru) Аппроксимация восстановления формы сигнала
KR102287947B1 (ko) 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
JP6182644B2 (ja) 階層的vdr符号化における層分解
CN107771392B (zh) 用于高动态范围图像的实时内容自适应感知量化器
EP3375190B1 (en) High dynamic range color conversion correction
US9661328B2 (en) Method of bit allocation for image and video compression using perceptual guidance
US9911179B2 (en) Image decontouring in high dynamic range video processing
Li et al. CNN based post-processing to improve HEVC
CN112913237A (zh) 使用深度神经网络的人工智能编码和人工智能解码方法和设备
US8897580B2 (en) Error diffusion with color conversion and encoding
US10832383B2 (en) Systems and methods for distortion removal at multiple quality levels
CN101080929A (zh) 图像处理装置与图像处理方法
US10129565B2 (en) Method for processing high dynamic range video in order to improve perceived visual quality of encoded content
KR20190127090A (ko) 주관적 화질 대비 영상 압축률 향상을 위한 부호화 방법 및 장치
Agarwal et al. Compressing video calls using synthetic talking heads
TWI381329B (zh) 影像壓縮方法及其裝置
JP2017216625A (ja) 画像符号化装置及びその制御方法
JP4645948B2 (ja) 復号化装置及びプログラム
US11153606B2 (en) Face region detection based light field video compression
US11825088B2 (en) Adaptively encoding video frames based on complexity
KR102471796B1 (ko) 세일리언시 맵을 이용한 인지적 비디오 전처리 방법 및 시스템
CN114363624B (zh) 一种基于敏感度的码率分配特征压缩方法
JP2019068385A (ja) 符号化装置、その制御方法、および制御プログラム、並びに撮像装置
KR102025494B1 (ko) 베이어 영상 압축을 위한 시각적 무손실 압축 기법에 기반한 장치 및 그 방법
US10715772B2 (en) High dynamic range color conversion correction

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees