JP3857297B2 - 画像予測符号化方法及び装置 - Google Patents

画像予測符号化方法及び装置 Download PDF

Info

Publication number
JP3857297B2
JP3857297B2 JP2005366257A JP2005366257A JP3857297B2 JP 3857297 B2 JP3857297 B2 JP 3857297B2 JP 2005366257 A JP2005366257 A JP 2005366257A JP 2005366257 A JP2005366257 A JP 2005366257A JP 3857297 B2 JP3857297 B2 JP 3857297B2
Authority
JP
Japan
Prior art keywords
block
prediction
coefficient
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2005366257A
Other languages
English (en)
Other versions
JP2006197574A (ja
Inventor
セン・ブン チュン
メイ・シェン シェン
ケン・タン ティオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2005366257A priority Critical patent/JP3857297B2/ja
Publication of JP2006197574A publication Critical patent/JP2006197574A/ja
Application granted granted Critical
Publication of JP3857297B2 publication Critical patent/JP3857297B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像予測符号化装置及び方法、画像予測復号化装置及び方法、並びに記録媒体に関する。特に、静止画又は動画である画像のディジタル画像データを、例えば光ディスクなどの記録媒体に記憶し、又は通信回線を伝送するための画像予測符号化装置及び方法、並びに、画像予測復号化装置及び方法に関する。また、上記画像予測符号化方法のステップを含むプログラムを記録した記録媒体、並びに、上記画像予測復号化方法のステップを含むプログラムを記録した記録媒体に関する。
ディジタル画像を効率よく記憶し又は伝送するには、圧縮符号化する必要がある。ディジタル画像を圧縮符号化するための方法として、JPEG(Joint Photographic Experts Group)やMPEG(Motion Picture Experts Group)に代表される離散コサイン変換(以下、DCT変換という。)のほかに、サブバンド符号化やウェーブレット符号化、フラクタル符号化などの波形符号化方法がある。また、画像間の冗長な信号を取り除くには動き補償を用いた画像間予測を行い、差分信号を波形符号化する。
MPEGの方式では、入力画像を複数の16×16のマクロブロックに分割して処理する。1つのマクロブロックをさらに8×8のブロックに分割し、8×8のDCT変換処理を施してから量子化する。これはフレーム内符号化と呼ばれる。
一方、ブロックマッチングをはじめとする動き検出方法で、時間に隣接する別のフレームの中から対象マクロブロックに誤差の最も小さい予測マクロブロックを検出し、検出された予測マクロブロックを対象マクロブロックから減算し、差分マクロブロックを生成し、8×8のDCT変換を施してから量子化する。これをフレーム間符号化と呼び、予測マクロブロックを時間領域の予測信号と呼ぶ。このようにMPEGでは、同じフレームの中から画像を予測していない。
通常の画像は空間的に似ている領域が多く、この性質を用いて空間領域に画像を近似することができる。時間領域の予測信号と同じように、同じフレームの中から予測信号を求めることも可能である。これを空間領域の予測信号と呼ぶ。
空間的に近接する2つの画素値が近いため、空間領域の予測信号は一般的に対象信号に近い位置にある。一方、受信側又は再生側では、原画像がないため、予測信号は過去において符号化し再生された信号を用いる必要がある。この2つの要素から、空間領域の予測信号を高速に生成する必要がある。画素値を復号化し再生した後すぐに予測信号の生成に用いられるからである。
従って、空間領域の予測信号を簡単かつ高精度に生成する必要がある。また、符号化装置及び復号化装置において高速演算可能な構成が要求される。
ところで、画像データの符号化は、JPEG、MPEG1、H.261、MPEG2及びH.263などの多くの国際的標準に広く使用されて来た。後者の標準の各々は符号化能率を更に改善している。すなわち、同じ画質を表現するのに従来の標準に比べてビット数をさらに減少する努力がなされてきた。
動画に対する画像データの符号化は、イントラフレーム符号化と予測フレーム符号化から成りたっている。ここで、イントラフレーム符号化は、1つのフレームの画面内でのフレーム内符号化をいう。例えばMPEG1標準のような代表的なハイブリッド符号化システムにおいては、連続するフレームは次の3つの異なるタイプに分類できる。
(a)イントラフレーム(以下、Iフレームという。)、
(b)予測フレーム(以下、Pフレームという。)、及び
(c)両方向予測フレーム(以下、Bフレームという。)。
Iフレームは他のフレームと独立的に符号化され、すなわち、Iフレームは他のフレームを用いることなく圧縮される。Pフレームは、符号化されたフレーム(それは、Pフレームである。)の内容を予測するために1つ前のフレームを用いることにより動きの検出及び補償を通じて符号化されている。Bフレームは、1つ前のフレームからの情報及びBフレームの中味のデータを予測する後続のフレームからの情報を用いる動きの検出及び補償を用いることにより符号化されている。以前のフレーム及び後続のフレームはIフレームか、又はPフレームである。Iフレームはイントラコードモードに属している。Pフレーム及びBフレームは予測コードモードに属している。
Iフレーム、Pフレーム及びBフレームの符号化の性質が違っているように、その圧縮方法も各々異なっている。Iフレームは、冗長性を減少させるために一時的な予測を使用しないので、Pフレーム及びBフレームに比べてより多くのビット数を必要とする。
ここで、MPEG2を例として説明する。ビットレートを4Mビット/秒とし、画像は、30フレーム/秒の画像と仮定する。一般的には、I、P及びBフレームに用いられるビット数の比は6:3:1である。従ってIフレームは約420Kbits/sを使用し、Bフレームは約70Kbits/sを使用する。なぜならBフレームは両方向から十分に予測されているからである。
図14は、従来技術の画像予測符号化装置の構成を示すブロック図である。DCT変換をブロックに基づいて実行するので、最近の画像符号化方法はすべて、画像をより小さいブロックに分割することを基礎としている。イントラフレーム符号化においては、入力されたディジタル画像信号に対して、図14に示されるように、まず、ブロックサンプリング処理1001が実行される。次いで、ブロックサンプリング処理1001後のこれらのブロックに対して、DCT変換処理1004が実行された後、量子化処理1005及びランレングスホフマン可変長符号化(VLC:Variable Length Coding;エントロピー符号化)処理1006が実行される。一方、予測フレーム符号化においては、入力されたディジタル画像に対して動き補償処理1003が実行され、そして、動き補償されたブロック(すなわち、予測されたブロック)に対してDCT変換処理1004が実行される。次いで、量子化処理1005、及びランレングスホフマンVLC符号化(エントロピー符号化)処理1006が実行される。
ブロックに基づくDCT変換処理1004は、処理対象のブロック内の空間的な冗長性を除去し又は減少させること、並びに、動き検出及び補償処理1002,1003は隣接するフレームの間の一時的な冗長性を除去し又は減少させることは、従来の画像符号化技術から公知である。さらに、DCT変換処理1004及び量子化処理1005の後に実行される、ランレングスホフマンVLC符号化又は他のエントロピー符号化処理1006は、量子化されたDCT変換係数の間の統計的冗長性を除去する。しかしその処理は、画面内のブロックのみに対してのみある。
ディジタル画像は本来的性質として空間的に大きな冗長性を有している。この冗長性は、画像のフレーム内のブロックのみでなく、ブロックを越えてブロックとブロックとの間にも存在している。しかしながら、現実の方法は画像のブロック間の冗長性を除去する方法を使用していないことは、上述から明らかである。
現在の画像符号化手法においては、DCT変換処理1004又は他の変換処理は、ハードウェアの形成及び計算上の拘束条件のためにブロックに基づいて実行される。
空間的な冗長性は、ブロックを基礎とする変換処理によって減少されるが、それは1つのブロック内でのみに限定される。隣接する2つのブロック間の冗長性はあまりうまく考慮されていないが、常に多くのビット数を消費するフレーム内符号化を用いればさらに減少できるであろう。
さらに、ブロックを基礎とするDCT変換処理が、処理対象のブロック内の空間的な冗長性を除去し、又は減少させ、また、動き予測及び補償処理が、隣接する2つのフレーム間の一時的な冗長性を除去し、又は減少させることは、現在の画像符号化技術から公知である。DCT変換処理及び量子化処理の後に実行される、ジグザグスキャン及びランレングスホフマンVLC符号化処理又は他のエントロピー符号化処理は、量子化されたDCT変換係数の中の統計的冗長性を除去するが、なお、それは1つのブロック内に限定される。
ディジタル画像は本来高い空間冗長性を含んでいる。この冗長性はブロックの内部に存在するのみでなく、画像のブロックを越えてそしてブロック間にも存在している。従って、上記のことから明らかなように、現存する方法においては、JPEG、MPEG1及びMPEG2のDC係数の予測を除いて、1つの画像のブロック間の冗長性を除去する方法を全く用いていない。
MPEG1及びMPEG2においては、DC係数の予測は、現在の符号化されているブロックから前の符号化ブロックのDC値を減算することにより実行される。これは予測が適切でない時に適応性又はモードスイッチングを有しない簡単な予測方法である。さらにそれはDC係数を含むだけである。
当該技術分野の現在の状態では、ジグザグスキャンはランレングス符号化の前にすべてのブロックに対して用いられている。ブロックの中味のデータに基づいてスキャンを適応的にする試みはなされていない。
図22は、従来技術の画像予測符号化装置の構成を示すブロック図である。図22において、従来技術の画像予測符号化装置は、ブロックサンプリニングユニット2001、DCT変換ユニット2003、量子化ユニット2004、ジグザグスキャンユニット2005及びエントロピー符号化ユニット2006を備える。本明細書において、「ユニット」という用語は、回路装置を意味する。
イントラフレーム符号化(すなわち、フレーム内符号化)においては、入力された画像信号に対して、ブロックサンプリング処理2001が実行された後、直接に、DCT変換処理2003が実行され、そして、量子化処理2004、ジグザグスキャン処理2005及びエントロピー符号化処理2006が順次実行される。一方、インターフレーム符号化(すなわち、フレーム間符号化、すなわち、予測フレーム符号化)においては、ブロックサンプリング処理2001の後に、動き検出及び補償処理がユニット2011において実行され、次いで、ブロックサンプリング2001からの画像データをユニット2011からの検出値を減算することにより、加算器2002により予測誤差が得られる。さらに、この予測誤差に対して、DCT変換処理2003が実行され、続いて量子化処理2004、ジグザグスキャン処理2005及びエントロピー符号化処理2006が、イントラフレーム符号化と同様に実行される。
図22の画像予測符号化装置内に設けられるローカルデコーダにおいて、逆量子化処理及び逆DCT変換処理はユニット2007及び2008において実行される。イントラフレーム符号化においては、動き検出及び補償された予測値は、ユニット2007及び2008によって再構築された予測誤差に加算器2009によって加算され、その加算値は、局所的に復号化された画像データを意味し、その復号化された画像データは、ローカルデコーダのフレームメモリ2010に記憶される。最終的には、ビットストリームがエントロピー符号化ユニット2010から出力されて、相手方の画像予測復号化装置に送信される。
図23は、従来技術の画像予測復号化装置の構成を示すブロック図である。ビットストリームは、可変長デコーダ(VLD:Variable Length Decoding)ユニット(又はエントロピー復号化ユニット)2021によって復号化され、次いで、復号化された画像データに対して、逆量子化処理及び逆DCT変換処理がユニット2023及び2024において実行される。インターフレーム符号化において、ユニット2027で形成された、動き検出及び補償された予測値は、加算器2025によって再構築された予測誤差に加算され、局所的な復号化画像データが形成される。局所的に復号化された画像データはローカルデコーダのフレームメモリ1026に記憶される。
特開昭63−197185号公報。 特開平2−65583号公報。
現在の画像符号化技術においては、DCT変換処理又は他の変換処理は、ハードウェアの形成及び計算上の拘束条件のために、ブロックを基礎として実行されている。空間的冗長性はブロックを基礎とする変換によって削減されるであろう。しかしながら、それはブロック内のみである。隣接するブロック間の冗長性はあまり十分に考慮されていない。特に、常に多量のビットを消費するイントラフレーム符号化については特に考慮がなされていない。
本発明の第1の目的は、空間領域の予測画像データを簡単に、高速でかつ高精度に生成することができる画像予測符号化装置及び方法、並びに、画像予測復号化装置及び方法を提供することにある。
また、本発明の第2の目的は、従来技術の画像予測符号化装置及び画像予測復号化装置に比較して、ブロック内の冗長性を除去することができ、より効率的に画像データを符号化又は復号化することができる画像予測符号化装置及び方法、並びに、画像予測復号化装置及び方法を提供することにある。
さらに、本発明の第3の目的は、画像データの内部の性質に依存して、重要な変換係数がブロックの異なる区域に集中されるという問題点を解決し、ブロックに対して正しいスキャン方法を決定することによりエントロピー符号化処理の能率を改善することができる画像予測符号化装置及び方法、並びに、画像予測復号化装置及び方法を提供することにある。
またさらに、本発明の第4の目的は、上記画像予測符号化方法又は画像予測復号化方法の各ステップを記録した記録媒体を提供することにある。
本発明に係る画像予測符号化方法は、画像信号を複数のブロックにサンプリングすることと、
上記ブロックの画像信号を、DC係数とAC係数とを有するDCT係数の2次元列に変換することと、
左ブロック(B)又は上ブロック(A)のいずれかから適応的に選択された隣接ブロックのDC係数から、カレントブロック(C)のDC係数を予測することとを含むことを特徴とする。
また、上記画像予測符号化方法において、好ましくは、上記DC係数を予測する前に、上記DCT係数を量子化することをさらに含むことを特徴とする。
さらに、上記画像予測符号化方法において、好ましくは、上記カレントブロック(C)のDC係数の予測は、マクロブロックのすべてのブロックにわたって独立に繰り返されることを特徴とする。
本発明に係る画像予測符号化方法は、画像信号を複数のブロックにサンプリングすることと、
上記ブロックの画像信号を、DC係数とAC係数とを有するDCT係数の2次元列に変換することと、
左ブロック(B)又は上ブロック(A)のいずれかから適応的に選択された隣接ブロックの上記DCT係数から、カレントブロック(C)のDC係数とAC係数とを予測することとを含むことを特徴とする。
本発明に係る上記画像予測符号化方法は、画像信号を複数のブロックにサンプリングすることと、
上記ブロックの画像信号を、DC係数とAC係数とを有するDCT係数の2次元列に変換することと、
左ブロック(B)又は上ブロック(A)のいずれかから適応的に選択された隣接ブロックのDC係数から、カレントブロック(C)のDC係数を予測することと、
上記カレントブロック(C)のAC係数を、
(a)カレントブロックの上記DC係数が上記左ブロック(B)から選択されたとき、上記左ブロック(B)の最初の列と、
(b)カレントブロックの上記DC係数が上記上ブロック(A)から選択されたとき、上記上ブロック(A)の最初の行と
のいずれかの係数の集合から予測することとを含むことを特徴とする。
また、上記画像予測符号化方法において、好ましくは、上記左ブロック(B)又は上記上ブロック(A)のいずれかから選択された上記隣接ブロックのDC係数から、上記カレントブロック(C)のDC係数を最少ビット使用規則に従って予測することを特徴とする。
さらに、上記画像予測符号化方法において、好ましくは、上記カレントブロックのAC係数が上記隣接ブロックから予測されるか否かを示す、指示ビットを供給することをさらに含むことを特徴とする。
本発明に係る画像予測符号化方法は、画像信号を複数のブロックにサンプリングすることと、
上記ブロックの画像信号を、DC係数とAC係数とを有するDCT係数の2次元列に変換することと、
上記DCT係数を、量子化されたDCT値に量子化することと、
左ブロック又は上ブロックのいずれかから適応的に選択された隣接ブロックの上記DC係数から、カレントブロックの量子化されたDC係数を予測することとを含み、
上記カレントブロックの量子化されたDC係数の上記予測に用いるために選択されたブロックの上記DC係数は、上記選択されたブロックの量子化ステップサイズに対する上記カレントブロックの量子化ステップサイズの比によって測定されることを特徴とする。
本発明に係る画像予測符号化方法は、画像信号を複数のブロックにサンプリングすることと、
上記ブロックの画像信号を、DC係数とAC係数とを有するDCT係数の2次元列に変換することと、
上記DCT係数を、量子化されたDCT値に量子化することと、
左ブロック又は上ブロックのいずれかから適応的に選択された隣接ブロックの上記DCT係数から、カレントブロックの量子化されたDC係数と量子化されたAC係数とを予測することとを含み、
上記カレントブロック(C)の上記量子化されたDC係数と上記量子化されたAC係数の上記予測に用いられるために選択されたブロックの上記DCT係数は、上記選択されたブロックの量子化ステップサイズに対する上記カレントブロックの量子化ステップサイズの比によって測定されることを特徴とする。
本発明に係る画像予測符号化方法は、サンプリングされた画像信号のブロックをDCT係数の2次元列に変換することと、
左ブロック又は上ブロックのいずれかから適応的に選択された隣接ブロックのDCT係数からカレントブロックのDCT係数を予測することによって、予測されたDCT変換係数を得ることと、
上記カレントブロックの上記DCT係数から、上記予測されたDCT変換係数を減算することにより、複数の差分DCT係数の2次元列を得ることと、
上記複数の差分DCT係数の2次元列を走査して、DCT係数の1次元列に変換することとを含み、
上記走査は、
(1)上記予測において、上記カレントブロックのAC係数が予測されなかったときのジグザグ走査と、
(2)上記カレントブロックのAC係数が予測され、上記DC予測が左ブロックを参照したときの垂直走査と、
(3)上記カレントブロックのAC係数が予測され、上記DC予測が上ブロックを参照したときの水平走査と
のうち1つによって実行されることを特徴とする。
また、上記画像予測符号化方法において、好ましくは、上記DCT係数の1次元列の可変長符号化を実行することをさらに含むことを特徴とする。
さらに、上記画像予測符号化方法において、好ましくは、上記変換は、サンプリングされた画像信号のブロックを、DCT係数の複数の8×8ブロックに変換することを特徴とする。
またさらに、上記画像予測符号化方法において、好ましくは、上記走査は、
(1)上記予測において上記カレントブロック(C)のAC係数が予測されていないときに、複数のDCT変換係数の8×8ブロックを以下の順序でジグザグ走査する場合と、
0, 1, 5, 6,14,15,27,28;
2, 4, 7,13,16,26,29,42;
3, 8,12,17,25,30,41,43;
9,11,18,24,31,40,44,53;
10,19,23,32,39,45,52,54;
20,22,33,38,46,51,55,60;
21,34,37,47,50,56,59,61;
35,36,48,49,57,58,62,63;
(2)上記予測において上記カレントブロック(C)のAC係数が予測され、上記DC予測が上記左ブロックを参照したときに、以下の順序で垂直走査をする場合と、
0, 4, 6,20,22,36,38,52;
1, 5, 7,21,23,37,39,53;
2, 8,19,24,34,40,50,54;
3, 9,18,25,35,41,51,55;
10,17,26,30,42,46,56,60;
11,16,27,31,43,47,57,61;
12,15,28,32,44,48,58,62;
13,14,29,33,45,49,59,63;
(3)上記予測において上記カレントブロック(C)のAC係数が予測され、上記DC予測が上記上ブロックを参照したときに、以下の順序で水平走査をする場合と、
0, 1, 2, 3,10,11,12,13;
4, 5, 8, 9,17,16,15,14;
6, 7,19,18,26,27,28,29;
20,21,24,25,30,31,32,33;
22,23,34,35,42,43,44,45;
36,37,40,41,46,47,48,49;
38,39,50,51,56,57,58,59;
52,53,54,55,60,61,62,63;
の走査を実行することを特徴とする。
また、上記画像予測符号化方法において、好ましくは、上記左ブロック(B)又は上記上ブロック(A)のいずれかから選択された隣接ブロックのDC係数から、上記カレントブロック(C)のDC係数を最少ビット使用規則に従って予測することを特徴とする。
さらに、上記画像予測符号化方法において、好ましくは、上記カレントブロックのAC係数が上記隣接ブロックから予測されるか否かを示す、指示ビットを供給することをさらに含むことを特徴とする。
第1の発明に係る画像予測符号化装置は、入力される符号化画像データを互いに隣接する複数の小領域の画像データに分割する分割手段と、
上記分割手段によって分割された互いに隣接する複数の小領域の画像データの中で処理対象の小領域の画像データを符号化するときに、上記処理対象の小領域の画像データに隣接する再生された再生小領域の画像データを上記処理対象の小領域の画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとし、上記処理対象の小領域の画像データと上記最適予測小領域の画像データとの差分である差分小領域の画像データを生成する第1の生成手段と、
上記生成手段によって生成された差分小領域の画像データを符号化する符号化手段と、
上記符号化手段によって符号化された差分小領域の画像データを復号化する復号化手段と、
上記復号化手段によって復号化された差分小領域の画像データを上記最適予測小領域の画像データに加算することにより再生された再生小領域の画像データを生成する第2の生成手段とを備える。
また、第2の発明に係る画像予測符号化装置は、入力された符号化画像データを互いに隣接する複数の小領域の画像データに分割する分割手段と、
上記分割手段によって分割された互いに隣接する複数の小領域の中で処理対象の小領域を符号化するときに、上記処理対象の小領域の画像データに隣接する再生された再生小領域の画像データの中から、上記符号化画像データが有意であるか否かを示す入力された有意信号によって示される有意な画像データのみを上記処理対象の小領域の画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとし、上記処理対象の小領域の画像データと上記最適予測小領域の画像データとの差分である差分小領域の画像データを生成する第1の生成手段と、
上記第1の生成手段によって生成された差分小領域の画像データを符号化する符号化手段と、
上記符号化手段によって符号化された差分小領域の画像データを復号化する復号化手段と、
上記復号化手段によって復号化された差分小領域の画像データを上記最適予測小領域の画像データに加算することにより再生された再生小領域の画像データを生成する第2の生成手段とを備える。
さらに、第3の発明に係る画像予測復号化装置は、入力された符号化された画像データ系列を解析して画像差分信号を出力する解析手段と、
上記解析手段から出力される差分画像信号から、再生差分小領域の画像データを復号化する復号化手段と、
所定の画面内予測小領域の画像データを生成するための画像データを格納するラインメモリと、
上記ラインメモリからの画像データに対して予測信号発生処理を実行することにより、上記再生差分小領域の画像データに隣接する再生された画像データを画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとして出力する発生手段と、
上記復号化手段からの再生差分小領域の画像データと、上記発生手段からの最適予測小領域の画像データとを加算して、加算結果の画面内予測小領域を生成するための画像データを出力するとともに、上記ラインメモリに格納する加算手段とを備える。
またさらに、第4の発明に係る画像予測復号化装置は、入力された符号化された画像データ系列を解析して、画像差分信号と、動きベクトル信号と、制御信号とを出力する解析手段と、
上記解析手段から出力される差分画像信号を、再生差分小領域の画像データに復号化する復号化手段と、
上記解析手段から出力される制御信号に基づいて、動き補償手段と発生手段とが選択的に動作させるように制御する切り換え信号を出力する制御手段と、
所定の再生画像データを格納するフレームメモリと、
所定の画面内予測小領域の画像データを生成するための画像データを格納するラインメモリと、
上記制御手段からの切り換え信号に応答して、入力される動きベクトル信号に対して動き補償処理を実行することにより、上記フレームメモリから時間予測小領域の画像データを生成して、最適予測小領域の画像データとして出力する動き補償手段と、
上記制御手段からの切り換え信号に応答して、上記ラインメモリからの画像データに対して予測信号発生処理を実行することにより、上記再生差分小領域の画像データに隣接する再生された画像データを画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとして出力する発生手段と、
上記復号化手段からの再生差分小領域の画像データと、上記発生手段からの最適予測小領域とを加算することにより、加算結果の再生画像データを出力するとともに、上記再生画像データを上記フレームメモリに格納し、上記画面内予測小領域の画像データを生成するための画像データのみを上記ラインメモリに格納する加算手段とを備える。
また、第5の発明に係る画像予測復号化装置は、入力された符号化された画像データ系列を解析して、圧縮形状信号と画像差分信号とを出力する解析手段と、
上記解析手段から出力される圧縮形状信号を、再生形状信号に復号化する第1の復号化手段と、
上記解析手段から出力される差分画像信号を、再生差分小領域の画像データに復号化する第2の復号化手段と、
所定の画面内予測小領域の画像データを生成するための画像データを格納するラインメモリと、
上記ラインメモリからの画像データに対して予測信号処理を実行することにより、上記再生差分小領域の画像データに隣接する再生された画像データの中から、上記再生形状信号によって示される有意な画像データのみを画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとして出力する発生手段と、
上記第2の復号化手段からの再生差分小領域の画像データと、上記発生手段からの最適予測小領域とを加算することにより、加算結果の画像データを出力するとともに、上記画面内予測小領域の画像データを生成するための画像データのみを上記ラインメモリに格納する加算手段とを備える。
さらに、第6の発明に係る画像予測復号化装置は、入力された符号化された画像データ系列を解析して、圧縮形状信号と、画像差分信号と、動きベクトル信号と、制御信号とを出力する解析手段と、
上記解析手段から出力される圧縮形状信号を、再生形状信号に復号化する第1の復号化手段と、
上記解析手段から出力される差分画像信号を、再生差分小領域に復号化する第2の復号化手段と、
上記解析手段から出力される制御信号に基づいて、動き補償手段と発生手段とを選択的に動作させるように制御する切り換え信号を出力する制御手段と、
所定の再生画像データを格納するフレームメモリと、
所定の画面内予測小領域の画像データを生成するための画像データを格納するラインメモリと、
上記制御手段から出力される切り換え信号に応答して、上記解析手段から出力される動きベクトル信号に基づいて、上記フレームメモリからの再生画像データに対して動き補償処理を実行することにより、時間予測小領域の画像データを発生して、最適予測小領域の画像データとして出力する動き補償手段と、
上記制御手段から出力される切り換え信号に応答して、上記ラインメモリからの画像データに対して予測信号処理を実行することにより、上記再生差分小領域の画像データに隣接する再生された画像データの中から、上記再生形状信号によって示される有意な画像データのみを画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとして出力する発生手段と、
上記第2の復号化手段からの再生差分小領域の画像データと、上記発生手段からの最適予測小領域とを加算することにより、加算結果の再生画像データを出力するとともに、上記再生画像データを上記フレームメモリに格納し、上記画面内予測小領域を生成するための画像データのみを上記ラインメモリに格納する加算手段とを備える。
第7の発明に係る画像予測符号化装置は、入力された画像信号をそれぞれ二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
上記サンプリング手段によってサンプリングされたブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データを決定し選択して出力し、上記選択された予測ブロックを表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第1の加算手段と、
上記第1の加算手段から出力される予測誤差の係数データを量子化する量子化手段と、
上記量子化手段からの予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記量子化手段からの予測誤差の係数データを逆量子化して、復元されたブロックの係数データを出力する逆量子化手段と、
上記決定手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、復元されたブロックの係数データを出力するとともに、上記ブロックメモリに格納する第2の加算手段と、
上記第2の加算手段から出力されるブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段とを備える。
また、第8の発明に係る画像予測符号化装置は、入力された画像信号を二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
上記サンプリング手段によってサンプリングされた複数のブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
上記変換手段からの変換領域の係数データを量子化する量子化手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データを決定し選択して出力し、上記選択された予測ブロックを表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第1の加算手段と、
上記第1の加算手段からの予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記第1の加算手段からの予測誤差の係数データを、上記決定手段から出力される予測ブロックの係数データを加算することにより、量子化されたカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第2の加算手段と、
上記第2の加算手段から出力されるカレントブロックの係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段からのカレントブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段とを備える。
さらに、第9の発明に係る画像予測符号化装置は、入力された画像信号をそれぞれ二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
入力されるブロックの画像データに対して動き補償処理を実行することにより、動き補償されたブロックの予測誤差の画像データを生成して出力する補償手段と、
上記サンプリング手段から出力されるブロックの画像データから、上記補償手段から出力されるブロックの予測誤差の画像データを減算して、減算結果のブロックの画像データを出力する第1の加算手段と、
上記第1の加算手段から出力されるブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データを決定し選択して出力し、上記選択された予測ブロックを表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第2の加算手段と、
上記第2の加算手段から出力される予測誤差の係数データを量子化する量子化手段と、
上記量子化手段からの予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記量子化手段からの予測誤差の係数データを逆量子化して、復元されたブロックの係数データを出力する逆量子化手段と、
上記決定手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、復元されたブロックの係数データを出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段と、
上記逆変換手段からの復元されたブロックの画像データに、上記補償手段から出力される動き補償されたブロックの予測誤差の画像データを加算することにより、復元されたブロックの画像データを上記補償手段に出力する第4の加算手段とを備える。
またさらに、第10の発明に係る画像予測符号化装置は、入力された画像信号を二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
入力されるブロックの画像データに対して動き補償処理を実行することにより、動き補償されたブロックの予測誤差の画像データを生成して出力する補償手段と、
上記サンプリング手段から出力されるブロックの画像データから、上記補償手段から出力されるブロックの予測誤差の画像データを減算して、減算結果のブロックの画像データを出力する第1の加算手段と、
上記第1の加算手段から出力されるブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
上記変換手段からの変換領域の係数データを量子化する量子化手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データを決定し選択して出力し、上記選択された予測ブロックを表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第2の加算手段と、
上記第2の加算手段からの予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記第2の加算手段からの予測誤差の係数データを、上記決定手段から出力される予測ブロックの係数データを加算することにより、量子化されたカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるカレントブロックの係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段からのカレントブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段と、
上記逆変換手段からの復元されたブロックの画像データに、上記補償手段から出力される動き補償されたブロックの予測誤差の画像データを加算することにより、復元されたブロックの画像データを上記補償手段に出力する第4の加算手段とを備える。
第11の発明に係る画像予測復号化装置は、第7の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記復号化手段から出力される予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記別の予測手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段とを備える。
また、第12の発明に係る画像予測復号化装置は、第8の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記予測手段から出力される予測ブロックの係数データを、上記復号化手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力される予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段とを備える。
さらに、第13の発明に係る画像予測復号化装置は、第9の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記復号化手段から出力される予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記別の予測手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データに対して動き補償処理を実行することにより、動き補償の予測誤差データを出力する別の補償手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データから、上記別の補償手段から出力される動き補償の予測誤差データを減算して、減算結果の復元されたブロックの画像データを出力する第5の加算手段とを備える。
またさらに、第14の発明に係る画像予測復号化装置は、第10の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記予測手段から出力される予測ブロックの係数データを、上記復号化手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力される予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データに対して動き補償処理を実行することにより、動き補償の予測誤差データを出力する別の補償手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データから、上記別の補償手段から出力される動き補償の予測誤差データを減算して、減算結果の復元されたブロックの画像データを出力する第5の加算手段とを備える。
第15の発明に係る画像予測符号化装置は、入力された画像信号をそれぞれ二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
上記サンプリング手段によってサンプリングされたブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データ及びスキャン方法を決定し選択して出力し、上記選択された予測ブロック及びスキャン方法を表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第1の加算手段と、
上記第1の加算手段から出力される予測誤差の係数データを量子化する量子化手段と、
上記量子化手段からの予測誤差の係数データに対して上記決定手段によって決定されたスキャン方法でスキャン処理を実行して、スキャン処理後の予測誤差の係数データを出力するスキャン手段と、
上記スキャン手段から出力されるスキャン処理後の予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記量子化手段からの予測誤差の係数データを逆量子化して、復元されたブロックの係数データを出力する逆量子化手段と、
上記決定手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、復元されたブロックの係数データを出力するとともに、上記ブロックメモリに格納する第2の加算手段と、
上記第2の加算手段から出力されるブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段とを備える。
また、第16の発明に係る画像予測符号化装置は、入力された画像信号を二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
上記サンプリング手段によってサンプリングされた複数のブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
上記変換手段からの変換領域の係数データを量子化する量子化手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データ及びスキャン方法を決定し選択して出力し、上記選択された予測ブロック及びスキャン方法を表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第1の加算手段と、
上記第1の加算手段からの予測誤差の係数データに対して上記決定手段によって決定されたスキャン方法でスキャン処理を実行して、スキャン処理後の予測誤差の係数データを出力するスキャン手段と、
上記スキャン手段から出力されるスキャン処理後の予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記第1の加算手段からの予測誤差の係数データを、上記決定手段から出力される予測ブロックの係数データを加算することにより、量子化されたカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第2の加算手段と、
上記第2の加算手段から出力されるカレントブロックの係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段からのカレントブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段とを備える。
さらに、第17の発明に係る画像予測符号化装置は、入力された画像信号をそれぞれ二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
入力されるブロックの画像データに対して動き補償処理を実行することにより、動き補償されたブロックの予測誤差の画像データを生成して出力する補償手段と、
上記サンプリング手段から出力されるブロックの画像データから、上記補償手段から出力されるブロックの予測誤差の画像データを減算して、減算結果のブロックの画像データを出力する第1の加算手段と、
上記第1の加算手段から出力されるブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データ及びスキャン方法を決定し選択して出力し、上記選択された予測ブロック及びスキャン方法を表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第2の加算手段と、
上記第2の加算手段から出力される予測誤差の係数データを量子化する量子化手段と、
上記量子化手段からの予測誤差の係数データに対して上記決定手段によって決定されたスキャン方法でスキャン処理を実行して、スキャン処理後の予測誤差の係数データを出力するスキャン手段と、
上記スキャン手段から出力されるスキャン処理後の予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記量子化手段からの予測誤差の係数データを逆量子化して、復元されたブロックの係数データを出力する逆量子化手段と、
上記決定手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、復元されたブロックの係数データを出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段と、
上記逆変換手段からの復元されたブロックの画像データに、上記補償手段から出力される動き補償されたブロックの予測誤差の画像データを加算することにより、復元されたブロックの画像データを上記補償手段に出力する第4の加算手段とを備える。
またさらに、第18の発明に係る画像予測符号化装置は、入力された画像信号を二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
入力されるブロックの画像データに対して動き補償処理を実行することにより、動き補償されたブロックの予測誤差の画像データを生成して出力する補償手段と、
上記サンプリング手段から出力されるブロックの画像データから、上記補償手段から出力されるブロックの予測誤差の画像データを減算して、減算結果のブロックの画像データを出力する第1の加算手段と、
上記第1の加算手段から出力されるブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
上記変換手段からの変換領域の係数データを量子化する量子化手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データ及びスキャン方法を決定し選択して出力し、上記選択された予測ブロック及びスキャン方法を表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第2の加算手段と、
上記第2の加算手段からの予測誤差の係数データに対して上記決定手段によって決定されたスキャン方法でスキャン処理を実行して、スキャン処理後の予測誤差の係数データを出力するスキャン手段と、
上記スキャン手段から出力されるスキャン処理後の予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記第2の加算手段からの予測誤差の係数データを、上記決定手段から出力される予測ブロックの係数データを加算することにより、量子化されたカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるカレントブロックの係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段からのカレントブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段と、
上記逆変換手段からの復元されたブロックの画像データに、上記補償手段から出力される動き補償されたブロックの予測誤差の画像データを加算することにより、復元されたブロックの画像データを上記補償手段に出力する第4の加算手段とを備える。
第19の発明に係る画像予測復号化装置は、第15の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記復号化手段から出力される予測誤差の係数データに対して、上記抽出手段によって抽出された指示ビットが示すスキャン方法に基づいて、逆スキャン処理を実行して、逆スキャン処理後の予測誤差の係数データを出力する逆スキャン手段と、
上記逆スキャン手段から出力される逆スキャン処理後の予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記別の予測手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段とを備える。
また、第20の発明に係る画像予測復号化装置は、第16の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記復号化手段から出力される予測誤差の係数データに対して、上記抽出手段によって抽出された指示ビットが示すスキャン方法に基づいて、逆スキャン処理を実行して、逆スキャン処理後の予測誤差の係数データを出力する逆スキャン手段と、
上記予測手段から出力される予測ブロックの係数データを、上記逆スキャン手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力される予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段とを備える。
さらに、第21の発明に係る画像予測復号化装置は、第17の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記復号化手段から出力される予測誤差の係数データに対して、上記抽出手段によって抽出された指示ビットが示すスキャン方法に基づいて、逆スキャン処理を実行して、逆スキャン処理後の予測誤差の係数データを出力する逆スキャン手段と、
上記逆スキャン手段から出力される逆スキャン処理後の予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記別の予測手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データに対して動き補償処理を実行することにより、動き補償の予測誤差データを出力する別の補償手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データから、上記別の補償手段から出力される動き補償の予測誤差データを減算して、減算結果の復元されたブロックの画像データを出力する第5の加算手段とを備える。
またさらに、第22の発明に係る画像予測復号化装置は、第18の発明に係る画像予測符号化装置に対応して設けられる画像予測復号化装置であって、
上記画像予測符号化装置から受信された受信データから指示ビットを抽出する抽出手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記抽出手段によって抽出された指示ビットが示す予測ブロックに基づいて、上記ブロックメモリに格納された以前に復元されたブロックの係数データを用いて、上記受信データに含まれる現時点のカレントブロックの係数データに対して予測ブロックの係数データを生成して出力する別の予測手段と、
上記受信データをエントロピー復号化して、復号化された予測誤差の係数データを出力する復号化手段と、
上記復号化手段から出力される予測誤差の係数データに対して、上記抽出手段によって抽出された指示ビットが示すスキャン方法に基づいて、逆スキャン処理を実行して、逆スキャン処理後の予測誤差の係数データを出力する逆スキャン手段と、
上記予測手段から出力される予測ブロックの係数データを、上記逆スキャン手段から出力される予測誤差の係数データに加算することにより、現時点のカレントブロックの係数データを復元して出力するとともに、上記ブロックメモリに格納する第3の加算手段と、
上記第3の加算手段から出力される予測誤差の係数データを逆量子化して出力する逆量子化手段と、
上記逆量子化手段から出力されるカレントブロックの係数データを逆変換して、復元されたカレントブロックの画像データを出力する別の逆変換手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データに対して動き補償処理を実行することにより、動き補償の予測誤差データを出力する別の補償手段と、
上記別の逆変換手段から出力されるカレントブロックの画像データから、上記別の補償手段から出力される動き補償の予測誤差データを減算して、減算結果の復元されたブロックの画像データを出力する第5の加算手段とを備える。
また、第23の発明に係る画像予測符号化方法は、上記画像予測符号化装置における各手段をそれぞれ各ステップに置き換えたステップを含む。
さらに、第24の発明に係る画像予測復号化方法は、上記画像予測復号化装置における各手段をそれぞれ各ステップに置き換えたステップを含む。
また、第25の発明に係る記録媒体は、上記画像予測符号化方法における各ステップを含むプログラムを記録した記録媒体である。
さらに、第26の発明に係る記録媒体は、上記画像予測復号化方法における各ステップを含むプログラムを記録した記録媒体である。
本発明に係る画像予測符号化装置によれば、入力される符号化画像データを互いに隣接する複数の小領域の画像データに分割する分割手段と、
上記分割手段によって分割された互いに隣接する複数の小領域の画像データの中で処理対象の小領域の画像データを符号化するときに、上記処理対象の小領域の画像データに隣接する再生された再生小領域の画像データを上記処理対象の小領域の画面内予測小領域の画像データとし、上記画面内予測小領域の画像データを最適予測小領域の画像データとし、上記処理対象の小領域の画像データと上記最適予測小領域の画像データとの差分である差分小領域の画像データを生成する第1の生成手段と、
上記生成手段によって生成された差分小領域の画像データを符号化する符号化手段と、
上記符号化手段によって符号化された差分小領域の画像データを復号化する復号化手段と、
上記復号化手段によって復号化された差分小領域の画像データを上記最適予測小領域の画像データに加算することにより再生された再生小領域の画像データを生成する第2の生成手段とを備える。
従って、処理対象の小領域の画像データに隣接する再生された画素値を画面内予測信号の画素値とするだけで、従来技術に比較して低い演算量で簡単に高精度な予測信号を生成することができ、フレーム内符号化のビット数を削減することができるという特有の効果が得られる。
また、本発明に係る画像予測符号化装置によれば、入力された画像信号をそれぞれ二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
上記サンプリング手段によってサンプリングされたブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データを決定し選択して出力し、上記選択された予測ブロックを表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第1の加算手段と、
上記第1の加算手段から出力される予測誤差の係数データを量子化する量子化手段と、
上記量子化手段からの予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記量子化手段からの予測誤差の係数データを逆量子化して、復元されたブロックの係数データを出力する逆量子化手段と、
上記決定手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、復元されたブロックの係数データを出力するとともに、上記ブロックメモリに格納する第2の加算手段と、
上記第2の加算手段から出力されるブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段とを備える。
従って、現時点の符号化効率を増大させる新しい画像予測符号化装置及び画像予測復号化装置を提供することができる。当該装置では、符号化効率を上げるためには複雑な手段は必要とせず、その回路構成は、非常に簡単で容易に形成できる。
さらに、本発明に係る画像予測符号化装置によれば、入力された画像信号をそれぞれ二次元配列の画素値を含む複数のブロックの画像データにサンプリングするサンプリング手段と、
上記サンプリング手段によってサンプリングされたブロックの画像データを所定の変換領域の係数データに変換する変換手段と、
復元されたブロックの係数データを格納するブロックメモリと、
上記ブロックメモリに格納された前に再構築されたブロックの係数データに基づいて、上記変換手段によって変換されたブロックの係数データに対して複数の予測ブロックの係数データを形成する予測手段と、
上記予測手段によって形成された複数の予測ブロックの係数データのうち、最も効率が良い予測ブロックの係数データ及びスキャン方法を決定し選択して出力し、上記選択された予測ブロック及びスキャン方法を表す指示子を指示ビットの形式で画像予測復号化装置に送信する決定手段と、
上記決定手段によって選択された予測ブロックの係数データを、現時点のカレントブロックの係数データから減算することにより、減算結果の予測誤差の係数データを出力する第1の加算手段と、
上記第1の加算手段から出力される予測誤差の係数データを量子化する量子化手段と、
上記量子化手段からの予測誤差の係数データに対して上記決定手段によって決定されたスキャン方法でスキャン処理を実行して、スキャン処理後の予測誤差の係数データを出力するスキャン手段と、
上記スキャン手段から出力されるスキャン処理後の予測誤差の係数データをエントロピー符号化して、符号化された予測誤差の係数データを画像予測復号化装置に送信する符号化手段と、
上記量子化手段からの予測誤差の係数データを逆量子化して、復元されたブロックの係数データを出力する逆量子化手段と、
上記決定手段から出力される予測ブロックの係数データを、上記逆量子化手段から出力される予測誤差の係数データに加算することにより、復元されたブロックの係数データを出力するとともに、上記ブロックメモリに格納する第2の加算手段と、
上記第2の加算手段から出力されるブロックの係数データを逆変換することにより、復元されたブロックの画像データを生成する逆変換手段とを備える。
従って、隣接するブロックを越えて変換領域の中の冗長性を削減又は除去するのに非常に効果的であり、使用ビットのビット数を削減し、その結果、符号化の効率を大幅に改善することができる。これは新しいビデオ圧縮アルゴリズムにおけるツールとしても有用である。
以下、本発明に係る好ましい実施形態について、添付の図面を参照して説明する。
<第1の実施形態グループ>
第1の実施形態グループは、第1の乃至第4の実施形態を含む。
<第1の実施形態>
図1は、本発明に係る第1の実施形態である画像予測符号化装置の構成を示すブロック図である。
図1において、101は入力端子、102は第1の加算器、103は符号化器、106は出力端子、107は復号化器、110は第2の加算器、111はラインメモリ、112は予測信号発生器である。
以下、画像予測符号化装置の構成及び動作について説明する。入力端子101に、符号化の処理対象となる画像データが入力される。ここで、入力された画像データは複数の隣接する小領域に分割される。
図2において、8×8の小領域に分割された場合の入力された画像データの画像を示し、図3において、三角形小領域に分割された場合の入力された画像データの画像を示す。複数の小領域の画像データを順次に符号化するが、処理対象の小領域の画像データは、入力端子101及びライン113を介して加算器102に入力される。一方、予測信号発生器112は、画面内予測小領域の画像データを発生し、発生された画像データを最適予測小領域の画像データとして、ライン121を介して加算器102に出力する。
加算器102は、処理対象の小領域における入力された画像データの画素値から、予測信号発生器112からの最適予測小領域の対応する画素値を減算し、減算結果の差分小領域の画像データを生成して符号化器103に出力して、圧縮符号化処理を実行する。本実施形態では、符号化器103はDCT変換器104と量子化器(Q)105を備え、差分小領域の画像データは、DCT変換器104によって周波数領域の画像信号に変換され、DCT変換係数を得る。次いで、DCT変換係数は、量子化器105によって量子化される。量子化された小領域の画像データはライン116を介して出力端子106に出力され、さらに可変長又は固定長の符号に変換された後、例えば光ディスクなどの記録媒体に記憶され又は通信回線を介して伝送される(図示せず。)。
同時に、量子化された小領域の画像データは復号化器107に入力され、ここで、当該復号化器107は、逆量子化器108と逆DCT変換器109とを備え、入力された小領域の画像データを、伸長差分小領域の画像データに復元する。本実施形態では、入力された小領域の画像データは、逆量子化器108によって逆量子化された後、逆量子化された画像データは、逆離散コサイン変換器(以下、逆DCT変換器という。)109によって空間領域の画像信号に変換される。このように得られた伸長差分小領域の画像データは加算器110に出力され、加算器110は、伸長差分小領域の画像データに、予測信号発生器112からライン121とライン122を介して出力される最適予測画像信号を加算して、再生小領域の画像データを生成し、再生小領域の画像データの中から、画面内予測画像信号を生成するための再生画素値をラインメモリ111に格納する。予測信号発生器112は以下のように、画面内予測小領域の画像データを発生する。すなわち、予測信号発生器112は、処理対象の小領域の画像データに隣接する再生された画像データの画素値を、画面内予測小領域の画像データの画素値として発生する。
図2において、ブロック200を処理対象の小領域とすると、隣接する再生された画像データの画素値はa0、a1、a2、…、a6、a7、b0、b1、b2、…、b6、b7である。図3において、三角形301を処理対象の小領域とすると、隣接する再生された画像データの画素値はg0、g1、…、g4、f0、f1、f2、…、f7、f8である。また、図3の三角形300を処理対象の小領域とすると、隣接する再生された画像データの画素値はe0、h0、h1、…、h4である。これらの画素値をラインメモリ111に格納する。予測信号発生器112はラインメモリ111をアクセスし隣接する画像データの画素値を画面内予測小領域の画像データの画素値として読み出す。
図4及び図5はそれぞれ、図1の画像予測符号化装置に用いられる予測信号発生器の第1及び第2の実施例の構成を示すブロック図である。
図4において、処理対象の小領域に対して水平方向に隣接する画素値a0、a1、a2、…、a6、a7はラインメモリ111から予測信号発生器112に入力され、予測信号発生器112内の発生器401は、水平方向に同一の画素を例えば8回繰り返して出力することにより、画面内予測小領域の画像データ403を生成する。ここで、画面内予測小領域の画像データ403は処理対象の小領域に対して垂直方向に隣接する画素が存在しない場合に用いられる。
図5において、処理対象の小領域に対して垂直方向に隣接する画素値b0、b1、b2、…、b6、b7がラインメモリ111から予測信号発生器112に入力され、予測信号発生器112内の発生器402は、垂直方向に画素を例えば8回繰り返して出力することにより、画面内予測小領域の画像データ404を生成する。ここで、画面内予測小領域の画像データ404は、処理対象の小領域に対して水平方向に隣接する画素がない場合に用いられる。水平方向及び垂直方向共に隣接する画素値が存在する場合、図6に示す第3の実施例のように画面内予測小領域の画像データを生成する。
図6は、図1の画像予測符号化装置に用いられる予測信号発生器の第3の実施例の構成を示すブロック図である。
図6において、発生器401によって発生された画面内予測小領域の画像データ403(図5参照。)と、発生器402によって発生された画面内予測小領域の画像データ404とは加算器500に入力され、加算器500は、入力された2つの画像データの和を2で除算することにより、これら2つの画像データを平均化する。このように、発生器401,402により隣接する再生された画素を繰り返して出力し、加算器500により平均化演算を行うだけなので、画面内予測小領域の画像データを高速に生成することができる。なお、隣接する2つの画像データの画素値を線形補間することにより画面内予測小領域の画像データを生成してもよい。
図7は、図1の画像予測符号化装置に用いられる予測信号発生器の第4の実施例の構成を示すブロック図である。
図7において、処理対象の小領域に対して水平方向に隣接する画像データの画素値a0、a1、a2、…、a6、a7は、ラインメモリ111から発生器401に入力され、発生器401は、水平方向に画素を繰り返して出力することにより第1の画面内予測小領域の画像データを生成する。一方、処理対象の小領域に対して垂直方向に隣接する画素値b0、b1、b2、…、b6、b7は、ラインメモリ111から発生器402に入力され、発生器402は、垂直方向に画素を繰り返して出力することにより第2の画面内予測小領域の画像データを生成する。第1の画面内予測小領域の画像データと、第2の画面内予測小領域の画像データは加算器500に入力され、これら2つの画像データを平均化することにより第3の画面内予測小領域の画像データを生成する。
一方、処理対象の小領域の画像データは、ライン616を介して誤差計算器601,602,603に入力される。ここで、上記第1の画面内予測小領域の画像データと、処理対象の小領域の画像データは、誤差計算器601に入力され、誤差計算器601はそれら2つの画像データの誤差の絶対値である第1の絶対誤差を計算して比較器604に出力する。また、上記第2の画面内予測小領域の画像データと、処理対象の小領域の画像データは誤差計算器602に入力され、誤差計算器602はこれら2つの画像データの誤差の絶対値である第2の絶対誤差を計算して比較器604に出力する。さらに、上記第3の画面内予測小領域の画像データと、処理対象の小領域の画像データは、誤差計算器603に入力され、誤差計算器603はこれら2つの画像データの誤差の絶対値である第3の絶対誤差を計算して比較器604に出力する。
比較器604は、入力される3つの絶対誤差を互いに比較して、絶対誤差の最も小さいものを決定し、それに対応する画面内予測小領域の画像データをライン121に出力するようにスイッチ605を制御する。比較器604は、同時に、第1、第2及び第3の画面内予測小領域の画像データを識別するための識別子をライン615を介して受信側又は再生側の装置に出力する。この識別子により、受信側又は再生側では画面内予測小領域の画像データが一意に決まる。このように誤差の最も小さい画面内予測小領域の画像データを用いることによって、符号化時の差分信号を抑圧することができ、発生ビット数を削減することができる。
<第2の実施形態>
図8は、本発明に係る第2の実施形態である画像予測符号化装置の構成を示すブロック図であり、図1と同様のものは同一の符号を付している。 図8の画像予測符号化装置は、図1の画像予測符号化装置に比較して、動き検出器700、動き補償器701、最適モード選択器703とフレームメモリ702を追加して備えたことを特徴とする。
以下、図8の画像予測符号化装置の構成及び動作について説明する。
入力端子101を介して、第1の実施形態と同様に、入力された処理対象の小領域の画像データが加算器102に入力され、加算器102は、処理対象の小領域の画像データを、最適モード選択器703からライン121を介して入力される最適予測小領域の画像データから減算した後、減算結果の画像データを符号化器103に出力する。符号化器103は、入力される減算結果の画像データを圧縮符号化して出力端子106を介して出力すると同時に、圧縮符号化された小領域の画像データを復号化器107に出力して伸長復号化させた後、加算器110に出力して、伸長復号化された画像データを最適予測小領域の画像データと加算する。
次いで、第1の実施形態と同様に、画面内予測小領域の画像データを生成するために用いられる画像データの画素値のみをラインメモリ111に格納する一方、再生された画像の画素値をすべてフレームメモリ702に格納する。
次の画像の画像データが入力端子101を介して入力されるときに、動き検出器700には、処理対象の小領域の画像データと、フレームメモリ702に格納された再生画像データとが入力され、動き検出器700は、ブロックマッチングなどの方法で画像の動きを検出し、動きベクトルをライン705を介して出力する。出力された動きベクトルは、例えば可変長符号化して記憶又は伝送される(図示せず。)と同時に動き補償器701に送られる。動き補償器701は、動きベクトルに基づいてフレームメモリ702の再生画像から時間予測小領域の画像データを生成して、最適モード選択器703に出力する。動き検出処理及び動き補償処理においては、前方予測と、後方予測と、両方向予測とがあり、これらの方法は、例えば米国特許第5,193,004号明細書に開示されている。
一方、予測信号発生器112は、第1の実施形態と同様に、画面内予測小領域の画像データを発生して最適モード選択器703に出力すると同時に、処理対象の小領域の画像データを最適モード選択器703に出力する。最適モード選択器703は、画面内予測小領域の画像データと、時間予測小領域の画像データとから、処理対象の小領域の画像データに最も誤差(例えば、画素毎の差の絶対値の和)の小さい画像データを選択し、選択された画像データを最適予測小領域の画像データとして加算器102に出力する。また、どの予測小領域の画像データが選択されたかを示す識別子をライン709を介して受信側又は再生側に出力して伝送する。
このようにフレーム間動き補償符号化の画像データに、画面内予測を導入することによりフレーム間の動きベクトルを伝送する必要がないため、ビット数をさらに削減できる。
第1と第2の実施形態では、画面全体に有意な画素が存在する場合である。画面内に有意であるとそうでない画素が存在する場合がある。例えば、クロマキーで撮影された画像では、被写体を表す画素は有意なもので、背景となるブルーなど領域を現す画素は有意でない画素である。有意な物体のテキスチャー及びその形状を符号化して伝送することにより、物体単位の再生表示が可能である。このような入力画像に対して、予測信号発生器112で画面内予測小領域の画像データを生成する場合、有意でない画素値を用いることができない。
図9乃至図11は有意な画素と有意でない画素をもつ入力画像の模式図を示す。本実施形態においては、画素が有意であるかどうかを示すには形状信号を用いる。形状信号を所定の方法で圧縮符号化して受信側又は再生側に伝送する。形状を符号化する方法としては、チェーン符号化などの方法がある。圧縮された形状信号をまた伸長再生し、再生された形状信号を用いて以下に述べるように画面内予測信号を生成する。
図9においては、形状曲線800が境界線で、矢印の示す方向が物体の内部であって、物体の内部の画像データは有意な画素から構成される。処理対象の小領域802に隣接する再生された画素の中で、b4、b5、b6、b7が有意な画素で、これらの画素値のみを繰り返して処理対象の小領域802の画面内予測小領域の画素値とする。
また、図10においては、形状曲線804が境界線で、矢印の示す方向が物体の内部であって、物体の内部の画像データは有意な画素から構成される。処理対象の小領域805に隣接する再生された画素の中で、a4、a5、a6、a7が有意な画素であって、これらの画素値のみを繰り返して処理対象の小領域805の画面内予測小領域の画素値とする。
さらに、図11においては、曲線808が境界線で、矢印の示す方向が物体の内部であって、物体の内部の画像データは有意な画素から構成される。処理対象の小領域810に隣接する再生された画素の中で、a5、a6、a7、b4、b5、b6、b7が有意な画素であって、これらの画素値のみを繰り返して出力し、2つの画素値が重なるところでは、それらの画素値を平均化した値を処理対象の小領域810の画面内予測小領域の画素値とする。
図11において、例えば、処理対象の小領域810の画素z77の値はa7とb7の平均値とする。また、画素値が1つもないところでは、水平方向及び垂直方向に隣接する2つの画素値の平均値をとる。例えば、画素z14の値はa5とb4の平均値とする。このように、任意の形状をもつ画像の画面予測小領域の画像データを生成する。
以上の実施形態においては、正方形状に分割された小領域について説明したが、本発明はこれに限らず、図3と同様に、画面を三角形の小領域に分割してもよい。この場合においても、画像処理が同様に実行される。
また、別の実施形態として、有意な画素値だけを用いて平均値を求めて、その平均値を画面内予測小領域の画素値としてもよい。具体的には、図9では、画素b4、b5、b6、b7の平均値を計算し、計算された平均値を画面内予測小領域の画素値とする。図10では、画素a4、a5、a6、a7の平均値を計算し、計算された平均値を画面内予測小領域の画素値とする。図11では、画素a5、a6、a7、b4、b5、b6、b7の平均値を計算し、画面内予測小領域の画素値とする。
<第3の実施形態>
図12は、本発明に係る第3の実施形態である画像予測復号化装置の構成を示すブロック図である。
図12において、901は入力端子、902はデータ解析器、903は復号化器、906は加算器、907は出力端子、908はコントローラ、909は動き補償器、910は予測信号発生器、911はラインメモリ、912はフレームメモリである。
以下、図12の画像予測復号化装置の構成及び動作について説明する。図12において、圧縮符号化された画像データはデータ解析器902に入力され、データ解析器902は入力された画像データを解析して、圧縮差分小領域の画像データをライン915を介して復号化器903に出力し、また、制御信号をライン926を介してコントローラ908に出力し、さらには、上述の動きベクトル(存在する場合のみ)を動き補償器909に出力する。復号化器903は、逆量子化器904と、逆DCT変換器905を備え、圧縮された差分小領域の画像データを伸長して、伸長差分小領域の画像データに復元する。
本実施形態では、圧縮された差分小領域の画像データは、逆量子化器904により逆量子化された後、逆量子化後の周波数領域の画像データは、逆DCT変換器905により空間領域の画像データに変換される。変換後の伸長差分小領域の画像データは加算器906に入力され、加算器906は、入力される伸長差分小領域の画像データを、動き補償器923又は予測信号発生器922からスイッチ913及びライン924を介して送られる最適予測小領域の画像データに加算し、加算結果の再生小領域の画像データを生成する。加算器906は、再生された画像データをライン917を介して出力端子907に出力すると同時に、フレームメモリ912に格納する。また、画面内予測小領域の画像を生成するために用いられる画像データの画素値をラインメモリ911に格納する。
最適予測小領域の画像データは、データ解析器902からの制御信号に基づいてコントローラ908によって決定されてスイッチ913の切り換えが制御される。画面内予測小領域の画像データがコントローラ908によって選択される場合、スイッチ913はライン924をライン922に接続し、コントローラ908からの制御信号に応答して、予測信号発生器910はラインメモリ911をアクセスして、隣接する再生画素値を画面内予測小領域の画素値として出力する。予測信号発生器910の動作の詳細については、図4、図5及び図6を参照して詳細上述している。また、時間予測小領域の画像データがコントローラ908によって選択される場合、スイッチ913はライン924をライン923に接続し、コントローラ908からの制御信号に応答して、動き補償器909はデータ解析器902からライン925を介して送られる動きベクトルに基づいて、フレームメモリ912からの画像データに対して動き補償処理を実行することにより、時間予測小領域の画像データを発生して、スイッチ913及びライン924を介して加算器906に出力する。
<第4の実施形態>
図13は、本発明に係る第4の実施形態である画像予測復号化装置の構成を示すブロック図であり、図13において図12と同様のものについては同一の符号を付している。図13の画像予測復号化装置は、図12の画像予測復号化装置の基本構成に加えて、形状復号化器990を追加して備えたことを特徴とする。図13の画像予測復号化装置の基本動作も図12と同じであるため、異なる動作だけについて以下に詳細に説明する。
本実施形態においては、圧縮符号化された画像データには、圧縮符号化された形状データが含まれる。データ解析器902は、この形状データを抽出して形状復号化器990に出力し、これに応答して形状復号化器990は形状信号を伸長再生する。再生された形状信号は受信側又は再生側に伝送される同時に、予測信号発生器910に入力される。予測信号発生器910は、この再生された形状信号に基づいて、図9乃至図11を参照して説明したように、画面内予測小領域の画像データを生成する。このようにして、任意の形状をもつ画像の画面内予測小領域の画像データを生成し、受信側又は再生側において、画像データを復号化し、再生することができる。
第3と第4の実施形態の特徴は、ラインメモリ911を備えた事である。ラインメモリ911がなければ、画面内予測小領域の画像データを生成するための画素をフレームメモリ912からアクセスしなければならない。隣接する小領域の画素で予測信号を生成するために、高速にフレームメモリを書き込み、読み出しすることが必要である。専用のラインメモリやバッファを設けることにより高速なフレームメモリを用いないで高速に画面内予測小領域の画像データを生成することが可能になる。
以上の実施形態において、複数の画素値の平均値は、所定の重み付け平均値であってもよい。
以上説明したように、本発明の第1の実施形態グループによれば、処理対象の小領域の画像データに隣接する再生された画素値を画面内予測信号の画素値とするだけで、従来技術に比較して低い演算量で簡単に高精度な予測信号を生成することができ、フレーム内符号化のビット数を削減することができるという特有の効果が得られる。また、画面内予測信号を生成するために用いられる再生された画素値を格納するために、ラインメモリ911を設けているので、画素値を高速にアクセスすることができ、画面内予測信号を高速に生成することができる。
<第2の実施形態グループ>
第2の実施形態グループは、第5乃至第7の実施形態を含む。
本発明者は、従来技術の問題点に鑑みて、画像符号化能率が、2つの画像間又は1つの画像内の2つのブロックの内部の間のみならず、1つの画像内の2つのブロック間の冗長性を除去することにより、画像符号化能率をさらに改善することを見いだした。
本発明者は隣接するブロックの、同じ位置のDCT変換係数は多くの場合非常に近似していることを発見した。特に、2つのブロックに対する原画像の組織がよく似ている場合、又は同じ画像パターン、例えば直線、角、その他を含んでいる場合には近似が高いことを発見した。同一の情報は情報理論により冗長を意味する。
ブロックを越えてDCT変換領域の中に存在するこの種の冗長は、以前のブロックからの適応的イントラ予測(フレーム内予測)により除去されるか、又は大幅に減少させることができる。そして、次のVLCエントロピー符号化処理は、予測の小さいエントロピーによりさらに高い符号化能率を達成することができる。このDCT変換領域の予測の結果として、VLCエントロピー符号化回路への冗長データの入力は、大幅に減少されうる。そのために多くのビットの節約が期待できる。従って、符号化された画図データの画質は明確に改善される。
本発明に係る本実施形態は、他のブロックからのDCT変換係数を適格に予測する方式を提供する。この方式により隣接するブロックを越えて存在する冗長性を除去し、量子化されたDCT変換係数のエントロピーをより小さくし、その結果、DCT変換係数を符号化するための必要なビット数を減少することができる。
処理対象である現時点のカレントブロック(以下、カレントブロックという。)のDCT変換係数は以前の隣接するブロックの中の同じ位置のDCT変換係数から予測できる。隣接するブロックは、処理時に既に復号化されている。すなわち、以前に復号化された隣接するブロックの1つの中の第1のDC係数により第1のDC係数は予測される。また、第2の係数AC1は、同じ復号化されたブロックの中の第2の係数AC1から予測される。以下同様に実行される。この方法を用いることにより、数個の予測されるブロックを、現時点に符号化されているDCT変換ブロックに対して上向き左側に、斜めに左側に、上向きに斜めに右側に、及び上向きにある隣接する復号化されたブロックから求めることができる。これらの予測されたブロックに対して、実際のエントロピー符号化が実行されることによりチェックされる。そして、より少ないビット数を持つ予測ブロックが選択された後、エントロピー符号化されて、付加的指示ビットとともに受信側又は再生側の画像予測復号化装置に伝送される。画像予測復号化装置には、どの隣接するブロックからカレントブロックが予測したかを報告する。
本発明に係る本実施形態の方法は、カレントブロックのDCT変換係数を予測することができる。そのDCT変換係数は他の隣接するブロックのDCT変換係数と良好な相互関係を一般に保有している。その理由はDCT変換は、同様のブロック画像に対しては、DCT変換係数の同一の値又は同一の分布を与える傾向にあるからである。
イントラフレームか、又は一時的に予測されたフレームである、入力された画像データに対して通常、まずブロックに基づいたDCT変換処理が実行される。カレントブロックのDCT変換係数が得られた後に、DCT変換領域の予測処理を量子化前に、また量子化の後に実行することができる。
カレントブロックのDCT変換係数は、図15に示されるように、既に復号化されたブロックであって、隣接するブロック、すなわち、左上のブロックB1、上のブロックB2、右上のブロックB3、左のブロックB4から予測することができる。予測されたブロックは、カレントブロックのDCT変換係数の全てを、同じ位置にある以前の隣接するブロックのDCT変換係数の全てから減算することにより得られる。また全てのDCT変換係数の代わりに、部分的にDCT変換係数を減算することにより得ることができる。
異なる予測されたブロックにおける予測されたDCT変換係数は、量子化の前に予測が実行されるならば、量子化される。次いで、DCT変換係数に対して、エントロピー符号化処理が実行される。そのエントロピー符号化処理は、画像予測符号化装置のそれと同一であり、どの予測されたブロックが下位ビットとして使用するかチェックされる。
下位ビットを使用する予測ブロックが選択され、選択された予測ブロックは、予測決定について画像予測復号化装置に知らせる指示ビットとともにエントロピー符号化される。
画像予測復号化装置においては、指示ビットを用いて予測されたブロックが復号化される。すなわち、1つのブロックに対して予測されたDCT変換係数を逆エントロピー復号化した後に、当該ブロックに対するDCT変換係数は、指示ビットによって表される前に復号化された隣接するブロックの基準DCT変換係数を上記復号化されたDCT変換係数に加算することによって得られる。最終的に、逆DCT変換処理が各々のブロックに対する復元されたDCT変換係数に適用され、復号化された画像データが得られる。
本発明に係る本実施形態は、通常DCT変換のような変換によって除去される空間的な冗長性、動き検出及び補償によってフレーム間で除去される冗長性及びブロック内の量子化変換係数の中でエントロピー符号化によって除去される統計的冗長性以外に、隣接するブロックを越えてDCT変換領域に存在する他の種類の冗長性を減少させることができる画像符号化装置を提供するものである。
従来技術の画像予測符号化装置を示す図14からわかるように、従来の画像符号化(例えば、MPEGにおいて)に一般的に使用されている画像予測符号化装置は、ブロックサンプリングユニット1001、DCT変換ユニット1004、量子化器1005及びエントロピー符号化器1006を備える。
イントラフレーム符号化(フレーム内符号化)においては、入力された画像信号に対してまず、ブロックサンプリング処理が実行される。次に直接にDCT変換処理が実行される。それに続いて、量子化処理及びエントロピー符号化処理が実行される。一方、インターフレーム符号化(予測フレーム符号化)においては、ブロックサンプリング処理の後に、処理対象の現時点のフレームのが画像データに対して、動き検出ユニット1002及び動き補償ユニット1003の処理が実行され、さらに、DCT変換処理が実行される。さらに、量子化処理及びエントロピー符号化処理が実行される。
ここで、エントロピー符号化ユニット1006において、量子化値はエントロピー符号化されて符号データが出力される。エントロピー符号化とは、よく発生する値には短い符号語を、あまり発生しない値には長い符号語を割り当てることにより、平均情報量であるエントロピーに近づくように符号化して、全体としての符号量を大幅に削減する方式である。これは、可逆符号化である。エントロピー符号化として種々の方式が提案されているが、ベースラインシステムでは、ハフマン符号化を用いる。量子化されたDC係数値とAC係数値では、ハフマン符号化の方法が異なり、すなわち、DC係数は8×8画素ブロックの平均値を示すが、一般の画像では隣のブロックとの平均値は似通った値を持つことが多い。そこで、前のブロックとの差分をとった後にエントロピー符号化を行う。こうすると、0付近に値が集中するので、エントロピー符号化が効果的となる。また、AC係数については、例えばジグザグスキャンを行い2次元データを1次元データに変換する。さらに、特に高周波成分を含むAC係数は0が多く発生するので、0以外の値を持つAC係数の値とその前に0がいくつあるか(ランレングス)を組としてエントロピー符号化する。
レートコントローラ1007は前に符号化されたブロックに用いられたビットをフィードバックし、量子化ユニット1005の処理を制御しかつコードビットレートを調整する。ここで、レートコントローラ1007は、符号化された単位の性質や利用可能なビットに基づいて各符号化されたオブジェクトデータ、各フレーム及び各符号化されたブロックに対して異なるビット量を割り当てるようにコードビットレートを制御する。また、逆量子化処理及び逆DCT変換処理はローカルデコーダの一部としてのユニット1008及び1009において実行される。ローカルデコーダで復号化された画像データはローカル復号化フレームメモリ1010に記憶され、動き検出処理ために利用される。1011は動き検出のために、前の原フレームを保存する基準フレームメモリである。そして、最後にビットストリームがエントロピー符号化ユニット1006から出力されて、受信側又は再生側の画像予測復号化装置に送られる。
図15は、画面内予測のための適応的DCT変換領域を説明するための画像の模式図である。
図15において、DCT変換領域において、8×8の4個のDCT変換ブロックがマクロブロックを構成していることが示されている。ここで、B0は8×8のDCT変換係数を有する現時点のカレントブロックを示す。B2は既に復号化された上側に隣接するブロックを示す。B1及びB3は既に復号化された斜め上の隣接する2つのブロックを示す。B4は、左側に隣接する直前のブロックを示す。DCT変換係数を持つブロックは、8×8のDCT変換係数を有する、復号化された隣接する複数のブロックから予測できることが図15からわかる。
どのブロックからカレントブロックが予測されたかが常に違っていることに注意すべきである。従って、最小ビット使用規則に基づく決定が実行され、その決定は画像予測復号化装置側の異なるブロックに適応的に与えられる。その決定は、指示ビットにより画像予測復号化装置に報知される。ここで、最小ビット使用規則は、異なる複数の予測方法の中で予測方法を決定するために用いられ、各予測方法が適用された後に、ブロックを符号化するために用いられるビット量が計数される。結果として、使用される最小のビット量をもたらす方法が、使用すべき予測方法として、選択される。
なお、DCT変換領域予測は量子化の後及びまた前に実施されることができる。
<第5の実施形態>
図16は、本発明に係る第5の実施形態である画像予測符号化装置の構成を示すブロック図である。図16の画像予測符号化装置は、DCT変換領域予測処理は、量子化処理の後に実行されることを特徴としている。
図16において、入力された画像信号に対してまず、ブロックサンプリングユニット1012によってブロックサンプリングが実行される。そして、イントラフレーム符号化においては、サンプルされたブロック画像データは加算器1013の処理が実行されずに、加算器1013を通過してDCT変換ユニット1014に入力される。一方、予測フレーム符号化においては、加算器1013は、サンプルされたブロック画像データから動き検出及び補償ユニット1025から出力される動き検出画像データを減算して、減算結果の画像データをDCT変換ユニット1014に出力する。そして、DCT変換処理がユニット1014で実行された後、量子化処理がユニット1015で実行される。
DCT変換領域予測処理はユニット1017で実行され、1018は予測のために前に復号化されたブロックを格納するためのブロックメモリである。加算器1016は、量子化ユニット1015から出力される現時点のDCT変換ブロックから、DCT変換領域予測ユニット1017から出力される復号化された隣接するブロックを減算する。この符号化された隣接するブロックの決定はDCT変換領域予測ユニット1017において行われる。最後に、予測されたDCT変換ブロックに対して、ユニット1020によってエントロピーVLC符号化処理が実行され、符号化されたビットはビットストリームに書きこまれる。
加算器1019は、予測のために用いられる前の隣接するブロックを、予測ブロックに加算することにより、現時点のDCT変換ブロックを復元する。次いで、復元されたDCT変換ブロックに対して、逆量子化処理及び逆DCT変換処理はそれぞれユニット1021及び1022において実行される。局所的に復号化されて逆DCT変換ユニット1022から出力されるブロックの画像データは加算器1023に入力される。加算器1023は、復元されたブロックの画像データに前のフレームの画像データを加算することによって、再構築された画像データを得てフレームメモリ1024に記憶される。動き検出及び補償処理はユニット1025で実行される。動き検出及び補償処理のための前のフレームを格納するためにフレームメモリ1024が用いられる。
<第6の実施形態>
図17は、本発明に係る第6の実施形態である画像予測符号化装置の構成を示すブロック図である。図17の画像予測符号化装置は、量子化処理の前に、DCT変換領域予測処理が実行されたことを特徴としている。入力された画像信号に対して、ユニット1026においてブロックサンプリング処理が実行される。次いで、加算器1027は予測フレーム符号化のために減算を行い、減算結果の画像データは、DCT変換ユニット1028、加算器1029及び量子化ユニット1030を介して、エントロピーVLC符号化ユニット1034及び逆量子化ユニット1033に出力される。
ブロックメモリ1032は、ユニット1031のDCT変換領域予測処理のために前のブロックの画像データを格納している。DCT変換ユニット1028から出力される現時点のDCT変換ブロックの画像データは、加算器1029によって、最小ビット使用規則に従ってDCT変換領域予測ユニット1031で選択された前のDCT変換ブロックから減算される。減算結果のDCT変換ブロックの画像データは、量子化ユニット1030によって量子化された後、逆量子化ユニット1033及びエントロピーVLC符号化ユニット1034に出力される。逆量子化ユニット1033は、入力される量子化されたDCT変換ブロックの画像データを逆量子化することにより復元して加算器1035に出力する。加算器1035は、復元されたDCT変換ブロックの画像データを、DCT変換領域予測ユニット1031からの前のDCT変換ブロックの画像データを加算して、加算結果の前のブロックの画像データをブロックメモリ1032に格納するとともに、逆DCT変換ユニット1036に出力する。
逆DCT変換ユニット1036は、加算器1035から入力される前のブロックの画像データに対して逆DCT変換処理を実行して、変換処理後の復元された画像データを加算器1037に出力する。加算器1037は、逆DCT変換ユニット1036から出力される復元された画像データに動き検出及び補償ユニット1025から出力される前のフレームの画像データを加算して、加算結果の画像データをフレームメモリ1038に一時的に記憶した後、動き検出及び補償ユニット1025に出力される。
<B1.モード決定の一般的な説明>
図18は、図16及び図17のDCT変換領域予測回路1017,1031の構成を示すブロック図である。
図18において、1040は予測のために前の隣接するブロックの画像データを格納するブロックメモリである。処理対象の現時点のカレントブロックはユニット1041に入力され、ユニット1041は、ブロックメモリ1040で格納されている前の隣接するDCT変換ブロックから入力されたカレントブロックの画像データを減算して、次の4種類の予測DCT変換ブロックの画像データが得られる。
(a)1042で示されるNo−Predブロック、
(b)1043で示されるUp−Predブロック、
(c)1044で示されるLeft−Predブロック、
(d)1045で示されるOther−Predブロック。
ここで、2ビットを用いて上記4つの種類のブロックを示す。すなわち、例えば“00”はNo−Predブロックを示し、“01”はUp−Predブロックを示し、“10”はLeft−Predを示し、“11”はOther−Predブロックを示す。
No−Predブロックは、予測無しのときの、現時点のDCT変換ブロックの画像データ自身である。Up−Predブロックは、予測に用いられたブロックが上方に隣接するDCT変換ブロックB2である場合に得られた予測ブロックの画像データを示す。Left−Predブロックは予測に用いられたブロックが左側に隣接するDCT変換ブロックB4である場合に得られた予測ブロックの画像データを示す。Other−Predブロックは予測がDC係数に対してのみ行われたときの予測ブロックの画像データを示す。Other−Predの場合において、2種類の予測方法が存在する。すなわち、Up−DC−Pred(1046)は上方に隣接するDCT変換ブロックB2に基づいてDC係数のみに対して予測が行われた場合に得られた予測ブロックの画像データを示す。Left−DC−Pred(1047)は左側に隣接するDCT変換ブロックB4に基づいてDC係数のみに対して予測が行われた場合に得られた予測ブロックの画像データを示す。この2つのケースに対して、もう1つビットが指示のために必要となる。例えば“0”はUp−DC−Pred(1046)を示し、“1”はLeft−DC−Pred(1047)を示すように使用される。
斜め方向に隣接するブロックB1、B3に基づいた予測は可能ではあるがその予測結果は上方や左側のブロックに予測によるもののようによくないので、本実施形態では用いていない。
全ての予測されたブロックに対して、ユニット1048によって実際のエントロピー符号化処理が実行されることにより検査され、チェックされる。異なる予測されたブロックに使用されたビットはユニット1049において比較される。最後に、ユニット1050は最小ビット使用規則に基づいて予測されたDCT変換ブロックを決定し、指示ビットとともに予測されたDCT変換ブロックを出力する。すなわち、ビット数が最小の予測されたDCT変換ブロックを選択する。
<B2.モード決定の実施>
図19は、図18のDCT変換領域予測回路におけるDC/AC予測の符号化方法の一例を示す画像の模式図である。
図19において、先に定義されたDC/AC予測された画像データの部分集合が実際の使用に対して図示されている。カレントブロック1101はカレントマクロブロックの上部左側の8×8ブロックであり、カレントブロック1102はカレントマクロブロックの上部右側の8×8ブロックである。A及びBは、カレントブロック1101に隣接する8×8ブロックである。カレントブロック1101の強調された上部行及び左列はそれぞれ、隣接ブロックであるA及びBの同一場所から予測される。つまり、カレントブロック1101の最上行はその上のブロックAの最上行から予測され、カレントブロック1101の左列はその左のブロックBの左列から予測される。同様の手順で、カレントブロック1102はその上のブロックD及びその左のカレントブロック1から予測される。
C(u,v)を符号化すべきブロックとし、Ei(u,v)をモードiの場合の予測誤差であって、A(u,v)及び/又はB(u,v)の各ブロックから予測値を減算して求めたものであるとする。実際の実施においては、節B1において前述した最も頻度が多い次の3つのモードのみが使用される。
(a)モード0:DC予測のみ
[数1]
0(0,0)=C(0,0)−(A(0,0)+B(0,0))/2,
0(u,v)=C(u,v),
u≠0;v≠0;u=0,…,7;v=0,…,7
(b)モード1:上側ブロックからのDC/AC予測
[数2]
1(0,v)=C(0,v)−A(0,v),v=0,…,7,
1(u,v)=C(u,v),
u=1,…,7;v=0,…,7
(c)モード2:左側ブロックからのDC/AC予測
[数3]
2(u,0)=C(u,0)−B(u,0),u=0,…,7,
2(u,v)=C(u,v),
u=0,…,7;v=1,…,7.
モードの選択は、マクロブロックにおける4つの輝度信号のブロックに対して予測された誤差の絶対値の和、SADmodeiを計算して、そのうちの最小値を有するモードを選択することにより行われる。
[数4]
SADmodei
=Σ[Ei(0,0)+32・ΣEi(u,0)+32・ΣEi(0,v)],
b u v
i=0,…,2;b=0,…,3;u,v=1,…,7
モードの決定は、異なる符号化ビットレートを目標とするアプリケーションの違いに依存して、ブロックベース及びマクロブロックベースの両方で実行することができる。モードは、次の表1の可変長コードを使用して符号化される。
Figure 0003857297
量子化後にDC/AC予測を実行する場合、先行する水平方向の隣接ブロック又は垂直方向の隣接ブロックでは通常、使用する量子化のステップが異なるため、DC/AC予測を正確に行うためには、量子化されたDCT変換係数をスケーリングするために幾つかの種類の重み係数が必要とされる。
QacAをブロックA(図19参照。)の量子化されたDCT変換係数とし、QacBをブロックB(図19参照。)の量子化されたDCT変換係数とする。QstepAをブロックAの量子化に使用される量子化ステップとすると、QstepBはブロックAの量子化に使用する量子化ステップであり、QstepCはカレントブロックCの量子化に使用すべき量子化ステップであり、従ってスケーリング方程式は以下の通りである。
[数5]
Q’acA=(QacA×QstepA)/QstepC
[数6]
Q’acB=(QacB×QstepB)/QstepC
ここで、Q’acAはブロックAからのDCT変換係数であり、カレントブロックCの最上行の予測に使用される。また、Q’acBはブロックBからのDCT変換係数であり、カレントブロックCの左列の予測に使用される。
<第7の実施形態>
図20は、本発明に係る第7の実施形態である画像予測復号化装置の構成を示すブロック図である。
図20において、画像予測符号化装置からのビットストリームは、エントロピーVLD復号化ユニット1051に入力され、可変長復号化される。復号化された画像データは、加算器1052によって、DCT変換領域予測ユニット1053からの前の隣接するDCT変換ブロックの画像データと加算することにより、DCT変換ブロックの画像データが復元される。前に隣接するDCT変換ブロックは、どのブロックであるかは、ビットストリームからとり出された指示ビットによって知らされ、ユニット1053において予測のために使用される。1054は、予測のために用いる隣接するDCT変換ブロックを格納するためのブロックメモリである。加算器1052から得られる復元されたDCT変換ブロックは逆DCT変換ユニット1055に出力される。逆DCT変換ユニット1055は入力されたDCT変換ブロックに対して逆DCT変換処理を実行することにより復元されたDCT変換係数の画像データを生成して、加算器1056に出力する。加算器1056は、逆DCT変換ユニット1055からの復元された画像データを、動き検出及び補償ユニット1057からの前のフレームの画像データと加算することにより、動き検出及び補償されかつ復号化された画像データを生成して出力する。当該復号化された画像データは、動き検出及び補償のために前のフレームの画像データを格納するフレームメモリに一時的に格納した後、動き検出及び補償ユニット1057に出力される。動き検出及び補償ユニット1057は、入力される画像データに対して、動き検出及び補償処理が実行される。
さらに、加算器1056から出力される復号化された画像データは、図16及び図17のブロックサンプリングユニット1012,1026の処理に対応する逆の復元処理により、元の画像データが復元される。
さらに、1059は逆量子化ユニットであり、図17に示すように量子化処理の前にDCT変換領域予測処理が行われる場合は、当該逆量子化ユニット1059は図20における1059aの位置に挿入される一方、図16に示すように量子化処理の後にDCT変換領域予測処理が行われる場合は、当該逆量子化ユニット1059は図20における1059bの位置に挿入される。
図21は、図20の画像予測復号化装置におけるDC/AC予測の復号化方法を示すフローチャートである。すなわち、図21では、DC/AC予測モードを取得し、隣接するDC/AC予測値からDCT変換係数を再構成するためのビットストリームの復号化の詳細が図示されている。
まず、ステップ1059において、入力されるビットストリームから指示ビットを復号化し、ステップ1060で、指示ビットのフラグがチェックされ、それが「0」であれば、ステップ1061で上側ブロック及び左側ブロックの画像データの平均値からDC値を計算してステップ1063に進む。ステップ1060でNOであればステップ1062に進み、ステップ1062でチェックされた指示フラグが「10」であれば、ステップ1063で左側ブロックの左列の画像データが抽出され、ステップ1065に進む。ステップ1062でNOであればステップ1064に進み、ステップ1064でチェックされた表示フラグが「11」であれば、ステップ1065で上側ブロックの最上行の画像データが抽出され、ステップ1066に進む。最後に、ステップ1066では、ステップ1061、1063、又は1065で取得又は抽出されたDCT変換係数がカレントブロックの対応するDCT変換係数に加算される。
さらに、以下、本実施形態グループの変形例について説明する。
(a)上記ブロックサンプリングユニット1012,1026は、4つのブロックのグループの中の二次元配列の画素は、第1のブロックでは奇数番目の行にある奇数番目の画素から成り、第2のブロックでは奇数番目の行にある偶数番目の画素から成り、第3ブロックでは偶数番目の行にある奇数場番目の画素から成り、第4ブロックでは偶数番目の行にある偶数番目の画素から成るように、画素を交互に差し挟むインターリーブ処理を含んでもよい。
(b)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックに隣接するように位置されたブロックから選択され、ブロック中の全ての変換係数が選択されてもよい。
(c)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックに隣接するように位置されたブロックから選択され、あらかじめ定められたサブセットがブロックの変換係数として選択されてもよい。
(d)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックの上方及び左側に隣接するよう位置されたブロックから選択され、当該ブロックの最上行、及び当該ブロックの最左列の変換係数のみが使用され、残りの変換係数はゼロにセットされてもよい。
(e)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックの近傍に位置されたブロックから選択され、各ブロックの変換係数は異なる重み付け関数で重み付けされてもよい。
(f)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックの近傍に位置されたブロックから選択され、各ブロックの変換係数に対して変換演算が実行されてもよい。
(g)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックの近傍に位置された複数のブロックの重み付け平均化されてもよい。
(h)復号化された画像データに基づいて、インターリーブされた4個のブロックからなる複数のグループから二次元配列の画素を形成して元の画像データを復元するときに、奇数番目の行にある奇数番目の画素は全て第1のブロックから求め、奇数番目の行にある偶数番目の画素は第2のブロックから求め、偶数番目の行にある奇数番目の画素は第3ブロックから求め、偶数番目の行にある偶数番目の画素は第4ブロックから求めるように、上記復号化された画像データに対して逆インターリーブ処理を実行してもよい。
以上説明したように、本発明に係る本実施形態グループによれば、隣接するブロック間におけるDCT変換領域の冗長性を除去又は減少するために大いに効果があり、その結果、使用ビット数を減少させ、最終的に符号化効率を大いに改善することができる。詳細な画像予測符号化装置の例として図18を参照すると、予測処理は、好ましくは、上側又は左側の隣接するブロックを使用することによってのみ実行される。
QCIFを含むシーケンスに対しては、上位ビットレート符号化に対して6.4%のビットを節約することができ、下位ビットレート符号化に対して20%のビットを節約することができる。また、例えば、アキヨ(Akiyo)、マザー(Mother)、及びドウター(Daughter)などのテストシーケンスなどの他のQCIFシーケンスに対して、約10%のビットを節約することができる。さらにCIF及びCCIRのシーケンスに対しては、より多くのビット節約が可能である。
以上説明したように本発明に係る第2の実施形態グループによれば、現時点の符号化効率を増大させる新しい画像予測符号化装置及び画像予測復号化装置を提供することができる。当該装置では、符号化効率を上げるためには複雑な手段は必要とせず、その回路構成は、非常に簡単で容易に形成できる。
<第3の実施形態グループ>
第3の実施形態グループは、第8の実施形態を含む。
本発明者は、従来技術の問題点に鑑みて、画像符号化効率は、2つの画像間又は1つの画像内のブロックの内部における冗長性ばかりでなく、画像内のブロック間の冗長性を削減するとともに、ブロックのスキャンパターンを適切にすることによりさらに冗長性を改善することを考えた。
同じ位置にあっても隣接するブロックの中のDCT変換係数は多くの場合非常によく似ていることが見出されている。この2つのブロックに対する原画像の特質が非常によく似ている場合、もしくは水平又は垂直ライン、対角線その他の画像パターンが同じものを含んでいる場合、上記のことは正しいといえる。情報理論の観点から同じ情報は冗長性を意味することになる。
ブロックを越えてDCT変換領域の中に存在する冗長性は、以前のブロックの適応性予測により除去されるか又は削減されることができる。このことはVLCエントロピー符号化は予測誤差信号のより小さいエントロピーのためのより高い符号化効率を達成できるという結果になる。
同時に、水平及び垂直の構造は、最左側の列及び最上行の変換ブロックに、重要なDCT変換係数が集中するという結果になることは公知である。従って、本発明に係る実施形態は、予測モードに基づいて、スキャンを適応化することにより係数のスキャンにおける上述の問題点を解決することができる。
本発明に係る実施形態は、他のブロックからカレントブロックのDCT変換係数を適応的に予測し、その結果隣接するブロック間の冗長性を除去する方法を提供する。予測誤差の情報は量子化DCT変換係数のエントロピーをより小さくする予測モードにスキャン方法を適応化することによりさらに縮少される。その結果、DCT変換係数を符号化するためのビットの数を削減できる。
この問題点を解決するために、予測モードの決定を実行する方法が各予測及びスキャン方法により発生される実際のビットレートに基づいて得られる。
本発明に係る実施形態は、現在のカレントブロックのDCT変換係数を予測する方法を提供するものである。DCT変換は同じ値、又は同じDCT変換係数の分布を同じブロックの画像データに与える傾向があるので、カレントブロックは通常他の隣接するブロックの中のDCT変換係数と良好な相互関係を保持している。
入力された画像データは、イントラフレームであるか又は一時的に予測されたフレームであるかのいずれかであり、まず、入力された画像データに対して、通常ブロックを基礎とするDCT変換処理が実行される。カレントブロックのDCT変換係数が得られた後に、DCT変換領域の予測は量子化の前、又は後に実行することができる。
カレントブロックの中のDCT変換係数は上方の左側に対角線方向(斜め方向)に位置した以前の隣接するブロックから予測することができる。それらは、図23に示すように、その時刻において既に復号化されている。予測されたブロックは、カレントブロックにおける同じ位置のDCT係数から前の隣接するブロックの1つ又はそれ以上のDCT係数を減算することによって、予測された誤差信号を発生する。
異なる予測モードからの予測誤差信号が、予測が量子化処理の前になされるならば量子化される。量子化された予測誤差信号は、エントロピー符号化が実行される前にシーケンスの(一連の)画像データに対してスキャンされる。最小ビット使用規則に基づいて予測されたブロック、すなわち最小のビットを有する予測ブロックが選択される。このブロックの符号化データは使用する予測モードとともに画像予測復号化装置に送られる。
画像予測復号化装置は、使用した予測モード及びブロックの符号化されたデータを用いて、予測されたブロックを復号化する。ブロックに対する符号化されたデータに対する逆のエントロピー復号化の後に、量子化された予測誤差は用いられるスキャンモードに従って逆にスキャンされる。もし量子化処理が予測処理の後の実行されるならば、ブロックは逆量子化されることになる。再構築されたブロックは、予測モードによって指示された、前に復号化された隣接するブロックの中のDCT変換係数を現在のDCT変換係数に加算することにより得ることができる。一方、量子化処理が予測処理の前に実行されるならば、再構築された係数は逆量子化される。最後に、逆DCT変換処理が各ブロックに対して再構築されたDCT変換係数に適用され、復号化された画像を得ることができる。
本発明に係る実施形態は、隣接するブロックを越えてDCT変換領域の中に存在する冗長性を減少させる画像予測符号化装置及び画像予測復号化装置を提供するものである。
<第8の実施形態>
図24は、本発明に係る第8の実施形態である画像予測符号化装置の構成を示すブロック図である。図24の画像予測符号化装置は、図22の従来技術の画像予測符号化装置と比較して、
(a)加算器2035、
(b)H/V/Zスキャンユニット2036、
(c)加算器2038、
(d)ブロックメモリ2039、及び
(e)量子化スケーリングを有するDCT変換領域予測ユニット2040を備えたことを特徴としている。
イントラフレーム符号化(フレーム内符号化)においては、入力された画像信号に対して、ユニット2031でブロックサンプリング処理が実行された後に、直接にユニット2033でDCT変換処理が実行される。次いで、ユニット2034で、DCT変換ユニット2033から出力されるDCT変換係数に対して量子化処理が実行される。一方、インターフレーム符号化又はフレーム間符号化(予測フレーム符号化)においては、ユニット2031のブロックサンプリング処理の後に、加算器2032は、ブロックサンプリング処理後の画像データから、動き検出及び補償ユニット2045から出力された画像データを減算して、予測誤差データを得る。次いで、この予測誤差データは、DCT変換処理を実行するDCT変換ユニット2033及び量子化処理を実行する量子化ユニット2034を介して加算器2035に出力される。DCT変換係数は、ユニット2040のDCT変換領域処理によって予測され、予測されたDCT変換係数は加算器2035に入力される。加算器2035は、量子化ユニット2034からのDCT変換係数から、DCT変換領域予測ユニット2040からの予測されたDCT変換係数を減算して、減算結果の予測誤差のDCT変換係数を、H/V/Zスキャンユニット2036及び加算器2038に出力する。H/V/Zスキャンユニット2036は、選択された予測モードに依存して、入力されたDCT変換係数に対して適応的に、水平スキャン、垂直スキャン又はジグザグスキャンを実行して、スキャン処理後のDCT変換係数をエントロピーVLC符号化ユニット2037に出力する。次いで、エントロピーVLC符号化ユニット2037は、入力されたDCT変換係数をエントロピーVLC符号化処理を実行して、符号化されたビットストリームを受信側又は再生側の画像予測復号化装置に伝送する。
加算器2038は、加算器2035から出力される量子化されたDCT変換係数と、DCT変換領域予測ユニット2040からの予測されたDCT変換係数とを加算することにより、復元された量子化DCT変換係数データを得る。当該量子化DCT変換係数データは、ブロックメモリ2039及び逆量子化ユニット2041に出力される。
当該画像予測符号化装置に設けられるローカルデコーダにおいて、加算器2038からの復元されたDCT変換係数データは、次の予測を行うために1つのブロックのデータを格納するブロックメモリ2039に一時的に記憶された後、DCT変換領域予測ユニット2040に出力される。逆量子化ユニット2041は、入力される量子化DCT変換係数を逆量子化して逆DCT変換ユニット2042に出力し、次いで、逆DCT変換ユニット2042は、入力される復元されたDCT変換係数を逆DCT変換処理を実行して、現時点のブロックの画像データを復元して加算器2043に出力する。
フレーム間符号化においては、ローカル復号化された画像データを生成するために、加算器2043は、動き検出及び補償ユニット2045によって動き検出及び補償された画像データと、逆DCT変換ユニット2042からの復元された画像データとを加算して、ローカル復号化された画像データを得て、ローカルデコーダのフレームメモリ2044に記憶される。なお、加算器2043とフレームメモリ2044と動き検出及び補償ユニット2045の構成及び処理は、図22の従来技術のユニット2009、2010及び2011と同様である。
最終的には、ビットストリームはエントロピー符号化ユニット2037から出力されて画像予測符号化装置に送られる。
図25は、本発明に係る第8の実施形態である画像予測復号化装置の構成を示すブロック図である。図25の画像予測復号化装置は、図23の従来技術の画像予測復号化装置に比較して、
(a)H/V/Zスキャンユニット2052、
(b)加算器2053、
(c)DCT変換領域予測ユニット2055、及び
(d)ブロックメモリ2054、
を備えたことを特徴とする。
図25において、画像予測符号化装置からのビットストリームは、可変長デコーダユニット2051において復号化される。復号化されたデータは、H/V/Z逆スキャンユニット2052に入力され、スキャンモードに依存して、水平に逆方向で、垂直に逆方向で、又はジグザグに逆方向でスキャンされる。スキャン処理後のデータは加算器2053に入力され、加算器2053は、逆スキャン処理後のデータと、DCT変換予測ユニット2055からの予測誤差データとを加算することにより、復号化されたDCT変換係数データを得て、これを逆量子化ユニット2056に出力するとともに、ブロックメモリ2054に記憶される。次いで、逆量子化ユニット2056は、入力される符号化されたDCT変換係数データを逆量子化して逆量子化されたDCT変換係数データを得て、逆DCT変換ユニット2057に出力する。逆DCT変換ユニット2057は、入力されるDCT変換係数データに対して逆DCT変換処理を実行して、元の画像データを復元して、加算器2058に出力する。フレーム間符号化においては、加算器2058は、動き検出及び補償ユニット2060からの予測誤差データに、逆DCT変換ユニット2057からの画像データを加算して、局所的に復号化された画像データを得て、外部装置に出力するとともに、フレームメモリ2059に記憶する。
さらに、加算器2058から出力される復号化された画像データは、図24のブロックサンプリングユニット2031の処理に対応する逆の復元処理により、元の画像データが復元される。
以上の実施形態においては、量子化処理が予測処理に先だって行われる。変形例においては、予測処理の後に量子化処理を行ってもよい。この場合、ローカルデコーダ及び画像予測復号化装置では、予測値が加算される前に逆量子化処理が実行される。他の詳細は全て、上述の実施形態と同様である。
図26は、第8の実施形態において、ブロック分割から得られた、フレームのマクロブロックとブロックの構造を示し、かつブロック予測方法を示す画像の模式図である。図26の拡大図は、カレントブロックに対する予測データがどのように符号化されるかを示す。ここで、ブロックC(u,v)は、上側に隣接するブロックA(u,v)と、左方向に隣接するブロックB(u,v)とから得られる。次に、本発明にこの実施形態を更に詳しく説明する。
<C1.予測に使用される係数の番号>
予測に使用される係数のナンバーは画像データのシーケンスに依存している。フラグAC_Coeffは、各画像に使用される係数の最適の数を適応的に選択するために使用される。フラグは下の表2に示され、サイド情報の一部として画像予測符号化装置から画像予測復号化装置に送られる。フラグAC_Coeffに対する固定長コード及びFLCを表2に示す。ここで、FLC(Fixed Length Coding;固定長符号化)は、すべての可能なイベントを表すために、固定長のコードワードを割り当てる可逆符号化である。
Figure 0003857297
ここで、ACnは、用いられるモードに依存して、A(0,n)又はB(n,0)である。
この実施形態の特別なケースでは、最上行及び最左列のすべてのAC係数が予測のために使用される。このケースでは、画像予測符号化装置と画像予測復号化装置との両方が、このデフォルト値を同意しているとき、フラグを必要としない。
<C2.量子化ステップのスケーリング>
隣接するブロックがカレントブロックからの異なる量子化ステップサイズを用いて量子化されるときは、AC係数の予測はそんなに能率的ではない。従って、当該予測方法は、予測データが、現在のカレントブロックの量子化ステップサイズの比と、予測データのブロックの量子化ステップの比とによってスケーリングされるように変形される。この定義は次の節C3.における方程式を用いて与えられる。
<C3.予測モード>
設定される複数のモードは次の通りである。
(a)モード0:処理ブロックから上側のブロックからのDC予測(「上のDCモード」と略す。)
[数7]
0(0,0)=C(0,0)−A(0,0),
0(u,v)=C(u,v)
(b)モード1:処理ブロックから左側のブロックからのDC予測(「左のDCモード」と略す。)
[数8]
1(0,0)=C(0,0)−B(0,0),
1(u,v)=C(u,v)
(c)モード2;処理ブロックから上側のブロックからのDC/AC予測(「上のDC/ACモード」と略す。)
[数9]
2(0,0)=C(0,0)−A(0,0),
2(0,v)=C(0,v)−A(0,v)・QA/QC
v=1,2,…,AC_Coeff,
2(u,v)=C(u,v)
(d)モード3:処理ブロックから左側のブロックからのDC/AC予測(「左のDC/ACモード」と略す。)
[数10]
3(0,0)=C(0,0)−B(0,0),
3(u,0)=C(u,0)−B(u,0)・QB/QC
u=1,2,…,AC_Coeff,
3(u,v)=C(u,v)
<C4.適応的水平/垂直/ジグザグスキャン>
上のような4個の予測モードが与えられるならば、フレーム内符号化の効率は係数のスキャンを採用することによりさらに改善させることができる。
図27、図28及び図29はそれぞれ、第8の実施形態における係数スキャンに用いられる水平スキャン、垂直スキャン及び水平スキャンの順序を説明するための画像の模式図である。ここで、これらのスキャンは集合的にH/V/Zスキャンとして参照される。
<C5.明示的モードの決定>
明示的(explicit)モードの決定においては、予測モードの決定が画像予測符号化装置において実行され、その決定情報が、ビットストリームにおける幾つかの符号化されたビット情報を用いて画像予測符号化装置から画像予測復号化装置に明示的に送られる。
図30は、第8の実施形態に使用されているモード決定処理を示すフローチャートである。
図30において、カレントブロックのDCT変換係数データはユニット2062に入力され、ユニット2062は、ブロックメモリ2061からの隣接するブロックのDCT変換係数データから入力されたカレントブロックのDCT変換係数データを減算することにより、DCT変換予測処理が実行される。ユニット2062では、節C3.で説明された4つのモードで、DCT変換予測処理が実行される。次いで、H/V/Zスキャンユニット2063では、係数のスキャン処理が実行され、ここでは、図30に示すように、節C4.で説明したそれぞれ対応するスキャン処理が実行される。さらに、スキャン処理後のDCT変換係数データは、エントロピー符号化ユニット2064に送られ、ここで可変長符号化処理が実行される。次いで、ユニット2065では、異なるモードで発生されたすべてのビットが比較されて、ユニット2066では、最少のビットを発生する予測モードのDCT変換係数のブロックが選択される。これらのDCT変換係数データのビットは予測モードの値とともにユニット2066からビットストリームとして画像予測復号化装置に送られる。なお、予測モードは、次の表3の固定長コードを用いて符号化される。
Figure 0003857297
<C6.暗黙的モードの決定>
モード決定の第2の実施例では、画像予測符号化装置と画像予測復号化装置とが同一の予測モード決定機能を共有している。画像予測符号化装置と画像予測復号化装置は共に、カレントブロックに隣接する復号化されたブロックのDC係数値に基づいて、予測モードの決定に関する方向性を決定する。すなわち、暗黙的(implicit)モードの決定においては、暗黙的モードの決定が幾つかの規則を用いて画像予測符号化装置と画像予測復号化装置において実行される。そして、モード決定を示す付加的な情報データは画像予測符号化装置から画像予測復号化装置に対して送られない。
図31は、第8の実施形態の暗黙モード決定におけるブロックの関係を示す画像の模式図である。すなわち、図31は、各ブロックと予測対象であるカレントブロックとの位置関係を示している。
図31において、ブロックCは現在予測中の処理対象のカレントブロックである。ブロックAは、予測中のカレントブロックCの上側のブロックである。ブロックCは、カレントブロックCから左側に位置するブロックである。ブロックC’は、カレントブロックCとは対角位置にあるブロックAとブロックBの間のブロックである。
まず、DCの方向が決定される。個別の決定方法を使用して、AC係数も同様に予測中であるか否かが決定される。これを行うには、予測係数の絶対値の差の合計を非予測係数の絶対値と比較し、何れが小さいかを判断する。画像予測復号化装置へのこの指示には、1ビットが使用される。DC予測の方向性、及びAC係数が予測されているか否かの決定には、以下の式が使用される。表3は、可能性のある4つの結論を要約したものである。
(A1)もし
[数11]
(B(0,0)−C’(0,0)<C’(0,0)−A(0,0))
のとき、
[数12]
E(0,0)=C(0,0)−A(0,0)
であり、
(a1)もし
[数13]
7 7
( Σ C(0,v)≧ Σ C(0,v)−A(0,v))
v=1 v=1
のとき、
[数14]
E(0,v)
=C(0,v)−A(0,v)・QA/QC,v=1,…,7,
(a2)上記数13が成立しなければ、
[数15]
E(0,v)=C(0,v)
である。
(A2)上記数11が成立しなければ、
[数16]
E(0,0)=C(0,0)−B(0,0)
であり、
(b1)もし
[数17]
7 7
( Σ C(u,0)≧ Σ C(u,0)−B(u,0))
v=1 v=1
のとき、
[数18]
E(u,0)
=C(u,0)−B(u,0)・QB/QC,v=1,…,7,
(b2)上記数17が成立しなければ、
[数19]
E(u,0)=C(u,0)
である。
さらに、他の全ての係数に対して、
[数20]
E(u,v)=C(u,v)
である。
Figure 0003857297
以上の第8の実施形態において、DCT変換係数予測処理はユニット2040によって、量子化された変換係数データについて行っているが、本発明はこれに限らず、図17の第6の実施形態と同様に、量子化されない変換係数データについて行ってもよい。この場合、対応する画像予測復号化装置においては、図25において、逆量子化ユニット2056は、逆スキャンユニット2052と、加算器2053に移動されて挿入される。
以下、第8の実施形態の変形例について述べる。
(a)ブロックサンプリングユニット2031は、4つのブロックのグループの中の二次元配列の画素は、第1のブロックでは奇数番目の行にある奇数番目の画素から成り、第2のブロックでは奇数番目の行にある偶数番目の画素から成り、第3ブロックでは偶数番目の行にある奇数場番目の画素から成り、第4ブロックでは偶数番目の行にある偶数番目の画素から成るように、画素を交互に差し挟むインターリーブ処理を含んでもよい。
(b)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックに隣接するように位置されたブロックから選択され、ブロック中の全ての係数データが選択されてもよい。
(c)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックに隣接するように位置されたブロックから選択され、あらかじめ定められたサブセットがブロックの係数データとして選択されてもよい。
(d)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックであって、符号化されたカレントブロックの上方及び左側に隣接するよう位置されたブロックから選択され、当該ブロックの最上行、及び当該ブロックの最左列の係数データのみが使用され、残りの係数データはゼロにセットされてもよい。
(e)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
当該ブロックの最上行又は最左列からの1つ又はそれ以上の係数データを含むサブセットのみを使用することを、画像予測符号化装置と画像予測復号化装置とが通信を行うことにより決定してもよい。
(f)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
当該ブロックの最上行又は最左列からの1つ又はそれ以上の係数データを含むサブセットのみを使用することを、画像予測符号化装置が決定して、決定されたサブセット及び係数データの数を示すフラグを、画像予測復号化装置に送信されるデータに周期的に挿入することにより、画像予測復号化装置に通知してもよい。
(g)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
各ブロックの係数データは、符号化されるカレントブロックの量子化ステップサイズと予測ブロックの量子化ステップサイズの比に等しい比で乗算されてもよい。
(h)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
各ブロックの係数データは、異なる重み付け関数で重み付けされてもよい。
(i)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
各ブロックの係数データに対して所定の変換演算が実行されてもよい。(j)上記予測ブロックは、符号化されるカレントブロックに隣接して位置する、上記ブロックメモリに格納され、前に復元されたブロックの重み付け平均値として得てもよい。
(k)スキャン方法は、
(i)係数データが、左から右に向かって、行毎に、最上行で始まり、最下行で終わるようにスキャンされる水平スキャンと、
(ii)係数データが、最上行から最下行に向かって、列毎に、最左列から始まり、最右列で終るようにスキャンされる垂直スキャンと、
(iii)係数データが、最上行の最左の係数データから最下行の最右の係数データに向かって、対角線方向にスキャンされるジグザグスキャンとのうちの少なくとも1つのスキャン方法を含んでもよい。
(l)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
上記予測ブロックの予測モードは、
(i)処理対象のカレントブロックから上側に位置するブロックからの、DC係数として呼ばれる当該ブロックの平均値を表す最上及び最左の係数データのみを予測のために使用する第1のモードと、
(ii)処理対象のカレントブロックから左側に位置するブロックからの、DC係数のみを予測のために使用する第2のモードと、
(iii)処理対象のカレントブロックから上側に位置するブロックの最上行からの、DC係数及び、高周波成分を含む0個又はそれ以上のAC係数を予測のために使用する第3のモードと、
(iv)処理対象のカレントブロックから左側に位置するブロックの最左列からの、DC係数及び、高周波成分を含む0個又はそれ以上のAC係数を予測のために使用する第4のモードと、
の少なくとも1つの予測モードを含み、
上記予測誤差の係数データはジグザグスキャンのスキャン方法でスキャンされてもよい。
(m)上記予測ブロックは、上記ブロックメモリに格納され、前に復元されたブロックから上述の基準に従って選択され、
上記予測誤差の係数データは、上述のスキャン方法の1つに従ってスキャンされ、
上記予測誤差の係数データを予測する予測モードは、
(i)処理対象のカレントブロックから上側に位置するブロックにおけるDC係数のみが予測のために使用され、上記予測誤差の係数データに対して、ジグザグスキャンでスキャン処理が実行される第1のモードと、
(ii)処理対象のカレントブロックから左側に位置するブロックにおけるDC係数のみが予測のために使用され、上記予測誤差の係数データに対して、ジグザグスキャンでスキャン処理が実行される第2のモードと、
(iii)処理対象のカレントブロックから上側に位置するブロックの最上行におけるDC係数及び、高周波成分を含む0個又はそれ以上のAC係数が予測のために使用され、上記予測誤差の係数データに対して、水平スキャンでスキャン処理が実行される第3のモードと、
(iv)処理対象のカレントブロックから左側に位置するブロックの最左列におけるDC係数及び、高周波成分を含む0個又はそれ以上のAC係数が予測のために使用され、上記予測誤差の係数データに対して、垂直スキャンでスキャン処理が実行される第4のモードと、
の少なくとも1つを含んでもよい。
(n)上記復号化された画像データに基づいて、インターリーブされた4個のブロックからなる複数のグループから二次元配列の画素を形成して元の画像データを復元するときに、奇数番目の行にある奇数番目の画素は全て第1のブロックから求め、奇数番目の行にある偶数番目の画素は第2のブロックから求め、偶数番目の行にある奇数番目の画素は第3ブロックから求め、偶数番目の行にある偶数番目の画素は第4ブロックから求めるように、上記復号化された画像データに対して逆インターリーブ処理を実行してもよい。
(o)画像予測符号化装置と画像予測復号化装置は、予め決められた同一のルールを用いて、上記予測モードを決定してもよい。
(p)画像予測符号化装置と画像予測復号化装置は、予め決められた同一のルールを用いて、上記スキャン方法を決定してもよい。
以上説明したように、本発明に係る第3の実施形態グループによれば、隣接するブロックを越えてDCT変換領域の中の冗長性を削減又は除去するのに非常に効果的であり、使用ビットのビット数を削減し、その結果、符号化の効率を大幅に改善することができる。これは新しいビデオ圧縮アルゴリズムにおけるツールとしても有用である。
以上の実施形態において、画像予測符号化装置及び画像予測復号化装置について述べているが、本発明はこれに限らず、上記画像予測符号化装置における各手段、各ユニットなどの構成要素をそれぞれ各ステップに置き換えたステップを含む画像予測符号化方法であってもよいし、上記画像予測復号化装置における各手段、各ユニットなどの構成要素をそれぞれ各ステップに置き換えたステップを含む画像予測復号化方法であってもよい。この場合、例えば、上記画像予測符号化方法及び/又は上記画像予測復号化方法の各ステップがプログラムとして記憶装置に記憶され、マイクロプロセッサユニット(MPU)、中央演算処理装置(CPU)などのコントローラは当該プログラムを実行することにより、画像予測符号化処理及び/又は上記画像予測復号化処理を実行する。
また、本発明は、上記画像予測符号化方法及び/又は上記画像予測復号化方法における各ステップを含むプログラムを記録した記録媒体であってもよい。当該記録媒体は、例えば記録領域がセクタ形状に分割され、又は記録領域が渦巻き形状で各ブロックに分割された円盤形状を有し、例えば、CD−ROM、DVDなどの光ディスク又は光磁気ディスク、もしくは、フロッピーディスクなどの磁気記録ディスクである。
本発明に係る第1の実施形態である画像予測符号化装置の構成を示すブロック図である。 図1の画像予測符号化装置に入力される入力画像を8×8のブロックに分割した場合の模式図である。 図1の画像予測符号化装置に入力される入力画像を三角領域に分割した場合の模式図である。 図1の画像予測符号化装置に用いられる予測信号発生器の第1の実施例の構成を示すブロック図である。 図1の画像予測符号化装置に用いられる予測信号発生器の第2の実施例の構成を示すブロック図である。 図1の画像予測符号化装置に用いられる予測信号発生器の第3の実施例の構成を示すブロック図である。 図1の画像予測符号化装置に用いられる予測信号発生器の第4の実施例の構成を示すブロック図である。 本発明に係る第2の実施形態である画像予測符号化装置の構成を示すブロック図である。 図1及び図8の画像予測符号化装置に入力される入力画像であって、有意である画素を有する入力画像の一例を示す模式図である。 図1及び図8の画像予測符号化装置に入力される入力画像であって、有意である画素を有する入力画像の一例を示す模式図である。 図1及び図8の画像予測符号化装置に入力される入力画像であって、有意でない画素を有する入力画像の一例を示す模式図である。 本発明に係る第3の実施形態である画像予測復号化装置の構成を示すブロック図である。 本発明に係る第4の実施形態である画像予測復号化装置の構成を示すブロック図である。 従来技術の画像予測符号化装置の構成を示すブロック図である。 画面内予測のための適応的DCT変換領域を説明するための画像の模式図である。 本発明に係る第5の実施形態である画像予測符号化装置の構成を示すブロック図である。 本発明に係る第6の実施形態である画像予測符号化装置の構成を示すブロック図である。 図16及び図17のDCT変換領域予測回路の構成を示すブロック図である。 図18のDCT変換領域予測回路におけるDC/AC予測の符号化方法の一例を示す画像の模式図である。 本発明に係る第7の実施形態である画像予測復号化装置の構成を示すブロック図である。 図20の画像予測復号化装置におけるDC/AC予測の復号化方法を示すフローチャートである。 従来技術の画像予測符号化装置の構成を示すブロック図である。 従来技術の画像予測復号化装置の構成を示すブロック図である。 本発明に係る第8の実施形態である画像予測符号化装置の構成を示すブロック図である。 本発明に係る第8の実施形態である画像予測復号化装置の構成を示すブロック図である。 第8の実施形態における、フレームのマクロブロックとブロックの構造を示し、かつブロック予測方法を示す画像の模式図である。 第8の実施形態における係数スキャンに用いられる水平スキャンの順序を説明するための画像の模式図である。 第8の実施形態における係数スキャンに用いられる垂直スキャンの順序を説明するための画像の模式図である。 第8の実施形態における係数スキャンに用いられるジグザグスキャンの順序を説明するための画像の模式図である。 第8の実施形態に使用されているモード決定処理を示すフローチャートである。 第8の実施形態の暗黙モード決定におけるブロックの関係を示す画像の模式図である。
符号の説明
101…入力端子、
102…第1の加算器、
103…符号化器、
104…DCT変換器、
105…量子化器、
106…出力端子、
107…復号化器、
108…逆量子化器、
109…逆DCT変換器、
110…第2の加算器、
111…ラインメモリ、
112…予測信号発生器、
200…ブロック、
300,301…三角形、
401,402…発生器、
403,404…画像データ、
500…加算器、
601,602,603…誤差計算器、
604…比較器、
605…スイッチ、
700…動き検出器、
701…動き補償器、
702…フレームメモリ、
703…最適モード選択器、
800,804…形状曲線、
802,805,810…処理対象の小領域、
808…曲線、
901…入力端子、
902…データ解析器、
903…復号化器、
904…逆量子化器、
905…逆DCT変換器、
906…加算器、
907…出力端子、
908…コントローラ、
909…動き補償器、
910…予測信号発生器、
911…ラインメモリ、
912…フレームメモリ、
913…スイッチ、
922…予測信号発生器、
923…動き補償器、
990…形状復号化器、
1001…ブロックサンプリングユニット、
1002…動き検出ユニット、
1003…補償ユニット、
1004…DCT変換器、
1005…量子化ユニット、
1006…エントロピー符号化ユニット、
1007…レートコントローラ、
1008,1009…ユニット、
1010…ローカル復号化フレームメモリ、
1011…基準フレームメモリ、
1012…ブロックサンプリングユニット、
1013…加算器、
1014…DCT変換ユニット、
1015…量子化ユニット、
1016…加算器、
1017…DCT変換領域予測ユニット、
1018…ブロックメモリ、
1019…加算器、
1020…エントロピーVLC符号化ユニット、
1021…逆量子化ユニット、
1022…逆DCT変換ユニット、
1023…加算器、
1024…フレームメモリ、
1025…動き検出及び補償ユニット、
1026…ブロックサンプリングユニット、
1027…加算器、
1028…DCT変換ユニット、
1029…加算器、
1030…量子化ユニット、
1031…DCT変換領域予測ユニット、
1032…ブロックメモリ、
1033…逆量子化ユニット、
1034…エントロピーVLC符号化ユニット、
1035…加算器、
1036…逆DCT変換ユニット、
1037…加算器、
1038…フレームメモリ、
1040…ブロックメモリ、
1041…ユニット、
1042…No−Predブロック、
1043…Up−Predブロック、
1044…Left−Predブロック、
1045…Other−Predブロック、
1048,1049,1050…ユニット、
1051…エントロピーVLD復号化ユニット、
1052…加算器、
1053…DCT変換領域予測ユニット、
1054…ブロックメモリ、
1055…逆DCT変換ユニット、
1056…加算器、
1057…動き検出及び補償ユニット、
1059…逆量子化ユニット、
1101,1102…カレントブロック、
2031…ブロックサンプリングユニット、
2032…加算器、
2033…DCT変換ユニット、
2034…量子化ユニット、
2035…加算器、
2036…H/V/Zスキャンユニット、
2037…エントロピーVLC符号化ユニット、
2038…加算器、
2039…ブロックメモリ、
2040…DCT変換領域予測ユニット、
2041…逆量子化ユニット、
2042…逆DCT変換ユニット、
2043…加算器、
2044…フレーメモリ、
2045…動き検出及び補償ユニット、
2051…可変長デコーダユニット、
2052…H/V/Zスキャンユニット、
2053…加算器、
2054…ブロックメモリ、
2055…DCT変換領域予測ユニット、
2056…逆量子化ユニット、
2057…逆DCT変換ユニット、
2058…加算器、
2059…フレームメモリ、
2060…動き検出及び補償ユニット、
2061…ブロックメモリ、
2062…減算ユニット、
2063…H/V/Zスキャンユニット、
2064…エントロピー符号化ユニット、
2065…比較ユニット、
2066…選択ユニット、
B0…カレントブロック、
B1…左上のブロック、
B2…上のブロック、
B3…右上のブロック、
B4…左のブロック。

Claims (2)

  1. ブロック化された画像データを2次元列の変換係数に変換する変換ステップと、
    上記変換された2次元列の変換係数を量子化して、量子化された変換係数を得る量子化ステップと、
    カレントブロックに隣接する上ブロック又は左ブロックのいずれかから上記カレントブロックの変換係数を予測すべき予測ブロックを適応的に選択する予測ブロック選択ステップと、
    上記上ブロック又は上記左ブロックのいずれかから適応的に選択された予測ブロックの変換係数を用いて、上記カレントブロックの量子化変換係数に対する予測を行い、2次元列の変換係数予測誤差を求める変換係数予測ステップと、
    上記2次元列の変換係数予測誤差を走査して、1次元列の変換係数を得る走査ステップを含む画像予測符号化方法であって、
    上記カレントブロックの量子化変換係数に対する予測は、
    上記予測ブロックの量子化されたAC係数について、カレントブロックの量子化ステップサイズと予測ブロックの量子化ステップサイズとの比によりスケーリングを行い、
    上記スケーリングされたAC係数を予測値として、カレントブロックのAC係数に対する予測を行うものであり、
    上記走査ステップは、
    (1)上記カレントブロックの変換係数予測において、上記カレントブロックのAC係数予測が行われていない場合はジグザグ走査であり、
    (2)上記カレントブロックのAC係数予測が行われ、上記カレントブロックのDC係数の予測が左ブロックから予測されている場合には、垂直方向の上記AC係数を水平方向の上記AC係数より優先的に走査する垂直優先走査であり、
    (3)上記カレントブロックのAC係数予測が行われ、上記カレントブロックのDC係数の予測が上ブロックから予測されている場合には、水平方向の上記AC係数を垂直方向の上記AC係数より優先的に走査する水平優先走査であることを特徴とする画像予測符号化方法。
  2. 画像データを符号化する画像予測符号化装置であって、
    ブロック化された画像データを2次元列の変換係数に変換する変換器と、
    上記2次元列の変換係数を量子化して、量子化された変換係数を得る量子化器と、
    カレントブロックに隣接する上ブロック又は左ブロックのいずれかから上記カレントブロックの変換係数を予測すべき予測ブロックを適応的に選択する予測ブロック選択手段と、
    上記上ブロック又は上記左ブロックのいずれかから適応的に選択された予測ブロックの変換係数を用いて、上記カレントブロックの量子化変換係数に対する予測を行い、2次元列の変換係数予測誤差を求める変換係数予測手段と、
    上記2次元列の変換係数予測誤差を走査して、1次元列の変換係数を得る走査手段を含み、
    上記カレントブロックの量子化変換係数に対する予測は、
    上記予測ブロックの量子化されたAC係数について、カレントブロックの量子化ステップサイズと予測ブロックの量子化ステップサイズとの比によりスケーリングを行い、
    上記スケーリングされたAC係数を予測値として、カレントブロックのAC係数に対する予測を行うものであり、
    上記走査手段は、
    (1)上記カレントブロックの変換係数予測において、上記カレントブロックのAC係数予測が行われていない場合はジグザグ走査を行い、
    (2)上記カレントブロックのAC係数予測が行われ、上記カレントブロックのDC係数の予測が左ブロックから予測されている場合には、垂直方向の上記AC係数を水平方向の上記AC係数より優先的に走査する垂直優先走査を行い、
    (3)上記カレントブロックのAC係数予測が行われ、上記カレントブロックのDC係数の予測が上ブロックから予測されている場合には、水平方向の上記AC係数を垂直方向の上記AC係数より優先的に走査する水平優先走査を行うように動作可能であることを特徴とする画像予測符号化装置。
JP2005366257A 1996-05-28 2005-12-20 画像予測符号化方法及び装置 Expired - Lifetime JP3857297B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005366257A JP3857297B2 (ja) 1996-05-28 2005-12-20 画像予測符号化方法及び装置

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP13297096 1996-05-28
JP17642696 1996-07-05
JP25467796 1996-09-26
JP2005366257A JP3857297B2 (ja) 1996-05-28 2005-12-20 画像予測符号化方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2004049378A Division JP3851317B2 (ja) 1996-05-28 2004-02-25 画像予測符号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2006197574A JP2006197574A (ja) 2006-07-27
JP3857297B2 true JP3857297B2 (ja) 2006-12-13

Family

ID=36803223

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005366257A Expired - Lifetime JP3857297B2 (ja) 1996-05-28 2005-12-20 画像予測符号化方法及び装置

Country Status (1)

Country Link
JP (1) JP3857297B2 (ja)

Also Published As

Publication number Publication date
JP2006197574A (ja) 2006-07-27

Similar Documents

Publication Publication Date Title
JP3851063B2 (ja) 画像予測復号化方法及び装置
JP3857298B2 (ja) 画像予測符号化装置及び方法、並びに画像予測復号化装置及び方法
JP3851317B2 (ja) 画像予測符号化方法及び装置
JP3343554B1 (ja) 画像予測復号化方法及び画像予測符号化装置
JP3857297B2 (ja) 画像予測符号化方法及び装置
JP3157144B1 (ja) 画像予測復号化方法
JP2002359852A (ja) 画像予測復号化装置及び方法
JP3343553B1 (ja) 画像予測符号化装置及び方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060905

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060913

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090922

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100922

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110922

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120922

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130922

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S131 Request for trust registration of transfer of right

Free format text: JAPANESE INTERMEDIATE CODE: R313133

SZ02 Written request for trust registration

Free format text: JAPANESE INTERMEDIATE CODE: R313Z02

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term