JP3937632B2 - 画像復号装置及び画像復号方法 - Google Patents
画像復号装置及び画像復号方法 Download PDFInfo
- Publication number
- JP3937632B2 JP3937632B2 JP04373499A JP4373499A JP3937632B2 JP 3937632 B2 JP3937632 B2 JP 3937632B2 JP 04373499 A JP04373499 A JP 04373499A JP 4373499 A JP4373499 A JP 4373499A JP 3937632 B2 JP3937632 B2 JP 3937632B2
- Authority
- JP
- Japan
- Prior art keywords
- orthogonal transform
- coefficients
- block
- discrete cosine
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、8×8画素からなる直交変換ブロック単位で直交変換することによる圧縮符号化をした第1の解像度の圧縮画像データを復号する画像復号装置及び画像復号方法に関し、特に、第1の解像度の圧縮画像データを復号して、この第1の解像度よりも低い第2の解像度の動画像データに縮小する画像復号装置及び画像復号方法に関するものである。
【0002】
【従来の技術】
MPEG2(Moving Picture Experts Group phase2)等の画像圧縮方式を用いたデジタルテレビジョン放送の規格化が進められている。デジタルテレビジョン放送の規格には、標準解像度画像(例えば垂直方向の有効ライン数が576本)に対応した規格、高解像度画像(例えば垂直方向の有効ライン数が1152本)に対応した規格等がある。そのため、近年、高解像度画像の圧縮画像データを復号するとともにこの圧縮画像データを1/2の解像度に縮小することにより、標準解像度画像の画像データを生成して、この画像データを標準解像度に対応したテレビジョンモニタに表示するダウンデコーダが求められている。
【0003】
高解像度画像に対して動き予測による予測符号化及び離散コサイン変換による圧縮符号化をしたMPEG2等のビットストリームを、復号するとともに標準解像度画像にダウンサンプリングするダウンデコーダが、文献「低域ドリフトのないスケーラブル・デコーダ」(岩橋・神林・貴家:信学技報 CS94-186,DSP94-108,1995-01)に提案されている(以下、この文献を文献1と呼ぶ。)。この文献1には、以下の第1から第3のダウンデコーダが示されている。
【0004】
第1のダウンデコーダは、図4に示すように、高解像度画像のビットストリームに対して8(垂直方向のDC成分から数えた係数の数)×8(水平方向のDC成分から数えた係数の数)の逆離散コサイン変換をする逆離散コサイン変換装置101と、離散コサイン変換がされた高解像度画像と動き補償がされた参照画像とを加算する加算装置102と、参照画像を一時記憶するフレームメモリ103と、フレームメモリ103が記憶した参照画像に1/2画素精度で動き補償をする動き補償装置104と、フレームメモリ103が記憶した参照画像を標準解像度の画像に変換するダウンサンプリング装置105とを備えている。
【0005】
この第1のダウンデコーダでは、逆離散コサイン変換を行い高解像度画像として復号した出力画像を、ダウンサンプリング装置105で縮小して標準解像度の画像データを出力する。
【0006】
第2のダウンデコーダは、図5に示すように、高解像度画像のビットストリームのDCT(Discrete Cosine Transform)ブロックの高周波成分の係数を0に置き換えて8×8の逆離散コサイン変換をする逆離散コサイン変換装置111と、離散コサイン変換がされた高解像度画像と動き補償がされた参照画像とを加算する加算装置112と、参照画像を一時記憶するフレームメモリ113と、フレームメモリ113が記憶した参照画像に1/2画素精度で動き補償をする動き補償装置114と、フレームメモリ113が記憶した参照画像を標準解像度の画像に変換するダウンサンプリング装置115とを備えている。
【0007】
この第2のダウンデコーダでは、DCTブロックの全ての係数のうち高周波成分の係数を0に置き換えて逆離散コサイン変換を行い高解像度画像として復号した出力画像を、ダウンサンプリング装置105で縮小して標準解像度の画像データを出力する。
【0008】
第3のダウンデコーダは、図6に示すように、高解像度画像のビットストリームのDCTブロックの低周波成分の係数のみを用いて例えば4×4の逆離散コサイン変換をして標準解像度画像に復号する縮小逆離散コサイン変換装置121と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置122と、参照画像を一時記憶するフレームメモリ123と、フレームメモリ123が記憶した参照画像に1/4画素精度で動き補償をする動き補償装置124とを備えている。
【0009】
この第3のダウンデコーダでは、DCTブロックの全ての係数のうち低周波成分の係数のみを用いて逆離散コサイン変換を行い、高解像度画像から標準解像度画像として復号する。
【0010】
ここで、上記第1のダウンデコーダでは、DCTブロック内の全ての係数に対して逆離散コサイン変換を行い高解像度画像を復号しているため、高い演算処理能力の逆離散コサイン変換装置101と高容量のフレームメモリ103とが必要となる。また、上記第2のダウンデコーダでは、DCTブロック内の係数のうち高周波成分を0として離散コサイン変換を行い高解像度画像を復号しているため、逆離散コサイン変換装置111の演算処理能力は低くて良いが、やはり高容量のフレームメモリ113が必要となる。これら第1及び第2のダウンデコーダに対し、第3のダウンデコーダでは、DCTブロック内の全ての係数うち低周波成分の係数のみを用いて逆離散コサイン変換をしているため逆離散コサイン変換装置121の演算処理能力が低くてよく、さらに、標準解像度画像の参照画像を復号しているのでフレームメモリ123の容量も少なくすることができる。
【0011】
ところで、テレビジョン放送等の動画像の表示方式には、順次走査方式と飛び越し走査方式とがある。順次走査方式は、フレーム内の全ての画素を同じタイミングでサンプリングした画像を、順次表示する表示方式である。飛び越し走査方式は、フレーム内の画素を水平方向の1ライン毎に異なるタイミングでサンプリングした画像を、交互に表示する表示方式である。
【0012】
この飛び越し走査方式では、フレーム内の画素を1ライン毎に異なるタイミングでサンプリングした画像のうちの一方を、トップフィールド(第1フィールドともいう。)といい、他方をボトムフィールド(第2のフィールドともいう。)という。フレームの水平方向の先頭ラインが含まれる画像がトップフィールドとなり、フレームの水平方向の2番目のラインが含まれる画像がボトムフィールドとなる。従って、飛び越し走査方式では、1つのフレームが2つのフィールドから構成されることとなる。
【0013】
MEPG2では、飛び越し走査方式に対応した動画像信号を効率良く圧縮するため、画面の圧縮単位であるピクチャにフレームを割り当てて符号化するだけでなく、ピクチャにフィールドを割り当てて符号化することもできる。
【0014】
MPEG2では、ピクチャにフィールドが割り当てられた場合には、そのビットストリームの構造をフィールド構造と呼び、ピクチャにフレームが割り当てられた場合には、そのビットストリームの構造をフレーム構造と呼ぶ。また、フィールド構造では、フィールド内の画素からDCTブロックが形成され、フィールド単位で離散コサイン変換がされる。このフィールド単位で離散コサイン変換を行う処理モードのことをフィールドDCTモードと呼ぶ。また、フレーム構造では、フレーム内の画素からDCTブロックが形成され、フレーム単位で離散コサイン変換がされる。このフレーム単位で離散コサイン変換を行う処理モードのことをフレームDCTモードと呼ぶ。さらに、フィールド構造では、フィールド内の画素からマクロブロックが形成され、フィールド単位で動き予測がされる。このフィールド単位で動き予測を行う処理モードのことをフィールド動き予測モードと呼ぶ。また、フレーム構造では、フレーム内の画素からマクロブロックが形成され、フレーム単位で動き予測がされる。フレーム単位で動き予測を行う処理モードのことをフレーム動き予測モードと呼ぶ。
【0015】
ところで、上記文献1に示された第3のダウンデコーダを利用して、飛び越し走査方式に対応した圧縮画像データを復号する画像復号装置が、例えば文献「A Compensation Method of Drift Errors in Scalability」(N.OBIKANE,K.TAHARA and J.YONEMITSU,HDTV Work Shop'93)に提案されている(以下、この文献を文献2と呼ぶ)。
【0016】
この文献2に示された従来の画像復号装置は、図7に示すように、高解像度画像をMPEG2で圧縮したビットストリームが供給され、このビットストリームを解析するビットストリーム解析装置131と、データの発生頻度に応じた符号長を割り当てる可変長符号化がされたビットストリームを復号する可変長符号復号装置132と、DCTブロックの各係数に量子化ステップを掛ける逆量子化装置2033と、DCTブロックの全ての係数のうち低周波成分の係数のみを用いて例えば4×4の逆離散コサイン変換をして標準解像度画像を復号する縮小逆離散コサイン変換装置134と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置135と、参照画像を一時記憶するフレームメモリ136と、フレームメモリ136が記憶した参照画像に1/4画素精度で動き補償をする動き補償装置137とを備えている。
【0017】
この文献2に示された従来の画像復号装置の縮小逆離散コサイン変換装置134は、DCTブロック内の全ての係数のうち低周波成分の係数のみを用いて逆離散コサイン変換をするが、フレームDCTモードとフィールドDCTモードとで、逆離散コサイン変換を行う係数の位置が異なっている。
【0018】
具体的には、縮小逆離散コサイン変換装置134は、フィールドDCTモードの場合には、図8に示すように、DCTブロック内の8×8個のうち、低域の4×4個の係数のみに逆離散コサイン変換を行う。それに対し、縮小逆離散コサイン変換装置134は、フレームDCTモードの場合には、図9に示すように、DCTブロック内の8×8個の係数のうち、4×2個+4×2個の係数のみに逆離散コサイン変換を行う。
【0019】
また、この文献2に示された従来の画像復号装置の動き補償装置137は、 高解像度画像に対して行われた動き予測の情報(動きベクトル)に基づき、フィールド動き予測モード及びフレーム動き予測モードのそれぞれに対応した1/4画素精度の動き補償を行う。すなわち、通常MPEG2では1/2画素精度で動き補償が行われることが定められているが、高解像度画像から標準解像度画像を復号する場合には、ピクチャ内の画素数が1/2に間引かれるため、動き補償装置137では動き補償の画素精度を1/4画素精度として動き補償を行っている。
【0020】
従って、動き補償装置137では、高解像度画像に対応した動き補償を行うため、標準解像度の画像としてフレームメモリ136に格納された参照画像の画素に対して線形補間して、1/4画素精度の画素を生成している。
【0021】
具体的に、フィールド動き予測モード及びフレーム動き予測モードの場合の垂直方向の画素の線形補間処理を、図10及び図11を用いて説明する。なお、図面中には、縦方向に垂直方向の画素の位相を示し、表示画像の各画素が位置する位相を整数で示している。
【0022】
まず、フィールド動き予測モードで動き予測がされた画像の補間処理について、図10を用いて説明する。高解像度画像(上位レイヤー)に対しては、図10(a)に示すように、各フィールドそれぞれ独立に、1/2画素精度で動き補償がされる。これに対し、標準解像度画像(下位レイヤー)に対しては、図10(b)に示すように、整数精度の画素に基づきフィールド内で線形補間をして、垂直方向に1/4画素、1/2画素、3/4画素分の位相がずれた画素を生成し、動き補償がされる。すなわち、標準解像度画像(下位レイヤー)では、トップフィールドの整数精度の各画素に基づきトップフィールドの1/4画素精度の各画素が線形補間により生成され、ボトムフィールドの整数精度の各画素に基づきボトムフィールドの1/4画素精度の各画素が線形補間により生成される。例えば、垂直方向の位相が0の位置にあるトップフィールドの画素の値をa、垂直方向の位相が1の位置にあるトップフィールドの画素の値をbとする。この場合、垂直方向の位相が1/4の位置にあるトップフィールドの画素は(3a+b)/4となり、垂直方向の位相が1/2の位置にあるトップフィールドの画素は(a+b)/2となり、垂直方向の位相が3/4の位置にあるトップフィールドの画素は(a+3b)/4となる。
【0023】
続いて、フレーム動き予測モードで動き予測がされた画像の補間処理について、図11を用いて説明する。高解像度画像(上位レイヤー)に対しては、図11(a)に示すように、各フィールド間で補間処理がされ、すなわち、ボトムフィールドとトップフィールドとの間で補間処理がされ、1/2画素精度で動き補償がされる。標準解像度画像(下位レイヤー)に対しては、図11(b)に示すように、トップフィールド及びボトムフィールドの2つのフィールドの整数精度の各画素に基づき、垂直方向に1/4画素、1/2画素、3/4画素分の位相がずれた画素が線形補間により生成され、動き補償がされる。例えば、垂直方向の位相が−1の位置にあるボトムフィールドの画素の値をa、垂直方向の位相が0の位置にあるトップフィールドの画素の値をb、垂直方向の位相が1の位置にあるボトムフィールドの画素の値をc、垂直方向の位相が2の位置にあるトップフィールドの画素の値をd、垂直方向の位相が3の位置にあるボトムフィールドの画素の値をeとする。この場合、垂直方向の位相が0〜2の間にある1/4画素精度の各画素は、以下のように求められる。
【0024】
垂直方向の位相が1/4の位置にある画素は(a+4b+3c)/8となる。垂直方向の位相が1/2の位置にある画素は(a+3c)/4となる。垂直方向の位相が3/4の位置にある画素は(a+2b+3c+2d)/8となる。垂直方向の位相が5/4の位置にある画素は(2b+3c+2d+e)/8となる。垂直方向の位相が3/2の位置にある画素は(3c+e)/4となる。垂直方向の位相が7/4の位置にある画素は(3c+4d+e)/8となる。
【0025】
以上のように上記文献2に示された従来の画像復号装置は、飛び越し走査方式に対応した高解像度画像の圧縮画像データを、標準解像度画像データに復号することができる。
【0026】
しかしながら、上記文献2に示された従来の画像復号装置では、フィールドDCTモードで得られる標準解像度画像の各画素と、フレームDCTモードで得られる標準解像度の各画素との位相がずれる。具体的には、フィールドDCTモードでは、図12に示すように、下位レイヤーのトップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、下位レイヤーのボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。それに対して、フレームDCTモードでは、図13に示すように、下位レイヤーのトップフィールドの各画素の垂直方向の位相が0、2・・・となり、下位レイヤーのボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。そのため、位相が異なる画像がフレームメモリ136に混在し、出力する画像の画質が劣化する。
【0027】
また、上記文献2に示された従来の画像復号装置では、フィールド動き予測モードとフレーム動き予測モードとで位相ずれの補正がされていない。そのため、出力する画像の画質が劣化する。
【0028】
【発明が解決しようとする課題】
このような問題を解決するための画像復号装置が、特願平10−208385号により提案されている。
【0029】
つぎに、特願平10−208385で提案された画像復号装置について説明する。
【0030】
図14に示す特願平10−208385号で提案した画像復号装置200は、垂直方向の有効ライン数が例えば1152本の高解像度画像をMPEG2で画像圧縮したビットストリームが入力され、この入力されたビットストリームを復号するとともに1/2の解像度に縮小して、垂直方向の有効ライン数が例えば576本の標準解像度画像を出力する装置である。
【0031】
なお、以下、高解像度画像のことを上位レイヤーとも呼び、標準解像度画像のことを下位レイヤーとも呼ぶものとする。また、通常、8×8の離散コサイン係数を有するDCTブロックを逆離散コサイン変換した場合8×8の画素から構成される復号データを得ることができるが、例えば、8×8の離散コサイン係数を復号して4×4の画素から構成される復号データを得るような、逆離散コサイン変換をするとともに解像度を縮小する処理を、縮小逆離散コサイン変換という。
【0032】
この画像復号装置200は、圧縮された高解像度画像のビットストリームが供給され、このビットストリームを解析するビットストリーム解析装置201と、データの発生頻度に応じた符号長を割り当てる可変長符号化がされた上記ビットストリームを復号する可変長符号復号装置202と、DCTブロックの各係数に量子化ステップを掛ける逆量子化装置203と、フィールドDCTモードで離散コサイン変換がされたDCTブロックに対して縮小逆離散コサイン変換をして標準解像度画像を生成するフィールドモード用縮小逆離散コサイン変換装置204と、フレームDCTモードで離散コサイン変換がされたDCTブロックに対して縮小逆離散コサイン変換をして標準解像度画像を生成するフレームモード用縮小逆離散コサイン変換装置205と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置206と、参照画像を一時記憶するフレームメモリ207と、フレームメモリ207が記憶した参照画像にフィールド動き予測モードに対応した動き補償をするフィールドモード用動き補償装置208と、フレームメモリ207が記憶した参照画像にフレーム動き予測モードに対応した動き補償をするフレームモード用動き補償装置209と、フレームメモリ207が記憶した画像に対してポストフィルタリングをすることにより、画枠変換をするとともに画素の位相ずれを補正してテレビジョンモニタ等に表示するための標準解像度の画像データを出力する画枠変換・位相ずれ補正装置210とを備えている。
【0033】
フィールドモード用縮小逆離散コサイン変換装置204は、入力されたビットストリームのマクロブロックが、フィールドDCTモードで離散コサイン変換されている場合に用いられる。フィールドモード用縮小逆離散コサイン変換装置204は、フィールドDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、図8で示したような、低域の4×4の係数のみに逆離散コサイン変換を行う。すなわち、水平方向及び垂直方向の低域の4点の離散コサイン係数に基づき縮小逆離散コサイン変換を行う。このフィールドモード用縮小逆離散コサイン変換装置204では、以上のような縮小逆離散コサイン変換を行うことにより、1つのDCTブロックが4×4の画素から構成される標準解像度画像を復号することができる。この復号された画像データの各画素の位相は、図15に示すように、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。すなわち、復号された下位レイヤーのトップフィールドでは、先頭画素(位相が1/2の画素)の位相が上位レイヤーのトップフィールドの先頭から1番目と2番目の画素(位相が0と2の画素)の中間位相となり、先頭から2番目の画素(位相が5/2の画素)の位相が上位レイヤーのトップフィールドの先頭から3番目と4番目の画素(位相が4と6の画素)の中間位相となる。また、復号された下位レイヤーのボトムフィールドでは、先頭画素(位相が1の画素)の位相が上位レイヤーのボトムフィールドの先頭から1番目と2番目の画素(位相が1と3の画素)の中間位相となり、先頭から2番目の画素(位相が3の画素)の位相が上位レイヤーのボトムフィールドの先頭から3番目と4番目の画素(位相が5と7の画素)の中間位相となる。
【0034】
フレームモード用縮小逆離散コサイン変換装置205は、入力されたビットストリームのマクロブロックが、フレームDCTモードで離散コサイン変換されている場合に用いられる。フレームモード用縮小逆離散コサイン変換装置205は、フレームDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、縮小逆離散コサイン変換を行う。そして、フレームモード用縮小逆離散コサイン変換装置205では、1つのDCTブロックが4×4の画素から構成される解像度画像を復号するとともに、フィールドモード用縮小逆離散コサイン変換装置204で生成した標準解像度画像の画素の位相と同位相の画像を生成する。すなわち、フレームモード用縮小逆離散コサイン変換装置205で復号された画像データの各画素の位相は、図15に示すように、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。
【0035】
なお、このフレームモード用縮小逆離散コサイン変換装置205の処理については、その詳細を後述する。
【0036】
加算装置206は、フィールドモード用縮小逆離散コサイン変換装置204又はフレームモード用縮小逆離散コサイン変換装置205により縮小逆離散コサイン変換されたマクロブロックがイントラ画像の場合には、そのイントラ画像をそのままフレームメモリ207に格納する。また、加算装置206は、フィールドモード用縮小逆離散コサイン変換装置204又はフレームモード用縮小逆離散コサイン変換装置205により縮小逆離散コサイン変換されたマクロブロックがインター画像である場合には、そのインター画像に、フィールドモード用動き補償装置208或いはフレームモード用動き補償装置209により動き補償がされた参照画像を合成して、フレームメモリ207に格納する。
【0037】
フィールドモード用動き補償装置208は、マクロブロックの動き予測モードがフィールド動き予測モードの場合に用いられる。フィールドモード用動き補償装置208は、フレームメモリ207に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フィールド動き予測モードに対応した動き補償をする。このフィールドモード用動き補償装置208により動き補償がされた参照画像は、加算装置206に供給され、インター画像に合成される。
【0038】
フレームモード用動き補償装置209は、マクロブロックの動き予測モードがフレーム動き予測モードの場合に用いられる。フレームモード用動き補償装置209は、フレームメモリ207に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フレーム動き予測モードに対応した動き補償をする。このフレームモード用動き補償装置209により動き補償がされた参照画像は、加算装置206に供給され、インター画像に合成される。
【0039】
画枠変換・位相ずれ補正装置210は、フレームメモリ207が記憶した標準解像度の参照画像或いは加算装置206が合成した画像が供給され、この画像をポストフィルタリングにより、トップフィールドとボトムフィールドとの間の位相ずれ成分を補正するとともに画枠を標準解像度のテレビジョンの規格に合致するように変換する。すなわち、画枠変換・位相ずれ補正装置210は、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる標準解像度画像を、例えば、トップフィールドの各画素の垂直方向の位相が0、2、4・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3、5・・・となるように補正する。また、画枠変換・位相ずれ補正装置210は、高解像度のテレビジョン規格の画枠を、1/4に縮小して標準解像度のテレビジョン規格の画枠に変換する。
【0040】
特願平10−208385で提案した画像復号装置200では、以上のような構成を有することにより、高解像度画像をMPEG2で画像圧縮したビットストリームを、復号するとともに解像度を1/2に縮小して、標準解像度画像を出力することができる。
【0041】
つぎに、上記フレームモード用縮小逆離散コサイン変換装置205の処理内容について、さらに詳細に説明する。
【0042】
フレームモード用縮小逆離散コサイン変換装置205には、図16に示すように、高解像度画像を圧縮符号化したビットストリームが、1つのDCTブロック単位で入力される。
【0043】
まず、ステップS1において、この1つのDCTブロックの離散コサイン係数y(DCTブロックの全ての離散コサイン係数のうち垂直方向の係数をy1〜y8として図中に示す。)に対して、8×8の逆離散コサイン変換(IDCT8×8)を行う。逆離散コサイン変換をすることにより、8×8の復号された画素データx(DCTブロックの全ての画素データのうち垂直方向の画素データをx1〜x8として図中に示す。)を得ることができる。
【0044】
続いて、ステップS2において、この8×8の画素データxを、垂直方向に1ライン毎交互に取り出して、飛び越し走査に対応した4×4のトップフィールドの画素ブロックと、飛び越し走査に対応した4×4のボトムフィールドの画素ブロックの2つの画素ブロックに分離する。すなわち、垂直方向に1ライン目の画素データx1と、3ライン目の画素データx3と、5ライン目の画素データx5と、7ライン目の画素データx7とを取り出して、トップフィールドに対応した画素ブロックを生成する。また、垂直方向に2ライン目の画素データx2と、4ライン目の画素データx4と、6ライン目の画素データx6と、8ライン目の画素データx8とを取り出して、ボトムフィールドに対応した画素ブロックを生成する。なお、DCTブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離する処理を、以下フィールド分離という。
【0045】
続いて、ステップS3において、フィールド分離した2つの画素ブロックそれぞれに対して4×4の離散コサイン変換(DCT4×4)をする。
【0046】
続いて、ステップS4において、4×4の離散コサイン変換をして得られたトップフィールドに対応する画素ブロックの離散コサイン係数z(トップフィールドに対応する画素ブロックの全ての係数のうち垂直方向の離散コサイン係数をz1,z3,z5,z7として図中に示す。)の高域成分を間引き、2×2の離散コサイン係数から構成される画素ブロックとする。また、4×4の離散コサイン変換をして得られたボトムフィールドに対応する画素ブロックの離散コサイン係数z(ボトムフィールドに対応する画素ブロックの全ての係数のうち垂直方向の離散コサイン係数をz2,z4,z6,z8として図中に示す。)の高域成分を間引き、2×2の離散コサイン係数から構成される画素ブロックとする。
【0047】
続いて、ステップS5において、高域成分の離散コサイン係数を間引いた画素ブロックに対して、2×2の逆離散コサイン変換(IDCT2×2)を行う。2×2の逆離散コサイン変換をすることにより、2×2の復号された画素データx′(トップフィールドの画素ブロックの全ての画素データのうち垂直方向の画素データをx′1,x′3として図中に示し、また、ボトムフィールドに対応する画素ブロックの全ての画素データのうち垂直方向の画素データをx′2,x′4として図中に示す。)を得ることができる。
【0048】
続いて、ステップS6において、トップフィールドに対応する画素ブロックの画素データと、ボトムフィールドに対応する画素ブロックの画素データとを、垂直方向に1ラインずつ交互に合成して、4×4の画素データから構成される縮小逆離散コサイン変換をしたDCTブロックを生成する。なお、トップフィールドとボトムフィールドに対応した2つの画素ブロックの各画素を垂直方向に交互に合成する処理を、以下フレーム合成という。
【0049】
以上のステップS1からステップS6を行うことにより、フレームモード用縮小逆離散コサイン変換装15では、図15で示したような、フィールドモード用縮小逆離散コサイン変換装置204で生成した標準解像度画像の画素の位相と同位相の画素から構成される4×4のDCTブロックを生成することができる。
【0050】
また、フレームモード用縮小逆離散コサイン変換装置205では、以上のステップS1からステップS6までの処理を1つの行列を用いて演算する。具体的には、フレームモード用縮小逆離散コサイン変換装置205では、以上の処理を加法定理を用いて展開計算することにより得られる以下の式(1)に示す行列[FS′]と、1つのDCTブロックの離散コサイン係数y(y1〜y8)とを行列演算することにより、縮小逆離散コサイン変換したDCTブロックの画素データx′(x′1〜x′4)を得ることができる。
【0051】
【数1】
【0052】
但し、この式(1)において、A〜Jは以下の通りである。
【0053】
【数2】
【0054】
以上のように特願平10−208385で提案した画像復号装置200においては、フィールドDCTモードでは、トップフィールドとボトムフィールドとのそれぞれに4×4の縮小逆離散コサイン変換を行い標準解像度画像を復号し、フレームDCTモードでは、フレーム分離をして縮小逆離散コサイン変換を行い標準解像度画像を復号する。この画像復号装置200では、このようにフィールドDCTモードとフレームDCTモードとで異なる処理を行うため、飛び越し走査画像が有するインタレース性を損なうことなく、かつ、フィールドDCTモードとフレームDCTモードとで復号した画像の位相を同一とすることができ、出力する画像の画質を劣化させない。
【0055】
なお、上記画像復号装置200では、フィールドモード用縮小逆離散コサイン変換装置204の4×4の縮小逆離散コサイン変換処理、及び、フレームモード用縮小逆離散コサイン変換装置205の上記ステップS1〜ステップS6の縮小逆離散コサイン変換処理を、高速アルゴリズムを用いて処理してもよい。
【0056】
例えば、Wangのアルゴリズム(参考文献:Zhong DE Wang.,"Fast Algorithms for the Discrete W Transform and for the Discrete Fourier Transform",IEEE Tr.ASSP-32,NO.4,pp.803-816, Aug.1984)を用いることにより、処理を高速化することができる。
【0057】
フィールドモード用縮小逆離散コサイン変換装置204が演算をする行列を、Wangのアルゴリズムを用いて分解すると、以下の式(2)に示すように分解される。
【0058】
【数3】
【0059】
図17にフィールドモード用縮小逆離散コサイン変換装置204の処理にWangのアルゴリズムを適用した場合の処理フローを示す。
【0060】
この処理フローは、第1から第5の乗算器204a〜204e及び第1から第9の加算器204f〜204nから構成され、1次元の離散コサイン係数X(0)〜X(3)が入力される。第1から第5の乗算器204a〜204eに示しているW0〜W4は、各乗算器が乗算する値を示している。この処理フローからは、以下の式(3)〜式(6)に示す演算がされた4つの係数値或いは画素値Y(0)〜Y(3)が出力される。なお、この式(3)〜式(6)では、W0=W1の関係がある。
【0061】
【数4】
【0062】
フィールドモード用縮小逆離散コサイン変換装置204では、DCTブロックの低域の4×4の垂直方向の4個の係数に対して図17に示す処理フローを施した後、係数位置をメモリ内で90°転換し、DCTブロックの低域の4×4の水平方向の4個の係数に対して再度この図17に示す処理フローを施す。
【0063】
このようにWangのアルゴリズムを適用することにより演算を高速化することができる。
【0064】
また、フレームモード用縮小逆離散コサイン変換装置205が演算をする行列[FS′]を、Wangのアルゴリズムを用いて分解すると、以下の式(7)に示すように分解される。
【0065】
【数5】
【0066】
但し、この式(7)において、A〜Jは、以下の通りである。
【0067】
【数6】
【0068】
図18にフレームモード用縮小逆離散コサイン変換装置205の処理にWangのアルゴリズムを適用した場合の処理フローを示す。
【0069】
この処理フローは、第1から第10の乗算器205a〜205j及び第1から第12の加算器205k〜205vから構成され、1次元の離散コサイン係数X(0)〜X(7)が入力される。第1から第10の乗算器205a〜205jに示しているW0〜W9は、各乗算器が乗算する値を示している。この処理フローからは、以下の式(8)〜式(11)に示す演算がされた4つの係数値Y(0)からY(3)が出力される。なお、この式(8)〜式(11)では、W0=W1の関係がある。
【0070】
【数7】
【0071】
フレームモード用縮小逆離散コサイン変換装置205では、DCTブロックの低域の8×4の垂直方向の8個の係数に対して図18に示す処理フローを施した後、係数位置をメモリ内で90°転換し、DCTブロックの低域の4×4の水平方向の4個の係数に対して図17に示す処理フローを施す。
【0072】
このようにWangのアルゴリズムを適用することにより演算を高速化することができる。
【0073】
ところで、以上のような特願平10−208385号で提案した画像復号装置200では、フィールドモード時の縮小逆離散コサイン変換と、フレームモード時の縮小逆離散コサイン変換とが全く別の処理フローとなっている。
【0074】
そのため、例えば、これらの処理をソフトウェアで行おうとした場合には、コードサイズが大きくなり、多くの命令メモリが必要となってしまう。同様に、コードサイズが大きくなることによりキャッシュミスを起こし易くなり、復号処理の低下を招く可能性がある。また、これらの処理を専用回路で行おうとした場合も、回路規模が大きくなってしまう。
【0075】
本発明は、このような実情を鑑みてなされたものであり、飛び越し走査画像が有するインタレース性を損なうことなくフィールド直交変換モードとフレーム直交変換モードとによる画素の位相ずれをなくすことが可能な、高解像度画像の圧縮画像データから標準解像度の画像データを復号する画像復号装置及び画像復号方法であって、処理フローを簡略化した画像復号装置及び画像復号方法を提供することを目的とする。
【0076】
【課題を解決するための手段】
本発明にかかる画像復号装置は、8×8画素からなる画素ブロックに対して2次元の直交変換をして8×8係数からなる直交変換ブロックを生成して圧縮符号化をした第1の解像度の圧縮画像データから、上記第1の解像度の1/2の解像度の動画像データを復号する画像復号装置であって、飛び越し走査に対応した直交変換方式(フィールド直交変換モード)により直交変換がされた直交変換ブロックと、順次走査に対応した直交変換方式(フレーム直交変換モード)により直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をして、4×4係数となる直交変換ブロックを生成する第1の逆直交変換手段と、上記第1の逆直交変換手段により逆直交変換がされた4×4係数に対して、水平方向の1次元の逆直交変換をして、4×4画素からなる画素ブロックを生成する第2の逆直交変換手段とを備え、上記第1の逆直交変換手段は、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成することを特徴とする。
【0077】
この画像復号装置では、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成する。そして、この画像復号装置では、第1の解像度より低い第2の解像度の動画像データを出力する。さらに、この画像復号装置では、フィールド直交変換モードにより直交変換がされた直交変換ブロックと、フレーム直交変換モードにより直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をする。
【0078】
また、本発明にかかる画像復号方法は、8×8画素からなる画素ブロックに対して2次元の直交変換をして8×8係数からなる直交変換ブロックを生成して圧縮符号化をした第1の解像度の圧縮画像データから、上記第1の解像度の1/2の解像度の動画像データを復号する画像復号方法であって、飛び越し走査に対応した直交変換方式(フィールド直交変換モード)により直交変換がされた直交変換ブロックと、順次走査に対応した直交変換方式(フレーム直交変換モード)により直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をして、4×4係数となる直交変換ブロックを生成し、逆直交変換がされた上記4×4係数に対して、水平方向の1次元の逆直交変換をして、4×4画素からなる画素ブロックを生成し、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成することを特徴とする。
【0079】
この画像復号方法では、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成する。そして、この画像復号装置では、第1の解像度より低い第2の解像度の動画像データを出力する。さらに、この画像復号装置では、フィールド直交変換モードにより直交変換がされた直交変換ブロックと、フレーム直交変換モードにより直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をする。
【0080】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0081】
図1に本発明の実施の形態の画像復号装置のブロック構成図を示す。
【0082】
図1に示す画像復号装置10は、垂直方向の有効ライン数が例えば1152本の高解像度画像をMPEG2で画像圧縮したビットストリームが入力され、この入力されたビットストリームを復号するとともに1/2の解像度に縮小して、垂直方向の有効ライン数が例えば576本の標準解像度画像を出力する装置である。
【0083】
この画像復号装置10は、圧縮された高解像度画像のビットストリームが供給され、このビットストリームを解析するビットストリーム解析装置11と、データの発生頻度に応じた符号長を割り当てる可変長符号化がされた上記ビットストリームを復号する可変長符号復号装置12と、DCTブロックの各係数に量子化ステップを掛ける逆量子化装置13と、離散コサイン変換がされたDCTブロックに対して縮小逆離散コサイン変換をして標準解像度画像を生成する縮小逆離散コサイン変換装置14と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置16と、参照画像を一時記憶するフレームメモリ17と、フレームメモリ17が記憶した参照画像にフィールド動き予測モードに対応した動き補償をするフィールドモード用動き補償装置18と、フレームメモリ17が記憶した参照画像にフレーム動き予測モードに対応した動き補償をするフレームモード用動き補償装置19と、フレームメモリ17が記憶した画像に対してポストフィルタリングをすることにより、画枠変換をするとともに画素の位相ずれを補正してテレビジョンモニタ等に表示するための標準解像度の画像データを出力する画枠変換・位相ずれ補正装置20とを備えている。
【0084】
縮小逆離散コサイン変換装置14は、入力されたビットストリームのマクロブロックがフィールドDCTモードで離散コサイン変換されている場合には、フィールドDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、図8で示したような、低域の4×4の係数のみに逆離散コサイン変換を行う。すなわち、水平方向及び垂直方向の低域の4点の離散コサイン係数に基づき縮小逆離散コサイン変換を行う。この縮小逆離散コサイン変換装置14では、以上のような縮小逆離散コサイン変換を行うことにより、1つのDCTブロックが4×4の画素から構成される標準解像度画像を復号することができる。この復号された画像データの各画素の位相は、図15に示したように、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。すなわち、復号された下位レイヤーのトップフィールドでは、先頭画素(位相が1/2の画素)の位相が上位レイヤーのトップフィールドの先頭から1番目と2番目の画素(位相が0と2の画素)の中間位相となり、先頭から2番目の画素(位相が5/2の画素)の位相が上位レイヤーのトップフィールドの先頭から3番目と4番目の画素(位相が4と6の画素)の中間位相となる。また、復号された下位レイヤーのボトムフィールドでは、先頭画素(位相が1の画素)の位相が上位レイヤーのボトムフィールドの先頭から1番目と2番目の画素(位相が1と3の画素)の中間位相となり、先頭から2番目の画素(位相が3の画素)の位相が上位レイヤーのボトムフィールドの先頭から3番目と4番目の画素(位相が5と7の画素)の中間位相となる。
【0085】
また、縮小逆離散コサイン変換装置14は、入力されたビットストリームのマクロブロックがフレームDCTモードで離散コサイン変換されている場合には、フレームDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、上述したフレームモード用縮小逆離散コサイン変換装置15と同様の8×4の縮小逆離散コサイン変換を行う。そして、縮小逆離散コサイン変換装置14では、1つのDCTブロックが4×4の画素から構成される解像度画像を復号するとともに、フィールドDCTモードで離散コサイン変換されている場合に復号した標準解像度画像の画素の位相と同位相の画像を生成する。すなわち、縮小逆離散コサイン変換装置14は、図15に示したような、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる画像を生成する。
【0086】
加算装置16は、縮小逆離散コサイン変換装置14により縮小逆離散コサイン変換されたマクロブロックがイントラ画像の場合には、そのイントラ画像をそのままフレームメモリ17に格納する。また、加算装置16は、縮小逆離散コサイン変換装置14により縮小逆離散コサイン変換されたマクロブロックがインター画像である場合には、そのインター画像に、フィールドモード用動き補償装置18或いはフレームモード用動き補償装置19により動き補償がされた参照画像を合成して、フレームメモリ17に格納する。
【0087】
フィールドモード用動き補償装置18は、マクロブロックの動き予測モードがフィールド動き予測モードの場合に用いられる。フィールドモード用動き補償装置18は、フレームメモリ17に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フィールド動き予測モードに対応した動き補償をする。このフィールドモード用動き補償装置18により動き補償がされた参照画像は、加算装置16に供給され、インター画像に合成される。
【0088】
フレームモード用動き補償装置19は、マクロブロックの動き予測モードがフレーム動き予測モードの場合に用いられる。フレームモード用動き補償装置19は、フレームメモリ17に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フレーム動き予測モードに対応した動き補償をする。このフレームモード用動き補償装置19により動き補償がされた参照画像は、加算装置16に供給され、インター画像に合成される。
【0089】
画枠変換・位相ずれ補正装置20は、フレームメモリ17が記憶した標準解像度の参照画像或いは加算装置16が合成した画像が供給され、この画像をポストフィルタリングにより、トップフィールドとボトムフィールドとの間の位相ずれ成分を補正するとともに画枠を標準解像度のテレビジョンの規格に合致するように変換する。すなわち、画枠変換・位相ずれ補正装置20は、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる標準解像度画像を、例えば、トップフィールドの各画素の垂直方向の位相が0、2、4・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3、5・・・となるように補正する。また、画枠変換・位相ずれ補正装置20は、高解像度のテレビジョン規格の画枠を、1/4に縮小して標準解像度のテレビジョン規格の画枠に変換する。
【0090】
この画像復号装置10では、以上のような構成を有することにより、高解像度画像をMPEG2で画像圧縮したビットストリームを、復号するとともに解像度を1/2に縮小して、標準解像度画像を出力することができる。
【0091】
つぎに、上記縮小逆離散コサイン変換装置14の処理内容について、さらに詳細に説明する。
【0092】
縮小逆離散コサイン変換装置14は、図2に示すように、逆量子化装置13から高解像度画像をMPEG2で画像圧縮したビットストリームが供給される入力バッファ21と、垂直成分の1次元の逆離散コサイン変換を行う垂直成分逆離散コサイン変換部22と、中間バッファ23と、水平成分の1次元の逆離散コサイン変換を行う水平成分逆離散コサイン変換部24と、出力バッファ25と有している。
【0093】
入力バッファ21には、逆量子化装置13により逆量子化されたビットストリームがDCTブロック単位で入力され、このDCTブロックを一時格納する。
【0094】
垂直成分逆離散コサイン変換部22は、入力バッファ21に格納されたDCTブロック単位の離散コサイン係数を抜き出し、このDCTブロックに対して垂直方向の一次元の逆離散コサイン変換を行う。このとき、垂直成分逆離散コサイン変換部22は、8個の垂直方向の係数に対して離散コサイン変換をするとともに、この8個の係数を4個の係数に縮小する縮小逆離散コサイン変換を行う。
【0095】
また、この垂直成分逆離散コサイン変換部22には、離散コサイン変換をするDCTブロックの離散コサイン変換のモード情報が入力される。すなわち、そのDCTブロックが、フィールドDCTモードで離散コサイン変換されているか、或いは、フレームDCTモード離散コサイン変換がされているかどうかの情報が入力される。垂直成分逆離散コサイン変換部22は、離散コサイン変換をするDCTブロックが、フィールドDCTモードで離散コサイン変換されている場合には、上述した特願平10−208385号で提案した画像復号装置200のフィールドモード用縮小逆離散コサイン変換装置204と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行う。また、垂直成分逆離散コサイン変換部22は、離散コサイン変換をするDCTブロックが、フレームDCTモードで離散コサイン変換されている場合には、上述した特願平10−208385号で提案した画像復号装置200のフレームモード用縮小逆離散コサイン変換装置205と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行う。
【0096】
この垂直成分逆離散コサイン変換部22の具体的な処理フローを図3に示す。
【0097】
この図3に示した処理フローは、縮小逆離散コサイン変換装置14が演算をする行列を、分解してWangのアルゴリズムに適用したものである。
【0098】
この垂直成分逆離散コサイン変換部22の処理フローは、第1から第10の乗算器31〜40及び第1から第12の加算器41〜52から構成され、1次元の離散コサイン係数X(0)〜X(7)が入力される。第1から第10の乗算器31〜40に示しているA〜Jは、各乗算器が乗算する値を示している。
【0099】
第1の乗算器31は最も低域の離散コサイン係数X(0)に対して値Aを乗算する。第2の乗算器32は低域から3番目の離散コサイン係数X(2)に対して値Bを乗算する。第3の乗算器33は低域から5番目の離散コサイン係数X(4)に対して値Cを乗算する。第4の乗算器34は低域から7番目の離散コサイン係数X(6)に対して値Dを乗算する。第5の乗算器35は低域から4番目の離散コサイン係数X(3)に対して値Eを乗算する。第6の乗算器36は低域から6番目の離散コサイン係数X(5)に対して値Fを乗算する。第7の乗算器37は低域から2番目の離散コサイン係数X(1)に対して値Gを乗算する。第8の乗算器38は低域から2番目の離散コサイン係数X(1)に対して値Hを乗算する。
【0100】
また、第9の乗算器39は、フィールドDCTモードの場合には低域から4番目の離散コサイン係数X(3)に対して値Iを乗算し、また、フレームDCTモードの場合には最も高域の離散コサイン係数X(7)に対して値Iを乗算する。また、第10の乗算器40は、フィールドDCTモードの場合には低域から4番目の離散コサイン係数X(3)に対して値Jを乗算し、また、フレームDCTモードの場合には最も高域の離散コサイン係数X(7)に対して値Jを乗算する。この第9及び第10の乗算器39,40に入力する離散コサイン係数の切り換えは、即ち離散コサイン係数X(3)と離散コサイン係数X(7)の入力データポートの切り換えは、切換スイッチ60により行われる。
【0101】
従って、フィールドDCTモードの場合、この図3に示す処理フローからは、以下の式(12)〜式(15)に示す演算がされた4つの係数値Y(0)〜Y(3)が出力される。
【0102】
【数8】
【0103】
また、フレームDCTモードの場合、この図3に示す処理フローからは、以下の式(16)〜式(19)に示す演算がされた4つの係数値Y(0)からY(3)が出力される。
【0104】
【数9】
【0105】
また、第1から第10の各乗算器31〜40は、例えば内部にレジスタを備えており、そのレジスタ内に乗算するA〜Jの値が格納される。このレジスタ内の値は、フィールドDCTモードとフレームDCTモードとで切り換えられる。
【0106】
フィールドDCTモードとフレームDCTモードとで切り換えられる各乗算器の乗算定数を以下の表に示す。なお、この表では、W0=W1の関係がある。
【0107】
【表1】
【0108】
この表に示されたフィールドDCTモードの場合の各値を上記式(12)〜式(15)に代入すると、図3に示した処理フローからは、以下の式(20)〜式(23)に示す演算がされた4つの係数値Y(0)からY(3)が出力されることとなる。
【0109】
【数10】
【0110】
この式(20)〜式(23)に示され得たY(0)からY(3)は、上記式(3)〜式(6)の各値と同一となる。すなわち、特願平10−208385号で提案した画像復号装置200のフィールドモード用縮小逆離散コサイン変換装置204と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行っている。
【0111】
また、フレームDCTモードの場合の各値を上記式(16)〜式(19)に代入すると、図3に示した処理フローからは、以下の式(24)〜式(27)に示す演算がされた4つの係数値Y(0)からY(3)が出力されることとなる。
【0112】
【数11】
【0113】
この式(24)〜式(27)に示され得たY(0)からY(3)は、上記式(7)〜式(11)の各値と同一となる。すなわち、すなわち、特願平10−208385号で提案した画像復号装置200のフレームモード用縮小逆離散コサイン変換装置205と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行う。
【0114】
以上のように垂直成分逆離散コサイン変換部22では、各乗算器31〜33の乗算定数を切り換えるとともにデータの入力ポートを切り換えることにより、フィールドDCTモードの場合とフレームDCTモードの場合の垂直方向の縮小逆離散コサイン変換をすることができる。また、この垂直成分逆離散コサイン変換部22では、フィールドDCTモードの縮小逆離散コサイン変換とフレームDCTモードの縮小逆離散コサイン変換とを1つの処理フローで演算するの、その構成が非常に簡易となる。
【0115】
以上のように演算された離散コサイン係数は、中間バッファ23に一旦格納される。
【0116】
水平成分逆離散コサイン変換部24は、中間バッファ23に格納されたDCTブロック単位の離散コサイン係数を抜き出し、このDCTブロックに対して水平方向の一次元の逆離散コサイン変換を行う。このとき、水平成分逆離散コサイン変換部24は、4個の垂直方向の係数に対して離散コサイン変換をする。水平成分逆離散コサイン変換部24は、離散コサイン変換をするDCTブロックが、フィールドDCTモードで離散コサイン変換されているか、或いは、フレームDCTモードで離散コサイン変換されているかにかかわらず、上述した特願平10−208385号で提案した画像復号装置200のフィールドモード用縮小逆離散コサイン変換装置204と同一のアルゴリズムで、水平方向の逆離散コサイン変換を行う。
【0117】
すなわち、この水平成分逆離散コサイン変換部24の処理フローは、上記図17で示したものと同一となる。
【0118】
なお、この水平成分逆離散コサイン変換部24の処理フローは、上記垂直成分逆離散コサイン変換部22のフィールドDCTモードの際の処理フローと同一であるので、この垂直成分逆離散コサイン変換部22の処理フローを流用しても良い。
【0119】
出力バッファ25は、水平成分逆離散コサイン変換部24が演算した4×4の画素値をDCTブロック単位で一時格納し、加算装置16に供給する。
【0120】
以上のように本発明の実施の形態の画像復号装置10では、飛び越し走査画像が有するインタレース性を損なうことなくフィールド直交変換モードとフレーム直交変換モードとによる画素の位相ずれをなくた高解像度画像の圧縮画像データから標準解像度の画像データを復号することができ、かつ、その処理フローを簡略化することができる。
【0121】
【発明の効果】
本発明にかかる画像復号装置及び画像復号方法では、フレーム直交変換モードにより直交変換がされた直交変換ブロックの全周波数成分の係数に対して逆直交変換をして飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をして低周波成分の係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成する。そして、この画像復号方法では、第1の解像度より低い第2の解像度の動画像データを出力する。さらに、この画像復号方法では、フィールド直交変換モードにより直交変換がされた直交変換ブロックと、フレーム直交変換モードにより直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をする。
【0122】
このことにより、本発明では、復号に必要な演算量及び記憶容量を少なくすることができるとともに、飛び越し走査画像が有するインタレース性を損なうことなくフィールド直交変換モードとフレーム直交変換モードとによる画素の位相ずれをなくすことができる。また、第2の解像度の動画像データの画質を向上させることができる。さらに、本発明では、逆離散コサイン変換に伴う処理を簡略化することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の画像復号装置のブロック図である。
【図2】上記画像復号装置の縮小逆離散コサイン変換装置のブロック構成図である。
【図3】上記縮小離散コサイン変換装置の垂直成分逆離散コサイン変換部の処理フローを示す図である。
【図4】従来の第1のダウンデコーダを示すブロック図である。
【図5】従来の第2のダウンデコーダを示すブロック図である。
【図6】従来の第3のダウンデコーダを示すブロック図である。
【図7】従来の画像復号装置のブロック図である。
【図8】上記従来の画像復号装置のフィールドDCTモードにおける縮小逆離散コサイン変換処理を説明するための図である。
【図9】上記従来の画像復号装置のフィールドDCTモードにおける縮小逆離散コサイン変換処理を説明するための図である。
【図10】上記従来の画像復号装置のフィールド動き予測モードにおける線形補間処理を説明するための図である。
【図11】上記従来の画像復号装置のフレーム動き予測モードにおける線形補間処理を説明するための図である。
【図12】上記従来の画像復号装置のフィールドDCTモードの結果得られる画素の位相を説明するための図である。
【図13】上記従来の画像復号装置のフレームDCTモードの結果得られる画素の位相を説明するための図である。
【図14】特願平10−208385で提案された画像復号装置のブロック図である。
【図15】上記特願平10−208385で提案された画像復号装置のフレームメモリに格納される参照画像の垂直方向の画素の位相を説明するための図である。
【図16】上記特願平10−208385で提案された画像復号装置のフレームモード用縮小逆離散コサイン変換装置の1ブロック処理の内容を説明するための図である。
【図17】Wangのアルゴリズムを上記特願平10−208385で提案された画像復号装置のフィールドモード用縮小逆離散コサイン変換装置の処理に適用した場合の演算フローを示す図である。
【図18】Wangのアルゴリズムを上記特願平10−208385で提案された画像復号装置のフレームモード用縮小逆離散コサイン変換装置の1ブロック処理に適用した場合の演算フローを示す図である。
【符号の説明】
10 画像復号装置、14 縮小逆離散コサイン変換装置、22 垂直成分逆離散コサイン変換部、24 水平成分逆離散コサイン変換部
【発明の属する技術分野】
本発明は、8×8画素からなる直交変換ブロック単位で直交変換することによる圧縮符号化をした第1の解像度の圧縮画像データを復号する画像復号装置及び画像復号方法に関し、特に、第1の解像度の圧縮画像データを復号して、この第1の解像度よりも低い第2の解像度の動画像データに縮小する画像復号装置及び画像復号方法に関するものである。
【0002】
【従来の技術】
MPEG2(Moving Picture Experts Group phase2)等の画像圧縮方式を用いたデジタルテレビジョン放送の規格化が進められている。デジタルテレビジョン放送の規格には、標準解像度画像(例えば垂直方向の有効ライン数が576本)に対応した規格、高解像度画像(例えば垂直方向の有効ライン数が1152本)に対応した規格等がある。そのため、近年、高解像度画像の圧縮画像データを復号するとともにこの圧縮画像データを1/2の解像度に縮小することにより、標準解像度画像の画像データを生成して、この画像データを標準解像度に対応したテレビジョンモニタに表示するダウンデコーダが求められている。
【0003】
高解像度画像に対して動き予測による予測符号化及び離散コサイン変換による圧縮符号化をしたMPEG2等のビットストリームを、復号するとともに標準解像度画像にダウンサンプリングするダウンデコーダが、文献「低域ドリフトのないスケーラブル・デコーダ」(岩橋・神林・貴家:信学技報 CS94-186,DSP94-108,1995-01)に提案されている(以下、この文献を文献1と呼ぶ。)。この文献1には、以下の第1から第3のダウンデコーダが示されている。
【0004】
第1のダウンデコーダは、図4に示すように、高解像度画像のビットストリームに対して8(垂直方向のDC成分から数えた係数の数)×8(水平方向のDC成分から数えた係数の数)の逆離散コサイン変換をする逆離散コサイン変換装置101と、離散コサイン変換がされた高解像度画像と動き補償がされた参照画像とを加算する加算装置102と、参照画像を一時記憶するフレームメモリ103と、フレームメモリ103が記憶した参照画像に1/2画素精度で動き補償をする動き補償装置104と、フレームメモリ103が記憶した参照画像を標準解像度の画像に変換するダウンサンプリング装置105とを備えている。
【0005】
この第1のダウンデコーダでは、逆離散コサイン変換を行い高解像度画像として復号した出力画像を、ダウンサンプリング装置105で縮小して標準解像度の画像データを出力する。
【0006】
第2のダウンデコーダは、図5に示すように、高解像度画像のビットストリームのDCT(Discrete Cosine Transform)ブロックの高周波成分の係数を0に置き換えて8×8の逆離散コサイン変換をする逆離散コサイン変換装置111と、離散コサイン変換がされた高解像度画像と動き補償がされた参照画像とを加算する加算装置112と、参照画像を一時記憶するフレームメモリ113と、フレームメモリ113が記憶した参照画像に1/2画素精度で動き補償をする動き補償装置114と、フレームメモリ113が記憶した参照画像を標準解像度の画像に変換するダウンサンプリング装置115とを備えている。
【0007】
この第2のダウンデコーダでは、DCTブロックの全ての係数のうち高周波成分の係数を0に置き換えて逆離散コサイン変換を行い高解像度画像として復号した出力画像を、ダウンサンプリング装置105で縮小して標準解像度の画像データを出力する。
【0008】
第3のダウンデコーダは、図6に示すように、高解像度画像のビットストリームのDCTブロックの低周波成分の係数のみを用いて例えば4×4の逆離散コサイン変換をして標準解像度画像に復号する縮小逆離散コサイン変換装置121と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置122と、参照画像を一時記憶するフレームメモリ123と、フレームメモリ123が記憶した参照画像に1/4画素精度で動き補償をする動き補償装置124とを備えている。
【0009】
この第3のダウンデコーダでは、DCTブロックの全ての係数のうち低周波成分の係数のみを用いて逆離散コサイン変換を行い、高解像度画像から標準解像度画像として復号する。
【0010】
ここで、上記第1のダウンデコーダでは、DCTブロック内の全ての係数に対して逆離散コサイン変換を行い高解像度画像を復号しているため、高い演算処理能力の逆離散コサイン変換装置101と高容量のフレームメモリ103とが必要となる。また、上記第2のダウンデコーダでは、DCTブロック内の係数のうち高周波成分を0として離散コサイン変換を行い高解像度画像を復号しているため、逆離散コサイン変換装置111の演算処理能力は低くて良いが、やはり高容量のフレームメモリ113が必要となる。これら第1及び第2のダウンデコーダに対し、第3のダウンデコーダでは、DCTブロック内の全ての係数うち低周波成分の係数のみを用いて逆離散コサイン変換をしているため逆離散コサイン変換装置121の演算処理能力が低くてよく、さらに、標準解像度画像の参照画像を復号しているのでフレームメモリ123の容量も少なくすることができる。
【0011】
ところで、テレビジョン放送等の動画像の表示方式には、順次走査方式と飛び越し走査方式とがある。順次走査方式は、フレーム内の全ての画素を同じタイミングでサンプリングした画像を、順次表示する表示方式である。飛び越し走査方式は、フレーム内の画素を水平方向の1ライン毎に異なるタイミングでサンプリングした画像を、交互に表示する表示方式である。
【0012】
この飛び越し走査方式では、フレーム内の画素を1ライン毎に異なるタイミングでサンプリングした画像のうちの一方を、トップフィールド(第1フィールドともいう。)といい、他方をボトムフィールド(第2のフィールドともいう。)という。フレームの水平方向の先頭ラインが含まれる画像がトップフィールドとなり、フレームの水平方向の2番目のラインが含まれる画像がボトムフィールドとなる。従って、飛び越し走査方式では、1つのフレームが2つのフィールドから構成されることとなる。
【0013】
MEPG2では、飛び越し走査方式に対応した動画像信号を効率良く圧縮するため、画面の圧縮単位であるピクチャにフレームを割り当てて符号化するだけでなく、ピクチャにフィールドを割り当てて符号化することもできる。
【0014】
MPEG2では、ピクチャにフィールドが割り当てられた場合には、そのビットストリームの構造をフィールド構造と呼び、ピクチャにフレームが割り当てられた場合には、そのビットストリームの構造をフレーム構造と呼ぶ。また、フィールド構造では、フィールド内の画素からDCTブロックが形成され、フィールド単位で離散コサイン変換がされる。このフィールド単位で離散コサイン変換を行う処理モードのことをフィールドDCTモードと呼ぶ。また、フレーム構造では、フレーム内の画素からDCTブロックが形成され、フレーム単位で離散コサイン変換がされる。このフレーム単位で離散コサイン変換を行う処理モードのことをフレームDCTモードと呼ぶ。さらに、フィールド構造では、フィールド内の画素からマクロブロックが形成され、フィールド単位で動き予測がされる。このフィールド単位で動き予測を行う処理モードのことをフィールド動き予測モードと呼ぶ。また、フレーム構造では、フレーム内の画素からマクロブロックが形成され、フレーム単位で動き予測がされる。フレーム単位で動き予測を行う処理モードのことをフレーム動き予測モードと呼ぶ。
【0015】
ところで、上記文献1に示された第3のダウンデコーダを利用して、飛び越し走査方式に対応した圧縮画像データを復号する画像復号装置が、例えば文献「A Compensation Method of Drift Errors in Scalability」(N.OBIKANE,K.TAHARA and J.YONEMITSU,HDTV Work Shop'93)に提案されている(以下、この文献を文献2と呼ぶ)。
【0016】
この文献2に示された従来の画像復号装置は、図7に示すように、高解像度画像をMPEG2で圧縮したビットストリームが供給され、このビットストリームを解析するビットストリーム解析装置131と、データの発生頻度に応じた符号長を割り当てる可変長符号化がされたビットストリームを復号する可変長符号復号装置132と、DCTブロックの各係数に量子化ステップを掛ける逆量子化装置2033と、DCTブロックの全ての係数のうち低周波成分の係数のみを用いて例えば4×4の逆離散コサイン変換をして標準解像度画像を復号する縮小逆離散コサイン変換装置134と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置135と、参照画像を一時記憶するフレームメモリ136と、フレームメモリ136が記憶した参照画像に1/4画素精度で動き補償をする動き補償装置137とを備えている。
【0017】
この文献2に示された従来の画像復号装置の縮小逆離散コサイン変換装置134は、DCTブロック内の全ての係数のうち低周波成分の係数のみを用いて逆離散コサイン変換をするが、フレームDCTモードとフィールドDCTモードとで、逆離散コサイン変換を行う係数の位置が異なっている。
【0018】
具体的には、縮小逆離散コサイン変換装置134は、フィールドDCTモードの場合には、図8に示すように、DCTブロック内の8×8個のうち、低域の4×4個の係数のみに逆離散コサイン変換を行う。それに対し、縮小逆離散コサイン変換装置134は、フレームDCTモードの場合には、図9に示すように、DCTブロック内の8×8個の係数のうち、4×2個+4×2個の係数のみに逆離散コサイン変換を行う。
【0019】
また、この文献2に示された従来の画像復号装置の動き補償装置137は、 高解像度画像に対して行われた動き予測の情報(動きベクトル)に基づき、フィールド動き予測モード及びフレーム動き予測モードのそれぞれに対応した1/4画素精度の動き補償を行う。すなわち、通常MPEG2では1/2画素精度で動き補償が行われることが定められているが、高解像度画像から標準解像度画像を復号する場合には、ピクチャ内の画素数が1/2に間引かれるため、動き補償装置137では動き補償の画素精度を1/4画素精度として動き補償を行っている。
【0020】
従って、動き補償装置137では、高解像度画像に対応した動き補償を行うため、標準解像度の画像としてフレームメモリ136に格納された参照画像の画素に対して線形補間して、1/4画素精度の画素を生成している。
【0021】
具体的に、フィールド動き予測モード及びフレーム動き予測モードの場合の垂直方向の画素の線形補間処理を、図10及び図11を用いて説明する。なお、図面中には、縦方向に垂直方向の画素の位相を示し、表示画像の各画素が位置する位相を整数で示している。
【0022】
まず、フィールド動き予測モードで動き予測がされた画像の補間処理について、図10を用いて説明する。高解像度画像(上位レイヤー)に対しては、図10(a)に示すように、各フィールドそれぞれ独立に、1/2画素精度で動き補償がされる。これに対し、標準解像度画像(下位レイヤー)に対しては、図10(b)に示すように、整数精度の画素に基づきフィールド内で線形補間をして、垂直方向に1/4画素、1/2画素、3/4画素分の位相がずれた画素を生成し、動き補償がされる。すなわち、標準解像度画像(下位レイヤー)では、トップフィールドの整数精度の各画素に基づきトップフィールドの1/4画素精度の各画素が線形補間により生成され、ボトムフィールドの整数精度の各画素に基づきボトムフィールドの1/4画素精度の各画素が線形補間により生成される。例えば、垂直方向の位相が0の位置にあるトップフィールドの画素の値をa、垂直方向の位相が1の位置にあるトップフィールドの画素の値をbとする。この場合、垂直方向の位相が1/4の位置にあるトップフィールドの画素は(3a+b)/4となり、垂直方向の位相が1/2の位置にあるトップフィールドの画素は(a+b)/2となり、垂直方向の位相が3/4の位置にあるトップフィールドの画素は(a+3b)/4となる。
【0023】
続いて、フレーム動き予測モードで動き予測がされた画像の補間処理について、図11を用いて説明する。高解像度画像(上位レイヤー)に対しては、図11(a)に示すように、各フィールド間で補間処理がされ、すなわち、ボトムフィールドとトップフィールドとの間で補間処理がされ、1/2画素精度で動き補償がされる。標準解像度画像(下位レイヤー)に対しては、図11(b)に示すように、トップフィールド及びボトムフィールドの2つのフィールドの整数精度の各画素に基づき、垂直方向に1/4画素、1/2画素、3/4画素分の位相がずれた画素が線形補間により生成され、動き補償がされる。例えば、垂直方向の位相が−1の位置にあるボトムフィールドの画素の値をa、垂直方向の位相が0の位置にあるトップフィールドの画素の値をb、垂直方向の位相が1の位置にあるボトムフィールドの画素の値をc、垂直方向の位相が2の位置にあるトップフィールドの画素の値をd、垂直方向の位相が3の位置にあるボトムフィールドの画素の値をeとする。この場合、垂直方向の位相が0〜2の間にある1/4画素精度の各画素は、以下のように求められる。
【0024】
垂直方向の位相が1/4の位置にある画素は(a+4b+3c)/8となる。垂直方向の位相が1/2の位置にある画素は(a+3c)/4となる。垂直方向の位相が3/4の位置にある画素は(a+2b+3c+2d)/8となる。垂直方向の位相が5/4の位置にある画素は(2b+3c+2d+e)/8となる。垂直方向の位相が3/2の位置にある画素は(3c+e)/4となる。垂直方向の位相が7/4の位置にある画素は(3c+4d+e)/8となる。
【0025】
以上のように上記文献2に示された従来の画像復号装置は、飛び越し走査方式に対応した高解像度画像の圧縮画像データを、標準解像度画像データに復号することができる。
【0026】
しかしながら、上記文献2に示された従来の画像復号装置では、フィールドDCTモードで得られる標準解像度画像の各画素と、フレームDCTモードで得られる標準解像度の各画素との位相がずれる。具体的には、フィールドDCTモードでは、図12に示すように、下位レイヤーのトップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、下位レイヤーのボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。それに対して、フレームDCTモードでは、図13に示すように、下位レイヤーのトップフィールドの各画素の垂直方向の位相が0、2・・・となり、下位レイヤーのボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。そのため、位相が異なる画像がフレームメモリ136に混在し、出力する画像の画質が劣化する。
【0027】
また、上記文献2に示された従来の画像復号装置では、フィールド動き予測モードとフレーム動き予測モードとで位相ずれの補正がされていない。そのため、出力する画像の画質が劣化する。
【0028】
【発明が解決しようとする課題】
このような問題を解決するための画像復号装置が、特願平10−208385号により提案されている。
【0029】
つぎに、特願平10−208385で提案された画像復号装置について説明する。
【0030】
図14に示す特願平10−208385号で提案した画像復号装置200は、垂直方向の有効ライン数が例えば1152本の高解像度画像をMPEG2で画像圧縮したビットストリームが入力され、この入力されたビットストリームを復号するとともに1/2の解像度に縮小して、垂直方向の有効ライン数が例えば576本の標準解像度画像を出力する装置である。
【0031】
なお、以下、高解像度画像のことを上位レイヤーとも呼び、標準解像度画像のことを下位レイヤーとも呼ぶものとする。また、通常、8×8の離散コサイン係数を有するDCTブロックを逆離散コサイン変換した場合8×8の画素から構成される復号データを得ることができるが、例えば、8×8の離散コサイン係数を復号して4×4の画素から構成される復号データを得るような、逆離散コサイン変換をするとともに解像度を縮小する処理を、縮小逆離散コサイン変換という。
【0032】
この画像復号装置200は、圧縮された高解像度画像のビットストリームが供給され、このビットストリームを解析するビットストリーム解析装置201と、データの発生頻度に応じた符号長を割り当てる可変長符号化がされた上記ビットストリームを復号する可変長符号復号装置202と、DCTブロックの各係数に量子化ステップを掛ける逆量子化装置203と、フィールドDCTモードで離散コサイン変換がされたDCTブロックに対して縮小逆離散コサイン変換をして標準解像度画像を生成するフィールドモード用縮小逆離散コサイン変換装置204と、フレームDCTモードで離散コサイン変換がされたDCTブロックに対して縮小逆離散コサイン変換をして標準解像度画像を生成するフレームモード用縮小逆離散コサイン変換装置205と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置206と、参照画像を一時記憶するフレームメモリ207と、フレームメモリ207が記憶した参照画像にフィールド動き予測モードに対応した動き補償をするフィールドモード用動き補償装置208と、フレームメモリ207が記憶した参照画像にフレーム動き予測モードに対応した動き補償をするフレームモード用動き補償装置209と、フレームメモリ207が記憶した画像に対してポストフィルタリングをすることにより、画枠変換をするとともに画素の位相ずれを補正してテレビジョンモニタ等に表示するための標準解像度の画像データを出力する画枠変換・位相ずれ補正装置210とを備えている。
【0033】
フィールドモード用縮小逆離散コサイン変換装置204は、入力されたビットストリームのマクロブロックが、フィールドDCTモードで離散コサイン変換されている場合に用いられる。フィールドモード用縮小逆離散コサイン変換装置204は、フィールドDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、図8で示したような、低域の4×4の係数のみに逆離散コサイン変換を行う。すなわち、水平方向及び垂直方向の低域の4点の離散コサイン係数に基づき縮小逆離散コサイン変換を行う。このフィールドモード用縮小逆離散コサイン変換装置204では、以上のような縮小逆離散コサイン変換を行うことにより、1つのDCTブロックが4×4の画素から構成される標準解像度画像を復号することができる。この復号された画像データの各画素の位相は、図15に示すように、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。すなわち、復号された下位レイヤーのトップフィールドでは、先頭画素(位相が1/2の画素)の位相が上位レイヤーのトップフィールドの先頭から1番目と2番目の画素(位相が0と2の画素)の中間位相となり、先頭から2番目の画素(位相が5/2の画素)の位相が上位レイヤーのトップフィールドの先頭から3番目と4番目の画素(位相が4と6の画素)の中間位相となる。また、復号された下位レイヤーのボトムフィールドでは、先頭画素(位相が1の画素)の位相が上位レイヤーのボトムフィールドの先頭から1番目と2番目の画素(位相が1と3の画素)の中間位相となり、先頭から2番目の画素(位相が3の画素)の位相が上位レイヤーのボトムフィールドの先頭から3番目と4番目の画素(位相が5と7の画素)の中間位相となる。
【0034】
フレームモード用縮小逆離散コサイン変換装置205は、入力されたビットストリームのマクロブロックが、フレームDCTモードで離散コサイン変換されている場合に用いられる。フレームモード用縮小逆離散コサイン変換装置205は、フレームDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、縮小逆離散コサイン変換を行う。そして、フレームモード用縮小逆離散コサイン変換装置205では、1つのDCTブロックが4×4の画素から構成される解像度画像を復号するとともに、フィールドモード用縮小逆離散コサイン変換装置204で生成した標準解像度画像の画素の位相と同位相の画像を生成する。すなわち、フレームモード用縮小逆離散コサイン変換装置205で復号された画像データの各画素の位相は、図15に示すように、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。
【0035】
なお、このフレームモード用縮小逆離散コサイン変換装置205の処理については、その詳細を後述する。
【0036】
加算装置206は、フィールドモード用縮小逆離散コサイン変換装置204又はフレームモード用縮小逆離散コサイン変換装置205により縮小逆離散コサイン変換されたマクロブロックがイントラ画像の場合には、そのイントラ画像をそのままフレームメモリ207に格納する。また、加算装置206は、フィールドモード用縮小逆離散コサイン変換装置204又はフレームモード用縮小逆離散コサイン変換装置205により縮小逆離散コサイン変換されたマクロブロックがインター画像である場合には、そのインター画像に、フィールドモード用動き補償装置208或いはフレームモード用動き補償装置209により動き補償がされた参照画像を合成して、フレームメモリ207に格納する。
【0037】
フィールドモード用動き補償装置208は、マクロブロックの動き予測モードがフィールド動き予測モードの場合に用いられる。フィールドモード用動き補償装置208は、フレームメモリ207に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フィールド動き予測モードに対応した動き補償をする。このフィールドモード用動き補償装置208により動き補償がされた参照画像は、加算装置206に供給され、インター画像に合成される。
【0038】
フレームモード用動き補償装置209は、マクロブロックの動き予測モードがフレーム動き予測モードの場合に用いられる。フレームモード用動き補償装置209は、フレームメモリ207に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フレーム動き予測モードに対応した動き補償をする。このフレームモード用動き補償装置209により動き補償がされた参照画像は、加算装置206に供給され、インター画像に合成される。
【0039】
画枠変換・位相ずれ補正装置210は、フレームメモリ207が記憶した標準解像度の参照画像或いは加算装置206が合成した画像が供給され、この画像をポストフィルタリングにより、トップフィールドとボトムフィールドとの間の位相ずれ成分を補正するとともに画枠を標準解像度のテレビジョンの規格に合致するように変換する。すなわち、画枠変換・位相ずれ補正装置210は、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる標準解像度画像を、例えば、トップフィールドの各画素の垂直方向の位相が0、2、4・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3、5・・・となるように補正する。また、画枠変換・位相ずれ補正装置210は、高解像度のテレビジョン規格の画枠を、1/4に縮小して標準解像度のテレビジョン規格の画枠に変換する。
【0040】
特願平10−208385で提案した画像復号装置200では、以上のような構成を有することにより、高解像度画像をMPEG2で画像圧縮したビットストリームを、復号するとともに解像度を1/2に縮小して、標準解像度画像を出力することができる。
【0041】
つぎに、上記フレームモード用縮小逆離散コサイン変換装置205の処理内容について、さらに詳細に説明する。
【0042】
フレームモード用縮小逆離散コサイン変換装置205には、図16に示すように、高解像度画像を圧縮符号化したビットストリームが、1つのDCTブロック単位で入力される。
【0043】
まず、ステップS1において、この1つのDCTブロックの離散コサイン係数y(DCTブロックの全ての離散コサイン係数のうち垂直方向の係数をy1〜y8として図中に示す。)に対して、8×8の逆離散コサイン変換(IDCT8×8)を行う。逆離散コサイン変換をすることにより、8×8の復号された画素データx(DCTブロックの全ての画素データのうち垂直方向の画素データをx1〜x8として図中に示す。)を得ることができる。
【0044】
続いて、ステップS2において、この8×8の画素データxを、垂直方向に1ライン毎交互に取り出して、飛び越し走査に対応した4×4のトップフィールドの画素ブロックと、飛び越し走査に対応した4×4のボトムフィールドの画素ブロックの2つの画素ブロックに分離する。すなわち、垂直方向に1ライン目の画素データx1と、3ライン目の画素データx3と、5ライン目の画素データx5と、7ライン目の画素データx7とを取り出して、トップフィールドに対応した画素ブロックを生成する。また、垂直方向に2ライン目の画素データx2と、4ライン目の画素データx4と、6ライン目の画素データx6と、8ライン目の画素データx8とを取り出して、ボトムフィールドに対応した画素ブロックを生成する。なお、DCTブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離する処理を、以下フィールド分離という。
【0045】
続いて、ステップS3において、フィールド分離した2つの画素ブロックそれぞれに対して4×4の離散コサイン変換(DCT4×4)をする。
【0046】
続いて、ステップS4において、4×4の離散コサイン変換をして得られたトップフィールドに対応する画素ブロックの離散コサイン係数z(トップフィールドに対応する画素ブロックの全ての係数のうち垂直方向の離散コサイン係数をz1,z3,z5,z7として図中に示す。)の高域成分を間引き、2×2の離散コサイン係数から構成される画素ブロックとする。また、4×4の離散コサイン変換をして得られたボトムフィールドに対応する画素ブロックの離散コサイン係数z(ボトムフィールドに対応する画素ブロックの全ての係数のうち垂直方向の離散コサイン係数をz2,z4,z6,z8として図中に示す。)の高域成分を間引き、2×2の離散コサイン係数から構成される画素ブロックとする。
【0047】
続いて、ステップS5において、高域成分の離散コサイン係数を間引いた画素ブロックに対して、2×2の逆離散コサイン変換(IDCT2×2)を行う。2×2の逆離散コサイン変換をすることにより、2×2の復号された画素データx′(トップフィールドの画素ブロックの全ての画素データのうち垂直方向の画素データをx′1,x′3として図中に示し、また、ボトムフィールドに対応する画素ブロックの全ての画素データのうち垂直方向の画素データをx′2,x′4として図中に示す。)を得ることができる。
【0048】
続いて、ステップS6において、トップフィールドに対応する画素ブロックの画素データと、ボトムフィールドに対応する画素ブロックの画素データとを、垂直方向に1ラインずつ交互に合成して、4×4の画素データから構成される縮小逆離散コサイン変換をしたDCTブロックを生成する。なお、トップフィールドとボトムフィールドに対応した2つの画素ブロックの各画素を垂直方向に交互に合成する処理を、以下フレーム合成という。
【0049】
以上のステップS1からステップS6を行うことにより、フレームモード用縮小逆離散コサイン変換装15では、図15で示したような、フィールドモード用縮小逆離散コサイン変換装置204で生成した標準解像度画像の画素の位相と同位相の画素から構成される4×4のDCTブロックを生成することができる。
【0050】
また、フレームモード用縮小逆離散コサイン変換装置205では、以上のステップS1からステップS6までの処理を1つの行列を用いて演算する。具体的には、フレームモード用縮小逆離散コサイン変換装置205では、以上の処理を加法定理を用いて展開計算することにより得られる以下の式(1)に示す行列[FS′]と、1つのDCTブロックの離散コサイン係数y(y1〜y8)とを行列演算することにより、縮小逆離散コサイン変換したDCTブロックの画素データx′(x′1〜x′4)を得ることができる。
【0051】
【数1】
【0052】
但し、この式(1)において、A〜Jは以下の通りである。
【0053】
【数2】
【0054】
以上のように特願平10−208385で提案した画像復号装置200においては、フィールドDCTモードでは、トップフィールドとボトムフィールドとのそれぞれに4×4の縮小逆離散コサイン変換を行い標準解像度画像を復号し、フレームDCTモードでは、フレーム分離をして縮小逆離散コサイン変換を行い標準解像度画像を復号する。この画像復号装置200では、このようにフィールドDCTモードとフレームDCTモードとで異なる処理を行うため、飛び越し走査画像が有するインタレース性を損なうことなく、かつ、フィールドDCTモードとフレームDCTモードとで復号した画像の位相を同一とすることができ、出力する画像の画質を劣化させない。
【0055】
なお、上記画像復号装置200では、フィールドモード用縮小逆離散コサイン変換装置204の4×4の縮小逆離散コサイン変換処理、及び、フレームモード用縮小逆離散コサイン変換装置205の上記ステップS1〜ステップS6の縮小逆離散コサイン変換処理を、高速アルゴリズムを用いて処理してもよい。
【0056】
例えば、Wangのアルゴリズム(参考文献:Zhong DE Wang.,"Fast Algorithms for the Discrete W Transform and for the Discrete Fourier Transform",IEEE Tr.ASSP-32,NO.4,pp.803-816, Aug.1984)を用いることにより、処理を高速化することができる。
【0057】
フィールドモード用縮小逆離散コサイン変換装置204が演算をする行列を、Wangのアルゴリズムを用いて分解すると、以下の式(2)に示すように分解される。
【0058】
【数3】
【0059】
図17にフィールドモード用縮小逆離散コサイン変換装置204の処理にWangのアルゴリズムを適用した場合の処理フローを示す。
【0060】
この処理フローは、第1から第5の乗算器204a〜204e及び第1から第9の加算器204f〜204nから構成され、1次元の離散コサイン係数X(0)〜X(3)が入力される。第1から第5の乗算器204a〜204eに示しているW0〜W4は、各乗算器が乗算する値を示している。この処理フローからは、以下の式(3)〜式(6)に示す演算がされた4つの係数値或いは画素値Y(0)〜Y(3)が出力される。なお、この式(3)〜式(6)では、W0=W1の関係がある。
【0061】
【数4】
【0062】
フィールドモード用縮小逆離散コサイン変換装置204では、DCTブロックの低域の4×4の垂直方向の4個の係数に対して図17に示す処理フローを施した後、係数位置をメモリ内で90°転換し、DCTブロックの低域の4×4の水平方向の4個の係数に対して再度この図17に示す処理フローを施す。
【0063】
このようにWangのアルゴリズムを適用することにより演算を高速化することができる。
【0064】
また、フレームモード用縮小逆離散コサイン変換装置205が演算をする行列[FS′]を、Wangのアルゴリズムを用いて分解すると、以下の式(7)に示すように分解される。
【0065】
【数5】
【0066】
但し、この式(7)において、A〜Jは、以下の通りである。
【0067】
【数6】
【0068】
図18にフレームモード用縮小逆離散コサイン変換装置205の処理にWangのアルゴリズムを適用した場合の処理フローを示す。
【0069】
この処理フローは、第1から第10の乗算器205a〜205j及び第1から第12の加算器205k〜205vから構成され、1次元の離散コサイン係数X(0)〜X(7)が入力される。第1から第10の乗算器205a〜205jに示しているW0〜W9は、各乗算器が乗算する値を示している。この処理フローからは、以下の式(8)〜式(11)に示す演算がされた4つの係数値Y(0)からY(3)が出力される。なお、この式(8)〜式(11)では、W0=W1の関係がある。
【0070】
【数7】
【0071】
フレームモード用縮小逆離散コサイン変換装置205では、DCTブロックの低域の8×4の垂直方向の8個の係数に対して図18に示す処理フローを施した後、係数位置をメモリ内で90°転換し、DCTブロックの低域の4×4の水平方向の4個の係数に対して図17に示す処理フローを施す。
【0072】
このようにWangのアルゴリズムを適用することにより演算を高速化することができる。
【0073】
ところで、以上のような特願平10−208385号で提案した画像復号装置200では、フィールドモード時の縮小逆離散コサイン変換と、フレームモード時の縮小逆離散コサイン変換とが全く別の処理フローとなっている。
【0074】
そのため、例えば、これらの処理をソフトウェアで行おうとした場合には、コードサイズが大きくなり、多くの命令メモリが必要となってしまう。同様に、コードサイズが大きくなることによりキャッシュミスを起こし易くなり、復号処理の低下を招く可能性がある。また、これらの処理を専用回路で行おうとした場合も、回路規模が大きくなってしまう。
【0075】
本発明は、このような実情を鑑みてなされたものであり、飛び越し走査画像が有するインタレース性を損なうことなくフィールド直交変換モードとフレーム直交変換モードとによる画素の位相ずれをなくすことが可能な、高解像度画像の圧縮画像データから標準解像度の画像データを復号する画像復号装置及び画像復号方法であって、処理フローを簡略化した画像復号装置及び画像復号方法を提供することを目的とする。
【0076】
【課題を解決するための手段】
本発明にかかる画像復号装置は、8×8画素からなる画素ブロックに対して2次元の直交変換をして8×8係数からなる直交変換ブロックを生成して圧縮符号化をした第1の解像度の圧縮画像データから、上記第1の解像度の1/2の解像度の動画像データを復号する画像復号装置であって、飛び越し走査に対応した直交変換方式(フィールド直交変換モード)により直交変換がされた直交変換ブロックと、順次走査に対応した直交変換方式(フレーム直交変換モード)により直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をして、4×4係数となる直交変換ブロックを生成する第1の逆直交変換手段と、上記第1の逆直交変換手段により逆直交変換がされた4×4係数に対して、水平方向の1次元の逆直交変換をして、4×4画素からなる画素ブロックを生成する第2の逆直交変換手段とを備え、上記第1の逆直交変換手段は、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成することを特徴とする。
【0077】
この画像復号装置では、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成する。そして、この画像復号装置では、第1の解像度より低い第2の解像度の動画像データを出力する。さらに、この画像復号装置では、フィールド直交変換モードにより直交変換がされた直交変換ブロックと、フレーム直交変換モードにより直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をする。
【0078】
また、本発明にかかる画像復号方法は、8×8画素からなる画素ブロックに対して2次元の直交変換をして8×8係数からなる直交変換ブロックを生成して圧縮符号化をした第1の解像度の圧縮画像データから、上記第1の解像度の1/2の解像度の動画像データを復号する画像復号方法であって、飛び越し走査に対応した直交変換方式(フィールド直交変換モード)により直交変換がされた直交変換ブロックと、順次走査に対応した直交変換方式(フレーム直交変換モード)により直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をして、4×4係数となる直交変換ブロックを生成し、逆直交変換がされた上記4×4係数に対して、水平方向の1次元の逆直交変換をして、4×4画素からなる画素ブロックを生成し、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成することを特徴とする。
【0079】
この画像復号方法では、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成する。そして、この画像復号装置では、第1の解像度より低い第2の解像度の動画像データを出力する。さらに、この画像復号装置では、フィールド直交変換モードにより直交変換がされた直交変換ブロックと、フレーム直交変換モードにより直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をする。
【0080】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0081】
図1に本発明の実施の形態の画像復号装置のブロック構成図を示す。
【0082】
図1に示す画像復号装置10は、垂直方向の有効ライン数が例えば1152本の高解像度画像をMPEG2で画像圧縮したビットストリームが入力され、この入力されたビットストリームを復号するとともに1/2の解像度に縮小して、垂直方向の有効ライン数が例えば576本の標準解像度画像を出力する装置である。
【0083】
この画像復号装置10は、圧縮された高解像度画像のビットストリームが供給され、このビットストリームを解析するビットストリーム解析装置11と、データの発生頻度に応じた符号長を割り当てる可変長符号化がされた上記ビットストリームを復号する可変長符号復号装置12と、DCTブロックの各係数に量子化ステップを掛ける逆量子化装置13と、離散コサイン変換がされたDCTブロックに対して縮小逆離散コサイン変換をして標準解像度画像を生成する縮小逆離散コサイン変換装置14と、縮小逆離散コサイン変換がされた標準解像度画像と動き補償がされた参照画像とを加算する加算装置16と、参照画像を一時記憶するフレームメモリ17と、フレームメモリ17が記憶した参照画像にフィールド動き予測モードに対応した動き補償をするフィールドモード用動き補償装置18と、フレームメモリ17が記憶した参照画像にフレーム動き予測モードに対応した動き補償をするフレームモード用動き補償装置19と、フレームメモリ17が記憶した画像に対してポストフィルタリングをすることにより、画枠変換をするとともに画素の位相ずれを補正してテレビジョンモニタ等に表示するための標準解像度の画像データを出力する画枠変換・位相ずれ補正装置20とを備えている。
【0084】
縮小逆離散コサイン変換装置14は、入力されたビットストリームのマクロブロックがフィールドDCTモードで離散コサイン変換されている場合には、フィールドDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、図8で示したような、低域の4×4の係数のみに逆離散コサイン変換を行う。すなわち、水平方向及び垂直方向の低域の4点の離散コサイン係数に基づき縮小逆離散コサイン変換を行う。この縮小逆離散コサイン変換装置14では、以上のような縮小逆離散コサイン変換を行うことにより、1つのDCTブロックが4×4の画素から構成される標準解像度画像を復号することができる。この復号された画像データの各画素の位相は、図15に示したように、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる。すなわち、復号された下位レイヤーのトップフィールドでは、先頭画素(位相が1/2の画素)の位相が上位レイヤーのトップフィールドの先頭から1番目と2番目の画素(位相が0と2の画素)の中間位相となり、先頭から2番目の画素(位相が5/2の画素)の位相が上位レイヤーのトップフィールドの先頭から3番目と4番目の画素(位相が4と6の画素)の中間位相となる。また、復号された下位レイヤーのボトムフィールドでは、先頭画素(位相が1の画素)の位相が上位レイヤーのボトムフィールドの先頭から1番目と2番目の画素(位相が1と3の画素)の中間位相となり、先頭から2番目の画素(位相が3の画素)の位相が上位レイヤーのボトムフィールドの先頭から3番目と4番目の画素(位相が5と7の画素)の中間位相となる。
【0085】
また、縮小逆離散コサイン変換装置14は、入力されたビットストリームのマクロブロックがフレームDCTモードで離散コサイン変換されている場合には、フレームDCTモードで離散コサイン変換がされたマクロブロック内の8×8個の係数が示されたDCTブロックに対して、上述したフレームモード用縮小逆離散コサイン変換装置15と同様の8×4の縮小逆離散コサイン変換を行う。そして、縮小逆離散コサイン変換装置14では、1つのDCTブロックが4×4の画素から構成される解像度画像を復号するとともに、フィールドDCTモードで離散コサイン変換されている場合に復号した標準解像度画像の画素の位相と同位相の画像を生成する。すなわち、縮小逆離散コサイン変換装置14は、図15に示したような、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる画像を生成する。
【0086】
加算装置16は、縮小逆離散コサイン変換装置14により縮小逆離散コサイン変換されたマクロブロックがイントラ画像の場合には、そのイントラ画像をそのままフレームメモリ17に格納する。また、加算装置16は、縮小逆離散コサイン変換装置14により縮小逆離散コサイン変換されたマクロブロックがインター画像である場合には、そのインター画像に、フィールドモード用動き補償装置18或いはフレームモード用動き補償装置19により動き補償がされた参照画像を合成して、フレームメモリ17に格納する。
【0087】
フィールドモード用動き補償装置18は、マクロブロックの動き予測モードがフィールド動き予測モードの場合に用いられる。フィールドモード用動き補償装置18は、フレームメモリ17に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フィールド動き予測モードに対応した動き補償をする。このフィールドモード用動き補償装置18により動き補償がされた参照画像は、加算装置16に供給され、インター画像に合成される。
【0088】
フレームモード用動き補償装置19は、マクロブロックの動き予測モードがフレーム動き予測モードの場合に用いられる。フレームモード用動き補償装置19は、フレームメモリ17に記憶されている標準解像度画像の参照画像に対して、トップフィールドとボトムフィールドとの間の位相ずれ成分を考慮した形で1/4画素精度で補間処理を行い、フレーム動き予測モードに対応した動き補償をする。このフレームモード用動き補償装置19により動き補償がされた参照画像は、加算装置16に供給され、インター画像に合成される。
【0089】
画枠変換・位相ずれ補正装置20は、フレームメモリ17が記憶した標準解像度の参照画像或いは加算装置16が合成した画像が供給され、この画像をポストフィルタリングにより、トップフィールドとボトムフィールドとの間の位相ずれ成分を補正するとともに画枠を標準解像度のテレビジョンの規格に合致するように変換する。すなわち、画枠変換・位相ずれ補正装置20は、トップフィールドの各画素の垂直方向の位相が1/2、5/2・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3・・・となる標準解像度画像を、例えば、トップフィールドの各画素の垂直方向の位相が0、2、4・・・となり、ボトムフィールドの各画素の垂直方向の位相が1、3、5・・・となるように補正する。また、画枠変換・位相ずれ補正装置20は、高解像度のテレビジョン規格の画枠を、1/4に縮小して標準解像度のテレビジョン規格の画枠に変換する。
【0090】
この画像復号装置10では、以上のような構成を有することにより、高解像度画像をMPEG2で画像圧縮したビットストリームを、復号するとともに解像度を1/2に縮小して、標準解像度画像を出力することができる。
【0091】
つぎに、上記縮小逆離散コサイン変換装置14の処理内容について、さらに詳細に説明する。
【0092】
縮小逆離散コサイン変換装置14は、図2に示すように、逆量子化装置13から高解像度画像をMPEG2で画像圧縮したビットストリームが供給される入力バッファ21と、垂直成分の1次元の逆離散コサイン変換を行う垂直成分逆離散コサイン変換部22と、中間バッファ23と、水平成分の1次元の逆離散コサイン変換を行う水平成分逆離散コサイン変換部24と、出力バッファ25と有している。
【0093】
入力バッファ21には、逆量子化装置13により逆量子化されたビットストリームがDCTブロック単位で入力され、このDCTブロックを一時格納する。
【0094】
垂直成分逆離散コサイン変換部22は、入力バッファ21に格納されたDCTブロック単位の離散コサイン係数を抜き出し、このDCTブロックに対して垂直方向の一次元の逆離散コサイン変換を行う。このとき、垂直成分逆離散コサイン変換部22は、8個の垂直方向の係数に対して離散コサイン変換をするとともに、この8個の係数を4個の係数に縮小する縮小逆離散コサイン変換を行う。
【0095】
また、この垂直成分逆離散コサイン変換部22には、離散コサイン変換をするDCTブロックの離散コサイン変換のモード情報が入力される。すなわち、そのDCTブロックが、フィールドDCTモードで離散コサイン変換されているか、或いは、フレームDCTモード離散コサイン変換がされているかどうかの情報が入力される。垂直成分逆離散コサイン変換部22は、離散コサイン変換をするDCTブロックが、フィールドDCTモードで離散コサイン変換されている場合には、上述した特願平10−208385号で提案した画像復号装置200のフィールドモード用縮小逆離散コサイン変換装置204と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行う。また、垂直成分逆離散コサイン変換部22は、離散コサイン変換をするDCTブロックが、フレームDCTモードで離散コサイン変換されている場合には、上述した特願平10−208385号で提案した画像復号装置200のフレームモード用縮小逆離散コサイン変換装置205と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行う。
【0096】
この垂直成分逆離散コサイン変換部22の具体的な処理フローを図3に示す。
【0097】
この図3に示した処理フローは、縮小逆離散コサイン変換装置14が演算をする行列を、分解してWangのアルゴリズムに適用したものである。
【0098】
この垂直成分逆離散コサイン変換部22の処理フローは、第1から第10の乗算器31〜40及び第1から第12の加算器41〜52から構成され、1次元の離散コサイン係数X(0)〜X(7)が入力される。第1から第10の乗算器31〜40に示しているA〜Jは、各乗算器が乗算する値を示している。
【0099】
第1の乗算器31は最も低域の離散コサイン係数X(0)に対して値Aを乗算する。第2の乗算器32は低域から3番目の離散コサイン係数X(2)に対して値Bを乗算する。第3の乗算器33は低域から5番目の離散コサイン係数X(4)に対して値Cを乗算する。第4の乗算器34は低域から7番目の離散コサイン係数X(6)に対して値Dを乗算する。第5の乗算器35は低域から4番目の離散コサイン係数X(3)に対して値Eを乗算する。第6の乗算器36は低域から6番目の離散コサイン係数X(5)に対して値Fを乗算する。第7の乗算器37は低域から2番目の離散コサイン係数X(1)に対して値Gを乗算する。第8の乗算器38は低域から2番目の離散コサイン係数X(1)に対して値Hを乗算する。
【0100】
また、第9の乗算器39は、フィールドDCTモードの場合には低域から4番目の離散コサイン係数X(3)に対して値Iを乗算し、また、フレームDCTモードの場合には最も高域の離散コサイン係数X(7)に対して値Iを乗算する。また、第10の乗算器40は、フィールドDCTモードの場合には低域から4番目の離散コサイン係数X(3)に対して値Jを乗算し、また、フレームDCTモードの場合には最も高域の離散コサイン係数X(7)に対して値Jを乗算する。この第9及び第10の乗算器39,40に入力する離散コサイン係数の切り換えは、即ち離散コサイン係数X(3)と離散コサイン係数X(7)の入力データポートの切り換えは、切換スイッチ60により行われる。
【0101】
従って、フィールドDCTモードの場合、この図3に示す処理フローからは、以下の式(12)〜式(15)に示す演算がされた4つの係数値Y(0)〜Y(3)が出力される。
【0102】
【数8】
【0103】
また、フレームDCTモードの場合、この図3に示す処理フローからは、以下の式(16)〜式(19)に示す演算がされた4つの係数値Y(0)からY(3)が出力される。
【0104】
【数9】
【0105】
また、第1から第10の各乗算器31〜40は、例えば内部にレジスタを備えており、そのレジスタ内に乗算するA〜Jの値が格納される。このレジスタ内の値は、フィールドDCTモードとフレームDCTモードとで切り換えられる。
【0106】
フィールドDCTモードとフレームDCTモードとで切り換えられる各乗算器の乗算定数を以下の表に示す。なお、この表では、W0=W1の関係がある。
【0107】
【表1】
【0108】
この表に示されたフィールドDCTモードの場合の各値を上記式(12)〜式(15)に代入すると、図3に示した処理フローからは、以下の式(20)〜式(23)に示す演算がされた4つの係数値Y(0)からY(3)が出力されることとなる。
【0109】
【数10】
【0110】
この式(20)〜式(23)に示され得たY(0)からY(3)は、上記式(3)〜式(6)の各値と同一となる。すなわち、特願平10−208385号で提案した画像復号装置200のフィールドモード用縮小逆離散コサイン変換装置204と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行っている。
【0111】
また、フレームDCTモードの場合の各値を上記式(16)〜式(19)に代入すると、図3に示した処理フローからは、以下の式(24)〜式(27)に示す演算がされた4つの係数値Y(0)からY(3)が出力されることとなる。
【0112】
【数11】
【0113】
この式(24)〜式(27)に示され得たY(0)からY(3)は、上記式(7)〜式(11)の各値と同一となる。すなわち、すなわち、特願平10−208385号で提案した画像復号装置200のフレームモード用縮小逆離散コサイン変換装置205と同一のアルゴリズムで、垂直方向の逆離散コサイン変換を行う。
【0114】
以上のように垂直成分逆離散コサイン変換部22では、各乗算器31〜33の乗算定数を切り換えるとともにデータの入力ポートを切り換えることにより、フィールドDCTモードの場合とフレームDCTモードの場合の垂直方向の縮小逆離散コサイン変換をすることができる。また、この垂直成分逆離散コサイン変換部22では、フィールドDCTモードの縮小逆離散コサイン変換とフレームDCTモードの縮小逆離散コサイン変換とを1つの処理フローで演算するの、その構成が非常に簡易となる。
【0115】
以上のように演算された離散コサイン係数は、中間バッファ23に一旦格納される。
【0116】
水平成分逆離散コサイン変換部24は、中間バッファ23に格納されたDCTブロック単位の離散コサイン係数を抜き出し、このDCTブロックに対して水平方向の一次元の逆離散コサイン変換を行う。このとき、水平成分逆離散コサイン変換部24は、4個の垂直方向の係数に対して離散コサイン変換をする。水平成分逆離散コサイン変換部24は、離散コサイン変換をするDCTブロックが、フィールドDCTモードで離散コサイン変換されているか、或いは、フレームDCTモードで離散コサイン変換されているかにかかわらず、上述した特願平10−208385号で提案した画像復号装置200のフィールドモード用縮小逆離散コサイン変換装置204と同一のアルゴリズムで、水平方向の逆離散コサイン変換を行う。
【0117】
すなわち、この水平成分逆離散コサイン変換部24の処理フローは、上記図17で示したものと同一となる。
【0118】
なお、この水平成分逆離散コサイン変換部24の処理フローは、上記垂直成分逆離散コサイン変換部22のフィールドDCTモードの際の処理フローと同一であるので、この垂直成分逆離散コサイン変換部22の処理フローを流用しても良い。
【0119】
出力バッファ25は、水平成分逆離散コサイン変換部24が演算した4×4の画素値をDCTブロック単位で一時格納し、加算装置16に供給する。
【0120】
以上のように本発明の実施の形態の画像復号装置10では、飛び越し走査画像が有するインタレース性を損なうことなくフィールド直交変換モードとフレーム直交変換モードとによる画素の位相ずれをなくた高解像度画像の圧縮画像データから標準解像度の画像データを復号することができ、かつ、その処理フローを簡略化することができる。
【0121】
【発明の効果】
本発明にかかる画像復号装置及び画像復号方法では、フレーム直交変換モードにより直交変換がされた直交変換ブロックの全周波数成分の係数に対して逆直交変換をして飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をして低周波成分の係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成する。そして、この画像復号方法では、第1の解像度より低い第2の解像度の動画像データを出力する。さらに、この画像復号方法では、フィールド直交変換モードにより直交変換がされた直交変換ブロックと、フレーム直交変換モードにより直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をする。
【0122】
このことにより、本発明では、復号に必要な演算量及び記憶容量を少なくすることができるとともに、飛び越し走査画像が有するインタレース性を損なうことなくフィールド直交変換モードとフレーム直交変換モードとによる画素の位相ずれをなくすことができる。また、第2の解像度の動画像データの画質を向上させることができる。さらに、本発明では、逆離散コサイン変換に伴う処理を簡略化することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の画像復号装置のブロック図である。
【図2】上記画像復号装置の縮小逆離散コサイン変換装置のブロック構成図である。
【図3】上記縮小離散コサイン変換装置の垂直成分逆離散コサイン変換部の処理フローを示す図である。
【図4】従来の第1のダウンデコーダを示すブロック図である。
【図5】従来の第2のダウンデコーダを示すブロック図である。
【図6】従来の第3のダウンデコーダを示すブロック図である。
【図7】従来の画像復号装置のブロック図である。
【図8】上記従来の画像復号装置のフィールドDCTモードにおける縮小逆離散コサイン変換処理を説明するための図である。
【図9】上記従来の画像復号装置のフィールドDCTモードにおける縮小逆離散コサイン変換処理を説明するための図である。
【図10】上記従来の画像復号装置のフィールド動き予測モードにおける線形補間処理を説明するための図である。
【図11】上記従来の画像復号装置のフレーム動き予測モードにおける線形補間処理を説明するための図である。
【図12】上記従来の画像復号装置のフィールドDCTモードの結果得られる画素の位相を説明するための図である。
【図13】上記従来の画像復号装置のフレームDCTモードの結果得られる画素の位相を説明するための図である。
【図14】特願平10−208385で提案された画像復号装置のブロック図である。
【図15】上記特願平10−208385で提案された画像復号装置のフレームメモリに格納される参照画像の垂直方向の画素の位相を説明するための図である。
【図16】上記特願平10−208385で提案された画像復号装置のフレームモード用縮小逆離散コサイン変換装置の1ブロック処理の内容を説明するための図である。
【図17】Wangのアルゴリズムを上記特願平10−208385で提案された画像復号装置のフィールドモード用縮小逆離散コサイン変換装置の処理に適用した場合の演算フローを示す図である。
【図18】Wangのアルゴリズムを上記特願平10−208385で提案された画像復号装置のフレームモード用縮小逆離散コサイン変換装置の1ブロック処理に適用した場合の演算フローを示す図である。
【符号の説明】
10 画像復号装置、14 縮小逆離散コサイン変換装置、22 垂直成分逆離散コサイン変換部、24 水平成分逆離散コサイン変換部
Claims (4)
- 8×8画素からなる画素ブロックに対して2次元の直交変換をして8×8係数からなる直交変換ブロックを生成して圧縮符号化をした第1の解像度の圧縮画像データから、上記第1の解像度の1/2の解像度の動画像データを復号する画像復号装置において、
飛び越し走査に対応した直交変換方式(フィールド直交変換モード)により直交変換がされた直交変換ブロックと、順次走査に対応した直交変換方式(フレーム直交変換モード)により直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をして、4×4係数となる直交変換ブロックを生成する第1の逆直交変換手段と、
上記第1の逆直交変換手段により逆直交変換がされた4×4係数に対して、水平方向の1次元の逆直交変換をして、4×4画素からなる画素ブロックを生成する第2の逆直交変換手段とを備え、
上記第1の逆直交変換手段は、フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成すること
を特徴とする画像復号装置。 - 上記第1の逆直交変換手段及び第2の逆直交変換手段は、高速アルゴリズムに基づき逆直交変換をすること
を特徴とする請求項1に記載の画像復号装置。 - 8×8画素からなる画素ブロックに対して2次元の直交変換をして8×8係数からなる直交変換ブロックを生成して圧縮符号化をした第1の解像度の圧縮画像データから、上記第1の解像度の1/2の解像度の動画像データを復号する画像復号方法において、
飛び越し走査に対応した直交変換方式(フィールド直交変換モード)により直交変換がされた直交変換ブロックと、順次走査に対応した直交変換方式(フレーム直交変換モード)により直交変換がされた直交変換ブロックとで、逆直交変換に用いる各乗算係数を切り換えるとともに各乗算係数に入力する係数を切り換え、上記圧縮画像データの直交変換ブロックの各係数のうち8×4係数に対して垂直方向の1次元の逆直交変換をして、4×4係数となる直交変換ブロックを生成し、
逆直交変換がされた上記4×4係数に対して、水平方向の1次元の逆直交変換をして、4×4画素からなる画素ブロックを生成し、
フィールド直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向及び垂直方向の低域の4係数に対して逆直交変換をして4×4係数からなる直交変換ブロックを生成し、
フレーム直交変換モードにより直交変換された上記直交変換ブロックの各係数に対しては、水平方向の低域の4係数及び垂直方向の8係数に対して逆直交変換をし、逆直交変換をした直交変換ブロックの各画素を飛び越し走査に対応した2つの画素ブロックに分離し、分離した2つの画素ブロックに対してそれぞれ直交変換をし、直交変換をした2つの画素ブロックの各係数のうち水平方向及び垂直方向2係数に対して逆直交変換をし、逆直交変換をした2つの画素ブロックを合成して4×4係数からなる直交変換ブロックを生成すること
を特徴とする画像復号方法。 - 高速アルゴリズムに基づき逆直交変換をすること
を特徴とする請求項3に記載の画像復号方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04373499A JP3937632B2 (ja) | 1999-02-22 | 1999-02-22 | 画像復号装置及び画像復号方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04373499A JP3937632B2 (ja) | 1999-02-22 | 1999-02-22 | 画像復号装置及び画像復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000244916A JP2000244916A (ja) | 2000-09-08 |
JP3937632B2 true JP3937632B2 (ja) | 2007-06-27 |
Family
ID=12672024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04373499A Expired - Fee Related JP3937632B2 (ja) | 1999-02-22 | 1999-02-22 | 画像復号装置及び画像復号方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3937632B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003223433A (ja) * | 2002-01-31 | 2003-08-08 | Matsushita Electric Ind Co Ltd | 直交変換方法、直交変換装置、符号化方法、符号化装置、逆直交変換方法、逆直交変換装置、復号化方法、及び、復号化装置 |
-
1999
- 1999-02-22 JP JP04373499A patent/JP3937632B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000244916A (ja) | 2000-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4026238B2 (ja) | 画像復号装置及び画像復号方法 | |
JP3975629B2 (ja) | 画像復号装置及び画像復号方法 | |
US6748018B2 (en) | Picture decoding method and apparatus | |
US6650708B1 (en) | Video signal encoding apparatus | |
KR100370076B1 (ko) | 다운 컨버젼 기능을 갖는 비디오 디코더 및 비디오 신호를디코딩 하는 방법 | |
KR19980080157A (ko) | 이산 코사인 변환 인코드 화상의 다운 변환을 위한 주파수 영역 필터링 | |
US20020090028A1 (en) | Codec system and method for spatially scalable video data | |
JP2000059795A (ja) | 情報ストリ―ムデコ―ダにおいてモ―ションベクトル情報を適応的にスケ―リングする方法および装置 | |
JP2001204026A (ja) | 画像情報変換装置及び方法 | |
JP4361987B2 (ja) | フィールドモード符号化を含む画像フレームのサイズ変更のための方法及び装置 | |
KR100711597B1 (ko) | 감소된 해상도의 비디오 신호를 유도하기 위한 디코딩 장치 및 방법 | |
JP2001285863A (ja) | 画像情報変換装置及び方法 | |
JP3937599B2 (ja) | 画像復号装置及び画像復号方法 | |
JP4051772B2 (ja) | 画像復号装置及び画像復号方法 | |
KR20050084396A (ko) | 공간 스케일 능력를 갖는 디지털 필터 | |
US6493391B1 (en) | Picture decoding method and apparatus | |
US6532309B1 (en) | Picture decoding method and apparatus | |
JP3937632B2 (ja) | 画像復号装置及び画像復号方法 | |
JP4051799B2 (ja) | 画像復号装置及び画像復号方法 | |
JP4016166B2 (ja) | 画像復号装置及び画像復号方法 | |
JP2000041253A (ja) | 画像復号装置及び画像復号方法 | |
JP2000059777A (ja) | 画像復号装置及び画像復号方法 | |
JP2000041254A (ja) | 画像復号装置及び画像復号方法 | |
JP2001285875A (ja) | 画像情報変換装置及び方法 | |
JP2002034046A (ja) | 画像情報変換装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070319 |
|
LAPS | Cancellation because of no payment of annual fees |