JP2000236547A - 画像情報変換装置及び画像情報変換方法 - Google Patents

画像情報変換装置及び画像情報変換方法

Info

Publication number
JP2000236547A
JP2000236547A JP18360299A JP18360299A JP2000236547A JP 2000236547 A JP2000236547 A JP 2000236547A JP 18360299 A JP18360299 A JP 18360299A JP 18360299 A JP18360299 A JP 18360299A JP 2000236547 A JP2000236547 A JP 2000236547A
Authority
JP
Japan
Prior art keywords
coefficient
orthogonal transform
quantization
motion compensation
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP18360299A
Other languages
English (en)
Other versions
JP2000236547A5 (ja
Inventor
Kazufumi Sato
数史 佐藤
Takeshi Kubozono
猛 窪園
Shintaro Okada
紳太郎 岡田
Iku Ryuu
イク リュウ
Hisafumi Yanagihara
尚史 柳原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP18360299A priority Critical patent/JP2000236547A/ja
Priority to US09/605,035 priority patent/US6658157B1/en
Publication of JP2000236547A publication Critical patent/JP2000236547A/ja
Publication of JP2000236547A5 publication Critical patent/JP2000236547A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 MPEG−2方式で圧縮符号化したビットス
トリームのビットレートを、復号画像の画質劣化を最小
限に抑えながら削減する。 【解決手段】 逆量子化装置26は、MPEG−2のビ
ットストリームを逆量子化して、DCTブロック単位の
離散コサイン係数を出力する。帯域制限装置27は、離
散コサイン係数の水平方向の高周波成分の値を0と置き
換える。量子化装置28は、元々の量子化幅と異なる量
子化幅で離散コサイン係数を量子化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、所定の画素ブロッ
ク単位で直交変換するとともに直交変換して得られた上
記直交変換ブロック内の直交変換係数を量子化すること
により圧縮符号化をした画像圧縮情報のビットレートを
変換する画像情報変換装置及び画像情報変換方法に関す
るものである。例えば、本発明は、衛星放送やケーブル
テレビジョン等のネットワークに伝送する場合や、光デ
ィスクや磁気ディスク等の記録メディアに記録する場合
などに、MPEG−2等により圧縮符号化した画像圧縮
情報のビットレートを削減するものである。
【0002】
【従来の技術】近年、画像情報をデジタルデータとして
取り扱い、そのデジタルデータを画像情報特有の冗長性
を利用した直交変換と動き補償により圧縮を行い、衛星
放送やケーブルテレビジョン等のネットワークメディア
へ伝送や、光ディスクや磁気ディスク等のストレージメ
ディアへの記録を行う装置が普及している。このような
装置では、一般に、画像圧縮方式に、離散コサイン変換
を用いたMPEG−2(Moving Picture Experts Group
phase - 2)が用いられている。
【0003】また、近年、このMPEG−2等の画像圧
縮方式を用いたデジタルテレビジョン放送の規格化が進
められている。デジタルテレビジョン放送の規格には、
標準解像度画像(例えば垂直方向の有効ライン数が57
6本)に対応した規格、高解像度画像(例えば垂直方向
の有効ライン数が1152本)に対応した規格等があ
る。
【0004】ところで、この高解像度画像の画像情報は
膨大であり、MPEG−2等の符号化方式を用いて圧縮
しても、十分な画質を得るためには多くの符号量(ビッ
トレート)が必要となる。例えば、画枠が1920画素
×1080画素の30Hzの飛び越し走査画像の場合に
は、18〜22Mbps程度或いはそれ以上の符号量
(ビットレート)を必要とする。
【0005】そのため、例えば衛星放送やケーブルテレ
ビジョン等のネットワークメディアへこのような高解像
度画像を伝送する場合には、伝送経路のバンド幅に合わ
せて更に符号量(ビットレート)の削減をしなければな
らない。同様に、光ディスクや磁気ディスク等のストレ
ージメディアへこのような高解像度画像を記録する場合
にも、メディアの記録容量に合わせて、更に符号量(ビ
ットレート)の削減をしなければならない。また、この
ような符号量(ビットレート)の削減の必要性は、高解
像度画像のみならず、標準解像度画像(例えば画枠が7
20画素×480画素の30Hzの飛び越し走査画像
等)でも生じることが考えられる。
【0006】従来より、図41に示すような、画像復号
化装置110と画像符号化装置120とが直列接続され
て構成された画像情報変換装置が、画像圧縮情報(ビッ
トストリーム)の持つ符号量(ビットレート)を削減す
る装置として知られている。
【0007】この従来の画像情報変換装置では、高ビッ
トレートの画像圧縮情報(ビットストリーム)が画像復
号化装置110に入力する。この画像復号化装置110
は、高ビットレートの画像圧縮情報を一旦完全に復号
し、ベースバンドのビデオデータを出力する。そして、
画像符号化装置120は、画像復号化装置21の出力と
して得られるベースバンドのビデオデータを再符号化
し、低ビットレートの画像圧縮情報(ビットストリー
ム)を出力する。このとき、画像符号化装置120は、
入力された画像圧縮情報の符号量(高ビットレート)よ
り低い目標符号量(ターゲットビットレート)が予め与
えられ、この目標符号量に応じた量子化処理をする。
【0008】以上のような処理を行うことにより、従来
の画像情報変換装置では、画像圧縮情報の符号量を削減
することができる。
【0009】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の画像情報変換装置では、復号化及び符号化に
伴う全てのハードウェア構成が必要となるため、コスト
と消費電力が大きくなり、民生用の機器や携帯型の機器
に組み込むことは困難であった。また、このような従来
の画像情報変換装置では、復号化及び符号化に伴う処理
を全て行わなければならないため、演算処理量が非常に
膨大となり、汎用の集積回路を用いてソフトウエアとし
て実現する場合には、回路の持つ演算処理能力では実時
間内に処理が終わらないといった問題が生じる可能性が
あった。
【0010】また、従来の画像情報変換装置の画像符号
化装置120では、入力された高ビットレートの画像圧
縮情報に対して、より低い目標符号量(ターゲットビッ
トレート)が与えられるため、量子化幅が粗くなり、こ
れによって生じる量子化雑音が復号画像においてブロッ
クノイズとして現れ、良好な画質が得られなかった。
【0011】本発明の目的は、上記問題点を解決するも
ので、入力された多くの符号量(高いビットレート)の
画像圧縮情報(ビットストリーム)を、復号画像の画質
劣化を最小限に抑えながら符号量(ビットレート)を削
減して、少ない符号量(低いビットレート)の画像圧縮
情報を出力する画像情報変換装置及び画像情報変換方法
を提供するものである。
【0012】
【課題を解決するための手段】本発明にかかる画像情報
変換装置は、所定の画素ブロック(直交変換ブロック)
単位で直交変換するとともに直交変換して得られた上記
直交変換ブロック内の直交変換係数を量子化することに
より、画像信号を圧縮符号化をした第1のビットレート
の第1の画像圧縮情報を、上記第1のビットレートより
低い第2のビットレートの第2の画像圧縮情報に変換す
る画像情報変換装置であって、入力された第1の画像圧
縮情報の直交変換係数の量子化幅に応じて、この直交変
換係数を逆量子化する逆量子化手段と、出力する第2の
画像圧縮情報が上記第2のビットレートとなるような量
子化幅に応じて、上記逆量子化手段により逆量子化され
た直交変換係数を再量子化する量子化手段とを備えるこ
とを特徴とする。
【0013】この画像情報変換装置では、直交変換係数
を逆量子化した後量子化幅を変えて再量子化する。
【0014】また、本発明にかかる画像情報変換装置
は、上記逆量子化手段により逆量子化された直交変換係
数の水平方向の高周波成分の値を制限する帯域制限手段
を備え、上記量子化手段は、出力する第2の画像圧縮情
報が上記第2のビットレートとなるような量子化幅に応
じて、上記帯域制限手段により水平方向の高周波成分が
制限された直交変換係数を再量子化することを特徴とす
る。
【0015】この画像情報変換装置では、直交変換係数
を逆量子化した後、直交変換係数の水平方向の高周波成
の値を制限し、量子化幅を変えて再量子化する。
【0016】また、本発明にかかる画像情報変換装置
は、所定の画素ブロック(直交変換ブロック)単位で直
交変換するとともに直交変換して得られた上記直交変換
ブロック内の直交変換係数を量子化することにより、画
像信号を圧縮符号化をした第1のビットレートの第1の
画像圧縮情報を、上記第1のビットレートより低い第2
のビットレートの第2の画像圧縮情報に変換する画像情
報変換装置であって、入力された第1の画像圧縮情報の
直交変換係数の量子化幅に応じて、この直交変換係数を
逆量子化する第1の逆量子化手段と、上記第1の逆量子
化手段により逆量子化された直交変換係数と動き補償誤
差補正係数とを加算する加算手段と、出力する第2の画
像圧縮情報が上記第2のビットレートとなるような量子
化幅に応じて、上記加算手段により動き補償誤差係数が
加算された直交変換係数を再量子化する量子化手段と上
記量子化手段により再量子化された直交変換係数を逆量
子化する第2の逆量子化手段と、上記第2の逆量子化手
段により逆量子化された直交変換係数から上記加算手段
により動き補償補正係数が加算された直交変換係数を減
算する減算手段と、上記減算手段により減算した上記直
交変換係数を直交変換して動きベクトルに基づき動き補
償し、動き補償で得た値を逆直交変換をして上記動き補
償誤差補正係数を生成する動き補償誤差補正手段とを備
えることを特徴とする。
【0017】この画像情報変換装置では、直交変換係数
を逆量子化した後量子化幅を変えて再量子化するととも
に、入力された直交変換係数と再量子化した直交変換係
数との差分を動き補償して動き補償による誤差を補正す
る。
【0018】また、本発明にかかる画像情報変換装置
は、上記第1の逆量子化手段により逆量子化された直交
変換係数の水平方向の高周波成分の値を制限する帯域制
限手段を備え、上記量子化手段は、出力する第2の画像
圧縮情報が上記第2のビットレートとなるような量子化
幅に応じて、上記帯域制限手段により水平方向の高周波
成分が制限された直交変換係数を再量子化することを特
徴とする。
【0019】この画像情報変換装置では、直交変換係数
を逆量子化した後直交変換係数の水平方向の高周波成の
値を制限し量子化幅を変えて再量子化するとともに、入
力された直交変換係数と再量子化した直交変換係数との
差分を動き補償して動き補償による誤差を補正する。
【0020】また、本発明にかかる画像情報変換装置
は、上記直交変換係数は、水平方向8係数と垂直方向8
係数の8×8係数からなり、上記動き補償誤差補正手段
が、水平方向8係数及び垂直方向8係数からなる量子化
誤差係数に対して、4×8の逆直交変換を行い、空間領
域の量子化誤差値を生成する4×8逆直交変換部と、上
記4×8逆直交変換部により生成された空間領域の量子
化誤差値に対して、水平方向に1/4画素精度で動き補
償をし、垂直方向に1/2画素精度で動き補償をして、
空間領域の量子化誤差補正値を生成する動き補償部と、
上記動き補償部により生成された空間領域の量子化誤差
補正値に対して、4×8の直交変換を行い、周波数領域
の上記動き補償誤差補正係数を生成する4×8直交変換
部とを有することを特徴とする。
【0021】この画像情報変換装置では、直交変換係数
を逆量子化した後直交変換係数の水平方向の高周波成の
値を制限し量子化幅を変えて再量子化するとともに、入
力された直交変換係数と再量子化した直交変換係数との
差分の水平方向の低域4係数及び垂直方向の8係数と
を、動き補償して動き補償による誤差を補正する。
【0022】本発明にかかる画像情報変換方法は、所定
の画素ブロック(直交変換ブロック)単位で直交変換す
るとともに直交変換して得られた上記直交変換ブロック
内の直交変換係数を量子化することにより、画像信号を
圧縮符号化をした第1のビットレートの第1の画像圧縮
情報を、上記第1のビットレートより低い第2のビット
レートの第2の画像圧縮情報に変換する画像情報変換方
法であって、上記第1のビットレートの第1の画像圧縮
情報を入力し、入力された第1の画像圧縮情報の直交変
換係数の量子化幅に応じて、この直交変換係数を逆量子
化し、出力する第2の画像圧縮情報が上記第2のビット
レートとなるような量子化幅に応じて、逆量子化された
上記直交変換係数を再量子化し、再量子化して生成した
第2の画像圧縮情報を出力することを特徴とする。
【0023】この画像情報変換方法では、直交変換係数
を逆量子化した後量子化幅を変えて再量子化する。
【0024】また、本発明にかかる画像情報変換方法
は、逆量子化された上記直交変換係数の水平方向の高周
波成分の値を制限し、出力する第2の画像圧縮情報が上
記第2のビットレートとなるような量子化幅に応じて、
水平方向の高周波成分が制限された上記直交変換係数を
再量子化することを特徴とする。
【0025】この画像情報変換方法では、直交変換係数
を逆量子化した後、直交変換係数の水平方向の高周波成
の値を制限し、量子化幅を変えて再量子化する。
【0026】また、本発明にかかる画像情報変換方法
は、所定の画素ブロック(直交変換ブロック)単位で直
交変換するとともに直交変換して得られた上記直交変換
ブロック内の直交変換係数を量子化することにより、画
像信号を圧縮符号化をした第1のビットレートの第1の
画像圧縮情報を、上記第1のビットレートより低い第2
のビットレートの第2の画像圧縮情報に変換する画像情
報変換方法であって、上記第1のビットレートの第1の
画像圧縮情報を入力し、入力された第1の画像圧縮情報
の直交変換係数の量子化幅に応じて、この直交変換係数
を逆量子化し、逆量子化された上記直交変換係数と動き
補償誤差補正係数とを加算し、出力する第2の画像圧縮
情報が上記第2のビットレートとなるような量子化幅に
応じて、動き補償誤差係数が加算された直交変換係数を
再量子化し、再量子化して生成した第2の画像圧縮情報
を出力し、再量子化された上記直交変換係数を逆量子化
し、逆量子化された直交変換係数から動き補償補正係数
が加算された直交変換係数を減算し、減算した直交変換
係数を直交変換して動きベクトルに基づき動き補償し、
動き補償をした値を逆直交変換をして上記動き補償誤差
補正係数を生成することを特徴とする。
【0027】この画像情報変換方法では、直交変換係数
を逆量子化した後量子化幅を変えて再量子化するととも
に、入力された直交変換係数と再量子化した直交変換係
数との差分を動き補償して動き補償による誤差を補正す
る。
【0028】また、本発明にかかる画像情報変換方法
は、逆量子化された直交変換係数の水平方向の高周波成
分の値を制限し、出力する第2の画像圧縮情報が上記第
2のビットレートとなるような量子化幅に応じて、水平
方向の高周波成分が制限された直交変換係数を再量子化
することを特徴とする。
【0029】この画像情報変換方法では、直交変換係数
を逆量子化した後直交変換係数の水平方向の高周波成の
値を制限し量子化幅を変えて再量子化するとともに、入
力された直交変換係数と再量子化した直交変換係数との
差分を動き補償して動き補償による誤差を補正する。
【0030】また、本発明にかかる画像情報変換方法
は、上記直交変換係数が、水平方向8係数と垂直方向8
係数の8×8係数からなり、水平方向8係数及び垂直方
向8係数からなる量子化誤差係数に対して、4×8の逆
直交変換を行い、空間領域の量子化誤差値を生成し、上
記空間領域の量子化誤差値に対して、水平方向に1/4
画素精度で動き補償をし、垂直方向に1/2画素精度で
動き補償をして、空間領域の量子化誤差補正値を生成
し、上記空間領域の量子化誤差補正値に対して、4×8
の直交変換を行い、周波数領域の上記動き補償誤差補正
係数を生成することを特徴とする。
【0031】この画像情報変換方法では、直交変換係数
を逆量子化した後直交変換係数の水平方向の高周波成の
値を制限し量子化幅を変えて再量子化するとともに、入
力された直交変換係数と再量子化した直交変換係数との
差分の水平方向の低域4係数及び垂直方向の8係数と
を、動き補償して動き補償による誤差を補正する。
【0032】
【発明の実施の形態】以下、本発明の実施の形態とし
て、MPEG−2方式で符号化された画像圧縮情報(ビ
ットストリーム)の符号量(ビットレート)を削減する
画像情報変換装置について説明する。MPEG−2(I
SO/IEC 13818−2)は、飛び越し走査画像
及び順次走査画像、並びに、標準解像度画像及び高解像
度画像の双方に対応した画像情報の圧縮方式である。
【0033】まず、本発明の実施の形態の画像情報変換
装置を説明する前に、MPEG−2方式の画像圧縮情報
(ビットストリーム)を符号化するMPEG−2画像情
報符号化装置、並びに、MPEG−2方式の画像圧縮情
報(ビットストリーム)の構成について説明する。
【0034】(画像情報符号化装置)図1に、MPEG
−2画像情報符号化装置のブロック図を示す。
【0035】MPEG−2画像情報符号化装置は、この
図1に示すように、画面並べ替えバッファ1と、加算器
2と、離散コサイン変換装置3と、量子化装置4と、可
変長符号化装置5と、符号バッファ6と、符号量制御装
置7と、逆量子化装置8と、逆離散コサイン変換装置9
と、加算器10と、ビデオメモリ11と、動き予測装置
12とから構成される。
【0036】画像並べ替えバッファ1には、ベースバン
ドのビデオデータが入力される。この画像並べ替えバッ
ファ1は、表示時間順に時系列に並んでいるフレーム順
序を、MPEG−2の符号化順序に応じたフレーム順序
に並び替える。
【0037】図2に、画面並べ替えバッファ1によるフ
レーム順序の並べ替え処理の一例を示す。
【0038】入力されたビデオデータの各フレームが、
図2(A)に示すように、表示時間順に時系列に並んで
いたとする。このとき、MPEG−2画像情報符号化装
置では、まず、表示順序で3番目のフレームをフレーム
内符号化によって符号化する。次に、この3番目のフレ
ームを参照フレームとして、6番目のフレームを予測符
号化によって符号化し、更に、この3番目のフレームと
6番目のフレームを参照フレームとして、4番目、5番
目のフレームを予測符号化によって符号化するといった
符号化処理がなされる。そこで、この画像並べ替えバッ
ファ1では、図2(B)に示すように、フレームの並べ
替えを行う。MPEG−2では、フレーム内符号化が行
われた画像、及び、この画像を元にしてフレーム間符号
化が行われた画像群からなるGOP(Group Of Picture
s)が定義されている。このMPEG−2画像符号化装
置では、フレーム内符号化によって符号化された画像
(以下これをIピクチャと呼ぶ。)が1枚と、1つの参
照フレーム(時間軸上で処理されるフレームより過去に
あるもの)を予測フレームとしてフレーム間符号化によ
って符号化された画像(以下、これをPピクチャと呼
ぶ。)が4枚と、2つの参照フレーム(時間軸上で、処
理されるフレームより過去にあるもの及び未来にあるも
の)を予測フレームとしてフレーム間符号化によって符
号化された画像(以下、これをBピクチャと呼ぶ)が1
0枚の合計15枚の画像から構成されるGOPを符号化
するものとする。
【0039】このような画像並べ替えバッファ1により
並べ替えられた各フレームは、加算器2に送られる。
【0040】加算器2は、Pピクチャ又はBピクチャが
送られてきた場合には、そのフレームと、後述する動き
補償予測装置12により生成されたこのフレームの予測
フレームとを減算して、離散コサイン変換装置3に送
る。また、加算器2は、Iピクチャが送られてきた場合
には、そのフレームから何らデータを減算せずに、その
フレームを離散コサイン変換装置3に送る。
【0041】離散コサイン変換装置3は、各フレームを
8画素×8画素のブロック(DCTブロック)に分割
し、各DCTブロックに対し、水平方向、垂直方向それ
ぞれに8次の離散コサイン変換を施す。離散コサイン変
換を施すことにより、2次元の画像信号が直交変換さ
れ、空間周波数係数(離散コサイン変換係数)となる。
その際、入力されたビデオデータが例えば図3に示すよ
うなY:U:V=4:2:0信号である場合、輝度信号
の16画素×16画素及び色差信号の8画素×8画素を
一つのブロック(以下、これをマクロブロックとい
う。)として処理を行う。この場合離散コサイン変換装
置3は、輝度信号に関しては、図4に示すようなフレー
ムを単位として8画素×8画素の離散コサイン変換を施
すモード(以下フレーム離散コサイン変換モードと呼
ぶ。)と、図5に示すような各マクロブロックのデータ
をフィールド毎に分離して8画素×8画素の離散コサイ
ン変換を施すモード(以下フィールド離散コサイン変換
モードと呼ぶ。)との2つのモードのうち、符号化効率
の良い方の離散コサイン変換を選択して行う。
【0042】離散コサイン変換装置3は、離散コサイン
変換を施して得られたデータ(離散コサイン変換係数)
を量子化装置4に送る。
【0043】量子化装置4は、水平方向、垂直方向の8
次の離散コサイン変換係数に対して、所定の量子化行列
を用いて量子化を行う。この量子化行列の量子化スケー
ルは、後段の符号バッファ6がオーバフロー及びアンダ
ーフロー等しないように、符号量制御装置7により予め
定められた目標符号量(ターゲットビットレート)に基
づきフィードバック制御される。量子化装置4は、量子
化した離散コサイン係数を可変長符号化装置5及び逆量
子化装置8に送る。
【0044】可変長復号化装置5は、量子化した離散コ
サイン変換係数を、平均符号長が短くなるように可変長
符号化する。その際、可変長復号化装置5は、離散コサ
イン変換係数の直流成分に関しては、1ブロック前の直
流成分係数を予測値としてその差分を符号化し、その他
の成分に関しては、予め設定された走査方式(ジグザグ
スキャン若しくはオルタネートスキャン)に基づいて1
次元の配列データに並べ替えた後、連続する0係数の数
(ラン)及び非0係数(レベル)のペアを事象とした符
号化を行う。
【0045】図6(A)にジグザグスキャンによる水平
方向及び垂直方向の8次の離散コサイン変換係数に対す
るスキャン順序を示し、図6(B)にオルタネートスキ
ャンによる水平方向及び垂直方向の8次の離散コサイン
変換係数に対するスキャン順序を示す。量子化装置4
は、DCTブロック内のスキャンを行っている際に、そ
れ以降の係数の値が全て0となった場合、EOB(End
Of Block)と呼ばれる符号を出力し、そのブロックに対
する可変長符号化を終了する。
【0046】そして、可変長符号化装置5により可変長
符号化された離散コサイン変換係数は符号バッファ6に
送られ、この符号バッファ6に一時格納されたのち、M
PEG−2に規定されたビットストリーム構造とされ
て、圧縮画像情報として出力される。
【0047】一方、量子化装置4により量子化されたデ
ータは、逆量子化装置8にも送られる。この逆量子化装
置8は、送られたデータを逆量子化して、逆離散コサイ
ン変換装置9に送る。
【0048】逆離散コサイン変換装置9は、逆量子化し
た離散コサイン変換係数に対して、逆離散コサイン変換
を施す。逆離散コサイン変換を施して得られた画素値
は、加算器10を介して、ビデオメモリ11に格納され
る。
【0049】加算器10は、逆離散コサイン変換装置8
からPピクチャが送られてきた場合には、そのフレーム
と、後述する動き補償予測装置12により生成されたこ
のフレームの参照フレームとを加算して、ビデオメモリ
11に格納する。また、加算器10は、Iピクチャが送
られてきた場合には、そのフレームに何らデータ加算せ
ずに、ビデオメモリ11に格納する。
【0050】動き補償予測装置12は、Pピクチャ及び
Bピクチャに対するマクロブロックを単位とした1/2
画素精度の動きベクトル情報を、ブロックマッチング法
などの方式により検出する。動きベクトル情報は、符号
バッファ6から出力される画像圧縮情報(ビットストリ
ーム)に格納されて外部に送出される。また、これとと
もに、動き補償予測装置12は、検出したベクトル情報
に基づきビデオメモリ11に格納された画素データに対
して動き補償を行ってPピクチャ及びBピクチャの予測
フレームを生成し、その予測フレームを加算器2に供給
する。
【0051】Iピクチャに関してはフレーム内予測符号
化を行うので動きベクトル情報は検出されないが、Pピ
クチャ及びBピクチャに関しても、動きベクトルに基づ
くフレーム間予測による符号化効率が高くない場合に
は、マクロブロック単位で、フレーム内予測を行うこと
も可能である。以下、フレーム内予測に基づいて符号化
されるマクロブロックをイントラマクロブロック、フレ
ーム間予測に基づいて符号化されるマクロブロックをイ
ンターマクロブロックと呼ぶ。Iピクチャに含まれるマ
クロブロックは全てイントラマクロブロックである。
【0052】以上のように、この図1に示したMPEG
−2画像情報符号化装置では、入力されたベースバンド
のビデオデータを符号化して、画像圧縮情報(ビットス
トリーム)を出力する。
【0053】つぎに、上述した量子化装置4における量
子化処理について更に詳しく述べる。
【0054】まず、イントラマクロブロックの直流係数
に関しては、以下の式(1)に基づいて量子化される。
【0055】
【数1】
【0056】この式(1)に示した“F′′[0]
[0]”は直流係数値の量子化代表値であり、“QF
[0][0]”は直流係数値の量子化代表値レベル番号
である。逆量子化係数(intra dc mult)は、図7に示
すように、各フレーム毎に設定可能な変数であり、直流
係数のビット精度を表すイントラDC精度(intra dc p
recision)によって設定される。
【0057】イントラマクロブロックの直流係数以外の
係数に関しては、以下の式(2)に基づいて量子化され
る。
【0058】
【数2】
【0059】この式(2)に示した“F′′[u]
[v]”は第(u,v)係数値の量子化代表値であり、
“QF[u][v]”は第(u,v)係数値の量子化代
表値レベル番号である。kは以下の式(3)によって与
えられる。
【0060】
【数3】
【0061】また、“W[w][v][u]”は量子化
行列であり、“quantiser_scale”は量
子化スケールである。
【0062】上記量子化行列は、DCTブロック内の離
散コサイン変換係数値間での相対的な量子化精度を設定
するために設けられた行列である。この量子化行列は、
視覚的に劣化が目に付きにくい高域成分の離散コサイン
変換係数を粗く量子化し、視覚的に劣化が目に付き易い
低域成分の離散コサイン変換係数を細かく量子化するこ
とができる。そのため、この量子化行列を用いることに
より画質劣化を最小限に抑えながら符号量を削減するこ
とが可能となる。
【0063】この量子化行列は、各フレーム毎に設定す
ることが可能である。設定されない場合には、イントラ
マクロブロックについては図8(A)に示すようなデフ
ォルト値に設定された量子化行列が用いられ、インター
マクロブロックについては図8(B)に示すようなデフ
ォルト値に設定された量子化行列が用いられる。
【0064】また、上記quantiser_scal
e(量子化スケール)は、MPEG2画像圧縮情報(ビ
ットストリーム)の構文中で、フレーム毎に定義される
q_scale_type(量子化スケールタイプ)
と、マクロブロック毎に定義されるq_scale_c
ode(量子化スケールコード)とによって、図9に示
すように定義される。各マクロブロックに対するq_s
cale_codeの割り当ては、符号量制御装置7に
よって行われる。
【0065】つぎに、符号量制御装置7における処理に
ついて更に詳しく述べる。
【0066】符号量制御装置7における処理について
は、MPEG2(ISO/IEC 13818−2)で
は特に定められておらず、符号化装置の開発者が、出力
符号バッファ6においてオーバーフロー及びアンダーフ
ローを起こさないという拘束条件の下に、同じ符号量で
より良好な画質が得られるように自由に設定する。ここ
では、MPEG2 Test Model 5(ISO
/IEC JTC1/SC29/WG11 N040
0)で述べられている一般的な処理について、図10に
示すフローチャートを用いて述べる。
【0067】符号量制御装置7は、図10に示すよう
に、目標符号量(ターゲットビットレート)及びGOP
構成要素を設定し、この目標符号量及びGOP構成要素
を入力変数として、まずステップS1として各ピクチャ
ヘのビット配分を行い、続いてステップS2として仮想
バッファを用いたレート制御を行い、最後に、ステップ
S3として視覚特性を考慮した適応量子化を行う。符号
量制御装置7は、これらの処理を、出力符号バッファ6
の占有量(バッファフルネス)を監視しながら行う。
【0068】まず、上記ステップS1では、割り当て対
象ピクチャを含めGOP内でまだ符号化されていないピ
クチャに対して割り当てられるビット量(以下、これを
Rとする)を配分して、GOP内の各ピクチャに対して
符号量を割り当てる。この符号量の割り当てをGOP内
のピクチャ順に繰り返し行う。その際、以下に述べる第
1と第2の2つの仮定に基づいて各ピクチャヘの符号量
の割り当てを行う。
【0069】第1に、各ピクチャを符号化する際に用い
る平均量子化スケールコードと発生符号量の積(画面の
複雑さ)は画面が変化しない限りピクチャタイプ毎に一
定値となる、と仮定する。そして、各ピクチャを符号化
した後、各ピクチャタイプ毎に、画面の複雑さを示す変
数Xi,Xp,Xb(grobal complexity measure)を
以下の式(4)に基づき更新する。
【0070】
【数4】
【0071】この式(4)に示した“Si”,“S
p”,“Sb”はピクチャ符号化時の発生符号ビット量
であり、“Qi”,“Qp”,“Qb”はピクチャ符号
化時の平均量子化スケールコードである。
【0072】画面の複雑さを示す変数Xi,Xp,Xb
の初期値は、目標符号量(ターゲットビットレート)b
it_rate[bits/sec]を用いて、以下の
式(5)、式(6)、式(7)で示される値とする。
【0073】
【数5】
【0074】
【数6】
【0075】
【数7】
【0076】第2に、Iピクチャの量子化スケールコー
ドを基準としたP,Bピクチャの量子化スケールコード
の比率Kp,Kbが以下の式(8)に定めた値となる場
合に常に全体の画質が最適化される、と仮定する。
【0077】
【数8】
【0078】以上第1及び第2の2つの仮定から、GO
Pの各ピクチャに対する割り当てビット量(Ti,T
p,Tb)は、以下の式(9)、式(10)、式(1
1)に示す値とする。
【0079】
【数9】
【0080】
【数10】
【0081】
【数11】
【0082】この式(9)〜(11)に示した“N
p”,“Nb”はGOP内でまだ符号化されていない
P,Bピクチャの枚数である。
【0083】このようにして求めた割当符号量を基にし
て、GOP内の未符号化ピクチャに対して割り当てるビ
ット量Rを、各ピクチャを符号化する毎に、以下の式
(12)により更新する。
【0084】
【数12】
【0085】また、GOPの最初のピクチャを符号化す
る際には、以下の(13)によりRを更新する。
【0086】
【数13】
【0087】この式(13)で示した“N”はGOP内
のピクチャ数である。また、シーケンスの最初のRを0
とする。
【0088】続いて、ステップS2では、実際の発生符
号量とステップ1で求められた各ピクチャに対する割当
ビット量(Ti,Tp,Tb)と一致させるため、各ピ
クチャタイプに独立に設定した3種類の仮想バッファの
容量に基づき、量子化スケールコードをマクロブロック
単位のフィードバック制御により求める。
【0089】まず、j番目のマクロブロック符号化に先
だって、仮想バッファの占有量を以下の式(14)、式
(15)、式(16)により求める。
【0090】
【数14】
【0091】
【数15】
【0092】
【数16】
【0093】式(14)〜(16)で示した“d0 i”,
“d0 p”,“d0 b”はI,P,Bの各ピクチャの仮想バ
ッファの初期占有量であり、“Bj”はピクチャの先頭
からj番目のマクロブロックまでの発生ビット量であ
り、“MB_cnt”は1ピクチャ内のマクロブロック
数である。ピクチャ符号化終了時の各仮想バッファ占有
量(dMB_cnt i,dMB_cnt p,dMB_cnt b)は、それぞれ
同一のピクチャタイプで、次のピクチャに対する仮想バ
ッファ占有量の初期値(d0 i,d0 p,d0 b)として用い
られる。
【0094】次にj番目のマクロブロックに対する量子
化スケールコードを、以下の式(17)により計算す
る。
【0095】
【数17】
【0096】この式(17)で示した“r”はリアクシ
ョンパラメーターと呼ばれるフィードバックループの応
答を制御する変数であり、以下の式(18)により与え
られる。
【0097】
【数18】
【0098】なお、符号化開始時における仮想バッファ
の初期値は以下の式(19)で与えられる。
【0099】
【数19】
【0100】最後に、ステップ3では、視覚的に劣化の
目立ちやすい平坦部でより細かく量子化し、劣化の比較
的目立ちにくい絵柄の複雑な部分で粗く量子化するよう
に、ステップ2で求められた量子化スケールコードを、
各マクロブロック毎のアクティビティと呼ばれる変数に
よって変化させる。
【0101】アクティビティactjは、原画の輝度信
号画素値を用い、フレーム離散コサイン変換モードにお
ける4個のブロックと、フィールド離散コサイン変換モ
ードにおける4個のブロックとの、合計8ブロックの画
素値を用いて、以下の式(20)、式(21)、式(2
2)で与えられる。
【0102】
【数20】
【0103】
【数21】
【0104】
【数22】
【0105】式(20)、式(21)、式(22)で示
したPkは原画の輝度信号ブロック内画素値である。式
(20)において最小値を採るのは、マクロブロック内
の一部だけでも平坦部分のある場合には量子化を細かく
するためである。
【0106】更に、以下の式(23)により、その値が
0.5〜2の範囲を取る正規化アクティビティNact
jを求める。
【0107】
【数23】
【0108】この式(23)で示したavg_actは
直前に符号化したピクチャでのactjの平均値であ
る。
【0109】視覚特性を考慮した量子化スケールコード
mquantjはステップ2で得られた量子化スケール
コードQjに基づき以下の式(24)で与えられる。
【0110】
【数24】
【0111】符号化制御装置7では、以上のようなステ
ップSS1〜ステップS3の処理を行い、出力符号バッ
ファ6においてオーバーフロー及びアンダーフローを起
こさず、同じ符号量でより良好な画質が得られるように
自由に設定する。
【0112】つぎに、出力符号バッファ6における拘束
条件について述べる。
【0113】MPEG2(ISO/IEC 13818
−2)では、VBV(Video BufferVerifier)バッファ
と呼ばれる仮想バッファが復号化装置に対して定義され
ている。符号量制御装置7では、この画像符号化装置の
出力である画像圧縮情報(ビットストリーム)が、この
拘束条件を満たすように符号の割当が行われる。VBV
バッファには、符号化装置とVBVバッファとは完全に
同期して動作するという第1の理想条件と、各ピクチャ
の復号は瞬時に行われ各ピクチャのデータはVBVバッ
ファより瞬時に抜き取られるという第2の理想条件との
2つの理想条件の下で動作することが仮定されている。
なお、VBVバッファを定義する目的は、あくまでこの
モデルによって画像圧縮情報(ビットストリーム)に対
する規定を加えることであり、現実の復号化装置の実現
方式を規定するものではない。
【0114】VBVバッファは、単位時間当たりの符号
量が一定の場合(固定レート:CBR[Constant Bit R
ate])及び単位時間当たりの符号量が一定ではない場
合(可変レート:VBR[Variable Bit Rate])の双
方に対応しており、固定レートは可変レートの特別な場
合として定められている。
【0115】また、様々な応用に対応するため、VBV
バッファに対するデータの入力は以下の第1の方法と第
2の方法の2種類の方法で規定することが可能となって
いる。第1の方法では、入力レートがピクチャ単位で変
化するよう規定される。第2の方法では、入力レートが
VBVバッファの状態に応じてピークレート若しくは0
のいずれかの値を取るように規定される。いずれの方法
も、そのピークレートRmax〔bit/sec]が、
MPEG2による画像圧縮情報の構文(シンタクス)に
おいて、シーケンスヘッダと呼ばれる部分のパラメータ
ビットレートで指定される。2種類の方法の区別は、各
フレーム毎に定義されるvbv_delayと呼ばれる
変数によってされる。
【0116】各ピクチャのvbv_delayが全て最
大値“0xFFFF”でない場合、vbv_delay
は、各ピクチャのスタートコードがVBVバッファに入
力されてから復号されるまでの時間を示す。この場合、
VBVバッファへのデータの入力レートは、ピクチャデ
ータ単位で可変レートとなる。n番目のピクチャデータ
がVBVバッファに入力されるレートR(n)[bit
/sec]は、以下の式(25)で定められる。
【0117】
【数25】
【0118】この式(25)に示したdn*は、n番目
のピクチャに対するスタートコードから、(n+1)番
目のピクチャに対するスタートコードまでの符号量であ
る。τ(n)は、n番目のピクチャに対して設定された
変数vbv_delayの値であり、t(n)はn番目
のピクチャに対する値がVBVバッファより抜き取られ
る時刻である。固定レート(CBR)データは、R
(n)がnによらず一定の値である特別な場合としてこ
の規定に含まれることになる。
【0119】図11に、VBVバッファのビット占有量
の変化を示す。VBVバッファは、初期状態において、
そのビット占有量が0となっている。VBVバッファ
は、最初のピクチャのスタートコードの入力時点から、
変数vbv_delayが示す時間の経過の後に復号が
開始される。引き続き定めれた復号時間問隔で、各ピク
チャの復号とVBVバッファの検証を継続する。
【0120】各ピクチャのvbv_delayが全て最
大値“0xFFFF”の場合、VBVバッファに対する
データの入力レートは、このVBVバッファのビット占
有量で決定される。この入力レートは、VBVバッファ
に空きがあるときにはRmaxとなり、空きのない場合
は0となる。
【0121】この場合、VBVバッファは、初期状態に
おいて、ビット占有量が0となっている。バッファに空
きがなくなった時点で復号を開始する。引き続き、定め
られた復号時間間隔で各ピクチャの復号とVBVバッフ
ァの検証を継続する。
【0122】画像圧縮情報(ビットストリーム)は、以
上の規定に従ってVBVバッファに対するデータの入力
を行う。その際に、画像圧縮情報(ビットストリーム)
は、ピクチャデータをVBVバッファから瞬時に抜き取
る直前にVBVバッファがオーバーフローしないという
条件(条件(1))、ピクチャデータをVBVバッファ
から瞬時に抜き取った直後におけるVBVバッファがア
ンダーフローをしないという条件(条件(2))、とい
う2つの条件を満たすよう検証がされて符号化される。
【0123】なお、上記条件(2)に関しては、変数l
ow−delayで指定される低遅延モードの場合とそ
うでない場合で検証内容が異なる。低遅延モードとは、
Bピクチャの使用を禁ずるモードである。この低遅延モ
ードは、符号化及び復号化の際のピクチャの並べ替えに
よって生じる遅延を防ぐとともに、符号化ピクチャでの
スキップ(駒落し)を許してVBVバッファでの遅延を
少なくする。
【0124】低遅延モードでない場合には、VBVバッ
ファからピクチャデータを瞬時に抜き取った直後にVB
Vバッファがアンダーフローを起こしてはならないよう
に検証がされる。
【0125】低遅延モードの場合には、仮にピクチャデ
ータを抜き取ると、VBVバッファがアンダーフローを
起こすことを許す。この場合には、その時刻でのピクチ
ャデータを抜き取らず、2フィールド間隔毎に全てのピ
クチャデータが到達したかどうかの検証を繰り返し、初
めて到達した時点でピクチャデータを抜き取る。
【0126】従って、低遅延モードの場合も含め、1ピ
クチャのデータ量はVBVバッファサイズより小さくな
ければならない。
【0127】(MPEG−2方式の画像圧縮情報の構
成)つぎに、図1に示すMPEG−2画像情報符号化装
置により符号化されたMPEG2画像圧縮情報(ビット
ストリーム)のデータ構成について説明する。
【0128】図12に、MPEG2画像圧縮情報(ビッ
トストリーム)のデータ構成を模式的に示す。
【0129】MPEG2画像圧縮情報(ビットストリー
ム)は、この図12に示すように階層構造となってお
り、上位層から順に、シーケンス(Sequence)層、GO
P(Group of Pictures)層、ピクチャ(Picture)層、
スライス(Slice)層、マクロブロック(Macro Block)
層、ブロック(Block)層から構成される。
【0130】シーケンス層からスライス層までの各階層
では、“0x000001”に続く8ビット(1バイ
ト)のユニークなスタートコード(合計32ビット(4
バイト))が予め定義されている。MPEG2画像圧縮
情報(ビットストリーム)では、このスタートコードに
より各層が区別され、また、このスタートコードがエラ
ー回復ポイントになっている。各階層におけるスタート
コードのコード値を図13に示す。
【0131】MPEG2画像圧縮情報(ビットストリー
ム)の各階層のブロック構成を図14に示し、以下、こ
のMPEG2画像圧縮情報データ構成についてさらに詳
細に説明する。
【0132】シーケンス層は、この図14に示すよう
に、画像圧縮情報(ビットストリーム)の一番上位に位
置する階層で、シーケンスヘッダで始まり、シーケンス
エンドコード(sequence_end_code)で終了する。この
シーケンス層には、基本的に1つ以上のGOP層が含ま
れる。このシーケンス層では、シーケンス拡張部、及
び、拡張部&ユーザデータ(1)が含まれており、この
シーケンス拡張のスタートコード(extension_start_co
de)の有無でMPEG1とMPEG2の画像圧縮情報
(ビットストリーム)の分類が行われる。
【0133】シーケンスヘッダには、図15に示すよう
に、シーケンスヘッダコード(sequence_header_cod
e)、水平方向画素数情報(horizontal_size_value)、
垂直方向ライン数情報(vertical_size_value)、画素
アスペクト比情報(aspect_ratio_information)、フレ
ームレートコード(frame_rate_code)、ビットレート
情報(bit_rate_value)、VBVバッファサイズ情報
(vbv_buffer_size_value)、イントラマクロブロック
用量子化行列(intra_quantiser_matrix[64])、インタ
ーマクロブロック用量子化行列(non_intra_quantiser_
matrix[64])等のシーケンス単位で設定される情報が含
まれる。
【0134】シーケンス拡張部には、シーケンス拡張部
のスタートコード(extension_start_code)の後に、図
16に示すように、MPEG2で用いられているプロフ
ァイル,レベル表示情報(profile_and_level_indicati
on)、シーケンス全体の順次走査画像フラグ(progress
ive_sequence)、色差フォーマット(chroma_forma
t)、低遅延モード(low_delay)、及び、MPEG1と
共有しているシーケンスヘッダでの画素数や符号量(ビ
ットレート)等の上限をMPEG2用に拡張するための
付加データが含まれている。
【0135】拡張部&ユーザデータ(1)には、図17
に示すように、拡張データ(1)(extension_data
(1))、シーケンス表示拡張部()(sequence_display_
extension())、シーケンススケーラブル拡張部()(s
equence_scalable_extension)、シーケンススケーラブ
ル拡張ID(extension_start_code_identifier)、ス
ケーラビリティモード情報(scalable_mode)、スケー
ラブル階層のレイヤID(layer_id)が含まれている。
シーケンス表示拡張部()には、原信号のRGB変換特
性や表示画像サイズ等の情報が含まれている。また、シ
ーケンススケーラブル拡張部()には、スケーラビリテ
ィモード(空間、SNR、テンポラル、データパーティ
ション)、スケーラビリティのレイヤの設定がされる。
また、拡張部&ユーザデータ(1)には、空間スケーラ
ビリティとテンポラルスケーラビリティとでそれぞれ以
下の変数が設定される。空間スケーラビリティの場合に
は、予測用下位レイヤの水平サイズ(lower_layer_pred
iction_horizontal_size)、予測用下位レイヤの垂直サ
イズ(lower_layer_prediction_vertical_size)、垂直
方向アップサンプル用除数(vertical_subsampling_fac
tor_n)が含まれ、テンポラルスケーラビリティの場合
には、第1ベースレイヤ画像前の付加レイヤ画像数(pi
cture_mux_order)、ベースレイヤ間の付加レイヤの画
像数(picture_mux_factor)、ユーザデータ()(user
_data())、ユーザデータ(user_data)が含まれる。ユ
ーザデータ()(user_data())には、シーケンスレベ
ルでのユーザデータが自由に設定できる。
【0136】続いて、GOP層は、図14に示すよう
に、シーケンス層の下の階層に位置し、GOPヘッダに
始まり、拡張部&ユーザデータ(2)と、1つ以上のピ
クチャ層から構成される。GOP層の最初のピクチャ
は、参照画面を用いずに独立して符号化(イントラ符号
化)されるIピクチャとなる。このため、このGOP
は、このIピクチャを用いることによりランダムアクセ
スを行うエントリーポイントとして用いられる。例えば
1つのGOPを10〜15枚のピクチャで構成した場
合、毎秒30フレームのビデオデータであれば0.3〜
0.5秒毎にランダムアクセスポイントが存在すること
になる。また、GOPの長さは任意であるため、シーン
の切り替わりポイントでGOPを開始又は終了して符号
化効率を高めることも可能である。なお、Iピクチャは
非常に大きな符号量となり占有バッファ量も大きくなる
ため、低遅延特性が要求される通信などのアプリケーシ
ョンでも用いることができるように、MPEG2では、
GOP層を省略することが可能となっている。この場
合、例えば、フレーム内符号化を行うスライス(以下、
イントラスライスと呼ぶ)を用い、各スライスのイント
ラ符号化データを数画面に分けて巡回させることによ
り、Iピクチャの代用となるとともに、どの画面のバッ
ファ占有量も平均的に低くすることが可能である。
【0137】GOPヘッダには、図18に示すように、
GOPヘッダのスタートコード(group_start_code)の
後に、タイムコード(time_code)、GOPの独立性を
示すフラグ(closed_gop)、GOP内Iピクチャ前のB
ピクチャの正当性を示すフラグ(broken_link)が含ま
れている。GOP内Iピクチャ前のBピクチャの正当性
を示すフラグ(broken_link)は、例えば前GOPが編
集によりカットされたこと等による、GOP内の最初の
Iピクチャより前にあるBピクチャが正確に復号できな
いことを示している。また、GOPの独立性を示すフラ
グ(closed_gop)は、当該GOPが他のGOP内の画像
に依存しないを示している。これらのコードはランダム
アクセス時の不当なBピクチャ表示の回避や、編集でG
OPをカットした際のフラグとして用いられる。
【0138】拡張部&ユーザデータ(2)には、図19
に示すように、拡張データ(2)(extension_data
(2))、ユーザデータ()(user_data())、ユーザデー
タ(user_data)が含まれ、GOPレベルでのユーザデ
ータの設定がされる。
【0139】続いて、ピクチャ層は、図14に示すよう
に、GOP層の下の階層に位置し、各画面に相当する層
である。ピクチャ層は、ピクチャヘッダ、ピクチャ符号
化拡張部、拡張部&ユーザデータ(3)、ピクチャデー
タが含まれる。このピクチャ層は図12で示したよう
に、1個以上のスライス層に分割されている。
【0140】ピクチャヘッダには、図20に示すよう
に、ピクチャスタートコード(picture_start_code)、
テンポラルリファレンス(temporal_reference)、ピク
チャ符号化タイプ情報(picture_coding_type)、符号
開始までのVBV遅延量情報(vbv_delay)が含まれて
いる。テンポラルリファレンス(temporal_reference)
は、GOP内における当該ピクチャの表示順序を示す画
像番号で、GOP毎に初期値が0にリセットされる。ピ
クチャの符号化タイプ情報(picture_coding_type)に
は、ピクチャ毎のI,P,Bの区別が設定される。ま
た、符号開始までのVBV遅延量情報(vbv_delay)
は、先に述べたVBVバッファによる復号開始時刻まで
の遅延量が設定される。
【0141】ピクチャ符号化拡張部には、図21に示す
ように、動きベクトル範囲情報(f_code[s][t])、イン
トラマクロブロックのDC係数精度情報(intra_dc_pre
cision)、ピクチャ構造情報(picture_structure)、
表示フィールドの指定情報(top_field_first)、フレ
ーム予測及びフレームDCTフラグ(frame_pred_frame
_dct)、イントラマクロブロック用コンシールメント動
きベクトルフラグ(concealment_motion_vector)、量
子化スケールタイプ情報(q_scale_type)、イントラマ
クロブロック用可変長符号タイプ情報(intra_vlc_form
at)、スキャンタイプ情報(alternate_scan)、2:3
プルダウン用フィールドリピート情報(repeat_first_f
ield)、420タイプ情報(chroma_420_type)、順次
走査フラグ(progressive_frame)が含まれている。動
きベクトル範囲情報(f_code[s][t])には、前・後方向
及び水平・垂直方向の動きベクトル範囲が設定される。
ピクチャ構造情報(picture_structure)には、フィー
ルド毎に符号化・復号化処理を行うか(以下、フィール
ド構造と呼ぶ)、フレーム毎に符号化・復号化処理を行
うか(以下、フレーム構造と呼ぶ)が設定される。ま
た、イントラマクロブロック用可変長符号タイプ情報
(intra_vlc_format)には、線形・非線型量子化スケー
ルの設定がされ、スキャンタイプ情報(alternate_sca
n)には、そのピクチャの可変長符号化処理のタイプの
選択(オルタネートスキャンか、ジグザグスキャンかの
選択)の設定がされる。
【0142】拡張部&ユーザデータ(3)には、図22
に示すように、拡張データ(3)(extension_data
(3))、量子化行列拡張部()(quant_matrix_extensio
n())、イントラマクロブロック量子化行列(intra_qua
ntiser_matrix[64])、インターマクロブロック量子化
行列(non_intra_quantiser_matrix[64])、色差イント
ラマクロブロック量子化行列(chroma_intra_quantiser
_matrix[64])、色差インターマクロブロック量子化行
列(chroma_non_intra_quantiser_matrix[64])、著作
権拡張部()(copyright_extension())、ピクチャ表
示拡張部()(picture_display_extension())、ピク
チャ空間スケーラブル拡張部()(picture_spatial_sc
alable_extention())、アップサンプル用空間重み付け
テーブル(spatial_temporal_weight_code_table_inde
x)、下位レイヤ順次走査画像フラグ(lower_layer_pro
gressive_frame)、下位レイヤのフィールド選択情報
(lower_layer_deinterlaced_field_select)、ピクチ
ャテンポラルスケーラブル拡張部()(picture_tempor
al_scalable_extention())、参照画面の選択コード(r
eference_select_code)、前方向予測用の下位レイヤの
画像番号(forward_temporal_reference)、後方向予測
用の下位レイヤの画像番号(backward_tempral_referen
ce)、ユーザデータ()(user_data())、ユーザデー
タ(user_data)が含まれる。
【0143】量子化行列拡張部()(quant_matrix_ext
ension())には、量子化マトリクスの設定がされる。こ
のため、ピクチャ毎にイントラ、インター、輝度、色差
ブロックの量子化行列を変更することも可能であり、各
画面の特性に応じた量子化を行うことが可能となる。著
作権拡張部()(copyright_extension())には、著作
権番号の設定がされる。ピクチャ表示拡張部()(pict
ure_display_extension())には、表示領域の設定がさ
れる。これにより、例えば16:9の高解像度画像(H
DTV)を復号し、最も興味にある部分に対して4:3
の標準解像度テレビサイズでその領域を指定して、標準
解像度テレビで高解像度画像の一部表示を行うといった
パン−スキャン機能を実現することができる。ピクチャ
空間スケーラブル拡張部()(picture_spatial_scalab
le_extention())やピクチャテンポラルスケーラブル拡
張部()(picture_temporal_scalable_extention())
は、空間スケーラビリティやテンポラルスケーラビリテ
ィで、上位レイヤの予測に用いる下位レイヤの画像番号
などの情報が設定される。
【0144】続いて、スライス層は、図14に示すよう
に、ピクチャ層の下の階層に位置する層である。スライ
ス層は、図23のように、画面内で分割された横長の帯
状の領域(図23のA,B,C・・・Q領域)から構成
され、図24に示すようなスライスデータとして定義さ
れる。画面を複数のスライス層で構成することにより、
あるスライス層でエラーが発生しても、次のスライス層
の開始コード(slice_start_code)からの同期でエラー
回復が可能となる。スライス層は、1個以上のマクロブ
ロックから構成され、ラスタスキャンオーダで、左から
右、上から下へと並ぶ。その長さや開始位置は自由で、
画面毎に変更可能である。但し、並列処理や効果的なエ
ラー耐性を目的として、一つのスライスは右方向にのみ
に伸び、下方にまで伸びることはない。
【0145】スライスデータには、図25に示すよう
に、スライス層のスタートコード(slice_start_cod
e)、スライス垂直位置拡張情報(slice_vertical_posi
tion_extension)、データパーティショニング用区分点
情報(priority_breakpoint)、量子化スケールコード
(quantiser_scale_code)、イントラスライスフラグ
(intra_slice)、マクロブロックデータ(macrobloc
k())とが含まれる。スライス層のスタートコード(sli
ce_start_code)、スライス垂直位置拡張情報(slice_v
ertical_position_extension)には、スライスの開始の
垂直位置が設定される。量子化スケールコード(quanti
ser_scale_code)には、図9に示した量子化スケールコ
ードが設定される。イントラスライスフラグ(intra_sl
ice)には、スライス内のマクロブロックが全てイント
ラマクロブロックであるかどうかが設定される。
【0146】続いて、マクロブロック層は、図14に示
すように、スライス層の下の階層に位置する層である。
マクロブロック層には、マクロブロック情報、ブロック
データが含まれている。
【0147】マクロブロックデータには、図26に示す
ように、マクロブロックのアドレス拡張データ(macrob
lock_escape)、現マクロブロックと前マクロブロック
アドレスの差分量(macroblock_address_increment)、
マクロブロックモード()(macroblock_modes())、マ
クロブロック符号化タイプ情報(macroblock_type)、
アップサンプル用時空間重み付けコード(spatial_temp
oral_weight_code)、フレーム構造の動き補償タイプ情
報(frame_motion_type)、フィールド構造の動き補償
タイプ情報(field_motion_type)、DCTタイプ情報
(dct_type)、マクロブロック量子化スケールコード
(quantiser_scale_code)、動きベクトル(s)(moti
on_vectors[s])、予測に用いる参照フィールドの選択
情報(motion_vertical_field_select[r][s])、動きベ
クトル(r,s)(motion_vectors[s][r])、基本差分
動きベクトル(motion_code[r][s][t] )、残差ベクト
ル(motion_residual[r][s][t])デュアルプライム用差
分ベクトル(dmvector[t])、CBP(coded_block_pat
tern)、ブロックデータ(block(i))が含まれている。
【0148】現マクロブロックと前マクロブロックアド
レスの差分量(macroblock_address_increment)には、
現在のマクロブロックの位置(macroblock_address)
が、直前のマクロブロックの位置(previous_macrobloc
k_address)との差分として設定される。この現マクロ
ブロックと前マクロブロックアドレスの差分量(macrob
lock_address_increment)が1より大きい場合には、現
在のマクロブロックと直前の符号化マクロブロックとの
間のマクロブロックはスキップマクロブロックとなり、
画像圧縮情報(ビットストリーム)中に動きベクトルや
離散コサイン変換係数などの符号化情報が存在しない。
スキップマクロブロックとなる条件は、Pピクチャでは
動きベクトル値が水平、垂直成分ともに0且つ離散コサ
イン変換係数が全て0であることであり、Bピクチャで
は一つ前のマクロブロックと動き補償予測モード(前方
向、後方向、双方向)及び動きベクトルが同じで且つ離
散コサイン変換係数が全て0であることである。MPE
G2では、スキップマクロブロックの導入により、不要
なマクロブロックの情報の削減を図っている。なお、I
ピクチャではスキップマクロブロックは存在せず、ま
た、P,Bピクチャにおいても、スライスの最初と最後
のマクロブロックはスキップマクロブロックとはならず
に必ず符号化される。
【0149】マクロブロック符号化タイプ情報(macrob
lock_type)には、動き補償予測モード、及び、離散コ
サイン変換係数符号化モードが決定される。ピクチャタ
イプによって可能なモードは異なるが、基本的には、動
きベクトルが0かどうかを示すMC/No_MC選択モ
ード(Pピクチャの場合)、動き補償予測の方向(Bピ
クチャの場合で、前方向、後方向若しくは双方向)、C
oded/Not_Coded(離散コサイン変換係数
の有無を示す)、フレーム内符号化及び量子化スケール
コードの更新が設定される。
【0150】フレーム構造の動き補償タイプ情報(fram
e_motion_type)及びフィールド構造の動き補償タイプ
情報(field_motion_type)には、フィールド単位の動
き補償を行うか、フレーム単位の動き補償を行うかが設
定される。以下、前者をフィールド動き補償モード、後
者をフレーム動き補償モードと呼ぶ。
【0151】動きベクトル(s)(motion_vectors
[s])では、動きベクトルが設定される。アップサンプ
ル用時空間重み付けコード(spatial_temporal_weight_
code)では、下位レイヤをアップサンプルして上位レイ
ヤを予測するための時空間重み付け係数が設定される。
マクロブロック量子化スケールコード(quantiser_scal
e_code)では、マクロブロック毎の量子化スケールのサ
イズが設定されている。なお、量子化スケールの制御に
関しては、先述のように、符号量制御装置7によって行
われる。
【0152】続いて、ブロック層は、図14に示すよう
に、マクロブロック層の下の階層に位置する層である。
ブロック層には、量子化された離散コサイン変換係数か
ら構成されたブロックデータ(block(i))が定義され
る。ブロックデータ(block(i))は、輝度信号若しくは
色差信号の8ライン×8画素から構成され、離散コサイ
ン変換及び逆離散コサイン変換はこの単位で行われる。
【0153】ブロックデータには、図27に示すよう
に、DCT輝度直流係数差分サイズ(dct_dc_size_lumi
nance)、DCT輝度直流係数差分値(dct_dc_differen
cial)、DCT色差直流係数差分サイズ(dct_dc_size_
chrominance)、DCT色差直流係数差分値(dct_dc_di
fferencial)、非イントラブロックの第一非零係数(Fi
rst_DCT_coefficients)、後続のDCT係数(Subsquen
ce_DCT_coefficients)、ブロック内のDCT係数終了
フラグ(End_of_Block)が含まれている。
【0154】DCT輝度直流係数差分サイズ(dct_dc_s
ize_luminance)には、輝度成分のイントラマクロブロ
ック内の直流成分係数と、隣のブロックとの差分の大き
さが与えられる。DCT輝度直流係数差分値(dct_dc_d
ifferencial)には、輝度成分のイントラマクロブロッ
クの直流成分の係数の差分情報が与えられる。DCT色
差直流係数差分サイズ(dct_dc_size_chrominance)、
色差成分のイントラマクロブロック内の直流成分係数
と、隣のブロックとの差分の大きさが与えられる。DC
T色差直流係数差分値(dct_dc_differencial)では、
色差成分のイントラマクロブロックの直流成分の係数の
差分情報が与えられる。非イントラブロックの第一非零
係数(First_DCT_coefficients)では、インターマクロ
ブロックの非0量子化離散コサイン変換係数までの0係
数の長さ(以下、ラン長と呼ぶ。)が与えられる。後続
のDCT係数(Subsquence_DCT_coefficients)では、
インターマクロブロックの非0係数の大きさが与えられ
る。ブロック内のDCT係数終了フラグ(End_of_Bloc
k)では、各ブロックでの離散コサイン変換係数が終了
情報が与えられる。
【0155】以上のように構成されるMPEG2画像圧
縮情報(ビットストリーム)は、MPEG−2画像情報
符号化装置により符号化され復号装置等に送出される。
【0156】(本発明の第1の実施の形態の画像情報変
換装置)つぎに、本発明を適用した第1の実施の形態の
画像情報変換装置について説明する。
【0157】図28に本発明の第1の実施の形態の画像
情報変換装置のブロック図を示す。この画像情報変換装
置は、MPEG−2方式で符号化された画像圧縮情報
(ビットストリーム)の符号量(ビットレート)を削減
して、低ビットレートの画像圧縮情報を出力する装置で
ある。
【0158】図28に示す画像情報変換装置20は、符
号バッファ23と、圧縮情報解析装置24と、可変長復
号化装置25と、逆量子化装置26と、帯域制限装置2
7と、量子化装置28と、可変長符号化装置29と、符
号バッファ30と、符号量制御装置31とから構成され
る。
【0159】符号バッファ23には、多くの符号量(高
いビットレート)の画像圧縮情報(ビットストリーム)
が入力される。画像圧縮情報(ビットストリーム)は、
上述したようにVBVバッファの拘束条件を満たすよう
符号化されているので、符号バッファ23でオーバーフ
ロー、アンダーフローを起こすことはない。符号バッフ
ァ23に格納された画像圧縮情報(ビットストリーム)
は、圧縮情報解析装置24に送られる。
【0160】圧縮情報解析装置24は、図15〜図27
に示したような、MPEG−2の構文(シンタクス)に
従って画像圧縮情報(ビットストリーム)中から情報を
抽出して、抽出した情報を可変長復号化装置25及び以
後の各装置に送る。
【0161】可変長復号化装置25は、まず、イントラ
マクロブロックの直流成分に対しては隣のブロックとの
差分値として符号化されているデータを可変長復号し、
その他の係数に対してはランとレベルにより符号化され
たデータを可変長復号し、量子化された一次元の離散コ
サイン変換係数を検出する。次に、可変長復号化装置2
5は、圧縮情報解析装置24により抽出された走査方式
(ジグザグスキャン若しくはオルタネートスキャン)に
関する情報に基づき、一次元配列された離散コサイン変
換係数を逆スキャンして、量子化された二次元の離散コ
サイン変換係数に再配列する。二次元配列された量子化
された離散コサイン変換係数は、逆量子化装置26に送
られる。
【0162】逆量子化装置26は、圧縮情報解析装置2
4により抽出された量子化幅及び量子化行列に関する情
報に基づき、量子化されている離散コサイン変換係数を
逆量子化する。逆量子化された離散コサイン変換係数
は、帯域制限装置27に送られる。
【0163】帯域制限装置は、逆量子化装置26から送
られた離散コサイン変換係数に対して、DCTブロック
毎に、水平方向高周波成分係数の帯域制限をする。
【0164】図29に、帯域制限装置27における水平
方向高周波成分の帯域制限処理の一例を示す。例えば、
帯域制限装置27は、輝度信号に関しては、図29
(A)に示すように8×8の離散コサイン変換係数のう
ち、水平方向低域成分である6×8係数のみの値を保存
し、残りを0と置きかえる。また、帯域制限装置27
は、色差信号に関しては、図29(B)に示すように、
8×8の離散コサイン変換係数のうち、水平方向低域成
分である4×8係数のみの値を保存し、残りを0と置き
かえる。
【0165】このように離散コサイン変換係数の高周波
成分を帯域制限することで、周波数領域において符号量
(ビットレート)の削減をすることができる。
【0166】また、入力となる画像圧縮情報(ビットス
トリーム)が、飛び越し走査画像のものである場合に
は、フィールド間の時間差に関する情報を、離散コサイ
ン変換係数の垂直方向高域成分が含むことになる。その
ため、垂直方向の離散コサイン変換係数の帯域制限を行
うことは大幅な画質劣化に繋がる。従って、この帯域制
限装置27では、垂直方向の帯域制限は行わない。
【0167】また、この帯域制限装置27では、劣化が
より人間の目に付きやすい輝度信号に比べ、より人間の
目に付きにくい色差信号に対して、より大きく帯域制限
を行っている。このことにより、この帯域制限装置27
では、画質劣化を最小限に抑えながら、再量子化の歪み
を低減することができる。なお、削減する符号量(ビッ
トレート)が少ない場合や回路的な制限がある場合等
は、輝度信号と色差信号との帯域制限を同一にしてもよ
い。
【0168】また、帯域制限装置27における水平方向
の離散コサイン変換係数の帯域制限処理は、この図29
に示したような係数を0と置く処理に限らない。例え
ば、0と置き換える代わりに、予め用意した重み係数を
離散コサイン変換の水平方向高域成分に乗じることで同
様に符号量(ビットレート)を削減することが可能であ
る。
【0169】帯域制限装置27により帯域制限がされた
離散コサイン変換係数は、量子化装置28に送られる。
【0170】量子化装置28は、帯域制限装置27から
送られた8×8離散コサイン変換係数を量子化する。そ
の際用いられる量子化幅は、以下に説明するように符号
量制御装置31により制御される。また、量子化の際に
用いる量子化行列は、入力された高い符号量(高ビット
レート)の画像圧縮情報(ビットストリーム)で用いら
れている量子化行列をそのまま用いても良いが、再量子
化に適した行列を新たに設定して用いてもよい。
【0171】以下符号化制御装置31における量子化幅
の制御方法について説明する。
【0172】図10において説明したように、MPEG
−2画像情報符号化装置において適用されるMPEG−
2 Test Model 5(ISO/IEC JT
C1/SC29/WG11 N0400)で用いられて
いる手法では、まず、GOPを構成するピクチャ(Iピ
クチャ,Pピクチャ,Bピクチャ)に関する情報に基づ
きピクチャ毎の目標符号量(ターゲットビットレート)
が算出され、符号化処理が行われる。しかしながら、本
実施の形態の画像情報変換装置20では、画像圧縮情報
(ビットストリーム)が入力されるので、ヘッダ情報か
らGOP情報を読み取ることができなず、MPEG−2
Test Model 5で用いられている手法をそ
のまま適用することができない。
【0173】そのため、画像情報変換装置20では、図
30に示すように、まず、圧縮情報解析装置24におい
て、1ピクチャに割り当てられた符号量を予め解析する
(ステップS11)。そして、解析した1ピクチャに割
り当てられた符号量の情報を、符号量制御装置31に与
える。符号量制御装置31は、与えられたこの符号量を
1とし、入力ビットストリームのビットレートをR1
し、出力ビットストリームのビットレートをR2とし
て、当該ピクチャの目標符号量(ターゲットビットレー
ト)Tを、以下の式(26)によって算出して、目標符
号量を設定する(ステップS12)。
【0174】
【数26】
【0175】なお、R1、R2は、図15に示したシーケ
ンスヘッダ内の情報を解析することにより抽出すること
ができる。
【0176】そして、符号量制御装置31は、以下、図
10に示したステップS1、ステップS2、ステップS
3と同一の処理を行う。
【0177】このように画像情報変換装置20では、1
ピクチャに割り当てられた符号量を予め解析し、この解
析した符号量に入出力される画像圧縮情報のビットレー
トの比率を乗じることで、GOPに関する情報が無くて
も、MPEG−2 TestModel 5で定められ
た方式での符号量の制御を行うことができる。
【0178】また、符号量制御装置31は、符号バッフ
ァ30において、先述のVBVバッファの拘束条件が満
たされるよう、各マクロブロックに対して量子化幅の割
当も行う。
【0179】以上のように再量子化された離散コサイン
変換係数は、量子化装置29から可変長符号化装置29
に送られる。
【0180】可変長復号化装置29は、量子化した離散
コサイン変換係数を、平均符号長が短くなるように符号
化する。その際、可変長復号化装置5は、離散コサイン
変換係数の直流成分に関しては、1ブロック前の直流成
分係数を予測値としてその差分を符号化し、その他の成
分に関しては、予め設定された走査方式(ジグザグスキ
ャン若しくはオルタネートスキャン)に基づいて1次元
の配列データに並べ替えた後、連続する0係数の数(ラ
ン)及び非0係数(レベル)のペアを事象とした可変長
符号化を行う。そして、量子化装置4は、DCTブロッ
ク内のスキャンを行っている際に、それ以降の係数の値
が全て0となった場合、EOB(End OfBlock)と呼ば
れる符号を出力し、そのブロックに対する可変長符号化
を終了する。
【0181】なお、可変長符号化装置29は、入力され
た高い符号量(高ビットレート)の画像圧縮情報のスキ
ャン方式に関わらず、オルタネートスキャン方式により
離散コサイン変換係数を1次元データに配列してもよ
い。オルタネートスキャン方式により離散コサイン変換
係数を1次元データに配列するのは、以下の理由によ
る。
【0182】すなわち、入力となる画像圧縮情報(ビッ
トストリーム)のあるブロックの離散コサイン変換係数
が、例えば、図31(A)に示すようになっていたとす
る。図31において、●で示す係数は非0係数であり、
○で示すは0係数である。このような離散コサイン変換
係数に対して離散コサイン変換係数の水平高周波成分を
0としたとすると、非0係数の分布は例えば図31
(B)に示すようになる。この図31(B)に示す水平
高周波成分を0とした離散コサイン変換係数を、ジグザ
グスキャンで再符号化すると、最後の非0係数のスキャ
ン番号は50となる(図6(A)参照)。それに対し、
走査変換を行ってオルタネートスキャンで改めて符号化
すると、最後の非0係数のスキャン番号は44になる
(図6(B)参照)。このことから、水平高周波成分を
0とした離散コサイン変換係数に対して可変長符号化す
る場合には、オルタネートスキャン方式によりスキャン
をすれば、ジグザグスキャンの場合より早いスキャン番
号でEOB信号を設定することが可能となる。そのた
め、量子化幅としてより細かな値を割り当てることがで
き、再量子化に伴う量子化歪みを低減することができ
る。
【0183】そして、可変長符号化装置5により可変長
符号化された離散コサイン変換係数は符号バッファ6に
送られ、この符号バッファ6に一時格納されたのち、M
PEG−2に規定されたビットストリーム構造とされ
て、圧縮画像情報として出力される。
【0184】以上のように、本発明の第1の実施の形態
の画像情報変換装置20では、周波数領域で各ブロック
のデータの受け渡しを行って符号量(ビットレート)を
削減することができるので、ベースバンドのビデオデー
タまで復号した後符号化する従来の画像情報変換装置に
比べて、演算量が少なくなり、また、回路構成を大幅に
削減することができる。
【0185】なお、上記画像情報変換装置20では、逆
量子化装置26と量子化装置28との間に帯域制限装置
27を設けているが、符号量(ビットレート)の削減量
によってはこの帯域制限装置27を設けなくても良い。
【0186】(本発明の第2の実施の形態の画像情報変
換装置)つぎに、本発明を適用した第2の実施の形態の
画像情報変換装置について説明する。
【0187】図32に本発明の第2の実施の形態の画像
情報変換装置のブロック図を示す。なお、この第2の実
施の形態の画像情報変換装置を説明するのにあたり、上
記第1の実施の形態の画像情報変換装置20と同一の構
成要素には図面中に同一の符号を付け、その詳細な説明
を省略する。
【0188】図32に示す画像情報変換装置40は、符
号バッファ23と、圧縮情報解析装置24と、可変長復
号化装置25と、逆量子化装置26と、加算器41と、
帯域制限装置27と、量子化装置28と、可変長符号化
装置29と、符号バッファ30と、符号量制御装置31
と、動き補償誤差補正装置42とから構成される。
【0189】加算器41は、逆量子化装置26と帯域制
限装置27との間に設けられる。加算器41は、逆量子
化装置26が逆量子化して得られた離散コサイン変換係
数から、動き補償誤差補正装置42により生成された動
き補償誤差補正係数を減算する。
【0190】動き補償誤差補正装置42は、逆量子化装
置26により逆量子化した離散コサイン変換係数を、量
子化装置28により再量子化する際に生じる動き補償誤
差を補正する動き補償誤差補正係数を生成する。
【0191】まず、動き補償誤差が生じる原因について
述べる。
【0192】原画像の画素値をOとし、入力された高い
符号量(高ビットレート)の画像圧縮情報(ビットスト
リーム)のこの原画像の画素値Oに対する量子化幅をQ
1とし、再符号化後の低い符号量(低ビットレート)の
画像圧縮情報(ビットストリーム)のこの原画像の画素
値Oに対する量子化幅をQ2とする。また、量子化幅
1、量子化幅Q2で復号された参照画像の画素値を、そ
れぞれL(Q1),L(Q2)とする。
【0193】インターマクロブロックの画素は、符号化
時において、例えば図1に示したMPEG−2画像情報
符号化装置の加算器2により差分値“O−L(Q1)”
が計算され、この差分値“O−L(Q1)”に離散コサ
イン変換が施される。このように符号化されたインター
マクロブロックの画素は、復号時においては、差分値
“O−L(Q1)”に逆離散コサイン変換が施され、こ
の差分値“O−L(Q1)”から動き補償により生成さ
れた参照画像“L(Q1)”が減算され、原画像の画素
値Oが復号される。
【0194】一方、インターマクロブロックの画素は、
図28に示した画像情報変換装置20による符号量(ビ
ットレート)を削減時において、逆量子化装置26及び
量子化装置28により差分値“O−L(Q1)”の量子
化幅がQ1からQ2に変換される。このように符号量を
削減したインターマクロブロックの画素は、復号時にお
いては、差分値“O−L(Q2)”が量子化幅Q2で符号
化されたものと見なされて復号される。
【0195】ここで、画像情報変換装置20において量
子化幅を変えて符号量を削減していることからQ1=Q2
は成立せず、インターマクロブロックの復号時に量子化
誤差が生じる。従って、インターマクロブロックにより
符号化がされているPピクチャ、Bピクチャに、動き補
償に伴う誤差が発生する。
【0196】Pピクチャで生じた誤差は、以後このPピ
クチャを参照画像とするPピクチャやBピクチャに伝播
し、さらなる画質劣化に繋がる。
【0197】この第2の実施の形態の画像情報圧縮装置
40の動き補償誤差補正装置42では、動き補償誤差補
正係数を生成し、逆量子化装置26により逆量子化した
離散コサイン変換係数から減算し、以上の動き補償誤差
を補正している。
【0198】続いてこの動き補償誤差補正装置42につ
いて説明する。
【0199】動き補償誤差補正装置42は、逆量子化装
置43と、加算器44と、逆離散コサイン変換装置45
と、ビデオメモリ46と、動き補償予測装置47と、離
散コサイン変換装置48とから構成されている。
【0200】逆量子化装置43は、量子化装置28によ
り再量子化された離散コサイン変換係数を、上記量子化
装置28で用いられた量子化行列に基づき逆量子化す
る。逆量子化装置43により逆量子化された離散コサイ
ン変換係数は、加算器44に送られる。
【0201】加算器44は、逆量子化装置43により逆
量子化された離散コサイン変換係数から、加算器41に
より動き補償誤差補正係数が減算された離散コサイン変
換係数を減算して、周波数領域の量子化誤差係数を生成
し、逆離散コサイン変換装置45に送る。
【0202】逆離散コサイン変換装置45は、加算器4
4から送られた周波数領域の量子化誤差係数に対して、
逆離散コサイン変換を施す。逆離散コサイン変換を施し
て得らた結果は、空間領域の量子化誤差値として、ビデ
オメモリ46に格納される。
【0203】動き補償予測装置47は、入力された高い
符号量(高ビットレート)の画像圧縮情報(ビットスト
リーム)内における動き補償予測モード情報(フィール
ド動き補償予測モード或いはフレーム動き補償予測モー
ド、及び、前方向予測モード、後方向予測モード、或い
は、双方向予測モード)及び、動きベクトル情報に基づ
き、ビデオメモリ46内の空間領域の量子化誤差値に対
して動き補償を行う。動き補償がされたデータが、空間
領域での動き補償誤差補正値となる。この動き補償誤差
補正値は、離散コサイン変換装置48に送られる。
【0204】離散コサイン変換装置48は、送られた空
間領域での動き補償誤差補正値に対して離散コサイン変
換を施し、周波数領域での動き補償誤差補正係数を生成
する。この動き補償誤差補正係数は、加算器41に送ら
れる。
【0205】そして、この加算器41において、逆量子
化装置26により逆量子化された離散コサイン変換係数
から、この動き補償誤差補正係数を減算することによっ
て、動き補償に起因する誤差の補正がされる。
【0206】以上のように、本発明の第2の実施の形態
の画像情報変換装置40では、周波数領域で各ブロック
のデータの受け渡しを行って符号量(ビットレート)を
削減することができるので、ベースバンドのビデオデー
タまで復号した後符号化する従来の画像情報変換装置に
比べて、演算量が少なくなり、また、回路構成を大幅に
削減することができる。これとともに、画像情報変換装
置40では、動き補償誤差の蓄積に起因する画質劣化を
生じさせずに、符号量を削減することができる。
【0207】なお、上記動き補償誤差補正装置42の逆
離散コサイン変換装置45及び離散コサイン変換装置4
8では、高速アルゴリズムを適用することが可能であ
る。
【0208】図33に、文献”A fast comp
utational algorithm for t
he discrete cosine transf
orm”(IEEE Trans.Commun.,v
ol.25,no.9 pp.1004−1009,1
977)に示されている高速アルゴリズムを適用した場
合のフロー図を示す。
【0209】この方式は、図33中の矢印の方向(変数
[x(0)・・・x(7)]から変数[X(0)・・・
X(7)]へ向かう方向)に処理することで離散コサイ
ン変換を実行することが可能である。また、図33中の
矢印と反対の方向(変数[X(0)・・・X(7)]か
ら変数[x(0)・・・x(7)]へ向かう方向)に処
理することで逆離散コサイン変換を実行することが可能
である。なお、この図33で示す“Cl i”は、COS
(iπ/l)を意味する。
【0210】また、逆離散コサイン変換装置45及び離
散コサイン変換装置48では、帯域制限装置37におい
て水平高域成分の係数が0と置き換えられている場合、
0と置き換えられている係数に対する逆離散コサイン変
換及び離散コサイン変換を省くことで、回路規模及び演
算処理量を削減することが可能である。
【0211】更に、画像における色差信号の劣化は、輝
度信号の劣化に比べ、人間の目には分かり難いという特
色を有しているため、上記の動き補償誤差補正を、輝度
信号のみに適用することで、画質劣化を最小に保ちなが
ら回路規模及び演算処理量を大幅に削減することもでき
る。また、Pピクチャにおける誤差はBピクチャに伝播
するが、Bピクチャにおける誤差はそれ以上伝播しな
い。一方、Bピクチャには双方向予測モードを含み、多
大なる演算処理量を要する。そこで、Pピクチャにのみ
動き補償誤差補正を行うことで、画質劣化を最小に保ち
ながら回路規模及び演算処理量を大幅に削減することも
考えられる。Bピクチャにおける処理を行わないこと
で、ビデオメモリ46の容量を削減することも可能とな
る。
【0212】また、以上、入力として、MPEG2によ
る画像圧縮情報(ビットストリーム)を対象としてきた
が、直交変換と動き補償によって符号化された画像圧縮
情報(ビットストリーム)では、本装置と同様の構成で
符号量(ビットレート)の削減を行うことが可能であ
る。
【0213】(本発明の第3の実施の形態の画像情報変
換装置)つぎに、本発明を適用した第3の実施の形態の
画像情報変換装置について説明する。
【0214】図32に本発明の第3の実施の形態の画像
情報変換装置のブロック図を示す。なお、この第3の実
施の形態の画像情報変換装置を説明するのにあたり、上
記第1の実施の形態の画像情報変換装置20及び上記第
2の実施の形態の画像情報変換装置40と同一の構成要
素には図面中に同一の符号を付け、その詳細な説明を省
略する。
【0215】図34に示す画像情報変換装置50は、符
号バッファ23と、圧縮情報解析装置24と、可変長復
号化装置25と、逆量子化装置26と、加算器41と、
帯域制限装置27と、量子化装置28と、可変長符号化
装置29と、符号バッファ30と、符号量制御装置31
と、動き補償誤差補正装置51とから構成される。
【0216】加算器41は、逆量子化装置26と帯域制
限装置27との間に設けられる。加算器41は、逆量子
化装置26が逆量子化して得られた離散コサイン変換係
数から、動き補償誤差補正装置51により生成された動
き補償誤差補正係数を減算する。
【0217】動き補償誤差補正装置51は、逆量子化装
置26により逆量子化した離散コサイン変換係数を、量
子化装置28により再量子化する際に生じる動き補償誤
差を補正する動き補償誤差補正係数を生成する。そし
て、この動き補償誤差補正装置51は、この動き補償誤
差補正係数を、逆量子化装置26により逆量子化した離
散コサイン変換係数から減算し、動き補償誤差を補正し
ている。
【0218】続いてこの動き補償誤差補正装置51につ
いて説明する。
【0219】動き補償誤差補正装置51は、逆量子化装
置43と、加算器44と、4×8逆離散コサイン変換装
置52と、ビデオメモリ53と、補間装置54と、動き
補償予測装置55と、4×8離散コサイン変換装置56
とから構成されている。
【0220】逆量子化装置43は、量子化装置28によ
り再量子化された離散コサイン変換係数を、上記量子化
装置28で用いられた量子化行列に基づき逆量子化す
る。逆量子化装置43により逆量子化された離散コサイ
ン変換係数は、加算器44に送られる。
【0221】加算器44は、逆量子化装置43により逆
量子化された離散コサイン変換係数から、加算器41に
より動き補償誤差補正係数が減算された離散コサイン変
換係数を減算し、周波数領域の量子化誤差係数を生成し
て、4×8逆離散コサイン変換装置52に送る。
【0222】4×8逆離散コサイン変換装置52は、加
算器44から送られた量子化誤差係数に対して、4×8
の逆離散コサイン変換を施し、空間領域の4×8量子化
誤差値を算出する。4×8逆離散コサイン変換装置52
は、逆離散コサイン変換を施して得らた結果である空間
領域の4×8量子化誤差値を、ビデオメモリ53に格納
する。
【0223】ビデオメモリ53は、空間領域の4×8量
子化誤差値を格納する。この4×8量子化誤差値は、水
平方向のデータが1/2間引かれているので、入力とな
る画像圧縮情報の解像度に対して1/2の解像度のデー
タが格納できる容量を有していればよい。
【0224】補間装置54は、ビデオメモリ53に格納
されている4×8量子化誤差値の水平方向のデータの補
間処理を行う。この補間装置54により水平方向の4×
8量子化誤差値の補間を行っておくことにより、後段の
動き補償予測装置55で水平方向の情報に対して1/4
画素精度の動き予測を行うことができる。補間装置54
は、例えば線形内挿若しくはハーフバンドフィルタ等の
数タップのデジタルフィルタを用いた内挿を行うことで
補間を行う。なお、この補間装置54は、動きベクトル
の値に応じて、必要な値のみを補間して生成すればよ
い。
【0225】図35に、線形内挿により、水平方向の1
/4画素精度の補間を行う場合の処理内容を示す。動き
ベクトルが元画素と同位相の画素位置を示している場合
には、図35(A)に示すように、元画素の値が補間し
た画素の値となる。動きベクトルが元画素と1/4位相
ずれた画素位置を示している場合には、図35(B)、
図35(C)及び図35(D)に示すように、水平方向
に近接する2つの画素値に、その画素との距離の割合を
乗じて、補間した画素の値を求める。
【0226】動き補償予測装置55は、入力された高い
符号量(高ビットレート)の画像圧縮情報(ビットスト
リーム)内における動き補償予測モード情報(フィール
ド動き補償予測モード或いはフレーム動き補償予測モー
ド、及び、前方向予測モード、後方向予測モード、或い
は、双方向予測モード)及び、動きベクトル情報に基づ
き、ビデオメモリ53内の空間領域の4×8量子化誤差
値に対して動き補償を行う。このとき、水平方向には補
間装置54で補間した値を用いて1/4画素精度で動き
補償を行い、垂直方向には1/2画素精度で動き補償を
行う。
【0227】動き補償がされたデータが、空間領域での
4×8動き補償誤差補正値となる。この4×8動き補償
誤差補正値は、4×8離散コサイン変換装置56に送ら
れる。
【0228】4×8離散コサイン変換装置56は、送ら
れた4×8動き補償誤差補正値に対して、4×8の離散
コサイン変換を施し、周波数領域の動き補償誤差補正係
数を生成する。この動き補償誤差補正係数は、加算器4
1に送られる。
【0229】そして、この加算器41において、逆量子
化装置26により逆量子化された離散コサイン変換係数
から、この動き補償誤差補正係数を減算することによっ
て、動き補償に起因する誤差の補正がされる。
【0230】このように画像情報変換装置50では、8
×8の離散コサイン係数として表される動き補償に起因
する誤差成分のうち、誤差補正に対して大きく寄与する
水平方向の低域成分及び垂直方向の全周波数成分に対し
てのみ演算処理を行い、水平方向の高周波成分に対して
は演算処理を行わない。水平方向の誤差の高周波成分
は、元々誤差の分布の頻度は低く、さらに、帯域制限装
置27が高周波成分を削減する処理を行っているので、
演算処理を行わなくてもほとんど画質の劣化が生じな
い。もっとも、垂直方向の誤差成分は、例えば入力とな
る画像圧縮情報が飛び越し走査によるものである場合に
は、フィールド間の時間差に関する情報が高域成分に含
まれているので、全周波数成分に対して演算処理を行
う。
【0231】以上のように、本発明の第3の実施の形態
の画像情報変換装置50では、周波数領域で各ブロック
のデータの受け渡しを行って符号量(ビットレート)を
削減することができるので、ベースバンドのビデオデー
タまで復号した後符号化する従来の画像情報変換装置に
比べて、演算量が少なくなり、また、回路構成を大幅に
削減することができる。これとともに、画像情報変換装
置50では、動き補償誤差の蓄積に起因する画質劣化を
生じさせずに、符号量を削減することができる。また、
動き補償誤差補正係数を求める動き補償誤差補正装置5
1が、水平方向の高周波成分に対しては演算処理を行わ
ないので、さらに演算量を少なくすることができる。
【0232】また、4×8逆離散コサイン変換装置52
及び4×8離散コサイン変換装置56の垂直方向に対す
る処理としては、通常の8次の逆離散コサイン変換及び
8次の離散コサイン変換を施す。この際、4×8逆離散
コサイン変換装置52及び4×8離散コサイン変換装置
56では、高速アルゴリズムを適用することが可能であ
る。
【0233】図36に、文献”A fast comp
utational algorithm for t
he discrete cosine transf
orm”(IEEE Trans.Commun.,v
ol.25,no.9 pp.1004−1009,1
977)に示されている高速アルゴリズムを適用した場
合のフロー図を示す。
【0234】この方式は、図36中の矢印の方向(変数
[x(0)・・・x(7)]から変数[X(0)・・・
X(7)]へ向かう方向)に処理することで離散コサイ
ン変換を実行することが可能である。また、図36中の
矢印と反対の方向(変数[X(0)・・・X(7)]か
ら変数[x(0)・・・x(7)]へ向かう方向)に処
理することで逆離散コサイン変換を実行することが可能
である。なお、この図36で示す“Cl i”は、COS
(iπ/l)を意味する。
【0235】また、4×8逆離散コサイン変換装置52
及び4×8離散コサイン変換装置56の水平方向に対す
る処理としては、以下の2つの方式がある。
【0236】第1の方式は、4×8逆離散コサイン変換
装置52において、8次の離散コサイン係数である周波
数領域の量子化誤差係数のうち、低域4係数のみに対し
て4次の逆離散コサイン変換を施する。4×8離散コサ
イン変換装置56において、動き補償によって生成され
た4×8の空間領域の動き補償誤差補正値に対して、水
平方向の4次の離散コサイン変換を施す。このことによ
り、4×8の周波数領域の動き補償誤差補正係数を出力
することができる。ここで、4次の逆離散コサイン変換
及び4次の離散コサイン変換に高速アルゴリズムを適用
することが可能である。図37に、4次の高速アルゴリ
ズムを適用した場合のフロー図を示す。この4次の高速
アルゴリズムは、F(0)〜F(3)を入力とし、f
(0)〜f(3)を出力とすることにより、逆離散コサ
イン変換を実行することが可能である。また、f(0)
〜f(3)を入力とし、F(0)〜F(3)を出力とす
ることにより、離散コサイン変換を実行することが可能
である。
【0237】第2の方式は、4×8逆離散コサイン変換
装置52において、8次の離散コサイン係数である周波
数領域の量子化誤差係数のうち、高域4係数を0と置き
換えて8次の離散コサイン変換を施して、8次の空間領
域の量子化誤差値を得る。続いて、4×8逆離散コサイ
ン変換装置52は、8次の空間領域の量子化誤差値に対
して、水平方向に平均化処理又は間引き処理を行い、空
間領域の4次の量子化誤差値を生成する。4×8離散コ
サイン変換装置56は、動き補償によって得られた画素
領域の4点の誤差補正値を、補間処理によって8点にす
る。続いて、4×8離散コサイン変換装置56は、補間
処理によって8点にした空間領域の動き補償画素補正値
に対して離散コサイン変換を施した後、4次までの低域
成分を取り出す。このことにより4×8の周波数領域で
の誤差補正係数を出力することができる。
【0238】なお、この第2の方式において、4×8逆
離散コサイン変換装置52は、逆離散コサイン変換と平
均化処理、又は、逆離散コサイン変換と間引き処理を、
一連の処理として1つの行列で演算しても良い。逆離散
コサイン変換と平均化処理とを1つの行列で演算する場
合の演算式(iD4_ave)を図38に示す。また、
逆離散コサイン変換と間引き処理とを1つの行列で演算
する場合の演算式(iD4_deci)を図39に示
す。
【0239】また、4×8離散コサイン変換装置56
も、同様に、補間処理と離散コサイン変換とを一連の処
理として1つの行列で演算しても良い。平均化処理に対
応する補間処理と離散コサイン変換とを1つの行列で演
算する場合の演算式(D4_ave)、及び、間引き処
理に対応する補間処理と逆離散コサイン変換とを1つの
行列で演算する場合の演算式(D4_deci)は、以
下の式で示される。なお、t()は転置行列を示してい
る。
【0240】
【数27】
【0241】また、画像における色差信号の劣化は、輝
度信号の劣化に比べ、人間の目には分かり難いという特
色を有している。そのため、4×8逆離散コサイン変換
装置52では、図40に示すように、色差信号の離散コ
サイン係数の垂直方向の高域成分4係数を0に置き換え
て、逆直交変換をして演算量の削減を行っても良い。
【0242】また、以上、入力として、MPEG2によ
る画像圧縮情報(ビットストリーム)を対象としてきた
が、直交変換と動き補償によって符号化された画像圧縮
情報(ビットストリーム)では、本装置と同様の構成で
符号量(ビットレート)の削減を行うことが可能であ
る。
【0243】
【発明の効果】本発明にかかる画像情報変換装置及び方
法では、直交変換係数を逆量子化した後量子化幅を変え
て再量子化する。このことにより本発明では、画像信号
をベースバンドで処理をせずに周波数領域で処理をする
ことができ、そのため、少ない演算量及び回路規模でビ
ットレートの削減をすることができる。また、本発明で
は、再量子化による歪みを低減でき画質劣化を少なくし
てビットレートの削減をすることができる。
【0244】また、本発明にかかる画像情報変換装置及
び方法では、直交変換係数を逆量子化した後、直交変換
係数の水平方向の高周波成の値を制限し、量子化幅を変
えて再量子化する。このことにより、本発明では、再量
子化による歪みを低減でき画質劣化を少なくしてビット
レートの削減をすることができる。また、本発明では、
フィールド間の差分情報を含む垂直方向の情報を制限し
ないので、画質劣化を少なくしてビットレートの削減を
することができる。
【0245】また、本発明にかかる画像情報変換装置及
び方法では、直交変換係数を逆量子化した後量子化幅を
変えて再量子化するとともに、入力された直交変換係数
と再量子化した直交変換係数との差分を動き補償して動
き補償による誤差を補正する。このことにより、再量子
化にともなう動き補償の誤差の蓄積が減少し、画質の劣
化を少なくしてビットレートの削減をすることができ
る。
【0246】また、本発明にかかる画像情報変換装置及
び方法では、直交変換係数を逆量子化した後直交変換係
数の水平方向の高周波成の値を制限し量子化幅を変えて
再量子化するとともに、入力された直交変換係数と再量
子化した直交変換係数との差分の水平方向の低域4係数
及び垂直方向の8係数とを、動き補償して動き補償によ
る誤差を補正する。このことにより、再量子化にともな
う動き補償の誤差の蓄積が減少し、画質の劣化を少なく
してビットレートの削減をすることができるとともに、
回路規模を削減することができる。
【図面の簡単な説明】
【図1】MPEG−2画像情報符号化装置のブロック図
である。
【図2】上記MPEG−2画像情報符号化装置の画面並
べ替えバッファによるフレーム順序の並べ替え処理を説
明する図である。(A)は並べ替え前のフレーム順序を
示す図であり、(B)は並べ替え後のフレーム順序を示
す図である。
【図3】ビデオデータが4:2:0信号の場合のマクロ
ブロックの構成を説明する図である。
【図4】フレーム離散コサイン変換モードの際のDCT
ブロックを説明する図である。
【図5】フィールド離散コサイン変換モードの際のDC
Tブロックを説明する図である。
【図6】可変長符号化をする際の離散コサイン変換係数
のスキャン順序を示す図である。(A)はジグザグスキ
ャンのスキャン順序を示す図であり、(B)はオルタネ
ートスキャンのスキャン順序を示す図である。
【図7】イントラDC精度に対する逆量子化係数の関係
を示す図である。
【図8】量子化行列のデフォルト値を示す図である。
(A)はイントラマクロブロックについて用いられるデ
フォルトに設定された量子化行列を示す図である。
(B)はインターマクロブロックについて用いられるデ
フォルト値に設定された量子化行列を示す図である。
【図9】MPEG2画像圧縮情報(ビットストリーム)
の構文中で定義されるquantiser_scale
(量子化スケール)を説明する図である。
【図10】上記MPEG−2画像情報符号化装置の符号
量制御装置の動作内容を示すフローチャートである。
【図11】VBVバッファのビット占有量の変化を示す
図である。
【図12】MPEG2画像圧縮情報(ビットストリー
ム)の階層構成を示す図である。
【図13】MPEG2画像圧縮情報(ビットストリー
ム)の各階層におけるスタートコードのコード値を示す
図である。
【図14】MPEG2画像圧縮情報(ビットストリー
ム)の各階層のブロック構成を示す図である。
【図15】シーケンスヘッダに含まれる情報を説明する
図である。
【図16】シーケンス拡張部に含まれる情報を説明する
図である。
【図17】拡張部&ユーザデータ(1)に含まれる情報
を説明する図である。
【図18】GOPヘッダに含まれる情報を説明する図で
ある。
【図19】拡張部&ユーザデータ(2)に含まれる情報
を説明する図である。
【図20】ピクチャヘッダに含まれる情報を説明する図
である。
【図21】ピクチャ符号化拡張部に含まれる情報を説明
する図である。
【図22】拡張部&ユーザデータ(3)に含まれる情報
を説明する図である。
【図23】画面内に分割されたスライス層を説明する図
である。
【図24】スライス層を定義するスライスデータを説明
する図である。
【図25】スライスデータに含まれる情報を説明する図
である。
【図26】マクロブロックデータに含まれる情報を説明
する図である。
【図27】ブロックデータに含まれる情報を説明する図
である。
【図28】本発明の第1の実施の形態の画像情報変換装
置のブロック図である。
【図29】上記画像情報変換装置の帯域制限装置による
離散コサイン変換係数の水平高周波成分の帯域制限例を
説明する図である。(A)は輝度信号に対する離散コサ
イン変換係数の帯域制限例を示す図であり、(B)は色
差信号に対する離散コサイン変換係数の帯域制限例を示
す図である。
【図30】上記画像情報変換装置の符号量制御装置の動
作内容を示すフローチャートである。
【図31】入力された信号のスキャン方式に関わらず、
オルタネートスキャン方式により離散コサイン変換係数
をスキャンすることを説明する図である。(A)は帯域
制限まえの離散コサイン変換係数を示す図であり、
(B)は帯域制限後の離散コサイン変換係数を示す図で
ある。
【図32】本発明の第2の実施の形態の画像情報変換装
置のブロック図である。
【図33】離散コサイン変換及び逆離散コサイン変換に
高速アルゴリズムを適用した場合の処理フローを示す図
である。
【図34】本発明の第3の実施の形態の画像情報変換装
置のブロック図である。
【図35】線形内挿により水平方向の1/4画素精度の
補間を行うときの処理内容を示す図である。
【図36】4×8離散コサイン変換及び4×8逆離散コ
サイン変換に高速アルゴリズムを適用した場合の処理フ
ローを示す図である。
【図37】4×8離散コサイン変換及び4×8逆離散コ
サイン変換に他の高速アルゴリズムを適用した場合の処
理フローを示す図である。
【図38】逆離散コサイン変換と平均化処理とを1つの
行列で演算する場合の演算式を説明する図である。
【図39】逆離散コサイン変換と間引き処理とを1つの
行列で演算する場合の演算式を説明する図である。
【図40】色差信号の離散コサイン係数の垂直方向の高
域成分4係数を0に置き換える処理を説明する図であ
る。
【図41】従来の画像情報変換装置のブロック図であ
る。
【符号の説明】
20,40,50 画像情報変換装置、24 圧縮情報
解析装置、25、可変長復号化装置、26 逆量子化装
置、27 帯域制限装置、28 量子化装置、29 可
変長符号化装置、31 符号量制御装置、41,44
加算器、42,51動き補償誤差補正装置、43 逆量
子化装置、45 逆離散コサイン変換装置、46,53
ビデオメモリ、47,55動き補償予測装置、48
離散コサイン変換装置、52 4×8逆離散コサイン変
換装置、54 補間装置、564×8離散コサイン変換
装置
フロントページの続き (72)発明者 岡田 紳太郎 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 リュウ イク 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 (72)発明者 柳原 尚史 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5C059 KK01 KK22 MA00 MA23 MC11 MC38 ME01 NN01 PP04 PP16 SS01 SS02 SS13 TA53 TB08 TC10 TD02 TD03 UA02 UA05 UA11

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 所定の画素ブロック(直交変換ブロッ
    ク)単位で直交変換するとともに直交変換して得られた
    上記直交変換ブロック内の直交変換係数を量子化するこ
    とにより、画像信号を圧縮符号化をした第1のビットレ
    ートの第1の画像圧縮情報を、上記第1のビットレート
    より低い第2のビットレートの第2の画像圧縮情報に変
    換する画像情報変換装置において、 入力された第1の画像圧縮情報の直交変換係数の量子化
    幅に応じて、この直交変換係数を逆量子化する逆量子化
    手段と、 出力する第2の画像圧縮情報が上記第2のビットレート
    となるような量子化幅に応じて、上記逆量子化手段によ
    り逆量子化された直交変換係数を再量子化する量子化手
    段とを備えることを特徴とする画像情報変換装置。
  2. 【請求項2】 上記逆量子化手段により逆量子化された
    直交変換係数の水平方向の高周波成分の値を制限する帯
    域制限手段を備え、 上記量子化手段は、出力する第2の画像圧縮情報が上記
    第2のビットレートとなるような量子化幅に応じて、上
    記帯域制限手段により水平方向の高周波成分が制限され
    た直交変換係数を再量子化することを特徴とする請求項
    1記載の画像情報変換装置。
  3. 【請求項3】 上記帯域制限手段は、輝度成分の直交変
    換係数よりも色差信号の直交変換係数を、より低い成分
    の直交変換係数まで制限することを特徴とする請求項2
    記載の画像情報変換装置。
  4. 【請求項4】 入力された第1の画像圧縮情報の1ピク
    チャ毎の符号量を解析する画像圧縮情報解析手段と、 上記量子化手段の量子化幅を制御して出力する第2の画
    像圧縮情報の符号量を制御する符号量制御手段とを備
    え、 上記符号量制御手段は、入力された第1の画像圧縮情報
    の1ピクチャ毎の符号量をB、上記第1のビットレート
    をR1、上記第2のビットレートをR2としたとき、第
    2の画像圧縮情報の各ピクチャの目標符号量(ターゲッ
    トビット)Tを T=B(R2/R1) により求めて、量子化幅を制御することを特徴とする請
    求項1記載の画像情報変換装置。
  5. 【請求項5】 上記量子化手段は、上記第1の画像圧縮
    情報の直交変換係数を量子化した量子化行列と異なる量
    子化行列を用いて、上記逆量子化手段により逆量子化さ
    れた直交変換係数を再量子化することを特徴とする請求
    項1記載の画像情報変換装置。
  6. 【請求項6】 入力された第1の画像圧縮情報を可変長
    復号する可変長復号化手段と、 上記量子化手段により再量子化した画像圧縮情報を可変
    長符号化する可変長符号化手段とを備え、 上記可変長符号化手段は、オルタネートスキャン方式で
    直交変換ブロックを一次元信号に変換して可変長符号化
    することを特徴とする請求項1記載の画像情報変換装
    置。
  7. 【請求項7】 所定の画素ブロック(直交変換ブロッ
    ク)単位で直交変換するとともに直交変換して得られた
    上記直交変換ブロック内の直交変換係数を量子化するこ
    とにより、画像信号を圧縮符号化をした第1のビットレ
    ートの第1の画像圧縮情報を、上記第1のビットレート
    より低い第2のビットレートの第2の画像圧縮情報に変
    換する画像情報変換装置において、 入力された第1の画像圧縮情報の直交変換係数の量子化
    幅に応じて、この直交変換係数を逆量子化する第1の逆
    量子化手段と、 上記第1の逆量子化手段により逆量子化された直交変換
    係数と動き補償誤差補正係数とを加算する加算手段と、 出力する第2の画像圧縮情報が上記第2のビットレート
    となるような量子化幅に応じて、上記加算手段により動
    き補償誤差係数が加算された直交変換係数を再量子化す
    る量子化手段と、 上記量子化手段により再量子化された直交変換係数を逆
    量子化する第2の逆量子化手段と、 上記第2の逆量子化手段により逆量子化された直交変換
    係数から上記加算手段により動き補償補正係数が加算さ
    れた直交変換係数を減算して周波数領域の量子化誤差係
    数を生成する減算手段と、 上記減算手段により減算した上記直交変換係数を直交変
    換して動きベクトルに基づき動き補償し、動き補償で得
    た値を逆直交変換をして上記動き補償誤差補正係数を生
    成する動き補償誤差補正手段とを備えることを特徴とす
    る画像情報変換装置。
  8. 【請求項8】 上記第1の逆量子化手段により逆量子化
    された直交変換係数の水平方向の高周波成分の値を制限
    する帯域制限手段を備え、 上記量子化手段は、出力する第2の画像圧縮情報が上記
    第2のビットレートとなるような量子化幅に応じて、上
    記帯域制限手段により水平方向の高周波成分が制限され
    た直交変換係数を再量子化することを特徴とする請求項
    7記載の画像情報変換装置。
  9. 【請求項9】 上記帯域制限手段は、輝度成分の直交変
    換係数よりも色差信号の直交変換係数を、より低い成分
    の直交変換係数まで制限することを特徴とする請求項8
    記載の画像情報変換装置。
  10. 【請求項10】 上記動き補償誤差補正手段は、上記帯
    域制限手段が0とした直交変換係数に対する逆直交変換
    及び直交変換を行わないことを特徴とする請求項8記載
    の画像情報変換装置。
  11. 【請求項11】 入力された第1の画像圧縮情報の1ピ
    クチャ毎の符号量を解析する画像圧縮情報解析手段と、 上記量子化手段の量子化幅を制御して出力する第2の画
    像圧縮情報の符号量を制御する符号量制御手段とを備
    え、 上記符号量制御手段は、入力された第1の画像圧縮情報
    の1ピクチャ毎の符号量をB、上記第1のビットレート
    をR1、上記第2のビットレートをR2としたとき、第
    2の画像圧縮情報の各ピクチャの目標符号量(ターゲッ
    トビット)Tを T=B(R2/R1) により求めて、量子化幅を制御することを特徴とする請
    求項7記載の画像情報変換装置。
  12. 【請求項12】 上記量子化手段は、上記第1の画像圧
    縮情報の直交変換係数を量子化した量子化行列と異なる
    量子化行列を用いて、上記逆量子化手段により逆量子化
    された直交変換係数を再量子化することを特徴とする請
    求項7記載の画像情報変換装置。
  13. 【請求項13】 入力された第1の画像圧縮情報を可変
    長復号する可変長復号化手段と、 上記量子化手段により再量子化した画像圧縮情報を可変
    長符号化する可変長符号化手段とを備え、 上記可変長符号化手段は、入力された第1の画像圧縮情
    報のスキャン方式にかかわらず、オルタネートスキャン
    方式で直交変換ブロックを一次元信号に変換して可変長
    符号化することを特徴とする請求項7記載の画像情報変
    換装置。
  14. 【請求項14】 上記動き補償誤差補正手段は、Pピク
    チャには動き補償誤差補正係数を生成し、Bピクチャに
    は動き補償誤差補正係数を生成することを特徴とする請
    求項7記載の画像情報変換装置。
  15. 【請求項15】 上記動き補償誤差補正手段は、輝度信
    号には動き補償誤差補正係数を生成し、色差信号には動
    き補償誤差補正係数を生成することを特徴とする請求項
    7記載の画像情報変換装置。
  16. 【請求項16】 上記動き補償誤差補正手段は、高速ア
    ルゴリズムに基づき、逆直交変換及び直交変換をするこ
    とを特徴とする請求項7記載の画像情報変換装置。
  17. 【請求項17】 上記直交変換係数は、水平方向8係数
    と垂直方向8係数の8×8係数からなり、 上記動き補償誤差補正手段は、 水平方向8係数及び垂直方向8係数からなる量子化誤差
    係数に対して、4×8の逆直交変換を行い、空間領域の
    量子化誤差値を生成する4×8逆直交変換部と、 上記4×8逆直交変換部により生成された空間領域の量
    子化誤差値に対して、水平方向に1/4画素精度で動き
    補償をし、垂直方向に1/2画素精度で動き補償をし
    て、空間領域の量子化誤差補正値を生成する動き補償部
    と、 上記動き補償部により生成された空間領域の量子化誤差
    補正値に対して、4×8の直交変換を行い、周波数領域
    の上記動き補償誤差補正係数を生成する4×8直交変換
    部とを有することを特徴とする請求項7記載の画像情報
    変換装置。
  18. 【請求項18】 上記4×8逆直交変換部は、色差信号
    の直交変換係数の垂直方向の高域成分の値を0に置き換
    えて、逆直交変換をすることを特徴とする請求項17記
    載の画像情報変換装置。
  19. 【請求項19】 上記動き補償誤差補正手段は、上記4
    ×8逆直交変換部により生成された空間領域の量子化誤
    差値に対して、水平方向の1/4画素精度の画素補間を
    する補間部を有し、 上記動き補償部は、上記補間部が補間した補間値を用い
    て、水平方向の動き補償をすることを特徴とする請求項
    17記載の画像情報変換装置。
  20. 【請求項20】 上記4×8逆直交変換部は、水平方向
    には周波数領域の8次の量子化誤差係数のうち低域4係
    数のみ対して4次の逆直交変換を行い、垂直方向には8
    次の逆直交変換を行い、 上記4×8直交変換部は、空間領域の動き補償誤差補正
    値に対して、水平方向には4次の直交変換を行い、垂直
    方向には8次の直交変換を行うことを特徴とする請求項
    17記載の画像情報変換装置。
  21. 【請求項21】 上記4×8逆直交変換部は、水平方向
    には、周波数領域の8次の量子化誤差係数のうち高域4
    係数を0と置き換え8次の逆直交変換を行った後、間引
    き処理又は平均化処理を行って4次の空間領域の量子化
    誤差値を生成し、 上記4×8直交変換部は、水平方向には、空間領域の4
    点の動き補償誤差補正値を補間処理して8点の動き補償
    誤差補正値にした後、離散コサイン変換をすることを特
    徴とする請求項17記載の画像情報変換装置。
  22. 【請求項22】 上記4×8逆直交変換部は、逆直交変
    換及び間引き処理、又は、逆直交変換及び平均化処理を
    1つの行列により演算し、 上記4×8直交変換部は、補間処理及び直交変換を1つ
    の行列で演算することを特徴とする請求項21記載の画
    像情報変換装置。
  23. 【請求項23】 所定の画素ブロック(直交変換ブロッ
    ク)単位で直交変換するとともに直交変換して得られた
    上記直交変換ブロック内の直交変換係数を量子化するこ
    とにより、画像信号を圧縮符号化をした第1のビットレ
    ートの第1の画像圧縮情報を、上記第1のビットレート
    より低い第2のビットレートの第2の画像圧縮情報に変
    換する画像情報変換方法において、 上記第1のビットレートの第1の画像圧縮情報を入力
    し、 入力された第1の画像圧縮情報の直交変換係数の量子化
    幅に応じて、この直交変換係数を逆量子化し、 出力する第2の画像圧縮情報が上記第2のビットレート
    となるような量子化幅に応じて、逆量子化された上記直
    交変換係数を再量子化し、 再量子化して生成した第2の画像圧縮情報を出力するこ
    とを特徴とする画像情報変換方法。
  24. 【請求項24】 逆量子化された上記直交変換係数の水
    平方向の高周波成分の値を制限し、 出力する第2の画像圧縮情報が上記第2のビットレート
    となるような量子化幅に応じて、水平方向の高周波成分
    が制限された上記直交変換係数を再量子化することを特
    徴とする請求項23記載の画像情報変換方法。
  25. 【請求項25】 所定の画素ブロック(直交変換ブロッ
    ク)単位で直交変換するとともに直交変換して得られた
    上記直交変換ブロック内の直交変換係数を量子化するこ
    とにより、画像信号を圧縮符号化をした第1のビットレ
    ートの第1の画像圧縮情報を、上記第1のビットレート
    より低い第2のビットレートの第2の画像圧縮情報に変
    換する画像情報変換方法において、 上記第1のビットレートの第1の画像圧縮情報を入力
    し、 入力された第1の画像圧縮情報の直交変換係数の量子化
    幅に応じて、この直交変換係数を逆量子化し、 逆量子化された上記直交変換係数と動き補償誤差補正係
    数とを加算し、 出力する第2の画像圧縮情報が上記第2のビットレート
    となるような量子化幅に応じて、動き補償誤差係数が加
    算された直交変換係数を再量子化し、 再量子化して生成した第2の画像圧縮情報を出力し、 再量子化された上記直交変換係数を逆量子化し、逆量子
    化された直交変換係数から動き補償補正係数が加算され
    た直交変換係数を減算し、減算した直交変換係数を直交
    変換して動きベクトルに基づき動き補償し、動き補償を
    した値を逆直交変換をして上記動き補償誤差補正係数を
    生成することを特徴とする画像情報変換方法。
  26. 【請求項26】 逆量子化された直交変換係数の水平方
    向の高周波成分の値を制限し、 出力する第2の画像圧縮情報が上記第2のビットレート
    となるような量子化幅に応じて、水平方向の高周波成分
    が制限された直交変換係数を再量子化することを特徴と
    する請求項25記載の画像情報変換方法。
  27. 【請求項27】 上記直交変換係数は、水平方向8係数
    と垂直方向8係数の8×8係数からなり、 水平方向8係数及び垂直方向8係数からなる量子化誤差
    係数に対して、4×8の逆直交変換を行い、空間領域の
    量子化誤差値を生成し、 上記空間領域の量子化誤差値に対して、水平方向に1/
    4画素精度で動き補償をし、垂直方向に1/2画素精度
    で動き補償をして、空間領域の量子化誤差補正値を生成
    し、 上記空間領域の量子化誤差補正値に対して、4×8の直
    交変換を行い、周波数領域の上記動き補償誤差補正係数
    を生成することを特徴とする請求項25記載の画像情報
    変換方法。
JP18360299A 1998-12-15 1999-06-29 画像情報変換装置及び画像情報変換方法 Pending JP2000236547A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP18360299A JP2000236547A (ja) 1998-12-15 1999-06-29 画像情報変換装置及び画像情報変換方法
US09/605,035 US6658157B1 (en) 1999-06-29 2000-06-27 Method and apparatus for converting image information

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP35630298 1998-12-15
JP10-356302 1998-12-15
JP18360299A JP2000236547A (ja) 1998-12-15 1999-06-29 画像情報変換装置及び画像情報変換方法

Publications (2)

Publication Number Publication Date
JP2000236547A true JP2000236547A (ja) 2000-08-29
JP2000236547A5 JP2000236547A5 (ja) 2006-04-27

Family

ID=26501969

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18360299A Pending JP2000236547A (ja) 1998-12-15 1999-06-29 画像情報変換装置及び画像情報変換方法

Country Status (1)

Country Link
JP (1) JP2000236547A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005507204A (ja) * 2001-10-23 2005-03-10 トムソン ライセンシング ソシエテ アノニム ダミーの双方向予測フィールドピクチャの生成
WO2009050897A1 (ja) * 2007-10-19 2009-04-23 Panasonic Corporation 符号化レート変換装置、符号化レート変換方法および集積回路
JP2011139511A (ja) * 2011-02-28 2011-07-14 Sony Corp 復号装置および復号方法
US8194751B2 (en) 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
JP2013059106A (ja) * 2012-11-20 2013-03-28 Sony Corp 符号化装置および符号化方法
JP2014078924A (ja) * 2012-09-21 2014-05-01 Toshiba Corp 復号装置、及び符号化装置
US8831096B2 (en) 2005-09-15 2014-09-09 Sony Corporation Decoding apparatus, decoding method, and program of same
WO2019073802A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 送信装置および送信方法、並びにプログラム
JP2020145765A (ja) * 2012-09-21 2020-09-10 株式会社東芝 復号装置、符号化装置、復号方法、及び符号化方法
CN111886871A (zh) * 2018-03-28 2020-11-03 索尼公司 图像处理装置和图像处理方法
CN117354529A (zh) * 2023-11-28 2024-01-05 广东匠芯创科技有限公司 基于视频编码***的图像处理方法、电子设备及介质
US12022099B2 (en) 2012-09-21 2024-06-25 Kabushiki Kaisha Toshiba Decoding device and encoding device

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4719418B2 (ja) * 2001-10-23 2011-07-06 トムソン ライセンシング ダミーの双方向予測フィールドピクチャの生成
JP2005507204A (ja) * 2001-10-23 2005-03-10 トムソン ライセンシング ソシエテ アノニム ダミーの双方向予測フィールドピクチャの生成
US8194751B2 (en) 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
US8831096B2 (en) 2005-09-15 2014-09-09 Sony Corporation Decoding apparatus, decoding method, and program of same
US8842732B2 (en) 2005-09-15 2014-09-23 Sony Corporation Encoding apparatus, encoding method, and program of same
WO2009050897A1 (ja) * 2007-10-19 2009-04-23 Panasonic Corporation 符号化レート変換装置、符号化レート変換方法および集積回路
JP2011139511A (ja) * 2011-02-28 2011-07-14 Sony Corp 復号装置および復号方法
JP2022036956A (ja) * 2012-09-21 2022-03-08 株式会社東芝 復号装置、符号化装置、復号方法、及び符号化方法
JP7214818B2 (ja) 2012-09-21 2023-01-30 株式会社東芝 復号装置、符号化装置、復号方法、及び符号化方法
US9781440B2 (en) 2012-09-21 2017-10-03 Kabushiki Kaisha Toshiba Decoding device and encoding device
US9998747B2 (en) 2012-09-21 2018-06-12 Kabushiki Kaisha Toshiba Decoding device
US10250898B2 (en) 2012-09-21 2019-04-02 Kabushiki Kaisha Toshiba Decoding device and encoding device
US12022099B2 (en) 2012-09-21 2024-06-25 Kabushiki Kaisha Toshiba Decoding device and encoding device
US10728566B2 (en) 2012-09-21 2020-07-28 Kabushiki Kaisha Toshiba Decoding device and encoding device
JP2020145765A (ja) * 2012-09-21 2020-09-10 株式会社東芝 復号装置、符号化装置、復号方法、及び符号化方法
JP7387924B2 (ja) 2012-09-21 2023-11-28 株式会社東芝 復号装置、符号化装置、復号方法、及び符号化方法
JP2014078924A (ja) * 2012-09-21 2014-05-01 Toshiba Corp 復号装置、及び符号化装置
US10972745B2 (en) 2012-09-21 2021-04-06 Kabushiki Kaisha Toshiba Decoding device and encoding device
US11381831B2 (en) 2012-09-21 2022-07-05 Kabushiki Kaisha Toshiba Decoding device and encoding device
JP2013059106A (ja) * 2012-11-20 2013-03-28 Sony Corp 符号化装置および符号化方法
JPWO2019073802A1 (ja) * 2017-10-11 2020-11-12 ソニー株式会社 送信装置および送信方法、並びにプログラム
JP7173028B2 (ja) 2017-10-11 2022-11-16 ソニーグループ株式会社 送信装置および送信方法、並びにプログラム
WO2019073802A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 送信装置および送信方法、並びにプログラム
CN111886871A (zh) * 2018-03-28 2020-11-03 索尼公司 图像处理装置和图像处理方法
CN117354529A (zh) * 2023-11-28 2024-01-05 广东匠芯创科技有限公司 基于视频编码***的图像处理方法、电子设备及介质
CN117354529B (zh) * 2023-11-28 2024-03-12 广东匠芯创科技有限公司 基于视频编码***的图像处理方法、电子设备及介质

Similar Documents

Publication Publication Date Title
US6658157B1 (en) Method and apparatus for converting image information
Wiegand et al. Rate-constrained coder control and comparison of video coding standards
KR100934290B1 (ko) 엠피이지-2 4:2:2-프로파일 비트스트림을 메인-프로파일비트스트림으로 컨버팅 하기 위한 방법 및 아키텍처
Tudor MPEG-2 video compression
Wiegand et al. Overview of the H. 264/AVC video coding standard
Puri et al. Video coding using the H. 264/MPEG-4 AVC compression standard
US7532808B2 (en) Method for coding motion in a video sequence
Puri Video coding using the MPEG-2 compression standard
US8325797B2 (en) System and method of reduced-temporal-resolution update for video coding and quality control
US7787541B2 (en) Dynamic pre-filter control with subjective noise detector for video compression
US6687296B1 (en) Apparatus and method for transforming picture information
US9071844B2 (en) Motion estimation with motion vector penalty
US20120076203A1 (en) Video encoding device, video decoding device, video encoding method, and video decoding method
JP2006521771A (ja) ハイブリッドレートコントローラーを備えるデジタルストリームトランスコーダー
JP2000236547A (ja) 画像情報変換装置及び画像情報変換方法
Frimout et al. Forward rate control for MPEG recording
JP2003520513A (ja) 画像データの圧縮
JP2003061091A (ja) 圧縮ビットストリームをアップサンプリングする方法および装置
JP4292659B2 (ja) 画像情報変換装置及び画像情報変換方法
US6040875A (en) Method to compensate for a fade in a digital video input sequence
JP4517475B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
Aramvith et al. MPEG-1 and MPEG-2 video standards
JP4517453B2 (ja) 画像情報変換装置及び方法並びに符号化装置及び方法
JP2004056616A (ja) 符号化信号復号装置、符号化信号復号方法および符号化信号復号プログラム
JP3800965B2 (ja) データレート変換装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060310

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070306

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070626