JP3938679B2 - 最適符号化モード選択型動画像符号化方式 - Google Patents

最適符号化モード選択型動画像符号化方式 Download PDF

Info

Publication number
JP3938679B2
JP3938679B2 JP2001350668A JP2001350668A JP3938679B2 JP 3938679 B2 JP3938679 B2 JP 3938679B2 JP 2001350668 A JP2001350668 A JP 2001350668A JP 2001350668 A JP2001350668 A JP 2001350668A JP 3938679 B2 JP3938679 B2 JP 3938679B2
Authority
JP
Japan
Prior art keywords
coding
coding mode
picture
encoding
bits
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001350668A
Other languages
English (en)
Other versions
JP2003153280A (ja
Inventor
整 内藤
正裕 和田
修一 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2001350668A priority Critical patent/JP3938679B2/ja
Publication of JP2003153280A publication Critical patent/JP2003153280A/ja
Application granted granted Critical
Publication of JP3938679B2 publication Critical patent/JP3938679B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は最適符号化モード選択型動画像符号化方式に関し、動画像を高効率に圧縮符号化できる最適符号化モード選択型動画像符号化方式に関する。
【0002】
【従来の技術】
従来の動画像符号化装置の一例を、図6を参照して説明する。入力画像信号11は、予測信号減算器12と動き推定・動き補償部19に送られる。予測信号減算器12で、入力画像信号11から動き補償予測信号aが減算され、予測誤差信号bが得られる。該予測誤差信号bは、高い符号化効率を得るために、DCT(離散コサイン変換部)部13で直交変換され、量子化部14で量子化される。その後、可変長符号化(VLC)部20でハフマン符号化等の可変長符号に変換され、一旦バッファ21に格納された後、ビットストリーム22として出力される。量子化部14は、該バッファ21からのレート制御信号により、次のブロックのための量子化ステップを計算する。
【0003】
また、復号側と同一の予測信号を用いるために、量子化部14で得られた量子化係数を逆量子化部15で逆量子化し、逆DCT部16で予測誤差信号が局所的に復号される。この予測誤差信号は、局所復号加算器17で、動き推定・動き補償部19で復元された動き補償予測信号aと加算され、フレームメモリ18に送られる。
【0004】
前記動き推定・動き補償部19では、動き補償予測信号aの復元、動きベクトルMVの決定、および符号化モードの選択をする。ここで、符号化モードは、例えば図7に示されているように、I、P、およびBピクチャ毎に、参照方式、予測タイプ、およびDCTタイプの組み合わせにより与えられ、マクロブロック単位に符号化モードの選択が可能である。
【0005】
【発明が解決しようとする課題】
前記した従来装置では、前記符号化モードの選択は、予測誤差信号bの絶対値和とか分散値とかを最小にするように、単に機械的に決定していた。このため、動画像を高効率に圧縮符号化することに関して、改善の余地があった。
【0006】
本発明の目的は、前記した従来技術に鑑み、動画像符号化におけるマクロブロック単位の適応モード判定を符号化ビット数最小化の規範でより厳密に行うことにより、圧縮符号化の効率をさらに向上させる最適符号化モード選択型動画像符号化方式を提供することにある。
【0007】
【課題を解決するための手段】
前記した目的を達成するために、本発明は、矩形小領域単位で動画像の符号化処理を行う最適符号化モード選択型動画像符号化方式であって、各符号化ピクチャにつき、動き補償予測の参照方式、動き補償予測のタイプ、および直交変換のタイプの組み合わせにより規定される複数の符号化モード候補と、符号化処理を行う画像の符号化ピクチャを決定する手段と、前記決定された符号化ピクチャの符号化モード候補毎に、前記矩形小領域を形成する複数のDCTブロックの各符号化ビット数を求める手段と、前記矩形小領域内で符号化ビット数が0となるDCTブロックの個数が予め定められた閾値以上になったかどうかを判断する手段と、前記判断により前記閾値以上になるものがあった場合には、予測誤差電力が最小となるものを符号化モードとして決定し、前記閾値以上になるものがない場合には、DCTブロックの符号化ビット数とオーバヘッドビット数との和が小さいものを符号化モードとして決定する手段とを具備した点に特徴がある。
【0008】
この特徴によれば、圧縮符号化の効率をさらに向上させることが可能であり、動画像を高効率で圧縮符号化できるようになる。
【0009】
【発明の実施の形態】
以下に、図面を参照して、本発明をより詳細に説明する。図1、図2および図3は、本発明の一実施形態の動作を示すフローチャート、図4は圧縮符号化される入力画像の概念図である。なお、該図1〜図3は、本実施形態の動き推定・動き補償部の動き補償動作を示すものである。
【0010】
図1〜図3の動作を、図4を参照しながら説明する。図示されているように、Piはi番目の入力画像、jは矩形小領域、例えば16画素×16ラインのマクロブロックの番号を示す。画像の全枚数は(N+1)枚、1画像の全マクロブロック数は(M+1)個であるとする。
【0011】
図1のステップS1では、入力画像の番号を示すiが0と置かれる。ステップS2では、画像Piが入力する。ステップS3では、該画像Piの符号化ピクチャが、I、P、およびBピクチャのいずれであるかが判断される。なお、本実施形態では、入力画像Piをどのピクチャにするかは、予め決められているものとする。該画像Piに対するピクチャがIピクチャであればステップS4に進み、PピクチャであればステップS8に進み、BピクチャであればステップS12に進む。
【0012】
画像Piの符号化ピクチャがIピクチャであるとすると、ステップS4では、マクロブロック(16画素×16ライン)の番号を表すjが0と置かれる。ステップS5では、j番目のマクロブロックの符号化モードが、後で詳述する本発明の方式により選択される。ステップS6では、j=Mが成立したか否かの判断がなされる。この判断が否定の時には、ステップS7に進んで、jに1が加算される。以下、ステップS5〜S7の処理が繰り返し行われ、ステップS6の判断が肯定になると、画像Piの符号化モードの選択を終了し、ステップS16に進む。なお、前記ステップS3でPピクチャと判定されてステップS8に進んだ時、およびBピクチャと判定されてステップS12に進んだ時の、各ステップS9〜S11の処理、およびステップS13〜S15の処理は、前記ステップS5〜S7の処理と同じであるので、説明を省略する。
【0013】
ステップS16では、i=N、すなわち全画像の圧縮符号化が終了したか否かの判断がなされ、この判断が否定の時には、ステップS17に進んで、iに1が加算される。そして、次の画像の処理が実行される。一方、ステップS16の判断が肯定になると、前記一連の圧縮符号化処理を終了する。
【0014】
次に、前記ステップS5,S9およびS13の「マクロブロックMBjの符号化モード選択」の動作を、図2のフローチャートおよび図5の説明図を参照して説明する。
【0015】
まず、本実施形態の概要を説明する。簡単のため、扱う映像信号としては、輝度信号のみを対象として説明を行うこととする。本実施形態では、図5に示されているように、各マクロブロックMBjを4個のDCTブロックB0〜B3に分解し、符号化モード毎に、▲1▼各DCTブロックの符号化ビット数、▲2▼動きベクトルのオーバヘッドビット数を算出する。本実施形態では、前記▲1▼のDCTブロック符号化ビット数の計算は、画素毎に計算をしていたのではリアルタイムの処理に間に合わないので、ブロック単位予測誤差信号の統計量、例えば平均値m、分散σ、および量子化ステップサイズΔを基に、既知の発生ビット推定関数f(m,σ,Δ)から各ブロック毎の発生ビット数を推定する。また、▲2▼の動きベクトルのオーバヘッドビット数は、VLCテーブル等から算出する。
【0016】
そして、マクロブロック内で、DCTブロックの符号化ビット数が0となる、あるいは符号化ビット数が0となるDCTブロックが大半を占める候補が一つ以上存在する場合には、この符号化モードを優先的に採用した上で、これらの中から予測誤差電力、すなわち予測誤差信号の2乗和が最小となるものを符号化モードとして決定する。
【0017】
一方、前記のような候補が存在しない場合には、マクロブロックの発生ビット数を、各符号化モード毎に、4個のDCTブロックの符号化ビット数と、それ以外のオーバヘッドビット数から算出し、最小となるものを符号化モードとして決定する。
【0018】
なお、前記発生ビット推定関数f(m,σ,Δ)の一例としては、各量子化ステップサイズΔを変化させて実測により決定される次の関数を用いることができる。例えば、イントラ符号化モードの時には、f(m,σ,Δ)=g(m)+a×log σ +bを用いることができる。ここに、関数g(m)はDCT入力となる予測誤差信号の平均値mから推定される発生ビット数であり、{a×log σ +b}は、分散値σから推定される発生ビット数である。なお、aおよびbは定数であり、実験結果により決定される。また、インター符号化モードの時には、前記g(m)=0として、f(m,σ,Δ)=a×log σ+bを用いることができる。
【0019】
図2のステップS21においてブロック数を表すN(k’)を0、ある置き数xを1と置き、ステップS22で候補となる符号化モードkを0と置く。ここに、該候補となる符号化モードは図7のkに相当し、Iピクチャは2候補(k=0〜1)、Pピクチャは6候補(k=0〜5)、およびBピクチャは14候補(k=0〜13)となる。
【0020】
ステップS23では、マクロブロックMBjの符号化モードkの動きベクトルMVを取得する。ステップS24では、マクロブロックMBjの予測誤差信号を取得する。ステップS25では、該予測誤差信号を基に、DCTブロック符号化ビット数SA(m)(m=0〜3)を推定する。この推定は、前記した発生ビット推定関数f(m,σ,Δ)を用いて行われる。ステップS26では、該推定されたDCTブロック符号化ビット数SA(m)が、SA(m)=0になるブロック数N(k)をカウントする。1マクロブロック当たりのDCTブロック数は4個であるので、SA(m)=0になるブロック数N(k)は最大で4個になる。
【0021】
ステップS27では、該SA(m)=0になるブロック数N(k)がある閾値THより大きいか否かの判断がなされる。この判断は、符号化ビット数が0となるDCTブロックが大半を占めるかどうかの判定であるので、閾値THとしては、2又は3が好適である。以下の説明では、TH=2として説明する。
【0022】
ステップS27の判断が否定の時には、ステップS28に進んで、N(k’)>0が成立するか否かの判断がなされる。N(k’)=0であると否定と判断されてステップS29に進み、オーバヘッドビット数SBを算出する。ステップS30では、(DCTブロックの符号化ビット数SA(m)のマクロブロック合計+オーバヘッドビット数SB)が求められ、これがST(k)と置かれる。なお、画像Piの符号化ピクチャ(ステップS3の判断)がフレーム内符号化(Iピクチャ)の場合には、DCTブロックの符号化ビット数推定対象をDC係数を除く全てのAC係数とし、DC係数はオーバヘッドビット数に含めることにする。
【0023】
ステップS31では、ST(k)の最小値が更新されたか否かの判断がなされる。この判断が肯定の時には、ステップS32に進んで、minST(k)のkを保持する。このkをk’とする。ステップS31の判断が否定の時、またはステップS32の処理が終了すると、ステップS33に進んで、kに1が加算されて評価対象とする符号化モードが更新される。ステップS34では、kがkmax に等しくなったか否かの判断がなされる。すなわち、Iピクチャであればkmax=1、Pピクチャであればkmax=5、Bピクチャであればkmax=13となる。ステップS34の判断が否定の時には、ステップS23に戻って、次の符号化モードの動きベクトルMVを取得する動作が行われる。
【0024】
次に、SA(m)=0となるブロック数N(k)が3または4となって、ステップS27の判断が肯定になった時の動作を、図3を参照して説明する。
【0025】
ステップS35では、4個のDCTブロックの予測誤差電力を、Σ(x−y、(ただし、i=0〜N−1、NはDCTブロックの画素数)から算出し、その算出結果をMSE(k)と置く。ここに、x はブロックに対応する入力画像11の画素値、y はブロックに対応する動き補償予測信号aの要素である。
【0026】
ステップS36では、x=1であるか否かの判断がなされる。この判断が肯定の時には、ステップS37に進んでSA(m)=0のブロック数N(k)と予測誤差電力MSE(k)を保持し、以降の処理のために、それぞれを、N(k’)、MSE(k’)とする。ステップS38ではkをk’と置き、ステップS39ではxに1を加算する。そして、前記ステップS33に進む。
【0027】
一方、前記ステップS36の判断が否定の時、すなわちステップS27の判断が肯定になった回数が2回以上の時には、ステップS40に進んで、SA(m)=0のブロック数N(k)が前回のSA(m)=0のブロック数N(k’)より大きいか否かの判断がなされる。この判断が肯定の時にはステップS41に進んで、N(k’)がN(k)に更新される。また、ステップS42に進んで、k’がkに更新される。
【0028】
さらに、前記ステップS40の判断が否定の時には、ステップS43に進んで、予測誤差電力MSE(k)が前回の予測誤差電力MSE(k’)より小さいか否かの判断がなされる。この判断が肯定の時には、ステップS44に進んでk’がkに更新される。ステップS40、S43の判断が共に否定の時には、何らの処理をされずに、ステップS33に進む。
【0029】
図3の処理により、ブロック数N(k’)が0でなくなると、図2のステップS28の判断は常に肯定となり、ステップS29〜S32はスキップしてステップS33に進むようになる。ステップS34の判断が肯定になると、ステップS35に進み、前記の処理により選択された符号化モードk’が、最終的に当該マクロブロックの符号化モードとして採用される。
【0030】
以上の説明から明らかなように、本実施形態では、DCTブロック符号化ビット数SA(m)が0になるDCTブロック数N(k)が閾値TH以上になる符号化モードkがあれば、これを優先し、SA(m)=0を満たすDCTブロック数N(k)が大きくかつ予測誤差電力MSE(k)が小さい符号化モードkを選択する。
【0031】
一方、SA(m)=0を満たすDCTブロック数N(k)が閾値TH以上になる符号化モードkがなければ、(DCTブロックの符号化ビット数SA(m)のマクロブロック合計+オーバヘッドビット数SB)を求め、それを最小とする符号化モードkを選択する。この結果、動画像符号化におけるマクロブロック単位の適応モード判定を、より厳密に行うことができるようになる。
【0032】
【発明の効果】
以上の説明から明らかなように、請求項1の発明によれば、動画像符号化におけるマクロブロック単位の適応モード判定を厳密に行うことができるようになり、圧縮符号化の効率をさらに向上させることができるようになる。
【0033】
また、請求項の発明によれば、DCTブロックの符号化ビット数は予測誤差信号の統計量から推定するようにしたので、前記の効果に加えて、リアルタイム処理を行うハードウェア規模を実現可能なレベルに抑えることができる。
【図面の簡単な説明】
【図1】 本発明の全体の動作を示す概略フローチャートである。
【図2】 図1のステップS5、S9、およびS13の詳細を示すフローチャートである。
【図3】 図2の続きのフローチャートである。
【図4】 入力画像信号の概念図である。
【図5】 矩形小領域(マクロブロック)の発生ビット数の説明図である。
【図6】 従来の圧縮符号化方式の概略の構成を示すブロック図である。
【図7】 符号化モードの説明図である。
【符号の説明】
11・・・入力画像信号、13・・・DCT部、14・・・量子化部、15・・・逆量子化部、16・・・逆DCT部、19・・・動き推定・動き補償部、20・・・可変長符号化部、21・・・バッファ。

Claims (2)

  1. 矩形小領域単位で動画像の符号化処理を行う最適符号化モード選択型動画像符号化方式であって、
    各符号化ピクチャにつき、動き補償予測の参照方式、動き補償予測のタイプ、および直交変換のタイプの組み合わせにより規定される複数の符号化モード候補と、
    符号化処理を行う画像の符号化ピクチャを決定する手段と、
    前記決定された符号化ピクチャの符号化モード候補毎に、前記矩形小領域を形成する複数のDCTブロックの各符号化ビット数を求める手段と、
    前記矩形小領域内で符号化ビット数が0となるDCTブロックの個数が予め定められた閾値以上になったかどうかを判断する手段と、
    前記判断により前記閾値以上になるものがあった場合には、予測誤差電力が最小となるものを符号化モードとして決定し、前記閾値以上になるものがない場合には、DCTブロックの符号化ビット数とオーバヘッドビット数との和が小さいものを符号化モードとして決定する手段とを具備したことを特徴とする最適符号化モード選択型動画像符号化方式。
  2. 請求項1に記載の最適符号化モード選択型動画像符号化方式において、
    前記DCTブロックの符号化ビット数は、各符号化モードの予測誤差信号の統計量である平均値、分散および量子化ステップサイズから推定することを特徴とする最適符号化モード選択型動画像符号化方式。
JP2001350668A 2001-11-15 2001-11-15 最適符号化モード選択型動画像符号化方式 Expired - Fee Related JP3938679B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001350668A JP3938679B2 (ja) 2001-11-15 2001-11-15 最適符号化モード選択型動画像符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001350668A JP3938679B2 (ja) 2001-11-15 2001-11-15 最適符号化モード選択型動画像符号化方式

Publications (2)

Publication Number Publication Date
JP2003153280A JP2003153280A (ja) 2003-05-23
JP3938679B2 true JP3938679B2 (ja) 2007-06-27

Family

ID=19163122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001350668A Expired - Fee Related JP3938679B2 (ja) 2001-11-15 2001-11-15 最適符号化モード選択型動画像符号化方式

Country Status (1)

Country Link
JP (1) JP3938679B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005151391A (ja) 2003-11-19 2005-06-09 Toshiba Corp 動画像符号化方法、動画像符号化装置およびプログラム
JP4127818B2 (ja) 2003-12-24 2008-07-30 株式会社東芝 動画像符号化方法及びその装置

Also Published As

Publication number Publication date
JP2003153280A (ja) 2003-05-23

Similar Documents

Publication Publication Date Title
JP4851741B2 (ja) ソース画像のシーケンスを符号化する方法及び装置
JP2001061154A (ja) 画像予測復号化方法
JP2003348583A (ja) 適応的動映像符号化及び復号化方法とその装置
JP2006157881A (ja) 可変長符号化装置及びその方法
JPH08512188A (ja) ビデオ・ブロックをイントラ・コーディングするかどうかを判定する方法
JP4417054B2 (ja) 離散コサイン変換係数を参照する動き推定方法及び装置
KR100727988B1 (ko) 변환 영역에서의 dc 계수 예측 방법 및 장치
JP4130617B2 (ja) 動画像符号化方法および動画像符号化装置
JP2011091772A (ja) 画像符号化装置
JP5136470B2 (ja) 動画像符号化装置及び動画像符号化方法
JP4532607B2 (ja) ブロック・ベースのコード化システムにおいてコード化モードを選択するための装置および方法
US6141449A (en) Coding mode determination system
JP3938679B2 (ja) 最適符号化モード選択型動画像符号化方式
KR100359819B1 (ko) 압축영상의 공간 도메인에서의 효율적인 엣지 예측 방법
JP2001309384A (ja) 画像圧縮装置
KR101639434B1 (ko) 와이너-지브 부호화 및 복호화 시스템 및 방법
JP2000261809A (ja) 画像特徴に応じた画像符号化装置
JP3690259B2 (ja) 動画像高速符号化装置及び動画像高速符号化方法
JP4642033B2 (ja) 参照フレームの数を固定する符号化方式で画像の参照ブロックを取得する方法
JP2003032691A (ja) 画像特徴に応じた画像符号化装置
KR100778473B1 (ko) 비트율 제어 방법
JP4222046B2 (ja) 信号処理装置および方法、記録媒体、並びにプログラム
JP2008153802A (ja) 動画像符号化装置及び動画像符号化プログラム
KR20090037288A (ko) 동영상 부호화 데이터율 제어를 위한 실시간 장면 전환검출 방법, 이를 이용한 영상통화 품질 향상 방법, 및영상통화 시스템
JPH11205801A (ja) 動画像符号化装置およびその符号化選択方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070223

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070323

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100406

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160406

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees