JP5655480B2 - 動画像符号化装置 - Google Patents

動画像符号化装置 Download PDF

Info

Publication number
JP5655480B2
JP5655480B2 JP2010224682A JP2010224682A JP5655480B2 JP 5655480 B2 JP5655480 B2 JP 5655480B2 JP 2010224682 A JP2010224682 A JP 2010224682A JP 2010224682 A JP2010224682 A JP 2010224682A JP 5655480 B2 JP5655480 B2 JP 5655480B2
Authority
JP
Japan
Prior art keywords
prediction
mode
unit
intra
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010224682A
Other languages
English (en)
Other versions
JP2012080387A (ja
Inventor
楊 宋
楊 宋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2010224682A priority Critical patent/JP5655480B2/ja
Publication of JP2012080387A publication Critical patent/JP2012080387A/ja
Application granted granted Critical
Publication of JP5655480B2 publication Critical patent/JP5655480B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本件開示は、マクロブロックごとに決定されるベストモードを適用して圧縮符号化を行う動画像符号化装置に関する。
動画像の圧縮符号化方式としては、MPEG(Moving Picture Experts Group)−2/MPEG−4や、H.264/AVC(Advanced Video Coding)などが知られている。これらの圧縮符号化方式では、動画像に含まれる各ピクチャの画像は、例えば16×16画素のマクロブロックごとに圧縮処理される。
H.264/AVCでは、圧縮率を向上するために、多数の予測モードの中から、個々のブロックに適した予測モードを選択的に適用して圧縮処理が行われる。予測モードの選択は、それぞれの予測モードを適用した際の予測コストを求め、これらを比較した結果に基づいて行われる。したがって、PピクチャやBピクチャについては、7種類の画面間予測モードおよび22種類の画面間予測モードに、スキップモードあるいはダイレクトモードを加えた合計30種類の予測モードについて、予測コストがそれぞれ算出される(非特許文献1参照)。
例えば、Pピクチャの場合は、ベストインターモードのコストと、ベストイントラモードのコストと、スキップモードのコストとの中で最も小さいコストに対応する予測モードが選択される。なお、ベストインターモードは、7種類の画面間予測モードに対応する予測コストの中で、最も小さいコストを与えるモードである。また、ベストイントラモードは、22種類の画面内予測モードに対応する予測コストの中で、最も小さいコストを与えるモードである。
「H.264規格書」Joint Video Team of ITU-T and ISO/IEC JTC 1, "Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC)," document JVT-G050r1, May 2003; technical corrigendum 1 documents JVT-K050r1 (non-integrated form) and JVT-K051r1 (integrated form), March 2004; and Fidelity Range Extensions documents JVT-L047 (non-integrated form) and JVT-L050 (integrated form), July 2004
上述したように、従来方式では、各マクロブロックについて多数の予測モードでのコストを算出するので、コスト算出のための演算量が非常に多い。このため、ベストモード決定処理のためのハードウェアは大規模となり、消費電力も大きくなってしまう。
本件開示の装置は、動画像符号化装置において、ベストモード決定のための演算量を削減することを目的とする。
上述した目的は、以下に開示する動画像符号化装置によって達成することができる。
一つの観点による動画像符号化装置は、動画像データに含まれる各フレームに含まれるマクロブロックのうち、所定の密度で分布する複数の全探索ブロックそれぞれについて、全ての予測モードの中から最もコストの小さいベストモードを探索する全探索部と、各フレームに含まれるマクロブロックのうち、全探索ブロック以外の予測ブロックそれぞれについて、既にベストモードの探索が完了したマクロブロックのうち、当該予測ブロックに隣接するマクロブロックを含む参照範囲内のマクロブロックについての探索結果に基づいて、探索対象の予測ブロックのベストモードが属する予測モードの種別を予測する種別予測部と、各予測ブロックについて、種別予測部で予測された種別に含まれる予測モードの中からベストモードを探索する予測探索部とを備える。
本件開示の動画像符号化装置によれば、ベストモード決定のための演算量を削減することができる。
動画像符号化装置の一実施形態を示す図である。 全探索ブロックと予測ブロックとの関係を説明する図である。 イントラモード予測部の一実施形態を示す図である。 スキップモード予測部の一実施形態を示す図である。 予測モードの種別を予測する動作を表す流れ図である。 動画像符号化動作を表す流れ図である。 画質評価結果を説明する図である。 全探索ブロックおよび予測ブロックの別の配置例を説明する図である。 全探索ブロックおよび予測ブロックの更に別の配置例を説明する図である。 イントラモード予測部の別実施形態を示す図である。 スキップモード予測部の別実施形態を示す図である。
以下、図面に基づいて、本件開示の動画像符号化装置の実施形態について詳細に説明する。
(一の実施形態)
図1に、動画像符号化装置の一実施形態を示す。
図1に示した動画像符号化装置は、イントラ予測部101とインター予測部102とモード決定部103とDCT量子化部104とエントロピー符号化部106と再構成画像生成部106と再構成画像保持部107と種別予測部110とを備える。
符号化対象の動画像データは、図1に示した入力ポートPinを介して、イントラ予測部101およびインター予測部102に入力される。モード決定部103は、イントラ予測部101による予測結果およびインター予測部102による予測結果のいずれかを選択的にDCT量子化部104に入力する。DCT量子化部104による量子化処理結果は、エントロピー符号化部105によって符号化される。生成された符号化データは、出力ポートPoutを介して出力される。また、再構成画像生成部106は、DCT量子化部104による量子化処理結果から再構成画像を生成する。この再構成画像は、イントラ予測部101の予測処理に供されるとともに、再構成画像保持部107に保持される。そして、再構成画像保持部107に保持された再構成画像は、インター予測部102による予測処理に供される。
イントラ予測部101は、入力される動画像データの各ピクチャに含まれる各マクロブロックについて、種別予測部110からの指示に応じてイントラ予測を行う。イントラ予測部101では、イントラ予測モードに含まれる複数の予測モードを適用して、予測処理が行われる。そして、この予測処理により、各予測モードの予測画像とコストとが求められる。なお、イントラ予測モードに含まれる各予測モードは、例えば、3種類のマクロブロックサイズと9種類あるいは4種類の予測方向との組み合わせで示される。
インター予測部102は、入力される動画像データの各ピクチャに含まれる各マクロブロックについて、種別予測部110からの指示に応じてインター予測を行う。インター予測部102では、インター予測モードに含まれる複数の予測モードを適用して、予測処理が行われる。そして、この予測処理により、各予測モードの予測画像とコストとが求められる。なお、インター予測モードには、例えば、マクロブロックサイズが異なる7種類の予測モードが含まれる。
モード決定部103は、イントラ予測部101およびインター予測部102による予測結果の中から、最もコストが低いベストモードによる予測画像を選択する。選択された予測画像およびコストは、DCT量子化部104およびエントロピー符号化部105によって符号化される。
図1に示した種別予測部110は、各ピクチャに含まれる各マクロブロックのうち、後述するように分布する予測ブロックについて、ベストモードが含まれる予測モードの種別を予測する。ベストモードがイントラ予測モードに含まれることを予測した場合に、種別予測部110は、イントラ予測部101に対して、当該予測ブロックについてイントラ予測処理を実行する旨を指示する。この指示に応じて、イントラ予測部101とモード決定部103とにより、イントラ予測モードの中からベストモードが探索される。また、ベストモードがインター予測モードに含まれることを予測した場合に、種別予測部110は、インター予測部102に対して、当該予測ブロックについてインター予測処理を実行する旨を指示する。この指示に応じて、インター予測部102とモード決定部103とにより、インター予測モードの中からベストモードが探索される。一方、各ピクチャに含まれる各マクロブロックのうち、後述するように分布する全探索ブロックについて、種別予測部110は、イントラ予測部101とインター予測部102との双方に、それぞれの予測処理を実行する旨を指示する。この指示に応じて、イントラ予測部101とインター予測部102とモード決定部103とにより、イントラ予測モードおよびインター予測モードを含む全ての予測モードの中からベストモードが探索される。
図1に示した実施形態では、種別予測部110は、探索結果記憶部111と、探索結果読出部112と、イントラモード予測部113と、スキップモード予測部114と、予測種別出力部115と、モード予測制御部116と、配置情報記憶部117とを備える。
探索結果記憶部111は、モード決定部103によって各マクロブロックのベストモードが決定されるごとに、このベストモードと対応するコストとを含む探索結果を、例えば、マクロブロックのピクチャにおける位置に対応して記憶する。探索結果読出部112は、モード予測制御部116からの指示に応じて、予測対象の予測ブロックに対応する参照範囲に含まれる各マクロブロックのベストモードおよびコストを読み出す。読み出されたベストモードおよびコストは、イントラモード予測部113およびスキップモード予測部114に入力される。
予測種別出力部115は、イントラモード予測部113およびスキップモード予測部114による予測結果と、モード予測制御部116からの通知とに基づいて、イントラ予測部101およびインター予測部102への指示を作成する。モード予測制御部116は、配置情報記憶部117に保持された配置情報を参照し、符号化対象のマクロブロックが全探索ブロックであるか予測ブロックであるかを判断する。この判断結果は、予測種別出力部115に通知される。符号化対象のマクロブロックが全探索ブロックである旨の通知に応じて、予測種別出力部115は、イントラ予測部101とインター予測部102との双方の予測処理を実行させる指示を作成する。一方、予測ブロックである旨の通知に応じて、予測種別出力部115は、イントラモード予測部113およびスキップモード予測部114による予測結果に基づいて、イントラ予測部101あるいはインター予測部102に予測処理を実行させる指示を作成する。つまり、図1に示した構成例では、種別予測部110からの指示に応じて、イントラ予測部101とインター予測部102との両方が予測処理を行うことで、全探索ブロックについてベストモードを探索する全探索部が実現されている。また、種別予測部110からの指示に応じて、イントラ予測部101あるいはインター予測部102が選択的に予測処理を行うことで、予測ブロックについてベストモードを探索する予測探索部が実現されている。
配置情報記憶部117には、例えば、動画像データに含まれる各ピクチャにおける全探索ブロックの分布に関する配置情報が保持されている。そして、モード予測制御部116は、この配置情報に基づいて、符号化対象のマクロブロックが全探索ブロックであるか、全探索ブロック以外の予測ブロックであるかを判断する。
図2に、全探索ブロックと予測ブロックとの関係を説明する図を示す。図2(A)に、全探索ブロックと予測ブロックとの分布を示す。また、図2(B)に、符号化対象の予測ブロックと参照範囲との関係を示した。なお、図2(A)において、全探索ブロックを、網掛けを付して示した。
図2(A)の例では、1ピクチャに含まれるN×M個のマクロブロックの半分が全探索ブロックである。そして、残りの半分が予測ブロックである。また、図2(A)の例では、全探索ブロックおよび予測ブロックは1ピクチャ内に均一に分布している。なお、図2の例では、各マクロブロックのピクチャ内での位置を、行番号と列番号との組で示した。
図2(B)の例では、符号化対象の予測ブロックT:MB(j、k)に対応する参照範囲に含まれるマクロブロックを、破線で囲んで示した。なお、図2(B)の例では、1ピクチャに含まれる各マクロブロックは、第1行から列番号の若い順に動画像符号化装置による符号化対象となっている。この場合に、参照範囲に含まれる各マクロブロックの位置は、図2(B)に示すような行番号と列番号との組で示される。
本出願人は、様々な動画像シーケンスについて、ピクチャ内での予測モードの分布を調べた。その結果、各種別の予測モードが適用されたマクロブロックは、ピクチャ内で集中して分布していることが分かった。つまり、各マクロブロックのベストモードと、その周囲のマクロブロックのベストモードとの間には相関がある。この相関関係を利用すれば、符号化対象のマクロブロックのベストモードを、このマクロブロックの周囲のマクロブロックに対応するベストモードから予測することができる。
例えば、図2(B)に示した参照範囲に含まれる各マクロブロックの符号化処理は、符号化対象のマクロブロックTに先立って完了している。したがって、上述した参照範囲内の各マクロブロックに対応するベストモードおよびコストを含む探索結果は、既に、探索結果記憶部111に記憶されている。そして、この参照範囲内の各マクロブロックに対応する探索結果が、探索結果読出部112を介して、イントラモード予測部113、スキップモード予測部114の処理に供される。
イントラモード予測部113では、例えば、探索結果読出部112から受け取った探索結果が、所定のイントラ判定条件を満たすときに、符号化対象の予測ブロックのベストモードがイントラ予測モードに含まれる旨の予測結果を出力する。イントラモード予測部113は、イントラ判定条件として、イントラ予測モードに含まれる予測モードが適用されたイントラブロックの数Nrと、参照範囲内の4つのマクロブロックに対応するコストC1〜C4とに関する条件を用いることができる。イントラモード予測部113は、例えば、次に挙げる条件1と条件2とが両方とも真であるときに、符号化対象の予測ブロックに適合する予測モードの種別はイントラ予測モードであると判定する。
条件1:イントラブロックの数Nrが所定の閾値Th3以上である。
条件2:イントラブロックのコストの平均値D1と、インター予測モードに含まれる予測モードが適用されたインターブロックのコストの平均値D2との比(D1/D2)が所定の閾値Th4以下である。
上述した条件1は、参照範囲内の各マクロブロックのベストモードと符号化対象の予測ブロックに適用すべき予測モードとの相関関係を用いた条件である。例えば、閾値Th3として数値「2」を用いれば、参照範囲内のマクロブロックのうち半数以上のベストモードがイントラ予測モードである場合に、上述した条件1が満たされる。
一方、条件2は、参照範囲の画像の特徴と符号化対象の予測ブロックの画像の特徴との相関関係を用いた条件である。この条件2では、符号化対象の画像が複雑である場合に、予測モードとしてはイントラ予測モードが適することと、イントラ予測モードによるコストとインター予測モードによるコストとの間に大きな開きがないことを利用する。例えば、閾値Th4として数値「1.5」を用いれば、参照範囲の画像が複雑である場合に、上述した条件2が満たされる。
つまり、上述したイントラ判定条件を用いることにより、予測モードについての相関関係に加えて、画像の特徴についての相関関係を考慮して、符号化対象の予測ブロックにイントラ予測モードが適するか否かを判定することができる。
また、イントラモード予測部113は、更に、次に挙げる条件3が真であった場合に、条件2の真偽にかかわらず、符号化対象の予測ブロックにイントラ予測モードが適すると判定することができる。
条件3:参照範囲内の全てのマクロブロックに対応する予測モードがイントラ予測モードに含まれる。
図3に、イントラモード予測部の一実施形態を示す。なお、図3に示した構成要素のうち、図1に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。
図3に示したイントラモード予測部113は、上述した条件1〜3を用いて符号化対象の予測ブロックに適合する予測モードの種別がイントラ予測モードであるか否かを判定する。図3に示した例では、イントラモード予測部113は、イントラブロック計数部121、イントラコスト平均部122、インターコスト平均部123、除算器124、イントラ判定部125を備えている。
探索結果読出部112によって読み出された探索結果のうち、各マクロブロックのベストモードはイントラブロック計数部121に渡される。一方、探索結果のうち、各マクロブロックに対応するコストは、イントラコスト平均部122およびインターコスト平均部123に渡される。イントラブロック計数部121は、例えば、探索結果読出部112からベストモードとしてイントラ予測モードに属する予測モードを示す情報を受け取った回数を計数する。この計数結果は、イントラブロックの数Nrとしてイントラ判定部125に渡される。イントラコスト平均部122は、探索結果読出部112から受け取ったコストのうち、イントラ予測モードに属する予測モードに対応するコストについて平均値D1を算出する。インターコスト平均部123は、探索結果読出部112から受け取ったコストのうち、インター予測モードに属する予測モードに対応するコストについて平均値D2を算出する。除算器124は、イントラコスト平均部122で得られた平均値D1をインターコスト平均部123で得られた平均値D2で除算し、比D1/D2を求める。算出された比D1/D2は、イントラ判定部125に渡される。
イントラ判定部125は、上述したようにして求められたイントラブロックの数Nrおよび比D1/D2をそれぞれの閾値Th3,Th4と比較する。そして、この比較結果により、上述した条件1,2の両方が満たされることが示された場合に、符号化対象の予測ブロックに適合する予測モードの種別は、イントラ予測モードであると判定する。また、イントラ判定部125は、イントラブロックの数Nrが参照範囲内のマクロブロックの総数(例えば4)である場合に、符号化対象の予測ブロックに適合する予測モードの種別は、イントラ予測モードであると判定する。この場合は、除算器124による除算結果の出力を待たずに、上述した判定結果を予測種別出力部115に渡すことができる。
一方、スキップモード予測部114では、例えば、探索結果読出部112から受け取った探索結果が、所定のスキップ判定条件を満たすときに、符号化対象の予測ブロックのベストモードがスキップモードである旨の予測結果を出力する。スキップモード予測部114は、スキップ判定条件として、イントラ予測モードに含まれる予測モードが適用されたイントラブロックの数Nrと、参照範囲内の4つのマクロブロックに対応するコストC1〜C4とに関する条件を用いることができる。スキップモード予測部114は、例えば、次に挙げる条件4と条件5とが両方とも真であるときに、符号化対象の予測ブロックに適合する予測モードはスキップモードであると判定する。
条件4:イントラブロックの数Nrが所定の閾値Th1以下である。
条件5:参照範囲内の各マクロブロックに対応するコストは所定の閾値Th2以下である。
上述した条件は、参照範囲内の各マクロブロックのベストモードと符号化対象の予測ブロックに適用すべき予測モードとの相関関係を用いた条件である。例えば、閾値Th1として数値「0」を用いれば、参照範囲内の全マクロブロックのベストモードがインター予測モードである場合に、上述した条件4が満たされる。
一方、条件5は、参照範囲の画像の特徴と符号化対象の予測ブロックの画像の特徴との相関関係を用いた条件である。この条件5では、符号化対象の画像が複雑でない場合に、予測モードとしてスキップモードを適用することができることを用いている。そして、参照範囲内の各マクロブロックに対応するコストが上述した閾値Th2以下であるか否かにより、符号化対象の画像が複雑であるか否かを判定している。画像の複雑さを判定するための閾値Th2としては、例えば、量子化パラメータQPに数値「4」を乗じた値を用いることができる。
つまり、上述したイントラ判定条件を用いることにより、予測モードについての相関関係に加えて、画像の特徴についての相関関係を考慮して、符号化対象の予測ブロックにスキップモードが適するか否かを判定することができる。
また、スキップモード予測部114は、更に、次に挙げる条件6が真であった場合に、条件5の真偽にかかわらず、符号化対象の予測ブロックにスキップ予測モードが適すると判定することができる。
条件6:参照範囲内の全てのマクロブロックに対応する予測モードがスキップモードである。
図4に、スキップモード予測部の一実施形態を示す。なお、図4に示した構成要素のうち、図1に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。
図4に示したスキップモード予測部114は、上述した条件4〜6を用いて符号化対象の予測ブロックに適合する予測モードの種別がインター予測モードの一つであるスキップモードであるか否かを判定する。図4に示した例では、スキップモード予測部114は、イントラブロック計数部121、スキップブロック計数部126、最大コスト検出部127、スキップ判定部128を備えている。
探索結果読出部112によって読み出された探索結果のうち、各マクロブロックのベストモードはイントラブロック計数部121およびスキップブロック計数部126に渡される。一方、探索結果のうち、各マクロブロックに対応するコストは、最大コスト検出部127に渡される。イントラブロック計数部121は、例えば、探索結果読出部112からベストモードとしてイントラ予測モードに属する予測モードを示す情報を受け取った回数を計数する。この計数結果は、イントラブロックの数Nrとしてスキップ判定部128に渡される。スキップブロック計数部126は、例えば、探索結果読出部112からベストモードとしてスキップモードを示す情報を受け取った回数を計数する。この計数結果は、スキップブロックの数Nsとしてスキップ判定部128に渡される。最大コスト検出部127は、探索結果読出部112から受け取ったコストの中から、最大のコストCmaxを検出する。検出された最大のコストCmaxは、スキップ判定部128に渡される。
スキップ判定部128は、上述したようにして求められたイントラブロックの数Nrおよび最大のコストCmaxをそれぞれの閾値Th1,Th2と比較する。そして、この比較結果により、上述した条件4,5の両方が満たされることが示された場合に、符号化対象の予測ブロックには、スキップモードが適切であると判定する。この判定結果は、予測種別出力部115に通知される。また、スキップ判定部128は、スキップブロックの数Nsが参照範囲内のマクロブロックの総数(例えば4)である場合に、符号化対象の予測ブロックには、スキップモードが適切であると判定する。この場合は、最大コスト検出部127による最大のコストCmaxの検出を待たずに、上述した判定結果を予測種別出力部115に通知ことができる。
このようにして、符号化対象の予測ブロックにはスキップモードが適合する旨が通知されたときに、予測種別出力部115は、インター予測部102に対して、符号化対象のマクロブロックについて、スキップモードによる予測処理の実行を指示する。一方、イントラモード予測部113から、イントラ予測モードが適合する旨が通知された場合に、予測種別出力部115は、イントラ予測部101に対して、イントラ予測モードによる予測処理の実行を指示する。また、イントラ判定条件とスキップ判定条件とのいずれも満たされない旨が通知された場合に、予測種別出力部115は、インター予測部102に対して、インター予測モードによる予測処理の実行を指示する。なお、この場合に、予測種別出力部115は、インター予測モードのうち、スキップモードを探索範囲から除外する旨をインター予測部102に指示することができる。
図1に示した種別予測部110の一例に含まれる各構成要素は、カウンタや比較器、加算器や除算器および論理ゲート回路などのハードウェア素子を用いて構成することが可能である。なお、図3および図4にそれぞれ示したイントラブロック計数部121は、イントラモード予測部113とスキップモード予測部114とで共通に設けることもできる。
また、この種別予測部110は、ソフトウェアによって実現することも可能である。
図5に、予測モードの種別を予測する動作を表す流れ図を示す。図5に示した例では、スキップ判定条件による判定とイントラ判定条件による判定とを順次に行っている。なお、これらの判定処理の順序は入れ替え可能である。
まず、ステップS11において、符号化対象の予測ブロックに対応する参照範囲に含まれる各マクロブロックの探索結果が読み込まれる。この処理は、上述したモード予測制御部116からの指示に応じて探索結果読出部112によって実行される処理に相当する処理の一例である。
次いで、ステップS12において、スキップ判定条件およびイントラ判定条件で各閾値Th1〜Th4と比較される指標値が、読み込まれた探索結果に基づいて算出される。例えば、上述したスキップモード予測部114およびイントラモード予測部113において説明したようにして、イントラブロックの数Nr、最大コストCmaxおよびコストの平均値の比D1/D2などの指標を、探索結果から求めることができる。なお、算出する指標値に、上述したスキップブロックの数Nsを含めることもできる。
上述した指標値と閾値Th1,Th2との比較に基づいて、スキップ判定条件が満たされたと判定された場合に(ステップS13の肯定判定)、予測種別はスキップモードである旨が出力される(ステップS14)。
一方、ステップ313の否定判定の場合は、上述した指標値と閾値Th3,Th4との比較に基づいて、イントラ判定条件が満たされるか否かが判定される(ステップS15)。ステップS15の肯定判定の場合に、予測種別はイントラモードである旨が出力される(ステップS16)。そして、否定判定の場合には、予測種別はインターモードである旨が出力される(ステップS17)。
上述したような構成を備えた種別予測部を備えた動画像符号化装置によれば、ピクチャ内に分布する予測ブロックについては、ベストモードの探索範囲を、予測種別に応じて限定することができる。
図6に、動画像符号化動作を表す流れ図を示す。なお、図6においては、マクロブロックを「MB」と略称する。
符号化対象のマクロブロックが動画像符号化装置に入力されるごとに、モード予測制御部116により、当該マクロブロックが全探索ブロックであるか予測ブロックであるかが判定される(ステップS1,S2)。
符号化対象のマクロブロックが全探索ブロックである場合には(ステップS2の肯定判定)、種別予測部110からの指示に応じて、イントラ予測部101およびインター予測部102により、全ての予測モードの中からベストモードが探索される(ステップS3)。
一方、ステップS2の否定判定の場合に、種別予測部110により、符号化対象のマクロブロックに適合する予測モードの種別が、対応する参照範囲の各マクロブロックについての探索結果から予測される(ステップS4)。そして、予測された種別に応じて、イントラ予測部101あるいはインター予測部102により、対応する種別に含まれる予測モードの中からベストモードが探索される(ステップS5)。
ステップS6では、上述したステップS3あるいはステップS5で得られたベストモードおよび対応するコストを含む探索結果が、動画像符号化装置の内部に備えられたメモリなどに記憶される。また、ステップS7では、ベストモードによる予測結果に基づいて、符号化対象のマクロブロックが符号化される。なお、ステップS6,S7の処理は順不同で実行することができる。
次いで、ステップS8において、符号化対象のマクロブロックがピクチャに含まれる最後のマクロブロックであるか否かを判定する。ステップS8の否定判定の場合は、ステップS1に戻って、次のマクロブロックの符号化処理を実行する。このようにして、ステップS1〜ステップS8を繰り返していき、ピクチャに含まれる全てのマクロブロックの符号化処理が完了したときに、ステップS8の肯定判定として1ピクチャ分の符号化処理を終了する。
上述したように、本件開示の動画像符号化装置は、予測ブロックについては、種別予測部110によって予測された種別に応じて、イントラ予測部101あるいはインター予測部102が選択的に予測処理を実行する。したがって、予測ブロックについてベストモードを探索する処理に要する演算量を削減することができる。
図2(A)に示した例では、ピクチャ内の半分のマクロブロックが予測ブロックである。これらの予測ブロックの60%についてインター予測モードが、20%についてスキップモードが、そして、20%についてイントラ予測モードが予測された場合を例として、削減される演算量の概略を示す。上述した比率でインター予測モードが予測された場合に、ピクチャに含まれるN×M個のマクロブロックのうち、30%のマクロブロックについては、インター予測部102による予測処理のみが行われる。そして、これらのマクロブロックについては、イントラ予測部101による22種類の予測モードに従う予測処理は省略される。同様に、ピクチャに含まれる全マクロブロックのうち、別の10%のマクロブロックについては、スキップモードによる予測処理のみが行われる。そして、これらのマクロブロックについては、イントラ予測部101による予測処理と、インター予測部102による予測処理のうち、スキップモード以外の7種類の予測モードによる予測処理は省略される。また、ピクチャに含まれる全マクロブロックのうち、更に別の10%のマクロブロックについては、イントラ予測部101による予測処理のみが行われる。そして、これらのマクロブロックについては、インター予測部101による8種類の予測モードに従う予測処理は省略される。
上述したような割合でイントラ予測部101およびインター予測部102による予測処理が省略されることを考慮して、イントラ予測部101およびインター予測部102に割り当てるハードウェア量を削減することが可能である。また、予測処理の省略が行われる際に、イントラ予測部101あるいはインター予測部102への電力供給を抑制する制御を行うことにより、動画像符号化装置による消費電力を削減することが可能である。
一方、本件開示の動画像符号化装置では、上述した演算量の削減を実現するとともに、符号化データに基づいて復元される動画像の画質も維持されている。本出願人は、HDTV向けのテストシーケンスを用いて、本件開示の動画像符号化装置によって符号化された動画像符号データに対応する復元動画像の画質を評価した。
図7に、画質評価結果を説明する図を示す。なお、図7に示したグラフの横軸は、符号化に適用したビットレートを示し、縦軸は画質を示す。また、本件開示の動画像符号化装置において、全マクロブロックのうち半数を予測ブロックとした場合の画質評価結果を、図7に実線で示した。一方、全てのマクロブロックを全探索ブロックとした場合の画質評価結果を、図7に破線で示した。
図7から分かるように、本件開示の動画像符号化装置により、幅広いビットレートの範囲において、全てのマクロブロックを全探索ブロックとした場合と同等の画質を実現することができる。このことから、図1に例示した種別予測部110により、符号化対象のマクロブロックに適合する予測モードが属する予測モードの種別が、高い精度で予測されていることが分かる。
また、本件開示の動画像符号化装置では、予測モードの種別の予測に用いる閾値を調整することにより、ピクチャ内でイントラ予測モードあるいはスキップモードが適用されるマクロブロックの比率を調整することもできる。これにより、動画像符号化データのビットレートを所望の値になるように調整することができる。
例えば、上述したイントラ判定条件に含まれる閾値Th4の値を例示した数値1.5よりも小さい値にすることにより、予測モードについての予測結果がイントラ予測モードとなる予測ブロックの数を抑制することができる。更に、スキップ判定条件に含まれる閾値Th2の値を例示した数値4QPよりも大きい値にすることにより、予測結果がスキップモードとなる予測ブロックの数を多くすることができる。このようにして、イントラ予測モードが適用されるマクロブロックの数を抑制し、逆に、スキップモードが適用されるマクロブロックの数を増大させることにより、低いビットレートの動画像符号化データを得ることができる。
逆に、上述したイントラ判定条件に含まれる閾値Th4の値を例示した数値1.5よりも大きい値にすることにより、予測モードについての予測結果がイントラ予測モードとなる予測ブロックの数を増大させることができる。更に、スキップ判定条件に含まれる閾値Th2の値を例示した数値4QPよりも小さい値にすることにより、予測結果がスキップモードとなる予測ブロックの数を抑制することができる。このようにして、イントラ予測モードが適用されるマクロブロックの数を増大させ、逆に、スキップモードが適用されるマクロブロックの数を抑制ことにより、画質を優先した動画像符号化データを得ることができる。
本件開示の動画像符号化装置によれば、ピクチャ内に配置された予測ブロックの比率が高いほど、演算量の削減効果が高くなる。例えば、ピクチャ内に、全マクロブロックの半数を超える数の予測ブロックを配置して、演算量の削減効果を高めることも可能である。
(別の実施形態)
図8(A),(B)に、全探索ブロックおよび予測ブロックの別の配置例を示す。
図8(A)に示した配置例では、ピクチャに含まれる全マクロブロックのうち2/3が予測ブロックとなっている。この配置例では、全探索ブロックの配置密度は、1/3となる。一方、図8(B)に示した配置例では、ピクチャに含まれる全マクロブロックのうち3/4が予測ブロックとなっている。この配置例では、全探索ブロックの配置密度は、1/4となる。
いずれの配置例を適用した場合でも、符号化対象の予測ブロックに隣接するマクロブロックのうち、符号化処理が完了している4つのマクロブロックを参照範囲として、予測モードの種別を予測することができる。そして、各予測ブロックに対応する参照範囲には、少なくとも一つの全探索ブロックが含まれている。つまり、各予測ブロックについて得られた予測結果には、全探索ブロックについての探索結果が確実に反映される。したがって、符号化対象の予測ブロックの予測結果として、この予測ブロックの近傍における画像の特徴に適合した予測モードの種別を高い精度で得ることができる。
図8(A),(B)に示した配置例を適用した予測処理は、図5を用いて説明したステップS11〜ステップS17と同様に、スキップ判定条件およびイントラ判定条件を利用して行うことができる。なお、スキップ判定条件およびイントラ判定条件に含まれる閾値は、それぞれの配置例について異なる値を設定することができる。それぞれの配置例に適合する閾値の値は、例えば、テストシーケンスの符号化を行う実験などに基づいて決定することができる。
なお、本件開示の動画像符号化装置で用いる全探索ブロックおよび予測ブロックの配置パターンは、上述したような一様な密度で全探索ブロックおよび予測ブロックが配置されたパターンに限られない。例えば、ピクチャ内に、1/2の密度で全探索ブロックが分布している高密度領域RHと、1/3あるいは1/4の密度で全探索ブロックが分布している低密度領域RLとが混在していてもよい。
図9(A)、(B)に、全探索ブロックおよび予測ブロックの更に別の配置例を示す。図9(A)の例では、ピクチャの中央部に配置された高密度領域RHに網掛けを付して示すことにより、周囲の低密度領域RLと区別して示した。また、図9(A)の例では、複数の高密度領域RH1、RH2,RH3にそれぞれ網掛けを付して示すことにより、周囲の低密度領域RLと区別して示した。
ピクチャの中央部は、主要な被写体が捉えられている場合が多いため、人間の視覚で画質の劣化が捉えられやすいと考えられる。そこで、図9(A)に示したように、この領域に高密度領域RHを配置して、この領域における予測モードの予測精度を高め、画面中央部の復元画像の画質を維持する。その一方、画面の周辺部分に当たる領域に低密度領域RLを配置すれば、演算量の削減を図ることができる。つまり、図9(A)に示したような配置例を適用することにより、画面中央部分における復元画像の画質を維持しつつ、更なる演算量の削減を図ることができる。
その一方、複数の被写体が画面内に同時に捉えられている場合などに対応するために、図9(B)に示したように、複数の高密度領域RHを配置することもできる。ピクチャ内に配置される高密度領域の大きさや数は、例えば、ピクチャごとに、画像の特徴を解析するための前処理を行って決定することができる。この前処理では、例えば、エッジ強度が所定の閾値よりも高い領域を検出すればよい。ここで、ピクチャ内でエッジ強度が高い部分は、細部が多い部分であるので、画質の劣化が目立ちやすい部分であるといえる。したがって、そのような部分について、選択的に高密度領域RHを配置することにより、復元画像の画質を維持することができる。また、この場合も、周囲の領域を低密度領域RLとすることにより、演算量の削減を図ることができる。
なお、上述したような全探索ブロックおよび予測ブロックについての様々な配置例は、いずれも、例えば、図1に示した配置情報記憶部117に記憶させる配置情報を制御することによって実現することができる。
また、以上に説明した様々な配置例において、符号化対象の予測ブロックについての予測モードの種別を予測するために、図2(B)に示した参照範囲よりも広い範囲を参照することもできる。例えば、図8(A)に破線で示したような参照範囲に含まれる各マクロブロックの探索結果を利用して、符号Tで示した符号化対象の予測ブロックについての予測モードの種別を予測することができる。図8(A)に示した例では、符号化対象の予測ブロックTの左側に隣接するマクロブロックと、上側に隣接するマクロブロックおよびその両側のマクロブロックに加えて、更に1行前の3つのマクロブロックが参照範囲に含まれている。
一方、各予測ブロックについて予測モードの種別を予測する際に、全探索ブロックについて得られた探索結果をより重視して、種別の予測結果に反映することもできる。
(更に別の実施形態)
図10に、イントラモード予測部の別実施形態を示す。また、図11に、スキップモード予測部の別実施形態を示す。なお、図10に示した構成要素のうち、図3に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。同様に、図11に示した構成要素のうち、図4に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。
図10に示したイントラモード予測部113は、図3に示した各部に加えて、重み乗算部131を備えている。重み乗算部131は、例えば、探索結果読出部112から参照範囲内の各マクロブロックに対応する探索結果に含まれるコストC1〜C4を受け取る。そして、受け取ったコストCj(jは1〜4のいずれか)が全探索ブロックに対応する場合に、重み乗算部131は、所定の重みWa1をコストCjに乗算する。一方、受け取ったコストCjが予測ブロックに対応する場合に、重み乗算部131は、別の所定の重みWp1をコストCjに乗算する。このようにして、重み乗算部131により、コストC1〜C4への重み付けが行われる。このようにして得られた重み付きコストは、イントラコスト平均部122およびインターコスト平均部123による平均値算出処理に供される。
重み乗算部131は、上述した重みWa1に重みWp1よりも大きい値を設定することができる。つまり、全探索ブロックに対応するコストに大きい重みをつけ、逆に、予測ブロックに対応するコストに小さい重みを付けることができる。この場合に、イントラコスト平均部122およびインターコスト平均部123によって、イントラ予測モードおよびインター予測モードについてそれぞれ算出される平均コストには、全探索ブロックについて得られたコストがより強く反映される。このような平均コストが、除算器124を介してイントラ判定部125による判定処理に供される。したがって、符号化対象の予測ブロックの予測モードとしてイントラ予測モードが適しているか否かの判定に、全探索ブロックについて得られた探索結果をより強く反映することができる。
また、図11に示したスキップモード予測部114は、図4に示した各部に加えて、重み乗算部132を備えている。重み乗算部132は、例えば、探索結果読出部112から参照範囲内の各マクロブロックに対応する探索結果に含まれるコストC1〜C4を受け取る。そして、受け取ったコストCj(jは1〜4のいずれか)が全探索ブロックに対応する場合に、重み乗算部132は、所定の重みWa2をコストCjに乗算する。一方、受け取ったコストCjが予測ブロックに対応する場合に、重み乗算部132は、別の所定の重みWp2をコストCjに乗算する。このようにして、重み乗算部132により、コストC1〜C4への重み付けが行われる。このようにして得られた重み付きコストは、最大コスト検出部127による最大値検出処理に供される。
重み乗算部132は、上述した重み乗算部131と同様に、重みWa2に重みWp2よりも大きい値を設定することができる。このように設定された重みWa2,Wp2を適用すれば、全探索ブロックに対応する重み付きコストが最大コストとして検出される確率が高くなる。このような最大コストが、スキップ判定部128による判定処理に供される。したがって、符号化対象の予測ブロックの予測モードとしてスキップ予測モードが適しているか否かの判定に、全探索ブロックについて得られた探索結果をより強く反映することができる。
101 イントラ予測部
102 インター予測部
103 モード決定部
104 DCT量子化部
105 エントロピー符号化部
106 再構成画像生成部
107 再構成画像保持部
110 種別予測部
111 探索結果記憶部
112 探索結果読出部
113 イントラモード予測部
114 スキップモード予測部
115 予測種別出力部
116 モード予測制御部
117 配置情報記憶部
121 イントラブロック計数部
122 イントラコスト平均部
123 インターコスト平均部
124 除算器
125 イントラ判定部
126 スキップブロック計数部
127 最大コスト検出部
128 スキップ判定部
131,132 重み乗算部

Claims (6)

  1. 動画像データに含まれる各フレームに含まれるマクロブロックのうち、所定の密度で分布する複数の全探索ブロックそれぞれについて、全ての予測モードの中から最もコストの小さいベストモードを探索する全探索部と、
    前記各フレームに含まれるマクロブロックのうち、前記全探索ブロック以外の予測ブロックそれぞれについて、既にベストモードの探索が完了したマクロブロックのうち、当該予測ブロックに隣接するマクロブロックを含む参照範囲内のマクロブロックについての探索結果に基づいて、探索対象の予測ブロックのベストモードが少なくともイントラ予測モードおよびインター予測モードのいずれかの種別に属するかを予測する種別予測部と、
    前記各予測ブロックについて、前記種別予測部で予測された種別に含まれる予測モードの中からベストモードを探索する予測探索部と、
    を備えたことを特徴とする動画像符号化装置。
  2. 動画像データに含まれる各フレームに含まれるマクロブロックのうち、所定の密度で分布する複数の全探索ブロックそれぞれについて、全ての予測モードの中から最もコストの小さいベストモードを探索する全探索部と
    前記各フレームに含まれるマクロブロックのうち、前記全探索ブロック以外の予測ブロックそれぞれについて、既にベストモードの探索が完了したマクロブロックのうち、当該予測ブロックに隣接するマクロブロックを含む参照範囲内のマクロブロックについての探索結果に基づいて、探索対象の予測ブロックのベストモードが属する予測モードの種別を予測する種別予測部と、
    前記各予測ブロックについて、前記種別予測部で予測された種別に含まれる予測モードの中からベストモードを探索する予測探索部と、を備え、
    前記種別予測部は、
    前記探索対象の予測ブロックに対応する参照範囲内のマクロブロックのうち、探索されたベストモードがイントラ予測モードに含まれる予測モードであるイントラ−マクロブロックの数と、前記参照範囲内の各マクロブロックのベストモードに対応するコストとを、予測モードの種別の予測に用いる

    ことを特徴とする動画像符号化装置。
  3. 請求項に記載の動画像符号化装置において、
    前記種別予測部は、
    前記探索対象の予測ブロックに対応する参照範囲内のマクロブロックのうち、探索されたベストモードがイントラ予測モードに含まれる予測モードであるイントラ−マクロブロックの数と、前記参照範囲内の各マクロブロックのベストモードに対応するコストとを、予測モードの種別の予測に用いる
    ことを特徴とする動画像符号化装置。
  4. 請求項2または請求項3に記載の動画像符号化装置において、
    前記種別予測部は、
    前記探索対象の予測ブロックに対応する参照範囲内に含まれるイントラ−マクロブロックの数が別の閾値Th3以上であり、かつ、前記イントラ−マクロブロックに対応するコストの平均値と前記参照範囲内の他のマクロブロックに対応するコストとの比が別の閾値Th4以下である場合に、当該予測ブロックについてイントラ予測モードを予測するイントラモード予測部を備えた
    ことを特徴とする動画像符号化装置。
  5. 請求項2乃至請求項4のいずれか一項に記載の動画像符号化装置において、
    前記種別予測部は、
    前記探索対象の予測ブロックに対応する参照範囲内に含まれるイントラ−マクロブロックの数が所定の閾値Th1以下であり、かつ、前記参照範囲内の各マクロブロックのベストモードに対応するコストが別の閾値Th2以下である場合に、当該予測ブロックについてスキップモードを予測するスキップモード予測部を備えた
    ことを特徴とする動画像符号化装置。
  6. 請求項2乃至請求項5のいずれか一項に記載の動画像符号化装置において、
    前記種別予測部は、
    前記探索対象の予測ブロックに対応する参照範囲内に含まれる全てのマクロブロックに対応する予測モードの種別が一致している場合に、当該予測ブロックについて前記予測モードの種別を予測結果として出力する一致予測部を備えた
    ことを特徴とする動画像符号化装置。
JP2010224682A 2010-10-04 2010-10-04 動画像符号化装置 Expired - Fee Related JP5655480B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010224682A JP5655480B2 (ja) 2010-10-04 2010-10-04 動画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010224682A JP5655480B2 (ja) 2010-10-04 2010-10-04 動画像符号化装置

Publications (2)

Publication Number Publication Date
JP2012080387A JP2012080387A (ja) 2012-04-19
JP5655480B2 true JP5655480B2 (ja) 2015-01-21

Family

ID=46240107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010224682A Expired - Fee Related JP5655480B2 (ja) 2010-10-04 2010-10-04 動画像符号化装置

Country Status (1)

Country Link
JP (1) JP5655480B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022121786A1 (zh) * 2020-12-11 2022-06-16 百果园技术(新加坡)有限公司 视频预测编码的方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006246431A (ja) * 2005-02-07 2006-09-14 Matsushita Electric Ind Co Ltd 画像符号化装置および画像符号化方法
JP4677932B2 (ja) * 2006-03-06 2011-04-27 日本電気株式会社 動画像符号化方法及び動画像符号化装置とプログラムならびに媒体
JP4719650B2 (ja) * 2006-08-31 2011-07-06 富士通株式会社 画像符号化装置
JP2009055542A (ja) * 2007-08-29 2009-03-12 Toshiba Corp 動画像符号化装置および動画像符号化方法

Also Published As

Publication number Publication date
JP2012080387A (ja) 2012-04-19

Similar Documents

Publication Publication Date Title
KR101208863B1 (ko) 비디오 데이터의 인코딩을 위한 인코딩 유형 및 예측 모드 선택
JP5554831B2 (ja) 歪みの重み付け
CN103997646A (zh) 一种高清视频编码中快速帧内预测模式选择方法
Zhao et al. Fast mode decision based on mode adaptation
Jamali et al. Fast HEVC intra mode decision based on edge detection and SATD costs classification
CN101815215A (zh) 编码模式选择的方法和装置
US20080037637A1 (en) Moving picture encoding apparatus
US11025913B2 (en) Encoding video using palette prediction and intra-block copy
JP2008227670A (ja) 画像符号化装置
Hu et al. Analysis and optimization of x265 encoder
Chen et al. Rough mode cost–based fast intra coding for high-efficiency video coding
US20240031576A1 (en) Method and apparatus for video predictive coding
KR20130055631A (ko) 영상 부호화 방법, 영상 복호 방법, 영상 부호화 장치, 영상 복호 장치 및 이들의 프로그램
CN102075751B (zh) 一种基于宏块运动状态的h264快速模式选择方法
Ramezanpour et al. Fast HEVC I-frame coding based on strength of dominant direction of CUs
JP5748225B2 (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
EP3621303B1 (en) Processing method and device for video encoding, and storage medium
JP5655480B2 (ja) 動画像符号化装置
KR101754500B1 (ko) 인트라 모드 결정 방법 및 장치
CN113992911A (zh) 全景视频h264编码的帧内预测模式确定方法和设备
CN113747166B (zh) 一种编解码方法、装置及其设备
Shang et al. Low-complexity intra-coding scheme for HEVC
CN109951707B (zh) 一种目标运动矢量选择方法、装置、电子设备及介质
Lin et al. Coding unit partition prediction technique for fast video encoding in HEVC
JP6239838B2 (ja) 動画像符号化装置、その制御方法、及び撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140501

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141028

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141110

R150 Certificate of patent or registration of utility model

Ref document number: 5655480

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees