JP6190103B2

JP6190103B2 - 動画像符号化装置、動画像符号化方法およびプログラム

Info

Publication number: JP6190103B2
Application number: JP2012238002A
Authority: JP
Inventors: 遠藤　寛朗; 寛朗遠藤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2012-10-29
Filing date: 2012-10-29
Publication date: 2017-08-30
Anticipated expiration: 2032-10-29
Also published as: JP2014090253A; US9313524B2; US20140119449A1

Description

本発明は動画像を符号化する動画像符号化装置に関し、特に高ビット深度を含む異なるビット深度の動画像データを符号化するための動画像符号化装置に関する。

近年、音声信号、画像信号など所謂マルチメディアに関連する情報のデジタル化が急進しており、これに対応して画像データの圧縮符号化／復号化技術が注目されている。圧縮符号化及び復号化技術により、画像データの格納に必要な記憶容量や伝送に必要な帯域を減少させることができるため、マルチメディア産業には極めて重要な技術である。

これらの圧縮符号化復号化技術は、多くの画像が有する自己相関性の高さ（すなわち、冗長性）を利用して情報量／データ量を圧縮している。画像データが有する冗長性には、時間冗長性と二次元の空間冗長性があり、時間冗長性は、ブロック単位の動き検出及び動き補償を用いて低減することができる。一方、空間冗長性は、離散コサイン変換（ＤＣＴ）を用いて低減させることが出来る。これらの技術を用いた画像符号化方式に、Ｈ．２６４／ＭＰＥＧ−４ＰＡＲＴ１０（ＡＶＣ）（以下、Ｈ．２６４と呼ぶ）がある。

また、デジタルシネマに代表される映像制作の分野では超高画質映像への期待が高まっており、映像の高画質化に関する研究が精力的に行われている。そのための要素の一つとして、映像の高ダイナミックレンジ化があり、画像データのビット深度を現行の８ビットから、１０ビットや１２ビットとするものである。画像データの高ビット深度化は、そのまま画像のデータ量増大を招くことになるため、効率的な符号化手法が研究されている。例えば、特許文献１では、入力画像データをそのビット深度が小さくなるように変換処理し、変換処理後の画像データを符号化するとともに、変換処理後の符号化画像と高ビット深度の入力画像との差分情報も符号化している。

特開２０１１−１７６４０７号公報

しかしながら、前記特許文献１では、低ビット深度の符号化画像と高ビット深度の入力画像との差分情報を計算するために符号化画像データを復号する必要があり、符号化処理の演算コストが増大してしまう。また、前記Ｈ．２６４でも、従来の８ビット深度の符号化方式を転用した形で画像データの高ビット深度化に対応しているが、８ビット深度の符号化方式を転用しているため、データ量がそのまま増大し、やはり符号化処理の演算コストが増大してしまう。

そこで、本発明は上記従来技術の課題に鑑み、イントラ予測方式の選択精度を大きく落とすことなく符号化処理の演算コストの増大化を抑えた、高ビット深度の画像データの符号化に対応した動画像符号化装置を提供することである。

本発明の一態様によれば、複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化装置であって、前記動画像データを取得する取得手段と、前記取得手段で取得した動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換手段と、前記変換手段でビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定手段と、前記決定手段が決定した画面内予測モードに従って、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化手段と、を備え、前記決定手段は、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を、前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換手段が出力する動画像データから演算し、前記補正された評価値と前記変換手段が出力する動画像データから演算した評価値に基づいて画面内予測モードを決定することを特徴とする動画像符号化装置が提供される。

本発明によれば、イントラ予測方式の選択精度を大きく落とすことなく、また符号化処理の演算コストの増大化を抑えて高ビット深度の画像データの符号化に対応できる動画像符号化装置を提供することが可能となる。

本発明の第１の実施例に係る動画像符号化装置の構成例を示すブロック図である。イントラ予測の予測モードを説明するための図である。本発明の第１の実施例に係るビット深度変換部の変換処理の第１の変形例を説明するための図である。本発明の第１の実施例に係るビット深度変換部の変換処理の第２の変形例を説明するための図である。本発明の第２の実施例に係る動画像符号化装置の構成例を示すブロック図である。本発明の第１の実施例に係る動画像符号化装置の動作のフローチャートを示す図である。本発明の第２の実施例に係る動画像符号化装置の動作のフローチャートを示す図である。

以下、添付の図面を参照して本発明の好適な実施形態を詳細に説明する。

（第１の実施例）
図１は、本発明の第１の実施例に係る動画像を予測符号化する動画像符号化装置の構成例を示すブロック図である。

同図において、動画像符号化装置１００は、レンズや撮像センサ等のカメラ部を含む撮像部１０１からの入力動画像データを取得する。動画像符号化装置１００は、フレームメモリ１０２と、動きベクトルを探索する動き探索部１０３と、イントラ予測方法を決定するイントラ予測モード決定部１０４とを備える。さらに、画素値のビット深度を変換するビット深度変換部１２０と、インター予測とイントラ予測とのどちらかの予測方法を選択するイントラ・インター選択部１０５と、予測画像生成部１０６と、減算器１０７と、整数変換部１０８と、量子化部１０９とを備える。さらに、逆量子化部１１０と、逆整数変換部１１１と、加算器１１２と、ループ内フィルタ１１３と、エントロピー符号化部１１５と、量子化制御部１１６と、符号量制御部１１７とを備える。そして、動画像符号化装置１００による圧縮符号化によって生成された符号化データは、記録部１１８によって記録媒体に記録される。なお、インター予測は画面間予測とも称し、イントラ予測は画面内予測とも称す。
動画像符号化装置１００は、記録媒体１１９が装着可能に構成されている。本実施例に係わる動画像符号化装置１００は上述した構成であるので、撮像部と記録部を備えた撮像装置における画像処理装置として適用できるだけでなく、信号の入力手段と記録手段を備えるＰＣなどの情報処理装置にも同様に適用できる。その場合、撮像装置又は情報処理装置の制御部が有するＣＰＵによって上記動画像符号化装置を制御することになる。具体的には、上記ＣＰＵが制御プログラムを実行することに本実施例の動画像符号化装置の各部の動作を実現することになる。

本実施例に係わる動画像符号化装置は、撮像部１０１により撮像して得られた動画像データを取得し、フレームメモリ１０２の入力画像の領域に順次格納する。本実施例に係わる動画像符号化装置１００は、異なるビット深度の動画像データを入力して圧縮符号化することが可能な構成を有する。例えば、１２ｂｉｔ，１０ｂｉｔ，８ｂｉｔ，等のいずれかのビット深度の動画像データを入力して圧縮符号化することが可能なように、フレームメモリ１０２を初めとする各部を構成するものとする。本実施例では、入力される動画像データはＮｉビット深度であり、それがフレームメモリに格納されるとする。ビット深度Ｎｉは複数のビット深度（例えば、１２ｂｉｔ，１０ｂｉｔ，８ｂｉｔ，等）のいずれかを表わす。なお、フレームメモリ１０２に記憶する動画像データのビット深度は、ユーザが選択してもよいし、固定であってもよい。また、入力される動画データのビット深度を判定して対応するようにしてもよい。本実施形態では、Ｎｉ＝１２として以降の説明を行なう。

動き探索部１０３は、フレームメモリ１０２から、符号化対象ブロックの画像データと参照フレームの動き探索範囲の画像データを読み出す。探索範囲内の画像データと前記符号化対象ブロックの画像データとのブロックマッチングにより、探索範囲内の相関が高い場所を動きベクトルとして決定し、相関に基づく評価値とともにイントラ・インター選択部１０５に出力する。

イントラ予測モード（画面内予測モード）は、例えば図２に示す複数の予測モードが選択可能になっている。図２において、四角は１つの画素を示し、白い四角が符号化対象ブロックの画素を、また黒い四角は符号化対象ブロックの周辺画素を示している。図示の各イントラ予測モードの予測画像は、ブロック周辺の画素を用いて、周辺の画素値を矢印の方向に有する予測画像を生成する。図２（ａ）のVertical予測は、上方向に隣接する画素を使用して予測画像を生成する。図２（ｂ）のHorizontal予測は、左方向に隣接する画素を使用して予測画像を生成する。図２（ｃ）のDC予測は、周辺の画素値の平均値を予測画像の全画素値とする。図２（ｄ）のPlane予測は、複数の隣接する画素値を用いた演算により予測画像を生成する。なお、イントラ予測モードの種類はこれに限るものではない。

イントラ予測モード決定部１０４は、動画像符号化装置１００が対応可能な動画像データのビット深度のうちの最小ビット深度（以下、Ｎｏビット深度と記す）の動画像データのみに対応している。本実施形態では、１２ｂｉｔ，１０ｂｉｔ，８ｂｉｔに対応する動画像符号化装置１００であるとしているので、Ｎｏ＝８とする。

イントラ予測モード決定部１０４は、フレームメモリ１０２に格納されている符号化対象ブロックの画像データを、後述するビット深度変換部１２０を経由して８ビット深度の符号化対象ブロックの画像データとして読み出す。また同様に、フレームメモリ１０２に格納されている符号化対象ブロックの周辺の画像データを、ビット深度変換部１２０を経由して８ビット深度の符号化対象ブロックの周辺の画像データとして読み出す。イントラ予測モード決定部１０４は、読み出した周辺の画像データを用いて、複数のイントラ予測モードに対応する予測画像を生成し、それぞれのイントラ予測モードに対して、符号化対象ブロックとの相関を表す評価値を算出する。評価値には、符号化対象ブロックと予測画像との画素値の差分絶対値総和を用い、評価値が小さいほど相関が高いことになる。なお、評価値の算出方法はこれに限るものではない。イントラ予測モード決定部１０４は、算出されたそれぞれのイントラ予測モードに対する評価値のうちで最小となる評価値に対応するイントラ予測モードをイントラ・インター選択部１０５に出力する。なお、動画像データは輝度成分と２つの色差成分（Ｃｂ、Ｃｒ）から構成されていて、イントラ予測モード決定部１０４は、輝度成分のイントラ予測モードを決定するとともに、色差成分に対しては２つの色差成分に共通のイントラ予測モードを決定する。

ビット深度変換部１２０は、フレームメモリ１０２に格納されているＮｉ（Ｎｉ＝１２）ビット深度の動画像データを入力し、ビット深度をＮｏ（Ｎｏ＝８）の動画像データとして出力する。ビット深度の変換は、下位ビットの削減量ＬをＬ＝Ｎｉ−Ｎｏから算出し（Ｌ＝１２−８＝４）、各画素データの下位Ｌ（Ｌ＝４）ビットを削除する構成とする。なお、入力動画像データのビット深度がＮｏであった場合は、入力動画像データをそのまま出力する。また、上述の変換構成はこれに限るものではなく、後に本実施例の変形例として説明する構成でもよい。この構成により、符号化される動画像データのビット深度が異なっても、一つのイントラ予測モード決定部１０４で（を兼用して）イントラ予測モードを決定することが可能となる。
ここで、本実施例の特徴であるイントラ予測モードを決定する動作について、図６を参照しながら説明する。本動作は、本実施例の動画像符号化装置１００の図示しない制御部又は当該装置が適用されているカメラ、情報処理装置等の制御部のＣＰＵがプログラムを実行してソフトウエア処理として実現される。なお、ここでは詳述しないが、イントラ予測モードを決定した後の符号化動作も、同様に上記ＣＰＵによるソフトウエア処理として実現することが可能である。
まずＳ６０１で、ビット深度変換部１２０は、符号化する画像データのビット深度が、動画像符号化装置１００が対応可能な動画像データのビット深度のうちの最小ビット深度であるかどうかを判断する。最小のビット深度ではない場合（本実施例の場合）は、Ｓ６０２で画像データのビット深度変換を行いＳ６０３へ移行する。Ｓ６０１において最小のビット深度であった場合には、ビット深度変換は行わずにＳ６０３へ移行する。
Ｓ６０３で、イントラ予測モード決定部１０４は、複数のイントラ予測モードの評価値を算出し、Ｓ６０４へ移行する。Ｓ６０４で、イントラ予測モード決定部１０４は、前記複数のイントラ予測モードの評価値のうち最小の評価値を示すモードをイントラ予測モードとして決定する。

イントラ・インター選択部１０５は、動き探索部１０３の結果とイントラ予測モード決定部１０４の結果とを入力し、例えば、評価値が小さい方の予測方法を選択して、予測画像生成部１０６へ通知する。予測画像生成部１０６は、入力された予測方法に従って予測画像を生成し、減算器１０７へ出力する。インター予測が選択された場合は、フレームメモリ１０２に格納されている後述の参照フレームの画像データから予測画像を生成し、イントラ予測が選択された場合は、後述する加算器１１２が出力する再構成画像から予測画像を生成する。減算器１０７では、符号化対象の画像データと予測画像データとの差分を計算し、差分画像データが生成される。差分画像データは整数変換部１０８に出力され、入力された差分画像データに整数変換を施し、量子化部１０９は、整数変換部１０８により整数変換された差分画像データに対して量子化処理を行う。

エントロピー符号化部１１５は、量子化部１０９により量子化された変換係数をエントロピー符号化し、ストリームとして記録部１１８に出力する。ここで、量子化部１０９における量子化係数は、エントロピー符号化部１１５で発生した符号量や、符号量制御部１１７から設定される目標符号量などから量子化制御部１１６が算出する。記録部１１８は、エントロピー符号化部１１５から出力されたストリームを記録媒体１１９に記録する。

また、量子化部１０９により量子化された変換係数は、逆量子化部１１０にも入力される。逆量子化部１１０は、入力された変換係数を逆量子化し、逆整数変換部１１１は、逆量子化された信号に対して逆整数変換処理を施す。

加算器１１２には、逆整数変換されたデータと、予測画像生成部１０６により生成された予測画像データとが入力されて加算される。加算後のデータは復号された再構成画像データとなり、予測画像生成部１０６に入力されてイントラ予測画像データの生成に用いられる。また、再構成画像データは、ループ内フィルタ１１３によって符号化歪の軽減処理が施され、インター符号化の際に用いる参照フレームの画像データとしてフレームメモリ１０２の参照画像の領域(不図示)に格納される。

上述した本実施例によれば、イントラ予測方式の選択精度を大きく落とすことなく、また符号化処理の演算コストの増大化を抑えて高ビット深度の画像データの符号化に対応できる動画像符号化が可能となる。特に、従来技術のように低ビット深度の符号化画像と高ビット深度の入力画像との差分情報を計算および符号化することがないので、符号化処理の負荷および符号化のデータ量の増大を避けることが可能となる。

（第１の実施例の第１の変形例）
上述した本発明の第１の実施例におけるビット深度変換部１２０の動作（ビット深度変換の構成）の第１の変形例を説明する。本変形例では、ビット深度変換部１２０の変換動作が異なる以外は、前記第１の実施例の構成と同様であるので、ここでの説明を省略する。なお、ビット深度ＮｉおよびＮｏは、第１の実施例と同様にそれぞれ１２および８であり、また動画像データは輝度成分と２つの色差成分から構成されている。以下、本変形例に係わるビット深度変換部１２０の動作を説明する。

ビット深度変換部１２０は、フレームメモリ１０２に格納されているＮｉ（Ｎｉ＝１２）ビット深度の動画像データから符号化対象ブロックの画像データおよびその周辺の画像データを入力する。入力された画像データの輝度成分の全画素データの中で、最も上位にある有意ビット“１”の位置ｎを検出する。図３（ａ）に、入力された輝度成分の画像データを８画素Ａ乃至Ｈとして、各画素の値をビットデータとして例示した。この例では、最も上位にある有意ビット“１”の位置ｎは１０である。そこで、上位ビットの削除量ｍをｍ＝Ｎｉ−ｎで算出し（ｍ＝１２−１０＝２）、下位ビットの削減量ＬをＬ＝Ｎｉ−Ｎｏ−ｍで算出する（Ｌ＝１２−８−２＝２）。算出したｍおよびＬに従って、入力された画像データの輝度成分の各画素の上位ｍビットと下位Ｌビットを削除し、ビット深度Ｎｏの画像データとして出力する。色差成分に対しては、２つの色差成分の画像データに対して輝度成分の場合と同様のビット削減を行い、ビット深度Ｎｏの画像データとして出力する（図３（ｂ））。なお、色差成分は１２ビット深度の場合、−２０４８〜＋２０４７の値をとるが、ここでは−２０４８は−２０４７にクリップ処理したあと絶対値を求め、その絶対値に対して同様のビット深度変換を行った後、符号を戻して値を求める。この場合、入力される色差成分の絶対値のビット深度は（Ｎｉ−１）ビットであり、ビット深度変換後のビット深度は（Ｎｏ−１）ビットである。また、イントラ予測モードが２つの色差成分に対して共通であるため、ビット深度の変換も２つの色差成分に対して共通に行っている。
有意な最上位ビットを検出してビット削減を行うことにより、全体的に画素の値が小さな場合であっても、下位のビットも用いた精度が高い評価値の算出が可能となる。

本変形例によっても、符号化される動画像データのビット深度が異なる場合でも、一つのイントラ予測モード決定部１０４で（を兼用して）イントラ予測モードを決定することが可能となる。

（第１の実施例の第２の変形例）
上述した本発明の第１の実施例におけるビット深度変換部１２０の動作（ビット深度変換の構成）の第２の変形例を説明する。本変形例でも、ビット深度変換部１２０の変換動作が異なる以外は、前記第１の実施例の構成と同様であるので、ここでの説明を省略する。なお本変形例においても、ビット深度ＮｉおよびＮｏは第１の実施例と同様に、それぞれ１２および８であり、また動画像データは輝度成分と２つの色差成分から構成されている。以下、本変形例に係わるビット深度変換部１２０の動作を説明する。

ビット深度変換部１２０は、フレームメモリ１０２に格納されているＮｉビット深度（Ｎｉ＝１２）の動画像データから符号化対象ブロックの画像データおよびその周辺の画像データを入力する。入力された画像データの輝度成分の各画素の値の中で、最も大きい画素値Ｉｍａｘを求める。図４（ａ）に入力された輝度成分の画像データを８画素として、各画素の値を例示した。この例では、最も大きい値を有する画素は画素Ｂであり、最大値Ｉｍａｘは３００である。出力するビット深度Ｎｏ（Ｎｏ＝８）で表現可能な最大値をＯｍａｘ（Ｏｍａｘ＝２５５）として、各輝度値に対して、（Ｏｍａｘ／Ｉｍａｘ）を乗算することでビット深度Ｎｏである値に変換し、変換した輝度値を出力する。色差成分に対しては、２つの色差成分の画像データに輝度成分の場合と同様のビット削減を行なって出力する（図４（ｂ））。なお、色差成分は１２ビット深度の場合、−２０４８〜＋２０４７の値をとるが、ここでは−２０４８は−２０４７にクリップ処理したあと絶対値を求め、その絶対値に対して同様のビット深度変換を行った後、符号を戻して値を求める。この場合、入力される色差成分の絶対値のビット深度は（Ｎｉ−１）ビットであり、ビット深度変換後のビット深度は（Ｎｏ−１）ビットである。また、イントラ予測モードが２つの色差成分に対して共通であるため、ビット深度の変換も２つの色差成分に対して共通に行っている。
画素の値の最大値で正規化することによって、変換後のビット深度で取り得る値の範囲を有効に使用した精度が高い評価値の算出が可能となる。

（第１の実施例の第３の変形例）
上述した本発明の第１の実施例におけるビット深度変換部１２０の動作（ビット深度変換の構成）の第３の変形例を説明する。本変形例でも、ビット深度変換部１２０の変換動作が異なる以外は、前記第１の実施例の構成と同様であるので、ここでの説明を省略する。なお本変形例においても、ビット深度ＮｉおよびＮｏは第１の実施例と同様にそれぞれ１２および８であり、また動画像データは輝度成分と２つの色差成分から構成されている。以下、本変形例に係わるビット深度変換部１２０の動作を説明する。

ビット深度変換部１２０は、フレームメモリ１０２に格納されているＮｉ（Ｎｉ＝１２）ビット深度の動画像データから符号化対象ブロックの画像データおよびその周辺の画像データを入力する。ビット深度変換部１２０は、入力されたＮｉビット深度の画像データを、次の変換式に従って演算によってＮｏビット深度の画像データに変換する。
Pout =4×√Pin
ここで、Ｐｉｎは変換前の画素値、Ｐｏｕｔは変換後の画素値である。

上記の式に従って、ビット深度変換部１２０は各輝度値を変換して出力する。色差成分に対しては、２つの色差成分の画像データに輝度成分の場合と同様にビット削減を行なって出力する。なお、色差成分は１２ビット深度の場合、−２０４８〜＋２０４７の値をとるが、絶対値を使用して、同様のビット深度変換を行った後、符号を戻して値を求める。その場合、絶対値を求める変換式は、|Pout|=2×√2×√|Pin|である。また、イントラ予測モードが２つの色差成分に対して共通であるため、ビット深度の変換も２つの色差成分に対して共通に行っている。なお、変換式は本変形例に示したものに限るものではない。
全体的な画素の値の大きさによらず共通の変換処理でありながらも、画素の値が小さい領域を生かした精度が高い評価値の算出が可能となる。なお、変換式によっては、画素の値が大きい領域を重視することも可能であり、また、画素の値が中程度の領域を重視することも可能である。

（第２の実施例）
本発明の第２の実施例を、図５を用いて説明する。

図５は、本実施例に係る動画像符号化装置５００の構成例を示すブロック図である。同図において、ＤＣ予測評価値算出部５０１およびイントラ予測モード決定部５０２以外の部分は第１の実施例と同じであるので、ここでの説明は省略する。なお本実施例においても、ＮｉおよびＮｏはそれぞれ１２および８とする。

ＤＣ予測評価値算出部５０１は、入力画像データ、即ち符号化される画像データと同じＮｉビット深度の画像データを入力として、イントラ予測モードのＤＣ予測の評価値を算出する。ＤＣ予測評価値算出部５０１は、フレームメモリ１０２に格納されている、１２ビット深度の動画像データから符号化対象ブロックの画像データおよび符号化対象ブロックの周辺の画像データを読み出す。そして、読み出した周辺の画像データを用いて、ＤＣ予測モードに対応する予測画像を生成し、符号化対象ブロックとの相関を表す評価値を算出してイントラ予測モード決定部５０２へ出力する。

イントラ予測モード決定部５０２は、前記第１の実施例で説明したイントラ予測モード決定部１０４と同様に、ＤＣ予測モード以外のイントラ予測モードに対応する評価値を算出する。その時、ＤＣ予測評価値算出部５０１から入力されたＤＣ予測モードの評価値は、ビット深度Ｎｏの画像データの評価値に相当するように、１６（２^４）で除算して補正する。イントラ予測モード決定部５０２は、補正されたＤＣ予測モードの評価値と算出した他のイントラ予測モードの評価値それぞれを比較し、評価値が最小であるイントラ予測モードをイントラ・インター選択部１０５に出力する。

なお、イントラ予測モード決定部５０２は、補正前のＤＣ予測モードの評価値が閾値より小さいかどうかを判定し、小さい場合には他のイントラ予測モードとの評価値の比較をせずに、ＤＣ予測モードをイントラ予測モードとして決定してもよい。
ＤＣ予測モードは主に平坦な画像部分で使用されることが多い。また、平坦な画像部分では画像のわずかな濃淡を表現することが視覚的に良好な画質である。このことから、本実施例のように、ＤＣ予測モードの評価値算出をＮｉビット深度で行うことで、ＤＣ予測モードの選択精度が向上し、平坦部分での視覚的が画像劣化を抑えることができる。
ここで、本実施例の特徴であるイントラ予測モードを決定する動作について、図７を参照しながら説明する。本動作は、本実施例の動画像符号化装置５００の図示しない制御部又は当該装置が適用されているカメラ、情報処理装置等の制御部のＣＰＵがプログラムを実行してソフトウエア処理として実現される。なお、ここでは詳述しないが、イントラ予測モードを決定した後の符号化動作も、同様に上記ＣＰＵによるソフトウエア処理として実現することが可能である。
まずＳ７０１で、ＤＣ予測評価値算出部５０１はＤＣ予測モードの評価値を算出する。
Ｓ７０２で、ビット深度変換部１２０は、符号化する画像データのビット深度が、動画像符号化装置５００が対応可能な動画像データのビット深度のうちの最小ビット深度であるかどうかを判断する。最小のビット深度ではない場合（本実施例の場合）は、Ｓ７０３で画像データのビット深度変換を行い、Ｓ７０４移行する。Ｓ７０２において最小のビット深度であった場合は、ビット深度変換は行わずにＳ７０４へ移行する。
Ｓ７０４では、イントラ予測モード決定部５０２は、ＤＣ予測モード以外の複数のイントラ予測モードの評価値を算出し、Ｓ７０５へ移行する。Ｓ７０５では、イントラ予測モード決定部５０２は、ＤＣ予測モードの評価値を他のモードの評価値と比較できるように補正した後、ＤＣ予測モードを含む前記複数のイントラ予測モードの評価値のうち最小の評価値を示すモードをイントラ予測モードとして決定する。

本実施例によっても、第１の実施例と同様に、イントラ予測方式の選択精度を大きく落とすことなく、また符号化処理の演算コストの増大化を抑えて高ビット深度の画像データの符号化に対応できる動画像符号化が可能となる。

（その他の実施形態）
前述した本発明の実施形態における動画像符号化装置を構成する各手段、並びに動画像符号化方法の各工程は、コンピュータのＲＡＭやＲＯＭなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記憶したコンピュータ読み取り可能な記憶媒体は本発明に含まれる。

また、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。

なお、本発明は、前述した実施形態の機能を実現するソフトウエアのプログラム（図示したフローチャートに対応したプログラム）を、システムまたは装置に直接、または遠隔から供給する場合も含む。そして、そのシステムまたは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。

したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等の形態であってもよい。

プログラムを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスクなどがある。さらに、ＭＯ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、磁気テープ、不揮発性のメモリカード、ＲＯＭ、ＤＶＤ（ＤＶＤ−ＲＯＭ、ＤＶＤ−Ｒ）などもある。

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続する方法がある。そして、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記憶媒体にダウンロードすることによっても供給できる。

また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるＷＷＷサーバも、本発明に含まれるものである。

また、その他の方法として、本発明のプログラムを暗号化してＣＤ−ＲＯＭ等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。さらに、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。

さらに、その他の方法として、まず記憶媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。そして、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。

以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。

Claims

複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化装置であって、
前記動画像データを取得する取得手段と、
前記取得手段で取得した動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換手段と、
前記変換手段でビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定手段と、
前記決定手段が決定した画面内予測モードに従って、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化手段と、を備え、
前記決定手段は、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を、前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換手段が出力する動画像データから演算し、前記補正された評価値と前記変換手段が出力する動画像データから演算した評価値に基づいて画面内予測モードを決定する
ことを特徴とする動画像符号化装置。
前記符号化手段は、前記取得手段が取得する前記複数の異なるビット深度のいずれか一つで表現される動画像データを符号化し、前記決定手段は前記最も低いビット深度で表現される動画像データのみの画面内予測モードを、複数の画面内予測モードの評価値に基づいて決定し、前記取得手段が取得した動画像データのビット深度が前記最も低いビット深度であるときは、前記変換手段は、前記取得した動画像データを出力することを特徴とする請求項１に記載の動画像符号化装置。
前記決定手段は、前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した前記所定のモードの評価値が所定の閾値より小さい場合は、前記所定のモードを画面内予測モードとして決定することを特徴とする請求項１に記載の動画像符号化装置。
前記所定のモードは、ＤＣ予測モードであることを特徴とする請求項１乃至３のいずれか一項に記載の動画像符号化装置。
前記変換手段は、前記取得手段が取得した動画像データのビット深度をＮｉとし、前記最も低いビット深度をＮｏとするとき、前記取得手段が取得した動画像データの下位Ｌ（Ｌ＝Ｎｉ−Ｎｏ）ビットを削除して、前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項１乃至４のいずれか一項に記載の動画像符号化装置。
前記変換手段は、前記取得手段が取得した動画像データのビット深度をＮｉとし、前記最も低いビット深度をＮｏとしたとき、前記取得手段が取得した動画像データの最も上位の有意ビットの位置ｎを検出し、前記検出した位置ｎに基づいて、前記取得手段が取得した動画像データの上位ｍ（ｍ＝Ｎｉ−ｎ）ビットおよび下位Ｌ（Ｌ＝Ｎｉ−Ｎｏ−ｍ）ビットを削除して、前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項１乃至４のいずれか一項に記載の動画像符号化装置。
前記変換手段は、前記取得手段が取得した動画像データのビット深度をＮｉとし、前記最も低いビット深度をＮｏとしたとき、前記取得手段が取得した動画像データの最も大きい画素値Ｉｍａｘを検出し、前記ビット深度Ｎｏで表現され得る画素値の最大値をＯｍａｘとして、前記取得手段が取得した動画像データに（Ｏｍａｘ／Ｉｍａｘ）を乗算して前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項１乃至４のいずれか一項に記載の動画像符号化装置。
前記変換手段は、変換式に従った演算により前記取得手段が取得した動画像データのビット深度を変換することを特徴とする請求項１乃至４のいずれか一項に記載の動画像符号化装置。
前記変換手段は、前記取得手段が取得した動画像データの複数の色差成分に対しては、共通のビット深度変換を行うことを特徴とする請求項１乃至８のいずれか一項に記載の動画像符号化装置。
前記取得手段が取得した動画像データの動きベクトルを探索する動き探索手段をさらに備え、前記符号化手段は、前記動き探索手段による動きベクトルの探索の結果と前記決定手段による画面内予測モードの決定の結果とに基づいて、前記取得手段が取得した動画像データを予測符号化することを特徴とする請求項１乃至９のいずれか一項に記載の動画像符号化装置。
複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化方法であって、
前記動画像データを取得してメモリに記憶する取得ステップと、
前記メモリに記憶された動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換ステップと、
前記変換ステップでビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定ステップと、
前記決定した画面内予測モードに従って、前記メモリに記憶された前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化ステップと、を備え、
前記画面内予測モードは、前記取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を、前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換によって得られる動画像データから演算し、前記補正された評価値と前記変換によって得られる動画像データから演算した評価値に基づいて決定されることを特徴とする動画像符号化方法。
複数の異なるビット深度のいずれか一つで表現される動画像データを、少なくとも画面内予測を用いて予測符号化する動画像符号化装置を制御するプログラムであって、
コンピュータを、
前記動画像データを取得する取得手段、
前記取得手段で取得した動画像データを、前記複数の異なるビット深度の最も低いビット深度の動画像データに変換する変換手段、
前記変換手段でビット深度が変換された動画像データに基づいて画面内予測モードを決定する決定手段、
前記決定手段が決定した画面内予測モードに従って、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データを予測符号化する符号化手段、として機能させ、
前記決定手段は、前記取得手段が取得した前記複数の異なるビット深度のいずれか一つで表現される動画像データから演算した所定のモードの評価値を、前記最も低いビット深度の評価値に補正し、前記所定のモード以外の画面内予測モードの評価値を前記変換手段が出力する動画像データから演算し、前記補正された評価値と前記変換手段が出力する動画像データから演算した評価値に基づいて画面内予測モードを決定するプログラム。
請求項１２に記載のプログラムを記憶したコンピュータが読み取り可能な記憶媒体。
コンピュータを、請求項１乃至１０のいずれか一項に記載された動画像符号化装置の各手段として機能させるプログラム。
コンピュータを、請求項１乃至１０のいずれか一項に記載された動画像符号化装置の各手段として機能させるプログラムを格納したコンピュータ読み取り可能な記憶媒体。