JP2009284298A

JP2009284298A - 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法

Info

Publication number: JP2009284298A
Application number: JP2008135224A
Authority: JP
Inventors: Toru Yokoyama; 徹横山; Muneaki Yamaguchi; 宗明山口
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2008-05-23
Filing date: 2008-05-23
Publication date: 2009-12-03
Also published as: WO2009141969A1

Abstract

【課題】モデルベース符号化、復号化において、複数のモデルを利用することやモデルの種類を柔軟に変更することを可能とすること。
【解決手段】モデルベース予測系統は、モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部１２２と、複数のモデルデータを所定のパラメータを用いて変形し入力画像に最適なモデルを選択するモデルマッチング部１２３とを有し、モデルベース予測画像を生成する。モデルデータには、モデル名、要素型、要素データ、属性データセット、モデルパラメータ初期値が含まれ、符号化ストリーム１０６には、モデルベース予測画像において予測に用いたモデルを示す情報と、モデルの変形に用いたパラメータとを格納する。
【選択図】図１

Description

本発明は、動画像信号を高効率で符号化・復号化する動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法に関する。

従来の動画像符号化技術としては、時間方向での画像ピクチャ間の相関性や、ピクチャ内の画素間の相関性などを利用して冗長な情報量を削減し、可変長符号化を行うことにより、情報量を圧縮する符号化方式が実用化されている。このような符号化方式（ここでは、「波形符号化方式」と呼ぶ）は、符号化対象が限定されないという利点がある反面、情報量の圧縮率に限界がある。

これに対し、符号化対象の３次元モデルなどを用いたモデルベース符号化方式が提案されている。この方式は、符号化対象の予測画像を３次元モデルのパラメータにより表現することができるため、波形符号化方式に比べて圧縮率を大幅に向上することが可能である。

特許文献１には、波形符号化とモデルベース符号化を組み合わせ、符号化対象ブロックに応じてこれら符号化方式を選択するような、ハイブリッド符号化方法が記載されている。また特許文献２には、三次元モデルに基づいて二次元テンプレートを生成することで対象領域を抽出する構成のモデルベース符号化方式が記載されている。

特開平３−２５３１９０号公報特開２００４−３２０７９９号公報

モデルベース符号化方式は、近年の計算機の処理速度向上や、画像認識、解析、コンピュータグラフィックスの進歩により実現性が高まっている。すなわち、符号化対象の画像を解析し、適切なモデルを選択し、そのモデルのパラメータを調整することで、符号化対象の画像に近い画像をモデルから構成することが技術的に可能となってきている。入力画像に近い画像をモデルから生成できれば、このモデルから得られる生成画像と入力画像との差分情報とモデルのパラメータ情報のみによって入力画像を復号化できるため、情報量の大幅な圧縮が期待できる。

しかしながら、特許文献１、２に記載されるような従来のモデルベース符号化やこれを用いたハイブリッド符号化では、符号化装置と復号化装置とで、使用する３次元モデルに関するデータ（モデルデータ）を予め共有していることを前提としている。よって、モデルベース符号化の利点を活かせる符号化対象は、共有する唯一のモデルに限定されてしまうという問題があった。

本発明の目的は、上記の課題を鑑み、モデルベース符号化、復号化において、複数のモデルを利用することやモデルの種類を柔軟に変更することを可能とする動画像符号化、復号化装置及びその方法を実現することにある。

上記目的を達成するため、本発明による動画像符号化装置は予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、モデルベース予測系統は、モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、複数のモデルデータを所定のパラメータを用いて変形し入力画像に最適なモデルを選択するモデルマッチング部と、変形されたモデルデータを２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成する２次元画像合成部と、２次元モデル画像を参照し入力画像のモデルベース動き予測ベクトルとモデルベース予測画像を生成するモデルベース動き予測部とを有する。

ここでモデルデータには、モデル名、要素型、要素データ、属性データセット、モデルパラメータ初期値が含まれ、パラメータによるモデルの操作ルールは予め定義されている。

また出力する符号化ストリームには、予測差分画像の情報とともに、モデルベース予測画像において予測に用いたモデルを示す情報と、モデルの変形に用いたパラメータと、モデルベース動き予測ベクトルと、２次元平面に関する情報を格納する。

さらに、モデルベース予測に用いるモデル一覧を提示し、一覧の中で必要なモデルのモデルデータを外部から取得する装置制御部を備える。

また入力画像の解像度に応じてモデルベース予測に用いるモデルデータの階層レベルを変換するモデル制御部を備え、モデル制御部は、階層レベルに従いモデルデータの構成要素の大きさと数の変換及び属性値の変換を行う。

本発明による動画像復号化装置は、予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、モデルベース予測系統は、モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、符号化ストリームから取得した予測に用いたモデルを示す情報とモデルの変形に用いたパラメータを元に、該当するモデルデータを変形するモデル変形部と、符号化ストリームから取得した２次元平面に関する情報を元に、２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成する２次元画像合成部と、２次元モデル画像と符号化ストリームから取得したモデルベース動き予測ベクトルを用いてモデルベース予測画像を生成するモデルベース動き補償部とを有する。

本発明による動画像符号化方法は、予測画像としてモデルベース予測画像を生成するために、モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、複数のモデルデータを所定のパラメータを用いて変形し入力画像に最適なモデルを選択し、変形されたモデルデータを２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成し、２次元モデル画像を参照し入力画像のモデルベース動き予測ベクトルとモデルベース予測画像を生成する。

本発明による動画像復号化方法は、予測画像としてモデルベース予測画像を生成するために、モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、符号化ストリームから取得した予測に用いたモデルを示す情報とモデルの変形に用いたパラメータを元に、該当するモデルデータを変形し、符号化ストリームから取得した２次元平面に関する情報を元に、２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成し、２次元モデル画像と符号化ストリームから取得したモデルベース動き予測ベクトルを用いてモデルベース予測画像を生成する。

本発明によれば、符号化対象に応じて符号化効率の向上に有効なモデルを適宜選択して用いることができるので、様々な入力画像に対して符号化時の圧縮率を大幅に向上させる効果がある。

以下、図面を参照して本発明の各実施例を詳細に説明する。

実施例１は本発明による動画像符号化装置に関するもので、複数のモデルを用いて、波形符号化とモデルベース符号化を組み合わせたハイブリッド符号化を行う。本実施例の動画像符号化装置は、フレームが時間方向に配置されるような一般的な動画像のみならず、Ｘ線ＣＴやＭＲＩなどの画像診断装置における３次元画像にも適用可能であることを予め記しておく。モデルベース符号化は、ＴＶ会議や医用画像診断装置など撮像対象が限定されている場合などにおいて特に有効である。

図１は、本発明による動画像符号化装置の一実施例を示す構成図である。
動画像符号化装置１００は、予測画像格納部１１４に格納される予測画像１１６と入力画像１０１との予測差分画像１１７を生成する差分器１０２、予測差分画像１１７をＤＣＴなどの直交変換を行う変換部１０３、変換後の信号を量子化する量子化部１０４、量子化後の信号を符号化する可変長符号化部１０５を有し、符号化ストリーム１０６を出力する。

本実施例の動画像符号化装置１００は、上記の予測画像１１６を生成するために３通りの予測処理系統を有する。第１の系統は画面間予測によるもので、次の入力画像のための参照画像を得るため、量子化部１０４で出力された量子化信号を逆量子化する逆量子化部１０７、逆量子化信号を逆変換して予測差分画像を得る逆変換部１０８、逆変換後の予測差分画像と予測画像格納部１１４からの予測画像を加算する加算器１０９、加算後の画像からブロックノイズを除去した参照画像を得るデブロック処理部１１０を有する。そして、得られた参照画像を格納する参照画像格納部１１１、参照画像と入力画像１０１との間の動き予測を行う動き予測部１１２を有する。第２の系統は画面内予測によるもので、入力画像１０１から画面内予測を行う画面内予測部１１８を有する。第３の系統はモデルベース予測によるもので、モデルベース画像生成部１２０と、モデルベース動き予測部１２５を有する。モデルベース予測については後述する。

予測画像比較部１１３では上記３通りの予測処理系統、すなわち、動き予測部１１２からの画面間予測画像、画面内予測部１１８からの画面内予測画像、及びモデルベース動き予測部１２５からのモデルベース予測画像のうち、最も予測効率が高いと推測される予測画像を選択する。予測効率の指標としては、例えば予測誤差エネルギーなどが挙げられるが、その他として近傍のブロックの予測方式（画面間予測か画面内予測かモデルベース予測か）との類似性などを考慮して予測画像（すなわち予測方式）を選択してもよい。

選択された予測画像は、フィルタ処理部１１３により必要に応じて予測画像のブロック境界において低域通過型フィルタをかける。これはブロック境界の両側で予測方式が異なるとブロックノイズが目立ちやすくなるため、これを除去するためである。予測方式が異なっている場合の他、モデルベース予測で用いられているモデルが異なる場合にもフィルタ処理を施しても良い。フィルタ処理を施された最終的な予測画像１１６は予測画像格納部１１５に格納され、入力画像１０１との予測差分画像１１７を生成するために用いられる。
なお、予測画像比較部１１３で選択した予測方式に関する情報１２６は、可変長符号化部１０５に送られ、符号化ストリーム１０６の一部に格納される。

本実施例では第３の系統であるモデルベース予測の構成に特徴があり、以下詳細に説明する。モデルベース画像生成部１２０は、モデル制御部１２１、モデルデータ格納部１２２、モデルマッチング部１２３、及び２次元画像合成部１２４を有する。モデル制御部１２１は、各部の動作の制御を行う。モデルデータ格納部１２２は、モデルベース予測に用いるモデルデータを格納するが、格納するモデルデータは符号化対象に応じて決められ、必要なモデルデータを全て格納している。もし必要なモデルデータが存在しない場合には、モデルデータが存在しない旨のメッセージを通知し、外部から取得することも可能である。

モデルマッチング部１２３では、予め定められたモデルパラメータの値を変えてモデルデータを変形する。２次元画像合成部１２４では、変形されたモデルデータを２次元平面に投影、あるいは２次元平面で切断し、２次元平面のモデル画像を合成する。合成されたモデル画像はモデルマッチング部１２３にて入力画像１０１と比較される。モデルマッチング部１２３は比較により変形情報の抽出を行い、再びモデルパラメータの値を更新してモデルデータを変形する。このような処理を繰り返すことにより、入力画像１０１に対して最適なモデルパラメータと、この最適なモデルパラメータをモデルに適応したときの２次元のモデル画像が生成される。

このようなモデルパラメータの抽出例は、例えば参考文献１に報告がなされている。参考文献１では、１つの顔モデルを前提としているが、本実施例のモデルマッチング部１２３では、モデルデータ格納部１２２に格納された複数のモデルに対して同様のモデルパラメータ抽出処理を行い、最適なモデルを選択することが可能である。
［参考文献１］金子、羽鳥、小池：「形状変化の検出と３次元モデルに基づく顔動画像の符号化」、電子情報通信学会論文誌（Ｂ）、Ｊ７１−Ｂ、ｐｐ．１５５４−１５５６（昭和６３年１２月）。

モデルベース動き予測部１２５では、上記のように得られた２次元モデル画像を参照画像と見立て、入力画像１０１からの動き予測処理を行う。この動き予測アルゴリズムに関しては、既知のアルゴリズムを用いることが可能であり、動き予測部１１２と処理を共通化してもよい。また、２次元モデル画像生成に用いたモデルパラメータの情報１２７は、モデルベース画像生成部１２０から可変長符号化部１０５に送られ、符号化ストリーム１０６の一部に格納される。

図２は、モデルデータ格納部１１６に格納されるモデルデータの構造の一例を示す図である。モデルデータの各要素について説明する。

「ＩＤ」とはモデルデータの種類を同定するための番号である。「Ｖｅｒｓｉｏｎ」は同じＩＤのモデルデータにおけるバージョンを示す番号であり、更新されたモデルデータを識別するために用いる。「モデル名」は、モデルデータに与えられる名称の文字列である。例えば、人間の顔であれば、「顔（男）」「顔（女）」「顔（成人）」「顔（子供）」など、モデルデータの特徴を示す文字列が望ましい。

「要素型」は、モデルデータを構成する要素の型に関する情報を示す。例えば、３次元表面のモデル化であれば「三角パッチ」「四角パッチ」など、内部を含めた３次元立体のモデル化であれば「ボクセル」などと表す。

「要素データ」は、モデルデータを構成する個々の要素に関する情報である。「要素データ数」は要素データの数を表し、同図ではＭ個存在する。そしてＭ個の各要素のモデル上の位置は「要素の座標値」で表される。ここで「要素の座標値」とは、例えば要素型が三角パッチ面であれば要素である各三角形パッチ面を構成する三点の座標の組を表すものであり、要素型に応じて「要素の座標値」の形式は異なっていてよい。

「属性データセット」は、個々の要素に与える属性データに関する組である。「属性データ数」は属性データの組の数を表し、同図ではＮ個存在する。個々の「属性データ」は、「属性名」、「属性型」、及びＭ個の「属性値」から成る。「属性名」は属性の名称を表す文字列であり「色（ＲＧＢ）」「明るさ」「反射率」「透明度」など、個々の属性の特徴を表す名称が望ましい。「属性型」は個々の属性値の型に関する情報であり、「整数」「２値数」「小数点」などの情報である。「属性値」は、個々の要素に与える属性の値であり、要素の数だけ値が存在しており、この属性値は要素データにおける各要素の座標は対応づけられる必要がある。

「モデルパラメータ初期値」は、モデルデータを操作、変形するためのモデルパラメータの初期値である。「パラメータ数」は「パラメータデータ」の数を表す。個々の「パラメータデータ」は「パラメータ名」、「パラメータ型」、「パラメータ値」から成る。

「モデルパラメータ」としては、回転角度や縮尺サイズなど、多くのモデルに共通的なパラメータの他、個々のモデルに応じたパラメータを含んでもよい。例えば参考文献２には顔モデルの作成の例が示され、目や鼻、眉毛、***など、顔の各部位の特徴点を定義し、この特徴点の位置を移動することにより個々の顔を形成する。上記の例であれば、パラメータ名として「特徴点（目１）」「特徴点（目２）」など、パラメータ型としては「３次元座標」、数値として個々の特徴点座標値を与える。
［参考文献２］特開２００３−４４８７３号公報
さらに表情を変えるための表情筋モデルを顔モデルに加えると、個々の筋肉に対して長さや収縮率の値を与え、予め表情筋モデルで定められた運動方程式により特徴点の位置を変える、といった変形操作を行うことも可能である。このように、個々のモデルに応じたモデルパラメータに対して初期値が与えられることにより、モデルの初期状態が定義される。

上記の顔の例のように、モデルパラメータを用いてどのように変形するか、といった規則は個々のモデルに依存する。このため、モデル制御部１２１では、モデルベース画像生成部１２０が、どのＩＤのモデルに対して、変形や操作処理を含めて対応可能であるか、の情報を管理しておく必要がある。

その他、モデルデータには、「モデルデータの説明」やモデルデータをダウンロードする際に利用する、モデルの「Ｓｉｚｅ」情報などを含んでもよい。
モデルデータ格納部１２２には、上記のようなモデルデータが複数格納される。

図３は、本実施例の動画像符号化装置１００が出力する符号化ストリーム１０６の構成を説明する図である。

（ａ）は一般の符号化ストリーム１０６の全体構造を示し、ストリーム全体に関連するシーケンスヘッダ情報１０６１、各ピクチャ単位に適応される情報であるピクチャヘッダ１０６２、及び各ピクチャデータ１０６３とから構成される。以下、本実施例のモデルベース符号化に関連する情報の格納例を示す。

（ｂ）はシーケンスヘッダ１０６１を示し、ストリームの符号化に用いられたモデルに関するモデルセット情報が格納される。モデルセット情報は、符号化に用いられたモデル数、及び各モデル情報から成る。モデル情報は、モデルを同定する「ＩＤ」、「Ｖｅｒｓｉｏｎ」、「ＵＲＬ」、及び「階層レベル」を含む。「ＩＤ」と「Ｖｅｒｓｉｏｎ」は、図２で述べたモデルデータの内容と同様である。「ＵＲＬ」は、モデルデータを取得するためのネットワーク上のアドレスである。「ＵＲＬ」は後述するように、復号化時に必要に応じてモデルデータを取得するために用いられる。「階層レベル」については実施例３で後述する。

（ｃ）はピクチャヘッダ１０６２を示し、個々のピクチャ画像を符号化する際、前述のモデル予測画像を生成するために用いられた「モデル数」と、モデルベース予測パラメータが格納される。予測パラメータは、各モデルの「ＩＤ」、そのモデルから２次元平面のモデル画像を合成したときの投影面もしくは切断面を示す「ピクチャ面情報」、投影か切断かを表す「投影情報」、及び「モデルパラメータ値」を含む。

「ピクチャ面情報」とは、２次元平面モデル画像を得るための投影面もしくは切断面を、例えばａｘ＋ｂｙ＋ｃｚ＋ｄ＝０と表記したときの係数（ａ，ｂ，ｃ，ｄ）である。「投影情報」は前述の２次元平面に対して、３次元モデルを投影するのかもしくは切断するのか、投影するのであれば平行投影（平行光線による投影）か透視投影（放射光線による投影）か、等に関する情報である。もし透視投影である場合には、放射光線の光源の位置の座標も格納する。

「モデルパラメータ値」は、モデルマッチング部１２３と２次元画像合成部１２４が最終的にモデルベース予測画像を作成したときのモデルパラメータ値である。

（ｄ）はピクチャデータ１０６３を示し、ピクチャの符号化データが格納される。一般的な動画像符号化では、一枚のピクチャをマクロブロック（図３ではＭＢと表記）と呼ばれる１６×１６画素のブロック単位で画像の変換や量子化を行い、予測方式、動きベクトル、符号化データをマクロブロックデータとして格納する。

個々のマクロブロックデータには、動き予測方式を示す「ＭＢタイプ」を含む。「ＭＢタイプ」は、当該マクロブロックの予測画像を生成した際、予測画像比較部１１３にてどの予測方式（画面内予測、画面間予測、もしくはモデルベース予測）を選択したかを表す。

もしも「ＭＢタイプ」がモデルベース予測方式であることを示している場合には、どのモデルが予測に使用されたかを示す「ＩＤ」、モデルベース予測画像を生成したときの動きベクトルを表す「モデルベース動きベクトル」、モデルベース予測画像と入力画像との差分を変換、量子化した「差分画像情報」を格納する。

本実施例では、モデルベース予測に関する情報を以上に述べたような構成にて符号化ストリーム１０６に格納して伝送する。

次に図４は、本発明による動画像符号化装置の他の実施例を示す構成図である。本実施例の動画像符号化装置１５０は、前記図１の動画像符号化装置１００の構成を動画像符号化部１００’として備える他に、ユーザインタフェース部１５１、符号化装置制御部１５２、符号化モデルデータベース部１５３を有する。符号化モデルデータベース部１５３は、動画像符号化装置１５０内で利用可能なモデルデータを管理する。さらに符号化装置制御部１５２は、ネットワーク１６０を介して外部のモデルデータサーバ１７０に接続し、必要なモデルデータを取得する。これらの追加構成により、符号化に用いるモデルの選択、及び動画像符号化部１００’へのモデルデータの設定の機能を実現する。

本実施例では、次の手順によりモデルデータを設定する。符号化装置制御部１５２は、ネットワーク１６０を介してモデルデータサーバ１７０にアクセスし、メッセージ１６１により符号化モデルのリストを要求する。モデルデータサーバ１７０は、メッセージ１６２により配信可能なモデルリストを符号化装置制御部１５２へ返信する。このモデルリストには少なくともモデルのＩＤ、Ｖｅｒｓｉｏｎ、モデル名が格納されている。

符号化装置制御部１５２は、受信したモデルリスト内のそれぞれのモデルが、符号化モデルデータベース部１５３に格納されているかどうかを確認する。そして、ユーザインタフェース部１５１を介しオペレータに対して、モデルリストの一覧と各々のモデルが既に動画像符号化装置１５０内に格納済みであるかどうかを通知する。

図５は、モデルリストの通知画面の一例であり、モデル名とダウンロード済みか否かを表示する。オペレータはこの画面を参照しながら、これから符号化を行おうとする入力画像に使用する適切なモデルを選択する。

もしも選択されたモデルが動画像符号化装置１５０に存在しない場合には、符号化装置制御部１５２は、モデルデータサーバ１７０に対して選択されたモデルのデータをメッセージ１６１により要求する。このメッセージ１６１には、要求するモデルのＩＤを格納する。モデルデータサーバ１７０は、要求されたモデルデータをメッセージ１６２により送信する。

符号化装置制御部１５２は、受信したモデルデータをモデルデータベース部１５３に格納する。もしくはこのモデルデータを、動画像符号化装置１５０が管理する動的メモリ領域に格納し、このメモリアドレスを動画像符号化部１００’に設定する。このモデルデータのメモリアドレスは、動画像符号化部１００’内のモデル制御部１２１に渡される。モデル制御部１２１は、このメモリアドレスを参照してモデルデータ格納部１２２にモデルデータをコピーする。あるいは、メモリアドレスを参照してモデルデータを直接取得してもよい。

以上により、動画像符号化部１００’では、動画像符号化装置１５０にて指定されたモデルデータを、内部での符号化に利用することが可能となる。

上記の例では、ユーザインタフェース部１５１を介してオペレータがモデルを選択する例を示したが、動画像符号化装置１５０の用途によっては、符号化対象に関する情報を与えることで自動的にモデルを選択するよう、符号化装置制御部１５２を設定することも可能である。

例えば画像診断装置などの用途であれば、撮像対象の部位や患者の年齢、性別などを別途管理する場合が多い。よってこれらの情報と、利用するモデルの対応付けのルールを予め符号化装置制御部１５２へ設定することで、オペレータがモデルを選択することなく、符号化装置制御部１５２が自動的にモデルを選択することが可能である。

以上に述べたように、本実施例による動画像符号化装置では、符号化対象に応じてモデルを選択し、このモデルデータを符号化時に外部から取得することができる。よって、様々な符号化対象に対してモデルベース符号化を広く適用することができ、動画像符号化の圧縮率を大幅に向上させる効果がある。

実施例２は本発明による動画像復号化装置に関するもので、実施例１の動画像符号化装置により生成された符号化ストリームを復号する。その際、復号に必要なモデルデータを予め取得しておく。

図６は、本発明による動画像復号化装置の一実施例を示す構成図である。
動画像復号化装置２００は、符号化ストリーム２０１の可変長符号を復号する可変長復号部２０２と、復号された信号を逆量子化する逆量子化部２０３と、逆量子化された信号を逆直交変換する逆変換部２０４と、予測画像格納部２１４に格納される予測画像２１５と逆変換部２０４から出力される予測差分画像２１６とを加算する加算器２０５と、加算した画像に対してブロック境界にて低域通過型のフィルタ処理を施すデブロック処理部２０６を有し、出力画像２０７を出力する。

本実施例の動画像復号化装置２００は、上記の予測画像２１５を生成するために３通りの予測処理系統を有する。第１の系統は画面間予測によるもので、出力画像２０７をマクロブロック単位で逐次格納する出力画像格納部２０８と、出力画像格納部２０８に格納された全マクロブロックの画像データが次ピクチャの参照画像として別途格納される参照画像格納部２０９と、可変長復号化部２０２で復号された動きベクトルを用いて参照画像に対して動き補償を行い、画面間予測画像を得る動き補償部２１０を有する。第２の系統は画面内予測によるもので、出力画像格納部２０８に格納された処理済みのマクロブロックの画像データを用いて画面内予測を行う画面内予測部２１１を有する。第３の系統はモデルベース予測によるもので、モデルベース画像生成部２２０とモデルベース動き補償部２２５を有する。モデルベース復号化については後述する。

上記３通りの予測処理系統、すなわち、動き補償部２１０からの画面間予測画像、画面内予測部２１１からの画面内予測画像、及びモデルベース動き補償部２２５からのモデルベース予測画像は、予測画像生成部２１２へ渡される。予測画像生成部２１２は、可変長復号化部２０２からマクロブロック毎の「ＭＢタイプ」情報２２６を受け取り、マクロブロック毎に予測画像を切り替えるスイッチ機能を有する。すなわち、「ＭＢタイプ」が指示する予測方式が画面間予測であれば、動き補償部２１０からの予測画像をフィルタ処理部２１３へ転送する。予測方式が画面内予測であれば、画面内予測部２１１からの予測画像をフィルタ処理部２１３へ転送する。予測方式がモデルベース予測であれば、モデルベース動き補償部２２５からの予測画像をフィルタ処理部２１３へ転送する。

フィルタ処理部２１３では、必要に応じて予測画像のマクロブロック境界の予測画像画素に対して低域通過型のフィルタをかける。これは、予測方式が異なるマクロブロック境界ではブロックノイズが目立ちやすくなるため、これを除去するためである。また境界の両側がモデルベース予測方式でも、予測に用いられたモデルが異なる場合にも、同様にフィルタ処理を施しても良い。

フィルタ処理後の予測画像２１５は予測画像格納部２１４へ格納され、予測差分画像２１６と加算するために用いられる。なおフィルタ処理部２１３では、マクロブロック境界でフィルタをかけるため、必要に応じて既に予測画像格納部２１４に格納された予測画像データを取得し、これを変更するようにしてもよい。

本実施例では第３の系統であるモデルベース予測の構成に特徴があり、以下詳細に説明する。モデルベース画像生成部２２０は、モデル制御部２２１、モデルデータ格納部２２２、モデル変形部２２３、及び２次元画像合成部２２４を有する。モデル制御部２２１は、各部の動作の制御を行う。モデルデータ格納部２２２は、モデルベース予測に用いるモデルデータを格納するが、使用するモデルデータを復号化対象に応じて切り替えるので、必要なモデルデータを全て格納している。もし必要なモデルデータ存在しない場合には、モデルデータが存在しない旨のメッセージを通知し、外部から取得することも可能である。

可変長復号部２０２は、符号化ストリーム２０１を解析し、復号に必要な情報２２８をモデル制御部２２１へ渡す。まず符号化ストリーム２０１内のシーケンスヘッダ１０６１（図３参照）を解析し、復号に必要なモデルセット情報を送る。モデル制御部２２１は、符号化ストリーム２０１を復号するために必要なモデルデータが予めモデルデータ格納部２２２に存在することを確認した上で、各ピクチャの復号処理を行う。

また符号化ストリーム２０１内のピクチャヘッダ１０６２（図３参照）を読み出し、このピクチャの復号に必要なモデルベース予測パラメータをモデル制御部２２１へ送る。モデルベース予測パラメータのうち、ピクチャ面情報と投影情報は２次元画像合成部２２４へ送られ、モデルパラメータ値はモデル変形部２２３へ送られる。

次に、符号化ストリーム２０１内のピクチャデータ１０６３（図３参照）を読み出し、各マクロブロックの復号処理を行う。予測方式を示す「ＭＢタイプ」がモデルベース予測である場合、「ＩＤ」と「モデルベース動きベクトル」が復号される。「ＩＤ」はモデル制御部２２１へ、「モデルベース動きベクトル」はモデルベース動き補償部２２５へ（符号２２７）それぞれ送られる。ここに「ＩＤ」は、マクロブロックの予測に使用されたモデルを示す番号である。また差分画像情報は、逆量子化部２０３、逆変換部２０４を介して予測差分画像２１６に復元される。なお、「ＭＢタイプ」が、モデルベース予測以外の方式（画面内予測もしくは画面間予測）である場合は、従来の復号方式であるので説明を省略する。

モデル制御部２２１は、上記「ＩＤ」をモデル変形部２２３へ渡す。モデル変形部２２３では、「ＩＤ」で指定されたモデルのモデルデータをモデルデータ格納部２２２から取得し、既に取得した「モデルパラメータ値」を用いてこのモデルを変形する。モデルの変形ルールはモデル固有であり、国際標準規格や業界標準、運用規定等により定められており、これらに従い実行する。

２次元画像合成部２２４は、このようにして変形されたモデルを、「ピクチャ面情報」で指示される平面で投影もしくは切断して、２次元平面のモデル画像を取得する。ここで用いる「投影情報」には、当該平面に対して投影するか、当該平面で切断するか、投影する場合には平行投影か透写投影かの情報、透写投影の場合には光源の位置座標を含まれる。

得られた２次元のモデル画像はモデルベース動き補償部２２５に渡される。モデルベース動き補償部２２５は、モデル画像内の現在のマクロブロック位置から「モデルベース動きベクトル」だけ移動した位置の１６×１６ブロックの画素値を取得することで、当該マクロブロック位置におけるモデルベース予測画像を作成する。

次に図７は、本発明による動画像復号化装置の他の実施例を示す構成図である。本実施例の動画像復号化装置２５０は、前記図６の動画像復号化装置２００の構成を動画像復号化部２００’として備える他に、ユーザインタフェース部２５１、復号化装置制御部２５２、符号化モデルデータベース部２５３を有する。符号化モデルデータベース部２５３は、動画像復号化装置２５０内で復号処理に利用可能なモデルデータを管理する。さらに復号化装置制御部２５２は、ネットワーク２６０を介して外部のモデルデータサーバ２７０に接続し、必要なモデルデータを取得する。これらの追加構成により、符号化ストリームの復号に必要なモデルの取得、及び動画像復号化部２００’へモデルデータを供給する機能を実現する。

本実施例では、次の手順によりモデルデータを供給する。復号装置制御部２５２は符号化ストリーム２０１を復号化する際、そのシーケンスヘッダを解析し、どのモデルデータが必要かの情報を取得する。もし必要なモデルが符号化モデルデータベース部２５３に存在しない場合には、外部のモデルデータサーバ２７０からそのモデルデータを取得する。具体的には復号化装置制御部２５２は、ネットワーク２６０を介してモデルデータサーバ２７０にアクセスし、メッセージ２６１により必要なモデルデータの概要情報を要求する。モデルデータサーバ２７０は、メッセージ２６２により要求されたモデルデータの概要情報を復号化装置制御部２５２へ返信する。この概要情報としては、例えばモデル名やその説明、モデルデータサイズなどが挙げられる。

復号化装置制御部２５２は、モデルデータの概要情報を取得すると、ユーザインタフェース部２５１を介して、オペレータに対して復号化のために新たに取得する必要のあるモデルの概要情報の一覧を示し、取得するか否かの選択を促すような画面を提供する。

図８は、モデルデータの概要情報の画面の一例である。オペレータはこのような画面を参照し、これから復号化を行おうとするストリームに必要なモデルの情報を確認しながら、モデルデータを外部から取得するかどうかを指示する。

もしもモデルデータを外部から取得する場合には、復号化装置制御部２５２は、モデルデータサーバ２７０に対して、必要なモデルデータをメッセージ２６１により要求する。このときのメッセージ２６１には、要求するモデルのＩＤを格納する。モデルデータサーバ２７０は、要求されたモデルデータをメッセージ２６２により送信する。

復号化装置制御部２５２は、受信したモデルデータをモデルデータベース部２５３に格納する。もしくはこのモデルデータを、動画像復号化装置２５０が管理する動的メモリ領域に格納し、このメモリアドレスを動画像復号化部２００’に設定する。このモデルデータのメモリアドレスは、動画像復号化部２００’内のモデル制御部２２１に渡される。モデル制御部２２１は、このメモリアドレスを参照してモデルデータ格納部２２２にモデルデータをコピーする。あるいは、メモリアドレスを参照してモデルデータを直接取得してもよい。

以上により、動画像復号化部２００’では、動画像復号化装置２５０にて設定されたモデルデータを、内部での復号化に利用することが可能となる。

なお、復号化装置制御部２５２がモデルデータを取得するタイミングは、必ずしも符号化ストリーム２０１を解析した後である必要はない。すなわち予め必要なモデルデータの組の情報が分かる場合には、符号化ストリームを取得する以前からモデルデータを取得することも可能である。例えば、地上デジタル放送における番組情報として、予め番組内の符号化ストリームに使用されるモデルセット情報（シーケンスヘッダ内のモデルセット情報に相当）が格納されていれば、予め必要なモデルデータを取得してもよい。

またモデルデータサーバ２７０と定期的に交信し、常にモデルデータを最新の状態に更新してもよいし、そこで管理される全てのモデルデータを取得しておくようにしてもよい。例えば画像診断装置などでは、撮像する対象が限定されるため、撮影部位に応じたモデルデータ全てをモデルデータサーバ２７０に格納しておくことも可能である。このモデルデータを利用する復号化装置２５０や符号化装置１５０は、モデルデータサーバ２７０から定期的にモデルの一覧リストを取得し、追加、更新されたモデルデータがあれば、各々の符号化モデルデータベース部に予めダウンロードしてもよい。

以上に述べたように、本実施例による動画像復号化装置では、復号に必要なモデルデータを予め取得することにより、様々なモデルを用いて符号化されたモデルベース符号化ストリームに対して好適に復号化を行うことが可能となる。

実施例３は、動画像符号化及び復号化に用いるモデルデータを、階層レベルに応じて変換して用いることを特徴とする。ここで階層レベルとは、同一のモデルデータに設定する解像度の高低を示す指数である。

図１の動画像符号化装置１００内のモデル制御部１２１は、入力画像の解像度とこれに適したモデルデータの階層レベルとの対応関係を予め記憶している。そして、符号化対象画像の解像度が低く、モデルデータの階層レベルを低いレベルに切り替える場合には、モデル制御部１２１は、モデルデータを構成する要素の大きさ（面積や体積）を大きくすることで要素の数を小さくし、これに応じた属性値を再計算してモデルデータ格納部１２２へ格納する。このようにモデルデータの階層レベルを低くすることで、モデルマッチング部１２３や２次元画像合成部１２４における処理量を軽減することができる。モデルデータの階層レベルを変更した場合は、その情報を符号化ストリームに格納しておく。

同様に図６の動画像復号化装置２００においては、符号化ストリームから階層レベルの情報を取得する。モデル制御部２２１は、階層レベルの情報に従い、モデルデータの構成要素の大きさと数の変換及び属性値の変換を行う。これにより、モデル変形部２２３と２次元画像合成部２２４における処理量も軽減される。

なお、モデルデータの階層レベルを下げるか否かの判定はユーザが判断し、図４のユーザインタフェース部１５１から指示することでもよい。

モデルデータの階層レベルの切り替えに当たり、モデルデータの構成要素の大きさと数の変換、これに対応した属性値の変換は、個々のモデルデータの種類と階層レベルに応じて予めルールを決めておくことが望ましい。

図９は、モデルデータの変換の一例を示す図で、モデルの要素が三角パッチ面から構成されている場合である。（ａ）は変換前、（ｂ）は変換後である。（ａ）の状態から要素の大きさを増やして要素数を減らすため、三角パッチ面Ａ０，Ａ１，Ａ２・・・を構成する頂点を１点置きにサンプリングする。そして、（ｂ）のようにサンプリングされた点を頂点とする新たな三角パッチ面Ｂ０，Ｂ１の要素を構成する。

このようにしてモデルデータの要素数と大きさを変更した場合、新たな要素における属性値は、元の要素値から予め定められたルールに従って計算する。例えば同図（ｂ）の要素Ｂ０における属性値は、要素Ｂ０の基となっている同図（ａ）の要素Ａ０〜Ａ３の属性値の平均を求めることで得られる。

また図１０は、モデルデータの変換の他の例を示す図で、モデルの要素が立方体のボクセルによって構成されている場合である。この場合も同様に、変換前の（ａ）のボクセルを構成する頂点を１点置きにサンプリングし、（ｂ）のようにサンプリングされた点を頂点とする新たなボクセル要素を構成する。この新たなボクセル要素における属性値は、（ａ）の元のボクセル８個分の属性値の平均を求めることで得られる。

上記の例では、要素を構成する頂点の間隔を変えることで要素の大きさと数を変換する例を示したが、変換の方法はこれに限定されるものではなく、何らかのルールが予め定義され、一意に新たな要素が得られるものであればよい。

以上に述べたように、本実施例によれば、動画像符号化及び復号化に必要なモデルデータを、階層レベルに従い要素の大きさと数、及び個々の要素の属性値を変換することで、符号化及び復号化における処理量を軽減する効果がある。

本発明の動画像符号化装置及び復号化装置は、フレームが時間方向に配置されるような一般的な動画像のみならず、Ｘ線ＣＴやＭＲＩなどの画像診断装置における３次元画像にも適用可能である。実施例４は、このような画像診断装置に関する。すなわち画像診断装置では、撮像面の位置（動画像における各フレームの時刻に相当）が３次元空間内に配置されているため、一般的な動画像におけるフレーム時刻情報を、画像診断装置における各撮像面の空間的位置と対応付けが可能である。必要に応じてこのような対応付けに関する情報を付加してもよい。

図１１は、本発明を適用した医用画像診断装置の一実施例を示す構成図である。医用画像診断装置としてはＸ線ＣＴ、ＭＲＩなどが挙げられるが、ここではＸ線ＣＴを例に説明する。

医用画像診断装置３００は、撮影した画像のモデルベース符号化と復号化を行う符号化・復号化処理部３１０の他に、画像取得部３２０、撮影プロトコル記憶部３３０、制御部３４０、ユーザインタフェース部３５０を備えて構成される。さらに制御部３４０は、ネットワーク３６０を介し外部のモデルデータサーバ３７０に接続されている。画像取得部３２０は、撮像対象の３次元再構成画像データを取得する。撮影プロトコル記憶部３３０は、撮影条件を含む撮影プロトコルを記録する。制御部３４０は、医用画像診断装置３００の動作全体を制御する。符号化・復号化処理部３１０は、画像取得部３２０で生成された断層画像の符号化や、既に符号化されたストリームからの断層画像の復号を行う。ユーザインタフェース部３５０は、画像取得部３２０で生成された断層画像や、符号化・復号化処理部３１０での断層画像の符号化に用いるモデルの選択、符号化・復号化処理部３１０で復号された断層画像の表示、撮影プロトコルの入力等に用いられる。

画像取得部３２０の構成及び動作について説明する。画像取得部３２０は、スキャン制御部３２１、撮影部３２２、画像再構成部３２３、ボリュームデータ記憶部３２４から構成される。画像取得部３２０は、撮像対象に対してＸ線ビームを照射し、撮像対象を透過したＸ線ビームを検出し、検出されたＸ線投影データに基づいて３次元ボリュームデータを生成する。

撮影部３２２は撮像対象物を置く寝台、Ｘ線源、Ｘ線検出器、データ収集部などから構成され、撮像対象に対してＸ線ビームを照射し、撮像対象を透過したＸ線を検出する。Ｘ線検出器は、互いに直交する２方向それぞれにアレイ状に配列されたＸ線検出素子から成る。データ収集部は、Ｘ線検出素子と同様にアレイ状に配列されたデータ収集素子から成り、スキャン制御部３２１が出力する制御信号に応じてデータを収集する。この収集されたデータがＸ線投影データとなる。

撮影部３２２はスキャン制御部３２１の制御の下、撮像対象を置いた寝台を撮像対象の体軸に沿って移動させながらＸ線源を撮像対象の周りで回線させることで、撮像対象に対して螺旋状となるようなスキャンによる撮影を行う。

画像再構成部３２３は、撮影部３２２により出力されるＸ線投影データから、Ｘ線吸収係数の３次元分布データである３次元画像データ（ボリュームデータ）を再構成する。この再構成処理は、フーリエ変換を用いる方法や逆投影処理を行うなど、既知の方法により実現される。再構成されたボリュームデータは、ボリュームデータ記憶部３２４に記憶される。

画像生成部３２５は、ボリュームデータ記憶部３２４に記憶されたボリュームデータを用いて、任意の断面画像データを生成する。生成された断面画像は、ユーザインタフェース部３５０で表示される。

符号化・復号化処理部３１０は、動画像符号化部３１１と動画像復号化部３１２、及び符号化モデルデータベース３１３から構成される。動画像符号化部３１１は、前記実施例１（図１）による動画像符号化装置１００と同等であり、画像取得部３２０で生成された断層画像のシーケンスを入力して、既に述べた画像符号化処理を行って圧縮された符号化ストリームを生成する。

動画像復号化装置３１２は、前記実施例２（図６）による動画像符号化装置２００と同等であり、圧縮された符号化ストリームに含まれる任意の断層画像を復号化する。

符号化モデルデータベース３１３は、動画像符号化部３１１が利用可能なモデルデータと、動画像復号化部３１２が利用可能なモデルデータとの管理を行う。動作は、図４、図７の符号化モデルデータベース１５３、２５３と同様である。

ユーザインタフェース部３５０は、画像取得部３２０で生成された断層画像や、符号化・復号化処理部３１０での断層画像の符号化に用いるモデルデータの選択、外部のモデルデータサーバ３７０からのモデル取得の決定、符号化・復号化処理部３１０で復号された断層画像の表示、撮影プロトコルの入力等に用いられる。ここでモデルデータの選択やモデルデータサーバ３７０からのモデル取得の決定などのインタフェースは、図５、図８にて述べた例と同様である。

本実施例の医用画像診断装置に用いられるモデルデータの一例を説明する。「モデル名」は、モデルデータの特徴を示す文字列であり、例えば、「脳のＸ線ＣＴ画像（水平断面用）」「脳のＸ線ＣＴ画像（矢状断面用）」「腹部ＭＲＩ画像（標準男性）」「腹部ＭＲＩ（肥満男性）」などを用意する。この他、「胸部Ｘ線ＣＴ画像」、「腹部Ｘ線ＣＴ画像」、「頭部ＭＲＩ画像」といった、撮像された対象部位に応じて、符号化に用いるモデルを選択できるようにする。これより、様々な撮像対象に対して最適なモデルベース符号化を実行することができる。また、「腹部Ｘ線ＣＴ」の撮像画像を符号化する場合、標準的な腹部モデルとして、「成人男性」、「成人女性」、「肥満型男性」、「肥満型女性」といった、符号化対象の特質に応じてさらに細分化したモデルを用意することで、より精度の高い予測画像を生成し、圧縮率のさらなる向上が期待できる。

本発明による動画像符号化装置の一実施例を示す構成図（実施例１）。モデルデータの構造の一例を示す図。符号化ストリームの構成を説明する図。本発明による動画像符号化装置の他の実施例を示す構成図。モデルリストの通知画面の一例を示す図。本発明による動画像復号化装置の一実施例を示す構成図（実施例２）。本発明による動画像復号化装置の他の実施例を示す構成図。モデルデータの概要情報の画面の一例を示す図。モデルデータの変換の一例を示す図（三角パッチ面）（実施例３）。モデルデータの変換の一例を示す図（ボクセル要素）。本発明を適用した医用画像診断装置の一実施例を示す構成図（実施例４）。

符号の説明

１００…動画像符号化装置
１２１…モデル制御部
１２２…モデルデータ格納部
１２３…モデルマッチング部
１２４…２次元画像合成部
１２５…モデルベース動き予測部
１５０…動画像符号化装置
１５１…ユーザインタフェース部
１５２…符号化装置制御部
１５３…符号化モデルデータベース部
２００…動画像復号化装置
２２１…モデル制御部
２２２…モデルデータ格納部
２２３…モデル変形部
２２４…２次元画像合成部
２２５…モデルベース動き補償部
２５０…動画像復号化装置
２５１…ユーザインタフェース部
２５２…復号化装置制御部
２５３…符号化モデルデータベース部。

Claims

入力画像に対し予測画像との差分をとり、予測差分画像を直交変換、量子化、可変長符号化して符号化ストリームを出力する動画像符号化装置において、
上記予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、
該モデルベース予測系統は、
モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、
上記複数のモデルデータを所定のパラメータを用いて変形し上記入力画像に最適なモデルを選択するモデルマッチング部と、
変形されたモデルデータを２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成する２次元画像合成部と、
上記２次元モデル画像を参照し上記入力画像のモデルベース動き予測ベクトルと上記モデルベース予測画像を生成するモデルベース動き予測部と、
を有することを特徴とする動画像符号化装置。
請求項１記載の動画像符号化装置において、
前記モデルデータには、モデル名、要素型、要素データ、属性データセット、モデルパラメータ初期値が含まれ、前記パラメータによるモデルの操作ルールは予め定義されていることを特徴とする動画像符号化装置。
請求項１または２に記載の動画像符号化装置において、
前記出力する符号化ストリームには、前記予測差分画像の情報とともに、前記モデルベース予測画像において予測に用いたモデルを示す情報と、前記モデルの変形に用いたパラメータと、前記モデルベース動き予測ベクトルと、前記２次元平面に関する情報を格納することを特徴とする動画像符号化装置。
請求項１または２に記載の動画像符号化装置において、
モデルベース予測に用いるモデル一覧を提示し、一覧の中で必要なモデルのモデルデータを外部から取得する装置制御部を備えることを特徴とする動画像符号化装置。
請求項１または２に記載の動画像符号化装置において、
前記入力画像の解像度に応じてモデルベース予測に用いるモデルデータの階層レベルを変換するモデル制御部を備え、
該モデル制御部は、階層レベルに従いモデルデータの構成要素の大きさと数の変換及び属性値の変換を行うことを特徴とする動画像符号化装置。
入力する符号化ストリームの可変長符号を復号化、逆量子化、逆直交変換して予測差分画像とし、予測画像と加算して画像を出力する動画像復号化装置において、
上記予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、
該モデルベース予測系統は、
モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、
上記符号化ストリームから取得した予測に用いたモデルを示す情報と該モデルの変形に用いたパラメータを元に、該当するモデルデータを変形するモデル変形部と、
上記符号化ストリームから取得した２次元平面に関する情報を元に、２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成する２次元画像合成部と、
該２次元モデル画像と上記符号化ストリームから取得したモデルベース動き予測ベクトルを用いて上記モデルベース予測画像を生成するモデルベース動き補償部と、
を有することを特徴とする動画像復号化装置。
請求項６に記載の動画像復号化装置において、
前記符号化ストリームから取得した予測に用いたモデルを示す情報を提示し、復号に必要なモデルデータを外部から取得する装置制御部を備えることを特徴とする動画像復号化装置。
請求項６に記載の動画像復号化装置において、
前記モデルベース予測に用いるモデルデータの階層レベルを変換するモデル制御部を備え、
該モデル制御部は、前記符号化ストリームから取得した階層レベルの情報に従い、モデルデータの構成要素の大きさと数の変換及び属性値の変換を行うことを特徴とする動画像復号化装置。
入力画像に対し予測画像との差分をとり、予測差分画像を直交変換、量子化、可変長符号化して符号化ストリームを出力する動画像符号化方法において、
上記予測画像としてモデルベース予測画像を生成するために、
モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、
上記複数のモデルデータを所定のパラメータを用いて変形し上記入力画像に最適なモデルを選択し、
変形されたモデルデータを２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成し、
上記２次元モデル画像を参照し上記入力画像のモデルベース動き予測ベクトルと上記モデルベース予測画像を生成することを特徴とする動画像符号化方法。
請求項９記載の動画像符号化方法において、
符号化する際にモデルベース符号化に用いるモデル一覧を提示し、一覧の中で必要なモデルを格納していない場合そのモデルデータを外部から取得することを特徴とする動画像符号化方法。
請求項９記載の動画像符号化方法において、
前記入力画像の解像度に応じてモデルベース符号化に用いるモデルデータの階層レベルを変換し、モデルデータの構成要素の大きさと数の変換及び属性値の変換を行うことを特徴とする動画像符号化方法。
入力する符号化ストリームの可変長符号を復号化、逆量子化、逆直交変換して予測差分画像とし、予測画像と加算して画像を出力する動画像復号化方法において、
上記予測画像としてモデルベース予測画像を生成するために、
モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、
上記符号化ストリームから取得した予測に用いたモデルを示す情報と該モデルの変形に用いたパラメータを元に、該当するモデルデータを変形し、
上記符号化ストリームから取得した２次元平面に関する情報を元に、２次元平面上に投影もしくは２次元平面で切断して２次元モデル画像を合成し、
該２次元モデル画像と上記符号化ストリームから取得したモデルベース動き予測ベクトルを用いて上記モデルベース予測画像を生成することを特徴とする動画像復号化方法。
請求項１２に記載の動画像復号化方法において、
復号化する際に前記符号化ストリームから取得した予測に用いたモデルを示す情報を提示し、
復号に必要なモデルデータを格納していない場合そのモデルデータを外部から取得することを特徴とする動画像復号化方法。