JP2009284298A - 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法 - Google Patents

動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法 Download PDF

Info

Publication number
JP2009284298A
JP2009284298A JP2008135224A JP2008135224A JP2009284298A JP 2009284298 A JP2009284298 A JP 2009284298A JP 2008135224 A JP2008135224 A JP 2008135224A JP 2008135224 A JP2008135224 A JP 2008135224A JP 2009284298 A JP2009284298 A JP 2009284298A
Authority
JP
Japan
Prior art keywords
model
image
prediction
data
model data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008135224A
Other languages
English (en)
Inventor
Toru Yokoyama
徹 横山
Muneaki Yamaguchi
宗明 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008135224A priority Critical patent/JP2009284298A/ja
Priority to PCT/JP2009/002041 priority patent/WO2009141969A1/ja
Publication of JP2009284298A publication Critical patent/JP2009284298A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/004Predictors, e.g. intraframe, interframe coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】モデルベース符号化、復号化において、複数のモデルを利用することやモデルの種類を柔軟に変更することを可能とすること。
【解決手段】モデルベース予測系統は、モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部122と、複数のモデルデータを所定のパラメータを用いて変形し入力画像に最適なモデルを選択するモデルマッチング部123とを有し、モデルベース予測画像を生成する。モデルデータには、モデル名、要素型、要素データ、属性データセット、モデルパラメータ初期値が含まれ、符号化ストリーム106には、モデルベース予測画像において予測に用いたモデルを示す情報と、モデルの変形に用いたパラメータとを格納する。
【選択図】図1

Description

本発明は、動画像信号を高効率で符号化・復号化する動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法に関する。
従来の動画像符号化技術としては、時間方向での画像ピクチャ間の相関性や、ピクチャ内の画素間の相関性などを利用して冗長な情報量を削減し、可変長符号化を行うことにより、情報量を圧縮する符号化方式が実用化されている。このような符号化方式(ここでは、「波形符号化方式」と呼ぶ)は、符号化対象が限定されないという利点がある反面、情報量の圧縮率に限界がある。
これに対し、符号化対象の3次元モデルなどを用いたモデルベース符号化方式が提案されている。この方式は、符号化対象の予測画像を3次元モデルのパラメータにより表現することができるため、波形符号化方式に比べて圧縮率を大幅に向上することが可能である。
特許文献1には、波形符号化とモデルベース符号化を組み合わせ、符号化対象ブロックに応じてこれら符号化方式を選択するような、ハイブリッド符号化方法が記載されている。また特許文献2には、三次元モデルに基づいて二次元テンプレートを生成することで対象領域を抽出する構成のモデルベース符号化方式が記載されている。
特開平3−253190号公報 特開2004−320799号公報
モデルベース符号化方式は、近年の計算機の処理速度向上や、画像認識、解析、コンピュータグラフィックスの進歩により実現性が高まっている。すなわち、符号化対象の画像を解析し、適切なモデルを選択し、そのモデルのパラメータを調整することで、符号化対象の画像に近い画像をモデルから構成することが技術的に可能となってきている。入力画像に近い画像をモデルから生成できれば、このモデルから得られる生成画像と入力画像との差分情報とモデルのパラメータ情報のみによって入力画像を復号化できるため、情報量の大幅な圧縮が期待できる。
しかしながら、特許文献1、2に記載されるような従来のモデルベース符号化やこれを用いたハイブリッド符号化では、符号化装置と復号化装置とで、使用する3次元モデルに関するデータ(モデルデータ)を予め共有していることを前提としている。よって、モデルベース符号化の利点を活かせる符号化対象は、共有する唯一のモデルに限定されてしまうという問題があった。
本発明の目的は、上記の課題を鑑み、モデルベース符号化、復号化において、複数のモデルを利用することやモデルの種類を柔軟に変更することを可能とする動画像符号化、復号化装置及びその方法を実現することにある。
上記目的を達成するため、本発明による動画像符号化装置は予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、モデルベース予測系統は、モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、複数のモデルデータを所定のパラメータを用いて変形し入力画像に最適なモデルを選択するモデルマッチング部と、変形されたモデルデータを2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成する2次元画像合成部と、2次元モデル画像を参照し入力画像のモデルベース動き予測ベクトルとモデルベース予測画像を生成するモデルベース動き予測部とを有する。
ここでモデルデータには、モデル名、要素型、要素データ、属性データセット、モデルパラメータ初期値が含まれ、パラメータによるモデルの操作ルールは予め定義されている。
また出力する符号化ストリームには、予測差分画像の情報とともに、モデルベース予測画像において予測に用いたモデルを示す情報と、モデルの変形に用いたパラメータと、モデルベース動き予測ベクトルと、2次元平面に関する情報を格納する。
さらに、モデルベース予測に用いるモデル一覧を提示し、一覧の中で必要なモデルのモデルデータを外部から取得する装置制御部を備える。
また入力画像の解像度に応じてモデルベース予測に用いるモデルデータの階層レベルを変換するモデル制御部を備え、モデル制御部は、階層レベルに従いモデルデータの構成要素の大きさと数の変換及び属性値の変換を行う。
本発明による動画像復号化装置は、予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、モデルベース予測系統は、モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、符号化ストリームから取得した予測に用いたモデルを示す情報とモデルの変形に用いたパラメータを元に、該当するモデルデータを変形するモデル変形部と、符号化ストリームから取得した2次元平面に関する情報を元に、2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成する2次元画像合成部と、2次元モデル画像と符号化ストリームから取得したモデルベース動き予測ベクトルを用いてモデルベース予測画像を生成するモデルベース動き補償部とを有する。
本発明による動画像符号化方法は、予測画像としてモデルベース予測画像を生成するために、モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、複数のモデルデータを所定のパラメータを用いて変形し入力画像に最適なモデルを選択し、変形されたモデルデータを2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成し、2次元モデル画像を参照し入力画像のモデルベース動き予測ベクトルとモデルベース予測画像を生成する。
本発明による動画像復号化方法は、予測画像としてモデルベース予測画像を生成するために、モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、符号化ストリームから取得した予測に用いたモデルを示す情報とモデルの変形に用いたパラメータを元に、該当するモデルデータを変形し、符号化ストリームから取得した2次元平面に関する情報を元に、2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成し、2次元モデル画像と符号化ストリームから取得したモデルベース動き予測ベクトルを用いてモデルベース予測画像を生成する。
本発明によれば、符号化対象に応じて符号化効率の向上に有効なモデルを適宜選択して用いることができるので、様々な入力画像に対して符号化時の圧縮率を大幅に向上させる効果がある。
以下、図面を参照して本発明の各実施例を詳細に説明する。
実施例1は本発明による動画像符号化装置に関するもので、複数のモデルを用いて、波形符号化とモデルベース符号化を組み合わせたハイブリッド符号化を行う。本実施例の動画像符号化装置は、フレームが時間方向に配置されるような一般的な動画像のみならず、X線CTやMRIなどの画像診断装置における3次元画像にも適用可能であることを予め記しておく。モデルベース符号化は、TV会議や医用画像診断装置など撮像対象が限定されている場合などにおいて特に有効である。
図1は、本発明による動画像符号化装置の一実施例を示す構成図である。
動画像符号化装置100は、予測画像格納部114に格納される予測画像116と入力画像101との予測差分画像117を生成する差分器102、予測差分画像117をDCTなどの直交変換を行う変換部103、変換後の信号を量子化する量子化部104、量子化後の信号を符号化する可変長符号化部105を有し、符号化ストリーム106を出力する。
本実施例の動画像符号化装置100は、上記の予測画像116を生成するために3通りの予測処理系統を有する。第1の系統は画面間予測によるもので、次の入力画像のための参照画像を得るため、量子化部104で出力された量子化信号を逆量子化する逆量子化部107、逆量子化信号を逆変換して予測差分画像を得る逆変換部108、逆変換後の予測差分画像と予測画像格納部114からの予測画像を加算する加算器109、加算後の画像からブロックノイズを除去した参照画像を得るデブロック処理部110を有する。そして、得られた参照画像を格納する参照画像格納部111、参照画像と入力画像101との間の動き予測を行う動き予測部112を有する。第2の系統は画面内予測によるもので、入力画像101から画面内予測を行う画面内予測部118を有する。第3の系統はモデルベース予測によるもので、モデルベース画像生成部120と、モデルベース動き予測部125を有する。モデルベース予測については後述する。
予測画像比較部113では上記3通りの予測処理系統、すなわち、動き予測部112からの画面間予測画像、画面内予測部118からの画面内予測画像、及びモデルベース動き予測部125からのモデルベース予測画像のうち、最も予測効率が高いと推測される予測画像を選択する。予測効率の指標としては、例えば予測誤差エネルギーなどが挙げられるが、その他として近傍のブロックの予測方式(画面間予測か画面内予測かモデルベース予測か)との類似性などを考慮して予測画像(すなわち予測方式)を選択してもよい。
選択された予測画像は、フィルタ処理部113により必要に応じて予測画像のブロック境界において低域通過型フィルタをかける。これはブロック境界の両側で予測方式が異なるとブロックノイズが目立ちやすくなるため、これを除去するためである。予測方式が異なっている場合の他、モデルベース予測で用いられているモデルが異なる場合にもフィルタ処理を施しても良い。フィルタ処理を施された最終的な予測画像116は予測画像格納部115に格納され、入力画像101との予測差分画像117を生成するために用いられる。
なお、予測画像比較部113で選択した予測方式に関する情報126は、可変長符号化部105に送られ、符号化ストリーム106の一部に格納される。
本実施例では第3の系統であるモデルベース予測の構成に特徴があり、以下詳細に説明する。モデルベース画像生成部120は、モデル制御部121、モデルデータ格納部122、モデルマッチング部123、及び2次元画像合成部124を有する。モデル制御部121は、各部の動作の制御を行う。モデルデータ格納部122は、モデルベース予測に用いるモデルデータを格納するが、格納するモデルデータは符号化対象に応じて決められ、必要なモデルデータを全て格納している。もし必要なモデルデータが存在しない場合には、モデルデータが存在しない旨のメッセージを通知し、外部から取得することも可能である。
モデルマッチング部123では、予め定められたモデルパラメータの値を変えてモデルデータを変形する。2次元画像合成部124では、変形されたモデルデータを2次元平面に投影、あるいは2次元平面で切断し、2次元平面のモデル画像を合成する。合成されたモデル画像はモデルマッチング部123にて入力画像101と比較される。モデルマッチング部123は比較により変形情報の抽出を行い、再びモデルパラメータの値を更新してモデルデータを変形する。このような処理を繰り返すことにより、入力画像101に対して最適なモデルパラメータと、この最適なモデルパラメータをモデルに適応したときの2次元のモデル画像が生成される。
このようなモデルパラメータの抽出例は、例えば参考文献1に報告がなされている。参考文献1では、1つの顔モデルを前提としているが、本実施例のモデルマッチング部123では、モデルデータ格納部122に格納された複数のモデルに対して同様のモデルパラメータ抽出処理を行い、最適なモデルを選択することが可能である。
[参考文献1]金子、羽鳥、小池:「形状変化の検出と3次元モデルに基づく顔動画像の符号化」、電子情報通信学会論文誌(B)、J71−B、pp.1554−1556(昭和63年12月)。
モデルベース動き予測部125では、上記のように得られた2次元モデル画像を参照画像と見立て、入力画像101からの動き予測処理を行う。この動き予測アルゴリズムに関しては、既知のアルゴリズムを用いることが可能であり、動き予測部112と処理を共通化してもよい。また、2次元モデル画像生成に用いたモデルパラメータの情報127は、モデルベース画像生成部120から可変長符号化部105に送られ、符号化ストリーム106の一部に格納される。
図2は、モデルデータ格納部116に格納されるモデルデータの構造の一例を示す図である。モデルデータの各要素について説明する。
「ID」とはモデルデータの種類を同定するための番号である。「Version」は同じIDのモデルデータにおけるバージョンを示す番号であり、更新されたモデルデータを識別するために用いる。「モデル名」は、モデルデータに与えられる名称の文字列である。例えば、人間の顔であれば、「顔(男)」「顔(女)」「顔(成人)」「顔(子供)」など、モデルデータの特徴を示す文字列が望ましい。
「要素型」は、モデルデータを構成する要素の型に関する情報を示す。例えば、3次元表面のモデル化であれば「三角パッチ」「四角パッチ」など、内部を含めた3次元立体のモデル化であれば「ボクセル」などと表す。
「要素データ」は、モデルデータを構成する個々の要素に関する情報である。「要素データ数」は要素データの数を表し、同図ではM個存在する。そしてM個の各要素のモデル上の位置は「要素の座標値」で表される。ここで「要素の座標値」とは、例えば要素型が三角パッチ面であれば要素である各三角形パッチ面を構成する三点の座標の組を表すものであり、要素型に応じて「要素の座標値」の形式は異なっていてよい。
「属性データセット」は、個々の要素に与える属性データに関する組である。「属性データ数」は属性データの組の数を表し、同図ではN個存在する。個々の「属性データ」は、「属性名」、「属性型」、及びM個の「属性値」から成る。「属性名」は属性の名称を表す文字列であり「色(RGB)」「明るさ」「反射率」「透明度」など、個々の属性の特徴を表す名称が望ましい。「属性型」は個々の属性値の型に関する情報であり、「整数」「2値数」「小数点」などの情報である。「属性値」は、個々の要素に与える属性の値であり、要素の数だけ値が存在しており、この属性値は要素データにおける各要素の座標は対応づけられる必要がある。
「モデルパラメータ初期値」は、モデルデータを操作、変形するためのモデルパラメータの初期値である。「パラメータ数」は「パラメータデータ」の数を表す。個々の「パラメータデータ」は「パラメータ名」、「パラメータ型」、「パラメータ値」から成る。
「モデルパラメータ」としては、回転角度や縮尺サイズなど、多くのモデルに共通的なパラメータの他、個々のモデルに応じたパラメータを含んでもよい。例えば参考文献2には顔モデルの作成の例が示され、目や鼻、眉毛、***など、顔の各部位の特徴点を定義し、この特徴点の位置を移動することにより個々の顔を形成する。上記の例であれば、パラメータ名として「特徴点(目1)」「特徴点(目2)」など、パラメータ型としては「3次元座標」、数値として個々の特徴点座標値を与える。
[参考文献2]特開2003−44873号公報
さらに表情を変えるための表情筋モデルを顔モデルに加えると、個々の筋肉に対して長さや収縮率の値を与え、予め表情筋モデルで定められた運動方程式により特徴点の位置を変える、といった変形操作を行うことも可能である。このように、個々のモデルに応じたモデルパラメータに対して初期値が与えられることにより、モデルの初期状態が定義される。
上記の顔の例のように、モデルパラメータを用いてどのように変形するか、といった規則は個々のモデルに依存する。このため、モデル制御部121では、モデルベース画像生成部120が、どのIDのモデルに対して、変形や操作処理を含めて対応可能であるか、の情報を管理しておく必要がある。
その他、モデルデータには、「モデルデータの説明」やモデルデータをダウンロードする際に利用する、モデルの「Size」情報などを含んでもよい。
モデルデータ格納部122には、上記のようなモデルデータが複数格納される。
図3は、本実施例の動画像符号化装置100が出力する符号化ストリーム106の構成を説明する図である。
(a)は一般の符号化ストリーム106の全体構造を示し、ストリーム全体に関連するシーケンスヘッダ情報1061、各ピクチャ単位に適応される情報であるピクチャヘッダ1062、及び各ピクチャデータ1063とから構成される。以下、本実施例のモデルベース符号化に関連する情報の格納例を示す。
(b)はシーケンスヘッダ1061を示し、ストリームの符号化に用いられたモデルに関するモデルセット情報が格納される。モデルセット情報は、符号化に用いられたモデル数、及び各モデル情報から成る。モデル情報は、モデルを同定する「ID」、「Version」、「URL」、及び「階層レベル」を含む。「ID」と「Version」は、図2で述べたモデルデータの内容と同様である。「URL」は、モデルデータを取得するためのネットワーク上のアドレスである。「URL」は後述するように、復号化時に必要に応じてモデルデータを取得するために用いられる。「階層レベル」については実施例3で後述する。
(c)はピクチャヘッダ1062を示し、個々のピクチャ画像を符号化する際、前述のモデル予測画像を生成するために用いられた「モデル数」と、モデルベース予測パラメータが格納される。予測パラメータは、各モデルの「ID」、そのモデルから2次元平面のモデル画像を合成したときの投影面もしくは切断面を示す「ピクチャ面情報」、投影か切断かを表す「投影情報」、及び「モデルパラメータ値」を含む。
「ピクチャ面情報」とは、2次元平面モデル画像を得るための投影面もしくは切断面を、例えばax+by+cz+d=0と表記したときの係数(a,b,c,d)である。「投影情報」は前述の2次元平面に対して、3次元モデルを投影するのかもしくは切断するのか、投影するのであれば平行投影(平行光線による投影)か透視投影(放射光線による投影)か、等に関する情報である。もし透視投影である場合には、放射光線の光源の位置の座標も格納する。
「モデルパラメータ値」は、モデルマッチング部123と2次元画像合成部124が最終的にモデルベース予測画像を作成したときのモデルパラメータ値である。
(d)はピクチャデータ1063を示し、ピクチャの符号化データが格納される。一般的な動画像符号化では、一枚のピクチャをマクロブロック(図3ではMBと表記)と呼ばれる16×16画素のブロック単位で画像の変換や量子化を行い、予測方式、動きベクトル、符号化データをマクロブロックデータとして格納する。
個々のマクロブロックデータには、動き予測方式を示す「MBタイプ」を含む。「MBタイプ」は、当該マクロブロックの予測画像を生成した際、予測画像比較部113にてどの予測方式(画面内予測、画面間予測、もしくはモデルベース予測)を選択したかを表す。
もしも「MBタイプ」がモデルベース予測方式であることを示している場合には、どのモデルが予測に使用されたかを示す「ID」、モデルベース予測画像を生成したときの動きベクトルを表す「モデルベース動きベクトル」、モデルベース予測画像と入力画像との差分を変換、量子化した「差分画像情報」を格納する。
本実施例では、モデルベース予測に関する情報を以上に述べたような構成にて符号化ストリーム106に格納して伝送する。
次に図4は、本発明による動画像符号化装置の他の実施例を示す構成図である。本実施例の動画像符号化装置150は、前記図1の動画像符号化装置100の構成を動画像符号化部100’として備える他に、ユーザインタフェース部151、符号化装置制御部152、符号化モデルデータベース部153を有する。符号化モデルデータベース部153は、動画像符号化装置150内で利用可能なモデルデータを管理する。さらに符号化装置制御部152は、ネットワーク160を介して外部のモデルデータサーバ170に接続し、必要なモデルデータを取得する。これらの追加構成により、符号化に用いるモデルの選択、及び動画像符号化部100’へのモデルデータの設定の機能を実現する。
本実施例では、次の手順によりモデルデータを設定する。符号化装置制御部152は、ネットワーク160を介してモデルデータサーバ170にアクセスし、メッセージ161により符号化モデルのリストを要求する。モデルデータサーバ170は、メッセージ162により配信可能なモデルリストを符号化装置制御部152へ返信する。このモデルリストには少なくともモデルのID、Version、モデル名が格納されている。
符号化装置制御部152は、受信したモデルリスト内のそれぞれのモデルが、符号化モデルデータベース部153に格納されているかどうかを確認する。そして、ユーザインタフェース部151を介しオペレータに対して、モデルリストの一覧と各々のモデルが既に動画像符号化装置150内に格納済みであるかどうかを通知する。
図5は、モデルリストの通知画面の一例であり、モデル名とダウンロード済みか否かを表示する。オペレータはこの画面を参照しながら、これから符号化を行おうとする入力画像に使用する適切なモデルを選択する。
もしも選択されたモデルが動画像符号化装置150に存在しない場合には、符号化装置制御部152は、モデルデータサーバ170に対して選択されたモデルのデータをメッセージ161により要求する。このメッセージ161には、要求するモデルのIDを格納する。モデルデータサーバ170は、要求されたモデルデータをメッセージ162により送信する。
符号化装置制御部152は、受信したモデルデータをモデルデータベース部153に格納する。もしくはこのモデルデータを、動画像符号化装置150が管理する動的メモリ領域に格納し、このメモリアドレスを動画像符号化部100’に設定する。このモデルデータのメモリアドレスは、動画像符号化部100’内のモデル制御部121に渡される。モデル制御部121は、このメモリアドレスを参照してモデルデータ格納部122にモデルデータをコピーする。あるいは、メモリアドレスを参照してモデルデータを直接取得してもよい。
以上により、動画像符号化部100’では、動画像符号化装置150にて指定されたモデルデータを、内部での符号化に利用することが可能となる。
上記の例では、ユーザインタフェース部151を介してオペレータがモデルを選択する例を示したが、動画像符号化装置150の用途によっては、符号化対象に関する情報を与えることで自動的にモデルを選択するよう、符号化装置制御部152を設定することも可能である。
例えば画像診断装置などの用途であれば、撮像対象の部位や患者の年齢、性別などを別途管理する場合が多い。よってこれらの情報と、利用するモデルの対応付けのルールを予め符号化装置制御部152へ設定することで、オペレータがモデルを選択することなく、符号化装置制御部152が自動的にモデルを選択することが可能である。
以上に述べたように、本実施例による動画像符号化装置では、符号化対象に応じてモデルを選択し、このモデルデータを符号化時に外部から取得することができる。よって、様々な符号化対象に対してモデルベース符号化を広く適用することができ、動画像符号化の圧縮率を大幅に向上させる効果がある。
実施例2は本発明による動画像復号化装置に関するもので、実施例1の動画像符号化装置により生成された符号化ストリームを復号する。その際、復号に必要なモデルデータを予め取得しておく。
図6は、本発明による動画像復号化装置の一実施例を示す構成図である。
動画像復号化装置200は、符号化ストリーム201の可変長符号を復号する可変長復号部202と、復号された信号を逆量子化する逆量子化部203と、逆量子化された信号を逆直交変換する逆変換部204と、予測画像格納部214に格納される予測画像215と逆変換部204から出力される予測差分画像216とを加算する加算器205と、加算した画像に対してブロック境界にて低域通過型のフィルタ処理を施すデブロック処理部206を有し、出力画像207を出力する。
本実施例の動画像復号化装置200は、上記の予測画像215を生成するために3通りの予測処理系統を有する。第1の系統は画面間予測によるもので、出力画像207をマクロブロック単位で逐次格納する出力画像格納部208と、出力画像格納部208に格納された全マクロブロックの画像データが次ピクチャの参照画像として別途格納される参照画像格納部209と、可変長復号化部202で復号された動きベクトルを用いて参照画像に対して動き補償を行い、画面間予測画像を得る動き補償部210を有する。第2の系統は画面内予測によるもので、出力画像格納部208に格納された処理済みのマクロブロックの画像データを用いて画面内予測を行う画面内予測部211を有する。第3の系統はモデルベース予測によるもので、モデルベース画像生成部220とモデルベース動き補償部225を有する。モデルベース復号化については後述する。
上記3通りの予測処理系統、すなわち、動き補償部210からの画面間予測画像、画面内予測部211からの画面内予測画像、及びモデルベース動き補償部225からのモデルベース予測画像は、予測画像生成部212へ渡される。予測画像生成部212は、可変長復号化部202からマクロブロック毎の「MBタイプ」情報226を受け取り、マクロブロック毎に予測画像を切り替えるスイッチ機能を有する。すなわち、「MBタイプ」が指示する予測方式が画面間予測であれば、動き補償部210からの予測画像をフィルタ処理部213へ転送する。予測方式が画面内予測であれば、画面内予測部211からの予測画像をフィルタ処理部213へ転送する。予測方式がモデルベース予測であれば、モデルベース動き補償部225からの予測画像をフィルタ処理部213へ転送する。
フィルタ処理部213では、必要に応じて予測画像のマクロブロック境界の予測画像画素に対して低域通過型のフィルタをかける。これは、予測方式が異なるマクロブロック境界ではブロックノイズが目立ちやすくなるため、これを除去するためである。また境界の両側がモデルベース予測方式でも、予測に用いられたモデルが異なる場合にも、同様にフィルタ処理を施しても良い。
フィルタ処理後の予測画像215は予測画像格納部214へ格納され、予測差分画像216と加算するために用いられる。なおフィルタ処理部213では、マクロブロック境界でフィルタをかけるため、必要に応じて既に予測画像格納部214に格納された予測画像データを取得し、これを変更するようにしてもよい。
本実施例では第3の系統であるモデルベース予測の構成に特徴があり、以下詳細に説明する。モデルベース画像生成部220は、モデル制御部221、モデルデータ格納部222、モデル変形部223、及び2次元画像合成部224を有する。モデル制御部221は、各部の動作の制御を行う。モデルデータ格納部222は、モデルベース予測に用いるモデルデータを格納するが、使用するモデルデータを復号化対象に応じて切り替えるので、必要なモデルデータを全て格納している。もし必要なモデルデータ存在しない場合には、モデルデータが存在しない旨のメッセージを通知し、外部から取得することも可能である。
可変長復号部202は、符号化ストリーム201を解析し、復号に必要な情報228をモデル制御部221へ渡す。まず符号化ストリーム201内のシーケンスヘッダ1061(図3参照)を解析し、復号に必要なモデルセット情報を送る。モデル制御部221は、符号化ストリーム201を復号するために必要なモデルデータが予めモデルデータ格納部222に存在することを確認した上で、各ピクチャの復号処理を行う。
また符号化ストリーム201内のピクチャヘッダ1062(図3参照)を読み出し、このピクチャの復号に必要なモデルベース予測パラメータをモデル制御部221へ送る。モデルベース予測パラメータのうち、ピクチャ面情報と投影情報は2次元画像合成部224へ送られ、モデルパラメータ値はモデル変形部223へ送られる。
次に、符号化ストリーム201内のピクチャデータ1063(図3参照)を読み出し、各マクロブロックの復号処理を行う。予測方式を示す「MBタイプ」がモデルベース予測である場合、「ID」と「モデルベース動きベクトル」が復号される。「ID」はモデル制御部221へ、「モデルベース動きベクトル」はモデルベース動き補償部225へ(符号227)それぞれ送られる。ここに「ID」は、マクロブロックの予測に使用されたモデルを示す番号である。また差分画像情報は、逆量子化部203、逆変換部204を介して予測差分画像216に復元される。なお、「MBタイプ」が、モデルベース予測以外の方式(画面内予測もしくは画面間予測)である場合は、従来の復号方式であるので説明を省略する。
モデル制御部221は、上記「ID」をモデル変形部223へ渡す。モデル変形部223では、「ID」で指定されたモデルのモデルデータをモデルデータ格納部222から取得し、既に取得した「モデルパラメータ値」を用いてこのモデルを変形する。モデルの変形ルールはモデル固有であり、国際標準規格や業界標準、運用規定等により定められており、これらに従い実行する。
2次元画像合成部224は、このようにして変形されたモデルを、「ピクチャ面情報」で指示される平面で投影もしくは切断して、2次元平面のモデル画像を取得する。ここで用いる「投影情報」には、当該平面に対して投影するか、当該平面で切断するか、投影する場合には平行投影か透写投影かの情報、透写投影の場合には光源の位置座標を含まれる。
得られた2次元のモデル画像はモデルベース動き補償部225に渡される。モデルベース動き補償部225は、モデル画像内の現在のマクロブロック位置から「モデルベース動きベクトル」だけ移動した位置の16×16ブロックの画素値を取得することで、当該マクロブロック位置におけるモデルベース予測画像を作成する。
次に図7は、本発明による動画像復号化装置の他の実施例を示す構成図である。本実施例の動画像復号化装置250は、前記図6の動画像復号化装置200の構成を動画像復号化部200’として備える他に、ユーザインタフェース部251、復号化装置制御部252、符号化モデルデータベース部253を有する。符号化モデルデータベース部253は、動画像復号化装置250内で復号処理に利用可能なモデルデータを管理する。さらに復号化装置制御部252は、ネットワーク260を介して外部のモデルデータサーバ270に接続し、必要なモデルデータを取得する。これらの追加構成により、符号化ストリームの復号に必要なモデルの取得、及び動画像復号化部200’へモデルデータを供給する機能を実現する。
本実施例では、次の手順によりモデルデータを供給する。復号装置制御部252は符号化ストリーム201を復号化する際、そのシーケンスヘッダを解析し、どのモデルデータが必要かの情報を取得する。もし必要なモデルが符号化モデルデータベース部253に存在しない場合には、外部のモデルデータサーバ270からそのモデルデータを取得する。具体的には復号化装置制御部252は、ネットワーク260を介してモデルデータサーバ270にアクセスし、メッセージ261により必要なモデルデータの概要情報を要求する。モデルデータサーバ270は、メッセージ262により要求されたモデルデータの概要情報を復号化装置制御部252へ返信する。この概要情報としては、例えばモデル名やその説明、モデルデータサイズなどが挙げられる。
復号化装置制御部252は、モデルデータの概要情報を取得すると、ユーザインタフェース部251を介して、オペレータに対して復号化のために新たに取得する必要のあるモデルの概要情報の一覧を示し、取得するか否かの選択を促すような画面を提供する。
図8は、モデルデータの概要情報の画面の一例である。オペレータはこのような画面を参照し、これから復号化を行おうとするストリームに必要なモデルの情報を確認しながら、モデルデータを外部から取得するかどうかを指示する。
もしもモデルデータを外部から取得する場合には、復号化装置制御部252は、モデルデータサーバ270に対して、必要なモデルデータをメッセージ261により要求する。このときのメッセージ261には、要求するモデルのIDを格納する。モデルデータサーバ270は、要求されたモデルデータをメッセージ262により送信する。
復号化装置制御部252は、受信したモデルデータをモデルデータベース部253に格納する。もしくはこのモデルデータを、動画像復号化装置250が管理する動的メモリ領域に格納し、このメモリアドレスを動画像復号化部200’に設定する。このモデルデータのメモリアドレスは、動画像復号化部200’内のモデル制御部221に渡される。モデル制御部221は、このメモリアドレスを参照してモデルデータ格納部222にモデルデータをコピーする。あるいは、メモリアドレスを参照してモデルデータを直接取得してもよい。
以上により、動画像復号化部200’では、動画像復号化装置250にて設定されたモデルデータを、内部での復号化に利用することが可能となる。
なお、復号化装置制御部252がモデルデータを取得するタイミングは、必ずしも符号化ストリーム201を解析した後である必要はない。すなわち予め必要なモデルデータの組の情報が分かる場合には、符号化ストリームを取得する以前からモデルデータを取得することも可能である。例えば、地上デジタル放送における番組情報として、予め番組内の符号化ストリームに使用されるモデルセット情報(シーケンスヘッダ内のモデルセット情報に相当)が格納されていれば、予め必要なモデルデータを取得してもよい。
またモデルデータサーバ270と定期的に交信し、常にモデルデータを最新の状態に更新してもよいし、そこで管理される全てのモデルデータを取得しておくようにしてもよい。例えば画像診断装置などでは、撮像する対象が限定されるため、撮影部位に応じたモデルデータ全てをモデルデータサーバ270に格納しておくことも可能である。このモデルデータを利用する復号化装置250や符号化装置150は、モデルデータサーバ270から定期的にモデルの一覧リストを取得し、追加、更新されたモデルデータがあれば、各々の符号化モデルデータベース部に予めダウンロードしてもよい。
以上に述べたように、本実施例による動画像復号化装置では、復号に必要なモデルデータを予め取得することにより、様々なモデルを用いて符号化されたモデルベース符号化ストリームに対して好適に復号化を行うことが可能となる。
実施例3は、動画像符号化及び復号化に用いるモデルデータを、階層レベルに応じて変換して用いることを特徴とする。ここで階層レベルとは、同一のモデルデータに設定する解像度の高低を示す指数である。
図1の動画像符号化装置100内のモデル制御部121は、入力画像の解像度とこれに適したモデルデータの階層レベルとの対応関係を予め記憶している。そして、符号化対象画像の解像度が低く、モデルデータの階層レベルを低いレベルに切り替える場合には、モデル制御部121は、モデルデータを構成する要素の大きさ(面積や体積)を大きくすることで要素の数を小さくし、これに応じた属性値を再計算してモデルデータ格納部122へ格納する。このようにモデルデータの階層レベルを低くすることで、モデルマッチング部123や2次元画像合成部124における処理量を軽減することができる。モデルデータの階層レベルを変更した場合は、その情報を符号化ストリームに格納しておく。
同様に図6の動画像復号化装置200においては、符号化ストリームから階層レベルの情報を取得する。モデル制御部221は、階層レベルの情報に従い、モデルデータの構成要素の大きさと数の変換及び属性値の変換を行う。これにより、モデル変形部223と2次元画像合成部224における処理量も軽減される。
なお、モデルデータの階層レベルを下げるか否かの判定はユーザが判断し、図4のユーザインタフェース部151から指示することでもよい。
モデルデータの階層レベルの切り替えに当たり、モデルデータの構成要素の大きさと数の変換、これに対応した属性値の変換は、個々のモデルデータの種類と階層レベルに応じて予めルールを決めておくことが望ましい。
図9は、モデルデータの変換の一例を示す図で、モデルの要素が三角パッチ面から構成されている場合である。(a)は変換前、(b)は変換後である。(a)の状態から要素の大きさを増やして要素数を減らすため、三角パッチ面A0,A1,A2・・・を構成する頂点を1点置きにサンプリングする。そして、(b)のようにサンプリングされた点を頂点とする新たな三角パッチ面B0,B1の要素を構成する。
このようにしてモデルデータの要素数と大きさを変更した場合、新たな要素における属性値は、元の要素値から予め定められたルールに従って計算する。例えば同図(b)の要素B0における属性値は、要素B0の基となっている同図(a)の要素A0〜A3の属性値の平均を求めることで得られる。
また図10は、モデルデータの変換の他の例を示す図で、モデルの要素が立方体のボクセルによって構成されている場合である。この場合も同様に、変換前の(a)のボクセルを構成する頂点を1点置きにサンプリングし、(b)のようにサンプリングされた点を頂点とする新たなボクセル要素を構成する。この新たなボクセル要素における属性値は、(a)の元のボクセル8個分の属性値の平均を求めることで得られる。
上記の例では、要素を構成する頂点の間隔を変えることで要素の大きさと数を変換する例を示したが、変換の方法はこれに限定されるものではなく、何らかのルールが予め定義され、一意に新たな要素が得られるものであればよい。
以上に述べたように、本実施例によれば、動画像符号化及び復号化に必要なモデルデータを、階層レベルに従い要素の大きさと数、及び個々の要素の属性値を変換することで、符号化及び復号化における処理量を軽減する効果がある。
本発明の動画像符号化装置及び復号化装置は、フレームが時間方向に配置されるような一般的な動画像のみならず、X線CTやMRIなどの画像診断装置における3次元画像にも適用可能である。実施例4は、このような画像診断装置に関する。すなわち画像診断装置では、撮像面の位置(動画像における各フレームの時刻に相当)が3次元空間内に配置されているため、一般的な動画像におけるフレーム時刻情報を、画像診断装置における各撮像面の空間的位置と対応付けが可能である。必要に応じてこのような対応付けに関する情報を付加してもよい。
図11は、本発明を適用した医用画像診断装置の一実施例を示す構成図である。医用画像診断装置としてはX線CT、MRIなどが挙げられるが、ここではX線CTを例に説明する。
医用画像診断装置300は、撮影した画像のモデルベース符号化と復号化を行う符号化・復号化処理部310の他に、画像取得部320、撮影プロトコル記憶部330、制御部340、ユーザインタフェース部350を備えて構成される。さらに制御部340は、ネットワーク360を介し外部のモデルデータサーバ370に接続されている。画像取得部320は、撮像対象の3次元再構成画像データを取得する。撮影プロトコル記憶部330は、撮影条件を含む撮影プロトコルを記録する。制御部340は、医用画像診断装置300の動作全体を制御する。符号化・復号化処理部310は、画像取得部320で生成された断層画像の符号化や、既に符号化されたストリームからの断層画像の復号を行う。ユーザインタフェース部350は、画像取得部320で生成された断層画像や、符号化・復号化処理部310での断層画像の符号化に用いるモデルの選択、符号化・復号化処理部310で復号された断層画像の表示、撮影プロトコルの入力等に用いられる。
画像取得部320の構成及び動作について説明する。画像取得部320は、スキャン制御部321、撮影部322、画像再構成部323、ボリュームデータ記憶部324から構成される。画像取得部320は、撮像対象に対してX線ビームを照射し、撮像対象を透過したX線ビームを検出し、検出されたX線投影データに基づいて3次元ボリュームデータを生成する。
撮影部322は撮像対象物を置く寝台、X線源、X線検出器、データ収集部などから構成され、撮像対象に対してX線ビームを照射し、撮像対象を透過したX線を検出する。X線検出器は、互いに直交する2方向それぞれにアレイ状に配列されたX線検出素子から成る。データ収集部は、X線検出素子と同様にアレイ状に配列されたデータ収集素子から成り、スキャン制御部321が出力する制御信号に応じてデータを収集する。この収集されたデータがX線投影データとなる。
撮影部322はスキャン制御部321の制御の下、撮像対象を置いた寝台を撮像対象の体軸に沿って移動させながらX線源を撮像対象の周りで回線させることで、撮像対象に対して螺旋状となるようなスキャンによる撮影を行う。
画像再構成部323は、撮影部322により出力されるX線投影データから、X線吸収係数の3次元分布データである3次元画像データ(ボリュームデータ)を再構成する。この再構成処理は、フーリエ変換を用いる方法や逆投影処理を行うなど、既知の方法により実現される。再構成されたボリュームデータは、ボリュームデータ記憶部324に記憶される。
画像生成部325は、ボリュームデータ記憶部324に記憶されたボリュームデータを用いて、任意の断面画像データを生成する。生成された断面画像は、ユーザインタフェース部350で表示される。
符号化・復号化処理部310は、動画像符号化部311と動画像復号化部312、及び符号化モデルデータベース313から構成される。動画像符号化部311は、前記実施例1(図1)による動画像符号化装置100と同等であり、画像取得部320で生成された断層画像のシーケンスを入力して、既に述べた画像符号化処理を行って圧縮された符号化ストリームを生成する。
動画像復号化装置312は、前記実施例2(図6)による動画像符号化装置200と同等であり、圧縮された符号化ストリームに含まれる任意の断層画像を復号化する。
符号化モデルデータベース313は、動画像符号化部311が利用可能なモデルデータと、動画像復号化部312が利用可能なモデルデータとの管理を行う。動作は、図4、図7の符号化モデルデータベース153、253と同様である。
ユーザインタフェース部350は、画像取得部320で生成された断層画像や、符号化・復号化処理部310での断層画像の符号化に用いるモデルデータの選択、外部のモデルデータサーバ370からのモデル取得の決定、符号化・復号化処理部310で復号された断層画像の表示、撮影プロトコルの入力等に用いられる。ここでモデルデータの選択やモデルデータサーバ370からのモデル取得の決定などのインタフェースは、図5、図8にて述べた例と同様である。
本実施例の医用画像診断装置に用いられるモデルデータの一例を説明する。「モデル名」は、モデルデータの特徴を示す文字列であり、例えば、「脳のX線CT画像(水平断面用)」「脳のX線CT画像(矢状断面用)」「腹部MRI画像(標準男性)」「腹部MRI(肥満男性)」などを用意する。この他、「胸部X線CT画像」、「腹部X線CT画像」、「頭部MRI画像」といった、撮像された対象部位に応じて、符号化に用いるモデルを選択できるようにする。これより、様々な撮像対象に対して最適なモデルベース符号化を実行することができる。また、「腹部X線CT」の撮像画像を符号化する場合、標準的な腹部モデルとして、「成人男性」、「成人女性」、「肥満型男性」、「肥満型女性」といった、符号化対象の特質に応じてさらに細分化したモデルを用意することで、より精度の高い予測画像を生成し、圧縮率のさらなる向上が期待できる。
本発明による動画像符号化装置の一実施例を示す構成図(実施例1)。 モデルデータの構造の一例を示す図。 符号化ストリームの構成を説明する図。 本発明による動画像符号化装置の他の実施例を示す構成図。 モデルリストの通知画面の一例を示す図。 本発明による動画像復号化装置の一実施例を示す構成図(実施例2)。 本発明による動画像復号化装置の他の実施例を示す構成図。 モデルデータの概要情報の画面の一例を示す図。 モデルデータの変換の一例を示す図(三角パッチ面)(実施例3)。 モデルデータの変換の一例を示す図(ボクセル要素)。 本発明を適用した医用画像診断装置の一実施例を示す構成図(実施例4)。
符号の説明
100…動画像符号化装置
121…モデル制御部
122…モデルデータ格納部
123…モデルマッチング部
124…2次元画像合成部
125…モデルベース動き予測部
150…動画像符号化装置
151…ユーザインタフェース部
152…符号化装置制御部
153…符号化モデルデータベース部
200…動画像復号化装置
221…モデル制御部
222…モデルデータ格納部
223…モデル変形部
224…2次元画像合成部
225…モデルベース動き補償部
250…動画像復号化装置
251…ユーザインタフェース部
252…復号化装置制御部
253…符号化モデルデータベース部。

Claims (13)

  1. 入力画像に対し予測画像との差分をとり、予測差分画像を直交変換、量子化、可変長符号化して符号化ストリームを出力する動画像符号化装置において、
    上記予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、
    該モデルベース予測系統は、
    モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、
    上記複数のモデルデータを所定のパラメータを用いて変形し上記入力画像に最適なモデルを選択するモデルマッチング部と、
    変形されたモデルデータを2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成する2次元画像合成部と、
    上記2次元モデル画像を参照し上記入力画像のモデルベース動き予測ベクトルと上記モデルベース予測画像を生成するモデルベース動き予測部と、
    を有することを特徴とする動画像符号化装置。
  2. 請求項1記載の動画像符号化装置において、
    前記モデルデータには、モデル名、要素型、要素データ、属性データセット、モデルパラメータ初期値が含まれ、前記パラメータによるモデルの操作ルールは予め定義されていることを特徴とする動画像符号化装置。
  3. 請求項1または2に記載の動画像符号化装置において、
    前記出力する符号化ストリームには、前記予測差分画像の情報とともに、前記モデルベース予測画像において予測に用いたモデルを示す情報と、前記モデルの変形に用いたパラメータと、前記モデルベース動き予測ベクトルと、前記2次元平面に関する情報を格納することを特徴とする動画像符号化装置。
  4. 請求項1または2に記載の動画像符号化装置において、
    モデルベース予測に用いるモデル一覧を提示し、一覧の中で必要なモデルのモデルデータを外部から取得する装置制御部を備えることを特徴とする動画像符号化装置。
  5. 請求項1または2に記載の動画像符号化装置において、
    前記入力画像の解像度に応じてモデルベース予測に用いるモデルデータの階層レベルを変換するモデル制御部を備え、
    該モデル制御部は、階層レベルに従いモデルデータの構成要素の大きさと数の変換及び属性値の変換を行うことを特徴とする動画像符号化装置。
  6. 入力する符号化ストリームの可変長符号を復号化、逆量子化、逆直交変換して予測差分画像とし、予測画像と加算して画像を出力する動画像復号化装置において、
    上記予測画像としてモデルベース予測画像を生成するためのモデルベース予測系統を備え、
    該モデルベース予測系統は、
    モデルベース予測に用いる複数のモデルのモデルデータを格納するモデルデータ格納部と、
    上記符号化ストリームから取得した予測に用いたモデルを示す情報と該モデルの変形に用いたパラメータを元に、該当するモデルデータを変形するモデル変形部と、
    上記符号化ストリームから取得した2次元平面に関する情報を元に、2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成する2次元画像合成部と、
    該2次元モデル画像と上記符号化ストリームから取得したモデルベース動き予測ベクトルを用いて上記モデルベース予測画像を生成するモデルベース動き補償部と、
    を有することを特徴とする動画像復号化装置。
  7. 請求項6に記載の動画像復号化装置において、
    前記符号化ストリームから取得した予測に用いたモデルを示す情報を提示し、復号に必要なモデルデータを外部から取得する装置制御部を備えることを特徴とする動画像復号化装置。
  8. 請求項6に記載の動画像復号化装置において、
    前記モデルベース予測に用いるモデルデータの階層レベルを変換するモデル制御部を備え、
    該モデル制御部は、前記符号化ストリームから取得した階層レベルの情報に従い、モデルデータの構成要素の大きさと数の変換及び属性値の変換を行うことを特徴とする動画像復号化装置。
  9. 入力画像に対し予測画像との差分をとり、予測差分画像を直交変換、量子化、可変長符号化して符号化ストリームを出力する動画像符号化方法において、
    上記予測画像としてモデルベース予測画像を生成するために、
    モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、
    上記複数のモデルデータを所定のパラメータを用いて変形し上記入力画像に最適なモデルを選択し、
    変形されたモデルデータを2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成し、
    上記2次元モデル画像を参照し上記入力画像のモデルベース動き予測ベクトルと上記モデルベース予測画像を生成することを特徴とする動画像符号化方法。
  10. 請求項9記載の動画像符号化方法において、
    符号化する際にモデルベース符号化に用いるモデル一覧を提示し、一覧の中で必要なモデルを格納していない場合そのモデルデータを外部から取得することを特徴とする動画像符号化方法。
  11. 請求項9記載の動画像符号化方法において、
    前記入力画像の解像度に応じてモデルベース符号化に用いるモデルデータの階層レベルを変換し、モデルデータの構成要素の大きさと数の変換及び属性値の変換を行うことを特徴とする動画像符号化方法。
  12. 入力する符号化ストリームの可変長符号を復号化、逆量子化、逆直交変換して予測差分画像とし、予測画像と加算して画像を出力する動画像復号化方法において、
    上記予測画像としてモデルベース予測画像を生成するために、
    モデルベース予測に用いる複数のモデルのモデルデータを格納しておき、
    上記符号化ストリームから取得した予測に用いたモデルを示す情報と該モデルの変形に用いたパラメータを元に、該当するモデルデータを変形し、
    上記符号化ストリームから取得した2次元平面に関する情報を元に、2次元平面上に投影もしくは2次元平面で切断して2次元モデル画像を合成し、
    該2次元モデル画像と上記符号化ストリームから取得したモデルベース動き予測ベクトルを用いて上記モデルベース予測画像を生成することを特徴とする動画像復号化方法。
  13. 請求項12に記載の動画像復号化方法において、
    復号化する際に前記符号化ストリームから取得した予測に用いたモデルを示す情報を提示し、
    復号に必要なモデルデータを格納していない場合そのモデルデータを外部から取得することを特徴とする動画像復号化方法。
JP2008135224A 2008-05-23 2008-05-23 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法 Pending JP2009284298A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008135224A JP2009284298A (ja) 2008-05-23 2008-05-23 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法
PCT/JP2009/002041 WO2009141969A1 (ja) 2008-05-23 2009-05-11 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008135224A JP2009284298A (ja) 2008-05-23 2008-05-23 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法

Publications (1)

Publication Number Publication Date
JP2009284298A true JP2009284298A (ja) 2009-12-03

Family

ID=41339911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008135224A Pending JP2009284298A (ja) 2008-05-23 2008-05-23 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法

Country Status (2)

Country Link
JP (1) JP2009284298A (ja)
WO (1) WO2009141969A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012505600A (ja) * 2008-10-07 2012-03-01 ユークリッド・ディスカバリーズ・エルエルシー 特徴を基礎とするビデオ圧縮
JP2013524681A (ja) * 2010-04-09 2013-06-17 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 適応的フィルタを用いたイントラ予測実行方法及び装置
JP2013534384A (ja) * 2010-07-31 2013-09-02 オ,ス−ミ イントラ予測復号化装置
JP2013535919A (ja) * 2010-07-31 2013-09-12 オ,ス−ミ 予測ブロック生成装置
JP2017017736A (ja) * 2010-09-30 2017-01-19 三菱電機株式会社 画像復号装置、画像復号方法、画像符号化装置、画像符号化方法及び符号化データのデータ構造

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH082107B2 (ja) * 1990-03-02 1996-01-10 国際電信電話株式会社 動画像のハイブリッド符号化方法及びその装置
JPH05316491A (ja) * 1992-05-07 1993-11-26 Seiko Epson Corp 顔画像符号化方式
JP3769786B2 (ja) * 1995-09-29 2006-04-26 株式会社デンソー 画像信号の復号化装置
JPH0998416A (ja) * 1995-09-29 1997-04-08 Denso Corp 画像信号の符号化装置および画像の認識装置
JP3593067B2 (ja) * 2001-07-04 2004-11-24 沖電気工業株式会社 画像コミュニケーション機能付き情報端末装置および画像配信システム

Cited By (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012505600A (ja) * 2008-10-07 2012-03-01 ユークリッド・ディスカバリーズ・エルエルシー 特徴を基礎とするビデオ圧縮
US10623770B2 (en) 2010-04-09 2020-04-14 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US9781448B2 (en) 2010-04-09 2017-10-03 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP7324909B2 (ja) 2010-04-09 2023-08-10 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像デコード方法および映像エンコード方法
JP2014207683A (ja) * 2010-04-09 2014-10-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 適応的フィルタを用いたイントラ予測実行方法及び装置
JP2014207684A (ja) * 2010-04-09 2014-10-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 適応的フィルタを用いたイントラ予測実行方法及び装置
JP2014207685A (ja) * 2010-04-09 2014-10-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 適応的フィルタを用いたイントラ予測実行方法及び装置
US10560721B2 (en) 2010-04-09 2020-02-11 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US11601673B2 (en) 2010-04-09 2023-03-07 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP2022141850A (ja) * 2010-04-09 2022-09-29 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像デコード方法、映像エンコード方法および記録媒体
JP7111859B2 (ja) 2010-04-09 2022-08-02 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像デコード方法、映像エンコード方法および記録媒体
JP2021106403A (ja) * 2010-04-09 2021-07-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像デコード方法、映像エンコード方法および記録媒体
US10951917B2 (en) 2010-04-09 2021-03-16 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US10623769B2 (en) 2010-04-09 2020-04-14 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP2013524681A (ja) * 2010-04-09 2013-06-17 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 適応的フィルタを用いたイントラ予測実行方法及び装置
JP2018137781A (ja) * 2010-04-09 2018-08-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute ビデオデコーディング装置
JP7488947B2 (ja) 2010-04-09 2024-05-22 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 映像デコード方法、映像エンコード方法および記録媒体
JP2016140090A (ja) * 2010-04-09 2016-08-04 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 適応的フィルタを用いたイントラ予測実行方法及び装置
US10560722B2 (en) 2010-04-09 2020-02-11 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP2020005277A (ja) * 2010-04-09 2020-01-09 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 映像デコード方法、映像エンコード方法および記録媒体
US10440393B2 (en) 2010-04-09 2019-10-08 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US10440392B2 (en) 2010-04-09 2019-10-08 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US10432968B2 (en) 2010-04-09 2019-10-01 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US10075734B2 (en) 2010-04-09 2018-09-11 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP2018137782A (ja) * 2010-04-09 2018-08-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute ビデオデコーディング装置
JP2018137783A (ja) * 2010-04-09 2018-08-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute ビデオデコーディング装置
US9549204B2 (en) 2010-04-09 2017-01-17 Electronics And Telecommunications Research Instit Method and apparatus for performing intra-prediction using adaptive filter
JP2018137780A (ja) * 2010-04-09 2018-08-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute ビデオデコーディング装置
US9661345B2 (en) 2010-04-09 2017-05-23 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP2017143542A (ja) * 2010-04-09 2017-08-17 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute ビデオデコーディング装置
JP2018137779A (ja) * 2010-04-09 2018-08-30 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute ビデオデコーディング装置
US9838711B2 (en) 2010-04-09 2017-12-05 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
US10623771B2 (en) 2010-04-09 2020-04-14 Electronics And Telecommunications Research Institute Method and apparatus for performing intra-prediction using adaptive filter
JP2016165128A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2016220245A (ja) * 2010-07-31 2016-12-22 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2017011730A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2017011732A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2017011733A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2017011729A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2017011727A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2017011728A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2017011731A (ja) * 2010-07-31 2017-01-12 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
CN106231314B (zh) * 2010-07-31 2020-02-04 M&K控股株式会社 用于对图像进行解码的装置
CN106231313B (zh) * 2010-07-31 2020-02-04 M&K控股株式会社 用于对图像进行编码的装置
JP2013534384A (ja) * 2010-07-31 2013-09-02 オ,ス−ミ イントラ予測復号化装置
JP2016220246A (ja) * 2010-07-31 2016-12-22 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
CN106231313A (zh) * 2010-07-31 2016-12-14 M&K控股株式会社 用于对图像进行编码的装置
CN106231314A (zh) * 2010-07-31 2016-12-14 M&K控股株式会社 用于对图像进行解码的装置
JP2016165129A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2016165130A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2016165126A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2016165131A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2016165132A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像復号化装置
JP2016165127A (ja) * 2010-07-31 2016-09-08 エム アンド ケー ホールディングス インコーポレイテッド 映像符号化装置
JP2013535919A (ja) * 2010-07-31 2013-09-12 オ,ス−ミ 予測ブロック生成装置
JP2017017736A (ja) * 2010-09-30 2017-01-19 三菱電機株式会社 画像復号装置、画像復号方法、画像符号化装置、画像符号化方法及び符号化データのデータ構造

Also Published As

Publication number Publication date
WO2009141969A1 (ja) 2009-11-26

Similar Documents

Publication Publication Date Title
CN109745062B (zh) Ct图像的生成方法、装置、设备及存储介质
US20080219567A1 (en) Tomosynthesis imaging data compression system and method
US20230080852A1 (en) Use of tiered hierarchical coding for point cloud compression
EP3247108B1 (en) Multi-resolution lightfield rendering using image pyramids
WO2009141969A1 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法及び動画像復号化方法
US11711535B2 (en) Video-based point cloud compression model to world signaling information
JP7344988B2 (ja) ボリュメトリック映像の符号化および復号化のための方法、装置、およびコンピュータプログラム製品
US20230262208A1 (en) System and method for generating light field images
Karadimitriou Set redundancy, the enhanced compression model, and methods for compressing sets of similar images
US20230084376A1 (en) Information processing device, 3d model generation method, and program
US11792453B2 (en) Coding scheme for immersive video with asymmetric down-sampling and machine learning
JP2005152645A (ja) プログレッシブな医用画像ボリューム・ナビゲーション
JPWO2015056712A1 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、及び動画像復号プログラム
JP4964827B2 (ja) 多視点距離情報符号化方法,復号方法,符号化装置,復号装置,符号化プログラム,復号プログラムおよびコンピュータ読み取り可能な記録媒体
Munoz-Gómez et al. Correlation modeling for compression of computed tomography images
WO2023023918A1 (zh) 解码方法、编码方法、解码器以及编码器
JP2003174590A (ja) 画像処理装置及び画像処理システム並びにそれらの制御方法
WO2022102016A1 (ja) 画像符号化装置、画像符号化方法、画像復号装置、画像復号方法及びコンピュータープログラム
Prazeres Static Point Clouds Compression Efficiency of Mpeg Point Clouds Coding Standards A practical Comparison between Two Powerful PCC Codec’s
JP6658191B2 (ja) 符号化装置、符号化方法、及びプログラム
KR20230012558A (ko) 비디오 기반 포인트 클라우드 코딩을 위한 고속 재채색
JP2023533416A (ja) ビデオベースの点群コーディングのための条件付き再着色
JP2002517048A (ja) デジタル・サブトラクション画像法におけるノイズとデジタル画像不良を軽減する方法
Zhen et al. Lossless compression of DSA image sequence based on D/sup 2/PCM coder
JP2018019789A (ja) 画像符号化装置及びその制御方法