JP5061355B2 - 画像符号化方法、装置およびプログラムならびに画像処理機器 - Google Patents

画像符号化方法、装置およびプログラムならびに画像処理機器 Download PDF

Info

Publication number
JP5061355B2
JP5061355B2 JP2009266020A JP2009266020A JP5061355B2 JP 5061355 B2 JP5061355 B2 JP 5061355B2 JP 2009266020 A JP2009266020 A JP 2009266020A JP 2009266020 A JP2009266020 A JP 2009266020A JP 5061355 B2 JP5061355 B2 JP 5061355B2
Authority
JP
Japan
Prior art keywords
prediction
picture
image
affected
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009266020A
Other languages
English (en)
Other versions
JP2010045857A (ja
Inventor
宗明 山口
雅俊 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Kokusai Electric Inc
Original Assignee
Hitachi Kokusai Electric Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Kokusai Electric Inc filed Critical Hitachi Kokusai Electric Inc
Priority to JP2009266020A priority Critical patent/JP5061355B2/ja
Publication of JP2010045857A publication Critical patent/JP2010045857A/ja
Application granted granted Critical
Publication of JP5061355B2 publication Critical patent/JP5061355B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像を符号化・復号化する技術に関し、特に、少ない遅延時間により動画像の符号化・復号化を行う方法および装置に適用して有効な技術に関するものである。
従来から知られているJPEG、MPEG−2に代表される動画像の符号化技術では、画像情報が一般的に持つ特性、すなわち隣接画素間とフレーム間に高い相関を持つという特性を利用し、更に人間の視覚にとって変化を知覚しにくい高周波成分などの冗長な情報を削減することにより、広い伝送帯域(例えば、HD−SDI(High Definition Serial Digital Interface)では約1.5Gbps)にある入力画像を、低い伝送帯域(例えば、地上波デジタル放送での約15Mbps)に適用させることができるようにしている。
このような技術としては、例えば、特開平5−300492号公報(特許文献1)、特開平11−4437号公報(特許文献2)、特開平11−234671号公報(特許文献3)、特開2003−348538号公報(特許文献4)などの技術が提案されている。
近年では、ISO/MPEG(International Organization for Standardization / Moving Picture Experts Group)とITU−T/VCEG(International Telecommunication Union - Telecommunication standardization sector / Video Coding Experts Group)の共同プロジェクトによって策定されたH.264/AVC画像符号化方式がその圧縮率性能で広く使用されるに至っている。このH.264/AVC規格については、例えば、Joint Video Team (JVT) of ISO / IEC MPEG & ITU-T VCEG : Text of ISO / IEC 14496-10 Advanced Video Coding 3rd Edition (2004).(非特許文献1)などに詳細に記載されている。
特開平5−300492号公報 特開平11−4437号公報 特開平11−234671号公報 特開2003−348538号公報
Joint Video Team (JVT) of ISO / IEC MPEG & ITU-T VCEG : Text of ISO / IEC 14496-10 Advanced Video Coding 3rd Edition (2004).
ところで、上記H.264/AVC規格では、マクロブロックと呼ばれる16×16画素ブロック単位で符号化処理を行う。画面内あるいは画面間予測においては、16×16画素や、8×8画素、4×4画素等にマクロブロックをブロック単位に分割し、各ブロック単位で予測処理によって符号化を行うことが規定されている。この技術によると、入力画像の細かな動きあるいは模様に応じて、規定されている多数の予測モードを使い分けることによって、符号化効率を向上することができる。
以下、H.264/AVC規格を例にして画面内予測処理と画面間予測処理の概要を説明する。
画面内予測は、同一画面内の隣接画素の画素相関を利用して圧縮率を向上させる方法である。例えば、画面内予測モードの一つであるIntra4×4DC予測処理は、4×4画素単位での予測であり、該当4×4画素ブロックの上辺に隣接する4画素および左辺に隣接する4画素の計8画素の値の平均値を予測値として使用する。該当ブロックの各画素値と予測値との差分を変換し、量子化、可変長符号化を施して、ビットストリームに格納する。H.264/AVCにおける画面内予測モードは、4×4画素単位で8モード、8×8画素単位で8モード、16×16画素単位で4モード設定されている。なお、以上は輝度データに関してであり、色差データに関しては輝度とは別に4モードが設定されている。
画面間予測は、画像の画面間の画素相関を利用して圧縮率を向上させる方法である。例えば、前方予測モードの1つであるP4×4予測処理は、符号化対象ブロックに対して処理時間で前方(過去)に位置するピクチャの類似した領域を用いて予測画像を生成する。画面間予測は予測画素サイズに応じた複数の予測モードを有し、そのモードに従って予測画像が生成される。H.264/AVCでは、前方予測では、4×4画素、8×4画素、4×8画素、8×8画素、16×8画素、8×16画素、16×16画素、スキップの8種類のモードがある。また、双方向予測では23種類の予測モードがある。これらの中から最も符号化コスト値が小さくなるモードを一つ選択して符号化を行う。
一般的に、画面内予測と画面間予測とでは、画面間予測の方がより高い精度の予測値が得られる。そのため、画面間予測の使用率を上げることにより各画素値と予測値との差分を小さくすることができ、高い圧縮率を得ることが可能となる。一方、画面間予測は予測値を算出するために他の画面を使用するため、対象画面の復号化の際に予測に使用した画面が復号化されていない場合は、正常に復号化できない。一般的には、画面内予測のみで構成されたピクチャ(Iピクチャ)を定期的に挿入し、復号化時に画面間予測で使用するピクチャの範囲を限定している。その結果、ランダムアクセスが可能となる。
また、ランダムアクセスを必要としない動画像ストリームに関しては、先頭のピクチャのみをIピクチャとし、その他のピクチャは画面間予測を含むピクチャ(Pピクチャ)として構成し、最初のピクチャ以外での圧縮率を向上させる方法もある。しかしながらこの方法では、途中位置からの再生ができないことから、利用方法は限定されてしまう。
一方、画像符号化では、符号化および復号化時に遅延が発生することが一般的に知られている。画像符号化装置に画像を入力後、画像符号化装置より出力された符号を画像復号化装置に入力し、復号化処理を実行して表示を行うシステムなどにおいて、同一ピクチャの画像入力から表示までの時間差が遅延時間であり、一般的な画像符号化および復号化装置では、数100ミリ秒から数秒程度の遅延となっている。昨今、非圧縮画像データとの同時使用などを目的として、例えば遅延時間が16ミリ秒以下といったような、画像符号化および復号化の低遅延化の必要性が出てきている。
低遅延の画像符号化および復号化を実現するためには、データ発生量の変動を抑えることが必要である。一般に、画像データは、画像データ全体のデータ量から決定される固定のビットレートにより伝送され、伝送された画像データはバッファに格納されて処理される。
ここで、画像ピクチャのある領域においてビットレート以上の大量のビット量を生成した場合、当該領域については、処理の際にバッファ内にあるデータでは足りず、バッファへのデータの伝送待ちが生じてしまう。当該領域について全ての処理が完了しないと当該領域を表示することができないため、結果として画像全体の表示としては遅延時間が大きくなってしまう。つまり、遅延時間は想定される最大ビット発生量を処理する時間によって設定され、この時間は、ビットレートと最大ビット発生量との差、すなわち発生データの変動量に大きく影響されることになる。
従来の技術では、以下の3種類の方法で画像の符号化を行うことが考えられる。まず、一般的な画像符号化方法では、連続するPピクチャの間に定期的にIピクチャを挿入している。IピクチャはPピクチャと比較して発生ビット量が多いため、遅延時間をIピクチャの処理に合わせて設定する必要がある。この場合、データ発生量の変動が大きいため、遅延時間が増大することとなっていた。例えば、地上波デジタル放送では、0.5秒に1度の割合でIピクチャ(Iフレーム)が挿入されることになっている。そのため、500ミリ秒から数秒程度の符号化および復号化遅延が生じている。
別の方法として、全てIピクチャにて符号を構成することも可能である。この場合、ビットレートが大きくなり、データ発生量の変動も小さいことから、遅延時間を低減することは可能である。しかしながらIピクチャは一般的に予測精度がPピクチャに比べて低いため圧縮率が低くなり、全てIピクチャで構成した場合には圧縮率の向上が困難となる。
その他の方法として、先頭のピクチャのみIピクチャとし、その他をPピクチャとした構成が考えられるが、この方法では、前述したように途中位置からの再生ができず、利用方法が非常に限定されてしまう。
そこで本発明の目的は、低遅延かつ高圧縮で、ランダムアクセス可能な動画像の符号化を可能とする画像符号化方法および装置を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。
本発明の代表的な実施の形態による画像符号化方法は、画像の符号化時に影響の有るピクチャの範囲の最大値を定義する値を設定しておき、予測処理時に該当ピクチャがどの程度時間的に離れた過去のピクチャからの影響を受けるかを管理し、実際に影響を受けるピクチャの範囲が上記で設定した値より少なくなるように制御を行うことを特徴とするものである。
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。
本発明の代表的な実施の形態によれば、定期的なIピクチャの挿入を必要とせず、低遅延かつ高圧縮で、ランダムアクセス可能な動画像の符号化方法および装置を提供することが可能となる。
本発明の実施の形態1の画像符号化装置における処理モジュールの構成を示した図である。 本発明の実施の形態1の画像符号化装置における符号化処理モジュールの処理の流れを表したフローチャートである。 本発明の実施の形態1の画像符号化装置における影響ピクチャ数情報テーブルの概要を表した図である。 本発明の実施の形態1の画像符号化装置における画像符号化時に処理する順番でピクチャを並べた概念図である。 本発明の実施の形態1の画像符号化装置における画像出力開始ピクチャ数Nsの設定時のフローチャートである。 本発明の実施の形態1の画像符号化装置における影響ピクチャ数情報テーブルの初期化動作を示すフローチャートである。 本発明の実施の形態1の画像符号化装置における予測処理実行時の影響ピクチャ数制御部の動作を示すフローチャートである。 本発明の実施の形態1の画像符号化装置における影響ピクチャ数情報テーブルの更新時の影響ピクチャ数制御部の動作を示すフローチャートである。 本発明の実施の形態2の画像符号化装置における影響ピクチャ数情報テーブルの概要を表した図である。 本発明の実施の形態2の画像符号化装置における参照に使用するピクチャの概念図である。 本発明の実施の形態2の画像符号化装置における予測処理実行時の影響ピクチャ数制御部の動作を示すフローチャートである。 本発明の実施の形態2の画像符号化装置における影響ピクチャ数情報テーブルの更新時の影響ピクチャ数制御部の動作を示すフローチャートである。
<本発明の実施の形態の概要>
動画像の符号化において、Pピクチャによる符号化の問題点は、該当ピクチャの処理がどの程度時間的に離れた各ピクチャの影響を受けるかが画素やブロック毎に異なるため不明な点にあり、この点が復号化時にランダムアクセスができない要因ともなっている。時間的に離れたピクチャの影響の有無を明確にすれば、影響のあるピクチャから復号化を開始することにより該当ピクチャが問題なく復号可能となり、ランダムアクセスが可能となる。
そこで、本発明の一実施の形態である画像符号化装置は、ピクチャ間の時間的距離をピクチャ番号の差分を基に算出したピクチャ数で把握し、画像の符号化時に影響の有るピクチャの範囲の最大値、すなわち、最大でもこれだけの数のピクチャを処理すれば、該当ピクチャを復号化して画像出力することができるという画像出力可能パラメータとして、画像出力開始ピクチャ数Nsを設定しておく。さらに、予測処理時に該当ピクチャが実際にどの程度時間的に離れた過去のピクチャからの影響を受けるかという影響範囲情報として、影響ピクチャ数Neを算出して管理し、影響ピクチャ数Neが画像出力開始ピクチャ数Nsより少なくなるように制御を行うものである。
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一の符号を付し、その繰り返しの説明は省略する。
<実施の形態1>
以下、本発明の実施の形態1である画像符号化装置(エンコーダ)について説明する。図1は、本実施の形態の画像符号化装置における処理モジュールの構成を示した図である。当該画像符号化装置は、例えばLSIなどに実装され、テレビ/ビデオカメラ、DVD/HDDレコーダ、携帯電話、デジタルカメラなど、動画像の符号化処理を行う種々の画像処理機器に搭載することができる。また、各処理モジュールの機能をコンピュータシステム上で稼動するソフトウェアとして実装することなども可能である。
本実施の形態の画像符号化装置における符号化処理モジュールは、予測部102、変換・量子化部103、可変長符号化部104、逆量子化・逆変換部105、フレームメモリ106、影響ピクチャ数制御部108、影響ピクチャ数情報テーブル109、Ns格納領域110を有する構成となっている。
入力画像101が予測部102に入力され、予測処理が行われる。予測処理の結果、予測部102から予測画像が出力され、入力画像101との差分が変換・量子化部103へ出力される。変換・量子化部103により変換・量子化されたデータは、可変長符号化部104にて符号化され、ビットストリーム107として出力される。一方、変換・量子化されたデータは、逆量子化・逆変換部105にて逆量子化・逆変換された後、予測画像と加算され、次段階での予測処理のためにフレームメモリ106に格納される。
Ns格納領域110は、画像出力可能パラメータである画像出力開始ピクチャ数Ns111を保持する手段であり、影響ピクチャ数情報テーブル109は、影響範囲情報である影響ピクチャ数Neを保持する手段であり、影響ピクチャ数制御部108は、符号化における予測処理時に参照ピクチャの範囲を制御する手段である。
予測部102は、予測処理実行時に、影響ピクチャ数制御部108より予測処理に使用する参照ピクチャの領域が使用可能であるかの情報を取得し、使用不可(NG)である場合は参照ピクチャとして使用しない。影響ピクチャ数制御部108は、予測部102から予測処理に使用する参照ピクチャの領域情報を取得し、該当領域の影響ピクチャ数情報を影響ピクチャ数情報テーブル109から取得する。取得した影響ピクチャ数情報と、Ns格納領域110に格納されている画像出力開始ピクチャ数Ns111とを比較し、影響ピクチャ数情報のほうが小さければOK信号を、大きければNG信号を予測部102に出力する。
次に、本実施の形態の画像符号化装置における処理の流れを説明する。図2は、本実施の形態の画像符号化装置における符号化処理モジュールの処理の流れを表したフローチャートである。
まず、画像符号化装置が初期化される(ステップ201)。次に、画像出力開始ピクチャ数Ns111がNs格納領域110に入力される(ステップ202)。その後、影響ピクチャ数情報テーブル109を初期化する(ステップ203)。その際の初期値は、画像出力開始ピクチャ数Ns111より大きな値を用いる。
以下の部分は、符号化処理が終了するまでループ処理される。まず入力画像101が入力され(ステップ204)、予測部102が予測領域を設定する(ステップ205)。予測部102は、影響ピクチャ数制御部108から予測領域が使用可能(OK)か使用不可(NG)かの情報を取得し(ステップ206)、その判定を行う(ステップ207)。OKの場合は、予測領域の予測誤差の評価を実施し(ステップ208)、NGの場合は、予測領域の評価を実施せずに、その後、全予測領域の評価が終了したかの判定を行う(ステップ209)。全予測領域の評価が終了していない場合は、次の予測領域の設定(ステップ205)に戻る。なお、全予測領域が使用不可(NG)であった場合には、画面内予測とするなどの処理を行うことになる。
全予測領域の評価終了後に、決定した予測領域の情報に基づき、影響ピクチャ数情報テーブル109の更新を行う(ステップ210)。その後、入力画像101と予測値との差分値が生成され(ステップ211)、差分値に対して変換・量子化部103において変換・量子化処理を実施する(ステップ212)。変換・量子化データは、逆量子化・逆変換部105において逆量子化・逆変換され(ステップ213)、再構成画像としてフレームメモリ106に書き込まれる(ステップ214)。さらに変換・量子化データは、可変長符号化部104において可変長符号化処理され(ステップ215)、ビットストリーム107として出力される。この後、符号化処理の終了判定がされ(ステップ216)、終了でない場合は、画像の入力(ステップ204)に戻り、終了の場合は処理を終了する。
次に、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109について説明する。図3は、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の概要を表した図である。本テーブルの各要素が持つビット数は、影響ピクチャ数の最大値に応じて規定される。本テーブルは、符号化対象画像の画素数と同数の要素を持つテーブルが参照ピクチャ数+1以上用意される。1が足されているのは、現在符号化処理を行っているピクチャについての影響ピクチャ数情報を格納するテーブル分である。
現在符号化処理を行っているピクチャのテーブルを「0」、直前のピクチャのテーブルを「1」、2ピクチャ前のテーブルを「2」とし、以下、同様に扱う。影響ピクチャ数情報の格納は、図3に示す通り、各画素に対応する位置に格納し、例えば一番左上の画素についての影響ピクチャ数情報は、一番左上の位置(301)に格納される。
次に、本実施の形態の画像符号化装置における影響ピクチャ数Neについて説明する。図4は、本実施の形態の画像符号化装置における、画像符号化時に処理する順番でピクチャを並べた概念図である。現在符号化処理を行っているピクチャはピクチャ401であり、ピクチャ番号はnとする。直前に処理を行ったピクチャはピクチャ402で、ピクチャ番号はn−1である。このように、符号化処理を行った順序に従ってピクチャ番号が付与されるものとする。
影響ピクチャ数Neは、該当領域が過去のどのピクチャまで遡って影響を受けているかを示す指標である。例えば、ピクチャ番号n−1(ピクチャ402)の影響を受けている領域の影響ピクチャ数Neは1となる。また、ピクチャ番号n−4(ピクチャ405)からピクチャ番号n(ピクチャ401)までの影響を受けている領域の影響ピクチャ数Neは4となる。なお、ピクチャ番号n(ピクチャ401)のみの影響を受けている領域の影響ピクチャ数Neは0とする。
次に、本実施の形態の画像符号化装置における画像出力開始ピクチャ数Ns111の設定について説明する。図5は、本実施の形態の画像符号化装置における画像出力開始ピクチャ数Ns111の設定時のフローチャートである。画像出力開始ピクチャ数Ns111が入力されると(ステップ501)、Ns格納領域110に画像出力開始ピクチャ数Ns111を格納し(ステップ502)、処理を終了する。
ここで、Ns格納領域110については、メモリやレジスタなどを用いることが考えられる。また、画像出力開始ピクチャ数Ns111は、当該画像符号化装置が実装された画像処理機器の操作により外部からユーザが入力・設定しても良いし、何らかの手法により算出して設定しても良い。また、画像符号化装置の構築時にNs格納領域110にあらかじめ書き込んでおいても良く、その場合、本動作は不要となる。
次に、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の初期化について説明する。図6は、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の初期化動作を示すフローチャートである。まず、Ns格納領域110より画像出力開始ピクチャ数Ns111を取得する(ステップ601)。次に、画像出力開始ピクチャ数Ns111より大きな数値であるN、例えばN=Ns+1を用いて、本テーブルの該当領域、例えば図3の301の位置へNを書き込む(ステップ602)。次に、全テーブルの全要素に対する書き込みが終了したかを判定する(ステップ603)。書き込みが終了していない場合はステップ602に戻って書き込みを継続し、終了している場合は処理を終了する。
次に、本実施の形態の画像符号化装置における予測処理実行時の影響ピクチャ数制御部108の動作について説明する。図7は、本実施の形態の画像符号化装置における予測処理実行時の影響ピクチャ数制御部108の動作を示すフローチャートである。ここでは、画面間予測において直前のピクチャを参照した場合について説明する。
まず、予測部102より予測領域の画素位置情報および予測モードを取得する(ステップ701)。予測モードは、画面内予測、画面間予測のいずれによる予測かという情報と、さらに画面間予測の場合はどのピクチャを参照しているかの情報を含む。本実施の形態の画像符号化装置では、予測ピクチャは直前のピクチャとしている。次に、予測モードを判定し(ステップ702)、画面間予測である場合は、影響ピクチャ数情報テーブル109の「1」のテーブルを選択し(ステップ704)、画面間予測でない場合は、「0」のテーブルを選択する(ステップ703)。
次に、取得した予測領域の画素位置情報に基づき、選択したテーブルの対応する画素位置の影響ピクチャ数Neを取得する(ステップ705)。その後、予測モードを判定し(ステップ706)、画面間予測の場合は、影響ピクチャ数Neに1を加算する(ステップ707)。ここで、予測領域の全画素位置の処理が終了したかを判定し(ステップ708)、終了していない場合は、次の画素位置についての予測モードの判定(ステップ702)に戻る。
全画素位置の処理が終了した場合は、影響ピクチャ数Neの最大値Ne_maxを算出し(ステップ709)、画像出力開始ピクチャ数Ns111を取得して(ステップ710)、Ne_maxと画像出力開始ピクチャ数Ns111との比較を行う(ステップ711)。Ne_max<Nsの場合にはOK信号を出力し(ステップ712)、Ne_max<Nsでない場合にはNG信号を出力して(ステップ713)、処理を終了する。
次に、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の更新時の影響ピクチャ数制御部108の動作について説明する。図8は、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の更新時の影響ピクチャ数制御部108の動作を示すフローチャートである。ここでは、画面間予測において直前のピクチャを参照した場合について説明する。
まず、予測部102より予測領域の画素位置情報および予測モードを取得する(ステップ801)。予測モードは、画面内予測、画面間予測のいずれによる予測かという情報と、さらに画面間予測の場合はどのピクチャを参照しているかの情報を含む。本実施の形態の画像符号化装置では、予測ピクチャは直前のピクチャとしている。次に、予測モードを判定し(ステップ802)、画面間予測である場合は、影響ピクチャ数情報テーブル109の「1」のテーブルを選択し(ステップ804)、画面間予測でない場合は、「0」のテーブルを選択する(ステップ803)。
次に、取得した予測領域の画素位置情報に基づき、選択したテーブルの対応する画素位置の影響ピクチャ数Neを取得する(ステップ805)。その後、予測モードを判定し(ステップ806)、画面間予測の場合は、影響ピクチャ数Neに1を加算する(ステップ807)。その後、処理結果の影響ピクチャ数Neを、影響ピクチャ数情報テーブル109の「0」のテーブルにおける該当の処理画素位置に書き込む(ステップ808)。次に、予測領域の全画素位置の処理が終了したかを判定する(ステップ809)。終了していない場合は、次の画素位置についての予測モードの判定(ステップ802)に戻り、終了している場合は処理を終了する。
以上に説明したように、本実施の形態の画像符号化装置では、画像出力開始ピクチャ数Ns111を設定しておき、予測処理時に該当ピクチャが実際に影響を受ける影響ピクチャ数Neを画素単位で算出して管理し、影響ピクチャ数Neが画像出力開始ピクチャ数Ns111より少なくなるように制御を行う。これにより、画像符号化時のデータ発生量の変動を抑え、定期的なIピクチャの挿入を必要とせず、低遅延かつ高圧縮で、ランダムアクセス可能な画像の符号化を行うことができる。
なお、本実施の形態では、画面間予測時の参照ピクチャとして直前のピクチャを使用する場合のみについて説明したが、予測に使用するピクチャは直前に限定する必要はなく、H.264/AVCにおけるマルチリファレンスのように、双方向を含む複数の参照ピクチャであっても良い。
また、本実施の形態では、画像出力開始ピクチャ数Ns111に対する画像符号化装置側の処理について説明したが、画像出力開始ピクチャ数Ns111をビットストリーム107に格納し、画像復号化装置側に送信しても良い。その場合、画像復号化装置は画像出力開始ピクチャ数Ns111を利用して画像出力のタイミングを調整することが可能となる。
<実施の形態2>
以下、本発明の実施の形態2である画像符号化装置(エンコーダ)について説明する。画像符号化装置の処理モジュールの構成は、実施の形態1での図1の構成と同様であるので、ここでの再度の説明は省略する。
まず、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109について説明する。図9は、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の概要を表した図である。本テーブルの各要素が持つビット数は、影響ピクチャ数の最大値に応じて規定される。
本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109では、実施の形態1と異なり、ブロック単位で影響ピクチャ数情報の格納を行い、例えば、4画素×4画素を1ブロックとした場合は、4画素×4画素単位に1つのテーブルの要素を有する。従って、符号化対象ピクチャのブロック数と同数の要素を持つテーブルが参照ピクチャ数+1以上用意される。1が足されているのは現在符号化処理を行っているピクチャについての影響ピクチャ数情報を格納するテーブル分である。
現在符号化処理を行っているピクチャのテーブルを「0」、直前のピクチャのテーブルを「1」、2ピクチャ前のテーブルを「2」とし、以下、同様に扱う。影響ピクチャ数情報の格納は、図9に示す通り、各ブロックに対応する位置に格納し、例えば4画素×4画素をブロックとした場合は、一番左上の4画素×4画素についての影響ピクチャ数情報は、一番左上の位置(901)に格納される。
次に、本実施の形態の画像符号化装置における影響ピクチャ数Neの決定について説明する。本実施の形態の画像符号化装置では、画素ではなくブロックを単位として影響ピクチャ数Neを扱うために以下の処理が必要である。
図10は、本実施の形態の画像符号化装置における、参照に使用するピクチャの概念図である。参照ピクチャ1001は、影響ピクチャ数Neを管理する単位となるブロックと同じ画素数で構成するブロックに分割する。ブロック1003〜1006はその一部を示している。例えば、現在符号化処理を行っている対象領域が参照する領域が、図10の領域1002であったとする。領域1002は、図10に示す通り、ブロック1003〜1006の影響を受ける。ブロック単位での管理を行うために、影響ピクチャ数Neはブロックで1つの値とする必要がある。そこで、関係ブロック(ブロック1003〜1006)の影響ピクチャ数Neの最大値を選択して、領域1002についての影響ピクチャ数Neとして使用する。
次に、本実施の形態の画像符号化装置における予測処理実行時の影響ピクチャ数制御部108の動作について説明する。図11は、本実施の形態の画像符号化装置における予測処理実行時の影響ピクチャ数制御部108の動作を示すフローチャートである。ここでは、画面間予測において直前のピクチャを参照した場合について説明する。
まず、予測部102より予測領域の画素位置情報および予測モードを取得する(ステップ1101)。予測モードは、画面内予測、画面間予測のいずれによる予測かという情報と、さらに画面間予測の場合はどのピクチャを参照しているかの情報を含む。本実施の形態の画像符号化装置では、予測ピクチャは直前のピクチャとしている。次に、予測モードを判定し(ステップ1102)、画面間予測である場合は、影響ピクチャ数情報テーブル109の「1」のテーブルを選択し(ステップ1104)、画面間予測でない場合は、「0」のテーブルを選択する(ステップ1103)。
次に、取得した予測領域の画素位置情報から予測領域の該当ブロックの位置を算出し(ステップ1105)、該当ブロック位置に基づき、選択したテーブルの対応するブロック位置の影響ピクチャ数Neを取得する(ステップ1106)。その後、予測モードを判定し(ステップ1107)、画面間予測時には、影響ピクチャ数Neに1を加算する(ステップ1108)。ここで、予測領域の全画素位置の処理が終了したかを確認し(ステップ1109)、終了していない場合は、次の画素位置についての予測モードの判定(ステップ1102)に戻る。
全画素位置の処理が終了した場合は、影響ピクチャ数Neの最大値Ne_maxを算出し(ステップ1110)、画像出力開始ピクチャ数Ns111を取得して(ステップ1111)、Ne_maxと画像出力開始ピクチャ数Ns111との比較を行う(ステップ1112)。Ne_max<Nsの場合にはOK信号を出力し(ステップ1113)、Ne_max<Nsでない場合にはNG信号を出力して(ステップ1114)、処理を終了する。
次に、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の更新時の影響ピクチャ数制御部108の動作について説明する。図12は、本実施の形態の画像符号化装置における影響ピクチャ数情報テーブル109の更新時の影響ピクチャ数制御部108の動作を示すフローチャートである。ここでは、画面間予測において直前のピクチャを参照した場合について説明する。
まず、予測部102より予測領域の画素位置情報および予測モードを取得する(ステップ1201)。予測モードは、画面内予測、画面間予測のいずれによる予測かという情報と、さらに画面間予測の場合はどのピクチャを参照しているかの情報を含む。本実施の形態の画像符号化装置では、予測ピクチャは直前のピクチャとしている。次に、予測モードを判定し(ステップ1202)、画面間予測である場合は、影響ピクチャ数情報テーブル109の「1」のテーブルを選択し(ステップ1204)、画面間予測でない場合は、「0」のテーブルを選択する(ステップ1203)。
次に、取得した予測領域の画素位置情報から予測領域の該当ブロックの位置を算出し(ステップ1205)、該当ブロック位置に基づき、選択したテーブルの対応するブロック位置の影響ピクチャ数Neを取得する(ステップ1206)。その後、予測モードを判定し(ステップ1207)、画面間予測の場合は、影響ピクチャ数Neに1を加算する(ステップ1208)。その後、処理結果の影響ピクチャ数Neを、一時的に保存しておく(ステップ1209)。このとき、処理結果の影響ピクチャ数Neが、すでに保存されている影響ピクチャ数Neよりも大きい場合のみ上書き保存することで、最終的に予測領域での影響ピクチャ数Neの最大値が保持されるようにすることができる。
ここで、予測領域の全画素位置の処理が終了したかを判定し(ステップ1210)、終了していない場合は、次の画素位置についての予測モードの判定(ステップ1202)に戻る。全画素位置の処理が終了している場合は、ステップ1209にて一時的に保存してある影響ピクチャ数Neの最大値を、影響ピクチャ数情報テーブル109の「0」のテーブルにおける該当の処理ブロック位置に書き込んで(ステップ1211)、処理を終了する。
なお、本実施の形態の画像符号化装置では、予測領域における影響ピクチャ数Neの最大値を求める際に、予測領域の各画素について該当ブロック位置を算出し、そのブロック位置での影響ピクチャ数Neを取得して、予測領域の全画素位置における最大値を求める方法をとっているが、この方法は一例であり、これに限られるものではない。
このように、ブロック単位で影響ピクチャ数情報の管理を行うことにより、実施の形態1での画素単位での影響ピクチャ数情報の管理と比較して、予測精度は劣るが、影響ピクチャ数情報テーブル109の容量を小さくすることが可能となる。
以上に説明したように、本実施の形態における画像符号化装置では、画像出力開始ピクチャ数Ns111を設定しておき、予測処理時に該当ピクチャが実際に影響を受ける影響ピクチャ数Neをブロック単位で算出して管理し、影響ピクチャ数Neが画像出力開始ピクチャ数Ns111より少なくなるように制御を行う。これにより、画像符号化時のデータ発生量の変動を抑え、定期的なIピクチャの挿入を必要とせず、低遅延かつ高圧縮で、ランダムアクセス可能な画像の符号化を行うことができる。
なお、実施の形態1と同様に、本実施の形態でも画面間予測時の参照ピクチャとして直前のピクチャを使用する場合のみについて説明したが、予測に使用するピクチャは直前に限定する必要はなく、H.264/AVCにおけるマルチリファレンスのように、双方向を含む複数の参照ピクチャであっても良い。
また、実施の形態1と同様に、本実施の形態でも画像出力開始ピクチャ数Ns111に対する画像符号化装置側の処理について説明したが、画像出力開始ピクチャ数Ns111をビットストリーム107に格納し、画像復号化装置側に送信しても良い。その場合、画像復号化装置は画像出力開始ピクチャ数Ns111を利用して画像出力のタイミングを調整することが可能となる。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
本発明は、少ない遅延時間かつ高圧縮で、ランダムアクセス可能な動画像の符号化・復号化を行う方法に利用可能であり、特に、画像符号化装置や、これを実装した画像処理機器などに利用可能である。
101…入力画像、102…予測部、103…変換・量子化部、104…可変長符号化部、105…逆量子化・逆変換部、106…フレームメモリ、107…ビットストリーム、108…影響ピクチャ数制御部、109…影響ピクチャ数情報テーブル、110…Ns格納領域、111…画像出力開始ピクチャ数Ns、
301…影響ピクチャ数情報格納位置、
901…影響ピクチャ数情報格納位置、
1001…参照ピクチャ、1002…参照領域、1003〜1006…ブロック。

Claims (7)

  1. 画像データを入力し、所定のブロック毎に、少なくとも画面内予測符号化と、該画像データについての参照ピクチャおよび該参照ピクチャと該画像データとの間の差分を用いて該画像データの画面間予測符号化とを選択的に行う画像符号化装置における画像符号化方法であって、
    前記画像符号化装置は、
    該画像符号化方法によって符号化された前記画像データを復号化して出力するために必要となる、過去のピクチャの数の最大値を画像出力可能パラメータとして設定する手順と、
    現在符号化処理を行っているピクチャ及び前記参照ピクチャのそれぞれについて、符号化対象の前記画像データにおけるブロック数と同数の要素を有して前記ブロックの各画素の復号化に必要となる過去のピクチャの数を示す影響ピクチャ数を格納するテーブルを用意する手順と、
    前記画像データの符号化の際に、符号化対象の前記ブロックについての予測領域について、前記ブロックを単位として、該予測領域に対応する前記テーブルの、該予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数を取得し、該予測領域における該影響ピクチャ数の最大値を影響範囲情報として算出する手順と、
    画面間予測符号化が選択された際、算出された前記影響範囲情報が前記画像出力可能パラメータを越えるときは、前記予測領域を他の前記予測領域に設定し、いずれの前記予測領域においても算出された前記影響範囲情報が前記画像出力可能パラメータを超えるときは、画面内予測符号化を選択することにより、符号化時における前記参照ピクチャの範囲を制御する手順と
    前記予測領域毎に、該予測領域に対応する前記テーブルの、該予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数を取得し、該予測領域が直前のピクチャから画面間予測符号化により予測されたものである場合は、取得した前記影響ピクチャ数に1を加算し、該予測領域の全画素位置について算出した前記影響ピクチャ数の最大値を、前記現在符号化処理を行っているピクチャにおける前記テーブルの、該予測領域により予測符号化処理される対象の前記ブロックに対応する要素に書き込む手順と、を実行することを特徴とする画像符号化方法。
  2. 請求項1記載の画像符号化方法において、
    前記用意されたテーブルの全要素に所定の前記影響ピクチャ数を書き込んで初期化する手順をさらに実行することを特徴とする画像符号化方法。
  3. 請求項2記載の画像符号化方法において、
    前記制御する手順は、画面内予測符号化が選択された際、前記現在符号化処理を行っているピクチャにおける前記テーブルの、該画面内予測符号化が予測に使用する前記予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数をそれぞれ取得し、取得した前記影響ピクチャ数の最大値を前記影響範囲情報とするものであることを特徴とする画像符号化方法。
  4. 請求項1記載の画像符号化方法において、
    前記画像符号化装置は、前記画像符号化方法によって符号化され出力されるビットストリームに、前記画像出力可能パラメータを格納して、画像復号化装置に送信することを特徴とする画像符号化方法。
  5. 画像データを入力し、所定のブロック毎に、少なくとも画面内予測符号化と、該画像データについての参照ピクチャおよび該参照ピクチャと該画像データとの間の差分を用いて該画像データの画面間予測符号化とを選択的に行う画像符号化装置であって、
    該画像符号化装置によって符号化された前記画像データを復号化して出力するために必要となる、過去のピクチャの数の最大値を画像出力可能パラメータとして設定する手段と、
    現在符号化処理を行っているピクチャ及び前記参照ピクチャのそれぞれについて、符号化対象の前記画像データにおけるブロック数と同数の要素を有して前記ブロックの各画素の復号化に必要となる過去のピクチャの数を示す影響ピクチャ数を格納するテーブルを用意する手段と、
    前記画像データの符号化の際に、符号化対象の前記ブロックについての予測領域について、前記ブロックを単位として、該予測領域に対応する前記テーブルの、該予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数を取得し、該予測領域における該影響ピクチャ数の最大値を影響範囲情報として算出する手段と、
    画面間予測符号化が選択された際、算出された前記影響範囲情報が前記画像出力可能パラメータを越えるときは、前記予測領域を他の前記予測領域に設定し、いずれの前記予測領域においても算出された前記影響範囲情報が前記画像出力可能パラメータを超えるときは、画面内予測符号化を選択することにより、符号化時における前記参照ピクチャの範囲を制御する手段と、
    前記予測領域毎に、該予測領域に対応する前記テーブルの、該予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数を取得し、該予測領域が直前のピクチャから画面間予測符号化により予測されたものである場合は、取得した前記影響ピクチャ数に1を加算し、該予測領域の全画素位置について算出した前記影響ピクチャ数の最大値を、前記現在符号化処理を行っているピクチャにおける前記テーブルの、該予測領域により予測符号化処理される対象の前記ブロックに対応する要素に書き込む手段と、を有することを特徴とする画像符号化装置。
  6. 請求項5記載の画像符号化装置を実装していることを特徴とする画像処理機器。
  7. 画像データを入力し、所定のブロック毎に、少なくとも画面内予測符号化と、該画像データについての参照ピクチャおよび該参照ピクチャと該画像データとの間の差分を用いて該画像データの画面間予測符号化とを選択的に行う画像符号化装置における画像符号化プログラムであって
    画像符号化プログラムによって符号化された前記画像データを復号化して出力するために必要となる、過去のピクチャの数の最大値を画像出力可能パラメータとして設定する処理と、
    現在符号化処理を行っているピクチャ及び前記参照ピクチャのそれぞれについて、符号化対象の前記画像データにおけるブロック数と同数の要素を有して前記ブロックの各画素の復号化に必要となる過去のピクチャの数を示す影響ピクチャ数を格納するテーブルを用意する処理と、
    前記画像データの符号化の際に、符号化対象の前記ブロックについての予測領域について、前記ブロックを単位として、該予測領域に対応する前記テーブルの、該予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数を取得し、該予測領域における該影響ピクチャ数の最大値を影響範囲情報として算出する処理と、
    画面間予測符号化が選択された際、算出された前記影響範囲情報が前記画像出力可能パラメータを越えるときは、前記予測領域を他の前記予測領域に設定し、いずれの前記予測領域においても算出された前記影響範囲情報が前記画像出力可能パラメータを超えるときは、画面内予測符号化を選択することにより、符号化時における前記参照ピクチャの範囲を制御する処理と、
    前記予測領域毎に、該予測領域に対応する前記テーブルの、該予測領域の各画素位置が属するブロックに対応する要素から前記影響ピクチャ数を取得し、該予測領域が直前のピクチャから画面間予測符号化により予測されたものである場合は、取得した前記影響ピクチャ数に1を加算し、該予測領域の全画素位置について算出した前記影響ピクチャ数の最大値を、前記現在符号化処理を行っているピクチャにおける前記テーブルの、該予測領域により予測符号化処理される対象の前記ブロックに対応する要素に書き込む処理と、を実行することを特徴とする画像符号化プログラム。
JP2009266020A 2009-11-24 2009-11-24 画像符号化方法、装置およびプログラムならびに画像処理機器 Expired - Fee Related JP5061355B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009266020A JP5061355B2 (ja) 2009-11-24 2009-11-24 画像符号化方法、装置およびプログラムならびに画像処理機器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009266020A JP5061355B2 (ja) 2009-11-24 2009-11-24 画像符号化方法、装置およびプログラムならびに画像処理機器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007275279A Division JP4676474B2 (ja) 2007-10-23 2007-10-23 画像符号化方法

Publications (2)

Publication Number Publication Date
JP2010045857A JP2010045857A (ja) 2010-02-25
JP5061355B2 true JP5061355B2 (ja) 2012-10-31

Family

ID=42016749

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009266020A Expired - Fee Related JP5061355B2 (ja) 2009-11-24 2009-11-24 画像符号化方法、装置およびプログラムならびに画像処理機器

Country Status (1)

Country Link
JP (1) JP5061355B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06113286A (ja) * 1992-09-30 1994-04-22 Matsushita Electric Ind Co Ltd 高能率符号化装置
JP2830856B2 (ja) * 1996-09-04 1998-12-02 日本電気株式会社 画像符号化装置
US20090074078A1 (en) * 2005-04-13 2009-03-19 Tomoyuki Yamamoto Moving image reproduction device

Also Published As

Publication number Publication date
JP2010045857A (ja) 2010-02-25

Similar Documents

Publication Publication Date Title
US7310371B2 (en) Method and/or apparatus for reducing the complexity of H.264 B-frame encoding using selective reconstruction
JP5861752B2 (ja) 映像復号装置、映像復号方法及びプログラム
US20110150072A1 (en) Encoding method, decoding method and apparatus thereof
JP2022506717A (ja) ビデオ符号化のための方法及び機器
KR20130045785A (ko) 메모리 관리 방법 및 그를 이용한 복호화 장치
JP2008283303A (ja) 画像符号化装置及び画像符号化方法
JP2009021908A (ja) 動画像符号化装置及びプログラム
JP2006217560A (ja) 参考フレームバッファメモリのサイズとアクセス量を減らす方法
JP2022511308A (ja) オーバーラップブロック動き補償のためのブロック拡張を用いた映像符号化又は復号化
JP5396711B2 (ja) 動画像復号装置、動画像復号方法及びプログラム
JP2007013298A (ja) 画像符号化装置
JP2010288166A (ja) 動画像符号化装置、放送波記録装置及び、プログラム
JP4643437B2 (ja) 情報処理装置
JP2009089267A (ja) イントラ予測符号化装置、イントラ予測符号化方法及びプログラム
JP2022531470A (ja) ビデオ・コーディングにおける新しいコーディングされたビデオ・シーケンスを開始するピクチャのための前のピクチャの出力
KR20160105203A (ko) 멀티미디어 코덱, 상기 멀티미디어 코덱을 포함하는 애플리케이션 프로세서, 및 상기 애플리케이션 프로세서의 동작 방법
JP5061355B2 (ja) 画像符号化方法、装置およびプログラムならびに画像処理機器
JP4676474B2 (ja) 画像符号化方法
JP4515870B2 (ja) 信号処理装置及び映像システム
CN115486072A (zh) 用于视频译码的方法和设备
JP2010035025A (ja) 符号化装置およびその方法
JP2008289105A (ja) 画像処理装置およびそれを搭載した撮像装置
KR20170077621A (ko) 영상 압축에서의 플리커링 현상 제거 방법 및 그 장치
JP6874844B2 (ja) 動画像符号化装置、動画像符号化方法、及び、動画像符号化プログラム
JP2005303487A (ja) 動画像復号装置及び動画像復号プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101006

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120712

R150 Certificate of patent or registration of utility model

Ref document number: 5061355

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees