JP2013187905A - 映像を符号化および復号する方法および装置 - Google Patents
映像を符号化および復号する方法および装置 Download PDFInfo
- Publication number
- JP2013187905A JP2013187905A JP2013039752A JP2013039752A JP2013187905A JP 2013187905 A JP2013187905 A JP 2013187905A JP 2013039752 A JP2013039752 A JP 2013039752A JP 2013039752 A JP2013039752 A JP 2013039752A JP 2013187905 A JP2013187905 A JP 2013187905A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- reference picture
- pictures
- encoding
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/43—Hardware specially adapted for motion estimation or compensation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】最適な参照ピクチャ構成と正しい出力順序を満足しつつ復号ピクチャバッファ(DPB)サイズを最小にする。
【解決手段】適切なインスタンスに、および/または所定の優先順位にしたがって、非参照として設定/マーキングされるように連続する参照ピクチャセットが構成された参照ピクチャセット(RPS)を用いる復号ピクチャバッファ(DPB)管理のための新たな方法および装置を導入する。最適な参照ピクチャ構成および正しい出力順序の並び替えの両方をサポートしつつ、DPBサイズを最小に保つことができる。符号化効率を改善できることおよび/またはDPBのためのメモリ容量を削減できる。
【選択図】図4
【解決手段】適切なインスタンスに、および/または所定の優先順位にしたがって、非参照として設定/マーキングされるように連続する参照ピクチャセットが構成された参照ピクチャセット(RPS)を用いる復号ピクチャバッファ(DPB)管理のための新たな方法および装置を導入する。最適な参照ピクチャ構成および正しい出力順序の並び替えの両方をサポートしつつ、DPBサイズを最小に保つことができる。符号化効率を改善できることおよび/またはDPBのためのメモリ容量を削減できる。
【選択図】図4
Description
本発明は、あらゆるマルチメディアデータ符号化に用いることができ、特に、ピクチャ間予測を用いて画像および映像コンテンツの符号化に用いることができる。
H.264/MPEG−4 AVC(Advanced Video Coding)や、HEVC(High−Efficiency Video Coding)等の最新の映像符号化方式では、時間的に連続するピクチャにおける情報の冗長性を利用するために、既に符号化/復号された参照ピクチャからのピクチャ間予測を用いて、画像/映像コンテンツを符号化/復号する。
最新の映像符号化方式は、符号化ピクチャが符号化順序とは異なる順序/並びで出力される場合の、ピクチャの出力順序の並べ替えをサポートしている。出力順序(表示順序としても知られる)は、復号ピクチャが出力あるいは表示される順序を表す。出力順序は、通常、映像の撮影/生成中における非圧縮ピクチャの元の順序に対応する。一方、符号化順序は、ピクチャが符号化映像ビットストリームから復号される順序を表す。ある程度の出力遅延が許容されるアプリケーションにおいて、出力順序の並べ替えにより符号化効率が改善される。
映像符号化中に、入力ピクチャはGOP(Group Of Pictures)に分けられる。例えば、図1に示されるように、1つのGOPは、出力順序が連続する8つのピクチャからなる。図1において、“I”はイントラピクチャを示し、“B”は双予測インターピクチャを示し、大文字(例えば“B”)は参照ピクチャを示し、小文字(例えば“b”)は非参照ピクチャを示す。通常、所定の符号化順序がいくつかのGOPに対して繰り返し用いられる。図1に示されるように、出力順序と異なる順序でピクチャを符号化すると、ピクチャb1、B2、b3、B4、b5、B6およびb7は、復号ピクチャバッファ(DPB)に格納された符号化/復号済み参照ピクチャからの予測であって前方および後方の双方向予測を利用できるようになり、符号化効率が改善される。図1において、インター予測の主要な参照構成が、参照ピクチャから対象ピクチャを指す矢印で示される。図1に示される符号化構造は、階層構造として周知である。複数のピクチャが異なる階層レベルに配置され、高いレベルのピクチャは、低いレベルのピクチャからインター予測され、映像圧縮の量/強度は、低レベル(圧縮度が低いので忠実度が高い)から高レベル(圧縮度が高いので品質が低い)に向かって増加する。
出力の並び替えがある(つまり符号化順序と出力順序とが異なる)場合、非参照ピクチャを含むいくつかのピクチャは、出力時刻になるまでDPBに格納/バッファされる必要がある。ピクチャを規則正しい間隔で確実に出力するためには、そのような出力の遅延が必要である。図1の例において、非参照ピクチャb3、b5、およびb7はそれぞれ1、1、および2ピクチャ区間の間DPBに格納されている。しかしながら、そのようにDPBに非参照ピクチャを格納して出力を待機すると、効率的な符号化に必要な参照ピクチャを格納するためのDPB内の利用可能なスペースが減少する。
HEVC映像符号化方式は、参照ピクチャセット(バッファ記述としても知られている)を用いてDPBの管理を行う。参照ピクチャセット(RPS)は、複数の参照ピクチャの中で非参照ピクチャとして設定されるピクチャを定義する代わりに、DPB内に参照ピクチャとして保持される/含まれるピクチャを定義するために用いられる。RPSは、基本的に、DPB内の全ての参照ピクチャを含むリストである。RPSは対象ピクチャの符号化/復号処理を開始する時点で有効化/適用される。有効なRPSに含まれていないDPB内のピクチャは、非参照ピクチャとして設定される(つまり“参照に使用されない”とマーキングされる)。非参照ピクチャは有効なRPSに記述されていないが、上述の通り、出力タイムインスタンスまでDPB内に残っている。
HEVCにおけるRPSを用いたDPB管理は、AVC映像符号化方式のDPB管理と異なる。AVCにおいて、MMCO(メモリ管理制御操作)コマンドは、“参照に使用されない”と参照ピクチャにマーキングするために、参照ピクチャのスライスヘッダで送信される(よって当該ピクチャが非参照ピクチャとして設定される)。マーキング操作は、MMCOコマンドが送信された参照ピクチャの復号処理の最後に実行される。MMCOコマンドを非参照ピクチャのスライスヘッダで送信することは許されない。
AVCにおける従来のDPB管理方式の問題点は、MMCOコマンドが参照ピクチャのスライスヘッダでしか送信できないことである。その結果、出力順序の並べ替えのために格納される必要のある1以上の非参照ピクチャがある場合に、その非参照ピクチャに先行する参照ピクチャが、DPBの利用可能なスペースを確保する必要がある。参照ピクチャの復号直後には、空のDPBスペースはまだ必要とされない可能性があるが、参照ピクチャを非参照ピクチャとしてマーキングするためのMMCOコマンドは、当該参照ピクチャにおいて送信されてもよい。結果として、符号化順序において当該参照ピクチャに後続する1以上の非参照ピクチャは、参照ピクチャの選択肢が減るため、符号化効率が最適ではない可能性がある。
従来のDPB管理方式の実装形態における別の問題点は、最適な符号化効率と正しい出力順序の並べ替えとの両方を達成するために、参照ピクチャと出力待機中の非参照ピクチャとの両方を含む大きなサイズのDPBを使用することである。大きなサイズのDPBは、より大きなメモリ容量と実装コストを必要とする。さらに、標準的には、DPBのサイズは、HEVCのプロファイルとレベルとの特定の各組み合わせに対する最大値に制限される。
上記課題を解決するため、本発明は、適切なインスタンスに、および/または所定の優先順位にしたがって、非参照として設定/マーキングされるように連続する参照ピクチャセットが構成された参照ピクチャセット(RPS)を用いるDPB管理のための新たな方法および装置を導入する。本発明を用いることで、最適な参照ピクチャ構成および正しい出力順序の並び替えの両方をサポートしつつ、DPBサイズを最小に保つことができる。本発明の利点は、符号化効率を改善できることおよび/またはDPBのためのメモリ容量を削減できることである。
本発明の効果は、DPBのためのメモリサイズを小さく保ちながら、インター予測ピクチャの符号化効率を改善することである。本発明により、DPBからピクチャをタイムリーに削除することができるので、最大DPBサイズの制限を超えることなく、参照ピクチャがインター予測の参照に利用可能である状態をできる限り長く保つことができる。
以下、本発明について、図面を参照しながら説明する。
[符号化装置]
図2は、本発明に係る映像/画像符号化装置200の構成を示すブロック図である。
図2は、本発明に係る映像/画像符号化装置200の構成を示すブロック図である。
映像/画像符号化装置200は、ブロック単位で入力映像/画像ビットストリームを符号化し、符号化出力ビットストリームを生成する装置であり、図2に示されるように、変換部201、量子化部202、逆量子化部203、逆変換部204、ブロックメモリ205、ピクチャメモリ206、イントラ予測部207、インター予測部208、エントロピー符号化部209、およびピクチャメモリ制御部210を備える。
入力映像が加算器に入力され、加算値が変換部201に出力される。変換部201は、加算値を周波数係数に変換し、得られた周波数係数を量子化部202に出力する。量子化部202は入力された周波数係数を量子化し、得られた量子化値を逆量子化部203およびエントロピー符号化部209に出力する。エントロピー符号化部209は、量子化部202から出力された量子化値を符号化し、ビットストリームを出力する。
逆量子化部203は量子化部202から出力されたサンプル値を逆量子化し、周波数係数を逆変換部204に出力する。逆変換部204は、周波数係数を逆周波数変換して周波数係数をビットストリームのサンプル値に変換し、得られたサンプル値を加算器に出力する。加算器は、逆変換部204から出力されたビットストリームのサンプル値を、イントラ/インター予測部207、208から出力された予測映像/画像値に加算し、得られた加算値を、(ピクチャメモリ制御部210を介して)ブロックメモリ205またはピクチャメモリ206に、さらなる予測のため出力する。イントラ/インター予測部207、208は、ブロックメモリ205またはピクチャメモリ206に格納されている再構成映像/画像内を検索し、予測のため、例えば入力映像/画像に最も類似した映像/画像領域を推定する。
ピクチャメモリ制御部210は、ピクチャメモリ206に格納されている再構成ピクチャを管理する。ピクチャメモリ制御部210が行うメモリ管理処理は、再構成ピクチャが保持されるか、ピクチャメモリ206から削除されるかを決定することと、インター予測部208によって用いられる参照ピクチャセットを構築することと、エントロピー符号化部209によって出力ビットストリームに書き込まれる参照ピクチャセットを制御する制御パラメータを決定することとを含む。
[符号化処理]
次に、上述の映像/画像符号化装置200の動作について説明する。
次に、上述の映像/画像符号化装置200の動作について説明する。
図4は、本発明に係る映像/画像符号化装置200が実行する、複数のピクチャに対する実施の形態1の符号化処理S400を示すフローチャートである。
ステップS401において、符号化映像ビットストリームのヘッダにピクチャバッファの最大サイズを書き込む。(例えばバイト単位の)最大サイズは、ピクチャバッファ内に許容される(つまり格納できる)ピクチャの最大数を決定する。最大サイズからピクチャの最大数を導出する方法として、例えば、(バイトで表される)最大サイズを、(バイトで表される)1つの再構成/復号ピクチャのサイズで除算する。そして、ステップS402において、所定の符号化順序にしたがって符号化され、出力順序が連続している複数のピクチャを選択する。このとき、符号化順序と出力順序は異なる。符号化順序に応じて、複数のピクチャのうちの1以上の非参照ピクチャが、少なくとも1ピクチャ区間の間、ピクチャバッファ内に格納される必要があり、その結果、複数のピクチャを、その出力順序にしたがって正しく出力できる。
次に、ステップS403において、第1の参照ピクチャセットを記述するパラメータを、符号化映像ビットストリームに書き込む。このとき、第1の参照ピクチャセット内の参照ピクチャの数は、ピクチャバッファ内に許容されるピクチャの最大数よりも1つ少ない。そしてステップS404において、第1の参照ピクチャセットを用いて、複数のピクチャのうちの第1の非参照ピクチャを符号化し、符号化映像ビットストリームに含める。
次に、ステップS405において、第2の参照ピクチャセットを記述するパラメータを、符号化映像ビットストリームに書き込む。このとき、第2の参照ピクチャセット内の参照ピクチャの数は、第1の参照ピクチャセット内の参照ピクチャの数よりも1つ少ない。第2の参照ピクチャセットは、第1の参照ピクチャセットに既に含まれる所定の参照ピクチャを含まないので、当該所定の参照ピクチャを非参照ピクチャとして設定する(つまり“参照に使用されない”とマーキングされる)。新たな/入力されるピクチャがDPBに格納される必要がある場合、出力タイムインスタンスを越えている非参照ピクチャを、その新たなピクチャで上書きすることができる。そしてステップS406において、第2の参照ピクチャセットを用いて、複数のピクチャのうちの第2の非参照ピクチャを符号化し、符号化映像ビットストリームに含める。
図6は、本発明に係る映像/画像符号化装置200が実行する、複数のピクチャに対する実施の形態2の符号化処理S600を示すフローチャートである。
ステップS601において、符号化映像ビットストリームのヘッダにピクチャバッファの最大サイズを書き込む。最大サイズは、ピクチャバッファ内に許容される(つまり格納できる)ピクチャの最大数を決定する。そして、ステップS602において、所定の符号化順序にしたがって符号化され、出力順序が連続している複数のピクチャを選択する。このとき、符号化順序と出力順序は異なる。符号化順序に応じて、複数のピクチャのうちの1以上の非参照ピクチャが、少なくとも1ピクチャ区間の間、ピクチャバッファ内に格納される必要があり、その結果、複数のピクチャが、その出力順序にしたがって正しく出力できる。
次に、ステップS603において、符号化順序にしたがって複数のピクチャを符号化する。ステップS603において、符号化順序内で所定のピクチャに対応付けられた参照ピクチャセットは、符号化順序において所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットに既に含まれる先行参照ピクチャを含まない。所定のピクチャに対応付けられた参照ピクチャセット内のピクチャの最大数は、ピクチャバッファ内に許容されるピクチャの最大数よりも2つ少ない。
本発明の一実施の形態において、所定のピクチャ(つまり、先行ピクチャに対応付けられた参照ピクチャセットに既に含まれる参照ピクチャを含まない参照ピクチャセットを有するピクチャ)は、符号化順序内で連続する2ピクチャ毎に(つまり1ピクチャおきに)発生する。
図1の例示的な符号化構造に戻り、本発明の符号化処理における処理のシーケンスをテーブル1に列挙する。図1およびテーブル1は、8ピクチャ毎に周期的に繰り返す4レベルを有する階層符号化構造を示す。テーブル1において、IDR(瞬時復号更新)ピクチャが一般的なIピクチャの代わりに用いられる。IDRピクチャは、DPB全体をフラッシュ/空にする特殊な型のIピクチャである。DPBサイズは、DPB内に許容されるピクチャの最大数が5になるように設定される。テーブル1の各行は、対象ピクチャに対する符号化/復号処理の開始から終了までのピクチャ区間を示し、所定の符号化順序にしたがって上から下まで配置されている。C103列は、対象ピクチャに対する符号化/復号処理の最後に出力されるピクチャを示す。C104列は、対象ピクチャに対する符号化/復号処理の開始時のDPBの内容/ステータスを示す。ワーキングバッファ(WB)は、対象ピクチャの再構成サンプルが格納されるDPB内のピクチャバッファである。C105列は、対象ピクチャに対応付けられた参照ピクチャセット(RPS)から除外/削除される参照ピクチャを示す。C105列が空欄の場合、RPSは上の列にある先行RPSと同じ参照ピクチャを含む。C106列は、DPB処理およびRPS参照ピクチャの除外/削除に関する注記を示す。
テーブル1の例示的な実施の形態において、複数の参照ピクチャのうちのRPSから除外/削除する1つの参照ピクチャを選択する決定処理/理由は、以下の通りである。
・出力された(つまり、出力タイムインスタンスが過ぎている)参照ピクチャが2つ以上あり、これらのピクチャの階層レベルが異なる場合、最も高い階層レベルの参照ピクチャがRPSから除外/削除される対象として選択される。
・一方、出力された参照ピクチャが2つ以上あり、これらのピクチャの階層レベルが同じ場合、時間的距離(つまり出力順序の距離)が最も大きい参照ピクチャがRPSから除外/削除される対象として選択される。
テーブル1に示されるように、b5のインター予測に4つの参照ピクチャ、つまりIDR0、B8、B4、B6が利用できる。b5の出力遅延は1であるので、b5は1ピクチャ区間の間、DPBに格納される必要がある。DPB内のスペースの制限により、b5の符号化/復号の最後に、上記4つのうちの一つの参照ピクチャがb5のためのスペースを空けるためにDPBから削除される必要がある。従来技術のAVC映像符号化方式によると、b7のような非参照ピクチャは参照ピクチャを“参照に使用されない”としてマーキングできないので、B4はB6によって早期に削除されなければならない(AVCにおいて、参照ピクチャのマーキングは削除コマンド/パラメータを有するピクチャ、つまりB6の符号化/復号の最後に実行される)。その結果、b5のインター予測に利用できる参照ピクチャの数が減少する。一方、本発明では、複数のピクチャに対する実施の形態1の符号化処理S400で上述したように、b7の符号化/復号の開始時にのみB4が削除できる。したがって、本発明の利点は、B4をタイムリーに削除できるので、b5が4つの参照ピクチャ全てを完全に利用できることである。結果として、b5の符号化効率が最適化される。
テーブル1に示されるように、DPBはIDR0からB2まで徐々に満たされ、b1の符号化/復号の開始時には完全に占有されている。B6を符号化/復号するためには、1つの参照ピクチャがB6の符号化/復号開始時にDPBから削除される必要がある。例示的な決定処理によると、(図1に示されるように)IDR0が階層レベル0に位置しているのに対し、B2は階層レベル2に属しているため、除外/削除される。同様の決定および除外/削除処理が複数のピクチャの符号化を通して続けられる。このとき、RPSから除外/削除される参照ピクチャは符号化映像ビットストリームに書き込まれた各RPSパラメータに示される。そのような除外/削除処理は、上述の通り、複数のピクチャに対する実施の形態2の符号化処理S600にしたがって実行される。テーブル1のC105列に示されるように、RPSからの参照ピクチャの除外/削除は、1ピクチャおきに実行される(つまり、符号化順序が連続する2ピクチャ毎に実行される)。
図1およびテーブル1の例示的な符号化構造は、リーディングピクチャを含まない。リーディングピクチャとは、符号化順序においてイントラピクチャに後続するが、出力順序においてイントラピクチャに先行するピクチャである。テーブル2は、リーディングピクチャを含むIDRピクチャから始まる4レベルの階層構造に対する処理のシーケンスを示す。リーディングピクチャは、IDR0に対する負の出力順序で示される。例えば、B−2は、出力順序においてIDR0から2ピクチャ区間だけ先行するBピクチャを指す。テーブル2のC205列に示されるように、参照ピクチャは、DPBが占有されている場合にRPSから1ピクチャおきに除外/削除される。
IDRピクチャの他に、HEVC映像符号化方式はCRA(Clean Ramdom Access)ピクチャをサポートしている。CRAピクチャの要求により、符号化順序および表示順序の両方においてCRAに後続するいかなるピクチャも、符号化順序または出力順序の何れかにおいてCRAピクチャに先行するあらゆるピクチャからのインター予測を用いてはならず、符号化順序においてCRAピクチャに先行するあらゆるピクチャは、出力順序においてもCRAピクチャに先行する必要がある。テーブル3は、リーディングピクチャを含むCRAピクチャから始まる4レベルの階層構造に対する処理のシーケンスを示す。テーブル3のC305列に示されるように、参照ピクチャは、DPBが占有されている場合にRPSから1ピクチャおきに除外/削除される。
テーブル1、2、および3に示されるように、通常の所定の、RPSからの参照ピクチャの除外/削除は、DPBが完全に占有されたときに開始される。次に、DPBが占有されている場合を考慮した本発明の代替的な実施の形態を示す。
図7は、本発明に係る映像/画像符号化装置200が実行する、複数のピクチャに対する実施の形態3の符号化処理S700を示すフローチャートである。
ステップS701において、符号化映像ビットストリームのヘッダにピクチャバッファの最大サイズを書き込む。最大サイズは、ピクチャバッファ内に許容される(つまり格納できる)ピクチャの最大数を決定する。そして、ステップS702において、所定の符号化順序にしたがって符号化され、出力順序が連続している複数のピクチャを選択する。このとき、符号化順序と出力順序は異なる。符号化順序に応じて、複数のピクチャのうちの1以上の非参照ピクチャが、少なくとも1ピクチャ区間の間、ピクチャバッファ内に格納される必要があり、その結果、複数のピクチャを、それらの出力順序にしたがって正しく出力できる。
次に、ステップS703において、符号化順序にしたがって複数のピクチャのうちの一部のピクチャ(サブセット)を符号化する。このとき、一部のピクチャのうちの参照ピクチャは、ピクチャバッファに許容される参照ピクチャの最大数に達するまで、当該ピクチャバッファに格納される。
次に、ステップS704において、符号化順序にしたがって複数のピクチャのうちの残りのピクチャを符号化する。ステップS603において、符号化順序内で所定のピクチャに対応付けられた参照ピクチャセットは、符号化順序において所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットに既に含まれる先行参照ピクチャを含まない。所定のピクチャに対応付けられた参照ピクチャ内のピクチャの最大数は、ピクチャバッファ内に許容されるピクチャの最大数よりも2つ少ない。
図1、テーブル1、2、および3に示される4レベルの階層符号化構造以外に、他の符号化構造も映像/画像の符号化によく用いられている。
図9およびテーブル4は、16ピクチャ毎に周期的に繰り返す、5レベルの階層符号化構造を示す。テーブル4において、テーブル1と同様に、IDR(瞬時復号更新)ピクチャが一般的なIピクチャの代わりに用いられる。DPBサイズは、DPB内に許容されるピクチャの最大数が6になるように設定される。
テーブル4に示されるように、b5のインター予測に5つの参照ピクチャ、つまりIDR0、B16、B8、B4、B6が利用できる。b5の出力遅延は1であるので、b5は1ピクチャ区間の間、DPBに格納される必要がある。DPB内のスペースの制限により、b5の符号化/復号の最後に、上記5つの参照ピクチャのうちの1つが、b5のためのスペースを空けるためにDPBから削除される必要がある。先行技術のAVC映像符号化方式によると、b7はB4を“参照に用いられない”とマーキングすることができないので、B4はB6によって早期に削除されなければならない。その結果、b5のインター予測に利用できる参照ピクチャの数が減少する。一方、本発明では、複数のピクチャに対する実施の形態1の符号化処理S400で上述したように、b7の符号化/復号の開始時にのみB4が削除できる。したがって、本発明の利点は、B4をタイムリーに削除できるので、b5が4つの参照ピクチャ全てを完全に利用できることである。結果として、b5の符号化効率が最適化される。
上記と同様に、参照ピクチャをタイムリーに削除できるという本発明の利点は、b9およびb11の符号化/復号に関しても得ることができる。
テーブル4に示されるように、DPBはIDR0からB2まで徐々に満たされ、b1の符号化/復号の開始時には完全に占有されている。B6を符号化/復号するためには、1つの参照ピクチャがB6の符号化/復号開始時にDPBから削除される必要がある。上記テーブル1に関して説明した例示的な決定処理によると、(図9に示されるように)IDR0が階層レベル0に位置しているのに対し、B2は階層レベル2に属しているため、除外/削除される。同様の決定および除外/削除処理が複数のピクチャの符号化を通して続けられる。このとき、RPSから除外/削除される参照ピクチャは符号化映像ビットストリームに書き込まれた各RPSパラメータに示される。そのような除外/削除処理は、上述の通り、複数のピクチャに対する実施の形態2の符号化処理S600、または複数のピクチャに対する実施の形態3の符号化処理S700にしたがって実行される。テーブル4のC405列に示されるように、RPSからの参照ピクチャの除外/削除は、1ピクチャおきに実行される(つまり、符号化順序が連続する2ピクチャ毎に実行される)。
リーディングピクチャを含む、または含まないIDRまたはCRAから開始する、代替的な5レベルの階層符号化構造が、本発明に係る符号化処理の、同じ実施の形態を用いて達成できる。
図10およびテーブル5は、4ピクチャ毎に周期的に繰り返す、3レベルの階層符号化構造を示す。テーブル5において、テーブル1と同様に、IDR(Instaneous Decoding Refresh)ピクチャが一般的なIピクチャの代わりに用いられる。DPBサイズは、DPB内に許容されるピクチャの最大数が4になるように設定される。
テーブル5に示されるように、DPBはIDR0からB2まで徐々に満たされ、b1の符号化/復号の開始時には完全に占有されている。B8を符号化/復号するためには、1つの参照ピクチャがB8の符号化/復号開始時にDPBから削除される必要がある。上記テーブル1に関して説明した例示的な決定処理によると、IDR0は、B4と比べて対象ピクチャB8からの時間的距離(つまり出力順序の距離)が長いため、除外/削除される。同様の決定および除外/削除処理が複数のピクチャの符号化を通して続けられる。このとき、RPSから除外/削除される参照ピクチャは符号化映像ビットストリームに書き込まれた各RPSパラメータに示される。そのような除外/削除処理は、上述の通り、複数のピクチャに対する実施の形態2の符号化処理S600、または複数のピクチャに対する実施の形態3の符号化処理S700にしたがって実行される。テーブル5のC505列に示されるように、RPSからの参照ピクチャの除外/削除は、1ピクチャおきに実行される(つまり、符号化順序が連続する2ピクチャ毎に実行される)。
リーディングピクチャを含む、または含まないIDRまたはCRAから開始する、代替的な3レベルの階層符号化構造が、本発明に係る符号化処理の、同じ実施の形態を用いて達成できる。
図11およびテーブル6は、3ピクチャ毎に周期的に繰り返す2つのレベルを有し、2つの連続するピクチャがレベル1に含まれる第1の階層符号化構造を示す。1番目のレベル1ピクチャは参照ピクチャであり、2番目のレベル1ピクチャは非参照ピクチャである。テーブル6において、テーブル1と同様に、IDR(瞬時復号更新)ピクチャが一般的なIピクチャの代わりに用いられる。DPBサイズは、DPB内に許容されるピクチャの最大数が3になるように設定される。
テーブル6に示されるように、DPBはIDR0からB3まで徐々に満たされ、B1の符号化/復号の開始時には完全に占有されている。b2を符号化/復号するためには、1つの参照ピクチャがb2の符号化/復号開始時にDPBから削除される必要がある。IDR0は、DPB内で出力インスタンス/時間を過ぎている唯一の参照ピクチャであるため削除される。同様に、B4を符号化/復号するためには、1つの参照ピクチャがB4の符号化/復号開始時にDPBから削除される必要がある。上記テーブル1に関して説明した例示的な決定処理によると、(図11に示されるように)B3が階層レベル0に位置しているのに対し、B1は、階層レベル1に属しているため除外/削除される。そのような除外/削除処理は、上述の通り、複数のピクチャに対する実施の形態2の符号化処理S600、または複数のピクチャに対する実施の形態3の符号化処理S700にしたがって実行される。テーブル6のC605列に示されるように、RPSからの参照ピクチャの除外/削除は、3ピクチャの階層的区間の各々において、2番目と3番目のピクチャでそれぞれ実行される。
リーディングピクチャを含む、または含まないIDRまたはCRAから開始する、代替的な2レベルの階層符号化構造が、本発明に係る符号化処理の、同じ実施の形態を用いて達成できる。
図12およびテーブル7は、3ピクチャ毎に周期的に繰り返す2つのレベルを有し、2つの連続するピクチャがレベル1に含まれる第2の階層符号化構造を示す。レベル1ピクチャは両方とも非参照ピクチャである。テーブル7において、テーブル1と同様に、IDR(瞬時復号更新)ピクチャが一般的なIピクチャの代わりに用いられる。DPBサイズは、DPB内に許容されるピクチャの最大数が3になるように設定される。
テーブル7に示されるように、DPBはIDR0からB3まで徐々に満たされ、b1の符号化/復号の開始時には完全に占有されている。b4を符号化/復号するためには、1つの参照ピクチャがb4の符号化/復号開始時にDPBから削除される必要がある。そうすれば、B6を出力インスタンス/時間まで格納できる。上記テーブル1に関して説明した例示的な決定処理によると、IDR0はB3と比べて、対象ピクチャb4からの時間的距離(つまり出力順序の距離)が長いため、IDR0が除外/削除される。そのような除外/削除処理は、上述の通り、複数のピクチャに対する実施の形態2の符号化処理S600、または複数のピクチャに対する実施の形態3の符号化処理S700にしたがって実行される。テーブル7のC705列に示されるように、RPSからの参照ピクチャの除外/削除は、3ピクチャの階層的区間の各々において2番目と3番目のピクチャでそれぞれ実行される。
リーディングピクチャを含む、または含まないIDRまたはCRAから開始する、代替的な2レベルの階層符号化構造は、本発明に係る符号化処理の、同じ実施の形態を用いて達成できる。
[シンタックス]
図13は、最大DPBサイズおよび参照ピクチャセットを指定するパラメータの位置を示すシンタックス図である。
図13は、最大DPBサイズおよび参照ピクチャセットを指定するパラメータの位置を示すシンタックス図である。
図13に示されるように、最大DPBサイズを示すパラメータは、符号化映像ビットストリームの第1ヘッダに位置する。第1ヘッダの一例は、シーケンスパラメータセットである。本発明の代替的な実施の形態において、最大DPBサイズは、所定のマッピングテーブルにしたがって、第1ヘッダ内のプロファイルおよびレベルを示すパラメータから導出される。符号化映像ビットストリームの第2ヘッダは、複数の予め定義された参照ピクチャセットを指定するパラメータを含む。スライスヘッダにおいて、複数の予め定義された参照ピクチャセットのうちの1つが選択され、当該スライスの符号化/復号に用いられる有効参照ピクチャセットとして用いるために修正される可能性がある。有効参照ピクチャセットは、参照ピクチャのリストを定義する。DPB内の参照ピクチャが当該リストから除外される場合、その参照ピクチャは“参照に使用されない”とマーキングされる(つまり、非参照ピクチャとして設定される)。第2ヘッダの一例は、ピクチャパラメータセットである。第2ヘッダの他の例は、適応パラメータセットである。本発明の他の実施の形態において、最大DPBサイズと予め定義された参照ピクチャセットとは両方とも、第1ヘッダ内に位置する。本発明に想定される実施の形態において、スライスの他に、タイル、エントロピースライス、および波面分割ユニット等の他のサブピクチャユニットを用いてもよい。そのような実施の形態において、参照ピクチャセットを選択および修正するパラメータは、サブピクチャユニットのヘッダに位置してもよい。
図14は、最大DPBサイズおよび参照ピクチャセットを指定するパラメータの位置を示すシンタックス図である。
図14に示されるように、最大DPBサイズを示すパラメータは、符号化映像ビットストリームの第1ヘッダに位置する。第1ヘッダの一例は、シーケンスパラメータセットである。本発明の代替的な実施の形態において、最大DPBサイズは、所定のマッピングテーブルにしたがって、第1ヘッダ内のプロファイルおよびレベルを示すパラメータから導出される。サブピクチャユニットのスライスヘッダまたはヘッダは、スライスまたはサブピクチャユニットの符号化/復号に用いられる有効参照ピクチャセットを指定するパラメータを有する。有効参照ピクチャセットは、参照ピクチャのリストを定義する。DPB内の参照ピクチャが当該リストから除外される場合、その参照ピクチャは“参照に使用されない”とマーキングされる(つまり、非参照ピクチャとして設定される)。
[符号化に関する発明の効果]
本発明の効果は、DPBのメモリサイズを小さく保ちながら、インター予測ピクチャの符号化効率を改善することである。本発明により、DPBからピクチャをタイムリーに削除することができるので、最大DPBサイズの制限を超えることなく、参照ピクチャがインター予測の参照に利用可能である状態をできる限り長く保つことができる。
本発明の効果は、DPBのメモリサイズを小さく保ちながら、インター予測ピクチャの符号化効率を改善することである。本発明により、DPBからピクチャをタイムリーに削除することができるので、最大DPBサイズの制限を超えることなく、参照ピクチャがインター予測の参照に利用可能である状態をできる限り長く保つことができる。
[復号装置]
図3は、本発明に係る映像/画像復号装置300の構成を示すブロック図である。
図3は、本発明に係る映像/画像復号装置300の構成を示すブロック図である。
映像/画像復号装置300は、ブロック単位で入力符号化ビットストリームを復号し、映像/画像を出力する装置であり、図3に示されるように、エントロピー復号部301、逆量子化部302、逆変換部303、ブロックメモリ304、ピクチャメモリ305、イントラ予測部306、インター予測部307、ピクチャメモリ制御部308を備える。
入力された符号化ビットストリームは、エントロピー復号部301に入力される。入力された符号化ビットストリームがエントロピー復号部301に入力された後、エントロピー復号部301は入力された符号化ビットストリームを復号し、逆量子化部302に復号値を出力する。逆量子化部302は復号値を逆量子化し、周波数係数を逆変換部303に出力する。逆変換部303は、周波数係数を逆周波数変換してサンプル値に変換し、得られた画素値を加算器に出力する。加算器は、得られた画素値を、イントラ/インター予測部306、307から出力された予測映像/画像値に加算し、得られた値を表示するために出力し、かつさらなる予測のため、(ピクチャメモリ制御部308を介して)ブロックメモリ304またはピクチャメモリ305に出力する。また、イントラ/インター予測部306、307は、ブロックメモリ304またはピクチャメモリ305に格納されている映像/画像内を検索し、予測のため、例えば復号映像/画像に最も類似した映像/画像領域を推定する。
ピクチャメモリ制御部308は、ピクチャメモリ305に格納されている再構成ピクチャを管理する。ピクチャメモリ制御部308は、エントロピー復号部301から制御パラメータを読み出し、それにしたがってメモリ管理処理を実行する。ピクチャメモリ制御部308が行うメモリ管理処理は、再構成ピクチャが保持されるか、ピクチャメモリ305から削除されるかを解析されたパラメータに基づいて決定することと、インター予測部307によって用いられる参照ピクチャセットを構築することとを含む。
[復号処理]
次に、上述の映像/画像復号装置300の動作について説明する。
次に、上述の映像/画像復号装置300の動作について説明する。
図5は、本発明に係る映像/画像符号化装置300が実行する、複数のピクチャに対する実施の形態1の復号処理S500を示すフローチャートである。
ステップS501において、符号化映像ビットストリームのヘッダからピクチャバッファの最大サイズを解析する。最大サイズは、ピクチャバッファ内に許容される(つまり格納できる)ピクチャの最大数を決定する。次に、ステップS502において、第1の参照ピクチャセットを、符号化映像ビットストリームから解析する。このとき、第1の参照ピクチャセット内の参照ピクチャの数は、ピクチャバッファ内に許容されるピクチャの最大数よりも1つ少ない。そしてステップS503において、第1の参照ピクチャセットを用いて、第1の非参照ピクチャを符号化映像ビットストリームから復号する。ステップS504において、当該第1の非参照ピクチャをピクチャバッファに格納する。
次に、ステップS505において、第2の参照ピクチャセットを、符号化映像ビットストリームから解析する。このとき、第2の参照ピクチャセット内の参照ピクチャの数は、第1の参照ピクチャセット内の参照ピクチャの数よりも1つ少ない。そしてステップS506において、第2の参照ピクチャセットを用いて、第2の非参照ピクチャを符号化映像ビットストリームから復号する。最後に、ステップS507において、第2の非参照ピクチャの復号が完了するタイムインスタンスまたはそれよりも後に、第1の非参照ピクチャを出力する。
図8は、本発明に係る映像/画像復号装置300が実行する、複数のピクチャに対する実施の形態2の復号処理S800を示すフローチャートである。
ステップS801において、符号化映像ビットストリームのヘッダからピクチャバッファの最大サイズを解析する。最大サイズは、ピクチャバッファ内に許容される(つまり格納できる)ピクチャの最大数を決定する。次に、ステップS802において、符号化映像ビットストリームから参照ピクチャセットを解析する。そしてステップS803において、参照ピクチャセットを用いて、非参照ピクチャを符号化映像ビットストリームから復号する。ステップS804において、当該非参照ピクチャをピクチャバッファに格納する。最後に、ステップS805において、符号化順序において非参照ピクチャの直後に続くピクチャが完全に復号されるタイムインスタンスまたはそれよりも後に、当該非参照ピクチャを出力する。
[復号に関する発明の効果]
本開示の効果は、DPBのメモリサイズを小さく保ちながらインター予測ピクチャの符号化効率を改善して符号化された、符号化映像ビットストリームを復号できることである。
本開示の効果は、DPBのメモリサイズを小さく保ちながらインター予測ピクチャの符号化効率を改善して符号化された、符号化映像ビットストリームを復号できることである。
[実施の形態の応用例]
上記各実施の形態で示した動画像符号化方法(画像符号化方法)または動画像復号化方法(画像復号方法)の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
上記各実施の形態で示した動画像符号化方法(画像符号化方法)または動画像復号化方法(画像復号方法)の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
さらにここで、上記各実施の形態で示した動画像符号化方法(画像符号化方法)や動画像復号化方法(画像復号方法)の応用例とそれを用いたシステムを説明する。当該システムは、画像符号化方法を用いた画像符号化装置、及び画像復号方法を用いた画像復号装置からなる画像符号化復号装置を有することを特徴とする。システムにおける他の構成について、場合に応じて適切に変更することができる。
[実施の形態A]
図15は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
図15は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex106、ex107、ex108、ex109、ex110が設置されている。
このコンテンツ供給システムex100は、インターネットex101にインターネットサービスプロバイダex102および電話網ex104、および基地局ex106からex110を介して、コンピュータex111、PDA(Personal Digital Assistant)ex112、カメラex113、携帯電話ex114、ゲーム機ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図15のような構成に限定されず、いずれかの要素を組合せて接続するようにしてもよい。また、固定無線局である基地局ex106からex110を介さずに、各機器が電話網ex104に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex116はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex114は、GSM(登録商標)(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、若しくはLTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)の携帯電話機、またはPHS(Personal Handyphone System)等であり、いずれでも構わない。
コンテンツ供給システムex100では、カメラex113等が基地局ex109、電話網ex104を通じてストリーミングサーバex103に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex113を用いて撮影するコンテンツ(例えば、音楽ライブの映像等)に対して上記各実施の形態で説明したように符号化処理を行い(即ち、本開示の一態様に係る画像符号化装置として機能する)、ストリーミングサーバex103に送信する。一方、ストリーミングサーバex103は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114、ゲーム機ex115等がある。配信されたデータを受信した各機器では、受信したデータを復号化処理して再生する(即ち、本開示の一態様に係る画像復号装置として機能する)。
なお、撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号化処理はクライアントで行っても、ストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。また、カメラex113に限らず、カメラex116で撮影した静止画像および/または動画像データを、コンピュータex111を介してストリーミングサーバex103に送信してもよい。この場合の符号化処理はカメラex116、コンピュータex111、ストリーミングサーバex103のいずれで行ってもよいし、互いに分担して行ってもよい。
また、これら符号化・復号化処理は、一般的にコンピュータex111や各機器が有するLSIex500において処理する。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化・復号化用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込み、そのソフトウェアを用いて符号化・復号化処理を行ってもよい。さらに、携帯電話ex114がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex114が有するLSIex500で符号化処理されたデータである。
また、ストリーミングサーバex103は複数のサーバや複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。
以上のようにして、コンテンツ供給システムex100では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex100では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号化し、再生することができ、特別な権利や設備を有さないユーザでも個人放送を実現できる。
なお、コンテンツ供給システムex100の例に限らず、図16に示すように、デジタル放送用システムex200にも、上記各実施の形態の少なくとも動画像符号化装置(画像符号化装置)または動画像復号化装置(画像復号装置)のいずれかを組み込むことができる。具体的には、放送局ex201では映像データに音楽データなどが多重化された多重化データが電波を介して通信または衛星ex202に伝送される。この映像データは上記各実施の形態で説明した動画像符号化方法により符号化されたデータである(即ち、本開示の一態様に係る画像符号化装置によって符号化されたデータである)。これを受けた放送衛星ex202は、放送用の電波を発信し、この電波を衛星放送の受信が可能な家庭のアンテナex204が受信する。受信した多重化データを、テレビ(受信機)ex300またはセットトップボックス(STB)ex217等の装置が復号化して再生する(即ち、本開示の一態様に係る画像復号装置として機能する)。
また、DVD、BD等の記録メディアex215に記録した多重化データを読み取り復号化する、または記録メディアex215に映像信号を符号化し、さらに場合によっては音楽信号と多重化して書き込むリーダ/レコーダex218にも上記各実施の形態で示した動画像復号化装置または動画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示され、多重化データが記録された記録メディアex215により他の装置やシステムにおいて映像信号を再生することができる。また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に動画像復号化装置を実装し、これをテレビのモニタex219で表示してもよい。このときセットトップボックスではなく、テレビ内に動画像復号化装置を組み込んでもよい。
図17は、上記各実施の形態で説明した動画像復号化方法および動画像符号化方法を用いたテレビ(受信機)ex300を示す図である。テレビex300は、上記放送を受信するアンテナex204またはケーブルex203等を介して映像データに音声データが多重化された多重化データを取得、または出力するチューナex301と、受信した多重化データを復調する、または外部に送信する多重化データに変調する変調/復調部ex302と、復調した多重化データを映像データと、音声データとに分離する、または信号処理部ex306で符号化された映像データ、音声データを多重化する多重/分離部ex303を備える。
また、テレビex300は、音声データ、映像データそれぞれを復号化する、またはそれぞれの情報を符号化する音声信号処理部ex304、映像信号処理部ex305(本開示の一態様に係る画像符号化装置または画像復号装置として機能する)を有する信号処理部ex306と、復号化した音声信号を出力するスピーカex307、復号化した映像信号を表示するディスプレイ等の表示部ex308を有する出力部ex309とを有する。さらに、テレビex300は、ユーザ操作の入力を受け付ける操作入力部ex312等を有するインタフェース部ex317を有する。さらに、テレビex300は、各部を統括的に制御する制御部ex310、各部に電力を供給する電源回路部ex311を有する。インタフェース部ex317は、操作入力部ex312以外に、リーダ/レコーダex218等の外部機器と接続されるブリッジex313、SDカード等の記録メディアex216を装着可能とするためのスロット部ex314、ハードディスク等の外部記録メディアと接続するためのドライバex315、電話網と接続するモデムex316等を有していてもよい。なお記録メディアex216は、格納する不揮発性/揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex300の各部は同期バスを介して互いに接続されている。
まず、テレビex300がアンテナex204等により外部から取得した多重化データを復号化し、再生する構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、CPU等を有する制御部ex310の制御に基づいて、変調/復調部ex302で復調した多重化データを多重/分離部ex303で分離する。さらにテレビex300は、分離した音声データを音声信号処理部ex304で復号化し、分離した映像データを映像信号処理部ex305で上記各実施の形態で説明した復号化方法を用いて復号化する。復号化した音声信号、映像信号は、それぞれ出力部ex309から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex318、ex319等に一旦これらの信号を蓄積するとよい。また、テレビex300は、放送等からではなく、磁気/光ディスク、SDカード等の記録メディアex215、ex216から多重化データを読み出してもよい。次に、テレビex300が音声信号や映像信号を符号化し、外部に送信または記録メディア等に書き込む構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、制御部ex310の制御に基づいて、音声信号処理部ex304で音声信号を符号化し、映像信号処理部ex305で映像信号を上記各実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重/分離部ex303で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex320、ex321等に一旦これらの信号を蓄積するとよい。なお、バッファex318、ex319、ex320、ex321は図示しているように複数備えていてもよいし、1つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調/復調部ex302や多重/分離部ex303の間等でもシステムのオーバフロー、アンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。
また、テレビex300は、放送等や記録メディア等から音声データ、映像データを取得する以外に、マイクやカメラのAV入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex300は上記の符号化処理、多重化、および外部出力ができる構成として説明したが、これらの処理を行うことはできず、上記受信、復号化処理、外部出力のみが可能な構成であってもよい。
また、リーダ/レコーダex218で記録メディアから多重化データを読み出す、または書き込む場合には、上記復号化処理または符号化処理はテレビex300、リーダ/レコーダex218のいずれで行ってもよいし、テレビex300とリーダ/レコーダex218が互いに分担して行ってもよい。
一例として、光ディスクからデータの読み込みまたは書き込みをする場合の情報再生/記録部ex400の構成を図18に示す。情報再生/記録部ex400は、以下に説明する要素ex401、ex402、ex403、ex404、ex405、ex406、ex407を備える。光ヘッドex401は、光ディスクである記録メディアex215の記録面にレーザスポットを照射して情報を書き込み、記録メディアex215の記録面からの反射光を検出して情報を読み込む。変調記録部ex402は、光ヘッドex401に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex403は、光ヘッドex401に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex215に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex404は、記録メディアex215に記録するための情報および記録メディアex215から再生した情報を一時的に保持する。ディスクモータex405は記録メディアex215を回転させる。サーボ制御部ex406は、ディスクモータex405の回転駆動を制御しながら光ヘッドex401を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex407は、情報再生/記録部ex400全体の制御を行う。上記の読み出しや書き込みの処理はシステム制御部ex407が、バッファex404に保持された各種情報を利用し、また必要に応じて新たな情報の生成・追加を行うと共に、変調記録部ex402、再生復調部ex403、サーボ制御部ex406を協調動作させながら、光ヘッドex401を通して、情報の記録再生を行うことにより実現される。システム制御部ex407は例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。
以上では、光ヘッドex401はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。
図19に光ディスクである記録メディアex215の模式図を示す。記録メディアex215の記録面には案内溝(グルーブ)がスパイラル状に形成され、情報トラックex230には、予めグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex231の位置を特定するための情報を含み、記録や再生を行う装置において情報トラックex230を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex215は、データ記録領域ex233、内周領域ex232、外周領域ex234を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex233であり、データ記録領域ex233より内周または外周に配置されている内周領域ex232と外周領域ex234は、ユーザデータの記録以外の特定用途に用いられる。情報再生/記録部ex400は、このような記録メディアex215のデータ記録領域ex233に対して、符号化された音声データ、映像データまたはそれらのデータを多重化した多重化データの読み書きを行う。
以上では、1層のDVD、BD等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりなど、多次元的な記録/再生を行う構造の光ディスクであってもよい。
また、デジタル放送用システムex200において、アンテナex205を有する車ex210で衛星ex202等からデータを受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex211の構成は例えば図17に示す構成のうち、GPS受信部を加えた構成が考えられ、同様なことがコンピュータex111や携帯電話ex114等でも考えられる。
図20Aは、上記実施の形態で説明した動画像復号化方法および動画像符号化方法を用いた携帯電話ex114を示す図である。携帯電話ex114は、基地局ex110との間で電波を送受信するためのアンテナex350、映像、静止画を撮ることが可能なカメラ部ex365、カメラ部ex365で撮像した映像、アンテナex350で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の表示部ex358を備える。携帯電話ex114は、さらに、操作キー部ex366を有する本体部、音声を出力するためのスピーカ等である音声出力部ex357、音声を入力するためのマイク等である音声入力部ex356、撮影した映像、静止画、録音した音声、または受信した映像、静止画、メール等の符号化されたデータもしくは復号化されたデータを保存するメモリ部ex367、又は同様にデータを保存する記録メディアとのインタフェース部であるスロット部ex364を備える。
さらに、携帯電話ex114の構成例について、図20Bを用いて説明する。携帯電話ex114は、表示部ex358及び操作キー部ex366を備えた本体部の各部を統括的に制御する主制御部ex360に対して、電源回路部ex361、操作入力制御部ex362、映像信号処理部ex355、カメラインタフェース部ex363、LCD(Liquid Crystal Display)制御部ex359、変調/復調部ex352、多重/分離部ex353、音声信号処理部ex354、スロット部ex364、メモリ部ex367がバスex370を介して互いに接続されている。
電源回路部ex361は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することにより携帯電話ex114を動作可能な状態に起動する。
携帯電話ex114は、CPU、ROM、RAM等を有する主制御部ex360の制御に基づいて、音声通話モード時に音声入力部ex356で収音した音声信号を音声信号処理部ex354でデジタル音声信号に変換し、これを変調/復調部ex352でスペクトラム拡散処理し、送信/受信部ex351でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex350を介して送信する。また携帯電話ex114は、音声通話モード時にアンテナex350を介して受信した受信データを増幅して周波数変換処理およびアナログデジタル変換処理を施し、変調/復調部ex352でスペクトラム逆拡散処理し、音声信号処理部ex354でアナログ音声信号に変換した後、これを音声出力部ex357から出力する。
さらにデータ通信モード時に電子メールを送信する場合、本体部の操作キー部ex366等の操作によって入力された電子メールのテキストデータは操作入力制御部ex362を介して主制御部ex360に送出される。主制御部ex360は、テキストデータを変調/復調部ex352でスペクトラム拡散処理をし、送信/受信部ex351でデジタルアナログ変換処理および周波数変換処理を施した後にアンテナex350を介して基地局ex110へ送信する。電子メールを受信する場合は、受信したデータに対してこのほぼ逆の処理が行われ、表示部ex358に出力される。
データ通信モード時に映像、静止画、または映像と音声を送信する場合、映像信号処理部ex355は、カメラ部ex365から供給された映像信号を上記各実施の形態で示した動画像符号化方法によって圧縮符号化し(即ち、本開示の一態様に係る画像符号化装置として機能する)、符号化された映像データを多重/分離部ex353に送出する。また、音声信号処理部ex354は、映像、静止画等をカメラ部ex365で撮像中に音声入力部ex356で収音した音声信号を符号化し、符号化された音声データを多重/分離部ex353に送出する。
多重/分離部ex353は、映像信号処理部ex355から供給された符号化された映像データと音声信号処理部ex354から供給された符号化された音声データを所定の方式で多重化し、その結果得られる多重化データを変調/復調部(変調/復調回路部)ex352でスペクトラム拡散処理をし、送信/受信部ex351でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex350を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、または映像およびもしくは音声が添付された電子メールを受信する場合、アンテナex350を介して受信された多重化データを復号化するために、多重/分離部ex353は、多重化データを分離することにより映像データのビットストリームと音声データのビットストリームとに分け、同期バスex370を介して符号化された映像データを映像信号処理部ex355に供給するとともに、符号化された音声データを音声信号処理部ex354に供給する。映像信号処理部ex355は、上記各実施の形態で示した動画像符号化方法に対応した動画像復号化方法によって復号化することにより映像信号を復号し(即ち、本開示の一態様に係る画像復号装置として機能する)、LCD制御部ex359を介して表示部ex358から、例えばホームページにリンクされた動画像ファイルに含まれる映像、静止画が表示される。また音声信号処理部ex354は、音声信号を復号し、音声出力部ex357から音声が出力される。
また、上記携帯電話ex114等の端末は、テレビex300と同様に、符号化器・復号化器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号化器のみの受信端末という3通りの実装形式が考えられる。さらに、デジタル放送用システムex200において、映像データに音楽データなどが多重化された多重化データを受信、送信するとして説明したが、音声データ以外に映像に関連する文字データなどが多重化されたデータであってもよいし、多重化データではなく映像データ自体であってもよい。
このように、上記各実施の形態で示した動画像符号化方法あるいは動画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記各実施の形態で説明した効果を得ることができる。
また、本開示の上記各実施の形態では、種々の変形または修正が可能である。
[実施の形態B]
上記各実施の形態で示した動画像符号化方法または装置と、MPEG−2、MPEG4−AVC、VC−1など異なる規格に準拠した動画像符号化方法または装置とを、必要に応じて適宜切替えることにより、映像データを生成することも可能である。
上記各実施の形態で示した動画像符号化方法または装置と、MPEG−2、MPEG4−AVC、VC−1など異なる規格に準拠した動画像符号化方法または装置とを、必要に応じて適宜切替えることにより、映像データを生成することも可能である。
ここで、それぞれ異なる規格に準拠する複数の映像データを生成した場合、復号する際に、それぞれの規格に対応した復号方法を選択する必要がある。しかしながら、復号する映像データが、どの規格に準拠するものであるか識別できないため、適切な復号方法を選択することができないという課題を生じる。
この課題を解決するために、映像データに音声データなどを多重化した多重化データは、映像データがどの規格に準拠するものであるかを示す識別情報を含む構成とする。上記各実施の形態で示す動画像符号化方法または装置によって生成された映像データを含む多重化データの具体的な構成を以下説明する。多重化データは、MPEG−2トランスポートストリーム形式のデジタルストリームである。
図21は、多重化データの構成を示す図である。図21に示すように多重化データは、ビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム(PG)、インタラクティブグラフィックスストリームのうち、1つ以上を多重化することで得られる。ビデオストリームは映画の主映像および副映像を、オーディオストリーム(IG)は映画の主音声部分とその主音声とミキシングする副音声を、プレゼンテーショングラフィックスストリームは、映画の字幕をそれぞれ示している。ここで主映像とは画面に表示される通常の映像を示し、副映像とは主映像の中に小さな画面で表示する映像のことである。また、インタラクティブグラフィックスストリームは、画面上にGUI部品を配置することにより作成される対話画面を示している。ビデオストリームは、上記各実施の形態で示した動画像符号化方法または装置、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠した動画像符号化方法または装置によって符号化されている。オーディオストリームは、ドルビーAC−3、Dolby Digital Plus、MLP、DTS、DTS−HD、または、リニアPCMのなどの方式で符号化されている。
多重化データに含まれる各ストリームはPIDによって識別される。例えば、映画の映像に利用するビデオストリームには0x1011が、オーディオストリームには0x1100から0x111Fまでが、プレゼンテーショングラフィックスには0x1200から0x121Fまでが、インタラクティブグラフィックスストリームには0x1400から0x141Fまでが、映画の副映像に利用するビデオストリームには0x1B00から0x1B1Fまで、主音声とミキシングする副音声に利用するオーディオストリームには0x1A00から0x1A1Fが、それぞれ割り当てられている。
図22は、多重化データがどのように多重化されるかを模式的に示す図である。まず、複数のビデオフレームからなるビデオストリームex235、複数のオーディオフレームからなるオーディオストリームex238を、それぞれPESパケット列ex236およびex239に変換し、TSパケットex237およびex240に変換する。同じくプレゼンテーショングラフィックスストリームex241およびインタラクティブグラフィックスex244のデータをそれぞれPESパケット列ex242およびex245に変換し、さらにTSパケットex243およびex246に変換する。多重化データex247はこれらのTSパケットを1本のストリームに多重化することで構成される。
図23は、PESパケット列に、ビデオストリームがどのように格納されるかをさらに詳しく示している。図23における第1段目はビデオストリームのビデオフレーム列を示す。第2段目は、PESパケット列を示す。図23の矢印yy1,yy2,yy3,yy4に示すように、ビデオストリームにおける複数のVideo Presentation UnitであるIピクチャ、Bピクチャ、Pピクチャは、ピクチャ毎に分割され、PESパケットのペイロードに格納される。各PESパケットはPESヘッダを持ち、PESヘッダには、ピクチャの表示時刻であるPTS(Presentation Time−Stamp)やピクチャの復号時刻であるDTS(Decoding Time−Stamp)が格納される。
図24は、多重化データに最終的に書き込まれるTSパケットの形式を示している。TSパケットは、ストリームを識別するPIDなどの情報を持つ4ByteのTSヘッダとデータを格納する184ByteのTSペイロードから構成される188Byte固定長のパケットであり、上記PESパケットは分割されTSペイロードに格納される。BD−ROMの場合、TSパケットには、4ByteのTP_Extra_Headerが付与され、192Byteのソースパケットを構成し、多重化データに書き込まれる。TP_Extra_HeaderにはATS(Arrival_Time_Stamp)などの情報が記載される。ATSは当該TSパケットのデコーダのPIDフィルタへの転送開始時刻を示す。多重化データには図24下段に示すようにソースパケットが並ぶこととなり、多重化データの先頭からインクリメントする番号はSPN(ソースパケットナンバー)と呼ばれる。
また、多重化データに含まれるTSパケットには、映像・音声・字幕などの各ストリーム以外にもPAT(Program Association Table)、PMT(Program Map Table)、PCR(Program Clock Reference)などがある。PATは多重化データ中に利用されるPMTのPIDが何であるかを示し、PAT自身のPIDは0で登録される。PMTは、多重化データ中に含まれる映像・音声・字幕などの各ストリームのPIDと各PIDに対応するストリームの属性情報を持ち、また多重化データに関する各種ディスクリプタを持つ。ディスクリプタには多重化データのコピーを許可・不許可を指示するコピーコントロール情報などがある。PCRは、ATSの時間軸であるATC(Arrival Time Clock)とPTS・DTSの時間軸であるSTC(System Time Clock)の同期を取るために、そのPCRパケットがデコーダに転送されるATSに対応するSTC時間の情報を持つ。
図25はPMTのデータ構造を詳しく説明する図である。PMTの先頭には、そのPMTに含まれるデータの長さなどを記したPMTヘッダが配置される。その後ろには、多重化データに関するディスクリプタが複数配置される。上記コピーコントロール情報などが、ディスクリプタとして記載される。ディスクリプタの後には、多重化データに含まれる各ストリームに関するストリーム情報が複数配置される。ストリーム情報は、ストリームの圧縮コーデックなどを識別するためストリームタイプ、ストリームのPID、ストリームの属性情報(フレームレート、アスペクト比など)が記載されたストリームディスクリプタから構成される。ストリームディスクリプタは多重化データに存在するストリームの数だけ存在する。
記録媒体などに記録する場合には、上記多重化データは、多重化データ情報ファイルと共に記録される。
多重化データ情報ファイルは、図26に示すように多重化データの管理情報であり、多重化データと1対1に対応し、多重化データ情報、ストリーム属性情報とエントリマップから構成される。
多重化データ情報は図26に示すようにシステムレート、再生開始時刻、再生終了時刻から構成されている。システムレートは多重化データの、後述するシステムターゲットデコーダのPIDフィルタへの最大転送レートを示す。多重化データ中に含まれるATSの間隔はシステムレート以下になるように設定されている。再生開始時刻は多重化データの先頭のビデオフレームのPTSであり、再生終了時刻は多重化データの終端のビデオフレームのPTSに1フレーム分の再生間隔を足したものが設定される。
ストリーム属性情報は図27に示すように、多重化データに含まれる各ストリームについての属性情報が、PID毎に登録される。属性情報はビデオストリーム、オーディオストリーム、プレゼンテーショングラフィックスストリーム、インタラクティブグラフィックスストリーム毎に異なる情報を持つ。ビデオストリーム属性情報は、そのビデオストリームがどのような圧縮コーデックで圧縮されたか、ビデオストリームを構成する個々のピクチャデータの解像度がどれだけであるか、アスペクト比はどれだけであるか、フレームレートはどれだけであるかなどの情報を持つ。オーディオストリーム属性情報は、そのオーディオストリームがどのような圧縮コーデックで圧縮されたか、そのオーディオストリームに含まれるチャンネル数は何であるか、何の言語に対応するか、サンプリング周波数がどれだけであるかなどの情報を持つ。これらの情報は、プレーヤが再生する前のデコーダの初期化などに利用される。
本実施の形態においては、上記多重化データのうち、PMTに含まれるストリームタイプを利用する。また、記録媒体に多重化データが記録されている場合には、多重化データ情報に含まれる、ビデオストリーム属性情報を利用する。具体的には、上記各実施の形態で示した動画像符号化方法または装置において、PMTに含まれるストリームタイプ、または、ビデオストリーム属性情報に対し、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示す固有の情報を設定するステップまたは手段を設ける。この構成により、上記各実施の形態で示した動画像符号化方法または装置によって生成した映像データと、他の規格に準拠する映像データとを識別することが可能になる。
また、本実施の形態における動画像復号化方法のステップを図28に示す。ステップexS100において、多重化データからPMTに含まれるストリームタイプ、または、多重化データ情報に含まれるビデオストリーム属性情報を取得する。次に、ステップexS101において、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成された多重化データであることを示しているか否かを判断する。そして、ストリームタイプ、または、ビデオストリーム属性情報が上記各実施の形態で示した動画像符号化方法または装置によって生成されたものであると判断された場合には、ステップexS102において、上記各実施の形態で示した動画像復号方法により復号を行う。また、ストリームタイプ、または、ビデオストリーム属性情報が、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠するものであることを示している場合には、ステップexS103において、従来の規格に準拠した動画像復号方法により復号を行う。
このように、ストリームタイプ、または、ビデオストリーム属性情報に新たな固有値を設定することにより、復号する際に、上記各実施の形態で示した動画像復号化方法または装置で復号可能であるかを判断することができる。従って、異なる規格に準拠する多重化データが入力された場合であっても、適切な復号化方法または装置を選択することができるため、エラーを生じることなく復号することが可能となる。また、本実施の形態で示した動画像符号化方法または装置、または、動画像復号方法または装置を、上述したいずれの機器・システムに用いることも可能である。
[実施の形態C]
上記各実施の形態で示した動画像符号化方法および装置、動画像復号化方法および装置は、典型的には集積回路であるLSIで実現される。一例として、図29に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
上記各実施の形態で示した動画像符号化方法および装置、動画像復号化方法および装置は、典型的には集積回路であるLSIで実現される。一例として、図29に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501、ex502、ex503、ex504、ex505、ex506、ex507、ex508、ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
例えば符号化処理を行う場合には、LSIex500は、CPUex502、メモリコントローラex503、ストリームコントローラex504、駆動周波数制御部ex512等を有する制御部ex501の制御に基づいて、AV I/Oex509によりマイクex117やカメラex113等からAV信号を入力する。入力されたAV信号は、一旦SDRAM等の外部のメモリex511に蓄積される。制御部ex501の制御に基づいて、蓄積したデータは処理量や処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られ、信号処理部ex507において音声信号の符号化および/または映像信号の符号化が行われる。ここで映像信号の符号化処理は上記各実施の形態で説明した符号化処理である。信号処理部ex507ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームI/Oex506から外部に出力する。この出力された多重化データは、基地局ex107に向けて送信されたり、または記録メディアex215に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex508にデータを蓄積するとよい。
なお、上記では、メモリex511がLSIex500の外部の構成として説明したが、LSIex500の内部に含まれる構成であってもよい。バッファex508も1つに限ったものではなく、複数のバッファを備えていてもよい。また、LSIex500は1チップ化されてもよいし、複数チップ化されてもよい。
また、上記では、制御部ex501が、CPUex502、メモリコントローラex503、ストリームコントローラex504、駆動周波数制御部ex512等を有するとしているが、制御部ex501の構成は、この構成に限らない。例えば、信号処理部ex507がさらにCPUを備える構成であってもよい。信号処理部ex507の内部にもCPUを設けることにより、処理速度をより向上させることが可能になる。また、他の例として、CPUex502が信号処理部ex507、または信号処理部ex507の一部である例えば音声信号処理部を備える構成であってもよい。このような場合には、制御部ex501は、信号処理部ex507、またはその一部を有するCPUex502を備える構成となる。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
そのようなプログラムすることが可能な論理デバイスは、通常、ソフトウェアまたはファームウェアに含まれる1以上のプログラムをメモリ等から読み込むことによって、上記実施の形態の何れかに係る動画像符号化方法および/または動画像復号方法を実行することができる。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
[実施の形態D]
上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データを復号する場合、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データを復号する場合に比べ、処理量が増加することが考えられる。そのため、LSIex500において、従来の規格に準拠する映像データを復号する際のCPUex502の駆動周波数よりも高い駆動周波数に設定する必要がある。しかし、駆動周波数を高くすると、消費電力が高くなるという課題が生じる。
上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データを復号する場合、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データを復号する場合に比べ、処理量が増加することが考えられる。そのため、LSIex500において、従来の規格に準拠する映像データを復号する際のCPUex502の駆動周波数よりも高い駆動周波数に設定する必要がある。しかし、駆動周波数を高くすると、消費電力が高くなるという課題が生じる。
この課題を解決するために、テレビex300、LSIex500などの動画像復号化装置は、映像データがどの規格に準拠するものであるかを識別し、規格に応じて駆動周波数を切替える構成とする。図30は、本実施の形態における構成ex800を示している。駆動周波数切替え部ex803は、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合には、駆動周波数を高く設定する。そして、上記各実施の形態で示した動画像復号化方法を実行する復号処理部ex801に対し、映像データを復号するよう指示する。一方、映像データが、従来の規格に準拠する映像データである場合には、映像データが、上記各実施の形態で示した動画像符号化方法または装置によって生成されたものである場合に比べ、駆動周波数を低く設定する。そして、従来の規格に準拠する復号処理部ex802に対し、映像データを復号するよう指示する。
より具体的には、駆動周波数切替え部ex803は、図29のCPUex502と駆動周波数制御部ex512から構成される。また、上記各実施の形態で示した動画像復号化方法を実行する復号処理部ex801、および、従来の規格に準拠する復号処理部ex802は、図29の信号処理部ex507に該当する。CPUex502は、映像データがどの規格に準拠するものであるかを識別する。そして、CPUex502からの信号に基づいて、駆動周波数制御部ex512は、駆動周波数を設定する。また、CPUex502からの信号に基づいて、信号処理部ex507は、映像データの復号を行う。ここで、映像データの識別には、例えば、実施の形態Bで記載した識別情報を利用することが考えられる。識別情報に関しては、実施の形態Bで記載したものに限られず、映像データがどの規格に準拠するか識別できる情報であればよい。例えば、映像データがテレビに利用されるものであるか、ディスクに利用されるものであるかなどを識別する外部信号に基づいて、映像データがどの規格に準拠するものであるか識別可能である場合には、このような外部信号に基づいて識別してもよい。また、CPUex502における駆動周波数の選択は、例えば、図127のような映像データの規格と、駆動周波数とを対応付けたルックアップテーブルに基づいて行うことが考えられる。ルックアップテーブルを、バッファex508や、LSIの内部メモリに格納しておき、CPUex502がこのルックアップテーブルを参照することにより、駆動周波数を選択することが可能である。
図31は、本実施の形態の方法を実施するステップを示している。まず、ステップexS200では、信号処理部ex507において、多重化データから識別情報を取得する。次に、ステップexS201では、CPUex502において、識別情報に基づいて映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものであるか否かを識別する。映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合には、ステップexS202において、駆動周波数を高く設定する信号を、CPUex502が駆動周波数制御部ex512に送る。そして、駆動周波数制御部ex512において、高い駆動周波数に設定される。一方、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合には、ステップexS203において、駆動周波数を低く設定する信号を、CPUex502が駆動周波数制御部ex512に送る。そして、駆動周波数制御部ex512において、映像データが上記各実施の形態で示した符号化方法または装置によって生成されたものである場合に比べ、低い駆動周波数に設定される。
さらに、駆動周波数の切替えに連動して、LSIex500またはLSIex500を含む装置に与える電圧を変更することにより、省電力効果をより高めることが可能である。例えば、駆動周波数を低く設定する場合には、これに伴い、駆動周波数を高く設定している場合に比べ、LSIex500またはLSIex500を含む装置に与える電圧を低く設定することが考えられる。
また、駆動周波数の設定方法は、復号する際の処理量が大きい場合に、駆動周波数を高く設定し、復号する際の処理量が小さい場合に、駆動周波数を低く設定すればよく、上述した設定方法に限らない。例えば、MPEG4−AVC規格に準拠する映像データを復号する処理量の方が、上記各実施の形態で示した動画像符号化方法または装置により生成された映像データを復号する処理量よりも大きい場合には、駆動周波数の設定を上述した場合の逆にすることが考えられる。
さらに、駆動周波数の設定方法は、駆動周波数を低くする構成に限らない。例えば、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、LSIex500またはLSIex500を含む装置に与える電圧を高く設定し、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合には、LSIex500またはLSIex500を含む装置に与える電圧を低く設定することも考えられる。また、他の例としては、識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合には、CPUex502の駆動を停止させることなく、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合には、処理に余裕があるため、CPUex502の駆動を一時停止させることも考えられる。識別情報が、上記各実施の形態で示した動画像符号化方法または装置によって生成された映像データであることを示している場合であっても、処理に余裕があれば、CPUex502の駆動を一時停止させることも考えられる。この場合は、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する映像データであることを示している場合に比べて、停止時間を短く設定することが考えられる。
このように、映像データが準拠する規格に応じて、駆動周波数を切替えることにより、省電力化を図ることが可能になる。また、電池を用いてLSIex500またはLSIex500を含む装置を駆動している場合には、省電力化に伴い、電池の寿命を長くすることが可能である。
[実施の形態E]
テレビや、携帯電話など、上述した機器・システムには、異なる規格に準拠する複数の映像データが入力される場合がある。このように、異なる規格に準拠する複数の映像データが入力された場合にも復号できるようにするために、LSIex500の信号処理部ex507が複数の規格に対応している必要がある。しかし、それぞれの規格に対応する信号処理部ex507を個別に用いると、LSIex500の回路規模が大きくなり、また、コストが増加するという課題が生じる。
テレビや、携帯電話など、上述した機器・システムには、異なる規格に準拠する複数の映像データが入力される場合がある。このように、異なる規格に準拠する複数の映像データが入力された場合にも復号できるようにするために、LSIex500の信号処理部ex507が複数の規格に対応している必要がある。しかし、それぞれの規格に対応する信号処理部ex507を個別に用いると、LSIex500の回路規模が大きくなり、また、コストが増加するという課題が生じる。
この課題を解決するために、上記各実施の形態で示した動画像復号方法を実行するための復号処理部と、従来のMPEG−2、MPEG4−AVC、VC−1などの規格に準拠する復号処理部とを一部共有化する構成とする。この構成例を図128Aのex900に示す。例えば、上記各実施の形態で示した動画像復号方法と、MPEG4−AVC規格に準拠する動画像復号方法とは、エントロピー符号化、逆量子化、デブロッキング・フィルタ、動き補償などの処理において処理内容が一部共通する。共通する処理内容については、MPEG4−AVC規格に対応する復号処理部ex902を共有し、MPEG4−AVC規格に対応しない、本開示の一態様に特有の他の処理内容については、専用の復号処理部ex901を用いるという構成が考えられる。特に、本開示の一態様は、動き補償に特徴を有していることから、例えば、動き補償については専用の復号処理部ex901を用い、それ以外のエントロピー復号、デブロッキング・フィルタ、逆量子化のいずれか、または、全ての処理については、復号処理部を共有することが考えられる。復号処理部の共有化に関しては、共通する処理内容については、上記各実施の形態で示した動画像復号化方法を実行するための復号処理部を共有し、MPEG4−AVC規格に特有の処理内容については、専用の復号処理部を用いる構成であってもよい。
また、処理を一部共有化する他の例を図128Bのex1000に示す。この例では、本開示の一態様に特有の処理内容に対応した専用の復号処理部ex1001と、他の従来規格に特有の処理内容に対応した専用の復号処理部ex1002と、本開示の一態様に係る動画像復号方法と他の従来規格の動画像復号方法とに共通する処理内容に対応した共用の復号処理部ex1003とを用いる構成としている。ここで、専用の復号処理部ex1001、ex1002は、必ずしも本開示の一態様、または、他の従来規格に特有の処理内容に特化したものではなく、他の汎用処理を実行できるものであってもよい。また、本実施の形態の構成を、LSIex500で実装することも可能である。
このように、本開示の一態様に係る動画像復号方法と、従来の規格の動画像復号方法とで共通する処理内容について、復号処理部を共有することにより、LSIの回路規模を小さくし、かつ、コストを低減することが可能である。
Claims (14)
- 映像符号化方法であって、
符号化映像ビットストリームのヘッダにピクチャバッファの最大サイズを書き込み、ここで、前記ピクチャバッファ内に許容されるピクチャの最大数は、前記ピクチャバッファの最大サイズから導出され、
所定の符号化順序にしたがって符号化される、出力順序が連続している複数のピクチャを選択し、ここで、(i)前記符号化順序は前記出力順序とは異なり、(ii)前記符号化順序では、前記出力順序にしたがって前記複数のピクチャを出力するために前記複数のピクチャのうち1以上の非参照ピクチャを前記ピクチャバッファに格納する必要があり、
第1の参照ピクチャセットを記述するパラメータを、前記符号化映像ビットストリームに書き込み、ここで、前記第1の参照ピクチャセット内の参照ピクチャの数は、前記ピクチャバッファ内に許容されるピクチャの最大数よりも1つ少なく、
前記第1の参照ピクチャセットを用いて、前記複数のピクチャのうちの第1の非参照ピクチャを符号化して前記符号化映像ビットストリームに含め、
第2の参照ピクチャセットを記述するパラメータを、前記符号化映像ビットストリームに書き込み、ここで、前記第2の参照ピクチャセット内の参照ピクチャの数は、前記第1の参照ピクチャセット内の参照ピクチャの数よりも1つ少なく、
前記第2の参照ピクチャセットを用いて、前記複数のピクチャのうちの第2の非参照ピクチャを符号化して前記符号化映像ビットストリームに含める
映像符号化方法。 - さらに、前記符号化順序にしたがって前記複数のピクチャを符号化し、ここで、(i)前記符号化順序内で所定のピクチャに対応付けられた参照ピクチャセットは、前記符号化順序において前記所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットに既に含まれる先行参照ピクチャを含まず、かつ、(ii)前記所定のピクチャに対応付けられた前記参照ピクチャセット内のピクチャの最大数は、前記ピクチャバッファ内に許容されるピクチャの最大数よりも2つ少ない
請求項1記載の映像符号化方法。 - さらに、前記複数のピクチャのうちの一部のピクチャを前記符号化順序にしたがって符号化し、ここで、前記一部のピクチャのうちの参照ピクチャは、前記ピクチャバッファに許容される参照ピクチャの最大数に達するまで、前記ピクチャバッファに格納され、
前記複数のピクチャのうちの残りのピクチャを前記符号化順序にしたがって符号化し、ここで、(i)前記符号化順序内で所定のピクチャに対応付けられた参照ピクチャセットは、前記符号化順序において前記所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットに既に含まれる先行参照ピクチャを含まず、かつ、(ii)前記所定のピクチャに対応付けられた前記参照ピクチャセット内のピクチャの最大数は、前記ピクチャバッファ内に許容されるピクチャの最大数よりも2つ少ない
請求項1記載の映像符号化方法。 - 前記先行参照ピクチャを含まない前記参照ピクチャセットに対応付けられた前記所定のピクチャは、前記符号化順序において連続する2ピクチャ毎に発生する
請求項2記載の映像符号化方法。 - 前記符号化順序は、参照ピクチャとして符号化されるピクチャと、非参照ピクチャとして符号化されるピクチャとを含む
請求項1記載の映像符号化方法。 - 前記符号化順序では、階層構造でピクチャが配列され、前記階層構造では、階層レベルが高いピクチャが、階層レベルが低いピクチャから双方向インター予測される
請求項1記載の映像符号化方法。 - 所定のピクチャに対応付けられた参照ピクチャセットから除外される先行参照ピクチャは、参照ピクチャの階層レベルと、参照ピクチャから前記所定のピクチャの間の出力順序の距離とのうちの少なくとも1つに基づいて選択される
請求項6記載の映像符号化方法。 - 映像復号方法であって、
符号化映像ビットストリームのヘッダからピクチャバッファの最大サイズを解析し、ここで、前記ピクチャバッファ内に許容されるピクチャの最大数は、前記ピクチャバッファの最大サイズから導出され、
第1の参照ピクチャセットを前記符号化映像ビットストリームから解析し、ここで、前記第1の参照ピクチャセット内の参照ピクチャの数は、前記ピクチャバッファ内に許容されるピクチャの最大数よりも1つ少なく、
前記第1の参照ピクチャセットを用いて、第1の非参照ピクチャを符号化映像ビットストリームから復号し、
前記第1の非参照ピクチャを前記ピクチャバッファに格納し、
第2の参照ピクチャセットを、前記符号化映像ビットストリームから解析し、ここで、前記第2の参照ピクチャセット内の参照ピクチャの数は、前記第1の参照ピクチャセット内の参照ピクチャの数よりも1つ少なく、
前記第2の参照ピクチャセットを用いて、第2の非参照ピクチャを前記符号化映像ビットストリームから復号し、
前記第2の非参照ピクチャの復号が完了するタイムインスタンスまたはそれよりも後に、前記第1の非参照ピクチャを出力する
映像復号方法。 - (i)所定のピクチャに対応付けられた参照ピクチャセットは、前記所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットに既に含まれる先行参照ピクチャを含まず、かつ、(ii)前記所定のピクチャに対応付けられた前記参照ピクチャセットのピクチャの最大数は、前記ピクチャバッファ内に許容されるピクチャの最大数よりも2つ少なく、
前記映像復号方法は、さらに、
前記所定のピクチャに対応付けられた参照ピクチャセットを前記符号化映像ビットストリームから解析し、前記所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットを前記符号化映像ビットストリームから解析し、
(i)前記符号化映像ビットストリームから解析された、前記所定のピクチャに対応付けられた前記参照ピクチャセットと、(ii)前記符号化映像ビットストリームから解析された、前記所定のピクチャの直前にあるピクチャに対応付けられた前記参照ピクチャセットとを用いて、複数のピクチャを前記符号化映像ビットストリームから復号し、
前記ピクチャバッファに前記複数のピクチャを格納する
請求項8記載の映像復号方法。 - (i)所定のピクチャに対応付けられた参照ピクチャセットは、前記所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットに既に含まれる先行参照ピクチャを含まず、かつ、(ii)前記所定のピクチャに対応付けられた前記参照ピクチャセットのピクチャの最大数は、前記ピクチャバッファ内に許容されるピクチャの最大数よりも2つ少なく、
前記映像復号方法は、さらに、
前記所定のピクチャに対応付けられた参照ピクチャセットを前記符号化映像ビットストリームから解析し、前記所定のピクチャの直前にあるピクチャに対応付けられた参照ピクチャセットを前記符号化映像ビットストリームから解析し、
(i)前記符号化映像ビットストリームから解析された、前記所定のピクチャに対応付けられた前記参照ピクチャセットと、(ii)前記符号化映像ビットストリームから解析された、前記所定のピクチャの直前にあるピクチャに対応付けられた前記参照ピクチャセットとを用いて、複数のピクチャのうちの一部のピクチャを前記符号化映像ビットストリームから復号して、前記ピクチャバッファ内に許容される参照ピクチャの最大数に達するまで前記ピクチャバッファに格納し、
(i)前記符号化映像ビットストリームから解析された、前記所定のピクチャに対応付けられた前記参照ピクチャセットと、(ii)前記符号化映像ビットストリームから解析された、前記所定のピクチャの直前にあるピクチャに対応付けられた前記参照ピクチャセットとを用いて、前記複数のピクチャのうちの残りのピクチャを前記符号化映像ビットストリームから復号して前記ピクチャバッファに格納する
請求項8記載の映像復号方法。 - 前記先行参照ピクチャを含まない前記参照ピクチャセットに対応付けられた前記所定のピクチャは、前記符号化映像ビットストリーム内で連続する2ピクチャ毎に発生する
請求項9記載の映像復号方法。 - 前記符号化映像ビットストリームは、参照ピクチャとして符号化されるピクチャと、非参照ピクチャとして符号化されるピクチャとを含む
請求項8記載の映像復号方法。 - 前記符号化映像ビットストリームでは、階層構造でピクチャが配列され、前記階層構造では、階層レベルが高いピクチャが、階層レベルが低いピクチャから双方向インター予測される
請求項8記載の映像復号方法。 - 所定のピクチャに対応付けられた参照ピクチャセットから除外される先行参照ピクチャは、参照ピクチャの階層レベルと、参照ピクチャから前記所定のピクチャの間の出力順序の距離とのうちの少なくとも1つに基づいて前記符号化映像の符号化中に選択される
請求項13記載の映像復号方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261608292P | 2012-03-08 | 2012-03-08 | |
US61/608,292 | 2012-03-08 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013187905A true JP2013187905A (ja) | 2013-09-19 |
Family
ID=49114111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013039752A Pending JP2013187905A (ja) | 2012-03-08 | 2013-02-28 | 映像を符号化および復号する方法および装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20130235927A1 (ja) |
JP (1) | JP2013187905A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015102439A1 (ko) * | 2014-01-03 | 2015-07-09 | 삼성전자 주식회사 | 멀티 레이어 비디오의 복호화 및 부호화를 위한 버퍼 관리 방법 및 장치 |
US10528961B2 (en) | 2014-08-20 | 2020-01-07 | Virtual Moving Technologies | System and method for estimating a move using object measurements |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10003813B2 (en) | 2015-06-25 | 2018-06-19 | Samsung Electronics Co., Ltd. | Method and system for decoding by enabling optimal picture buffer management |
US11595652B2 (en) | 2019-01-28 | 2023-02-28 | Op Solutions, Llc | Explicit signaling of extended long term reference picture retention |
US10404979B2 (en) * | 2016-03-17 | 2019-09-03 | Mediatek Inc. | Video coding with interpolated reference pictures |
WO2018048704A1 (en) * | 2016-09-06 | 2018-03-15 | Carnegie Mellon University | Gaussian mixture model based approximation of continuous belief distributions |
US11509919B2 (en) * | 2018-10-17 | 2022-11-22 | Tencent America | Reference sample memory size restrictions for intra block copy |
WO2020159994A1 (en) * | 2019-01-28 | 2020-08-06 | Op Solutions, Llc | Online and offline selection of extended long term reference picture retention |
CN110119313B (zh) * | 2019-05-13 | 2021-09-03 | 格兰菲智能科技有限公司 | 图像处理方法及图像处理装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8615038B2 (en) * | 2004-12-06 | 2013-12-24 | Nokia Corporation | Video coding, decoding and hypothetical reference decoder |
JP5023739B2 (ja) * | 2007-02-28 | 2012-09-12 | ソニー株式会社 | 画像情報符号化装置及び符号化方法 |
US9451284B2 (en) * | 2011-10-10 | 2016-09-20 | Qualcomm Incorporated | Efficient signaling of reference picture sets |
US20130094774A1 (en) * | 2011-10-13 | 2013-04-18 | Sharp Laboratories Of America, Inc. | Tracking a reference picture based on a designated picture on an electronic device |
US9264717B2 (en) * | 2011-10-31 | 2016-02-16 | Qualcomm Incorporated | Random access with advanced decoded picture buffer (DPB) management in video coding |
-
2013
- 2013-02-28 JP JP2013039752A patent/JP2013187905A/ja active Pending
- 2013-03-05 US US13/785,639 patent/US20130235927A1/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015102439A1 (ko) * | 2014-01-03 | 2015-07-09 | 삼성전자 주식회사 | 멀티 레이어 비디오의 복호화 및 부호화를 위한 버퍼 관리 방법 및 장치 |
US10136145B2 (en) | 2014-01-03 | 2018-11-20 | Samsung Electronics Co., Ltd. | Method and apparatus for managing buffer for encoding and decoding multi-layer video |
US10528961B2 (en) | 2014-08-20 | 2020-01-07 | Virtual Moving Technologies | System and method for estimating a move using object measurements |
Also Published As
Publication number | Publication date |
---|---|
US20130235927A1 (en) | 2013-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6167409B2 (ja) | 画像復号化方法および画像復号化装置 | |
JP6172485B2 (ja) | 画像符号化方法及び画像符号化装置 | |
JP6210248B2 (ja) | 動画像符号化方法及び動画像符号化装置 | |
JP6213753B2 (ja) | 符号化復号装置 | |
WO2013057884A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置 | |
JP6327435B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、及び、画像復号装置 | |
WO2012023281A1 (ja) | 動画像復号方法、動画像符号化方法、動画像復号装置、及び、動画像符号化装置 | |
JP6414712B2 (ja) | 多数の参照ピクチャを用いる動画像符号化方法、動画像復号方法、動画像符号化装置、および動画像復号方法 | |
WO2014010192A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置 | |
JP6587046B2 (ja) | 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置 | |
JP2013187905A (ja) | 映像を符号化および復号する方法および装置 | |
JP6483028B2 (ja) | 画像符号化方法及び画像符号化装置 | |
WO2012120863A1 (ja) | 動画像符号化方法および動画像復号方法 | |
JP6078927B2 (ja) | 動画像符号化方法、動画像符号化装置、動画像復号方法、及び、動画像復号装置 | |
WO2012090495A1 (ja) | 画像符号化方法および画像復号方法 | |
WO2012098878A1 (ja) | 動画像符号化方法及び動画像復号化方法 | |
JP6391018B2 (ja) | 画像符号化方法、及び、画像符号化装置 | |
WO2012096157A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置 | |
WO2012014472A1 (ja) | 動画像符号化方法、動画像符号化装置、動画像復号方法、及び動画像復号装置 | |
WO2013046616A1 (ja) | 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法 | |
WO2012014458A1 (ja) | 画像符号化方法および画像復号方法 | |
WO2012086166A1 (ja) | 画像符号化方法及び画像復号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140606 |