JP2013126157A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP2013126157A
JP2013126157A JP2011274660A JP2011274660A JP2013126157A JP 2013126157 A JP2013126157 A JP 2013126157A JP 2011274660 A JP2011274660 A JP 2011274660A JP 2011274660 A JP2011274660 A JP 2011274660A JP 2013126157 A JP2013126157 A JP 2013126157A
Authority
JP
Japan
Prior art keywords
unit
prediction
information
mostprobablemode
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2011274660A
Other languages
English (en)
Inventor
Kazufumi Sato
数史 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2011274660A priority Critical patent/JP2013126157A/ja
Priority to EP12856645.2A priority patent/EP2793465A4/en
Priority to US14/347,657 priority patent/US20140241428A1/en
Priority to CA 2850349 priority patent/CA2850349A1/en
Priority to AU2012353798A priority patent/AU2012353798A1/en
Priority to RU2014123205/07A priority patent/RU2014123205A/ru
Priority to KR20147012710A priority patent/KR20140110842A/ko
Priority to BR112014013858A priority patent/BR112014013858A2/pt
Priority to PCT/JP2012/076618 priority patent/WO2013088833A1/ja
Priority to CN201280060389.8A priority patent/CN103988507A/zh
Priority to MX2014006764A priority patent/MX2014006764A/es
Priority to TW101142619A priority patent/TW201332365A/zh
Publication of JP2013126157A publication Critical patent/JP2013126157A/ja
Priority to ZA2014/02438A priority patent/ZA201402438B/en
Priority to IN4238CHN2014 priority patent/IN2014CN04238A/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】複数ストリームが符号化される画像符号化方式においてイントラ予測のためのパラメータをより効率的に符号化すること。
【解決手段】共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号する復号部と、前記復号部により復号される前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行う第1予測部と、前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記第1予測部により使用される前記MostProbableMode情報を用いてイントラ予測を行う第2予測部と、を備える画像処理装置を提供する。
【選択図】図14

Description

本開示は、画像処理装置及び画像処理方法に関する。
デジタル画像のデータサイズを圧縮するための画像符号化方式において重要な技術の1つは、画面内予測、即ちイントラ予測である。イントラ予測は、画像内の隣り合うブロック間の相関を利用し、あるブロック内の画素値を隣り合う他のブロックの画素値から予測することで、符号化される情報量を削減する技術である。MPEG4以前の画像符号化方式では、直交変換係数の直流成分及び低周波成分のみがイントラ予測の対象とされていた。これに対し、H.264/AVC(Advanced Video Coding)では、全ての成分についてイントラ予測が可能となった。イントラ予測を用いることで、例えば青空の画像のように、画素値の変化の緩やかな画像については、圧縮率の大幅な向上が見込まれる。
イントラ予測に際しては、通常、予測対象のブロックの画素値を予測するために最適な予測モードが、複数の予測モードから選択される。予測モードは、典型的には、参照画素から予測対象画素への予測方向によって区別され得る。H.264/AVCに続く次世代の画像符号化方式として標準化が進められているHEVCでは、下記非特許文献1に記載されているような角度イントラ予測(Angular Intra Prediction)法が採用される予定である。角度イントラ予測法によれば、例えば8×8画素、16×16画素又は32×32画素のサイズの輝度の予測単位(PU:Prediction Unit)について、33種類の予測方向に対応する予測モードが選択可能である。
MostProbableModeは、イントラ予測の予測モード情報の符号量を低減するために導入される仕組みである。H.264/AVCでは、左及び上の隣接ブロックの予測モードのうちモード番号の小さい方が、予測対象のブロック(予測単位)のMostProbableModeとして扱われる。これに対し、HEVCでは、左及び上の隣接ブロックのうちMostProbableModeとして扱うべき予測モードを有する隣接ブロックの位置を、予測単位ごとにインデックス情報で示すことが提案されている(下記非特許文献2参照)。それにより、MostProbableModeを利用できる予測単位の割合が増加し、符号化効率が向上することが期待される。
一方で、将来の画像符号化方式において重要なもう1つの技術は、スケーラブル符号化(SVC(Scalable Video Coding)ともいう)である。スケーラブル符号化とは、粗い画像信号を伝送するレイヤと精細な画像信号を伝送するレイヤとを階層的に符号化する技術をいう。スケーラブル符号化において階層化される典型的な属性は、主に次の3種類である。
−空間スケーラビリティ:空間解像度あるいは画像サイズが階層化される。
−時間スケーラビリティ:フレームレートが階層化される。
−SNR(Signal to Noise Ratio)スケーラビリティ:SN比(雑音比率)が階層化される。
さらに、標準規格で未だ採用されていないものの、ビット深度スケーラビリティ及びクロマフォーマットスケーラビリティもまた議論されている。
スケーラブル符号化において符号化される複数のレイヤは、一般的には、共通するシーンを映している。共通するシーンについて複数のストリームが符号化される点は、スケーラブル符号化だけでなく、立体視画像のためのマルチビュー符号化、及びインターレース符号化においても同様である。
Kemal Ugur, et al., "Description of video coding technology proposal by Tandberg, Nokia, Ericsson", JCTVC-A119,2010年4月 Mei Guo, Xun Guo, Shawmin Lei,"Improved Intra Mode Coding",JCTVC-D166,2011年1月
しかしながら、スケーラブル符号化においてレイヤごとに別々にパラメータを符号化することは、符号化効率の観点で最適ではない。下位レイヤのパラメータを上位レイヤで再利用できれば、上位レイヤのための符号量を削減し、符号化効率を高めることができる。マルチビュー符号化及びインターレース符号化においても同様である。
従って、複数ストリームが符号化される画像符号化方式においてイントラ予測のためのパラメータをより効率的に符号化できる仕組みが提供されることが望ましい。
本開示によれば、共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号する復号部と、前記復号部により復号される前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行う第1予測部と、前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記第1予測部により使用される前記MostProbableMode情報を用いてイントラ予測を行う第2予測部と、を備える画像処理装置が提供される。
上記画像処理装置は、典型的には、画像を復号する画像復号装置として実現され得る。
また、本開示によれば、共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号することと、復号された前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行うことと、前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いてイントラ予測を行うことと、を含む画像処理方法が提供される。
また、本開示によれば、共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャ内の第1の予測単位についてMostProbableModeが有効かを判定する第1判定部と、前記第1判定部による判定結果に応じて、前記第1の予測単位についてのMostProbableMode情報を前記第1のピクチャの符号化ストリーム内に符号化する第1符号化部と、前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いて特定される参照予測モードがMostProbableModeとして有効かを判定する第2判定部と、を備える画像処理装置が提供される。
上記画像処理装置は、典型的には、画像を符号化する画像符号化装置として実現され得る。
また、本開示によれば、共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャ内の第1の予測単位についてMostProbableModeが有効かを判定することと、前記判定の結果に応じて、前記第1の予測単位についてのMostProbableMode情報を前記第1のピクチャの符号化ストリーム内に符号化することと、前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いて特定される参照予測モードがMostProbableModeとして有効かを判定することと、を含む画像処理方法が提供される。
本開示に係る技術によれば、複数ストリームが符号化される画像符号化方式においてイントラ予測のためのパラメータをより効率的に符号化することができる。
スケーラブル符号化について説明するための説明図である。 一実施形態に係る画像符号化装置の概略的な構成を示すブロック図である。 一実施形態に係る画像復号装置の概略的な構成を示すブロック図である。 図2に示した第1ピクチャ符号化部の構成の一例を示すブロック図である。 図2に示した第2ピクチャ符号化部の構成の一例を示すブロック図である。 図4A及び図4Bに示したイントラ予測部の詳細な構成の一例を示すブロック図である。 HEVCの角度イントラ予測法において選択可能な予測方向の候補について説明するための説明図である。 HEVCの角度イントラ予測法における参照画素値の計算について説明するための説明図である。 一実施形態において符号化され得るMostProbableMode情報の第1の例について説明するための説明図である。 一実施形態において符号化され得るMostProbableMode情報の第2の例について説明するための説明図である。 一実施形態において符号化され得るMostProbableMode情報の第3の例について説明するための説明図である。 一実施形態に係る符号化時のイントラ予測処理の流れの第1の例を示すフローチャートである。 一実施形態に係る符号化時のイントラ予測処理の流れの第2の例を示すフローチャートである。 図3に示した第1ピクチャ復号部の構成の一例を示すブロック図である。 図3に示した第2ピクチャ復号部の構成の一例を示すブロック図である。 図13A及び図13Bに示したイントラ予測部の詳細な構成の一例を示すブロック図である。 一実施形態に係る復号時のイントラ予測処理の流れの第1の例を示すフローチャートである。 一実施形態に係る復号時のイントラ予測処理の流れの第2の例を示すフローチャートである。 一実施形態に係る画像符号化処理のマルチビュー符号化への適用について説明するための説明図である。 一実施形態に係る画像復号処理のマルチビュー符号化への適用について説明するための説明図である。 テレビジョン装置の概略的な構成の一例を示すブロック図である。 携帯電話機の概略的な構成の一例を示すブロック図である。 記録再生装置の概略的な構成の一例を示すブロック図である。 撮像装置の概略的な構成の一例を示すブロック図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
また、以下の順序で説明を行う。
1.概要
2.一実施形態に係る符号化部の構成例
3.一実施形態に係る符号化時の処理の流れ
4.一実施形態に係る復号部の構成例
5.一実施形態に係る復号時の処理の流れ
6.様々な画像符号化方式への適用
7.応用例
8.まとめ
<1.概要>
本節では、スケーラブル符号化への適用を例にとって、一実施形態に係る画像符号化装置及び画像復号装置の概要を説明する。なお、本明細書で説明するこれら装置の構成は、マルチビュー符号化及びインターレース符号化にも同等に適用可能である。
スケーラブル符号化においては、一連の画像をそれぞれ含む複数のレイヤが符号化される。ベースレイヤ(base layer)は、最初に符号化される、最も粗い画像を表現するレイヤである。ベースレイヤの符号化ストリームは、他のレイヤの符号化ストリームを復号することなく、独立して復号され得る。ベースレイヤ以外のレイヤは、エンハンスメントレイヤ(enhancement layer)と呼ばれる、より精細な画像を表現するレイヤである。エンハンスメントレイヤの符号化ストリームは、ベースレイヤの符号化ストリームに含まれる情報を用いて符号化される。従って、エンハンスメントレイヤの画像を再現するためには、ベースレイヤ及びエンハンスメントレイヤの双方の符号化ストリームが復号されることになる。スケーラブル符号化において扱われるレイヤの数は、2つ以上のいかなる数であってもよい。3つ以上のレイヤが符号化される場合には、最下位のレイヤがベースレイヤ、残りの複数のレイヤがエンハンスメントレイヤである。より上位のエンハンスメントレイヤの符号化ストリームは、より下位のエンハンスメントレイヤ又はベースレイヤの符号化ストリームに含まれる情報を用いて符号化され及び復号され得る。本明細書では、依存関係を有する少なくとも2つのレイヤのうち、依存される側のレイヤを下位レイヤ(lower layer)、依存する側のレイヤを上位レイヤ(upper layer)という。
図1は、スケーラブル符号化される3つのレイヤL1、L2及びL3を示している。レイヤL1はベースレイヤであり、レイヤL2及びL3はエンハンスメントレイヤである。なお、ここでは、様々な種類のスケーラビリティのうち、空間スケーラビリティを例にとっている。レイヤL2のレイヤL1に対する空間解像度の比は、2:1である。レイヤL3のレイヤL1に対する空間解像度の比は、4:1である。レイヤL1のブロックB1は、ベースレイヤのピクチャ内の予測単位である。レイヤL1のブロックN1及びN1は、それぞれ、ブロックB1の上及び左の隣接ブロックである。レイヤL2のブロックB2は、ブロックB1と共通するシーンを映したエンハンスメントレイヤのピクチャ内の予測単位である。ブロックB2は、レイヤL1のブロックB1に対応する。レイヤL2のブロックN2及びN2は、それぞれ、ブロックB2の上及び左の隣接ブロックである。レイヤL3のブロックB3は、ブロックB1及びB2と共通するシーンを映したより上位のエンハンスメントレイヤのピクチャ内の予測単位である。ブロックB3は、レイヤL1のブロックB1及びレイヤL2のブロックB2に対応する。レイヤL3のブロックN3及びN3は、それぞれ、ブロックB3の上及び左の隣接ブロックである。
このようなレイヤ構造において、あるレイヤのピクチャ内の画像の空間的相関は、通常、共通するシーンに関連付けられる他のレイヤのピクチャ内の画像の空間的相関と類似する。例えば、レイヤL1においてブロックB1と隣接ブロックN1との間の相関が強い場合、レイヤL2においてブロックB2と隣接ブロックN2との間の相関が強く、レイヤL3においてブロックB3と隣接ブロックN3との間の相関が強いことが予測される。従って、画像の空間的相関に依存して決まるパラメータであるMostProbableMode情報をレイヤ間で再利用すれば、符号量を効果的に削減することができるであろう。レイヤ間で画像の空間的相関が類似する点は、SNRスケーラビリティ及びビット深度スケーラビリティにおいても同様である。
なお、あるレイヤのブロックに対応する他のレイヤのブロックとは、例えば、あるレイヤのブロック内の所定の位置(例えば、左上)の画素に対応する画素を有する、他のレイヤのブロックをいう。このような定義により、例えば下位レイヤの複数のブロックを統合するような上位レイヤのブロックが存在したとしても、上位レイヤのブロックに対応する下位レイヤのブロックを一意に決定することができる。
図2は、スケーラブル符号化をサポートする、一実施形態に係る画像符号化装置10の概略的な構成を示すブロック図である。図2を参照すると、画像符号化装置10は、第1ピクチャ符号化部1a、第2ピクチャ符号化部1b、レイヤ間バッファ2及び多重化部3を備える。
第1ピクチャ符号化部1aは、ベースレイヤ画像を符号化し、ベースレイヤの符号化ストリームを生成する。第2ピクチャ符号化部1bは、エンハンスメントレイヤ画像を符号化し、エンハンスメントレイヤの符号化ストリームを生成する。レイヤ間バッファ2は、レイヤ間で再利用されるパラメータを一時的に記憶する。多重化部3は、第1ピクチャ符号化部1aにより生成されるベースレイヤの符号化ストリームと、第2ピクチャ符号化部1bにより生成される1つ以上のエンハンスメントレイヤの符号化ストリームとを多重化し、マルチレイヤの多重化ストリームを生成する。
図3は、スケーラブル符号化をサポートする、一実施形態に係る画像復号装置60の概略的な構成を示すブロック図である。図3を参照すると、画像復号装置60は、逆多重化部5、第1ピクチャ復号部6a、第2ピクチャ復号部6b及びレイヤ間バッファ7を備える。
逆多重化部5は、マルチレイヤの多重化ストリームをベースレイヤの符号化ストリーム及び1つ以上のエンハンスメントレイヤの符号化ストリームに逆多重化する。第1ピクチャ復号部6aは、ベースレイヤの符号化ストリームからベースレイヤ画像を復号する。第2ピクチャ復号部6bは、エンハンスメントレイヤの符号化ストリームからエンハンスメントレイヤ画像を復号する。レイヤ間バッファ7は、レイヤ間で再利用されるパラメータを一時的に記憶する。
図2に例示した画像符号化装置10において、ベースレイヤの符号化のための第1ピクチャ符号化部1aの構成と、エンハンスメントレイヤの符号化のための第2ピクチャ符号化部1bの構成とは、互いに類似する。それら構成の間の相違点の1つは、イントラ予測に関し、第2ピクチャ符号化部1bが、第1ピクチャ符号化部1aによるベースレイヤの符号化処理の結果を利用して、エンハンスメントレイヤの符号化処理を行う点である。そこで、次節では、第1ピクチャ符号化部1a及び第2ピクチャ符号化部1bの構成の共通部分について説明した後、特にイントラ予測に焦点を当ててそれら構成の間の関係性について詳細に説明する。
同様に、図3に例示した画像復号装置60において、ベースレイヤの復号のための第1ピクチャ復号部6aの構成と、エンハンスメントレイヤの復号のための第2ピクチャ復号部6bの構成とは、互いに類似する。それら構成の間の相違点の1つは、イントラ予測に関し、第2ピクチャ復号部6bが、第1ピクチャ復号部6aによるベースレイヤの復号処理の結果を利用して、エンハンスメントレイヤの復号処理を行う点である。そこで、さらに次の節では、第1ピクチャ復号部6a及び第2ピクチャ復号部6bの構成の共通部分について説明した後、特にイントラ予測に焦点を当ててそれら構成の間の関係性について詳細に説明する。
<2.一実施形態に係る符号化部の構成例>
[2−1.全体的な構成例]
図4Aは、図2に示した第1ピクチャ符号化部1aの構成の一例を示すブロック図である。図4Aを参照すると、第1ピクチャ符号化部1aは、並び替えバッファ12、減算部13、直交変換部14、量子化部15、可逆符号化部16a、蓄積バッファ17、レート制御部18、逆量子化部21、逆直交変換部22、加算部23、デブロックフィルタ24、フレームメモリ25、セレクタ26及び27、動き探索部30、並びにイントラ予測部40aを備える。
並び替えバッファ12は、一連の画像データに含まれる画像を並び替える。並び替えバッファ12は、符号化処理に係るGOP(Group of Pictures)構造に応じて画像を並び替えた後、並び替え後の画像データを減算部13、動き探索部30及びイントラ予測部40aへ出力する。
減算部13には、並び替えバッファ12から入力される画像データ、及び後に説明する動き探索部30又はイントラ予測部40aから入力される予測画像データが供給される。減算部13は、並び替えバッファ12から入力される画像データと予測画像データとの差分である予測誤差データを算出し、算出した予測誤差データを直交変換部14へ出力する。
直交変換部14は、減算部13から入力される予測誤差データについて直交変換を行う。直交変換部14により実行される直交変換は、例えば、離散コサイン変換(Discrete Cosine Transform:DCT)又はカルーネン・レーベ変換などであってよい。直交変換部14は、直交変換処理により取得される変換係数データを量子化部15へ出力する。
量子化部15には、直交変換部14から入力される変換係数データ、及び後に説明するレート制御部18からのレート制御信号が供給される。量子化部15は、変換係数データを量子化し、量子化後の変換係数データ(以下、量子化データという)を可逆符号化部16a及び逆量子化部21へ出力する。また、量子化部15は、レート制御部18からのレート制御信号に基づいて量子化パラメータ(量子化スケール)を切り替えることにより、可逆符号化部16aに入力される量子化データのビットレートを変化させる。
可逆符号化部16aは、量子化部15から入力されるベースレイヤの量子化データについて可逆符号化処理を行うことにより、ベースレイヤの符号化ストリームを生成する。可逆符号化部16aによる可逆符号化は、例えば、可変長符号化、又は算術符号化などであってよい。また、可逆符号化部16aは、セレクタ27から入力されるイントラ予測に関する情報又はインター予測に関する情報を、符号化ストリームのヘッダ領域内に多重化する。そして、可逆符号化部16aは、生成した符号化ストリームを蓄積バッファ17へ出力する。
可逆符号化部16aにより符号化されるイントラ予測に関する情報は、例えば、ベースレイヤの予測モード情報及びMostProbableMode情報を含み得る。これら情報について、後にさらに説明する。
蓄積バッファ17は、可逆符号化部16aから入力される符号化ストリームを半導体メモリなどの記憶媒体を用いて一時的に蓄積する。そして、蓄積バッファ17は、蓄積した符号化ストリームを、伝送路の帯域に応じたレートで、図示しない伝送部(例えば、通信インタフェース又は周辺機器との接続インタフェースなど)へ出力する。
レート制御部18は、蓄積バッファ17の空き容量を監視する。そして、レート制御部18は、蓄積バッファ17の空き容量に応じてレート制御信号を生成し、生成したレート制御信号を量子化部15へ出力する。例えば、レート制御部18は、蓄積バッファ17の空き容量が少ない時には、量子化データのビットレートを低下させるためのレート制御信号を生成する。また、例えば、レート制御部18は、蓄積バッファ17の空き容量が十分大きい時には、量子化データのビットレートを高めるためのレート制御信号を生成する。
逆量子化部21は、量子化部15から入力される量子化データについて逆量子化処理を行う。そして、逆量子化部21は、逆量子化処理により取得される変換係数データを、逆直交変換部22へ出力する。
逆直交変換部22は、逆量子化部21から入力される変換係数データについて逆直交変換処理を行うことにより、予測誤差データを復元する。そして、逆直交変換部22は、復元した予測誤差データを加算部23へ出力する。
加算部23は、逆直交変換部22から入力される復元された予測誤差データと動き探索部30又はイントラ予測部40aから入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部23は、生成した復号画像データをデブロックフィルタ24及びフレームメモリ25へ出力する。
デブロックフィルタ24は、画像の符号化時に生じるブロック歪みを減少させるためのフィルタリング処理を行う。デブロックフィルタ24は、加算部23から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データをフレームメモリ25へ出力する。
フレームメモリ25は、加算部23から入力される復号画像データ、及びデブロックフィルタ24から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。
セレクタ26は、インター予測のために使用されるフィルタリング後の復号画像データをフレームメモリ25から読み出し、読み出した復号画像データを参照画像データとして動き探索部30に供給する。また、セレクタ26は、イントラ予測のために使用されるフィルタリング前の復号画像データをフレームメモリ25から読み出し、読み出した復号画像データを参照画像データとしてイントラ予測部40aに供給する。
セレクタ27は、インター予測モードにおいて、動き探索部30から出力されるインター予測の結果としての予測画像データを減算部13へ出力すると共に、インター予測に関する情報を可逆符号化部16aへ出力する。また、セレクタ27は、イントラ予測モードにおいて、イントラ予測部40aから出力されるイントラ予測の結果としての予測画像データを減算部13へ出力すると共に、イントラ予測に関する情報を可逆符号化部16aへ出力する。セレクタ27は、インター予測モードとイントラ予測モードとを、動き探索部30及びイントラ予測部40aから出力されるコスト関数値の大きさに応じて切り替える。
動き探索部30は、並び替えバッファ12から入力される符号化対象の画像データ(原画像データ)、及びセレクタ26を介して供給される復号画像データに基づいて、インター予測処理(フレーム間予測処理)を行う。例えば、動き探索部30は、各予測モードによる予測結果を所定のコスト関数を用いて評価する。次に、動き探索部30は、コスト関数値が最小となる予測モード、即ち圧縮率が最も高くなる予測モードを、最適な予測モードとして選択する。また、動き探索部30は、当該最適な予測モードに従って予測画像データを生成する。そして、動き探索部30は、選択した最適な予測モードを表す予測モード情報、動きベクトル情報及び参照画像情報を含むインター予測に関する情報、コスト関数値、並びに予測画像データを、セレクタ27へ出力する。
イントラ予測部40aは、並び替えバッファ12から入力される原画像データ、及びフレームメモリ25から供給される参照画像データとしての復号画像データに基づいて、ベースレイヤの画像内に設定される予測単位ごとにイントラ予測処理を行う。そして、イントラ予測部40aは、イントラ予測に関する情報、コスト関数値、並びに予測画像データを、セレクタ27へ出力する。
第1ピクチャ符号化部1aは、ここで説明した一連の符号化処理を、ベースレイヤの一連の画像データについて実行する。イントラ予測部40aは、予測単位ごとに決定されるMostProbableMode情報を、レイヤ間バッファ2を用いてバッファリングする。バッファリングされるMostProbableMode情報は、次に説明する第2ピクチャ符号化部1bにより利用される。
図4Bは、図2に示した第2ピクチャ符号化部1bの構成の一例を示すブロック図である。図4Bを参照すると、第2ピクチャ符号化部1bは、並び替えバッファ12、減算部13、直交変換部14、量子化部15、可逆符号化部16b、蓄積バッファ17、レート制御部18、逆量子化部21、逆直交変換部22、加算部23、デブロックフィルタ24、フレームメモリ25、セレクタ26及び27、動き探索部30、並びにイントラ予測部40bを備える。
可逆符号化部16bは、量子化部15から入力されるエンハンスメントレイヤの量子化データについて可逆符号化処理を行うことにより、エンハンスメントレイヤの符号化ストリームを生成する。可逆符号化部16bによる可逆符号化は、例えば、可変長符号化、又は算術符号化などであってよい。また、可逆符号化部16bは、セレクタ27から入力されるイントラ予測に関する情報又はインター予測に関する情報を、符号化ストリームのヘッダ領域内に多重化する。そして、可逆符号化部16bは、生成した符号化ストリームを蓄積バッファ17へ出力する。
可逆符号化部16bにより符号化されるイントラ予測に関する情報は、例えば、エンハンスメントレイヤの予測モード情報及びMostProbableMode情報を含み得る。但し、下位レイヤのMostProbableMode情報が再利用される予測単位については、可逆符号化部16bは、上位レイヤのMostProbableMode情報の符号化を(少なくとも部分的に)省略し得る。MostProbableMode情報の符号化の省略について、後にさらに説明する。
イントラ予測部40bは、並び替えバッファ12から入力される原画像データ、フレームメモリ25から供給される参照画像データ及びレイヤ間バッファ2により記憶されている下位レイヤのMostProbableMode情報を用いて、エンハンスメントレイヤの画像内に設定される予測単位ごとにイントラ予測処理を行う。そして、イントラ予測部40aは、イントラ予測に関する情報、コスト関数値、並びに予測画像データを、セレクタ27へ出力する。
エンハンスメントレイヤが複数存在する場合には、第2ピクチャ符号化部1bは、このような一連の符号化処理を、エンハンスメントレイヤの各々について実行する。イントラ予測部40bは、予測単位ごとに決定されるMostProbableMode情報を、さらなる上位レイヤでの処理のために、レイヤ間バッファ2を用いてバッファリングしてもよい。
[2−2.イントラ予測部の構成例]
図5は、図4Aに示したイントラ予測部40a及び図4Bに示したイントラ予測部40bの詳細な構成の一例を示すブロック図である。図5を参照すると、イントラ予測部40aは、予測制御部41a、予測部42a、判定部43a、モードバッファ44a及びパラメータ生成部45aを有する。イントラ予測部40bは、予測制御部41b、予測部42b、判定部43b、モードバッファ44b及びパラメータ生成部45bを有する。
予測制御部41aは、イントラ予測部40aによるベースレイヤのイントラ予測処理を制御する。より具体的には、予測制御部41aは、複数の予測モードの候補の各々を予測単位に順次設定する。予測部42aは、予測制御部41aにより設定される予測モードの候補に従い、フレームメモリ25から入力される参照画像データを用いて、各予測単位の予測画像を生成する。判定部43aは、並び替えバッファ12から入力される原画像データと予測部42aから入力される予測画像データとに基づいて、予測モードの各候補についてコスト関数値を算出する。そして、判定部43aは、算出したコスト関数値に基づき、最適な予測モードを判定する。モードバッファ44aは、最適な予測モードを表す予測モード情報を一時的に記憶する。また、判定部43aは、モードバッファ44aにより記憶される隣接ブロックの予測モード情報を参照し、ベースレイヤの画像内の各予測単位について、MostProbableModeが有効かを判定する。パラメータ生成部45aは、判定部43aによる判定結果に応じて、予測モード情報及びMostProbableMode情報を生成する。そして、判定部43aは、パラメータ生成部45aにより生成された予測モード情報及びMostProbableMode情報を含むイントラ予測に関する情報、コスト関数値及び予測画像データをセレクタ27へ出力する。また、パラメータ生成部45aは、MostProbableMode情報をレイヤ間バッファ2へ出力する。
予測制御部41bは、イントラ予測部40bによるエンハンスメントレイヤのイントラ予測処理を制御する。より具体的には、予測制御部41bは、複数の予測モードの候補の各々を予測単位に順次設定する。予測部42bは、予測制御部41bにより設定される予測モードの候補に従い、フレームメモリ25から入力される参照画像データを用いて、各予測単位の予測画像を生成する。判定部43bは、並び替えバッファ12から入力される原画像データと予測部42bから入力される予測画像データとに基づいて、予測モードの各候補についてコスト関数値を算出する。そして、判定部43bは、算出したコスト関数値に基づき、最適な予測モードを判定する。モードバッファ44bは、最適な予測モードを表す予測モード情報を一時的に記憶する。また、判定部43bは、モードバッファ44bにより記憶される隣接ブロックの予測モード情報を参照し、エンハンスメントレイヤの画像内の各予測単位について、MostProbableModeが有効かを判定する。パラメータ生成部45bは、判定部43bによる判定結果に応じて、予測モード情報及びMostProbableMode情報を生成する。但し、下位レイヤのMostProbableMode情報が再利用される予測単位については、パラメータ生成部45bは、上位レイヤのMostProbableMode情報の生成を省略し得る。そして、判定部43bは、パラメータ生成部45bにより生成された予測モード情報及びMostProbableMode情報を含むイントラ予測に関する情報、コスト関数値及び予測画像データをセレクタ27へ出力する。パラメータ生成部45bは、さらなる上位レイヤが存在する場合には、MostProbableMode情報をレイヤ間バッファ2へ出力してもよい。
図6は、イントラ予測部40a及びイントラ予測部40bにおいて、角度イントラ予測法が用いられる場合に選択可能な予測方向の候補について説明するための説明図である。図6に示した画素P1は、予測対象画素である。画素P1が属する予測単位の周囲の網掛けされた画素は、隣接ブロックの参照画素である。ブロックサイズが4×4画素である場合には、図中で実線(太線及び細線の双方)で示された、参照画素と予測対象画素とを結ぶ17種類の予測方向(に対応する予測モード)が、(DC予測に加えて)選択可能である。ブロックサイズが8×8画素、16×16画素又は32×32画素である場合には、図中で点線並びに実線(太線及び細線の双方)で示された33種類の予測方向(に対応する予測モード)が、(DC予測及び平面予測に加えて)選択可能である。ブロックサイズが64×64画素である場合には、図中で太線で示された2種類の予測方向(に対応する予測モード)が、(DC予測に加えて)選択可能である。
なお、上述した角度イントラ予測法では、予測方向の角度の分解能が高く、例えば8×8画素の場合の隣り合う予測方向の間の角度の差は、180度/32=5.625度である。従って、予測部42aは、図7に示すような1/8画素精度の参照画素値をまず計算し、計算した参照画素値を用いて、予測モードの各候補に従って予測画素値を計算する。
図8〜図10は、本実施形態において符号化され得るMostProbableMode情報の例をそれぞれ示している。
(1)第1の例
図8の左には、下位レイヤ(例えばベースレイヤ)の予測対象ブロックBa、予測対象ブロックBaの上の隣接ブロックNa及び左の隣接ブロックNaが示されている。予測対象ブロックBaの最適な予測モードは、予測モードMaである。隣接ブロックNaの参照予測モードは、予測モードRMaである。隣接ブロックNaの参照予測モードは、予測モードRMaである。第1の例において、予測モードMa及び参照予測モードRMaの予測方向は互いに等しい。この場合、予測対象ブロックBaのMostProbableMode情報は、MPMインデックス=“左”、MPMフラグ=“True”を示し得る。MPMフラグは、予測対象ブロックについてMostProbableModeが有効か否かを示すフラグである。MPMインデックスは、MostProbableModeが有効である場合に、有効なMostProbableModeを参照予測モードとして有する隣接ブロックの位置を識別するインデックス情報である。第1の例では、MPMインデックスは、左及び上の隣接ブロック候補のうちのいずれかを識別する、2値の情報であってよい。
図8の右には、上位レイヤ(エンハンスメントレイヤ)の予測対象ブロックBb、予測対象ブロックBbの上の隣接ブロックNb及び左の隣接ブロックNbが示されている。予測対象ブロックBbは、下位レイヤの予測対象ブロックBaに対応する上位レイヤのブロックである。予測対象ブロックBbの最適な予測モードは、予測モードMbである。隣接ブロックNbの参照予測モードは、予測モードRMbである。隣接ブロックNbの参照予測モードは、予測モードRMbである。予測モードMb及び参照予測モードRMbの予測方向は互いに等しい。この場合、MostProbableMode情報は、MPMフラグ=“True”のみを示し得る。MPMインデックスは、下位レイヤから再利用されるため、上位レイヤにおいては生成されず、上位レイヤの符号化ストリーム内に符号化されない。即ち、イントラ予測部40bの判定部43bは、(例えばイントラ予測部40aのパラメータ生成部45aにより生成され、可逆符号化部16aにより符号化される)予測対象ブロックBaについてのMPMインデックスにより示される位置(図8の例では左)の隣接ブロックの参照予測モードを、予測対象ブロックBbについてのMostProbableModeとして扱う。
(2)第2の例
図9の左には、下位レイヤ(例えばベースレイヤ)の予測対象ブロックBa、並びに予測対象ブロックBaの上、右上、左上及び左下の隣接ブロックNa、NaUR、NaLT、NaLBが示されている。予測対象ブロックBaの最適な予測モードは、予測モードMaである。隣接ブロックNaの参照予測モードは、予測モードRMaである。隣接ブロックNaURの参照予測モードは、予測モードRMaURである。隣接ブロックNaLTの参照予測モードは、予測モードRMaLTである。隣接ブロックNaLBの参照予測モードは、予測モードRMaLBである。第2の例において、予測モードMa及び参照予測モードRMaLTの予測方向は互いに等しい。この場合、予測対象ブロックBaのMostProbableMode情報は、MPMインデックス=“左上”、MPMフラグ=“True”を示し得る。第2の例では、MPMインデックスは、4つの隣接ブロック候補のうちのいずれかを識別する情報であってよい。
図9の右には、上位レイヤ(エンハンスメントレイヤ)の予測対象ブロックBb、及び予測対象ブロックBbの左上の隣接ブロックNbLTが示されている。予測対象ブロックBbは、下位レイヤの予測対象ブロックBaに対応する上位レイヤのブロックである。予測対象ブロックBbの最適な予測モードは、予測モードMbである。隣接ブロックNbLTの参照予測モードは、予測モードRMbLTである。予測モードMb及び参照予測モードRMbLTの予測方向は互いに等しい。この場合、MostProbableMode情報は、MPMフラグ=“True”のみを示し得る。MPMインデックスは、下位レイヤから再利用されるため、上位レイヤにおいては生成されず、上位レイヤの符号化ストリーム内に符号化されない。即ち、イントラ予測部40bの判定部43bは、(例えばイントラ予測部40aのパラメータ生成部45aにより生成され、可逆符号化部16aにより符号化される)予測対象ブロックBaについてのMPMインデックスにより示される位置(図9の例では左上)の隣接ブロックの参照予測モードを、予測対象ブロックBbについてのMostProbableModeとして扱う。
(3)第3の例
図10の左には、下位レイヤ(例えばベースレイヤ)の予測対象ブロックBa、予測対象ブロックBaの上の隣接ブロックNa及び左の隣接ブロックNaが示されている。予測対象ブロックBaの最適な予測モードは、予測モードMaである。隣接ブロックNaの参照予測モードは、予測モードRMaである。隣接ブロックNaの参照予測モードは、予測モードRMaである。第3の例において、予測モードMa及び参照予測モードRMaの予測方向は互いに等しい。この場合、予測対象ブロックBaのMostProbableMode情報は、MPMインデックス=“左”、MPMフラグ=“True”を示し得る。
図10の右には、上位レイヤ(エンハンスメントレイヤ)の予測対象ブロックBb、予測対象ブロックBbの上の隣接ブロックNb及び左の隣接ブロックNbが示されている。予測対象ブロックBbは、下位レイヤの予測対象ブロックBaに対応する上位レイヤのブロックである。予測対象ブロックBbの最適な予測モードは、予測モードMbである。隣接ブロックNbの参照予測モードは、予測モードRMbである。隣接ブロックNbの参照予測モードは、予測モードRMbである。第3の例において、予測モードMbの予測方向は、参照予測モードRMbではなく参照予測モードRMbの予測方向と等しい。この場合、MostProbableMode情報は、上位レイヤにおいても、MPMフラグ=“True”だけでなく、MPMインデックス=“上”を示し得る。パラメータ生成部45aは、さらに追加的なパラメータとして再利用フラグ=“False”を生成する。
即ち、第3の例においては、符号化パラメータとして再利用フラグが導入され、当該再利用フラグによって、下位レイヤのMostProbableMode情報を再利用すべきか否かが示される。そして、再利用フラグが下位レイヤのMostProbableMode情報を再利用すべきことを示す場合には、上位レイヤにおいてMPMインデックスは符号化されない。一方、再利用フラグが下位レイヤのMostProbableMode情報を再利用すべきことを示さない場合には、上位レイヤにおいてもMPMインデックスが生成され、生成されたMPMインデックスが(再利用フラグ及びMPMフラグと共に)可逆符号化部16bにより符号化される。
なお、第1〜第3の例を通じて、予測対象ブロックの最適な予測モードがいずれの隣接ブロックの参照予測モードとも異なる場合には、MPMフラグが“False”を示し、当該予測対象ブロックについて予測モード情報が生成され、符号化される。また、再利用フラグが導入されない場合において、図10の例のように予測対象ブロックの最適な予測モードが下位レイヤのMostProbableMode情報により識別される位置の隣接ブロックの参照予測モードと等しくないときにも、MPMフラグが“False”を示し、当該予測対象ブロックについて予測モード情報が符号化されてよい。
<3.一実施形態に係る符号化時の処理の流れ>
図11及び図12は、本実施形態に係る符号化時のイントラ予測処理の流れの例をそれぞれ示している。図11に示す第1の例では、図10を用いて説明したような再利用フラグは導入されない。図12に示す第2の例では、再利用フラグが導入される。
(1)第1の例
図11を参照すると、まず、イントラ予測部40aは、ベースレイヤのイントラ予測処理を行う(ステップS100)。その結果、ベースレイヤのピクチャ内の予測単位の配置が決定され、各予測単位について最適な予測モードが決定される。イントラ予測部40aにおいて生成される予測モード情報及びMostProbableMode情報は、可逆符号化部16aによりベースレイヤの符号化ストリーム内に符号化される。レイヤ間バッファ2は、各予測単位について生成されるMostProbableMode情報をバッファリングする。
ステップS110〜S180の処理は、エンハンスメントレイヤのイントラ予測処理である。これら処理のうちステップS110〜S165の処理は、各エンハンスメントレイヤの各予測単位を予測対象ブロックとして繰り返される。なお、以下の説明において、「上位レイヤ」は予測対象のレイヤであり、「下位レイヤ」は予測対象のレイヤの下位のレイヤである。
まず、予測部42bにより複数の予測モードの候補に従って予測対象ブロックの予測画像が生成されると、判定部43bは、原画像と予測画像との差分に応じたコスト関数値を算出し、算出したコスト関数値に基づいて最適な予測モードMbを判定する(ステップS110)。
次に、判定部43bは、判定された最適な予測モードMbが下位レイヤのMostProbableMode情報に含まれるMPMインデックスにより識別される位置の隣接ブロックの参照予測モードと等しいか否かを判定する(ステップS130)。ここで、予測モードMbが当該隣接ブロックの参照予測モードと異なる場合には、処理はステップS140へ進む。一方、予測モードMbが当該隣接ブロックの参照予測モードと等しい場合には、処理はステップS165へ進む。
ステップS140では、パラメータ生成部45bは、予測対象ブロックについてのMostProbableMode情報として、MPMフラグ=“False”を生成する(ステップS140)。次に、パラメータ生成部45bは、最適な予測モードMbを示す予測モード情報を生成する(ステップS140)。
一方、ステップS165では、パラメータ生成部45bは、予測対象ブロックについてのMostProbableMode情報として、MPMフラグ=“True”を生成する(ステップS165)。パラメータ生成部45bは、上位レイヤの予測対象ブロックについてのMostProbableMode情報として、MPMインデックスを生成しない。
その後、予測対象のレイヤ内に未処理の予測単位が残っている場合には、処理はステップS110に戻る(ステップS180)。一方、未処理の予測単位が残っていない場合には、さらに残りのレイヤ(より上位のレイヤ)が存在するかが判定される(ステップS190)、ここで、残りのレイヤが存在する場合には、それまでの予測対象のレイヤを下位レイヤ、次のレイヤを上位レイヤとして、ステップS110以降の処理が繰り返される。MostProbableMode情報は、レイヤ間バッファ2によりバッファリングされる。残りのレイヤが存在しない場合には、図11のイントラ予測処理は終了する。なお、ここで生成される上位レイヤの予測モード情報及びMostProbableMode情報は、可逆符号化部16bにより上位レイヤの符号化ストリーム内に符号化される。
(2)第2の例
図12を参照すると、まず、イントラ予測部40aは、ベースレイヤのイントラ予測処理を行う(ステップS100)。その結果、ベースレイヤのピクチャ内の予測単位の配置が決定され、各予測単位について最適な予測モードが決定される。イントラ予測部40aにおいて生成される予測モード情報及びMostProbableMode情報は、可逆符号化部16aによりベースレイヤの符号化ストリーム内に符号化される。レイヤ間バッファ2は、各予測単位について生成されるMostProbableMode情報をバッファリングする。
ステップS110〜S180の処理は、エンハンスメントレイヤのイントラ予測処理である。これら処理のうちステップS110〜S170の処理は、各エンハンスメントレイヤの各予測単位を予測対象ブロックとして繰り返される。
まず、予測部42bにより複数の予測モードの候補に従って予測対象ブロックの予測画像が生成されると、判定部43bは、原画像と予測画像との差分に応じたコスト関数値を算出し、算出したコスト関数値に基づいて最適な予測モードMbを判定する(ステップS110)。
次に、判定部43bは、判定された最適な予測モードMbがいずれかの隣接ブロックの参照予測モードと等しいか否かを判定する(ステップS120)。ここで、予測モードMbがいずれの隣接ブロックの参照予測モードとも等しくない場合には、処理はステップS140へ進む。一方、予測モードMbがいずれかの隣接ブロックの参照予測モードと等しい場合には、処理はステップS130へ進む。
ステップS130では、判定部43bは、予測モードMbが下位レイヤのMostProbableMode情報に含まれるMPMインデックスにより識別される位置の隣接ブロックの参照予測モードと等しいか否かを判定する(ステップS130)。ここで、予測モードMbが当該隣接ブロックの参照予測モードと異なる場合には、処理はステップS160へ進む。一方、予測モードMbが当該隣接ブロックの参照予測モードと等しい場合には、処理はステップS170へ進む。
ステップS140では、パラメータ生成部45bは、予測対象ブロックについてのMostProbableMode情報として、MPMフラグ=“False”を生成する(ステップS140)。次に、パラメータ生成部45bは、最適な予測モードMbを示す予測モード情報を生成する(ステップS140)。
ステップS160では、パラメータ生成部45bは、予測対象ブロックについてのMostProbableMode情報として、MPMフラグ=“True”、再利用フラグ=“False”及びMPMインデックスを生成する(ステップS160)。ここで生成されるMPMインデックスは、予測モードMbと等しい参照予測モードを有する隣接ブロックの位置を示す。
ステップS170では、パラメータ生成部45bは、予測対象ブロックについてのMostProbableMode情報として、MPMフラグ=“True”及び再利用フラグ=“True”を生成する(ステップS170)。この場合、パラメータ生成部45bは、上位レイヤの予測対象ブロックについてのMostProbableMode情報として、MPMインデックスを生成しない。
その後、予測対象のレイヤ内に未処理の予測単位が残っている場合には、処理はステップS110に戻る(ステップS180)。一方、未処理の予測単位が残っていない場合には、さらに残りのレイヤ(より上位のレイヤ)が存在するかが判定される(ステップS190)、ここで、残りのレイヤが存在する場合には、それまでの予測対象のレイヤを下位レイヤ、次のレイヤを上位レイヤとして、ステップS110以降の処理が繰り返される。MostProbableMode情報は、レイヤ間バッファ2によりバッファリングされる。残りのレイヤが存在しない場合には、図12のイントラ予測処理は終了する。なお、ここで生成される上位レイヤの予測モード情報及びMostProbableMode情報は、可逆符号化部16bにより上位レイヤの符号化ストリーム内に符号化される。
<4.一実施形態に係る復号部の構成例>
[4−1.全体的な構成例]
図13Aは、図3に示した第1ピクチャ復号部6aの構成の一例を示すブロック図である。図13Aを参照すると、第1ピクチャ復号部6aは、蓄積バッファ61、可逆復号部62a、逆量子化部63、逆直交変換部64、加算部65、デブロックフィルタ66、並び替えバッファ67、D/A(Digital to Analogue)変換部68、フレームメモリ69、セレクタ70及び71、動き補償部80、並びにイントラ予測部90aを備える。
蓄積バッファ61は、伝送路を介して入力される符号化ストリームを記憶媒体を用いて一時的に蓄積する。
可逆復号部62aは、蓄積バッファ61から入力されるベースレイヤの符号化ストリームを、符号化の際に使用された符号化方式に従って復号する。また、可逆復号部62aは、符号化ストリームのヘッダ領域に多重化されている情報を復号する。可逆復号部62aにより復号される情報は、例えば、上述したインター予測に関する情報及びイントラ予測に関する情報を含み得る。イントラ予測に関する情報は、ベースレイヤのピクチャ内の予測単位についての予測モード情報及びMostProbableMode情報を含む。可逆復号部62aは、インター予測に関する情報を動き補償部80へ出力する。また、可逆復号部62aは、イントラ予測に関する情報をイントラ予測部90aへ出力する。
逆量子化部63は、可逆復号部62aによる復号後の量子化データを逆量子化する。逆直交変換部64は、符号化の際に使用された直交変換方式に従い、逆量子化部63から入力される変換係数データについて逆直交変換を行うことにより、予測誤差データを生成する。そして、逆直交変換部64は、生成した予測誤差データを加算部65へ出力する。
加算部65は、逆直交変換部64から入力される予測誤差データと、セレクタ71から入力される予測画像データとを加算することにより、復号画像データを生成する。そして、加算部65は、生成した復号画像データをデブロックフィルタ66及びフレームメモリ69へ出力する。
デブロックフィルタ66は、加算部65から入力される復号画像データをフィルタリングすることによりブロック歪みを除去し、フィルタリング後の復号画像データを並び替えバッファ67及びフレームメモリ69へ出力する。
並び替えバッファ67は、デブロックフィルタ66から入力される画像を並び替えることにより、時系列の一連の画像データを生成する。そして、並び替えバッファ67は、生成した画像データをD/A変換部68へ出力する。
D/A変換部68は、並び替えバッファ67から入力されるデジタル形式の画像データをアナログ形式の画像信号に変換する。そして、D/A変換部68は、例えば、画像復号装置60と接続されるディスプレイ(図示せず)にアナログ画像信号を出力することにより、画像を表示させる。
フレームメモリ69は、加算部65から入力されるフィルタリング前の復号画像データ、及びデブロックフィルタ66から入力されるフィルタリング後の復号画像データを記憶媒体を用いて記憶する。
セレクタ70は、可逆復号部62aにより取得されるモード情報に応じて、画像内のブロックごとに、フレームメモリ69からの画像データの出力先を動き補償部80とイントラ予測部90aとの間で切り替える。例えば、セレクタ70は、インター予測モードが指定された場合には、フレームメモリ69から供給されるフィルタリング後の復号画像データを参照画像データとして動き補償部80へ出力する。また、セレクタ70は、イントラ予測モードが指定された場合には、フレームメモリ69から供給されるフィルタリング前の復号画像データを参照画像データとしてイントラ予測部90aへ出力する。
セレクタ71は、可逆復号部62aにより取得されるモード情報に応じて、加算部65へ供給すべき予測画像データの出力元を動き補償部80とイントラ予測部90aとの間で切り替える。例えば、セレクタ71は、インター予測モードが指定された場合には、動き補償部80から出力される予測画像データを加算部65へ供給する。また、セレクタ71は、イントラ予測モードが指定された場合には、イントラ予測部90aから出力される予測画像データを加算部65へ供給する。
動き補償部80は、可逆復号部62aから入力されるインター予測に関する情報とフレームメモリ69からの参照画像データとに基づいて動き補償処理を行い、予測画像データを生成する。そして、動き補償部80は、生成した予測画像データをセレクタ71へ出力する。
イントラ予測部90aは、可逆復号部62aから入力されるイントラ予測に関する情報とフレームメモリ69からの参照画像データとに基づいてベースレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部90aは、生成した予測画像データをセレクタ71へ出力する。このようなイントラ予測部90aによるイントラ予測処理について、後にさらに説明する。
第1ピクチャ復号部6aは、ここで説明した一連の復号処理を、ベースレイヤの一連の画像データについて実行する。イントラ予測部90aは、予測単位ごとに復号されるMostProbableMode情報を、レイヤ間バッファ7を用いてバッファリングする。バッファリングされるMostProbableMode情報は、次に説明する第2ピクチャ復号部6bにより利用される。
図13Bは、図3に示した第2ピクチャ復号部6bの構成の一例を示すブロック図である。図13Bを参照すると、第2ピクチャ復号部6bは、蓄積バッファ61、可逆復号部62b、逆量子化部63、逆直交変換部64、加算部65、デブロックフィルタ66、並び替えバッファ67、D/A変換部68、フレームメモリ69、セレクタ70及び71、動き補償部80、並びにイントラ予測部90bを備える。
可逆復号部62bは、蓄積バッファ61から入力されるエンハンスメントレイヤの符号化ストリームを、符号化の際に使用された符号化方式に従って復号する。また、可逆復号部62bは、符号化ストリームのヘッダ領域に多重化されている情報を復号する。可逆復号部62bにより復号される情報は、例えば、上述したインター予測に関する情報及びイントラ予測に関する情報を含み得る。イントラ予測に関する情報は、エンハンスメントレイヤのピクチャ内の予測単位についての予測モード情報及びMostProbableMode情報を含み得る。可逆復号部62bは、インター予測に関する情報を動き補償部80へ出力する。また、可逆復号部62b、イントラ予測に関する情報をイントラ予測部90bへ出力する。
なお、図8〜図10を用いて説明したように、下位レイヤのMostProbableMode情報が再利用される予測単位については、上位レイヤのMostProbableMode情報の符号化は、エンコーダ側で部分的に省略され得る。その場合、可逆符号化部16bは、省略されたMostProbableMode情報を復号しない。
イントラ予測部90bは、可逆復号部62bから入力されるイントラ予測に関する情報、フレームメモリ69からの参照画像データ及びレイヤ間バッファ7により記憶されている下位レイヤのMostProbableMode情報を用いて、エンハンスメントレイヤのイントラ予測処理を行い、予測画像データを生成する。そして、イントラ予測部90bは、生成した予測画像データをセレクタ71へ出力する。このようなイントラ予測部90bによるイントラ予測処理について、後にさらに説明する。
エンハンスメントレイヤが複数存在する場合には、第2ピクチャ復号部6bは、このような一連の復号処理を、エンハンスメントレイヤの各々について実行する。イントラ予測部90bは、予測単位ごとに決定されるMostProbableMode情報を、さらなる上位レイヤでの処理のために、レイヤ間バッファ7を用いてバッファリングしてもよい。
[4−2.イントラ予測部の構成例]
図14は、図13Aに示したイントラ予測部90a及び図13Bに示したイントラ予測部90bの詳細な構成の一例を示すブロック図である。図14を参照すると、イントラ予測部90aは、予測制御部91a、パラメータ取得部92a、予測部93a及びモードバッファ94aを有する。イントラ予測部90bは、予測制御部91b、パラメータ取得部92b、予測部93b及びモードバッファ94bを有する。
予測制御部91aは、イントラ予測部90aによるベースレイヤのイントラ予測処理を制御する。より具体的には、予測制御部91aは、可逆復号部62aにより復号されるイントラ予測に関する情報を、パラメータ取得部92aに取得させる。パラメータ取得部92aにより取得される情報には、ベースレイヤのピクチャ内の予測単位についての予測モード情報及びMostProbableMode情報が含まれる。予測部93aは、パラメータ取得部92aにより取得される予測モード情報及びMostProbableMode情報に従って各予測単位に予測モードを設定する。例えば、予測部93aは、MPMフラグが“False”を示す予測単位に、予測モード情報により示される予測モードを設定する。また、予測部93aは、MPMフラグが“True”を示す予測単位に、MPMインデックスにより識別される位置の隣接ブロックの参照予測モードと同じ予測モードを設定する。そして、予測部93aは、設定した予測モードに従い、フレームメモリ69から入力される参照画像データを用いて、各予測単位の予測画像を生成する。モードバッファ94aは、各予測単位に設定された予測モードを表す予測モード情報を一時的に記憶する。予測部93aにより生成される予測画像データは、加算部65へ出力される。また、パラメータ取得部92aにより取得されるMostProbableMode情報は、レイヤ間バッファ7へ出力される。
予測制御部91bは、イントラ予測部90bによるエンハンスメントレイヤのイントラ予測処理を制御する。より具体的には、予測制御部91bは、可逆復号部62bにより復号されるイントラ予測に関する情報を、パラメータ取得部92bに取得させる。パラメータ取得部92bにより取得される情報には、エンハンスメントレイヤのピクチャ内の予測単位についての予測モード情報及びMostProbableMode情報が含まれ得る。また、予測制御部91bは、レイヤ間バッファ7により記憶されている下位レイヤのMostProbableMode情報を、パラメータ取得部92bに取得させる。予測部93bは、パラメータ取得部92bにより取得される予測モード情報及びMostProbableMode情報に従って各予測単位に予測モードを設定する。例えば、予測部93bは、MPMフラグが“False”を示す予測単位に、予測モード情報により示される予測モードを設定する。また、予測部93bは、MPMフラグが“True”を示す予測単位に、レイヤ間バッファ7から取得されたMPMインデックスにより識別される位置の隣接ブロックの参照予測モードと同じ予測モードを設定し得る。予測部93bは、ある予測単位について“False”を示す再利用フラグが復号された場合には、エンハンスメントレイヤにおいて別途復号されるMPMインデックスにより識別される位置の隣接ブロックの参照予測モードと同じ予測モードを、当該予測単位に設定してもよい。そして、予測部93bは、設定した予測モードに従い、フレームメモリ69から入力される参照画像データを用いて、各予測単位の予測画像を生成する。モードバッファ94bは、各予測単位に設定された予測モードを表す予測モード情報を一時的に記憶する。予測部93bにより生成される予測画像データは、加算部65へ出力される。また、パラメータ取得部92bは、さらなる上位レイヤが存在する場合には、MostProbableMode情報をレイヤ間バッファ7へ出力してもよい。
<5.一実施形態に係る復号時の処理の流れ>
図15及び図16は、本実施形態に係る復号時のイントラ予測処理の流れの例をそれぞれ示している。図15に示す第1の例では、図10を用いて説明したような再利用フラグは導入されない。図16に示す第2の例では、再利用フラグが導入される。
(1)第1の例
図15を参照すると、まず、イントラ予測部90aは、ベースレイヤのイントラ予測処理を行う(ステップS200)。それにより、ベースレイヤのピクチャ内の各予測単位について、符号化ストリームから復号される予測モード情報及びMostProbableMode情報を用いて、予測画像データが生成される。レイヤ間バッファ7は、各予測単位について生成されるMostProbableMode情報をバッファリングする。
ステップS210〜S280の処理は、エンハンスメントレイヤのイントラ予測処理である。これら処理のうちステップS210〜S270の処理は、各エンハンスメントレイヤの各予測単位を予測対象ブロックとして繰り返される。なお、以下の説明において、「上位レイヤ」は予測対象のレイヤであり、「下位レイヤ」は予測対象のレイヤの下位のレイヤである。
まず、パラメータ取得部92bは、上位レイヤの予測対象ブロックについて可逆復号部62bにより復号されるMostProbableMode情報を取得する(ステップS210)。
次に、予測制御部91bは、上位レイヤの予測対象ブロックのMPMフラグが“True”を示しているか否かを判定する(ステップS220)。ここで、MPMフラグが“True”を示していない場合には、処理はステップS230へ進む。一方、MPMフラグが“True”を示している場合には、処理はステップS250へ進む。
ステップS230では、パラメータ取得部92bは、予測対象ブロックについて可逆復号部62bにより復号される予測モード情報を取得する(ステップS230)。そして、パラメータ取得部92bは、取得した予測モード情報を予測部93bへ出力する。
ステップS250では、パラメータ取得部92bは、レイヤ間バッファ7により記憶されている、予測対象ブロックに対応する下位レイヤの予測単位のMostProbableMode情報を取得する(ステップS250)。そして、パラメータ取得部92bは、取得したMostProbableMode情報を予測部93bへ出力する。予測部93bは、パラメータ取得部92bにより取得されたMostProbableMode情報に含まれるMPMインデックスにより示される位置の隣接ブロックの予測モード情報を、モードバッファ94bから取得する(ステップS260)。
次に、予測部93bは、取得した予測モード情報に従って予測対象ブロックに予測モードを設定し、設定した予測モードに従って予測対象ブロックの予測画像を生成する(ステップS270)。
その後、予測対象のレイヤ内に未処理の予測単位が残っている場合には、処理はステップS210に戻る(ステップS280)。一方、未処理の予測単位が残っていない場合には、さらに残りのレイヤ(より上位のレイヤ)が存在するかが判定される(ステップS290)、ここで、残りのレイヤが存在する場合には、それまでの予測対象のレイヤを下位レイヤ、次のレイヤを上位レイヤとして、ステップS210以降の処理が繰り返される。MostProbableMode情報は、レイヤ間バッファ7によりバッファリングされる。残りのレイヤが存在しない場合には、図15のイントラ予測処理は終了する。
(2)第2の例
図16を参照すると、まず、イントラ予測部90aは、ベースレイヤのイントラ予測処理を行う(ステップS200)。それにより、ベースレイヤのピクチャ内の各予測単位について、符号化ストリームから復号される予測モード情報及びMostProbableMode情報を用いて、予測画像データが生成される。レイヤ間バッファ7は、各予測単位について生成されるMostProbableMode情報をバッファリングする。
ステップS210〜S280の処理は、エンハンスメントレイヤのイントラ予測処理である。これら処理のうちステップS210〜S270の処理は、各エンハンスメントレイヤの各予測単位を予測対象ブロックとして繰り返される。
まず、パラメータ取得部92bは、上位レイヤの予測対象ブロックについて可逆復号部62bにより復号されるMostProbableMode情報を取得する(ステップS210)。
次に、予測制御部91bは、上位レイヤの予測対象ブロックのMPMフラグが“True”を示しているか否かを判定する(ステップS220)。ここで、MPMフラグが“True”を示していない場合には、処理はステップS230へ進む。一方、MPMフラグが“True”を示している場合には、処理はステップS240へ進む。
ステップS230では、パラメータ取得部92bは、予測対象ブロックについて可逆復号部62bにより復号される予測モード情報を取得する(ステップS230)。そして、パラメータ取得部92bは、取得した予測モード情報を予測部93bへ出力する。
ステップS240では、予測制御部91bは、予測対象ブロックの再利用フラグが“True”を示しているか否かを判定する(ステップS240)。ここで、再利用フラグが“True”を示している場合には、処理はステップS250へ進む。一方、再利用フラグが“True”を示していない場合には、処理はステップS265へ進む。
ステップS250では、パラメータ取得部92bは、レイヤ間バッファ7により記憶されている、予測対象ブロックに対応する下位レイヤの予測単位のMostProbableMode情報を取得する(ステップS250)。そして、パラメータ取得部92bは、取得したMostProbableMode情報を予測部93bへ出力する。予測部93bは、パラメータ取得部92bにより取得されたMostProbableMode情報に含まれるMPMインデックスにより示される位置の隣接ブロックの予測モード情報を、モードバッファ94bから取得する(ステップS260)。
ステップS265では、予測部93bは、予測対象ブロックについてのMostProbableMode情報に含まれるMPMインデックスにより示される位置の隣接ブロックの予測モード情報を、モードバッファ94bから取得する(ステップS265)。
次に、予測部93bは、取得した予測モード情報に従って予測対象ブロックに予測モードを設定し、設定した予測モードに従って予測対象ブロックの予測画像を生成する(ステップS270)。
その後、予測対象のレイヤ内に未処理の予測単位が残っている場合には、処理はステップS210に戻る(ステップS280)。一方、未処理の予測単位が残っていない場合には、さらに残りのレイヤ(より上位のレイヤ)が存在するかが判定される(ステップS290)、ここで、残りのレイヤが存在する場合には、それまでの予測対象のレイヤを下位レイヤ、次のレイヤを上位レイヤとして、ステップS210以降の処理が繰り返される。MostProbableMode情報は、レイヤ間バッファ7によりバッファリングされる。残りのレイヤが存在しない場合には、図16のイントラ予測処理は終了する。
<6.様々な画像符号化方式への適用>
本開示に係る技術は、上述したように、スケーラブル符号化のみならず、例えばマルチビュー符号化及びインターレース符号化にも適用可能である。本節では、本開示に係る技術がマルチビュー符号化に適用される例について説明する。
マルチビュー符号化は、いわゆる立体視画像を符号化し及び復号するための画像符号化方式である。マルチビュー符号化においては、立体表示される画像の右眼ビュー及び左眼ビューにそれぞれ対応する2つの符号化ストリームが生成される。これら2つのビューのうち一方がベースビューとして選択され、他方はノンベースビューと呼ばれる。マルチビューの画像データを符号化する際、ベースビューのピクチャについての符号化パラメータに基づいてノンベースビューのピクチャを符号化することにより、全体としての符号化ストリームのデータサイズが圧縮され得る。
図17は、上述した画像符号化処理のマルチビュー符号化への適用について説明するための説明図である。図17を参照すると、一例としてのマルチビュー符号化装置810の構成が示されている。マルチビュー符号化装置810は、第1ピクチャ符号化部1a、第2ピクチャ符号化部1b、ビュー間バッファ2及び多重化部3を備える。なお、ここでは一例として、左眼ビューがベースビューとして扱われるものとする。
第1ピクチャ符号化部1aは、左眼ビューの画像を符号化し、ベースビューの符号化ストリームを生成する。第2ピクチャ符号化部1bは、右眼ビューの画像を符号化し、ノンベースビューの符号化ストリームを生成する。ビュー間バッファ2は、ビュー間で再利用されるパラメータを一時的に記憶する。多重化部3は、第1ピクチャ符号化部1aにより生成されるベースビューの符号化ストリームと、第2ピクチャ符号化部1bにより生成されるノンベースビューの符号化ストリームとを多重化し、マルチビューの多重化ストリームを生成する。
図18は、上述した画像復号処理のマルチビュー符号化への適用について説明するための説明図である。図18を参照すると、一例としてのマルチビュー復号装置860の構成が示されている。マルチビュー復号装置860は、逆多重化部5、第1ピクチャ復号部6a、第2ピクチャ復号部6b及びビュー間バッファ7を備える。
逆多重化部5は、マルチビューの多重化ストリームをベースビューの符号化ストリーム及びノンベースビューの符号化ストリームに逆多重化する。第1ピクチャ復号部6aは、ベースビューの符号化ストリームから左眼ビューの画像を復号する。第2ピクチャ復号部6bは、ノンベースビューの符号化ストリームから右眼ビューの画像を復号する。ビュー間バッファ7は、ビュー間で再利用されるパラメータを一時的に記憶する。
本開示に係る技術がインターレース符号化に適用される場合には、第1ピクチャ符号化部1aが1つのフレームを構成する2つのフィールドの一方を符号化して第1の符号化ストリームを生成し、第1ピクチャ復号部6aが当該第1の符号化ストリームを復号する。また、第2ピクチャ符号化部1bが他方のフィールドを符号化して第2の符号化ストリームを生成し、第2ピクチャ復号部6bが当該第2の符号化ストリームを復号する。
<7.応用例>
上述した実施形態に係る画像符号化装置10及び画像復号装置60は、衛星放送、ケーブルTVなどの有線放送、インターネット上での配信、及びセルラー通信による端末への配信などにおける送信機若しくは受信機、光ディスク、磁気ディスク及びフラッシュメモリなどの媒体に画像を記録する記録装置、又は、これら記憶媒体から画像を再生する再生装置などの様々な電子機器に応用され得る。以下、4つの応用例について説明する。
[7−1.第1の応用例]
図19は、上述した実施形態を適用したテレビジョン装置の概略的な構成の一例を示している。テレビジョン装置900は、アンテナ901、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、表示部906、音声信号処理部907、スピーカ908、外部インタフェース909、制御部910、ユーザインタフェース911、及びバス912を備える。
チューナ902は、アンテナ901を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ902は、復調により得られた符号化ビットストリームをデマルチプレクサ903へ出力する。即ち、チューナ902は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送手段としての役割を有する。
デマルチプレクサ903は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ904へ出力する。また、デマルチプレクサ903は、符号化ビットストリームからEPG(Electronic Program Guide)などの補助的なデータを抽出し、抽出したデータを制御部910に供給する。なお、デマルチプレクサ903は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。
デコーダ904は、デマルチプレクサ903から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ904は、復号処理により生成される映像データを映像信号処理部905へ出力する。また、デコーダ904は、復号処理により生成される音声データを音声信号処理部907へ出力する。
映像信号処理部905は、デコーダ904から入力される映像データを再生し、表示部906に映像を表示させる。また、映像信号処理部905は、ネットワークを介して供給されるアプリケーション画面を表示部906に表示させてもよい。また、映像信号処理部905は、映像データについて、設定に応じて、例えばノイズ除去などの追加的な処理を行ってもよい。さらに、映像信号処理部905は、例えばメニュー、ボタン又はカーソルなどのGUI(Graphical User Interface)の画像を生成し、生成した画像を出力画像に重畳してもよい。
表示部906は、映像信号処理部905から供給される駆動信号により駆動され、表示デバイス(例えば、液晶ディスプレイ、プラズマディスプレイ又はOLEDなど)の映像面上に映像又は画像を表示する。
音声信号処理部907は、デコーダ904から入力される音声データについてD/A変換及び増幅などの再生処理を行い、スピーカ908から音声を出力させる。また、音声信号処理部907は、音声データについてノイズ除去などの追加的な処理を行ってもよい。
外部インタフェース909は、テレビジョン装置900と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース909を介して受信される映像ストリーム又は音声ストリームが、デコーダ904により復号されてもよい。即ち、外部インタフェース909もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置900における伝送手段としての役割を有する。
制御部910は、CPU(Central Processing Unit)などのプロセッサ、並びにRAM(Random Access Memory)及びROM(Read Only Memory)などのメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置900の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース911から入力される操作信号に応じて、テレビジョン装置900の動作を制御する。
ユーザインタフェース911は、制御部910と接続される。ユーザインタフェース911は、例えば、ユーザがテレビジョン装置900を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース911は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部910へ出力する。
バス912は、チューナ902、デマルチプレクサ903、デコーダ904、映像信号処理部905、音声信号処理部907、外部インタフェース909及び制御部910を相互に接続する。
このように構成されたテレビジョン装置900において、デコーダ904は、上述した実施形態に係る画像復号装置60の機能を有する。それにより、テレビジョン装置900での画像のスケーラブル復号に際して、より効率的に符号化された複数のピクチャの符号化ストリームを復号することができる。
[7−2.第2の応用例]
図20は、上述した実施形態を適用した携帯電話機の概略的な構成の一例を示している。携帯電話機920は、アンテナ921、通信部922、音声コーデック923、スピーカ924、マイクロホン925、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、制御部931、操作部932、及びバス933を備える。
アンテナ921は、通信部922に接続される。スピーカ924及びマイクロホン925は、音声コーデック923に接続される。操作部932は、制御部931に接続される。バス933は、通信部922、音声コーデック923、カメラ部926、画像処理部927、多重分離部928、記録再生部929、表示部930、及び制御部931を相互に接続する。
携帯電話機920は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録などの動作を行う。
音声通話モードにおいて、マイクロホン925により生成されるアナログ音声信号は、音声コーデック923に供給される。音声コーデック923は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック923は、圧縮後の音声データを通信部922へ出力する。通信部922は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック923へ出力する。音声コーデック923は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
また、データ通信モードにおいて、例えば、制御部931は、操作部932を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部931は、文字を表示部930に表示させる。また、制御部931は、操作部932を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部922へ出力する。通信部922は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部922は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部931へ出力する。制御部931は、表示部930に電子メールの内容を表示させると共に、電子メールデータを記録再生部929の記憶媒体に記憶させる。
記録再生部929は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリなどの内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USBメモリ、又はメモリカードなどの外部装着型の記憶媒体であってもよい。
また、撮影モードにおいて、例えば、カメラ部926は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部927へ出力する。画像処理部927は、カメラ部926から入力される画像データを符号化し、符号化ストリームを記録再生部929の記憶媒体に記憶させる。
また、テレビ電話モードにおいて、例えば、多重分離部928は、画像処理部927により符号化された映像ストリームと、音声コーデック923から入力される音声ストリームとを多重化し、多重化したストリームを通信部922へ出力する。通信部922は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部922は、生成した送信信号をアンテナ921を介して基地局(図示せず)へ送信する。また、通信部922は、アンテナ921を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部922は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部928へ出力する。多重分離部928は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部927、音声ストリームを音声コーデック923へ出力する。画像処理部927は、映像ストリームを復号し、映像データを生成する。映像データは、表示部930に供給され、表示部930により一連の画像が表示される。音声コーデック923は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック923は、生成した音声信号をスピーカ924に供給して音声を出力させる。
このように構成された携帯電話機920において、画像処理部927は、上述した実施形態に係る画像符号化装置10及び画像復号装置60の機能を有する。それにより、携帯電話機920での画像のスケーラブル符号化及び復号に際して、より効率的に複数のピクチャの符号化ストリームを生成し、生成されたそれら符号化ストリームを復号することができる。
[7−3.第3の応用例]
図21は、上述した実施形態を適用した記録再生装置の概略的な構成の一例を示している。記録再生装置940は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置940は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置940は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置940は、音声データ及び映像データを復号する。
記録再生装置940は、チューナ941、外部インタフェース942、エンコーダ943、HDD(Hard Disk Drive)944、ディスクドライブ945、セレクタ946、デコーダ947、OSD(On-Screen Display)948、制御部949、及びユーザインタフェース950を備える。
チューナ941は、アンテナ(図示せず)を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ941は、復調により得られた符号化ビットストリームをセレクタ946へ出力する。即ち、チューナ941は、記録再生装置940における伝送手段としての役割を有する。
外部インタフェース942は、記録再生装置940と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース942は、例えば、IEEE1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェースなどであってよい。例えば、外部インタフェース942を介して受信される映像データ及び音声データは、エンコーダ943へ入力される。即ち、外部インタフェース942は、記録再生装置940における伝送手段としての役割を有する。
エンコーダ943は、外部インタフェース942から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ943は、符号化ビットストリームをセレクタ946へ出力する。
HDD944は、映像及び音声などのコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD944は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。
ディスクドライブ945は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ945に装着される記録媒体は、例えばDVDディスク(DVD−Video、DVD−RAM、DVD−R、DVD−RW、DVD+R、DVD+RW等)又はBlu−ray(登録商標)ディスクなどであってよい。
セレクタ946は、映像及び音声の記録時には、チューナ941又はエンコーダ943から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD944又はディスクドライブ945へ出力する。また、セレクタ946は、映像及び音声の再生時には、HDD944又はディスクドライブ945から入力される符号化ビットストリームをデコーダ947へ出力する。
デコーダ947は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ947は、生成した映像データをOSD948へ出力する。また、デコーダ904は、生成した音声データを外部のスピーカへ出力する。
OSD948は、デコーダ947から入力される映像データを再生し、映像を表示する。また、OSD948は、表示する映像に、例えばメニュー、ボタン又はカーソルなどのGUIの画像を重畳してもよい。
制御部949は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置940の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース950から入力される操作信号に応じて、記録再生装置940の動作を制御する。
ユーザインタフェース950は、制御部949と接続される。ユーザインタフェース950は、例えば、ユーザが記録再生装置940を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部などを有する。ユーザインタフェース950は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部949へ出力する。
このように構成された記録再生装置940において、エンコーダ943は、上述した実施形態に係る画像符号化装置10の機能を有する。また、デコーダ947は、上述した実施形態に係る画像復号装置60の機能を有する。それにより、記録再生装置940での画像のスケーラブル符号化及び復号に際して、より効率的に複数のピクチャの符号化ストリームを生成し、生成されたそれら符号化ストリームを復号することができる。
[7−4.第4の応用例]
図22は、上述した実施形態を適用した撮像装置の概略的な構成の一例を示している。撮像装置960は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。
撮像装置960は、光学ブロック961、撮像部962、信号処理部963、画像処理部964、表示部965、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、制御部970、ユーザインタフェース971、及びバス972を備える。
光学ブロック961は、撮像部962に接続される。撮像部962は、信号処理部963に接続される。表示部965は、画像処理部964に接続される。ユーザインタフェース971は、制御部970に接続される。バス972は、画像処理部964、外部インタフェース966、メモリ967、メディアドライブ968、OSD969、及び制御部970を相互に接続する。
光学ブロック961は、フォーカスレンズ及び絞り機構などを有する。光学ブロック961は、被写体の光学像を撮像部962の撮像面に結像させる。撮像部962は、CCD又はCMOSなどのイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部962は、画像信号を信号処理部963へ出力する。
信号処理部963は、撮像部962から入力される画像信号に対してニー補正、ガンマ補正、色補正などの種々のカメラ信号処理を行う。信号処理部963は、カメラ信号処理後の画像データを画像処理部964へ出力する。
画像処理部964は、信号処理部963から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部964は、生成した符号化データを外部インタフェース966又はメディアドライブ968へ出力する。また、画像処理部964は、外部インタフェース966又はメディアドライブ968から入力される符号化データを復号し、画像データを生成する。そして、画像処理部964は、生成した画像データを表示部965へ出力する。また、画像処理部964は、信号処理部963から入力される画像データを表示部965へ出力して画像を表示させてもよい。また、画像処理部964は、OSD969から取得される表示用データを、表示部965へ出力する画像に重畳してもよい。
OSD969は、例えばメニュー、ボタン又はカーソルなどのGUIの画像を生成して、生成した画像を画像処理部964へ出力する。
外部インタフェース966は、例えばUSB入出力端子として構成される。外部インタフェース966は、例えば、画像の印刷時に、撮像装置960とプリンタとを接続する。また、外部インタフェース966には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスクなどのリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置960にインストールされ得る。さらに、外部インタフェース966は、LAN又はインターネットなどのネットワークに接続されるネットワークインタフェースとして構成されてもよい。即ち、外部インタフェース966は、撮像装置960における伝送手段としての役割を有する。
メディアドライブ968に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリなどの、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ968に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD(Solid State Drive)のような非可搬性の記憶部が構成されてもよい。
制御部970は、CPUなどのプロセッサ、並びにRAM及びROMなどのメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータなどを記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置960の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース971から入力される操作信号に応じて、撮像装置960の動作を制御する。
ユーザインタフェース971は、制御部970と接続される。ユーザインタフェース971は、例えば、ユーザが撮像装置960を操作するためのボタン及びスイッチなどを有する。ユーザインタフェース971は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部970へ出力する。
このように構成された撮像装置960において、画像処理部964は、上述した実施形態に係る画像符号化装置10及び画像復号装置60の機能を有する。それにより、撮像装置960での画像のスケーラブル符号化及び復号に際して、より効率的に複数のピクチャの符号化ストリームを生成し、生成されたそれら符号化ストリームを復号することができる。
<8.まとめ>
ここまで、図1〜図22を用いて、一実施形態に係る画像符号化装置10及び画像復号装置60について説明した。本実施形態によれば、複数ストリームが符号化される画像符号化方式において、あるピクチャ内の予測単位についてイントラ予測を実行する際に、共通するシーンに関連付けられる他のピクチャ内の対応する予測単位について使用されたMostProbableMode情報を再利用することが可能となる。それにより、複数ストリームが符号化される画像符号化方式においてイントラ予測のためのパラメータをより効率的に符号化することが可能となる。
また、本実施形態によれば、再利用されるMostProbableMode情報は、MostProbableModeとして扱われる参照予測モードを有する隣接ブロックの位置を識別するインデックス情報であってよい。共通するシーン(必ずしも全く同一のシーンでなくてよい)が複数のピクチャに映っている場合、画像の空間的相関は、それらピクチャの間で互いに類似する。従って、イントラ予測の最適な予測方向もまたそれらピクチャ間で類似する傾向にある。そこで、かかる最適な予測方向に依存して決まるインデックス情報をピクチャ間で再利用することとすれば、MostProbableMode情報の符号量を効果的に削減することができる。
また、本実施形態によれば、上記インデックス情報は、例えば、左及び上の隣接ブロック候補のうちのいずれかを識別する情報であってよい。かかる構成は、上記非特許文献2により提案されている手法を採用するエンコーダ及びデコーダに良好に適合する。また、上記インデックス情報は、隣接する3つ以上の隣接ブロック候補のうちのいずれかを識別する情報であってもよい。3つ以上の隣接ブロック候補が存在する場合には、隣接ブロックの位置を指定するインデックス情報のビット数はより多くなる。従って、その場合、インデックス情報の再利用により削減することのできるMostProbableMode情報の割合も増加し得る。
また、本実施形態によれば、追加的な符号化パラメータがMostProbableMode情報を再利用すべきことを示す場合にのみ、MostProbableMode情報がピクチャ間で再利用されてもよい。かかる構成によれば、例えば、第1のピクチャ内の第1の予測単位について使用されたインデックス情報を、第2のピクチャ内の対応する第2の予測単位において上書きし、第2の予測単位について別個のMostProbableModeを利用することが可能となる。それにより、MostProbableMode情報を再利用するか否かの切り替えをより柔軟に行うことができる。
なお、本明細書では、イントラ予測に関する情報及びインター予測に関する情報が、符号化ストリームのヘッダに多重化されて、符号化側から復号側へ伝送される例について主に説明した。しかしながら、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化ビットストリームに多重化されることなく、符号化ビットストリームと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、ビットストリームに含まれる画像(スライス若しくはブロックなど、画像の一部であってもよい)と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。即ち、情報は、画像(又はビットストリーム)とは別の伝送路上で伝送されてもよい。また、情報は、画像(又はビットストリーム)とは別の記録媒体(又は同一の記録媒体の別の記録エリア)に記録されてもよい。さらに、情報と画像(又はビットストリーム)とは、例えば、複数フレーム、1フレーム、又はフレーム内の一部分などの任意の単位で互いに関連付けられてよい。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号する復号部と、
前記復号部により復号される前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行う第1予測部と、
前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記第1予測部により使用される前記MostProbableMode情報を用いてイントラ予測を行う第2予測部と、
を備える画像処理装置。
(2)
前記MostProbableMode情報は、MostProbableModeとして扱うべき参照予測モードを有する隣接ブロックの位置を識別するインデックス情報を含む、前記(1)に記載の画像処理装置。
(3)
前記インデックス情報は、左及び上の隣接ブロック候補のうちのいずれかを識別する情報である、前記(2)に記載の画像処理装置。
(4)
前記インデックス情報は、隣接する3つ以上の隣接ブロック候補のうちのいずれかを識別する情報である、前記(2)に記載の画像処理装置。
(5)
前記第2予測部は、前記第2のピクチャの符号化ストリームから取得されるパラメータが前記MostProbableMode情報を再利用すべきことを示している場合に、前記MostProbableMode情報を用いてイントラ予測を行う、前記(1)〜(4)のいずれか1項に記載の画像処理装置。
(6)
前記第1のピクチャは、スケーラブル符号化される画像の第1のレイヤに相当し、
前記第2のピクチャは、前記第1のレイヤよりも上位の第2のレイヤに相当する、
前記(1)〜(5)のいずれか1項に記載の画像処理装置。
(7)
前記第1のレイヤ及び前記第2のレイヤは、空間解像度、雑音比率又はビット深度が互いに異なる、前記(6)に記載の画像処理装置。
(8)
前記第1のピクチャは、立体表示される画像の右眼ビュー及び左眼ビューの一方に相当し、
前記第2のピクチャは、前記画像の右眼ビュー及び左眼ビューの他方に相当する、
前記(1)〜(5)のいずれか1項に記載の画像処理装置。
(9)
前記第1のピクチャは、インターレース符号化される画像の第1のフィールドに相当し、
前記第2のピクチャは、前記画像の第2のフィールドに相当する、
前記(1)〜(5)のいずれか1項に記載の画像処理装置。
(10)
共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号することと、
復号された前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行うことと、
前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いてイントラ予測を行うことと、
を含む画像処理方法。
(11)
共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャ内の第1の予測単位についてMostProbableModeが有効かを判定する第1判定部と、
前記第1判定部による判定結果に応じて、前記第1の予測単位についてのMostProbableMode情報を前記第1のピクチャの符号化ストリーム内に符号化する第1符号化部と、
前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いて特定される参照予測モードがMostProbableModeとして有効かを判定する第2判定部と、
を備える画像処理装置。
(12)
前記MostProbableMode情報は、前記参照予測モードを有する隣接ブロックの位置を識別するインデックス情報を含む、前記(11)に記載の画像処理装置。
(13)
前記インデックス情報は、左及び上の隣接ブロック候補のうちのいずれかを識別する情報である、前記(12)に記載の画像処理装置。
(14)
前記インデックス情報は、隣接する3つ以上の隣接ブロック候補のうちのいずれかを識別する情報である、前記(12)に記載の画像処理装置。
(15)
前記MostProbableMode情報を前記第2の予測単位について再利用すべき場合に、前記MostProbableMode情報を再利用すべきことを示すパラメータを前記第2のピクチャの符号化ストリーム内に符号化する第2符号化部、をさらに備え、
前記第2符号化部は、前記パラメータが前記MostProbableMode情報を再利用すべきことを示さない場合には、前記第2のピクチャの符号化ストリーム内に前記第2の予測単位のための別個のインデックス情報を符号化する、
前記(12)〜(14)のいずれか1項に記載の画像処理装置。
(16)
前記第1のピクチャは、スケーラブル符号化される画像の第1のレイヤに相当し、
前記第2のピクチャは、前記第1のレイヤよりも上位の第2のレイヤに相当する、
前記(11)〜(15)のいずれか1項に記載の画像処理装置。
(17)
前記第1のレイヤ及び前記第2のレイヤは、空間解像度、雑音比率又はビット深度が互いに異なる、前記(16)に記載の画像処理装置。
(18)
前記第1のピクチャは、立体表示される画像の右眼ビュー及び左眼ビューの一方に相当し、
前記第2のピクチャは、前記画像の右眼ビュー及び左眼ビューの他方に相当する、
前記(11)〜(15)のいずれか1項に記載の画像処理装置。
(19)
前記第1のピクチャは、インターレース符号化される画像の第1のフィールドに相当し、
前記第2のピクチャは、前記画像の第2のフィールドに相当する、
前記(11)〜(15)のいずれか1項に記載の画像処理装置。
(20)
共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャ内の第1の予測単位についてMostProbableModeが有効かを判定することと、
前記判定の結果に応じて、前記第1の予測単位についてのMostProbableMode情報を前記第1のピクチャの符号化ストリーム内に符号化することと、
前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いて特定される参照予測モードがMostProbableModeとして有効かを判定することと、
を含む画像処理方法。
10,810 画像符号化装置(画像処理装置)
16a 第1符号化部
16b 第2符号化部
43a 第1判定部
43b 第2判定部
60,860 画像復号装置(画像処理装置)
62a 復号部
93a 第1予測部
93b 第2予測部

Claims (20)

  1. 共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号する復号部と、
    前記復号部により復号される前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行う第1予測部と、
    前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記第1予測部により使用される前記MostProbableMode情報を用いてイントラ予測を行う第2予測部と、
    を備える画像処理装置。
  2. 前記MostProbableMode情報は、MostProbableModeとして扱うべき参照予測モードを有する隣接ブロックの位置を識別するインデックス情報を含む、請求項1に記載の画像処理装置。
  3. 前記インデックス情報は、左及び上の隣接ブロック候補のうちのいずれかを識別する情報である、請求項2に記載の画像処理装置。
  4. 前記インデックス情報は、隣接する3つ以上の隣接ブロック候補のうちのいずれかを識別する情報である、請求項2に記載の画像処理装置。
  5. 前記第2予測部は、前記第2のピクチャの符号化ストリームから取得されるパラメータが前記MostProbableMode情報を再利用すべきことを示している場合に、前記MostProbableMode情報を用いてイントラ予測を行う、請求項1に記載の画像処理装置。
  6. 前記第1のピクチャは、スケーラブル符号化される画像の第1のレイヤに相当し、
    前記第2のピクチャは、前記第1のレイヤよりも上位の第2のレイヤに相当する、
    請求項1に記載の画像処理装置。
  7. 前記第1のレイヤ及び前記第2のレイヤは、空間解像度、雑音比率又はビット深度が互いに異なる、請求項6に記載の画像処理装置。
  8. 前記第1のピクチャは、立体表示される画像の右眼ビュー及び左眼ビューの一方に相当し、
    前記第2のピクチャは、前記画像の右眼ビュー及び左眼ビューの他方に相当する、
    請求項1に記載の画像処理装置。
  9. 前記第1のピクチャは、インターレース符号化される画像の第1のフィールドに相当し、
    前記第2のピクチャは、前記画像の第2のフィールドに相当する、
    請求項1に記載の画像処理装置。
  10. 共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャの符号化ストリームから、前記第1のピクチャ内の第1の予測単位についてのMostProbableMode情報を復号することと、
    復号された前記MostProbableMode情報を用いて前記第1の予測単位についてイントラ予測を行うことと、
    前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いてイントラ予測を行うことと、
    を含む画像処理方法。
  11. 共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャ内の第1の予測単位についてMostProbableModeが有効かを判定する第1判定部と、
    前記第1判定部による判定結果に応じて、前記第1の予測単位についてのMostProbableMode情報を前記第1のピクチャの符号化ストリーム内に符号化する第1符号化部と、
    前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いて特定される参照予測モードがMostProbableModeとして有効かを判定する第2判定部と、
    を備える画像処理装置。
  12. 前記MostProbableMode情報は、前記参照予測モードを有する隣接ブロックの位置を識別するインデックス情報を含む、請求項11に記載の画像処理装置。
  13. 前記インデックス情報は、左及び上の隣接ブロック候補のうちのいずれかを識別する情報である、請求項12に記載の画像処理装置。
  14. 前記インデックス情報は、隣接する3つ以上の隣接ブロック候補のうちのいずれかを識別する情報である、請求項12に記載の画像処理装置。
  15. 前記MostProbableMode情報を前記第2の予測単位について再利用すべき場合に、前記MostProbableMode情報を再利用すべきことを示すパラメータを前記第2のピクチャの符号化ストリーム内に符号化する第2符号化部、をさらに備え、
    前記第2符号化部は、前記パラメータが前記MostProbableMode情報を再利用すべきことを示さない場合には、前記第2のピクチャの符号化ストリーム内に前記第2の予測単位のための別個のインデックス情報を符号化する、
    請求項12に記載の画像処理装置。
  16. 前記第1のピクチャは、スケーラブル符号化される画像の第1のレイヤに相当し、
    前記第2のピクチャは、前記第1のレイヤよりも上位の第2のレイヤに相当する、
    請求項11に記載の画像処理装置。
  17. 前記第1のレイヤ及び前記第2のレイヤは、空間解像度、雑音比率又はビット深度が互いに異なる、請求項16に記載の画像処理装置。
  18. 前記第1のピクチャは、立体表示される画像の右眼ビュー及び左眼ビューの一方に相当し、
    前記第2のピクチャは、前記画像の右眼ビュー及び左眼ビューの他方に相当する、
    請求項11に記載の画像処理装置。
  19. 前記第1のピクチャは、インターレース符号化される画像の第1のフィールドに相当し、
    前記第2のピクチャは、前記画像の第2のフィールドに相当する、
    請求項11に記載の画像処理装置。
  20. 共通するシーンに関連付けられる2つ以上のピクチャのうちの第1のピクチャ内の第1の予測単位についてMostProbableModeが有効かを判定することと、
    前記判定の結果に応じて、前記第1の予測単位についてのMostProbableMode情報を前記第1のピクチャの符号化ストリーム内に符号化することと、
    前記2つ以上のピクチャのうちの第2のピクチャ内の前記第1の予測単位に対応する第2の予測単位について、前記MostProbableMode情報を用いて特定される参照予測モードがMostProbableModeとして有効かを判定することと、
    を含む画像処理方法。
JP2011274660A 2011-12-15 2011-12-15 画像処理装置及び画像処理方法 Withdrawn JP2013126157A (ja)

Priority Applications (14)

Application Number Priority Date Filing Date Title
JP2011274660A JP2013126157A (ja) 2011-12-15 2011-12-15 画像処理装置及び画像処理方法
BR112014013858A BR112014013858A2 (pt) 2011-12-15 2012-10-15 dispositivo e método para processamento de imagem
PCT/JP2012/076618 WO2013088833A1 (ja) 2011-12-15 2012-10-15 画像処理装置及び画像処理方法
CA 2850349 CA2850349A1 (en) 2011-12-15 2012-10-15 Image processing device and image processing method
AU2012353798A AU2012353798A1 (en) 2011-12-15 2012-10-15 Image processing device and image processing method
RU2014123205/07A RU2014123205A (ru) 2011-12-15 2012-10-15 Устройство обработки изображения и способ обработки изображения
KR20147012710A KR20140110842A (ko) 2011-12-15 2012-10-15 화상 처리 장치 및 화상 처리 방법
EP12856645.2A EP2793465A4 (en) 2011-12-15 2012-10-15 IMAGE PROCESSING DEVICE AND IMAGE PROCESSING METHOD
US14/347,657 US20140241428A1 (en) 2011-12-15 2012-10-15 Image processing device and image processing method
CN201280060389.8A CN103988507A (zh) 2011-12-15 2012-10-15 图像处理装置和图像处理方法
MX2014006764A MX2014006764A (es) 2011-12-15 2012-10-15 Dispositivo de procesamiento de imagenes y metodo de procesamiento de imagenes.
TW101142619A TW201332365A (zh) 2011-12-15 2012-11-15 影像處理裝置及影像處理方法
ZA2014/02438A ZA201402438B (en) 2011-12-15 2014-04-02 Image processing device and image processing method
IN4238CHN2014 IN2014CN04238A (ja) 2011-12-15 2014-06-06

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011274660A JP2013126157A (ja) 2011-12-15 2011-12-15 画像処理装置及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2013126157A true JP2013126157A (ja) 2013-06-24

Family

ID=48612290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011274660A Withdrawn JP2013126157A (ja) 2011-12-15 2011-12-15 画像処理装置及び画像処理方法

Country Status (14)

Country Link
US (1) US20140241428A1 (ja)
EP (1) EP2793465A4 (ja)
JP (1) JP2013126157A (ja)
KR (1) KR20140110842A (ja)
CN (1) CN103988507A (ja)
AU (1) AU2012353798A1 (ja)
BR (1) BR112014013858A2 (ja)
CA (1) CA2850349A1 (ja)
IN (1) IN2014CN04238A (ja)
MX (1) MX2014006764A (ja)
RU (1) RU2014123205A (ja)
TW (1) TW201332365A (ja)
WO (1) WO2013088833A1 (ja)
ZA (1) ZA201402438B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015133320A1 (ja) * 2014-03-05 2015-09-11 ソニー株式会社 画像符号化装置および方法
JP2015211386A (ja) * 2014-04-28 2015-11-24 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2016005210A (ja) * 2014-06-19 2016-01-12 三菱電機株式会社 端末装置及びデータ管理装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2509901A (en) * 2013-01-04 2014-07-23 Canon Kk Image coding methods based on suitability of base layer (BL) prediction data, and most probable prediction modes (MPMs)
EP3714602A4 (en) * 2017-11-21 2021-07-28 Immersive Robotics Pty Ltd IMAGE COMPRESSION FOR DIGITAL REALITY
WO2019137730A1 (en) * 2018-01-11 2019-07-18 Telefonaktiebolaget Lm Ericsson (Publ) Multiple boundary filtering
CN112073788B (zh) * 2019-06-10 2023-04-14 海信视像科技股份有限公司 视频数据处理方法、装置及显示设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1553782A3 (en) * 2002-05-28 2005-07-27 Sharp Kabushiki Kaisha Methods and systems for image intra-prediction mode estimation, communication, and organization
US20060153295A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
WO2006087319A2 (en) * 2005-02-18 2006-08-24 Thomson Licensing Method for deriving coding information for high resolution pictures from low resoluton pictures and coding and decoding devices implementing said method
JP5008664B2 (ja) * 2005-07-11 2012-08-22 トムソン ライセンシング マクロブロック適応型レイヤ間テクスチャ内予測の方法及び装置
KR100678911B1 (ko) * 2005-07-21 2007-02-05 삼성전자주식회사 방향적 인트라 예측의 적용을 확장하여 비디오 신호를인코딩하고 디코딩하는 방법 및 장치
JP5017825B2 (ja) * 2005-09-15 2012-09-05 ソニー株式会社 復号装置および復号方法
US7535383B2 (en) * 2006-07-10 2009-05-19 Sharp Laboratories Of America Inc. Methods and systems for signaling multi-layer bitstream data
US8059714B2 (en) * 2006-07-10 2011-11-15 Sharp Laboratories Of America, Inc. Methods and systems for residual layer scaling
US7885471B2 (en) * 2006-07-10 2011-02-08 Sharp Laboratories Of America, Inc. Methods and systems for maintenance and use of coded block pattern information
US7840078B2 (en) * 2006-07-10 2010-11-23 Sharp Laboratories Of America, Inc. Methods and systems for image processing control based on adjacent block characteristics
KR101306834B1 (ko) * 2008-09-22 2013-09-10 에스케이텔레콤 주식회사 인트라 예측 모드의 예측 가능성을 이용한 영상 부호화/복호화 장치 및 방법
US9225961B2 (en) * 2010-05-13 2015-12-29 Qualcomm Incorporated Frame packing for asymmetric stereo video
US9860528B2 (en) * 2011-06-10 2018-01-02 Hfi Innovation Inc. Method and apparatus of scalable video coding

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015133320A1 (ja) * 2014-03-05 2015-09-11 ソニー株式会社 画像符号化装置および方法
JPWO2015133320A1 (ja) * 2014-03-05 2017-04-06 ソニー株式会社 画像符号化装置および方法
JP2015211386A (ja) * 2014-04-28 2015-11-24 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP2016005210A (ja) * 2014-06-19 2016-01-12 三菱電機株式会社 端末装置及びデータ管理装置

Also Published As

Publication number Publication date
EP2793465A1 (en) 2014-10-22
IN2014CN04238A (ja) 2015-08-14
CA2850349A1 (en) 2013-06-20
TW201332365A (zh) 2013-08-01
RU2014123205A (ru) 2015-12-20
CN103988507A (zh) 2014-08-13
EP2793465A4 (en) 2015-07-22
ZA201402438B (en) 2014-07-30
WO2013088833A1 (ja) 2013-06-20
US20140241428A1 (en) 2014-08-28
KR20140110842A (ko) 2014-09-17
BR112014013858A2 (pt) 2017-06-13
AU2012353798A1 (en) 2014-04-03
MX2014006764A (es) 2014-08-01

Similar Documents

Publication Publication Date Title
US10785504B2 (en) Image processing device and image processing method
JP6070870B2 (ja) 画像処理装置、画像処理方法、プログラム及び記録媒体
US9749625B2 (en) Image processing apparatus and image processing method utilizing a correlation of motion between layers for encoding an image
US20130259142A1 (en) Image processing device and image processing method
WO2012005099A1 (ja) 画像処理装置及び画像処理方法
WO2013164922A1 (ja) 画像処理装置及び画像処理方法
WO2013150838A1 (ja) 画像処理装置及び画像処理方法
WO2013088833A1 (ja) 画像処理装置及び画像処理方法
WO2015053001A1 (ja) 画像処理装置及び画像処理方法
WO2013001939A1 (ja) 画像処理装置及び画像処理方法
JP5900612B2 (ja) 画像処理装置及び画像処理方法
WO2014038330A1 (ja) 画像処理装置及び画像処理方法
WO2014097913A1 (ja) 画像処理装置および方法
WO2013157308A1 (ja) 画像処理装置及び画像処理方法
WO2014148070A1 (ja) 画像処理装置及び画像処理方法
KR102197557B1 (ko) 화상 처리 장치 및 방법
WO2014097703A1 (ja) 画像処理装置及び画像処理方法
WO2013088838A1 (ja) 画像処理装置及び画像処理方法
JP2017060184A (ja) 画像処理装置及び画像処理方法
JP2016042717A (ja) 画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141021

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20150610