JP5873395B2 - 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム - Google Patents

動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム Download PDF

Info

Publication number
JP5873395B2
JP5873395B2 JP2012135117A JP2012135117A JP5873395B2 JP 5873395 B2 JP5873395 B2 JP 5873395B2 JP 2012135117 A JP2012135117 A JP 2012135117A JP 2012135117 A JP2012135117 A JP 2012135117A JP 5873395 B2 JP5873395 B2 JP 5873395B2
Authority
JP
Japan
Prior art keywords
video
encoding
decoding
component
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012135117A
Other languages
English (en)
Other versions
JP2013258651A (ja
Inventor
知伸 吉野
知伸 吉野
内藤 整
整 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012135117A priority Critical patent/JP5873395B2/ja
Priority to US14/407,877 priority patent/US20150181253A1/en
Priority to PCT/JP2013/065875 priority patent/WO2013187334A1/ja
Priority to EP13804466.4A priority patent/EP2863629A4/en
Priority to CN201380030288.0A priority patent/CN104365094B/zh
Priority to GB1422150.1A priority patent/GB2518088A/en
Publication of JP2013258651A publication Critical patent/JP2013258651A/ja
Application granted granted Critical
Publication of JP5873395B2 publication Critical patent/JP5873395B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • H04N19/895Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder in combination with error concealment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラムに関する。
従来、映像信号における画素値表現方法に関しては、YUVやRGBなどのフォーマットが定義されている。また、各フォーマットでは、色成分のサンプリング方法が定義されているとともに、色成分の表現ビット数も複数定義されている。
以降では、フォーマットやサンプリング方法やビット数の組み合わせを総称して、映像フォーマットと呼ぶこととする。この映像フォーマット間では、画素値の間引きや補間処理などにより、映像を互いに変換することが可能である。
なお、フォーマットとは、例えばYUVやRGBやLabやCMYKなどのことである。また、サンプリング方法とは、例えばYUVであれば、4:4:4や4:2:2や4:2:0のことである。また、ビット数とは、1画素あたりのビット数のことである。
一方、H.264(例えば、非特許文献1参照)に代表される映像圧縮符号化技術では、入出力映像は、所定の映像フォーマットに対応しており、用途に応じて使い分けることが可能である。また、H.264では、スケーラブル性を有する映像ストリームを生成可能なプロファイル(SVC profile)が設けられており、このプロファイルでは、例えば解像度スケーラビリティが定義されている。
Joint Video Team(JVT) of ISO/IEC MPEG and ITU-T VCEG, "Text of ISO/IEC 14496-10 Advanced Video Coding,"
H.264に代表される映像圧縮符号化技術では、映像フォーマット間のスケーラビリティが定義されていない。このため、映像フォーマットの異なる映像については、絵柄が同じであっても、映像フォーマットごとに映像ストリームを生成する必要があった。したがって、絵柄は同じだが映像フォーマットが異なる映像を、効率的に圧縮することは困難であった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、絵柄は同じだが映像フォーマットが異なる複数の映像を、効率的に圧縮することを目的とする。
本発明は、上記の課題を解決するために、以下の事項を提案している。
(1) 本発明は、入力映像に対するスケーラブル符号化が可能な動画像符号化装置であって、前記入力映像を、当該入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成する映像フォーマット変換手段と、前記映像フォーマット変換手段により前記変換後映像を生成する際に失われた情報を予測する符号化側予測手段と、前記符号化側予測手段による予測結果を用いて、前記入力映像を符号化する第1の符号化手段と、前記映像フォーマット変換手段により生成された前記変換後映像を符号化する第2の符号化手段と、前記第1の符号化手段による符号化結果と、前記第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成する多重化手段と、を備えることを特徴とする動画像符号化装置を提案している。
この発明によれば、入力映像に対するスケーラブル符号化が可能な動画像符号化装置に、映像フォーマット変換手段、符号化側予測手段、第1の符号化手段、第2の符号化手段、および多重化手段を設けた。そして、映像フォーマット変換手段により、入力映像を、入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成することとした。また、符号化側予測手段により、映像フォーマット変換手段により変換後映像を生成する際に失われた情報を予測することとした。また、第1の符号化手段により、符号化側予測手段による予測結果を用いて、入力映像を符号化することとした。また、第2の符号化手段により、映像フォーマット変換手段により生成された変換後映像を符号化することとした。また、多重化手段により、第1の符号化手段による符号化結果と、第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成することとした。
映像には、成分間で、画素値の変化について相関性があったり、対関係にあったりする。このため、これら相関性や対関係を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、上位レイヤの映像と下位レイヤの映像とで、絵柄は同じだが映像フォーマットが異なっていても、これら映像を1つの圧縮データとして効率よく圧縮できる。
(2) 本発明は、(1)の動画像符号化装置について、前記映像フォーマット変換手段(例えば、図4の色情報サンプリング部37に相当)は、前記変換後映像として、前記入力映像(例えば、図4の入力映像aに相当)のフォーマットと同じフォーマットで、かつ、当該入力映像より色情報の少ない映像フォーマットの映像(例えば、図4の下位レイヤの映像xに相当)を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(1)の動画像符号化装置において、映像フォーマット変換手段により、変換後映像として、入力映像のフォーマットと同じフォーマットで、かつ、入力映像より色情報の少ない映像フォーマットの映像を生成することとした。このため、上述の成分間での相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(3) 本発明は、(2)の動画像符号化装置について、前記第1の符号化手段(例えば、図2のエントロピー符号化部15と、図3のエントロピー符号化部25と、に相当)は、既存の標準方式によりベースレイヤの符号化を行い、前記符号化側予測手段(例えば、図2の予測値生成部12に相当)は、前記ベースレイヤの復号画像の輝度成分の画素値を用いて、前記失われた色情報を予測することを特徴とする動画像符号化装置を提案している。
この発明によれば、(2)の動画像符号化装置において、第1の符号化手段により、既存の標準方式によりベースレイヤの符号化を行い、符号化側予測手段により、ベースレイヤの復号画像の輝度成分の画素値を用いて、失われた色情報を予測することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(4) 本発明は、(3)の動画像符号化装置について、前記符号化側予測手段は、前記入力映像についての復号画像の輝度成分の画素値と、前記変換後映像についての復号画像の輝度成分の画素値と、を用いて、多項式近似に基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた色差成分の予測値を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(3)の動画像符号化装置において、符号化側予測手段により、入力映像についての復号画像の輝度成分の画素値と、変換後映像についての復号画像の輝度成分の画素値と、を用いて、多項式近似に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた色差成分の予測値を生成することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(5) 本発明は、(3)の動画像符号化装置について、前記符号化側予測手段は、前記入力映像についての復号画像の輝度成分の画素値と、前記変換後映像についての復号画像の輝度成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた色差成分の予測値を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(3)の動画像符号化装置において、符号化側予測手段により、入力映像についての復号画像の輝度成分の画素値と、変換後映像についての復号画像の輝度成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた色差成分の予測値を生成することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(6) 本発明は、(3)の動画像符号化装置について、前記符号化側予測手段は、前記入力映像についての復号画像の輝度成分の画素値と、前記変換後映像についての復号画像の輝度成分の画素値と、を用いて、非線形補間処理に基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた色差成分の予測値を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(3)の動画像符号化装置において、符号化側予測手段により、入力映像についての復号画像の輝度成分の画素値と、変換後映像についての復号画像の輝度成分の画素値と、を用いて、非線形補間処理に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた色差成分の予測値を生成することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(7) 本発明は、(1)の動画像符号化装置について、前記映像フォーマット変換手段(例えば、図11の色フォーマット変換部226に相当)は、前記変換後映像として、前記入力映像(例えば、図11の入力映像αに相当)のフォーマットと異なるフォーマットで、かつ、1画素あたりのデータ量が当該入力映像より少ない映像フォーマットの映像(例えば、図11の変換後映像θに相当)を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(1)の動画像符号化装置において、映像フォーマット変換手段により、変換後映像として、入力映像のフォーマットと異なるフォーマットで、かつ、1画素あたりのデータ量が入力映像より少ない映像フォーマットの映像を生成することとした。このため、上述の成分間での対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(8) 本発明は、(7)の動画像符号化装置について、前記第1の符号化手段(例えば、図10のエントロピー符号化部216に相当)は、既存の標準方式によりベースレイヤの符号化を行い、前記符号化側予測手段(例えば、図10の予測値生成部213に相当)は、前記ベースレイヤの復号画像を構成する複数の成分のうちの1つの画素値を用いて、前記失われた情報を予測することを特徴とする動画像符号化装置を提案している。
この発明によれば、(7)の動画像符号化装置において、第1の符号化手段により、既存の標準方式によりベースレイヤの符号化を行い、符号化側予測手段により、ベースレイヤの復号画像を構成する複数の成分のうちの1つの画素値を用いて、失われた情報を予測することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(9) 本発明は、(8)の動画像符号化装置について、前記入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分(例えば、後述のRGBフォーマットにおけるG成分に相当)と、前記変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分(例えば、後述のYUVフォーマットにおけるY成分に相当)と、は対関係にあり、前記符号化側予測手段は、前記入力映像についての復号画像の前記特定成分の画素値と、前記変換後映像についての復号画像の前記所定成分の画素値と、を用いて、多項式近似に基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(8)の動画像符号化装置において、入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分と、変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分と、が対関係にある。そして、符号化側予測手段により、入力映像についての復号画像の特定成分の画素値と、変換後映像についての復号画像の所定成分の画素値と、を用いて、多項式近似に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた成分の予測値を生成することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(10) 本発明は、(8)の動画像符号化装置について、前記入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分(例えば、後述のRGBフォーマットにおけるG成分に相当)と、前記変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分(例えば、後述のYUVフォーマットにおけるY成分に相当)と、は対関係にあり、前記符号化側予測手段は、前記入力映像についての復号画像の前記特定成分の画素値と、前記変換後映像についての復号画像の前記所定成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(8)の動画像符号化装置において、入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分と、変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分と、が対関係にある。そして、符号化側予測手段により、入力映像についての復号画像の特定成分の画素値と、変換後映像についての復号画像の所定成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた成分の予測値を生成することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(11) 本発明は、(8)の動画像符号化装置について、前記入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分(例えば、後述のRGBフォーマットにおけるG成分に相当)と、前記変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分(例えば、後述のYUVフォーマットにおけるY成分に相当)と、は対関係にあり、前記符号化側予測手段は、前記入力映像についての復号画像の前記特定成分の画素値と、前記変換後映像についての復号画像の前記所定成分の画素値と、を用いて、非線形補間処理に基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする動画像符号化装置を提案している。
この発明によれば、(8)の動画像符号化装置において、入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分と、変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分と、が対関係にある。そして、符号化側予測手段により、入力映像についての復号画像の特定成分の画素値と、変換後映像についての復号画像の所定成分の画素値と、を用いて、非線形補間処理に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた成分の予測値を生成することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(12) 本発明は、(1)〜(6)のいずれかの動画像符号化装置で生成された圧縮データ(例えば、図5の圧縮ストリームbに相当)に対するスケーラブル復号が可能な動画像復号装置であって、前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す逆多重化手段と、前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する復号手段と、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する復号側予測手段と、前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第1の映像出力手段と、前記復号手段により復号された映像に基づいて、前記変換後映像を求める第2の映像出力手段と、を備えることを特徴とする動画像復号装置を提案している。
この発明によれば、(1)〜(6)のいずれかの動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置に、逆多重化手段、復号手段、復号側予測手段、第1の映像出力手段、および第2の映像出力手段を設けた。そして、逆多重化手段により、圧縮データから、映像の符号化結果を映像フォーマットごとに取り出すこととした。また、復号手段により、逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号することとした。また、復号側予測手段により、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた情報を予測することとした。また、第1の映像出力手段により、復号手段により復号された映像と、復号側予測手段による予測結果と、を用いて、入力映像を求めることとした。また、第2の映像出力手段により、復号手段により復号された映像に基づいて、変換後映像を求めることとした。
映像には、成分間で、画素値の変化について相関性がある場合がある。このため、この相関性を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、1つの圧縮データから、絵柄は同じだが互いに映像フォーマットの異なる映像を復号できる。
(13) 本発明は、(12)の動画像復号装置について、前記復号手段(例えば、図6のエントロピー復号部111や、図7のエントロピー復号部121や、図8のエントロピー復号部131に相当)は、既存の標準方式により符号化されたベースレイヤの符号化結果の復号と、前記逆多重化手段(例えば、図5のストリームDEMUX部140に相当)により取り出された符号化結果のうち当該ベースレイヤとは異なるエンハンスメントレイヤの符号化結果の復号と、を行い、前記復号側予測手段(例えば、図6の予測値生成部114に相当)は、前記ベースレイヤの復号画像の輝度成分の画素値を用いて、前記失われた色情報を予測することを特徴とする動画像復号装置を提案している。
この発明によれば、(12)の動画像復号装置において、復号手段により、既存の標準方式により符号化されたベースレイヤの符号化結果の復号と、逆多重化手段により取り出された符号化結果のうちベースレイヤとは異なるエンハンスメントレイヤの符号化結果の復号と、を行うこととした。また、復号側予測手段により、ベースレイヤの復号画像の輝度成分の画素値を用いて、失われた色情報を予測することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(14) 本発明は、(13)の動画像復号装置について、前記復号側予測手段は、前記ベースレイヤの復号画像の輝度成分の画素値と、前記エンハンスメントレイヤの復号画像の輝度成分の画素値と、を用いて、多項式近似に基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた色差成分の予測値を生成することを特徴とする動画像復号装置を提案している。
この発明によれば、(13)の動画像復号装置において、復号側予測手段により、ベースレイヤの復号画像の輝度成分の画素値と、エンハンスメントレイヤの復号画像の輝度成分の画素値と、を用いて、多項式近似に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた色差成分の予測値を生成することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(15) 本発明は、(13)の動画像復号装置について、前記復号側予測手段は、前記ベースレイヤの復号画像の輝度成分の画素値と、前記エンハンスメントレイヤの復号画像の輝度成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた色差成分の予測値を生成することを特徴とする動画像復号装置を提案している。
この発明によれば、(13)の動画像復号装置において、復号側予測手段により、ベースレイヤの復号画像の輝度成分の画素値と、エンハンスメントレイヤの復号画像の輝度成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた色差成分の予測値を生成することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(16) 本発明は、(13)の動画像復号装置について、前記復号側予測手段は、前記ベースレイヤの復号画像の輝度成分の画素値と、前記エンハンスメントレイヤの復号画像の輝度成分の画素値と、を用いて、非線形補間処理に基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた色差成分の予測値を生成することを特徴とする動画像復号装置を提案している。
この発明によれば、(13)の動画像復号装置において、復号側予測手段により、ベースレイヤの復号画像の輝度成分の画素値と、エンハンスメントレイヤの復号画像の輝度成分の画素値と、を用いて、非線形補間処理に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた色差成分の予測値を生成することとした。このため、輝度と色情報との相関性を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(17) 本発明は、(1)、(7)〜(11)のいずれかの動画像符号化装置で生成された圧縮データ(例えば、図12の圧縮ストリームβに相当)に対するスケーラブル復号が可能な動画像復号装置であって、前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す逆多重化手段と、前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する復号手段と、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する復号側予測手段と、前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第1の映像出力手段と、前記復号手段により復号された映像に基づいて、前記変換後映像を求める第2の映像出力手段と、を備えることを特徴とする動画像復号装置を提案している。
この発明によれば、(1)、(7)〜(11)のいずれかの動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置に、逆多重化手段、復号手段、復号側予測手段、第1の映像出力手段、および第2の映像出力手段を設けた。そして、逆多重化手段により、圧縮データから、映像の符号化結果を映像フォーマットごとに取り出すこととした。また、復号手段により、逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号することとした。また、復号側予測手段により、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた情報を予測することとした。また、第1の映像出力手段により、復号手段により復号された映像と、復号側予測手段による予測結果と、を用いて、入力映像を求めることとした。また、第2の映像出力手段により、復号手段により復号された映像に基づいて、変換後映像を求めることとした。
映像には、成分間で対関係がある場合がある。このため、この対関係を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、1つの圧縮データから、絵柄は同じだが互いに映像フォーマットの異なる映像を復号できる。
(18) 本発明は、(17)の動画像復号装置について、前記復号手段(例えば、図13のエントロピー復号部311や、図14のエントロピー復号部321に相当)は、既存の標準方式により符号化されたベースレイヤの符号化結果の復号と、前記逆多重化手段(例えば、図12のストリームDEMUX部330に相当)により取り出された符号化結果のうち当該ベースレイヤとは異なるエンハンスメントレイヤの符号化結果の復号と、を行い、前記復号側予測手段(例えば、図13の予測値生成部315に相当)は、前記ベースレイヤの復号画像の前記特定成分の画素値を用いて、前記失われた情報を予測することを特徴とする動画像復号装置を提案している。
この発明によれば、(17)の動画像復号装置において、復号手段により、既存の標準方式により符号化されたベースレイヤの符号化結果の復号と、逆多重化手段により取り出された符号化結果のうちベースレイヤとは異なるエンハンスメントレイヤの符号化結果の復号と、を行うこととした。また、復号側予測手段により、ベースレイヤの復号画像の特定成分の画素値を用いて、失われた情報を予測することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(19) 本発明は、(18)の動画像復号装置について、前記復号側予測手段は、前記ベースレイヤの復号画像の前記特定成分の画素値と、前記エンハンスメントレイヤの復号画像の前記所定成分の画素値と、を用いて、多項式近似に基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする動画像復号装置を提案している。
この発明によれば、(18)の動画像復号装置において、復号側予測手段により、ベースレイヤの復号画像の特定成分の画素値と、エンハンスメントレイヤの復号画像の所定成分の画素値と、を用いて、多項式近似に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた成分の予測値を生成することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(20) 本発明は、(18)の動画像復号装置について、前記復号側予測手段は、前記ベースレイヤの復号画像の前記特定成分の画素値と、前記エンハンスメントレイヤの復号画像の前記所定成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする動画像復号装置を提案している。
この発明によれば、(18)の動画像復号装置において、復号側予測手段により、ベースレイヤの復号画像の特定成分の画素値と、エンハンスメントレイヤの復号画像の所定成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた成分の予測値を生成することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(21) 本発明は、(18)の動画像復号装置について、前記復号側予測手段は、前記ベースレイヤの復号画像の前記特定成分の画素値と、前記エンハンスメントレイヤの復号画像の前記所定成分の画素値と、を用いて、非線形補間処理に基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする動画像復号装置を提案している。
この発明によれば、(18)の動画像復号装置において、復号側予測手段により、ベースレイヤの復号画像の特定成分の画素値と、エンハンスメントレイヤの復号画像の所定成分の画素値と、を用いて、非線形補間処理に基づき、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた成分の予測値を生成することとした。このため、例えばYUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分と、のように、予め定められた成分間にある対関係を用いて、色成分間予測に基づくレイヤ間予測を行って、上述した効果と同様の効果を奏することができる。
(22) 本発明は、映像フォーマット変換手段、符号化側予測手段、第1の符号化手段、第2の符号化手段、および多重化手段を備え、入力映像に対するスケーラブル符号化が可能な動画像符号化装置における動画像符号化方法であって、前記映像フォーマット変換手段が、前記入力映像を、当該入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成する第1のステップと、前記符号化側予測手段が、前記映像フォーマット変換手段により前記変換後映像を生成する際に失われた情報を予測する第2のステップと、前記第1の符号化手段が、前記符号化側予測手段による予測結果を用いて、前記入力映像を符号化する第3のステップと、前記第2の符号化手段が、前記映像フォーマット変換手段により変換された映像を符号化する第4のステップと、前記多重化手段が、前記第1の符号化手段による符号化結果と、前記第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成する第5のステップと、を備えることを特徴とする動画像符号化方法を提案している。
この発明によれば、映像フォーマット変換手段により、入力映像を、入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成することとした。また、符号化側予測手段により、映像フォーマット変換手段により変換後映像を生成する際に失われた情報を予測することとした。また、第1の符号化手段により、符号化側予測手段による予測結果を用いて、入力映像を符号化することとした。また、第2の符号化手段により、映像フォーマット変換手段により変換された映像を符号化することとした。また、多重化手段により、第1の符号化手段による符号化結果と、第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成することとした。
映像には、成分間で、画素値の変化について相関性があったり、対関係にあったりする。このため、これら相関性や対関係を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、上位レイヤの映像と下位レイヤの映像とで、絵柄は同じだが映像フォーマットが異なっていても、これら映像を1つの圧縮データとして効率よく圧縮できる。
(23) 本発明は、逆多重化手段、復号手段、復号側予測手段、第1の映像出力手段、および第2の映像出力手段を備え、(22)の動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置における動画像復号方法であって、前記逆多重化手段が、前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す第6のステップと、前記復号手段が、前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する第7のステップと、前記復号側予測手段が、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する第8のステップと、前記第1の映像出力手段が、前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第9のステップと、前記第2の映像出力手段が、前記復号手段により復号された映像に基づいて、前記変換後映像を求める第10のステップと、を備えることを特徴とする動画像復号方法を提案している。
この発明によれば、逆多重化手段により、圧縮データから、映像の符号化結果を映像フォーマットごとに取り出すこととした。また、復号手段により、逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号することとした。また、復号側予測手段により、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた情報を予測することとした。また、第1の映像出力手段により、復号手段により復号された映像と、復号側予測手段による予測結果と、を用いて、入力映像を求めることとした。また、第2の映像出力手段により、復号手段により復号された映像に基づいて、変換後映像を求めることとした。
映像には、成分間で、画素値の変化について相関性があったり、対関係があったりする。このため、これら相関性や対関係を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、1つの圧縮データから、絵柄は同じだが互いに映像フォーマットの異なる映像を復号できる。
(24) 本発明は、映像フォーマット変換手段、符号化側予測手段、第1の符号化手段、第2の符号化手段、および多重化手段を備え、入力映像に対するスケーラブル符号化が可能な動画像符号化装置における動画像符号化方法を、コンピュータに実行させるためのプログラムであって、前記映像フォーマット変換手段が、前記入力映像を、当該入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成する第1のステップと、前記符号化側予測手段が、前記映像フォーマット変換手段により前記変換後映像を生成する際に失われた情報を予測する第2のステップと、前記第1の符号化手段が、前記符号化側予測手段による予測結果を用いて、前記入力映像を符号化する第3のステップと、前記第2の符号化手段が、前記映像フォーマット変換手段により変換された映像を符号化する第4のステップと、前記多重化手段が、前記第1の符号化手段による符号化結果と、前記第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成する第5のステップと、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、映像フォーマット変換手段により、入力映像を、入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成することとした。また、符号化側予測手段により、映像フォーマット変換手段により変換後映像を生成する際に失われた情報を予測することとした。また、第1の符号化手段により、符号化側予測手段による予測結果を用いて、入力映像を符号化することとした。また、第2の符号化手段により、映像フォーマット変換手段により変換された映像を符号化することとした。また、多重化手段により、第1の符号化手段による符号化結果と、第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成することとした。
映像には、成分間で、画素値の変化について相関性があったり、対関係にあったりする。このため、これら相関性や対関係を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、上位レイヤの映像と下位レイヤの映像とで、絵柄は同じだが映像フォーマットが異なっていても、これら映像を1つの圧縮データとして効率よく圧縮できる。
(25) 本発明は、逆多重化手段、復号手段、復号側予測手段、第1の映像出力手段、および第2の映像出力手段を備え、(24)の動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置における動画像復号方法を、コンピュータに実行させるためのプログラムであって、前記逆多重化手段が、前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す第6のステップと、前記復号手段が、前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する第7のステップと、前記復号側予測手段が、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する第8のステップと、前記第1の映像出力手段が、前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第9のステップと、前記第2の映像出力手段が、前記復号手段により復号された映像に基づいて、前記変換後映像を求める第10のステップと、をコンピュータに実行させるためのプログラムを提案している。
この発明によれば、逆多重化手段により、圧縮データから、映像の符号化結果を映像フォーマットごとに取り出すこととした。また、復号手段により、逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号することとした。また、復号側予測手段により、映像フォーマット変換手段により入力映像から変換後映像を生成した際に失われた情報を予測することとした。また、第1の映像出力手段により、復号手段により復号された映像と、復号側予測手段による予測結果と、を用いて、入力映像を求めることとした。また、第2の映像出力手段により、復号手段により復号された映像に基づいて、変換後映像を求めることとした。
映像には、成分間で、画素値の変化について相関性があったり、対関係があったりする。このため、これら相関性や対関係を用いて、色成分間予測に基づくレイヤ間予測を行うことで、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。したがって、1つの圧縮データから、絵柄は同じだが互いに映像フォーマットの異なる映像を復号できる。
本発明によれば、絵柄は同じだが映像フォーマットが異なる複数の映像を、効率的に圧縮できる。
本発明の第1実施形態に係る動画像符号化装置の構成を示すブロック図である。 前記動画像符号化装置が備える第1の上位レイヤ符号化部の構成を示すブロック図である。 前記動画像符号化装置が備える第2の上位レイヤ符号化部の構成を示すブロック図である。 前記動画像符号化装置が備える下位レイヤ符号化部の構成を示すブロック図である。 本発明の第1実施形態に係る動画像復号装置の構成を示すブロック図である。 前記動画像復号装置が備える第1の上位レイヤ復号部の構成を示すブロック図である。 前記動画像復号装置が備える第2の上位レイヤ復号部の構成を示すブロック図である。 前記動画像復号装置が備える下位レイヤ復号部の構成を示すブロック図である。 本発明の第2実施形態に係る動画像符号化装置の構成を示すブロック図である。 前記動画像符号化装置が備える上位レイヤ符号化部の構成を示すブロック図である。 前記動画像符号化装置が備える下位レイヤ符号化部の構成を示すブロック図である。 本発明の第2実施形態に係る動画像復号装置の構成を示すブロック図である。 前記動画像復号装置が備える上位レイヤ復号部の構成を示すブロック図である。 前記動画像復号装置が備える下位レイヤ復号部の構成を示すブロック図である。
以下、本発明の実施の形態について図面を参照しながら説明する。なお、以下の実施形態における構成要素は適宜、既存の構成要素などとの置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、以下の実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1実施形態>
[動画像符号化装置AAの構成および動作]
図1は、本発明の第1実施形態に係る動画像符号化装置AAの構成を示すブロック図である。動画像符号化装置AAは、入力された入力映像aから、2つの映像フォーマットの映像を生成し、1つの映像ストリームに多重化して、圧縮ストリームbとして出力する。
なお、本実施形態では、入力映像aとして、YUV4:4:4フォーマットの映像が入力されるものとする。また、本実施形態では、2つの映像フォーマットの映像として、YUV4:4:4フォーマットの映像(上位レイヤ)と、YUV4:2:2フォーマットの映像またはYUV4:2:0フォーマットの映像(下位レイヤ)と、を動画像符号化装置AAが生成するものとする。このため、下位レイヤの映像は、入力映像aのフォーマットと同じフォーマットで、かつ、入力映像aより色情報の少ない映像フォーマットの映像となる。
また、本実施形態では、ベースレイヤのデコード画素値を用いて、エンハンスメントレイヤの予測符号化を行うものとする。ベースレイヤの情報としては、デコード画素値しか用いないため、ベースレイヤの符号化には既存の標準方式(例えば、H.264やMPEG−2など)を用いることができる。
動画像符号化装置AAは、第1の上位レイヤ符号化部10、第2の上位レイヤ符号化部20、下位レイヤ符号化部30、およびストリームMUX部40を備える。
ストリームMUX部40は、第1の上位レイヤ符号化部10から出力される後述の上位レイヤのUV成分に関する符号化情報cと、第2の上位レイヤ符号化部20から出力される後述の上位レイヤのY成分に関する符号化情報dと、下位レイヤ符号化部30から出力される後述の下位レイヤの符号化情報eと、を入力とする。このストリームMUX部40は、これら入力された情報を、標準規格などで予め定められた方法に従って1つの圧縮ストリームbに多重化し、出力する。
(第1の上位レイヤ符号化部10の構成および動作)
図2は、第1の上位レイヤ符号化部10の構成を示すブロック図である。第1の上位レイヤ符号化部10は、色情報スケーラブル予測部11、予測値生成部12、DCT/量子化部13、逆DCT/逆量子化部14、エントロピー符号化部15、およびローカルメモリ16を備える。
色情報スケーラブル予測部11は、第2の上位レイヤ符号化部20から出力される後述の上位レイヤのY成分のローカルデコード映像fと、下位レイヤ符号化部30から出力される後述の下位レイヤのローカルデコード映像gと、を入力とする。この色情報スケーラブル予測部11は、上位レイヤのY成分のデコード画素値の情報、および、下位レイヤのY成分のデコード画素値の情報を用いて、線形処理、補間フィルタ処理、または非線形処理により上位レイヤのUV成分の予測値hを生成し、出力する。
まず、色情報スケーラブル予測部11が上述の線形処理を行う場合について、説明する。この場合、色情報スケーラブル予測部11は、処理画素を中心としたこの処理画素近傍のS×T画素(Sは、S≧1を満たす整数であり、Tは、T≧1を満たす整数)のY成分の画素値を、多項式により線形的に近似表現する。そして、得られた多項式をこれら処理画素近傍のS×T画素のUV成分の画素値に適用して、処理画素のUV成分の予測値hを得る。
次に、色情報スケーラブル予測部11が上述の補間フィルタ処理を行う場合について、説明する。この場合、色情報スケーラブル予測部11は、処理画素を中心としたこの処理画素近傍のS×T画素のY成分の画素について、処理画素のY成分の画素値の誤差が最小となるフィルタ係数を算出する。そして、得られたフィルタ係数を、処理画素近傍のS×T画素のUV成分の画素値に適用して、処理画素のUV成分の予測値hを得る。
次に、色情報スケーラブル予測部11が上述の非線形処理を行う場合について、説明する。この場合、色情報スケーラブル予測部11は、処理画素を中心としたこの処理画素近傍のS×T画素のY成分の画素値に基づいて、メディアフィルタやランクフィルタなどの非線形処理により処理画素のY成分の予測値を生成し、処理画素におけるY成分の画素値と予測値との差分値を求める。また、処理画素を中心としたこの処理画素近傍のS×T画素のUV成分の画素値に基づいて、メディアフィルタやランクフィルタなどの非線形処理により処理画素のUV成分の予測値を生成する。そして、Y成分の画素値と予測値との差分値についてY成分とUV成分との表示ビット深度に基づいてスケーリングした値を求め、UV成分の予測値と、スケーリングした値と、を加算して、処理画素のUV成分の予測値hとする。
予測値生成部12は、入力映像aのUV成分と、上位レイヤのUV成分の予測値hと、ローカルメモリ16から出力される後述の上位レイヤのUV成分のローカルデコード映像iと、を入力とする。この予測値生成部12は、これら入力された情報を用いて、予め定められた予測方法のうち符号化効率の最も良い予測方法により、予測値jを生成する。そして、予測値jを出力するとともに、予測値jを生成するのに利用した予測方法を示す情報を、予測情報kとして出力する。
DCT/量子化部13は、入力映像aと予測値jとの差分情報を、入力とする。このDCT/量子化部13は、入力された差分情報に対してDCTを施し、DCT係数を量子化して、量子化されたDCT係数mとして出力する。
逆DCT/逆量子化部14は、量子化されたDCT係数mを入力とする。この逆DCT/逆量子化部14は、入力された量子化されたDCT係数mを逆量子化し、逆量子化した係数を逆DCTして、逆DCTおよび逆量子化された差分情報nとして出力する。
エントロピー符号化部15は、量子化されたDCT係数mと、予測情報kと、を入力とする。このエントロピー符号化部15は、入力された情報について、可変長符号化法または算術符号化法により符号化し、上位レイヤのUV成分に関する符号化情報cとして出力する。
ローカルメモリ16は、ローカルデコード映像を入力とする。ローカルメモリ16に入力されるローカルデコード映像とは、予測値jと、逆DCTおよび逆量子化された差分情報nと、の加算情報のことである。このローカルメモリ16は、入力されたローカルデコード映像を蓄積し、上位レイヤのUV成分のローカルデコード映像iとして適宜出力する。
(第2の上位レイヤ符号化部20の構成および動作)
図3は、第2の上位レイヤ符号化部20の構成を示すブロック図である。第2の上位レイヤ符号化部20は、予測値生成部22、DCT/量子化部23、逆DCT/逆量子化部24、エントロピー符号化部25、およびローカルメモリ26を備える。
予測値生成部22は、入力映像aのY成分と、ローカルメモリ26から出力される後述の上位レイヤのY成分のローカルデコード映像fと、下位レイヤ符号化部30から出力される後述の下位レイヤのローカルデコード映像gと、を入力とする。この予測値生成部22は、これら入力された情報を用いて、予め定められた予測方法のうち符号化効率の最も良い予測方法により、予測値pを生成する。そして、予測値pを出力するとともに、予測値pを生成するのに利用した予測方法を示す情報を、予測情報qとして出力する。
DCT/量子化部23は、入力映像aと予測値pとの差分情報を、入力とする。このDCT/量子化部23は、入力された差分情報に対してDCTを施し、DCT係数を量子化して、量子化されたDCT係数rとして出力する。
逆DCT/逆量子化部24は、量子化されたDCT係数rを入力とする。この逆DCT/逆量子化部24は、入力された量子化されたDCT係数rを逆量子化し、逆量子化した係数を逆DCTして、逆DCTおよび逆量子化された差分情報sとして出力する。
エントロピー符号化部25は、量子化されたDCT係数rと、予測情報qと、を入力とする。このエントロピー符号化部25は、入力された情報について、可変長符号化法または算術符号化法により符号化し、上位レイヤのY成分に関する符号化情報dとして出力する。
ローカルメモリ26は、ローカルデコード映像を入力とする。ローカルメモリ26に入力されるローカルデコード映像とは、予測値pと、逆DCTおよび逆量子化された差分情報sと、の加算情報のことである。このローカルメモリ26は、入力されたローカルデコード映像を蓄積し、上位レイヤのY成分のローカルデコード映像fとして適宜出力する。
(下位レイヤ符号化部30の構成および動作)
図4は、下位レイヤ符号化部30の構成を示すブロック図である。下位レイヤ符号化部30は、予測値生成部32、DCT/量子化部33、逆DCT/逆量子化部34、エントロピー符号化部35、ローカルメモリ36、および色情報サンプリング部37を備える。
色情報サンプリング部37は、入力映像aを入力とする。この色情報サンプリング部37は、入力映像aに対して色情報をサブサンプルした映像を生成し、下位レイヤの映像xとして出力する。具体的には、本実施形態では、上述のように入力映像aがYUV4:4:4フォーマットの映像であるため、色情報サンプリング部37は、下位レイヤの映像xとして、YUV4:2:2フォーマットの映像またはYUV4:2:0フォーマットの映像を出力する。
予測値生成部32は、下位レイヤの映像xと、ローカルメモリ36から出力される後述の下位レイヤのローカルデコード映像gと、を入力とする。この予測値生成部32は、これら入力された情報を用いて、予め定められた予測方法のうち符号化効率の最も良い予測方法により、予測値tを生成する。そして、予測値tを出力するとともに、予測値tを生成するのに利用した予測方法を示す情報を、予測情報uとして出力する。
DCT/量子化部33は、下位レイヤの映像xと予測値tとの差分情報を、入力とする。このDCT/量子化部33は、入力された差分情報に対してDCTを施し、DCT係数を量子化して、量子化されたDCT係数vとして出力する。
逆DCT/逆量子化部34は、量子化されたDCT係数vを入力とする。この逆DCT/逆量子化部34は、入力された量子化されたDCT係数vを逆量子化し、逆量子化した係数を逆DCTして、逆DCTおよび逆量子化された差分情報wとして出力する。
エントロピー符号化部35は、量子化されたDCT係数vと、予測情報uと、を入力とする。このエントロピー符号化部35は、入力された情報について、可変長符号化法または算術符号化法により符号化し、下位レイヤの符号化情報eとして出力する。
ローカルメモリ36は、ローカルデコード映像を入力とする。ローカルメモリ36に入力されるローカルデコード映像とは、予測値tと、逆DCTおよび逆量子化された差分情報wと、の加算情報のことである。このローカルメモリ36は、入力されたローカルデコード映像を蓄積し、下位レイヤのローカルデコード映像gとして適宜出力する。
[動画像復号装置BBの構成および動作]
図5は、本発明の第1実施形態に係る動画像復号装置BBの構成を示すブロック図である。動画像復号装置BBは、動画像符号化装置AAにおいて生成された圧縮ストリームbを復号して、上位レイヤ出力映像Aおよび下位レイヤ出力映像Bを生成する。この動画像復号装置BBは、第1の上位レイヤ復号部110、第2の上位レイヤ復号部120、下位レイヤ復号部130、およびストリームDEMUX部140を備える。上位レイヤ出力映像Aは、第1の上位レイヤ復号部110から出力される後述の上位レイヤのUV成分に関するデコード画像A1と、第2の上位レイヤ復号部120から出力される後述の上位レイヤのY成分に関するデコード画像A2と、で構成される。
ストリームDEMUX部140は、圧縮ストリームbを入力とする。このストリームDEMUX部140は、圧縮ストリームbから、上位レイヤの符号化情報と、下位レイヤの符号化情報と、を取り出す。そして、上位レイヤのUV成分に関する符号化情報Cを第1の上位レイヤ復号部110に出力し、上位レイヤのY成分に関する符号化情報Dを第2の上位レイヤ復号部120に出力し、下位レイヤの符号化情報Eを下位レイヤ復号部130に出力する。
(第1の上位レイヤ復号部110の構成および動作)
図6は、第1の上位レイヤ復号部110の構成を示すブロック図である。第1の上位レイヤ復号部110は、エントロピー復号部111、色情報スケーラブル予測部112、逆DCT/逆量子化部113、予測値生成部114、およびローカルメモリ115を備える。
エントロピー復号部111は、上位レイヤのUV成分に関する符号化情報Cを入力とする。このエントロピー復号部111は、可変長符号化法または算術符号化法に基づいて符号化情報Cを復号し、差分情報Hおよび予測情報Jを取り出して出力する。
色情報スケーラブル予測部112は、第2の上位レイヤ復号部120から出力される後述の上位レイヤのY成分のデコード画像Fと、下位レイヤ復号部130から出力される後述の下位レイヤのデコード画像Gと、を入力とする。この色情報スケーラブル予測部112は、図2に示した色情報スケーラブル予測部11と同様に、上位レイヤのY成分のデコード画素値の情報、および、下位レイヤのY成分のデコード画素値の情報を用いて、線形処理、補間フィルタ処理、または非線形処理により上位レイヤのUV成分の予測値Kを生成し、出力する。
逆DCT/逆量子化部113は、差分情報Hを入力とする。この差分情報Hは、量子化されたDCT係数である。この逆DCT/逆量子化部113は、差分情報Hを逆量子化し、その結果に対して逆DCTを施して、逆量子化および逆DCTされた差分情報Lとして出力する。
予測値生成部114は、予測情報Jと、上位レイヤのUV成分の予測値Kと、ローカルメモリ115から出力される後述の上位レイヤのUV成分のデコード画像Mと、を入力とする。この予測値生成部114は、予測情報Jに従った予測方法により、予測値Kおよびデコード画像Mを用いて予測値Nを生成し、出力する。
ローカルメモリ115は、上位レイヤのUV成分に関するデコード画像A1を入力とする。この上位レイヤのUV成分に関するデコード画像A1とは、差分情報Lと、予測値Nと、の加算情報のことである。このローカルメモリ115は、上位レイヤのUV成分に関するデコード画像A1を蓄積し、上位レイヤのUV成分のデコード画像Mとして適宜出力する。
(第2の上位レイヤ復号部120の構成および動作)
図7は、第2の上位レイヤ復号部120の構成を示すブロック図である。第2の上位レイヤ復号部120は、エントロピー復号部121、逆DCT/逆量子化部123、予測値生成部124、およびローカルメモリ125を備える。
エントロピー復号部121は、上位レイヤのY成分に関する符号化情報Dを入力とする。このエントロピー復号部121は、可変長符号化法または算術符号化法に基づいて符号化情報Dを復号し、差分情報Pおよび予測情報Qを取り出して出力する。
逆DCT/逆量子化部123は、差分情報Pを入力とする。この差分情報Pは、量子化されたDCT係数である。この逆DCT/逆量子化部123は、差分情報Pを逆量子化し、その結果に対して逆DCTを施して、逆量子化および逆DCTされた差分情報Rとして出力する。
予測値生成部124は、予測情報Qと、下位レイヤのデコード画像Gと、ローカルメモリ125から出力される後述の上位レイヤのY成分のデコード画像Fと、を入力とする。この予測値生成部124は、予測情報Qに従った予測方法により、デコード画像F、Gを用いて予測値Sを生成し、出力する。
ローカルメモリ125は、上位レイヤのY成分に関するデコード画像A2を入力とする。この上位レイヤのY成分に関するデコード画像A2とは、差分情報Rと、予測値Sと、の加算情報のことである。このローカルメモリ125は、上位レイヤのY成分に関するデコード画像A2を蓄積し、上位レイヤのY成分のデコード画像Fとして適宜出力する。
(下位レイヤ復号部130の構成および動作)
図8は、下位レイヤ復号部130の構成を示すブロック図である。下位レイヤ復号部130は、エントロピー復号部131、逆DCT/逆量子化部133、予測値生成部134、およびローカルメモリ135を備える。
エントロピー復号部131は、下位レイヤの符号化情報Eを入力とする。このエントロピー復号部131は、可変長符号化法または算術符号化法に基づいて符号化情報Eを復号し、差分情報Tおよび予測情報Uを取り出して出力する。
逆DCT/逆量子化部133は、差分情報Tを入力とする。この差分情報Tは、量子化されたDCT係数である。この逆DCT/逆量子化部133は、差分情報Tを逆量子化し、その結果に対して逆DCTを施して、逆量子化および逆DCTされた差分情報Vとして出力する。
予測値生成部134は、予測情報Uと、ローカルメモリ135から出力される後述の下位レイヤのデコード画像Gと、を入力とする。この予測値生成部134は、予測情報Uに従った予測方法により、デコード画像Gを用いて予測値Wを生成し、出力する。
ローカルメモリ135は、下位レイヤの出力映像Bを入力とする。この下位レイヤの出力映像Bとは、差分情報Vと、予測値Wと、の加算情報のことである。このローカルメモリ135は、下位レイヤの出力映像Bを蓄積し、下位レイヤのデコード画像Gとして適宜出力する。
以上の動画像符号化装置AAによれば、以下の効果を奏することができる。
映像には、輝度と色情報との間で、画素値の変化について相関性があることが知られている。そこで、動画像符号化装置AAは、輝度と色情報との間の相関性を用いて、色成分間予測に基づくレイヤ間予測を行う。これによれば、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。このため、上位レイヤの映像(YUV4:4:4フォーマットの映像)と下位レイヤの映像(YUV4:2:2フォーマットまたはYUV4:2:0フォーマットの映像)とで、絵柄は同じだが映像フォーマットが異なっていても、これら映像を1つの圧縮ストリームbとして効率よく圧縮できる。したがって、例えば、下位レイヤを放送用の映像フォーマットとし、上位レイヤを素材用の映像フォーマットとして、両者を効率よく圧縮できる。
なお、動画像符号化装置AAは、レイヤ間で映像フォーマットが同一な色成分についても、上位レイヤにおいて、下位レイヤでの劣化を補償する情報を付与すること(SNRスケーラビリティ)が可能である。
また、以上の動画像復号装置BBによれば、以下の効果を奏することができる。
動画像復号装置BBは、輝度と色情報との間の相関性を用いて、色成分間予測に基づくレイヤ間予測を行う。これによれば、下位レイヤの映像を用いて上位レイヤの色情報を高精度に予測できる。このため、1つの圧縮ストリームbから、上位レイヤ出力映像Aおよび下位レイヤ出力映像Bという互いに映像フォーマットの異なる映像を復号できる。
<第2実施形態>
[動画像符号化装置CCの構成および動作]
図9は、本発明の第2実施形態に係る動画像符号化装置CCの構成を示すブロック図である。動画像符号化装置CCは、入力された入力映像αから、2つの映像フォーマットの映像を生成し、1つの映像ストリームに多重化して、圧縮ストリームβとして出力する。
なお、本実施形態では、入力映像αとして、RGBフォーマットの映像が入力され、2つの映像フォーマットの映像として、RGBフォーマットの映像(上位レイヤ)と、YUV(4:2:0)フォーマットの映像(下位レイヤ)と、を動画像符号化装置CCが生成するものとする。このため、下位レイヤの映像は、入力映像αのフォーマットと異なるフォーマットで、かつ、1画素あたりのデータ量が入力映像αより少ない映像フォーマットとの映像となる。
また、本実施形態では、上位レイヤの表現ビット数と、下位レイヤの表現ビット数とは、同一であるものとする。
動画像符号化装置CCは、上位レイヤ符号化部210、下位レイヤ符号化部220、およびストリームMUX部230を備える。
ストリームMUX部230は、上位レイヤ符号化部210から出力される後述の上位レイヤの符号化情報γと、下位レイヤ符号化部220から出力される後述の下位レイヤの符号化情報δと、を入力とする。このストリームMUX部230は、これら入力された情報を、標準規格などで予め定められた方法に従って1つの圧縮ストリームβに多重化し、出力する。
(上位レイヤ符号化部210の構成および動作)
図10は、上位レイヤ符号化部210の構成を示すブロック図である。上位レイヤ符号化部210は、色フォーマット変換部211、色予測値生成部212、予測値生成部213、DCT/量子化部214、逆DCT/逆量子化部215、エントロピー符号化部216、およびローカルメモリ217を備える。
予測値生成部213、DCT/量子化部214、逆DCT/逆量子化部215、エントロピー符号化部216、およびローカルメモリ217は、それぞれ、図2に示した予測値生成部12、DCT/量子化部13、逆DCT/逆量子化部14、エントロピー符号化部15、およびローカルメモリ16と同様に動作する。
色フォーマット変換部211は、下位レイヤのローカルデコード映像εを入力とする。ここで、下位レイヤのローカルデコード映像εは、YUVフォーマットの映像である。そこで、色フォーマット変換部211は、下位レイヤのローカルデコード映像εのY成分、U成分、およびV成分のそれぞれの画素値の重み付け和により、R成分、G成分、およびB成分のそれぞれの画素値を得て、RGBフォーマットの変換後映像ζとして出力する。
色予測値生成部212は、変換後映像ζを入力とする。この色予測値生成部212は、RGBの各成分のうちの1つを基準として、残りの2成分の予測値を生成する。
ここで、YUVフォーマットとRGBフォーマットとでは、Y成分とG成分とが視覚的に重要な成分であることが知られており、これらY成分とG成分とは、略同等の情報量を持つ。すなわち、Y成分とG成分とは、対関係にある。そこで、本実施形態では、G成分を基準とするものとする。すると、色予測値生成部212は、G成分を、図2に示した色情報スケーラブル予測部11のY成分として、色情報スケーラブル予測部11でUV成分の予測値hを生成するのと同様の方法で、RB成分を予測する。そして、上位レイヤにおける基準色成分(G成分)と、残りの成分(RB成分)の予測値と、を予測値ηとして出力とする。
(下位レイヤ符号化部220の構成および動作)
図11は、下位レイヤ符号化部220の構成を示すブロック図である。下位レイヤ符号化部220は、予測値生成部221、DCT/量子化部222、逆DCT/逆量子化部223、エントロピー符号化部224、ローカルメモリ225、および色フォーマット変換部226を備える。
予測値生成部221、DCT/量子化部222、逆DCT/逆量子化部223、エントロピー符号化部224、およびローカルメモリ225は、それぞれ、図4に示した予測値生成部32、DCT/量子化部33、逆DCT/逆量子化部34、エントロピー符号化部35、およびローカルメモリ36と同様に動作する。
色フォーマット変換部226は、入力映像αを入力とする。ここで、入力映像αは、RGBフォーマットの映像である。そこで、色フォーマット変換部226は、入力映像αのR成分、G成分、およびB成分のそれぞれの画素値の重み付け和により、Y成分、U成分、およびV成分のそれぞれの画素値を得て、YUVフォーマットの変換後映像θとして出力する。
[動画像復号装置DDの構成および動作]
図12は、本発明の第2実施形態に係る動画像復号装置DDの構成を示すブロック図である。動画像復号装置DDは、動画像符号化装置CCにおいて生成された圧縮ストリームβを復号して、上位レイヤ出力映像κおよび下位レイヤ出力映像λを生成する。この動画像復号装置DDは、上位レイヤ復号部310、下位レイヤ復号部320、およびストリームDEMUX部330を備える。
ストリームDEMUX部330は、圧縮ストリームβを入力とする。このストリームDEMUX部330は、圧縮ストリームβから、上位レイヤの符号化情報νと、下位レイヤの符号化情報ξと、を取り出す。そして、上位レイヤの符号化情報νを上位レイヤ復号部310に出力し、下位レイヤの符号化情報ξを下位レイヤ復号部320に出力する。
(上位レイヤ復号部310の構成および動作)
図13は、上位レイヤ復号部310の構成を示すブロック図である。上位レイヤ復号部310は、エントロピー復号部311、色フォーマット変換部312、色予測値生成部313、逆DCT/逆量子化部314、予測値生成部315、およびローカルメモリ316を備える。
エントロピー復号部311、逆DCT/逆量子化部314、予測値生成部315、およびローカルメモリ316は、それぞれ、図6に示したエントロピー復号部111、逆DCT/逆量子化部113、予測値生成部114、およびローカルメモリ115と同様に動作する。
色フォーマット変換部312は、下位レイヤ復号部320から出力される後述の下位レイヤのデコード画像μを入力とする。ここで、下位レイヤのデコード画像μは、YUVフォーマットの映像である。そこで、色フォーマット変換部312は、下位レイヤのデコード画像μのY成分、U成分、およびV成分のそれぞれの画素値の重み付け和により、R成分、G成分、およびB成分のそれぞれの画素値を得て、RGBフォーマットの下位レイヤのデコード画像πとして出力する。
色予測値生成部313は、下位レイヤのデコード画像πを入力とする。この色予測値生成部313は、図10に示した色予測値生成部212と同様に、色予測値の生成を行う。そして、下位レイヤにおける基準色成分(G成分)と、残りの成分(RB成分)の予測値と、を予測値ρとして出力とする。
(下位レイヤ復号部320の構成および動作)
図14は、下位レイヤ復号部320の構成を示すブロック図である。下位レイヤ復号部320は、エントロピー復号部321、逆DCT/逆量子化部322、予測値生成部323、およびローカルメモリ324を備える。
エントロピー復号部321、逆DCT/逆量子化部322、予測値生成部323、およびローカルメモリ324は、それぞれ、図8に示したエントロピー復号部131、逆DCT/逆量子化部133、予測値生成部134、およびローカルメモリ135と同様に動作する。
以上の動画像符号化装置CCによれば、以下の効果を奏することができる。
上述のように、YUVフォーマットにおけるY成分と、RGBフォーマットにおけるG成分とは、対関係にある。そこで、動画像符号化装置CCは、Y成分とG成分との対関係を用いて、色成分間予測に基づくレイヤ間予測を行う。これによれば、下位レイヤの映像を用いて上位レイヤの映像を高精度に予測できる。このため、上位レイヤの映像(RGBフォーマットの映像)と下位レイヤの映像(YUVフォーマットの映像)とで、絵柄は同じだが映像フォーマットが異なっていても、これら映像を1つの圧縮ストリームβとして効率よく圧縮できる。したがって、例えば、下位レイヤを放送用の映像フォーマットとし、上位レイヤを素材用の映像フォーマットとして、両者を効率よく圧縮できる。
なお、動画像符号化装置CCは、レイヤ間で映像フォーマットが同一な色成分についても、上位レイヤにおいて、下位レイヤでの劣化を補償する情報を付与すること(SNRスケーラビリティ)が可能である。
また、以上の動画像復号装置DDによれば、以下の効果を奏することができる。
動画像復号装置DDは、Y成分とG成分との対関係を用いて、色成分間予測に基づくレイヤ間予測を行う。これによれば、下位レイヤの映像を用いて上位レイヤの映像を高精度に予測できる。このため、1つの圧縮ストリームβから、上位レイヤ出力映像κおよび下位レイヤ出力映像λという互いに映像フォーマットの異なる映像を復号できる。
なお、本発明の動画像符号化装置AA、CCや動画像復号装置BB、DDの処理を、コンピュータ読み取り可能な非一時的な記録媒体に記録し、この記録媒体に記録されたプログラムを動画像符号化装置AA、CCや動画像復号装置BB、DDに読み込ませ、実行することによって、本発明を実現できる。
ここで、上述の記録媒体には、例えば、EPROMやフラッシュメモリといった不揮発性のメモリ、ハードディスクといった磁気ディスク、CD−ROMなどを適用できる。また、この記録媒体に記録されたプログラムの読み込みおよび実行は、動画像符号化装置AA、CCや動画像復号装置BB、DDに設けられたプロセッサによって行われる。
また、上述のプログラムは、このプログラムを記憶装置などに格納した動画像符号化装置AA、CCや動画像復号装置BB、DDから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネットなどのネットワーク(通信網)や電話回線などの通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上述のプログラムは、上述の機能の一部を実現するためのものであってもよい。さらに、上述の機能を動画像符号化装置AA、CCや動画像復号装置BB、DDにすでに記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計なども含まれる。
例えば、上述の第1実施形態では、入力映像aとして、YUV4:4:4フォーマットの映像が入力されるものとしたが、これに限らず、例えば、YUV4:2:2フォーマットの映像が入力されてもよい。YUV4:2:2フォーマットの映像が入力映像aとして入力される場合には、図4の色情報サンプリング部37は、YUV4:2:0フォーマットの映像を生成することになる。
また、上述の第1実施形態では、上位レイヤと下位レイヤとの2階層が存在する場合について説明したが、これに限らず、例えば、3階層や4階層が存在する場合にも本発明を適用できる。3階層以上が存在する場合であっても、上述の第1実施形態と同様に、下位のレイヤから逐次的に上位のレイヤの符号化や復号を行えばよい。
また、上述の第1実施形態において、入力映像aのY成分と、下位レイヤのローカルデコード映像gのY成分と、の差分が予め定められた閾値より小さい場合に、予測値生成部22は、入力映像aと同じ値を予測値pとして出力してもよい。これによれば、Y成分について、下位レイヤのローカルデコード映像gの画質が十分に良ければ、下位レイヤのローカルデコード映像gが、上位レイヤのY成分として置き換えられることになる。そして、DCT/量子化部23に入力される入力映像aと予測値pとの差分情報がゼロになり、エントロピー符号化部25では予測情報qのみが符号化されることになる。また、生成される圧縮ストリームbに対して、後述する動画像復号装置BBで追加情報や特別な処理が不要になる。
また、上述の第2実施形態では、上位レイヤの表現ビット数と、下位レイヤの表現ビット数と、は同一であるものとしたが、これに限らず、異なるものであってもよい。例えば、下位レイヤから上位レイヤを予測する際に表現ビット数を増加させることで、上位レイヤのビット数が下位レイヤのビット数を包含する映像フォーマット階層構造において、表現ビット数のスケーラビリティを実現できる。
また、上述の第1実施形態ではYUVフォーマットの映像について説明し、第2実施形態ではRGBフォーマットの映像とYUVフォーマットの映像とについて説明した。しかしながら、これに限らず、LabやCMYKなどの他の色空間との間のスケーラビリティについても、本発明を適用できる。
10・・・第1の上位レイヤ符号化部
20・・・第2の上位レイヤ符号化部
30、220・・・下位レイヤ符号化部
40、230・・・ストリームMUX部
110・・・第1の上位レイヤ復号部
120・・・第2の上位レイヤ復号部
130、320・・・下位レイヤ復号部
140、330・・・ストリームDEMUX部
210・・・上位レイヤ符号化部
310・・・上位レイヤ復号部
AA、CC・・・動画像符号化装置
BB、DD・・・動画像復号装置

Claims (13)

  1. 入力映像に対するスケーラブル符号化が可能な動画像符号化装置であって、
    前記入力映像を、当該入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成する映像フォーマット変換手段と、
    前記映像フォーマット変換手段により前記変換後映像を生成する際に失われた情報を予測する符号化側予測手段と、
    前記符号化側予測手段による予測結果を用いて、前記入力映像を符号化する第1の符号化手段と、
    前記映像フォーマット変換手段により生成された前記変換後映像を符号化する第2の符号化手段と、
    前記第1の符号化手段による符号化結果と、前記第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成する多重化手段と、を備え
    前記映像フォーマット変換手段は、前記変換後映像として、前記入力映像のフォーマットと異なるフォーマットで、かつ、1画素あたりのデータ量が当該入力映像より少ない映像フォーマットの映像を生成し、
    前記符号化側予測手段は、ベースレイヤの復号画像を構成する複数の成分のうちの1つの画素値を用いて、前記失われた情報を予測し、
    前記第1の符号化手段は、既存の標準方式により前記ベースレイヤの符号化を行うことを特徴とする動画像符号化装置。
  2. 前記入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分と、前記変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分と、は対関係にあり、
    前記符号化側予測手段は、前記入力映像についての復号画像の前記特定成分の画素値と、前記変換後映像についての復号画像の前記所定成分の画素値と、を用いて、多項式近似に基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする請求項に記載の動画像符号化装置。
  3. 前記入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分と、前記変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分と、は対関係にあり、
    前記符号化側予測手段は、前記入力映像についての復号画像の前記特定成分の画素値と、前記変換後映像についての復号画像の前記所定成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする請求項に記載の動画像符号化装置。
  4. 前記入力映像についての復号画像を構成する複数の成分のうちの1つである特定成分と、前記変換後映像についての復号画像を構成する複数の成分のうちの1つである所定成分と、は対関係にあり、
    前記符号化側予測手段は、前記入力映像についての復号画像の前記特定成分の画素値と、前記変換後映像についての復号画像の前記所定成分の画素値と、を用いて、非線形補間処理に基づき、前記映像フォーマット変換手段により当該入力映像から当該変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする請求項に記載の動画像符号化装置。
  5. 請求項1から4のいずれかの動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置であって、
    前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す逆多重化手段と、
    前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する復号手段と、
    前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する復号側予測手段と、
    前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第1の映像出力手段と、
    前記復号手段により復号された映像に基づいて、前記変換後映像を求める第2の映像出力手段と、を備えることを特徴とする動画像復号装置。
  6. 前記復号手段は、既存の標準方式により符号化されたベースレイヤの符号化結果の復号と、前記逆多重化手段により取り出された符号化結果のうち当該ベースレイヤとは異なるエンハンスメントレイヤの符号化結果の復号と、を行い、
    前記復号側予測手段は、前記ベースレイヤの復号画像を構成する複数の成分のうちの1つである特定成分の画素値を用いて、前記失われた情報を予測することを特徴とする請求項に記載の動画像復号装置。
  7. 前記復号側予測手段は、前記ベースレイヤの復号画像の前記特定成分の画素値と、前記エンハンスメントレイヤの復号画像を構成する複数の成分のうちの1つである所定成分の画素値と、を用いて、多項式近似に基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする請求項に記載の動画像復号装置。
  8. 前記復号側予測手段は、前記ベースレイヤの復号画像の前記特定成分の画素値と、前記エンハンスメントレイヤの復号画像を構成する複数の成分のうちの1つである所定成分の画素値と、を用いて、処理画素値の誤差が最小となる補間フィルタに基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする請求項に記載の動画像復号装置。
  9. 前記復号側予測手段は、前記ベースレイヤの復号画像の前記特定成分の画素値と、前記エンハンスメントレイヤの復号画像を構成する複数の成分のうちの1つである所定成分の画素値と、を用いて、非線形補間処理に基づき、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた成分の予測値を生成することを特徴とする請求項に記載の動画像復号装置。
  10. 映像フォーマット変換手段、符号化側予測手段、第1の符号化手段、第2の符号化手段、および多重化手段を備え、入力映像に対するスケーラブル符号化が可能な動画像符号化装置における動画像符号化方法であって、
    前記映像フォーマット変換手段が、前記入力映像を、当該入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成する第1のステップと、
    前記符号化側予測手段が、前記映像フォーマット変換手段により前記変換後映像を生成する際に失われた情報を予測する第2のステップと、
    前記第1の符号化手段が、前記符号化側予測手段による予測結果を用いて、前記入力映像を符号化する第3のステップと、
    前記第2の符号化手段が、前記映像フォーマット変換手段により変換された映像を符号化する第4のステップと、
    前記多重化手段が、前記第1の符号化手段による符号化結果と、前記第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成する第5のステップと、を備え
    前記第1のステップでは、前記映像フォーマット変換手段が、前記変換後映像として、前記入力映像のフォーマットと異なるフォーマットで、かつ、1画素あたりのデータ量が当該入力映像より少ない映像フォーマットの映像を生成し、
    前記第2のステップでは、前記符号化側予測手段が、ベースレイヤの復号画像を構成する複数の成分のうちの1つの画素値を用いて、前記失われた情報を予測し、
    前記第3のステップでは、前記第1の符号化手段が、既存の標準方式により前記ベースレイヤの符号化を行うことを特徴とする動画像符号化方法。
  11. 逆多重化手段、復号手段、復号側予測手段、第1の映像出力手段、および第2の映像出力手段を備え、請求項10の動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置における動画像復号方法であって、
    前記逆多重化手段が、前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す第6のステップと、
    前記復号手段が、前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する第7のステップと、
    前記復号側予測手段が、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する第8のステップと、
    前記第1の映像出力手段が、前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第9のステップと、
    前記第2の映像出力手段が、前記復号手段により復号された映像に基づいて、前記変換後映像を求める第10のステップと、を備えることを特徴とする動画像復号方法。
  12. 映像フォーマット変換手段、符号化側予測手段、第1の符号化手段、第2の符号化手段、および多重化手段を備え、入力映像に対するスケーラブル符号化が可能な動画像符号化装置における動画像符号化方法を、コンピュータに実行させるためのプログラムであって、
    前記映像フォーマット変換手段が、前記入力映像を、当該入力映像の映像フォーマットとは異なる映像フォーマットの映像に変換して、変換後映像を生成する第1のステップと、
    前記符号化側予測手段が、前記映像フォーマット変換手段により前記変換後映像を生成する際に失われた情報を予測する第2のステップと、
    前記第1の符号化手段が、前記符号化側予測手段による予測結果を用いて、前記入力映像を符号化する第3のステップと、
    前記第2の符号化手段が、前記映像フォーマット変換手段により変換された映像を符号化する第4のステップと、
    前記多重化手段が、前記第1の符号化手段による符号化結果と、前記第2の符号化手段による符号化結果と、を多重化して、映像フォーマットに関するスケーラビリティを有する圧縮データを生成する第5のステップと、をコンピュータに実行させ
    前記第1のステップでは、前記映像フォーマット変換手段が、前記変換後映像として、前記入力映像のフォーマットと異なるフォーマットで、かつ、1画素あたりのデータ量が当該入力映像より少ない映像フォーマットの映像を生成し、
    前記第2のステップでは、前記符号化側予測手段が、ベースレイヤの復号画像を構成する複数の成分のうちの1つの画素値を用いて、前記失われた情報を予測し、
    前記第3のステップでは、前記第1の符号化手段が、既存の標準方式により前記ベースレイヤの符号化を行うためのプログラム。
  13. 逆多重化手段、復号手段、復号側予測手段、第1の映像出力手段、および第2の映像出力手段を備え、請求項12の動画像符号化装置で生成された圧縮データに対するスケーラブル復号が可能な動画像復号装置における動画像復号方法を、コンピュータに実行させるためのプログラムであって、
    前記逆多重化手段が、前記圧縮データから、映像の符号化結果を映像フォーマットごとに取り出す第6のステップと、
    前記復号手段が、前記逆多重化手段により取り出された映像フォーマットごとの符号化結果を復号する第7のステップと、
    前記復号側予測手段が、前記映像フォーマット変換手段により前記入力映像から前記変換後映像を生成した際に失われた情報を予測する第8のステップと、
    前記第1の映像出力手段が、前記復号手段により復号された映像と、前記復号側予測手段による予測結果と、を用いて、前記入力映像を求める第9のステップと、
    前記第2の映像出力手段が、前記復号手段により復号された映像に基づいて、前記変換後映像を求める第10のステップと、をコンピュータに実行させるためのプログラム。
JP2012135117A 2012-06-14 2012-06-14 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム Expired - Fee Related JP5873395B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2012135117A JP5873395B2 (ja) 2012-06-14 2012-06-14 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
US14/407,877 US20150181253A1 (en) 2012-06-14 2013-06-07 Video encoding apparatus, video decoding apparatus, video encoding method, video decoding method, and computer program
PCT/JP2013/065875 WO2013187334A1 (ja) 2012-06-14 2013-06-07 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
EP13804466.4A EP2863629A4 (en) 2012-06-14 2013-06-07 VIDEO ENCODING DEVICE, VIDEO DECODING DEVICE, VIDEO ENCODING METHOD, VIDEO DECODING METHOD, AND PROGRAM
CN201380030288.0A CN104365094B (zh) 2012-06-14 2013-06-07 动画图像编码装置、动画图像解码装置、动画图像编码方法、动画图像解码方法以及程序
GB1422150.1A GB2518088A (en) 2012-06-14 2013-06-07 Video encoding device, video decoding device, video encoding method, video decoding method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012135117A JP5873395B2 (ja) 2012-06-14 2012-06-14 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2013258651A JP2013258651A (ja) 2013-12-26
JP5873395B2 true JP5873395B2 (ja) 2016-03-01

Family

ID=49758157

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012135117A Expired - Fee Related JP5873395B2 (ja) 2012-06-14 2012-06-14 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム

Country Status (6)

Country Link
US (1) US20150181253A1 (ja)
EP (1) EP2863629A4 (ja)
JP (1) JP5873395B2 (ja)
CN (1) CN104365094B (ja)
GB (1) GB2518088A (ja)
WO (1) WO2013187334A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10536710B2 (en) 2012-06-27 2020-01-14 Intel Corporation Cross-layer cross-channel residual prediction
CA2933563C (en) * 2013-12-27 2022-02-22 Sony Corporation Image processing apparatus and method
JP6233121B2 (ja) * 2014-03-17 2017-11-22 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US10904534B2 (en) * 2016-04-19 2021-01-26 Dolby Laboratories Licensing Corporation Enhancement layer masking for high-dynamic range video coding
CN112689197B (zh) * 2019-10-18 2022-07-08 腾讯科技(深圳)有限公司 一种文件格式转换方法、装置、以及计算机存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3703088B2 (ja) * 2001-06-08 2005-10-05 日本ビクター株式会社 拡張画像符号化装置及び拡張画像復号化装置
WO2004045217A1 (en) * 2002-11-13 2004-05-27 Koninklijke Philips Electronics N.V. Transmission system with colour depth scalability
US20050129130A1 (en) * 2003-12-10 2005-06-16 Microsoft Corporation Color space coding framework
US20050259729A1 (en) * 2004-05-21 2005-11-24 Shijun Sun Video coding with quality scalability
KR100657268B1 (ko) * 2004-07-15 2006-12-14 학교법인 대양학원 컬러 영상의 신축적 부호화, 복호화 방법 및 장치
CN101589625B (zh) * 2006-10-25 2011-09-21 弗劳恩霍夫应用研究促进协会 质量可缩放编码
KR20080114388A (ko) * 2007-06-27 2008-12-31 삼성전자주식회사 스케일러블 영상 부호화장치 및 방법과 그 영상 복호화장치및 방법

Also Published As

Publication number Publication date
US20150181253A1 (en) 2015-06-25
CN104365094B (zh) 2018-05-18
CN104365094A (zh) 2015-02-18
GB2518088A (en) 2015-03-11
WO2013187334A1 (ja) 2013-12-19
EP2863629A4 (en) 2015-12-02
JP2013258651A (ja) 2013-12-26
EP2863629A1 (en) 2015-04-22

Similar Documents

Publication Publication Date Title
CN111869212B (zh) 视频解码方法、装置和可读介质
JP7271683B2 (ja) エンコーダ、デコーダ、および対応するイントラ予測方法
TWI544787B (zh) 當跳過轉換時用於有損寫碼之內部預測模式
JP6065095B2 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
CN104813667B (zh) 用于可伸缩视频编码的帧间层预测方法及装置
JP4908180B2 (ja) 動画像符号化装置
JP2022520944A (ja) 変換スキップモードとブロック差分パルスコード変調の改善された残差コーディング
CN101467461B (zh) 基于多层的视频编码方法及其装置
JP6333942B2 (ja) ビデオ情報のスケーラブルコード化のための装置及び方法
JP2017216698A (ja) ビデオビットストリームをトランスコーディングする方法及び構成
CN101601299A (zh) 用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备
JP2008536440A (ja) ビデオ信号のスケーラブルなエンコーディング方法およびデコーディング方法
JP6409516B2 (ja) ピクチャ符号化プログラム、ピクチャ符号化方法及びピクチャ符号化装置
JP5873395B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
WO2012017945A1 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
JP5768180B2 (ja) 画像復号方法及び画像復号装置
JP2012517178A (ja) 多視点映像の符号化及び復号化のための装置及び方法
WO2015091360A1 (en) Method for coding a sequence of pictures and method for decoding a bitstream and corresponding devices
JP5800362B2 (ja) 動画像送出装置、動画像受信装置、動画像伝送システム、動画像送出方法、動画像受信方法、およびプログラム
WO2010055675A1 (ja) 動画像符号化装置及び動画像復号装置
CN113748678B (zh) 视频编解码方法、装置和存储介质
JP5878792B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
WO2013035358A1 (ja) 動画像符号化装置およびその方法、ならびに動画像復号装置およびその方法
CN115702566A (zh) 基于子层级别信息的图像编码/解码方法和设备及存储比特流的记录介质
JP2008270974A (ja) 動画像符号化装置及び動画像復号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160115

R150 Certificate of patent or registration of utility model

Ref document number: 5873395

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees