JPWO2017191749A1

JPWO2017191749A1 - 画像処理装置及び画像処理方法

Info

Publication number: JPWO2017191749A1
Application number: JP2018515418A
Authority: JP
Inventors: 拓郎川合; 健一郎細川; 圭祐千田; 央二中神; 隆浩永野
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2016-05-02
Filing date: 2017-04-18
Publication date: 2019-03-07
Also published as: EP3454557A4; US20190124327A1; CN109076217A; EP3454557A1; EP3684056A1; KR20190003497A; WO2017191749A1

Abstract

本技術は、S/N及び圧縮効率を改善することができるようにする画像処理装置及び画像処理方法に関する。
予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像が生成される。フィルタ処理では、第１の画像の処理対象画素に対応する第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、第１の画像から選択し、処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類し、学習により求められた、複数のクラスごとの、予測演算に用いられるタップ係数のうちの、処理対象画素のクラスのタップ係数と、処理対象画素の予測タップとを用いた予測演算を行うことにより、対応画素の画素値を求める。本技術は、例えば、画像の符号化装置や復号装置に適用できる。

Description

本技術は、画像処理装置及び画像処理方法に関し、特に、例えば、画像のS/N及び圧縮効率を、大きく改善することができるようにする画像処理装置及び画像処理方法に関する。

予測符号化方式の１つである、例えば、HEVC(High Efficiency Video Coding)では、ILF(In Loop Filter)が提案された。また、ポストHEVC（HEVCの次の世代の予測符号化方式）では、ILFを採用することが予想される。

ILFとしては、ブロックノイズを低減するためのDF(Deblocking Filter)、リンギングを低減するためのSAO(Sample Adaptive Offset)、符号化誤差（復号画像の、元画像に対する誤差）を最小化するためのALF(Adaptive Loop Filter)がある。

ALFについては、特許文献１に記載され、SAOについては、特許文献２に記載されている。

特許第5485983号公報特表2014-523183号公報

現在提案されているILFとしてのDFや、SAO、ALFは、フィルタ強度の自由度が低く、フィルタ強度の細かい制御を行うことが困難であるため、画像のS/N(Signal to Noise Ratio)（SN比）(SNR)及び圧縮効率を、大きく改善することが困難である。

本技術は、このような状況に鑑みてなされたものであり、画像のS/N及び圧縮効率を、大きく改善することができるようにするものである。

本技術の画像処理装置は、予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するフィルタ処理部を備え、前記フィルタ処理部は、前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択する予測タップ選択部と、前記処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類するクラス分類部と、前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部とを有する画像処理装置である。

本技術の画像処理方法は、予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するステップを含み、前記フィルタ処理は、前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することと、前記処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類することと、前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得することと、前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求めることとを含む画像処理方法である。

本技術の画像処理装置及び画像処理方法においては、予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理が行われ、前記予測画像の予測に用いられる第２の画像が生成される。フィルタ処理では、前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素が、前記第１の画像から選択されるとともに、前記処理対象画素が、複数のクラスのうちのいずれかのクラスにクラス分類される。そして、前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数が取得され、前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値が求められる。

なお、画像処理装置は、独立した装置であっても良いし、１つの装置を構成している内部ブロックであっても良い。

また、画像処理装置は、コンピュータにプログラムを実行させることにより実現することができる。プログラムは、伝送媒体を介して、伝送することにより、又は、記録媒体に記録して、提供することができる。

本技術によれば、画像のS/N及び圧縮効率を、大きく改善することができる。

なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。

本技術を適用した画像処理システムの一実施の形態の構成例を示す図である。クラス分類適応処理を行う画像変換装置の第１の構成例を示すブロック図である。係数取得部２４に記憶されるタップ係数の学習を行う学習装置の構成例を示すブロック図である。学習部３３の構成例を示すブロック図である。クラス分類適応処理を行う画像変換装置の第２の構成例を示すブロック図である。係数取得部２４に記憶される種係数の学習を行う学習装置の構成例を示すブロック図である。学習部６３の構成例を示すブロック図である。学習部６３の他の構成例を示すブロック図である。符号化装置１１の第１の構成例を示すブロック図である。クラス分類適応フィルタ１１１の構成例を示すブロック図である。画像変換装置１３１の構成例を示すブロック図である。クラス分類部２３で行われるクラス分類の例を説明する図である。学習装置１３２の構成例を示すブロック図である。符号化装置１１の符号化処理の例を説明するフローチャートである。ステップＳ２５で行われるクラス分類適応処理の例を説明するフローチャートである。復号装置１２の第１の構成例を示すブロック図である。クラス分類適応フィルタ２０６の構成例を示すブロック図である。画像変換装置２３１の構成例を示すブロック図である。復号装置１２の復号処理の例を説明するフローチャートである。ステップＳ７０で行われるクラス分類適応処理の例を説明するフローチャートである。クラス分類適応処理と、ILFのうちのALFとの、クラス分類、及び、フィルタ処理の相違を説明する図である。クラス分類適応処理と、ILFのうちのALFとのクラス分類、及び、フィルタ処理の相違により生じる効果の相違を説明する図である。クラス分類適応処理の予測タップ及びクラスタップと、ILFのうちのALFのフィルタ係数に対する画素との相違を説明する図である。学習により得られるタップ係数を削減する削減方法の例を説明する図である。符号化装置１１の第２の構成例を示すブロック図である。復号装置１２の第２の構成例を示すブロック図である。符号化装置１１の第３の構成例を示すブロック図である。復号装置１２の第３の構成例を示すブロック図である。符号化装置１１の第４の構成例を示すブロック図である。復号装置１２の第４の構成例を示すブロック図である。付加クラスの概要を説明する図である。符号化装置１１の第５の構成例を示すブロック図である。クラス分類適応フィルタ４１１の構成例を示すブロック図である。画像変換装置４３１の構成例を示すブロック図である。クラス分類部４４１の構成例を示すブロック図である。学習装置４３２の構成例を示すブロック図である。符号化装置１１の符号化処理の例を説明するフローチャートである。ステップＳ１２５で行われるクラス分類適応処理の例を説明するフローチャートである。復号装置１２の第５の構成例を示すブロック図である。クラス分類適応フィルタ４７１の構成例を示すブロック図である。画像変換装置４８１の構成例を示すブロック図である。クラス分類部４９１の構成例を示すブロック図である。復号装置１２の復号処理の例を説明するフローチャートである。ステップＳ１７０で行われるクラス分類適応処理の例を説明するフローチャートである。クラスの縮退を説明する図である。符号化装置１１の第６の構成例を示すブロック図である。クラス分類適応フィルタ５１１の構成例を示すブロック図である。画像変換装置５３１の構成例を示すブロック図である。クラス分類部５４１の構成例を示すブロック図である。学習装置５３２の構成例を示すブロック図である。符号化装置１１の符号化処理の例を説明するフローチャートである。ステップＳ２２５で行われるクラス分類適応処理の例を説明するフローチャートである。復号装置１２の第６の構成例を示すブロック図である。クラス分類適応フィルタ５７１の構成例を示すブロック図である。画像変換装置５８１の構成例を示すブロック図である。クラス分類部５９１の構成例を示すブロック図である。復号装置１２の復号処理の例を説明するフローチャートである。ステップＳ２７０で行われるクラス分類適応処理の例を説明するフローチャートである。クラス分類係数の学習の概要を説明する図である。クラス分類係数を用いたクラス分類の概要を説明する図である。クラス分類係数の学習を行う学習装置の構成例を示すブロック図である。学習装置が行う学習処理の例を説明するフローチャートである。クラス分類にクラス分類係数を用いるクラス分類適応処理を行う画像変換装置の構成例を示すブロック図である。クラス分類部７２１の構成例を示すブロック図である。クラス分類部７２１で行われる、クラス分類係数を用いたクラス分類の処理の例を説明するフローチャートである。符号化装置１１の第７の構成例を示すブロック図である。クラス分類適応フィルタ８１１の構成例を示すブロック図である。画像変換装置８３１の構成例を示すブロック図である。クラス分類部８４１の構成例を示すブロック図である。学習装置８３２の構成例を示すブロック図である。符号化装置１１の符号化処理の例を説明するフローチャートである。ステップＳ４２５で行われるクラス分類適応処理の例を説明するフローチャートである。復号装置１２の第７の構成例を示すブロック図である。クラス分類適応フィルタ８６１の構成例を示すブロック図である。画像変換装置８７１の構成例を示すブロック図である。復号装置１２の復号処理の例を説明するフローチャートである。ステップＳ４７０で行われるクラス分類適応処理の例を説明するフローチャートである。学習装置８３２の他の構成例を示すブロック図である。 ILFとして、クラス分類適応処理によりILFの処理を行うクラス分類適応フィルタを設けた場合と、ALFを設けた場合とのRD(Rate-Distortion)曲線を示す図である。多視点画像符号化方式の例を示す図である。本技術を適用した多視点画像符号化装置の主な構成例を示す図である。本技術を適用した多視点画像復号装置の主な構成例を示す図である。階層画像符号化方式の例を示す図である。本技術を適用した階層画像符号化装置の主な構成例を示す図である。本技術を適用した階層画像復号装置の主な構成例を示す図である。コンピュータの主な構成例を示すブロック図である。テレビジョン装置の概略的な構成の一例を示すブロック図である。携帯電話機の概略的な構成の一例を示すブロック図である。記録再生装置の概略的な構成の一例を示すブロック図である。撮像装置の概略的な構成の一例を示すブロック図である。ビデオセットの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の一例を示すブロック図である。ビデオプロセッサの概略的な構成の他の例を示すブロック図である。

＜本技術を適用した画像処理システム＞

図１は、本技術を適用した画像処理システムの一実施の形態の構成例を示す図である。

図１において、画像処理システムは、符号化装置１１及び復号装置１２を有する。

符号化装置１１には、符号化対象の元画像が供給される。

符号化装置１１は、例えば、HEVCやAVC(Advanced Video Coding)等のような予測符号化により、元画像を符号化する。

符号化装置１１の予測符号化では、元画像の予測画像が生成され、元画像と予測画像との残差が符号化される。

さらに、符号化装置１１の予測符号化では、予測符号化の残差と予測画像とを加算することにより得られる復号途中画像に、ILFをかけるILF処理を行うことで、予測画像の予測に用いられる参照画像が生成される。

ここで、ILF処理としてのフィルタ処理（フィルタリング）が、復号途中画像に施されることにより得られる画像を、フィルタ後画像ともいう。

符号化装置１１は、予測符号化を行う他、復号途中画像と元画像とを用いて学習を行うことにより、フィルタ後画像が、なるべく元画像に近くなるようなILF処理としてのフィルタ処理を行うためのフィルタ情報を求める。

符号化装置１１のILF処理は、学習により求められたフィルタ情報を用いて行われる。

ここで、フィルタ情報を求める学習は、例えば、元画像の１又は複数のシーケンスごとや、元画像の１又は複数のシーン（シーンチェンジから、次のシーンチェンジまでのフレーム）ごと、元画像の１又は複数のフレーム（ピクチャ）ごと、元画像の１又は複数のスライスごと、ピクチャの符号化の単位のブロックの１又は複数ラインごと、その他任意の単位で行うことができる。また、フィルタ情報を求める学習は、例えば、残差が閾値以上になった場合に行うことができる。

符号化装置１１は、元画像の予測符号化により得られる符号化データ、及び、学習により得られるフィルタ情報を、伝送媒体１３を介して伝送し、又は、記録媒体１４に伝送して記録させる。

なお、フィルタ情報を求める学習は、符号化装置１１とは別の装置で行うことができる。

また、フィルタ情報は、符号化データとは別に伝送することもできるし、符号化データに含めて伝送することもできる。

さらに、フィルタ情報を求める学習は、元画像そのもの（及び元画像から得られる復号途中画像）を用いて行う他、画像特徴量が元画像と類似する、元画像とは別個の画像を用いて行うことができる。

復号装置１２は、符号化装置１１から伝送される符号化データ及びフィルタ情報を、伝送媒体１３や記録媒体１４を介して受け取り（受信し）（取得し）、符号化データを、符号化装置１１の予測符号化に対応する方式で復号する。

すなわち、復号装置１２は、符号化装置１１からの符号化データを処理することで、予測符号化の残差を求める。さらに、復号装置１２は、残差と予測画像とを加算することにより、符号化装置１１で得られるのと同様の復号途中画像を求める。そして、復号装置１２は、復号途中画像に、符号化装置１１からのフィルタ情報を用いたILF処理としてのフィルタ処理を施し、フィルタ後画像を求める。

復号装置１２において、フィルタ後画像は、元画像の復号画像として出力されるとともに、必要に応じて、予測画像の予測に用いられる参照画像として一時記憶される。

符号化装置１１及び復号装置１２のILF処理としてのフィルタ処理は、クラス分類適応処理によって行われる。以下、クラス分類適応処理について説明する。

＜クラス分類適応処理＞

図２は、クラス分類適応処理を行う画像変換装置の第１の構成例を示すブロック図である。

ここで、クラス分類適応処理は、例えば、第１の画像を、第２の画像に変換する画像変換処理として捉えることができる。

第１の画像を第２の画像に変換する画像変換処理は、その第１と第２の画像の定義によって様々な信号処理となる。

すなわち、例えば、第１の画像を低空間解像度の画像とするとともに、第２の画像を高空間解像度の画像とすれば、画像変換処理は、空間解像度を向上させる空間解像度創造（向上）処理ということができる。

また、例えば、第１の画像を低S/Nの画像とするとともに、第２の画像を高S/Nの画像とすれば、画像変換処理は、ノイズを除去するノイズ除去処理ということができる。

さらに、例えば、第１の画像を所定の画素数（サイズ）の画像とするとともに、第２の画像を、第１の画像の画素数を多くまたは少なくした画像とすれば、画像変換処理は、画像のリサイズ（拡大または縮小）を行うリサイズ処理ということができる。

また、例えば、第１の画像を、HEVC等のブロック単位で符号化された画像を復号することによって得られる復号画像とするとともに、第２の画像を、符号化前の元画像とすれば、画像変換処理は、ブロック単位の符号化及び復号によって生じるブロック歪みを除去する歪み除去処理ということができる。

なお、クラス分類適応処理は、画像の他、例えば、音響を、処理の対象とすることができる。音響を対象とするクラス分類適応処理は、第１の音響（例えば、S/Nの低い音響等）を、第２の音響（例えば、S/Nの高い音響等）に変換する音響変換処理として捉えることができる。

クラス分類適応処理では、第１の画像のうちの注目している注目画素（処理対象の処理対象画素）の画素値を複数のクラスのうちのいずれかのクラスにクラス分類することにより得られるクラスのタップ係数と、注目画素に対して選択される第１の画像の、タップ係数と同一の数の画素の画素値とを用いた予測演算により、注目画素の画素値が求められる。

図２は、クラス分類適応処理による画像変換処理を行う画像変換装置の構成例を示している。

図２において、画像変換装置２０は、タップ選択部２１及び２２、クラス分類部２３、係数取得部２４、並びに、予測演算部２５を有する。

画像変換装置２０には、第１の画像が供給される。画像変換装置２０に供給される第１の画像は、タップ選択部２１及び２２に供給される。

タップ選択部２１は、第１の画像を構成する画素を、順次、注目画素に選択する。さらに、タップ選択部２１は、注目画素に対応する第２の画像の対応画素（の画素値）を予測するのに用いる第１の画像を構成する画素（の画素値）の幾つかを、予測タップとして選択する。

具体的には、タップ選択部２１は、注目画素の時空間の位置から空間的又は時間的に近い位置にある第１の画像の複数の画素を、予測タップとして選択する。

タップ選択部２２は、注目画素を、幾つかのクラスのうちのいずれかにクラス分けするクラス分類を行うのに用いる第１の画像を構成する画素（の画素値）の幾つかを、クラスタップとして選択する。すなわち、タップ選択部２２は、タップ選択部２１が予測タップを選択するのと同様にして、クラスタップを選択する。

なお、予測タップとクラスタップは、同一のタップ構造を有するものであっても良いし、異なるタップ構造を有するものであっても良い。

タップ選択部２１で得られた予測タップは、予測演算部２５に供給され、タップ選択部２２で得られたクラスタップは、クラス分類部２３に供給される。

クラス分類部２３は、一定の規則に従って、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数取得部２４に供給する。

すなわち、クラス分類部２３は、例えば、タップ選択部２２からのクラスタップを用いて、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数取得部２４に供給する。

例えば、クラス分類部２３は、クラスタップを用いて、注目画素の画像特徴量を求める。さらに、クラス分類部２３は、注目画素の画像特徴量に応じて、注目画素をクラス分類し、その結果得られるクラスに対応するクラスコードを、係数取得部２４に供給する。

ここで、クラス分類を行う方法としては、例えば、ADRC(Adaptive Dynamic Range Coding)等を採用することができる。

ADRCを用いる方法では、クラスタップを構成する画素（の画素値）が、ADRC処理され、その結果得られるADRCコード（ADRC値）にしたがって、注目画素のクラスが決定される。ADRCコードは、注目画素を含む小領域の画像特徴量としての波形パターンを表す。

なお、LビットADRCにおいては、例えば、クラスタップを構成する画素の画素値の最大値MAXと最小値MINが検出され、DR=MAX-MINを、集合の局所的なダイナミックレンジとし、このダイナミックレンジDRに基づいて、クラスタップを構成する各画素の画素値がLビットに再量子化される。すなわち、クラスタップを構成する各画素の画素値から、最小値MINが減算され、その減算値がDR/2^Lで除算（再量子化）される。そして、以上のようにして得られる、クラスタップを構成するLビットの各画素の画素値を、所定の順番で並べたビット列が、ADRCコードとして出力される。したがって、クラスタップが、例えば、１ビットADRC処理された場合には、そのクラスタップを構成する各画素の画素値は、最大値MAXと最小値MINとの平均値で除算され（小数点以下切り捨て）、これにより、各画素の画素値が１ビットとされる（２値化される）。そして、その１ビットの画素値を所定の順番で並べたビット列が、ADRCコードとして出力される。

なお、クラス分類部２３には、例えば、クラスタップを構成する画素の画素値のレベル分布のパターンを、そのままクラスコードとして出力させることも可能である。しかしながら、この場合、クラスタップが、N個の画素の画素値で構成され、各画素の画素値に、Aビットが割り当てられているとすると、クラス分類部２３が出力するクラスコードの場合の数は、（２^N）^A通りとなり、画素の画素値のビット数Aに指数的に比例した膨大な数となる。

したがって、クラス分類部２３においては、クラスタップの情報量を、上述のADRC処理や、あるいはベクトル量子化等によって圧縮することにより、クラス分類を行うのが好ましい。

係数取得部２４は、後述する学習によって求められたクラスごとのタップ係数を記憶し、さらに、その記憶したタップ係数のうちの、クラス分類部２３から供給されるクラスコードが表すクラスのタップ係数、すなわち、注目画素のクラスのタップ係数を取得する。さらに、係数取得部２４は、注目画素のクラスのタップ係数を、予測演算部２５に供給する。

ここで、タップ係数とは、ディジタルフィルタにおける、いわゆるタップにおいて入力データと乗算される係数に相当する係数である。

予測演算部２５は、タップ選択部２１が出力する予測タップと、係数取得部２４が供給されるタップ係数とを用いて、注目画素に対応する第２の画像の画素（対応画素）の画素値の真値の予測値を求める所定の予測演算を行う。これにより、予測演算部２５は、対応画素の画素値（の予測値）、すなわち、第２の画像を構成する画素の画素値を求めて出力する。

図３は、係数取得部２４に記憶されるタップ係数の学習を行う学習装置の構成例を示すブロック図である。

ここで、例えば、高画質の画像（高画質画像）を第２の画像とするとともに、その高画質画像をLPF(Low Pass Filter)によってフィルタリングする等してその画質（解像度）を低下させた低画質の画像（低画質画像）を第１の画像として、低画質画像から予測タップを選択し、その予測タップとタップ係数を用いて、高画質画像の画素（高画質画素）の画素値を、所定の予測演算によって求める（予測する）ことを考える。

所定の予測演算として、例えば、線形１次予測演算を採用することとすると、高画質画素の画素値yは、次の線形１次式によって求められることになる。

・・・（１）

但し、式（１）において、x_nは、対応画素としての高画質画素yに対する予測タップを構成する、n番目の低画質画像の画素（以下、適宜、低画質画素という）の画素値を表し、w_nは、n番目の低画質画素（の画素値）と乗算されるn番目のタップ係数を表す。なお、式（１）では、予測タップが、N個の低画質画素x₁，x₂，・・・，x_Nで構成されることとする。

ここで、高画質画素の画素値yは、式（１）に示した線形１次式ではなく、２次以上の高次の式によって求めるようにすることも可能である。

いま、第ｋサンプルの高画質画素の画素値の真値をy_kと表すとともに、式（１）によって得られるその真値y_kの予測値をy_k’と表すと、その予測誤差e_kは、次式で表される。

・・・（２）

いま、式（２）の予測値y_k’は、式（１）にしたがって求められるため、式（２）のy_k’を、式（１）にしたがって置き換えると、次式が得られる。

・・・（３）

但し、式（３）において、x_n,kは、対応画素としての第kサンプルの高画質画素に対する予測タップを構成するn番目の低画質画素を表す。

式（３）（又は式（２））の予測誤差e_kを０とするタップ係数w_nが、高画質画素を予測するのに最適なものとなるが、すべての高画質画素について、そのようなタップ係数w_nを求めることは、一般には困難である。

そこで、タップ係数w_nが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適なタップ係数w_nは、次式で表される自乗誤差の総和Ｅ（統計的な誤差）を最小にすることで求めることができる。

・・・（４）

但し、式（４）において、Kは、対応画素としての高画質画素y_kと、その高画質画素y_kに対する予測タップを構成する低画質画素x_1,k，x_2,k，・・・，x_N,kとのセットのサンプル数（学習用のサンプルの数）を表す。

式（４）の自乗誤差の総和Ｅの最小値（極小値）は、式（５）に示すように、総和Ｅをタップ係数w_nで偏微分したものを０とするw_nによって与えられる。

・・・（５）

そこで、上述の式（３）をタップ係数w_nで偏微分すると、次式が得られる。

・・・（６）

式（５）と（６）から、次式が得られる。

・・・（７）

式（７）のe_kに、式（３）を代入することにより、式（７）は、式（８）に示す正規方程式で表すことができる。

・・・（８）

式（８）の正規方程式は、例えば、掃き出し法（Gauss-Jordanの消去法）等を用いることにより、タップ係数w_nについて解くことができる。

式（８）の正規方程式を、クラスごとにたてて解くことにより、最適なタップ係数（ここでは、自乗誤差の総和Ｅを最小にするタップ係数）w_nを、クラスごとに求めることができる。

図３は、式（８）の正規方程式をたてて解くことによりタップ係数w_nを求める学習を行う学習装置の構成例を示している。

図３において、学習装置３０は、教師データ生成部３１、生徒データ生成部３２、及び、学習部３３を有する。

教師データ生成部３１及び生徒データ生成部３２には、タップ係数w_nの学習に用いられる学習画像が供給される。学習画像としては、例えば、解像度の高い高画質画像を用いることができる。

教師データ生成部３２は、学習画像から、タップ係数の学習の教師（真値）となる教師データ、すなわち、クラス分類適応処理により得たい教師データとして、式（１）による予測演算としての写像の写像先となる教師画像を生成し、学習部３３に供給する。ここでは、教師データ生成部３２は、例えば、学習画像としての高画質画像を、そのまま教師画像として、学習部３３に供給する。

生徒データ生成部３２は、学習画像から、タップ係数の学習の生徒となる生徒データ、すなわち、クラス分類適応処理においてタップ係数との予測演算の対象となる生徒データとして、式（１）による予測演算としての写像による変換対象となる生徒画像を生成し、学習部３３に供給する。ここでは、生徒データ生成部３２は、例えば、学習画像としての高画質画像をLPF(low Pass Filter)でフィルタリングすることにより、その解像度を低下させることで、低画質画像を生成し、この低画質画像を、生徒画像として、学習部３３に供給する。

学習部３３は、生徒データ生成部３２からの生徒データとしての生徒画像を構成する画素を、順次、注目画素とし、その注目画素について、図２のタップ選択部２１が選択するのと同一のタップ構造の画素を、生徒画像から予測タップとして選択する。さらに、学習部３３は、注目画素に対応する教師画像を構成する対応画素と、注目画素の予測タップとを用い、クラスごとに、式（８）の正規方程式をたてて解くことにより、クラスごとのタップ係数を求める。

図４は、図３の学習部３３の構成例を示すブロック図である。

図４において、学習部３３は、タップ選択部４１及び４２、クラス分類部４３、足し込み部４４、並びに、係数算出部４５を有する。

生徒画像は、タップ選択部４１及び４２に供給され、教師画像は、足し込み部４４に供給される。

タップ選択部４１は、生徒画像を構成する画素を、順次、注目画素として選択し、その注目画素を表す情報を、必要なブロックに供給する。

さらに、タップ選択部４１は、注目画素について、生徒画像を構成する画素から、図２のタップ選択部２１が選択するのと同一の画素を予測タップに選択し、これにより、タップ選択部２１で得られるのと同一のタップ構造の予測タップを得て、足し込み部４４に供給する。

タップ選択部４２は、注目画素について、生徒画像を構成する画素から、図２のタップ選択部２２が選択するのと同一の画素をクラスタップに選択し、これにより、タップ選択部２２で得られるのと同一のタップ構造のクラスタップを得て、クラス分類部４３に供給する。

クラス分類部４３は、タップ選択部４２からのクラスタップを用いて、図２のクラス分類部２３と同一のクラス分類を行い、その結果得られる注目画素のクラスに対応するクラスコードを、足し込み部４４に出力する。

足し込み部４４は、教師画像を構成する画素から、注目画素に対応する対応画素（の画素値）を取得し、対応画素と、タップ選択部４１から供給される注目画素についての予測タップを構成する生徒画像の画素（の画素値）とを対象とした足し込みを、クラス分類部４３から供給されるクラスコードごとに行う。

すなわち、足し込み部４４には、教師データとしての教師画像の対応画素y_k、生徒データとしての注目画素の予測タップx_n,k、注目画素のクラスを表すクラスコードが供給される。

足し込み部４４は、注目画素のクラスごとに、予測タップ（生徒データ）x_n,kを用い、式（８）の左辺の行列における生徒データどうしの乗算（x_n,kx_n',k）と、サメーション（Σ）に相当する演算を行う。

さらに、足し込み部４４は、やはり、注目画素のクラスごとに、予測タップ（生徒データ）x_n,kと教師データy_kを用い、式（８）の右辺のベクトルにおける生徒データx_n,k及び教師データy_kの乗算（x_n,ky_k）と、サメーション（Σ）に相当する演算を行う。

すなわち、足し込み部４４は、前回、教師データとしての、注目画素に対応する対応画素について求められた式（８）における左辺の行列のコンポーネント（Σx_n,kx_n',k）と、右辺のベクトルのコンポーネント（Σx_n,ky_k）を、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネント（Σx_n,kx_n',k）又はベクトルのコンポーネント（Σx_n,ky_k）に対して、新たな注目画素に対応する対応画素となった教師データについて、その教師データy_k+1及び生徒データx_n,k+1を用いて計算される、対応するコンポーネントx_n,k+1x_n',k+1又はx_n,k+1y_k+1を足し込む（式（８）のサメーションで表される加算を行う）。

そして、足し込み部４４は、例えば、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、式（８）に示した正規方程式をたて、その正規方程式を、係数算出部４５に供給する。

係数算出部４５は、足し込み部４４から供給される各クラスについての正規方程式を解くことにより、各クラスについて、最適なタップ係数w_nを求めて出力する。

図２の画像変換装置２０における係数取得部２４には、以上のようにして求められたクラスごとのタップ係数w_nを記憶させることができる。

図５は、クラス分類適応処理を行う画像変換装置の第２の構成例を示すブロック図である。

なお、図中、図２の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図５において、画像変換装置２０は、タップ選択部２１及び２２、クラス分類部２３、係数取得部２４、並びに、予測演算部２５を有する。

したがって、図５の画像変換装置２０は、図２の場合と同様に構成される。

但し、図５では、係数取得部２４は、後述する種係数を記憶する。さらに、図５では、係数取得部２４には、外部からパラメータzが供給される。

係数取得部２４は、種係数から、パラメータzに対応する、クラスごとのタップ係数を生成し、そのクラスごとのタップ係数から、クラス分類部２３からのクラスのタップ係数を取得して、予測演算部２５に供給する。

ここで、図２では、係数取得部２４は、タップ係数そのものを記憶するが、図５では、係数取得部２４は、種係数を記憶する。種係数は、パラメータzを与える（決定する）ことによって、タップ係数を生成することができ、かかる観点から、種係数は、タップ係数と同等の情報であるとみなすことができる。本明細書では、タップ係数には、タップ係数そのものの他、そのタップ係数を生成することができる種係数も必要に応じて含まれることとする。

図６は、係数取得部２４に記憶される種係数の学習を行う学習装置の構成例を示すブロック図である。

ここで、例えば、図３で説明した場合と同様に、高画質の画像（高画質画像）を第２の画像とするとともに、その高画質画像の空間解像度を低下させた低画質の画像（低画質画像）を第１の画像として、低画質画像から予測タップを選択し、その予測タップとタップ係数を用いて、高画質画像の画素である高画質画素の画素値を、例えば、式（１）の線形１次予測演算によって求める（予測する）ことを考える。

いま、タップ係数w_nが、種係数と、パラメータzとを用いた次式によって生成されることとする。

・・・（９）

但し、式（９）において、β_m,nは、n番目のタップ係数w_nを求めるのに用いられるｍ番目の種係数を表す。なお、式（９）では、タップ係数w_nが、Ｍ個の種係数β_1,n，β_2,n，・・・，β_M,nを用いて求められる。

ここで、種係数β_m,nとパラメータzから、タップ係数w_nを求める式は、式（９）に限定されるものではない。

いま、式（９）におけるパラメータzによって決まる値z^m-1を、新たな変数ｔ_mを導入して、次式で定義する。

・・・（１０）

式（１０）を、式（９）に代入することにより、次式が得られる。

・・・（１１）

式（１１）によれば、タップ係数w_nは、種係数β_m,nと変数ｔ_mとの線形１次式によって求められることになる。

ところで、いま、第kサンプルの高画質画素の画素値の真値をy_kと表すとともに、式（１）によって得られるその真値y_kの予測値をy_k’と表すと、その予測誤差e_kは、次式で表される。

・・・（１２）

いま、式（１２）の予測値y_k’は、式（１）にしたがって求められるため、式（１２）のy_k’を、式（１）にしたがって置き換えると、次式が得られる。

・・・（１３）

但し、式（１３）において、x_n,kは、対応画素としての第kサンプルの高画質画素に対する予測タップを構成するn番目の低画質画素を表す。

式（１３）のw_nに、式（１１）を代入することにより、次式が得られる。

・・・（１４）

式（１４）の予測誤差e_kを０とする種係数β_m,nが、高画質画素を予測するのに最適なものとなるが、すべての高画質画素について、そのような種係数β_m,nを求めることは、一般には困難である。

そこで、種係数β_m,nが最適なものであることを表す規範として、例えば、最小自乗法を採用することとすると、最適な種係数β_m,nは、次式で表される自乗誤差の総和Ｅを最小にすることで求めることができる。

・・・（１５）

但し、式（１５）において、Kは、対応画素としての高画質画素y_kと、その高画質画素y_kに対する予測タップを構成する低画質画素x_1,k，x_2,k，・・・，x_N,kとのセットのサンプル数（学習用のサンプルの数）を表す。

式（１５）の自乗誤差の総和Ｅの最小値（極小値）は、式（１６）に示すように、総和Ｅを種係数β_m,nで偏微分したものを０とするβ_m,nによって与えられる。

・・・（１６）

式（１３）を、式（１６）に代入することにより、次式が得られる。

・・・（１７）

いま、Ｘ_i,p,j,qとＹ_i,pを、式（１８）と（１９）に示すように定義する。

・・・（１８）

・・・（１９）

この場合、式（１７）は、Ｘ_i,p,j,qとＹ_i,pを用いた式（２０）に示す正規方程式で表すことができる。

・・・（２０）

式（２０）の正規方程式は、例えば、掃き出し法（Gauss-Jordanの消去法）等を用いることにより、種係数β_m,nについて解くことができる。

図５の画像変換装置２０においては、多数の高画質画素y₁，y₂，・・・，y_Kを教師データとするとともに、各高画質画素y_kに対する予測タップを構成する低画質画素x_1,k，x_2,k，・・・，x_N,kを生徒データとして、クラスごとに式（２０）の正規方程式をたてて解く学習を行うことにより求められたクラスごとの種係数β_m,nが、係数取得部２４に記憶される。そして、係数取得部２４では、種係数β_m,nと、外部から与えられるパラメータzから、式（９）にしたがって、クラスごとのタップ係数w_nが生成され、予測演算部２５において、そのタップ係数w_nと、注目画素についての予測タップを構成する低画質画素（第１の画像の画素）x_nを用いて、式（１）が計算されることにより、高画質画素（第２の画像の対応画素）の画素値（に近い予測値）が求められる。

図６は、式（２０）の正規方程式をクラスごとにたてて解くことにより、クラスごとの種係数β_m,nを求める学習を行う学習装置の構成例を示している。

なお、図中、図３の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図６において、学習装置３０は、教師データ生成部３１、パラメータ生成部６１、生徒データ生成部６２、及び、学習部６３を有する。

したがって、図６の学習装置３０は、教師データ生成部３１を有する点で、図３の場合と共通する。

但し、図６の学習装置３０は、パラメータ生成部６１を新たに有する点で、図３の場合と相違する。さらに、図６の学習装置３０は、生徒データ生成部３２及び学習部３３に代えて、生徒データ生成部６２、及び、学習部６３がそれぞれ設けられている点で、図３の場合と相違する。

パラメータ生成部６１は、パラメータzが取り得る範囲の幾つかの値を生成し、生徒データ生成部６２と学習部６３に供給する。

例えば、パラメータzが取り得る値が0乃至Zの範囲の実数であるとすると、パラメータ生成部６１は、例えば、例えば、z=0,1,2,・・・,Zの値のパラメータzを生成し、生徒データ生成部６２と学習部６３に供給する。

生徒データ生成部６２には、教師データ生成部３１に供給されるのと同様の学習画像が供給される。

生徒データ生成部６２は、図３の生徒データ生成部３２と同様に、学習画像から生徒画像を生成し、生徒データとして、学習部６３に供給する。

ここで、生徒データ生成部６２には、学習画像の他、パラメータzが取り得る範囲の幾つかの値が、パラメータ生成部６１から供給される。

生徒データ生成部６２は、学習画像としての高画質画像を、例えば、そこに供給されるパラメータzに対応するカットオフ周波数のLPFによってフィルタリングすることにより、パラメータzの幾つかの値それぞれに対して、生徒画像としての低画質画像を生成する。

すなわち、生徒データ生成部６２では、学習画像としての高画質画像について、Z+1種類の、空間解像度の異なる生徒画像としての低画質画像が生成される。

なお、ここでは、例えば、パラメータzの値が大きくなるほど、カットオフ周波数の高いLPFを用いて、高画質画像をフィルタリングし、生徒画像としての低画質画像を生成することとする。この場合、値の大きいパラメータzに対する生徒画像としての低画質画像ほど、空間解像度が高い。

また、生徒データ生成部６２では、パラメータzに応じて、学習画像としての高画質画像の水平方向及び垂直方向のうちの一方又は両方向の空間解像度を低下させた生徒画像としての低画質画像を生成することができる。

さらに、学習画像としての高画質画像の水平方向及び垂直方向のうちの両方向の空間解像度を低下させた生徒画像としての低画質画像を生成する場合には、学習画像としての高画質画像の水平方向及び垂直方向の空間解像度は、それぞれ別個のパラメータ、すなわち、２個のパラメータz及びz'に応じて、別個に低下させることができる。

この場合、図５の係数取得部２４では、外部から２個のパラメータz及びz'が与えられ、その２個のパラメータz及びz'と種係数とを用いて、タップ係数が生成される。

以上のように、種係数としては、１個のパラメータzの他、２個のパラメータz及びz'、さらには、３個以上のパラメータを用いて、タップ係数を生成することができる種係数を求めることができる。但し、本明細書では、説明を簡単にするため、１個のパラメータzを用いてタップ係数を生成する種係数を例に、説明を行う。

学習部６３は、教師データ生成部３１からの教師データとしての教師画像、パラメータ生成部６１からのパラメータz、及び、生徒データ生成部６２からの生徒データとしての生徒画像を用いて、クラスごとの種係数を求めて出力する。

図７は、図６の学習部６３の構成例を示すブロック図である。

なお、図中、図４の学習部３３と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図７において、学習部６３は、タップ選択部４１及び４２、クラス分類部４３、足し込み部７１、並びに、係数算出部７２を有する。

したがって、図７の学習部６３は、タップ選択部４１及び４２、並びに、クラス分類部４３を有する点で、図４の学習部３３と共通する。

但し、学習部６３は、足し込み部４４及び係数算出部４５に代えて、足し込み部７１、及び、係数算出部７２をそれぞれ有する点で、学習部３３と相違する。

図７では、タップ選択部４１と４２は、パラメータ生成部６１で生成されるパラメータzに対応して生成された生徒画像（ここでは、パラメータzに対応するカットオフ周波数のLPFを用いて生成された生徒データとしての低画質画像）から、予測タップとクラスタップをそれぞれ選択する。

足し込み部７１は、図６の教師データ生成部３１からの教師画像から、注目画素に対応する対応画素を取得し、その対応画素、タップ選択部４１から供給される注目画素について構成された予測タップを構成する生徒データ（生徒画像の画素）、及び、その生徒データを生成したときのパラメータzを対象とした足し込みを、クラス分類部４３から供給されるクラスごとに行う。

すなわち、足し込み部７１には、注目画素に対応する対応画素としての教師データy_k、タップ選択部４１が出力する注目画素についての予測タップx_i,k（x_j,k）、及び、クラス分類部４３が出力する注目画素のクラスが供給されるとともに、注目画素についての予測タップを構成する生徒データを生成したときのパラメータzが、パラメータ生成部６１から供給される。

そして、足し込み部７１は、クラス分類部４３から供給されるクラスごとに、予測タップ（生徒データ）x_i,k（x_j,k）とパラメータzを用い、式（２０）の左辺の行列における、式（１８）で定義されるコンポーネントＸ_i,p,j,qを求めるための生徒データ及びパラメータzの乗算（x_i,kｔ_px_j,kｔ_q）と、サメーション（Σ）に相当する演算を行う。なお、式（１８）のｔ_pは、式（１０）にしたがって、パラメータzから計算される。式（１８）のｔ_qも同様である。

さらに、足し込み部７１は、やはり、クラス分類部４３から供給されるクラスごとに、予測タップ（生徒データ）x_i,k、教師データy_k、及び、パラメータzを用い、式（２０）の右辺のベクトルにおける、式（１９）で定義されるコンポーネントＹ_i,pを求めるための生徒データx_i,k、教師データy_k、及び、パラメータzの乗算（x_i,kｔ_py_k）と、サメーション（Σ）に相当する演算を行う。なお、式（１９）のｔ_pは、式（１０）にしたがって、パラメータzから計算される。

すなわち、足し込み部７１は、前回、教師データとしての、注目画素に対応する対応画素について求められた式（２０）における左辺の行列のコンポーネントＸ_i,p,j,qと、右辺のベクトルのコンポーネントＹ_i,pを、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネントＸ_i,p,j,q又はベクトルのコンポーネントＹ_i,pに対して、新たな注目画素に対応する対応画素となった教師データについて、その教師データy_k、生徒データx_i,k(x_j,k)、及びパラメータzを用いて計算される、対応するコンポーネントx_i,kｔ_px_j,kｔ_q又はx_i,kｔ_py_kを足し込む（式（１８）のコンポーネントＸ_i,p,j,q又は式（１９）のコンポーネントＹ_i,pにおけるサメーションで表される加算を行う）。

そして、足し込み部７１は、０，１，・・・，Zのすべての値のパラメータzにつき、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、式（２０）に示した正規方程式をたて、その正規方程式を、係数算出部７２に供給する。

係数算出部７２は、足し込み部７１から供給されるクラスごとの正規方程式を解くことにより、各クラスごとの種係数β_m,nを求めて出力する。

ところで、図６の学習装置３０では、学習画像としての高画質画像を教師データとするとともに、その高画質画像の空間解像度を、パラメータzに対応して劣化させた低画質画像を生徒データとして、タップ係数w_n及び生徒データx_nから式（１）の線形１次式で予測される教師データの予測値yの自乗誤差の総和を直接的に最小にする種係数β_m,nを求める学習を行うようにしたが、種係数β_m,nの学習としては、教師データの予測値yの自乗誤差の総和を、いわば、間接的に最小にする種係数β_m,nを求める学習を行うことができる。

すなわち、学習画像としての高画質画像を教師データとするとともに、その高画質画像を、パラメータzに対応したカットオフ周波数のLPFによってフィルタリングすることにより、その水平解像度及び垂直解像度を低下させた低画質画像を生徒データとして、まず最初に、タップ係数w_n及び生徒データx_nを用いて式（１）の線形１次予測式で予測される教師データの予測値yの自乗誤差の総和を最小にするタップ係数w_nを、パラメータzの値（ここでは、z=0,1,・・・,Z）ごとに求める。そして、そのパラメータzの値ごとに求められたタップ係数w_nを教師データとするとともに、パラメータzを生徒データとして、式（１１）によって種係数β_m,n及び生徒データであるパラメータzに対応する変数ｔ_mから予測される教師データとしてのタップ係数w_nの予測値の自乗誤差の総和を最小にする種係数β_m,nを求める。

ここで、式（１）の線形１次予測式で予測される教師データの予測値yの自乗誤差の総和Ｅを最小（極小）にするタップ係数w_nは、図３の学習装置３０における場合と同様に、式（８）の正規方程式をたてて解くことにより、各クラスについて、パラメータzの値（z=0,1,・・・,Z）ごとに求めることができる。

ところで、タップ係数は、式（１１）に示したように、種係数β_m,nと、パラメータzに対応する変数ｔ_mとから求められる。そして、いま、この式（１１）によって求められるタップ係数を、w_n’と表すこととすると、次の式（２１）で表される、最適なタップ係数w_nと式（１１）により求められるタップ係数w_n’との誤差e_nを０とする種係数β_m,nが、最適なタップ係数w_nを求めるのに最適な種係数となるが、すべてのタップ係数w_nについて、そのような種係数β_m,nを求めることは、一般には困難である。

・・・（２１）

なお、式（２１）は、式（１１）によって、次式のように変形することができる。

・・・（２２）

そこで、種係数β_m,nが最適なものであることを表す規範として、例えば、やはり、最小自乗法を採用することとすると、最適な種係数β_m,nは、次式で表される自乗誤差の総和Ｅを最小にすることで求めることができる。

・・・（２３）

式（２３）の自乗誤差の総和Ｅの最小値（極小値）は、式（２４）に示すように、総和Ｅを種係数β_m,nで偏微分したものを０とするβ_m,nによって与えられる。

・・・（２４）

式（２２）を、式（２４）に代入することにより、次式が得られる。

・・・（２５）

いま、Ｘ_i,j,とＹ_iを、式（２６）と（２７）に示すように定義する。

・・・（２６）

・・・（２７）

この場合、式（２５）は、Ｘ_i,jとＹ_iを用いた式（２８）に示す正規方程式で表すことができる。

・・・（２８）

式（２８）の正規方程式も、例えば、掃き出し法等を用いることにより、種係数β_m,nについて解くことができる。

図８は、図６の学習部６３の他の構成例を示すブロック図である。

すなわち、図８は、式（２８）の正規方程式をたてて解くことにより種係数β_m,nを求める学習を行う学習部６３の構成例を示している。

なお、図中、図４又は図７の場合と対応するについては、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図８の学習部６３は、タップ選択部４１及び４２、クラス分類部４３、係数算出部４５、足し込み部８１及び８２、並びに、係数算出部８３を有する。

したがって、図８の学習部６３は、タップ選択部４１及び４２、クラス分類部４３、並びに、係数算出部４５を有する点で、図４の学習部３３と共通する。

但し、図８の学習部６３は、足し込み部４４に代えて、足し込み部８１を有する点、並びに、足し込み部８２及び係数算出部８３を新たに有する点で、図４の学習部３３と相違する。

足し込み部８１には、クラス分類部４３が出力する注目画素のクラスと、パラメータ生成部６１が出力するパラメータzが供給される。足し込み部８１は、教師データ生成部３１からの教師画像のうちの、注目画素に対応する対応画素としての教師データと、タップ選択部４１から供給される注目画素についての予測タップを構成する生徒データとを対象とした足し込みを、クラス分類部４３から供給されるクラスごとに、かつ、パラメータ生成部６１が出力するパラメータzの値ごとに行う。

すなわち、足し込み部８１には、教師データy_k、予測タップx_n,k、注目画素のクラス、及び、予測タップx_n,kを構成する生徒画像を生成したときのパラメータzが供給される。

足し込み部８１は、注目画素のクラスごとに、かつ、パラメータzの値ごとに、予測タップ（生徒データ）x_n,kを用い、式（８）の左辺の行列における生徒データどうしの乗算（x_n,kx_n',k）と、サメーション（Σ）に相当する演算を行う。

さらに、足し込み部８１は、注目画素のクラスごとに、かつパラメータzの値ごとに、予測タップ（生徒データ）x_n,kと教師データy_kを用い、式（８）の右辺のベクトルにおける生徒データx_n,k及び教師データy_kの乗算（x_n,ky_k）と、サメーション（Σ）に相当する演算を行う。

すなわち、足し込み部８１は、前回、教師データとしての、注目画素に対応する対応画素について求められた式（８）における左辺の行列のコンポーネント（Σx_n,kx_n',k）と、右辺のベクトルのコンポーネント（Σx_n,ky_k）を、その内蔵するメモリ（図示せず）に記憶しており、その行列のコンポーネント（Σx_n,kx_n',k）又はベクトルのコンポーネント（Σx_n,ky_k）に対して、新たな注目画素に対応する対応画素となった教師データについて、その教師データy_k+1及び生徒データx_n,k+1を用いて計算される、対応するコンポーネントx_n,k+1x_n',k+1又はx_n,k+1y_k+1を足し込む（式（８）のサメーションで表される加算を行う）。

そして、足し込み部８１は、生徒画像の画素すべてを注目画素として、上述の足し込みを行うことにより、各クラスについて、パラメータzの各値ごとに、式（８）に示した正規方程式をたて、その正規方程式を、係数算出部４５に供給する。

したがって、足し込み部８１は、図４の足し込み部４４と同様に、各クラスについて、式（８）の正規方程式をたてる。但し、足し込み部８１は、さらに、パラメータzの各値ごとにも、式（８）の正規方程式をたてる点で、図４の足し込み部４４と異なる。

係数算出部４５は、足し込み部８１から供給される各クラスについての、パラメータzの値ごとの正規方程式を解くことにより、各クラスについて、パラメータzの値ごとの最適なタップ係数w_nを求め、足し込み部８２に供給する。

足し込み部８２は、パラメータ生成部６１（図６）から供給されるパラメータz（に対応する変数ｔ_m）と、係数算出部４５から供給される最適なタップ係数w_nを対象とした足し込みを、クラスごとに行う。

すなわち、足し込み部８２は、パラメータ生成部６１から供給されるパラメータzから式（１０）によって求められる変数ｔ_i（ｔ_j）を用い、式（２８）の左辺の行列における、式（２６）で定義されるコンポーネントＸ_i,jを求めるためのパラメータzに対応する変数ｔ_i（ｔ_j）どうしの乗算（ｔ_iｔ_j）と、サメーション（Σ）に相当する演算を、クラスごとに行う。

ここで、コンポーネントＸ_i,jは、パラメータzによってのみ決まるものであり、クラスとは関係がないので、コンポーネントＸ_i,jの計算は、実際には、クラスごとに行う必要はなく、１回行うだけで済む。

さらに、足し込み部８２は、パラメータ生成部６１から供給されるパラメータzから式（１０）によって求められる変数ｔ_iと、係数算出部４５から供給される最適なタップ係数w_nとを用い、式（２８）の右辺のベクトルにおける、式（２７）で定義されるコンポーネントＹ_iを求めるためのパラメータzに対応する変数ｔ_i及び最適なタップ係数w_nの乗算（ｔ_iw_n）と、サメーション（Σ）に相当する演算を、クラスごとに行う。

足し込み部８２は、各クラスごとに、式（２６）で表されるコンポーネントＸ_i,jと、式（２７）で表されるコンポーネントＹ_iを求めることにより、各クラスについて、式（２８）の正規方程式をたて、その正規方程式を、係数算出部８３に供給する。

係数算出部８３は、足し込み部８２から供給されるクラスごとの式（２８）の正規方程式を解くことにより、各クラスごとの種係数β_m,nを求めて出力する。

図５の係数取得部２４には、以上のようにして求められたクラスごとの種係数β_m,nを記憶させることができる。

なお、種係数の学習においても、タップ係数の学習における場合と同様に、第１の画像に対応する生徒データと、第２の画像に対応する教師データとする画像の選択の仕方によって、種係数としては、各種の画像変換処理を行う種係数を得ることができる。

すなわち、上述の場合には、学習画像を、そのまま第２の画像に対応する教師データとするとともに、その学習画像の空間解像度を劣化させた低画質画像を、第１の画像に対応する生徒データとして、種係数の学習を行うようにしたことから、種係数としては、第１の画像を、その空間解像度を向上させた第２の画像に変換する空間解像度創造処理としての画像変換処理を行う種係数を得ることができる。

この場合、図５の画像変換装置２０では、画像の水平解像度及び垂直解像度を、パラメータzに対応する解像度に向上させることができる。

また、例えば、高画質画像を教師データとするとともに、その教師データとしての高画質画像に対して、パラメータzに対応するレベルのノイズを重畳した画像を生徒データとして、種係数の学習を行うことにより、種係数としては、第１の画像を、そこに含まれるノイズを除去（低減）した第２の画像に変換するノイズ除去処理としての画像変換処理を行う種係数を得ることができる。この場合、図５の画像変換装置２０では、パラメータzに対応するS/Nの画像（パラメータzに対応する強度のノイズ除去を施した画像）を得ることができる。

なお、上述の場合には、タップ係数w_nを、式（９）に示したように、β_1,nz⁰＋β_2,nz¹＋・・・＋β_M,nz^M-1で定義し、この式（９）によって、水平及び垂直方向の空間解像度を、いずれも、パラメータzに対応して向上させるためのタップ係数w_nを求めるようにしたが、タップ係数w_nとしては、水平解像度と垂直解像度を、独立のパラメータz_xとz_yに対応して、それぞれ独立に向上させるものを求めるようにすることも可能である。

すなわち、タップ係数w_nを、式（９）に代えて、例えば、３次式β_1,nz_x ⁰z_y ⁰＋β_2,nz_x ¹z_y ⁰＋β_3,nz_x ²z_y ⁰＋β_4,nz_x ³z_y ⁰＋β_5,nz_x ⁰z_y ¹＋β_6,nz_x ⁰z_y ²＋β_7,nz_x ⁰z_y ³＋β_8,nz_x ¹z_y ¹＋β_9,nz_x ²z_y ¹＋β_10,nz_x ¹z_y ²で定義するとともに、式（１０）で定義した変数ｔ_mを、式（１０）に代えて、例えば、ｔ₁＝z_x ⁰z_y ⁰，ｔ₂＝z_x ¹z_y ⁰，ｔ₃＝z_x ²z_y ⁰，ｔ₄＝z_x ³z_y ⁰，ｔ₅＝z_x ⁰z_y ¹，ｔ₆＝z_x ⁰z_y ²，ｔ₇＝z_x ⁰z_y ³，ｔ₈＝z_x ¹z_y ¹，ｔ₉＝z_x ²z_y ¹，ｔ₁₀＝z_x ¹z_y ²で定義する。この場合も、タップ係数w_nは、最終的には、式（１１）で表すことができ、したがって、図６の学習装置３０において、パラメータz_xとz_yに対応して、教師データの水平解像度と垂直解像度をそれぞれ劣化させた画像を、生徒データとして用いて学習を行って、種係数β_m,nを求めることにより、水平解像度と垂直解像度を、独立のパラメータz_xとz_yに対応して、それぞれ独立に向上させるタップ係数w_nを求めることができる。

その他、例えば、水平解像度と垂直解像度それぞれに対応するパラメータz_xとz_yに加えて、さらに、時間方向の解像度に対応するパラメータz_tを導入することにより、水平解像度、垂直解像度、時間解像度を、独立のパラメータz_x，z_y，z_tに対応して、それぞれ独立に向上させるタップ係数w_nを求めることが可能となる。

さらに、図６の学習装置３０において、パラメータz_xに対応して教師データの水平解像度及び垂直解像度を劣化させるとともに、パラメータz_yに対応して教師データにノイズを付加した画像を、生徒データとして用いて学習を行って、種係数β_m,nを求めることにより、パラメータz_xに対応して水平解像度及び垂直解像度を向上させるとともに、パラメータz_yに対応してノイズ除去を行うタップ係数w_nを求めることができる。

＜符号化装置１１の第１の構成例＞

図９は、図１の符号化装置１１の第１の構成例を示すブロック図である。

図９において、符号化装置１１は、A/D変換部１０１、並べ替えバッファ１０２、演算部１０３、直交変換部１０４、量子化部１０５、可逆符号化部１０６、及び、蓄積バッファ１０７を有する。さらに、符号化装置１１は、逆量子化部１０８、逆直交変換部１０９、演算部１１０、クラス分類適応フィルタ１１１、フレームメモリ１１２、選択部１１３、イントラ予測部１１４、動き予測補償部１１５、予測画像選択部１１６、及び、レート制御部１１７を有する。

A/D変換部１０１は、アナログ信号の元画像を、ディジタル信号の元画像にA/D変換し、並べ替えバッファ１０２に供給して記憶させる。

並べ替えバッファ１０２は、元画像のフレームを、GOP（Group Of Picture）に応じて、表示順から符号化（復号）順に並べ替え、演算部１０３、イントラ予測部１１４、動き予測補償部１１５、及び、クラス分類適応フィルタ１１１に供給する。

演算部１０３は、並べ替えバッファ１０２からの元画像から、予測画像選択部１１６を介してイントラ予測部１１４又は動き予測補償部１１５から供給される予測画像を減算し、その減算により得られる残差（予測残差）を、直交変換部１０４に供給する。

例えば、インター符号化が行われる画像の場合、演算部１０３は、並べ替えバッファ１０２から読み出された元画像から、動き予測補償部１１５から供給される予測画像を減算する。

直交変換部１０４は、演算部１０３から供給される残差に対して、離散コサイン変換やカルーネン・レーベ変換等の直交変換を施す。なお、この直交変換の方法は任意である。直交変換部１０４は、直交交換により得られる変換係数を量子化部１０５に供給する。

量子化部１０５は、直交変換部１０４から供給される変換係数を量子化する。量子化部１０５は、レート制御部１１７から供給される符号量の目標値（符号量目標値）に基づいて量子化パラメータQPを設定し、変換係数の量子化を行う。なお、この量子化の方法は任意である。量子化部１０５は、量子化された変換係数を可逆符号化部１０６に供給する。

可逆符号化部１０６は、量子化部１０５において量子化された変換係数を所定の可逆符号化方式で符号化する。変換係数は、レート制御部１１７の制御の下で量子化されているので、可逆符号化部１０６の可逆符号化により得られる符号化データの符号量は、レート制御部１１７が設定した符号量目標値となる（又は符号量目標値に近似する）。

また、可逆符号化部１０６は、符号化装置１１での予測符号化に関する符号化情報のうちの、必要な符号化情報を、各ブロックから取得する。

ここで、符号化情報としては、例えば、イントラ予測やインター予測の予測モード、動きベクトル等の動き情報、符号量目標値、量子化パラメータQP、ピクチャタイプ(I,P,B)、CU(Coding Unit)やCTU(Coding Tree Unit)の情報等がある。

例えば、予測モードは、イントラ予測部１１４や動き予測補償部１１５から取得することができる。また、例えば、動き情報は、動き予測補償部１１５から取得することができる。

可逆符号化部１０６は、符号化情報を取得する他、クラス分類適応フィルタ１１１から、そのクラス分類適応フィルタ１１１でのクラス分類適応処理に関するフィルタ情報を取得する。図９では、フィルタ情報には、クラスごとのタップ係数が含まれる。

可逆符号化部１０６は、符号化情報及びフィルタ情報を、任意の可逆符号化方式で符号化し、符号化データのヘッダ情報の一部とする（多重化する）。

可逆符号化部１０６は、符号化データを、蓄積バッファ１０７を介して伝送する。したがって、可逆符号化部１０６は、符号化データ、ひいては、符号化データに含まれる符号化情報やフィルタ情報を伝送する伝送部として機能する。

可逆符号化部１０６の可逆符号化方式としては、例えば、可変長符号化又は算術符号化等を採用することができる。可変長符号化としては、例えば、H．264/AVC方式で定められているCAVLC（Context-Adaptive Variable Length Coding）等がある。算術符号化としては、例えば、CABAC（Context-Adaptive Binary Arithmetic Coding）等がある。

蓄積バッファ１０７は、可逆符号化部１０６から供給される符号化データを、一時的に蓄積する。蓄積バッファ１０７に蓄積された符号化データは、所定のタイミングで読み出されて伝送される。

量子化部１０５において量子化された変換係数は、可逆符号化部１０６に供給される他、逆量子化部１０８にも供給される。逆量子化部１０８は、量子化された変換係数を、量子化部１０５による量子化に対応する方法で逆量子化する。この逆量子化の方法は、量子化部１０５による量子化処理に対応する方法であればどのような方法であってもよい。逆量子化部１０８は、逆量子化により得られる変換係数を、逆直交変換部１０９に供給する。

逆直交変換部１０９は、逆量子化部１０８から供給される変換係数を、直交変換部１０４による直交変換処理に対応する方法で逆直交変換する。この逆直交変換の方法は、直交変換部１０４による直交変換処理に対応する方法であればどのようなものであってもよい。逆直交変換された出力（復元された残差）は、演算部１１０に供給される。

演算部１１０は、逆直交変換部１０９から供給される逆直交変換結果、すなわち、復元された残差に、予測画像選択部１１６を介してイントラ予測部１１４又は動き予測補償部１１５から供給される予測画像を加算し、その加算結果を、復号途中の復号途中画像として出力する。

演算部１１０が出力する復号途中画像は、クラス分類適応フィルタ１１１又はフレームメモリ１１２に供給される。

クラス分類適応フィルタ１１１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う。

クラス分類適応フィルタ１１１には、演算部１１０から復号途中画像が供給される他、並べ替えバッファ１０２から、復号途中画像に対応する元画像が供給されるとともに、符号化装置１１の各ブロックから必要な符号化情報が供給される。

クラス分類適応フィルタ１１１は、演算部１１０からの復号途中画像に相当する生徒画像と、並べ替えバッファ１０２からの元画像に相当する教師画像とを用いるとともに、必要に応じて、符号化情報を用いて、クラスごとのタップ係数を求める学習を行う。

すなわち、クラス分類適応フィルタ１１１は、例えば、演算部１１０からの復号途中画像そのものを生徒画像とするとともに、並べ替えバッファ１０２からの元画像そのものを教師画像として、必要に応じて、符号化情報を用いて、クラスごとのタップ係数を求める学習を行う。クラスごとのタップ係数は、フィルタ情報として、クラス分類適応フィルタ１１１から可逆符号化部１０６に供給される。

さらに、クラス分類適応フィルタ１１１は、演算部１１０からの復号途中画像を第１の画像として、クラスごとのタップ係数を用いたクラス分類適応処理（による画像変換）を、符号化情報を必要に応じて用いて行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

クラス分類適応フィルタ１１１が出力するフィルタ後画像は、フレームメモリ１１２に供給される。

ここで、クラス分類適応フィルタ１１１では、上述のように、復号途中画像を生徒画像とするとともに、元画像を教師画像として、学習が行われ、その学習により得られるタップ係数を用いて、復号途中画像をフィルタ後画像に変換するクラス分類適応処理が行われる。したがって、クラス分類適応フィルタ１１１で得られるフィルタ後画像は、極めて元画像に近い画像になる。

フレームメモリ１１２は、演算部１１０から供給される復号途中画像、又は、クラス分類適応フィルタ１１１から供給されるフィルタ後画像を、局所復号された復号画像として一時記憶する。フレームメモリ１１２に記憶された復号画像は、必要なタイミングで、予測画像の生成に用いられる参照画像として、選択部１１３に供給される。

例えば、フレームメモリ１１２に記憶される復号画像としての、演算部１１０から供給される復号途中画像、及び、クラス分類適応フィルタ１１１から供給されるフィルタ後画像のうちの、復号途中画像は、イントラ予測の参照画像として用いられる。また、フィルタ後画像は、インター予測の参照画像として用いられる。

選択部１１３は、フレームメモリ１１２から供給される参照画像の供給先を選択する。例えば、イントラ予測部１１４においてイントラ予測が行われる場合、選択部１１３は、フレームメモリ１１２から供給される参照画像を、イントラ予測部１１４に供給する。また、例えば、動き予測補償部１１５においてインター予測が行われる場合、選択部１１３は、フレームメモリ１１２から供給される参照画像を、動き予測補償部１１５に供給する。

イントラ予測部１１４は、並べ替えバッファ１０２から供給される元画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、基本的に、PU(Prediction Unit)を処理単位として、イントラ予測（画面内予測）を行う。イントラ予測部１１４は、所定のコスト関数に基づいて、最適なイントラ予測モードを選択し、その最適なイントラ予測モードで生成された予測画像を、予測画像選択部１１６に供給する。また、上述したように、イントラ予測部１１４は、コスト関数に基づいて選択されたイントラ予測モードを示す予測モードを、可逆符号化部１０６等に適宜供給する。

動き予測補償部１１５は、並べ替えバッファ１０２から供給される元画像と、選択部１１３を介してフレームメモリ１１２から供給される参照画像とを用いて、基本的にPUを処理単位として、動き予測（インター予測）を行う。さらに、動き予測補償部１１５は、動き予測により検出される動きベクトルに応じて動き補償を行い、予測画像を生成する。動き予測補償部１１５は、あらかじめ用意された複数のインター予測モードで、インター予測を行い、予測画像を生成する。

動き予測補償部１１５は、複数のインター予測モードそれぞれについて得られた予測画像の所定のコスト関数に基づいて、最適なインター予測モードを選択する。さらに、動き予測補償部１１５は、最適なインター予測モードで生成された予測画像を、予測画像選択部１１６に供給する。

また、動き予測補償部１１５は、コスト関数に基づいて選択されたインター予測モードを示す予測モードや、そのインター予測モードで符号化された符号化データを復号する際に必要な動きベクトル等の動き情報等を、可逆符号化部１０６に供給する。

予測画像選択部１１６は、演算部１０３及び１１０に供給する予測画像の供給元（イントラ予測部１１４又は動き予測補償部１１５）を選択し、その選択した方の供給元から供給される予測画像を、演算部１０３及び１１０に供給する。

レート制御部１１７は、蓄積バッファ１０７に蓄積された符号化データの符号量に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御する。すなわち、レート制御部１１７は、蓄積バッファ１０７のオーバーフロー及びアンダーフローが生じないように、符号化データの目標符号量を設定し、量子化部１０５に供給する。

＜クラス分類適応フィルタ１１１の構成例＞

図１０は、図９のクラス分類適応フィルタ１１１の構成例を示すブロック図である。

図１０において、クラス分類適応フィルタ１１１は、画像変換装置１３１及び学習装置１３２を有する。

画像変換装置１３１には、演算部１１０（図９）から復号途中画像が供給されるとともに、学習装置１３２からクラスごとのタップ係数が供給される。さらに、画像変換装置１３１には、符号化情報が供給される。

画像変換装置１３１は、復号途中画像を第１の画像として、クラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、フレームメモリ１１２（図９）に供給する。

なお、画像変換装置１３１は、クラス分類適応処理において、クラス分類を、必要に応じて、符号化情報を用いて行う。

学習装置１３２には、並べ替えバッファ１０２（図９）から元画像が供給されるとともに、演算部１１０（図９）から復号途中画像が供給される。さらに、学習装置１３２には、符号化情報が供給される。

学習装置１３２は、復号途中画像を生徒データとするとともに、元画像を教師データとして、クラスごとのタップ係数を求める学習（以下、タップ係数学習ともいう）を行う。

さらに、学習装置１３２は、タップ係数学習により得られるクラスごとのタップ係数を、フィルタ情報として、画像変換装置１３１及び可逆符号化部１０６（図９）に供給する。

なお、学習装置１３２は、タップ係数学習において、クラス分類を、必要に応じて、符号化情報を用いて行う。

＜画像変換装置１３１の構成例＞

図１１は、図１０の画像変換装置１３１の構成例を示すブロック図である。

なお、図中、図２の画像変換装置２０と対応する部分については、同一の符号を付してあり、その説明は、適宜省略する。

図１１において、画像変換装置１３１は、タップ選択部２１ないし予測演算部２５を有する。

したがって、画像変換装置１３１は、図２の画像変換装置２０と同様に構成される。

但し、画像変換装置１３１では、復号途中画像が、第１の画像として、タップ選択部２１及び２２に供給され、予測演算部２５では、フィルタ後画像が第２の画像として求められる。

また、画像変換装置１３１では、符号化情報が、クラス分類部２３に供給され、クラス分類部２３が、クラスタップや符号化情報を必要に応じて用いてクラス分類を行う。

さらに、画像変換装置１３１では、学習装置１３２で得られたフィルタ情報としてのクラスごとのタップ係数が、係数取得部２４に供給されて記憶される。

図１２は、図１１のクラス分類部２３で行われるクラス分類の例を説明する図である。

クラス分類部２３では、クラスタップとしての復号途中画像の画素の画素値から得られる注目画素の画像特徴量、及び、注目画素の符号化情報のうちの一方、又は、両方を用いて、クラス分類を行うことができる。

クラス分類に用いる画像特徴量としては、例えば、ADRC処理により得られるADRCコード（ADRC値）を採用することができる。

図１２は、1ビットADRC処理の例を説明する図である。

ここで、復号途中画像の画素を、画素番号を付して特定することとし、画素番号iの画素を画素iとも記載する。

図１２では、復号途中画像において、画素0が注目画素になっている。

そして、注目画素としての画素0を中心とする十字型の9画素がクラスタップを構成している。

すなわち、画素0、画素0の上に隣接する2画素である画素1及び画素2、画素0の左に隣接する2画素である画素3及び画素4、画素0の右に隣接する2画素である画素5及び画素6、並びに、画素０の下に隣接する2画素である画素7及び画素8の、合計で9画素0ないし8が、注目画素である画素0のクラスタップを構成している。

クラス分類部２３は、クラスタップを構成する画素0ないし8の画素値の最大値MAXと最小値MINを検出し、その最大値MAXと最小値MINとの間の中間値（平均値）を、量子化の閾値として求める。

さらに、クラス分類部２３は、画素0ないし8の画素値を、閾値と比較し、画素値が閾値以上である場合には、量子化値1に量子化し、画素値が閾値以上でない場合には、量子化値0に量子化する。

そして、クラス分類部２３は、画素0ないし8の画素値の量子化値を、例えば、画素番号順に並べたコードを、ADRCコードとして求める。

いま、説明を簡単にするため、クラス分類部２３が、画像特徴量としてのADRCコードのみを用いて、注目画素（画素0)のクラス分類を行うこととすると、クラス分類部２３は、注目画素を、例えば、ADRCコードに対応するクラスコードのクラスにクラス分類する。

ここで、例えば、クラスコードが10進数で表されることとすると、ADRCコードに対応するクラスコードとは、ADRCコードを2進数とみなして、その2進数のADRCコードを10進数に変換した値を意味する。

この場合、例えば、画素0ないし8の画素値の量子化値を画素番号順に並べたADRCコードが、000011100であれば、そのADRCコード000011100に対応するクラスコードは、28になる。

なお、図１２では、最大値MAXと最小値MINとの間の１つの値を、量子化の閾値とする1ビットADRC処理を行うこととしたが、複数の値を量子化の閾値とすることで、クラスタップを構成する各画素の画素値を、複数であるNビットに量子化するNビットADRC処理を行うことができる。

また、クラスタップが、9個の画素0ないし8で構成され、1ビットADRC処理によるクラス分類を行う場合、クラス数は、2⁹クラスになるが、クラス分類により得られるクラス数は、縮退することができる。

例えば、1ビットADRC処理によるクラス分類を行う場合、その1ビットADRC処理により得られるADRCコードとしての2進数と、その2進数のビットを反転した反転2進数とについては、同一のクラスにクラス分類する、クラス数の縮退を行うことにより、クラス数は、縮退を行わない場合の1/2にすることができる。

例えば、9個の画素0ないし8で構成されるクラスタップを対象とした1ビットADRC処理によるクラス分類を行う場合、クラス数の縮退を行うことにより、クラス数を、2^9-1クラスにすることができる。

なお、ADRCについては、例えば、特許第4240322号公報に記載されている。

ここで、クラスタップは、図１２に示したような、注目画素を中心とする十字型の9画素に限定されるものではない。

すなわち、クラスタップとしては、例えば、注目画素を中心とする3×3画素の正方形状の9画素や、注目画素を中心とする、水平方向及び垂直方向を対角線とする菱形状の13画素を採用することができる。

さらに、クラスタップは、注目画素のフレーム（ピクチャ）である注目フレームの他、注目画素に隣接するフレーム等の注目フレーム以外のフレームの画素を含めて構成することができる。

また、図１２では、クラス分類に用いる画像特徴量として、クラスタップから得られるADRCコードを採用することとしたが、画像特徴量としては、その他、例えば、クラスタップを構成する画素の画素値のダイナミックレンジや差分絶対値和等のADRCコード以外の画像特徴量を採用することができる。

クラス分類に用いる画像特徴量として、例えば、クラスタップを構成する画素の画素値のダイナミックレンジを採用する場合、例えば、ダイナミックレンジを、1以上の閾値で閾値処理することにより、注目画素を2以上のクラスのうちのいずれかのクラスにクラス分類することができる。

さらに、クラス分類は、ADRCコード等の１つの画像特徴量ではなく、例えば、ADRCコード及びダイナミックレンジ等の複数の画像特徴量を用いて行うことができる。

また、クラス分類は、注目画素の画像特徴量の他、注目画素の符号化情報を用いて行うことができる。

クラス分類に用いる注目画素の符号化情報としては、例えば、注目画素を含むCUやPU等のブロック内における注目画素の位置を表すブロック位相や、注目画素を含むピクチャのピクチャタイプ、注目画素を含むPUの量子化パラメータQP等を採用することができる。

クラス分類に用いる注目画素の符号化情報として、ブロック位相を採用する場合には、例えば、注目画素がブロックの境界の画素であるか否かによって、注目画素をクラス分類することができる。

また、クラス分類に用いる注目画素の符号化情報として、ピクチャタイプを採用する場合には、例えば、注目画素を含むピクチャが、Iピクチャ、Pピクチャ、及び、Bピクチャのうちのいずれであるかによって、注目画素をクラス分類することができる。

さらに、クラス分類に用いる注目画素の符号化情報として、量子化パラメータQPを採用する場合には、例えば、量子化の粗さ（細かさ）によって、注目画素をクラス分類することができる。

また、クラス分類は、画像特徴量又は符号化情報を用いて行う他、例えば、画像特徴量及び符号化情報の両方を用いて行うことができる。

＜学習装置１３２の構成例＞

図１３は、図１０の学習装置１３２の構成例を示すブロック図である。

なお、図中、図３及び図４の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図１３において、学習装置１３２は、学習部３３を有する。学習部３３は、タップ選択部４１及び４２、クラス分類部４３、足し込み部４４、並びに、係数算出部４５を有する。

したがって、図１３の学習装置１３２は、学習部３３を有する点で、図３の場合と共通する。さらに、学習装置１３２は、学習部３３が、タップ選択部４１ないし係数算出部４５を有する点で、図４の場合と共通する。

但し、図１３の学習装置１３２は、教師データ生成部３１及び生徒データ生成部３２を有しない点で、図３の場合と相違する。

さらに、図１３の学習装置１３２は、学習部３３において、クラス分類部４３に、符号化情報が供給される点で、図４の場合と相違する。

図１３の学習装置１３２では、クラス分類部４３が、クラスタップや符号化情報を必要に応じて用いて、図１１のクラス分類部２３と同様のクラス分類を行う。

また、図１３の学習装置１３２では、復号途中画像を生徒データとして用いるとともに、その復号途中画像に対応する元画像を教師データとして用いて、タップ係数の学習が行われる。

そして、図１３の学習装置１３２では、係数算出部４５で求められたクラスごとのタップ係数が、画像変換装置１３１（図１０）に供給されるとともに、フィルタ情報として、可逆符号化部１０６（図９）に供給される。

なお、タップ係数の学習は、元画像の符号化と並列して行うこともできるし、元画像の符号化とは関係なく、前もって行っておくこともできる。

タップ係数の学習を、元画像の符号化とは関係なく、前もって行う場合には、複数のカテゴリの元画像を教師データとして用いて、カテゴリごとに、タップ係数の学習を行うことができる。そして、複数のカテゴリのタップ係数のうちの、例えば、所定のコスト関数を最小にするカテゴリのタップ係数を、画像変換装置１３１でのクラス分類適応処理に用いるとともに、フィルタ情報として、可逆符号化部１０６から伝送することができる。

＜符号化処理＞

図１４は、図９の符号化装置１１の符号化処理の例を説明するフローチャートである。

なお、図１４に示す符号化処理の各ステップの順番は、説明の便宜上の順番であり、実際の符号化処理の各ステップは、適宜、並列的に、必要な順番で行われる。後述する符号化処理についても、同様である。

符号化装置１１において、クラス分類適応フィルタ１１１の学習装置１３２（図１０）は、そこに供給される復号途中画像を生徒データとするとともに、その復号途中画像に対応する元画像を教師データとして、適宜、学習を行っている。そして、学習装置１３２は、ステップＳ１１において、フィルタ情報としてのタップ係数の更新タイミングであるかどうかを判定する。

ここで、フィルタ情報の更新タイミングは、例えば、１以上のフレーム（ピクチャ）ごとや、１以上のシーケンスごと、１以上のスライスごと等のように、あらかじめ決めておくことができる。

また、例えば、所定のコスト関数が閾値以下にならなくなったときを、フィルタ情報の更新タイミングとして採用することができる。

ステップＳ１１において、フィルタ情報の更新タイミングでないと判定された場合、処理は、ステップＳ１２及びＳ１３をスキップして、ステップＳ１４に進む。

また、ステップＳ１１において、フィルタ情報の更新タイミングであると判定された場合、処理は、ステップＳ１２に進み、画像変換装置１３１は、フィルタ情報としてのタップ係数を、学習装置１３２から供給される最新のフィルタ情報としてのタップ係数に更新する。

すなわち、画像変換装置１３１（図１１）は、係数取得部２４に、学習装置１３２から供給される最新のタップ係数を記憶させる。

そして、処理は、ステップＳ１２からステップＳ１３に進み、可逆符号化部１０６は、学習装置１３２から供給される最新のフィルタ情報を、伝送対象に設定して、処理は、ステップＳ１４に進む。伝送対象に設定された最新のフィルタ情報は、後述するステップＳ２７において符号化データに含められて伝送される。

ステップＳ１４以降では、元画像の予測符号化処理が行われる。

すなわち、ステップＳ１４において、A/D変換部１０１は、元画像をA/D変換し、並べ替えバッファ１０２に供給して、処理は、ステップＳ１５に進む。

ステップＳ１５において、並べ替えバッファ１０２は、A/D変換部１０１からの元画像を記憶し、符号化順に並べ替えて出力し、処理は、ステップＳ１６に進む。

ステップＳ１６では、イントラ予測部１１４は、イントラ予測モードのイントラ予測処理を行い、処理は、ステップＳ１７に進む。ステップＳ１７において、動き予測補償部１１５は、インター予測モードでの動き予測や動き補償を行うインター動き予測処理を行い、処理は、ステップＳ１８に進む。

イントラ予測部１１４のイントラ予測処理、及び、動き予測補償部１１５のインター動き予測処理では、各種の予測モードのコスト関数が演算されるとともに、予測画像が生成される。

ステップＳ１８では、予測画像選択部１１６は、イントラ予測部１１４及び動き予測補償部１１５で得られる各コスト関数に基づいて、最適な予測モードを決定する。そして、予測画像選択部１１６は、イントラ予測部１１４により生成された予測画像と、動き予測補償部１１５により生成された予測画像のうちの最適な予測モードの予測画像を選択して出力し、処理は、ステップＳ１８からステップＳ１９に進む。

ステップＳ１９では、演算部１０３は、並べ替えバッファ１０２が出力する元画像である符号化対象の対象画像と、予測画像選択部１１６が出力する予測画像との残差を演算し、直交変換部１０４に供給して、処理は、ステップＳ２０に進む。

ステップＳ２０では、直交変換部１０４は、演算部１０３からの残差を直交変換し、その結果得られる変換係数を、量子化部１０５に供給して、処理は、ステップＳ２１に進む。

ステップＳ２１では、量子化部１０５は、直交変換部１０４からの変換係数を量子化し、その量子化により得られる量子化係数を、可逆符号化部１０６及び逆量子化部１０８に供給して、処理は、ステップＳ２２に進む。

ステップＳ２２では、逆量子化部１０８は、量子化部１０５からの量子化係数を逆量子化し、その結果得られる変換係数を、逆直交変換部１０９に供給して、処理は、ステップＳ２３に進む。ステップＳ２３では、逆直交変換部１０９は、逆量子化部１０８からの変換係数を逆直交変換し、その結果得られる残差を、演算部１１０に供給して、処理は、ステップＳ２４に進む。

ステップＳ２４では、演算部１１０は、逆直交変換部１０９からの残差と、予測画像選択部１１６が出力する予測画像とを加算し、演算部１０３での残差の演算の対象となった元画像に対応する復号途中画像を生成する。演算部１１０は、復号途中画像を、クラス分類適応フィルタ１１１又はフレームメモリ１１２に供給し、処理は、ステップＳ２４からステップＳ２５に進む。

演算部１１０からクラス分類適応フィルタ１１１に、復号途中画像が供給される場合、ステップＳ２５において、クラス分類適応フィルタ１１１は、演算部１１０からの復号途中画像に、ILFの処理としてのクラス分類適応処理（クラス分類適応フィルタ処理）を施す。復号途中画像に、クラス分類適応処理が施されることにより、復号途中画像をILFでフィルタリングする場合よりも元画像に近いフィルタ後画像が求められる。

クラス分類適応フィルタ１１１は、クラス分類適応処理により得られるフィルタ後画像を、フレームメモリ１１２に供給して、処理は、ステップＳ２５からステップＳ２６に進む。

ステップＳ２６では、フレームメモリ１１２は、演算部１１０から供給される復号途中画像、又は、クラス分類適応フィルタ１１１から供給されるフィルタ後画像を、復号画像として記憶し、処理は、ステップＳ２７に進む。フレームメモリ１１２に記憶された復号画像は、ステップＳ１７やＳ１８で、予測画像を生成する元となる参照画像として使用される。

ステップＳ２７では、可逆符号化部１０６は、量子化部１０５からの量子化係数を符号化する。さらに、可逆符号化部１０６は、量子化部１０５での量子化に用いられた量子化パラメータQPや、イントラ予測部１１４でのイントラ予測処理で得られた予測モード、動き予測補償部１１５でのインター動き予測処理で得られた予測モードや動き情報等の符号化情報を必要に応じて符号化し、符号化データに含める。

また、可逆符号化部１０６は、ステップＳ１３で伝送対象に設定されたフィルタ情報を符号化し、符号化データに含める。そして、可逆符号化部１０６は、符号化データを、蓄積バッファ１０７に供給し、処理は、ステップＳ２７からステップＳ２８に進む。

ステップＳ２８において、蓄積バッファ１０７は、可逆符号化部１０６からの符号化データを蓄積し、処理は、ステップＳ２９に進む。蓄積バッファ１０７に蓄積された符号化データは、適宜読み出されて伝送される。

ステップＳ２９では、レート制御部１１７は、蓄積バッファ１０７に蓄積されている符号化データの符号量（発生符号量）に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化部１０５の量子化動作のレートを制御し、符号化処理は終了する。

図１５は、図１４のステップＳ２５で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ１１１の画像変換装置１３１（図１１）では、ステップＳ４１において、タップ選択部２１が、演算部１１０から供給される復号途中画像（としてのブロック）の画素のうちの、まだ、注目画素とされていない画素の１つを、注目画素として選択し、処理は、ステップＳ４２に進む。

ステップＳ４２において、タップ選択部２１及び２２が、演算部１１０から供給される復号途中画像から、注目画素についての予測タップ及びクラスタップとする画素を、それぞれ選択する。そして、タップ選択部２１は、予測タップを予測演算部２５に供給し、タップ選択部２２は、クラスタップを、クラス分類部２３に供給する。

その後、処理は、ステップＳ４２からステップＳ４３に進み、クラス分類部２３は、注目画素についてのクラスタップ、及び、注目画素についての符号化情報を用いて、注目画素のクラス分類を行う。

すなわち、クラス分類では、ステップＳ５１において、クラス分類部２３は、タップ選択部２２からのクラスタップを構成する画素から、例えば、ADRCコード（ADRC値）等の画像特徴量を抽出（算出）し、処理は、ステップＳ５２に進む。

ステップＳ５２では、クラス分類部２３は、注目画素についての必要な符号化情報を取得し、あらかじめ決められた規則に従って、符号化情報を、情報コードに変換して、処理は、ステップＳ５３に進む。

すなわち、例えば、符号化情報が、Iピクチャ、Pピクチャ、又は、Bピクチャを表すピクチャタイプである場合、Iピクチャ、Pピクチャ、及び、Bピクチャには、例えば、情報コード0,1,2がそれぞれ割り当てられており、その割り当てに従い、注目画素のピクチャタイプが、情報コードに変換される。

ステップＳ５３では、クラス分類部２３は、画像特徴量及び情報コードから、注目画素のクラスを表すクラスコードを生成し、係数取得部２４に供給して、ステップＳ４３のクラス分類を終了する。

例えば、画像特徴量がADRCコードである場合には、クラス分類部２３は、画像特徴量としてのADRCコードの上位ビットに、情報コードを付加して得られる数値を、注目画素のクラスを表すクラスコードとして生成する。

ステップＳ４３のクラス分類が終了すると、処理は、ステップＳ４４に進み、係数取得部２４が、クラス分類部２３から供給されるクラスコードが表すクラスのタップ係数を取得し、予測演算部２５に供給して、処理は、ステップＳ４５に進む。

ステップＳ４５では、予測演算部２５は、タップ選択部２１からの予測タップと、係数取得部２４からのタップ係数とを用いて、式（１）予測演算を行う。これにより、予測演算部２５は、注目画素に対応する元画像の対応画素の画素値の予測値を、フィルタ後画像の画素値として求め、処理は、ステップＳ４６に進む。

ステップＳ４６では、タップ選択部２１が、演算部１１０からの復号途中画像（としてのブロック）の画素の中に、まだ、注目画素としていない画素があるかどうかを判定する。ステップＳ４６において、まだ、注目画素としていない画素があると判定された場合、処理は、ステップＳ４１に戻り、以下、同様の処理が繰り返される。

また、ステップＳ４６において、まだ、注目画素とされていない画素がないと判定された場合、処理は、ステップＳ４７に進み、予測演算部２５は、演算部１１０からの復号途中画像（としてのブロック）に対して得られた画素値で構成されるフィルタ後画像を、フレームメモリ１１２（図９）に供給する。そして、クラス分類適応処理は終了され、処理はリターンする。

＜復号装置１２の第１の構成例＞

図１６は、図１の復号装置１２の第１の構成例を示すブロック図である。

図１６において、復号装置１２は、蓄積バッファ２０１、可逆復号部２０２、逆量子化部２０３、逆直交変換部２０４、演算部２０５、クラス分類適応フィルタ２０６、並べ替えバッファ２０７、及び、D/A変換部２０８を有する。また、復号装置１２は、フレームメモリ２１０、選択部２１１、イントラ予測部２１２、動き予測補償部２１３、及び、選択部２１４を有する。

蓄積バッファ２０１は、符号化装置１１から伝送されてくる符号化データを一時蓄積し、所定のタイミングにおいて、その符号化データを、可逆復号部２０２に供給する。

可逆復号部２０２は、蓄積バッファ２０１からの符号化データを取得する。したがって、可逆復号部２０２は、符号化装置１１から伝送されてくる符号化データ、ひいては、符号化データに含まれる符号化情報やフィルタ情報を受け取る受け取り部として機能する。

可逆復号部２０２は、蓄積バッファ２０１から取得した符号化データを、図９の可逆符号化部１０６の符号化方式に対応する方式で復号する。

そして、可逆復号部２０２は、符号化データの復号により得られる量子化係数を、逆量子化部２０３に供給する。

また、可逆復号部２０２は、符号化データの復号により、符号化情報やフィルタ情報が得られた場合には、必要な符号化情報を、イントラ予測部２１２や動き予測補償部２１３その他の必要なブロックに供給する。

さらに、可逆復号部２０２は、符号化情報及びフィルタ情報を、クラス分類適応フィルタ２０６に供給する。

逆量子化部２０３は、可逆復号部２０２からの量子化係数を、図９の量子化部１０５の量子化方式に対応する方式で逆量子化し、その逆量子化により得られる変換係数を、逆直交変換部２０４に供給する。

逆直交変換部２０４は、逆量子化部２０３から供給される変換係数を、図９の直交変換部１０４の直交変換方式に対応する方式で逆直交変換し、その結果得られる残差を、演算部２０５に供給する。

演算部２０５には、逆直交変換部２０４から残差が供給される他、選択部２１４を介して、イントラ予測部２１２又は動き予測補償部２１３から予測画像が供給される。

演算部２０５は、逆直交変換部２０４からの残差と、選択部２１４からの予測画像とを加算し、復号途中画像を生成して、クラス分類適応フィルタ２０６、又は、並べ替えバッファ２０７及びフレームメモリ２１０に供給する。例えば、復号途中画像のうちの、イントラ予測に用いる参照画像となる復号途中画像は、並べ替えバッファ２０７及びフレームメモリ２１０に供給され、他の復号途中画像は、クラス分類適応フィルタ２０６に供給される。

クラス分類適応フィルタ２０６は、クラス分類適応フィルタ１１１と同様に、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF（の）処理を行う。

すなわち、クラス分類適応フィルタ２０６は、演算部２０５からの復号途中画像を第１の画像として、可逆復号部２０２からのフィルタ情報としてのクラスごとのタップ係数を用いたクラス分類適応処理（による画像変換）を、可逆復号部２０２からの符号化情報を必要に応じて用いて行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）出力する。

クラス分類適応フィルタ２０６が出力するフィルタ後画像は、クラス分類適応フィルタ１１１が出力するフィルタ後画像と同様の画像であり、並べ替えバッファ２０７及びフレームメモリ２１０に供給される。

並べ替えバッファ２０７は、演算部２０５から供給される復号途中画像や、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として一時記憶し、復号画像のフレーム（ピクチャ）の並びを、符号化（復号）順から表示順に並べ替え、D/A変換部２０８に供給する。

D/A変換部２０８は、並べ替えバッファ２０７から供給される復号画像をD/A変換し、図示せぬディスプレイに出力して表示させる。

フレームメモリ２１０は、演算部２０５から供給される復号途中画像や、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として一時記憶する。さらに、フレームメモリ２１０は、所定のタイミングにおいて、又は、イントラ予測部２１２や動き予測補償部２１３等の外部の要求に基づいて、復号画像を、予測画像の生成に用いる参照画像として、選択部２１１に供給する。

選択部２１１は、フレームメモリ２１０から供給される参照画像の供給先を選択する。選択部２１１は、イントラ符号化された画像を復号する場合、フレームメモリ２１０から供給される参照画像をイントラ予測部２１２に供給する。また、選択部２１１は、インター符号化された画像を復号する場合、フレームメモリ２１０から供給される参照画像を動き予測補償部２１３に供給する。

イントラ予測部２１２は、可逆復号部２０２から供給される符号化情報に含まれる予測モードに従い、図９のイントラ予測部１１４において用いられたイントラ予測モードで、フレームメモリ２１０から選択部２１１を介して供給される参照画像を用いてイントラ予測を行う。そして、イントラ予測部２１２は、イントラ予測により得られる予測画像を、選択部２１４に供給する。

動き予測補償部２１３は、可逆復号部２０２から供給される符号化情報に含まれる予測モードに従い、図９の動き予測補償部１１５において用いられたインター予測モードで、フレームメモリ２１０から選択部２１１を介して供給される参照画像を用いてインター予測を行う。インター予測は、可逆復号部２０２から供給される符号化情報に含まれる動き情報等を必要に応じて用いて行われる。

動き予測補償部２１３は、インター予測により得られる予測画像を、選択部２１４に供給する。

選択部２１４は、イントラ予測部２１２から供給される予測画像、又は、動き予測補償部２１３から供給される予測画像を選択し、演算部２０５に供給する。

＜クラス分類適応フィルタ２０６の構成例＞

図１７は、図１６のクラス分類適応フィルタ２０６の構成例を示すブロック図である。

図１７において、クラス分類適応フィルタ２０６は、画像変換装置２３１を有する。

画像変換装置２３１には、演算部２０５（図１６）から復号途中画像が供給されるとともに、可逆復号部２０２からフィルタ情報としてのクラスごとのタップ係数、及び、符号化情報が供給される。

画像変換装置２３１は、図１０の画像変換装置１３１と同様に、復号途中画像を第１の画像として、クラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、並べ替えバッファ２０７及びフレームメモリ２１０（図１６）に供給する。

なお、画像変換装置２３１は、クラス分類適応処理において、図１０の画像変換装置１３１と同様に、クラス分類を、必要に応じて、符号化情報を用いて行う。

＜画像変換装置２３１の構成例＞

図１８は、図１７の画像変換装置２３１の構成例を示すブロック図である。

図１８において、画像変換装置２３１は、タップ選択部２４１及び２４２、クラス分類部２４３、係数取得部２４４、並びに、予測演算部２４５を有する。

タップ選択部２４１ないし予測演算部２４５は、画像変換装置１３１（図１１）を構成するタップ選択部２１ないし予測演算部２５とそれぞれ同様に構成される。

すなわち、タップ選択部２４１及び２４２には、演算部２０５（図１６）から復号途中画像が供給される。

タップ選択部２４１は、演算部２０５からの復号途中画像を第１の画像として、復号途中画像の画素を、順次、注目画素に選択する。

さらに、タップ選択部２４１は、注目画素について、復号途中画像から、図１１のタップ選択部２１で選択される予測タップと同一構造の予測タップを選択し、予測演算部２４５に供給する。

タップ選択部２４２は、注目画素について、演算部２０５からの復号途中画像を第１の画像として、復号途中画像の画素から、図１１のタップ選択部２２で選択されるクラスタップと同一構造のクラスタップを選択し、クラス分類部２４３に供給する。

クラス分類部２４３には、タップ選択部２４２からクラスタップが供給される他、可逆復号部２０２（図１６）から、符号化情報が供給される。

クラス分類部２４３は、タップ選択部２４２からのクラスタップ、及び、可逆復号部２０２からの符号化情報を用いて、図１１のクラス分類部２３と同一のクラス分類を行い、注目画素のクラス（を表すクラスコード）を、係数取得部２４４に供給する。

係数取得部２４４には、クラス分類部２４３から注目画素のクラスが供給される他、可逆復号部２０２からフィルタ情報としてのクラスごとのタップ係数が供給される。

係数取得部２４４は、可逆復号部２０２からフィルタ情報としてのクラスごとのタップ係数が供給されると、記憶しているタップ係数を、可逆復号部２０２からタップ係数に更新する。

さらに、係数取得部２４４は、記憶しているタップ係数から、クラス分類部２４３からの注目画素のクラスのタップ係数を取得し、予測演算部２４５に供給する。

予測演算部２４５は、タップ選択部２４１からの予測タップと、係数取得部２４４からのタップ係数とを用いて、式（１）の予測演算を行い、復号途中画像の注目画素に対応する元画像の対応画素の画素値の予測値を、第２の画像としてのフィルタ後画像の画素の画素値として求めて出力する。

＜復号処理＞

図１９は、図１６の復号装置１２の復号処理の例を説明するフローチャートである。

なお、図１９に示す復号処理の各ステップの順番は、説明の便宜上の順番であり、実際の復号処理の各ステップは、適宜、並列的に、必要な順番で行われる。後述する復号処理についても、同様である。

復号処理では、ステップＳ６１において、蓄積バッファ２０１は、符号化装置１１から伝送されてくる符号化データを一時蓄積し、適宜、可逆復号部２０２に供給して、処理は、ステップＳ６２に進む。

ステップＳ６２では、可逆復号部２０２は、蓄積バッファ２０１から供給される符号化データを受け取って復号し、その復号により得られる量子化係数を、逆量子化部２０３に供給する。

また、可逆復号部２０２は、符号化データの復号により、符号化情報やフィルタ情報が得られた場合、必要な符号化情報を、イントラ予測部２１２や動き予測補償部２１３その他の必要なブロックに供給する。

その後、処理は、ステップＳ６２からステップＳ６３に進み、クラス分類適応フィルタ２０６は、可逆復号部２０２からフィルタ情報が供給されたかどうかを判定する。

ステップＳ６３において、フィルタ情報が供給されていないと判定された場合、処理は、ステップＳ６４をスキップして、ステップＳ６５に進む。

また、ステップＳ６３において、フィルタ情報が供給されたと判定された場合、処理は、ステップＳ６４に進み、クラス分類適応フィルタ２０６の画像変換装置２３１（図１８）は、係数取得部２４４に、可逆復号部２０２からのフィルタ情報としてのクラスごとのタップ係数を取得させ、記憶しているタップ係数を、可逆復号部２０２からのタップ係数に更新させる。

そして、処理は、ステップＳ６４からステップＳ６５に進み、逆量子化部２０３は、可逆復号部２０２からの量子化係数を逆量子化し、その結果得られる変換係数を、逆直交変換部２０４に供給して、処理は、ステップＳ６６に進む。

ステップＳ６６では、逆直交変換部２０４は、逆量子化部２０３からの変換係数を逆直交変換し、その結果得られる残差を、演算部２０５に供給して、処理は、ステップＳ６７に進む。

ステップＳ６７では、イントラ予測部２１２又は動き予測補償部２１３が、フレームメモリ２１０から選択部２１１を介して供給される参照画像、及び、可逆復号部２０２から供給される符号化情報を用いて、予測画像を生成する予測処理を行う。そして、イントラ予測部２１２又は動き予測補償部２１３は、予測処理により得られる予測画像を、選択部２１４に供給し、処理は、ステップＳ６７からステップＳ６８に進む。

ステップＳ６８では、選択部２１４は、イントラ予測部２１２又は動き予測補償部２１３から供給される予測画像を選択し、演算部２０５に供給して、処理は、ステップＳ６９に進む。

ステップＳ６９では、演算部２０５は、逆直交変換部２０４からの残差と、選択部２１４からの予測画像を加算することにより、復号途中画像を生成する。そして、演算部２０５は、復号途中画像を、クラス分類適応フィルタ２０６、又は、並べ替えバッファ２０７及びフレームメモリ２１０に供給して、処理は、ステップＳ６９からステップＳ７０に進む。

演算部２０５からクラス分類適応フィルタ２０６に、復号途中画像が供給される場合、ステップＳ７０において、クラス分類適応フィルタ２０６は、演算部２０５からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施す。復号途中画像に、クラス分類適応処理が施されることにより、符号化装置１１の場合と同様に、復号途中画像をILFでフィルタリングする場合よりも元画像に近いフィルタ後画像が求められる。

クラス分類適応フィルタ２０６は、クラス分類適応処理により得られるフィルタ後画像を、並べ替えバッファ２０７及びフレームメモリ２１０に供給して、処理は、ステップＳ７０からステップＳ７１に進む。

ステップＳ７１では、並べ替えバッファ２０７は、演算部２０５から供給される復号途中画像、又は、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として一時記憶する。さらに、並べ替えバッファ２０７は、記憶した復号画像を、表示順に並べ替えて、D/A変換部２０８に供給し、処理は、ステップＳ７１からステップＳ７２に進む。

ステップＳ７２では、D/A変換部２０８は、並べ替えバッファ２０７からの復号画像をD/A変換し、処理は、ステップＳ７３に進む。D/A変換後の復号画像は、図示せぬディスプレイに出力されて表示される。

ステップＳ７３では、フレームメモリ２１０は、演算部２０５から供給される復号途中画像、又は、クラス分類適応フィルタ２０６から供給されるフィルタ後画像を、復号画像として記憶し、復号処理は終了する。フレームメモリ２１０に記憶された復号画像は、ステップＳ６７の予測処理で、予測画像を生成する元となる参照画像として使用される。

図２０は、図１９のステップＳ７０で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ２０６の画像変換装置２３１（図１８）では、ステップＳ８１において、タップ選択部２４１が、演算部２０５から供給される復号途中画像（としてのブロック）の画素のうちの、まだ、注目画素とされていない画素の１つを、注目画素として選択し、処理は、ステップＳ８２に進む。

ステップＳ８２において、タップ選択部２４１及び２４２が、演算部２０５から供給される復号途中画像から、注目画素についての予測タップ及びクラスタップとする画素を、それぞれ選択する。そして、タップ選択部２４１は、予測タップを予測演算部２４５に供給し、タップ選択部２４２は、クラスタップを、クラス分類部２４３に供給する。

その後、処理は、ステップＳ８２からステップＳ８３に進み、クラス分類部２４３は、タップ選択部２４２から供給される注目画素についてのクラスタップ、及び、可逆復号部２０２から供給される注目画素についての符号化情報を用いて、図１５で説明した場合と同様の、注目画素のクラス分類を行う。

クラス分類部２４３は、クラス分類により得られる注目画素のクラスを表すクラスコードを生成し、係数取得部２４４に供給して、処理は、ステップＳ８３からステップＳ８４に進む。

ステップＳ８４では、係数取得部２４４が、クラス分類部２４３から供給されるクラスコードが表すクラスのタップ係数を取得し、予測演算部２４５に供給して、処理は、ステップＳ８５に進む。

ステップＳ８５では、予測演算部２４５は、タップ選択部２４１からの予測タップと、係数取得部２４４からのタップ係数とを用いて、式（１）予測演算を行う。これにより、予測演算部２４５は、注目画素に対応する元画像の対応画素の画素値の予測値を、フィルタ後画像の画素値として求め、処理は、ステップＳ８６に進む。

ステップＳ８６では、タップ選択部２４１が、演算部２０５からの復号途中画像（としてのブロック）の画素の中に、まだ、注目画素としていない画素があるかどうかを判定する。ステップＳ８６において、まだ、注目画素としていない画素があると判定された場合、処理は、ステップＳ８１に戻り、以下、同様の処理が繰り返される。

また、ステップＳ８６において、まだ、注目画素とされていない画素がないと判定された場合、処理は、ステップＳ８７に進み、予測演算部２４５は、演算部２０５からの復号途中画像（としてのブロック）に対して得られた画素値で構成されるフィルタ後画像を、並べ替えバッファ２０７及びフレームメモリ２１０（図９）に供給する。そして、クラス分類適応処理は終了され、処理はリターンする。

以上のように、符号化装置１１及び復号装置１２では、ILF処理を、クラス分類適応処理によって行うので、ILFの処理結果よりも元画像に近いフィルタ後画像を得ることができる。その結果、復号画像のS/Nを大きく改善することができる。さらに、元画像に近いフィルタ後画像を得ることができることから、残差が小さくなり、タップ係数をオーバーヘッドとして符号化データに含めても、特に、4kや8k等と呼ばれるデータ量の多い高解像度の元画像については、圧縮効率を、大きく改善することができる。

ここで、図９等で説明したように、ILFとしては、例えば、DF，SAO、及び、ALFがある。

DFは、量子化パラメータQPや、ブロックの境界の画素であるか否かによって、フィルタ強度を制御することで、ブロックノイズ（歪み）を低減する。

しかしながら、DFでは、ブロックに適用することができるフィルタ強度が、2種類と少ない。さらに、DFでは、フィルタ強度の制御の単位がスライスであり、画素ごとにフィルタ強度を制御することができない。

SAOでは、エッジ周辺のノイズを低減するか、又は、DC補正を行うかのフィルタモードが、CTUごとに切り替えられ、オフセット値を画素ごとに判定することで、リンギングの低減やDC補正が行われる。

しかしながら、SAOでは、フィルターモートの切り替えを、画素ごとに行うことが困難である。さらに、SAOでは、ノイズの低減と、DC補正とのうちのいずれかの処理しか行うことができず、両方の処理を同時に行うことができない。

ALFは、エッジの方向とアクティビティを用いて、15のクラスに分類するクラス分類を行い、クラスごとに、統計的に最適に作られたフィルタ係数によるフィルタ処理を行う。

しかしながら、ALFでは、フィルタ処理の単位が4×4画素単位であるために、画素ごとに、その画素の周辺の波形パターンやブロック位相に応じた細かいフィルタ強度の制御を行うことができない。さらに、ALFでは、クラス分類の対象となるクラス数が15クラスと少ないため、かかる点からも、細かいフィルタ強度の制御を行うことができない。

これに対して、クラス分類適応処理では、画素ごとに、ALFの15クラスよりも多いクラス数を対象としてクラス分類を行い、学習により得られる統計的に最適なタップ係数を用いて、復号途中画像をフィルタ後画像に画像変換するフィルタ処理を行うので、既存のILFよりも画質(S/N)を、大きく改善することができる。

特に、クラス分類適応処理では、画素ごとに、その画素の周辺の波形パターンを表現する画像特徴量としてのADRCコードや、ダイナミックレンジ等の画像特徴量と、量子化パラメータQPや、ピクチャタイプ、ブロック位相等の符号化情報とを用いてクラス分類を行うことで、フィルタ後画像として、元画像に極めて近い画像を得ることができる。その結果、予測符号化において、ILFを用いない場合は勿論、ILFを用いる場合と比較しても、画像のS/N及び圧縮効率を、大きく改善することができる。

＜クラス分類適応処理と、ILFのうちのALFとの相違＞

図２１は、クラス分類適応処理と、ILFのうちのALFとの、クラス分類、及び、フィルタ処理の相違を説明する図である。

ALFでは、4×4画素の小ブロックが、エッジの方向とアクティビティを用いて、15クラスのうちのいずれかにクラス分類される。

さらに、ALFでは、4×4画素の小ブロックが、その4×4画素の小ブロックのクラスのフィルタ係数を用いてフィルタ処理される。

また、ALFのフィルタ処理では、フィルタ処理の対象の対象画素に対するフィルタ係数を中心として、点対称のフィルタ係数が用いられる。

すなわち、ALFのフィルタ処理のフィルタ係数は、対象画素、対象画素の左に隣接する2画素、対象画像の右に隣接する2画素、対象画素の上に隣接する2画素、対象画素の下に隣接する2画素、対象画素の左上に隣接する1画素、対象画素の左下に隣接する1画素、対象画素の右上に隣接する1画素、及び、対象画素の右下に隣接する1画素の、合計で13画素に対する13個のフィルタ係数で構成される。

そして、対象画素の上に隣接する2画素のうちの遠い方の画素に対するフィルタ係数と、対象画素の下に隣接する2画素のうちの遠い方の画素に対するフィルタ係数とは、同一の係数C0とされる。

対象画素の左上に隣接する画素に対するフィルタ係数と、対象画像の右下に隣接する画素に対するフィルタ係数とは、同一の係数C1とされる。

対象画素の上に隣接する2画素のうちの近い方の画素に対するフィルタ係数と、対象画素の下に隣接する2画素のうちの近い方の画素に対するフィルタ係数とは、同一の係数C2とされる。

対象画素の左下に隣接する画素に対するフィルタ係数と、対象画像の右上に隣接する画素に対するフィルタ係数とは、同一の係数C3とされる。

対象画素の左に隣接する2画素のうちの遠い方の画素に対するフィルタ係数と、対象画素の右に隣接する2画素のうちの遠い方の画素に対するフィルタ係数とは、同一の係数C4とされる。

対象画素の左に隣接する2画素のうちの近い方の画素に対するフィルタ係数と、対象画素の右に隣接する2画素のうちの近い方の画素に対するフィルタ係数とは、同一の係数C5とされる。

対象画素に対するフィルタ係数は、係数C6とされる。

以上のように、ALFでは、4×4画素の小ブロックが、15クラスという少ないクラスにクラス分類され、さらに、クラスごとのフィルタ係数が、点対称になっているので、フィルタ処理の効果が、大きく制限される。

さらに、ALFでは、4×4画素の小ブロックのフィルタ処理に、同一のフィルタ係数が用いられるので、その4×4画素のすべてに、同一の（平均的な）フィルタ処理の効果が生じる。

一方、クラス分類適応処理では、クラス分類が、画素ごとに行われ、したがって、フィルタ処理としての式（１）の予測演算も、画素ごとに行われる。

また、クラス分類適応処理では、エッジの方向やアクティビティに制限されず、クラスタップから得られる画像特徴量や、符号化情報を用いて、注目画素の周辺の波形パターンや、ブロック内の注目画素の位置によって、注目画素をクラス分類することができる。

さらに、クラス分類のクラス数は、クラスタップとする画素の数や、クラス分類に用いる符号化情報の情報コード（図１５）への変換の仕方等によって、タップ係数のデータ量と、復号画像（フィルタ後画像）のS/N及び圧縮効率とを考慮して、任意の数に設計することができる。

例えば、いま説明を簡単にするために、クラスタップを8画素で構成し、1ビットADRC処理により得られる波形パターンを表すADRCコードでクラス分類を行うこととすると、クラス数は256クラスになる。

また、クラス分類適応処理では、フィルタ処理としての式（１）の予測演算に用いるタップ係数について、ALFのような点対称の制約や、フィルタ係数を13個とする制約はなく、そのため、フィルタ後画像の、元画像に対する統計的な誤差を、ALFよりも小さくするタップ係数を、学習により求めることができる。

さらに、クラス分類適応処理では、例えば、タップ係数のデータ量と、復号画像のS/N及び圧縮効率とを考慮して、タップ係数の数、すなわち、予測タップを構成する画素の数や、予測タップの構造を設計することができる。

また、クラス分類適応処理では、注目画素のフレームだけではなく、そのフレームの前後のフレームの画素も含めて、予測タップを構成することができる。

以上のように、クラス分類適応処理では、画素ごとに、クラス分類、及び、フィルタ処理としての式（１）の予測演算が行われるので、画素ごとに、その画素に適したフィルタ処理の効果を生じさせることができる。

その結果、例えば、エッジやテクスチャを潰しすぎずに、NR(Noise Reduction)の効果を生じさせることや、リンギングを抑制することができる。

また、クラス分類適応処理では、例えば、クラス分類を、ブロック位相等の符号化情報を用いて行うことで、注目画素がブロックの境界の画素であるかどうかによって、NRの効果を調整することができる。

さらに、クラス分類適応処理では、例えば、注目画素のフレームだけではなく、そのフレームの前後のフレームの画素も含めて、予測タップを構成することで、動きぼけ等の動きに起因する画質の劣化を改善することができる。

図２２は、クラス分類適応処理と、ILFのうちのALFとのクラス分類、及び、フィルタ処理の相違により生じる効果の相違を説明する図である。

ALFでは、4×4画素の小ブロックごとに、エッジ及びアクティビティを用いて、クラス分類が行われ、そのクラス分類により得られるクラスのフィルタ係数を用いて、4×4画素の小ブロックの各画素のフィルタ処理が行われる。

そのため、エッジ部分と平坦部分とが混在する場合に、平坦部分のノイズを除去する一方で、エッジ部分を鈍らせる（ディテールを潰す）ことや、逆に、エッジ部分を維持するが、平坦部分のノイズを十分に除去することができないことがある。

さらに、ALFでは、符号化処理（復号処理）の対象となる符号化ブロック（PUやCU等）内における画素の位置（ブロック位相）を考慮したクラス分類は行われないため、符号化ブロックの境界の画素で生じるブロック歪みを除去するフィルタ係数と、境界以外の位置の画素に生じる、ブロック歪み以外のノイズを除去するフィルタ係数とが、異なるクラスのフィルタ係数として用意されない。

そのため、ブロック歪みが生じている画素に、そのブロック歪みを除去するのに適切なフィルタ処理が施されるとは限らない。同様に、ブロック歪み以外のノイズが生じている画素に、そのノイズを除去するのに適切なフィルタ処理が施されるとは限らない。

これに対して、クラス分類適応処理では、画素ごとに、クラスタップから得られる画像特徴量としての波形パターンによってクラス分類を行い、そのクラス分類により得られるクラスのタップ係数を用いて、フィルタ処理としての式（１）の予測演算を、画素ごとに行うことができる。

したがって、エッジ部分の画素については、そのエッジ部分を維持し（ディテールを残し）、平坦部分の画素については、ノイズを十分に除去することができる。

さらに、クラス分類適応処理では、画素ごとに、符号化情報としてのブロック位相によってクラス分類を行い、そのクラス分類により得られるクラスのタップ係数を用いて、フィルタ処理としての式（１）の予測演算を、画素ごとに行うことができる。

したがって、ブロック歪みが生じている画素に、そのブロック歪みを除去するのに適切なフィルタ処理を施すとともに、ブロック歪み以外のノイズが生じている画素に、そのノイズを除去するのに適切なフィルタ処理を施すことができる。

ここで、本技術では、クラス分類適応処理が、符号化装置１１及び復号装置１２内で扱われる復号途中画像を対象として行われるので、ブロック位相、さらには、ブロック位相を特定するのに必要な符号化ブロックに関する情報（例えば、符号化ブロックのサイズや、符号化ブロックの境界等）は、符号化処理や復号処理において得ることができる。

なお、例えば、特許第4770711号公報には、MPEGデコーダが出力する復号画像を、ブロック位相を用いたクラス分類適応処理により高画質化する技術が記載されている。特許第4770711号公報に記載の技術では、MPEGデコーダの外部で、MPEGデコーダが出力する復号画像を対象としたクラス分類適応処理が行われるため、符号化ブロックに関する情報は、決め打ちするか、又は、何らかの方法で検出する必要がある。

図２３は、クラス分類適応処理の予測タップ及びクラスタップと、ILFのうちのALFのフィルタ係数に対する画素との相違を説明する図である。

ALFの13個のフィルタ係数は、いま符号化の対象になっている1フレームである注目フレーム内の画素に対するフィルタ係数であり、他のフレームの画素に対するフィルタ係数は、存在しない。

したがって、ALFのフィルタ処理は、注目フレーム内の画素（の画素値）のみを用いて行われるので、動きぼけ等の動きに起因する画質の劣化を改善することは困難である。

一方、クラス分類適応処理では、予測タップやクラスタップには、注目フレーム（図２３では、フレームT）内の画素の他、他のフレーム（図２３では、フレームT-1やフレームT+1）の画素を含めることができる。

すなわち、クラス分類適応処理では、注目フレームの注目画素から、動きベクトルだけ移動した位置の、注目フレームに隣接する隣接フレームの画素や、その画素の周辺の画素等を、予測タップやクラスタップに含めることができる。

したがって、クラス分類適応処理では、注目フレームの画素と、隣接フレームの画素ととから、クラスタップや予測タップを構成し、クラス分類や、フィルタ処理としての式（１）の予測演算を行うことができるので、動きぼけ等の動きに起因する画質の劣化を改善することができる。

＜タップ係数の削減＞

図２４は、学習により得られるタップ係数を削減する削減方法の例を説明する図である。

タップ係数は、符号化データのオーバーヘッドとなるため、フィルタ後画像が元画像に極めて近い画像となるタップ係数が得られても、タップ係数のデータ量が多いと、圧縮効率の改善の妨げとなる。

そこで、学習により得られるタップ係数（の数）は、必要に応じて削減することができる。

例えば、図１２に示したように、注目画素を中心とする十字型の9画素で、クラスタップを構成し、1ビットADRC処理によるクラス分類を行う場合には、例えば、最上位ビット（注目画素のADRC結果）が1のADRCコードについて、各ビットの反転を行うことにより、クラス数を、512=2⁹クラスから256=2⁸クラスに縮退することができる。クラスの縮退後の256クラスでは、9画素のクラスタップ（の1ビットADRC処理）のADRCコードをそのままクラスコードとする場合に比較して、タップ係数のデータ量が1/2に削減される。

さらに、クラスタップを構成する十字型の9画素のうちの、上下方向、左右方向、又は、斜め方向に線対称の位置関係にある画素のADRC結果が同一のクラスどうしを、１つのクラスにまとめるクラスの縮退を行うことにより、クラス数は、100クラスにすることができる。この場合、100クラスのタップ係数のデータ量は、256クラスのタップ係数のデータ量の約39％になる。

また、以上に加えて、クラスタップを構成する十字型の9画素のうちの、点対称の位置関係にある画素のADRC結果が同一のクラスどうしを、１つのクラスにまとめるクラスの縮退を行うことにより、クラス数は、55クラスにすることができる。この場合、55クラスのタップ係数のデータ量は、256クラスのタップ係数のデータ量の約21％になる。

タップ係数の削減は、以上のように、クラスの縮退によって行う他、タップ係数自体を削減することによって行うこともできる。

すなわち、例えば、予測タップ及び符号化ブロックが同一の画素で構成される場合には、ブロック位相に基づいて、タップ係数自体を削減することができる。

例えば、予測タップ及び符号化ブロックが、4×4画素で構成される場合には、予測タップの左上の2×2画素と左右方向に線対称の位置関係にある右上の2×2画素、上下方向に線対称の位置関係にある左下の2×2画素、及び、点対称の位置関係にある右下の2×2画素のタップ係数として、左上の2×2画素それぞれのタップ係数を位置関係に応じて配置し直したタップ係数を採用することができる。この場合、予測タップを構成する4×4画素に対する16個のタップ係数を、左上の2×2画素に対する4個のタップ係数に削減することができる。

また、予測タップの上半分の4×2画素と上下方向に線対称の位置関係にある下半分の4×2画素のタップ係数として、上半分の4×2画素それぞれのタップ係数を位置関係に応じて配置し直したタップ係数を採用することができる。この場合、予測タップを構成する4×4画素に対する16個のタップ係数を、上半分の4×2画素に対する8個のタップ係数に削減することができる。

その他、予測タップの左右方向に線対称の位置関係にある画素どうしや、斜め方向に線対称の位置関係にある画素どうしのタップ係数として、同一のタップ係数を採用することによって、タップ係数を削減することができる。

なお、以上のようなブロック位相に基づくタップ係数の削減を闇雲に行うと、その削減後のタップ係数により得られるフィルタ後画像のS/Nが低下する（元画像に対する誤差が増加する）。

そこで、ブロック位相に基づくタップ係数の削減は、例えば、クラス分類に用いるADRCコードにより、予測タップを構成する画素の波形パターンを解析し、その波形パターンが空間的な対称性を有する場合には、その対称性がある位置関係にある、予測タップとしての画素どうしについては、同一のタップ係数を採用することができる。

すなわち、例えば、クラスタップが、2×2画素で構成され、そのクラスタップの画素のADRC結果を、ラスタスキャン順に並べたADRCコードが、1001である場合には、点対称の対称性があるとみなして、点対称の位置関係にある予測タップとしての画素どうしのタップ係数として、同一のタップ係数を採用することができる。

＜符号化装置１１の第２の構成例＞

図２５は、図１の符号化装置１１の第２の構成例を示すブロック図である。

なお、図中、図９の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図２５において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、クラス分類適応フィルタ２６１、適応オフセット部２６２、及び、適応ループフィルタ２６３を有する。

したがって、図２５の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図９の場合と共通する。

但し、図２５の符号化装置１１は、クラス分類適応フィルタ１１１に代えて、クラス分類適応フィルタ２６１を有する点、並びに、適応オフセット部２６２及び適応ループフィルタ２６３を新たに有する点で、図９の場合と相違する。

クラス分類適応フィルタ２６１は、図９のクラス分類適応フィルタ１１１と同様に構成される。但し、クラス分類適応フィルタ２６１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてではなく、DFのみとして機能するフィルタである点で、ILF全体として機能するクラス分類適応フィルタ１１１と相違する。

図２５において、クラス分類適応フィルタ２６１には、演算部１１０から復号途中画像が供給される。

クラス分類適応フィルタ２６１は、演算部１１０からの復号途中画像に、クラス分類適応処理によるDFの処理を施し、その結果得られるフィルタ後画像を、適応オフセット部２６２に供給する。

適応オフセット部２６２は、クラス分類適応フィルタ２６１からのフィルタ後画像に、SAOの処理を行い、適応ループフィルタ２６３に供給する。

適応ループフィルタ２６３は、適応オフセット部２６２からのフィルタ後画像に、ALFの処理を行い、フレームメモリ１１２に供給する。

図２５の符号化装置１１では、クラス分類適応フィルタ２６１において、クラス分類適応処理によって、ILFのうちのDFの処理が行われる。そして、適応オフセット部２６２において、SAOの処理が行われ、適応ループフィルタ２６３において、ALFの処理が行われる。

なお、適応オフセット部２６２では、SAOの処理に必要なSAO情報が、可逆符号化部１０６に供給され、符号化データに含められる。

以上の点を除き、図２５の符号化装置１１では、図９の場合と同様の処理が行われる。

＜復号装置１２の第２の構成例＞

図２６は、図１の復号装置１２の第２の構成例を示すブロック図である。

なお、図中、図１６の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図２６において、復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０ないし選択部２１４、クラス分類適応フィルタ２７１、適応オフセット部２７２、及び、適応ループフィルタ２７３を有する。

したがって、図２６の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図１６の場合と共通する。

但し、図２６の復号装置１２は、クラス分類適応フィルタ２０６に代えて、クラス分類適応フィルタ２７１を有する点、並びに、適応オフセット部２７２及び適応ループフィルタ２７３を新たに有する点で、図１６の場合と相違する。

クラス分類適応フィルタ２７１は、図１６のクラス分類適応フィルタ２０６と同様に構成される。但し、クラス分類適応フィルタ２７１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてではなく、DFのみとして機能するフィルタである点で、ILF全体として機能するクラス分類適応フィルタ２０６と相違する。

図２６において、クラス分類適応フィルタ２７１には、演算部２０５から復号途中画像が供給される。

クラス分類適応フィルタ２７１は、演算部２０５からの復号途中画像に、クラス分類適応処理によるDFの処理を施し、その結果得られるフィルタ後画像を、適応オフセット部２７２に供給する。

適応オフセット部２７２は、クラス分類適応フィルタ２７１からのフィルタ後画像に、SAOの処理を行い、適応ループフィルタ２７３に供給する。

適応ループフィルタ２７３は、適応オフセット部２７２からのフィルタ後画像に、ALFの処理を行い、並べ替えバッファ２０７及びフレームメモリ２１０に供給する。

図２６の復号装置１２では、図２５の符号化装置１１で得られる符号化データが復号される。

すなわち、クラス分類適応フィルタ２７１において、クラス分類適応処理によって、ILFのうちのDFの処理が行われる。そして、適応オフセット部２７２において、SAOの処理が行われ、適応ループフィルタ２７３において、ALFの処理が行われる。

なお、適応オフセット部２７２には、可逆復号部２０２から、符号化データに含まれるSAO情報が供給される。適応オフセット部２７２では、可逆復号部２０２からのSAO情報を用いて、SAOの処理が行われる。

以上の点を除き、図２６の復号装置１２では、図１６の場合と同様の処理が行われる。

＜符号化装置１１の第３の構成例＞

図２７は、図１の符号化装置１１の第３の構成例を示すブロック図である。

なお、図中、図９又は図２５の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図２７において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、適応ループフィルタ２６３、デブロックフィルタ２８１、及び、クラス分類適応フィルタ２８２を有する。

したがって、図２７の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図９の場合と共通する。

但し、図２７の符号化装置１１は、クラス分類適応フィルタ１１１に代えて、クラス分類適応フィルタ２８２を有する点、及び、図２５の適応ループフィルタ２６３を新たに有するとともに、デブロックフィルタ２８１を新たに有する点で、図９の場合と相違する。

図２７において、デブロックフィルタ２８１には、演算部１１０から復号途中画像が供給される。

デブロックフィルタ２８１は、演算部１１０からの復号途中画像にDFの処理を行い、クラス分類適応フィルタ２８２に供給する。

クラス分類適応フィルタ２８２は、図９のクラス分類適応フィルタ１１１と同様に構成される。但し、クラス分類適応フィルタ２８２は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてではなく、SAOのみとして機能するフィルタである点で、ILF全体として機能するクラス分類適応フィルタ１１１と相違する。

クラス分類適応フィルタ２８２は、デブロックフィルタ２８１からの復号途中画像に、クラス分類適応処理によるSAOの処理を施し、その結果得られるフィルタ後画像を、適応ループフィルタ２６３に供給する。

図２７の符号化装置１１では、デブロックフィルタ２８１において、DFの処理が行われる。さらに、クラス分類適応フィルタ２８２において、クラス分類適応処理によって、ILFのうちのSAOの処理が行われる。そして、適応ループフィルタ２６３において、ALFの処理が行われる。

以上の点を除き、図２７の符号化装置１１では、図９の場合と同様の処理が行われる。

＜復号装置１２の第３の構成例＞

図２８は、図１の復号装置１２の第３の構成例を示すブロック図である。

なお、図中、図１６又は図２６の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図２８において、復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０ないし選択部２１４、適応ループフィルタ２７３、デブロックフィルタ２９１、及び、クラス分類適応フィルタ２９２を有する。

したがって、図２８の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図１６の場合と共通する。

但し、図２８の復号装置１２は、クラス分類適応フィルタ２０６に代えて、クラス分類適応フィルタ２９２を有する点、並びに、図２６の適応ループフィルタ２７３を新たに有するとともに、デブロックフィルタ２９１を新たに有する点で、図１６の場合と相違する。

図２８において、デブロックフィルタ２９１には、演算部２０５から復号途中画像が供給される。

デブロックフィルタ２９１は、演算部２０５からの復号途中画像に、DFの処理を行い、クラス分類適応フィルタ２９１に供給する。

クラス分類適応フィルタ２９２は、図１６のクラス分類適応フィルタ２０６と同様に構成される。但し、クラス分類適応フィルタ２９２は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてではなく、SAOのみとして機能するフィルタである点で、ILF全体として機能するクラス分類適応フィルタ２０６と相違する。

クラス分類適応フィルタ２９２は、デブロックフィルタ２９１からの復号途中画像に、クラス分類適応処理によるSAOの処理を施し、その結果得られるフィルタ後画像を、適応ループフィルタ２７３に供給する。

図２８の復号装置１２では、図２７の符号化装置１１で得られる符号化データが復号される。

すなわち、デブロックフィルタ２９１において、DFの処理が行われる。さらに、クラス分類適応フィルタ２９２において、クラス分類適応処理によって、ILFのうちのSAOの処理が行われる。そして、適応ループフィルタ２７３において、ALFの処理が行われる。

以上の点を除き、図２８の復号装置１２では、図１６の場合と同様の処理が行われる。

＜符号化装置１１の第４の構成例＞

図２９は、図１の符号化装置１１の第４の構成例を示すブロック図である。

なお、図中、図９、図２５、又は、図２７の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図２９において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、適応オフセット部２６２、デブロックフィルタ２８１、及び、クラス分類適応フィルタ３１１を有する。

したがって、図２９の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図９の場合と共通する。

但し、図２９の符号化装置１１は、クラス分類適応フィルタ１１１に代えて、クラス分類適応フィルタ３１１を有する点、及び、図２５の適応オフセット部２６２を新たに有するとともに、図２７のデブロックフィルタ２８１を新たに有する点で、図９の場合と相違する。

図２９において、クラス分類適応フィルタ３１１には、適応オフセット部２６２から、SAOの処理後の復号途中画像が供給される。

クラス分類適応フィルタ３１１は、図９のクラス分類適応フィルタ１１１と同様に構成される。但し、クラス分類適応フィルタ３１１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてではなく、ALFのみとして機能するフィルタである点で、ILF全体として機能するクラス分類適応フィルタ１１１と相違する。

クラス分類適応フィルタ３１１は、適応オフセット部２６２からの復号途中画像に、クラス分類適応処理によるSAOの処理を施し、その結果得られるフィルタ後画像を、フレームメモリ１１２に供給する。

図２９の符号化装置１１では、デブロックフィルタ２８１において、DFの処理が行われる。さらに、適応オフセット部２６２において、SAOの処理が行われる。そして、クラス分類適応フィルタ３１１において、クラス分類適応処理によって、ILFのうちのALFの処理が行われる。

なお、適応オフセット部２６２では、図２５で説明したように、SAOの処理に必要なSAO情報が、可逆符号化部１０６に供給され、符号化データに含められる。

以上の点を除き、図２９の符号化装置１１では、図９の場合と同様の処理が行われる。

＜復号装置１２の第４の構成例＞

図３０は、図１の復号装置１２の第４の構成例を示すブロック図である。

なお、図中、図１６、図２６、又は、図２８の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３０において、復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０ないし選択部２１４、適応オフセット部２７２、デブロックフィルタ２９１、及び、クラス分類適応フィルタ３２１を有する。

したがって、図３０の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図１６の場合と共通する。

但し、図３０の復号装置１２は、クラス分類適応フィルタ２０６に代えて、クラス分類適応フィルタ３２１を有する点、並びに、図２６の適応オフセット部２７２を新たに有するとともに、図２８のデブロックフィルタ２９１を新たに有する点で、図１６の場合と相違する。

図３０において、クラス分類適応フィルタ３２１には、適応オフセット部２７２から、SAOの処理後の復号途中画像が供給される。

クラス分類適応フィルタ３２１は、図１６のクラス分類適応フィルタ２０６と同様に構成される。但し、クラス分類適応フィルタ３２１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてではなく、ALFのみとして機能するフィルタである点で、ILF全体として機能するクラス分類適応フィルタ２０６と相違する。

クラス分類適応フィルタ３２１は、適応オフセット部２７２からの復号途中画像に、クラス分類適応処理によるALFの処理を施し、その結果得られるフィルタ後画像を、並べ替えバッファ２９７及びフレームメモリ２１０に供給する。

図３０の復号装置１２では、図２９の符号化装置１１で得られる符号化データが復号される。

すなわち、デブロックフィルタ２９１において、DFの処理が行われる。さらに、適応オフセット部２７２において、SAOの処理が行われる。そして、クラス分類適応フィルタ３２１において、クラス分類適応処理によって、ILFのうちのALFの処理が行われる。

以上の点を除き、図３０の復号装置１２では、図１６の場合と同様の処理が行われる。

以上のように、クラス分類適応処理によれば、ILF全体の機能を実現することもできるし、ILFのうちの、DF，SAO、又は、ALFの機能を実現することもできる。

また、クラス分類適応処理によれば、DF，SAO、及び、ALFのうちの２以上の機能を実現することもできる。

すなわち、クラス分類適応処理によれば、DF，SAO、及び、ALFのうちの１以上の機能を実現することができる。

そして、クラス分類適応処理によって、DF，SAO、及び、ALFのうちの１以上の機能を実現することにより、予測画像の予測に用いられる参照画像となるフィルタ後画像として、S/Nの良い画像、すなわち、元画像に極めて近い画像を得ることができ、さらに、残差を極めて小さくすることができる。したがって、S/N及び圧縮効率を、大きく改善することができる。

また、クラス分類適応処理によって、DF，SAO、及び、ALFのうちの２以上の機能を実現することにより、DF，SAO、及び、ALFのすべてを、ILFとして設ける場合に比較して、演算コストを低減することができる。

なお、以下では、クラス分類適応処理によって、ILF全体の機能を実現する場合を例に説明を行うが、以下で説明する実施の形態でも、クラス分類適応処理によって、DF，SAO、及び、ALFのうちの任意の１又は２の機能を実現することができる。

＜付加クラス＞

図３１は、付加クラスの概要を説明する図である。

符号化装置１１及び復号装置１２の第１ないし第４の構成例では、復号途中画像から得られるクラスタップ（の画像特徴量）や、符号化データに含められる符号化情報を用いて、クラス分類が行われる。

すなわち、符号化装置１１及び復号装置１２の第１ないし第４の構成例では、符号化装置１１及び復号装置１２のいずれでも取得することができる取得可能情報を用いて、クラス分類が行われる。

ところで、クラス分類適応処理については、より元画像に近いフィルタ後画像を得る観点からは、クラス分類に、元画像を用いることが望ましい。また、符号化データに含められない、例えば、目標符号量等の符号化情報や、符号化で失われる情報を用いて、クラス分類を行うことで、より元画像に近いフィルタ後画像を得ることができるクラス分類を行うことができることがあり得る。

しかしながら、元画像や、符号化データに含められない符号化情報、符号化で失われる情報は、復号装置１２側で取得することができない取得不可能情報であり、取得不可能情報を用いたクラス分類は、符号化装置１１で行うことはできても、復号装置１２で行うことができない。

そこで、符号化装置１１において、取得不可能情報を用いてクラス分類を行う場合には、そのクラス分類により得られるクラスを、付加クラスとして伝送する。そして、復号装置１２では、符号化装置１１から伝送されてくる付加クラスを用いて、クラス分類適応処理を行う。

すなわち、符号化装置１１では、復号途中画像から得られるクラスタップや、符号化データに含められる符号化情報等の取得可能情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求める。

さらに、符号化装置１１では、元画像や符号化データに含められない符号化情報等の取得不可能情報を用いて、クラス分類を行い、注目画素の第２クラスとしての付加クラスを求める。

そして、符号化装置１１では、通常クラス及び付加クラスから、注目画素の最終的なクラスを求め、その最終的なクラスのタップ係数を用いた予測演算により、注目画素に対応するフィルタ後画像の対応画素の画素値（注目画素に対応する元画像の画素の画素値の予測値）を求める。

また、符号化装置１１では、タップ係数とともに、付加クラス（を表すクラスコード）を、フィルタ情報として伝送する。

復号装置１２では、取得可能情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求める。

さらに、復号装置１２では、符号化装置１１から伝送されてくるタップ係数と、注目画素の第２クラスとしての付加クラスとを取得する。

そして、復号装置１２では、符号化装置１１と同様に、通常クラス及び付加クラスから、注目画素の最終的なクラスを求め、その最終的なクラスのタップ係数を用いた予測演算により、注目画素に対応するフィルタ後画像の対応画素の画素値を求める。

図３１では、符号化装置１１において、取得可能情報としての復号途中画像から得られるクラスタップを用いて、注目画素が、8ビットのクラスコードで表される通常クラスにクラス分類される。

さらに、符号化装置１１では、取得不可能情報としての元画像の、注目画素に対応する対応画素が含まれるCUや、CTU、スライス等の所定の単位を用いて、注目画素が、2ビットのクラスコードで表される付加クラスにクラス分類される。

また、符号化装置１１では、8ビットの通常クラスを表すクラスコードの上位ビットに、2ビットの付加クラスを表すクラスコードを付加することで、10ビットのクラスコードで表されるクラスが、最終的なクラスとして求められる。

そして、符号化装置１１では、10ビットのクラスコードで表される最終的なクラスのタップ係数を用いた予測演算により、注目画素に対応するフィルタ後画像の対応画素の画素値が求められる。

さらに、符号化装置１１では、10ビットのクラスコードで表される最終的なクラスごとのタップ係数と、2ビットの（クラスコードで表される）付加クラスが伝送される。

ここで、上述の場合には、通常クラス（を表すクラスコード）の上位ビットに、付加クラス（を表すクラスコード）を付加することで、最終的なクラス（を表すクラスコード）を生成することとしたが、通常クラス及び付加クラスから、最終的なクラスを生成する方法は、これに限定されるものではない。

すなわち、通常クラス及び付加クラスから、最終的なクラスを生成する方法は、あらかじめ決めておく必要はあるが、任意の方法を採用することができる。例えば、最終的なクラスは、通常クラスの下位ビットに、付加クラスを付加することで生成することができる。

復号装置１２では、符号化装置１１から伝送されてくる最終的なクラスごとのタップ係数と2ビットの付加クラスとが取得される。

さらに、復号装置１２では、取得可能情報としての復号途中画像から得られるクラスタップを用いて、注目画素が、8ビットの（クラスコードで表される）通常クラスにクラス分類される。

また、復号装置１２では、符号化装置１１と同様に、8ビットの通常クラスと、符号化装置１１から伝送されてくる2ビットの付加クラスから、10ビットの（クラスコードで表される）最終的なクラスが求められ、その最終的なクラスのタップ係数を用いた予測演算により、注目画素に対応するフィルタ後画像の対応画素の画素値が求められる。

なお、取得不可能情報を用いたクラス分類としては、例えば、取得不可能情報としての元画像のアクティビティ等の画像特徴量を用いたクラス分類を採用することができる。

元画像のアクティビティとしては、例えば、注目画素に対応する元画像の画素を含むCUや、CTU、スライス等の所定の領域（以下、特定領域ともいう）に含まれる画素について、隣接する画素の画素値の差分の絶対値和を、差分の個数で正規化して得られる値等を採用することができる。

また、取得不可能情報としての元画像の画像特徴量としては、注目画素に対応する元画像の対応画素どうしの画素値のフレーム間差分や、元画像の特定領域と、その特定領域に対応する復号途中画像の領域との画素値のDC差分、元画像の一部の帯域を抑制又は強調した画像の画像特徴量等を採用することができる。

さらに、取得不可能情報を用いたクラス分類では、取得不可能情報としての元画像の画像特徴量の他、取得可能情報であるか、取得不可能情報であるかを問わず、符号化情報を用いることができる。

すなわち、取得不可能情報を用いたクラス分類では、例えば、取得不可能情報としての元画像の画像特徴量と、量子化パラメータQPとを用いることができる。

元画像の画像特徴量としての、例えば、元画像のアクティビティが大きいテクスチャの領域については、量子化パラメータQPが大（量子化ステップが大）である場合、符号化（量子化）により失われる元画像の情報量が大きく、フィルタ後画像（復号画像）の劣化が大になる。

一方、元画像のアクティビティが小さい平坦な領域については、量子化パラメータQPが小（量子化ステップが小）である場合、符号化により失われる元画像の情報量が小さく、フィルタ後画像の劣化が小になる。

したがって、元画像の画像特徴量としてのアクティビティと、量子化パラメータQPとを用いてクラス分類を行う場合には、フィルタ後画像の劣化の大小に応じたクラス分類が行われ、その劣化を回復するのに適切なタップ係数による予測演算を行うことが可能になる。

＜符号化装置１１の第５の構成例＞

図３２は、図１の符号化装置１１の第５の構成例を示すブロック図である。

図３２において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、及び、クラス分類適応フィルタ４１１を有する。

したがって、図３２の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図９の場合と共通する。

但し、図３２の符号化装置１１は、クラス分類適応フィルタ１１１に代えて、クラス分類適応フィルタ４１１を有する点で、図９の場合と相違する。

クラス分類適応フィルタ４１１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う点で、クラス分類適応フィルタ１１１と共通する。

但し、クラス分類適応フィルタ４１１では、取得可能情報を用いたクラス分類により、第１クラスとしての通常クラスが求められるとともに、取得不可能情報を用いたクラス分類により第２クラスとしての付加クラスが求められ、それらの通常クラスと付加クラスとから、最終的なクラスが生成される点で、クラス分類適応フィルタ１１１と相違する。

さらに、クラス分類適応フィルタ４１１では、付加クラスが、最終的なクラスごとのタップ係数とともに、フィルタ情報として、可逆符号化部１０６に供給されて伝送される点で、クラス分類適応フィルタ１１１と相違する。

＜クラス分類適応フィルタ４１１の構成例＞

図３３は、図３２のクラス分類適応フィルタ４１１の構成例を示すブロック図である。

図３３において、クラス分類適応フィルタ４１１は、画像変換装置４３１及び学習装置４３２を有する。

画像変換装置４３１には、演算部１１０（図３２）から復号途中画像が供給されるとともに、学習装置４３２から最終的なクラスごとのタップ係数が供給される。さらに、画像変換装置４３１には、符号化情報が供給される。また、画像変換装置４３１には、並べ替えバッファ１０２（図３２）から元画像が供給される。

画像変換装置４３１は、復号途中画像を第１の画像として、最終的なクラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、フレームメモリ１１２（図３２）に供給する。

なお、画像変換装置４３１は、クラス分類適応処理において、クラス分類を、必要に応じて、符号化情報を用いて行う。

また、画像変換装置４３１は、取得可能情報としての復号途中画像及び符号化情報（符号化データに含められる符号化情報）を用いたクラス分類により、第１クラスとしての通常クラスを求めるとともに、取得不可能情報としての、例えば、元画像等を用いたクラス分類により第２クラスとしての付加クラスを求め、それらの通常クラスと付加クラスとから、最終的なクラスを生成する。

さらに、画像変換装置４３１は、付加クラスを、フィルタ情報として、可逆符号化部１０６（図３２）に供給する。

学習装置４３２には、並べ替えバッファ１０２（図３２）から元画像が供給されるとともに、演算部１１０（図３２）から復号途中画像が供給される。さらに、学習装置４３２には、符号化情報が供給される。

学習装置４３２は、復号途中画像を生徒データとするとともに、元画像を教師データとして、（最終的な）クラスごとのタップ係数を求める学習（タップ係数学習）を行う。

さらに、学習装置４３２は、タップ係数学習により得られるクラスごとのタップ係数を、フィルタ情報として、画像変換装置４３１及び可逆符号化部１０６（図３２）に供給する。

なお、学習装置４３２は、画像変換装置４３１と同様に、タップ係数学習において、クラス分類を、必要に応じて、符号化情報を用いて行う。

また、学習装置４３２は、画像変換装置４３１と同様に、クラス分類において、通常クラス及び付加クラスを求め、それらの通常クラスと付加クラスとから、最終的なクラスを生成する。

＜画像変換装置４３１の構成例＞

図３４は、図３３の画像変換装置４３１の構成例を示すブロック図である。

なお、図中、図１１の画像変換装置１３１と対応する部分については、同一の符号を付してあり、その説明は、適宜省略する。

図３４において、画像変換装置４３１は、タップ選択部２１及び２２、係数取得部２４、予測演算部２５、並びに、クラス分類部４４１を有する。

したがって、画像変換装置４３１は、タップ選択部２１及び２２、係数取得部２４、並びに、予測演算部２５を有する点で、図１１の画像変換装置１３１と共通する。

但し、画像変換装置４３１は、クラス分類部２３に代えて、クラス分類部４４１を有する点で、図１１の画像変換装置１３１と相違する。

クラス分類部４４１には、タップ選択部２２から、取得可能情報としての注目画素のクラスタップが供給される。さらに、クラス分類部４４１には、取得可能情報としての符号化情報が供給されるとともに、並べ替えバッファ１０２（図３２）から、取得不可能情報としての元画像が供給される。

クラス分類部４４１は、図１１のクラス分類部２３と同様に、クラスタップ及び符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求める。

さらに、クラス分類部４４１は、元画像を用いて、クラス分類を行い、注目画素の第２クラスとしての付加クラスを求める。

そして、クラス分類部４４１は、通常クラスと付加クラスとから、注目画素の最終的なクラスを生成し、係数取得部２４に供給する。

さらに、クラス分類部４４１は、付加クラス（を表すクラスコード）を、フィルタ情報として、可逆符号化部１０６に供給する。

ここで、図３４において、係数取得部２４は、学習装置４３２から供給される最終的なクラスごとのタップ係数を記憶し、その最終的なクラスごとのタップ係数から、クラス分類部５４１からの注目画素の最終的なクラスのタップ係数を取得して、予測演算部２５に供給する。

図３５は、図３４のクラス分類部４４１の構成例を示すブロック図である。

図３５において、クラス分類部４４１は、第１クラス分類部４５１、第２クラス分類部４５２、及び、クラスコード生成部４５３を有する。

第１クラス分類部４５１は、図１１のクラス分類部２３と同様に、クラスタップ及び符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求め、クラスコード生成部４５３に供給する。

第２クラス分類部４５２は、元画像を用い、例えば、元画像の画像特徴量としてのアクティビティの閾値処理を行うことで、クラス分類を行い、注目画素の第２クラスとしての付加クラスを求め、クラスコード生成部４５３に供給するとともに、フィルタ情報として、可逆符号化部１０６（図３２）に供給する。

クラスコード生成部４５３は、第１クラス分類部４５１からの通常クラスと、第２クラス分類部４５２からの付加クラスとから、注目画素の最終的なクラスを生成し、係数取得部２４（図３４）に供給する。

すなわち、クラスコード生成部４５３は、例えば、第１クラス分類部４５１からの通常クラスを表すクラスコードの上位ビットに、第２クラス分類部４５２からの付加クラスを表すクラスコードを付加することで、注目画素の最終的なクラスを表すクラスコードを生成する。

＜学習装置４３２の構成例＞

図３６は、図３３の学習装置４３２の構成例を示すブロック図である。

なお、図中、図１３の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図３６において、学習装置４３２は、学習部３３を有する。学習部３３は、タップ選択部４１及び４２、足し込み部４４、係数算出部４５、並びに、クラス分類部４６１を有する。

したがって、図３６の学習装置４３２は、学習部３３を有する点で、図１３の場合と共通する。さらに、学習装置４３２は、学習部３３が、タップ選択部４１及び４２、足し込み部４４、並びに、係数算出部４５を有する点で、図１３の場合と共通する。

但し、図３６の学習装置４３２は、学習部３３において、クラス分類部４３に代えて、クラス分類部４６１が設けられている点で、図１３の場合と相違する。

クラス分類部４６１には、タップ選択部４２から、取得可能情報としての注目画素のクラスタップが供給される。さらに、クラス分類部４６１には、取得可能情報としての符号化情報が供給されるとともに、並べ替えバッファ１０２（図３２）から、取得不可能情報としての元画像が供給される。

クラス分類部４６１は、図３５のクラス分類部４４１と同様に構成され、クラスタップ、符号化情報、及び、元画像を用いて、クラス分類部４４１と同様のクラス分類を行う。

すなわち、クラス分類部４６１は、図１３のクラス分類部４３と同様に、クラスタップ及び符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求める。

さらに、クラス分類部４６１は、元画像を用いて、クラス分類を行い、注目画素の第２クラスとしての付加クラスを求める。

そして、クラス分類部４６１は、通常クラスと付加クラスとから、注目画素の最終的なクラスを生成し、足し込み部４４に供給する。

したがって、足し込み部４４では、最終的なクラスごとに、正規方程式を求める足し込みが行われ、係数算出部４５では、最終的なクラスごとのタップ係数が求められる。

ここで、最終的なクラスごとのタップ係数は、通常クラスのクラス数と、付加クラスのクラス数との乗算値の数だけのクラスのタップ係数となる。

＜符号化処理＞

図３７は、図３２の符号化装置１１の符号化処理の例を説明するフローチャートである。

図３２の符号化装置１１では、ステップＳ１１１ないしＳ１２９において、図１４のステップＳ１１ないしＳ２９とそれぞれ同様の処理が行われる。

但し、符号化装置１１において、クラス分類適応フィルタ４１１の学習装置４３２（図３３）は、図１０の学習装置１３２と同様に、そこに供給される復号途中画像を生徒データとするとともに、その復号途中画像に対応する元画像を教師データとして、適宜、タップ係数学習を行うが、そのタップ係数学習では、最終的なクラスごとのタップ係数が、フィルタ情報として生成される。そして、その最終的なクラスごとのタップ係数が、ステップＳ１１２で更新されるフィルタ情報、及び、ステップＳ１１３で伝送対象に設定されるフィルタ情報となる。

また、ステップＳ１２５において、クラス分類適応フィルタ４１１は、図１４のステップＳ２５と同様に、演算部１１０からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施すが、そのクラス分類適応処理では、クラスタップ、符号化情報、及び、元画像を用いて、クラス分類が行われ、通常クラスと付加クラスとから、最終的なクラスが生成される。

さらに、クラス分類適応フィルタ４１１において、クラス分類適応処理は、最終的なクラスごとのタップ係数を用いて行われる。

また、クラス分類適応フィルタ４１１は、クラス分類適応処理で得られた付加クラスを、フィルタ情報として、可逆符号化部１０６に供給する。

さらに、ステップＳ１２７では、可逆符号化部１０６は、図１４のステップＳ２７と同様に、量子化係数、符号化情報、及び、フィルタ情報を符号化するが、そのフィルタ情報には、付加クラスと、最終的なクラスごとのタップ係数とが含まれる。

したがって、可逆符号化部１０６で得られる符号化データには、量子化係数、符号化情報、及び、フィルタ情報としての付加クラスや最終的なクラスごとのタップ係数が含まれる。そして、かかる符号化データは、ステップＳ１２８で、図１４のステップＳ２８で説明したように、蓄積バッファ１０７から、適宜読み出されて伝送される。

図３８は、図３７のステップＳ１２５で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ４１１の画像変換装置４３１（図３４）では、ステップＳ１４１ないしＳ１４７において、図１５のステップＳ４１ないしＳ４７とそれぞれ同様の処理が行われる。

但し、ステップＳ１４３の注目画素のクラス分類では、クラス分類部４４１（図３４、図３５）は、クラスタップ、符号化情報、及び、元画像を用いて、注目画素のクラス分類を行う。

すなわち、クラス分類では、ステップＳ１５１ないしＳ１５３において、図１５のステップＳ５１ないしＳ５３とそれぞれ同様の処理が行われる。

具体的には、ステップＳ１５１において、クラス分類部４４１（図３５）の第１クラス分類部４５１は、タップ選択部２２からのクラスタップを構成する画素から、例えば、ADRCコード等の画像特徴量を抽出し、処理は、ステップＳ１５２に進む。

ステップＳ１５２では、第１クラス分類部４５１は、注目画素についての必要な符号化情報を取得し、あらかじめ決められた規則に従って、符号化情報を、情報コードに変換して、処理は、ステップＳ１５３に進む。

ステップＳ１５３では、第１クラス分類部４５１は、画像特徴量及び情報コードから、注目画素の第１クラスとしての通常クラスを表すクラスコードを生成し、クラスコード生成部４５３に供給して、処理は、ステップＳ１５４に進む。

ステップＳ１５４では、第２クラス分類部４５２は、注目画素の元画像に対応する対応画素を含むCUや、CTU、スライス等の特定領域を、第２クラスとしての付加クラス用の情報として取得し、処理は、ステップＳ１５５に進む。

なお、付加クラス用の情報は、元画像から取得する他、符号化情報（符号化データに含められるか否かは、問わない）からも取得することができる。

ステップＳ１５５では、第２クラス分類部４５２は、付加クラス用の情報から、例えば、アクティビティ等の画像特徴量を抽出し、その画像特徴量の閾値処理を行うことで、注目画素の付加クラスを表すクラスコードを求める。

そして、第２クラス分類部４５２は、付加クラスを表すクラスコードを、クラスコード生成部４５３に供給して、処理は、ステップＳ１５５からステップＳ１５６に進む。

ステップＳ１５６では、クラスコード生成部４５３が、第１クラス分類部４５１からの通常クラスを表すクラスコードと、第２クラス分類部４５２からの付加クラスを表すクラスコードとから、注目画素の最終的なクラスを表すクラスコードを生成する。

そして、クラスコード生成部４５３は、注目画素の最終的なクラス（を表すクラスコード）を、画像変換装置４３１（図３４）の係数取得部２４に供給し、ステップＳ１４３のクラス分類を終了する。

なお、クラス分類適応フィルタ４１１の画像変換装置４３１（図３４）では、ステップＳ１４７において、予測演算部２５が、図１５のステップＳ４７と同様に、演算部１１０からの復号途中画像に対して得られた画素値で構成されるフィルタ後画像を、フレームメモリ１１２（図３２）に供給する他、クラス分類部４４１（図３４）が、ステップＳ１４３のクラス分類で得られた第２クラスとしての付加クラスを、フィルタ情報として、可逆符号化部１０６（図３２）に供給する。

＜復号装置１２の第５の構成例＞

図３９は、図１の復号装置１２の第５の構成例を示すブロック図である。

図３９において、復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０ないし選択部２１４、及び、クラス分類適応フィルタ４７１を有する。

したがって、図３９の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図１６の場合と共通する。

但し、図３９の復号装置１２は、クラス分類適応フィルタ２０６に代えて、クラス分類適応フィルタ４７１を有する点で、図１６の場合と相違する。

図３９の復号装置１２は、図３２の符号化装置１１から伝送されてくる符号化データを復号する。

そのため、可逆復号部２０２からクラス分類適応フィルタ４７１に供給されるフィルタ情報には、最終的なクラスごとのタップ係数や付加クラスが含まれる。

クラス分類適応フィルタ４７１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う点で、図１６のクラス分類適応フィルタ２０６と共通する。

但し、クラス分類適応フィルタ４７１では、取得可能情報を用いたクラス分類により、第１クラスとしての通常クラスが求められ、その通常クラスと、可逆復号部２０２からのフィルタ情報としての付加クラスとから、最終的なクラスが生成される点で、クラス分類適応フィルタ２０６と相違する。

＜クラス分類適応フィルタ４７１の構成例＞

図４０は、図３９のクラス分類適応フィルタ４７１の構成例を示すブロック図である。

図４０において、クラス分類適応フィルタ４７１は、画像変換装置４８１を有する。

画像変換装置４８１には、演算部２０５（図３９）から復号途中画像が供給されるとともに、可逆復号部２０２からフィルタ情報としての最終的なクラスごとのタップ係数及び付加クラス、並びに、符号化情報が供給される。

画像変換装置４８１は、図３３の画像変換装置４３１と同様に、復号途中画像を第１の画像として、クラス（最終的なクラス）ごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、並べ替えバッファ２０７及びフレームメモリ２１０（図３９）に供給する。

なお、画像変換装置４８１は、クラス分類適応処理において、図３３の画像変換装置４３１と同様に、クラス分類を、必要に応じて、符号化情報を用いて行う。

また、画像変換装置４８１は、取得可能情報としての復号途中画像から得られるクラスタップ及び符号化情報（符号化データに含められる符号化情報）を用いたクラス分類により、注目画素の第１クラスとしての通常クラスを求めるとともに、取得不可能情報としての元画像を用いたクラス分類により求められる注目画素の第２クラスとしての付加クラスを、可逆復号部２０２（図３９）からのフィルタ情報から取得し、それらの通常クラスと付加クラスとから、注目画素の最終的なクラスを生成する。

そして、画像変換装置４８１は、注目画素の最終的なクラスのタップ係数を用いて、式（１）の予測演算を行う。

＜画像変換装置４８１の構成例＞

図４１は、図４０の画像変換装置４８１の構成例を示すブロック図である。

なお、図中、図１８の画像変換装置２３１と共通する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図４１において、画像変換装置４８１は、タップ選択部２４１及び２４２、係数取得部２４４、予測演算部２４５、並びに、クラス分類部４９１を有する。

したがって、図４１の画像変換装置４８１は、タップ選択部２４１及び２４２、係数取得部２４４、並びに、予測演算部２４５を有する点で、図１８の画像変換装置２３１と共通する。

但し、図４１の画像変換装置４８１は、クラス分類部２４３に代えて、クラス分類部４９１を有する点で、図１８の画像変換装置２３１と相違する。

可逆復号部２０２（図３９）からのフィルタ情報としての最終的なクラスごとのタップ係数（通常クラスのクラス数と付加クラスのクラス数との乗算値のクラス数だけのタップ係数）は、係数取得部２４４に供給されて記憶される。

また、可逆復号部２０２（図３９）からのフィルタ情報としての付加クラスは、クラス分類部４９１に供給される。

さらに、クラス分類部４９１には、可逆復号部２０２からの符号化情報が供給されるとともに、タップ選択部２４２からクラスタップが供給される。

クラス分類部４９１は、図１８のクラス分類部２４３と同様に、クラスタップ及び符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求める。

さらに、クラス分類部４９１は、可逆復号部２０２（図３９）からのフィルタ情報として付加クラスの中から、注目画素の第２クラスとしての付加クラスを取得する。

そして、クラス分類部４９１は、注目画素の通常クラスと付加クラスとから、注目画素の最終的なクラスを生成し、係数取得部２４４に供給する。

係数取得部２４４は、可逆復号部２０２からフィルタ情報としての最終的なクラスごとのタップ係数から、クラス分類部４９１からの注目画素の最終的なクラスのタップ係数を取得し、予測演算部２４５に供給する。

図４２は、図４１のクラス分類部４９１の構成例を示すブロック図である。

図４２において、クラス分類部４９１は、第１クラス分類部５０１、及び、クラスコード生成部５０２を有する。

第１クラス分類部５０１は、図１８のクラス分類部２４３と同様に、タップ選択部２４２（図４１）からのクラスタップと、可逆復号部２０２（図３９）からの符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求め、クラスコード生成部５０２に供給する。

クラスコード生成部５０２は、可逆復号部２０２からのフィルタ情報としての付加クラスの中から、注目画素の第２クラスとしての付加クラスを取得する。

そして、クラスコード生成部５０２は、図３５のクラスコード生成部４５３と同様に、第１クラス分類部５０１からの通常クラスと、可逆復号部２０２からのフィルタ情報から取得した付加クラスとから、注目画素の最終的なクラスを生成し、係数取得部２４４（図４１）に供給する。

＜復号処理＞

図４３は、図３９の復号装置１２の復号処理の例を説明するフローチャートである。

図３９の復号装置１２では、ステップＳ１６１ないしＳ１７３において、図１９のステップＳ６１ないしＳ７３とそれぞれ同様の処理が行われる。

但し、ステップＳ１６２では、可逆復号部２０２は、図１９のステップＳ６２と同様に、符号化データを復号し、その復号により得られる量子化係数を、逆量子化部２０３に供給するとともに、符号化データの復号により得られる符号化情報やフィルタ情報を、イントラ予測部２１２や、動き予測補償部２１３、クラス分類適応フィルタ４７１その他の必要なブロックに供給するが、クラス分類適応フィルタ４７１に供給されるフィルタ情報には、最終的なクラスごとのタップ係数や、第２クラスとしての付加クラスが含まれる。

また、ステップＳ１７０において、クラス分類適応フィルタ４７１は、図１９のステップＳ７０と同様に、演算部２０５からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施すが、そのクラス分類適応処理では、クラスタップ及び符号化情報を用いたクラス分類により第１クラスとしての通常クラスが求められ、その通常クラスと、可逆復号部２０２（図３９）からのフィルタ情報としての付加クラスとから、最終的なクラスが生成される。

図４４は、図４３のステップＳ１７０で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ４７１の画像変換装置４８１（図４１）では、ステップＳ１８１ないしＳ１８７において、図２０のステップＳ８１ないしＳ８７とそれぞれ同様の処理が行われる。

但し、ステップＳ１８３の注目画素のクラス分類では、クラス分類部４９１（図４２）は、可逆復号部２０２（図３９）から供給されるフィルタ情報としての注目画素の付加クラスから、注目画素の最終的なクラスを生成する。

すなわち、クラス分類では、ステップＳ１９１ないしＳ１９３において、図３８のステップＳ１５１ないしＳ１５３とそれぞれ同様の処理が行われる。

具体的には、ステップＳ１９１において、クラス分類部４９１（図４２）の第１クラス分類部５０１は、タップ選択部２４２（図４１）からのクラスタップを構成する画素から、例えば、ADRCコード等の画像特徴量を抽出し、処理は、ステップＳ１９２に進む。

ステップＳ１９２では、第１クラス分類部５０１は、注目画素についての必要な符号化情報を取得し、あらかじめ決められた規則に従って、符号化情報を、情報コードに変換して、処理は、ステップＳ１９３に進む。

ステップＳ１９３では、第１クラス分類部５０１は、画像特徴量及び情報コードから、注目画素の第１クラスとしての通常クラスを表すクラスコードを生成し、クラスコード生成部５０２に供給して、処理は、ステップＳ１９４に進む。

ステップＳ１９４では、クラスコード生成部５０２は、可逆復号部２０２（図３９）から供給されるフィルタ情報としての付加クラスの中から、注目画素の第２クラスとしての付加クラス（を表すクラスコード）を取得する。

さらに、クラスコード生成部５０２は、第１クラス分類部５０１からの通常クラス（を表すクラスコード）と、可逆復号部２０２からのフィルタ情報としての付加クラスから取得した注目画素の付加クラス（を表すクラスコード）とから、注目画素の最終的なクラス（を表すクラスコード）を生成する。

そして、クラスコード生成部５０２は、注目画素の最終的なクラスを、係数取得部２４４（図４１）に供給し、ステップＳ１８３のクラス分類を終了する。

＜クラスの縮退＞

図４５は、最終的なクラスの縮退を説明する図である。

図３１で説明したように、取得可能情報を用いたクラス分類により得られる通常クラスと、取得不可能情報を用いたクラス分類により得られる付加クラスとから生成される最終的なクラスを採用し、より元画像に近いフィルタ後画像を得ることができるクラス分類を行うことで、フィルタ後画像（復号画像）のS/Nを向上させることができる。

しかしながら、通常クラスと付加クラスとから生成される最終的なクラスを採用する場合には、通常クラスだけを採用する場合に比較して、クラス数が増加する。したがって、符号化データに含まれるフィルタ情報としてのタップ係数のデータ量が増加し、符号化データのオーバーヘッドが増加する。

そして、符号化データのオーバーヘッドの増加は、圧縮効率の改善の妨げとなる。

そこで、通常クラスと付加クラスとから生成される最終的なクラスを採用する場合には、その最終的なクラスを縮退することができる。

図４５では、図３１と同様に、符号化装置１１において、取得可能情報としての復号途中画像から得られるクラスタップを用いたクラス分類により得られる8ビットの通常クラスを表すクラスコードの上位ビットに、取得不可能情報としての元画像の画像特徴量を用いたクラス分類により得られる2ビットの付加クラスを表すクラスコードを付加することで、10ビットのクラスコードで表されるクラスが、最終的なクラスとして求められる。

そして、符号化装置１１では、10ビットの（クラスコードで表される）最終的なクラスが、8ビットの縮退クラスに縮退され、その8ビットの縮退クラスのタップ係数を用いた予測演算により、注目画素に対応するフィルタ後画像の対応画素の画素値が求められる。

さらに、符号化装置１１では、8ビットの縮退クラスごとのタップ係数と、2ビットの付加クラスが伝送される。

また、符号化装置１１では、10ビットの最終的なクラスを、8ビットの縮退クラスに変換する変換テーブルが生成され、その変換テーブルも伝送される。

最終的なクラスの縮退は、例えば、図２４で説明した方法で行うことができる。また、最終的なクラスの縮退は、例えば、タップ係数を座標軸とするタップ係数空間において、タップ係数（のセット）どうしの距離が短いクラスどうしを、１つのクラスにまとめること等により行うことができる。その他、最終的なクラスの縮退は、任意の方法で行うことができる。

復号装置１２では、符号化装置１１から伝送されてくる縮退クラスごとのタップ係数、2ビットの付加クラス、及び、変換テーブルが取得される。

また、復号装置１２では、8ビットの通常クラスと、符号化装置１１から伝送されてくる2ビットの付加クラスから、符号化装置１１の場合と同様の10ビットの最終的なクラスが求められる。

そして、復号装置１２では、10ビットの最終的なクラスが、符号化装置１１から伝送されてくる変換テーブルに従って、縮退クラスに変換（縮退）され、その縮退クラスのタップ係数を用いた予測演算により、注目画素に対応するフィルタ後画像の対応画素の画素値が求められる。

以上のように、最終的なクラスを縮退することで、通常クラスと付加クラスとから生成される最終的なクラスを採用する場合に生じる、符号化データのオーバーヘッドの増加を抑制することができる。

なお、図３１で説明したように、最終的なクラスの縮退を行わず、最終的なクラスごとのタップ係数、及び、付加クラスを、フィルタ情報として伝送するか、又は、図４５で説明したように、最終的なクラスの縮退を行い、縮退クラスごとのタップ係数、付加クラス、及び、変換テーブルを伝送するかは、例えば、動作モードの切り替えにより選択することができる。

また、最終的なクラスを縮退クラスに縮退する場合、縮退クラスのクラス数は、例えば、S/Nが改善する程度と、符号化データのオーバーヘッドの増加量とを勘案して、適宜決定することができる。

＜符号化装置１１の第６の構成例＞

図４６は、図１の符号化装置１１の第６の構成例を示すブロック図である。

なお、図中、図３２の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図４６において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、及び、クラス分類適応フィルタ５１１を有する。

したがって、図４６の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図３２の場合と共通する。

但し、図４６の符号化装置１１は、クラス分類適応フィルタ４１１に代えて、クラス分類適応フィルタ５１１を有する点で、図３２の場合と相違する。

クラス分類適応フィルタ５１１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う点で、クラス分類適応フィルタ４１１と共通する。

さらに、クラス分類適応フィルタ５１１では、取得可能情報を用いたクラス分類により、第１クラスとしての通常クラスが求められるとともに、取得不可能情報を用いたクラス分類により第２クラスとしての付加クラスが求められ、それらの通常クラスと付加クラスとから、最終的なクラスが生成される点で、クラス分類適応フィルタ４１１と共通する。

また、クラス分類適応フィルタ５１１では、付加クラスが、フィルタ情報として、可逆符号化部１０６に供給されて伝送される点で、クラス分類適応フィルタ４１１と共通する。

但し、クラス分類適応フィルタ５１１では、最終的なクラスが、図４５で説明したように縮退クラスに変換（縮退）される点で、クラス分類適応フィルタ４１１と相違する。

さらに、クラス分類適応フィルタ５１１では、最終的なクラスを縮退クラスに変換する変換テーブルが、縮退クラスごとのタップ係数とともに、フィルタ情報として、可逆符号化部１０６に供給されて伝送される点で、クラス分類適応フィルタ４１１と相違する。

＜クラス分類適応フィルタ５１１の構成例＞

図４７は、図４６のクラス分類適応フィルタ５１１の構成例を示すブロック図である。

図４７において、クラス分類適応フィルタ５１１は、画像変換装置５３１及び学習装置５３２を有する。

画像変換装置５３１には、演算部１１０（図４６）から復号途中画像が供給されるとともに、学習装置５３２から縮退クラスごとのタップ係数、及び、変換テーブルが供給される。さらに、画像変換装置５３１には、符号化情報が供給される。また、画像変換装置５３１には、並べ替えバッファ１０２（図４６）から元画像が供給される。

画像変換装置５３１は、復号途中画像を第１の画像として、縮退クラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、フレームメモリ１１２（図４６）に供給する。

なお、画像変換装置５３１は、クラス分類適応処理において、クラス分類を、必要に応じて、符号化情報を用いて行う。

また、画像変換装置５３１は、取得可能情報としての復号途中画像から得られるクラスタップ及び符号化情報（符号化データに含められる符号化情報）を用いたクラス分類により、第１クラスとしての通常クラスを求めるとともに、取得不可能情報としての、例えば、元画像を用いたクラス分類により第２クラスとしての付加クラスを求め、それらの通常クラスと付加クラスとから、最終的なクラスを生成する。

さらに、画像変換装置５３１は、学習装置５３２からの変換テーブルに従って、最終的なクラスを縮退クラスに変換する。

また、画像変換装置５３１は、付加クラスを、フィルタ情報として、可逆符号化部１０６（図４６）に供給する。

学習装置５３２には、並べ替えバッファ１０２（図４６）から元画像が供給されるとともに、演算部１１０（図４６）から復号途中画像が供給される。さらに、学習装置５３２には、符号化情報が供給される。

学習装置５３２は、復号途中画像を生徒データとするとともに、元画像を教師データとして、縮退クラスごとのタップ係数を求めるタップ係数学習を行う。

さらに、学習装置５３２は、タップ係数学習により得られる縮退クラスごとのタップ係数を、フィルタ情報として、画像変換装置５３１及び可逆符号化部１０６（図４６）に供給する。

なお、学習装置５３２は、画像変換装置５３１と同様に、タップ係数学習において、クラス分類を、必要に応じて、符号化情報を用いて行う。

また、学習装置５３２は、画像変換装置５３１と同様に、クラス分類において、通常クラス及び付加クラスを求め、それらの通常クラスと付加クラスとから、最終的なクラスを生成する。

さらに、学習装置５３２は、最終的なクラスを縮退クラスに変換する変換テーブルを生成し、その変換テーブルに従って、最終的なクラスを縮退クラスに変換する。

また、学習装置５３２は、変換テーブルを、フィルタ情報として、画像変換装置５３１及び可逆符号化部１０６（図４６）に供給する。

＜画像変換装置５３１の構成例＞

図４８は、図４７の画像変換装置５３１の構成例を示すブロック図である。

なお、図中、図３４の画像変換装置４３１と対応する部分については、同一の符号を付してあり、その説明は、適宜省略する。

図４８において、画像変換装置５３１は、タップ選択部２１及び２２、係数取得部２４、予測演算部２５、並びに、クラス分類部５４１を有する。

したがって、画像変換装置５３１は、タップ選択部２１及び２２、係数取得部２４、並びに、予測演算部２５を有する点で、図３４の画像変換装置４３１と共通する。

但し、画像変換装置５３１は、クラス分類部４４１に代えて、クラス分類部５４１を有する点で、図３４の画像変換装置４３１と相違する。

クラス分類部５４１には、タップ選択部２２から、取得可能情報としての注目画素のクラスタップが供給される。さらに、クラス分類部５４１には、取得可能情報としての符号化情報が供給されるとともに、並べ替えバッファ１０２（図４６）から、取得不可能情報としての元画像が供給される。また、クラス分類部５４１には、学習装置５３２（図４７）から変換テーブルが供給される。

クラス分類部５４１は、図３４のクラス分類部４４１と同様に、クラスタップ及び符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求めるとともに、元画像を用いて、クラス分類を行い、注目画素の第２クラスとしての付加クラスを求める。

さらに、クラス分類部５４１は、クラス分類部４４１と同様に、付加クラスを、フィルタ情報として、可逆符号化部１０６に供給する。

また、クラス分類部５４１は、クラス分類部４４１と同様に、通常クラスと付加クラスとから、注目画素の最終的なクラスを生成する。

そして、クラス分類部５４１は、注目画素の最終的なクラスを、学習装置５３２（図４７）からの変換テーブルに従って、縮退クラスに変換し、係数取得部２４に供給する。

ここで、図４８において、係数取得部２４は、学習装置５３２から供給される縮退クラスごとのタップ係数を記憶し、その縮退クラスごとのタップ係数から、クラス分類部５４１からの縮退クラスのタップ係数を取得して、予測演算部２５に供給する。

図４９は、図４８のクラス分類部５４１の構成例を示すブロック図である。

なお、図中、図３５のクラス分類部４４１と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図４９において、クラス分類部５４１は、第１クラス分類部４５１ないしクラスコード生成部４５３、及び、クラス縮退部５５１を有する。

したがって、図４９のクラス分類部５４１は、第１クラス分類部４５１ないしクラスコード生成部４５３を有する点で、図３５のクラス分類部４４１と共通する。

但し、クラス分類部５４１は、クラス縮退部５５１を新たに有する点で、クラス分類部４４１と相違する。

クラス縮退部５５１には、学習装置５３２（図４７）から変換テーブルが供給されるとともに、クラスコード生成部４５３から注目画素の最終的なクラス（を表すクラスコード）が供給される。

クラス縮退部５５１は、学習装置５３２からの変換テーブルに従い、クラスコード生成部４５３からの最終的なクラスを、縮退クラス（を表すクラスコード）に変換し、係数取得部２４（図４８）に供給する。

＜学習装置５３２の構成例＞

図５０は、図４７の学習装置５３２の構成例を示すブロック図である。

なお、図中、図３６の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図５０において、学習装置５３２は、学習部３３及び変換テーブル生成部５６２を有する。学習部３３は、タップ選択部４１及び４２、足し込み部４４、係数算出部４５、並びに、クラス分類部４６１を有する。

したがって、図５０の学習装置５３２は、学習部３３を有する点で、図３６の場合と共通する。さらに、学習装置５３２は、学習部３３が、タップ選択部４１及び４２、足し込み部４４、係数算出部４５、並びに、クラス分類部４６１を有する点で、図３６の学習装置４３２と共通する。

但し、学習装置５３２は、変換テーブル生成部５６２を新たに有する点で、学習装置４３２と相違する。

変換テーブル生成部５６２には、係数算出部４５から最終的なクラスごとのタップ係数が供給される。

変換テーブル生成部５６２は、係数算出部４５からの最終的なクラス（ごとのタップ係数）を、縮退クラス（ごとのタップ係数）に縮退し、最終的なクラスを縮退クラスに変換する変換テーブルを生成する。

そして、変換テーブル生成部５６２は、縮退クラスごとのタップ係数及び変換テーブルを、フィルタ情報として、画像変換装置５３１（図４７）と、可逆符号化部１０６（図４６）とに供給する。

ここで、最終的なクラスのクラス数は、通常クラスのクラス数と、付加クラスのクラス数との乗算値の数だけのクラス数になるが、縮退クラスのクラス数としては、例えば、通常クラスのクラス数と等しいクラス数等を採用することができる。但し、縮退クラスのクラス数は、例えば、通常クラスのクラス数や、付加クラスのクラス数等に限定されるものではない。

最終的なクラスの縮退は、例えば、図２４で説明した方法で行うことができる。また、最終的なクラスの縮退は、例えば、タップ係数を座標軸とするタップ係数空間において、タップ係数（のセット）どうしの距離が短いクラスどうしを、１つのクラスにまとめること等により行うことができる。

さらに、最終的なクラスの縮退は、縮退後の縮退クラスごとのタップ係数を用いたクラス分類適応処理により得られる、元画像に対応する第２の画像のS/Nの低下を抑制する規範（以下、S/N規範ともいう）で行うことができる。

最終的なクラスの縮退を、S/N規範で行う場合には、変換テーブル生成部５６２には、例えば、教師データとしての元画像、及び、生徒データとしての復号途中画像が供給される。

変換テーブル生成部５６２は、任意の方法で、最終的なクラスの縮退を行い、縮退後の縮退クラスごとのタップ係数を用いて、クラス分類適応処理を行うことにより、教師データとしての元画像を予測した第２の画像を求め、元画像を真値とする第２の画像のS/Nを求める。

変換テーブル生成部５６２は、複数の縮退の方法（縮退クラスのクラス数が異なる縮退を含む）について、第２の画像のS/Nを求め、そのS/Nが閾値以上になる縮退の１つの方法を、最終的なクラスを縮退する方法に選択する。

＜符号化処理＞

図５１は、図４６の符号化装置１１の符号化処理の例を説明するフローチャートである。

図４６の符号化装置１１では、ステップＳ２１１ないしＳ２２９において、図３７のステップＳ１１１ないしＳ１２９とそれぞれ同様の処理が行われる。

但し、符号化装置１１において、クラス分類適応フィルタ５１１の学習装置５３２（図４７）は、図３３の学習装置４３２と同様に、そこに供給される復号途中画像を生徒データとするとともに、その復号途中画像に対応する元画像を教師データとして、適宜、タップ係数学習を行うが、そのタップ係数学習では、最終的なクラスごとのタップ係数を縮退した縮退クラスごとのタップ係数と、最終的なクラスを縮退クラスに変換する変換テーブルとが、フィルタ情報として生成される。縮退クラスごとのタップ係数、及び、変換テーブルは、フィルタ情報として、画像変換装置５３１（図４７）と可逆符号化部１０６（図４６）に供給される。

また、ステップＳ２１２での更新の対象のフィルタ情報、及び、ステップＳ２１３での伝送対象に設定されるフィルタ情報には、縮退クラスごとのタップ係数、及び、変換テーブルが含まれる。

さらに、ステップＳ２２５において、クラス分類適応フィルタ５１１は、図３７のステップＳ１２５と同様に、演算部１１０からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施す。

すなわち、クラス分類適応フィルタ５１１のクラス分類適応処理では、図３７の場合と同様に、クラスタップ、符号化情報、及び、元画像を用いたクラス分類により、通常クラス及び付加クラスが求められ、その通常クラス及び付加クラスから最終的なクラスが生成される。そして、付加クラスは、図３７の場合と同様に、フィルタ情報として、可逆符号化部１０６に供給される。

但し、クラス分類適応フィルタ５１１のクラス分類適応処理では、最終的なクラスが、学習装置５３２（図４７）からの変換テーブルに従って縮退クラスに変換され、その縮退クラスごとのタップ係数が用いられる。

また、ステップＳ２２７では、可逆符号化部１０６は、図３７のステップＳ１２７と同様に、量子化係数、符号化情報、及び、フィルタ情報を符号化し、符号化データに含めるが、フィルタ情報には、付加クラス、縮退クラスごとのタップ係数、及び、変換テーブルが含まれる。

したがって、可逆符号化部１０６で得られる符号化データには、量子化係数、符号化情報、及び、フィルタ情報としての付加クラスや、縮退クラスごとのタップ係数、変換テーブルが含まれる。そして、かかる符号化データは、ステップＳ２２８で、図１４のステップＳ２８で説明したように、蓄積バッファ１０７から、適宜読み出されて伝送される。

図５２は、図５１のステップＳ２２５で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ５１１の画像変換装置５３１（図４８）では、ステップＳ２４１ないしＳ２４７において、図３８のステップＳ１４１ないしＳ１４７とそれぞれ同様の処理が行われる。

但し、ステップＳ２４３の注目画素のクラス分類では、クラス分類部５４１（図４８、図４９）は、クラスタップ、符号化情報、及び、元画像を用いて、注目画素について、通常画像及び付加クラスから、最終的なクラスを求め、その最終的なクラスを、縮退クラスに縮退する。

すなわち、クラス分類では、ステップＳ２５１ないしＳ２５６において、図３８のステップＳ１５１ないしＳ１５６とそれぞれ同様の処理が行われ、これにより、クラス分類部５４１（図４９）のクラスコード生成部４５３では、第１クラス分類部４５１からの通常クラスと、第２クラス分類部４５２からの付加クラスとから、注目画素の最終的なクラスが生成され、クラス縮退部５５１に供給される。

その後、処理は、ステップＳ２５６からステップＳ２５７に進み、クラス縮退部５５１は、クラスコード生成部４５３からの最終的なクラスを、学習装置５３２（図４７）からの変換テーブルに従って、縮退クラスに変換する。

そして、クラス縮退部５５１は、縮退クラスを、画像変換装置５３１（図４８）の係数取得部２４に供給し、ステップＳ２４３のクラス分類を終了する。

＜復号装置１２の第６の構成例＞

図５３は、図１の復号装置１２の第６の構成例を示すブロック図である。

なお、図中、図３９の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図５３において、復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０ないし選択部２１４、及び、クラス分類適応フィルタ５７１を有する。

したがって、図５３の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図３９の場合と共通する。

但し、図５３の復号装置１２は、クラス分類適応フィルタ４７１に代えて、クラス分類適応フィルタ５７１を有する点で、図３９の場合と相違する。

図５３の復号装置１２は、図４６の符号化装置１１から伝送されてくる符号化データを復号する。

そのため、可逆復号部２０２からクラス分類適応フィルタ５７１に供給されるフィルタ情報には、縮退クラスごとのタップ係数及び変換テーブルや、付加クラスが含まれる。

クラス分類適応フィルタ５７１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う点で、図３９のクラス分類適応フィルタ４７１と共通する。

但し、クラス分類適応フィルタ５７１は、クラス分類適応フィルタ４７１と同様に、可逆復号部２０２からのフィルタ情報としての付加クラスを用いて、最終的なクラスを生成するが、その最終的なクラスを、可逆復号部２０２からのフィルタ情報としての変換テーブルに従って、縮退クラスに変換する点で、クラス分類適応フィルタ４７１と相違する。

＜クラス分類適応フィルタ５７１の構成例＞

図５４は、図５３のクラス分類適応フィルタ５７１の構成例を示すブロック図である。

図５４において、クラス分類適応フィルタ５７１は、画像変換装置５８１を有する。

画像変換装置５８１には、演算部２０５（図５３）から復号途中画像が供給されるとともに、可逆復号部２０２からフィルタ情報としての縮退クラスごとのタップ係数、変換テーブル、及び、付加クラス、並びに、符号化情報が供給される。

画像変換装置５８１は、図４７の画像変換装置５３１と同様に、復号途中画像を第１の画像として、クラス（縮退クラス）ごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、並べ替えバッファ２０７及びフレームメモリ２１０（図５３）に供給する。

なお、画像変換装置５８１は、クラス分類適応処理において、図４７の画像変換装置５３１と同様に、クラス分類を、必要に応じて、符号化情報を用いて行う。

また、画像変換装置５８１は、画像変換装置４８１（図４０）と同様に、クラスタップを用いたクラス分類により、注目画素の第１クラスとしての通常クラスを求めるとともに、注目画素の第２クラスとしての付加クラスを、可逆復号部２０２（図５３）からのフィルタ情報から取得し、それらの通常クラスと付加クラスとから、注目画素の最終的なクラスを生成する。

そして、画像変換装置５８１は、注目画素の最終的なクラスを、可逆復号部２０２からのフィルタ情報としての変換テーブルに従って、縮退クラスに変換し、その縮退クラスのタップ係数を用いて、式（１）の予測演算を行う。

＜画像変換装置５８１の構成例＞

図５５は、図５４の画像変換装置５８１の構成例を示すブロック図である。

なお、図中、図４１の画像変換装置４８１と共通する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図５５において、画像変換装置５８１は、タップ選択部２４１及び２４２、係数取得部２４４、予測演算部２４５、並びに、クラス分類部５９１を有する。

したがって、図５５の画像変換装置５８１は、タップ選択部２４１及び２４２、係数取得部２４４、並びに、予測演算部２４５を有する点で、図４１の画像変換装置４８１と共通する。

但し、図５５の画像変換装置５８１は、クラス分類部４９１に代えて、クラス分類部５９１を有する点で、図４１の画像変換装置４８１と相違する。

可逆復号部２０２（図５３）からのフィルタ情報としての縮退クラスごとのタップ係数（通常クラスのクラス数と付加クラスのクラス数との乗算値のクラス数だけのタップ係数）は、係数取得部２４４に供給されて記憶される。

また、可逆復号部２０２（図５３）からのフィルタ情報としての付加クラスや変換テーブルは、クラス分類部５９１に供給される。

さらに、クラス分類部５９１には、可逆復号部２０２からの符号化情報が供給されるとともに、タップ選択部２４２からクラスタップが供給される。

クラス分類部５９１は、図４１のクラス分類部４９１と同様に、クラスタップ及び符号化情報を用いて、クラス分類を行い、注目画素の第１クラスとしての通常クラスを求める。

さらに、クラス分類部５９１は、図４１のクラス分類部４９１と同様に、可逆復号部２０２（図５３）からのフィルタ情報として付加クラスの中から、注目画素の第２クラスとしての付加クラスを取得する。

そして、クラス分類部５９１は、図４１のクラス分類部４９１と同様に、通常クラスと付加クラスとから、注目画素の最終的なクラスを生成する。

さらに、クラス分類部５９１は、注目画素の最終的なクラスを、可逆復号部２０２（図５３）からのフィルタ情報としての変換テーブルに従って、縮退クラスに変換し、係数取得部２４４に供給する。

係数取得部２４４は、可逆復号部２０２からフィルタ情報としての縮退クラスごとのタップ係数から、クラス分類部５９１からの注目画素の縮退クラスのタップ係数を取得し、予測演算部２４５に供給する。

図５６は、図５５のクラス分類部５９１の構成例を示すブロック図である。

なお、図中、図４２のクラス分類部４９１と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図５６において、クラス分類部５９１は、第１クラス分類部５０１、クラスコード生成部５０２、及び、クラス縮退部６０１を有する。

したがって、図５６のクラス分類部５９１は、第１クラス分類部５０１、及び、クラスコード生成部５０２を有する点で、図４２のクラス分類部４９１と共通する。

但し、クラス分類部５９１は、クラス縮退部６０１を新たに有する点で、クラス分類部４９１と相違する。

クラス縮退部６０１には、クラスコード生成部５０２が生成する、注目画素の最終的なクラスと、可逆復号部２０２（図５３）からのフィルタ情報に含まれる変換テーブルとが供給される。

クラス縮退部６０１は、クラスコード生成部５０２からの注目画素の最終的なクラスを、可逆復号部２０２からの変換テーブルに従って、縮退クラスに変換し、係数取得部２４４（図５５）に供給する。

＜復号処理＞

図５７は、図５３の復号装置１２の復号処理の例を説明するフローチャートである。

図５３の復号装置１２では、ステップＳ２６１ないしＳ２７３において、図４３のステップＳ１６１ないしＳ１７３とそれぞれ同様の処理が行われる。

但し、ステップＳ２６２では、可逆復号部２０２は、図４３のステップＳ１６２と同様に、符号化データを復号し、その復号により得られる量子化係数を、逆量子化部２０３に供給するとともに、符号化データの復号により得られる符号化情報やフィルタ情報を、イントラ予測部２１２や、動き予測補償部２１３、クラス分類適応フィルタ５７１その他の必要なブロックに供給するが、クラス分類適応フィルタ５７１に供給されるフィルタ情報には、第２クラスとしての付加クラスや、縮退クラスごとのタップ係数及び変換テーブルが含まれることがある。

また、ステップＳ２７０において、クラス分類適応フィルタ５７１は、図４３のステップＳ１７０と同様に、演算部２０５からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施すが、そのクラス分類適応処理では、クラスタップ及び符号化情報を用いたクラス分類により求められる通常クラスと、可逆復号部２０２（図５３）からのフィルタ情報としての付加クラスとから生成される最終的なクラスが、可逆復号部２０２からのフィルタ情報としての変換テーブルに従って、縮退クラスに変換される。

図５８は、図５７のステップＳ２７０で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ５７１の画像変換装置５８１（図５５）では、ステップＳ２８１ないしＳ２８７において、図４４のステップＳ１８１ないしＳ１８７とそれぞれ同様の処理が行われる。

但し、ステップＳ２８３の注目画素のクラス分類では、クラス分類部５９１（図５６）は、可逆復号部２０２（図５３）から供給されるフィルタ情報としての注目画素の付加クラスから、注目画素の最終的なクラスを生成した後、その最終的なクラスを縮退クラスに変換する。

すなわち、クラス分類では、ステップＳ２９１ないしＳ２９４において、図４４のステップＳ１９１ないしＳ１９４とそれぞれ同様の処理が行われ、これにより、クラス分類部５９１（図５６）のクラスコード生成部５０２では、第１クラス分類部４５１からの通常クラスと、可逆復号部２０２（図５３）からのフィルタ情報としての付加クラスとから、注目画素の最終的なクラスが生成され、クラス縮退部６０１に供給される。

その後、処理は、ステップＳ２９４からステップＳ２９５に進み、クラス縮退部６０１は、可逆復号部２０２（図５３）からの変換テーブルに従って、クラスコード生成部５０２からの注目画素の最終的なクラスを、縮退クラスに変換する。

そして、クラス縮退部６０１は、縮退クラスを、画像変換装置５８１（図５５）の係数取得部２４４に供給し、ステップＳ２８３のクラス分類を終了する。

以上のように、通常クラスと付加クラスとから生成される最終的なクラスを採用する場合には、通常クラスだけを採用する場合に比較して、クラス数が増加し、その結果、符号化データのオーバーヘッドが増加するが、最終的なクラスを縮退クラスに変換（縮退）することで、符号化データのオーバーヘッドの増加を抑制することができる。

＜クラス分類係数を用いたクラス分類＞

図５９は、クラス分類係数の学習の概要を説明する図である。

クラスタップから、ADRCコード等の画像特徴量を求め、その画像特徴量によって、注目画素をクラス分類する場合には、クラス分類適応処理により得られる第２の画像のS/Nをより向上させるようにクラス分類が行われるとは限らない。

一方、クラス分類係数を用いたクラス分類では、クラス分類適応処理により得られる第２の画像のS/Nをより向上させるようにクラス分類が行われる。

クラス分類係数は、タップ係数とともに、統計的な誤差を最小にする学習により求められる。

図５９は、クラス分類係数の学習の概要を示している。

クラス分類係数の学習は、いわば階層的に行われる。最初の階層を第0階層とする。

各階層の学習では、注目画素を、複数のサブクラスのうちのいずれかのサブクラスに分類するサブクラス分類を行うクラス分類係数が求められる。

いま、サブクラス分類において、注目画素を、例えば、2つのサブクラス0又は1のうちのいずれかに分類することとすると、第n階層の学習では、2ⁿクラス（個）のクラス分類係数cc(n,k)（のセット）が求められる(k=0,1,...,2ⁿ-1)。

ここで、クラス分類係数は、タップ係数とともに、統計的な誤差を最小にする学習により求められるが、説明を簡単にするため、ここでは、クラス分類係数の学習にだけ注目する。

いま、クラスタップがM個の画素（の画素値）で構成されることとし、そのM個の画素のうちのn番目の画素の画素値を、x_mと表すこととする。

さらに、1クラス（個）のクラス分類係数（のセット）は、クラスタップの画素数Mと同一の数の係数からなり、その1クラスのクラス分類係数のうちの、m番目の係数（クラス分類係数）を、w_mと表すこととする。

また、生徒データとしての生徒画像を対象としたクラス分類適応処理により得られる、教師データとしての教師画像の画素の画素値の予測値の予測誤差の予測値（以下、予測誤差予測値ともいう）を、yと表すこととする。

さらに、予測誤差予測値yは、クラスタップx_m及びクラス分類係数w_mを用いた、例えば、線形１次式y=w₁x₁+w₂x₂+...+w_Mx_Mで表される積和演算等の所定の演算により求められることとする。ここで、所定の演算を表す、例えば、式y=w₁x₁+w₂x₂+...+w_Mx_Mを、以下、予測誤差予測式ともいう。

クラス分類係数の学習では、まず、第0階層の学習が行われる。

第0階層の学習では、例えば、生徒画像の全画素を、第0階層の画素群(0,0)として、画素群(0,0)の各画素の画素値を生徒データとするとともに、画素群(0,0)の各画素を対象としたクラス分類適応処理により得られる、画素群(0,0)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_m（のセット）が、第0階層のクラス分類係数cc(0,0)として求められる。

さらに、第0階層の画素群(0,0)の各画素について、第0階層のクラス分類係数cc(0,0)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第0階層の画素群(0,0)の画素のうちの、例えば、予測誤差予測値yが0以上の画素は、サブクラス0にサブクラス分類される。さらに、第0階層の画素群(0,0)の画素のうちの、例えば、予測誤差予測値yが0未満の画素は、サブクラス1にサブクラス分類され、第0階層の学習は終了する。

なお、サブクラス分類では、その他、例えば、予測誤差予測値yの絶対値が閾値未満の画素を、サブクラス0に分類し、予測誤差予測値yの絶対値が閾値以上の画素を、サブクラス1に分類することができる。

また、サブクラス分類では、画素を、その画素の予測誤差予測値yの絶対値によって、3以上のサブクラスのうちのいずれかに分類することができる。

ここで、第0階層の画素群(0,0)のうちの、サブクラス0にサブクラス分類された画素で構成される画素群を、画素群(0,0,0)というとともに、サブクラス1にサブクラス分類された画素で構成される画素群を、画素群(0,0,1)という。

また、画素群(n,k,s)は、第n階層の画素群(n,k)の中で、第n階層のクラス分類係数cc(n,k)を用いたサブクラス分類によりサブクラスsに分類された画素群を表す。

画素群(n,k)は、第n階層のk+1番目の画素群を表す。kは、0,1,...,2ⁿ-1の2ⁿ個の値をとり、したがって、第n階層の（サブクラス分類前の）画素群(n,k)は、2ⁿ個だけ存在する。

第0階層の学習の終了後、必要に応じて、次の階層、すなわち、第1階層の学習が行われる。

第1階層の学習では、第0階層の学習でのサブクラス分類で得られた2¹個の画素群(0,0,0)及び画素群(0,0,1)を、第1階層の2ⁿ個の画素群(n,k)、つまり、第1階層の2¹個の画素群(1,0)及び画素群(1,1)として、第0階層の学習と同様の処理が行われる。

すなわち、第1階層の1個目の画素群(1,0)については、その画素群(1,0)を生徒データとするとともに、画素群(1,0)の各画素を対象としたクラス分類適応処理により得られる、画素群(1,0)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第1階層の1個（クラス）目のクラス分類係数cc(1,0)として求められる。

さらに、第1階層の画素群(1,0)の各画素について、第1階層のクラス分類係数cc(1,0)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第1階層の画素群(1,0)の画素のうちの、予測誤差予測値yが0以上の画素は、サブクラス0の画素群(1,0,0)にサブクラス分類され、予測誤差予測値yが0未満の画素は、サブクラス1の画素群(1,0,1)にサブクラス分類される。

第1階層の2個目の画素群(1,1)についても、同様に、その画素群(1,1)を生徒データとするとともに、画素群(1,1)の各画素を対象としたクラス分類適応処理により得られる、画素群(1,1)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第1階層の2個（クラス）目のクラス分類係数cc(1,1)として求められる。

さらに、第1階層の画素群(1,1)の各画素について、第1階層のクラス分類係数cc(1,1)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第1階層の画素群(1,1)の画素のうちの、予測誤差予測値yが0以上の画素は、サブクラス0の画素群(1,1,0)にサブクラス分類され、予測誤差予測値yが0未満の画素は、サブクラス1の画素群(1,1,1)にサブクラス分類される。

第1階層の学習の終了後、必要に応じて、次の階層、すなわち、第2階層の学習が行われる。

第2階層の学習では、第1階層の学習でのサブクラス分類で得られた2²個の画素群(1,0,0)、画素群(1,0,1)、画素群(1,1,0)、及び、画素群(1,1,1)を、第2階層の2ⁿ個の画素群(n,k)、つまり、第2階層の2²個の画素群(2,0)、画素群(2,1)、画素群(2,2)、及び、画素群(2,3)として、第0階層の学習と同様の処理が行われる。

すなわち、第2階層の1個目の画素群(2,0)については、その画素群(2,0)を生徒データとするとともに、画素群(2,0)の各画素を対象としたクラス分類適応処理により得られる、画素群(2,0)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第2階層の1個目のクラス分類係数cc(2,0)として求められる。

さらに、第2階層の画素群(2,0)の各画素について、第2階層のクラス分類係数cc(2,0)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第2階層の画素群(2,0)の画素のうちの、予測誤差予測値yが0以上の画素は、サブクラス0の画素群(2,0,0)にサブクラス分類され、予測誤差予測値yが0未満の画素は、サブクラス1の画素群(2,0,1)にサブクラス分類される。

第2階層の2個目の画素群(2,1)についても、同様に、その画素群(2,1)を生徒データとするとともに、画素群(2,1)の各画素を対象としたクラス分類適応処理により得られる、画素群(2,1)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第2階層の2個目のクラス分類係数cc(2,1)として求められる。

さらに、第2階層の画素群(2,1)の各画素について、第2階層のクラス分類係数cc(2,1)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第2階層の画素群(2,1)の画素のうちの、予測誤差予測値yが0以上の画素は、サブクラス0の画素群(2,1,0)にサブクラス分類され、予測誤差予測値yが0未満の画素は、サブクラス1の画素群(2,1,1)にサブクラス分類される。

第2階層の3個目の画素群(2,2)についても、同様に、その画素群(2,2)を生徒データとするとともに、画素群(2,2)の各画素を対象としたクラス分類適応処理により得られる、画素群(2,2)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第2階層の3個目のクラス分類係数cc(2,2)として求められる。

さらに、第2階層の画素群(2,2)の各画素について、第2階層のクラス分類係数cc(2,2)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第2階層の画素群(2,2)の画素のうちの、予測誤差予測値yが0以上の画素は、サブクラス0の画素群(2,2,0)にサブクラス分類され、予測誤差予測値yが0未満の画素は、サブクラス1の画素群(2,2,1)にサブクラス分類される。

第2階層の4個目の画素群(2,3)についても、同様に、その画素群(2,3)を生徒データとするとともに、画素群(2,3)の各画素を対象としたクラス分類適応処理により得られる、画素群(2,3)の各画素に対応する教師画像の画素の画素値の予測値の予測誤差を教師データとして、予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第2階層の4個目のクラス分類係数cc(2,3)として求められる。

さらに、第2階層の画素群(2,3)の各画素について、第2階層のクラス分類係数cc(2,3)を用い、予測誤差予測式に従って、予測誤差予測値yが求められる。

そして、第2階層の画素群(2,3)の画素のうちの、予測誤差予測値yが0以上の画素は、サブクラス0の画素群(2,3,0)にサブクラス分類され、予測誤差予測値yが0未満の画素は、サブクラス1の画素群(2,3,1)にサブクラス分類される。

第2階層の学習の終了後、必要に応じて、次の階層、すなわち、第3階層の学習が行われる。

第3階層の学習では、第2階層の学習でのサブクラス分類で得られた2³個の画素群(2,0,0)、画素群(2,0,1)、画素群(2,1,0)、画素群(2,1,1)、画素群(2,2,0)、画素群(2,2,1)、画素群(2,3,0)、画素群(2,3,1)を、第3階層の2ⁿ個の画素群(n,k)、つまり、第3階層の2³個の画素群(3,0)、画素群(3,1)、画素群(3,2)、画素群(3,3)、画素群(3,4)、画素群(3,5)、画素群(3,6)、画素群(3,7)として、第0階層の学習と同様の処理が行われる。

以下、同様にして、必要な階層までの学習が行われる。

クラス分類係数の学習が、第L階層の学習まで行われた場合、第0階層の2⁰個のクラス分類係数cc(2,0)から、第L階層の2^L個のクラス分類係数cc(L,0),cc(L,1),...cc(L,2^L-1)までのクラス分類係数が得られる。

ここで、第n階層のk+1個目の画素群(n,k)を、第n階層のクラスkの画素群(n,k)ともいうとともに、第n階層のクラス分類係数cc(n,k)を、第n階層のクラスkのクラス分類係数cc(n,k)ともいう。

クラス分類係数の学習では、第n階層の学習において、第n階層のクラスkのクラス分類係数cc(n,k)を用い、予測誤差予測式に従って、第n階層のクラスkの画素群(n,k)のサブクラス分類が行われ、第n階層のクラスkの画素群(n,k)が、サブクラス0の画素群と、サブクラス1の画素分とに分類される。

そして、次の第n+1階層の学習において、第n階層のクラスkの画素群(n,k)のうちの、サブクラス0の画素群が、第n+1階層のあるクラスk1の画素群(n+1,k1)とされるとともに、サブクラス1の画素群が、第n+1階層の他のクラスk2の画素群(n+1,k2)とされる。

さらに、第n+1階層のクラスk1の画素群(n+1,k1)のサブクラス分類が、第n+1階層のクラスk1のクラス分類係数cc(n+1,k1)を用いて行われるとともに、第n+1階層のクラスk2の画素群(n+1,k2)のサブクラス分類が、第n+1階層のクラスk2のクラス分類係数cc(n+1,k2)を用いて行われる。

以下同様に、サブクラス分類が再帰的に繰り返し行われ、第0階層から任意の階層までのクラス分類係数が求められる。

図６０は、クラス分類係数を用いたクラス分類の概要を説明する図である。

クラス分類係数を用いたクラス分類は、クラス分類係数の学習と同様に、階層的に行われる。

すなわち、クラス分類係数を用いたクラス分類では、まず、第0階層のサブクラス分類が行われる。

第0階層のサブクラス分類では、注目画素について、第0階層のクラス分類係数cc(0,0)を用いて、予測誤差予測値yが求められる。

そして、注目画素の予測誤差予測値yが0以上である場合、注目画素は、第0階層のサブクラス0にサブクラス分類される。また、注目画素の予測誤差予測値yが0未満である場合、注目画素は、第0階層のサブクラス1にサブクラス分類される。

第0階層において、サブクラス0又は1にサブクラス分類された注目画素は、次の階層、すなわち、第1階層のクラスの画素になる。

第0階層において、注目画素がサブクラス分類された場合、注目画素の第1の階層のクラスが、注目画素の第0階層のクラスに、注目画素の第0階層のサブクラスを加味して決定される。

第0階層には、クラスがないので、注目画素の第1階層のクラスは、注目画素の第0階層のサブクラスから決定される。

すなわち、第0階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第1階層のクラスは、例えば、サブクラス0に応じて、クラス0に決定される。

また、第0階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第1階層のクラスは、例えば、サブクラス1に応じて、クラス1に決定される。

ここで、クラスkは、クラスコードがkのクラスを表すこととする。

第0階層のサブクラス分類の終了後、次の階層、すなわち、第1階層のクラス分類係数cc(1,0)及びcc(1,1)が存在する場合には、第1階層のサブクラス分類が行われる。

第1階層のサブクラス分類では、第1階層のクラス分類係数cc(1,0)及びcc(1,1)のうちの、注目画素の第1階層のクラスkのクラス分類係数cc(1,k)が用いられる。

したがって、注目画素の第1階層のクラスkがクラス0である場合、第1階層のクラス分類係数cc(1,0)を用いて、注目画素の予測誤差予測値yが求められる。また、注目画素の第1階層のクラスkがクラス1である場合、第1階層のクラス分類係数cc(1,1)を用いて、注目画素の予測誤差予測値yが求められる。

そして、注目画素の予測誤差予測値yが0以上である場合、注目画素は、第1階層のサブクラス0にサブクラス分類される。また、注目画素の予測誤差予測値yが0未満である場合、注目画素は、第1階層のサブクラス1にサブクラス分類される。

第1階層において、サブクラス0又は1にサブクラス分類された注目画素は、次の階層、すなわち、第2階層のクラスの画素になる。

第1階層において、注目画素がサブクラス分類された場合、注目画素の第2の階層のクラスが、注目画素の第1階層のクラスに、注目画素の第1階層のサブクラスを加味して決定される。

例えば、注目画素の第1階層のクラスkがクラス0である場合、注目画素の第2階層のクラスは、その第1階層のクラス0に、注目画素の第1階層のサブクラスを加味して決定される。

すなわち、第1階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第2階層のクラスは、注目画素の第1階層のクラス0の下位ビットに、注目画素の第1階層のサブクラス0を付加して、クラス00₂＝0に決定される。ここで、下付の2は、その直前の数値が2進数であることを表す。

また、第1階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第2階層のクラスは、注目画素の第1階層のクラス0の下位ビットに、注目画素の第1階層のサブクラス1を付加して、クラス01₂＝1に決定される。

一方、注目画素の第1階層のクラスkがクラス1である場合、注目画素の第2階層のクラスは、その第1階層のクラス1に、注目画素の第1階層のサブクラスを加味して決定される。

すなわち、第1階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第2階層のクラスは、注目画素の第1階層のクラス1の下位ビットに、注目画素の第1階層のサブクラス0を付加して、クラス10₂＝2に決定される。

また、第1階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第2階層のクラスは、注目画素の第1階層のクラス1の下位ビットに、注目画素の第1階層のサブクラス1を付加して、クラス11₂＝3に決定される。

第1階層のサブクラス分類の終了後、次の階層、すなわち、第2階層のクラス分類係数cc(2,0)，cc(2,1)，cc(2,2)，cc(2,3)が存在する場合には、第2階層のサブクラス分類が行われる。

第2階層のサブクラス分類では、第2階層のクラス分類係数cc(2,0)ないしcc(2,3)のうちの、注目画素の第2階層のクラスkのクラス分類係数cc(2,k)が用いられる。

したがって、例えば、注目画素の第2階層のクラスkがクラス0=00₂である場合、第2階層のクラス分類係数cc(2,0)を用いて、注目画素の予測誤差予測値yが求められる。

そして、注目画素の予測誤差予測値yが0以上である場合、注目画素は、第2階層のサブクラス0にサブクラス分類される。また、注目画素の予測誤差予測値yが0未満である場合、注目画素は、第2階層のサブクラス1にサブクラス分類される。

第2階層において、サブクラス0又は1にサブクラス分類された注目画素は、次の階層、すなわち、第3階層のクラスの画素になる。

第2階層において、注目画素がサブクラス分類された場合、注目画素の第3の階層のクラスが、注目画素の第2階層のクラスに、注目画素の第2階層のサブクラスを加味して決定される。

いまの場合、注目画素の第2階層のクラスkはクラス0=00₂であるため、注目画素の第3階層のクラスは、その第2階層のクラス0=00₂に、注目画素の第2階層のサブクラスを加味して決定される。

すなわち、第2階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス0=00₂の下位ビットに、注目画素の第2階層のサブクラス0を付加して、クラス000₂＝0に決定される。

また、第2階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス0=00₂の下位ビットに、注目画素の第2階層のサブクラス1を付加して、クラス001₂＝1に決定される。

注目画素の第2階層のクラスkがクラス1=01₂である場合、第2階層のクラス分類係数cc(2,1)を用いて、注目画素の予測誤差予測値yが求められる。

第2階層において、注目画素がサブクラス分類された場合、注目画素の第2の階層のクラスが、注目画素の第2階層のクラスに、注目画素の第2階層のサブクラスを加味して決定される。

いまの場合、注目画素の第2階層のクラスkはクラス1=01₂であるため、注目画素の第3階層のクラスは、その第2階層のクラス1=01₂に、注目画素の第2階層のサブクラスを加味して決定される。

すなわち、第2階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス1=01₂の下位ビットに、注目画素の第2階層のサブクラス0を付加して、クラス010₂＝2に決定される。

また、第2階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス1=01₂の下位ビットに、注目画素の第2階層のサブクラス1を付加して、クラス011₂＝3に決定される。

注目画素の第2階層のクラスkがクラス2=10₂である場合、第2階層のクラス分類係数cc(2,2)を用いて、注目画素の予測誤差予測値yが求められる。

いまの場合、注目画素の第2階層のクラスkはクラス2=10₂であるため、注目画素の第3階層のクラスは、その第2階層のクラス2=10₂に、注目画素の第2階層のサブクラスを加味して決定される。

すなわち、第2階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス2=10₂の下位ビットに、注目画素の第2階層のサブクラス0を付加して、クラス100₂＝4に決定される。

また、第2階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス2=10₂の下位ビットに、注目画素の第2階層のサブクラス1を付加して、クラス101₂＝5に決定される。

注目画素の第2階層のクラスkがクラス3=11₂である場合、第2階層のクラス分類係数cc(2,3)を用いて、注目画素の予測誤差予測値yが求められる。

いまの場合、注目画素の第2階層のクラスkはクラス3=11₂であるため、注目画素の第3階層のクラスは、その第2階層のクラス3=11₂に、注目画素の第2階層のサブクラスを加味して決定される。

すなわち、第2階層において、注目画素がサブクラス0にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス3=11₂の下位ビットに、注目画素の第2階層のサブクラス0を付加して、クラス110₂＝6に決定される。

また、第2階層において、注目画素がサブクラス1にサブクラス分類された場合、注目画素の第3階層のクラスは、注目画素の第2階層のクラス3=11₂₂の下位ビットに、注目画素の第2階層のサブクラス1を付加して、クラス111₂＝7に決定される。

以下、クラス分類係数cc(n,k)が存在しない階層に到達するまで、各階層のサブクラス分類が順次行われる。

なお、クラス分類係数の学習と、クラス分類係数を用いたクラス分類については、例えば、特許第5347862号公報に記載されている。

＜クラス分類係数の学習を行う学習装置＞

図６１は、クラス分類係数の学習を行う学習装置の構成例を示すブロック図である。

図６１の学習装置では、クラス分類係数が、タップ係数とともに、統計的な誤差を最小にする学習により求められる。

図６１において、学習装置は、タップ係数学習部７０１、タップ係数設定部７０２、サブクラス教師データ生成部７０３、クラス分類係数学習部７０４、クラス分類係数設定部７０５、サブクラス予測部７０６、サブクラス分類部７０７、クラス決定部７０８、画素予測部７０９、及び、終了条件判定部７１０を有する。

タップ係数学習部７０１には、生徒データとして、例えば、復号途中画像に相当する生徒画像が供給されるとともに、教師データとして、例えば、元画像に相当する教師画像が供給される。

さらに、タップ係数学習部７０１には、クラス決定部７０８から、生徒画像の各画素の第n階層のクラスkが供給される。

タップ係数学習部７０１は、クラス決定部７０８からの第n階層のクラスkごとに、生徒画像の第n階層のクラスkの画素群(n,k)と、その画素群(n,k)に対応する教師画像の画素群とを用いて、第n階層のクラスkのタップ係数tc(n,k)（のセット）を求めるタップ係数学習を行う。

そして、タップ係数学習部７０１は、タップ係数学習によって得られる、第n階層のクラスkのタップ係数tc(n,k)(k=0,1,...2ⁿ-1)を、タップ係数設定部７０２に供給する。

タップ係数設定部７０２は、タップ係数学習部７０１からの、第n階層のクラスkのタップ係数tc(n,k)(k=0,1,...2ⁿ-1)、すなわち、第n階層の2ⁿクラス（個）のタップ係数tc(n,k)を記憶し、画素予測部７０９に設定する。

また、タップ係数設定部７０２は、終了条件判定部７１０の制御に従い、記憶している第n階層の2ⁿクラスのタップ係数tc(n,k)を外部に出力する。

サブクラス教師データ生成部７０３には、教師画像が供給される。さらに、サブクラス教師データ生成部７０３には、画素予測部７０９から、生徒画像及び第n階層の2ⁿクラスのタップ係数tc(n,k)を用いたクラス分類適応処理により求められる、教師画像の画素の画素値を予測した予測値（以下、画素予測値ともいう）が供給される。

サブクラス教師データ生成部７０３は、教師画像と、画素予測部７０９からの画素予測値とから、サブクラス教師データを生成し、クラス分類係数学習部７０４に供給する。

ここで、サブクラス教師データは、生徒画像の画素が属するサブクラスに関する情報であり、クラス分類係数学習部７０４でのクラス分類係数学習の教師データとなる。

サブクラス教師データとしては、例えば、画素予測部７０９からサブクラス教師データ生成部７０３に供給される画素予測値の、教師画像の画素の画素値に対する予測誤差を採用することができる。

クラス分類係数学習部７０４には、サブクラス教師データ生成部７０３からサブクラス教師データが供給される他、生徒画像が供給される。

クラス分類係数学習部７０４は、サブクラス教師データとしての画素予測値の予測誤差を教師データとするとともに、生徒画像の画素のうちの、第n階層のクラスkの画素群(n,k)を生徒データとして、図５９で説明したように、第n階層のクラスkのクラス分類係数cc(n,k)を求めるクラス分類係数学習を行う。

すなわち、クラス分類係数学習部７０４では、第n階層のクラスkの生徒画像の画素群(n,k)を生徒データとするとともに、その画素群(n,k)の各画素に対応する教師画像の画素の画素予測値の予測誤差（サブクラス教師データ）を教師データとして、上述の予測誤差予測式y=w₁x₁+w₂x₂+...+w_Mx_Mで表される、画素予測値の予測誤差予測値yの予測誤差を統計的に最小にするクラス分類係数w_mが、第n階層のクラスkのクラス分類係数cc(n,k)として求められる。予測誤差予測値yの予測誤差を統計的に最小にする第n階層のクラスkのクラス分類係数cc(n,k)は、例えば、タップ係数学習と同様に、最小自乗法により求めることができる。

クラス分類係数学習部７０４は、クラス分類係数学習により、第n階層の2ⁿクラスのクラス分類係数cc(n,k)を求めると、その第n階層の2ⁿクラスのクラス分類係数cc(n,k)を、クラス分類係数設定部７０５に供給する。

クラス分類係数設定部７０５は、クラス分類係数学習部７０４からの第n階層の2ⁿクラスのクラス分類係数cc(n,k)を記憶し、サブクラス予測部７０６に設定する。

また、クラス分類係数設定部７０５は、終了条件判定部７１０の制御に従い、記憶している第0階層から第n階層までのクラス分類係数cc(0,k)，cc(1,k)，．．．，cc(n,k)を外部に出力する。

サブクラス予測部７０６には、生徒画像が供給される。

サブクラス予測部７０６は、生徒画像の画素群のうちの第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)の各画素について、クラス分類係数設定部７０５からの、第n階層のクラスkのクラス分類係数cc(n,k)={w_m}を用い、予測誤差予測式y=w₁x₁+w₂x₂+...+w_Mx_Mに従った予測演算を行うことにより、画素予測値の予測誤差予測値yを、サブクラス予測値として求める。

ここで、サブクラス予測値とは、第n階層のクラスkの画素群(n,k)の画素が属するサブクラスに関する情報としてのサブクラス教師データを予測した予測値である。

サブクラス予測部７０６は、サブクラス予測値を、サブクラス分類部７０７に供給する。

サブクラス分類部７０７は、サブクラス予測部７０６からのサブクラス予測値に応じて、第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)の各画素のサブクラス分類を行う。

すなわち、例えば、サブクラス予測値（予測誤差予測値y）が0以上の画素は、サブクラス0にサブクラス分類され、サブクラス予測値が0未満の画素は、サブクラス1にサブクラス分類される。

サブクラス分類部７０７は、第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)の各画素のサブクラスを、クラス決定部７０８に供給する。

クラス決定部７０８は、第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)の各画素の第n+1階層のクラスk'を、第n階層のクラスkに、サブクラス分類部７０７からの第n階層のサブクラスを加味して、図６０で説明したように決定する。

クラス決定部７０８は、第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)の各画素について決定した第n+1階層のクラスk'を、その第n+1階層のクラスk'に属する生徒画像の画素を識別することができる形で、タップ係数学習部７０１、及び、画素予測部７０９に供給する。

画素予測部７０９には、復号途中画像に相当する生徒画像が供給される。

画素予測部７０９は、クラス決定部７０８からの第n階層のクラスk(k=0,1,...2ⁿ-1)ごとに、生徒画像の第n階層のクラスkの画素群(n,k)の各画素を注目画素として、その注目画素に対応する教師画像の画素の画素値の画素予測値を、タップ係数設定部７０２からの第n階層のクラスkのタップ係数tc(n,k)を用いて求めるクラス分類適応処理（のうちの式（１）の予測演算）を行う。

そして、画素予測部７０９は、クラス分類適応処理により得られる各画素の画素予測値を、サブクラス教師データ生成部７０３に供給する。

終了条件判定部７１０は、学習の終了条件が満たされるかどうかを判定し、学習の終了条件が満たされる場合には、学習装置でのタップ係数tc(n,k)及びクラス分類係数cc(n,k)の学習を終了する。さらに、終了条件判定部７１０は、タップ係数設定部７０２及びクラス分類係数設定部７０５を制御することにより、タップ係数設定部７０２が記憶している第n階層の2ⁿクラスのタップ係数tc(n,k)を外部に出力させるとともに、クラス分類係数設定部７０５が記憶している第0階層から第n-1階層までのクラス分類係数cc(0,k)，cc(1,k)，．．．，cc(n-1,k)を外部に出力させる。

なお、タップ係数設定部７０２及びクラス分類係数設定部７０５は、１つのブロックで構成することができる。

図６２は、図６１の学習装置が行う学習処理の例を説明するフローチャートである。

ステップＳ３１１において、終了条件判定部７１０は、階層（を表す変数）nを、初期値としての、例えば、0に設定する。

その後、処理は、ステップＳ３１１からステップＳ３１２に進み、タップ係数学習部７０１は、クラス決定部７０８からの第n階層のクラスkごとに、生徒画像の第n階層のクラスkの画素群(n,k)と、その画素群(n,k)に対応する教師画像の画素群とを用いて、第n階層のクラスkのタップ係数tc(n,k)を求めるタップ係数学習を行う。

そして、タップ係数学習部７０１は、タップ係数学習によって得られる、第n階層の2ⁿクラスのタップ係数tc(n,k)(k=0,1,...2ⁿ-1)を、タップ係数設定部７０２に供給して記憶させ、処理は、ステップＳ３１２からステップＳ３１３に進む。

なお、ステップＳ３１２のタップ係数学習では、第0階層(n=0)については、生徒画像の全画素を、１つのクラス（例えば、クラス0）の画素として、1=2⁰個（クラス）のタップ係数tc(0,0)（のセット）が求められる。

ステップＳ３１３では、終了条件判定部７１０が、学習の終了条件が満たされるかどうかを判定する。

ここで、学習の終了条件としては、例えば、階層nが、最終階層Nであることを採用することができる。最終階層Nとは、タップ係数tc(n,k)を求める最後の階層で、例えば、あらかじめ設定しておくことができる。

また、学習の終了条件としては、例えば、画素予測部７０９でのクラス分類適応処理により求められる画素予測値で構成される画像のS/Nの増加量が閾値以下であること等を採用することができる。

ステップＳ３１３において、学習の終了条件が満たされないと判定された場合、処理は、ステップＳ３１４に進み、以下、第n階層の学習が行われる。

すなわち、ステップＳ３１４において、タップ係数設定部７０２は、記憶している第n階層の2ⁿクラスのタップ係数tc(n,k)を、画素予測部７０９に設定する。

そして、画素予測部７０９は、クラス分類適応処理により得られる画素予測値を、サブクラス教師データ生成部７０３に供給して、処理は、ステップＳ３１４からステップＳ３１５に進む。

なお、ステップＳ３１４のクラス分類適応処理では、第0階層(n=0)については、生徒画像の全画素を、１つのクラス（例えば、クラス0）の画素として、直前のステップＳ３１２で求められる1=2⁰個（クラス）のタップ係数tc(0,0)を用いて、１つのクラスの画素である、生徒画像の各画素に対応する教師画像の画素の画素値の画素予測値が求められる。

ステップＳ３１５では、サブクラス教師データ生成部７０３は、教師画像と、画素予測部７０９からの各画素の画素予測値とから、その画素予測値の、教師画像の対応画素の画素値に対する予測誤差を、サブクラス教師データとして求める（生成する）。

そして、サブクラス教師データ生成部７０３は、サブクラス教師データを、クラス分類係数学習部７０４に供給して、処理は、ステップＳ３１５からステップＳ３１６に進む。

ステップＳ３１６では、クラス分類係数学習部７０４は、サブクラス教師データ生成部７０３からのサブクラス教師データとしての画素予測値の予測誤差を教師データとするとともに、生徒画像の画素のうちの、第n階層のクラスkの画素群(n,k)(k=0,1,...2ⁿ-1)を生徒データとして、第n階層のクラスkごとに、図５９等で説明したように、サブクラス分類に用いる第n階層のクラスkのクラス分類係数cc(n,k)を求めるクラス分類係数学習を行う。

クラス分類係数学習部７０４は、第n階層のクラスkごとのクラス分類係数学習により、第n階層の2ⁿクラスのクラス分類係数cc(n,k)を求めると、その第n階層の2ⁿクラスのクラス分類係数cc(n,k)を、クラス分類係数設定部７０５に供給して記憶させる。

クラス分類係数設定部７０５は、クラス分類係数学習部７０４からの第n階層の2ⁿクラスのクラス分類係数cc(n,k)を記憶し、サブクラス予測部７０６に設定して、処理は、ステップＳ３１６からステップＳ３１７に進む。

ステップＳ３１７では、サブクラス予測部７０６は、生徒画像の画素群のうちの第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)の各画素について、クラス分類係数設定部７０５からの、第n階層のクラスkのクラス分類係数cc(n,k)={w_m}を用い、予測誤差予測式y=w₁x₁+w₂x₂+...+w_Mx_Mに従った予測演算を行うことにより、画素予測値の予測誤差予測値yを、サブクラス予測値として求め、サブクラス分類部７０７に供給する。

すなわち、サブクラス分類部７０７は、サブクラス予測値（予測誤差予測値y）が0以上の画素を、サブクラス0にサブクラス分類し、予測誤差予測値yが0未満の画素を、サブクラス1にサブクラス分類する。

サブクラス分類により、第n階層のクラスkの画素群(n,k)(k=0,1,...,2ⁿ-1)は、第n階層のサブクラス0の画素群(n,k,0)とサブクラス1の画素群(n,k,1)とに分類される。

なお、ステップＳ３１７では、第0階層(n=0)の画素群(0,0)については、第1階層のクラスは、第0階層のサブクラスから決定される。

すなわち、第0階層において、サブクラス0にサブクラス分類された画素の第1階層のクラスは、サブクラス0に応じて、クラス0に決定され、サブクラス1にサブクラス分類された画素の第1階層のクラスは、サブクラス1に応じて、クラス1に決定される。

クラス決定部７０８は、第n階層のクラスkごとに、第n階層のクラスkの画素群(n,k)の各画素について、第n+1階層のクラスk'を決定すると、第n+1階層のクラスk'に属する生徒画像の画素を識別することができる形で、生徒画像の各画素の第n+1階層のクラスk'を、タップ係数学習部７０１、及び、画素予測部７０９に供給し、処理は、ステップＳ３１７からステップＳ３１８に進む。

ステップＳ３１８では、終了条件判定部７１０は、階層nを1だけインクリメントして、処理は、ステップＳ３１２に戻る。

ステップＳ３１２では、タップ係数学習部７０１は、クラス決定部７０８からの、ステップＳ３１８での階層nのインクリメント後の第n階層のクラスkごとに、上述したように、生徒画像の第n階層のクラスkの画素群(n,k)と、その画素群(n,k)に対応する教師画像の画素群とを用いて、第n階層のクラスkのタップ係数tc(n,k)を求めるタップ係数学習を行う。

ここで、ステップＳ３１４から開始される、ある階層である第L階層の学習は、ステップＳ３１８からステップＳ３１２に戻って、第L+1階層の2^L+1クラスのタップ係数tc(L+1,k)(k=0,1,...2^L+1-1)が求められることにより終了する。

ステップＳ３１４から始まり、ステップＳ３１８からステップＳ３１２に戻るまでの処理が、1階層の学習である。

ステップＳ３１３において、学習の終了条件が満たされると判定された場合、処理は、ステップＳ３１９に進み、終了条件設定部７１０は、タップ係数設定部７０２及びクラス分類係数設定部７０５を制御することにより、タップ係数設定部７０２が記憶しているタップ係数tc(n,k)、及び、クラス分類係数設定部７０５が記憶しているクラス分類係数cc(n,k)を外部に出力させ、学習処理は、終了する。

すなわち、いま、第N-1階層の学習が終了し、階層nが最終階層Nになっているとする。

この場合、タップ係数設定部７０２は、終了条件判定部７１０の制御に従い、記憶している第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)を外部に出力する。

また、クラス分類係数設定部７０５は、終了条件判定部７１０の制御に従い、記憶している第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを外部に出力する。

＜クラス分類にクラス分類係数を用いるクラス分類適応処理を行う画像変換装置＞

図６３は、クラス分類にクラス分類係数を用いるクラス分類適応処理を行う画像変換装置の構成例を示すブロック図である。

図６３において、画像変換装置は、タップ選択部２１及び２２、予測演算部２５、クラス分類部７２１、並びに、係数取得部７２２を有する。

したがって、図６３の画像変換装置は、タップ選択部２１及び２２、並びに、予測演算部２５を有する点で、図２の場合と共通する。

但し、図６３の画像変換装置は、クラス分類部２３及び係数取得部２４に代えて、クラス分類部７２１及び係数取得部７２２をそれぞれ有する点で、図２の場合と相違する。

クラス分類部７２１には、タップ選択部２２からクラスタップが供給される。

クラス分類部７２１は、図６１の学習装置で得られる第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを記憶する。

クラス分類部７２１は、タップ選択部２２からのクラスタップを用いるとともに、第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを、必要に応じて用いて、注目画素のクラス分類を行い、そのクラス分類により得られる注目画素のクラス（第N階層のクラス）を、係数取得部７２２に供給する。

係数取得部７２２は、図６１の学習装置で得られる第N階層の2^Nクラスのタップ係数tc(n,k)(k=0,1,...2^N-1)を記憶する。

係数取得部７２２は、記憶している第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)から、クラス分類部７２１から供給される注目画素のクラスkのタップ係数tc(N,k)を取得し、予測演算部２５に供給する。

図６４は、図６３のクラス分類部７２１の構成例を示すブロック図である。

図６４において、クラス分類部７２１は、クラス分類係数設定部７３１、サブクラス予予測部７３２、サブクラス分類部７３３、及び、クラス決定部７３４を有する。

クラス分類係数設定部７３１は、図６１の学習装置で得られる第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを記憶する。

クラス分類係数設定部７３１は、クラス決定部７３４から供給される注目画素の第n階層のクラスkに従い、記憶している第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までの中から、第n階層のクラスkのクラス分類係数cc(n,k)を取得し、サブクラス予測部７３２に設定する。

サブクラス予測部７３２には、注目画素のクラスタップが供給される。

サブクラス予測部７３２は、注目画素のクラスタップを構成する画素の画素値x_mと、クラス分類係数設定部７３１からの第n階層のクラスkのクラス分類係数cc(n,k)={w_m}とを用い、予測誤差予測式y=w₁x₁+w₂x₂+...+w_Mx_Mに従った予測演算を行う。

この予測演算により、注目画素に対応する元画像の対応画素の画素予測値の予測誤差予測値yが、注目画素のサブクラス予測値として求められ、サブクラス予測部７３２からサブクラス分類部７３３に供給される。

サブクラス分類部７３３は、サブクラス予測部７３２からのサブクラス予測値に応じて、第n階層のクラスkの注目画素のサブクラス分類を行う。

すなわち、例えば、注目画素のサブクラス予測値（予測誤差予測値y）が0以上である場合、第n階層のクラスkの注目画素は、サブクラス0にサブクラス分類される。また、注目画素のサブクラス予測値が0未満である場合、第n階層のクラスkの注目画素は、サブクラス1にサブクラス分類される。

サブクラス分類部７３３は、第n階層のクラスkの注目画素のサブクラスを、クラス決定部７３４に供給する。

クラス決定部７３４は、注目画素の第n+1階層のクラスk'を、注目画素の第n階層のクラスkに、サブクラス分類部７３３からの注目画素の第n階層のサブクラスを加味して、図６０で説明したように決定する。

そして、クラス決定部７３４は、注目画素の第n+1階層のクラスk'を、クラス分類係数設定部７３１に供給する。

この場合、クラス分類係数設定部７３１では、クラス決定部７３４から供給される注目画素の第n+1階層のクラスk'に従い、記憶している第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までの中から、第n+1階層のクラスk'のクラス分類係数cc(n+1,k')が取得され、サブクラス予測部７３２に設定される。

なお、クラス決定部７３４は、第n+1階層が、最終階層Nである第N階層である場合、注目画素の第N階層のクラスkを、注目画素のクラス分類結果として、係数取得部７２２に供給する。

図６５は、図６４のクラス分類部７２１で行われる、クラス分類係数を用いたクラス分類の処理の例を説明するフローチャートである。

ステップＳ３３１において、クラス決定部７３４は、階層（を表す変数）nを、初期値としての、例えば、0に設定し、処理は、ステップＳ３３２に進む。

ステップＳ３３２では、クラス決定部７３４は、階層nが最終階層Nであるかどうかを判定する。

ステップＳ３３２において、階層nが最終階層Nでないと判定された場合、処理は、ステップＳ３３３に進み、注目画素のサブクラス予測値が求められる。

すなわち、ステップＳ３３３では、クラス分類係数設定部７３１は、クラス決定部７３４から供給される注目画素の第n階層のクラスkに従い、第n階層のクラスkのクラス分類係数cc(n,k)を、サブクラス予測部７３２に設定する。

なお、第0階層(n=0)については、クラス分類係数設定部７３１は、第0階層のクラス分類係数cc(0,0)を、サブクラス予測部７３２に設定する。

サブクラス予測部７３２は、タップ選択部２２（図６３）からの注目画素のクラスタップを構成する画素の画素値x_mと、クラス分類係数設定部７３１からの第n階層のクラスkのクラス分類係数cc(n,k)={w_m}とを用い、予測誤差予測式y=w₁x₁+w₂x₂+...+w_Mx_Mに従った予測演算を行う。

そして、サブクラス予測部７３２は、予測演算により得られる注目画素のサブクラス予測値を、サブクラス分類部７３３に供給して、処理は、ステップＳ３３３からステップＳ３３４に進む。

ステップＳ３３４では、サブクラス分類部７３３は、サブクラス予測部７３２からのサブクラス予測値に応じて、第n階層のクラスkの注目画素のサブクラス分類を行う。そして、サブクラス分類部７３３は、サブクラス分類により得られる、注目画素の、第n階層のサブクラスを、クラス決定部７３４に供給し、処理は、ステップＳ３３４からステップＳ３３５に進む。

ステップＳ３３５では、クラス決定部７３４は、注目画素の第n+1階層のクラスkを、注目画素の第n階層のクラスkに、サブクラス分類部７３３からの第n階層のサブクラスを加味して、図６０で説明したように決定する。

そして、クラス決定部７３４は、注目画素の第n+1階層のクラスkを、クラス分類係数設定部７３１に供給し、処理は、ステップＳ３３５からステップＳ３３６に進む。

ステップＳ３３６では、クラス決定部７３４は、階層nを1だけインクリメントして、処理は、ステップＳ３３２に戻る。

そして、ステップＳ３３２において、階層nが最終階層Nであると判定された場合、処理は、ステップＳ３３７に進み、クラス決定部７３４は、注目画素の第N階層のクラスkを、注目画素のクラス分類結果として、係数取得部７２２（図６３）に供給し、クラス分類の処理は終了する。

以上のようなクラス分類係数を用いたクラス分類によれば、画素値の予測誤差によって、画素が分類されるので、クラス分類適応処理により得られる第２の画像のS/Nをより向上させるようにクラス分類を行うことが可能となる。

＜符号化装置１１の第７の構成例＞

図６６は、図１の符号化装置１１の第７の構成例を示すブロック図である。

図６６において、符号化装置１１は、A/D変換部１０１ないし演算部１１０、フレームメモリ１１２ないしレート制御部１１７、及び、クラス分類適応フィルタ８１１を有する。

したがって、図６６の符号化装置１１は、A/D変換部１０１ないし演算部１１０、及び、フレームメモリ１１２ないしレート制御部１１７を有する点で、図９の場合と共通する。

但し、図６６の符号化装置１１は、クラス分類適応フィルタ１１１に代えて、クラス分類適応フィルタ８１１を有する点で、図９の場合と相違する。

クラス分類適応フィルタ８１１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う点で、クラス分類適応フィルタ１１１と共通する。

但し、クラス分類適応フィルタ８１１では、クラス分類係数を用いてクラス分類が行われる点で、クラス分類適応フィルタ１１１と相違する。

さらに、クラス分類適応フィルタ８１１では、クラス分類係数が、フィルタ情報として、可逆符号化部１０６に供給されて伝送される点で、クラス分類適応フィルタ１１１と相違する。

＜クラス分類適応フィルタ８１１の構成例＞

図６７は、図６６のクラス分類適応フィルタ８１１の構成例を示すブロック図である。

図６７において、クラス分類適応フィルタ８１１は、画像変換装置８３１及び学習装置８３２を有する。

画像変換装置８３１には、演算部１１０（図６６）から復号途中画像が供給されるとともに、学習装置８３２からクラスごとのタップ係数、及び、クラス分類係数が供給される。さらに、画像変換装置８３１には、符号化情報が供給される。

画像変換装置８３１は、復号途中画像を第１の画像として、クラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、フレームメモリ１１２（図６６）に供給する。

なお、画像変換装置８３１は、クラス分類適応処理において、クラス分類を、学習装置８３２からのクラス分類係数を用いて行う。また、クラス分類は、図１０の画像変換装置１３１と同様に、必要に応じて、クラスタップから得られる画像特徴量や、符号化情報を用いて行うことができる。

学習装置８３２には、並べ替えバッファ１０２（図６６）から元画像が供給されるとともに、演算部１１０（図６６）から復号途中画像が供給される。さらに、学習装置８３２には、符号化情報が供給される。

学習装置８３２は、復号途中画像及び元画像を用いて、クラス分類係数学習を行うとともに、タップ係数学習を行う。タップ係数学習では、クラス分類係数学習により得られるクラス分類係数を用いてクラス分類が行われる。

さらに、学習装置８３２は、クラス分類係数学習により得られるクラス分類係数、及び、タップ係数学習により得られるクラスごとのタップ係数を、フィルタ情報として、画像変換装置８３１及び可逆符号化部１０６（図６６）に供給する。

なお、学習装置８３２では、画像変換装置８３１と同様に、クラス分類を、必要に応じて、クラスタップから得られる画像特徴量や、符号化情報をも用いて行うことができる。

＜画像変換装置８３１の構成例＞

図６８は、図６７の画像変換装置８３１の構成例を示すブロック図である。

図６８において、画像変換装置８３１は、タップ選択部２１及び２２、予測演算部２５、クラス分類部８４１、並びに、係数取得部８４２、を有する。

したがって、画像変換装置８３１は、タップ選択部２１及び２２、並びに、予測演算部２５を有する点で、図１１の画像変換装置１３１と共通する。

但し、画像変換装置８３１は、クラス分類部２３及び係数取得部２４に代えて、クラス分類部８４１及び係数取得部８４２をそれぞれ有する点で、図１１の画像変換装置１３１と相違する。

クラス分類部８４１は、図６７の学習装置８３２から供給される第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを記憶する。

クラス分類部８４１は、タップ選択部２２から供給されるクラスタップを用いるとともに、第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを、必要に応じて用いて、注目画素のクラス分類を行い、そのクラス分類により得られる注目画素のクラス（第N階層のクラス）を、係数取得部８４２に供給する。

係数取得部８４２は、図６７の学習装置８３２から供給される第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)を記憶する。

係数取得部８４２は、記憶している第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)から、クラス分類部８４１から供給される注目画素のクラスkのタップ係数tc(N,k)を取得し、予測演算部２５に供給する。

なお、クラス分類部８４１では、クラス分類係数の他、必要に応じて、クラスタップから得られる画像特徴量や、符号化情報をも用いて、クラス分類を行うことができる。

例えば、クラス分類係数を用いたクラス分類の第0階層のサブクラス分類において、クラス分類係数の他、画像特徴量や符号化情報を用いることで、注目画素を、2又は3以上のサブクラスに分類することができる。

図６９は、図６８のクラス分類部８４１の構成例を示すブロック図である。

なお、図中、図６４のクラス分類部７２１と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図６９において、クラス分類部８４１は、クラス分類係数設定部７３１、サブクラス予予測部７３２、サブクラス分類部７３３、及び、クラス決定部７３４を有する。

したがって、図６９のクラス分類部８４１は、クラス分類係数設定部７３１ないしクラス決定部７３４を有する点で、図６４のクラス分類部７２１と共通する。

但し、図６９のクラス分類部８４１では、クラス分類係数設定部７３１は、図６７の学習装置８３２から供給される第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までを記憶する。

また、図６９のクラス分類部８４１では、サブクラス分類部７３３に、サブクラス予測部７３２から、注目画素のサブクラス予測値が供給される他、クラスタップ及び符号化情報が供給される。

サブクラス分類部７３３では、サブクラス予測値の他、クラスタップから得られる画像特徴量や、符号化情報をも用いて、第0階層のサブクラス分類を行うことができる。

第0階層のサブクラス分類を、サブクラス予測値の他、画像特徴量や符号化情報を用いて行うことで、クラス分類部８４１で行われるクラス分類は、クラス分類係数の他、画像特徴量や、符号化情報を用いたクラス分類になる。

＜学習装置８３２の構成例＞

図７０は、図６７の学習装置８３２の構成例を示すブロック図である。

なお、図中、図６１の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図７０において、学習装置８３２は、タップ係数学習部７０１、タップ係数設定部７０２、サブクラス教師データ生成部７０３、クラス分類係数学習部７０４、クラス分類係数設定部７０５、サブクラス予測部７０６、サブクラス分類部７０７、クラス決定部７０８、画素予測部７０９、及び、終了条件判定部７１０を有する。

したがって、図７０の学習装置８３２は、タップ係数学習部７０１ないし終了条件判定部７１０を有する点で、図６１の場合と共通する。

但し、図７０の学習装置８３２では、サブクラス分類部７０７に、サブクラス予測部７０６から、サブクラス予測値が供給される他、生徒画像及び符号化情報が供給される。

サブクラス分類部７０７では、図６９のサブクラス分類部７３３と同様に、サブクラス予測値の他、生徒画像の各画素について、図６８の画像変換装置８３１で生成されるクラスタップから得られる画像特徴量や、符号化情報をも用いて、第0階層のサブクラス分類を行うことができる。

第0階層のサブクラス分類を、サブクラス予測値の他、画像特徴量や符号化情報を用いて行うことで、クラス決定部７０８で決定されるクラスは、クラス分類係数の他、画像特徴量や、符号化情報を用いたクラス分類により得られるクラスになる。

また、図７０の学習装置８３２では、終了条件判定部７１０に、画素予測部７０９がクラス分類適応処理により求める画素予測値を供給するとともに、教師画像を供給することができる。

この場合、終了条件判定部７１０では、教師画像を真値として、画素予測値のS/Nを求め、学習の終了条件として、画素予測値で構成される画像のS/Nの増加量が閾値以下であることを採用することができる。

かかる終了条件により得られるクラス分類係数及びタップ係数によれば、S/Nをほぼ限界（飽和状態）にまで向上させることが可能となる。

＜符号化処理＞

図７１は、図６６の符号化装置１１の符号化処理の例を説明するフローチャートである。

図６６の符号化装置１１では、ステップＳ４１１ないしＳ４２９において、図１４のステップＳ１１ないしＳ２９とそれぞれ同様の処理が行われる。

但し、符号化装置１１において、クラス分類適応フィルタ８１１の学習装置８３２（図６７）は、図１０に学習装置１３２と同様に、そこに供給される復号途中画像を生徒データとするとともに、その復号途中画像に対応する元画像を教師データとして、適宜、学習を行うが、その学習では、クラスごとのタップ係数とクラス分類係数とが、フィルタ情報として生成される。そして、クラスごとのタップ係数とクラス分類係数とが、ステップＳ４１２で更新されるフィルタ情報、及び、ステップＳ４１３で伝送対象に設定されるフィルタ情報となる。

また、ステップＳ４２５において、クラス分類適応フィルタ８１１は、図１４のステップＳ２５と同様に、演算部１１０からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施すが、そのクラス分類適応処理では、クラス分類係数を用いてクラス分類を行う。

ここで、クラス分類係数を用いたクラス分類では、図６９や図７０で説明したように、クラス分類係数の他、画像特徴量や符号化情報をも用いることができるが、以下では、説明を簡単にするため、クラス分類係数を用いたクラス分類において、画像特徴量や符号化情報をも用いることについては、適宜、説明を省略する。

さらに、ステップＳ４２７では、可逆符号化部１０６（図６６）は、図１４のステップＳ２７と同様に、量子化係数、符号化情報、及び、フィルタ情報を符号化し、符号化データに含めるが、符号化データに含められるフィルタ情報には、クラスごとのタップ係数の他、クラス分類係数が含まれる。

したがって、可逆符号化部１０６で得られる符号化データには、量子化係数、符号化情報、並びに、フィルタ情報としてのタップ係数及びクラス分類係数が含まれる。そして、かかる符号化データは、ステップＳ４２８で、図１４のステップＳ２８で説明したように、蓄積バッファ１０７から、適宜読み出されて伝送される。

図７２は、図７１のステップＳ４２５で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ８１１の画像変換装置８３１（図６８）では、ステップＳ４４１ないしＳ４４７において、図１５のステップＳ４１ないしＳ４７とそれぞれ同様の処理が行われる。

但し、ステップＳ４４３の注目画素のクラス分類では、クラス分類部８４１（図６８、図６９）は、図６５で説明したように、クラス分類係数を用いてクラス分類を行い、注目画素の最終階層Nのクラスを求める。

さらに、ステップＳ４４４では、係数取得部８４２（図６８）は、第N階層の2^Nクラスのタップ係数から、クラス分類部８４１からの注目画素の最終階層Nのクラスのタップ係数を取得し、予測演算部２５に供給する。

＜復号装置１２の第７の構成例＞

図７３は、図１の復号装置１２の第７の構成例を示すブロック図である。

図７３において、復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、フレームメモリ２１０ないし選択部２１４、及び、クラス分類適応フィルタ８６１を有する。

したがって、図７３の復号装置１２は、蓄積バッファ２０１ないし演算部２０５、並べ替えバッファ２０７、D/A変換部２０８、及び、フレームメモリ２１０ないし選択部２１４を有する点で、図１６の場合と共通する。

但し、図７３の復号装置１２は、クラス分類適応フィルタ２０６に代えて、クラス分類適応フィルタ８６１を有する点で、図１６の場合と相違する。

図７３の復号装置１２は、図６６の符号化装置１１から伝送されてくる符号化データを復号する。

そのため、可逆復号部２０２からクラス分類適応フィルタ８６１に供給されるフィルタ情報には、クラスごとのタップ係数及びクラス分類係数が含まれる。

ここで、フィルタ情報に含まれるクラス分類係数は、第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までのクラス分類係数である。また、フィルタ情報に含まれるクラスごとのタップ係数は、最終階層Nである第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)である。

クラス分類適応フィルタ８６１は、クラス分類適応処理によって、ILF、すなわち、DF，SAO、及び、ALFのすべてとして機能するフィルタで、クラス分類適応処理によって、ILF処理を行う点で、図１６のクラス分類適応フィルタ２０６と共通する。

但し、クラス分類適応フィルタ８６１では、クラス分類適応処理において、クラス分類係数を用いたクラス分類が行われる点で、クラス分類適応フィルタ２０６と相違する。

＜クラス分類適応フィルタ８６１の構成例＞

図７４は、図７３のクラス分類適応フィルタ８６１の構成例を示すブロック図である。

図７４において、クラス分類適応フィルタ８６１は、画像変換装置８７１を有する。

画像変換装置８７１には、演算部２０５（図７３）から復号途中画像が供給されるとともに、可逆復号部２０２からフィルタ情報としてのクラスごとのタップ係数及びクラス分類係数、並びに、符号化情報が供給される。

画像変換装置８７１は、図６７の画像変換装置８３１と同様に、復号途中画像を第１の画像として、クラスごとのタップ係数を用いたクラス分類適応処理による画像変換を行うことで、第１の画像としての復号途中画像を、元画像に相当する第２の画像としてのフィルタ後画像に変換して（フィルタ後画像を生成して）、並べ替えバッファ２０７及びフレームメモリ２１０（図７３）に供給する。

なお、画像変換装置８７１は、図６７の画像変換装置８３１と同様に、クラス分類適応処理において、クラス分類を、可逆復号装置２０２（図７３）からのフィルタ情報としてのクラス分類係数を用いて行う。

画像変換装置８７１でのクラス分類は、図６７の画像変換装置８３１と同様に、クラス分類係数の他、必要に応じて、クラスタップから得られる画像特徴量や、符号化情報をも用いて行うことができる。

＜画像変換装置８７１の構成例＞

図７５は、図７４の画像変換装置８７１の構成例を示すブロック図である。

図７５において、画像変換装置８７１は、タップ選択部２４１及び２４２、予測演算部２４５、クラス分類部８８１、並びに、係数取得部８８２を有する。

したがって、図７５の画像変換装置８７１は、タップ選択部２４１及び２４２、並びに、予測演算部２４５を有する点で、図１８の画像変換装置２３１と共通する。

但し、図７５の画像変換装置８７１は、クラス分類部２４３及び係数取得部２４４に代えて、クラス分類部８８１及び係数取得部８８２をそれぞれ有する点で、図１８の画像変換装置２３１と相違する。

可逆復号部２０２（図７３）からのフィルタ情報としてのクラス分類係数、すなわち、第0階層の2⁰クラスのクラス分類係数cc(0,0)から、第N-1階層の2^N-1クラスのクラス分類係数cc(N-1,0)，cc(N-1,1)，．．．，cc(N-1,2^N-1-1)までのクラス分類係数は、クラス分類部８８１に供給されて記憶される。

また、可逆復号部２０２（図７３）からのフィルタ情報としてのクラスごとのタップ係数としての、第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)は、係数取得部８８２に供給されて記憶される。

クラス分類部８８１は、符号化装置１１（図６６）側のクラス分類部８４１（図６８、図６９）と同様に構成され、クラス分類係数を用いて、クラス分類部８４１と同様のクラス分類を行い、その結果得られる注目画素の第N階層のクラスを、係数取得部８８２に供給する。

係数取得部８８２は、記憶している第N階層の2^Nクラスのタップ係数tc(N,k)(k=0,1,...2^N-1)から、クラス分類部８８１からの、注目画素の第N階層のクラスのタップ係数tc(N,k)を取得し、予測演算部２４５に供給する。

＜復号処理＞

図７６は、図７３の復号装置１２の復号処理の例を説明するフローチャートである。

図７３の復号装置１２では、ステップＳ４６１ないしＳ４７３において、図１９のステップＳ６１ないしＳ７３とそれぞれ同様の処理が行われる。

但し、ステップＳ４６２では、可逆復号部２０２は、図１９のステップＳ６２と同様に、符号化データを復号し、その復号により得られる量子化係数を、逆量子化部２０３に供給するとともに、符号化データの復号により得られる符号化情報やフィルタ情報を、イントラ予測部２１２や、動き予測補償部２１３、クラス分類適応フィルタ８６１その他の必要なブロックに供給するが、クラス分類適応フィルタ８６１に供給されるフィルタ情報には、クラスごとのタップ係数及びクラス分類係数が含まれる。

また、ステップＳ４７０において、クラス分類適応フィルタ８６１は、図１９のステップＳ７０と同様に、演算部２０５からの復号途中画像に、ILFの処理としてのクラス分類適応処理を施すが、そのクラス分類適応処理では、クラス分類係数を用いてクラス分類を行う。

なお、クラス分類適応フィルタ８６１では、クラス分類適応フィルタ８１１（図６６）と同様に、クラス分類係数を用いたクラス分類において、クラス分類係数の他、画像特徴量や符号化情報をも用いることができる。

図７７は、図７６のステップＳ４７０で行われるクラス分類適応処理の例を説明するフローチャートである。

クラス分類適応フィルタ８６１の画像変換装置８７１（図７５）では、ステップＳ４８１ないしＳ４８７において、図２０のステップＳ８１ないしＳ８７とそれぞれ同様の処理が行われる。

但し、ステップＳ４８３の注目画素のクラス分類では、クラス分類部８８１（図７５）は、可逆復号部２０２からフィルタ情報として供給されるクラス分類係数を用いて、符号化装置１１（図６６）側のクラス分類部８４１（図６８）と同様のクラス分類を行い、注目画素の最終階層Nのクラスを求める。

さらに、ステップＳ４８４では、係数取得部８８２（図７５）は、可逆復号部２０２からフィルタ情報として供給される第N階層の2^Nクラスのタップ係数から、クラス分類部８８１からの注目画素の最終階層Nのクラスのタップ係数を取得し、予測演算部２４５に供給する。

＜学習装置８３２の他の構成例＞

図７８は、図６７の学習装置８３２の他の構成例を示すブロック図である。

なお、図中、図７０の場合と対応する部分については、同一の符号を付してあり、以下では、その説明は、適宜省略する。

図７８において、学習装置８３２は、タップ係数学習部７０１、タップ係数設定部７０２、サブクラス教師データ生成部７０３、クラス分類係数学習部７０４、クラス分類係数設定部７０５、サブクラス予測部７０６、サブクラス分類部７０７、クラス決定部７０８、画素予測部７０９、終了条件判定部７１０、伝送帯域検出部９１１、伝送量算出部９１２、及び、伝送対象係数設定部９１３を有する。

したがって、図７８の学習装置８３２は、タップ係数学習部７０１ないし終了条件判定部７１０を有する点で、図７０の場合と共通する。

但し、図７８の学習装置８３２は、伝送帯域検出部９１１、伝送量算出部９１２、及び、伝送対象係数設定部９１３を新たに有する点で、図７０の場合と相違する。

伝送帯域検出部９１１は、符号化装置１１から符号化データを伝送するときに使用可能な伝送帯域（例えば、符号化データに割り当てられたビットレート等）を検出し、伝送量算出部９１２に供給する。

伝送量算出部９１２は、伝送帯域検出部９１１からの伝送帯域に基づいて、その伝送帯域で伝送可能なフィルタ情報のデータ量である伝送可能伝送量を求め、伝送対象係数設定部９１３に供給する。

伝送対象係数設定部９１３には、タップ係数設定部７０２から、各階層の学習で求められる各階層のタップ係数、すなわち、第0階層から第N階層までのタップ係数が供給される。さらに、伝送対象係数設定部９１３には、クラス分類係数設定部７０５から、第0階層から第N-1階層までのクラス分類係数が供給される。

伝送対象係数設定部９１３は、伝送量算出部９１２からの伝送可能伝送量に応じて、タップ係数設定部７０２からのタップ係数の中から、伝送対象とするタップ係数を選択し、フィルタ情報として出力する。

さらに、伝送対象係数設定部９１３は、伝送量算出部９１２からの伝送可能伝送量に応じて、クラス分類係数設定部７０５からのクラス分類係数の中から、伝送対象とするクラス分類係数を選択し、フィルタ情報として出力する。

すなわち、伝送対象係数設定部９１３は、伝送量算出部９１２からの伝送可能伝送量に応じて、タップ係数及びクラス分類係数の伝送が可能な伝送可能階層N'（＜＝最終階層N）を設定する。伝送可能階層N'は、伝送可能伝送量が大であるほど、大きな（深い）階層に設定される。

さらに、伝送対象係数設定部９１３は、第0階層から第N階層までのタップ係数のうちの、第N'階層のタップ係数を伝送対象に設定（選択）するとともに、第0階層から第N-1階層までのクラス分類係数のうちの、第0階層から第N'-1階層までのクラス分類係数を伝送対象に設定する。

そして、伝送対象係数設定部９１３は、伝送対象に設定されたタップ係数及びクラス分類係数（伝送対象係数）を、フィルタ情報として出力する。

したがって、図７８の学習装置８３２を有する符号化装置１１では、学習装置８３２で得られたタップ係数及びクラス分類係数のうちの、伝送可能伝送量に応じて伝送対象に設定されたタップ係数及びクラス分類係数が伝送される。

以上のように、学習装置８３２で得られたタップ係数及びクラス分類係数のうちの、伝送可能伝送量に応じて伝送対象に設定されたタップ係数及びクラス分類係数を伝送する場合には、例えば、アダプティブストリーミングのような、伝送帯域が変動する変動伝送方式に対応することができる。

すなわち、伝送帯域が大である場合には、深い階層のクラスにまでクラス分類を行うクラス分類係数と、そのような深い階層のクラスのタップ係数とが伝送され、S/Nの改善に大きく資することができる。また、伝送帯域が小である場合には、浅い階層のクラスまでクラス分類を行うクラス分類係数と、そのような浅い階層のクラスのタップ係数とが伝送され、伝送帯域が小さい中で可能な範囲でS/Nを改善することができる。

なお、符号化データを、変動伝送方式で伝送する場合には、いくつかの伝送帯域ごとに、その伝送帯域に適したデータ量のタップ係数及びクラス分類係数を学習により求めておき、フィルタ情報として伝送するタップ係数及びクラス分類係数を、伝送帯域（又は伝送可能伝送量）により切り替えることができる。

また、伝送帯域ごとのタップ係数及びクラス分類係数から、伝送帯域に応じて、仮の伝送対象としてのタップ係数及びクラス分類係数を選択し、さらに、その仮の伝送対象としてのタップ係数及びクラス分類係数について、伝送可能階層N'を設定して、第N'階層のタップ係数、及び、第0階層から第N'-1階層までのクラス分類係数を、伝送対象に最終的に選択することができる。

＜RD曲線＞

図７９は、ILFとして、クラス分類適応処理によりILFの処理を行うクラス分類適応フィルタを設けた場合と、ALFを設けた場合とのRD(Rate-Distortion)曲線を示す図である。

なお、図７９では、クラス分類適応フィルタを設けた場合のRD曲線、及び、ALFを設けた場合のRD曲線の他、ILFを設けていない場合のRD曲線も示してある。

RD曲線は、S/Nを縦軸にとり、（符号化データの）ビットレートを、横軸にとったグラフであり、符号時の量子化パラメータQPごとに、S/Nとビットレートとに対応する点をプロットすることにより得ることができる。

S/Nが大きいほど、また、ビットレートが小さいほど、圧縮効率は向上するので、RD曲線は、左上側に位置するほど、圧縮効率が良いことを表す。

図７９では、ALFを設けた場合の圧縮効率は、ILFを設けていない場合よりも3.2%だけ向上しているのに対して、クラス分類適応フィルタを設けた場合の圧縮効率は、ILFを設けていない場合よりも5.5%だけ向上している。

したがって、クラス分類適応フィルタを設けた場合には、ALFを設けた場合よりも、2倍近く、圧縮効率を改善することができる。

なお、本実施の形態では、説明を簡単にするために、符号化装置１１から復号装置１２に提供するフィルタ情報には、タップ係数そのものを含めることとしたが、フィルタ情報には、タップ係数そのものに代えて、種係数及びパラメータzを含めることができる。タップ係数は、種係数及びパラメータzから求めることができるので、種係数及びパラメータzは、タップ係数と等価な情報であり、本明細書では、フィルタ情報としてのタップ係数には、タップ係数そのものの他、種係数及びパラメータzが含まれる。タップ係数として、種係数及びパラメータzを採用する場合、パラメータzは、例えば、所定のコスト関数に基づいて決定することができる。

＜多視点画像符号化・復号システムへの適用＞

上述した一連の処理は、多視点画像符号化・復号システムに適用することができる。

図８０は、多視点画像符号化方式の一例を示す図である。

図８０に示されるように、多視点画像は、複数の視点（ビュー（view））の画像を含む。この多視点画像の複数のビューは、他のビューの情報を利用せずに自身のビューの画像のみを用いて符号化・復号を行うベースビューと、他のビューの情報を利用して符号化・復号を行うノンベースビューとによりなる。ノンベースビューの符号化・復号は、ベースビューの情報を利用するようにしても良いし、他のノンベースビューの情報を利用するようにしてもよい。

図８０の例のような多視点画像を符号化・復号する場合、多視点画像は、視点毎に符号化される。そして、そのようにして得られた符号化データを復号する場合、各視点の符号化データは、それぞれ（すなわち視点毎に）復号される。このような各視点の符号化・復号に対して、以上の実施の形態において説明した方法を適用してもよい。このようにすることにより、S/N及び圧縮効率を、大きく改善することができる。つまり、多視点画像の場合も同様に、S/N及び圧縮効率を、大きく改善することができる。

＜多視点画像符号化・復号システム＞

図８１は、上述した多視点画像符号化・復号を行う多視点画像符号化・復号システムの、多視点画像符号化装置を示す図である。

図８１に示されるように、多視点画像符号化装置１０００は、符号化部１００１、符号化部１００２、及び多重化部１００３を有する。

符号化部１００１は、ベースビュー画像を符号化し、ベースビュー画像符号化ストリームを生成する。符号化部１００２は、ノンベースビュー画像を符号化し、ノンベースビュー画像符号化ストリームを生成する。多重化部１００３は、符号化部１００１において生成されたベースビュー画像符号化ストリームと、符号化部１００２において生成されたノンベースビュー画像符号化ストリームとを多重化し、多視点画像符号化ストリームを生成する。

図８２は、上述した多視点画像復号を行う多視点画像復号装置を示す図である。

図８２に示されるように、多視点画像復号装置１０１０は、逆多重化部１０１１、復号部１０１２、及び復号部１０１３を有する。

逆多重化部１０１１は、ベースビュー画像符号化ストリームとノンベースビュー画像符号化ストリームとが多重化された多視点画像符号化ストリームを逆多重化し、ベースビュー画像符号化ストリームと、ノンベースビュー画像符号化ストリームとを抽出する。復号部１０１２は、逆多重化部１０１１により抽出されたベースビュー画像符号化ストリームを復号し、ベースビュー画像を得る。復号部１０１３は、逆多重化部１０１１により抽出されたノンベースビュー画像符号化ストリームを復号し、ノンベースビュー画像を得る。

例えば、このような多視点画像符号化・復号システムにおいて、多視点画像符号化装置１０００の符号化部１００１及び符号化部１００２として、以上の実施の形態において説明した符号化装置１１を適用してもよい。このようにすることにより、多視点画像の符号化においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。また例えば、多視点画像復号装置１０１０の復号部１０１２及び復号部１０１３として、以上の実施の形態において説明した復号装置１２を適用してもよい。このようにすることにより、多視点画像の符号化データの復号においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。

＜階層画像符号化・復号システムへの適用＞

また、上述した一連の処理は、階層画像符号化（スケーラブル符号化）・復号システムに適用することができる。

図８３は、階層画像符号化方式の一例を示す図である。

階層画像符号化（スケーラブル符号化）は、画像データを、所定のパラメータについてスケーラビリティ（scalability）機能を有するように、画像を複数レイヤ化（階層化）し、レイヤ毎に符号化するものである。階層画像復号（スケーラブル復号）は、その階層画像符号化に対応する復号である。

図８３に示されるように、画像の階層化においては、スケーラビリティ機能を有する所定のパラメータを基準として１の画像が複数の画像（レイヤ）に分割される。つまり、階層化された画像（階層画像）は、その所定のパラメータの値が互いに異なる複数の階層（レイヤ）の画像を含む。この階層画像の複数のレイヤは、他のレイヤの画像を利用せずに自身のレイヤの画像のみを用いて符号化・復号を行うベースレイヤと、他のレイヤの画像を利用して符号化・復号を行うノンベースレイヤ（エンハンスメントレイヤとも称する）とによりなる。ノンベースレイヤは、ベースレイヤの画像を利用するようにしても良いし、他のノンベースレイヤの画像を利用するようにしてもよい。

一般的に、ノンベースレイヤは、冗長性が低減されるように、自身の画像と、他のレイヤの画像との差分画像のデータ（差分データ）により構成される。例えば、１の画像をベースレイヤとノンベースレイヤ（エンハンスメントレイヤとも称する）に２階層化した場合、ベースレイヤのデータのみで元の画像よりも低品質な画像が得られ、ベースレイヤのデータとノンベースレイヤのデータを合成することで、元の画像（すなわち高品質な画像）が得られる。

このように画像を階層化することにより、状況に応じて多様な品質の画像を容易に得ることができる。例えば携帯電話のような、処理能力の低い端末に対しては、ベースレイヤ（base layer）のみの画像圧縮情報を伝送し、空間時間解像度の低い、或いは、画質の良くない動画像を再生し、テレビやパーソナルコンピュータのような、処理能力の高い端末に対しては、ベースレイヤ（base layer）に加えて、エンハンスメントレイヤ（enhancement layer）の画像圧縮情報を伝送し、空間時間解像度の高い、或いは、画質の高い動画像を再生するといったように、トランスコード処理を行うことなく、端末やネットワークの能力に応じた画像圧縮情報を、サーバから送信することが可能となる。

図８３の例のような階層画像を符号化・復号する場合、階層画像は、レイヤ毎に符号化される。そして、そのようにして得られた符号化データを復号する場合、各レイヤの符号化データは、それぞれ（すなわちレイヤ毎に）復号される。このような各レイヤの符号化・復号に対して、以上の実施の形態において説明した方法を適用してもよい。このようにすることにより、S/N及び圧縮効率を大きく改善することができる。つまり、階層画像の場合も同様に、S/N及び圧縮効率を大きく改善することができる。

＜スケーラブルなパラメータ＞
このような階層画像符号化・階層画像復号（スケーラブル符号化・スケーラブル復号）において、スケーラビリティ（scalability）機能を有するパラメータは、任意である。例えば、空間解像度をそのパラメータとしてもよい（spatial scalability）。このスペーシャルスケーラビリティ（spatial scalability）の場合、レイヤ毎に画像の解像度が異なる。

また、このようなスケーラビリティ性を持たせるパラメータとして、他には、例えば、時間解像度を適用しても良い（temporal scalability）。このテンポラルスケーラビリティ（temporal scalability）の場合、レイヤ毎にフレームレートが異なる。

さらに、このようなスケーラビリティ性を持たせるパラメータとして、例えば、信号雑音比（SNR（Signal to Noise ratio））を適用しても良い（SNR scalability）。このSNRスケーラビリティ（SNR scalability）の場合、レイヤ毎にSN比が異なる。

スケーラビリティ性を持たせるパラメータは、上述した例以外であっても、もちろんよい。例えば、ベースレイヤ（base layer）が８ビット（bit）画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、10ビット（bit）画像が得られるビット深度スケーラビリティ（bit-depth scalability）がある。

また、ベースレイヤ（base layer）が4:2:0フォーマットのコンポーネント画像よりなり、これにエンハンスメントレイヤ（enhancement layer）を加えることにより、4:2:2フォーマットのコンポーネント画像が得られるクロマスケーラビリティ（chroma scalability）がある。

＜階層画像符号化・復号システム＞

図８４は、上述した階層画像符号化・復号を行う階層画像符号化・復号システムの、階層画像符号化装置を示す図である。

図８４に示されるように、階層画像符号化装置１０２０は、符号化部１０２１、符号化部１０２２、及び多重化部１０２３を有する。

符号化部１０２１は、ベースレイヤ画像を符号化し、ベースレイヤ画像符号化ストリームを生成する。符号化部１０２２は、ノンベースレイヤ画像を符号化し、ノンベースレイヤ画像符号化ストリームを生成する。多重化部１０２３は、符号化部１０２１において生成されたベースレイヤ画像符号化ストリームと、符号化部１０２２において生成されたノンベースレイヤ画像符号化ストリームとを多重化し、階層画像符号化ストリームを生成する。

図８５は、上述した階層画像復号を行う階層画像復号装置を示す図である。

図８５に示されるように、階層画像復号装置１０３０は、逆多重化部１０３１、復号部１０３２、及び復号部１０３３を有する。

逆多重化部１０３１は、ベースレイヤ画像符号化ストリームとノンベースレイヤ画像符号化ストリームとが多重化された階層画像符号化ストリームを逆多重化し、ベースレイヤ画像符号化ストリームと、ノンベースレイヤ画像符号化ストリームとを抽出する。復号部１０３２は、逆多重化部１０３１により抽出されたベースレイヤ画像符号化ストリームを復号し、ベースレイヤ画像を得る。復号部１０３３は、逆多重化部１０３１により抽出されたノンベースレイヤ画像符号化ストリームを復号し、ノンベースレイヤ画像を得る。

例えば、このような階層画像符号化・復号システムにおいて、階層画像符号化装置１０２０の符号化部１０２１及び符号化部１０２２として、以上の実施の形態において説明した符号化装置１１を適用してもよい。このようにすることにより、階層画像の符号化においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。また例えば、階層画像復号装置１０３０の復号部１０３２及び復号部１０３３として、以上の実施の形態において説明した復号装置１２を適用してもよい。このようにすることにより、階層画像の符号化データの復号においても、以上の実施の形態において説明した方法を適用することができる。すなわち、S/N及び圧縮効率を大きく改善することができる。

＜コンピュータ＞

上述した一連の処理は、ハードウエアにより実行することもできるし、ソフトウエアにより実行することもできる。一連の処理をソフトウエアにより実行する場合には、そのソフトウエアを構成するプログラムが、コンピュータにインストールされる。ここでコンピュータには、専用のハードウエアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータ等が含まれる。

図８６は、上述した一連の処理をプログラムにより実行するコンピュータのハードウエアの構成例を示すブロック図である。

図８６に示されるコンピュータ１１００において、CPU（Central Processing Unit）１１０１、ROM（Read Only Memory）１１０２、RAM（Random Access Memory）１１０３は、バス１１０４を介して相互に接続されている。

バス１１０４にはまた、入出力インタフェース１１１０も接続されている。入出力インタフェース１１１０には、入力部１１１１、出力部１１１２、記憶部１１１３、通信部１１１４、及びドライブ１１１５が接続されている。

入力部１１１１は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子等よりなる。出力部１１１２は、例えば、ディスプレイ、スピーカ、出力端子等よりなる。記憶部１１１３は、例えば、ハードディスク、RAMディスク、不揮発性のメモリ等よりなる。通信部１１１４は、例えば、ネットワークインタフェースよりなる。ドライブ１１１５は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブルメディア８２１を駆動する。

以上のように構成されるコンピュータでは、CPU１１０１が、例えば、記憶部１１１３に記憶されているプログラムを、入出力インタフェース１１１０及びバス１１０４を介して、RAM１１０３にロードして実行することにより、上述した一連の処理が行われる。RAM１１０３にはまた、CPU１１０１が各種の処理を実行する上において必要なデータ等も適宜記憶される。

コンピュータ（CPU１１０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア８２１に記録して適用することができる。その場合、プログラムは、リムーバブルメディア８２１をドライブ１１１５に装着することにより、入出力インタフェース１１１０を介して、記憶部１１１３にインストールすることができる。

また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線又は無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部１１１４で受信し、記憶部１１１３にインストールすることができる。

その他、このプログラムは、ROM１１０２や記憶部１１１３に、あらかじめインストールしておくこともできる。

＜本技術の応用＞

上述した実施の形態に係る符号化装置１１や復号装置１２は、例えば、衛星放送、ケーブルＴＶ等の有線放送、インターネット上での配信、及びセルラー通信による端末への配信等における送信機や受信機、又は、光ディスク、磁気ディスク及びフラッシュメモリ等の媒体に画像を記録する記録装置や、これら記憶媒体から画像を再生する再生装置等の、様々な電子機器に応用され得る。以下、４つの応用例について説明する。

＜第１の応用例：テレビジョン受像機＞

図８７は、上述した実施の形態を適用したテレビジョン装置の概略的な構成の一例を示す図である。

テレビジョン装置１２００は、アンテナ１２０１、チューナ１２０２、デマルチプレクサ１２０３、デコーダ１２０４、映像信号処理部１２０５、表示部１２０６、音声信号処理部１２０７、スピーカ１２０８、外部インタフェース（I/F）部１２０９、制御部１２１０、ユーザインタフェース（I/F）部１２１１、及びバス１２１２を備える。

チューナ１２０２は、アンテナ１２０１を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ１２０２は、復調により得られた符号化ビットストリームをデマルチプレクサ１２０３へ出力する。すなわち、チューナ１２０２は、画像が符号化されている符号化ストリームを受信する、テレビジョン装置１２００における伝送部としての役割を有する。

デマルチプレクサ１２０３は、符号化ビットストリームから視聴対象の番組の映像ストリーム及び音声ストリームを分離し、分離した各ストリームをデコーダ１２０４へ出力する。また、デマルチプレクサ１２０３は、符号化ビットストリームからEPG（Electronic Program Guide）等の補助的なデータを抽出し、抽出したデータを制御部１２１０に供給する。なお、デマルチプレクサ１２０３は、符号化ビットストリームがスクランブルされている場合には、デスクランブルを行ってもよい。

デコーダ１２０４は、デマルチプレクサ１２０３から入力される映像ストリーム及び音声ストリームを復号する。そして、デコーダ１２０４は、復号処理により生成される映像データを映像信号処理部１２０５へ出力する。また、デコーダ１２０４は、復号処理により生成される音声データを音声信号処理部１２０７へ出力する。

映像信号処理部１２０５は、デコーダ１２０４から入力される映像データを再生し、表示部１２０６に映像を表示させる。また、映像信号処理部１２０５は、ネットワークを介して供給されるアプリケーション画面を表示部１２０６に表示させてもよい。また、映像信号処理部１２０５は、映像データについて、設定に応じて、例えばノイズ除去等の追加的な処理を行ってもよい。さらに、映像信号処理部１２０５は、例えばメニュー、ボタン又はカーソル等のGUI（Graphical User Interface）の画像を生成し、生成した画像を出力画像に重畳してもよい。

表示部１２０６は、映像信号処理部１２０５から供給される駆動信号により駆動され、表示デバイス（例えば、液晶ディスプレイ、プラズマディスプレイ又はOELD（Organic ElectroLuminescence Display）（有機ELディスプレイ）等）の映像面上に映像又は画像を表示する。

音声信号処理部１２０７は、デコーダ１２０４から入力される音声データについてD/A変換及び増幅等の再生処理を行い、スピーカ１２０８から音声を出力させる。また、音声信号処理部１２０７は、音声データについてノイズ除去等の追加的な処理を行ってもよい。

外部インタフェース部１２０９は、テレビジョン装置１２００と外部機器又はネットワークとを接続するためのインタフェースである。例えば、外部インタフェース部１２０９を介して受信される映像ストリーム又は音声ストリームが、デコーダ１２０４により復号されてもよい。すなわち、外部インタフェース部１２０９もまた、画像が符号化されている符号化ストリームを受信する、テレビジョン装置１２００における伝送部としての役割を有する。

制御部１２１０は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、プログラムデータ、EPGデータ、及びネットワークを介して取得されるデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、テレビジョン装置１２００の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１２１１から入力される操作信号に応じて、テレビジョン装置１２００の動作を制御する。

ユーザインタフェース部１２１１は、制御部１２１０と接続される。ユーザインタフェース部１２１１は、例えば、ユーザがテレビジョン装置１２００を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部等を有する。ユーザインタフェース部１２１１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１２１０へ出力する。

バス１２１２は、チューナ１２０２、デマルチプレクサ１２０３、デコーダ１２０４、映像信号処理部１２０５、音声信号処理部１２０７、外部インタフェース部１２０９及び制御部１２１０を相互に接続する。

このように構成されたテレビジョン装置１２００において、デコーダ１２０４が、上述した復号装置１２の機能を有するようにしてもよい。つまり、デコーダ１２０４が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、テレビジョン装置１２００は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成されたテレビジョン装置１２００において、映像信号処理部１２０５が、例えば、デコーダ１２０４から供給される画像データを符号化し、得られた符号化データを、外部インタフェース部１２０９を介してテレビジョン装置１２００の外部に出力させることができるようにしてもよい。そして、その映像信号処理部１２０５が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、映像信号処理部１２０５が、デコーダ１２０４から供給される画像データを、以上の実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、テレビジョン装置１２００は、S/N及び圧縮効率を大きく改善することができる。

＜第２の応用例：携帯電話機＞

図８８は、上述した実施の形態を適用した携帯電話機の概略的な構成の一例を示す図である。

携帯電話機１２２０は、アンテナ１２２１、通信部１２２２、音声コーデック１２２３、スピーカ１２２４、マイクロホン１２２５、カメラ部１２２６、画像処理部１２２７、多重分離部１２２８、記録再生部１２２９、表示部１２３０、制御部１２３１、操作部１２３２、及びバス１２３３を備える。

アンテナ１２２１は、通信部１２２２に接続される。スピーカ１２２４及びマイクロホン１２２５は、音声コーデック１２２３に接続される。操作部１２３２は、制御部１２３１に接続される。バス１２３３は、通信部１２２２、音声コーデック１２２３、カメラ部１２２６、画像処理部１２２７、多重分離部１２２８、記録再生部１２２９、表示部１２３０、及び制御部１２３１を相互に接続する。

携帯電話機１２２０は、音声通話モード、データ通信モード、撮影モード及びテレビ電話モードを含む様々な動作モードで、音声信号の送受信、電子メール又は画像データの送受信、画像の撮像、及びデータの記録等の動作を行う。

音声通話モードにおいて、マイクロホン１２２５により生成されるアナログ音声信号は、音声コーデック１２２３に供給される。音声コーデック１２２３は、アナログ音声信号を音声データへ変換し、変換された音声データをA/D変換し圧縮する。そして、音声コーデック１２２３は、圧縮後の音声データを通信部１２２２へ出力する。通信部１２２２は、音声データを符号化及び変調し、送信信号を生成する。そして、通信部１２２２は、生成した送信信号を、アンテナ１２２１を介して基地局（図示せず）へ送信する。また、通信部１２２２は、アンテナ１２２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部１２２２は、受信信号を復調及び復号して音声データを生成し、生成した音声データを音声コーデック１２２３へ出力する。音声コーデック１２２３は、音声データを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック１２２３は、生成した音声信号をスピーカ１２２４に供給して音声を出力させる。

また、データ通信モードにおいて、例えば、制御部１２３１は、操作部１２３２を介するユーザによる操作に応じて、電子メールを構成する文字データを生成する。また、制御部１２３１は、文字を表示部１２３０に表示させる。また、制御部１２３１は、操作部１２３２を介するユーザからの送信指示に応じて電子メールデータを生成し、生成した電子メールデータを通信部１２２２へ出力する。通信部１２２２は、電子メールデータを符号化及び変調し、送信信号を生成する。そして、通信部１２２２は、生成した送信信号を、アンテナ１２２１を介して基地局（図示せず）へ送信する。また、通信部１２２２は、アンテナ１２２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。そして、通信部１２２２は、受信信号を復調及び復号して電子メールデータを復元し、復元した電子メールデータを制御部１２３１へ出力する。制御部１２３１は、表示部１２３０に電子メールの内容を表示させると共に、電子メールデータを記録再生部１２２９に供給し、その記憶媒体に書き込ませる。

記録再生部１２２９は、読み書き可能な任意の記憶媒体を有する。例えば、記憶媒体は、RAM又はフラッシュメモリ等の内蔵型の記憶媒体であってもよく、ハードディスク、磁気ディスク、光磁気ディスク、光ディスク、USB（Universal Serial Bus）メモリ、又はメモリカード等の外部装着型の記憶媒体であってもよい。

また、撮影モードにおいて、例えば、カメラ部１２２６は、被写体を撮像して画像データを生成し、生成した画像データを画像処理部１２２７へ出力する。画像処理部１２２７は、カメラ部１２２６から入力される画像データを符号化し、符号化ストリームを記録再生部１２２９に供給し、その記憶媒体に書き込ませる。

さらに、画像表示モードにおいて、記録再生部１２２９は、記憶媒体に記録されている符号化ストリームを読み出して画像処理部１２２７へ出力する。画像処理部１２２７は、記録再生部１２２９から入力される符号化ストリームを復号し、画像データを表示部１２３０に供給し、その画像を表示させる。

また、テレビ電話モードにおいて、例えば、多重分離部１２２８は、画像処理部１２２７により符号化された映像ストリームと、音声コーデック１２２３から入力される音声ストリームとを多重化し、多重化したストリームを通信部１２２２へ出力する。通信部１２２２は、ストリームを符号化及び変調し、送信信号を生成する。そして、通信部１２２２は、生成した送信信号を、アンテナ１２２１を介して基地局（図示せず）へ送信する。また、通信部１２２２は、アンテナ１２２１を介して受信される無線信号を増幅し及び周波数変換し、受信信号を取得する。これら送信信号及び受信信号には、符号化ビットストリームが含まれ得る。そして、通信部１２２２は、受信信号を復調及び復号してストリームを復元し、復元したストリームを多重分離部１２２８へ出力する。多重分離部１２２８は、入力されるストリームから映像ストリーム及び音声ストリームを分離し、映像ストリームを画像処理部１２２７、音声ストリームを音声コーデック１２２３へ出力する。画像処理部１２２７は、映像ストリームを復号し、映像データを生成する。映像データは、表示部１２３０に供給され、表示部１２３０により一連の画像が表示される。音声コーデック１２２３は、音声ストリームを伸張し及びD/A変換し、アナログ音声信号を生成する。そして、音声コーデック１２２３は、生成した音声信号をスピーカ１２２４に供給して音声を出力させる。

このように構成された携帯電話機１２２０において、例えば画像処理部１２２７が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、画像処理部１２２７が、画像データを、以上の実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、携帯電話機１２２０は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成された携帯電話機１２２０において、例えば画像処理部１２２７が、上述した復号装置１２の機能を有するようにしてもよい。つまり、画像処理部１２２７が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、携帯電話機１２２０は、S/N及び圧縮効率を大きく改善することができる。

＜第３の応用例：記録再生装置＞

図８９は、上述した実施の形態を適用した記録再生装置の概略的な構成の一例を示す図である。

記録再生装置１２４０は、例えば、受信した放送番組の音声データ及び映像データを符号化して記録媒体に記録する。また、記録再生装置１２４０は、例えば、他の装置から取得される音声データ及び映像データを符号化して記録媒体に記録してもよい。また、記録再生装置１２４０は、例えば、ユーザの指示に応じて、記録媒体に記録されているデータをモニタ及びスピーカ上で再生する。このとき、記録再生装置１２４０は、音声データ及び映像データを復号する。

記録再生装置１２４０は、チューナ１２４１、外部インタフェース（I/F）部１２４２、エンコーダ１２４３、HDD（Hard Disk Drive）部１２４４、ディスクドライブ１２４５、セレクタ１２４６、デコーダ１２４７、OSD（On-Screen Display）部１２４８、制御部１２４９、及びユーザインタフェース（I/F）部１２５０を備える。

チューナ１２４１は、アンテナ（図示せず）を介して受信される放送信号から所望のチャンネルの信号を抽出し、抽出した信号を復調する。そして、チューナ１２４１は、復調により得られた符号化ビットストリームをセレクタ１２４６へ出力する。すなわち、チューナ１２４１は、記録再生装置１２４０における伝送部としての役割を有する。

外部インタフェース部１２４２は、記録再生装置１２４０と外部機器又はネットワークとを接続するためのインタフェースである。外部インタフェース部１２４２は、例えば、IEEE（Institute of Electrical and Electronic Engineers）1394インタフェース、ネットワークインタフェース、USBインタフェース、又はフラッシュメモリインタフェース等であってよい。例えば、外部インタフェース部１２４２を介して受信される映像データ及び音声データは、エンコーダ１２４３へ入力される。すなわち、外部インタフェース部１２４２は、記録再生装置１２４０における伝送部としての役割を有する。

エンコーダ１２４３は、外部インタフェース部１２４２から入力される映像データ及び音声データが符号化されていない場合に、映像データ及び音声データを符号化する。そして、エンコーダ１２４３は、符号化ビットストリームをセレクタ１２４６へ出力する。

HDD部１２４４は、映像及び音声等のコンテンツデータが圧縮された符号化ビットストリーム、各種プログラム及びその他のデータを内部のハードディスクに記録する。また、HDD部１２４４は、映像及び音声の再生時に、これらデータをハードディスクから読み出す。

ディスクドライブ１２４５は、装着されている記録媒体へのデータの記録及び読み出しを行う。ディスクドライブ１２４５に装着される記録媒体は、例えばDVD（Digital Versatile Disc）ディスク（DVD-Video、DVD-RAM（DVD - Random Access Memory）、DVD-R（DVD - Recordable）、DVD-RW（DVD - Rewritable）、DVD+R（DVD + Recordable）、DVD+RW（DVD + Rewritable）等）又はBlu-ray（登録商標）ディスク等であってよい。

セレクタ１２４６は、映像及び音声の記録時には、チューナ１２４１又はエンコーダ１２４３から入力される符号化ビットストリームを選択し、選択した符号化ビットストリームをHDD１２４４又はディスクドライブ１２４５へ出力する。また、セレクタ１２４６は、映像及び音声の再生時には、HDD１２４４又はディスクドライブ１２４５から入力される符号化ビットストリームをデコーダ１２４７へ出力する。

デコーダ１２４７は、符号化ビットストリームを復号し、映像データ及び音声データを生成する。そして、デコーダ１２４７は、生成した映像データをOSD部１２４８へ出力する。また、デコーダ１２４７は、生成した音声データを外部のスピーカへ出力する。

OSD部１２４８は、デコーダ１２４７から入力される映像データを再生し、映像を表示する。また、OSD部１２４８は、表示する映像に、例えばメニュー、ボタン又はカーソル等のGUIの画像を重畳してもよい。

制御部１２４９は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、記録再生装置１２４０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１２５０から入力される操作信号に応じて、記録再生装置１２４０の動作を制御する。

ユーザインタフェース部１２５０は、制御部１２４９と接続される。ユーザインタフェース部１２５０は、例えば、ユーザが記録再生装置１２４０を操作するためのボタン及びスイッチ、並びに遠隔制御信号の受信部等を有する。ユーザインタフェース部１２５０は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１２４９へ出力する。

このように構成された記録再生装置１２４０において、例えばエンコーダ１２４３が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、エンコーダ１２４３が、画像データを、以上の実施の形態において説明方法で符号化するようにしてもよい。このようにすることにより、記録再生装置１２４０は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成された記録再生装置１２４０において、例えばデコーダ１２４７が、上述した復号装置１２の機能を有するようにしてもよい。つまり、デコーダ１２４７が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、記録再生装置１２４０は、S/N及び圧縮効率を大きく改善することができる。

＜第４の応用例：撮像装置＞

図９０は、上述した実施の形態を適用した撮像装置の概略的な構成の一例を示す図である。

撮像装置１２６０は、被写体を撮像して画像を生成し、画像データを符号化して記録媒体に記録する。

撮像装置１２６０は、光学ブロック１２６１、撮像部１２６２、信号処理部１２６３、画像処理部１２６４、表示部１２６５、外部インタフェース（I/F）部１２６６、メモリ部１２６７、メディアドライブ１２６８、OSD部１２６９、制御部１２７０、ユーザインタフェース（I/F）部１２７１、及びバス１２７２を備える。

光学ブロック１２６１は、撮像部１２６２に接続される。撮像部１２６２は、信号処理部１２６３に接続される。表示部１２６５は、画像処理部１２６４に接続される。ユーザインタフェース部１２７１は、制御部１２７０に接続される。バス１２７２は、画像処理部１２６４、外部インタフェース部１２６６、メモリ部１２６７、メディアドライブ１２６８、OSD部１２６９、及び制御部１２７０を相互に接続する。

光学ブロック１２６１は、フォーカスレンズ及び絞り機構等を有する。光学ブロック１２６１は、被写体の光学像を撮像部１２６２の撮像面に結像させる。撮像部１２６２は、CCD（Charge Coupled Device）又はCMOS（Complementary Metal Oxide Semiconductor）等のイメージセンサを有し、撮像面に結像した光学像を光電変換によって電気信号としての画像信号に変換する。そして、撮像部１２６２は、画像信号を信号処理部１２６３へ出力する。

信号処理部１２６３は、撮像部１２６２から入力される画像信号に対してニー補正、ガンマ補正、色補正等の種々のカメラ信号処理を行う。信号処理部１２６３は、カメラ信号処理後の画像データを画像処理部１２６４へ出力する。

画像処理部１２６４は、信号処理部１２６３から入力される画像データを符号化し、符号化データを生成する。そして、画像処理部１２６４は、生成した符号化データを外部インタフェース部１２６６又はメディアドライブ１２６８へ出力する。また、画像処理部１２６４は、外部インタフェース部１２６６又はメディアドライブ１２６８から入力される符号化データを復号し、画像データを生成する。そして、画像処理部１２６４は、生成した画像データを表示部１２６５へ出力する。また、画像処理部１２６４は、信号処理部１２６３から入力される画像データを表示部１２６５へ出力して画像を表示させてもよい。また、画像処理部１２６４は、OSD部１２６９から取得される表示用データを、表示部１２６５へ出力する画像に重畳してもよい。

OSD部１２６９は、例えばメニュー、ボタン又はカーソル等のGUIの画像を生成して、生成した画像を画像処理部１２６４へ出力する。

外部インタフェース部１２６６は、例えばUSB入出力端子として構成される。外部インタフェース部１２６６は、例えば、画像の印刷時に、撮像装置１２６０とプリンタとを接続する。また、外部インタフェース部１２６６には、必要に応じてドライブが接続される。ドライブには、例えば、磁気ディスク又は光ディスク等のリムーバブルメディアが装着され、リムーバブルメディアから読み出されるプログラムが、撮像装置１２６０にインストールされ得る。さらに、外部インタフェース部１２６６は、LAN又はインターネット等のネットワークに接続されるネットワークインタフェースとして構成されてもよい。すなわち、外部インタフェース部１２６６は、撮像装置１２６０における伝送部としての役割を有する。

メディアドライブ１２６８に装着される記録媒体は、例えば、磁気ディスク、光磁気ディスク、光ディスク、又は半導体メモリ等の、読み書き可能な任意のリムーバブルメディアであってよい。また、メディアドライブ１２６８に記録媒体が固定的に装着され、例えば、内蔵型ハードディスクドライブ又はSSD（Solid State Drive）のような非可搬性の記憶部が構成されてもよい。

制御部１２７０は、CPU等のプロセッサ、並びにRAM及びROM等のメモリを有する。メモリは、CPUにより実行されるプログラム、及びプログラムデータ等を記憶する。メモリにより記憶されるプログラムは、例えば、撮像装置１２６０の起動時にCPUにより読み込まれ、実行される。CPUは、プログラムを実行することにより、例えばユーザインタフェース部１２７１から入力される操作信号に応じて、撮像装置１２６０の動作を制御する。

ユーザインタフェース部１２７１は、制御部１２７０と接続される。ユーザインタフェース部１２７１は、例えば、ユーザが撮像装置１２６０を操作するためのボタン及びスイッチ等を有する。ユーザインタフェース部１２７１は、これら構成要素を介してユーザによる操作を検出して操作信号を生成し、生成した操作信号を制御部１２７０へ出力する。

このように構成された撮像装置１２６０において、例えば画像処理部１２６４が、上述した符号化装置１１の機能を有するようにしてもよい。つまり、画像処理部１２６４が、画像データを、以上の実施の形態において説明した方法で符号化するようにしてもよい。このようにすることにより、撮像装置１２６０は、S/N及び圧縮効率を大きく改善することができる。

また、このように構成された撮像装置１２６０において、例えば画像処理部１２６４が、上述した復号装置１２の機能を有するようにしてもよい。つまり、画像処理部１２６４が、符号化データを、以上の実施の形態において説明した方法で復号するようにしてもよい。このようにすることにより、撮像装置１２６０は、S/N及び圧縮効率を大きく改善することができる。

＜その他の応用例＞

なお、本技術は、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択して使用する、例えばMPEG DASH等のようなHTTPストリーミングにも適用することができる。つまり、このような複数の符号化データ間で、符号化や復号に関する情報を共有することもできる。

また、以上においては、本技術を適用する装置やシステム等の例を説明したが、本技術は、これに限らず、このような装置又はシステムを構成する装置に搭載するあらゆる構成、例えば、システムLSI（Large Scale Integration）等としてのプロセッサ、複数のプロセッサ等を用いるモジュール、複数のモジュール等を用いるユニット、ユニットにさらにその他の機能を付加したセット等（すなわち、装置の一部の構成）として実施することもできる。

＜ビデオセット＞

本技術をセットとして実施する場合の例について、図９１を参照して説明する。

図９１は、本技術を適用したビデオセットの概略的な構成の一例を示す図である。

近年、電子機器の多機能化が進んでおり、その開発や製造において、その一部の構成を販売や提供等として実施する場合、１機能を有する構成として実施を行う場合だけでなく、関連する機能を有する複数の構成を組み合わせ、複数の機能を有する１セットとして実施を行う場合も多く見られるようになってきた。

図９１に示されるビデオセット１３００は、このような多機能化された構成であり、画像の符号化や復号（いずれか一方でもよいし、両方でも良い）に関する機能を有するデバイスに、その機能に関連するその他の機能を有するデバイスを組み合わせたものである。

図９１に示されるように、ビデオセット１３００は、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４等のモジュール群と、コネクティビティ１３２１、カメラ１３２２、及びセンサ１３２３等の関連する機能を有するデバイスとを有する。

モジュールは、互いに関連するいくつかの部品的機能をまとめ、まとまりのある機能を持った部品としたものである。具体的な物理的構成は任意であるが、例えば、それぞれ機能を有する複数のプロセッサ、抵抗やコンデンサ等の電子回路素子、その他のデバイス等を配線基板等に配置して一体化したものが考えられる。また、モジュールに他のモジュールやプロセッサ等を組み合わせて新たなモジュールとすることも考えられる。

図９１の例の場合、ビデオモジュール１３１１は、画像処理に関する機能を有する構成を組み合わせたものであり、アプリケーションプロセッサ１３３１、ビデオプロセッサ１３３２、ブロードバンドモデム１３３３、及びRFモジュール１３３４を有する。

プロセッサは、所定の機能を有する構成をSoC（System On a Chip）により半導体チップに集積したものであり、例えばシステムLSI（Large Scale Integration）等と称されるものもある。この所定の機能を有する構成は、論理回路（ハードウエア構成）であってもよいし、CPU、ROM、RAM等と、それらを用いて実行されるプログラム（ソフトウエア構成）であってもよいし、その両方を組み合わせたものであってもよい。例えば、プロセッサが、論理回路とCPU、ROM、RAM等とを有し、機能の一部を論理回路（ハードウエア構成）により実現し、その他の機能をCPUにおいて実行されるプログラム（ソフトウエア構成）により実現するようにしてもよい。

図９１のアプリケーションプロセッサ１３３１は、画像処理に関するアプリケーションを実行するプロセッサである。このアプリケーションプロセッサ１３３１において実行されるアプリケーションは、所定の機能を実現するために、演算処理を行うだけでなく、例えばビデオプロセッサ１３３２等、ビデオモジュール１３１１内外の構成を必要に応じて制御することもできる。

ビデオプロセッサ１３３２は、画像の符号化・復号（その一方若しくは両方）に関する機能を有するプロセッサである。

ブロードバンドモデム１３３３は、インターネットや公衆電話回線網等の広帯域の回線を介して行われる有線若しくは無線（又はその両方）の広帯域通信により送信するデータ（デジタル信号）をデジタル変調する等してアナログ信号に変換したり、その広帯域通信により受信したアナログ信号を復調してデータ（デジタル信号）に変換したりする。ブロードバンドモデム１３３３は、例えば、ビデオプロセッサ１３３２が処理する画像データ、画像データが符号化されたストリーム、アプリケーションプログラム、設定データ等、任意の情報を処理する。

RFモジュール１３３４は、アンテナを介して送受信されるRF（Radio Frequency）信号に対して、周波数変換、変復調、増幅、フィルタ処理等を行うモジュールである。例えば、RFモジュール１３３４は、ブロードバンドモデム１３３３により生成されたベースバンド信号に対して周波数変換等を行ってRF信号を生成する。また、例えば、RFモジュール１３３４は、フロントエンドモジュール１３１４を介して受信されたRF信号に対して周波数変換等を行ってベースバンド信号を生成する。

なお、図９１において点線１３４１に示されるように、アプリケーションプロセッサ１３３１とビデオプロセッサ１３３２を、一体化し、１つのプロセッサとして構成されるようにしてもよい。

外部メモリ１３１２は、ビデオモジュール１３１１の外部に設けられた、ビデオモジュール１３１１により利用される記憶デバイスを有するモジュールである。この外部メモリ１３１２の記憶デバイスは、どのような物理構成により実現するようにしてもよいが、一般的にフレーム単位の画像データのような大容量のデータの格納に利用されることが多いので、例えばDRAM（Dynamic Random Access Memory）のような比較的安価で大容量の半導体メモリにより実現するのが望ましい。

パワーマネージメントモジュール１３１３は、ビデオモジュール１３１１（ビデオモジュール１３１１内の各構成）への電力供給を管理し、制御する。

フロントエンドモジュール１３１４は、RFモジュール１３３４に対してフロントエンド機能（アンテナ側の送受信端の回路）を提供するモジュールである。図９１に示されるように、フロントエンドモジュール１３１４は、例えば、アンテナ部１３５１、フィルタ１３５２、及び増幅部１３５３を有する。

アンテナ部１３５１は、無線信号を送受信するアンテナ及びその周辺の構成を有する。アンテナ部１３５１は、増幅部１３５３から供給される信号を無線信号として送信し、受信した無線信号を電気信号（RF信号）としてフィルタ１３５２に供給する。フィルタ１３５２は、アンテナ部１３５１を介して受信されたRF信号に対してフィルタ処理等を行い、処理後のRF信号をRFモジュール１３３４に供給する。増幅部１３５３は、RFモジュール１３３４から供給されるRF信号を増幅し、アンテナ部１３５１に供給する。

コネクティビティ１３２１は、外部との接続に関する機能を有するモジュールである。コネクティビティ１３２１の物理構成は、任意である。例えば、コネクティビティ１３２１は、ブロードバンドモデム１３３３が対応する通信規格以外の通信機能を有する構成や、外部入出力端子等を有する。

例えば、コネクティビティ１３２１が、Bluetooth（登録商標）、IEEE 802.11（例えばWi-Fi（Wireless Fidelity、登録商標））、NFC（Near Field Communication）、IrDA（InfraRed Data Association）等の無線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した信号を送受信するアンテナ等を有するようにしてもよい。また、例えば、コネクティビティ１３２１が、USB（Universal Serial Bus）、HDMI（登録商標）（High-Definition Multimedia Interface）等の有線通信規格に準拠する通信機能を有するモジュールや、その規格に準拠した端子を有するようにしてもよい。さらに、例えば、コネクティビティ１３２１が、アナログ入出力端子等のその他のデータ（信号）伝送機能等を有するようにしてもよい。

なお、コネクティビティ１３２１が、データ（信号）の伝送先のデバイスを含むようにしてもよい。例えば、コネクティビティ１３２１が、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等の記録媒体に対してデータの読み出しや書き込みを行うドライブ（リムーバブルメディアのドライブだけでなく、ハードディスク、SSD（Solid State Drive）、NAS（Network Attached Storage）等も含む）を有するようにしてもよい。また、コネクティビティ１３２１が、画像や音声の出力デバイス（モニタやスピーカ等）を有するようにしてもよい。

カメラ１３２２は、被写体を撮像し、被写体の画像データを得る機能を有するモジュールである。カメラ１３２２の撮像により得られた画像データは、例えば、ビデオプロセッサ１３３２に供給されて符号化される。

センサ１３２３は、例えば、音声センサ、超音波センサ、光センサ、照度センサ、赤外線センサ、イメージセンサ、回転センサ、角度センサ、角速度センサ、速度センサ、加速度センサ、傾斜センサ、磁気識別センサ、衝撃センサ、温度センサ等、任意のセンサ機能を有するモジュールである。センサ１３２３により検出されたデータは、例えば、アプリケーションプロセッサ１３３１に供給されてアプリケーション等により利用される。

以上においてモジュールとして説明した構成をプロセッサとして実現するようにしてもよいし、逆にプロセッサとして説明した構成をモジュールとして実現するようにしてもよい。

以上のような構成のビデオセット１３００において、後述するようにビデオプロセッサ１３３２に本技術を適用することができる。したがって、ビデオセット１３００は、本技術を適用したセットとして実施することができる。

＜ビデオプロセッサの構成例＞

図９２は、本技術を適用したビデオプロセッサ１３３２（図９１）の概略的な構成の一例を示す図である。

図９２の例の場合、ビデオプロセッサ１３３２は、ビデオ信号及びオーディオ信号の入力を受けてこれらを所定の方式で符号化する機能と、符号化されたビデオデータ及びオーディオデータを復号し、ビデオ信号及びオーディオ信号を再生出力する機能とを有する。

図９２に示されるように、ビデオプロセッサ１３３２は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、フレームメモリ１４０５、及びメモリ制御部１４０６を有する。また、ビデオプロセッサ１３３２は、エンコード・デコードエンジン１４０７、ビデオES（Elementary Stream）バッファ１４０８Ａ及び１４０８Ｂ、並びに、オーディオESバッファ１４０９Ａ及び１４０９Ｂを有する。さらに、ビデオプロセッサ１３３２は、オーディオエンコーダ１４１０、オーディオデコーダ１４１１、多重化部（MUX（Multiplexer））１４１２、逆多重化部（DMUX（Demultiplexer））１４１３、及びストリームバッファ１４１４を有する。

ビデオ入力処理部１４０１は、例えばコネクティビティ１３２１（図９１）等から入力されたビデオ信号を取得し、デジタル画像データに変換する。第１画像拡大縮小部１４０２は、画像データに対してフォーマット変換や画像の拡大縮小処理等を行う。第２画像拡大縮小部１４０３は、画像データに対して、ビデオ出力処理部１４０４を介して出力する先でのフォーマットに応じて画像の拡大縮小処理を行ったり、第１画像拡大縮小部１４０２と同様のフォーマット変換や画像の拡大縮小処理等を行ったりする。ビデオ出力処理部１４０４は、画像データに対して、フォーマット変換やアナログ信号への変換等を行って、再生されたビデオ信号として例えばコネクティビティ１３２１等に出力する。

フレームメモリ１４０５は、ビデオ入力処理部１４０１、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３、ビデオ出力処理部１４０４、及びエンコード・デコードエンジン１４０７によって共用される画像データ用のメモリである。フレームメモリ１４０５は、例えばDRAM等の半導体メモリとして実現される。

メモリ制御部１４０６は、エンコード・デコードエンジン１４０７からの同期信号を受けて、アクセス管理テーブル１４０６Ａに書き込まれたフレームメモリ１４０５へのアクセススケジュールに従ってフレームメモリ１４０５に対する書き込み・読み出しのアクセスを制御する。アクセス管理テーブル１４０６Ａは、エンコード・デコードエンジン１４０７、第１画像拡大縮小部１４０２、第２画像拡大縮小部１４０３等で実行される処理に応じて、メモリ制御部１４０６により更新される。

エンコード・デコードエンジン１４０７は、画像データのエンコード処理、並びに、画像データが符号化されたデータであるビデオストリームのデコード処理を行う。例えば、エンコード・デコードエンジン１４０７は、フレームメモリ１４０５から読み出した画像データを符号化し、ビデオストリームとしてビデオESバッファ１４０８Ａに順次書き込む。また、例えば、ビデオESバッファ１４０８Ｂからビデオストリームを順次読み出して復号し、画像データとしてフレームメモリ１４０５に順次書き込む。エンコード・デコードエンジン１４０７は、これらの符号化や復号において、フレームメモリ１４０５を作業領域として使用する。また、エンコード・デコードエンジン１４０７は、例えばマクロブロック毎の処理を開始するタイミングで、メモリ制御部１４０６に対して同期信号を出力する。

ビデオESバッファ１４０８Ａは、エンコード・デコードエンジン１４０７によって生成されたビデオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。ビデオESバッファ１４０８Ｂは、逆多重化部（DMUX）１４１３から供給されたビデオストリームをバッファリングして、エンコード・デコードエンジン１４０７に供給する。

オーディオESバッファ１４０９Ａは、オーディオエンコーダ１４１０によって生成されたオーディオストリームをバッファリングして、多重化部（MUX）１４１２に供給する。オーディオESバッファ１４０９Ｂは、逆多重化部（DMUX）１４１３から供給されたオーディオストリームをバッファリングして、オーディオデコーダ１４１１に供給する。

オーディオエンコーダ１４１０は、例えばコネクティビティ１３２１等から入力されたオーディオ信号を例えばデジタル変換し、例えばMPEGオーディオ方式やAC3（AudioCode number 3）方式等の所定の方式で符号化する。オーディオエンコーダ１４１０は、オーディオ信号が符号化されたデータであるオーディオストリームをオーディオESバッファ１４０９Ａに順次書き込む。オーディオデコーダ１４１１は、オーディオESバッファ１４０９Ｂから供給されたオーディオストリームを復号し、例えばアナログ信号への変換等を行って、再生されたオーディオ信号として例えばコネクティビティ１３２１等に供給する。

多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化する。この多重化の方法（すなわち、多重化により生成されるビットストリームのフォーマット）は任意である。また、この多重化の際に、多重化部（MUX）１４１２は、所定のヘッダ情報等をビットストリームに付加することもできる。つまり、多重化部（MUX）１４１２は、多重化によりストリームのフォーマットを変換することができる。例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームに変換する。また、例えば、多重化部（MUX）１４１２は、ビデオストリームとオーディオストリームとを多重化することにより、記録用のファイルフォーマットのデータ（ファイルデータ）に変換する。

逆多重化部（DMUX）１４１３は、多重化部（MUX）１４１２による多重化に対応する方法で、ビデオストリームとオーディオストリームとが多重化されたビットストリームを逆多重化する。つまり、逆多重化部（DMUX）１４１３は、ストリームバッファ１４１４から読み出されたビットストリームからビデオストリームとオーディオストリームとを抽出する（ビデオストリームとオーディオストリームとを分離する）。つまり、逆多重化部（DMUX）１４１３は、逆多重化によりストリームのフォーマットを変換（多重化部（MUX）１４１２による変換の逆変換）することができる。例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等から供給されたトランスポートストリームを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。また、例えば、逆多重化部（DMUX）１４１３は、例えばコネクティビティ１３２１により各種記録媒体から読み出されたファイルデータを、ストリームバッファ１４１４を介して取得し、逆多重化することにより、ビデオストリームとオーディオストリームとに変換することができる。

ストリームバッファ１４１４は、ビットストリームをバッファリングする。例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給する。

また、例えば、ストリームバッファ１４１４は、多重化部（MUX）１４１２から供給されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、例えばコネクティビティ１３２１等に供給し、各種記録媒体に記録させる。

さらに、ストリームバッファ１４１４は、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して取得したトランスポートストリームをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

また、ストリームバッファ１４１４は、例えばコネクティビティ１３２１等において各種記録媒体から読み出されたファイルデータをバッファリングし、所定のタイミングにおいて、若しくは外部からの要求等に基づいて、逆多重化部（DMUX）１４１３に供給する。

次に、このような構成のビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたビデオ信号は、ビデオ入力処理部１４０１において４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式のデジタル画像データに変換され、フレームメモリ１４０５に順次書き込まれる。このデジタル画像データは、第１画像拡大縮小部１４０２又は第２画像拡大縮小部１４０３に読み出されて、４：２：０Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式へのフォーマット変換及び拡大縮小処理が行われ、再びフレームメモリ１４０５に書き込まれる。この画像データは、エンコード・デコードエンジン１４０７によって符号化され、ビデオストリームとしてビデオESバッファ１４０８Ａに書き込まれる。

また、コネクティビティ１３２１等からビデオプロセッサ１３３２に入力されたオーディオ信号は、オーディオエンコーダ１４１０によって符号化され、オーディオストリームとして、オーディオESバッファ１４０９Ａに書き込まれる。

ビデオESバッファ１４０８Ａのビデオストリームと、オーディオESバッファ１４０９Ａのオーディオストリームは、多重化部（MUX）１４１２に読み出されて多重化され、トランスポートストリーム若しくはファイルデータ等に変換される。多重化部（MUX）１４１２により生成されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークに出力される。また、多重化部（MUX）１４１２により生成されたファイルデータは、ストリームバッファ１４１４にバッファされた後、例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

また、例えばコネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからビデオプロセッサ１３３２に入力されたトランスポートストリームは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。また、例えばコネクティビティ１３２１等において各種記録媒体から読み出され、ビデオプロセッサ１３３２に入力されたファイルデータは、ストリームバッファ１４１４にバッファされた後、逆多重化部（DMUX）１４１３により逆多重化される。つまり、ビデオプロセッサ１３３２に入力されたトランスポートストリーム又はファイルデータは、逆多重化部（DMUX）１４１３によりビデオストリームとオーディオストリームとに分離される。

オーディオストリームは、オーディオESバッファ１４０９Ｂを介してオーディオデコーダ１４１１に供給され、復号されてオーディオ信号が再生される。また、ビデオストリームは、ビデオESバッファ１４０８Ｂに書き込まれた後、エンコード・デコードエンジン１４０７により順次読み出されて復号されてフレームメモリ１４０５に書き込まれる。復号された画像データは、第２画像拡大縮小部１４０３によって拡大縮小処理されて、フレームメモリ１４０５に書き込まれる。そして、復号された画像データは、ビデオ出力処理部１４０４に読み出されて、４：２：２Ｙ／Ｃｂ／Ｃｒ方式等の所定の方式にフォーマット変換され、さらにアナログ信号に変換されて、ビデオ信号が再生出力される。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、エンコード・デコードエンジン１４０７に、上述した実施の形態に係る本技術を適用すればよい。つまり、例えば、エンコード・デコードエンジン１４０７が、上述した符号化装置１１の機能若しくは復号装置１２の機能又はその両方を有するようにしてもよい。このようにすることにより、ビデオプロセッサ１３３２は、上述した実施の形態の符号化装置１１や復号装置１２と同様の効果を得ることができる。

なお、エンコード・デコードエンジン１４０７において、本技術（すなわち、符号化装置１１の機能若しくは復号装置１２の機能又はその両方）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

＜ビデオプロセッサの他の構成例＞

図９３は、本技術を適用したビデオプロセッサ１３３２の概略的な構成の他の例を示す図である。

図９３の例の場合、ビデオプロセッサ１３３２は、ビデオデータを所定の方式で符号化・復号する機能を有する。

より具体的には、図９３に示されるように、ビデオプロセッサ１３３２は、制御部１５１１、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及び内部メモリ１５１５を有する。また、ビデオプロセッサ１３３２は、コーデックエンジン１５１６、メモリインタフェース１５１７、多重化・逆多重化部（MUX DMUX）１５１８、ネットワークインタフェース１５１９、及びビデオインタフェース１５２０を有する。

制御部１５１１は、ディスプレイインタフェース１５１２、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６等、ビデオプロセッサ１３３２内の各処理部の動作を制御する。

図９３に示されるように、制御部１５１１は、例えば、メインCPU１５３１、サブCPU１５３２、及びシステムコントローラ１５３３を有する。メインCPU１５３１は、ビデオプロセッサ１３３２内の各処理部の動作を制御するためのプログラム等を実行する。メインCPU１５３１は、そのプログラム等に従って制御信号を生成し、各処理部に供給する（つまり、各処理部の動作を制御する）。サブCPU１５３２は、メインCPU１５３１の補助的な役割を果たす。例えば、サブCPU１５３２は、メインCPU１５３１が実行するプログラム等の子プロセスやサブルーチン等を実行する。システムコントローラ１５３３は、メインCPU１５３１及びサブCPU１５３２が実行するプログラムを指定する等、メインCPU１５３１及びサブCPU１５３２の動作を制御する。

ディスプレイインタフェース１５１２は、制御部１５１１の制御の下、画像データを例えばコネクティビティ１３２１等に出力する。例えば、ディスプレイインタフェース１５１２は、デジタルデータの画像データをアナログ信号に変換し、再生されたビデオ信号として、又はデジタルデータの画像データのまま、コネクティビティ１３２１のモニタ装置等に出力する。

ディスプレイエンジン１５１３は、制御部１５１１の制御の下、画像データに対して、その画像を表示させるモニタ装置等のハードウエアスペックに合わせるように、フォーマット変換、サイズ変換、色域変換等の各種変換処理を行う。

画像処理エンジン１５１４は、制御部１５１１の制御の下、画像データに対して、例えば画質改善のためのフィルタ処理等、所定の画像処理を施す。

内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６により共用される、ビデオプロセッサ１３３２の内部に設けられたメモリである。内部メモリ１５１５は、例えば、ディスプレイエンジン１５１３、画像処理エンジン１５１４、及びコーデックエンジン１５１６の間で行われるデータの授受に利用される。例えば、内部メモリ１５１５は、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６から供給されるデータを格納し、必要に応じて（例えば、要求に応じて）、そのデータを、ディスプレイエンジン１５１３、画像処理エンジン１５１４、又はコーデックエンジン１５１６に供給する。この内部メモリ１５１５は、どのような記憶デバイスにより実現するようにしてもよいが、一般的にブロック単位の画像データやパラメータ等といった小容量のデータの格納に利用することが多いので、例えばSRAM（Static Random Access Memory）のような比較的（例えば外部メモリ１３１２と比較して）小容量だが応答速度が高速な半導体メモリにより実現するのが望ましい。

コーデックエンジン１５１６は、画像データの符号化や復号に関する処理を行う。このコーデックエンジン１５１６が対応する符号化・復号の方式は任意であり、その数は１つであってもよいし、複数であってもよい。例えば、コーデックエンジン１５１６は、複数の符号化・復号方式のコーデック機能を備え、その中から選択されたもので画像データの符号化又は符号化データの復号を行うようにしてもよい。

図９３に示される例において、コーデックエンジン１５１６は、コーデックに関する処理の機能ブロックとして、例えば、MPEG-2 Video１５４１、AVC/H.264１５４２、HEVC/H.265１５４３、HEVC/H.265(Scalable)１５４４、HEVC/H.265(Multi-view)１５４５、及びMPEG-DASH１５５１を有する。

MPEG-2 Video１５４１は、画像データをMPEG-2方式で符号化したり復号したりする機能ブロックである。AVC/H.264１５４２は、画像データをAVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265１５４３は、画像データをHEVC方式で符号化したり復号したりする機能ブロックである。HEVC/H.265(Scalable)１５４４は、画像データをHEVC方式でスケーラブル符号化したりスケーラブル復号したりする機能ブロックである。HEVC/H.265(Multi-view)１５４５は、画像データをHEVC方式で多視点符号化したり多視点復号したりする機能ブロックである。

MPEG-DASH１５５１は、画像データをMPEG-DASH（MPEG-Dynamic Adaptive Streaming over HTTP）方式で送受信する機能ブロックである。MPEG-DASHは、HTTP（HyperText Transfer Protocol）を使ってビデオのストリーミングを行う技術であり、予め用意された解像度等が互いに異なる複数の符号化データの中から適切なものをセグメント単位で選択し伝送することを特徴の１つとする。MPEG-DASH１５５１は、規格に準拠するストリームの生成やそのストリームの伝送制御等を行い、画像データの符号化・復号については、上述したMPEG-2 Video１５４１乃至HEVC/H.265(Multi-view)１５４５を利用する。

メモリインタフェース１５１７は、外部メモリ１３１２用のインタフェースである。画像処理エンジン１５１４やコーデックエンジン１５１６から供給されるデータは、メモリインタフェース１５１７を介して外部メモリ１３１２に供給される。また、外部メモリ１３１２から読み出されたデータは、メモリインタフェース１５１７を介してビデオプロセッサ１３３２（画像処理エンジン１５１４若しくはコーデックエンジン１５１６）に供給される。

多重化・逆多重化部（MUX DMUX）１５１８は、符号化データのビットストリーム、画像データ、ビデオ信号等、画像に関する各種データの多重化や逆多重化を行う。この多重化・逆多重化の方法は任意である。例えば、多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、複数のデータを１つにまとめるだけでなく、所定のヘッダ情報等をそのデータに付加することもできる。また、逆多重化の際に、多重化・逆多重化部（MUX DMUX）１５１８は、１つのデータを複数に分割するだけでなく、分割した各データに所定のヘッダ情報等を付加することもできる。つまり、多重化・逆多重化部（MUX DMUX）１５１８は、多重化・逆多重化によりデータのフォーマットを変換することができる。例えば、多重化・逆多重化部（MUX DMUX）１５１８は、ビットストリームを多重化することにより、転送用のフォーマットのビットストリームであるトランスポートストリームや、記録用のファイルフォーマットのデータ（ファイルデータ）に変換することができる。もちろん、逆多重化によりその逆変換も可能である。

ネットワークインタフェース１５１９は、例えばブロードバンドモデム１３３３やコネクティビティ１３２１等向けのインタフェースである。ビデオインタフェース１５２０は、例えばコネクティビティ１３２１やカメラ１３２２等向けのインタフェースである。

次に、このようなビデオプロセッサ１３３２の動作の例について説明する。例えば、コネクティビティ１３２１やブロードバンドモデム１３３３等を介して外部ネットワークからトランスポートストリームを受信すると、そのトランスポートストリームは、ネットワークインタフェース１５１９を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、例えば、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてファイルデータに変換され、ビデオインタフェース１５２０を介して例えばコネクティビティ１３２１等に出力され、各種記録媒体に記録される。

さらに、例えば、コネクティビティ１３２１等により図示せぬ記録媒体から読み出された、画像データが符号化された符号化データのファイルデータは、ビデオインタフェース１５２０を介して多重化・逆多重化部（MUX DMUX）１５１８に供給されて逆多重化され、コーデックエンジン１５１６により復号される。コーデックエンジン１５１６の復号により得られた画像データは、画像処理エンジン１５１４により所定の画像処理が施され、ディスプレイエンジン１５１３により所定の変換が行われ、ディスプレイインタフェース１５１２を介して例えばコネクティビティ１３２１等に供給され、その画像がモニタに表示される。また、例えば、コーデックエンジン１５１６の復号により得られた画像データは、コーデックエンジン１５１６により再符号化され、多重化・逆多重化部（MUX DMUX）１５１８により多重化されてトランスポートストリームに変換され、ネットワークインタフェース１５１９を介して例えばコネクティビティ１３２１やブロードバンドモデム１３３３等に供給され図示せぬ他の装置に伝送される。

なお、ビデオプロセッサ１３３２内の各処理部の間での画像データやその他のデータの授受は、例えば、内部メモリ１５１５や外部メモリ１３１２を利用して行われる。また、パワーマネージメントモジュール１３１３は、例えば制御部１５１１への電力供給を制御する。

このように構成されるビデオプロセッサ１３３２に本技術を適用する場合、コーデックエンジン１５１６に、上述した実施の形態に係る本技術を適用すればよい。つまり、例えば、コーデックエンジン１５１６が、上述した符号化装置１１の機能若しくは復号装置１２の機能又はその両方を有するようにすればよい。このようにすることにより、ビデオプロセッサ１３３２は、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

なお、コーデックエンジン１５１６において、本技術（すなわち、符号化装置１１や復号装置１２の機能）は、論理回路等のハードウエアにより実現するようにしてもよいし、組み込みプログラム等のソフトウエアにより実現するようにしてもよいし、それらの両方により実現するようにしてもよい。

以上にビデオプロセッサ１３３２の構成を２例示したが、ビデオプロセッサ１３３２の構成は任意であり、上述した２例以外のものであってもよい。また、このビデオプロセッサ１３３２は、１つの半導体チップとして構成されるようにしてもよいが、複数の半導体チップとして構成されるようにしてもよい。例えば、複数の半導体を積層する３次元積層LSIとしてもよい。また、複数のLSIにより実現されるようにしてもよい。

＜装置への適用例＞
ビデオセット１３００は、画像データを処理する各種装置に組み込むことができる。例えば、ビデオセット１３００は、テレビジョン装置１２００（図８７）、携帯電話機１２２０（図８８）、記録再生装置１２４０（図８９）、撮像装置１２６０（図９０）等に組み込むことができる。ビデオセット１３００を組み込むことにより、その装置は、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

なお、上述したビデオセット１３００の各構成の一部であっても、ビデオプロセッサ１３３２を含むものであれば、本技術を適用した構成として実施することができる。例えば、ビデオプロセッサ１３３２のみを本技術を適用したビデオプロセッサとして実施することができる。また、例えば、上述したように点線１３４１により示されるプロセッサやビデオモジュール１３１１等を、本技術を適用したプロセッサやモジュール等として実施することができる。さらに、例えば、ビデオモジュール１３１１、外部メモリ１３１２、パワーマネージメントモジュール１３１３、及びフロントエンドモジュール１３１４を組み合わせ、本技術を適用したビデオユニット１３６１として実施することもできる。いずれの構成の場合であっても、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

つまり、ビデオプロセッサ１３３２を含むものであればどのような構成であっても、ビデオセット１３００の場合と同様に、画像データを処理する各種装置に組み込むことができる。例えば、ビデオプロセッサ１３３２、点線１３４１により示されるプロセッサ、ビデオモジュール１３１１、又は、ビデオユニット１３６１を、テレビジョン装置１２００（図８７）、携帯電話機１２２０（図８８）、記録再生装置１２４０（図８９）、撮像装置１２６０（図９０）等に組み込むことができる。そして、本技術を適用したいずれかの構成を組み込むことにより、その装置は、ビデオセット１３００の場合と同様に、上述した符号化装置１１や復号装置１２と同様の効果を得ることができる。

＜その他＞
なお、本明細書では、各種情報が、符号化データ（ビットストリーム）に多重化されて、符号化側から復号側へ伝送される例について説明したが、これら情報を伝送する手法はかかる例に限定されない。例えば、これら情報は、符号化データに多重化されることなく、符号化データと関連付けられた別個のデータとして伝送され又は記録されてもよい。ここで、「関連付ける」という用語は、例えば、符号化データに含まれる画像（スライス若しくはブロック等、画像の一部であってもよい）と当該画像に対応する情報とを復号時にリンクさせ得るようにすることを意味する。すなわち、この符号化データ（画像）に関連付けられた情報は、符号化データ（画像）とは別の伝送路上で伝送されるようにしてもよい。また、この符号化データ（画像）に関連付けられた情報は、符号化データ（画像）とは別の記録媒体（又は同一の記録媒体の別の記録エリア）に記録されるようにしてもよい。さらに、画像とその画像に対応する情報とが、例えば、複数フレーム、１フレーム、又はフレーム内の一部分等の任意の単位で互いに関連付けられるようにしてもよい。

また、「合成する」、「多重化する」、「付加する」、「一体化する」、「含める」、「格納する」、「入れ込む」、「差し込む」、「挿入する」等の用語は、例えばフラグ情報と画像に関する情報の符号化データとを１つのデータにまとめるといった、複数の物を１つにまとめることを意味し、上述の「関連付ける」の１つの方法を意味する。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本明細書において、システムとは、複数の構成要素（装置、モジュール（部品）等）の集合を意味し、全ての構成要素が同一筐体中にあるか否かは問わない。したがって、別個の筐体に収納され、ネットワークを介して接続されている複数の装置、及び、１つの筐体の中に複数のモジュールが収納されている１つの装置は、いずれも、システムである。

また、例えば、１つの装置（又は処理部）として説明した構成を分割し、複数の装置（又は処理部）として構成するようにしてもよい。逆に、以上において複数の装置（又は処理部）として説明した構成をまとめて１つの装置（又は処理部）として構成されるようにしてもよい。また、各装置（又は各処理部）の構成に上述した以外の構成を付加するようにしてももちろんよい。さらに、システム全体としての構成や動作が実質的に同じであれば、ある装置（又は処理部）の構成の一部を他の装置（又は他の処理部）の構成に含めるようにしてもよい。

また、例えば、本技術は、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、例えば、上述したプログラムは、任意の装置において実行することができる。その場合、その装置が、必要な機能（機能ブロック等）を有し、必要な情報を得ることができるようにすればよい。

また、例えば、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

なお、コンピュータが実行するプログラムは、プログラムを記述するステップの処理が、本明細書で説明する順序に沿って時系列に実行されるようにしても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで個別に実行されるようにしても良い。つまり、矛盾が生じない限り、各ステップの処理が上述した順序と異なる順序で実行されるようにしてもよい。さらに、このプログラムを記述するステップの処理が、他のプログラムの処理と並列に実行されるようにしても良いし、他のプログラムの処理と組み合わせて実行されるようにしても良い。

なお、本明細書において複数説明した本技術は、矛盾が生じない限り、それぞれ独立に単体で実施することができる。もちろん、任意の複数の本技術を併用して実施することもできる。例えば、いずれかの実施の形態において説明した本技術を、他の実施の形態において説明した本技術と組み合わせて実施することもできる。また、上述した任意の本技術を、上述していない他の技術と併用して実施することもできる。

また、本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

なお、本技術は、以下の構成をとることができる。

＜１＞
予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するフィルタ処理部を備え、
前記フィルタ処理部は、
前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択する予測タップ選択部と、
前記処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類するクラス分類部と、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部と
を有する
画像処理装置。
＜２＞
前記タップ係数を伝送する伝送部をさらに備える
＜１＞に記載の画像処理装置。
＜３＞
前記学習を行う学習部をさらに備える
＜２＞に記載の画像処理装置。
＜４＞
前記クラス分類部は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いて、クラス分類を行う
＜２＞に記載の画像処理装置。
＜５＞
前記伝送部は、前記符号化情報を伝送する
＜４＞に記載の画像処理装置。
＜６＞
前記クラス分類部は、
前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いて、前記処理対象画素を第１クラスにクラス分類し、
復号側で取得することができない所定の情報を用いて、前記処理対象画素を第２クラスにクラス分類し、
前記第１クラス及び前記第２クラスから、前記処理対象画素の最終的なクラスを生成し、
前記伝送部は、前記第２クラスを伝送する
＜２＞ないし＜５＞のいずれかに記載の画像処理装置。
＜７＞
前記クラス分類部は、前記処理対象画素の最終的なクラスを、前記処理対象画素の最終的なクラスのクラス数を縮退した縮退クラスに変換する変換テーブルに従って、前記最終的なクラスを縮退クラスに変換し、
前記タップ係数取得部は、前記処理対象画素の前記縮退クラスのタップ係数を取得し、
前記伝送部は、前記変換テーブルを伝送する
＜６＞に記載の画像処理装置。
＜８＞
前記クラス分類部は、
前記クラス分類に用いられるクラスタップとなる、前記第１の画像の画素の画素値と、所定のクラス分類係数とを用いた予測演算により、前記処理対象画素が属するサブクラスに関する情報を予測したサブクラス予測値を求め、
前記サブクラス予測値に応じて、前記処理対象画素をサブクラスに分類する
ことを繰り返すことで、前記処理対象画素をクラス分類し、
前記伝送部は、前記クラス分類係数を伝送する
＜２＞に記載の画像処理装置。
＜９＞
前記生徒画像を用いて、前記タップ係数を求めるタップ係数学習を行い、
前記タップ係数と、前記生徒画像から選択された前記予測タップとを用いた予測演算により、前記教師画像の画素の画素予測値を求め、
前記画素予測値と、前記教師画像の画素の画素値とを比較することにより、前記サブクラスに関する情報を生成し、
前記生徒画像を用いた、前記サブクラスに関する情報を求める予測演算の結果と、前記サブクラスに関する情報との統計的な誤差を最小にする前記クラス分類係数を求めるクラス分類係数学習を行い、
前記クラス分類係数学習により得られる前記クラス分類係数と、前記生徒画像とを用いた予測演算により、前記生徒画像の画素の前記サブクラス予測値を求め、
前記サブクラス予測値に応じて、前記生徒画像の画素を前記サブクラスに分類し、
前記サブクラスごとに、そのサブクラスの前記生徒画像の画素を用いて、前記タップ係数学習を行う
ことを１階層の学習として行う学習部をさらに備える
＜８＞に記載の画像処理装置。
＜１０＞
前記学習部は、前記画素予測値のS/N(Signal to Noise ratio)に応じて、前記１階層の学習を繰り返す
＜９＞に記載の画像処理装置。
＜１１＞
前記伝送部は、最後の前記１階層の学習で得られる前記タップ係数と、すべての前記１階層の学習で得られる前記クラス分類係数とを伝送する
＜１０＞に記載の画像処理装置。
＜１２＞
前記学習部は、伝送が可能な伝送可能伝送量に応じて、所定回数目の前記１階層の学習で得られる前記タップ係数と、前記所定回数目までの前記１階層の学習で得られる前記クラス分類係数とを、伝送対象の伝送対象係数に設定し、
前記伝送部は、前記伝送対象係数を伝送する
＜１０＞に記載の画像処理装置。
＜１３＞
前記タップ係数を受け取る受け取り部をさらに備える
＜１＞に記載の画像処理装置。
＜１４＞
前記クラス分類部は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いて、クラス分類を行う
＜１３＞に記載の画像処理装置。
＜１５＞
前記受け取り部は、前記符号化情報を受け取る
＜１４＞に記載の画像処理装置。
＜１６＞
前記受け取り部は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いたクラス分類により得られる第１クラスと、復号側で取得することができない所定の情報を用いた前記クラス分類により得られる第２クラスとのうちの、前記第２クラスを受け取り、
前記クラス分類部は、
前記処理対象画素を前記第１クラスにクラス分類し、
前記第１クラス、及び、前記受け取り部により受け取られた前記第２クラスから、前記処理対象画素の最終的なクラスを生成する
＜１３＞ないし＜１５＞のいずれかに記載の画像処理装置。
＜１７＞
前記受け取り部は、前記処理対象画素の最終的なクラスを、前記処理対象画素の最終的なクラスのクラス数を縮退した縮退クラスに変換する変換テーブルを受け取り、
前記クラス分類部は、前記処理対象画素の最終的なクラスを、前記変換テーブルに従って、前記縮退クラスに変換する
＜１６＞に記載の画像処理装置。
＜１８＞
前記伝送部は、
前記生徒画像を用いて、前記タップ係数を求めるタップ係数学習を行い、
前記タップ係数と、前記生徒画像から選択された前記予測タップとを用いた予測演算により、前記教師画像の画素の画素予測値を求め、
前記画素予測値と、前記教師画像の画素の画素値とを比較することにより、前記生徒画像の画素が属するサブクラスに関する情報を生成し、
前記生徒画像と学習により求められるクラス分類係数とを用いた、前記サブクラスに関する情報を求める予測演算の結果と、前記サブクラスに関する情報との統計的な誤差を最小にする前記クラス分類係数を求めるクラス分類係数学習を行い、
前記クラス分類係数学習により得られる前記クラス分類係数と、前記生徒画像とを用いた予測演算により、前記生徒画像の画素の前記サブクラスに関する情報を予測したサブクラス予測値を求め、
前記サブクラス予測値に応じて、前記生徒画像の画素を前記サブクラスに分類し、
前記サブクラスごとに、そのサブクラスの前記生徒画像の画素を用いて、前記タップ係数学習を行う
１階層の学習を繰り返す
ことにより得られる前記タップ係数及び前記クラス分類係数を受け取り、
前記クラス分類部は、
前記クラス分類に用いられるクラスタップとなる、前記第１の画像の画素の画素値と、前記クラス分類係数とを用いた予測演算により、前記処理対象画素が属するサブクラスに関する情報を予測したサブクラス予測値を求め、
前記サブクラス予測値に応じて、前記処理対象画素をサブクラスに分類する
ことを繰り返すことで、前記処理対象画素をクラス分類する
＜１３＞に記載の画像処理装置。
＜１９＞
前記フィルタ処理部は、ILF(In Loop Filter)を構成するDF(Deblocking Filter)，SAO(Sample Adaptive Offset)、及び、ALF(Adaptive Loop Filter)のうちの１以上として機能する
＜１＞ないし＜１８＞のいずれかに記載の画像処理装置。
＜２０＞
予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するステップを含み、
前記フィルタ処理は、
前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することと、
前記処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類することと、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得することと、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求めることと
を含む
画像処理方法。

１１符号化装置，１２復号装置，２１，２２タップ選択部，２３クラス分類部，２４係数取得部，２５予測演算部，３０学習装置，３１教師データ生成部，３２生徒データ生成部，３３学習部，４１，４２タップ選択部，４３クラス分類部，４４足し込み部，４５係数算出部，６１パラメータ生成部，６２生徒データ生成部，６３学習部，７１足し込み部，７２係数算出部，８１，８２足し込み部，８３係数算出部，１０１ A/D変換部，１０２並べ替えバッファ，１０３演算部，１０４直交変換部，１０５量子化部，１０６可逆符号化部，１０７蓄積バッファ，１０８逆量子化部，１０９逆直交変換部，１１０演算部，１１１クラス分類適応フィルタ，１１２フレームメモリ，１１３選択部，１１４イントラ予測部，１１５動き予測補償部，１１６予測画像選択部，１１７レート制御部，１３１画像変換装置，１３２学習装置，２０１蓄積バッファ，２０２可逆復号部，２０３逆量子化部，２０４逆直交変換部，２０５演算部，２０６クラス分類適応フィルタ，２０７並べ替えバッファ，２０８ D/A変換部，２１０フレームメモリ，２１１選択部，２１２イントラ予測部，２１３動き予測補償部，２１４選択部，２３１画像変換装置，２４１，２４２タップ選択部，２４３クラス分類部，２４４係数取得部，２４５予測演算部，２６１クラス分類適応フィルタ，２６２適応オフセット部，２６３適応ループフィルタ，２７１クラス分類適応フィルタ，２７２適応オフセット部，２７３適応ループフィルタ，２８１デブロックフィルタ，２８２クラス分類適応フィルタ，２９１デブロックフィルタ，２９２，３１１，３２１，４１１クラス分類適応フィルタ，４３１画像変換装置，４３２学習装置，４４１クラス分類部，４５１第１クラス分類部，４５２第２クラス分類部，４５３クラスコード生成部，４６１クラス分類部，４７１クラス分類適応フィルタ，４８１画像変換装置，４９１クラス分類部，５０１第１クラス分類部，５０２クラスコード生成部，５１１クラス分類適応フィルタ，５３１画像変換装置，５３２学習装置，５４１クラス分類部，５５１クラス縮退部，５６２変換テーブル生成部，５７１クラス分類適応フィルタ，５８１画像変換装置，５９１クラス分類部，６０１クラス縮退部，７０１タップ係数学習部，７０２タップ係数設定部，７０３サブクラス教師データ生成部，７０４クラス分類係数学習部，７０５クラス分類係数設定部，７０６サブクラス予測部，７０７サブクラス分類部，７０８サブクラス決定部，７０９画素予測部，７１０終了条件判定部，７２１クラス分類部，７２２係数取得部，７３１クラス分類係数設定部，７３２サブクラス予測部，７３３サブクラス分類部，７３４クラス決定部，８１１クラス分類適応フィルタ，８３１画像変換装置，８３２学習装置，８４１クラス分類部，８４２係数取得部，８６１クラス分類適応フィルタ，８７１画像変換装置，８８１クラス分類部，８８２係数取得部，９１１伝送帯域検出部，９１２伝送量算出部，９１３伝送対象係数設定部

Claims

予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するフィルタ処理部を備え、
前記フィルタ処理部は、
前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択する予測タップ選択部と、
前記処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類するクラス分類部と、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得するタップ係数取得部と、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求める演算部と
を有する
画像処理装置。
前記タップ係数を伝送する伝送部をさらに備える
請求項１に記載の画像処理装置。
前記学習を行う学習部をさらに備える
請求項２に記載の画像処理装置。
前記クラス分類部は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いて、クラス分類を行う
請求項２に記載の画像処理装置。
前記伝送部は、前記符号化情報を伝送する
請求項４に記載の画像処理装置。
前記クラス分類部は、
前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いて、前記処理対象画素を第１クラスにクラス分類し、
復号側で取得することができない所定の情報を用いて、前記処理対象画素を第２クラスにクラス分類し、
前記第１クラス及び前記第２クラスから、前記処理対象画素の最終的なクラスを生成し、
前記伝送部は、前記第２クラスを伝送する
請求項２に記載の画像処理装置。
前記クラス分類部は、前記処理対象画素の最終的なクラスを、前記処理対象画素の最終的なクラスのクラス数を縮退した縮退クラスに変換する変換テーブルに従って、前記最終的なクラスを縮退クラスに変換し、
前記タップ係数取得部は、前記処理対象画素の前記縮退クラスのタップ係数を取得し、
前記伝送部は、前記変換テーブルを伝送する
請求項６に記載の画像処理装置。
前記クラス分類部は、
前記クラス分類に用いられるクラスタップとなる、前記第１の画像の画素の画素値と、所定のクラス分類係数とを用いた予測演算により、前記処理対象画素が属するサブクラスに関する情報を予測したサブクラス予測値を求め、
前記サブクラス予測値に応じて、前記処理対象画素をサブクラスに分類する
ことを繰り返すことで、前記処理対象画素をクラス分類し、
前記伝送部は、前記クラス分類係数を伝送する
請求項２に記載の画像処理装置。
前記生徒画像を用いて、前記タップ係数を求めるタップ係数学習を行い、
前記タップ係数と、前記生徒画像から選択された前記予測タップとを用いた予測演算により、前記教師画像の画素の画素予測値を求め、
前記画素予測値と、前記教師画像の画素の画素値とを比較することにより、前記サブクラスに関する情報を生成し、
前記生徒画像を用いた、前記サブクラスに関する情報を求める予測演算の結果と、前記サブクラスに関する情報との統計的な誤差を最小にする前記クラス分類係数を求めるクラス分類係数学習を行い、
前記クラス分類係数学習により得られる前記クラス分類係数と、前記生徒画像とを用いた予測演算により、前記生徒画像の画素の前記サブクラス予測値を求め、
前記サブクラス予測値に応じて、前記生徒画像の画素を前記サブクラスに分類し、
前記サブクラスごとに、そのサブクラスの前記生徒画像の画素を用いて、前記タップ係数学習を行う
ことを１階層の学習として行う学習部をさらに備える
請求項８に記載の画像処理装置。
前記学習部は、前記画素予測値のS/N(Signal to Noise ratio)に応じて、前記１階層の学習を繰り返す
請求項９に記載の画像処理装置。
前記伝送部は、最後の前記１階層の学習で得られる前記タップ係数と、すべての前記１階層の学習で得られる前記クラス分類係数とを伝送する
請求項１０に記載の画像処理装置。
前記学習部は、伝送が可能な伝送可能伝送量に応じて、所定回数目の前記１階層の学習で得られる前記タップ係数と、前記所定回数目までの前記１階層の学習で得られる前記クラス分類係数とを、伝送対象の伝送対象係数に設定し、
前記伝送部は、前記伝送対象係数を伝送する
請求項１０に記載の画像処理装置。
前記タップ係数を受け取る受け取り部をさらに備える
請求項１に記載の画像処理装置。
前記クラス分類部は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いて、クラス分類を行う
請求項１３に記載の画像処理装置。
前記受け取り部は、前記符号化情報を受け取る
請求項１４に記載の画像処理装置。
前記受け取り部は、前記第１の画像から得られる画像特徴量、及び、前記処理対象画素の予測符号化に関する符号化情報のうちの一方、又は、両方を用いたクラス分類により得られる第１クラスと、復号側で取得することができない所定の情報を用いた前記クラス分類により得られる第２クラスとのうちの、前記第２クラスを受け取り、
前記クラス分類部は、
前記処理対象画素を前記第１クラスにクラス分類し、
前記第１クラス、及び、前記受け取り部により受け取られた前記第２クラスから、前記処理対象画素の最終的なクラスを生成する
請求項１３に記載の画像処理装置。
前記受け取り部は、前記処理対象画素の最終的なクラスを、前記処理対象画素の最終的なクラスのクラス数を縮退した縮退クラスに変換する変換テーブルを受け取り、
前記クラス分類部は、前記処理対象画素の最終的なクラスを、前記変換テーブルに従って、前記縮退クラスに変換する
請求項１６に記載の画像処理装置。
前記伝送部は、
前記生徒画像を用いて、前記タップ係数を求めるタップ係数学習を行い、
前記タップ係数と、前記生徒画像から選択された前記予測タップとを用いた予測演算により、前記教師画像の画素の画素予測値を求め、
前記画素予測値と、前記教師画像の画素の画素値とを比較することにより、前記生徒画像の画素が属するサブクラスに関する情報を生成し、
前記生徒画像と学習により求められるクラス分類係数とを用いた、前記サブクラスに関する情報を求める予測演算の結果と、前記サブクラスに関する情報との統計的な誤差を最小にする前記クラス分類係数を求めるクラス分類係数学習を行い、
前記クラス分類係数学習により得られる前記クラス分類係数と、前記生徒画像とを用いた予測演算により、前記生徒画像の画素の前記サブクラスに関する情報を予測したサブクラス予測値を求め、
前記サブクラス予測値に応じて、前記生徒画像の画素を前記サブクラスに分類し、
前記サブクラスごとに、そのサブクラスの前記生徒画像の画素を用いて、前記タップ係数学習を行う
１階層の学習を繰り返す
ことにより得られる前記タップ係数及び前記クラス分類係数を受け取り、
前記クラス分類部は、
前記クラス分類に用いられるクラスタップとなる、前記第１の画像の画素の画素値と、前記クラス分類係数とを用いた予測演算により、前記処理対象画素が属するサブクラスに関する情報を予測したサブクラス予測値を求め、
前記サブクラス予測値に応じて、前記処理対象画素をサブクラスに分類する
ことを繰り返すことで、前記処理対象画素をクラス分類する
請求項１３に記載の画像処理装置。
前記フィルタ処理部は、ILF(In Loop Filter)を構成するDF(Deblocking Filter)，SAO(Sample Adaptive Offset)、及び、ALF(Adaptive Loop Filter)のうちの１以上として機能する
請求項１に記載の画像処理装置。
予測符号化の残差と予測画像とを加算することにより得られる第１の画像にフィルタ処理を行い、前記予測画像の予測に用いられる第２の画像を生成するステップを含み、
前記フィルタ処理は、
前記第１の画像のうちの処理対象である処理対象画素に対応する前記第２の画像の対応画素の画素値を求める予測演算に用いられる予測タップとなる画素を、前記第１の画像から選択することと、
前記処理対象画素を、複数のクラスのうちのいずれかのクラスにクラス分類することと、
前記第１の画像に相当する生徒画像と、前記第１の画像に対応する元画像に相当する教師画像とを用いた学習により求められた、前記複数のクラスごとの、前記予測演算に用いられるタップ係数のうちの、前記処理対象画素のクラスのタップ係数を取得することと、
前記処理対象画素のクラスのタップ係数と、前記処理対象画素の前記予測タップとを用いた前記予測演算を行うことにより、前記対応画素の画素値を求めることと
を含む
画像処理方法。