JP6917718B2 - 予測装置、符号化装置、復号装置、及びプログラム - Google Patents

予測装置、符号化装置、復号装置、及びプログラム Download PDF

Info

Publication number
JP6917718B2
JP6917718B2 JP2017012983A JP2017012983A JP6917718B2 JP 6917718 B2 JP6917718 B2 JP 6917718B2 JP 2017012983 A JP2017012983 A JP 2017012983A JP 2017012983 A JP2017012983 A JP 2017012983A JP 6917718 B2 JP6917718 B2 JP 6917718B2
Authority
JP
Japan
Prior art keywords
prediction
unit
block
image
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017012983A
Other languages
English (en)
Other versions
JP2018121282A (ja
Inventor
和博 千田
和博 千田
井口 和久
和久 井口
市ヶ谷 敦郎
敦郎 市ヶ谷
菊文 神田
菊文 神田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2017012983A priority Critical patent/JP6917718B2/ja
Publication of JP2018121282A publication Critical patent/JP2018121282A/ja
Application granted granted Critical
Publication of JP6917718B2 publication Critical patent/JP6917718B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、予測装置、符号化装置、復号装置、及びプログラムに関し、特に、画像の符号化、復号における画面内予測手法に関する。
動画像の予測符号化方式であるMPEG−2やH.264/AVC、H.265/HEVCでは、動画像の各フレームを正方(矩形)ブロックに分割し、それぞれのブロックを基本処理単位として予測画像を生成する。そして、原画像と予測画像との差分を符号化する。
予測画像の生成には、イントラ(画面内)予測とインター(画面間)予測との2種類の生成手法がある。イントラ予測では、予測対象ブロックの周辺画素を参照画素として外挿予測する。インター予測では、予測対象フレームの前後フレームから内挿予測もしくは外挿予測する。
また、H.265/HEVCでは、DC(Direct Current)予測、Planar予測、方向性予測の3種類のイントラ予測手法がある(例えば、非特許文献1)。このうち、DC予測は、参照画素の平均値を算出し、その平均値を予測値として、予測対象ブロックの予測画像を生成する手法である。例えば、図11に示す予測対象ブロック(P(1,1)〜P(N,N))の場合、DC予測の予測画像は全ての画素値が予測値PDCであるN×N画素の画像となる。ここで、予測値PDCは、参照画素(R(0,0)〜R(0,N),R(1,0)〜R(N,0))の平均値であり、以下の式(1)から計算する。
Figure 0006917718
予測対象ブロックの大きさは、新たな予測符号化方式が標準化されるたびに拡張されてきた。例えば、予測対象ブロックの大きさは、MPEG−2では最大16×16画素であり、H.265/HEVCでは最大64×64画素である。
Recommendation ITU−T H.265,(04/2015),"High efficiency video coding",International Telecommunication Union
ところで、従来のDC予測では、予測対象ブロック内の各画素の予測値を、一様に、参照画素の平均値とする。しかしながら、予測対象ブロック内の各画素の画素値が、参照画素の平均値に近い値であるとは限らない。また、予測対象ブロックが大きい場合には、予測対象ブロック内の各画素の画素値が一様になりにくく、一部の画素の画素値が予測値から大きく外れてしまう場合がある。従って、DC予測の符号化効率を向上させられない場合があった。
本発明のいくつかの態様は、DC予測の符号化効率を向上させることができる予測装置、符号化装置、復号装置、及びプログラムを提供することを目的の一つとする。
また、本発明の他の態様は、後述する実施形態に記載した作用効果を奏することを可能にする予測装置、符号化装置、復号装置、及びプログラムを提供することを目的の一つとする。
上述した課題を解決するために、本発明の一態様は、1つの画像ブロックに対して、参照画素の集合を複数特定する特定部と、前記特定部が特定した複数の前記参照画素の集合の各々から、DC予測により、予測ブロック候補を生成する生成部と、前記画像ブロックに対する予測ブロックを、前記生成部が生成した複数の前記予測ブロック候補の中から選択する選択部と、を備える予測装置である。
また、本発明の一態様は、上記の予測装置であって、前記特定部は、複数の参照画素のうち、隣接する参照画素により構成される集合を特定する。
また、本発明の一態様は、上記の予測装置であって、前記特定部は、所定数の集合を特定する。
また、本発明の一態様は、上記の予測装置であって、前記特定部は、クラスタリングにより前記参照画素の集合を特定する。
また、本発明の一態様は、上記の予測装置であって、前記選択部は、前記画像ブロックを複数に分割した分割ブロックの各々に対する予測ブロックを、前記予測ブロック候補の中から選択する。
また、本発明の一態様は、上記の予測装置により選択された予測ブロックを示すフラグ情報を符号化する符号化部を備える符号化装置である。
また、本発明の一態様は、上記の符号化装置が符号化したフラグ情報に基づいて、前記画像ブロックを復号する号部を備える復号装置である。
また、本発明の一態様は、コンピュータを、上記の予測装置として動作させるためのプログラムである。
本発明の一態様によれば、DC予測の符号化効率を向上させることができる。
本発明の第1の実施形態に係るDC予測の概要を示す図である。 同実施形態に係る画像符号化復号システムの構成を示すブロック図である。 同実施形態に係る符号化装置の構成を示すブロック図である。 同実施形態に係るイントラ予測部の構成を示すブロック図である。 同実施形態に係る復号装置の構成を示すブロック図である。 同実施形態に係るイントラ予測部の動作を示すフローチャートである。 本発明の第2の実施形態に係るDC予測の概要を示す図である。 同実施形態に係るイントラ予測部の構成を示すブロック図である。 同実施形態に係るイントラ予測部の動作を示すフローチャートである。 同実施形態に係る画像符号化復号システムによる処理結果の一例を示す図である。 従来技術に係るDC予測の概要を示す図である。
以下、本発明の一実施形態について、図面を参照して説明する。
[第1の実施形態]
本発明の第1の実施形態について説明する。まず、本実施形態に係る画像符号化復号システム1の概要について説明する。画像符号化復号システム1は、DC予測等のイントラ予測、インター予測を行って、画像の符号化や復号を行う情報処理システムである。画像符号化復号システム1は、静止画像を処理対象としてもよいし、動画像(映像)を処理対象としてもよい。以下では、画像を水平方向と垂直方向とを有する2次元直交座標系により表現する。具体的には、画像の2次元直交座標系における座標を(x,y)のように2成分で表し、第1成分(x成分)を水平座標、第2成分(y成分)を垂直座標と定義する。また、座標(x,y)における画素値をD(x,y)という形式で表記する。
ここで、本実施形態に係るDC予測の概要について説明する。
図1は、本実施形態に係るDC予測の概要を示す図である。
図1に示す例において、DC予測を行う対象の画像ブロック(以下、予測対象ブロックと称する。)Pは、(N−1)×(N−1)画素の大きさを有する(Nは正の整数)。なお、予測対象ブロックPの形状は、正方形、長方形等の矩形である。予測対象ブロックPの左側と上側には、予測対象ブロックPに対して、DC予測を行う際に参照される画素(以下、参照画素と称する。)Rが存在している。図1に示す例では、参照画素R(0,0)が、仮想的な原点に位置する画素である。非特許文献1に従来技術に係るDC予測では、予測対象ブロックPに隣接する座標(0,0)〜(0,N)、及び、座標(1,0)〜(N,0)の画素値R(0,0)〜R(0,N)、及び、R(1,0)〜R(N,0)を参照し、1つの予測値を生成していた。
これに対して、本実施形態に係るDC予測では、複数の参照画素Rを、複数のグループに分類する。各グループには、1以上の画素が含まれる。図1に示す例では、複数の参照画素Rを、第1〜第4グループDCA1、DCA2、DCL1、DCL2に4分割している。具体的には、第1グループDCA1は、座標(1,0)〜(K,0)の画素を含む。第2グループDCA2は、座標(K+1,0)〜(N,0)の画素を含む。第3グループDCL1は、座標(0,1)〜(0,L)の画素を含む。第4グループDCL2は、座標(0,L+1)〜(0,N)の画素を含む。このように、画像符号化復号システム1では、参照画素Rのグループを特定する。
次に、画像符号化復号システム1は、各グループに含まれる参照画素Rを参照して、DC予測を行う。つまり、グループごとにDC予測の予測値が得られる。このグループごとの予測値は、符号化する予測値の候補であり、以下では、予測候補値と称する。画像符号化復号システム1は、複数の予測候補値の中から、いずれか1つを予測値として選択する。そして、画像符号化復号システム1は、選択結果(以下、選択予測値と称する。)を示すフラグ情報を符号化、復号する。
このように、画像符号化復号システム1は、1つの予測対象ブロックPに対して、DC予測による複数の予測候補値を取得する。そして、符号化、復号には、複数の予測候補値のうち、1つの選択予測値を用いる。つまり、画像符号化復号システム1は、予測対象ブロックPに近い候補を、選択予測値とすることができる。従って、画像符号化復号システム1は、1つの予測対象ブロックPに対してDC予測による予測値を1つしか取得しない場合に比して、符号化精度を向上させることができる。
以上が、画像符号化復号システム1の概要についての説明である。
次に、画像符号化復号システム1の構成について説明する。
図2は、画像符号化復号システム1の構成を示すブロック図である。
画像符号化復号システム1は、符号化装置10と、復号装置30と、伝送蓄積部50と、を備える。符号化装置10と、復号装置30とは、例えば、コンピュータシステムを備える電子機器である。
符号化装置10は、画像を符号化し、伝送蓄積部50に出力する。つまり、符号化装置10は、符号を出力する。
復号装置30は、符号化装置10が出力した符号を取得する。復号装置30は、符号を復号し、画像を出力する。
伝送蓄積部50は、符号を伝送又は蓄積する。伝送蓄積部50は、必要に応じて送信端において伝送路符号化や信号の変調を行う。そして、伝送蓄積部50は、無線や有線、又はこれらの組み合わせによる伝送路を通じて信号伝送を行う。伝送蓄積部50の受信端では、必要に応じて復調や伝送路復号を行い、符号を出力する。伝送蓄積部50は、暗号化を施したり、電子署名を付加したり、他の信号との多重化や逆多重化を行ったりしてもよい。また、伝送蓄積部50は、伝送路の途中経路において分配、交換、再変調、遅延、増幅等を行ってもよい。
また、伝送蓄積部50は、符号を蓄積する場合、取得した符号を記憶媒体に保存する。伝送蓄積部50は、符号の保存と同時に符号を出力してもよいし、一旦保存された符号を読み出して出力してもよい。伝送蓄積部50は、取得した符号を記憶媒体に保存する際に、誤り訂正符号等による符号化や暗号化、電子署名付加等を行ってもよい。この記憶媒体は、固体メモリであってもよいし、磁気や光による記録媒体であってもよい。
また、伝送蓄積部50は、伝送と蓄積を複合した形態であってもよい。この場合、伝送蓄積部50は、例えば、いわゆるクラウドのように、遠隔にある記憶媒体に符号を伝送し、当該遠隔にある記憶媒体にその符号を保存する。そして、伝送蓄積部50は、符号の保存と同時に符号を復号装置30に伝送したり、一旦保存された符号を読み出して復号装置30に出力したりする。
なお、ここでは、伝送蓄積部50は、伝送、蓄積の過程において、信号の誤りや信号劣化を生じないものとする。つまり、伝送蓄積部50は、符号化装置10から取得した符号を、そのまま復号装置30に出力する。
以上が、画像符号化復号システム1の構成についての説明である。
次に、符号化装置10の構成について説明する。
図3は、符号化装置10の構成を示すブロック図である。
符号化装置10は、画面分割部101と、減算部102と、変換部103と、量子化部104と、エントロピー符号化部105と、逆量子化部106と、逆変換部107と、加算部108と、ループフィルタ109と、イントラ予測部200と、動き補償予測部110と、切替部111と、を備える。これらの構成は、例えば、符号化装置10が備えるCPU(Central Processing Unit、不図示)が、符号化装置10が備える記憶部(不図示)に予め記憶されたプログラムを実行することにより実現される。ただし、これらの構成は、ASIC(Application Specific Integrated Circuit)等のハードウェアとして実現されてもよい。
画面分割部101は、符号化対象の画像信号を取得し、この画像信号を符号化処理の処理単位のブロックに分割する。画面分割部101は分割したブロックの信号を減算部102へ出力する。
減算部102は、画面分割部101から取得した信号から、切替部111から取得した信号を減算する。減算部102は、減算結果の信号を変換部103へ出力する。
変換部103は、減算部102から取得した信号に対して直交変換を行い、直交変換の結果の信号を量子化部104へ出力する。変換部103が行う直交変換は、DCT(Discrete Cosine Transform)若しくはDST(Discrete Sine Transform)のいずれか一方であってもよく、又は、DCTとDSTの両方であってもよい。変換部103がDCTとDSTの両方を行う場合には、変換部103は、DCTの結果又はDSTの結果のいずれか一方を選択して量子化部104へ出力する。変換部103がDCTの結果又はDSTの結果のいずれか一方を選択する場合、変換部103は、例えば符号化効率のよい方を選択する。DCTの結果として出力される信号はDCT係数である。DSTの結果として出力される信号はDST係数である。
量子化部104は、変換部103から取得した信号に対して量子化を行い、量子化した信号をエントロピー符号化部105及び逆量子化部106へ出力する。
エントロピー符号化部105は、量子化部104から取得した信号に対してエントロピー符号化を行い、符号化信号を出力する。また、エントロピー符号化部105は、イントラ予測部200から選択予測値を示すフラグ情報を取得する。そして、フラグ情報に対してエントロピー符号化を行い、符号化信号を出力する。
逆量子化部106は、量子化部104から取得した信号に対して逆量子化を行い、逆量子化した信号を逆変換部107へ出力する。
逆変換部107は、逆量子化部106から取得した信号に対して逆直交変換を行い、逆直交変換の結果の信号を加算部108へ出力する。逆変換部107が行う逆直交変換は、変換部103が行った直交変換の逆変換である。
加算部108は、逆変換部107から取得した信号と切替部111から取得した信号とを加算し、加算結果の信号をループフィルタ109へ出力する。
ループフィルタ109は、加算部108から取得した信号に対して平滑化等のフィルタリングを行い、フィルタリング結果の信号をイントラ予測部200及び動き補償予測部110へ出力する。
イントラ予測部200は、ループフィルタ109から取得した信号を参照してイントラ予測を行い、予測画像の信号を切替部111へ出力する。ここで、イントラ予測部200の構成について説明する。
図4は、イントラ予測部200の構成を示すブロック図である。
イントラ予測部200は、Planar予測部201と、方向性予測部202と、DC予測部203と、を備える。
Planar予測部201は、Planar予測を行う。
方向性予測部202は、方向性予測を行う。
DC予測部203は、DC予測を行う。DC予測部203は、特定部204と、生成部205と、選択部206と、を備える。
特定部204は、各予測対象ブロックPについて、参照画素のグループを複数特定する。つまり、特定部204は、各グループを構成する参照画素を特定する。各グループを構成する参照画素の特定方法は、予め定められており、符号化装置10であっても、復号装置30であっても、同じ予測対象ブロックに対しては、同様の参照画素のグループが特定される。グループの識別情報の割当て方法についても同様である。例えば、特定部204は、各グループから水平方向、垂直方向の座標値が最小の画素を代表値として特定し、代表値同士を比較する。そして、水平方向の座標値が小さい画素を含むグループに対して小さい識別番号を割当てる。また、水平方向の座標値が同じ場合には、垂直方向の座標値が小さい画素を含むグループに対して小さい識別番号を割当てる。各グループを構成する参照画素の特定方法、グループの識別情報の割当て方法は、任意の手法であってよい。
特定部204は、各グループを構成する参照画素に係るグループ情報を、生成部205に出力する。グループ情報には、例えば、グループの識別情報と、各グループを構成する参照画素の範囲を示す情報とが含まれる。
生成部205は、特定部204が特定した各グループの参照画素を参照し、DC予測を行う。具体的には、各グループを構成する参照画素の画素値の平均値を算出する。そして、生成部205は、各グループの参照画素から取得した予測候補値の情報を、選択部206に出力する。
選択部206は、生成部205からグループごとの予測候補値の情報を取得する。選択部206は、複数の予測候補値から選択予測値を1つ選択する。選択部206は、例えば予測対象ブロックの画像信号と、予測候補値による予測画像の画像信号との差分を算出し、差分が最小となる予測候補値を選択予測値とする。予測候補値により構成される予測画像の画像信号とは、予測対象ブロックと同じ大きさを有し、各画素の画素値が予測候補値である信号である。選択部206は、選択予測値により構成される予測画像の信号を減算部102と、加算部108とに出力する。選択予測値により構成される予測画像の信号とは、予測対象ブロックと同じ大きさを有し、各画素の画素値が選択予測値である信号である。また、選択部206は、選択予測値を示すフラグ情報をエントロピー符号化部105に出力する。フラグ情報とは、例えば参照画素のグループの識別情報である。
動き補償予測部110は、ループフィルタ109から取得した信号にを参照して動き補償予測を行い、予測画像の信号を切替部111へ出力する。
切替部111は、イントラ予測部200から取得した信号又は動き補償予測部110から取得した信号のいずれを出力するかを切り替える。切替部111から出力された信号は、減算部102及び加算部108へ入力される。
以上が、符号化装置10の構成についての説明である。
次に、復号装置30の構成について説明する。
図5は、復号装置30の構成を示すブロック図である。
復号装置30は、符号化装置10の符号化に対応する復号を行う。復号装置30は、エントロピー復号部301と、逆量子化部302と、逆変換部303と、加算部304と、画面結合部305と、ループフィルタ306と、イントラ予測部200と、動き予測部307と、切替部308を備える。これらの構成は、例えば、復号装置30が備えるCPU(不図示)が、復号装置30が備える記憶部(不図示)に予め記憶されたプログラムを実行することにより実現される。ただし、これらの構成は、ASIC等のハードウェアとして実現されてもよい。
エントロピー復号部301は、復号対象である符号化信号を取得し、取得した符号化信号に対してエントロピー復号を行う。エントロピー復号部301は、エントロピー復号結果の信号を逆量子化部302へ出力する。
逆量子化部302は、エントロピー復号部301から取得した信号に対して逆量子化を行い、逆量子化した信号を逆変換部303へ出力する。逆量子化部302は、符号化装置10の逆量子化部106と同様の構成である。
逆変換部303は、逆量子化部302から取得した信号に対して逆直交変換を行い、逆直交変換の結果の信号を加算部304へ出力する。逆変換部303は、符号化装置10の逆変換部107と同様の構成である。
加算部304は、逆変換部303から取得した信号と切替部308から取得した信号を加算し、加算結果の信号を画面結合部305及びループフィルタ306へ出力する。
画面結合部305は、加算部304から取得した信号から構成される復号処理の処理単位のブロックを結合して映像信号を生成する。画面結合部305は、生成した映像信号を復号信号として出力する。
ループフィルタ306は、加算部304から取得した信号に対して平滑化等のフィルタリングを行い、フィルタリング結果の信号をイントラ予測部200及び動き予測部307へ出力する。ループフィルタ306は、符号化装置10のループフィルタ109と同様の構成である。
イントラ予測部200は、ループフィルタ306から取得した信号を参照してイントラ予測を行い、予測画像の信号を切替部308へ出力する。復号装置30のイントラ予測部200は、符号化装置10のイントラ予測部200と同様の構成である。ただし、復号装置30のイントラ予測部200は、エントロピー復号部301により復号されたフラグ情報を参照して、選択予測値を特定する。
動き予測部307は、ループフィルタ306から取得した信号を参照して動き予測を行い、予測画像の信号を切替部308へ出力する。動き予測部307は、動き補償予測部110と同様の構成である。
切替部308は、イントラ予測部200から取得した信号又は動き予測部307から取得した信号のいずれを出力するかを切り替える。切替部308の切り替え制御は、加算部304の加算結果に基づいて行われる。切替部308から出力された信号は、加算部304へ入力される。切替部308は、切替部111と同様の構成である。
以上が、復号装置30の構成についての説明である。
次に、DC予測部203によるDC予測の処理の流れについて説明する。
図6は、DC予測部203の動作を示すフローチャートである。
ここでは、一例として、符号化装置10におけるDC予測部203の処理の流れについて説明する。
(ステップS1)DC予測部203は、参照画素のグループを特定する。次に、DC予測部203は、ステップS3に処理を進める。
ここで、グループの特定について、説明する。
例えば、DC予測部203は、予測対象ブロックPの左側に位置する参照画素を、垂直方向の座標値に基づいて分割する。また、例えば、DC予測部203は、予測対象ブロックの上側に位置する参照画素を、水平方向の座標値に基づいて分割する。参照画素を、水平方向と垂直方向とにおいてそれぞれ2分割すると、図1に示すように4つのグループが特定される。
なお、グループの特定方法は、ここで説明した方法のみに限定されない。DC予測部203は、例えば、水平方向と、垂直方向とのいずれかのみにおいて、参照画素Rを分割してもよい。このように、グループの数は、2以上の任意の数であってよい。また、参照画素Rを座標値に基づいてグループ分けする以外にも、例えば画素値に基づいてクラスタリングしてもよい。クラスタリング手法としては、例えばk−means法を適用することができる。k−means法を適用する場合、ノード数を参照画素Rの数とし、クラスタ数をグループの数とすればよい。また、DC予測部203は、参照画素Rの全てを、必ずしもいずれかのグループに含める必要もない。つまり、従来のDC予測で参照される参照画素Rのうち、グループに含まれない画素が存在していてもよい。また、複数のグループに、1つの画素が重複して含まれてもよい。
また、グループは、1つの画素のみにより構成されてもよい。例えば、参照画素のうち、左下端の画素(例えば、図1の座標(0,N))、右上端の画素(例えば、図1の座標(N,0))、左上端の画素(例えば、図1の座標(0,0))を選択して、3つのグループとしてもよい。また、参照画素Rの中から、その画素値が最大である画素、最小である画素を選択して、それぞれ異なるグループとしてもよい。また、参照画素Rの全ての画素を含むグループを特定してもよい。この場合、従来技術に係るDC予測の予測値が得られる。
(ステップS3)DC予測部203は、各グループを構成する参照画素の画素値を参照し、DC予測を行う。つまり、DC予測部203は、グループごとに予測候補値を生成する。具体的には、DC予測部203は、グループごとに、各グループを構成する画素の画素値について統計量を算出する。統計量としては、平均値、最大値、最小値、中央値等を適用してよい。例えば、座標値に基づく領域分割によりグループを特定し、統計量として平均値を適用した場合、グループごとに算出される平均値は、局所平均値に該当する。また、例えば、クラスタリングによりグループを特定し、統計量として平均値を適用した場合、グループごとに算出される平均値は、各クラスタの重心に該当する。次に、DC予測部203は、ステップS5に処理を進める。
(ステップS5)DC予測部203は、予測候補値の中から、符号化に適用する予測値(すなわち、選択予測値)を選択する。選択予測値の選択では、予測候補値の画像信号と、予測対象ブロックPの画像信号との差分を、例えばMSE(Mean Squared Error)法により算出する。そして、DC予測部203は、差分が最小となる予測候補値を、選択予測値とする。DC予測部203は、選択予測値に基づいて予測画像を生成し、生成した予測画像の画像信号を、切替部111に出力する。また、DC予測部203は、選択予測値を示すフラグ情報を、エントロピー符号化部105に出力する。その後、DC予測部203は、図6に示す処理を終了する。
なお、DC予測部203が出力したフラグ情報は、エントロピー符号化部105により符号化される。例えば図1に示す4分割の場合、フラグ情報は、2[bit]で表される。具体的には、第1グループDCA1に「00」を割当て、第2グループDCA2に「01」を割当て、第3グループDCL1に「10」を割当て、第4グループDCL2に「11」を割当てる等してよい。
なお、ここでは、一例として、符号化装置10におけるDC予測部203の処理の流れについて説明したが、復号装置30におけるDC予測部203の処理も同様である。ただし、復号装置30では、ステップS5において、DC予測部203は、エントロピー復号部301が復号したフラグ情報を参照して、予測値を選択する。
以上が、DC予測部203の動作についての説明である。
以上説明したように、符号化装置10と、復号装置30とは、1つの画像ブロック(例えば、予測対象ブロック)に対して、参照画素の集合(例えば、グループ)を複数特定する特定部204と、特定部204が特定した複数の参照画素の集合の各々から、DC予測により、予測ブロック候補を生成する生成部205と、画像ブロックに対する予測ブロック(例えば、選択予測値の画素で構成される予測画像)を、生成部205が生成した複数の予測ブロック候補(例えば、予測候補値の画素で構成される予測画像)の中から選択する選択部206と、を備える。
これにより、符号化装置10と、復号装置30とは、1つの画像ブロックに対して、DC予測による複数の予測ブロックの候補を生成し、そのうちの1つを選択する。つまり、符号化装置10と、復号装置30とは、画像ブロックに応じて予測ブロックを変更することができる。従って、画像符号化復号システム1は、符号化効率を向上させることができる。
また、特定部204は、複数の参照画素のうち、隣接する参照画素により構成される集合を特定する。
これにより、符号化装置10と、復号装置30とは、局所平均値等の局所的な画像の性質に基づいて、DC予測を行うことができる。例えば、符号化装置10と、復号装置30とは、参照画素の画素値が一様でない場合であっても、局所的な画像の性質を損ねずに、DC予測を行うことができる。従って、画像符号化復号システム1は、符号化効率を向上させることができる。
また、特定部204は、所定数の集合を特定する。
これにより、符号化装置10と、復号装置30とにおいて、予測ブロック候補の数を整合させることができる。
また、特定部204は、クラスタリングにより参照画素の集合を特定する。
これにより、符号化装置10と、復号装置30とにおいて、参照画素の集合の大きさや各集合に含まれる参照画素の範囲を、画像ブロックに応じて変更することができる。従って、画像符号化復号システム1は、集合の大きさや各集合に含まれる参照画素の範囲を、固定した場合に比して、符号化効率を向上させることができる。
[第2の実施形態]
本発明の第2の実施形態について説明する。なお、ここでは、上述した第1の実施形態と同様の構成については、同一の符号を付し、説明を援用する。
本実施形態に係る画像符号化復号システム1A(不図示)は、画像符号化復号システム1と同様に、画像を符号化、復号する情報処理システムである。ただし、画像符号化復号システム1Aは、DC予測において、1つの予測対象ブロックPを分割し、分割後の各ブロックのそれぞれについて、複数の予測候補値の中からいずれかを割当てる点で、画像符号化復号システム1とは異なる。
ここで、本実施形態に係るDC予測の概要について説明する。
図7は、DC予測の概要を示す図である。
図7に示す例では、予測対象ブロックPは、水平方向と垂直方向とにおいて、それぞれ均等に2分割され、4つの分割領域PA、PB、PC、PDが設定されている。また、複数の参照画素Rは、第1の実施形態と同様に、第1〜第4グループDCA1、DCA2、DCL1、DCL2に4分割されている。ここで、本実施形態に係るDC予測では、各分割領域PA、PB、PC、PDのそれぞれに対して、第1〜第4グループDCA1、DCA2、DCL1、DCL2に基づく予測候補値の中から、いずれか1つを予測値として割当てる。これにより、予測対象ブロックPの画素値が、一様ではないとしても、分割領域ごとに予測値を変更することができるため、予測精度を向上させることができる。
以上が、本実施形態に係るDC予測の概要についての説明である。
次に、画像符号化復号システム1Aの構成について説明する。
画像符号化復号システム1Aは、画像符号化復号システム1が備える符号化装置10、復号装置30に代えて、符号化装置10A(不図示)、復号装置30A(不図示)を備える。
符号化装置10Aは、符号化装置10が備えるイントラ予測部200に代えて、イントラ予測部200Aを備える。同様に、復号装置30Aは、復号装置30が備えるイントラ予測部200に代えて、イントラ予測部200Aを備える。
図8は、イントラ予測部200Aの構成を示すブロック図である。
イントラ予測部200Aは、DC予測部203に代えて、DC予測部203Aを備える。DC予測部203Aは、選択部206に代えて選択部206Aを備える。また、DC予測部203Aは、DC予測部203が備える各構成に加えて、ブロック分割部207Aを備える。
ブロック分割部207Aは、予測対象ブロックを複数の分割領域に分割する。ブロック分割部207Aによる予測対象ブロックの分割方法は、予め定められており、符号化装置10であっても、復号装置30であっても、同じ予測対象ブロックは、同様に分割される。分割領域の識別情報の割当て方法も同様である。ブロック分割部207Aは、分割領域情報を、選択部206Aに出力する。分割領域情報には、例えば、各分割領域の識別情報と、各分割領域の範囲を示す情報とが含まれる。
選択部206Aは、選択部206と同様に、複数の予測候補値から選択予測値を1つ選択する。ただし、選択部206Aは、ブロック分割部207Aが分割した分割領域ごとに選択予測値を選択する点で、選択部206とは異なる。選択部206Aによる選択予測値の選択方法は、選択部206と同様であるため、説明を援用する。符号化装置10Aの場合、選択部206Aは、分割領域ごとの選択予測値を示すフラグ情報をエントロピー符号化部105に出力する。これにより、フラグ情報が符号化され、復号装置30Aに伝送される。また、復号装置30Aの場合、選択部206Aは、エントロピー復号部301により復号されたフラグ情報を参照し、分割領域ごとの選択予測値を取得する。
以上が、画像符号化復号システム1Aの構成についての説明である。
次に、画像符号化復号システム1Aの動作について説明する。
図9は、DC予測部203Aの動作を示すフローチャートである。
ここでは、一例として、符号化装置10AにおけるDC予測部203Aの処理の流れについて説明する。
図9に示すステップS1、3の処理は、図6に示す処理と同様であるため、説明を援用する。
(ステップS14)ステップS3の処理の後、DC予測部203Aは、予測対象ブロックを複数の領域に分割する。その後、DC予測部203Aは、ステップS15に処理を進める。
ここで、DC予測部203Aは、予測対象ブロックを水平方向と垂直方向とのいずれか、又は、両方において分割する。DC予測部203Aは、2以上の任意の数に予測対象ブロックを分割してよい。DC予測部203Aは、各方向において、均等に予測対象ブロックを分割してもよいし、不均等に予測対象ブロックを分割してもよい。DC予測部203Aは、予測対象ブロックの形状、例えば各方向における長さに応じて、各方向の分割数を変更してもよい。例えば長さが長い方向において分割数を多くし、長さが短い方向において分割数を少なくしてよい。また、DC予測部203Aは、参照画素のグループの特定方法に応じて、予測対象ブロックの分割方法を変更してもよい。
(ステップS15)DC予測部203Aは、予測対象ブロックの分割領域ごとに、予測候補値の中から選択予測値を選択する。例えば、DC予測部203Aは、予測候補値ごとに、各分割領域の予測画像と原画像との差分を算出し、差分が最小となる予測候補値を選択予測値とする。その他の処理については、図6に示すステップS5と同様である。そして、DC予測部203Aは、図9に示す処理を終了する。
以上が、DC予測部203Aの動作についての説明である。
次に、画像符号化復号システム1Aによる処理結果の例について説明する。
図10は、画像符号化復号システム1Aによる処理結果の一例を示す図である。
図10(a)は、予測対象ブロックの原画像と、そのDCT信号を示す。図10(b)は、従来技術に係るDC予測による予測画像と、予測残差と、予測残差のDCT信号とを示す。図10(c)は、Planar予測による予測画像と、予測残差と、予測残差のDCT信号とを示す。図10(d)は、DC予測部203Aによる予測画像と、予測残差と、予測残差のDCT信号とを示す。図10(d)に示す例では、DC予測部203Aは、参照画素を8つのグループに分類し、予測対象ブロックを16分割している。
ここで、図10(b)〜(d)の残差DCT信号を比較すると、従来技術に係るDC予測やPlanar予測と比較して、DC予測部203Aによる予測ではDC成分が削減されていることがわかる。原画像との差分をMSEにより算出すると、従来技術に係るDC予測では「1.49×10」である。Planar予測では「1.36×10」である。DC予測部203Aによる予測では「1.01×10」である。このように、DC予測部203Aによる予測では、DC成分を削減することができた。
以上が、画像符号化復号システム1Aによる処理結果の例についての説明である。
以上説明したように、符号化装置10Aと、復号装置30Aとにおいて、選択部206Aは、画像ブロックを複数に分割した分割ブロックの各々に対する予測ブロックを、予測ブロック候補の中から選択する。
これにより、符号化装置10Aと、復号装置30Aとは、分割ブロックごとに予測値を定める。従って、符号化装置10Aと、復号装置30Aとは、例えば、画像ブロック内において、画素値が局所的に大きく変動している場合であっても、局所的な画素値の変動に合わせた予測ブロックを選択することができる。従って、画像符号化復号システム1Aは、符号化効率を向上させることができる。
[変形例]
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成は上述の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、上述の第1〜2の実施形態において説明した各構成は、任意に組み合わせることができる。また、例えば、上述の第1〜2の実施形態において説明した各構成は、特定の機能を発揮するのに不要である場合には、省略することができる。また、例えば、上述の第1〜2の実施形態において説明した各構成は、複数の装置に分離して備えることができる。
なお、上述した第2の実施形態では、分割領域ごとの選択予測値を、フラグ情報として伝送する場合について説明したが、これには限られない。例えば、一部の選択予測値が暗黙的に定められてもよい。
ここで、暗黙的な選択予測値の設定について説明する。
一般的な画像では、画素値が急激に変化する部分は少ない。従って、予測対象ブロック内においても、参照画素から距離が近い領域では、参照画素と同様の画素値を示すことが期待される。そこで、例えば、参照画素に隣接している分割領域については、当該参照画素を含むグループの予測候補値を、選択予測値として暗黙的に設定してもよい。つまり、予測対象ブロックのうち、参照画素側の端部に位置している分割領域に対しては、選択予測値として、隣接する参照画素のグループに基づく予測候補値を選択する。これにより、符号化装置10Aと、復号装置30Aとは、符号化と復号とに伴う画質の低下を防ぎつつ、データ量を低減することができる。つまり、符号化効率を向上させることができる。
また、符号化装置10Aと、復号装置30Aとは、参照画素に隣接していない分割領域に対しては、その分割領域から最も距離が近い参照画素における参照画素を含むグループの予測候補値を、選択予測値として暗黙的に設定してもよい。この場合、分割領域からの距離とは、例えば、分割領域の左上端の画素の座標を代表値として、代表値からの距離であるとしてよい。
また、例えば、水平方向、垂直方向のそれぞれにおいて、最も距離が近い参照画素を含むグループを特定し、各グループによる予測候補値を、各グループまでの距離比に応じて加重平均した値を、選択予測値として設定してもよい。
また、参照画素に隣接していない分割領域に対しては、例えば、非特許文献1等の従来技術に係るDC予測において用いられる予測値を、選択候補値として設定してもよい。
また、上述の符号化装置10、10A、復号装置30、30Aの機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより符号化装置10、10A、復号装置30、30Aとしての処理を行ってもよい。ここで、「記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行する」とは、コンピュータシステムにプログラムをインストールすることを含む。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、インターネットやWAN、LAN、専用回線等の通信回線を含むネットワークを介して接続された複数のコンピュータ装置を含んでもよい。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。このように、プログラムを記憶した記録媒体は、CD−ROM等の非一過性の記録媒体であってもよい。また、記録媒体には、当該プログラムを配信するために配信サーバからアクセス可能な内部または外部に設けられた記録媒体も含まれる。配信サーバの記録媒体に記憶されるプログラムのコードは、端末装置で実行可能な形式のプログラムのコードと異なるものでもよい。すなわち、配信サーバからダウンロードされて端末装置で実行可能な形でインストールができるものであれば、配信サーバで記憶される形式は問わない。なお、プログラムを複数に分割し、それぞれ異なるタイミングでダウンロードした後に端末装置で合体される構成や、分割されたプログラムのそれぞれを配信する配信サーバが異なっていてもよい。さらに「コンピュータ読み取り可能な記録媒体」とは、ネットワークを介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、上述した機能の一部を実現するためのものであってもよい。さらに、上述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
1、1A…画像符号化復号システム、10、10A…符号化装置、30、30A…復号装置、50…伝送蓄積部、200、200A…イントラ予測部、203、203A…DC予測部、204…特定部、205…生成部、206、206A…選択部、207A…ブロック分割部、105…エントロピー符号化部、301…エントロピー復号部

Claims (9)

  1. 1つの画像ブロックに対して、参照画素の集合を複数特定する特定部と、
    前記特定部が特定した複数の前記参照画素の集合の各々から、イントラ予測により、予測ブロック候補を生成する生成部と、
    前記画像ブロックに対する予測ブロックを、前記生成部が生成した複数の前記予測ブロック候補の中から選択する選択部と、
    を備え、
    前記特定部は、前記参照画素のうち、画素値が最小である画素を選択して成る第一グループと、画素値が最大である画素を選択して成る第二グループと、を前記参照画素の集合として少なくとも特定する、
    予測装置。
  2. 1つの画像ブロックに対して、参照画素の集合を複数特定する特定部と、
    前記特定部が特定した複数の前記参照画素の集合の各々から、イントラ予測により、予測ブロック候補を生成する生成部と、
    前記画像ブロックに対する予測ブロックを、前記生成部が生成した複数の前記予測ブロック候補の中から選択する選択部と、
    を備え、
    前記選択部は、前記画像ブロックを複数に分割した分割ブロックの各々に対する予測ブロックを、前記予測ブロック候補の中から選択し、
    前記選択部が選択する前記予測ブロック候補は、前記分割ブロックの一部について暗黙的に定められている、
    予測装置。
  3. 前記選択部が選択する前記予測ブロック候補は、前記参照画素に隣接している前記分割ブロックについては当該参照画素を含む集合の前記予測ブロック候補であると暗黙的に定められている、
    請求項2に記載の予測装置。
  4. 前記選択部が選択する前記予測ブロック候補は、前記参照画素に隣接していない前記分割ブロックについては当該分割ブロックから最も距離が近い参照画素を含む集合の前記予測ブロック候補であると暗黙的に定められている、
    請求項2または3に記載の予測装置。
  5. 前記特定部は、所定数の集合を特定する、
    請求項1から4までのいずれか一項に記載の予測装置。
  6. 前記特定部は、クラスタリングにより前記参照画素の集合を特定する
    請求項1から5までのいずれか一項に記載の予測装置。
  7. 請求項1から請求項6までのいずれか一項に記載の予測装置により選択された予測ブロックを示すフラグ情報を符号化する符号化部
    を備える符号化装置。
  8. 請求項に記載の符号化装置が符号化したフラグ情報に基づいて、前記画像ブロックを復号する号部
    を備える復号装置。
  9. コンピュータを、請求項1から請求項6までのいずれか一項に記載の予測装置として動作させるためのプログラム。
JP2017012983A 2017-01-27 2017-01-27 予測装置、符号化装置、復号装置、及びプログラム Active JP6917718B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017012983A JP6917718B2 (ja) 2017-01-27 2017-01-27 予測装置、符号化装置、復号装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017012983A JP6917718B2 (ja) 2017-01-27 2017-01-27 予測装置、符号化装置、復号装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018121282A JP2018121282A (ja) 2018-08-02
JP6917718B2 true JP6917718B2 (ja) 2021-08-11

Family

ID=63044074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017012983A Active JP6917718B2 (ja) 2017-01-27 2017-01-27 予測装置、符号化装置、復号装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6917718B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI116819B (fi) * 2000-01-21 2006-02-28 Nokia Corp Menetelmä kuvien lähettämiseksi ja kuvakooderi
JP2006060267A (ja) * 2004-08-17 2006-03-02 Sony Corp 符号化装置、撮像装置、復号化装置及び画像データの処理方法
ES2393226T3 (es) * 2007-02-23 2012-12-19 Nippon Telegraph And Telephone Corporation Método de predicción Intra de codificación de video y método de descodificación, su dispositivo, su programa y medio de programa grabado
JP6210375B2 (ja) * 2012-12-28 2017-10-11 サン パテント トラスト 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置

Also Published As

Publication number Publication date
JP2018121282A (ja) 2018-08-02

Similar Documents

Publication Publication Date Title
KR102292589B1 (ko) 영상 복호화 방법 및 장치
TWI759389B (zh) 用於視訊寫碼之低複雜度符號預測
KR102469145B1 (ko) 영상을 부호화 또는 복호화하는 방법 및 장치
KR102635983B1 (ko) 스킵 모드를 이용한 영상 복호화 방법 및 이러한 방법을 사용하는 장치
JP7159354B2 (ja) 適応的動きベクトル解像度を用いるビデオ信号処理方法及び装置
JP2013524679A (ja) 適応的係数スキャン順序を利用した映像の符号化方法、復号化方法及びその装置
KR102503760B1 (ko) 영상 분석을 이용한 비디오 부호화/복호화 방법 및 장치
CN110870312B (zh) 用于视频压缩中的帧内编码的方法和设备
WO2015008417A1 (ja) 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
US11451771B2 (en) Moving-image decoder using intra-prediction, moving-image decoding method using intra-prediction, moving-image encoder using intra-prediction, moving-image encoding method using intra-prediction, and computer readable recording medium
JP2014096638A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
JP2018078409A (ja) イントラ予測器、画像符号化装置、画像復号装置およびプログラム
CN112889280B (zh) 用于数字图像/视频材料的编码和解码的方法和装置
CN110741642A (zh) 使用拟合平面和多个基准参考样本,以及多个次级参考样本进行定向帧内预测的装置和方法
KR20230035009A (ko) 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
KR20150095604A (ko) 적응적인 인트라 예측을 이용한 영상 부호화/복호화 장치 및 방법
JP6917718B2 (ja) 予測装置、符号化装置、復号装置、及びプログラム
JP6886825B2 (ja) 予測装置、符号化装置、復号装置、及びプログラム
JP2020028066A (ja) 色差イントラ予測候補生成装置、画像符号化装置、画像復号装置、及びプログラム
KR20200004348A (ko) 타겟 영역 수정을 통해 비디오 신호를 처리하는 방법 및 장치
JP7340658B2 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP5957513B2 (ja) 動画像復号化方法
KR20230144426A (ko) 영상 부호화/복호화 방법 및 장치
CN116325735A (zh) 用于针对参考帧进行自适应重新排序的方法和装置
KR20140124446A (ko) 인트라 예측을 이용한 비디오 부호화/복호화 방법 및 장치

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201013

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20201211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210622

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210720

R150 Certificate of patent or registration of utility model

Ref document number: 6917718

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250