JP7303661B2 - 画像処理装置及びプログラム - Google Patents

画像処理装置及びプログラム Download PDF

Info

Publication number
JP7303661B2
JP7303661B2 JP2019088513A JP2019088513A JP7303661B2 JP 7303661 B2 JP7303661 B2 JP 7303661B2 JP 2019088513 A JP2019088513 A JP 2019088513A JP 2019088513 A JP2019088513 A JP 2019088513A JP 7303661 B2 JP7303661 B2 JP 7303661B2
Authority
JP
Japan
Prior art keywords
spatial
picture
processed
frequency band
phase position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019088513A
Other languages
English (en)
Other versions
JP2020184693A (ja
Inventor
康孝 松尾
菊文 神田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2019088513A priority Critical patent/JP7303661B2/ja
Publication of JP2020184693A publication Critical patent/JP2020184693A/ja
Application granted granted Critical
Publication of JP7303661B2 publication Critical patent/JP7303661B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Picture Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置及びプログラムに関する。
従来、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて雑音除去を行う技法として、入力画像をウェーブレット変換した周波数分解係数のうち、所定の雑音レベル以下の成分をコアリングすることによりノイズ除去を行うことが知られている(例えば、非特許文献1参照)。
また、ウェーブレット縮退を用いた画像処理装置として、高周波ノイズ画像と低周波ノイズ画像を抽出し、これらの画像が輝度成分の画像であるか色差成分の画像であるかに応じて分けて統合することで雑音レベルの低減を行う技法が知られている(例えば、特許文献1参照)。
特許第5352942号明細書
David L. Donoho, Iain M. Johnstone, Gerard Kerkyacharian and Dominique Picard: "Wavelet Shrinkage: Asymptopia?", Journal of the Royal Statistical Society. Series B (Methodological), Vol. 57, No. 2, pp. 301-369, 1995.
上述したように、従来から、非特許文献1や特許文献1などのように、画像に対しウェーブレット縮退を用いて雑音除去する技法が知られている。また、ウェーブレット縮退を用いて帯域制限処理を行う技法もある。
一方で、近年、例えば次世代地上波放送として、ハイビジョンを超える超高精細動画像として4Kや8KのSHV(Super Hi-Vision)などの大容量コンテンツサービスを伝送することが検討されている。このような超高精細動画像の伝送にあたって高圧縮符号化を行う際に、空間高周波数帯域成分のパワーが大きいなどの理由で高圧縮符号化が困難な動画像が入力されうることが想定される。この場合、伝送容量としてその入力動画像が持つ膨大な情報量に対する符号化ビットレートが十分ではない事態が生じうるため、圧縮又は伝送に係る符号化に起因する画像破綻が発生する場合がある。
そこで、超高精細動画像に対する高圧縮符号化処理の前段で、非特許文献1や特許文献1などの従来の雑音除去処理や帯域制限処理を行うことで、入力動画像が持つ情報量を削減することができる。
しかし、従来技術を用いて雑音除去処理と帯域制限処理を行う場合に、様々な線形フィルタ処理や非線形フバルタ処理が存在するが、従来技術では、超高精細動画像等の動画像に対し圧縮又は伝送に係る符号化に起因する画像破綻を抑制しつつ動画像品質を劣化させないように、その圧縮符号化処理の前処理として適応的に雑音除去処理と帯域制限処理を行うことができないという問題がある。
このため、超高精細動画像等の動画像に対し圧縮符号化処理の前段でウェーブレット縮退を用いて情報量を削減するにあたり、画像破綻を抑制しつつ動画像品質を劣化させないように雑音除去処理と帯域制限処理を行うフィルタ処理(ウェーブレット縮退に用いる縮退関数)が望まれる。
従って、本発明の目的は、圧縮符号化処理の前処理として動画像を入力し、この入力動画像に対しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像破綻を抑制しつつ動画像品質を劣化させないように適応的に雑音除去処理と帯域制限処理を行う画像処理を施し、動画像の圧縮符号化処理に係る画質を向上させる画像処理装置及びプログラムを提供することにある。
本発明による一態様の画像処理装置は、動画像の圧縮符号化処理の前段で、入力動画像の雑音除去及び帯域制限を行うにあたり、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行うように構成する。当該縮退関数は、当該空間位相位置毎の時間パワーの変動の大きさを基に、より好適には時間パワーの変動の大きさと、後段の圧縮符号化処理に係る参照ピクチャセットに対応する時間的なマッチング度合い(時間パワーマッチング量)とを基に、雑音除去及び帯域制限を行う。
即ち、本発明の画像処理装置は、動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置であって、当該動画像における処理対象のピクチャを入力し、n階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数を抽出する空間ウェーブレットパケット分解部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群のうち空間対角最高周波数帯域の周波数分解係数を抽出し、当該空間対角最高周波数帯域内の全周波数分解係数のパワーにおける予め定めた割合以上となるパワーを雑音成分とみなし雑音パワーとして検出する雑音パワー検出部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群を基準に、前記処理対象のピクチャが属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャを用いて時間方向に1階ウェーブレットパケット分解を行い、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出する時間パワー変動量検出部と、前記処理対象のピクチャに関する当該雑音パワー及び当該空間位相位置毎の時間パワー変動量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定する縮退関数設定部と、前記処理対象のピクチャに関する各周波数帯域群の周波数分解係数に対し前記縮退関数を適用して空間ウェーブレット縮退処理を実行することにより、当該空間ウェーブレットパケット分解処理に基づく空間ウェーブレット縮退処理を行う空間ウェーブレット縮退部と、前記処理対象のピクチャに関して前記空間ウェーブレット縮退処理によって帯域制限及び雑音除去された各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施すことにより、当該動画像における各ピクチャについて帯域制限及び雑音除去された出力動画像を生成する再構成部と、を備えることを特徴とする。
また、本発明の画像処理装置において、前記時間パワー変動量検出部は、各空間位相位置を中心とする所定ブロックサイズのブロックを基に、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出することを特徴とする。
また、本発明の画像処理装置において、所定の圧縮符号化処理に係る参照ピクチャセットの情報を基に、当該処理対象のピクチャに対して符号化参照されることになる1枚以上の参照ピクチャを入力し、該参照ピクチャに対しn階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャを生成する第2の空間ウェーブレットパケット分解部と、前記処理対象のピクチャに関する前記空間方向の各周波数帯域群における各空間位相位置について、各空間位相位置を中心とする所定ブロックサイズのブロック毎に、前記空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャに対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量を前記処理対象のピクチャに関する空間位相位置毎の時間パワーマッチング量として検出する時間パワーマッチング量検出部と、を更に備え、前記縮退関数設定部は、前記処理対象のピクチャに関する当該雑音パワー、当該空間位相位置毎の時間パワー変動量、及び当該空間位相位置毎の時間パワーマッチング量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、前記時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定することを特徴とする。
更に、本発明のプログラムは、コンピューターを、本発明の画像処理装置として機能させるためのプログラムとして構成する。
本発明によれば、動画像の圧縮符号化処理の前処理として本発明に係る画像処理装置を利用することで、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定することができるので、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となる。
本発明による一実施形態の画像処理装置の概略構成を示すブロック図である。 本発明による一実施形態の画像処理装置における一実施例の画像処理に係る2階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図である。 本発明による一実施形態の画像処理装置における一実施例の画像処理を示すフローチャートである。 本発明による一実施形態の画像処理装置における時間パワー変動量の検出を示す説明図である。 本発明による一実施形態の画像処理装置における時間パワーマッチング量の検出を示す説明図である。 (a)は参照ピクチャセットを例示する図であり、(b),(c)はそれぞれ本発明による一実施形態の画像処理装置における時間パワーマッチング量の検出に係るブロックマッチングを例示する説明図である。 (a),(b)は、それぞれ本発明による一実施形態の画像処理装置における一実施例及び変形例の画像処理に係る縮退関数の説明図である。 本発明による一実施形態の画像処理装置における一実施例の画像処理に係る3階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図である。
以下、本発明による一実施形態の画像処理装置1について、図面を参照して詳細に説明する。
〔装置構成〕
図1は本発明による一実施形態の画像処理装置1の概略構成を示すブロック図である。本実施形態の画像処理装置1は、圧縮符号化処理の前処理として、動画像を入力し空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退を用いて画像処理を行う装置として構成され、空間ウェーブレットパケット分解部11、雑音パワー検出部12、時間パワー変動量検出部13、空間ウェーブレットパケット分解部14、時間パワーマッチング量検出部15、縮退関数設定部16、空間ウェーブレット縮退部17、及び再構成部18を備える。尚、図1に示す例において、画像処理装置1に対しウェーブレットパケット分解階数(n階)を外部指定可能とし、画像処理装置1内の必要とされる各構成要素に対し個別に外部指定するように図示しているが、パラメータとして伝送しながら処理する構成とすることも可能である。
空間ウェーブレットパケット分解部11は、入力動画像における処理対象のピクチャP(t)を入力し、設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、入力動画像における処理対象のピクチャP(t)(t:処理対象とするフレーム画像の時刻)に対し空間ウェーブレットパケット分解処理を施し、これにより抽出される空間方向の各周波数帯域群の周波数分解係数を空間ウェーブレット縮退部17に出力する。尚、処理対象のピクチャP(t)について当該n階空間ウェーブレットパケット分解によって得られる空間方向の各周波数帯域のうち空間対角最高周波数帯域内の周波数分解係数は雑音パワー検出部12にて抽出される。また、処理対象のピクチャP(t)について当該n階空間ウェーブレットパケット分解によって得られる空間方向の各周波数帯域群の周波数分解係数は、時間パワー変動量検出部13、及び時間パワーマッチング量検出部15において、それぞれ詳細に後述する時間パワー変動量及び時間パワーマッチング量の検出に用いられる。
図2を参照して、より具体的に処理対象のピクチャP(t)に対する空間ウェーブレットパケット分解について説明する。図2は本発明による一実施形態の画像処理装置1における一実施例の画像処理に係る処理対象のピクチャP(t)に対する2階空間ウェーブレットパケット分解によって得られる周波数帯域を示す図であり、放送カメラで撮像された所謂8K/60Pの動画像(水平解像度8K(7680画素)×垂直解像度4K(4320画素))を処理対象とした例である。この例では、時刻tのフレーム画像全体をピクチャP(t)としているが、時刻tのフレーム画像の一部を示すスライス画像やタイル画像(HEVC規格)をピクチャP(t)として扱うことができる。
図2に示すように、入力動画像における処理対象のピクチャP(t)に対するn=2とした空間方向のみを処理対象とする2階空間ウェーブレットパケット分解では、入力動画像における処理対象のピクチャP(t)に対しそれぞれ水平・垂直方向に2階空間ウェーブレットパケット分解を行う。この場合、水平周波数×垂直周波数で表される図2に図示するような周波数領域に分解されたピクチャP’(i,j,t)が得られ、ピクチャP’(i,j,t)は、2階の空間低周波数帯域LL(i,j,t)、水平高周波数帯域LH(i,j,t)、垂直高周波数帯域HL(i,j,t)、及び対角(水平・垂直)高周波数帯域HH(i,j,t)の各周波数帯域群に分解される(mは各周波数帯域群の群番号であり、iは水平方向の周波数分解係数の空間位相座標を示し、jは垂直方向の周波数分解係数の空間位相座標を示す。)。尚、n階空間ウェーブレットハケット分解における各階間には、パーセバルの法則が成り立つものとなっている。
図1に示すように、雑音パワー検出部12は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=2としており、空間HH(i,j,t))の成分(周波数分解係数)を抽出する。そして、雑音パワー検出部12は、ピクチャP’(i,j,t)の当該空間対角最高周波数帯域内の全成分(全周波数分解係数)のパワーにおける予め定めた割合以上となるパワー(上位α%番目のパワー)を雑音成分とみなし、雑音パワーPとして検出し縮退関数設定部16に出力する。
時間パワー変動量検出部13は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群を基準に、時間ウェーブレットフィルタを用いて当該ピクチャP’(i,j,t)が属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャP(t-a)(aは時刻tに対する相対時刻を示すが、例えばa=1としたときは、直前のフレーム画像における対応する空間位置のピクチャP(t-1)を示す。)を用いて時間方向に1階ウェーブレットパケット分解を行い、ピクチャP’(i,j,t-a)の各周波数帯域群の周波数分解係数を得る。続いて、時間パワー変動量検出部13は、ピクチャP’(i,j,t)の各周波数帯域群、及びピクチャP’(i,j,t-a)の各周波数帯域群について、それぞれ対応する空間位相位置(各周波数帯域内の周波数分解係数の空間位相を示す位置(i,j))で、その空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、該ブロック領域内の平均値又は中央値を当該空間位相位置のパワーとしてそれぞれ求め、ピクチャP’(i,j,t)及びピクチャP’(i,j,t-a)間で各空間位相位置(i,j)のパワーについて差分した値を、ピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量として検出し、縮退関数設定部16に出力する。尚、空間位相位置(i,j)毎の時間パワー変動量を検出するにあたり、上記のようにブロック領域で処理することでパワー値の精度及びこれに基づく縮退関数の設定値の精度が高くなる。
空間ウェーブレットパケット分解部14は、本実施形態の画像処理装置1の出力動画像に対し圧縮符号化処理を行う後段の符号化装置(図示略)で用いる参照ピクチャセット(RPS)の情報が外部指定される。そして、空間ウェーブレットパケット分解部14は、この参照ピクチャセット(RPS)の情報を基に、当該入力動画像における処理対象のピクチャP(t)に対して符号化参照されることになる1枚以上の参照ピクチャP(k)を入力し、当該設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、当該参照ピクチャP(k)に対しn階の空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数を時間パワーマッチング量検出部15に出力する。例えば、空間ウェーブレットパケット分解部14は、参照ピクチャセット(RPS)の情報に基づいて定められる、処理対象のピクチャP(t)に対し1つ前の符号化順の参照ピクチャP(k)について、2階空間ウェーブレットパケット分解を施して得られる周波数帯域群の周波数分解係数を時間パワーマッチング量検出部15に出力する。
時間パワーマッチング量検出部15は、ウェーブレットパケット分解階数(n階)に従って得られる空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、その各空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、空間ウェーブレットパケット分解部14からの出力値である参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量をピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量として検出し、縮退関数設定部16に出力する。ここで、類似度評価指数は、SSD(Sum of Squared Difference)値とすることや、SSD値以外にも、SAD(Sum of Absolute Difference)値、NCC(Normalized Cross-Correlation),ZNCC(Zero-means Normalized Cross-Correlation)等を利用できる。尚、空間位相位置(i,j)毎の時間パワーマッチング量を検出するにあたり、上記のようにブロック領域で処理することでマッチング量の精度及びこれに基づく縮退関数の設定値の精度が高くなる。
縮退関数設定部16は、雑音パワー検出部12から得られるピクチャP’(i,j,t)における雑音パワーPと、時間パワー変動量検出部13から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量と、時間パワーマッチング量検出部15から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量とを基に、ピクチャP’(i,j,t)における全ての周波数帯域群における空間位相位置(i,j)毎に、空間ウェーブレット縮退部17で用いる縮退関数を設定する。尚、縮退関数設定部16における縮退関数の設定において、雑音パワーPは雑音除去する縮退関数の入力値範囲が規定され、時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして設定される。
空間ウェーブレット縮退部17は、空間ウェーブレットパケット分解部11から入力されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数に対し、縮退関数設定部16により設定された縮退関数を適用して空間ウェーブレット縮退処理を実行する。これにより、空間ウェーブレット縮退部17は、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像(正確には各ピクチャ)における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行い、帯域制限及び雑音除去後の各周波数帯域内の周波数分解係数を再構成部18に出力する。
再構成部18は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレット縮退処理によって帯域制限及び雑音除去されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施し、入力動画像における各ピクチャについて同様に処理することにより、帯域制限及び雑音除去された出力動画像を生成し外部に出力する。
〔装置動作〕
以下、より具体的に、図1及び図2に示す本実施形態の画像処理装置1の動作として、図4乃至図6を参照しながら、図3を基に一実施例の画像処理について説明する。
図3は、本発明による一実施形態の画像処理装置1における一実施例の画像処理を示すフローチャートである。また、図4は本実施形態の画像処理装置1における時間パワー変動量の検出を示す説明図であり、図5は本実施形態の画像処理装置1における時間パワーマッチング量の検出を示す説明図である。尚、図6(a)は参照ピクチャセットを例示する図であり、図6(b),(c)はそれぞれ本実施形態の画像処理装置1における時間パワーマッチング量の検出に係るブロックマッチングを例示する説明図である。
まず、画像処理装置1は、空間ウェーブレットパケット分解部11により、入力動画像における処理対象のピクチャP(t)を入力し、設定されたウェーブレットパケット分解階数(n階)に従って(n≧2)、入力動画像における処理対象のピクチャP(t)に対し空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数を得る(ステップS1)。
続いて、画像処理装置1は、雑音パワー検出部12により、図2に示すピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=2としており、空間HH(i,j,t))の成分(周波数分解係数)を抽出し、ピクチャP’(i,j,t)の当該空間対角最高周波数帯域内の全成分(全周波数分解係数)のパワーにおける予め定めた割合以上となるパワー(上位α%番目のパワー)を雑音成分とみなし、雑音パワーPとして検出する(ステップS2)。
一般に、信号成分のパワーは低周波数帯域に偏在する。一方、熱雑音などの雑音成分のパワーは全周波数帯域群でほぼ一定である。このため、n階空間ウェーブレットパケット分解による空間対角最高周波数帯域内の成分は雑音成分が支配的となる。そこで、雑音パワー検出部12は、空間対角最高周波数帯域の全成分(全周波数分解係数)のパワーをソートして、例えばα=95とすると、その上位95%番目の値を雑音パワーPとする。
続いて、画像処理装置1は、時間パワー変動量検出部13により、ピクチャP’(i,j,t)の各周波数帯域群を基準に、時間ウェーブレットフィルタFを用いて当該ピクチャP’(i,j,t)が属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャP(t-a)を用いて時間方向に1階ウェーブレットパケット分解を行い、ピクチャP’(i,j,t-a)の各周波数帯域群の周波数分解係数を得る。
例えば、a=1としたとき、ピクチャP(t)(周波数領域ではピクチャP’(i,j,t))が属するフレーム画像に対し直前のフレーム画像における対応する空間位置のピクチャP(t-1)について、ピクチャP’(i,j,t)の各周波数帯域群を基準にした空間位相位置で時間方向に周波数分解されたピクチャP’(i,j,t-1)が得られる。即ち、1階ウェーブレットパケット分解を行う時間ウェーブレットフィルタFをHaarウェーブレットフィルタとすると、そのタップ長は2となり、図4に示すように、ピクチャP’(i,j,t)の各周波数帯域群に対応する空間位相位置で、時間方向に周波数分解されたピクチャP’(i,j,t-1)が得られる。
そして、時間パワー変動量検出部13は、ピクチャP’(i,j,t)の各周波数帯域群、及びピクチャP’(i,j,t-a)の各周波数帯域群について、それぞれ対応する空間位相位置(i,j)で、その空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック領域内の平均値又は中央値を当該空間位相位置のパワーとしてそれぞれ求め、ピクチャP’(i,j,t)及びピクチャP’(i,j,t-a)間で各空間位相位置(i,j)のパワーについて差分した値を、ピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量として検出する(ステップS3)。
例えば、時間パワー変動量検出部13は、図4に例示するように、或る周波数帯域(図示する例ではHL)における空間位相位置(i,j)を中心とするブロック領域で、ブロックサイズ3×3{Bx=3,By=3}とすると、その空間位相位置(i,j)のピクチャP’(i,j,t)のブロック領域内の平均値又は中央値を示すパワーと、同空間位相位置(i,j)のピクチャP’(i,j,t)のブロック領域内の平均値又は中央値を示すパワーとの差分を、ピクチャP’(i,j,t)における当該空間位相位置(i,j)の時間パワー変動量PHL (i,j,t)として検出する。このように、時間パワー変動量検出部13は、全ての周波数帯域における全ての空間位相位置(i,j)で、時間パワー変動量を検出する。
続いて、画像処理装置1は、空間ウェーブレットパケット分解部14により、圧縮符号化処理を行う後段の符号化装置(図示略)で用いる参照ピクチャセット(RPS)の情報が外部指定されると、この参照ピクチャセット(RPS)の情報を基に、当該入力動画像における処理対象のピクチャP(t)に対して符号化参照されることになる1枚以上の参照ピクチャP(k)を入力し、当該参照ピクチャP(k)に対しn階の空間ウェーブレットパケット分解処理を施し、これにより得られる空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャP’(i,j,k)を生成する。
例えば、空間ウェーブレットパケット分解部14は、図5に例示するように、参照ピクチャセット(RPS)の情報に基づいて定められる、処理対象のピクチャP(t)に対し1つ前の符号化順の参照ピクチャP(k)について、2階空間ウェーブレットパケット分解を施して得られる周波数帯域群の周波数分解係数で表される参照ピクチャP’(i,j,k)を生成する。
続いて、画像処理装置1は、時間パワーマッチング量検出部15により、ウェーブレットパケット分解階数(n階)に従って得られる空間ウェーブレットパケット分解部11からの出力値であるピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、その各空間位相位置(i,j)を中心とする外部指定されたブロックサイズ{Bx,By}のブロック毎に、空間ウェーブレットパケット分解部14からの出力値である参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数(例えば、SSD値)を示すマッチング量を探索し、当該最小となるマッチング量をピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量として検出する(ステップS4)。
例えば、時間パワーマッチング量検出部15は、図5に例示するように、或る周波数帯域(図示する例ではHL)における空間位相位置(i,j)を中心とするブロック領域で、ブロックサイズ3×3{Bx=3,By=3}とすると、そのピクチャP’(i,j,t)の空間位相位置(i,j)について、参照ピクチャセット(RPS)の情報に基づいて定められる参照ピクチャP’(i,j,k)に対するブロックマッチングを行い、最小の類似度評価指数(例えば、SSD値)を示すマッチング量を探索し、当該最小となるマッチング量を、ピクチャP’(i,j,t)における当該空間位相位置(i,j)の時間パワーマッチング量MHL (i,j,t)として検出する。このように、時間パワーマッチング量検出部15は、全ての周波数帯域における全ての空間位相位置(i,j)で、時間パワーマッチング量を検出する。
尚、図6を参照して、参照ピクチャセット、及び本実施形態の画像処理装置1における時間パワーマッチング量の検出に係るブロックマッチングを説明する。動画像の圧縮符号化技術として、例えばH.264/MPEG-4 AVC,H.265/MPEG-H HEVCなどでは、予測符号化処理前の動画像について複数の画面群に分割した所定グループを設定し、その所定グループ内で、予測符号化法として予め選択された画面間予測符号化処理や画面内予測符号化処理を行う。
H.264/MPEG-4 AVCでは、当該所定グループとして予測符号化前の動画像について複数の画面群に分割したGOP(Group of Pictures)を設定する。そして、GOP内の各画面(フレーム、又はスライス画面)について、フレーム内予測符号化処理を行うIピクチャ、時間的に過去の画面から片方向フレーム間予測符号化処理を行うPピクチャ、又は時間的に前後に位置する画面から双方向フレーム間予測符号化処理を行うBピクチャが予め選択される。尚、H.264/MPEG-4 AVCでは、GOP内の全ての画面について画面内予測符号化処理のみの圧縮符号化方式による圧縮も可能である。
また、H.265/MPEG-H HEVCにおいても、当該所定グループとして予測符号化前の動画像について複数の画面群に分割したシーケンスを設定する。HEVC規格上ではGOPという概念を導入していないが、このシーケンスがGOPに相当する。そして、シーケンス内の各画面(フレーム画面、スライス画面、又はタイル画面)について、画面内予測符号化処理や画面間予測符号化処理を行う処理ユニットが予め選択される。尚、H.265/MPEG-H HEVCにおいても、シーケンス内の全ての画面について画面内予測符号化処理のみの圧縮符号化方式による圧縮も可能である。
そして、図6(a)に例示するように、圧縮符号化する動画像は、そのフレーム番号で示される各フレーム画像(ここでは、フレーム画像全体をピクチャとして例示)が、いずれのピクチャを参照対象として圧縮符号化を行うかが予め定められ、参照ピクチャセットとして識別できるようになっている。
そこで、画像処理装置1は、時間パワーマッチング量検出部15により、ピクチャP’(i,j,t)の各周波数帯域群における各空間位相位置(i,j)について、ブロックサイズ{Bx,By}のブロック毎に、例えば1枚の参照ピクチャP’(i,j,k)に対するときは図6(b)に示すように、或いは2枚の参照ピクチャP’(i,j,k1),P’(i,j,k2)に対するときは図6(c)に示すように、予め定めた探索範囲内でブロックマッチングを行って、個々のブロックマッチングで得られるマッチング量(SSD値を例にSSD1,SSD2,…)のうち最小となるマッチング量を時間パワーマッチング量として検出する。尚、当該参照ピクチャセットにおける参照ピクチャP’(i,j,k)が処理対象のピクチャP’(i,j,t)のIピクチャに該当するときは、当該時間パワーマッチング量検出部15の処理は省略するか、或いは、前回の参照ピクチャセットにおけるIピクチャ又は最終の符号化順のピクチャを参照ピクチャP’(i,j,k)として扱うように構成することができる。
続いて、画像処理装置1は、縮退関数設定部16により、雑音パワー検出部12から得られるピクチャP’(i,j,t)における雑音パワーPと、時間パワー変動量検出部13から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワー変動量と、時間パワーマッチング量検出部15から得られるピクチャP’(i,j,t)における空間位相位置(i,j)毎の時間パワーマッチング量とを基に、ピクチャP’(i,j,t)における全ての周波数帯域群における空間位相位置(i,j)毎に、空間ウェーブレット縮退部17で用いる縮退関数を設定する(ステップS5)。
特に、縮退関数設定部16は、雑音パワーPは雑音除去する縮退関数の入力値範囲を規定するものとし、時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、縮退関数を設定する。
例えば、図7(a)は、本実施形態の画像処理装置1における一実施例の画像処理に係る縮退関数の説明図である。図7(a)に示す入力xに対する出力yで示される縮退関数は、雑音パワーPの絶対値以下で定まる入力値をゼロ値まで雑音除去するよう縮退関数の入力値範囲を規定するものとし、雑音パワーPの絶対値を超える入力値については、上述した図4に示す空間位相位置(i,j)の時間パワー変動量PHL (i,j,t)と、上述した図5に示す同空間位相位置(i,j)の時間パワーマッチング量MHL (i,j,t)とで定まる帯域制限とし、時間パワー変動量の値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、更に時間パワーマッチング量の値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとする。これは、時間パワー変動量の値が大きいほど、更には時間パワーマッチング量の値が大きいほど、圧縮符号化が難しく符号化に起因する画像劣化が起こりやすいとみなしているためである。尚、β,γは任意に定められる定数である。
(変形例)
尚、上述した実施形態の例では、雑音パワー、時間パワー変動量及び時間パワーマッチング量を用いて縮退関数の設定を行う例を説明したが、画像処理装置1において、空間ウェーブレットパケット分解部14、及び時間パワーマッチング量検出部15を省略し、雑音パワー、及び時間パワー変動量を用いて縮退関数の設定を行う構成としてもよい。この変形例の縮退関数を図7(b)に例示している。図7(b)に示す例においても、時間パワー変動量の値が大きいほど縮退関数の傾きを小さくするものとし、これにより、比較的多くの動画像において生じる圧縮符号化が難しく符号化に起因する画像劣化が起こりやすい現象を、抑制させることができる。
続いて、画像処理装置1は、空間ウェーブレット縮退部17により、空間ウェーブレットパケット分解部11から入力されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数に対し、縮退関数設定部16により設定された縮退関数を適用して空間ウェーブレット縮退処理を実行することより、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像(正確には各ピクチャ)における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定して、空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退処理を行う(ステップS6)。
最終的に、画像処理装置1は、ウェーブレットパケット分解階数(n階)に従って、空間ウェーブレット縮退処理によって帯域制限及び雑音除去されたピクチャP’(i,j,t)における各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施し、入力動画像における各ピクチャについて同様に処理することにより、帯域制限及び雑音除去された出力動画像を生成し外部に出力する(ステップS7)。
以上のように、本実施形態の画像処理装置1は、動画像の圧縮符号化処理の前処理として利用し、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定することができるので、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となる。
(応用例)
上述した実施形態の例では、空間ウェーブレットパケット分解部11及び空間ウェーブレットパケット分解部14において、n=2とした2階空間ウェーブレットパケット分解で動作するときの例を主として説明したが、n≧3以上とすることもできる。例えば、図8に示すように、n=3とした3階空間ウェーブレットパケット分解で動作させることもできる。図8では放送カメラで撮像された所謂8K/60Pの動画像(水平解像度8K(7680画素)×垂直解像度4K(4320画素))を処理対象とした例である。尚、図8に示す例では、雑音パワー検出部12は、ピクチャP’(i,j,t)の各周波数帯域群のうち空間対角最高周波数帯域(本例ではn=3としており、空間HH16(i,j,t))の成分(周波数分解係数)を基に雑音パワーを検出する。n=3とした空間方向を処理対象とする3階空間ウェーブレットパケット分解を用いる画像処理装置1では、より細かく雑音パワー、時間パワー変動量及び時間パワーマッチング量を設定した縮退関数で、動画像に対し雑音除去及び帯域制限を行うことができる。
以上の実施形態における画像処理装置1は、コンピューターにより構成することができ、画像処理装置1の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、画像処理装置1の各処理部を制御するための制御部をコンピューター内の中央演算処理装置(CPU)で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも1つのメモリで構成させることができる。即ち、そのようなコンピューターに、CPUによって該プログラムを実行させることにより、画像処理装置1の各処理部の有する機能を実現させることができる。更に、画像処理装置1の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納させることができる。そのような記憶部は、装置内部のRAM又はROMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。更に、そのようなコンピューターに、画像処理装置1の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、画像処理装置1の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。
以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述の実施形態の例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した実施形態の例では、主として、2階又は3階空間ウェーブレットパケット分解に基づく空間ウェーブレット縮退を用いて雑音除去及び帯域制限を行う例を説明したが、4階以上の空間ウェーブレットパケット分解に基づいた空間ウェーブレット縮退を用いて雑音除去及び帯域制限を行う処理とすることもできる。従って、本発明に係る画像処理装置1は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。
本発明によれば、動画像の圧縮符号化処理の前処理として本発明に係る画像処理装置を利用することで、その入力動画像の符号化難易度を時空間解析で予測しながら、入力動画像の各フレーム画像における周波数領域の空間位相位置毎に雑音除去及び帯域制限を行う縮退関数を適応的に設定し、後段の圧縮符号化処理における画像破綻を抑制することができ、動画像符号化品質を向上させることが可能となるので、特に、動画像符号化を要する用途に有用である。
1 画像処理装置
11 空間ウェーブレットパケット分解部
12 雑音パワー検出部
13 時間パワー変動量検出部
14 空間ウェーブレットパケット分解部
15 時間パワーマッチング量検出部
16 縮退関数設定部
17 空間ウェーブレット縮退部
18 再構成部

Claims (4)

  1. 動画像を入力しウェーブレットパケット分解に基づくウェーブレット縮退を用いて画像処理を行う画像処理装置であって、
    当該動画像における処理対象のピクチャを入力し、n階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数を抽出する空間ウェーブレットパケット分解部と、
    前記処理対象のピクチャに関する前記空間方向の各周波数帯域群のうち空間対角最高周波数帯域の周波数分解係数を抽出し、当該空間対角最高周波数帯域内の全周波数分解係数のパワーにおける予め定めた割合以上となるパワーを雑音成分とみなし雑音パワーとして検出する雑音パワー検出部と、
    前記処理対象のピクチャに関する前記空間方向の各周波数帯域群を基準に、前記処理対象のピクチャが属するフレーム画像に連続する直近の1枚のフレーム画像における対応する空間位置のピクチャを用いて時間方向に1階ウェーブレットパケット分解を行い、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出する時間パワー変動量検出部と、
    前記処理対象のピクチャに関する当該雑音パワー及び当該空間位相位置毎の時間パワー変動量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定する縮退関数設定部と、
    前記処理対象のピクチャに関する各周波数帯域群の周波数分解係数に対し前記縮退関数を適用して空間ウェーブレット縮退処理を実行することにより、当該空間ウェーブレットパケット分解処理に基づく空間ウェーブレット縮退処理を行う空間ウェーブレット縮退部と、
    前記処理対象のピクチャに関して前記空間ウェーブレット縮退処理によって帯域制限及び雑音除去された各周波数帯域群の周波数分解係数を用いて空間ウェーブレット再構成処理を施すことにより、当該動画像における各ピクチャについて帯域制限及び雑音除去された出力動画像を生成する再構成部と、
    を備えることを特徴とする画像処理装置。
  2. 前記時間パワー変動量検出部は、各空間位相位置を中心とする所定ブロックサイズのブロックを基に、前記処理対象のピクチャに関する空間位相位置毎の時間パワー変動量を検出することを特徴とする、請求項1に記載の画像処理装置。
  3. 所定の圧縮符号化処理に係る参照ピクチャセットの情報を基に、当該処理対象のピクチャに対して符号化参照されることになる1枚以上の参照ピクチャを入力し、該参照ピクチャに対しn階(n≧2)の空間ウェーブレットパケット分解処理を施し、空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャを生成する第2の空間ウェーブレットパケット分解部と、
    前記処理対象のピクチャに関する前記空間方向の各周波数帯域群における各空間位相位置について、各空間位相位置を中心とする所定ブロックサイズのブロック毎に、前記空間方向の各周波数帯域群の周波数分解係数で表される参照ピクチャに対するブロックマッチングを行い、最小の類似度評価指数を示すマッチング量を探索し、当該最小となるマッチング量を前記処理対象のピクチャに関する空間位相位置毎の時間パワーマッチング量として検出する時間パワーマッチング量検出部と、を更に備え、
    前記縮退関数設定部は、前記処理対象のピクチャに関する当該雑音パワー、当該空間位相位置毎の時間パワー変動量、及び当該空間位相位置毎の時間パワーマッチング量を基に、前記雑音パワーは雑音除去する縮退関数の入力値範囲を規定するものとし、前記時間パワー変動量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとし、前記時間パワーマッチング量はその値が大きいほど帯域制限量に相当する縮退関数の傾きを小さくするものとして、前記処理対象のピクチャに関する全ての周波数帯域群における空間位相位置毎に縮退関数を設定することを特徴とする、請求項1又は2に記載の画像処理装置。
  4. コンピューターを、請求項1から3のいずれか一項に記載の画像処理装置として機能させるためのプログラム。
JP2019088513A 2019-05-08 2019-05-08 画像処理装置及びプログラム Active JP7303661B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019088513A JP7303661B2 (ja) 2019-05-08 2019-05-08 画像処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019088513A JP7303661B2 (ja) 2019-05-08 2019-05-08 画像処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020184693A JP2020184693A (ja) 2020-11-12
JP7303661B2 true JP7303661B2 (ja) 2023-07-05

Family

ID=73044619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019088513A Active JP7303661B2 (ja) 2019-05-08 2019-05-08 画像処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7303661B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115456918B (zh) * 2022-11-11 2023-03-24 之江实验室 一种基于小波高频通道合成的图像去噪方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010232892A (ja) 2009-03-26 2010-10-14 Nippon Hoso Kyokai <Nhk> スレッショルド関数制御型ウェーブレットシュリンケージ雑音除去装置及びプログラム
JP2010239296A (ja) 2009-03-30 2010-10-21 Nippon Hoso Kyokai <Nhk> 動画像雑音除去装置、動領域画像雑音除去装置、動画像雑音除去プログラム、及び動領域画像雑音除去プログラム
JP2018173857A (ja) 2017-03-31 2018-11-08 日本放送協会 帯域制限装置及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010232892A (ja) 2009-03-26 2010-10-14 Nippon Hoso Kyokai <Nhk> スレッショルド関数制御型ウェーブレットシュリンケージ雑音除去装置及びプログラム
JP2010239296A (ja) 2009-03-30 2010-10-21 Nippon Hoso Kyokai <Nhk> 動画像雑音除去装置、動領域画像雑音除去装置、動画像雑音除去プログラム、及び動領域画像雑音除去プログラム
JP2018173857A (ja) 2017-03-31 2018-11-08 日本放送協会 帯域制限装置及びプログラム

Also Published As

Publication number Publication date
JP2020184693A (ja) 2020-11-12

Similar Documents

Publication Publication Date Title
US7548660B2 (en) System and method of spatio-temporal edge-preserved filtering techniques to reduce ringing and mosquito noise of digital pictures
JP3714944B2 (ja) 画像符号化装置および画像復号装置
US7804896B2 (en) Content adaptive noise reduction filtering for image signals
JP6729170B2 (ja) 画像処理システム及び画像復号装置
US8380001B2 (en) Edge adaptive deblocking filter and methods for use therewith
JP2003244702A (ja) ブロッキング効果を除去するためのフィルタリング方法及びその装置
IL230271A (en) Signal processing and inheritance in a layered signal quality hierarchy
JP2006229411A (ja) 画像復号化装置及び画像復号化方法
JP7303661B2 (ja) 画像処理装置及びプログラム
JP6915473B2 (ja) 符号化装置及びプログラム、復号装置及びプログラム、並びに、画像処理システム
JP7290985B2 (ja) 画像処理装置及びプログラム
Del Corso et al. MNR: A novel approach to correct MPEG temporal distortions
JP7290968B2 (ja) 画像処理装置及びプログラム
JP7071216B2 (ja) 帯域制限装置及びプログラム
JPH08191444A (ja) ビデオ信号復号化装置
JP2005197879A (ja) 映像信号符号化装置
Kumar et al. A Novel Blurring based Method for Video Compression
JP2022041172A (ja) 帯域制限装置及びプログラム
JP2007538451A (ja) 復号化ビデオにおいてアーチファクトを削減するアルゴリズム
JP2007104515A (ja) 映像符号化プレフィルタリング方法、映像符号化プレフィルタリング装置、映像符号化プレフィルタリングプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
Martínez-Rach et al. Perceptually enhanced encoder for high definition video content

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230623

R150 Certificate of patent or registration of utility model

Ref document number: 7303661

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150