JP4194479B2 - 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 - Google Patents

画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP4194479B2
JP4194479B2 JP2003390752A JP2003390752A JP4194479B2 JP 4194479 B2 JP4194479 B2 JP 4194479B2 JP 2003390752 A JP2003390752 A JP 2003390752A JP 2003390752 A JP2003390752 A JP 2003390752A JP 4194479 B2 JP4194479 B2 JP 4194479B2
Authority
JP
Japan
Prior art keywords
value
block
spatial differential
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003390752A
Other languages
English (en)
Other versions
JP2005159419A5 (ja
JP2005159419A (ja
Inventor
秀昭 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003390752A priority Critical patent/JP4194479B2/ja
Priority to US10/988,567 priority patent/US7382932B2/en
Publication of JP2005159419A publication Critical patent/JP2005159419A/ja
Publication of JP2005159419A5 publication Critical patent/JP2005159419A5/ja
Priority to US12/106,627 priority patent/US7542623B2/en
Application granted granted Critical
Publication of JP4194479B2 publication Critical patent/JP4194479B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Description

本発明は静止画像又は動画像を複数のブロックに領域分割し、ブロック毎に符号化処理を行う画像符号化方式を用いた場合の画質評価、並びに、高画質化技術に関するものである。
デジタル画像の有効利用のためには効率的に記憶、伝送する必要があり、画像データの圧縮符号化は必須技術と言える。画像データを圧縮する方法としては、画像符号化の標準符号化方式であるJPEG(Joint Photographic Experts Group)やMPEG(Motion Picture Experts Group)で知られているように、圧縮対象となる画像データについてブロック分割して、動画像の場合には必要に応じて動き補償を用いて画像間予測によって差分信号を生成し、該ブロック単位に離散コサイン変換(以下DCTと呼ぶ)等の直交変換を用いて直交変換係数(以下DCT係数と呼ぶ)に変換してエントロピー符号する方式が一般的に知られている。これは直交変換を用いることにより相関性の強い画像信号は周波数軸上では低周波領域に集中して分布するという、画像の持つ相関性を積極的に利用するものである。
例えばJPEGやMPEGにおいて、原画像は通常8×8画素のブロックに分割され、ブロック毎に2次元DCTを行う。そして符号量を減らすために、DCT係数に対して量子化テーブルと量子化スケール値を用いて量子化を行う。この際、人間の視覚特性を考慮して視覚的に敏感な低周波成分については小さい量子化テーブル値を用いて量子化し、鈍感な高周波成分については大きな量子化テーブル値で量子化を行うことによって、視覚的な劣化が少なく効率的に量子化を行い、量子化されたDCT係数(以下量子化DCT係数と呼ぶ)を得ることができる。また、出力される画像の符号量を一定の範囲に収めるために、現在のビットレートや総符号量により変化する量子化スケール値を用いて量子化する方式が一般的に用いられている。
ここで動画像や静止画像を大きな解像度で、かつ長時間(静止画像の場合には多くの枚数)フラッシュメモリ等の限られた容量の記憶装置に記憶する場合、圧縮率を大きくすることで単位時間あたりのデータサイズであるビットレートを下げる必要が生じる。
このようなビットレートを下げるための手法として量子化スケール値を大きくすることで値がゼロとなる量子化DCT係数を増加させる手法が一般的に用いられ、この量子化処理を行うことでエントロピー符号化においてより効率的な圧縮を行うことができる。
しかし、ブロック単位で周波数変換を行ったDCT係数に対して量子化を行うために、量子化スケール値を大きくして粗く量子化を行った場合にはブロックの境界において大きな歪、いわゆるブロック歪が生じてしまい、画質劣化が顕著になるという問題点がある。このようなブロック歪を低減させる手法としてローパスフィルタ(以下LPFと呼ぶ)等のフィルタを用いる手法が一般的に用いられている。復号化装置の出力に対してLPFを用いればこのブロック歪を効果的に削減できるが、このような復号化装置における処理はJPEG、MPEG等の画像符号化国際標準の内容からは逸脱し、特定の復号化装置でしか実現することができない。JPEG、MPEG等の画像符号化国際標準に準拠した一般的なソフトウェアに実装されているような復号化装置で処理される事を想定する場合には、ブロック歪の発生を抑制するような処理を符号化装置内において行う必要がある。
符号化装置においてブロック歪の発生を抑制する手段としては、量子化パラメータを適応的に変化させる方法、符号化の前段に位置する画像処理部におけるフィルタ処理装置のフィルタ特性を変化させる方法が一般的に用いられている。
量子化パラメータを適応的に変化させる方法としては1つの画像内においてブロック歪を検出し、ブロック歪が生じている部分は量子化スケール値を小さくし、ブロック歪がほとんど生じていない部分は量子化スケール値を大きくすることで、所望のビットレートを実現しながらブロック歪の発生を抑制する方法が一般的に用いられている。このように量子化パラメータを変化させる場合にはブロック歪を正確に検出する必要が生じ、検出を誤った場合にはブロック歪が増加してしまう場合がある。
またブロック歪低減のために符号化装置前段に位置する画像処理部内のフィルタ処理装置を用いる場合、一般的にフィルタはLPFが用いられる。これは一般的にブロック歪は高周波成分を多く含むためであり、LPFを用いることによりブロック歪が発生する高周波成分を予め低減するためでもる。同時に高周波成分の値がゼロでない量子化DCT係数を減少させることができ、エントロピー符号化の符号化効率を向上させることができる。このようにLPFを用いることにより復号画像のブロック歪の低減が可能となる。
符号化装置においてLPFを用いる場合の問題点としてブロック歪が生じていない場合にLPFを適用すると、原画像の高周波成分を削ってしまうことにより画質がボケてしまうという問題、物体のエッジにて境界が滑らかでなくなる、いわゆるモスキートノイズが生じてしまい、フィルタ処理をしない場合よりも画質が劣化してしまうという問題がある。
以上の理由から低ビットレートにおける画質劣化を最小限に抑えるためにはブロック歪による画質劣化を正確に定量評価し、その結果から適応的に量子化パラメータや、フィルタ特性を決定する必要がある。
ブロック歪検出手法の第一の従来手法としては、符号化時の量子化パラメータよりブロック歪等の出現を予測するものがある(特許文献1)。また第二の従来手法としては、ビデオコーデックにおける後処理フィルタの制御方式においては復号した画像についてブロック内における隣接画素との差分値とブロック境界における隣接画素との差分値を比較してブロック歪を検出するものがある(特許文献2)。そして、第三の従来手法としては、原画像と復号画像との誤差を計算し、まず誤差がある閾値以下ならば0とみなす。そして誤差がある一定以上ならばブロック境界において隣接画素との差分値を計算し、各ブロック境界についてブロック辺の長さだけの自乗平均を取ったものを計算する。人間の視覚特性を考慮して、前記自乗平均の結果とブロック内の輝度の分散値との比を、各ブロックのブロック歪の定量評価尺度としている(特許文献3)。
特開2003−018600公報 特開平7−38762号公報 特開平5−219384号公報
しかしながら、上記第一の従来手法において、ブロック歪は対象となる画像によって生じやすさが異なるために、量子化スケール値とブロック歪発生の関係を正確に予測するのは困難である。よって量子化スケール値からブロック歪の発生を予測する場合には精度が低く、誤判定が生じてしまうという問題がある。この誤判定が生じてしまった場合には前述のように量子化パラメータの変更やフィルタ特性の変更等により、かえって画質が悪化してしまう等の問題点がある。
また前記第二の従来手法においては復号画像のみで判定を行うのでブロック境界と物体のエッジが一致した場合にブロック歪が生じていないにも関わらず、物体のエッジをブロック歪と誤判定してしまうという問題がある。
また前記第三の従来手法においてはブロック境界のみの値で判断をしているので、画面全体で劣化が生じているのか、ブロック境界においてブロック歪のみが顕著に生じているかの判断が難しくなる。また自乗平均を計算し、かつブロック内の輝度分散値との比を計算しているために、計算が複雑であり、ハードウェアでの実現が困難であるという問題点がある。
本発明は係る問題点に鑑みなされたものであり、簡単な構成により符号化画像データより得られた復号画像のブロック歪みを客観的に評価するための情報を生成する技術を提供しようとするものである。
この課題を解決するため、例えば本発明の画像処理装置は以下の構成を備える。すなわち、
設定された符号化パラメータによる量子化スケールに基づいて原画像データを圧縮符号化し、得られた符号化データで表わされる復号画像の画質を評価するための情報を生成する画像処理装置であって、
前記原画像データを、複数画素で構成されるブロック単位に、設定された符号化パラメータに従って圧縮符号化する符号化手段と、
該符号化手段で得られた符号化データを復号することで復号画像データを生成する復号手段と、
前記原画像データに対して、隣接する画素の差分値を演算することにより、第1の空間微分値を算出する第1の空間微分演算手段と、
前記復号画像データに対して、隣接する画素の差分値を演算することにより、第2の空間微分値を算出する第2の空間微分演算手段と、
前記第1の空間微分値と、該第1の空間微分値と空間上対応する前記第2の空間微分値との誤差値を演算することにより、前記符号化手段で符号化された画像のブロック歪みの指標となる評価情報を演算する評価情報演算手段とを備える。
本発明の構成によれば、ブロック単位の圧縮符号化技術を利用した符号化データに基づく画像のブロック歪を定量評価するための情報を得ることができる。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
図1は、実施形態における画像処理装置のブロック構成図である。
図示において、100は本実施形態の主要部分であるブロック歪み評価部であって、内部には空間微分器101、102、及び評価情報演算部103を含むものである。104は符号化対象の原画像を入力する画像入力部であって、イメージスキャナ、或いはデジタルカメラ等から無圧縮の画像データを入力するものである。105は入力した原画画像を記憶する画像記憶部105である。106は画像記憶部105に記憶された原画像データを圧縮符号化する圧縮符号化部、107は圧縮符号化部106で圧縮符号化する際の符号化パラメータを入力する符号化パラメータ入力部である。108は圧縮符号化したデータを復号し、復号画像を生成する復号部である。109はブロック歪み評価部100からの情報を出力する出力部である。
<第1の実施形態>
上記構成において、ブロック歪み評価部100におけるブロック歪の定量評価指標の算出方法を以下に説明する。
なお、実施形態では、ブロック歪の定量評価指標をBND(Blocking Noise Degree)と表し、当該画素の画面内の主走査(水平)画素位置i、副走査(垂直)画素位置j(以下画素位置(i,j)と表す)における水平方向のブロック歪の定量評価指標をBND_h(i,j)、垂直方向のブロック歪の定量評価指標をBND_v(i,j)と表す。また原画像は輝度成分及び色差成分を有しているが、ブロック歪の定量評価は輝度成分値のみを用いて行われるものとする。
先ず、原画像をX(画像記憶部105に記憶された画像)、復号部108で復号して得られた画像(復号画像)をYと定義する。そして、原画像X中の注目画素の画素値(輝度成分値)をX(i,j)と表現した場合、図12に示すような分布を有することになる。復号画像Yについても同様である。
そして、原画像Xの水平方向及び垂直方向の微分値X’_h(i,j)、X’_v(i,j)、並びに、復号画像Yの水平方向、垂直方向の微分値Y’_h(i,j)、Y’_v(i,j)を次のようにして求める。
X'_h(i,j) = X(i,j) - X(i+1,j)
X'_v(i,j) = X(i,j) - X(i,j+1)
Y'_h(i,j) = Y(i,j) - Y(i+1,j)
Y'_v(i,j) = Y(i,j) - Y(i,j+1) (式1)
そして、原画像Xと復号画像Yの各方向の定量評価指標値BND_h(i,j)、BND_v(i,j)を次の様に求める。
BND_h(i,j) = |X'_h(i,j) - Y'_h(i,j)|
BND_v(i,j) = |X'_v(i,j) - Y'_v(i,j)| (式2)
上記処理を行う、本第1の実施形態におけるブロック歪み評価部100では、上記の定量評価指標BND_h(i,j)及びBND_v(i,j)を求めるわけであるから、以下により詳しく説明する。
空間微分器101は原画像Xの空間微分値を算出するものであり、空間微分器102は復号画像Yの空間微分値を算出するものである。ただし、これら2つの空間微分器101、102は共に同じ画素位置の空間微分値を算出するため同期している。評価情報演算部103は、これら2つの空間微分器101、102の微分値を入力し、ブロック歪の定量評価指標BND_h(i,j)及びBND_v(i,j)を求める。
図1に示したブロック歪み評価部100の構成を、より具体的に示すのが図2である。ただし、図2は、水平方向の定量評価指標BND_h(i,j)を求める構成を示している。垂直方向の定量評価指標BND_h(i,j)を求める構成は、入力する画素の入力方向が垂直方向となるだけで実質的に同じであり、以下の説明から明らかなので省略する。
図2において、減算器201は原画像Xの水平1ライン中の隣接する2つの画素値の差分、すなわち、X'_h(i,j)を算出する。隣接する2画素の値を得るには、1画素分だけ遅延するラッチ(フリップフロップ)を用意し、このラッチを介さずに入力した画素データと、ラッチを介した画素データを利用すれば実現できる。
一方、減算器202も同様に、復号画像Yの水平1ライン中の隣接する2つの画素値の差分、すなわち、Y'_h(i,j)を算出する。減算器203は、減算器201、202からの出力値を減じることで、原画像X及び復号画像Yにおける水平方向の微分値の誤差を得る。この誤差は、この時点で正負の符号を有するものであるので、絶対値化器204で絶対値に変換することで、水平方向の評価指標値BND_h(i,j)を得る。
上記の如く、図2の構成は非常に単純な構成により水平方向の評価指標値BND_h(i,j)を得ることに成功していることが理解できよう。同様に、垂直方向の評価指標値BND_v(i,j)については、入力する画素が水平ラインでははく、垂直な列になる点で異なるものの、図2と同様の簡単な構成により得ることができる。また、同様の理由でソフトウェアで実現する場合にあっても、その処理は単純であるため非常に高速に処理できるのは明らかである。
さて、標準的な自然画像(例えばデジタルカメラやイメージスキャナで写真を読取った無圧縮の画像)を用いて実際に符号化処理を行い、符号化により生じた水平方向の空間微分値の誤差について測定したところ、図3のようになった。
図3はある静止画像について3種類の量子化スケール値を用いて符号化した場合の水平方向の空間微分値誤差と画素位置の関係を示している(16×16のマクロブロック分のみ抽出)。図3においてQは量子化スケール値を表している。また、画素位置の中心(画素位置=8)がブロック境界をまたいで空間微分を行った位置を表している。図3から分かるように量子化スケール値を大きくした場合(Q=24)、つまり粗く量子化を行い量子化誤差が大きく生じている場合、ブロック境界における空間微分値誤差がブロック内の値よりも突出してきている様子がわかる。このような場合においてはブロック境界にて顕著な歪、すなわちブロック歪が生じていることを示している。
ところで、量子化スケール値とブロック歪の発生の関係については画像に依存する(ブロック歪が発生しやすい画像と発生しにくい画像がある)ので一概に決定することができない。しかし、量子化スケール値を大きくするに従ってブロック境界における空間微分値誤差が突出してくるというのは他の画像について符号化処理を行った場合にも見られた現象であった。
上記のようなブロック境界に発生する歪みは、量子化スケール値に依存するものの、その一方で原画像によっても依存し、且つ、1つの原画像に着目したとしてもある部分では歪みが少なく、ある部分では歪みが大きいということもある。従って、ユーザは、原画像のデータサイズに対する符号化データサイズ(或いは圧縮率)と、符号化画像より得られた復号画像の評価指標値との兼ねないで、ユーザが望む符号化データを生成するため、上記の評価指標値を何らかの手段でユーザに提示することが望ましい。図13は実施形態における機能実現手段をパーソナルコンピュータ等の汎用情報処理装置に実装した場合におけるユーザインタフェースを示している。
図13において、1300はユーザインタフェースとなるウインドウを示している。1301は原画像のファイルを所在を入力するファイル名フィールドであり、無圧縮の画像を選択するものである。なお、ボタン1302をクリックすることで、ファイル選択のためのブラウザを表示し選択することも可能となっている。なお、ファイルの指定ではなく、イメージスキャナやデジタルカメラ等から無圧縮の画像を直接入力するようにしても良い。
1303は、指定された原画像を表示する表示領域であり、1304は原画像を圧縮符号化した後の復号画像を表示する領域である。なお、圧縮符号化後のファイルは原画像と同じパスに拡張子「jpg」として保存されるものとする。
1305は量子化テーブルを選択するためのものであり、ここではコンボボックス形式にした(量子化テーブルを選択するためであればいかなる形態でもよいのは勿論である)。すなわち、図示の右端をクリックすることで、予め登録された複数の量子化テーブルが表示され、ユーザはその中の1つを選択することで圧縮符号化時の量子化テーブルを決定することになる(デフォルトでは「量子化テーブル1」が選択)。1306は圧縮符号化の開始を指示するボタンであり、このボタン1306をクリックすることで、指定された原画像を、指定された量子化テーブルを利用してJPEG圧縮符号化を行い、その結果えられた圧縮符号化データを復号し、それを領域1304に表示することになる。
1307は歪み評価結果表示領域であって、実施形態では、先に説明したように水平方向、及び、垂直方向のブロック歪み評価指標値を演算するので、図示の如く2つの表示領域1308、1309を設けた。
以下、図13におけるウインドウ1300で示される評価アプリケーションの動作処理手順を図14のフローチャートに従って説明する。
先ず、ステップS1で原画像のファイル名を入力する(もしくは原画像を入力する)。この入力が行われると、図13の領域1303にその画像が表示される。なお、領域1303に対して原画像のサイズが大きいのが一般的であるから、間引き処理、複数画素の平均して1画素を生成する等を行い、縮小画像を生成して表示する。また、原画像のデータサイズを図示のように表示する。
次いで、ステップS2に進み、符号化パラメータ(実施形態では量子化テーブル)を決定する。これは図13におけるコンボボックス1305を操作することで行う。この後、ステップS3にて符号化開始ボタン1306がクリックされるのを待つことになる。
符号化の開始の指示があると、処理はステップS4に進み、指定(入力)された原画像を、そのときに指定された符号化パラメータ(量子化テーブル)に従って圧縮符号化処理を行う。圧縮符号化された画像データは、原画像と同じ位置、或いは予め設定された場所にJPEGファイルとして保存する。
圧縮符号化が完了すると、ステップS5に進み、作成された圧縮符号化データを復号し、その復号画像を領域1304に表示する。このときの表示処理そのものは原画像と同様にして表示する。そして、その際には、圧縮符号化したファイルのデータサイズも併せて表示する(圧縮率でも良いし、両方を表示しても良い)。
次いで、ステップS6に進み、先に説明した処理を行うことで水平、垂直方向の評価指標値を演算処理を行い、ステップS7にて演算した結果を視覚的に分かりやすいように画像化して領域1308、1309それぞれに表示する。このあと、ステップS8で処理を終えるとの指示があれば本処理を終えるが、圧縮符号化サイズ(或いは圧縮率)と歪みとの関係に不満がある場合には、ステップS2からの処理を繰り返すことになる。
上記処理中、ステップS7での処理について具体例を以下に説明する。実施形態では、JPEG符号化を例にしている。ここでDCT処理が8×8画素ブロックを単位に行っているとする。
個々のブロックのサイズが既知であるから、各ブロック間の境界位置も既知である。また、各ブロックには水平方向に隣接する2つのブロックが存在し、且つ、垂直方向にも2つのブロックが隣接することになる(画像の端のブロックは水平方向、垂直方向の少なくとも一方に隣接するブロックが存在しない)。
実施形態では、ブロック境界における歪み評価指標値を問題にしている。そこで、8×8画素ブロックの境界に位置する画素30画素以外の、内部の6×6画素領域の水平方向の評価指標値の平均値(以下、ブロック内水平評価指標値という)と、内部の6×6画素領域の垂直方向の評価指標値の平均値(以下、ブロック内垂直評価指標値という)を求める。そして、水平方向の境界に位置する左右の16個の評価値の平均値(以下、ブロック境界水平評価指標値という)、垂直方向の境界に位置する上下の16個の評価値の平均値(以下、ブロック境界垂直評価指標値という)を求める。
そして、ブロック境界水平評価指標値からブロック内水平評価指標値を減算した結果を、該当するブロックの水平方向のブロック歪み評価量として決定する。同様に、ブロック境界垂直評価指標値からブロック内垂直評価指標値を減算した結果をそのブロックの垂直方向のブロック歪み評価量として決定する。
このようにして得られた水平及び垂直方向のブロック非積み評価量を輝度情報として、図13における領域1308、1309それぞれに表示する。従って、ユーザは輝度が高いほど、そのブロック歪みが高いことを知ることができるので、他の符号化パラメータを選択する指標を得ることができるようになる。なお、ここでは輝度のグレイスケールで歪みを表現したが、色別で表現しても良い。
以上説明したように本実施形態によれば、画像を圧縮符号化した際に、その圧縮した結果を復号した復号画像が、原画像に対する客観的なブロック歪み量をユーザに知らしめることが可能となる。また、ユーザは、圧縮後のデータサイズや圧縮率と、ブロック歪みとの関係を着目しながらデータサイズと画質を決めることが可能になる。
なお、上記はパーソナルコンピュータ等の汎用情報処理装置にアプリケーションとして実装する例を示したが、例えばデジタルカメラ等に実装しても良い。デジタルカメラにおいては表示画面は限られたサイズであるので、図13のような表示は難しいので、それぞれの画像表示領域を適宜切り換える等を行うことになるであろう。
<第2の実施形態>
次に第2の実施形態を説明する。本第2の実施形態においては、水平方向及び数直方向のブロック歪の定量評価指標BND_h(i,j)、BND_v(i,j)を以下のようにして求める。
BND_h(i,j) = Dh(i,j)/(Dh_av)
BND_v(i,j) = Dv(i,j)/(Dv_av)
Dh(i,j)= |X'_h(i,j) - Y’_h(i,j)|
Dv(i,j)= |X'_v(i,j) - Y’_v(i,j)|
このBND_h(i,j)、BND_v(i,j)が大きい程ブロック歪が大きく生じていると言える。なお、Dh(i,j)、Dv(i,j)は、それぞれ水平、垂直方向の符号化処理による空間微分値誤差を表し、Dh_avはDh(i.j)に関して、同じブロック内の垂直位置が同じである画素についての空間微分値誤差の平均を計算したものである。Dv_avはDv(i,j)に関して同じブロック内の水平位置が同じである画素についての空間微分値誤差の平均を計算したものである。
第2の実施形態において空間微分値の計算は垂直方向、垂直方向を別々に、中心差分公式による数値微分を用いて行った。中心差分公式による数値微分を用いた場合、原画像の輝度値X(i,j)の水平方向の空間微分値X'_(i,j)、垂直方向の空間微分値X'_v(i,j)は以下のように得ることができる。復号画像についても同様である。
X'_h(i,j) = (X(i-1,j) - X(i+1,j))/2
X'_v(i,j) = (X(i-1,j) - X(i,j+1))/2
図4は本第2の実施形態におけるブロック歪の定量評価指標(水平方向のみ、垂直方向も同様の構成となる)の算出の構成を示している。
図示されるように減算器401、減算器402、除算器403、除算器404、減算器405、絶対値化器406、除算器407を含む。図4において減算器401、除算器403は中心差分方式を用いた数値微分演算を行うためにX(i−1,j)とX(i+1,j)の差分、および“2”による除算を行う。同様に減算器402、除算器404はY(i−1,j)とY(i+1,j)の差分、及び“2”による除算を行う。減算器405は空間微分値の符号化処理による誤差を計算するために、除算器403と除算器404の出力の差分を計算している。絶対値化器406は誤差を正の値に統一するための絶対値化を行い、当該ブロックの水平方向の空間微分値誤差Dh(i,j)を出力する。除算器407はブロック内での平均空間微分値誤差と当該画素における空間微分値である絶対値化器406との比を計算し、結果であるBND_h(i,j)を出力している。
本第2の実施形態において、ブロック境界におけるBND_h(i,j)が大きくなった場合に、ブロック境界における空間微分値誤差がブロック内の平均値よりも突出していることを表しており、ブロック歪が発生していると考えられる。実際に自然画を用いて符号化を行ったところ、おおよそBND_h(i,j)が“1.2”より大きくなった場合に視覚的にブロック歪が目立つようになる、ということが確認できた。前述したように量子化スケール値を大きくするに従ってブロック境界における空間微分値誤差が周辺画素における値に比べて突出してくるというのはどのような画像においてもほぼ見受けられる現象である。よってこのように、空間微分値誤差に関してブロック境界における値とブロック内における値とを相対的に比較することにより、対象となる画像に依存せず、より正確にブロック歪の発生を検出し、定量評価することが可能となる。なお、第2の実施形態においてはブロック内の空間微分値誤差を表す値として平均値を用いたが、より計算が簡単になるようにブロック内の中央値等を用いることもできる。
また、実際の評価結果の表示方法は、第1の実施形態における図13、図14に沿って行うものとし、その説明については省略する。かかる点は、以下に説明する各実施形態でも同様である。
<第3の実施形態>
第3の実施形態を説明する。本第3の実施形態においては、以下のように人間の視覚特性(空間微分値に関する)を考慮してブロック歪の評価指標の計算を行っている点を特徴とする。第3の実施形態における水平方向及び数直方向のブロック歪の定量評価指標BND_h(i,j)、BND_v(i,j)は以下のようにして求める。
BND_h(i,j) = Dh(i,j)/(α×X'_h(i,j) + β)
BND_v(i,j) = Dv(i,j)/(α×X'_v(i,j) + β)
このBND_h(i,j)、BND_v(i,j)が大きい程ブロック歪が大きく生じていると言える。ここで、空間微分値誤差Dh(i,j)、Dv(i,j)については第2の実施形態と、空間微分演算については第1の実施形態と同様の計算を行っている。また原画像の空間微分値に係る係数α及び固定値βは人間の視覚特性に関する空間微分値のブロック歪の定量評価指標への影響を示している。αが大きくなり、βが小さくなる場合に空間微分値のブロック歪の定量評価指標への影響が大きくなる。
図5は本第3の実施形態におけるブロック歪の定量評価指標(水平方向のみ、垂直方向についても同様の構成となる)の算出するための構成を示している。
図示されるように減算器501、減算器502、減算器503、絶対値化器504、乗算器505、加算器506、除算器507を含む。図5において減算器501、減算器502は前進差分方式による数値微分法を用いて原画像Xと復号画像Yについて水平方向の空間微分演算を行う。減算器503は空間微分値の符号化処理による誤差を計算するために、減算器501と減算器502の出力の差分を計算している。絶対値化器504は誤差を正の値に統一するための絶対値化を行い、当該ブロックの水平方向の空間微分値誤差Dh(i,j)を出力する。乗算器505において視覚特性を考慮するために原画像の空間微分値X'_h(i,j)と係数αとの乗算を行っている。加算器506においてはゼロによる割り算を防ぐために、乗算器505の出力と固定値βとの加算を行っている。除算器507は人間の視覚特性を考慮するために、絶対値化器504の出力と加算器506の出力との比を計算し、結果であるブロック歪の定量評価指標BND_h(i,j)を出力している。
本第3の実施形態においては、ブロック境界に大きな歪が生じ、かつブロック歪が目立ちやすい原画像の平坦部にブロック歪が生じている場合にBND_h(9i,j)が大きくなるので、視覚的な劣化として目立つブロック歪をより正確に検出することが可能となる。
また図5に示されているように、視覚特性として考慮に入れる原画像の空間微分値は減算器501の出力を用いることができるのでハードウェアでこのようなブロック歪定量評価器を実現する場合に少ない回路構成で実現できることがわかる。
<第4の実施形態>
本第4の実施形態においては、以下のように、人間の視覚特性(原画像の輝度値に関する)を考慮してブロック歪の定量評価指標の計算を行う。
先ず、本第4の実施形態において、水平方向及び数直方向のブロック歪の定量評価指標BND_h(i,j)、BND_v(i,j)を以下のようにして求める。
BND_h(i,j) = W_lum(i,j)×Dh(i,j)
BND_v(i,j) = W_lum(i,j)×Dv(i,j)
このBND_h(i,j)、BND_v(i,j)が大きい程ブロック歪が大きく生じていると言える。ここで、空間微分値誤差Dh(i,j)、Dv(i,j)については第2の実施形態と、空間微分演算については第1の実施形態と同様の計算を行っている。またW_lum(i,j)は原画像の輝度値X(i,j)に対応したブロック歪の定量評価指標に係る係数である。原画像の輝度値と係数の関係を図6に示す。図6に示されている関係は輝度値がある範囲内にある場合にはブロック歪が視覚的に目立ち、範囲外にある場合には目立ちにくいという人間の視覚特性を考慮して決定された。
図7は本第4の実施形態におけるブロック歪の定量評価指標(水平方向のみ、垂直方向についても同様の構成となる)の算出に係る構成を示している。図示されるように減算器701、減算器702、減算器703、絶対値化器704、記憶装置705、乗算器706を含む。
図7において減算器701、減算器702は前進差分方式による数値微分法を用いて原画像と復号画像について水平方向の空間微分演算を行う(垂直方向も同様であるので省略)。減算器703は空間微分値の符号化処理による誤差を計算するために、減算器701と減算器702の出力の差分を計算している。絶対値化器704は誤差を正の値に統一するための絶対値化を行い、当該ブロックの水平方向の空間微分値誤差Dh(i,j)を出力する。記憶装置705は、原画像の輝度値X(i,j)が入力されると図6に示されている対応した係数の値W_lum(i,j)を出力する。乗算器706は絶対値化器704から出力されるDh(i,j)に記憶装置705から出力される係数W_lum(i,j)を乗じ、結果であるBND_h(i,j)を出力する。
本第4の実施形態においては、ブロック境界に大きな歪が生じており、かつ輝度値がブロック歪の目立つ範囲内に存在する場合にBND_h(i,j)が大きくなるので、視覚的な劣化として目立つブロック歪をより正確に検出することが可能となる。
<第5の実施形態>
本第5の実施形態においては、人間の視覚特性(注目画素の画面内における位置に関する)を考慮してブロック歪の評価指標の計算を行うものである。本第5の実施形態において、水平方向及び数直方向のブロック歪の定量評価指標BND_h(i,j)、BND_v(i,j)は以下のように表す。
BND_h(i,j) = P_x(i,j)×Dh(i,j)
BND_v(i,j) = P_x(i,j)×Dv(i,j)
このBND_h(i,j)、BND_v(i,j)が大きい程ブロック歪が大きく生じていると言える。ここで、空間微分値誤差Dh(i,j)、Dv(i,j)については第2の実施形態と、空間微分演算については第1の実施形態と同様の計算を行っている。またP_x(i,j)は当該画素の画素位置(i,j)に対応したブロック歪の定量評価指標に係る係数である。当該画素の画面内における位置と係数の関係を図8に示す。図8の升目中の数字がマクロブロックの位置に対応したブロック歪の定量評価指標に係る係数P_x(i,j)を示しており、マクロブロック内においては全て同じ係数を用いる。図8は当該画素が画面内の中心に近い程ブロック歪が視覚的に目立ち、画面内の端に近い程目立ちにくいという人間の視覚特性を考慮して決定された。なお、図8はマス目の数が9×9であるが、勿論、これは原画像のサイズに応じたものとなる。要するに、画像の中心位置ほど、P_xの値を大きくするものであることは望ましいことを示している。
図9は本第5の実施形態におけるブロック歪の定量評価指標(水平方向のみ、垂直方向についても同様の構成となる)の算出する構成を示している。図示されるように減算器901、減算器902、減算器903、絶対値化器904、記憶装置905、乗算器906を含む。
図9において減算器901、減算器902は前進差分方式による数値微分法を用いて原画像と復号画像について水平方向の空間微分演算を行う。減算器903は空間微分値の符号化処理による誤差を計算するために、減算器901と減算器902の出力の差分を計算している。絶対値化器904は誤差を正の値に統一するための絶対値化を行い、当該ブロックの水平方向の空間微分値誤差Dh(i,j)を出力する。記憶装置905は、当該画素の画面内における位置(i,j)をアドレスとして入力されると図8に示される対応した係数の値P_x(i,j)を出力する。乗算器906は絶対値化器904から出力されるDh(i,j)に記憶装置905から出力される係数P_x(i,j)を乗じ、結果であるBND_h(i,j)を出力する。
本第5の実施形態においては、ブロック境界において大きな歪が生じており、画面の中心付近に存在する場合にブロック歪を示すBND_h(i,j)が大きくなるので、視覚的な劣化として目立つブロック歪を、より正確に検出することが可能となる。
<第6の実施形態>
本第6の実施形態は、動画像符号化装置において前記ブロック歪定量評価器を実装したものである。
図10は本第6の実施形態における動画像符号化装置のブロック構成図である。図示に示すように、本装置は、減算器1001、DCT演算器1002、量子化器1003、スキャン処理器1004、エントロピー符号化器1005、逆量子化器1006、逆DCT演算器1007、加算器1008、記憶装置1009、動き検出器及び動き補償器1010、記憶装置1011、ブロック歪定量評価器1012を含む。
図10において、減算器1001はフレーム内の情報のみで符号化を行うフレーム内符号化においては減算処理が実行されずにDCT演算器1002へ、入力の原画像データを出力する。一方、時間的に異なるフレームからの予測を行うフレーム間予測符号化においては、入力の原画像データから動き検出器及び補償器より出力される動き検出画像データを減算して、減算結果の予測誤差をDCT演算器1002へ出力する。
DCT演算器1002は、ブロック分割された入力データに対し、該ブロック単位にDCT変換を施し、DCT係数を量子化器1003へ出力する。量子化器1003は、ブロック内の位置に対応する量子化テーブル値と当該ブロックの量子化スケール値を用いてDCT係数を量子化し、全ての量子化DCT係数をスキャン処理器1004へ出力し、同時に逆量子化器1006に出力する。スキャン処理器1004は符号化モードに応じてジグザグスキャン、垂直スキャン及び水平スキャン等のスキャン処理を行う。エントロピー符号化器1005はスキャン処理器1004の出力をエントロピー符号化し、符号として出力する。
ここで第6の実施形態の動画像符号化装置においては動き検出及び動き補償を行うために、逆量子化器1006、逆DCT演算器1007を用いて局所復号化処理が行われる。
逆量子化器1006においては当該ブロックの量子化スケール値を用いて当該ブロックの量子化DCT係数の逆量子化が行われ、逆量子化係数を逆DCT演算器1007へ出力する。逆DCT演算器1007は逆量子化されたDCT係数に対し、該ブロック単位に逆DCT変換を施し、復号した予測誤差を加算器1008へ出力する。加算器1008は動き検出器及び動き補償器1010から出力された予測値と逆DCT演算器からの復号された予測誤差を加算することにより復号化された参照画像(復号フレーム)として記憶装置1009に記憶する。
ここで、動画像符号化装置に実装されたブロック歪定量評価器1012は記憶装置1011に記憶された原画像の輝度成分と、加算器1008から得られる復号画像の輝度成分を入力とする。そしてブロック歪定量評価手段を用いてブロック歪を定量評価し、結果であるブロック歪の定量評価指標を出力する。ここでブロック歪定量評価器は前記各実施形態のいずれの方式でも用いることが可能である。図10に示す通り、ブロック歪定量評価器の入力となる復号画像は一般的な動画像符号化方式における局所復号化装置により算出されるものなので、復号画像の計算のために特別な回路の増加を必要としない。よって動画像符号化装置において最小限の回路規模の増加でブロック歪定量評価器を実装することができ、以下に示すような高画質化処理を行うことが可能となる。
なお、評価量を確認する場合には、各フレーム毎の評価量を入力する動画像と同様に、歪みの大きい位置を高い輝度(或いは色を変える等)とする動画像として表示することになる。
一般的に動画は時間的な相関が強く、同じ符号化を行った場合には現在のピクチャにおけるブロック歪と次のピクチャにおいて生じるブロック歪の間にも強い相関がある。よって現在のピクチャの情報から次のピクチャに対するブロック歪の低減処理(ブロック歪を低減させる部分及び低減処理の強弱)を決定する。
図10においてはブロック歪定量評価器1012から出力される定量評価指標を量子化器1003にフィードバックし、ある一部のマクロブロックにのみブロック歪が生じている場合には次のピクチャにおいて同じ位置に相当するマクロブロックの量子化スケール値を小さくし、ブロック歪の生じていないマクロブロックの量子化スケール値を上げるというような処理を行うことで指定されたビットレートを保ちながら画面全体として生じるブロック歪を低減させることが可能となる。なお、予め複数の閾値を設け、マクロブロックのブロック歪みの指標値がどの閾値間にあるかに基づいて歪みレベルを求め、それに応じた量子化スケール値を選択するようにすれば実現できる。
動画像符号化装置においてこのような処理を行うことにより、低ビットレートで符号化し、MPEG等の動画像符号化国際標準に準拠した一般的な復号化装置によって復号した場合においても画質劣化を最小限に抑えることが可能となる。
<第7の実施形態>
第7の実施形態においては、デジタルビデオカメラ等の動画撮影装置に適用した例を説明する。
図11は本第7の実施形態における動画像撮影装置内の画像処理装置、及び動画像符号化装置をブロック図である。図示されるように本装置には、画像処理部1101、画像処理部内のフィルタ処理装置1102、動画像符号化装置1103、記憶装置1104、ブロック歪定量評価器1105を含む。
本第7の実施形態の動画撮影装置においては撮影光学系からの電気信号に対して画像処理部1101内部のフィルタ処理装置1102においてフィルタ処理を行ってから原画像を動画像符号化装置1103に出力する。ここでフィルタ処理の周波数特性を変化させることにより動画像符号化装置1103に入力される原画像の周波数特性を変化させることが可能である。
図11において動画像処理装置1103は第6の実施形態に示した動画像処理装置と同様の構成になっており、符号を出力すると同時に局所復号化装置から復号画像を出力する。
ブロック歪定量評価器1105は記憶装置1104に記憶した原画像の輝度成分、及び動画像符号化装置1103からの復号された復号画像を入力とする。そして第1乃至第5の実施形態のいずれかのブロック歪定量評価手段を用いて定量評価を行い、結果であるブロック歪の定量評価指標を画像処理部内のフィルタ処理装置1102へ出力する。フィルタ処理装置1102においては入力されたブロック歪定量評価指標(ブロック歪の発生している箇所、度合いの情報)を用いてフィルタ処理装置のフィルタの周波数特性を変化させる。このフィルタ処理はブロック処理の単位等に依存せず、ブロック境界を含んだ広い範囲等任意の範囲でフィルタ処理を変化させることが可能であり、ブロック境界に生じるブロック歪を低減させることが可能である。ブロック歪が大きく生じている部分には、次のピクチャの同じ部分に対してよりカットオフ周波数の低いローパスフィルタとなるようにフィルタ特性を変化させる。カットオフ周波数を下げることにより、動画像符号化装置に入力される原画像においてブロック歪が発生する周波数成分を含む高周波成分が予め低減され、かつエントロピー符号化部において符号化効率が向上する。結果として、復号画像におけるブロック歪を低減させることが可能となる。
このように動画像符号化装置においてブロック歪定量評価器1105を実装することにより正確にブロック歪を定量評価し、必要な場合にのみブロック歪低減処理を実行することができる。よって、低ビットレートで符号化し、MPEG等の動画像符号化国際標準に準拠した一般的な復号化装置によって復号した場合においても画質劣化を最小限に抑えることが可能となる。
<他の実施形態>
上記第1乃至第7の実施形態は、その基本構成として図1に示すように、空間微分器101で原画像の空間微分値を演算し、空間微分器102で復号画像の微分値を演算し、比較器103で、その2つの演算結果を受けて評価情報演算部103によって評価量を決定するものであった。
本発明はかかる点に限定されるものではない。すなわち、図15に示すように、先ず、原画像Xと復号画像Yとの差分を減算器1501により演算し、空間微分器1502にてその差分値の微分値を演算し、比較器1503にて評価量を決定するようにしても良い。
図16は、その具体的な構成例を示している。同図は水平方向の定量評価指標値BND_h(i,j)を得るための構成を示し、ちょうど先に説明した第1の実施形態に対応するものであり、第1の実施形態の変形例とするものである。
すなわち、減算器1601では原画像及び復号画像の注目画素位置(i,j)の差分値を演算し、その結果を出力する。また、減算器1602は、減算器1601からの値と、注目画素に隣接する画素位置(i+1,j)における原画像及び復号画像の差分値を減算することで、2つの画像の差分値の空間微分値(水平方向の微分値)を演算する。
ここで、減算器1601の減算結果をE、減算器1602の減算結果をE’として表現すると、減算器1601は、
E(i,j) = X(i,j) - Y(i,j)
を演算していることになる。
そして、減算器1602は、
E'(i,j) = E(i,j) - E(i+1,j)
= X(i,j) - Y(i,j) - {X(i+1,j) - Y(i+1,j)}
= {X(i,j) - X(i+1,j)} - {Y(i,j) - Y(i+1,j)}
= X'_h(i,j) - Y'_h(i,j)
となる。
この結果を絶対値化器1603にて絶対値とするわけであるから、絶対値化器1603の出力をSDE(Spatial Derivation of coding Error)としたとき、SDE(i,j)は、先の第1の実施形態におけるBND_h(i,j)と等価のものとなるのは明らかである。
SDE(i,j)は次に除算器1604に入力され、注目画素位置(i,j)が存在するブロックの平均SDE値(=SDEave)で除算し、その結果を本実施形態におけるBND_h(i,j)として出力する。なお、SDEaveを算出する際には、ブロックの境界の画素が除外し、それよりも内側に位置するSDEを利用してもよい。
ブロック歪みは図3に示すようにブロックの境界付近で発生しやすいわけであるから、実施形態におけるBND_h(i,j)はブロック境界付近では1よりも大きくなり易く、ブロック内では1近傍の値となることになるので、このBND_h(i,j)を歪みの評価量とすることが可能となる。垂直方向の評価量も同様にできるのは明らかである。
なお、この評価量のユーザへの報知方法は第1の実施形態と同様であるものとし、その詳細は省略する。
以下は、上記第2乃至第5の実施形態における変形例である。
図17は、第2の実施形態(図4)に対応するものである。図4では減算器401には原画像X中の画素データX(i−1,j)とX(i+1,j)が入力され、減算器402には復号画像Y中の画素データY(i−1,j)、Y(i+1,j)が入力されたのに対し、図17では減算器1701にはX(i−1,j)とY(i−1,j)が入力され、減算器1702にはX(i+1,j)とY(i+1,j)が入力される点であり、他は同じであるので説明は省略する。
図18は第3の実施形態の図5に対応するものである。ただし、減算器1805により原画像XのX(i,j)からX(i+1,j)を減じる構成と、SDEaveの概念を取り入れた点についての特徴を付加している点のみ異なる。それ以外のアルゴリズムについては、上記説明から明らかであるのでその詳述については省略する。
図19は第4の実施形態の図7に対応するものである。図19と図7との差は、入力するデータが異なる点と、図19ではSDEaveの概念を取り入れた点についての特徴を付加している点のみである。それ以外のアルゴリズムについては上記説明から明らかであるのでその詳述については省略する。
図20は第5の実施形態における図9に対応するものである。図20と図9との差は、入力するデータが異なる点と、図20ではSDEaveの概念を取り入れた点についての特徴を付加している点のみである。それ以外のアルゴリズムについては上記説明から明らかであるのでその詳述については省略する。
なお、図15に示す構成概念は、第6、第7の実施形態にも適用できるのはこれまでの説明からも明らかである。
また、以上各実施形態を説明したが、先に説明したように、汎用の情報処理装置で実行されるアプリケーションプログラムによって各実施形態の機能を実現できるのは明らかである。従って、本発明はかかるコンピュータプログラムをもその範疇とするのは明らかである。更に、通常、コンピュータ上で実行されプログラムは、CDROM等のコンピュータ可読記憶媒体をそのコンピュータにセットし、システムにコピーもしくはインストールするものであるから、このようなコンピュータ可読記憶媒体も本発明の範疇に入るのは明らかである。
実施形態におけるブロック歪定量評価装置の機能ブロック構成図である。 第1の実施形態における歪み評価装置のブロック構成図である。 第1の実施形態における画面内の位置とブロック歪定量評価指標の関係を示す図である。 第2の実施形態における歪み評価装置のブロック構成図である。 第3の実施形態における歪み評価装置のブロック構成図である。 第4の実施形態における原画像の輝度値とブロック歪定量評価指標の係数の関係を示す図である。 第4の実施形態における歪み評価装置のブロック構成図である。 第5の実施形態における注目画素の画面内の位置とブロック歪定量評価指標の係数の関係を示す図である。 第5の実施形態における歪み評価装置のブロック構成図である。 第6の実施形態における動画像符号化装置のブロック構成図である。 本第7の実施形態における動画像撮影装置内の画像処理装置及び動画像符号化装置のブロック構成図である。 注目画素と周辺画素の位置関係を示す図である。 第1の実施形態における評価結果を表示するためのアプリケーションウインドウを示す図である。 図13のアプリケーションの処理手順を示すフローチャートである。 実施形態におけるブロック歪定量評価装置の変形例の機能ブロック構成図である。 第1の実施形態の変形例の歪み評価装置のブロック構成図である。 第2の実施形態の変形例の歪み評価装置のブロック構成図である。 第3の実施形態の変形例の歪み評価装置のブロック構成図である。 第4の実施形態の変形例の歪み評価装置のブロック構成図である。 第5の実施形態の変形例の歪み評価装置のブロック構成図である。

Claims (17)

  1. 設定された符号化パラメータによる量子化スケールに基づいて原画像データを圧縮符号化し、得られた符号化データで表わされる復号画像の画質を評価するための情報を生成する画像処理装置であって、
    前記原画像データを、複数画素で構成されるブロック単位に、設定された符号化パラメータに従って圧縮符号化する符号化手段と、
    該符号化手段で得られた符号化データを復号することで復号画像データを生成する復号手段と、
    前記原画像データに対して、隣接する画素の差分値を演算することにより、第1の空間微分値を算出する第1の空間微分演算手段と、
    前記復号画像データに対して、隣接する画素の差分値を演算することにより、第2の空間微分値を算出する第2の空間微分演算手段と、
    前記第1の空間微分値と、該第1の空間微分値と空間上対応する前記第2の空間微分値との誤差値を演算することにより、前記符号化手段で符号化された画像のブロック歪みの指標となる評価情報を演算する評価情報演算手段と
    を備えることを特徴とする画像処理装置。
  2. 前記第1、第2の空間微分演算手段それぞれは、水平方向に隣接する画素の差分値、及び、垂直方向に隣接する画素の差分値の少なくとも一方を演算することを特徴とする請求項1に記載の画像処理装置。
  3. 前記評価情報演算手段は、前記原画像データ及び前記復号画像データの、水平方向のそれぞれの差分値及び垂直方向それぞれの差分値の少なくとも一方の誤差値を演算することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記評価情報演算手段は、更に、前記誤差値を、ブロック内の平均誤差値により除算することを特徴とする請求項3に記載の画像処理装置。
  5. 前記評価情報演算手段は更に、該誤差値と空間上対応する前記第1の空間微分値に基づいて前記評価情報を補正する補正手段を備えることを特徴とする請求項1に記載の画像処理装置。
  6. 前記補正手段は、前記誤差値を、該誤差値と空間上対応する前記第1の空間微分値で除算することにより前記評価情報を補正することを特徴とする請求項5に記載の画像処理装置。
  7. 前記第1、第2の空間微分演算手段は、画像データの輝度成分の差分値を演算し、更に、前記原画像データ中の注目画素の輝度値に応じて前記評価情報演算手段の演算結果を補正する補正手段を備えることを特徴とする請求項1乃至3のいずれか1つに記載の画像処理装置。
  8. 前記補正手段は、前記輝度成分の取り得る範囲を低、中、高輝度の3つの領域に分けた場合、
    前記中輝度領域では、前記低及び高輝度領域よりも大きな値の補正係数を用いて補正し、
    前記低輝度領域では輝度が低くなるほど、前記高輝度領域では輝度が高くなるほど小さくなる補正係数を用いて補正することを特徴とする請求項に記載の画像処理装置。
  9. 前記第1、第2の空間微分演算手段は、画像の輝度成分の差分値を演算し、
    更に、原画像データ中の注目画素の位置に応じて前記評価情報演算手段の演算結果を補正する補正手段を備えることを特徴とする請求項1乃至3のいずれか1つに記載の画像処理装置。
  10. 前記補正手段は、原画像の領域を中央部と周辺部に分けた場合、
    前記中央部では、前記周辺部よりも大きな値の補正係数を用いて補正し、
    前記周辺部では、画像の境界に近いほど小さな値の補正係数を用いて補正することを特徴とする請求項に記載の画像処理装置。
  11. 更に、原画像データ、復号画像データ、それぞれのデータサイズと符号化データの圧縮率の少なくとも一方、前記評価情報演算手段による演算結果を可視画像として表示する表示手段を備えることを特徴とする請求項1乃至10のいずれか1つに記載の画像処理装置。
  12. 更に、前記原画像データは動画像となる各フレームであって、前記評価情報演算手段の演算結果に基づいて各ブロックの評価情報を演算し、次フレームの該当する各ブロックの量子化スケール値を調整する手段を備えることを特徴とする請求項1に記載の画像処理装置。
  13. 前記符号化パラメータは、量子化スケール値であることを特徴とする請求項1乃至12のいずれか1つに記載の画像処理装置。
  14. 更に、前記原画像データは動画像となる各フレームであって、前記評価情報演算手段の演算結果に基づいて各ブロックの評価情報を演算し、次フレーム中の該当する各ブロックのローパスフィルタを周波数特性を決定する手段を備えることを特徴とする請求項1に記載の画像処理装置。
  15. 設定された符号化パラメータによる量子化スケールに基づいて原画像データを圧縮符号化し、得られた符号化データで表わされる復号画像の画質を評価するための情報を生成する画像処理装置の制御方法であって、
    符号化手段が、前記原画像データを、複数画素で構成されるブロック単位に、設定された符号化パラメータに従って圧縮符号化する符号化工程と、
    復号手段が、該符号化工程で得られた符号化データを復号することで復号画像データを生成する復号工程と、
    第1の空間微分演算手段が、前記原画像データに対して、隣接する画素の差分値を演算することにより、第1の空間微分値を算出する第1の空間微分演算工程と、
    第2の空間微分演算手段が、前記復号画像データに対して、隣接する画素の差分値を演算することにより、第2の空間微分値を算出する第2の空間微分演算工程と、
    評価情報演算手段が、前記第1の空間微分値と、該第1の空間微分値と空間上対応する前記第2の空間微分値との誤差値を演算することにより、前記符号化工程で符号化された画像のブロック歪みの指標となる評価情報を演算する評価情報演算工程と
    を備えることを特徴とする画像処理装置の制御方法。
  16. コンピュータに読込ませ実行させることで、設定された符号化パラメータによる量子化スケールに基づいて原画像データを圧縮符号化し、得られた符号化データで表わされる復号画像の画質を評価するための情報を生成するための画像処理装置として機能させるコンピュータプログラムであって、
    前記原画像データを、複数画素で構成されるブロック単位に、設定された符号化パラメータに従って圧縮符号化する符号化手段と、
    該符号化手段で得られた符号化データを復号することで復号画像データを生成する復号手段と、
    前記原画像データに対して、隣接する画素の差分値を演算することにより、第1の空間微分値を算出する第1の空間微分演算手段と、
    前記復号画像データに対して、隣接する画素の差分値を演算することにより、第2の空間微分値を算出する第2の空間微分演算手段と、
    前記第1の空間微分値と、該第1の空間微分値と空間上対応する前記第2の空間微分値との誤差値を演算することにより、前記符号化手段で符号化された画像のブロック歪みの指標となる評価情報を演算する評価情報演算手段と
    して機能させることを特徴とするコンピュータプログラム。
  17. 請求項16に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2003390752A 2003-11-20 2003-11-20 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 Expired - Fee Related JP4194479B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003390752A JP4194479B2 (ja) 2003-11-20 2003-11-20 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
US10/988,567 US7382932B2 (en) 2003-11-20 2004-11-16 Image processing apparatus and method, and computer program and computer-readable storage medium
US12/106,627 US7542623B2 (en) 2003-11-20 2008-04-21 Image processing apparatus and method, and computer program and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003390752A JP4194479B2 (ja) 2003-11-20 2003-11-20 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体

Publications (3)

Publication Number Publication Date
JP2005159419A JP2005159419A (ja) 2005-06-16
JP2005159419A5 JP2005159419A5 (ja) 2007-01-11
JP4194479B2 true JP4194479B2 (ja) 2008-12-10

Family

ID=34587453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003390752A Expired - Fee Related JP4194479B2 (ja) 2003-11-20 2003-11-20 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体

Country Status (2)

Country Link
US (2) US7382932B2 (ja)
JP (1) JP4194479B2 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060034531A1 (en) * 2004-05-10 2006-02-16 Seiko Epson Corporation Block noise level evaluation method for compressed images and control method of imaging device utilizing the evaluation method
JP4641892B2 (ja) * 2005-07-27 2011-03-02 パナソニック株式会社 動画像符号化装置、方法、及びプログラム
JP2007189657A (ja) * 2005-12-16 2007-07-26 Fuji Xerox Co Ltd 画像評価装置、画像評価方法及びプログラム
KR100882949B1 (ko) * 2006-08-17 2009-02-10 한국전자통신연구원 화소 유사성에 따라 적응적인 이산 코사인 변환 계수스캐닝을 이용한 부호화/복호화 장치 및 그 방법
JP4775202B2 (ja) * 2006-09-15 2011-09-21 ソニー株式会社 表示制御装置、表示制御方法、およびプログラム
JP5031419B2 (ja) * 2007-03-26 2012-09-19 三菱電機株式会社 符号化装置
US8036485B2 (en) * 2007-04-09 2011-10-11 Tektronix, Inc. Systems and methods for measuring loss of detail in a video codec block
US8229229B2 (en) * 2007-04-09 2012-07-24 Tektronix, Inc. Systems and methods for predicting video location of attention focus probability trajectories due to distractions
JP4958713B2 (ja) * 2007-10-04 2012-06-20 キヤノン株式会社 動画像符号化装置及びその制御方法
JP4539755B2 (ja) * 2008-04-11 2010-09-08 ソニー株式会社 情報処理システム及び情報処理方法、並びにプログラム
WO2009157402A1 (ja) 2008-06-26 2009-12-30 日本電気株式会社 コンテンツ再生制御システムと、その方法及びプログラム
WO2009157340A1 (ja) 2008-06-26 2009-12-30 日本電気株式会社 高品質コンテンツ生成システムと、その方法及びプログラム
EP2296379A4 (en) 2008-07-21 2011-07-20 Huawei Tech Co Ltd METHOD, SYSTEM AND DEVICE FOR EVALUATING A VIDEO QUALITY
JP2010087949A (ja) * 2008-10-01 2010-04-15 Nec Electronics Corp デコーダー検証装置およびデコーダー検証方法
US8347023B2 (en) * 2008-10-06 2013-01-01 Marvell World Trade Ltd. Compression based wear leveling for non-volatile memory
JP5495625B2 (ja) 2009-06-01 2014-05-21 キヤノン株式会社 監視カメラシステム、監視カメラ及び監視カメラ制御装置
JP2011066704A (ja) * 2009-09-17 2011-03-31 Konica Minolta Business Technologies Inc 画像復号装置
US9445129B2 (en) 2010-04-13 2016-09-13 Sun Patent Trust Image coding method and image decoding method
JP2012104945A (ja) * 2010-11-08 2012-05-31 Sony Corp 画像処理装置と画像処理方法およびプログラム
US8428375B2 (en) * 2010-11-17 2013-04-23 Via Technologies, Inc. System and method for data compression and decompression in a graphics processing system
JP5858332B2 (ja) * 2011-10-13 2016-02-10 株式会社リコー 用紙処理装置及び画像形成装置
US10231313B2 (en) * 2014-03-31 2019-03-12 Philips Lighting Holding B.V. System and method for improving occupancy determination
US10559106B2 (en) * 2015-11-16 2020-02-11 Huawei Technologies Co., Ltd. Video smoothing method and apparatus
JP7129326B2 (ja) 2018-12-14 2022-09-01 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
CN110428415B (zh) * 2019-08-05 2022-05-13 上海联影医疗科技股份有限公司 医学图像的质量评估方法、装置、设备及存储介质
CN111953939B (zh) * 2020-07-31 2021-06-22 中标慧安信息技术股份有限公司 提高监控视频存证正确率的方法及***

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR930003757A (ko) 1991-07-31 1993-02-24 오오가 노리오 영상 신호 전송 장치 및 방법
JP3144573B2 (ja) 1991-07-31 2001-03-12 ソニー株式会社 映像信号伝送装置
JP3105335B2 (ja) * 1992-02-07 2000-10-30 株式会社ハドソン 画像の直交変換符号化による圧縮・伸張方法
JP3288811B2 (ja) 1993-07-26 2002-06-04 日本無線株式会社 ビデオコーデックにおける後処理フィルタ制御方式及び後処理フィルタ制御回路
JP3365572B2 (ja) * 1993-11-15 2003-01-14 ソニー株式会社 画像信号処理方法
JP3540855B2 (ja) * 1995-03-08 2004-07-07 シャープ株式会社 ブロック歪み補正器
JP2002232889A (ja) 2001-01-31 2002-08-16 Sony Corp ブロック歪低減回路、再生装置、受信装置、ブロック歪低減方法
JP2003018600A (ja) 2001-07-04 2003-01-17 Hitachi Ltd 画像復号装置

Also Published As

Publication number Publication date
US20050111542A1 (en) 2005-05-26
US7382932B2 (en) 2008-06-03
US7542623B2 (en) 2009-06-02
US20080205788A1 (en) 2008-08-28
JP2005159419A (ja) 2005-06-16

Similar Documents

Publication Publication Date Title
JP4194479B2 (ja) 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP4723025B2 (ja) 画像符号化方法および画像符号化装置
US8588301B2 (en) Image coding apparatus, control method therefor and computer program
JP4820191B2 (ja) 動画像符号化装置及びプログラム
KR20090100402A (ko) 이미지 압축 및 압축해제
KR101090586B1 (ko) 부호화 장치/복호화 장치, 부호화 방법/복호화 방법 및 기록 매체
JP2012034213A (ja) 画像処理装置、画像処理システムおよび画像処理方法
KR20040069210A (ko) 코딩 정보 및 로컬 공간 특징을 이용한 디지털 비디오신호들의 후처리에서의 선명도 향상
JP2005525014A (ja) 符号化されたデジタルビデオのためのシャープネスエンハンスメントのシステムおよび方法
JP2009224854A (ja) 画像符号化装置及び方法
JP2004518337A (ja) ビデオエンハンスメントのために符号化情報に基づく有用メトリックを提供するための装置及び方法
JP5943733B2 (ja) 画像符号化装置およびその制御方法ならびにプログラム
US9635359B2 (en) Method and apparatus for determining deblocking filter intensity
JP6313614B2 (ja) 動画像符号化装置及びその制御方法
JP5913929B2 (ja) 動画像符号化装置及びその制御方法、コンピュータプログラム
JP6066583B2 (ja) 動画像符号化装置及び動画像符号化方法
JP2011004051A (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
KR100771138B1 (ko) 촬영 장치 및 영상 보정 방법
JP2022145499A (ja) 符号化装置及び方法
JP6012307B2 (ja) 動画像符号化装置及びその制御方法、並びに、プログラム
JP2022158242A (ja) 符号化装置及び方法
JP2006121131A (ja) ノイズ検出装置及びノイズ検出プログラム
JP5180911B2 (ja) ノイズ除去制御装置及びノイズ除去制御方法
JP2011166357A (ja) 画像符号化装置
JP2020057842A (ja) 画像符号化装置及びその制御方法及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061120

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080606

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080905

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080922

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111003

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121003

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131003

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees