JP2020058017A - 画像処理方法及びシステム - Google Patents

画像処理方法及びシステム Download PDF

Info

Publication number
JP2020058017A
JP2020058017A JP2019148771A JP2019148771A JP2020058017A JP 2020058017 A JP2020058017 A JP 2020058017A JP 2019148771 A JP2019148771 A JP 2019148771A JP 2019148771 A JP2019148771 A JP 2019148771A JP 2020058017 A JP2020058017 A JP 2020058017A
Authority
JP
Japan
Prior art keywords
noise
image
image data
signal
applying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019148771A
Other languages
English (en)
Other versions
JP2020058017A5 (ja
JP7512021B2 (ja
Inventor
カルステン ビュットナー
Buettner Carsten
カルステン ビュットナー
ローワン ダグラス ハーベル
Douglas Habel Rowan
ローワン ダグラス ハーベル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Blackmagic Design Pty Ltd
Original Assignee
Blackmagic Design Pty Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AU2018903448A external-priority patent/AU2018903448A0/en
Application filed by Blackmagic Design Pty Ltd filed Critical Blackmagic Design Pty Ltd
Publication of JP2020058017A publication Critical patent/JP2020058017A/ja
Publication of JP2020058017A5 publication Critical patent/JP2020058017A5/ja
Application granted granted Critical
Publication of JP7512021B2 publication Critical patent/JP7512021B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/60Noise processing, e.g. detecting, correcting, reducing or removing noise
    • H04N25/63Noise processing, e.g. detecting, correcting, reducing or removing noise applied to dark current
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • H04N23/81Camera processing pipelines; Components thereof for suppressing or minimising disturbance in the image signal generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/80Camera processing pipelines; Components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • H04N25/60Noise processing, e.g. detecting, correcting, reducing or removing noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

【課題】圧縮アーティファクトに対処するための方法を提供する。【解決手段】周波数領域に表される画像データを処理する方法であって、ノイズ信号を画像データ100に印加してノイズ印加画像データ170を生成するステップを含む。画像データは離散コサイン変換の適用から生じる1以上の係数のセットを含み、係数の各セットはDC係数と1以上のAC係数を含む。ノイズ信号は1以上のセットの1以上の係数を変更することにより画像データに印加される。【選択図】図3

Description

本発明は画像データ処理方法及びシステムに関する。特に、本発明はノイズを含む画像データの圧縮及びその解凍のための方法及びシステムに関する。
デジタルカラーカメラは、通常、電荷結合素子(CCD)や相補型金属酸化膜半導体(CMOS)センサであるイメージセンサを使って、現実シーンのカラー画像を電子的に捕捉する。画像を含むデータは多くの場合カメラ内で処理され、カメラの内部記憶部に記憶させるために、あるいはカメラから外部メディアの記憶部へ転送するために及び/又は下流での処理のためにコード化される。
デジタル画像の捕捉は光電変換プロセスを伴うものであり、それによりノイズを画像データに取り込む。ノイズは画像が生成されるとほとんどその時点から画像に取り込まれるため、ノイズは必然的にノイズを含まない画像の成分と同じ画像処理や符号化処理を受けることになる。離散コサイン変換(DCT)に関わる符号化技術のために(特にその技術が高い圧縮率で適用されるものなので)高い周波数画像成分が除去される傾向となり、符号化画像にブロックタイプ構造として現れる。DCT符号化を通してノイズ成分が除去されることで符号化画像に表現された表面に「プラスチック」の外観を与え得る。その結果、構造的な細部が明確でない画像エリアは高い周波数が除去されることにより、かつ歪んだ空間ノイズ特性に起因して外観が「不自然」になり得る。
通常の画像に存在する避けることのできないノイズを処理するために数多くの技術が存在する。これらの技術は信号処理によるアプローチを含むとともに、圧縮アーティファクトを減衰させることを目的とした、画像が復号化された後に適用されるデブロッキングフィルタ等の様々のカテゴリのフィルタリングを用いるアプローチを含む。一般的に、そのようなフィルタリングはブロックタイプアーティファクトの可視化を低減するものである。
本発明はそのような圧縮アーティファクトに対処するための方法を提供することを目的とする。
明細書に記載の従来技術の参照は、その従来技術が常識の一部であることを裁判管轄を問わず承認又は示唆されるものではなく、あるいはその従来技術が当業者によって従来技術の別の部分に関連すると見なされ、及び/又はそれと組み合わされると見なされると合理的に予測できることが承認又は示唆されるものではない。
本発明の第1の態様によれば、周波数領域に表れる画像データを処理する方法が提供され、該方法は該画像データにノイズ信号を印加してノイズ印加画像データを生成するステップを含む。
本発明はノイズを減衰させたり又は完全に取り除くのではなく、むしろ画像にノイズ信号を印加することによって画像処理に対して直感に反するように思われるアプローチを行う。
本発明は画像ノイズのある成分や強度が実際にはそれを見る人にとって知覚的に快適であり、又、見ている画像のより現実的な属性として感じられるという観察結果から生まれた。これは特に動画を見ている場合に起こる。より具体的には、フォトンショットノイズの特定の分布によって占められる画像ノイズは観察者にとって知覚的に快適に感じられる。この知覚的に快適な画像ノイズは、通常圧縮プロセスの中で失われたり、歪められたりするので、本発明は特定の空間的かつ時間的なノイズ分布が復号化画像にうまく反映されるようにそれらを再生することを目的とする。
通常、周波数領域で表される画像データは離散コサイン変換の適用により生じる1以上の係数のセットを含み、各係数のセットはDC係数と1以上のAC係数を含む。この実施例によれば、1以上のセットの1以上の係数を変更することでノイズ信号を画像データに印加することができる。
そのような修正は、場合により、1以上のAC係数をある分布を有する疑似乱数に置換することであっても良い。この実施例によれば、置換されたAC係数がゼロ値を有する場合もあり得る。
好ましい実施例によれば、該方法は、ノイズ信号を印加するステップの前に実行される、画像データに存在するノイズを均一化するステップをさらに含む。この実施例では、画像データのうち圧縮されなかった空間表現に対して均一化ステップが実行される。通常、均一化ステップはその振幅又は標準偏差が画像データ全般に亘ってほぼ一定となるようにノイズを均一化する。
該ノイズはノイズモデルを参照して均一化することが可能であり、該ノイズモデルは画像データを捕捉するために使われた特定のイメージセンサによって実行される光電子変換のモデルとなり得る。例えば該ノイズモデルは画像データ内の時空間分布を参照してノイズを特徴づけることができる。該ノイズモデルは光電変換に関連するフォトンショットノイズ及び/又は読出しノイズも構成する。
実施例によれば、該ノイズモデルは実質的には正規分布を示す。
実施例によれば、画像データに印加されるノイズ信号は該ノイズモデルを参照してスケーリングされる。
選択的に、該方法は圧縮画像をエントロピー復号化するとともに、ノイズ信号の印加の前に画像ファイルに逆量子化を適用するステップを含む。
該方法はさらに逆離散コサイン変換を適用するステップを含む。
別の実施例によれば、イメージセンサから取得されたある振幅を有するあるノイズ成分とある振幅を有するある画像成分を含む画像信号を処理する方法を提供し、該方法は:
イメージセンサの特性から変換関数を決定し;及び
該変換関数を該画像信号に適用して画像成分の振幅から独立した略一定の振幅のノイズ成分を有する信号を生成する、ことを含む。
ノイズ成分の「振幅」とはノイズ成分の値ではなく、むしろノイズ成分の統計的尺度の振幅のことを指している。
該方法はさらに画像データを周波数領域表現に変換するステップを含む。実施例によれば、該変換は離散コサイン変換を該画像データに適用することを含む。
該方法はさらに該変換された画像データを量子化するとともに量子化された画像ファイルをエントロピー符号化するステップを含んでも良い。
本発明の一実施例を、添付図面を参照して説明する。
デジタルカメラの概略図である。 本発明の一実施例に係る方法の符号化フェーズのフローチャートである。 本発明の一実施例に係る方法の符号化フェーズのフローチャートである。 本発明の一実施例に係る方法の復号化フェーズのフローチャートである。 画像補足パラメータ間の代表的な関係を示すグラフの一例である。 両軸におけるトータルノイズ対DNへ変換された発生電子のグラフの一例である。 図5のグラフがフラットな線となるように線形信号をノイズ均等化応答(NER)に変換する変換の一例である。 8x8DCTの各周波数領域係数におけるホワイトノイズの標準偏差について表面プロットした一例である。 8x8DCTの各周波数領域係数におけるある形状のノイズの標準偏差について表面プロットした一例である。 8x8DCTの各周波数領域係数におけるある形状のノイズの標準偏差について表面プロットした一例である。
本発明の一実施例を、具体例を参照して説明するが、本発明の範囲がそのような例によって限定されることはない。
図1は本発明に係る方法を実施することが可能なカメラ10の概略図である。カメラ10は受光した光を画像データに変換するように構成された撮像システム12を含む。この例では、撮像システム12はイメージセンサ(画像センサ)12A(例えばCCD又はCMOSイメージセンサチップ等)及びそれに付随するオプティカルフィルタ12B(例えばIRカットフィルタ又はオプティカルローパスフィルタ)を含む。さらにオプティカルシステム14(例えばレンズ)が設けられてイメージセンサ上に画像を形成する。イメージセンサはカラーフィルタが空間配列されたカラーフィルタアレイ(CFA)を含み、カラーフィルタアレイはイメージセンサの前方に置かれてカラー画像を補足する。CFAのフィルタは単一のイメージセンサのフォトサイトと空間的に相関しているので、各フォトサイトは対応するスペクトル選択フィルタを有する。本発明の技術が特定のCFAの使用に制限されることはないが、この例で使用されるCFAはレッド、グリーン、ブルーのカラーフィルタが交互に配置されるベイヤCFAである。
撮像システム12によって生成されるビデオデータは画像処理サブシステム18へ送られる。画像処理サブシステム18はASIC又はFPGA又は関連するソフトウェアを備えたマイクロプロセッサ等の1以上のデータプロセッサを備え、画像処理タスクの範囲を実行するように構成される。ワーキングメモリ20は画像処理や他のタスクを実行中にデータやソフトウェア等を一時的に記憶できるように設けられる。
画像処理サブシステム18はさらにビデオエンコードシステム22を含む。一般的にビデオエンコードシステム22は1以上のビデオコーデックをプロセッサに実行させることができるソフトウェアを供給することにより動作する。このシステムは本発明に係るビデオ処理方法を実行するとともにビデオデータをエンコードし任意のフォーマットに圧縮するために使用することができる。開示される方法は専用の外部ビデオや汎用コンピュータシステムのようなカメラとは分離した処理プラットフォームで実行さすることができる。
画像処理サブシステム18はさらにフォーマット変換システム24を有し、フォーマット変換システム24はビデオ出力データをビデオ送信システム26を介して送信することが可能な、あるいは下流で処理するためにより都合の良い(Y’CbCrのような)フォーマットに変換する。フォーマット変換システム24はビデオデータがビデオ送信システム26へ送られる前にビデオデータを前記ビデオ送信フォーマットの1つにフォーマット化してビデオデータの送信を可能にするするために設けられる。これはビデオデータの元のフォーマットからビデオ送信システム26の適切なビデオ送信フォーマット(の1つ)へコード変換することを含んでも良い。
ビデオ送信システムは少なくともビデオ出力ポートを有するビデオインターフェイスを介して(外部ビデオレコーダ又はレコーダ/モニタ等へ)ビデオ出力データを送信(及びオプションとして受信)することができる。ビデオインターフェイスは双方向であってもよく従ってビデオ入力ポートを含むこともできる。一例としてビデオインターフェィスはSDIインターフェイスであり、又は他の同様のインターフェイスであっても良い。
カメラはローカル不揮発性メモリ30に記憶されるビデオデータ(及び他の任意のデータ)の永続記憶を制御するように構成された、メモリコントロールサブシステム28の形でデータ記憶システムを有する。ローカルメモリ30としてメモリカードまたは着脱式ハードドライブのような着脱式メモリを使用しても良い。しかし一般的には、メモリコントロールサブシステム28は制御信号をローカルメモリ30との間で送受信し、メモリ30へのビデオデータの記憶とその検索を制御し,さらに記憶のためにデータを符号化又はフォーマット化するために配置される。メモリ30はシリアルATAプロトコルに従って動作するソリッドステートドライブとすることができ、その場合、メモリコントロールサブシステムはSATAドライブの動作をコントロールしSATAドライブのデータの読出しと書き込みを管理する。
本発明の一実施例に係る方法の符号化フェーズ35を図2のフローチャートに示す。該方法は画像を捕捉するステップ40から開始する。前述したようにデジタル画像の捕捉はイメージセンサ12Aで受光した光を最初に電荷に変換し続いて電圧に変換し、そして最終的にデジタルナンバー(DN)に変換して行う。DNの意味は使用されている特定の画像表現フォーマットに依存しており、本発明の技術は特定のフォーマットに制限されない。例えば、RGBフォーマットにおける画像の各ピクセルは3つのDNのベクトルからなり;(レッド、グリーン、ブルーである)3つのカラーチャネルのそれぞれに対するベクトルであり、全体の画像がピクセルの2次元の配列からなる。該2次元ピクセル配列はデジタル画像信号であることの視点からも分析され得る。
デモサイジング処理がされていないRAW画像データに対しても、4以上のスペクトルバンドを含む画像データに対しても、本発明を等しく実施することができる。
画像の補足に続いて変換機能(ステップ50)が画像信号を構成する各ピクセルに適用される。これに関連して、画像信号の生成時に光電変換プロセスによって必然的にノイズが画像信号に取り込まれることになる。この取り込まれたノイズは撮像システム12の光電子部品と電子部品の両方から生成され、ノイズは画像信号の生成の時点から画像信号への導入が始まるので、該ノイズは信号の画像成分と同じ画像処理ルーチンを通ることになる。
しかし、発明者らは画像ノイズの特定の成分と強度が見る人にとって実際には知覚的に快適であり、あるいは見ている画像のより現実的な属性として感じられることを発見した。
特に、発明者らはフォトンショットノイズの特定の分布によって占められる画像ノイズが見る人によって知覚的に快適感のある属性として感じられることを発見した。フォトンショットノイズは離散化され量子化された粒子の挙動や離散量子粒子とイメージセンサとの相互作用を決定づける基本的な物理プロセスから生まれる。上述のようにイメージセンサ12Aのフォトサイトの配列は定義された時間(即ち「インテグレーションタイム」)の間に各フォトサイトに衝突する入射光の量に比例する信号を生成する。しかし、照明やインテグレーションタイムが一定であったとしても、イメージセンサによって補足される信号は捕捉する毎に常に微妙に変化しており、フォトンショットノイズの現象が生じる。
フォトンショットノイズを特徴づけるランダムな統計変動はポアソン過程としてモデル化でき、それの標準偏差(s_e)は次式で表される:
但し、N_eはピクセルのフォトダイオードで生成される電子数である。
このポアソン過程は正規分布として表すこともできる。
他の重要なテンポラルノイズ成分はノイズフロアであり、イメージセンサ12Aの「読み出しノイズ」即ち「s_r」としても知られている。ノイズフロアは通常増幅器やADC等の光学的、電子的成分を含む個別のノイズソースの組み合わせを包含している。ノイズフロアは固定ゲイン等特定の構成要素のセッティングに対して不変の正規分布としてモデル化することもできる。ノイズフロアはさらにインテグレーションタイム及びイメージセンサで受光する光量に依存しない。
これらテンポラルノイズソースのモデル化により以下のトータルノイズが成立する:
この量はシステム変換係数によってデジタルドメインへ移行される。
特定のイメージセンサ及びそのセッティングに対してノイズモデルを知ることにより、変換機能が演算されイメージセンサの通常線形信号出力に適用されてテンポラルノイズの標準偏差を信号レベルのスペクトル全体にわたって略一定とすることができる。
この変換された信号はここでは「ノイズ均等化応答」と記載する。
以下に示すように、このノイズ均等化応答のコンセプトを使うことによりさらに略一定の分布を有するノイズを一部の画像エリアにあるいは画像全体に局所輝度とは無関係に加えることができる。
変換に続いてノイズ均等化応答信号に、デモサイジング、フィルタカーネルの適用、及び/又は他のカラースペース(YCbCr等)への変換等の代表的な画像処理が実行される(ステップ60)。そのような処理は必然的にノイズ分布を変える効果をもたらす。
画像処理に続いて、ノイズ均等化応答信号は離散コサイン変換(DCT)を使って符号化される(ステップ70)。そのような符号化は画像データ配列を適切なサイズ(8x8等)のブロック分割し、DCTを使って各ブロックを周波数領域表現に変換することを含む。各ブロックのDCTを演算する前にその値(ノイズ均等化応答を包含する)がシフトされてゼロを中心とする範囲を確定する。その後2次元のDCTが該ブロックに適用される。これによりブロックの基本的強度レベルを決定する通常比較的大きなレベルの左上隅のエントリ(即ちDC係数)を有するブロックを生み出す。残る係数はAC係数として知られている。
このようにDCTエンコーディングを行うことによりDCT領域(即ち周波数)でノイズ分布を分析することが可能になる。それに加えて(以下に記載するように)、ノイズ信号の振幅は知られており、(少なくとも場合によっては)略一定なので、各DCTブロックは逆量子化が実行された後のタイミングで復号化のオペレーション中に個別に分析することができる。これによって、エンコード中に行われる量子化や他の丸め処理を受ける以前の信号に存在していた分布に(知覚的に類似するという意味において)適合するノイズ分布を周波数領域中に再生することができる。
さらに、ノイズ均等化応答に組み込まれているノイズの標準偏差を知ることにより、より一定の輝度を有する特定の画像エリアに対するデータ記憶がDCオフセットに限定されるので最小化される。これらのエリアの空間及びテンポラルノイズが容易に再生されて後で信号に付加される。この点に関し、ノイズ分布の細部が選択されたフレームヘッダに又はタイルや、スライスや、ブロックレベルを含む画像データの他の部分にメタデータとして記憶される。これによりデコーダ(後述する)が各特定のフレームに適切なノイズ信号を印加することが可能になる。
次にDCTブロックが適切な量子化マトリクスを参照して量子化される(ステップ80)。量子化により入力されたものより小さい係数を有するDCTブロックを生む。所定の量子化の度合いに対して十分に小さい(ローマグニチュード)の入力周波数係数がゼロに圧縮される。これが起きると、信号に存在するそのような係数のノイズ成分は完全に除去される。
量子化に続いて、DCTブロックは、今回はエントロピー符号化のプロセスを通して劣化されることなくさらに圧縮される(ステップ90)。これは周波数データへのランレングス符号化アルゴリズムの適用及びその結果得られるデータのハフマン符号化を含む。この結果符号化圧縮画像が生成されそれが符号化画像ファイル100に書き込まれる。
代替の符号化フェーズを図2Aのフローチャートを参照して説明する。符号化の方法は図示する通りであるが、図2では(図2Aのステップ55)の処理をすでに済ませている画像データに対して変換機能(図2Aのステップ65)が適用される。ステップ55で実行される画像処理はステップ60で実行される画像処理、即ちデモサイジング、フィルタカーネルの適用、及び/又は他のカラースペース(YCbCr等)への変換に相当する。
本発明に係る方法の符号化フェーズ110が図3のフローチャートにより説明される。符号化フェーズ110は以前記録された画像を再生するために使用される。画像再生はカメラハードウェア又はビデオプレーヤ又は編集システムの一部として分離したプロセッサ上で行われる。
符号化フェーズ110は符号化フェーズ35を実行することで生成された符号化画像ファイル100に基づいて実行される。符号化フェーズ110の実行は最初に符号化画像ファイル100のエントロピー復号化(ステップ120)である。エントロピー符号化は符号化フェーズ35のエントロピー符号化(ステップ90)を完全に反転させてそれぞれ量子化されたDCT係数のマトリクスからなるDCTブロック集合を生成する。
逆量子化(ステップ130)がその後量子化されたDCT係数の各ブロックに実行される。逆量子化は符号化フェーズ35の量子化ステップ(ステップ80)を可能な限り反転する。逆量子化は量子化(ステップ80)で使用するために選択されたものと同じ量子化マトリクスを参照して実行される。このように生成された逆量子化されたDCTブロックは、もとのDCT係数マトリクス即ちDCTステップ(ステップ70)中に生成されたものに酷似する(しかし正確に一致しない)。一方、該DCT係数マトリクスは周波数領域の元の画像の表現である。
量子化されたDCTブロックを逆量子化することから生じる不完全な再生により圧縮に関連するアーティファクトが十分に復号化された画像または一連の画像において出現する。これらのアーティファクトは元の周波数係数がゼロを含む少数の量子化レベルに丸められることに起因する。逆量子化された後、ゼロの値の係数は除去されたものの本来は小さなノイズ又は信号成分だった可能性がある。本来のノイズ成分の細部に亘る値を復元する術はないが、ノイズのランダム分布の知見により新たな乱数又は疑似乱数のデータ値を発生させて該分布をフォロー(もしくはそれに近似)させることができる。
この点に関し、逆量子化ステップにより出力された各DCT係数マトリクスに対しノイズの再生が実行される(ステップ140)。ノイズ再生は各DCブロックのAC係数を変更することを含む。好ましい修正は正規分布した乱数又は疑似乱数をゼロ値を有するDCT係数マトリクスのAC係数と置き換えることを含む。疑似乱数発生器は各フレームのヘッダに存在するシード値を参照できる。これにより該フレームがいつどのように復号化されたかに関わらず各フレームに亘り再生されたノイズ信号の整合性を確保する。
ノイズの再生はノイズの正規分布をDCT係数マトリクスへ符号化した結果であり、それによって1以上のノイズ成分を微妙に変更する。
場合によっては、ノイズの再生は逆DCT後の(及び他の任意の操作後の)完全に復号された画像のノイズ特性が符号化する前の元の画像に存在したノイズと同じに見えるように実行される。
信号の元のノイズ成分は時間と空間の両方においてランダムに分布されているので、生成された新しいランダム分布が各特定のブロックにおいて量子化前に存在したブロックと正確に同じ値を有することはない。しかしノイズ信号は同じ統計的分布を共有するので、係数の値が正確に再生される必要がない。
ノイズの再生後、(今は任意のノイズ信号をモジュレートする修正された係数を含んだ)DCT係数マトリクスは逆DCTを受ける(ステップ150)。このプロセスは最初にマトリクスの2次元逆DCTを行い、その結果を整数値に丸め、その整数値をシフトさせて元のデータ範囲を回復することにより実行する。
逆DCTに続いて、任意のデブロッキングプロセス(ステップ160)が低周波ノイズ成分と比較して高周波成分が減衰するノンホワイトノイズ分布を構成するように結果として生じるマトリクスに実行される。他の任意のプロセスは適用されたノイズ均等化応答からの逆変換、カラー処理、又は他の画像処理を含む。
復号化された画像170は方法110を実行することにより生成される。
以下の説明は代表的なノイズ特性を備えた代表的な画像に上記の方法を実行する一例を示すものであり、その中で:
N_eは、ピクセルのフォトダイオードで発生される電子の数であり、
s_eは、テンポラルノイズのうちのフォトンショットノイズ成分(使用ユニット:電子)の標準偏差であり、
s_rは、テンポラルノイズ(使用ユニット:電子)のノイズフロア(即ち「読み出しノイズ」)成分の標準偏差であり、
s_totalは、トータルノイズの標準偏差(使用ユニット:電子)である。
上述のように、信号範囲のほとんどはポアソン過程としてモデル化されるフォトンショットノイズによって理想的に占められており、その標準偏差s_eは以下のようにあらわされる:
これらの2つのテンポラルノイズソースのみをモデル化することで以下のトータルノイズ(直角位相で合計された)を求める。
このモデルで得られる最大値はN_eが最大の時に生じる。これは光によって飽和したフォトダイオードで発生する電子の数、則ち、フォトダイオードの「フルウェルキャパシティ」を表している。以下の説明において、
fwcは、該フルウェルキャパシティ(電子)であり、
s_maxは、トータルノイズの最大標準偏差であり、
を満たす。
イメージセンサに対するこれらの量の代表値は:
である。
図4で示されるグラフはN_e とs_totalとの間の代表的な関係を表している。
この量はシステム変換係数によってデジタルドメインへ移行されるが、これは電子ユニットからデジタルナンバー(DN)のユニットへのリニアスケーリングである。
システム変換係数は電子当たりのDNを単位として表され:
dn_maxは、フルウェルキャパシティが対応付けられるDN値であり;
dn_offは、ゼロ電子(ブラック)入力信号が対応付けられるDN「オフセット」値(注:これは読み出しノイズレベルの対応付けではない)であり;
A_cfは、変換係数(DN/e-)である。
dn_offは、一般的にはゼロ電子入力の状況であっても存在する読み出しノイズのクランピングを避けるためにゼロより大きいペデスタルレベルとして設定される。
カメラ画像の取得のための数値の例は:
である。
図5に示すように、トータルノイズ対発生電子の表現は両方の軸でDNに変換できる。
入力DN値として、元の電子計数への逆変換は、
で表される。
入力データとして、それはノイズに晒されることでdn_minよりも小さい値になり、ノイズは単に読み取りノイズとしてモデル化される。
このことは入力される電子をノンネガティブ値にクランプすることに等しい。即ち、
で表現される。
関連するトータルノイズは従って以下のようにモデル化される。
ノイズはデジタルドメインで以下のように再表現される。
線形信号をノイズ均等化応答(NER)に変換する変換を引き出して図5のプロットがフラットラインとなり、信号範囲の全体を通して略コンスタントなノイズの標準偏差とすることが都合良い。そのような変換の例を図6に示す。
そのような非線形に対応付けられた結果として生じる信号のノイズ、y = f(x)は線形信号ノイズと勾配関数dy/dx = f'(x)の積として算出される。ここで、xは線形入力DN信号である。
従って、マッピングは以下を満たすことになる:
x >= dn_offの場合は、以下のように解かれる:
x < dn_offの場合は、以下のように解かれる:
従って、定数'c'が2つのサブレンジの間でスムーズな連続性を確保するように選ばれる限り、一定の信号ノイズ応答が信号入力範囲を通して生じる。
ノンゼロペデスタルはダークノイズの標準偏差の適当数がクランプされないことを確実にするために変換信号でも使われる。即ち:
Bpsは、出力NER信号のサンプル当たりのDNビットであり、
Offsetは、NER信号に使われるノンゼロオフセット(ペデスタル)であり、
Bは、フラクショナルオフセットであり、
である。
線形信号からNER信号への変換は以下のように定義する:
Yがどこにあってもノンネガティブとなることを保証するためにさらなるクランピングを伴う。
コンスタントノイズの標準偏差値(DN)がクランプされる個所を除けばどこにでも存在するためには、
が成立する。
(周波数領域のノイズ特性)
圧縮前の画像処理がなされていない場合、NER画像はホワイトノイズの空間ノイズ分布を有するものとしてモデル化される。これを図7に示す。
このようなDCTブロックにおいて圧縮が全てのノイズを完全に除去(量子化/丸め)するならば、解凍ステップ(逆DCT動作の前)の間に印加される再生ノイズ(ステップ140)は同じプロファイルを有する(ゼロ値を有するAC係数においてのみ印加されるが)。
圧縮前画像処理が実行されるならば、かつバンドパスではない空間フィルタリング動作(通常実行する上ではローパスフィルタ)を含むものであれば、結果として生成される空間共分散は異なるDCT周波数係数をまたぐ不均一なノイズレベルとして周波数領域に存在するノンホワイトノイズ分布をもたらす。
このことは8x8DCTを想定して図8、9に示されているが、他のどのサイズであっても周波数分解は同様の分布を示す。
このようなDCTブロックにおいて圧縮が全てのノイズを完全に除去(量子化/丸め)するならば、そして成形されたノイズプロファイル(即ちホワイトノイズよりもむしろ成形されたノイズプロファイルを望むのであれば)、解凍プロセス(IDCTオペレーション前の)に印加される(ステップ140)再生ノイズは同じプロファイルを有する(ゼロ値を有するAC係数の場合においてのみ印加されるが)。投入されるノイズはすべての周波数係数に対して同じ標準偏差とはならない。
本明細書において開示され限定された発明はテキストや図面に記載され又はそこから明白な個別の特徴の2つ以上の全ての代替されうる組み合わせに及ぶことが理解されるだろう。これらの異なる組み合わせの全てが本発明の様々の代替されうる態様を構成する。

Claims (21)

  1. 周波数領域に表される画像データを処理する方法であって、該方法は、ノイズ信号を画像データに印加してノイズ印加画像データを生成するステップを含むことを特徴とする方法。
  2. 前記画像データは離散コサイン変換の適用から生じる1以上の係数のセットを含み、係数の各セットはDC係数と1以上のAC係数を含むことを特徴とする請求項1に記載の方法。
  3. 前記ノイズ信号は1以上の前記セットの1以上の前記係数を変更することにより画像データに印加されることを特徴とする請求項2に記載の方法。
  4. 前記変更は1以上のAC係数を分布する乱数又は疑似乱数と置換するステップを含むことを特徴とする請求項3に記載の方法。
  5. 前記乱数又は疑似乱数はシード値を使って生成されることを特徴とする請求項4に記載の方法。
  6. 前記置換されるAC係数はゼロ値を有するAC係数であることを特徴とする請求項4に記載の方法。
  7. 画像データに存在するノイズを均等化するステップをさらに含み、該均等化するステップはノイズ信号を印加するステップの前に実行されることを特徴とする請求項1に記載の方法。
  8. 前記均等化するステップはその振幅又は標準偏差が画像データ全体にわたって略一定となるようにノイズを均等化することを含むことを特徴とする請求項7に記載の方法。
  9. 前記ノイズはノイズモデルを参照して均等化されることを特徴とする請求項7に記載の方法。
  10. 前記ノイズモデルは画像データを補足する1以上のイメージセンサによって実行される光電変換のモデルであることを特徴とする請求項9に記載の方法。
  11. 前記ノイズモデルは光電変換に関連するフォトンショットノイズ及び/又は読出しノイズを構成することを特徴とする請求項10に記載の方法。
  12. 前記画像データに印加される前記ノイズ信号は前記ノイズモデルを参照してスケーリングされることを特徴とする請求項9に記載の方法。
  13. 前記画像データに前記ノイズ信号を印加するステップの前に、前記画像データに逆量子化を適用するステップをさらに含むことを特徴とする請求項1に記載の方法。
  14. 前記画像データに前記ノイズ信号を印加するステップの後に、逆離散コサイン変換を適用するステップをさらに含むことを特徴とする請求項13に記載の方法。
  15. 前記逆量子化を適用するステップの前に、前記画像データをエントロピー復号化するステップをさらに含むことを特徴とする請求項13に記載の方法。
  16. イメージセンサから得られた画像信号を処理する方法であって、該画像信号は振幅を有するノイズ成分と振幅を有する画像成分とを含み、該方法は:
    前記イメージセンサの特性から変換関数を決定するステップ、及び
    該変換関数を該画像信号に適用して画像成分の振幅から独立した略一定の振幅のノイズ成分を有する信号を生成するステップ
    を含むことを特徴とする方法。
  17. 前記画像信号に関連する前記変換関数の細部を記録するステップをさらに含む、請求項16に記載の方法。
  18. 前記画像信号を周波数領域表現に変換するステップをさらに含むことを特徴とする請求項16に記載の方法。
  19. 前記変換は離散コサイン変換を前記画像信号に適用することを含むことを特徴とする請求項18に記載の方法。
  20. 前記変換された画像信号を均等化するステップさらに含むことを特徴とする請求項18に記載の方法。
  21. 前記均等化された画像信号をエントロピー符号化するステップをさらに含むことを特徴とする請求項20に記載の方法。
JP2019148771A 2018-09-13 2019-08-14 画像処理方法及びシステム Active JP7512021B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AU2018903448 2018-09-13
AU2018903448A AU2018903448A0 (en) 2018-09-13 Image processing method and system

Publications (3)

Publication Number Publication Date
JP2020058017A true JP2020058017A (ja) 2020-04-09
JP2020058017A5 JP2020058017A5 (ja) 2022-09-01
JP7512021B2 JP7512021B2 (ja) 2024-07-08

Family

ID=

Also Published As

Publication number Publication date
US20200092446A1 (en) 2020-03-19
CN110896432A (zh) 2020-03-20
US11153468B2 (en) 2021-10-19
EP3624454A1 (en) 2020-03-18

Similar Documents

Publication Publication Date Title
US9596385B2 (en) Electronic apparatus
JP5249784B2 (ja) 高ダイナミックレンジコーデック
US8237830B2 (en) Video camera
CN108476325B (zh) 用于高动态范围颜色转换校正的介质、方法和设备
US10531098B2 (en) Video camera with rate control video compression
WO2019191983A1 (zh) 编码方法、装置、图像处理***和计算机可读存储介质
WO2018207059A1 (en) Methods and apparatuses for encoding and decoding digital light field images
MX2011000692A (es) Sistemas y metodos para compresion de video altamente eficiente al usar retencion selectiva de detalle visual relevante.
JP6857973B2 (ja) 画像符号化装置及びその制御方法
US11153468B2 (en) Image processing method and system
JP2017216630A (ja) 画像符号化装置及びその制御方法
US7702161B2 (en) Progressive differential motion JPEG codec
US10142604B2 (en) Imaging apparatus and control method thereof
JP6793511B2 (ja) 画像処理装置
CN108156461A (zh) 一种Bayer图像压缩方法及装置
JP7512021B2 (ja) 画像処理方法及びシステム
US10951891B2 (en) Coding apparatus capable of recording raw image, control method therefor, and storage medium storing control program therefor
JP6775339B2 (ja) 画像符号化装置及びその制御方法
Bennett Assessing the Potential Use of High Efficiency Video Coding (HEVC) and High Efficiency Image File Format (HEIF) in Archival Still Images
KR100261109B1 (ko) 화질 향상이 가능한 휘도 신호 압축 부호화 장치
JP2023070055A (ja) 画像符号化装置及びその制御方法及びプログラム
AU2012216606B2 (en) Video camera
KR20070099911A (ko) 디지털 영상 압축 방법 및 상기 방법을 실행시키기 위한컴퓨터 판독 가능한 프로그램을 기록한 매체
Fischer et al. A survey on lossy compression of DSC raw data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220812

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220824

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240226

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240528