JP4097874B2 - Image compression method and image compression apparatus for multispectral image - Google Patents

Image compression method and image compression apparatus for multispectral image Download PDF

Info

Publication number
JP4097874B2
JP4097874B2 JP2000060471A JP2000060471A JP4097874B2 JP 4097874 B2 JP4097874 B2 JP 4097874B2 JP 2000060471 A JP2000060471 A JP 2000060471A JP 2000060471 A JP2000060471 A JP 2000060471A JP 4097874 B2 JP4097874 B2 JP 4097874B2
Authority
JP
Japan
Prior art keywords
image
principal component
multispectral
image data
optimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000060471A
Other languages
Japanese (ja)
Other versions
JP2001251646A5 (en
JP2001251646A (en
Inventor
磴  秀康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2000060471A priority Critical patent/JP4097874B2/en
Publication of JP2001251646A publication Critical patent/JP2001251646A/en
Publication of JP2001251646A5 publication Critical patent/JP2001251646A5/ja
Application granted granted Critical
Publication of JP4097874B2 publication Critical patent/JP4097874B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、被写体を撮影する際の撮影波長領域を複数のバンド帯域に分割して撮影したバンド画像を用いて得られるマルチスペクトル画像の画像データに対して、画像品質を損なうことなく効率的に圧縮することのできる画像データの圧縮処理の技術分野に関する。
【0002】
【従来の技術】
今日、デジタル画像処理の進歩によって、画像の色情報(明度、色相、彩度)を完全に表現する手段として、画像の各画素毎に分光情報(スペクトル画像)を備える画像、すなわちマルチスペクトル画像が利用されている。
このマルチスペクトル画像は、撮影被写体の撮影波長領域を複数のバンド帯域に分割して各バンド帯域毎に撮影被写体を撮影した複数のバンド画像から構成されるマルチバンド画像に基づいて分光反射率分布を各画像毎に推定して得られるものである。このマルチバンド画像は、赤(R)、緑(G)および青(B)画像からなる従来のRGBカラー画像では十分に表現できない色情報を再現することができ、例えばより正確な色再現の望まれる絵画の世界にとって有効である。そこで、この色情報を正確に再現するといった特徴を生かすために、例えば380〜780nmの撮影波長帯域を10nm帯域毎に区切って41バンドさらには5nm帯域毎に区切って81バンドといった多くのバンド数を備えたマルチバンド画像に基づいてマルチスペクトル画像を得ることが望まれる。
【0003】
しかし、画素毎に分光情報を備えるマルチスペクトル画像は、撮影波長帯域を分割した各帯域(チャンネル)毎に、例えば41チャンネル毎に分光反射率データを有するため、従来から用いられてきた3チャンネルのRGBカラー画像に比べ、例えば約13倍(41チャンネル/3チャンネル)の画像データ量を備えなければならない。
そのため、得られたマルチスペクトル画像の画像データを保存する場合、大きな記憶容量が必要となり、保存に要する時間も長い。また、画像データをネットワークを介して転送する際にも多大の時間がかかり、取り扱いが困難になる。
【0004】
このような問題に対して、マルチスペクトル画像の各画素ごとの分光情報から得られるスペクトル波形を3つの等色関数、例えばRGB表色形の等色関数で展開するとともに、等色関数で表されないスペクトル波形の部分を、主成分分析法を用いて、主成分基底ベクトルで展開し、その中からスペクトル画像の画像情報を代表する主成分を抽出して採用し、それ以外の主成分は取り除き、最終的に等色関数を含め合計6〜8個の基底ベクトルで上記スペクトル波形を表現する方法が提案されている(Th.Keusen, Multispectoral Color System wuth an Encoding Format Compatible with the Conventional Tristimulus Model, Journal of Imaging Science and Technology 40: 510-515 (1996))。これを用いて、上記スペクトル波形を6〜8個の基底ベクトルとそれに対応した係数の対とで表わすことによって、マルチスペクトル画像の画像データを圧縮することができる。特に、RGB表色形の等色関数で表される場合の等色関数の係数は、R、GおよびBの三刺激値となるので、R、GおよびB画素による3刺激値に基づいて画像処理や画像表示等が行われる従来の画像処理装置や画像表示装置に対応して適合するように特別な変換を施す必要がなく、直接画像データを送ることができるといった処理の低減に対して優れた効果を備える。
【0005】
【発明が解決しようとする課題】
このような方法によって得られる画像データは、例えば41個のスペクトル画像から構成されるマルチスペクトル画像の場合、例えば8個の基底ベクトルとその係数によって表すことによって、マルチスペクトル画像の画像データ量の約20%(8個/41個×100)に圧縮することができる。
しかし、41個のスペクトル画像から構成されるマルチスペクトル画像の場合、RGBカラー画像の画像データ量に比べて約13倍も大きく、上記方法で約20%に圧縮できたとしても、RGBカラー画像の画像データ量に対して、依然として約2.5倍(13×20/100)ものデータ量を有することになる。そのため、上述したように記録メディア等に記録保存する際の記録時間や画像データをネットワークを介して転送する際の転送時間も長く、依然として取り扱いが困難である。
【0006】
そこで、本発明は、上記問題点を解決し、被写体を撮影する際の撮影波長帯域を複数のバンド帯域に分割することで得られる複数のスペクトル画像に対して、視覚的に劣化することが少なく画像圧縮の際の圧縮率を高め、画像データの取り扱いが向上するマルチスペクトル画像の画像圧縮方法および画像圧縮装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するために、本発明は、被写体を撮影する際に撮影波長帯域を複数のバンド帯域に分割して撮影したバンド画像を用いて得られるマルチスペクトル画像を画像圧縮する方法であって、
マルチスペクトル画像の画像データを対数変換して対数変換画像データとし、この対数変換画像データを用いて、主成分分析を行い、マルチスペクトル画像に基づく主成分ベクトルと主成分画像の複数の対を得、
この複数の対の中から、マルチスペクトル画像の画像情報を最適に代表する主成分ベクトルと主成分画像の対の最適主成分数を求めて、最適主成分ベクトルとこれに対応する最適主成分画像を得、
得られた各最適主成分画像に対して、像構造圧縮を行い最適主成分圧縮画像データを得ることによって、前記マルチスペクトル画像の画像データを前記最適主成分ベクトルおよび前記最適主成分圧縮画像データに圧縮することを特徴とするマルチスペクトル画像の画像圧縮方法を提供するものである。
【0008】
ここで、前記最適主成分数は、色空間上の測色値に基づいて決定されるのが好ましく、前記最適主成分数は、前記主成分ベクトルと前記主成分画像の中から選ばれて構成される合成画像の測色値の画像情報の、前記マルチスペクトル画像に基づいて構成されるオリジナル画像の測色値の画像情報に対する誤差の値が、所定値以下となる最小の主成分数であるのが好ましい。
ここで、さらに好ましくは、前記最適主成分数は、前記マルチスペクトル画像に対する寄与の大きい主成分ベクトルを、寄与の大きい主成分ベクトルの順に、順次含め、これに対応した前記主成分ベクトルと前記主成分画像によって構成される前記合成画像を求めた時の前記オリジナル画像に対する前記誤差の変動が、所定値以下に収まる最小の主成分数であるのが好ましい。
【0009】
また、前記像構造圧縮は、離散フーリエ変換またはウェーブレット変換による画像データの高周波成分の圧縮であるのが好ましい。
さらに、前記像構造による圧縮は、画像データの符号化により画像データを圧縮する符号化圧縮処理が付加されるものであってもよい。
【0010】
また、本発明は、被写体を撮影する際に撮影波長帯域を複数のバンド帯域に分割して撮影したバンド画像を用いて得られるマルチスペクトル画像を画像圧縮するマルチスペクトル画像の画像圧縮装置であって、
マルチスペクトル画像の画像データを対数変換して対数変換画像データを得る画像データ変換部と、
この画像データ変換部で得られた対数変換画像データを用いて、主成分分析を行い、マルチスペクトル画像に基づく主成分ベクトルと主成分画像の複数の対を得る主成分分析部と、
この主成分分析部で得られた主成分ベクトルと主成分画像の複数の対の中から、マルチスペクトル画像の画像情報を最適に代表する主成分ベクトルと主成分画像の対の最適主成分数を求めて、最適主成分ベクトルと最適主成分画像を得る最適主成分ベクトル・画像抽出部と、
この最適成分ベクトル・画像抽出部で得られた各最適主成分画像の画像データに対して、像構造圧縮を行う画像圧縮部とを有することを特徴とするマルチスペクトル画像の画像圧縮装置を提供するものである。
【0011】
【発明の実施の形態】
以下、本発明のマルチスペクトル画像の画像圧縮方法を実施するマルチスペクトル画像取得システムについて、添付の図面に示される好適実施例を基に詳細に説明する。
【0012】
図1は、本発明のマルチスペクトル画像の画像圧縮方法を実施し、本発明のマルチスペクトル画像の画像圧縮装置を含むマルチスペクトル画像取得システム(以下、本システムという)10を示す。
本システム10は、撮影被写体Oを撮影し、得られたマルチスペクトル画像MS の画像データを記録メディアに保存するものであって、撮影被写体Oを照らす光源12と、撮影波長帯域を複数のバンド帯域に分割する可変フィルタ14と、撮影被写体Oを撮影してマルチバンド画像MB を得るCCDカメラ16と、画像データを一時保持するマルチバンド画像データ記憶装置18と、マルチバンド画像から各画素毎に分光反射率分布を推定してマルチスペクトル画像MS を得るマルチスペクトル画像取得装置20と、マルチスペクトル画像MS の画像データを、視覚的な劣化が少なく、圧縮率を高くして圧縮するマルチスペクトル画像圧縮装置22と、得られた圧縮画像データを保存する記憶メディアドライブ装置24とを主に有して構成される。なお、本発明において、マルチスペクトル画像Ms は、少なくとも6チャンネル以上のスペクトル画像を備え、すなわち、分光反射率分布のデータを持つ構成波長数が6以上であるのが好ましい。
【0013】
光源12は、撮影被写体Oを撮影するものであって、光源の種類等は特に制限されないが、撮影されたマルチバンド画像MB から分光反射率を推定し、マルチスペクトル画像MS を取得するために、分光強度分布が既知の光源であることが好ましい。
可変フィルタ14は、撮影被写体Oを撮影してマルチバンド画像MB を得るために、撮影波長帯域を分割するバンド帯域が可変に設定可能なバンドパスフィルタであり、例えば16バンド、21バンド、41バンド、81バンドや201バンド等に分割することができる。このような可変フィルタとして、例えば液晶チューナブルフィルタが挙げられる。
【0014】
CCDカメラ16は、撮影被写体Oの反射光を可変フィルタ14を介して所望の波長帯域に分光された透過光によって結像される像を黒白のバンド画像として撮影するカメラであって、受光面には、エリアセンサとしてCCD(charge coupled device ) 撮像素子が面状に配置されている。
また、CCDカメラ16には、撮影される画像の明度値のダイナミックレンジを適切に定めるため、撮影被写体Oの撮影前に行うホワイトバランスの調整機構を備える。
【0015】
マルチバンド画像データ記憶装置18は、撮影波長帯域を複数のバンド帯域に分割して撮影され、各バンドに対応するホワイトバランスの調整された複数のバンド画像からなるマルチバンド画像MB を一時記憶保持する部分である。
マルチスペクトル取得装置20は、CCDカメラ16で撮影された分光反射率の既知の撮影被写体の画像データ、例えばマクベスチャートのグレーパッチの画像データとその既知の分光反射率の値との対応関係から予め作成された1次元ルックアップテーブル(1次元LUT)を備え、この1次元LUTを用いて、マルチバンド画像データ記憶装置18より呼び出された撮影被写体Oのマルチバンド画像MB の画像データから各画素毎の撮影被写体Oの分光反射率を推定し、マルチスペクトル画像MS を取得し、マルチスペクトル画像圧縮装置22に送る部分である。
撮影被写体Oの分光反射率の推定において、可変フィルタ14のフィルタ特性、すなわち可変フィルタ14の分光透過率分布がバンド間で一部分が重なった特性を有する場合、得られるマルチスペクトル画像MS の分光反射率分布は鈍り、精度の高い分光反射率分布を推定することができないため、マトリクス演算やフーリエ変換を用いて、上記フィルタ特性を排除するデコンボリューション処理を施してもよい。
【0016】
記録メディアドライブ装置24は、ハードディスクやフロッピーディスクやMOやCD−RやDVD等の記録メディアに記録するドライブ装置であり、マルチスペクトル画像MS の画像データを後述するマルチスペクトル画像圧縮装置22で圧縮した圧縮マルチスペクトル画像データを記録することができる。また、記録メディアドライブ装置24と共に、またこれに替えて、後述する圧縮マルチスペクトル画像データを各種ネットワークを介して転送するために、ネットワーク接続装置を備えてもよい。
【0017】
マルチスペクトル画像圧縮装置22は、マルチスペクトル取得装置20で得られたマルチスペクトル画像MS を構成するマルチスペクトル画像データから、視覚的な劣化が少なく画像圧縮率の高い画像データに変換する部分であり、画像データ変換部22aと、主成分分析部22bと、最適主成分ベクトル・画像抽出部22cと、画像圧縮部22dとを備える。また、本装置は、以下に示すような機能を備えるソフトウェアで構成してもよく、また1つのハードウェアとして構成してもよい。
【0018】
画像データ変換部22aは、マルチスペクトル画像取得装置20から送られたマルチスペクトル画像の画像データを対数変換、すなわち、Log変換して対数変換画像データを得、この対数変換画像データを主成分分析部22bに送る部分であり、一次元ルックアップテーブル等の公知の変換手段を用いて変換を行う。画像データを対数変換するのは、後述するように、画像の圧縮率を高めることができるからである。
【0019】
主成分分析部22bは、マルチスペクトル画像MS の各画素毎に備える分光反射率分布の対数変換画像データの主成分分析を行い、主成分ベクトルで展開する部分である。なお、以降では、撮影波長帯域を複数のバンド帯域に分割するバンド数をnとして説明する。
【0020】
本発明における主成分分析として具体的には、観測波形から、統計的手法および固有値解析法を用いて、観測波形に固有の1次独立な固有ベクトルを主成分ベクトルとして求め、この主成分ベクトルから、本来観測波形に雑音成分が無ければ、固有値が0となる固有値の小さな主成分ベクトルを取り除き、バンド数nより少ない数の最適主成分ベクトルを求め、この最適主成分ベクトルによって観測波形を線型的に表す、南茂夫著、「科学計測のための波形データ処理」、220−225頁に記載の方法が挙げられる。この分析方法は、主成分分析部22bおよび後述する最適主成分ベクトル・画像抽出部22cにおいて主に行われる。
このように主成分分析法を用いる場合には、分光反射率波形に含まれる雑音成分が、分光反射率の値と無関係な雑音であることが好ましい。
【0021】
本実施例に沿って大きく説明すると、マルチスペクトル画像MS は、各画素毎に、可変フィルタ14を用いて被写体の撮影波長帯域を分割したバンドの数nだけ、分光反射率の値を有する。すなわち、n個のバンド帯域からなるマルチバンド画像MB によって得られたマルチスペクトル画像MS は、n個の分光反射率の値からなる分光反射率分布を有する。また、マルチスペクトル画像MS は、例えば1024×1024画素、すなわち約106 個の画素で構成され、この画素数は、分光反射率の個数であるnよりも圧倒的に大きいため、統計的処理、すなわち、画像領域全体またはその一部分の画素に関する自己相関行列Tを求め、これを用いて分光反射率の主成分分析を行うことができる。この場合、主成分分析により主成分を効果的に求めるために、分光反射率波形のデータを対数変換した対数変換画像データに基づいて行う。
【0022】
ここで主成分分析から求められる主成分とは、統計的処理を用いて得られるもので、例えばnバンドの数に相当するn個の分光反射率の値からなる正規直交化された自己相関行列Tの固有ベクトルである主成分ベクトルpk (λ)(k=1〜n)と自己相関行列Tの固有値uk (k=1〜n(kは1以上n以下の整数を示す))の対である。また、主成分ベクトルpk (λ)(k=1〜n)を用いて、スペクトル画像の画素位置(i,j) での分光反射率分布の対数変換画像データR(i,j,λ) を線型展開し、その際得られる各主成分ベクトルpk (λ)(k=1〜n)に係る係数sk (i,j) (k=1〜n)を求め、これを画素位置(i,j) での画像データとする主成分画像Sk (k=1〜n)を得ることができる。
得られた主成分ベクトルpk (λ)(k=1〜n)および主成分画像Sk (k=1〜n)は、最適主成分ベクトル・画像抽出部22cに送られる。
【0023】
最適主成分ベクトル・画像抽出部22cは、主成分分析部22bで得られた主成分ベクトルpk (λ)(k=1〜n)とそれに対応した主成分画像Sk (k=1〜n)とを用いて、最適主成分数m1 を定め、最適主成分ベクトルpk (λ)(k=1〜m1 )および最適主成分画像Sk (k=1〜m1 )を抽出する部分である。
最適主成分ベクトルpk (λ)(k=1〜m1 )および最適主成分画像Sk (k=1〜m1 )を抽出するのは、主成分分析部22bで求められた主成分ベクトルpk (λ)(k=1〜n)には、マルチスペクトル画像の画像データの雑音成分の影響を受けて、本来主成分ベクトルに当たらない固有ベクトルも主成分ベクトルpk (λ)(k=1〜n)として含まれて求められるため、この主成分ベクトルpk (λ)を排除し、最適主成分ベクトルpk (λ)(k=1〜m1 )および最適主成分画像Sk (k=1〜m1 )を抽出する必要があるからである。
【0024】
すなわち、n個の主成分ベクトルpk (λ)(k=1〜n)とそれに対応した主成分画像Sk (k=1〜n)の対の中から、それより少ないm(m<n)個の主成分ベクトルpk (λ)(k=1〜m)とそれに対応した主成分画像Sk (k=1〜m)の対を用いて合成画像Gを求め、この合成画像Gの画像情報の、マルチスペクトル画像Ms に基づくオリジナル画像の画像情報に対する誤差を用いて、m個の主成分ベクトルpk (λ)(k=1〜m)とそれに対応した主成分画像Sk (k=1〜m)が最適な主成分であるかどうか判断する。
【0025】
ここで、主成分ベクトルp(λ)は、対応した固有値uが大きい程、マルチスペクトル画像Mの分光反射率分布における主成分の寄与は大きい。そこで、固有値uの大きい順に、この固有値uに対応する主成分ベクトルp(λ)を合成画像Gを求めるために順次増やして、一定の照明光源下再構成される合成画像Gを求めていくと、n個の主成分ベクトルから構成されるマルチスペクトル画像Mに基づくオリジナル画像に対する合成画像Gの画像情報の誤差が、採用する主成分ベクトル数mの増加に伴って単調減少する。そのため、この誤差が予め定めた所定値以下に減少する最初の主成分ベクトル数mを求めることによって、最小の最適主成分数mを求めることができる。これによって、最適主成分数mで合成画像Gを求める際に採用した主成分ベクトルp(λ)およびこれに基づいて得られる主成分画像Sを、それぞれ、最適主成分ベクトルp(λ)(k=1〜m)および最適主成分画像S(k=1〜m)として抽出することができる。
【0026】
ここで、上記画像情報とは、例えば、CIEL* * * 色空間に於ける一定の光源下の測色値L* 、a* およびb* 、例えばCIED65の標準光条件下の測色値L* 、a* およびb* であり、その際、上記誤差とは下記式(1) で表される色差ΔE0 である。この場合、この色差ΔE0 が例えば1.0以下となるような主成分画像の数mを見出すことによって最適主成分数m1 を求めることができる。
ΔE0 ={(ΔL* 2 +(Δa* 2 +(Δb* 2 1/2 (1)
ここで、ΔL* 、Δa* およびΔb* は、上記合成画像とマルチスペクトル画像の画像全体または一部分における平均測色値L* 、a* およびb* の差分である。このようにして、最適主成分数m1 は、合成画像Gの色空間上の測色値とオリジナル画像の測色値の色差ΔE0 に基づいて適応的に決定される。
【0027】
また、上記画像情報の誤差、すなわち、オリジナル画像に対するm個の主成分ベクトルpk によって再構成される合成画像Gの、画像全体または一部分の画素のスペクトルの自乗誤差E1 であってもよい。合成画像Gの画像データ値も、マルチスペクトル画像の測色値の一例と見做され、合成画像Gの色空間上の測色値である画像データ値とオリジナル画像の測色値であるスペクトルの画像データ値の自乗誤差E1 に基づいて,最適主成分数m1 を適応的に決定してもよい。この場合、この自乗誤差E1 またはLog(E1)は、主成分ベクトル数mに対して単調減少となるため、mを増やすことによって、自乗誤差E1 またはLog(E1)の減少幅が予め定められた所定値より小さくなる時のmの値、すなわちmの増加に対して自乗誤差Eの減少が所定値以下で飽和する時の最小のmの値を求めればよい。
【0028】
画像圧縮部22dは、最適主成分ベクトル・画像抽出部22cで求めた最適主成分画像Sk (k=1〜m1 )の各々の画像データに対して像構造に基づく像構造圧縮を行う部分である。
最適主成分画像Sk (k=1〜m1 )は、その画像データが第k主成分ベクトルpk (λ)の係数に基づく明度値で表現された画像データからなる黒白画像である。画像圧縮部22cは、このような画像データに対して、各主成分の主成分画像毎に、像構造圧縮を行う。なお、像構造圧縮方法として、例えば、JPEG(Joint Photographics Expert Group) で用いられるDCT(Discrete Cosine Transformation) 方式が挙げられる。以下では、JPEG方式について説明するが、この方式に制限されれず、例えば、DFT(Discrete Fourier Transformation)方式やFFT(Fast Fourier Transformation) 方式やWT(Wavelet Transformation)方式であってもよい。
【0029】
JPEG方式とは、例えば1024×1024画素の主成分画像Sk を8×8画素のブロック画像に分解し、このブロック画像各々に対して、cosine関数による2 次元の離散型のフーリエ展開であるDCTを施し、得られ低周波成分から高周波成分に至る複数のフーリエ係数をDCT係数として求めたのち、予め与えられた量子化テーブルによって上記DCT係数を除して、高周波成分のフーリエ係数を0として省略することで、高周波成分の画像データを圧縮し、その後DCT係数の0次低周波成分である直流成分とそれ以外の周波数成分に分け、ハフマン符号化方式や公知の算術符号化方式を用いて、DCT係数の画像データを符号化し圧縮する方式である。ここで、上記量子化テーブルの値は、主成分画像Sk の像構造によって変化するものである。
本発明においては、上記DCT係数の高周波成分を量子化テーブルによって除去した画像データを、ハフマン符号化方式や公知の算術符号化方式を用いることなく、圧縮マルチスペクトル画像データとして、画像圧縮部22dから出力させてもよい。また、最適主成分画像Sk (k=1〜m1 )の画像像データに対して、符号化による圧縮を直接施してもよい。
【0030】
本システム10は、以上のように構成される。
次に、本発明のマルチスペクトル画像の画像圧縮方法について、本システム10に沿った画像圧縮方法の流れを、図3を参照しつつ説明する。
【0031】
まず、光源12、可変フィルタ14およびCCDカメラ16によって形成されるマルチバンドカメラによって撮影被写体Oを撮影し、複数のバンド帯域、例えば41個のバンド帯域に分割された複数のバンド画像からなるマルチバンド画像Mを取得する(ステップ100)。得られたマルチバンド画像Mは、マルチバンド画像データ記憶装置18に一時記憶されると共に、マルチスペクトル画像取得装置20に送られる。
【0032】
マルチスペクトル画像取得装置20では、例えばマクベスチャートのグレーパッチの画像データとその分光反射率の値との関係から作成された1次元ルックアップテーブル(1次元LUT)が備えられており、この1次元LUTを用いて、マルチバンド画像データ記憶装置18から呼び出された撮影被写体Oのマルチバンド画像MB の画像データを用いて各画素毎の撮影被写体Oの分光反射率を推定しマルチスペクトル画像MS の画像データを取得する(ステップ102)。この撮影被写体Oの分光反射率の推定において、精度の高い分光反射率分布を推定するために、マトリクス演算やフーリエ変換を用いたデコンボリューション処理が付加されてもよい。
【0033】
次に、得られたマルチスペクトル画像MS の画像データを、対数変換して、主成分分析をし、最適主成分数m1 を決定する(ステップ104)。
まず、主成分分析を行う前に、マルチスペクトル画像の画像データを対数変換処理し、すなわち画像データのLog変換を行う(ステップ105)。
【0034】
ここで、対数変換を行うのは以下の理由による。
すなわち、マルチスペクトル画像MS の画像データは、所定のピーク波長を中心とする急峻な山型分布を示す可変フィルタ14の分光透過特性に従って得られる画像データであるので、得られる画像データの値は、実際、上記所定のピーク波長における光源12 の照明光の分光波長の強度分布の値と、撮影被写体Oの分光反射率分布の値と、CCDカメラ16の分光感度特性の値との積によって近似的に表されるが、対数変換を施すことによって、マルチスペクトル画像MS の画像データの対数変換画像データの値は、光源12 の照明光の分光波長の強度分布の値の対数値と、撮影被写体Oの分光反射率分布の値の対数値と、撮影被写体Oの分光反射率分布の値の対数値の和に分解され、後述する式(3)に示されるように、主成分分析において行われる主成分ベクトルの線型和に対応させることができるからである。
【0035】
一方、同一分光反射率を有する撮影被写体Oであっても、光源12の分光強度分布が異なる部分がある場合、対数変換の施されないマルチスペクトル画像MS の画像データでは、分光波長の強度分布の値と、撮影被写体Oの分光反射率分布の値と、CCDカメラ16の分光感度特性の値との積によって表されることから、主成分ベクトルpk (λ)の線型和で表現する主成分分析に対応して表現することはできず、従って、主成分数を大きくして、マルチスペクトル画像MS の画像データを表現しなければならず、本発明の目的である画像圧縮の際の圧縮効率を十分に高めることができない。
【0036】
次に、このようにマルチスペクトル画像データを対数変換して得た対数変換画像データに対して、主成分分析を行い(ステップ106)、主成分画像Sk (k=1〜n)および主成分ベクトルpk (λ)(k=1〜n)を求める。
以下、主成分分析法について説明する。
【0037】
マルチスペクトル画像Ms は、画素位置(i,j) においてそれぞれn個の分光反射率の値を持つ分光反射率分布を有し、マルチスペクトル画像Ms の画像データを対数変換した対数変換画像データをR(i,j,λ) =( R (i,j ,λ1),R(i,j,λ2),R(i,j ,λ3),・・・,R(i,j ,λn ) )T (小文字T は転置を示す))として、画像全体の画素または画像の一部分、例えば画像全体の画素から一定間隔で画素を間引いた残りの画素における自己相関行列T(Tの(k,l)成分TklはRT ・R/nであり、・は画素位置に関する内積である)を求める。
【0038】
得られた自己相関行列Tはn×nの正方行列であり、この自己相関行列Tを用いて、下記式(2)を満足する固有値uk (u1 >u2 >・・・>un ,k=1〜n)および正規直交化された固有ベクトルである主成分ベクトルpk (λ)=(pk (i,j ,λ1),pk (i,j,λ2),pk (i,j ,λ3),・・・,pk (i,j ,λn ) )T (k=1〜n)を求める。固有値および固有ベクトルを求める方法は、jacobi法やべき乗法等の公知の方法であればよく、特に制限されない。
T・pk (λ)= uk k (λ) (2)
【0039】
また、画素位置(i,j)における分光反射率分布の対数変換画像データR(i,j,λ)が下記式(3)のように、固有ベクトルである主成分ベクトルp(λ)(k=1〜n)で表されるため、
【数1】

Figure 0004097874
下記式(4)に従って、主成分ベクトルp(λ)(k=1〜n)がお互いに正規直交関係にあることを利用して、s(i,j)求める。
(i,j)=R(i,j,λ)・p(λ) (4)
ここで、記号・は、n個の成分から成るバンド帯域の分光波長に関するベクトルの内積であり、s(i,j)は、マルチスペクトル画像の画素位置(i,j)での分光反射率分布の対数変換画像データR(i,j,λ)に含まれる第k主成分ベクトルpの大きさを示す量である。また、このs(i,j)を各画素位置で求め、その値を各々の画素位置での画像データとする第k主成分画像S(k=1〜n)を求める。
【0040】
ところで、分光反射率分布の対数変換画像データR(i,j,λ)における第1〜第nの各主成分の寄与は、上述したように、各主成分に付随した固有値uの値が小さくなるに連れて小さくなることから、分光反射率分布の対数変換画像データR(i,j,λ)は、画像情報を最適に保持する限りにおいて、小さな固有値uを持つ主成分ベクトルpを省略して近似することができる。
すなわち、下記式(5)に示すように、固有値u(k=1〜n)を大きい順に並べた際の、上からm番目以内の固有値u(k=1〜m)に対応する固有ベクトルである主成分ベクトルp(λ) (k=1〜m)を採用し、それ以外の固有値uの小さい固有ベクトルである主成分ベクトルp(λ) (k=m+1〜n)を切り捨てることによって、分光反射率分布の対数変換画像データR(i,j,λ)を近似し、画像データを圧縮することができる。
【数2】
Figure 0004097874
【0041】
特に、上述した様に、分光反射率分布の対数変換画像データR(i,j,λ) は、マルチバンド画像の画像データを対数変換して、分光波長の強度分布の対数値と、撮影被写体Oの分光反射率分布の対数値の和で表すことができるので、撮影被写体Oの分光反射率が同一の部分であるが、光源12の照明強度が異なる部分が存在する場合、例えば、撮影被写体Oの同一の材質の表面上に照明光による陰影部分がある場合、撮影被写体Oの同一の材質の分光反射率分布の対数変換された画像データの主成分ベクトルpk (λ)に、照明光の陰影部分による分光強度分布の対数変換されたバイアス量分、加算されたデータとなる。そのため、撮影被写体Oの分光反射率に基づく主成分を、対数変換した状態で、照明光の分光強度分布によるバイアス量と区別して効果的に抽出するこができる。その結果、対数変換せずに主成分分析を行う場合に比べて、最適主成分数m1 を抑えることができ、本発明の目的とする画像の圧縮率を高めることができる。
【0042】
そこで、分光反射率分布の対数変換画像データR(i,j,λ) が、画像情報を損なうことなく、近似的に表されるような主成分ベクトルpk の採用数、すなわち最適主成分数m1 を見いだし、これを用いて、マルチスペクトル画像Ms を圧縮する。これによって、マルチスペクトル画像Ms の画質を劣化させることなく、画像データを圧縮することができる。
ここで、固有値uk の大きい固有ベクトルである主成分ベクトルpk (λ)(k=1〜m1 )を採用し、固有値uk の小さい固有ベクトルpk (λ)(k=m1 +1〜n)を切り捨てるための最適主成分数m1 の設定を以下の判断基準によって行なう(ステップ108)。
【0043】
まず、固有値uの大きい順に主成分ベクトルp(λ)を順次式(5)の主成分ベクトルp(λ)に含め、下記式(6)で示されるマルチスペクトル画像に対応する分光反射率分布の近似対数変換画像データR’(i,j,λ)を求める。
【数3】
Figure 0004097874
近似対数変換画像データR’(i,j,λ) は、対数変換画像データR(i,j,λ)を近似しているため誤差が存在するが、この近似対数変換画像データR’(i,j,λ)を真数変換し、一定の分光強度分布を、照明光の分光強度分布として掛け合わせて得られる合成画像Gの画像情報の、マルチスペクトル画像Mに上記分光強度分布を掛け合わせて得られるオリジナル画像の画像情報に対する誤差も、主成分数mが大きくなるに連れて減少する。そこで、判断基準として、所定値を設定し、近似対数変換画像データR’(i,j,λ)に分光強度分布を掛け合わせて得られる合成画像Gの画像情報の上記オリジナル画像の画像情報に対する誤差が、上記判断基準として定めた所定値より小さくなる最初の主成分数mを求めることによって、最小の最適主成分数mが取得される。
【0044】
例えば、合成画像Gの画像情報のマルチスペクトル画像Mの画像情報に対する誤差を、CIED65の標準光条件下のCIEL*a*b*色空間における測色値L*、a*およびb*の色差ΔEとして、この色差ΔEに対する上記所定値を定め、最小の最適主成分数mを求める。
また、上記誤差は、合成画像Gの画像全体または一部分のスペクトルの自乗誤差Eであってもよく、その際、主成分数mの増加に対して自乗誤差Eの減少量が所定値以内に飽和する時の最小の最適主成分数mの値を求めてもよい。
【0045】
このようにして、マルチスペクトル画像Ms の画像情報を保持し最適に代表する最小の最適主成分数m1 を求め、これによって、固有値u1 〜um1(u1 〜um1>um1>um1+1>・・・>un )に対応するm1 個の最適主成分ベクトルpk (λ)(k=1〜m1 )および最適主成分画像Sk (k=1〜m1 )を取得する。ここで、取り除かれる主成分ベクトルpk (λ)(k=m1 +1〜n)は、マルチスペクトル画像Ms に含まれるノイズ成分が支配的な場合が比較的多く、マルチスペクトル画像Ms から寄与の小さな主成分ベクトルpk (λ)(k=m1 +1〜n)を除去することで、マルチスペクトル画像Ms に含まれるノイズ成分の抑制も行うことができる。
【0046】
次に、得られた最適主成分画像Sk (k=1〜m1 )に対して、画像圧縮部22dで画像圧縮(ステップ110)を行う。画像圧縮は、像構造に基づく対数変換画像データの圧縮(ステップ112)および符号化データの圧縮(ステップ114)から構成される。
像構造に基づく対数変換画像データの圧縮は、例えば、JPEG方式の圧縮が行われ、例えば1024×1024画素の主成分画像Sk を8×8画素のブロック画像に分解し、このブロック画像各々に対して、cosine関数による2 次元の離散型のフーリエ展開であるDCTを施し、得られ低周波成分から高周波成分に至る複数のフーリエ係数をDCT係数として求めたのち、予め与えられた量子化テーブルによって上記DCT係数を除した商を画像データとする。ここで、上記DCT係数を除する量子化テーブルの係数は、高周波成分になるほど、値が大きく、しかも高周波成分のDCT係数は、低周波成分に比べて小さいため、高周波成分のDCT係数を除した商は大部分が0となる。すなわち、最適主成分画像Sk (k=1〜m1 )の画像データに含まれる高周波成分の画像データの大部分を、像構造に基づいた量子化テーブルによって0とするのである。一般的に画像データに含まれる高周波成分は、低周波成分に対して、画像に対する寄与が小さく、高周波成分を除去しても原画像の画像情報に対する影響は少なく、高周波成分を省略しても構わないからである。また、高周波成分は、撮影被写体Oの画像成分よりもノイズ成分が支配的である場合が多く、高周波成分を除去することで、画像データに含まれるノイズ成分を除去することができる。
【0047】
このように大部分の対数変換画像データの高周波成分のDCT係数を0とすることで、情報エントロピーを低減することができ、後述する符号化データ圧縮( ステップ114)の際において、対数変換画像データを大きく圧縮することが可能となる。
【0048】
次に、高周波成分の大部分が0となったDCT係数で構成される主成分画像Sk (k=1〜m1 )をそれぞれ、符号化し、対数変換画像データを圧縮する(ステップ114)。符号化は、例えばハフマン符号化やその他の算術符号化が行われる。
例えば、ハフマン符号化においては、DCT係数の0次低周波成分である直流成分とそれ以外の周波数成分に分け、例えば、8×8画素のブロック画像を代表した直流成分のみで表示される1/8×1/8の縮尺画像を得、この縮尺画像に対して、隣接する画素値との差分を取ってDPCM符号化により圧縮を行う。
一方、直流成分以外の周波数成分は、高周波成分になるにつれ、DCT係数が0となって行くため、順次低周波から高周波に向けてDCT係数を符号化する際、DCT係数0の連続する個数、すなわちランレングスによって符号化し、対数変換画像データの圧縮率を高めることができる。
【0049】
このようにして、最適主成分画像Sk (k=1〜m1 )の対数変換画像データを符号化した最適主成分圧縮画像データSdk (k=1〜m1 )を得、ステップ104において求められた最適主成分ベクトルpk (λ)(k=1〜m1 )とともに、圧縮マルチスペクトル画像データとして、記録メディアドライブ装置24を介して、ハードディスクやMOやCD−RやDVD等の各種記録メディアに保存する(ステップ116)
【0050】
本発明においては、画像データ量の大きなマルチスペクトル画像Ms を対数変換して、対数変換画像データを求め、これを用いて主成分分析し、画像情報を最適に保持する最適主成分ベクトルpk (λ)(k=1〜m1 )および最適主成分画像Sk (k=1〜m1 )を求めることによって、画像データ量を圧縮し、さらに、JPEG方式等によって、最適主成分画像Sk (k=1〜m1 )に対応した圧縮画像データSdk (k=1〜m1 )を求めて一層圧縮し,得られた最適主成分ベクトルpk (λ)(k=1〜m1 )および圧縮画像データSdk (k=1〜m1 )を記録保存する。
【0051】
これによって、複数のスペクトル画像が視覚的に劣化することなく画像圧縮の際の圧縮率を高め、画像データの取り扱いが向上する。特に、主成分分析では、主成分ベクトルの線型表示に対応する様に、主成分分析の対象となるマルチスペクトル画像の画像データを対数変換した対数変換画像データを用いて主成分分析を行うので、照明光の分光強度分布と撮影被写体Oの分光反射率分布の寄与を明確に分けることができ、撮影被写体Oの分光反射率が同じであるが照明強度が部分的に異なるマルチバンド画像や、照明強度のみが異なり、撮影被写体Oの分光反射率が同じである領域を大きく占めるようなマルチバンド画像において、画像圧縮の際の圧縮効率を高めることができる。
【0052】
なお、圧縮され記録メディア等に保存された画像データは、必要に応じて呼び出され、符号化データの圧縮および像構造に基づく圧縮の逆変換によって伸張処理が行われて、最適主成分ベクトルpk (λ)(k=1〜m1 )および最適主成分画像Sk (k=1〜m1 )が求められ、この最適主成分ベクトルpk (λ)および最適主成分画像Sk より、近似対数変換画像データR’(i,j,λ) が求められ、最後に真数変換を行ってマルチスペクトル画像が求められる。
【0053】
このようなマルチスペクトル画像の画像圧縮方法および画像圧縮装置において、以下のようなマルチスペクトル画像の圧縮を行った。
CCDカメラ16として、DALSA社製 CA-D4-1024A(画素数1024×1024、ピクセルサイズ12×12ミクロン、PCIインターフェース付き、モノクロ)を用い、可変フィルタ14として、CRI社製Varispec Tunable Filter (液晶チューナブルフィルタ)を用いた。この液晶チューナブルフィルタによって、380〜780nmの撮影波長帯域を、バンド帯域幅を10nmずつに分割し、41バンドとした。人物を撮影被写体Oとし、41画像から成る人物画のマルチバンド画像MB を得た。
【0054】
マルチバンド画像記憶部18、マルチスペクトル画像取得装置20およびマルチスペクトル画像圧縮装置22は、PROSIDE社製ブック型PC(パーソナルコンピュータ)を用いて構成し、Windows(登録商標)95上でC++言語によるソフトウェア処理を行った。なお、PROSIDE社製ブック型PCは、CPUが166MHz であり、RAMは128Mバイトであった。
なお、前処理として、ソフトウェア処理の都合上から、画像データの量子化数を2バイトから1バイトに変換した。この前処理は、以降で述べる画像データ量の圧縮には含まれていないものである。
【0055】
まず、マルチスペクトル画像取得装置20において、マルチバンド画像MB からマルチスペクトル画像MS を抽出し、対数変換を行った後、主成分分析を行い、主成分ベクトルpk (λ)(k=1〜41)および主成分画像Sk (k=1〜41)を求めた。
【0056】
次に、最適主成分数m1 を求めるために、判断基準として、CIED65の標準光源下のCIED1976L* * * 色空間における色度に基づく平均色差を1.5とし、上述した主成分分析法によって固有値uk および固有ベクトルである主成分ベクトルpk を求めた。固有値uk の大きい順に採用したm個の主成分ベクトルpk (λ)(k=1〜m)を真数変換して、再構成される合成画像Gとマルチスペクトル画像Ms から得られるオリジナル画像との上記平均色差を求め、平均色差が1.5以下となる最適主成分数m1 を決定した。
その結果、最適主成分数m1 は5であった。また、対数変換画像データR(i,j,λ) を第1〜第5主成分ベクトルpk (λ)によって近似しても、再構成された合成画像Gは、オリジナル画像の画像情報を依然保持し、しかも視覚的に劣化の少ないことがわかった。すなわち、第1〜5主成分画像Sk (k=1〜5)と第1〜5主成分ベクトルにより、41のバンド帯域からなるマルチスペクトル画像Ms を約1/8に画像データ量を圧縮することができた。
【0057】
さらに、求められた第1〜5主成分画像Sk (k=1〜5)について、上述した像構造に基づく非可逆なDCTによるJPEG方式で画像データの圧縮を行い、最適主成分画像Sk (k=1〜5)の画像データを符号化した。
その結果、最終的に主成分画像Sk (k=1〜5)の画像データは、41Mバイトから0.6Mバイトに、約1/70に圧縮されることがわかった。しかも、画像情報を保持し、視覚的な劣化も見られなかった。
【0058】
このように、本発明の画像圧縮方法およびこれを用いた画像圧縮装置は、複数のスペクトル画像に対して、視覚的な劣化が少なく画像圧縮の際の圧縮率を高め、例えば、1/70程度に高め、画像データの取り扱いを向上するのは明らかである。
【0059】
以上、本発明のマルチスペクトル画像の画像圧縮方法および画像圧縮装置について詳細に説明したが、本発明は上記実施例に限定はされず、本発明の要旨を逸脱しない範囲において、各種の改良および変更を行ってもよいのはもちろんである。
【0060】
【発明の効果】
以上、詳細に説明したように、本発明によれば、主成分分析法に合わせた形にマルチスペクトル画像データを対数変換して主成分分析を行い、画像データ量を圧縮し、さらに最適主成分画像をJPEG方式等による像構造圧縮を行い、さらに像構造圧縮を行った最適主成分画像の画像データを符号化して圧縮画像データとするので、画像品質を損なうことなく、画像圧縮し、さらに圧縮率を高め、画像データの取り扱いを向上させることができる。
また、マルチスペクトル画像に含まれる主成分ベクトルからノイズ成分が支配的な主成分ベクトルを除去することができ、ノイズ成分の抑制も行うことができる。
【図面の簡単な説明】
【図1】 本発明のマルチスペクトル画像圧縮装置を含むマルチスペクトル画像取得システムの一例を示す概念図である。
【図2】 本発明に係るマルチスペクトル画像圧縮装置の一例を示すブロック図である。
【図3】 本発明のマルチスペクトル画像圧縮方法における動作の一例を示すフローチャートである。
【符号の説明】
10 マルチスペクトル画像取得システム
12 光源
14 可変フィルタ
16 CCDカメラ
18 マルチバンド画像データ記憶装置
20 マルチスペクトル画像取得装置
22 マルチスペクトル画像圧縮装置
22a 画像データ変換部
22b 主成分分析部
22c 最適主成分ベクトル・画像抽出部
22d 画像圧縮部
24 記録メディアドライブ装置[0001]
BACKGROUND OF THE INVENTION
The present invention is effective for image data of a multispectral image obtained by using a band image obtained by dividing a photographing wavelength region when photographing a subject into a plurality of band bands, without impairing image quality. The present invention relates to a technical field of compression processing of image data that can be compressed.
[0002]
[Prior art]
Today, with the advancement of digital image processing, as a means for completely expressing color information (lightness, hue, saturation) of an image, an image having spectral information (spectral image) for each pixel of the image, that is, a multispectral image is used. It's being used.
This multispectral image has a spectral reflectance distribution based on a multiband image composed of a plurality of band images obtained by dividing a shooting wavelength region of a shooting subject into a plurality of band bands and shooting the shooting subject for each band band. It is obtained by estimating for each image. This multiband image can reproduce color information that cannot be sufficiently expressed by a conventional RGB color image composed of red (R), green (G), and blue (B) images. For example, a more accurate color reproduction is desired. It is effective for the world of painting. Therefore, in order to take advantage of the feature of accurately reproducing this color information, for example, the 380 to 780 nm imaging wavelength band is divided into 10 nm bands and divided into 41 bands, further divided into 5 nm bands and 81 bands. It is desired to obtain a multispectral image based on the provided multiband image.
[0003]
However, since a multispectral image having spectral information for each pixel has spectral reflectance data for each band (channel) obtained by dividing the imaging wavelength band, for example, for every 41 channels, the conventional three-channel image has been used. Compared to the RGB color image, for example, the image data amount must be about 13 times (41 channels / 3 channels).
Therefore, when storing the image data of the obtained multispectral image, a large storage capacity is required and the time required for the storage is long. Also, it takes a lot of time to transfer image data via a network, and handling becomes difficult.
[0004]
To solve such a problem, a spectral waveform obtained from spectral information for each pixel of a multispectral image is developed with three color matching functions, for example, a color matching function of RGB color form, and is not represented with a color matching function. Using the principal component analysis method, the spectral waveform part is expanded with the principal component basis vectors, and the principal components that represent the image information of the spectral image are extracted and adopted, and the other principal components are removed. Finally, a method of expressing the above spectrum waveform with a total of 6 to 8 basis vectors including color matching functions has been proposed (Th. Keusen, Multispectoral Color System wuth an Encoding Format Compatible with the Conventional Tristimulus Model, Journal of Imaging Science and Technology 40: 510-515 (1996)). By using this, the image data of the multispectral image can be compressed by expressing the spectrum waveform with 6 to 8 basis vectors and pairs of coefficients corresponding thereto. In particular, since the coefficient of the color matching function when represented by the color matching function of the RGB color form is a tristimulus value of R, G, and B, the image is based on the tristimulus value by the R, G, and B pixels. It is not necessary to perform special conversion so as to be compatible with conventional image processing apparatuses and image display apparatuses in which processing and image display are performed, and is excellent in reducing processing such that image data can be sent directly. It has the effect.
[0005]
[Problems to be solved by the invention]
For example, in the case of a multispectral image composed of 41 spectral images, the image data obtained by such a method is represented by, for example, eight basis vectors and their coefficients, thereby reducing the amount of image data of the multispectral image. It can be compressed to 20% (8 pieces / 41 pieces × 100).
However, in the case of a multispectral image composed of 41 spectral images, the amount of image data of the RGB color image is about 13 times larger than that of the RGB color image. The amount of data is still about 2.5 times (13 × 20/100) the amount of image data. For this reason, as described above, the recording time when recording and saving on a recording medium or the like, and the transfer time when transferring image data via a network are long, and handling is still difficult.
[0006]
Therefore, the present invention solves the above-described problems, and is less likely to be visually degraded with respect to a plurality of spectral images obtained by dividing a photographing wavelength band when photographing a subject into a plurality of band bands. It is an object of the present invention to provide an image compression method and an image compression apparatus for multispectral images that can increase the compression rate during image compression and improve the handling of image data.
[0007]
[Means for Solving the Problems]
In order to achieve the above object, the present invention is a method of compressing a multispectral image obtained by using a band image obtained by dividing a shooting wavelength band into a plurality of band bands when shooting a subject. ,
Logarithmically convert the image data of the multispectral image to logarithmically converted image data. Using the logarithmically converted image data, principal component analysis is performed to obtain multiple pairs of principal component vectors and principal component images based on the multispectral image. ,
From these multiple pairs, the optimum principal component vector and the optimum principal component image corresponding thereto are obtained by obtaining the optimum principal component number of the principal component vector and principal component image that best represents the image information of the multispectral image. And
Image structure compression is performed on each obtained optimum principal component image to obtain optimum principal component compressed image data, whereby the image data of the multispectral image is converted into the optimum principal component vector and the optimum principal component compressed image data. The present invention provides an image compression method for multispectral images characterized by compression.
[0008]
Here, the optimum number of principal components is preferably determined based on a colorimetric value in a color space, and the optimum number of principal components is selected from the principal component vector and the principal component image. The error value of the image information of the colorimetric value of the synthesized image to be image information of the colorimetric value of the original image configured based on the multispectral image is the minimum number of principal components that is equal to or less than a predetermined value. Is preferred.
More preferably, the optimum number of principal components includes a principal component vector having a large contribution to the multispectral image in order of a principal component vector having a large contribution, and the corresponding principal component vector and the principal component vector. It is preferable that the variation of the error with respect to the original image when obtaining the composite image composed of component images is the minimum number of principal components that falls within a predetermined value or less.
[0009]
The image structure compression is preferably compression of high-frequency components of image data by discrete Fourier transform or wavelet transform.
Furthermore, the compression by the image structure may be added with an encoding compression process for compressing the image data by encoding the image data.
[0010]
The present invention is also a multispectral image compression apparatus for compressing a multispectral image obtained by using a band image obtained by dividing a photographing wavelength band into a plurality of band bands when photographing a subject. ,
An image data converter for logarithmically converting the image data of the multispectral image to obtain logarithmically converted image data;
Using the logarithmically transformed image data obtained by this image data converter, a principal component analysis unit that performs principal component analysis and obtains a plurality of pairs of principal component vectors and principal component images based on multispectral images;
Among the multiple pairs of principal component vectors and principal component images obtained by this principal component analysis unit, the optimum number of principal components of the principal component vector and principal component image pair that best represents the image information of the multispectral image is determined. The optimum principal component vector / image extraction unit for obtaining the optimum principal component vector and the optimum principal component image,
Provided is an image compression device for multispectral images, characterized by having an image compression unit that performs image structure compression on the image data of each optimum principal component image obtained by the optimum component vector / image extraction unit. Is.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, a multispectral image acquisition system for performing an image compression method of a multispectral image of the present invention will be described in detail based on a preferred embodiment shown in the accompanying drawings.
[0012]
FIG. 1 shows a multispectral image acquisition system (hereinafter referred to as the present system) 10 that implements the multispectral image compression method of the present invention and includes the multispectral image compression apparatus of the present invention.
The system 10 shoots a photographic subject O and obtains a multispectral image M obtained. S Are stored in a recording medium, the light source 12 that illuminates the photographing subject O, the variable filter 14 that divides the photographing wavelength band into a plurality of band bands, and the multi-band image M obtained by photographing the photographing subject O. B A multi-spectral image data storage device 18 for temporarily storing image data, and a multi-spectral image M by estimating a spectral reflectance distribution for each pixel from the multi-band image. S A multispectral image acquisition device 20 for obtaining S The multi-spectral image compression device 22 that compresses the image data with less visual deterioration and with a higher compression ratio, and a storage media drive device 24 that stores the obtained compressed image data. Is done. In the present invention, the multispectral image M s Preferably comprises at least 6 channels or more of spectral images, that is, the number of constituent wavelengths having spectral reflectance distribution data is 6 or more.
[0013]
The light source 12 captures the photographic subject O, and the type of the light source is not particularly limited, but the captured multiband image M B Spectral reflectance is estimated from the multispectral image M S Is preferably a light source with a known spectral intensity distribution.
The variable filter 14 captures the photographic subject O and multiband image M. B In order to obtain the above, a band pass filter that can variably set the band band for dividing the imaging wavelength band can be divided into, for example, 16 bands, 21 bands, 41 bands, 81 bands, 201 bands, and the like. An example of such a variable filter is a liquid crystal tunable filter.
[0014]
The CCD camera 16 is a camera that captures an image formed by transmitted light obtained by splitting reflected light of a photographing subject O into a desired wavelength band through a variable filter 14 as a black and white band image. In this case, a CCD (charge coupled device) imaging device is arranged in a planar shape as an area sensor.
In addition, the CCD camera 16 is provided with a white balance adjustment mechanism that is performed before the photographing subject O is photographed in order to appropriately determine the dynamic range of the brightness value of the photographed image.
[0015]
The multiband image data storage device 18 is a multiband image M composed of a plurality of band images obtained by dividing the imaging wavelength band into a plurality of band bands and adjusted in white balance corresponding to each band. B Is a part for temporarily storing and holding.
The multispectral acquisition device 20 is preliminarily determined based on the correspondence between the image data of the photographic subject having a known spectral reflectance photographed by the CCD camera 16, for example, the image data of the Macbeth chart gray patch and the known spectral reflectance value. A created one-dimensional lookup table (one-dimensional LUT) is provided, and a multiband image M of the photographic subject O called from the multiband image data storage device 18 using the one-dimensional LUT. B The spectral reflectance of the photographic subject O for each pixel is estimated from the image data of the multi-spectral image M S Is acquired and sent to the multispectral image compression apparatus 22.
In the estimation of the spectral reflectance of the photographic subject O, when the filter characteristics of the variable filter 14, that is, the spectral transmittance distribution of the variable filter 14 has a characteristic in which a part thereof overlaps between bands, the obtained multispectral image M S Since the spectral reflectance distribution is dull and a highly accurate spectral reflectance distribution cannot be estimated, a deconvolution process that eliminates the filter characteristics may be performed using matrix calculation or Fourier transform.
[0016]
The recording media drive device 24 is a drive device that records on a recording medium such as a hard disk, floppy disk, MO, CD-R, or DVD. S The compressed multispectral image data obtained by compressing the image data by the multispectral image compression device 22 described later can be recorded. In addition to or instead of the recording media drive device 24, a network connection device may be provided for transferring compressed multispectral image data, which will be described later, via various networks.
[0017]
The multispectral image compression device 22 is a multispectral image M obtained by the multispectral acquisition device 20. S Is a portion for converting the multispectral image data constituting the image data into image data with little visual deterioration and a high image compression rate. The image data conversion unit 22a, the principal component analysis unit 22b, and the optimum principal component vector / image extraction A unit 22c and an image compression unit 22d. Moreover, this apparatus may be comprised by the software provided with the function as shown below, and may be comprised as one hardware.
[0018]
The image data conversion unit 22a performs logarithmic conversion, that is, log conversion, on the image data of the multispectral image sent from the multispectral image acquisition apparatus 20, and obtains logarithmically converted image data. 22b, which is converted using a known conversion means such as a one-dimensional lookup table. The logarithmic conversion of the image data is because the compression rate of the image can be increased as will be described later.
[0019]
Principal component analysis unit 22b performs multispectral image M S The principal component analysis of the logarithmically converted image data of the spectral reflectance distribution provided for each pixel is performed and developed by the principal component vector. Hereinafter, the number of bands for dividing the imaging wavelength band into a plurality of band bands will be described as n.
[0020]
Specifically, as the principal component analysis in the present invention, a primary independent eigenvector specific to the observed waveform is obtained as a principal component vector from the observed waveform using a statistical method and an eigenvalue analysis method. If there is essentially no noise component in the observed waveform, the principal component vector having a small eigenvalue with an eigenvalue of 0 is removed, the optimal principal component vector having a number smaller than the number of bands n is obtained, and the observed waveform is linearized by this optimum principal component vector. The method described in Shigeo Minami, “Waveform data processing for scientific measurement”, pp. 220-225. This analysis method is mainly performed in the principal component analysis unit 22b and an optimum principal component vector / image extraction unit 22c described later.
When the principal component analysis method is used in this way, it is preferable that the noise component included in the spectral reflectance waveform is noise that is unrelated to the spectral reflectance value.
[0021]
The multispectral image M will be described in detail according to the present embodiment. S Each has a spectral reflectance value corresponding to the number n of bands obtained by dividing the imaging wavelength band of the subject using the variable filter 14 for each pixel. That is, a multiband image M composed of n band bands. B Multispectral image M obtained by S Has a spectral reflectance distribution composed of n spectral reflectance values. Multispectral image M S Is, for example, 1024 × 1024 pixels, ie about 10 6 Since the number of pixels is overwhelmingly larger than n, which is the number of spectral reflectances, statistical processing, i.e., obtaining an autocorrelation matrix T for pixels in the entire image region or a part thereof, This can be used to perform principal component analysis of spectral reflectance. In this case, in order to effectively obtain the principal component by principal component analysis, the analysis is performed based on logarithmically converted image data obtained by logarithmically converting the spectral reflectance waveform data.
[0022]
Here, the principal component obtained from the principal component analysis is obtained by using statistical processing. For example, an orthonormalized autocorrelation matrix composed of n spectral reflectance values corresponding to the number of n bands. Principal component vector p which is an eigenvector of T k (Λ) (k = 1 to n) and the eigenvalue u of the autocorrelation matrix T k (K = 1 to n (k represents an integer of 1 to n)). The principal component vector p k (Λ) (k = 1 to n) is used to linearly expand the logarithmically converted image data R (i, j, λ) of the spectral reflectance distribution at the pixel position (i, j) of the spectral image. Each principal component vector p obtained k Coefficient s according to (λ) (k = 1 to n) k (i, j) (k = 1 to n) is obtained, and this is used as image data at the pixel position (i, j). k (K = 1 to n) can be obtained.
Obtained principal component vector p k (Λ) (k = 1 to n) and principal component image S k (K = 1 to n) is sent to the optimum principal component vector / image extraction unit 22c.
[0023]
The optimum principal component vector / image extraction unit 22c is configured to output the principal component vector p obtained by the principal component analysis unit 22b. k (Λ) (k = 1 to n) and the corresponding principal component image S k (K = 1 to n) and the optimal number of principal components m 1 And the optimal principal component vector p k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ).
Optimal principal component vector p k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ) Is extracted from the principal component vector p obtained by the principal component analysis unit 22b. k In (λ) (k = 1 to n), an eigenvector that does not originally correspond to the principal component vector due to the influence of the noise component of the image data of the multispectral image is also the principal component vector p. k Since it is obtained by being included as (λ) (k = 1 to n), this principal component vector p k (Λ) is eliminated and the optimal principal component vector p k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ) Must be extracted.
[0024]
That is, n principal component vectors p k (Λ) (k = 1 to n) and the corresponding principal component image S k From the (k = 1 to n) pairs, fewer m (m <n) principal component vectors p k (Λ) (k = 1 to m) and the corresponding principal component image S k A composite image G is obtained using a pair of (k = 1 to m), and the multispectral image M of the image information of the composite image G is obtained. s Using the error to the image information of the original image based on k (Λ) (k = 1 to m) and the corresponding principal component image S k It is determined whether (k = 1 to m) is the optimum principal component.
[0025]
Where the principal component vector p k (Λ) is the corresponding eigenvalue u k Is larger, the multispectral image M S The main component contributes greatly to the spectral reflectance distribution. Therefore, the eigenvalue u k Eigenvalue u in descending order of k Principal component vector p corresponding to k (Λ) is sequentially increased to obtain the composite image G, and under a certain illumination light source. so When the reconstructed composite image G is obtained, a multispectral image M composed of n principal component vectors is obtained. S The error of the image information of the composite image G with respect to the original image based on the above decreases monotonously as the number m of principal component vectors employed increases. Therefore, the minimum optimum principal component number m is obtained by obtaining the first principal component vector number m in which this error decreases below a predetermined value. 1 Can be requested. As a result, the optimum number of principal components m 1 Principal component vector p adopted when obtaining composite image G k (Λ) and the principal component image S obtained based thereon k Respectively, the optimal principal component vector p k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ) Can be extracted.
[0026]
Here, the image information is, for example, CIEL * a * b * Colorimetric value L under a certain light source in the color space * , A * And b * For example, CIED 65 Colorimetric value L under standard light conditions * , A * And b * In this case, the error is a color difference ΔE represented by the following formula (1). 0 It is. In this case, this color difference ΔE 0 For example, the optimal number m of principal components is found by finding the number m of principal component images such that the value is 1.0 or less. 1 Can be requested.
ΔE 0 = {(ΔL * ) 2 + (Δa * ) 2 + (Δb * ) 2 } 1/2 (1)
Where ΔL * , Δa * And Δb * Is an average colorimetric value L in the whole or part of the composite image and the multispectral image. * , A * And b * Difference. In this way, the optimum number of principal components m 1 Is the color difference ΔE between the colorimetric value in the color space of the composite image G and the colorimetric value of the original image. 0 Is adaptively determined based on
[0027]
Further, the error of the image information, that is, m principal component vectors p with respect to the original image k The square error E of the spectrum of the pixel of the whole image or a part of the composite image G reconstructed by 1 It may be. The image data value of the composite image G is also regarded as an example of the colorimetric value of the multispectral image, and the image data value that is the colorimetric value in the color space of the composite image G and the spectrum that is the colorimetric value of the original image. Square error E of image data value 1 Based on the optimal number of principal components m 1 May be determined adaptively. In this case, this square error E 1 Or Log (E 1 ) Is monotonically decreasing with respect to the number m of principal component vectors. Therefore, by increasing m, the square error E 1 Or Log (E 1 ) When the decrease width is smaller than a predetermined value, that is, the minimum m value when the decrease in the square error E is saturated below the predetermined value with respect to the increase in m may be obtained. .
[0028]
The image compression unit 22d receives the optimum principal component image S obtained by the optimum principal component vector / image extraction unit 22c. k (K = 1 to m 1 The image structure is compressed based on the image structure for each image data.
Optimal principal component image S k (K = 1 to m 1 ) Is the k-th principal component vector p k It is a black-and-white image composed of image data expressed by brightness values based on the coefficient of (λ). The image compression unit 22c performs image structure compression on such image data for each principal component image of each principal component. Examples of the image structure compression method include a DCT (Discrete Cosine Transformation) method used in JPEG (Joint Photographics Expert Group). Hereinafter, the JPEG method will be described. However, the present invention is not limited to this method, and for example, a DFT (Discrete Fourier Transformation) method, an FFT (Fast Fourier Transformation) method, or a WT (Wavelet Transformation) method may be used.
[0029]
The JPEG method is, for example, a principal component image S of 1024 × 1024 pixels. k Is divided into 8 × 8 pixel block images, and each block image is subjected to DCT, which is a two-dimensional discrete Fourier expansion using a cosine function, and a plurality of Fouriers obtained from low frequency components to high frequency components are obtained. After obtaining the coefficient as a DCT coefficient, the DCT coefficient is divided by a predetermined quantization table, and the Fourier coefficient of the high frequency component is omitted as 0, thereby compressing the image data of the high frequency component, and then the DCT coefficient In this method, the DCT coefficient image data is encoded and compressed using a Huffman coding method or a known arithmetic coding method. Here, the value of the quantization table is the principal component image S. k Depending on the image structure.
In the present invention, the image data from which the high-frequency component of the DCT coefficient is removed by the quantization table is used as compressed multispectral image data from the image compression unit 22d without using a Huffman coding method or a known arithmetic coding method. It may be output. In addition, the optimum principal component image S k (K = 1 to m 1 ) May be directly compressed by encoding.
[0030]
The system 10 is configured as described above.
Next, the flow of the image compression method along the system 10 will be described with reference to FIG.
[0031]
First, a photographic subject O is photographed by a multiband camera formed by the light source 12, the variable filter 14, and the CCD camera 16, and a multiband consisting of a plurality of band images, for example, a plurality of band images divided into 41 band bands. Image M B Is acquired (step 100). Obtained multiband image M B Is temporarily stored in the multiband image data storage device 18. When done Both are sent to the multispectral image acquisition device 20.
[0032]
The multispectral image acquisition apparatus 20 includes a one-dimensional lookup table (one-dimensional LUT) created from the relationship between, for example, the image data of the gray patch of the Macbeth chart and the value of the spectral reflectance thereof. Using the LUT, the multiband image M of the photographic subject O called from the multiband image data storage device 18 B Multispectral image M by estimating the spectral reflectance of the photographic subject O for each pixel using the image data of S Image data is acquired (step 102). In the estimation of the spectral reflectance of the photographic subject O, a deconvolution process using a matrix operation or Fourier transform may be added in order to estimate a highly accurate spectral reflectance distribution.
[0033]
Next, the obtained multispectral image M S Logarithmically transform the image data and analyze the principal component to obtain the optimum number of principal components m 1 Is determined (step 104).
First, before performing the principal component analysis, the image data of the multispectral image is subjected to logarithmic conversion processing, that is, Log conversion of the image data is performed (step 105).
[0034]
Here, the logarithmic conversion is performed for the following reason.
That is, the multispectral image M S Is the image data obtained according to the spectral transmission characteristics of the variable filter 14 showing a steep mountain distribution centered on the predetermined peak wavelength, and therefore the value of the obtained image data is actually the predetermined peak. It is approximately represented by the product of the spectral wavelength intensity distribution value of the illumination light of the light source 12 at the wavelength, the spectral reflectance distribution value of the photographic subject O, and the spectral sensitivity characteristic value of the CCD camera 16. By applying logarithmic transformation, the multispectral image M S The logarithmically converted image data values of the image data are the logarithmic value of the spectral wavelength intensity distribution value of the illumination light of the light source 12, the logarithmic value of the spectral reflectance distribution value of the photographic subject O, This is because it can be decomposed into a sum of logarithmic values of the reflectance distribution values and correspond to a linear sum of principal component vectors performed in principal component analysis, as shown in Equation (3) described later.
[0035]
On the other hand, if there is a portion where the spectral intensity distribution of the light source 12 is different even in the photographic subject O having the same spectral reflectance, the multispectral image M that is not subjected to logarithmic conversion. S Is represented by the product of the value of the spectral wavelength intensity distribution, the value of the spectral reflectance distribution of the photographic subject O, and the value of the spectral sensitivity characteristic of the CCD camera 16. k It cannot be expressed in correspondence with the principal component analysis expressed by the linear sum of (λ). Therefore, the multispectral image M can be expressed by increasing the number of principal components. S Therefore, the compression efficiency at the time of image compression which is the object of the present invention cannot be sufficiently increased.
[0036]
Next, principal component analysis is performed on the logarithmically transformed image data obtained by logarithmically transforming the multispectral image data in this way (step 106), and the principal component image S k (K = 1 to n) and principal component vector p k (Λ) (k = 1 to n) is obtained.
Hereinafter, the principal component analysis method will be described.
[0037]
Multispectral image M s Has a spectral reflectance distribution having n spectral reflectance values at the pixel position (i, j), and a multispectral image M s Logarithmically transformed image data obtained by logarithmically transforming the image data of R (i, j, λ) = (R (i, j, λ 1 ), R (i, j, λ 2 ), R (i, j, λ Three ), ..., R (i, j, λ n )) T (Lowercase T Is a transposition))), and an autocorrelation matrix T (the (k, l) component T of T) in a pixel of the entire image or a part of the image, for example, the remaining pixels obtained by thinning out the pixels from the entire image at regular intervals. kl Is R T R / n, and is an inner product related to the pixel position).
[0038]
The obtained autocorrelation matrix T is an n × n square matrix, and using this autocorrelation matrix T, an eigenvalue u that satisfies the following equation (2): k (U 1 > U 2 >...> u n , K = 1 to n) and the principal component vector p which is an orthonormalized eigenvector k (Λ) = (p k (i, j, λ 1 ), P k (i, j, λ 2 ), P k (I, j, λ Three ), ..., p k (I, j, λ n )) T (K = 1 to n) is obtained. The method for obtaining the eigenvalue and the eigenvector is not particularly limited as long as it is a known method such as the jacobi method or the power method.
T ・ p k (Λ) = u k p k (Λ) (2)
[0039]
Further, the logarithmically transformed image data R (i, j, λ) of the spectral reflectance distribution at the pixel position (i, j) is a principal component vector p which is an eigenvector as shown in the following equation (3). k Since (λ) (k = 1 to n),
[Expression 1]
Figure 0004097874
In accordance with the following equation (4), the principal component vector p k (Λ) (k = 1 to n) are normal to each other Orthogonal Taking advantage of the relationship, s k (I, j) to find.
s k (I, j) = R (i, j, λ) · p k (Λ) (4)
Here, the symbol • is an inner product of vectors related to the spectral wavelength of the band band composed of n components, and s k (I, j) is the k-th principal component vector p included in the logarithmically transformed image data R (i, j, λ) of the spectral reflectance distribution at the pixel position (i, j) of the multispectral image. k It is an amount indicating the size of. This s k (I, j) is obtained at each pixel position, and the k-th principal component image S having the value as image data at each pixel position. k (K = 1 to n) is obtained.
[0040]
Incidentally, the contribution of the first to n-th principal components in the logarithmically transformed image data R (i, j, λ) of the spectral reflectance distribution is, as described above, the eigenvalue u associated with each principal component. k Since the logarithmically transformed image data R (i, j, λ) of the spectral reflectance distribution is small as long as the image information is optimally held, the small eigenvalue u decreases. k Principal component vector p with k Can be approximated by omitting.
That is, as shown in the following formula (5), the eigenvalue u k Eigenvalue u within mth from the top when (k = 1 to n) are arranged in descending order k Principal component vector p which is an eigenvector corresponding to (k = 1 to m) k (Λ) (k = 1 to m) is adopted, and other eigenvalues u k Principal component vector p which is a small eigenvector of k By truncating (λ) (k = m + 1 to n), logarithmically converted image data R (i, j, λ) of the spectral reflectance distribution can be approximated and the image data can be compressed.
[Expression 2]
Figure 0004097874
[0041]
In particular, as described above, the logarithmically converted image data R (i, j, λ) of the spectral reflectance distribution is obtained by logarithmically converting the image data of the multiband image to obtain the logarithmic value of the intensity distribution of the spectral wavelength and the subject to be photographed. Since it can be expressed by the sum of logarithmic values of the spectral reflectance distribution of O, if there is a portion where the spectral reflectance of the photographic subject O is the same, but there is a portion where the illumination intensity of the light source 12 is different, for example, the photographic subject When there is a shadow portion due to illumination light on the surface of the same material of O, the principal component vector p of the logarithmically converted image data of the spectral reflectance distribution of the same material of the photographic subject O k The data is added to (λ) by the logarithmically converted bias amount of the spectral intensity distribution due to the shaded portion of the illumination light. Therefore, the main component based on the spectral reflectance of the photographic subject O can be extracted effectively in a state of logarithm conversion, distinguishing it from the bias amount due to the spectral intensity distribution of the illumination light. As a result, the optimal number of principal components m compared to the case where principal component analysis is performed without logarithmic transformation. 1 Can be suppressed, and the compression rate of the image targeted by the present invention can be increased.
[0042]
Therefore, the principal component vector p such that the logarithmically converted image data R (i, j, λ) of the spectral reflectance distribution is approximately represented without impairing the image information. k Adopted number, that is, optimum number of principal components m 1 And using this, the multispectral image M s Compress. As a result, the multispectral image M s The image data can be compressed without degrading the image quality.
Where eigenvalue u k Principal component vector p which is a large eigenvector k (Λ) (k = 1 to m 1 ) And the eigenvalue u k Small eigenvector p k (Λ) (k = m 1 Optimal number of principal components m for rounding down +1 to n) 1 Is set according to the following criteria (step 108).
[0043]
First, the eigenvalue u k Principal component vector p in descending order of k (Λ) in turn is the principal component vector p of equation (5) k Approximate logarithm-transformed image data R ′ (i, j, λ) of the spectral reflectance distribution corresponding to the multispectral image represented by the following formula (6) is included in (λ).
[Equation 3]
Figure 0004097874
The approximate logarithmically transformed image data R ′ (i, j, λ) has an error because it approximates the logarithmically transformed image data R (i, j, λ), but this approximate logarithmically transformed image data R ′ (i , j, λ) is converted to an exact number, and a multispectral image M of the image information of the composite image G obtained by multiplying a constant spectral intensity distribution as a spectral intensity distribution of illumination light. S The error with respect to the image information of the original image obtained by multiplying the above-mentioned spectral intensity distribution also decreases as the number of principal components m increases. Therefore, a predetermined value is set as a judgment criterion, and the image information of the synthesized image G obtained by multiplying the approximate logarithmically transformed image data R ′ (i, j, λ) by the spectral intensity distribution is the image information of the original image. The minimum optimum principal component number m is obtained by obtaining the first principal component number m whose error is smaller than the predetermined value set as the determination criterion. 1 Is acquired.
[0044]
For example , Multispectral image M of image information of composite image G S The error in the image information of the color difference ΔE between the colorimetric values L *, a * and b * in the CIEL * a * b * color space under the standard light conditions of CIED65. 0 This color difference ΔE 0 The above-mentioned predetermined value for is determined, and the minimum optimum number of principal components m 1 Ask for.
Further, the error is the square error E of the spectrum of the entire image or a part of the composite image G. 1 In this case, the square error E with respect to the increase in the number of principal components m. 1 Minimum optimal number of principal components m when the amount of decrease is saturated within a predetermined value 1 May be obtained.
[0045]
In this way, the multispectral image M s The minimum number of optimal principal components m that best represents the image information 1 , So that the eigenvalue u 1 ~ U m1 (U 1 ~ U m1 > U m1 > U m1 + 1 >...> u n M corresponding to 1 Optimal principal component vectors p k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ) To get. Where the principal component vector p to be removed k (Λ) (k = m 1 +1 to n), the noise component included in the multispectral image Ms is relatively dominant, and the principal component vector p having a small contribution from the multispectral image Ms. k (Λ) (k = m 1 By removing +1 to n), the multispectral image M s The noise component contained in can also be suppressed.
[0046]
Next, the obtained optimum principal component image S k (K = 1 to m 1 ), The image compression unit 22d performs image compression (step 110). Image compression includes logarithmically transformed image data compression (step 112) and encoded data compression (step 114) based on the image structure.
The logarithmically converted image data based on the image structure is compressed by, for example, JPEG compression, for example, a principal component image S of 1024 × 1024 pixels. k Is divided into 8 × 8 pixel block images, and each block image is subjected to DCT, which is a two-dimensional discrete Fourier expansion using a cosine function, and a plurality of Fouriers obtained from low frequency components to high frequency components are obtained. After obtaining the coefficient as a DCT coefficient, a quotient obtained by dividing the DCT coefficient by a predetermined quantization table is set as image data. Here, the coefficient of the quantization table that divides the DCT coefficient has a larger value as the frequency component becomes higher, and the DCT coefficient of the high frequency component is smaller than the low frequency component, so the DCT coefficient of the high frequency component is divided. Most of the quotient is 0. That is, the optimum principal component image S k (K = 1 to m 1 ) Is set to 0 by the quantization table based on the image structure. In general, the high frequency component included in the image data has a small contribution to the image with respect to the low frequency component, and even if the high frequency component is removed, the influence on the image information of the original image is small, and the high frequency component may be omitted. Because there is no. In addition, the high-frequency component is often dominated by the noise component as compared with the image component of the photographic subject O, and the noise component included in the image data can be removed by removing the high-frequency component.
[0047]
Information entropy can be reduced by setting the DCT coefficient of the high-frequency component of most logarithmically transformed image data to 0 in this way, and logarithmically transformed image data can be reduced during encoded data compression (step 114) described later. Can be greatly compressed.
[0048]
Next, the principal component image S composed of DCT coefficients in which most of the high frequency components are zero. k (K = 1 to m 1 ) Are respectively encoded and the logarithmically converted image data is compressed (step 114). For example, Huffman encoding or other arithmetic encoding is performed.
For example, in Huffman coding, a DC component that is a zero-order low-frequency component of a DCT coefficient is divided into a frequency component other than the DC component and, for example, 1 / D that is displayed only with a DC component that represents a block image of 8 × 8 pixels. An 8 × 1/8 scale image is obtained, and this scaled image is compressed by DPCM encoding by taking a difference from adjacent pixel values.
On the other hand, since the frequency components other than the direct current component become high frequency components, the DCT coefficient becomes 0. Therefore, when sequentially encoding DCT coefficients from low frequency to high frequency, the number of continuous DCT coefficients 0, That is, encoding is performed by run length, and the compression rate of logarithmically converted image data can be increased.
[0049]
In this way, the optimum principal component image S k (K = 1 to m 1 ) Optimal principal component compressed image data Sd encoded by logarithmically transformed image data k (K = 1 to m 1 ) And the optimum principal component vector p determined in step 104 k (Λ) (k = 1 to m 1 In addition, the compressed multispectral image data is stored in various recording media such as a hard disk, an MO, a CD-R, and a DVD via the recording media drive device 24 (step 116).
[0050]
In the present invention, the multispectral image M having a large amount of image data. s Logarithmically transform to obtain logarithmically transformed image data, and use this to perform principal component analysis, and optimal principal component vector p that optimally holds image information k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ) Is compressed, and the optimum principal component image S is further compressed by the JPEG method or the like. k (K = 1 to m 1 ) Corresponding to the compressed image data Sd k (K = 1 to m 1 ) To obtain the optimal principal component vector p k (Λ) (k = 1 to m 1 ) And compressed image data Sd k (K = 1 to m 1 ) Is recorded and saved.
[0051]
Thereby, the compression rate at the time of image compression is increased without visually degrading a plurality of spectrum images, and the handling of image data is improved. In particular, in principal component analysis, principal component analysis is performed using logarithmically transformed image data obtained by logarithmically transforming image data of a multispectral image to be subjected to principal component analysis so as to correspond to linear display of principal component vectors. The contribution of the spectral intensity distribution of the illumination light and the spectral reflectance distribution of the photographic subject O can be clearly separated, and a multiband image in which the spectral reflectance of the photographic subject O is the same but the illumination intensity is partially different, or illumination In a multiband image that differs only in intensity and occupies a large area where the spectral reflectance of the photographic subject O is the same, the compression efficiency at the time of image compression can be increased.
[0052]
The image data that has been compressed and stored in the recording medium or the like is called as necessary, and is subjected to expansion processing by compression of the encoded data and inverse conversion of compression based on the image structure, and the optimum principal component vector p k (Λ) (k = 1 to m 1 ) And the optimal principal component image S k (K = 1 to m 1 ) And the optimum principal component vector p k (Λ) and the optimal principal component image S k Thus, approximate logarithmic transformation image data R ′ (i, j, λ) is obtained, and finally, a multi-spectral image is obtained by performing a true number transformation.
[0053]
In such a multispectral image compression method and image compression apparatus, the following multispectral image was compressed.
A CA-D4-1024A manufactured by DALSA (pixel number: 1024 × 1024, pixel size: 12 × 12 microns, with a PCI interface, monochrome) is used as the CCD camera 16, and a variable spec tunable filter (liquid crystal tuner) manufactured by CRI is used as the variable filter 14. Bull filter) was used. With this liquid crystal tunable filter, the imaging wavelength band of 380 to 780 nm was divided into 10 nm increments to obtain 41 bands. A person is a shooting subject O, and a multi-band image M of a figure composed of 41 images. B Got.
[0054]
The multiband image storage unit 18, the multispectral image acquisition device 20, and the multispectral image compression device 22 are configured using a book type PC (personal computer) manufactured by PROSIDE, and are used in C ++ language on Windows (registered trademark) 95. Software processing by. Note that the PROSIDE book type PC has a CPU of 166 MHz and a RAM of 128M. Part-Time Job Met.
As preprocessing, the quantization number of the image data is converted from 2 bytes to 1 byte for the convenience of software processing. This preprocessing is not included in the compression of the image data amount described below.
[0055]
First, in the multispectral image acquisition apparatus 20, the multiband image M B To multispectral image M S Is extracted, logarithmic transformation is performed, principal component analysis is performed, and the principal component vector p k (Λ) (k = 1 to 41) and principal component image S k (K = 1 to 41) was determined.
[0056]
Next, the optimum number of principal components m 1 CIED as a criterion for determining 65 CIED 1976L under standard light source * a * b * The average color difference based on the chromaticity in the color space is set to 1.5, and the eigenvalue u is determined by the principal component analysis method described above. k And a principal component vector p which is an eigenvector k Asked. Eigenvalue u k M principal component vectors p adopted in descending order of k A composite image G and a multispectral image M reconstructed by performing an exact transformation of (λ) (k = 1 to m) s The average color difference from the original image obtained from the above is obtained, and the optimum number of main components m for which the average color difference is 1.5 or less 1 It was determined.
As a result, the optimum number of principal components m 1 Was 5. Also, logarithmically transformed image data R (i, j, λ) is converted into first to fifth principal component vectors p. k Even if approximated by (λ), it was found that the reconstructed composite image G still retains the image information of the original image and is visually less degraded. That is, the first to fifth principal component images S k Multispectral image M composed of 41 band bands by (k = 1 to 5) and the first to fifth principal component vectors. s The image data amount could be compressed to about 1/8.
[0057]
Further, the obtained first to fifth principal component images S k For (k = 1 to 5), the image data is compressed by the JPEG method by irreversible DCT based on the above-described image structure, and the optimum principal component image S k Image data (k = 1 to 5) was encoded.
As a result, finally the principal component image S k It was found that the image data of (k = 1 to 5) is compressed to about 1/70 from 41 Mbytes to 0.6 Mbytes. In addition, the image information was retained and no visual deterioration was observed.
[0058]
As described above, the image compression method and the image compression apparatus using the image compression method of the present invention increase the compression rate at the time of image compression with little visual deterioration with respect to a plurality of spectral images, for example, about 1/70. Obviously, the handling of image data is improved.
[0059]
The multispectral image compression method and image compression apparatus according to the present invention have been described in detail above. However, the present invention is not limited to the above embodiments, and various improvements and modifications can be made without departing from the scope of the present invention. Of course, you may also do.
[0060]
【The invention's effect】
As described above in detail, according to the present invention, the multispectral image data is logarithmically transformed into a form adapted to the principal component analysis method, the principal component analysis is performed, the image data amount is compressed, and the optimum principal component is further compressed. The image is compressed by JPEG, etc., and the image data of the optimal principal component image that has been further compressed is encoded into compressed image data. Therefore, the image is compressed without loss of image quality and further compressed. The rate can be increased and the handling of image data can be improved.
In addition, it is possible to remove the principal component vector in which the noise component is dominant from the principal component vector included in the multispectral image, and it is possible to suppress the noise component.
[Brief description of the drawings]
FIG. 1 is a conceptual diagram showing an example of a multispectral image acquisition system including a multispectral image compression apparatus of the present invention.
FIG. 2 is a block diagram showing an example of a multispectral image compression apparatus according to the present invention.
FIG. 3 shows a multispectral image compression method according to the present invention. Operation in It is a flowchart which shows an example.
[Explanation of symbols]
10 Multispectral image acquisition system
12 Light source
14 Variable filter
16 CCD camera
18 Multiband image data storage device
20 Multispectral image acquisition device
22 Multispectral image compression device
22a Image data converter
22b Principal component analysis unit
22c Optimal principal component vector / image extractor
22d Image compression unit
24 Recording media drive device

Claims (7)

被写体を撮影する際に撮影波長帯域を複数のバンド帯域に分割して撮影したバンド画像を用いて得られるマルチスペクトル画像を画像圧縮する方法であって、マルチスペクトル画像の画像データを対数変換して対数変換画像データとし、この対数変換画像データを用いて、主成分分析を行い、マルチスペクトル画像に基づく主成分ベクトルと主成分画像の複数の対を得、
この複数の対の中から、マルチスペクトル画像の画像情報を最適に代表する主成分ベクトルと主成分画像の対の最適主成分数を求めて、最適主成分ベクトルとこれに対応する最適主成分画像を得、
得られた各最適主成分画像に対して、像構造圧縮を行い最適主成分圧縮画像データを得ることによって、前記マルチスペクトル画像の画像データを前記最適主成分ベクトルおよび前記最適主成分圧縮画像データに圧縮することを特徴とするマルチスペクトル画像の画像圧縮方法。
A method of compressing a multispectral image obtained by using a band image obtained by dividing a shooting wavelength band into a plurality of band bands when shooting a subject, and logarithmically converting the image data of the multispectral image Using the logarithmically transformed image data as the logarithmically transformed image data, the principal component analysis is performed to obtain a plurality of principal component vector and principal component image pairs based on the multispectral image,
From these multiple pairs, the optimum principal component vector and the optimum principal component image corresponding thereto are obtained by obtaining the optimum principal component number of the principal component vector and principal component image that best represents the image information of the multispectral image. And
Image structure compression is performed on each obtained optimum principal component image to obtain optimum principal component compressed image data, whereby the image data of the multispectral image is converted into the optimum principal component vector and the optimum principal component compressed image data. An image compression method for a multispectral image, characterized by compression.
前記最適主成分数は、色空間上の測色値に基づいて決定される請求項1に記載のマルチスペクトル画像の画像圧縮方法。The multi-spectral image compression method according to claim 1, wherein the optimum number of principal components is determined based on a colorimetric value in a color space. 前記最適主成分数は、前記主成分ベクトルと前記主成分画像の中から選ばれて構成される合成画像の測色値の画像情報の、前記マルチスペクトル画像に基づいて構成されるオリジナル画像の測色値の画像情報に対する誤差の値が、所定値以下となる最小の主成分数である請求項1または2に記載のマルチスペクトル画像の画像圧縮方法。The optimum number of principal components is obtained by measuring an original image configured based on the multispectral image of image information of a colorimetric value of a composite image configured by being selected from the principal component vector and the principal component image. The image compression method for a multispectral image according to claim 1 or 2, wherein an error value with respect to image information of a color value is a minimum number of principal components that is a predetermined value or less. 前記最適主成分数は、前記マルチスペクトル画像に対する寄与の大きい主成分ベクトルを、寄与の大きい主成分ベクトルの順に、順次含め、これに対応した前記主成分ベクトルと前記主成分画像によって構成される前記合成画像を求めた時の前記オリジナル画像に対する前記誤差の変動が、所定値以下に収まる最小の主成分数である請求項3に記載のマルチスペクトル画像の画像圧縮方法。The optimal number of principal components includes principal component vectors having a large contribution to the multispectral image in the order of principal components vectors having a large contribution, and is constituted by the corresponding principal component vectors and the principal component images. The image compression method for a multispectral image according to claim 3, wherein a variation in the error with respect to the original image when a composite image is obtained is a minimum number of principal components that falls within a predetermined value. 前記像構造圧縮は、離散フーリエ変換またはウェーブレット変換による画像データの高周波成分の圧縮である請求項1〜4のいずれかに記載のマルチスペクトル画像の画像圧縮方法。5. The method of compressing a multispectral image according to claim 1, wherein the image structure compression is compression of a high-frequency component of image data by discrete Fourier transform or wavelet transform. 前記像構造による圧縮は、画像データの符号化により画像データを圧縮する符号化圧縮処理が付加される請求項5に記載のマルチスペクトル画像の画像圧縮方法。6. The method of compressing a multispectral image according to claim 5, wherein the compression by the image structure is added with an encoding compression process for compressing the image data by encoding the image data. 被写体を撮影する際に撮影波長帯域を複数のバンド帯域に分割して撮影したバンド画像を用いて得られるマルチスペクトル画像を画像圧縮するマルチスペクトル画像の画像圧縮装置であって、
マルチスペクトル画像の画像データを対数変換して対数変換画像データを得る画像データ変換部と、
この画像データ変換部で得られた対数変換画像データを用いて、主成分分析を行い、マルチスペクトル画像に基づく主成分ベクトルと主成分画像の複数の対を得る主成分分析部と、
この主成分分析部で得られた主成分ベクトルと主成分画像の複数の対の中から、マルチスペクトル画像の画像情報を最適に代表する主成分ベクトルと主成分画像の対の最適主成分数を求めて、最適主成分ベクトルと最適主成分画像を得る最適主成分ベクトル・画像抽出部と、
この最適成分ベクトル・画像抽出部で得られた各最適主成分画像の画像データに対して、像構造圧縮を行う画像圧縮部とを有することを特徴とするマルチスペクトル画像の画像圧縮装置。
A multispectral image compression apparatus that compresses a multispectral image obtained using a band image obtained by dividing a photographing wavelength band into a plurality of band bands when photographing a subject,
An image data converter for logarithmically converting the image data of the multispectral image to obtain logarithmically converted image data;
Using the logarithmically transformed image data obtained by this image data converter, a principal component analysis unit that performs principal component analysis and obtains a plurality of pairs of principal component vectors and principal component images based on multispectral images;
Among the multiple pairs of principal component vectors and principal component images obtained by this principal component analysis unit, the optimum number of principal components of the principal component vector and principal component image pair that best represents the image information of the multispectral image is determined. The optimum principal component vector / image extraction unit for obtaining the optimum principal component vector and the optimum principal component image,
An image compression apparatus for a multispectral image, comprising: an image compression unit that performs image structure compression on image data of each optimum principal component image obtained by the optimum component vector / image extraction unit.
JP2000060471A 2000-03-06 2000-03-06 Image compression method and image compression apparatus for multispectral image Expired - Fee Related JP4097874B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000060471A JP4097874B2 (en) 2000-03-06 2000-03-06 Image compression method and image compression apparatus for multispectral image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000060471A JP4097874B2 (en) 2000-03-06 2000-03-06 Image compression method and image compression apparatus for multispectral image

Publications (3)

Publication Number Publication Date
JP2001251646A JP2001251646A (en) 2001-09-14
JP2001251646A5 JP2001251646A5 (en) 2005-11-04
JP4097874B2 true JP4097874B2 (en) 2008-06-11

Family

ID=18580783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000060471A Expired - Fee Related JP4097874B2 (en) 2000-03-06 2000-03-06 Image compression method and image compression apparatus for multispectral image

Country Status (1)

Country Link
JP (1) JP4097874B2 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003103298A1 (en) * 2002-05-31 2003-12-11 オリンパス株式会社 Multiprojection system and correction data acquiring method for multiprojection system
JP4474145B2 (en) 2003-11-12 2010-06-02 株式会社日立メディコ Optical measuring device
JP4952329B2 (en) * 2007-03-27 2012-06-13 カシオ計算機株式会社 Imaging apparatus, chromatic aberration correction method, and program
JP5135882B2 (en) * 2007-05-22 2013-02-06 株式会社豊田中央研究所 Object identification device and program
JP5074101B2 (en) * 2007-06-04 2012-11-14 オリンパス株式会社 Multispectral image processing apparatus and color reproduction system using the same
JP5459088B2 (en) * 2010-06-10 2014-04-02 富士通株式会社 SPECTRUM ANALYSIS METHOD AND SPECTRUM ANALYSIS DEVICE
JP5713350B2 (en) * 2011-10-25 2015-05-07 日本電信電話株式会社 Image processing apparatus, method, and program
US8947549B2 (en) 2011-12-28 2015-02-03 Dolby Laboratories Licensing Corporation Spectral synthesis for image capturing device processing
JP6078382B2 (en) * 2013-03-06 2017-02-08 日本放送協会 Signal conversion device, signal restoration device, signal conversion program, and signal restoration program
CN105719322A (en) * 2016-01-27 2016-06-29 四川用联信息技术有限公司 Multispectral image compression method based on square matrix transformation
JP2021170689A (en) * 2018-06-01 2021-10-28 ソニーグループ株式会社 Image processing device and method
CN111061896B (en) * 2019-10-21 2023-04-18 武汉神库小匠科技有限公司 Loading method, device, equipment and medium for 3D (three-dimensional) graph based on glTF (generalized likelihood TF)

Also Published As

Publication number Publication date
JP2001251646A (en) 2001-09-14

Similar Documents

Publication Publication Date Title
JP4097873B2 (en) Image compression method and image compression apparatus for multispectral image
JP3986221B2 (en) Image compression method and image compression apparatus for multispectral image
US7181082B2 (en) Blur detection system
US7146039B2 (en) Image compression apparatus and image compression program
JP4097874B2 (en) Image compression method and image compression apparatus for multispectral image
US20040258301A1 (en) Lossy JPEG compression/reconstruction using principal components transformation
EP3185555B1 (en) Image compression method with negligible and quantifiable information loss and high compression ratio
JP2003023631A (en) Image compressor and image reproducing device
JP2001119587A5 (en)
JP2014519727A (en) Efficient expression and processing method of color pixel data in digital pathological image
US6597811B1 (en) Method and device for image digitized data compression and decompression
JP3986219B2 (en) Image compression method and image compression apparatus for multispectral image
US6665447B1 (en) Method for enhancing image data by sharpening
JP3743389B2 (en) Image compression apparatus and image compression program
US7146055B2 (en) Image processing decompression apparatus and method of using same different scaling algorithms simultaneously
US20020063899A1 (en) Imaging device connected to processor-based system using high-bandwidth bus
WO2023241188A1 (en) Data compression method for quantitative remote sensing application of unmanned aerial vehicle
Rabie Color-secure digital image compression
JPH11261740A (en) Picture evaluating method, its device and recording medium
JP3732674B2 (en) Color image compression method and color image compression apparatus
JP2001119586A5 (en)
JPH05176179A (en) Method and device for estimating picture data subject to compression/expansion processing
JP2004348293A (en) Image quality computing device and method, program thereof, and recording medium
Salamati et al. Compression of multispectral images: Color (RGB) plus near-infrared (NIR)
Mohebbian et al. CFA image compression using an efficient cascaded overlapping color transformation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050914

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050914

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080312

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110321

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110321

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120321

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120321

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130321

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130321

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140321

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees