JP4086192B2 - 画像処理装置、画像処理方法、プログラム及び情報記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラム及び情報記録媒体 Download PDF

Info

Publication number
JP4086192B2
JP4086192B2 JP2003417886A JP2003417886A JP4086192B2 JP 4086192 B2 JP4086192 B2 JP 4086192B2 JP 2003417886 A JP2003417886 A JP 2003417886A JP 2003417886 A JP2003417886 A JP 2003417886A JP 4086192 B2 JP4086192 B2 JP 4086192B2
Authority
JP
Japan
Prior art keywords
code
code stream
image
layer
progressive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003417886A
Other languages
English (en)
Other versions
JP2005184086A (ja
Inventor
幸二 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003417886A priority Critical patent/JP4086192B2/ja
Publication of JP2005184086A publication Critical patent/JP2005184086A/ja
Application granted granted Critical
Publication of JP4086192B2 publication Critical patent/JP4086192B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、画像処理の分野に係り、特に、画像のプログレッシブ符号ストリームの生成及びプログレッシブ復号に関する。
近年、デジタルカメラやスキャナ等の普及に加えてインターネットの高速化も進み、高精細な多値の静止画像がホームユーザにも手軽に扱われるようになった。通常、これらの多値静止画像は、非常に多くの情報量となるため、何らかの圧縮符号化処理が行われている。
現在、カラー静止画像において最もよく使用されいる圧縮符号化方式は、Joint Photographic Experts GroupのIS(International Standard)10918-1(ITU-T T.81)にて勧告されたJPEGベースラインシステムである。なお、JPEGはベースラインシステムの他にプログレッシブ等の機能を拡充した拡張システム(IS 10918-3:ITU-T T.84)も標準化されている。また、次世代圧縮方式として、JPEGよりも高画質、多機能化が図られたJPEG2000の基本方式(part1)も2000年12月に標準化が完了している(IS 15444-1)。
通常、画像データを転送する際には、上記のような圧縮方式によって圧縮符号化された画像データがネットワークを介して転送され、受信側で復号され、モニタ等の表示装置に表示され、あるいは紙等の記録媒体に記録されて顕像化される。例えば、クライアント/サーバ環境において、クライアント側が画像データを受信してモニタ等に表示する場合に、例えばインターネットのような転送路の帯域が狭く画像データの受信に時間がかかるような条件では、画像データの転送の初期段階で粗い画像を画面表示させ、画像データの転送が進むにつれて精細な画像を表示するプログレッシブ符号化方式が採用されている。
JPEGでは、その拡張システムにおいて、転送路を介して画像を表示させることを主な目的としたプログレッシブ符号化方式が定義されているが、JPEG2000においては基本方式からプログレッシブ符号化方式が定義されている。
後述の本発明の実施の形態においては圧縮符号化方式としてJPEG2000を利用するため、ここでJPEG2000基本方式とプログレッシブ順序の概要を説明する。
図26は、JPEG2000part1(以下JPEG2000)における圧縮符号化処理の基本ブロック図である。ここでは、入力画像データとしてカラーのRed,Green,Blue(以下RGB)の画像データを扱うもとして説明する。
入力されたRGBの画像データは、タイリング処理部222にて矩形のブロック(タイルと呼ばれる)に分割され、タイル単位で色変換部223に入力される。ラスタ形式の画像データが入力された場合は、タイリング処理部222においてラスタ/ブロック変換が行われる。
JPEG2000においては、タイル単位に独立して符号化又は復号化が可能である。このことは、ハードウェアにより符号化/復号化を行う場合のハード量を削減でき、また、必要なタイルのみ復号して表示することも可能となるなど、JPEG2000の多機能化の一翼を担っている。なお、JPEG2000ではタイリングはオプションであり、タイリングを行わないことも可能である。
次に、画像データは色変換処理部123にて、輝度/色差系の信号に変換される。JPEG2000では、離散ウェーブレット変換(以下DWT)に使用するフィルタの種類(5x3と9x7の2通り)に対応して2種類の色変換が定められており、例えば可逆変換可能な5x3フィルタを使用する場合は、下記の式(1)による可逆の色変換が用いられる。
Figure 0004086192
なお、上記の色変換に先立ち、RGBの各信号毎にDCレベルシフトが行われる。DCレベルシフトは、例えば入力RGB信号が8bitの場合は、下記の式(2)により表される。
Figure 0004086192
色変換後の信号はDWT処理部224において各コンポーネント毎に離散ウェーブレット変換(DWT)を施される。DWTは2次元にて行われるが、通常は、リフティング演算と呼ばれる演算方法により、1次元フィルタ演算のコンボリューションにて実施される。1次元の変換式を式(3)に示す。
Figure 0004086192
DWTはダウンサンプリングを伴うため、上記L(k)、H(k)は入力画像と比較し1/2の解像度となる。
図27は、オクターブ分割されたウェーブレット係数を表す図である。DWTは、1デコンポジション(分解)レベル毎にLL,HL,LH,HHの4つのサブバンドと呼ばれる方向成分が出力され、LLに対してDWTを再帰的に行うことによって、より低解像度へとデコンポジションレベルをあげていく。解像度の最も高いデコンポジションレベル1の係数を1HL,1LH,1HHと表し、デコンポジションレベル2の係数を2HL,2LH,2HH、等々と表す。なお、図27は、3デコンポジションレベルのサブバンド分割を示している。また、図27中の各サブバンドの右肩に記入した数字は解像度レベルを示す。
各デコンポジションレベルのサブバンドを、プレシンクトと呼ばれる矩形領域に分割して符号の集合を作成することが可能である。また、各プレシンクトはコードブロックとよばれる所定の矩形ブロックに分割され、符号化はコードブロック単位で行われる。
さて、DWT処理部224から出力されたウェーブレット係数に対し量子化処理部225によってスカラー量子化が行われるが、可逆のDWTが実施される場合にはスカラー量子化は行われないか、量子化ステップサイズを1とした量子化が行われる。また、後段のポスト量子化部227によるポスト量子化によっても、スカラー量子化とほぼ同様な効果が得られる。スカラー量子化のパラメータはタイル単位に変更可能である。
量子化処理部225から出力された量子化後のウェーブレット係数は、エントロピー符号化部226にてエントロピー符号化が行われる。JPEG2000におけるエントロピー符号化方式では、サブバンド内をコードブロックと呼ばれる矩形領域に分割し(但し、サブバンド領域のサイズがコードブロックサイズ以下の場合は分割しない)、コードブロック単位に符号化される。
この符号化においては、図28に模式的に示すように、コードブロック内のウェーブレット係数はビットプレーンに分解され、ビットプレーンは画質への影響度を表す状態に従って3つの符号化パス(Significance propagationパス,Magnitude refinementパス,Clean upパス)と呼ばれるサブビットプレーンに分割されて、各々でMQコーダと呼ばれる算術符号化方式により符号化される。ビットプレーンはMSB側ほど、また、符号化パスはSignificance propagation、Magnitude refinement,Clean upの順に、重要度(画質への寄与度)が高くなっている。また、各パスの終端は、切り捨て点(トランケーションポイント)とも呼ばれ、後段でのポスト量子化での符号の切り捨て可能な単位となっている。
エントロピー符号化により生成された符号データに対し、ポスト量子化部227にて必要に応じて符号の切り捨て(トランケーション)が行われる。ただし、可逆の符号を出力する必要がある場合にはポスト量子化は実行されない。このように符号化後に符号の切り捨てにより符号量を制御することができ、符号量の制御にフィードバックを必要としない構成(1パスの符号化)であり、これがJPEG2000の特徴の1つである。
符号ストリーム生成処理部228は、ポスト量子化後の符号データに対し、後述するプログレッシブ順序に従って符号の並べ替えとヘッダの付加を行うことにより符号ストリームを生成する。
図29は、JPEG2000におけるレイヤプログレッションの符号ストリームの模式図である。符号ストリームは、メインヘッダと1以上のタイルのデータで構成される。各タイルのデータは、タイルヘッダと、タイル内符号をレイヤとよばれる符号単位(後述)に区切った複数のレイヤにより構成されており、レイヤ0、レイヤ1・・・というように上位レイヤから順番に並んでいる。レイヤはレイヤ用のタイルヘッダと複数のパケットにより構成されており、パケットはパケットヘッダと符号データから構成されている。
パケットは、符号データの最小単位であり、1つのタイルコンポーネント内の1つの解像度レベル(デコンポジションレベル)における1つのプレシンクト内の1つのレイヤの符号データから成っている。
次に、JPEG2000におけるプログレッシブ順序について説明する。JPEG2000では、画質(レイヤ(L))、解像度(R)、コンポーネント(C)、位置(プレシンクト(P))という4つの画像の要素の優先順位を変更することによって、以下に示す5通りのプログレッション(プログレッシブ順序)が定義されている。
・LRCPプログレッション:プレシンクト、コンポーネント、解像度レベル、レイヤの順序に復号されるため、レイヤのインデックスが進む毎に画像全面の画質が改善されることになり、画質プログレッションを実現できる。レイヤプログレッションとも呼ばれる。
・RLCPプログレッション:プレシンクト、コンポーネント、レイヤ、解像度レベルの順序に復号されるため、解像度プログレッションを実現できる。
・RPCLプログレッション:レイヤ、コンポーネント、プレシンクト、解像度レベルの順序に復号されるため、RLCPプログレッションと同様、解像度プログレッションであるが、特定位置(プレシンクト)の優先度を高くすることができる。
・PCRLプログレッション:レイヤ、解像度レベル、コンポーネント、プレシンクトの順序に復号されるため、特定部分の復号が優先されるようになり空間位置プログレッションを実現できる。
・CPRLプログレッション:レイヤ、解像度レベル、プレシンクト、コンポーネントの順序に復号されるため、例えばカラー画像のプログレッシブ復号の際に、最初にグレーの画像を再現するようなコンポーネント・プログレッションを実現できる。
図30の(A)はLRCPプログレッション(以下、レイヤプログレッション)のプログレッシブ順序を、(B)はRLCPプログレッションまたはRPCLプログレッション(以下、解像度プログレッション)のプログレッシブ順序を、それぞれ模式的に表した図である。横軸はデコンポジションレベル(レベルが高いほど低解像度)であり、縦軸はレイヤ番号である(番号が大きいほど下位レイヤであり、上位レイヤに下位レイヤの符号を付加して復号することによって、より高画質な再生が可能となる)。図中、塗りつぶされた長方形は、各デコンポジションレベル、レイヤにおける符号を表し、その大きさは符号量の割合を模式的に示している。図中の点線の矢印は符号順序を表している。
(A)の破線はレイヤプログレッションにおける復号順序(符号の順序)を表している。最上位のレイヤの全ての解像度の復号を行って次位(下位)のレイヤの復号を行う。ウェーブレット係数レベルでみれば、係数の上位bitから復号を行うことになり、徐々に画質が向上するプログレッシブ復号が可能である。
(B)の破線は解像度プログレッションにおける復号順序(符号の順序)を表している。最も高いデコンポジションレベルの全てのレイヤの復号を行った後に次のデコンポジションレベルの復号を行うことになり、徐々に解像度が向上するプログレッシブ復号が可能である。
なお、図30においてはコンポーネント及びプレシンクトの概念が省略されているので、その理解のために、LRCPプログレッションとRLCPプログレッションにおけるパケットの並び方を模式的に図31と図32に例示する。
さて、近年、スキャナ、プリンタ、コピー等の機能を統合した複写機(マルチファンクションプリンタ;MFP)の普及がめざましい。このようなMFPは、ハードディスク装置(以下HDD)等の大容量の記憶装置を備え、複数部数の原稿を1度だけ読み込み、その画像データをHDD等に記憶(蓄積)しておくことにより、その原稿をページ順に複数部数、出力する”電子ソート”と呼ばれる機能や、用紙のミスフィード(紙づまり)等のエラーにより複数のプリントがエラーした場合でも、原稿の再読み込みをすることなく自動的に再プリントを行うような機能を備えている。また、このようなスタンドアロンで使用される機能のほかに、スキャンした画像データをパソコンに転送したり、E-mailに添付して送信したり、スキャンした画像データをHDD内に一旦蓄積し、それを必要に応じてパソコン等へ転送する、ネットワーク経由の文書配信機能を備えている。
しかし、従来、このようなMFPから文書画像をプログレッシブ符号化してパソコン等へ転送し、パソコン等でプログレッシブ復号を行っても、転送の早期の段階では、文書の全体のレイアウトは把握できるものの、文字が判読不可能であるため文書の内容を把握できないことが多いという問題があった。
このような問題の解決のために、例えば特許文献1に記載されている技術の利用が考えられる。特許文献1に記載の技術は、画像データをその属性に従って区分するレイアウト解析を行い、レイアウト解析により区分された領域の各々をタイルに分割し、分割によって得られたタイルに含まれる画像データの属性をタイルの属性として対応付け、対応付けされたタイルの属性に従ってプログレッシブ順序を切替えて符号化するというものである。より具体的には、文字属性のタイルはSNRプログレッション(レイヤプログレッション)を選択し、文字以外のタイルは解像度プログレッションを選択するものである。
しかし、このようなプログレッシブ順序を切り替える方式には別の問題がある。例えば、文字の含まれているタイルと文字の含まれていないタイルの境界部分でプログレッシブ順序が切り替わるため、それが画像上に違和感となって現れやすい。また、地図やチラシ等でよく見られる絵柄上の文字は”写真”属性と誤判定される場合があるが、その場合には解像度プログレッションとなるため文字判読性が低下するおそれがある。
なお、本発明においては画像種別を判定する領域判定技術が利用される。領域判定に関する公知文献は極めて多いが、その例として特許文献2,3,4を挙げることができる。
特開2003−23544号公報 特開2000−175032号公報 特開2003−101770号公報 特開平11−220622号公報
前記問題点に鑑み、本発明は、符号ストリームのプログレッシブ復号の早い段階で画像内容の把握を可能にするための、新規な画像処理装置及び画像処理方法を提供しようとするものである。
請求項1の発明は、画像の符号化処理を行って、レイヤプログレッションのプログレッシブ符号ストリームを出力する符号化手段と、画像の画像種別を所定のブロック単位で判定する領域判定手段とを有し、前記符号化手段において前記レイヤプログレッションのプログレッシブ符号ストリームを生成するための符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する手段を含むことを特徴とする画像処理装置である。
請求項2の発明は、画像の符号ストリームを記憶する記憶手段と、画像の画像種別を所定のブロック単位で判定する領域判定手段と、前記記憶手段に記憶されている符号ストリームを取り込み、該符号ストリームから、レイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成手段とを有し、前記符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する手段を含むことを特徴とする画像処理装置である。
請求項3の発明は、前記符号ストリーム生成手段に含まれる前記制御する手段が、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の符号量を予め決められた設定符号量に制御することを特徴とする請求項1又は2の発明による画像処理装置である。
請求項4の発明は、前記符号ストリーム生成手段に含まれる前記制御する手段が、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の設定符号量を、前記領域判定手段による判定結果に従って切り替えることを特徴とする請求項3の発明による画像処理装置である。
請求項5の発明は、前記領域判定手段により判定される画像種別に文字、黒文字、色文字及び網点のうちの少なくとも1つが含まれることを特徴とする請求項1,2,3又は4の発明による画像処理装置である。
請求項6の発明は、前記領域判定手段が、画像の符号化処理の過程において生成される画像の周波数変換係数に基づいて画像種別を判定することを特徴とする請求項1又は2の発明による画像処理装置である。
請求項7の発明は、前記領域判定手段が、前記符号ストリーム生成手段に取り込まれた符号ストリームに基づいて画像種別を判定することを特徴とする請求項2の発明による画像処理装置である。
請求項8の発明は、画像の符号化処理を行って、レイヤプログレッションのプログレッシブ符号ストリームを出力する符号化手段と、画像の特徴量を所定のブロック単位で検出する特徴量検出手段と、前記符号化手段において前記レイヤプログレッションのプログレッシブ符号ストリームを生成するための符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出手段により検出された特徴量に従って多段階に制御する手段を含むことを特徴とする画像処理装置である。
請求項9の発明は、画像の符号ストリームを記憶する記憶手段と、画像の特徴量を所定のブロック単位で検出する特徴量検出手段と、前記記憶手段に記憶されている符号ストリームを取り込み、該符号ストリームから、レイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成手段とを有し、前記符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出手段により検出された特徴量に従って多段階に制御する手段を含むことを特徴とする画像処理装置である。
請求項10の発明は、前記符号ストリーム生成手段に含まれる前記制御する手段が、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の符号量を予め決められた設定符号量に制御することを特徴とする請求項8又は9の発明による画像処理装置である。
請求項11の発明は、前記符号ストリーム生成手段に含まれる前記制御する手段が、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の設定符号量を、前記特徴量検出手段により検出された特徴量に従って多段階に切り替えることを特徴とする請求項10の発明による画像処理装置である。
請求項12の発明は、前記特徴量検出手段により検出される画像の特徴量がエッジ量であることを特徴とする請求項8,9,10又は11の発明による画像処理装置である。
請求項13の発明は、前記特徴量検出手段が、画像の符号化処理の過程において生成される画像の周波数変換係数に基づいて特徴量を検出することを特徴とする請求項8又は9の発明による画像処理装置である。
請求項14の発明は、前記特徴量検出手段が、前記符号ストリーム生成手段に取り込まれた符号ストリームに基づいて特徴量を検出することを特徴とする請求項9の発明による画像処理装置である。
請求項15の発明は、画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理装置であって、画像の画像種別を所定のブロック単位で判定する領域判定手段と、受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する手段とを有することを特徴とする画像処理装置である。
請求項16の発明は、画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理装置であって、画像の特徴量を所定のブロック単位で検出する特徴量検出手段と、受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出手段により検出された特徴量に従って多段階に制御する手段とを有することを特徴とする画像処理装置である。
請求項17の発明は、画像の画像種別を所定のブロック単位で判定する領域判定工程と、画像のレイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成工程とを有し、前記符号ストリーム生成工程は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する工程を含むことを特徴とする画像処理方法である。
請求項18の発明は、画像の多値の特徴量を所定のブロック単位で検出する特徴量検出工程と、画像のレイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成工程とを有し、前記符号ストリーム生成工程は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出工程により検出された特徴量に従って多段階に制御する工程を含むことを特徴とする画像処理方法である。
請求項19の発明は、画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理方法であって、画像の画像種別を所定のブロック単位で判定する領域判定工程と、受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定工程による判定結果に従って制御する工程とを有することを特徴とする画像処理方法である。
請求項20の発明は、画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理方法であって、画像の特徴量を所定のブロック単位で検出する特徴量検出工程と、受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出工程により検出された特徴量に従って多段階に制御する工程とを有することを特徴とする画像処理装方法である。
請求項21の発明は、請求項1乃至16のいずれか1項の発明による画像処理装置の各手段としてコンピュータを機能させるプログラムである。
請求項22の発明は、請求項21の発明によるプログラムが記録された、コンピュータが読み取り可能な情報記録媒体である。
請求項1乃至7,17の発明によれば、領域判定結果に従ったレイヤ分割構成の制御により、画像種別に適したレイヤ分割構成を有するプログレッシブ符号ストリームを生成できるため、それを外部装置へ転送してプログレッシブ復号する場合などに、転送もしくは復号の早い段階で画像内容の把握を可能にすることができる。また、プログレッシブ符号ストリームのプログレッシブ順序は領域判定結果によって切り替えられないため、画像種別の異なる領域の境界部に、プログレッシブ順序を切り替える方法に見られるような違和感を生じない。また、請求項2の発明によれば、記憶手段に記憶される符号ストリームのプログレッシブ順序や階層分割構成は任意であり、必ずしもプログレッシブである必要もないため、画像処理装置の内部での利用に適した構成の符号ストリームを記憶手段に記憶しておくことができ、一方、外部装置から要求された場合に、レイヤプログレッションの、画像種別に適したレイヤ分割構成のプログレッシブ符号ストリームを生成することができる。また、請求項3,4の発明によればプログレッシブ符号ストリームのレイヤ単位の符号量を保証でき、このことは低速の転送路を介して外部装置へ転送する場合などに有利である。さらに請求項4の発明によれば、例えば、非文字領域に比べ文字領域におけるレイヤ単位の設定符号量を大きくすることにより、プログレッシブ符号ストリームの転送、復号の早い段階での文字判読性を向上させることができる。また、請求項6,7の発明によれば、符号化処理又は符号ストリーム生成処理のためのハードウェア又はソフトウェアの内部で領域判定処理を完結させることができ、また領域判定処理も比較的簡易な処理とすることができるため、領域判定に関わるハードウェアやソフトウェアの簡略化に一般に有利である、等々の効果を得られる。
請求項8乃至14,18の発明によれば、特徴量に従ったレイヤ分割構成の制御により、画像種別に適したレイヤ分割構成を有するプログレッシブ符号ストリームを生成できるため、それを外部装置へ転送してプログレッシブ復号する場合などに、転送もしくは復号の早い段階で画像内容の把握を可能にすることができる。また、領域判定結果に従ってレイヤ分割構成を制御する構成では、誤判定領域で本来の画像種別とは別の画像種別に対応したレイヤ分割構成とされる結果、復号画像に違和感を生じやすいが、レイヤ分割構成を特徴量に従って段階的に制御することにより、そのような違和感は生じにくくなる。また、プログレッシブ符号ストリームのプログレッシブ順序は特徴量によらず一定であるため、特徴量の異なる領域の境界部に、プログレッシブ順序を切り替える方法に見られるような違和感を生じない。また、請求項9の発明によれば、記憶手段に記憶される符号ストリームのプログレッシブ順序や階層分割構成は任意であり、必ずしもプログレッシブである必要もないため、画像処理装置の内部での利用に適した構成の符号ストリームを記憶手段に記憶しておくことができ、一方、外部装置から要求された場合に、レイヤプログレッションの、画像種別に適したレイヤ分割構成のプログレッシブ符号ストリームを生成することができる。また、請求項10,11の発明によればプログレッシブ符号ストリームのレイヤ単位の符号量を保証でき、このことは低速の転送路を介して外部装置へ転送する場合などに有利である。さらに請求項11の発明によれば、例えば、非文字領域に比べ文字領域におけるレイヤ単位の設定符号量を大きくすることにより、プログレッシブ符号ストリームの転送、復号の早い段階での文字判読性を向上させることができる。また、請求項12の発明では特徴量としてエッジ量を検出するが、エッジ量はエントロピー符号化の符号量との対応や文字らしさとの対応が良好であるため、文字判読性を向上させるようなレイヤ分割構成制御を的確に行うことができる。また、請求項13,14の発明によれば符号化処理又は符号ストリーム生成処理のためのハードウェア又はソフトウェアの内部で特徴量検出処理を完結させることができ、また特徴量検出処理も比較的簡易な処理とすることができるため、特徴量検出に関わるハードウェアやソフトウェアの簡略化に一般に有利である、等々の効果が得られる。
請求項15,19の発明によれば、受信した符号ストリームのプログレッシブ復号のレイヤ分割構成が領域判定結果に従って制御されるため、復号の早い段階で画像内容の把握を可能にすることができる。また、復号のプログレッシブ順序は領域判定結果に応じて切り替えられないため、画像種別の異なる領域の境界部に、プログレッシブ順序を切り替える方法に見られるような違和感を生じない、等々の効果を得られる。
請求項16,20の発明によれば、受信した符号ストリームのプログレッシブ復号のレイヤ分割構成が特徴量に従って段階的に制御されるため、復号の早い段階で画像内容の把握を可能にすることができる。また、領域判定結果に従って階層分割構成を制御する構成では、誤判定領域で本来の画像種別とは異なった画像種別に適したレイヤ分割構成とされる結果、復号画像に違和感を生じやすいが、レイヤ分割構成を特徴量に従って段階的に制御する構成であるため、そのような違和感は生じにくい。また、プログレッシブ順序は特徴量によらず一定であるため、特徴量の異なる領域の境界部に、プログレッシブ順序を切り替える方法に見られるような違和感を生じない、等々の効果を得られる。
また、請求項21,22の発明によれば、コンピュータを利用し請求項1乃至20の発明を容易に実施することができる。
本発明の実施の形態の例として、図1に示すようなサーバ/クライアント環境で用いられる画像処理装置を挙げることができる。
図1において、サーバ1はMFPなどの画像処理装置であり、クライアント3はプログレッシブ復号処理の可能な画像処理装置やパソコンなどである。サーバ1とクライアント3の間の転送路2は、例えばLAN、イントラネット、インターネットなどのネットワークの回線である。サーバ1は、クライアント3からのコマンドを受信し、画像のプログレッシブ符号ストリームを送信する。クライアント3は、プログレッシブ符号ストリームを受信してプログレッシブに復号を行うことにより、モニタ装置4に画像を段階的に画質が向上するように表示する。
請求項1〜14,17,18の発明は、サーバ1として用いられるMFPなどの画像処理装置に関わるものである。また、請求項15,16,19,20の発明は、クライアント3として用いられる画像処理装置に関わるものである。ただし、本発明は、画像のプログレッシブ符号ストリームを生成し、それをプログレッシブ復号する機能を持つスタンドアローンの画像処理装置にも適用し得るものである。
以下、本発明の実施の形態を、いくつかの実施例に関し詳細に説明する。なお、説明の重複を減らすため、説明中で参照される複数の図面において同一部分又は対応部分には同一の参照符号を付し、また、一部の図面を複数の実施例の説明に利用する。また、各実施例における圧縮符号化方式として、先に概要を説明したJPEG2000の基本方式を想定する。
図2は、本実施例に係る画像処理装置のブロック図である。この画像処理装置は、サーバ1として利用し得るMFPであり、原稿を読み取るスキャナ部9、スキャナ部9から入力された画像データに対し公知のγ補正処理や空間フィルタ処理等の画像処理を行うスキャナ画像処理部11、スキャナ9から入力された画像データによって像域分離処理を行う像域分離処理部10、画像データの符号化処理を行って符号ストリームを出力するエンコーダ12、装置全体の動作命令やコントローラユニット内のデータ処理を行うCPU13、画像データや圧縮符号化された符号データを一時的に記憶するワーク領域として使用される揮発性のメモリ14、符号データ等を保存、蓄積するためのハードディスク装置(HDD)15、操作者とのインターフェースである、スタートボタンや動作モード等の設定ボタンなどを有する操作部16、外部転送路2を介してクライアント3等の外部機器とデータを送受信する外部転送路インターフェース(I/F)17、符号データを復号処理して画像データを出力するデコーダ18、画像データに公知の色補正処理、γ変換処理、擬似階調処理等を施すプリンタ画像処理部19、前記構成要素12〜18を接続するバス20、プリンタ画像処理部19より入力される画像データを記録紙等の記録媒体へ出力するプリンタ部21から構成されている。
まず、この画像処理装置における基本的な複写動作について説明する。ユーザにより操作部16上のスタートボタン(図示無し)が押下されると、操作部16よりバス20を介して信号を受信したCPU13は、複写動作に先立ち必要なパラメータの設定等を行った後、所定の複写動作のための制御を行う。
スキャナ部9は、原稿をスキャンして図示しないCCDによって光電変換を行い、デジタル信号であるRed(R),Green(G),Blue(B)のカラー画像データへと変換して出力する。スキャナから出力された画像データに対しスキャナ画像処理部11で公知の画像処理が行われ、また、この画像データに基づいて像域分離処理部10で像域分離処理が行われる。スキャナ画像処理部11における画像処理の内容は、本発明において特に限定されるものではないが、その例をあげれば、CCDから読込まれた反射率属性の信号を、濃度属性に変換するγ変換やlog変換、スキャナ光学系のMTFの劣化補正、モアレ抑制を目的とした空間フィルタ処理、原稿地肌を除去する地肌除去処理、スキャナの色空間を例えばsRGBなどの標準色空間へと変換する色変換処理等が考えられる。なお、このような処理において、像域分離処理部10から出力される分離信号を使用して、文字部と非文字部にて異なる処理を行うように構成してもよい。
像域分離処理部10では、画像を画素単位にて文字と非文字に像域分離を行い、1bitの分離信号を出力する。ここでの像域分離処理には公知の像域分離処理技術を使用すればよく、その処理方法は特に限定されないが、その好適な方法の一例として特許文献2に記載された像域分離方法がある。その概要は次の通りである。
RGB画像データの場合に、Gデータに関し、無地上文字領域の判定と網点上文字領域の判定を行う。無地上文字領域の判定においては、Gデータをエッジ強調フィルタを適用してから2つの閾値を用いて白、黒、その他に3値化し、黒エッジパターン及び白エッジパターンとのマッチングを行い、例えば5×5画素のブロック内に白エッジパターンと一致する画素及び黒エッジパターンと一致する画素がそれぞれ1個以上存在する場合には、そのブロック(又は中心画素)を無地上文字領域と判定する。網点上文字領域の判定においては、Gデータを平滑化フィルタを適用してから別の2つの閾値を用いて白、黒、その他に3値化し、黒エッジパターン及び白エッジパターンとのマッチングを行い、5×5画素のブロック内に白エッジパターンと一致する画素及び黒エッジパターンと一致する画素がそれぞれ1個以上存在する場合には、そのブロック(又は中心画素)を網点上文字領域と判定する。そして、無地上文字領域又は網点上文字領域と判定された画素を最終的に文字領域とし、それ以外の画素を最終的に非文字領域とする。
このような画像データに基づいた像域分離方法は、画素単位の精度の高い像域分離が可能であり、したがって、像域分離結果を利用することによりタイルの領域判定を精度よく行うことができる。なお、後述のようにエンコーダ12において色変換が行われるため、色変換後のY信号を用いて同様の像域分離を行ってもよく、かかる態様も本実施例に包含される。
スキャナ画像処理部11により処理された画像データと、像域分離処理部10より出力される分離信号は、エンコーダ12に入力される。エンコーダ12において、画像データは分離信号に応じて圧縮符号化され、符号ストリームが生成される。エンコーダ12は本発明に直接関連する部分であり、その詳細は後述する。
エンコーダ12からバス20に出力された符号ストリームはメモリ14に一旦記憶され、その後、メモリ14から読み出されてHDD15に保存される。また、HDD15への保存と並行して、符号ストリームはデコーダ18に入力され復号処理が行われる。上記のようなバスの制御は、CPU13によって行われる。
なお、通常、このようにバスに接続されたメモリへのデータの書き込みアクセスは、バスに接続された各処理部がDMA(Direct Memory Accsess)によって数十バイトから数キロバイトの一定量のデータ単位で行われるので、バスの接続部はバッファとDMAコントローラで構成されているのが一般的であるが、説明の簡略化のためDMAコントローラは省略されている。また、メモリからのデータの読み込みも同様にDMAによって行われるので入力バッファメモリが必要となるが、これも省略されている。
また、HDD15への符号データの保存の際にメモリ14への書き込みを介在させているが、その理由は次の通りである。HDDは、ディスクの中心に近い側と遠い側等で読み出し/書き込み速度が変化したり、読み出し/書き込みエラー等を生じる可能性があり、半導体メモリと比較すると同期信号の読み出し/書き込みには向かないデバイスである。そのため、同期信号であるエンコーダ12の出力データを直接書き込まずに、一旦メモリ14に記憶された符号データを非同期に書き込み安定的に使用するためである。読み出し時も同様である。ただし、1ページ単位のマクロ的にみれば、HDDも同期して動作することになる。
なお、HDD15に保存された符号データは、複写時に紙詰まり等が発生した場合のバックアップや、多ページの原稿を多部数、ページ順に出力する電子ソート機能、外部機器へのデータ配信等に利用される。
デコーダ18は、メモリ14から符号ストリームが入力されると、所定の復号処理を行い画像データをプリンタ画像処理部19に出力する。プリンタ画像処理部19での画像処理は、スキャナ画像処理部11と同様、本発明において特に限定されることはないが、例をあげれば、RGB信号をプリンタの色材信号、例えばCyan(C),Magenta(M),Yellow(Y),Black(K)へ変換しカラーマッチングを行う色補正、墨生成、画像データのγ特性をプリンタ21のγ特性に合わせるγ補正、ディザや誤差拡散といったハーフトーンへの変換を行う擬似階調処理等が考えられる。このような画像処理が行われた画像データは、プリンタ21にて記録紙などに印字されて出力され、複写動作が完了する。
複写動作完了後には、HDD15内に複写動作途中の画像データが圧縮符号化された状態で保存されたことになる。このようにHDD15内に画像データを保存しておくことによって、画像データを外部機器へ転送したり、必要になった時に再プリントをすることが可能となる。なお、原稿をHDD15内に電子データとして保存することのみ必要な場合は、デコーダ18以降の処理は行われない。
次に、エンコーダ12について説明する。図3は、本実施例に係るエンコーダ12のブロック図である。このエンコーダ12は、JPEG2000基本方式に準拠した符号化手段であり、入力バッファ30と、符号化処理に直接関わる色変換処理部31、離散ウェーブレット変換(DWT)処理部32、エントロピー符号化部35、ポスト量子化処理部36及び符号ストリーム生成処理部37と、領域判定処理部34とからなる。
スキャナ画像処理部11及び像域分離処理部10より出力されるRGB画像データ及び分離データは入力バッファ30に一旦蓄積され、タイル単位に読み出される。スキャナ9からの出力データはラスタデータの形式であるので、入力バッファ30でラスタ/ブロック変換が行われる。
入力バッファ30より読み出された画像データは、色変換処理部31にて輝度/色差信号(YUV)に変換される。色変換後の信号は、DWT処理部32において各々のコンポーネント毎にDWTが行われる。DWT処理部32から出力されたDWT係数は、エントロピー符号化部35にてエントロピー符号化される。エントロピー符号化された符号データは、ポスト量子化処理部36にて必要に応じて符号の切り捨てによるポスト量子化処理を施される。通常、スキャナにより入力された画像データにはノイズ成分が含まれている場合が多く、画質に影響しない程度にポスト量子化を行うことにより圧縮率を向上させることができる。ただし、可逆の符号を出力する場合は、ポスト量子化は行われない。ポスト量子化処理後の符号データは符号ストリーム生成処理部37へ入力される。なお、ポスト量子化の代わりに、DWT処理部32から出力されたDWT係数に対してスカラー量子化を行うように構成してもよい。
一方、領域判定処理部34では、タイル単位で分離信号(文字の時に”1”となる1bit信号)のORをとることによって、文字タイルであるか非文字タイルであるかの領域判定を行い、その結果を表す領域判定信号を出力する。この領域判定信号は符号ストリーム生成処理部37へ入力される。なお、この領域判定信号をポスト量子化処理部36へ入力して、文字タイルと非文字タイルとでポスト量子化処理の内容を変更させる構成としてもよく、かかる態様も本実施例に含まれる。
符号ストリーム生成処理部37では、ポスト量子化処理後の各タイルの符号データの符号を並べ替えることにより、所定のプログレッシブ順序(本実施例ではレイヤ(LRCP)プログレッション)によるプログレッシブ符号を生成し、当該タイル分のプログレッシブ符号ストリームを構成し、それをヘッダデータを付加してバス20を介しメモリ14へ出力する。この各タイルの符号ストリームの形成の際に、領域判定処理部34からの領域判定信号が文字タイルを示すか非文字タイルを示すかによって、符号ストリームの階層分割構成(ここではレイヤ分割構成、換言すれば符号の優先順位)を変更する。
本実施例においては符号ストリームのプログレッシブ順序としてレイヤ(LRCP)プログレッションを使用する。解像度プログレッションでは、低解像度を復号した後、高解像度の復号というプログレッシブ順序になるので、文字等の高周波成分に高いエネルギーを有する画像では一般にレイヤプログレッションの方が適する。一方、レイヤプログレッションにおいては、上位bitから下位bit側への復号順序を守らなければならないという制約はあるものの、コードブロック単位でレイヤ境界は自由に設定可能であり、階層分割構成の自由度は高くなっている。これがレイヤプログレッションを使用する主たる理由である。
ここまでの説明から明らかなように、符号ストリーム生成処理部37は請求項1の発明における符号ストリーム生成手段に対応し、領域判定処理部34は像域分離処理部10とともに請求項1の発明における領域判定手段を構成するものである。また、タイルが請求項1の発明におけるブロックに相当する。
また、本実施例は請求項17の発明の一実施例でもある。すなわち、符号ストリーム生成処理部37による処理は請求項17の発明における符号ストリーム生成工程に対応し、領域判定処理部34による処理は請求項17の発明における領域判定工程に対応する。
ここで、文字タイル/非文字タイルの別によるレイヤ分割構成(階層分割構成)の制御について説明する。
図4は、レイヤ分割構成を説明するための模式図であり、(A)は文字タイル用のレイヤ分割構成を、(B)は非文字タイル用のレイヤ分割構成を表している。ここでは、説明の簡略化のため、デコンポジションレベル数2のウェーブレット変換としている。また、コンポーネント、プレシンクト、コードブロックの概念は省略されている。
図4において、横軸は各サブバンド名を、縦軸はレイヤ番号を表している。レイヤ数は4としているが、これは例にすぎない。図30の(A)と同様、図中の塗りつぶされた長方形は各サブバンド、各レイヤにおける符号を示し、その大きさは符号量の割合を模式的に表している。
文字タイルと非文字タイルのレイヤ分割構成の違いを説明する。特に、レイヤ0に特徴がある。
文字タイルにおいては、図4(A)に示すように、最上位のレイヤ0から1HL、1LHサブバンドの符号を含ませることによって、高周波成分に高い値を持つ文字画像の再現性を高めている。但し、上位レイヤから符号量が大きくなる(圧縮率が低下する)ことをなるべく避けるため、斜め成分である1HHサブバンドの符号量は0とし、2HHサブバンドの符号量も2HL、2LHサブバンドと比較し小さくしている。
一方、非文字タイルにおいては、図4(B)に示すように、レイヤ0ではデコンポジションレベル1の成分の符号量を全て0として圧縮率の低下を防いでいる。レイヤ1では、高周波成分の上位bitを含ませている。デコンポジションレベルが高い(解像度が低い)成分であっても、下位bitはノイズ成分である可能性が高いので、そのような成分よりも高周波の上位bitを優先させることによって、エッジ等を含む写真の解像度をプログレッシブの早期段階から向上させることを意図したレイヤ分割構成としているわけである。CCD等の光電変換素子を使用して画像を取得する画像入力機器であるスキャナやデジタルカメラでは、画像にノイズ成分を含む場合が多いので、このようなレイヤ分割構成が特に有効である。
このようにレイヤ分割構成が制御されたレイヤプログレッションの符号ストリームは、外部I/F17より外部転送路2を介しクライアント3などの外部機器へ転送しプログレッシブ復号するならば、転送もしくは復号の早い段階で文字の判読が可能になるため画像内容の把握が容易になる。また、画像の写真部等のエッジ部分の再生も早期の段階で高画質に再生可能となる。また、文字タイルと非文字タイルとで符号ストリームのプログレッシブ順序が切り替わることはないため、文字タイルと非文字タイルの境界部にプログレッシブ順序の違いによる違和感が生じることもない。
図5に本実施例に係る符号ストリーム生成処理部37のブロック図を示す。図示のように、本実施例の符号ストリーム生成処理部37は、入力符号バッファ41、符号量カウンタ42、パターンテーブル43、セレクタ44、パケット生成処理部45、タイルヘッダ生成処理部46、及び、出力符号バッファ47から構成されている。なお、入力符号バッファ41と出力符号バッファ47を分割せず、同じメモリを使用するような構成にしてもよい。
符号ストリーム生成処理動作は以下の通りである。ポスト量子化処理部36から出力された符号データは、入力符号バッファ41に、サブバンドのコードブロック単位で記憶される。入力符号バッファ41にはそれが模式的に表されており、CD1〜CD4・・・・はコードブロックと便宜上の番号を示している。なお、説明の簡略化のためにコンポーネントの概念は省略している。各々のコードブロックの符号は、図28に示したようにサブビットプレーン単位に区切られて配置される。
また、符号データは符号量カウンタ42にも入力され、符号量カウンタ42によってコードブロックのサブビットプレーン単位で符号量がカウントされる。この符号量データは、パケット生成処理部45とタイルヘッダ生成部46に入力され、パケットヘッダとタイルヘッダの符号量情報に使用される。
入力符号バッファ41にタイルの全ての符号データが入力されると、まずタイルヘッダ生成処理部46によってタイルヘッダと部分列用のタイルヘッダが生成され、出力符号バッファ47に書き込まれる。次に、パケット生成処理部45は、同一のレイヤ、デコンポジションレベル、コンポーネント、プレシンクトの単位でパケットデータとパケットヘッダを生成する。
パターンテーブル43は、レイヤ分割構成を制御するための情報(以下レイヤパターン)を格納する手段である。パターンテーブル43は、文字タイル用と非文字タイル用の2種類のレイヤパターンを記憶可能な容量を備えており、処理に先立ってCPU13によってバス20を介し2種類のレイヤパターンが設定される。本実施例における各レイヤパターンは、サブバンド単位に、”各レイヤにどのサブビットプレーンまでを含めるか”という情報である。例えば、レイヤ0には、2LLのMSBから上位4bit+5bit目のSignificance propagationパスまで、2HLのMSBから上位3bit(3bitめのClean upパスまで)、というようなサブバンド毎のサブビットプレーン単位に設定されたレイヤ境界情報が格納されている。
セレクタ44は、領域判定処理部34より出力される領域判定データに従って、タイル単位で、文字用レイヤパターン又は非文字用レイヤパターンを選択し、それをパケット生成処理部45へ入力する。パケット生成処理部45は、セレクタ44から入力されるレイヤパターンに従って必要な符号データを入力符号バッファ41より読み込み、レイヤ単位に符号ストリームを形成して出力符号バッファ47へ順次出力する。一つのレイヤの符号ストリームが完成すると、タイルヘッダ生成処理部46で部分列用のタイルヘッダが生成されて出力符号バッファ47に書き込まれ、次のレイヤの符号ストリームの生成処理を開始する。このようにして1つのタイルについて、文字タイル用又は非文字タイル用レイヤパターンに従ったレイヤ分割構成の符号ストリームが完成した時点で、出力符号バッファ47に記憶された符号ストリームはメモリ14へ出力される。同様の処理が全タイルについて繰り返される。
画像データの全タイル分の符号ストリームがメモリ14上に完成すると、CPU13は、メモリ上の符号ストリームにメインヘッダを付加し、メモリ14からHDD15への符号ストリームの転送を開始する。
ここまでの説明から明らかなように、パターンテーブル43と、そのレイヤパターンを領域判定データに従って選択しパケット生成処理部45へ渡すセレクタ44、及びその作用は、請求項1,17の発明における符号ストリームの階層分割構成をブロック毎に領域判定結果に従って制御する手段もしくは工程に対応する。
なお、本実施例においては圧縮符号化方式としてJPEG2000の基本方式が用いられるが、標準圧縮方式に必ずしも準拠しなくともよい。このことは、本実施例のみならず後記各実施例でも同様である。但し、符号ストリームの汎用性の観点からは、標準圧縮方式に準拠した方が一般に有利である。また、ウェーブレット変換以外の周波数変換、例えば離散コサイン変換等を使用する圧縮符号化方式や、周波数変換を行わずに実空間画像データに直接的に圧縮符号化処理を行う圧縮符号化方式を用い得ることも同様である。
<実施例1の変形例>
前記実施例1はレイヤプログレッションの符号ストリームを生成する実施例であったが、パターンテーブル43の内容を変更することにより、同様の装置構成において、文字タイルと非文字タイルの別に応じて階層分割構成を制御した解像度プログレッションの符号ストリームを生成することも可能である。
図6は、解像度プログレッションの符号ストリームの階層分割構成の例を示す、図4と同様の模式図である。図6の(A)は文字タイルの階層分割構成の例を示し、(B)は非文字タイルの階層分割構成の例を示している。
解像度プログレッションの場合、低解像度(高いデコンポジションレベル)の符号よりも先に高解像度(低いデコンポジションレベル)の符号を出力できないので、プログレッシブ順序は、(2LL)→(2HL,2LH,2HH)→(1HL,1LH,1HH)の順となり、各解像度レベルでは上位レイヤの符号から復号されていくことになる。
文字タイルにおいては、図6の(A)に見られるように、上位レイヤの段階で多くの符号を出力するようにする。このような階層分割構成とすることにより、再生に多くの符号を必要とする文字画像の判読性を向上させることができる。一方、非文字タイルにおいては、(B)に見られるように、上位レイヤでは符号量を少なくして、下位レイヤで多くの符号を出力するようにするとよい。このような階層分割構成とすることにより、各解像度レベルでの上位レイヤにおける符号量の増加を抑制することができる。
なお、(A)では符号量が空(から)のレイヤが存在するが、符号構成上は問題はない。但し、プログレッシブに表示を行う時に空レイヤの部分で画像が変化しなくなるため、違和感を生じる可能性があるので、実際的は全てのレイヤに多少の符号を設定する方が好ましい。
ここで、レイヤプログレッションと比較した場合の解像度プログレッションの利点について述べる。クライアント側の装置が例えばモバイル端末などの表示部が非常に小さい機器の場合のように、クライアント側の表示部の解像度(画像サイズ)がサーバ側の画像データの解像度(画像サイズ)と比較して小さいと、レイヤプログレッションで高解像度部のデータを送付しても意味が無くなってしまい、転送に無駄が生じる。このような場合、解像度プログレションの符号ストリームならば、必要な解像度の段階で転送を停止させることによって無駄な転送を防止し、転送路のトラフィックを低減できる利点がある。
したがって、符号ストリームの転送先となるクライアントの表示部の解像度に応じて、サーバ側で符号ストリームのプログレッシブ順序としてレイヤプログレッションと解像度プログレッションの一方を選択できるようにするのが望ましい。例えば、CPU13で、符号ストリーム転送先となるクライアントの表示部の解像度に応じてレイヤプログレッション又は解像度プログレッションを選択し、選択したプログレッション用のレイヤパターンをパターンテーブル43に設定し、また、選択したプログレッションをパケット生成処理部45へ設定するような構成とすることができる。このようなプログレッシブ順序の選択が可能な態様も本発明に包含される。
前記実施例1は、符号化処理の際に、領域判定結果に応じて階層分割構成が制御されたプログレッシブ符号ストリームを生成する構成であったが、本実施例においては、外部装置へ転送する際に、プログレッシブ符号ストリームをHDD15に保存されている符号ストリームから生成する構成である。
図7は、本実施例に係る画像処理装置のブロック図である。この画像処理装置はサーバ1として利用し得るMFPであり、前記実施例1との主たる相違点は、符号ストリーム変更処理部50が追加されていることである。
実施例1においては、エンコーダ12から出力される符号ストリームは、領域判定結果に従って階層分割構成が制御されたレイヤプログレッションの符号ストリームであった。しかし、本実施例では、エンコーダ12によって生成されてHDD15に保存される符号ストリームに対しては、領域判定結果による階層分割構成の制御は行われない(ただし、後述のように領域判定の結果は符号ストリーム内に保持される)。また、エンコーダ12から出力される符号ストリームは、プログレッシブ順序は基本的に任意であり、必ずしもプログレッシブである必要はなく、階層構造も任意であり、例えば1ページ分全体を一様な階層構造としてもよい。これは本実施例の利点である。すなわち、複写動作の際には、プログレッシブ符号ストリームである必要なく、むしろ1ページ全体の画像を一様な階層構造としたほうが、複写動作のためのデコーダ18による伸長処理の負荷が軽減されるからである。また、クライアント3の種類によっては、RPCLプログレッションのような解像度プログレッションの方が都合の良い場合もあるからである。例えば、モバイル端末のようなモニタの表示サイズが小さいクライアントの場合には、必要解像度の符号のみ出力すればよいので、HDD15に保存されている符号ストリームのプログレッシブ順序の種類は、解像度の選択が容易な解像度プログレッションの方がよい場合もある。すなわち、クライアントからプログレッションの種類等の要求をコマンドとして受信し、それに応じて選択したプログレッションの符号ストリームを生成して送信する方が好ましい。本実施例は、このようなクライアントに応じて選択したプログレッションの符号ストリームの生成、送信をすることが可能な構成であり、これも本実施例の利点の一つである。
以下、本実施例について詳細に説明する。本実施例に係るエンコーダ12は、前記実施例1と同様な図3に示したような構成であり、符号化処理を行って符号ストリームを生成する。エンコーダ12内の符号ストリーム生成処理部37は、領域判定処理部34によるタイル単位の領域判定結果に従った階層分割構成の制御は行わないが、領域判定結果を、生成する符号ストリーム内に保持させる。本実施例では、領域判定結果を符号ストリーム内に保持させる方法として、符号ストリームのタイルヘッダのコメント部にフラグとして記録する方法が用いられるが、これのみに限定されるものではない。例えば、電子透かしなどの技術を使用して、領域判定結果を符号ストリーム内に記録することも可能である。領域判定結果のフラグデータを、符号ストリームとは分離してメモリ14またはHDD15に蓄積することも可能である。エンコーダ12から出力された符号ストリームは、メモリ14に一旦蓄積された後、HDD15に保存される。
クライアント3から符号ストリームの送信要求を外部転送路2を介し受信すると、CPU13は、必要なパラメータをセットした後、HDD15から符号ストリームを読み出し、バス20を介してメモリ14へ書き込む。メモリ14に記録された符号ストリームは、タイル単位に読み出されて符号ストリーム変更処理部50に入力される。
図8は、符号ストリーム変更処理部50のブロック図である。符号ストリーム変更処理部50は、前記実施例1に係る符号ストリーム生成処理部37(図5)とよく似た構成であるが、ヘッダ解析処理部51とパケット分解処理部52が追加されている。
まず、CPU13によって、クライアントの要求に応じて選択したプログレッシブ順序(レイヤプログレッション又は解像度プログレッション)のための文字タイル用、非文字タイル用の2種類のレイヤパターンがパターンテーブル43に設定される。また、選択されたプログレッションの種類もパケット生成処理部45に設定される。
次に、バス20を介してメモリ14からタイル単位に符号データが入力されるが、ヘッダ解析処理部51はタイルヘッダを解析し、タイルヘッダに記述されている領域判定結果を読み出して領域判定信号をセレクタ44へ出力する。
次にパケットが入力されると、ヘッダ解析処理部51はパケットヘッダの解析を行い、パケット分解処理部52へ制御信号を出力する。パケット分解処理部52は、この制御信号に応じてパケットの符号部分を、サブビットプレーン毎の符号データに分解して入力符号バッファ41へ記録する。この時に、符号量カウンタ42はコードブロックのサブビットプレーン単位に符号量をカウントする。入力符号バッファ41にタイルの全ての符号データが入力されると、まずタイルヘッダ生成処理部46によってタイルヘッダと部分列用のタイルヘッダが生成され、出力符号バッファ47に書き込まれる。次に、パケット生成処理部45は、ヘッダ解析処理部51からの領域選択信号に従ってセレクタ44により選択されたレイヤパターンに従って、必要な符号データを入力符号バッファ41より読み込み、レイヤ単位に符号ストリームを形成して出力符号バッファ47へ順次出力する。1つのタイルについてレイヤパターンに従った階層分割構成の符号ストリームが完成した時点で、出力符号バッファ47からメモリ14へ符号ストリームが出力される。同様の処理が各タイルについて繰り返される。
このようにして画像データの全タイル分の符号ストリームがメモリ14上に完成すると、CPU13は、その符号ストリームをメインヘッダを付加して外部I/F17より外部転送路2を介してクライアント3へ送信させる。クライアント3では、受信した符号ストリームをプログレッシブに復号しモニタ4上に復号画像をプログレッシブに表示させる。
ここまでの説明から明らかなように、符号ストリーム変更処理部50及びその処理は、請求項2,17の発明における符号ストリーム生成手段もしくは符号ストリーム生成工程に対応する。また、パターンテーブル43と、ヘッダ解析処理部51からの領域判定信号に従ってレイヤパターンを選択しパケット生成処理部45へ渡すセレクタ44及びその作用は、請求項2,17における符号ストリームの階層分割構成をブロック毎に領域判定結果に従って制御する手段もしくは工程に対応する。また、符号ストリーム変更処理部50の観点からは、ヘッダ解析処理部51の領域判定信号を抽出する機能は、請求項2,17における領域判定手段もしくは工程に対応する。ただし、画像処理装置全体の観点からは、像域分離処理部10及びエンコーダ12内の領域判定処理部34が領域判定手段もしくは工程に対応する。
以上説明したように、本実施例によれば、読み取った画像データをMFP内のプリント出力処理に適した構成の符号ストリームとしてHDD15に保存することができる。一方、クライアントから送信要求を受けたときに、クライアントに適したプログレッシブ順序を選択し、保存されている符号ストリームから、領域判定結果に従って階層分割構成を制御したプログレッシブ符号ストリームを生成してクライアントへ送信することができる。また、そのプログレッシブ符号ストリームの生成は、保存されている符号ストリームの符号レベルの操作、つまり符号の並べ替えによって行われ、復号・再符号化の処理を含まないため、復号・再符号化による画像品質の劣化を伴わず、また、処理も短時間で行うことができる。
実施例1,2においては、符号ストリームの生成の際に、サブバンド毎に設定されたサブビットプレーン単位に設定可能なレイヤ境界情報であるレイヤパターンを使用した。このようなレイヤパターンを利用した階層分割構成の制御によれば、レイヤ単位での画質レベルを一定とすることができる。途中のレイヤで復号を停止させたり、予め定められたレイヤまでを送信することにより、画質レベルを容易に制御可能になり、画質を保証するシステムの構築が可能となる。しかし、レイヤ単位(階層単位)での符号量を制御できないため、プログレッシブ転送途中の符号量を保証することはできない。
ここでは、レイヤ単位での符号量を保証する実施例について説明する。
レイヤ単位の符号量を制御する方法としては、次の2通りの方法をとり得る。その一つは、タイルまたは画像全体の符号量から1レイヤあたりの符号量(設定符号量)を算出し各レイヤの符号量をその設定符号量とするように制御する方法である。すなわち、レイヤ単位の設定符号量を画像に応じて適応的に制御する方法である(以下、A方法)。
もう一つは、レイヤ単位の設定符号量を予め決定し、各レイヤの符号量を設定符号量とするように制御し、最終レイヤの時点で符号に残りがあれば、残りの全ての符号で最終レイヤを構成する方法である。すなわち、レイヤ単位の設定符号量を非適応的に制御する方法である(以下、B方法)。
A方法,B方法には一長一短があり、一概にどちらの方法が良いとはいえない。例えば、方法Aでは、レイヤ単位の符号量をほぼ均等にすることが可能となり、また、レイヤ数も保証可能となる。その反面、画像によってレイヤ単位の符号量が変化するので、サーバからクライアントへの符号データのレイヤ単位の転送時間を保証できない。
一方、方法Bでは、最終レイヤ以外のレイヤの符号量を既知の値とすることが可能となるので、レイヤ単位の転送時間の保証が可能となる。その反面、最終レイヤのみ符号量が極端に多くなったり、設定した最終レイヤの前に全ての符号データが出力済みとなってレイヤ数が変化する可能性がある。
したがって、A方法、B方法のいずれを選ぶかは、システム条件に応じて決めるべきであろうが、ここではB方法を利用する実施例について説明する。そのための装置構成は、前記実施例1と同様でもよいし、前記実施例2と同様でもよい。つまり、レイヤ単位の符号量制御を、前記実施例1に係る図5に示す符号ストリーム生成処理部37において実施することも、前記実施例2に係る図8に示す符号ストリーム変更処理部50において実施することも可能であるが、ここでは便宜、図5の符号ストリーム生成処理部37において符号量制御を行う場合について説明する。
ここで述べる実施例では、図5に示す符号ストリーム生成処理部37において、パターンテーブル43に、文字タイル用と非文字タイル用の、サブバンドによらない符号の優先順位を示す情報が格納される。この情報とは、優先順位の高い順に、2LL(MSBから上位3bit+4bit目のMagnitude refinementパスまで)→2HL(MSBから上位3bit)→....というような情報である。この優先順位にレイヤ(階層)の区別はなく、単純にサブバンド単位での画質への寄与度の高い順である。
一つの実施例では、パケット生成処理部45は、セレクタ44により選択されたパターンテーブル43の符号順序情報に従ってパケット単位に符号ストリームを順次生成し、予め設定されたレイヤ単位の設定符号量に達した時点で、当該レイヤの符号ストリームを完成させる。ただし、最終(最下位)レイヤについては、残りの符号を全て使用して符号ストリームを生成する。すなわち、文字タイルでも非文字タイルでもタイル(階層)単位の設定符号量は同一である。ただし、各タイルにどのような符号を含めるか(階層分割構成)は文字タイルと非文字タイルとで異なる。
もう一つの一実施例では、領域判定データがパケット生成処理部45へも入力される。そして、パケット生成処理部45は、文字タイルでは文字タイル用に設定されたレイヤ単位の設定符号量となるようにレイヤの符号ストリームを生成し、非文字タイルでは非文字タイル用に設定されたレイヤ単位の設定符号量となるようにレイヤの符号ストリームを生成する。すなわち、文字タイルであるか非文字タイルであるかにより、レイヤ単位の設定符号量が切り替えられる。文字タイル用のレイヤ単位の設定符号量は、非文字タイル用のレイヤ単位の設定符号量より大きな値に設定するのが一般に好適である。これは、一般的に文字領域の方が非文字領域よりも情報量が大きいため、同程度の画質を再現するためには、文字領域の方が多くの符号量を必要とするためである。
ここまでの説明から明らかなように、本実施例は請求項3,4の発明の実施例である。
以上説明したように、本実施例はレイヤ単位の符号量を保証することができるため、転送路における転送速度が遅いシステム等に特に好適である。また、領域判定結果によってレイヤ単位の設定符号量を切り替え、非文字タイルに比べ文字タイルのレイヤ単位の符号量を多くすることによって、プログレッシブ転送時の初期段階での文字の判読性を向上させることができる。
なお、先に述べたように、前記実施例2に係る図8の符号ストリーム変更処理部50においても同様の符号量制御を実施できることは、以上の説明から明らかであろう。かかる態様も本発明に包含される。
また、このようなプログレッシブ転送の途中段階(階層)での符号量制御は、解像度プログレッションなどでも同様に実施できることは明らかであろう。
前記実施例1,2,3においては、領域判定で判定される画像種別は文字と非文字の2種類であったが、より多くの画像種別で領域判定を行い、領域判定結果に応じた階層分割構成の制御を行うこともできる。そのような実施例について次に説明する。
なお、装置構成は前記実施例1,2と同様でよいが、ここでは便宜、前記実施例1と同様な装置構成であるとし、前記実施例1に係る図2、図3及び図5を援用して説明する。
ここに述べる実施例では、像域分離処理部10(図2)は、図9のようにエッジ判定処理部61、網点判定処理部62、色判定処理部63及び総合判定処理部64からなる構成とされる。この像域分離処理部10は、スキャナ部9(図2)から出力されたRGBの画像信号に基づいて黒文字、色文字、網点、それ以外の領域分離処理を行う。
すなわち、G信号に基づいてエッジ判定処理部61によってエッジか否かの判定が、G信号に基づいて網点判定処理部62により網点領域か否かの判定が、RGB信号に基づいて色判定処理部63により有彩色か無彩色かの判定が、それぞれ行われてEdge,AMI,IRO信号(それぞれ1bitの信号)が出力され、これが総合判定部64に入力される。
このようなエッジ判定、網点判定、色判定に関しては公知の技術を使用すればよく、その方法は問わないが、エッジ判定と色判定には例えば特許文献3に記載の方法を用いることができる。また、網点判定には例えば特許文献2に記載の方法を用いることができる。これら判定方法の詳細は特許文献2,3に譲るが、その概略について次に説明する。
まず、エッジ判定であるが、G信号を2つの閾値を用いて白、黒、その他に3値化し、黒エッジパターン及び白エッジパターンとのマッチングを行い、例えば5×5画素のブロック内に白エッジパターンと一致する画素及び黒エッジパターンと一致する画素がそれぞれ1個以上存在する場合には、そのブロックをエッジと判定する。
網点判定であるが、例えば3×3画素のブロックにおいて中心画素の値が周囲画素より一定レベル以上か判定することによりピーク画素を検出する。次いで、例えば4×4画素のブロックにおいて、ピーク画素を含むブロックが2ブロック以上存在する場合に注目ブロックを網点領域候補とする。最後に、4×4画素を1ブロックとして、注目ブロックを中心ブロックとする3×3ブロックにおいて、4ブロック以上が網点領域候補の場合に注目ブロックを網点領域とする。
色判定であるが、画素毎にR,G,B信号の差分値の最大値max(|R−G|,|G−B|,|B−R|)を算出する。この値を所定の閾値と比較し、閾値以上の画素を有彩色、閾値未満の画素を無彩色と判定する。次に、注目画素を中心とした5×5画素のブロック内の有彩色と判定された画素数を計数し、その計数値が所定の閾値以上ならば注目画素を最終的に有彩色と判定し、閾値未満ならば注目画素を最終的に無彩色と判定する。
図9を再び参照する。総合判定部64では、Edge,AMI,IROの各信号から、例えば次に示す第1表に示すルールに従って、黒文字、色文字、網点領域の判定を行う。
Figure 0004086192
第1表は、Edge、IRO、AMI各信号の状態と総合判定の結果を対応させたものである。総合判定の結果は、黒文字、色文字、網点、その他の4種類である。各信号の状態は、1がオン(例えば、Edge信号がオンの場合その画素はエッジであることを表す。同様にIRO信号がオンの場合は有彩色、AMI信号がオンの場合は網点となる。)、0がオフ、*はその信号の状態によらずに総合判定が行われることをそれぞれ示す。
同表から分かるように、Edge信号を最優先としており、Edge信号がオンの場合、AMI信号によらずに文字画素とし、IRO信号によって黒文字と色文字を判定する。Edge信号がオフでかつAMI信号がオンの場合は網点と判定し、Edge信号とAMI信号がともオフの場合にその他に判定する。
なお、この総合判定方法はこれに限らない。例えば、次に示す第2表のように、AMI信号を最優先し、AMI信号がオンの場合にはEdge信号の状態に拘わらず網点領域と判定する方法としてもよい。
Figure 0004086192
第1表と第2表の違いは、網点地の上の文字を文字として判定するか網点として判定するかである。本実施例の場合は、文字の判読性向上を優先すため、網点地の上の文字を文字として判定することとしている。
次に、本実施例におけるエンコーダ12(図3)の動作を説明する。基本的なエンコード処理の流れは前記実施例1の場合と同様であるので、相違点のみ説明する。
まず、領域判定部34の動作を説明する。領域判定部34では、像域分離処理部10からの画素単位の黒文字、色文字、網点の分離信号に基づいて、タイル単位に領域を判定する。この判定方法は、タイル全体で画素単位の各分離信号のORをとり、タイル内に黒文字、色文字、網点のそれぞれの画素が存在するかどうか判定する。タイル内にいずれの画素も存在しない場合には、その他の領域と判定する。また、黒文字のみが存在するタイルは黒文字領域、色文字のみが存在するタイルを色文字領域、網点のみが存在するタイルを網点領域と判定する。
タイル内に複数の像域が存在している場合は、領域判定に関する各領域の優先順位に従って一つの領域に判定する。その優先順位は、システム環境に応じて適宜設定すればよいが、1つの好適な例としては、レイヤの初期段階にて優先的に符号を割り当てるべき画像種別、言い換えれば、画像をプログレッシブ転送する場合の初期段階に他の画像種別と比較して多くの符号を送信して細部の再現性を高めるべき画像種別の領域の優先順位を高く設定する。
ここでは、色文字、黒文字、網点、その他の順に優先順位を設定するものとする。つまり、タイル内に1つでも色文字画素が存在すれば、他の分離結果の存在にかかわらず色文字領域とし、色文字画素が存在しない場合に黒文字画素が存在すれば黒文字領域、色文字画素も黒文字画素も存在せずに網点画素が存在すれば網点領域とする。
この4種類の領域に関する領域判定データは符号ストリーム生成処理部37(図5)に入力し、符号ストリーム生成処理部37において、領域判定データに対応した符号ストリームのレイヤ分割構成(階層分割構成)の制御が行われる。この制御のため、パターンテーブル43には各画像種別に対応した4種類のレイヤパターンが設定され、そのいずれかのレイヤパターンがセレクタ44により領域判定データに従って選択されることになる。
ここで各画像種別の領域の特徴を簡単に述べると、色文字領域では自然画像に比べて輝度と色差のあらゆるサブバンドに高いDWT係数値が現れる。黒文字領域では輝度のあらゆるサブバンドに高いDWT係数値が現れ、網点領域では特定のサブバンドに高いDWT係数値が現れるという特徴を有している。これらを考慮して、各領域におけるレイヤ分割構成が決定され、それに対応したレイヤパターンがパターンテーブル43に設定される。
各領域の階層分割構成は概ね次のような考え方で決定し得る。まず、黒文字領域では、U,Vコンポーネントの優先順位及び符号量を低くする。色文字領域では、Y,U,V全コンポーネントを同様に扱う(高域成分まで必要であるから)。網点領域では、特定の高周波成分より高域の成分は送らないか優先順位を下げる。その他領域では、高域成分を含めなくても構わない。
なお、網点の特定サブバンドの成分は、網点の線数成分であるので自然画像を認識する上では特に必要な成分ではない。そのため、網点領域においては、上位レイヤ(転送の初期の段階)には網点線数成分を含ませないレイヤ分割構成とし、符号量を少なくすることができる。
以上説明したように、本実施例においては、タイル単位に画像の領域を黒文字、色文字、網点、その他の領域に判定し、判定結果に応じて符号ストリームの階層分割構成を制御するため、前記実施例1,2に比べ、より詳細に画像種別に適応したプログレッシブ符号ストリームの生成が可能となる。
なお、前記実施例2においても、同様の領域判定と、その判定結果に従った符号ストリームの階層分割構成の制御を行うことができることは以上の説明から明らかであり、かかる態様も本発明に包含される。
なお、領域判定の画像種をさらに増やし、より高精細な画像種別に応じた階層分割構成の制御を行うこともできる。例えば、銀塩写真や白地の判定などを行うようにしてもよい。また、同一の画像種別でも、そのサイズや色等の特徴を判定して階層分割構成(再生の優先度)を変更してもよい。例えば、表題のようなサイズの大きな文字の再現を優先させたり、文字色によって優先度を変更させたり、網点の線数の違いにより優先度を変えるなどしてもよい。また、自然画で構成されている画像で、人物の顔や花などの彩度の高い色の領域の再生を優先させるような制御も可能である。
前記実施例1〜4では、実空間の画像データの像域分離信号によって領域判定を行った。すなわち、実空間の画像データに基づいて領域判定を行っていた。
ここでは、画像データの符号化処理の過程で生成されるDWT係数(より広義にには周波数変換係数)に基づいて領域判定を行う実施例について説明する。
図10は、本実施例に係る画像処理装置のエンコーダ12のブロック図である。なお、装置全体の構成は前記実施例1と同様でよいが、像域分離処理部10は不要である。
図10に示すエンコーダ12において、領域判定処理部34はDWT処理部32より出力されるDWT係数に基づいてタイル単位で文字/非文字の領域判定を行うもので、像域分離信号は入力しない。この領域判定部34以外のエンコーダ12の構成は前記各実施例と同様である。
図11は、3デコンポジションレベルのDWT係数を表したものである。図中、太い実線はサブバンド境界を表し、細線は係数の境界を表している。つまり、細線で囲まれた格子が1つの係数である。DWT係数は、DWT処理部32に入力される画像と対応した位置に配置されている。言い換えれば、DWT処理は入力画像の位置情報を保存しているといえる。図11のように、各々のサブバンドに特定位置の入力画像に対応する係数が存在することになる。図中の網掛けされた係数が上記の対応関係にある係数を表している。
また、DWT係数においては、LLサブバンド以外の高周波成分の絶対値は、同一方向のサブバンド間で相関を持つことが知られている。同一方向のサブバンド間とは、例えば、3HL、2HL、1HLのように同一方向成分の、異なった解像度のサブバンド間のことである。
例えば、デコンポジションレベルの高い(解像度の低い)サブバンドの係数の絶対値が0であれば、同一方向成分の解像度の高いサブバンドの係数の絶対値も0の場合が多い。これと逆に、デコンポジションレベルの高い(解像度の低い)サブバンドの係数の絶対値が大きな値であれば、同一方向成分の解像度の高いサブバンドの係数も大きな値である場合が多い。また、入力画像がエッジ部であればDWT係数の絶対値は大きくなり、平坦部であれば小さくなる。本実施例では、このようなDWT係数の性質を利用して領域判定処理を行う。
図12は本実施例に係る領域判定処理部34のブロック図である。この領域判定部34には、絶対値化された(YUV信号のうちの)Y信号のDWT係数が入力される。なお、JPEG2000におけるDWT係数の符号化は、プラス、マイナスのサインビットと絶対値化されたDWT係数のビットプレーンに対して算術符号化が行われる。そのため、DWT処理部32から出力される時点で、DWT係数は絶対値化されている方が都合が良く、本実施例においても、そのような構成をとるものとして扱う。
領域判定処理部34は、HLサブバンド用のサブバンド判定処理部71及び成分判定処理部72と、LHサブバンド用のサブバンド判定処理部73及び成分判定処理部74と、HHサブバンド用のサブバンド判定処理部75及び成分判定処理部76と、総合判定処理部77と、ラッチ78とから構成される。
HLサブバンド用のサブバンド判定処理部71は、図示のように、1HLサブバンド係数に対応した16個の2値化手段と、その2値化結果のORをとる手段と、2HLサブバンド係数に対応した4個の2値化手段と、その2値化結果のORをとる手段と、3HLサブバンド係数に対応した1個の2値化手段から構成される。図12では簡略化されているが、他のサブバンド判定処理部73,75も同様の構成である。
次に、サブバンド判定処理部71と成分判定処理部72について処理を説明するが、他のサブバンドに関しても同様の処理が行われる。
領域判定処理部34に入力された1HL,2HL,3HLサブバンド係数の絶対値は、サブバンド判定処理部71において、2値化手段によりサブバンド毎に予め定められた所定のしきい値(TL)と比較され、しきい値以上である場合には1(オン)、しきい値未満である場合には0(オフ)に2値化される。ここで、1回の判定に使用される各々の係数の数は、図11の網掛けされた係数の数となる。つまり、1HLは16個、2HLは4個、3HLは1個の係数が一度に2値化され、1HL,2HLに関しては、2値化後にOR処理がなされ2値の信号として出力される。つまり、1HLと2HLに関しては入力された係数の最大値を2値化したことと等価となる。こうして3つの2値化された信号が、成分判定部72へ入力される。成分判定部72では、3つの2値化信号のうち、2つ以上が1(オン)であれば1(オン)の信号を、そうでなければ0(オフ)の信号を判定結果として出力する。なお、この判定結果信号がオンの場合は、画像が文字であることを示している。これは、文字のような強いエッジを有する画像では、DWT係数に大きな値が出ることと、前述した”同一方向のサブバンド間で相関を持つ”という特性を利用したものである。また、1つの係数のみオンの場合を文字と判定しない理由は、ノイズの影響を排除するためである。成分判定処理部74,76からも同様の判定結果信号が出力される。
総合判定処理部77では、成分判定処理部72,74,76の判定結果信号と、同一タイル内での直前に処理した係数組による総合判定結果(総合判定処理部77の出力)とのORをとり、それがオンであれば文字と判定する。この処理を、タイル内の全ての係数に対して行い、タイル内の全ての領域判定が終了した時点の総合判定結果がラッチ78にラッチされ、当該タイルの領域判定データとなる。つまり、タイル内にオンが一つでもあれば当該タイルを文字と判定し、一つもなければ非文字領域と判定する。次のタイルの判定開始時に、総合判定処理部77の出力は0クリアされる。
なお、図12の回路を並列に複数備え、タイル内の全ての係数組についての総合判定処理部77の出力信号のORをとるように構成することもできる。このような構成は、ハード量が増えるが、1タイル当たりの判定処理を極めて短時間で行うことができる。
ここまでの説明から明らかなように、本実施例の領域判定処理部34は、請求項6の発明における領域判定手段に対応する。
以上説明したように、本実施例においては、符号化処理の過程で生成される離散ウェーブレット変換係数に基づいて領域判定を行うため、エンコーダ34の内部のみで領域判定処理が完結する。また、領域判定処理も比較的簡易である。このことは、領域判定に関わるハードウェアの単純化、ハード量の削減、もしくは領域判定に関わるソフトウェアの単純化や高速化に有利である。
なお、ここでは、3デコンポジションレベルのDWT係数を使用する例を示したが、より多くの、または、より少ないデコンポジションレベルを使用して同様の領域判定を行うこともできる。また、符号化処理で生成される全てのデコンポジションレベルのDWT係数を使用する必要はなく、必要な解像度の係数を選択的に使用して領域判定を行ってよい。なお、一般にDWTではオクターブ分割を伴いながらデコンポジションレベルを上げていくので、デコンポジションレベルが高くなるほど、解像度は1/2づつ低くなる。したがって、文字等のエッジを判定する場合、あまりに低い解像度では文字密集部等でエッジの判定が不正確になるので、これを考慮して必要な解像度のDWT係数を領域判定に使用するのがよい。
なお、前記実施例2において、エンコーダで符号化処理の際にDWTを利用した同様の領域判定を行ってもよい。その結果を符号ストリームのヘッダに記述するなどの方法によって符号ストリーム内に保存させるならば、符号ストリーム変更処理部50において、ヘッダ解析により領域判定の結果を認識することができる。かかる態様も本発明に包含される。
<変形例>
ここで、本実施例の変形例として、DWT係数より黒文字、色文字、網点、その他の領域を判定する方法を簡単に説明する。文字領域/非文字領域のみの判定の場合は、Y成分のみのDWT係数を使用したが、この変形例の場合はY,U,Vの全成分が領域判定に用いられる。
すなわち、Y,U,Vの各成分について、図12に示したような構成の領域判定処理手段により文字/非文字の領域判定を行う。そして、U成分及び/又はV成分の判定結果が文字領域である場合には、色文字領域と判定する。U,V成分の両方の判定結果が非文字領域であり、かつ、Y成分の判定結果が文字領域である場合には、黒文字領域と判定する。
前述のように、網点領域では特定のサブバンドに高いDWT係数が出現する。この性質に基づき、例えば成分判定処理部72において、2つ以上の係数がしきい値以上の場合は文字領域、1つであれば網点領域、というような判定を行うことが可能である。但し、このような網点領域の判定方法は誤判定が生じやすいので、より好適な方法としては、総合判定処理部77にて、網点と判定された数を計数するカウンタを備え、タイル内にて網点と判定された数が所定数を超えた場合にのみ網点領域と判定する方法をとると、網点領域の判定精度が向上する。
なお、本出願人の特許出願に係る特許文献4に記載されている網点判定手法を利用してもよい。この特許文献4には、DWT係数を利用した網点領域の判定手法がいくつか記載されているが、その一つの手法の概要を次に説明する。使用されるDWT係数はYコンポーネントのものである。
所定のブロック単位で、最も高い周波数成分である1HL,1LH,1HHサブバンド係数の絶対値を、各サブバンド対応の閾値とそれぞれ比較する。どのサブバンド係数の絶対値も閾値より大きくないならば、そのブロックを非網点領域とする。いずれかのサブバンドが閾値より大きいときには、中程度の周波数成分であるサブバンド係数、例えば4デコンポジションレベルの場合の3HL,3LH,3HHサブバンド係数を選び、その絶対値をサブバンド対応の閾値とそれぞれ比較する。そして、それら全てのサブバンド係数の絶対値が閾値より小さいときに、そのブロックを網点領域と判定する。
前記実施例1〜5では、領域判定と階層分割構成制御の単位であるブロックとしてタイルを用いたが、JPEG2000におけるタイリングはオプションであり必ずしもタイリングが行われるわけではない。タイリングが行われない場合には、ブロックとしてタイルを用いることは適切でない。タイリングの有無に関係なく適用できるブロックとして、JPEG2000のコードブロックやプレシンクトを用いることができる。
ここでは、コードブロック単位にレイヤ分割構成を制御する実施例について説明する。本実施例に係る画像処理装置の基本的な構成は前記実施例5の場合と同様とし、相違点のみ説明することとする。本実施例に係る画像処理装置のエンコーダ12は、前記実施例5と同様な図10に示す構成であるが、その領域判定処理部34は図13に示すような構成とされる。
まず、図11を使用して、サブバンドとコードブロックの関係を説明する。前記実施例5の説明の際には、図11の細線で区切られた格子を1つのウェーブレット係数として扱ったが、ここでは、各格子を1つのコードブロックとして扱い説明する。
JPEG2000においては、コードブロックのサイズは各サブバンドで等しくなければならない。これは、デコンポジションレベルが異なれば、1つのコードブロックにより再現される実画像の面積(影響範囲)が異なることを意味している。したがって、デコンポジションレベル3で文字領域と判定されても、デコンポジションレベル2又は1では非文字領域と判定される場合があり得る。例えば、図11中の網掛けされた3HLのコードブロックが文字領域と判定されても、それに対応する1HLの16個のコードブロックには文字領域と写真領域が混在するということもあり得る。但し、このような場合であっても、本実施例の領域判定方法によれば、適切なレイヤ分割と画像のプログレッシブ再現を支障なく実現できる。
図13を参照し、本実施例に係るエンコーダ12の領域判定処理部34について説明する。図示のように、HLサブバンド用のサブバンド判定処理部71及び成分判定処理部72と、LHサブバンド用のサブバンド判定処理部73及び成分判定処理部74と、HHサブバンド用のサブバンド判定処理部75及び成分判定処理部76と、総合判定処理部77とから構成される。HLサブバンド用のサブバンド判定処理部71は、図示のように、デコンポジションレベル対応の3組の2値化手段とバッファから構成される。図13では簡略化されているが、他のサブバンド判定処理部73,75も同様の構成である。
次に、サブバンド判定処理部71と成分判定処理部72について処理を説明するが、他のサブバンドに関しても同様の処理が行われる。
領域判定処理部34には、各サブバンドの各コードブロックのDWT係数の絶対値が順次入力される。サブバンド判定処理部71においては、デコンポジションレベル対応の2値化手段により1係数ずつ順次、サブバンド毎に予め定められた所定のしきい値(TL)と比較され、しきい値以上でれば1(オン)、しきい値未満であれば0(オフ)に2値化される。2値化結果はサブバンド判定処理部71内のバッファに格納される。
このような構成をとる理由を以下に示す。JPEG2000におけるコードブロックサイズは、主、副走査とも2のべき乗の、4096以下の自由な値をとることができる。しかし、通常、符号化効率と利便性を考え、32×32または64×64のサイズが使用されることが多く、コードブロック内のDWT係数全てを同時に2値化しようとすると2値化手段のハード量が増大するため、2値化手段はデコンポジションレベル対応に1個ずつ用意し、逐次に2値化処理を行って、その結果をバッファに格納するようにしている。もちろん、ハード量の増大をいとわないならば、全係数を並列に2値化するような構成とすることもできる。
他のサブバンド判定処理部73,75のおいても同様の処理が行われる。
成分判定処理部72は、図14に示すように、デコンポジションレベル対応の3組のOR処理部81及びバッファ82と、判定処理部83とからなる構成である。他の成分判定処理部74,76も同様の構成である。
図14を参照し、成分判定処理部72の処理を説明する。サブバンド判定処理部71内のバッファから読み出された2値化されたサブバンド毎のHLb信号は、コードブロック単位にOR処理部81にてOR処理され、2値信号(1HLcb,2HLcb,3HLcb)が得られる。このOR処理後の2値化信号は、コードブロック内に1つでも2値化結果が1(オン)の係数があれ1(オン)になる(そのコードブロックを文字候補とすることを意味する)。OR処理部81から出力されるコードブロック単位の2値化信号はバッファ82に一旦記憶される。
判定処理部83は、バッファ82よりコードブロック単位の2値化信号を読み込み、各々のサブバンド毎の判定結果(J_1HL,J_2HL,J_3HL)を出力する。この判定結果はサブバンド毎のコードブロック単位に出力されるので、1個のJ_3HLに対して、4個のJ_2HLと、16個のJ_1HLが出力される。判定処理部83における判定は次のように行われる。J_3HLの判定では、3HLcb信号と、対応する4個の2HLcb信号のOR信号と、対応する16個の3HLcb信号のOR信号のうちの2つ以上が1(オン)ならば1(文字)を出力し、そうでなければ0(非文字)を出力する。J_2HLの判定では、2HLcb信号と、対応する3HLcbと、対応する4個の1HLcb信号のOR信号のうちの2つ以上が1ならば1(文字)を出力し、そうでなければ0(非文字)を出力する。J_1HLの判定では、1HLcb信号と、対応する2HLcb信号と、対応する3HLcb信号のうちの2つ以上が1ならば1(文字)を出力し、そうでなければ0(非文字)を出力する。
他の成分判定処理部74,76の処理も同様である。
総合判定処理部77は、成分判定処理部72,74,76より出力されるLH,HL,HH成分の判定出力信号を、デコンポジションレベル別に、対応コードブロック毎にOR処理することにより、デコンポジションレベル別のコードブロック単位の領域判定データJ1,J2,J3出力する。ここまでの説明から明らかなように、1個のJ3に対し、4個のJ2、16個のJ1が出力されることになる。
なお、タイリングを行う場合には、高いデコンポジションレベルのコードブロックのサイズが、サブバンドに含まれるDWT係数の数の関係から、デコンポジションレベル1のコードブロックよりも小さくなることがある(コードブロックサイズは、デフォルト値とサブバンド内の係数の数との小さい方の値をとるため)。この場合には、出力される領域判定データやOR処理に入力される2値データの数は上記の個数とは変化するが、特に問題とはならない。
本実施例における符号ストリーム生成処理部37の構成は、前記実施例1と基本的に同様であるので図5を援用して説明する。本実施例に係る符号ストリーム生成処理部37の場合、パターンテーブル43とセレクタ44が各デコンポジションレベル毎に備えられ、各セレクタ44に、対応したデコンポジションレベルの領域判定データが入力される。各セレクタ44により選択された各デコンポジションレベル用のパターンテーブル43の情報がパケット生成処理部45に入力され、コードブロック単位にレイヤ分割構成が制御された符号ストリームが生成される。
なお、各デコンポジションレベルの領域判定データがパケット生成処理部45にも入力することにより、前記実施例5に述べたようなレイヤ単位の符号量を文字ブロックと非文字ブロックとで切り替えることができることは明らかである。
本実施例は、タイリングの有無に拘わらず適用可能である。また、本実施例によれば、タイルサイズよりも小さなブロック単位で、領域判定をより高精度に行って符号ストリームの階層分割構成の制御、さらには階層単位の符号量制御を行うことができる。
なお、本実施例はDWT係数に基づいて領域判定を行う例であるが、前記実施例1〜4のように画像データの像域分離信号を基に領域判定を行う場合においても、同様のコードブロック単位の領域判定を行うことも可能である。この場合には、各デコンポジションレベルに対応した画素(面積)の像域分離信号のOR処理を行って、各々のデコンポジションレベルにおける領域判定データを生成させればよい。そして、その領域判定データに従って、前記実施例と同様の符号ストリームの階層分割制御、さらには階層単位の符号量制御を行うことができる。
また、本実施例に示した方法と同様の方法によってプレシンクト単位に領域判定を行うことも可能である。JPEG2000におけるプレシンクトは、デコンポジションレベル毎にある程度自由なサイズを選択可能なので、判定領域を柔軟に選択可能となる。
ここでは、符号ストリームに基づいて領域判定を行う実施例について説明する。
JPEG2000の場合、符号データに基づいて領域判定を行う方法としては、パケットヘッダに記録されている情報を用いるのが、簡易で高速な方法である。パケットヘッダには、そのパケットに含まれるコードブロックに関する以下の情報が含まれている。
・零長パケット:パケット長が0であるか(空のパケットであるか)か否か。
・コードブロックの包含:現コードブロックがそれ以前のレイヤのパケットに包含されていたか否か。
・ゼロビットプレーン情報:コードブロック単位の(情報の無い)ビットプレーンの数(MSBから符号が現れるまでの数)。
・符号化パス数:コードブロック単位の現パケットに含まれる符号化パスの数
・コードブロックの符号長(符号量):現コードブロックに包含される符号量。
つまり、パケットヘッダのみから、これらの情報を取得可能である。基本的に可変長符号においては、符号量が多い(符号が長い)場合は多くの値が存在する。また、JPEG2000の場合、ビットプレーン符号化であるため、上位のビットプレーンの符号量が特定の値よりも大きい(0よりも大きい)場合は、該当するDWT係数はそのビットプレーンにて表される数値以上の値を持つことは明らかである。
このような性質を使用することによって、各サブバンド内の全てのコードブロックに値の大きな(文字候補)の係数が存在するかどうかスキャンし、前記実施例5に関連して説明した方法と同様の方法(2つ以上のサブバンドに大きなDWT係数値(文字候補)が存在する場合に文字領域とする方法)などによりタイルの領域判定を行うことが可能である。
最も簡単な方法は、上記の0ビットプレーン情報を使用して、0でないサブビットプレーンのDWT係数におけるビット位置の情報から判定することである。例えば、あるコードブロック内に含まれるDWT係数のダイナミックレンジが10ビットであり、例えば0ビットプレーン数が3の場合、そのコードブロックに含まれるDWT係数の絶対値の最大値は、64〜127の範囲である。なお、上記のDWT係数の値は、量子化およびポスト量子化が行われていないDWT処理直後のDWT係数の値を表している。この方法により領域判定を行う実施例について説明する。
本実施例に係る画像処理装置の全体構成は、前記実施例2と同様な図7に示すような構成であるとして説明する。本実施例において、領域判定処理は、図7の符号ストリーム変更処理部50の内部で行われる。
本実施例に係る符号ストリーム変更処理部50の構成を図15に示す。本実施例と前記実施例2との相違点は、ヘッダ解析処理部51から出力されるヘッダ解析情報を基にタイル単位の領域判定行う領域判定処理部53が追加されたことである。なお、前記実施例2の場合には、エンコーダ12において符号化処理時に領域判定を行い、領域判定結果を符号ストリームのタイルヘッダ部等に保持させたが、本実施例においては、その必要はない。したがって、エンコーダ12の領域判定処理部34は設ける必要がない。また、エンコーダ12により生成される符号ストリームのプログレッシブ順序や階層分割構成は任意であり、また、プログレッシブでなくともよい。
ヘッダ解析処理部51は、入力されるパケットのパケットヘッダ情報を解析し、(YUV信号のうちの)Y信号に関するコードブロック単位での0ビットプレーン数を出力する。ここでは、例えば3デコンポジションレベルのDWT係数を示す図11において、細線で区切られた各格子を1つのコードブロックであるとして、各々のコードブロック毎の0ビットプレーン数がヘッダ解析処理部51から出力され、領域判定処理部53に入力する。
図16は領域判定処理部53のブロック図である。図示のように、領域判定処理部53は、HLサブバンド用のサブバンド判定処理部201及び成分判定処理部202と、LHサブバンド用のサブバンド判定処理部203及び成分判定処理部204と、HHサブバンド用のサブバンド判定処理部205及び成分判定処理部206と、総合判定処理部207と、ラッチ208とから構成される。
HLサブバンド用のサブバンド判定処理部201は、図示のように、1HLサブバンド係数に対応した16個の2値化手段と、その2値化信号のORをとる手段と、2HLサブバンド係数に対応した4個の2値化手段と、その2値化信号のORをとる手段と、3HLサブバンド係数に対応した1個の2値化手段から構成される。図16では簡略化されているが、他のサブバンド判定処理部203,205も同様の構成である。
ヘッダ解析処理部51から出力されたコードブロック単位の0ビットプレーン数は、一旦バッファ200に記録される。タイル内の全てのコードブロックの0ビットプレーン数がバッファ200に蓄積されると、サブバンド判定処理部201は、2値化手段により、1HLz,2HLz,3HLzに関する0ビットプレーン数を、サブバンド毎に予め定められた所定のしきい値(TL_1HLz,TL_2HLz,TL_3HLz)と比較し、しきい値より大きい場合には0(オフ)、しきい値以下である場合には1(オン)に2値化する。このように、この2値化処理は通常の2値化処理とは出力レベルが逆である。これは、0ビットプレーン数の数が小さい場合はコードブロック内に大きなDWT係数が存在することを示し、数が大きな場合にはコードブロック内に大きなDWT係数が存在しないこと示す、という関係に合わせるためである。
ここでの1回の判定に使用される0ビットプレーン数の個数は、前記実施例5の場合と同様に図11の網掛けされた係数の数となる。つまり、1HLzは16個、2HLzは4個、3HLzは1個の係数が一度に2値化され、1HLzと2HLzに関しては16個、4個の2値化信号がOR手段によりそれぞれOR処理され、OR処理後の2値信号がサブバンド判定処理部201より出力される。
成分判定処理部202は、サブバンド判定処理部201より出力される3つの2値化信号のうち、2つ以上が1(オン)であれば1(オン)すなわち文字領域、そうでなければ0(オフ)すなわち非文字領域の判定結果信号を出力する。
サブバンド判定処理部201及び成分判定処理部202について説明したが、LHサブバンドに対応したサブバンド判定処理部203及び成分判定処理部204、HHサブバンドに対応したサブバンド判定処理部205及び成分判定処理部208の処理も同様である。
総合判定処理部207は、成分判定処理部202,204,206の判定結果信号と、同一タイル内での一つ前の総合判定結果信号とのORをとり、そのOR信号を総合判定結果信号として出力する。この総合処理がタイル内の全ての係数に対して行われ、タイル内の全ての総合判定処理が終了した時点の総合判定結果信号がラッチ208にラッチされ、それが当該タイルの領域判定データとなる。つまり、タイル内にオンが一つでもあれば文字タイルと判定し、一つもなければ非文字タイルと判定する。なお、次のタイルの判定開始時に、総合判定処理部207の出力は0クリアされる。
ここまでの説明から明らかなように、本実施例は請求項7の発明の一実施例である。
以上説明したように、本実施例によれば、符号データから領域判定を行うことができるため、符号化処理時に領域判定を行う必要がなく、したがってメモリやHDD等の記憶媒体あるいは符号ストリームに領域判定結果を保持しておく必要がない。また、本実施例におけるパケットヘッダ情報のみに基づく領域判定処理は、処理が簡易であるという長所を有する。
なお、本実施例においては、タイル単位で領域判定を行ったが、同様の方法により、前記実施例6のようなコードブロック単位の領域判定もしくはプレシンクト単位の領域判定も容易に可能であることは明らかである。
前記実施例1〜7においては、領域判定を行い、領域に応じて階層分割構成の制御、さらには階層単位の符号量の制御を行った。しかし、スキャナから読込まれた種々の画像データに対し正確な領域判定を実現することは容易でなく、ある程度の誤判定は避けられない。特に、鉛筆書き等の低コントラスト文字や色地上の文字等で誤判定が生じる可能性が高い。そして、誤判定が生じ、それに応じた処理がなされると、復号画像上に違和感が生じる可能性がある。このような違和感を緩和するためには、画像の特徴量を検出し、その特徴量に応じて符号ストリームのレイヤ分割構成(階層分割構成)を”多段階に”制御すると効果的である。ここでは、そのような特徴量に応じた多段階の制御を行う実施例について説明する。
図17は、本実施例に係る画像処理装置の全体構成を示すブロック図である。この画像処理装置は、サーバ1として利用し得るMFPであり、図2に示した構成と比較すると、像域分離処理部10が特徴量算出部111に置き換えられている点が相違する。これ以外の全体的構成及びMFPとしての動作は前記実施例1に関連して述べた通りである。
なお、像域分離処理部10にはスキャナ9から出力される画像データが入力されたが、特徴量算出部111にはエンコーダ処理部12に入力される画像データが入力される。これは、符号化処理の対象となる画像データそのものを特徴量の算出に用いることにより、特徴量の算出精度を向上させようとするものである。
図18は特徴量算出部111のブロック図である。図示のように、特徴量算出部111は、エッジ量算出フィルタ121、絶対値化処理部122、最大値選択部123及びルックアップテーブル(LUT)124から構成される。
この特徴量算出部111には、画像データのG信号が入力される。入力されたG信号に対してエッジ量算出フィルタ121で2種類のフィルタによるフィルタ演算が行われ、それぞれのフィルタ演算結果が絶対値化処理部122へ入力される。絶対値化処理部122では、それぞれのフィルタ演算結果を絶対値化して2つのデータを出力する。最大値選択部123では、この2つのデータのうちの最大値を選択して出力する。このデータは、LUT124により所定段階数の特徴量(エッジ量)を表すEdge信号に変換される。本実施例では、Edge信号は0〜7の8値とし、その値が大きいほどエッジ量が大きいことを表す。なお、LUT124による変換は、Edge信号と入力画像との関係を線形に近づけるために行われる。
エッジ量算出フィルタ121では、例えば図19(a),(b)のような方向性の異なる2種類の一次微分フィルタが用いられる。
なお、特徴量算出処理部111において、画像データのR,G,B各信号からエッジ量を算出し、それらの絶対値の最大値を選択するようにしてもよい。あるいは、RGB信号から所定の演算により生成した一つの信号からエッジ量を算出するようにしてもよい。さらには、エンコーダ12内で色変換処理により生成されるY信号を特徴量算出部111に入力し、同様のエッジ量検出を行うことも可能である。これらの態様も本発明に包含される。
図20は、本実施例に係るエンコーダ12のブロック図である。前記実施例1などに係る図3に示した構成と比較すると、領域判定処理部34が最大値選択部131に置き換えられている。最大値選択部131は、各タイル単位で、タイル内でのEdge信号の最大値を選択し、その値をタイルにおける特徴量(エッジ量)として出力する。この特徴量は符号ストリーム生成処理部37に入力される。
符号ストリーム生成処理部37の構成は、前記実施例1などに係る図5に示した構成と同様であるが、パターンテーブル43には、特徴量の段階数に対応した8種類のレイヤパターンが設定される。例えば、特徴量0(最低エッジ量)に対応するレイヤパターンは前記実施例1における非文字領域用のレイヤパターンとし、特徴量7(最大エッジ量)に対応するレイヤパターンは前記実施例1における文字領域用のレイヤパターンとし、中間的な特徴量1〜6に対応するレイヤパターンとしては、非文字領域用レイヤパターンと文字領域用レイヤパターンの中間的なレイヤパターンが用いられる。
セレクタ44は、特徴量に対応したレイヤパターンを選択してパケット生成処理部45へ入力する。したがって、パケット生成処理部45により、特徴量0のタイルでは非文字領域に適した階層分割構成の符号ストリームが生成され、特徴7のタイルでは文字領域に適した階層分割構成の符号ストリームが生成され、特徴量1〜6のタイルでは、その値に応じた中間的な階層分割構成の符号ストリームが生成されることとなる。このようにして、多値の特徴量に従って、符号ストリームの階層分割構成(レイヤ分割構成)が多段階に制御される。
ここまでの説明から明らかなように、本実施例は請求項8,18の発明の一実施例である。特徴量算出部111及び最大値選択部131と、その作用は、請求項8,18における特徴量検出手段と工程に対応する。また、パターンテーブル43及びセレクタ44とその作用は、請求項8,18における階層分割構成を制御する手段と工程に対応する。
以上説明したように本実施例によれば、符号ストリームのレイヤ分割構成を特徴量(エッジ量)に従って多段階に制御されるため、領域判定結果に従ってレイヤ分割構成を制御する構成における、復号画像に誤判定による違和感が生じるという問題は解消される。
なお、符号ストリーム生成処理部37において、特徴量0に対応したレイヤパターンと特徴量7に対応したレイヤパターンのみをパターンテーブル43に設定し、それら2種類のレイヤパターンを用いて特徴量1〜6に対応した中間的なレイヤパターンを算出する構成としてもよく、かかる態様も本発明に包含される。
また、像域分離も行い、その像域分離信号をLUT124に入力し、像域分離信号が文字領域を示す場合にLUT124より7のEdge信号を出力し、像域分離信号が非文字領域を示す場合には、LUT124より最大値選択部123で選択されたエッジ量に応じた0〜6のEdge信号を出力するというように、特徴量検出に像域分離を組み合わせることも可能である。かかる態様も本発明に包含される。
また、エッジ量はエントロピー符号化時の符号量との対応や文字らしさとの対応も良いため、特徴量として極めて好適である。しかし、エッジ量以外の特徴量を利用することも可能である。例えば、パターン認識を行い、その類似度合い等を特徴量として利用することも可能であり、かかる態様も本発明に包含される。
また、コードブロック単位又はプレシンクト単位で特徴量を検出することも可能である。それには、例えば、最大値選択部131によってコードブロック内又はプレシンクト内の最大値を選択すればよい。
また、前記実施例3に関連して説明したようなレイヤ単位(階層単位)の符号量を設定符号量に制御させることも可能である。さらには、レイヤ単位の設定符号量を特徴量に従って行わせることも可能である。例えば、符号ストリーム生成処理部37において、特徴量をパケット生成処理部45にも入力することにより、パケット生成処理部45でレイヤ単位の符号量を特徴量に従って多段階に制御させることができる。かかる態様は、請求項10,11の発明の一実施例に相当する。
また、前記実施例2に係る画像処理装置(図7)において、前述したような特徴量検出を行い、エンコーダ12により生成される符号ストリーム内に、検出された特徴量の情報を保持させ、符号ストリーム変更処理部50(図8)で、本実施例と同様に特徴量に従った階層分割構成(レイヤ分割構成)の制御を行わせることも可能である。かかる態様は請求項9の一実施例に相当する。さらに、特徴量に従ってレイヤ単位の符号量を多段階に制御させることも可能である。
前記実施例8では、実空間画像信号から特徴量を検出したが、次にDWT係数から特徴量を算出する実施例を説明する。
本実施例に係る画像処理装置の全体構成は、前記実施例8に係る画像処理装置(図17)より特徴量算出部111を省いた構成である。全体的動作は前記実施例8と同様であるので説明を省略し、前記実施例8との相違点を以下に説明する。
図21は、本実施例に係るエンコーダ12のブロック図である。このエンコーダ12は、前記実施例5に係るエンコーダ(図10)の領域判定処理部34を特徴量算出処理部141に置き換えた構成である。
図22は、本実施例に係る特徴量算出処理部141のブロック図である。図示のように、特徴量算出部141は、HLサブバンドに対応した加算処理部151と、LHサブバンドに対応した加算処理部152と、HHサブバンドに対応した加算処理部153と、最大値選択処理部154と、ルックアップテーブル(LUT)155と、最大値選択処理部156と、ラッチ157とから構成される。
この特徴量算出処理部141には、前記実施例5と同様に図11の網掛けされた部分のDWT係数(絶対値)が一度に入力される(ここでは、図11の細線の格子はDWT係数値を示すものとする)。入力されたHL,LH,HHのDWT係数は、加算処理部151,152,153によりそれぞれ加算され、その合計値が出力される。最大値選択処理部154により、その3つの合計値のうちの最大値が選択される。選択された最大値はLUT155によって前記実施例9と同様に8値の特徴量に変換される。この特徴量は最大値選択処理部156によって一つ前の特徴量と比較され、そのうちの大きな方の値が最大値選択処理部156より出力される。同様の処理がタイル内の全ての係数について繰り返され、全ての係数の処理が終了した時点における最大値選択処理部157の出力値がラッチ157にラッチされ、当該タイルの特徴量として出力される。なお、最大値選択処理部156の出力は、次のタイルの特徴量算出処理の開始前に0クリアされる。つまり、特徴量算出処理部141から出力される特徴量は、タイル内の特徴量の最大値である。
そして、符号ストリーム生成処理部37において、前記実施例8と同様に階層分割構成が特徴量に従って多段階に制御された符号ストリームが生成される。
ここまでの説明から明らかなように、本実施例は請求項13の発明の一実施例に相当する。
なお、同様の方法により、コードブロック単位又はプレシンクト単位で特徴量を検出してもよいことは明らかである。かかる態様も請求項13の発明に包含される。
また、DWT係数を使用した特徴量の算出方法は、前述の方法のみに限定されるものではない。
また、前記実施例2に係る画像処理装置(図7)において、エンコーダ12内で同様の特徴量検出を行い、検出した特徴量を符号ストリーム内に保持させ、符号ストリーム変更処理部50(図8)で、本実施例と同様に特徴量に従った階層分割構成(レイヤ分割構成)の制御を行わせることも可能である。かかる態様は請求項9の一実施例に相当する。さらに、特徴量に従って階層単位(レイヤ)の符号量を多段階に制御させることも可能であり、かかる態様は請求項10,11の一実施例に相当する。
次に、符号データから特徴量を算出する実施例を説明する。
本実施例における画像処理装置の全体構成は、前記実施例7に係る画像処理装置(図7)の像域分離処理部10を省いた構成である。また、全体的動作は前記実施例7と同様である。
本実施例に係る符号ストリーム変更処理部50は、前記実施例7に係る符号ストリーム生成処理部(図15)における領域判定処理部53を、図23に示す構成の特徴量算出処理部に置き換えた構成である。
この特徴量算出処理部は、図示のように、0ビットプレーン解析処理部161、加算処理部162,163,164、最大値選択処理部165、ルックアップテーブル(LUT)166、最大値選択処理部167及びラッチ168からなる。
ヘッダ解析処理部51よりパケットヘッダが入力されると、0ビットプレーン解析処理部161によってパケットヘッダの0ビットプレーン情報が解析され、各サブバンドのコードブロック単位のMSBからの0ビットプレーン情報が得られる。言い換えれば、各コードブロック単位の最大値の最上位ビットが含まれるサブビットプレーンが得られる。0ビットプレーン解析処理部161では、この情報に応じた重み値を与えて図11の網掛けされた部分の重み(W_1HL、W_2HL、W_3HL)を同時に出力する(ここでは、図11の細線の格子はコードブロックを示すものとする)。ここでの重みは、例えば、上記最上位ビットがLSBから7ビット目であれば128というように、2の”最上位ビット”乗とする。なお、この場合にサブビットプレーン単位にて重みを変更してもよい。例えば、最上位ビットがLSBから7ビット目のSignificance propagationパスである場合は、128+128×3/4(128は2の7乗、3/4はSignificance propagationパスの重み)という計算で224、Magnitude refinementパスの場合は、128+128×2/4という計算で192、Clean upパスの場合は、128+128×1/4という計算で160となる。
これらの重みを、図11に示す網掛けされたコードブロックの数だけ、つまりW_1HLを16個、W_2HLを4個、W_3HLを1個、加算処理部162で加算する。LH,HH成分の重みについても同様に加算処理部163,164で加算処理する。3個の加算値のうち最大値が最大値選択処理部165にて選択される。これ以降の処理は実施例9と同様であり、最大値選択処理部165の出力値はLUT166により0〜7の値に変換され、その値と直前の最大値選択処理部167の出力値の大きい方の値が最大値選択処理部167により選択され、最終的にラッチ168にラッチされた値がタイルの特徴量として出力される。そして、前記実施例7と同様にして、特徴量に従って階層分割構成が多段階に制御された符号ストリームがパケット生成処理部45により生成される。
ここまでの説明から明らかなように、本実施例は、請求項10の発明の一実施例に相当する。
なお、特徴量算出の単位領域はタイルに限らず、コードブロック単位又はプレシンクト単位の特徴量を同様の方法で算出可能であることは明らかであり、かかる態様も請求項10の発明に包含される。
前記各実施例はサーバ側の画像処理装置に関するものであるが、転送路の転送速度は十分高速であるがクライアントの復号処理速度が遅い場合などには、クライアント側で前記各実施例に述べたような領域毎の画像種別に応じた階層分割構成の制御を行うと効果的である。
ここに述べる実施例は、領域毎の画像種別に従ってプログレッシブ復号の階層分割構成の制御を行うクライアント側の画像処理装置に関するものである。
図24は、本実施例に係る画像処理装置の復号処理に関連する構成を示すブロック図である。本実施例の画像処理装置は、外部転送路2を介してサーバより符号ストリームを受信し、それをプログレッシブに復号するもので、外部インターフェース(I/F)91、符号バッファ92、符号ストリーム分解処理部93、エントロピー復号化処理部94、係数バッファ95、逆離散ウェーブレット変換(IDWT)処理部96、逆色変換処理部97及び画像バッファ98を含む構成である。すなわち、本実施例は、JPEG2000の伸長処理のための基本的構成に符号ストリーム分解処理部93が追加された構成である。符号ストリーム分解処理部93は、タイル単位で文字/非文字の領域判定を行うための手段を含み、その判定結果に従って、エントロピー復号化処理の前段で符号データのレイヤ分割構成(階層分割構成)を制御することによって、プログレッシブ復号の階層分割構成を制御するための手段である。
全体的な処理の流れは次の通りである。外部転送路2を介してサーバ1から転送された符号ストリームは、外部I/F91を経由して符号バッファ92へ蓄積される。符号バッファ92に一つの画像全体の符号データが蓄積されると、符号ストリーム分解処理部93は符号バッファ92から符号データをタイル単位で読み出し、該当するプログレッシブ階層(レイヤ)の符号データを選択してエントロピー復号化処理部94へ出力する。エントロピー復号化処理部94では、コードブロック単位でかつサブビットプレーン単位に算術符号化された符号データを復号化し、復号化したビットプレーンデータを係数バッファ95にDWT係数の形態に並べ替えて蓄積する。IDWT処理部96では、係数バッファ95からDWT係数を読み出し、前記式(3)の逆変換である逆離散ウェーブレット変換を実施してYUVの画像データを出力する。逆色変換処理部97では、前記式(1)、式(2)の逆変換によりYUVデータをRGBの画像データに戻して画像バッファに蓄積する。同様の処理が画像内の全てのタイルについて実施され、当該レイヤ(階層)の復号が終了する。なお、画像バッファ98内の画像データはモニタ4に逐次表示される。
一つのレイヤの復号処理が終わると、次位のレイヤの復号が開始される。次位のレイヤの復号時も同様の流れにより復号処理が行われるが、処理済みの上位レイヤのエントロピー復号化されたビットプレーンデータは係数バッファ95内に蓄積されているので、改めてエントロピー復号化は行われない。つまり、次位のレイヤ分のみの符号データがエントロピー復号化されて新たに係数バッファ95内に蓄積されることになり、そのデータに改めてIDWT処理から後段の処理を実施して画像バッファ内の画像データを更新していくことにより、領域判定結果に従って階層分割構成が制御されたプログレッシブ復号がなされる。
図25は、符号ストリーム分解処理部93のブロック図である。この符号ストリーム分解処理部93は、前記実施例7に係る符号ストリーム変更処理部50(図15)とほぼ同様の構成であるが、符号ストリームの形成に関わるパケット生成処理部45及びタイルヘッダ生成処理部46は符号選択処理部101に置き換えられている。また、符号ストリーム分割処理部93内の領域判定処理部53は、前記実施例7に係る図16に示す構成と同様の構成である。
符号ストリーム分割処理部93の処理は前記実施例7の符号ストリーム変更処理部50とほぼ同様であり、入力されるパケットのパケットヘッダがヘッダ解析処理部51で解析され、パケット分解処理部52からの制御信号に応じてパケット分解処理部52によりパケットの符号部分がサブビットプレーン毎の符号データに分解されて入力符号バッファ41に記録される。この際に、ヘッダ解析処理部51より(YUV信号のうちの)Y信号に関するコードブロック単位での0ビットプレーン数が領域判定処理部53へ出力され、領域判定処理部53において前記実施例7に関連して説明したと同様のタイル単位の文字/非文字の領域判定が行われる。この領域判定の結果に応じて、セレクタ44を介して、パターンテーブル43に設定されている文字タイル用レイヤパターン又は非文字タイル用レイヤパターンが符号選択処理部101に読み込まれる。
ここまでは前記実施例7の場合と同様であるが、本実施例においては、符号選択処理部101により、レイヤパターンに従って復号すべきレイヤに対応するサブビットプレーンの符号データを入力符号バッファ41から読み出し、それをエントロピー復号化処理部94へそのまま出力する点が相違する。このような符号ストリーム分解処理が、画像内の全タイルについて、上位レイヤから下位レイヤへ向かって順次繰り返されることにより、前述のような領域判定結果に従った階層分割構成のプログレッシブ復号が可能となる。
ここまでの説明から明らかなように、本実施例は、請求項15,19の発明の一実施例に相当する。そして、符号ストリーム分解処理部93とその作用は、請求項15,19におけるプログレッシブ復号の階層分割構成を制御する手段と工程に対応し、また、領域判定処理部53とその作用は、請求項15,19における領域判定手段と工程に対応する。
なお、本実施例ではタイル単位で領域判定を行ったが、コードブロック単位又はプレシンクト単位で同様の領域判定を行うことも可能であることは明らかであり、かかる態様も請求項15,19の発明に包含される。
また、前記実施例2に関連して述べたように、サーバ側で領域判定が行われ、その領域判定データが符号ストリームのタイルヘッダのコメントマーカ部等に記述されているならば、符号ストリーム分割処理部93(図25)において、ヘッダ解析処理部51でタイルヘッダより領域判定データ結果を抽出し、その領域判定データをセレクタ44に与えることができる。この場合、ヘッダ解析処理部51が領域判定手段となるため、領域判定処理部53を省くことができる。かかる態様も請求項15,19の発明に包含される。
本実施例は、前記実施例11と同様にクライアント側の画像処理装置に関するものであり、復号処理に関わる構成は前記実施例11(図24)と同様である。
また、本実施例に係る画像処理装置の符号ストリーム分解処理部93の構成は前記実施例11に係る図25に示すような構成であるが、領域判定処理部53は前記実施例10に係る特徴量算出処理部(図23)と置き換えられる。この特徴量算出処理部により算出されたタイル単位の特徴量(0〜7の8段階)に応じたレイヤパターンがセレクタ44を介してパターンテーブル43より符号選択処理部101へ入力され、符号選択処理部101においてレイヤパターンに従って特徴量に応じた符号選択が行われる。かくして、タイル単位で特徴量に従ってプログレッシブ復号の階層分割構成を多段階に制御することができる。
すなわち、本実施例は、請求項16,20の発明の一実施例である。そして、符号ストリーム分解処理部93とその作用は、請求項16,20におけるプログレッシブ復号の階層分割構成を制御する手段と工程に対応し、また、特徴量算出処理部3とその作用は請求項16,20における特徴量算出手段と工程に対応する。
なお、本実施例ではタイル単位で特徴量を算出したが、コードブロック単位又はプレシンクト単位で同様の特徴量算出を行うことも可能であることは明らかであり、かかる態様も請求項16,20の発明に包含される。
また、サーバ側で特徴量算出を行い、その特徴量データが符号ストリームのタイルヘッダのコメントマーカ部等に記述されているならば、符号ストリーム分割処理部93において、ヘッダ解析処理部51でタイルヘッダより特徴量データを抽出してセレクタ44に与えることができ、特徴量算出処理部を省くことができる。かかる態様も請求項16,20の発明に包含される。
なお、本発明の画像処理装置を構成する手段あるいは本発明の画像処理方法を構成する工程を、汎用コンピュータやマイクロコンピュータなどのコンピュータを利用して実現することも可能であることは明らかであり、そのためのプログラム、及び、同プログラムが記録されたコンピュータが読み取り可能な磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などの各種情報記録(記憶)媒体も本発明に包含される。
クライアント/サーバ環境の説明図である。 本発明の実施例1などに係る画像処理装置の全体的構成を示すブロック図である。 本発明の実施例1などに係るエンコーダのブロック図である。 文字タイルと非文字タイルにおけるレイヤプログレッションの階層分割構成の説明図である。 本発明の実施例などに係る符号ストリーム生成処理部のブロック図である。 文字タイルと非文字タイルにおける解像度プログレッションの階層分割構成の説明図である。 本発明の実施例2などに係る画像処理装置の全体的構成を示すブロック図である。 本発明の実施例2に係る符号ストリーム変更処理部のブロック図である。 本発明の実施例4に係る贈位域分離処理部のブロック図である。 本発明の実施例5などに係るエンコーダのブロック図である。 各サブバンドのウェーブレット係数又はコードブロックの説明図である。 本発明の実施例5に係る領域判定処理部のブロック図である。 本発明の実施例6に係る領域判定処理部のブロック図である。 図13中の成分判定処理部を説明するためのブロック図である。 本発明の実施例7などに係る符号ストリーム変更処理部のブロック図である。 図16中の領域判定処理部のブロック図である。 本発明の実施例8などに係る画像処理装置の全体構成を示すブロック図である。 図17中の特徴量算出部のブロック図である。 エッジ量算出フィルタを示す図である。 本発明の実施例8に係るエンコーダのブロック図である。 本発明の実施例9に係るエンコーダのブロック図である。 図21中の特徴量算出処理部のブロック図である。 本発明の実施例10など係る特徴量算出処理部のブロック図である。 本発明の実施例11などに係る画像処理装置のブロック図である。 図24中の符号ストリーム分解処理部のブロック図である。 JPEG2000の圧縮符号化処理を説明するためのブロック図である。 オクターブ分割されたウェーブレット係数の説明図である。 ビットプレーン分解及びサブビットプレーン分解の模式図である。 レイヤプログレッションの符号ストリームの模式図である。 JPEG2000のLRCPプログレッションとRPCLプログレッションのプログレッシブ順序を示す模式図である。 LRCPプログレッションの符号並びの例を示す図である。 RLCPプログレッションの符号並びの例を示す図である。
符号の説明
1 サーバ
2 クライアント
10 像域分離処理部
12 エンコーダ
13 CPU
14 メモリ
15 HDD
17 外部I/F
31 色変換処理部
32 離散ウェーブレット変換(DWT)処理部
34 領域判定処理部
35 エントロピー符号化処理部
36 ポスト量子化処理部
37 符号ストリーム生成処理部
41 入力符号バッファ
43 パターンテーブル
44 セレクタ
45 パケット生成処理部
46 タイルヘッダ生成処理部
47 出力符号バッファ
50 符号ストリーム変更処理部
51 ヘッダ解析処理部
52 パケット分解処理部
53 領域判定処理部
91 外部I/F
92 符号バッファ
93 符号ストリーム分解処理部
94 エントロピー復号化処理部
95 係数バッファ
96 逆離散ウェーブレット変換(IDWT)処理部
97 逆色変換処理部
98 画像バッファ
101 符号選択処理部
111 特徴量算出部
141 特徴量算出処理部

Claims (22)

  1. 画像の符号化処理を行って、レイヤプログレッションのプログレッシブ符号ストリームを出力する符号化手段と、
    画像の画像種別を所定のブロック単位で判定する領域判定手段とを有し、
    前記符号化手段において前記レイヤプログレッションのプログレッシブ符号ストリームを生成するための符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する手段を含むことを特徴とする画像処理装置。
  2. 画像の符号ストリームを記憶する記憶手段と、
    画像の画像種別を所定のブロック単位で判定する領域判定手段と、
    前記記憶手段に記憶されている符号ストリームを取り込み、該符号ストリームから、レイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成手段とを有し、
    前記符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する手段を含むことを特徴とする画像処理装置。
  3. 前記符号ストリーム生成手段に含まれる前記制御する手段は、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の符号量を予め決められた設定符号量に制御することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記符号ストリーム生成手段に含まれる前記制御する手段は、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の設定符号量を、前記領域判定手段による判定結果に従って切り替えることを特徴とする請求項3に記載の画像処理装置。
  5. 前記領域判定手段により判定される画像種別に文字、黒文字、色文字及び網点のうちの少なくとも1つが含まれることを特徴とする請求項1,2,3又は4に記載の画像処理装置。
  6. 前記領域判定手段は、画像の符号化処理の過程において生成される画像の周波数変換係数に基づいて画像種別を判定することを特徴とする請求項1又は2に記載の画像処理装置。
  7. 前記領域判定手段は、前記符号ストリーム生成手段に取り込まれた符号ストリームに基づいて画像種別を判定することを特徴とする請求項2に記載の画像処理装置。
  8. 画像の符号化処理を行って、レイヤプログレッションのプログレッシブ符号ストリームを出力する符号化手段と、
    画像の特徴量を所定のブロック単位で検出する特徴量検出手段と、
    前記符号化手段において前記レイヤプログレッションのプログレッシブ符号ストリームを生成するための符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出手段により検出された特徴量に従って多段階に制御する手段を含むことを特徴とする画像処理装置。
  9. 画像の符号ストリームを記憶する記憶手段と、
    画像の特徴量を所定のブロック単位で検出する特徴量検出手段と、
    前記記憶手段に記憶されている符号ストリームを取り込み、該符号ストリームから、レイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成手段とを有し、
    前記符号ストリーム生成手段は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出手段により検出された特徴量に従って多段階に制御する手段を含むことを特徴とする画像処理装置。
  10. 前記符号ストリーム生成手段に含まれる前記制御する手段は、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の符号量を予め決められた設定符号量に制御することを特徴とする請求項8又は9に記載の画像処理装置。
  11. 前記符号ストリーム生成手段に含まれる前記制御する手段は、前記レイヤプログレッションのプログレッシブ符号ストリームのレイヤ単位の設定符号量を、前記特徴量検出手段により検出された特徴量に従って多段階に切り替えることを特徴とする請求項10に記載の画像処理装置。
  12. 前記特徴量検出手段により検出される画像の特徴量はエッジ量であることを特徴とする請求項8,9,10又は11に記載の画像処理装置。
  13. 前記特徴量検出手段は、画像の符号化処理の過程において生成される画像の周波数変換係数に基づいて特徴量を検出することを特徴とする請求項8又は9に記載の画像処理装置。
  14. 前記特徴量検出手段は、前記符号ストリーム生成手段に取り込まれた符号ストリームに基づいて特徴量を検出することを特徴とする請求項9に記載の画像処理装置。
  15. 画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理装置であって、
    画像の画像種別を所定のブロック単位で判定する領域判定手段と、
    受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する手段とを有することを特徴とする画像処理装置。
  16. 画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理装置であって、
    画像の特徴量を所定のブロック単位で検出する特徴量検出手段と、
    受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出手段により検出された特徴量に従って多段階に制御する手段とを有することを特徴とする画像処理装置。
  17. 画像の画像種別を所定のブロック単位で判定する領域判定工程と、
    画像のレイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成工程とを有し、
    前記符号ストリーム生成工程は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定手段による判定結果に従って制御する工程を含むことを特徴とする画像処理方法。
  18. 画像の多値の特徴量を所定のブロック単位で検出する特徴量検出工程と、
    画像のレイヤプログレッションのプログレッシブ符号ストリームを生成する符号ストリーム生成工程とを有し、
    前記符号ストリーム生成工程は、前記レイヤプログレッションのプログレッシブ符号ストリームの各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出工程により検出された特徴量に従って多段階に制御する工程を含むことを特徴とする画像処理方法。
  19. 画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理方法であって、
    画像の画像種別を所定のブロック単位で判定する領域判定工程と、
    受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記領域判定工程による判定結果に従って制御する工程とを有することを特徴とする画像処理方法。
  20. 画像のプログレッシブ符号ストリームを受信してレイヤプログレッションのプログレッシブ復号を行う画像処理方法であって、
    画像の特徴量を所定のブロック単位で検出する特徴量検出工程と、
    受信したプログレッシブ符号ストリームに対するレイヤプログレッションのプログレッシブ復号において各レイヤに含める符号及び符号量を、ブロック毎に、前記特徴量検出工程により検出された特徴量に従って多段階に制御する工程とを有することを特徴とする画像処理装方法。
  21. 請求項1乃至16のいずれか1項に記載の画像処理装置の各手段としてコンピュータを機能させるプログラム。
  22. 請求項21に記載のプログラムが記録された、コンピュータが読み取り可能な情報記録媒体。
JP2003417886A 2003-12-16 2003-12-16 画像処理装置、画像処理方法、プログラム及び情報記録媒体 Expired - Fee Related JP4086192B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003417886A JP4086192B2 (ja) 2003-12-16 2003-12-16 画像処理装置、画像処理方法、プログラム及び情報記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003417886A JP4086192B2 (ja) 2003-12-16 2003-12-16 画像処理装置、画像処理方法、プログラム及び情報記録媒体

Publications (2)

Publication Number Publication Date
JP2005184086A JP2005184086A (ja) 2005-07-07
JP4086192B2 true JP4086192B2 (ja) 2008-05-14

Family

ID=34780249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003417886A Expired - Fee Related JP4086192B2 (ja) 2003-12-16 2003-12-16 画像処理装置、画像処理方法、プログラム及び情報記録媒体

Country Status (1)

Country Link
JP (1) JP4086192B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007074362A (ja) * 2005-09-07 2007-03-22 Fuji Xerox Co Ltd 符号化装置、復号化装置、符号化方法、復号化方法及びこれらのプログラム
JP4688164B2 (ja) * 2006-07-14 2011-05-25 株式会社リコー 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP5030141B2 (ja) * 2006-08-25 2012-09-19 株式会社リコー 構造化文書画像処理装置、構造化文書画像暗号処理方法、プログラム及び情報記録媒体
JP4254867B2 (ja) * 2007-01-31 2009-04-15 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP5263621B2 (ja) 2009-09-24 2013-08-14 ソニー株式会社 画像処理装置および方法
JP5520890B2 (ja) * 2011-07-04 2014-06-11 株式会社ソニー・コンピュータエンタテインメント 画像処理装置、画像データ生成装置、画像処理方法、画像データ生成方法、および画像ファイルのデータ構造
EP3293702B1 (en) * 2016-09-13 2020-04-29 Dassault Systèmes Compressing a signal that represents a physical attribute
CN111311511B (zh) * 2020-01-22 2023-08-29 凌云光技术股份有限公司 一种去除莫尔纹的方法和装置
CN111369450B (zh) * 2020-02-21 2024-02-02 华为技术有限公司 去除摩尔纹的方法与装置

Also Published As

Publication number Publication date
JP2005184086A (ja) 2005-07-07

Similar Documents

Publication Publication Date Title
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
JP3814456B2 (ja) 画像処理装置及びその方法
US6879727B2 (en) Decoding bit-plane-encoded data using different image quality for display
JP4176114B2 (ja) 画像圧縮装置およびそれを備えた画像読取装置、画像圧縮装置を備えた画像処理装置並びにそれを備えた画像形成装置、画像圧縮処理方法
US20020018597A1 (en) Image processing system, image processing apparatus, image input apparatus, image output apparatus and method, and storage medium
WO2001016764A1 (en) System and method for transmitting a digital image over a communication network
KR100611705B1 (ko) 화상 부호화 장치, 화상 부호화 방법, 및 화상 처리 장치
JP2003348360A (ja) 文書エンコーディングシステム、文書デコーディングシステムおよびその方法
US7630574B2 (en) Image encoding method and image apparatus
JP4086192B2 (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP4089905B2 (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2007005844A (ja) 符号化処理装置、符号化処理方法、プログラム及び情報記録媒体
US20060056714A1 (en) Image process device, image processing program, and recording medium
JP4315928B2 (ja) 画像処理装置および画像処理方法
JP4097146B2 (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体
US7373000B2 (en) Image processing apparatus
JP4766586B2 (ja) 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2004227406A (ja) 画像処理装置、プログラム及び記憶媒体
JP3952981B2 (ja) 画像処理装置
JP5267140B2 (ja) 画像圧縮装置及び画像圧縮方法
JP2003204439A (ja) 画像符号化装置及び画像符号化方法
JP5560172B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JPH11289461A (ja) 画像符号化方法および画像符号化装置
JP2002290743A (ja) 画像情報符号化方法、符号化装置、ディジタル複写機、ディジタルファクシミリ装置、及び、ディジタルファイリング装置
JP2010028796A (ja) 画像形成装置、画像変換装置および画像形成方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080214

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130228

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140228

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees