JP3697464B2

JP3697464B2 - 文書画像処理装置、撮像装置及び文書画像処理プログラム

Info

Publication number: JP3697464B2
Application number: JP2002051397A
Authority: JP
Inventors: 大作保理江
Original assignee: コニカミノルタフォトイメージング株式会社
Priority date: 2002-02-27
Filing date: 2002-02-27
Publication date: 2005-09-21
Anticipated expiration: 2022-02-27
Also published as: JP2003256773A

Description

【０００１】
【発明の属する技術分野】
本発明は、撮像装置で撮影された文書画像の画像データを補正する技術に関するものである。
【０００２】
【従来の技術】
被写体のディジタル画像データを生成するディジタル撮像装置は、被写体とディジタル撮像装置との距離、照明条件等の撮像条件が予め設定されている密着型と撮像条件が自由に変化するオープン型とに大別される。ディジタルカメラ等のオープン型のディジタル撮像装置は、画像処理により撮影された画像の画質を自在に制御できることから、撮影の目的や被写体の種類の応じて撮影画像の画質の処理を適正に行なうことによって、通常の銀塩フィルムに撮影するカメラと比較してより好適な画質の画像を取り込むことができるという利点がある。このため、通常の写真撮影のためだけでなく、例えば会議場でホワイトボードに書かれた文字、図形等の文書情報を写し取るための機器として利用されている。
【０００３】
一方、ディジタルカメラで文字や図形等が書かれたホワイトボードを撮影する場合には、ホワイトボード上の文書には照度ムラや文字または図形の掠れ等が発生するため、鮮明な画質の画像が得られにくい。そこで、このような撮影で得られた画像データに対して、白地部分（ホワイトボードの部分）を本来の白色に変更する（白く飛ばす）ことで文書情報部分（文字や図形の部分）の鮮明度を高める補正を行なうことが望ましい。
【０００４】
上記の画像データの補正方法として、特開２００１−４５２４４号公報に開示されているように、１ライン毎に当該ラインに含まれる画素の画像データのピーク値（最大輝度値）を使用して１ライン毎に補正を行なう方法が知られている。この方法では、１ラインという局所的な情報によって１ライン毎に補正が行なわれるため、補正の精度が不充分であった。例えば、ホワイトボードに予め印刷されている格子線に含まれるラインについては、ピーク値が格子線の輝度に影響され、充分な補正が行なわれない場合がある。
【０００５】
【発明が解決しようとする課題】
出願人は、全体画像を複数の小画像（ブロックという）に分割して小画像毎に各小画像の画像データに基づいて補正する方法を提案した（特開平１０−２１０３５４）。この方法は、各ブロックの画像データの内、輝度への寄与の大きい緑色成分についてレベル分布のヒストグラムを作成し、最大度数の階級を白色飽和レベルＷとして設定して、当該ブロックの画像データの緑色成分を図１５に示すように白色飽和レベルＷで出力レベルを飽和させる補正曲線を用いて補正するものである。
【０００６】
この方法によれば、１ライン毎に補正する場合と比較して補正に使用する情報の局所性が軽減されるため、補正の精度が向上する。しかし、この方法は、ブロック毎に異なる補正曲線を用いて画像データが補正されるため、ブロック内の画像全体が暗く且つ文字（又は図形）の密度が多い場合に補正が過度に行なわれる場合が有った。さらに、１ライン毎に補正する場合と比較して局所性は軽減されるが、軽減の程度が充分ではなく、画像データの補正の精度を更に向上する必要がある場合があった。
【０００７】
本発明は、上記の課題に鑑みてなされたもので、撮像装置で撮影された文書画像の画像データを補正するための適正な補正データを求める文書画像処理装置、撮像装置及び文書画像処理プログラムを提供することを目的としている。
【０００８】
【課題を解決するための手段】
請求項１に記載の文書画像処理装置は、撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理装置であって、文書画像全体を第１の方向について第１の所定数の第１エリアに分割する第１分割手段と、文書画像全体を前記第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割する第２分割手段と、前記第１エリアを前記第２の方向について前記第２分割手段による画像の分割位置と一致する位置で前記第２の所定数のブロックに分割する第３分割手段と、前記第１エリアに含まれる画素の画像データから前記第１エリア毎に下地の第１下地補正データを求める第１下地算出手段と、前記第２エリアに含まれる画素の画像データから前記第２エリア毎に下地の第２下地補正データを求める第２下地算出手段と、前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第３下地補正データを求める第３下地算出手段と、前記第１下地補正データ、第２下地補正データ及び第３下地補正データを用いて前記ブロック毎に第４下地補正データを求める第４下地算出手段とを備えることを特徴としている。
【０００９】
上記の構成によれば、第１分割手段によって、文書画像全体が第１の方向について第１の所定数の第１エリアに分割され、第１下地算出手段によって、この第１エリアに含まれる画素の画像データから第１エリア毎に下地の第１下地補正データが求められる。また、第２分割手段によって、文書画像全体が第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割され、第２下地算出手段によって、この第２エリアに含まれる画素の画像データから第２エリア毎に下地の第２下地補正データが求められる。さらに、第３分割手段によって、第１エリアが第２の方向について第２分割手段による画像の分割位置と一致する位置で第２の所定数のブロックに分割され、第３下地算出手段によって、このブロックに含まれる画素の画像データからブロック毎に下地の第３下地補正データが求められる。そして、第４下地算出手段によって、第１下地補正データ、第２下地補正データ及び第３下地補正データを用いてブロック毎に第４下地補正データが求められる。
【００１０】
このようにして、第４下地補正データは、第１エリアに含まれる画素の画像データから求められる第１下地補正データと、第２エリアに含まれる画素の画像データから求められる第２下地補正データと、ブロックに含まれる画素の画像データから求められる第３下地補正データとを用いて求められるため、当該ブロックに含まれる画像データの特徴（照度、文字や図形の密度等）が反映され、且つ、第１又は第２エリアに含まれる周囲の画像データの特徴も反映された適正な下地補正データ（第４下地補正データ）が得られる。
【００１１】
すなわち、ブロックに含まれる画像データの特徴に、当該ブロックを含む第１及び第２エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データが得られることになる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正が行なわれ、下地部分に対してより鮮明な文書画像データが得られる。
【００１２】
請求項２に記載の撮像装置は、被写体の画像データを生成する画像データ生成手段と、画像全体を第１の方向について第１の所定数の第１エリアに分割する第１分割手段と、画像全体を前記第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割する第２分割手段と、前記第１エリアを前記第２の方向について前記第２分割手段による画像の分割位置と一致する位置で前記第２の所定数のブロックに分割する第３分割手段と、前記第１エリアに含まれる画素の画像データから前記第１エリア毎に下地の第１下地補正データを求める第１下地算出手段と、前記第２エリアに含まれる画素の画像データから前記第２エリア毎に下地の第２下地補正データを求める第２下地算出手段と、前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第３下地補正データを求める第３下地算出手段と、前記第１下地補正データ、第２下地補正データ及び第３下地補正データを用いて前記ブロック毎に第４下地補正データを求める第４下地算出手段とを備えることを特徴としている。
【００１３】
上記の構成によれば、画像データ生成手段によって、被写体の画像データが生成される。そして、第１分割手段によって、この画像全体が第１の方向について第１の所定数の第１エリアに分割され、第１下地算出手段によって、この第１エリアに含まれる画素の画像データから第１エリア毎に下地の第１下地補正データが求められる。また、第２分割手段によって、画像全体が第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割され、第２下地算出手段によって、この第２エリアに含まれる画素の画像データから第２エリア毎に下地の第２下地補正データが求められる。さらに、第３分割手段によって、第１エリアが第２の方向について第２分割手段による画像の分割位置と一致する位置で第２の所定数のブロックに分割され、第３下地算出手段によって、このブロックに含まれる画素の画像データからブロック毎に下地の第３下地補正データが求められる。そして、第４下地算出手段によって、第１下地補正データ、第２下地補正データ及び第３下地補正データを用いてブロック毎に第４下地補正データが求められる。
【００１４】
このようにして、第４下地補正データは、第１エリアに含まれる画素の画像データから求められる第１下地補正データと、第２エリアに含まれる画素の画像データから求められる第２下地補正データと、ブロックに含まれる画素の画像データから求められる第３下地補正データとを用いて求められるため、被写体が文書（文字や図形等）が書かれたホワイトボード等である場合に、当該ブロックに含まれる画像データの特徴（照度、文字や図形の密度等）が反映され、且つ、第１又は第２エリアに含まれる周囲の画像データの特徴も反映された適正な下地補正データ（第４下地補正データ）が得られる。
【００１５】
すなわち、ブロックに含まれる画像データの特徴に、当該ブロックを含む第１及び第２エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データが得られることになる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正が行なわれ、下地部分に対してより鮮明な文書画像データが得られる。
【００１６】
請求項３に記載の撮像装置は、請求項２に記載の撮像装置であって、外部から文書画像データであるか否かの選択を受け付ける選択手段を更に備えることを特徴としている。
【００１７】
上記の構成によれば、選択手段によって、外部から文書画像データであるか否かの選択が受け付けられるため、文書画像であるか否かの判別が確実に行なわれ、文書画像データであるか否かの判別処理が不要となる。更に、文書画像である場合の他、他種の画像、例えば写真画像に対しても、適正な補正処理が適用可能となる。
【００１８】
請求項４に記載の文書画像処理プログラムは、撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理プログラムであって、コンピュータを、文書画像全体を第１の方向について第１の所定数の第１エリアに分割する第１分割手段と、文書画像全体を前記第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割する第２分割手段と、前記第１エリアを前記第２の方向について前記第２分割手段による画像の分割位置と一致する位置で前記第２の所定数のブロックに分割する第３分割手段と、前記第１エリアに含まれる画素の画像データから前記第１エリア毎に下地の第１下地補正データを求める第１下地算出手段と、前記第２エリアに含まれる画素の画像データから前記第２エリア毎に下地の第２下地補正データを求める第２下地算出手段と、前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第３下地補正データを求める第３下地算出手段と、前記第１下地補正データ、第２下地補正データ及び第３下地補正データを用いて前記ブロック毎に第４下地補正データを求める第４下地算出手段として機能させることを特徴としている。
【００１９】
上記のプログラムによれば、第１分割手段によって、文書画像全体が第１の方向について第１の所定数の第１エリアに分割され、第１下地算出手段によって、この第１エリアに含まれる画素の画像データから第１エリア毎に下地の第１下地補正データが求められる。また、第２分割手段によって、文書画像全体が第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割され、第２下地算出手段によって、この第２エリアに含まれる画素の画像データから第２エリア毎に下地の第２下地補正データが求められる。さらに、第３分割手段によって、第１エリアが第２の方向について第２分割手段による画像の分割位置と一致する位置で第２の所定数のブロックに分割され、第３下地算出手段によって、このブロックに含まれる画素の画像データからブロック毎に下地の第３下地補正データが求められる。そして、第４下地算出手段によって、第１下地補正データ、第２下地補正データ及び第３下地補正データを用いてブロック毎に第４下地補正データが求められる。
【００２０】
このようにして、第４下地補正データは、第１エリアに含まれる画素の画像データから求められる第１下地補正データと、第２エリアに含まれる画素の画像データから求められる第２下地補正データと、ブロックに含まれる画素の画像データから求められる第３下地補正データとを用いて求められるため、当該ブロックに含まれる画像データの特徴（照度、文字や図形の密度等）が反映され、且つ、第１又は第２エリアに含まれる周囲の画像データの特徴も反映された適正な下地補正データ（第４下地補正データ）が得られる。
【００２１】
すなわち、ブロックに含まれる画像データの特徴に、当該ブロックを含む第１及び第２エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データが得られることになる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正が行なわれ、下地部分に対してより鮮明な文書画像データが得られる。
【００２２】
【発明の実施の形態】
図１は、本発明に係る一実施形態であるディジタルカメラの主要部の構成を示すブロック図である。
【００２３】
図１に示すディジタルカメラは、文書等の被写体画像の画像データを生成する画像データ生成部１（画像データ生成手段に相当する）と、外部から文書画像データであるか否かの選択を受け付けるスライドスイッチ等からなる選択部２（選択手段に相当する）と、文書画像データの補正を行なう文書画像データ補正部３と、メモリカード等の記録媒体に画像データを格納する画像データ記録部４とを備える。
【００２４】
図２は、画像データ生成部１の主要部の構成を示すブロック図である。画像データ生成部１は、被写体からの光を集光するレンズ１１と、複数の受光素子が配列され、被写体からの光をそれぞれの受光素子で光電変換し、変換された電荷を蓄積するＣＣＤ（電荷結合素子）１２と、ＣＣＤ２を駆動するＣＣＤ駆動部１３とを備える。
【００２５】
撮像レンズ１１は、例えば電動式のズームレンズである。レンズ駆動部１１１は、撮像レンズ１１の合焦動作及びズーミング動作を行なう。撮像レンズ１１の光軸Ｌ上の光束の結像位置には、露光制御用のメカニカルシャッタ１１２を介してＣＣＤ１２が設けられている。なお、図示していないが、必要に応じて絞り、光学式ローパスフィルタ、赤外線カットフィルタ、又は光量調節用のＮＤフィルタ等が設けられている。
【００２６】
ＣＣＤ１２の前面（被写体側）には、所定の（例えば、ベイヤー（Ｂａｙｅｒ）方式の）色配列を有する色フィルタ１１３（ここではＲ（赤）、Ｇ（緑）、Ｂ（青）の３原色からなる原色フィルタ）が配設されている。
【００２７】
ＣＣＤ１２は、フォトダイオードからなる受光素子がマトリクス状に配列されたインタライン転送型ＣＣＤである。また、ＣＣＤ１２はタイミングジェネレータ１３１から出力される制御信号に応じて残留電荷の放出等の所定の動作を行ない、入射される光を光電変換し、更に露光時間に亘って得た蓄積電荷を画像信号として信号処理部１３２へ出力する。
【００２８】
信号処理部１３２は、ＣＣＤ１２から出力された信号を相関二重サンプリング処理やＡ／Ｄ変換処理等の信号処理を施し、ディジタル化された画像データとして文書画像データ補正部３に出力するものである。なお、この画像データは受光素子に対応する個数の集合として得られ、ここでは、Ｒ，Ｇ，Ｂ色それぞれについて１画像当たり３１４５７２８画素（＝１５３６画素（縦方向）×２０４８画素（横方向））分だけ出力される。
【００２９】
文書画像データ補正部３は、Ｒ，Ｇ，Ｂデータからなる画像データを後述するＹ，Ｃｒ，Ｃｂデータからなる画像データに変換する前処理部３０と、画像全体を第１の方向（ここでは横方向）に所定数（ここでは１６個）に分割して縦長エリアＡＲｋ（ｋ＝１〜１６）（図３参照）を形成する第１分割部３１（第１分割手段に相当する）と、画像全体を第１の方向と異なる第２の方向（ここでは縦方向）に所定数（ここでは１２個）に分割して横長エリアＢＲｈ（ｈ＝１〜１２）（図４参照）を形成する第２分割部３２（第２分割手段に相当する）と、第２分割部３２による画像の分割位置と一致する位置で縦長エリアＡＲｋを第２の方向（ここでは縦方向）に１２個のブロックＣＲｋ，ｈ（ｋ＝１〜１６、ｈ＝１〜１２）（図５参照）に分割する第３分割部３３（第３分割手段に相当する）とを備えると共に、縦長エリアＡＲｋに含まれる画素の画像データから縦長エリアＡＲｋ毎に下地の下地補正データＬＡｋ（ｋ＝１〜１６）を求める第１下地算出部３４（第１下地算出手段に相当する）と、横長エリアＢＲｈに含まれる画素の画像データから横長エリアＢＲｈ毎に下地の下地補正データＬＢｈ（ｈ＝１〜１２）を求める第２下地算出部３５（第２下地算出手段に相当する）と、ブロックＣＲｋ，ｈに含まれる画素の画像データからブロックＣＲｋ，ｈ毎に高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈ（ｋ＝１〜１６、ｈ＝１〜１２）（第３下地補正データに相当する）を求める第３下地算出部３６（第３下地算出手段に相当する）とを備え、更に、下地補正データＬＡｋ、下地補正データＬＢｈ、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを用いてブロックＣＲｋ，ｈ毎に下地補正データＬＤｋ，ｈ（ｋ＝１〜１６、ｈ＝１〜１２）を求める第４下地算出部３７（第４下地算出手段に相当する）と、下地補正データＬＤｋ，ｈに基づいて画像データを補正する補正部３８と、種々の後処理を行なう後処理部３９とを備える。
【００３０】
前処理部３０は、以下に示す色変換のための（１−１）〜（１−３）式に従って、Ｒ，Ｇ，Ｂデータからなる画像データをＹ，Ｃｒ，Ｃｂデータからなる画像データに変換するものである。なお、（１−１）〜（１−３）式の結果値のＬＵＴ（ルックアップテーブル）を備える形態でもよい。
Ｙ＝０．３Ｒ＋０．５９Ｇ＋０．１１Ｂ（１−１）
Ｃｒ＝Ｒ−Ｙ（１−２）
Ｃｂ＝Ｂ−Ｙ（１−３）
なお、（１−１）式で求められるＹデータは輝度データである。また、ここでは、Ｙデータは２５６階調のデータであるものとする。以降の画像処理においては、Ｙ，Ｃｒ，Ｃｂデータが用いられる。
【００３１】
第１分割部３１は、図３に示すように、縦方向１５３６画素、横方向２０４８画素からなる全体画像データを、横方向にそれぞれ縦方向１５３６画素、横方向１２８画素からなる１６個の縦長エリアＡＲｋ（ｋ＝１〜１６）に分割するものである。
【００３２】
第２分割部３２は、図４に示すように、縦方向１５３６画素、横方向２０４８画素からなる全体画像データを、縦方向にそれぞれ縦方向１２８画素、横方向２０４８画素からなる１２個の横長エリアＢＲｈ（ｈ＝１〜１２）に分割するものである。
【００３３】
第３分割部３３は、図５に示すように、縦方向１５３６画素、横方向１２８画素からなる１６個の縦長エリアＡＲｋ（ｋ＝１〜１６）を、第２分割部３２による画像の分割位置と一致する位置で縦方向にそれぞれ縦方向１２８画素、横方向１２８画素からなる１２個のブロックＣＲｋ，ｈ（ｋ＝１〜１６、ｈ＝１〜１２）に分割するものである。なお、ブロックＣＲｋ，ｈは、縦長エリアＡＲｋと横長エリアＢＲｈとの共通画素の集合である。すなわち、ブロックＣＲｋ，ｈに含まれる画素は、縦長エリアＡＲｋ及び横長エリアＢＲｈの両方に含まれる画素である。
【００３４】
第１下地算出部３４は、縦長エリアＡＲｋ（ｋ＝１〜１６）毎の下地補正データＬＡｋ（ｋ＝１〜１６）を求めるもので、以下の各処理を実行する。すなわち、第１下地算出部３４は、縦長エリアＡＲｋについて、縦方向及び横方向共に所定画素毎（ここでは、８画素毎）にＹデータを抽出し、その値を１／４倍して６４階調データとして求めると共に、図６に示すように各階調毎のクラスでヒストグラムを作成し、このヒストグラム中より最大度数のクラスの６４階調データを抽出し、且つ、４倍して（２５６階調データに戻して）下地補正データＬＡｋ（ｋ＝１〜１６）を得る。
【００３５】
また、第１下地算出部３４は、縦長エリアＡＲｋ（ｋ＝１〜１６）毎に、注目縦長エリアＡＲｋと隣接する第１エリアＡＲ（ｋ−１）、ＡＲ（ｋ＋１）との下地補正データＬＡｋ、ＬＡ（ｋ−１）、ＬＡ（ｋ＋１）の中央値を注目縦長エリアＡＲｋの下地補正データＬＡｋとして求める（この処理を、平均化処理という）。更に、１６個の下地補正データＬＡｋから、最大のデータと最小のデータとを除いた１４個のデータを抽出し、その平均値である縦長エリア平均値ＬＡＡＶを求める。なお、左右両端の縦長エリアＡＲ１、ＡＲ１６の下地補正データＬＡ１及びＬＡ１６と縦長エリア平均値ＬＡＡＶとの差がそれぞれ所定階調（ここでは５０階調）以上である場合には、下地補正データＬＡ２を下地補正データＬＡ１に代入し、下地補正データＬＡ１５を下地補正データＬＡ１６に代入する（この処理を端部処理という）。
【００３６】
ここで、８画素毎のＹデータを使用するのは、全画素を使用する場合と比較して、ヒストグラムの作成に使用するデータ数を削減することによって計算時間を削減するためである。また、Ｙデータを１／４倍した６４階調データを使用するのは、ヒストグラムを作成するための集計計算に要する時間を削減するためである。なお、ここでは、８画素毎のデータを使用しているが、必ずしもこれに限定されるものではなく、計算時間と計算精度との関係で、適宜何画素毎の（又は全画素の）データを使用するかを設定することが可能である。また、ここでは、Ｙデータを１／４倍した６４階調データを使用しているが、必ずしもこれに限定されるものではなく、計算時間と計算精度との関係で、適宜Ｙデータを何倍（１倍を含む）したデータを使用するかを設定することが可能である。
【００３７】
ここで、平均化処理を施しているのは、隣接する縦長エリアＡＲｋの下地補正データＬＡｋ間の差が過大になることを防止するためである。また、端部処理を施しているのは、全体画像データの端部には、文書画像以外の画像（例えば背景画像）等の画像データが含まれている場合があり、この画像データが文書画像データの補正に影響を与えることを防止するためである。
【００３８】
第２下地算出部３５は、横長エリアＢＲｈ（ｈ＝１〜１２）毎の下地補正データＬＢｈ（ｈ＝１〜１２）を求めるもので、以下の各処理を実行する。すなわち、第２下地算出部３５は、横長エリアＢＲｈについて、縦方向及び横方向共に所定画素毎（ここでは、８画素毎）にＹデータを抽出し、その値を１／４倍して６４階調データとして求めると共に、図６に示すように各階調毎のクラスでヒストグラムを作成し、このヒストグラム中より最大度数のクラスの６４階調データを抽出し、且つ、４倍して（２５６階調データに戻して）下地補正データＬＢｈ（ｈ＝１〜１２）を得る。
【００３９】
また、第２下地算出部３５は、横長エリアＢＲｈ（ｈ＝１〜１２）毎に、注目第２エリアＢＲｈと隣接する横長エリアＢＲ（ｈ−１）、ＢＲ（ｈ＋１）との下地補正データＬＢｈ、ＬＢ（ｈ−１）、ＬＢ（ｈ＋１）の中央値を注目横長エリアＢＲｈの下地補正データＬＢｈとして求める。更に、１２個の下地補正データＬＢｈから、最大のデータと最小のデータとを除いた１０個のデータを抽出し、その平均値である横長エリア平均値ＬＢＡＶを求める。なお、左右両端の横長エリアＢＲ１、ＢＲ１２の下地補正データＬＢ１及びＬＢ１２と横長エリア平均値ＬＢＡＶとの差がそれぞれ所定階調（ここでは５０階調）以上である場合には、下地補正データＬＢ２を下地補正データＬＢ１に代入し、下地補正データＬＢ１１を第２下地補正データＬＢ１２に代入する。
【００４０】
第３下地算出部３６は、ブロックＣＲｋ,ｈ（ｋ＝１〜１６、ｈ＝１〜１２）毎の高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈ（ｋ＝１〜１６、ｈ＝１〜１２）（第３下地補正データに相当する）を求める以下の処理を行なう。すなわち、第３下地算出部３６は、ブロックＣＲｋ,ｈについて、縦方向及び横方向共に所定画素毎（ここでは、８画素毎）にＹデータを抽出し、その値を１／４倍して６４階調データとして求めると共に、図７に示すように各階調毎のクラスでヒストグラムを作成する。
【００４１】
また、第３下地算出部３６は、このヒストグラムについて、高輝度側から次の▲１▼及び▲２▼の２条件を満たすクラスを検索し、該当するクラス（第１クラスという）の６４階調データを４倍して（２５６階調データに戻して）、高輝度側下地補正データＬＣＨｋ,ｈを得る。
▲１▼度数＞ＴＨ１
▲２▼度数が、そのクラスより低輝度側の３クラスの度数より大きい。
ここで、閾値ＴＨ１は、ここでは３２（＝１２８×１２８÷６４÷８）であって、ヒストグラムを作成する対象とした画素のＹデータが全クラスに均一に分布している場合の各クラスの度数である。
【００４２】
更に、第３下地算出部３６は、このヒストグラムについて、第１クラスから低輝度側に向けて次の▲３▼〜▲５▼の３条件を満たすクラスを検索し、該当するクラスの６４階調データを４倍して（２５６階調データに戻して）低輝度側下地補正データＬＣＬｋ,ｈを得る。
▲３▼度数＞ＴＨ２
▲４▼度数が、そのクラスより高輝度側のクラスの度数より大きい。
▲５▼度数が、そのクラスより低輝度側の３クラスの度数より全て大きい。
ここで、閾値ＴＨ２は、閾値ＴＨ１と同様に３２である。
【００４３】
第４下地算出部３７は、下地補正データＬＡｋ、下地補正データＬＢｈ、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを用いて、ブロックＣＲｋ,ｈ毎の下地補正データＬＤｋ，ｈを求めるもので、以下の各処理を実行する。
【００４４】
すなわち、第４下地算出部３７は、ブロックＣＲｋ,ｈについて、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを、そのブロックの画素を含む縦長エリアＡＲｋの下地補正データＬＡｋと比較し、下地補正データＬＡｋの値に近い方を縦方向下地補正データＬＤＡｋ,ｈとして設定する。
【００４５】
ただし、縦方向下地補正データＬＤＡｋ,ｈと下地補正データＬＡｋとの差が予め設定されている所定値（ここでは６０階調）以上である場合には、下地補正データＬＡｋが縦方向下地補正データＬＤＡｋ,ｈとされる。縦方向下地補正データＬＤＡｋ,ｈと下地補正データＬＡｋとの差が比較の結果、予め設定されている所定値の範囲（ここでは、４０〜５９階調）である場合には、下地補正データＬＡｋと縦方向下地補正データＬＤＡｋ,ｈとの平均値が縦方向下地補正データＬＤＡｋ,ｈとされる。
【００４６】
例えば、高輝度側下地補正データＬＣＨｋ,ｈが「１６０」、低輝度側下地補正データＬＣＬｋ,ｈが「１１０」、下地補正データＬＡｋが「２３０」である場合には、高輝度側下地補正データＬＣＨｋ,ｈの方が低輝度側下地補正データＬＣＬｋ,ｈより下地補正データＬＡｋの値に近いため、高輝度側下地補正データＬＣＨｋ,ｈが縦方向下地補正データＬＤＡｋ,ｈとされる。そして、縦方向下地補正データＬＤＡｋ,ｈ（＝１６０）と下地補正データＬＡｋとの差（＝８０）が６０階調以上であるため、下地補正データＬＡｋが縦方向下地補正データＬＤＡｋ,ｈとされる。その結果、縦方向下地補正データＬＤＡｋ,ｈは「２３０」となる。
【００４７】
また、例えば、高輝度側下地補正データＬＣＨｋ,ｈが「１８０」、低輝度側下地補正データＬＣＬｋ,ｈが「１１０」、下地補正データＬＡｋが「２３０」である場合には、高輝度側下地補正データＬＣＨｋ,ｈの方が低輝度側下地補正データＬＣＬｋ,ｈより下地補正データＬＡｋの値に近いため、高輝度側下地補正データＬＣＨｋ,ｈが縦方向下地補正データＬＤＡｋ,ｈとされる。そして、縦方向下地補正データＬＤＡｋ,ｈと下地補正データＬＡｋとの差（＝５０）が４０〜５９階調の範囲内であるため、下地補正データＬＡｋと縦方向下地補正データＬＤＡｋ,ｈとの平均値（＝（２３０＋１８０）／２）が縦方向下地補正データＬＤＡｋ,ｈとされる。その結果、縦方向下地補正データＬＤＡｋ,ｈは「２０５」となる。
【００４８】
さらに、第４下地算出部３７は、ブロックＣＲｋ,ｈ毎に注目ブロックＣＲｋ,ｈとその上下左右ブロックの計５ブロックの縦方向下地補正データを抽出し、最大のものと最小のものを除く３ブロックの縦方向下地補正データの平均値を注目ブロックＣＲｋ,ｈの縦方向下地補正データＬＤＡｋ,ｈとして求める。
【００４９】
例えば、注目ブロックＣＲｋ,ｈの縦方向下地補正データＬＤＡｋ,ｈが「２００」、注目ブロックＣＲｋ,ｈの左側のブロックＣＲｋ,（ｈ−１）の縦方向下地補正データＬＤＡｋ,（ｈ−１）が「２１０」、注目ブロックＣＲｋ,ｈの右側のブロックＣＲｋ,（ｈ＋１）の縦方向下地補正データＬＤＡｋ,（ｈ＋１）が「２２０」、注目ブロックＣＲｋ,ｈの上側のブロックＣＲ（ｋ−１）,ｈの縦方向下地補正データＬＤＡ（ｋ−１）,ｈが「１９０」、注目ブロックＣＲｋ,ｈの下側のブロックＣＲ（ｋ＋１）,ｈの縦方向下地補正データＬＤＡ（ｋ＋１）,ｈが「２１０」である場合、注目ブロックＣＲｋ,ｈの縦方向下地補正データＬＤＡｋ,ｈは「２０７」（＝（２００＋２１０＋２１０）／３）とされる。
【００５０】
ただし、４隅のブロックＣＲ１,１、ＣＲ１,１２、ＣＲ１６,１、ＣＲ１６,１２の縦方向下地補正データについては、上記平均化処理を行なわず、第１下地算出部３４によって算出された縦長エリア平均値ＬＡＡＶとの差が予め設定された所定値（ここでは５０階調）以上である場合には、それぞれブロックＣＲ２,２、ＣＲ２,１１、ＣＲ１５,２、ＣＲ１５,１１の縦方向下地補正データが代入される。
【００５１】
このようにして、第４下地算出部３７は、ブロックＣＲｋ,ｈ毎に、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを下地補正データＬＡｋを用いて補正することによって縦方向下地補正データＬＤＡｋ,ｈを求める。すなわち、縦方向下地補正データＬＤＡｋ,ｈは、ブロック毎の情報にそのブロックの画素が含まれる縦長エリア（及びその左右の縦長エリア）の情報が加味されて補正された結果得られることになる。
【００５２】
更に、第４下地算出部３７は、ブロックＣＲｋ,ｈについて、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを、そのブロックの画素を含む横長エリアＢＲｈの下地補正データＬＢｈと比較し、下地補正データＬＢｈの値に近い方を横方向下地補正データＬＤＢｋ,ｈとして設定する。
【００５３】
ただし、横方向下地補正データＬＤＢｋ,ｈと下地補正データＬＢｈとの差が予め設定されている所定値（ここでは６０階調）以上である場合には、下地補正データＬＢｈを横方向下地補正データＬＤＢｋ,ｈとされる。横方向下地補正データＬＤＢｋ,ｈと下地補正データＬＢｈとの差が予め設定されている所定値の範囲（ここでは、４０〜５９階調）である場合には、下地補正データＬＢｈと横方向下地補正データＬＤＢｋ,ｈとの平均値が横方向下地補正データＬＤＢｋ,ｈとされる。
【００５４】
また、第４下地算出部３７は、ブロックＣＲｋ,ｈ毎に注目ブロックＣＲｋ,ｈとその上下左右ブロックの計５ブロックの横方向下地補正データを抽出し、最大のものと最小のものを除く３ブロックの横方向下地補正データの平均値を注目ブロックＣＲｋ,ｈの横方向下地補正データＬＤＢｋ,ｈとして求める。
【００５５】
ただし、４隅のブロックＣＲ１,１、ＣＲ１,１２、ＣＲ１６,１、ＣＲ１６,１２の横方向下地補正データについては、上記平均化処理を行なわず、第２下地算出部３４によって算出された横長エリア平均値ＬＢＡＶとの差が予め設定された所定値（ここでは５０階調）以上である場合には、それぞれブロックＣＲ２,２、ＣＲ２,１１、ＣＲ１５,２、ＣＲ１５,１１の横方向下地補正データが代入される。
【００５６】
このようにして、第４下地算出部３７は、ブロックＣＲｋ,ｈ毎に、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを下地補正データＬＢｈを用いて補正することによって横方向下地補正データＬＤＢｋ,ｈを求める。すなわち、横方向下地補正データＬＤＢｋ,ｈは、ブロック毎の情報にそのブロックの画素が含まれる横長エリア（及びその上下の横長エリア）の情報が加味されて補正された結果得られることになる。
【００５７】
更に、第４下地算出部３７は、上記の処理で得られた縦方向下地補正データＬＤＡｋ,ｈと横方向下地補正データＬＤＢｋ,ｈとの内、いずれか（ここでは小さい方）を下地補正データＬＤｋ，ｈとして設定する。小さい方を選択する場合には、画像データの輝度を高く（白色化の程度を強く）補正することができる。なお、上記のようにして求められた下地補正データＬＤｋ，ｈは、ブロック毎の情報に、そのブロックの画素が含まれる縦長エリア（及びその左右の縦長エリア）の情報と、そのブロックの画素が含まれる横長エリア（及びその上下の横長エリア）の情報とが加味されて補正された結果得られるものであるため、局所性及び方向性に対する依存度が軽減され適正な下地補正を行ない得る下地補正データＬＤｋ，ｈが得られる。
【００５８】
補正部３８は、第４下地算出部３７によってブロックＣＲｋ，ｈ毎に得られる下地補正データＬＤｋ，ｈを用いてＹデータ（輝度データ）を画素毎に補正するもので、以下の各処理を実行する。
【００５９】
すなわち、補正部３８は、以下に述べるようにして画素毎にＹデータの補正データＬＵｉ，ｊ（ｉ＝１〜１５３６、ｊ＝１〜２０４８）（下地補正データという）を算出する。ここで、下地補正データＬＤｋ，ｈは、ブロックＣＲｋ，ｈの中心位置に仮想的にある画素に対する下地補正データとして使用される。そして、図８に示すように、各ブロックの中心位置に仮想的にある画素に対する下地補正データＬＤｋ，ｈに線形内挿法を適用し、これによって各画素に対する下地補正データＬＵｉ，ｊを求める。
【００６０】
具体的には、ブロックＣＲｋ，ｈの中心位置Ａと、ブロックＣＲｋ，（ｈ＋１）の中心位置Ｂと、ブロックＣＲ（ｋ＋１），（ｈ＋１）の中心位置Ｃと、ブロックＣＲ（ｋ＋１），ｈの中心位置Ｄとによって規定される正方形ＡＢＣＤの内部にある画素Ｐに対する下地補正データＷｐを、ここでは、計算量の削減のため正方形ＡＢＣＤの内部にある左上隅の画素を基準にして縦方向及び横方向共に所定画素（ここでは、４画素）毎に、次の（２）式によって求める（図８参照）。
Ｗｐ＝（１−ｍ）×[（１−ｎ）×Ｗａ＋ｎ×Ｗｃ]＋ｍ×[（１−ｎ）×Ｗｂ＋ｎ×Ｗｄ] （２）
ただし、Ｗａ＝ＬＤｋ,ｈ、Ｗｂ＝ＬＤｋ,（ｈ＋１）、Ｗｃ＝ＬＤ（ｋ＋１）,（ｈ＋１）、Ｗｄ＝ＬＤ（ｋ＋１）,ｈであって、画素Ｐは正方形ＡＢＣＤの辺ＡＢを、ｍ：（１−ｍ）の比に内分し、辺ＡＤを、ｎ：（１−ｎ）の比に内分する位置にある画素である。
【００６１】
また、補正部３８は、（２）式によって下地補正データＬＵｉ，ｊが計算されなかった画素に対する下地補正データＬＵｉ，ｊを以下の方法で求める。図９に示すように、（２）式によって下地補正データＬＵｉ，ｊが計算された画素を左上隅（図の斜線部）の画素とする縦方向及び横方向ともに４画素からなる正方形の領域内（小ブロックという）にある画素（１６画素）の下地補正データＬＵｉ，ｊの値を、小ブロックの左上隅の画素に対する下地補正データＬＵｉ，ｊの値と同一の値に設定する。すなわち、小ブロック内の１６画素に対しては同じ値の下地補正データＬＵｉ，ｊが設定される。
【００６２】
このようにして求められる画素毎の下地補正データＬＵｉ，ｊは、画像全体（１５３６画素（縦方向）×２０４８画素（横方向））の内、図１０（ａ）に示す斜線部の領域である。なぜなら、画素毎の下地補正データＬＵｉ，ｊを求めるために使用する下地補正データＬＤｋ，ｈは、それぞれ縦方向及び横方向ともに１２８画素からなるブロックＣＲｋ,ｈ毎に求められるものであって、画素毎の下地補正データは、図８に示すように各ブロックの中心位置に仮想的にある画素に対する下地補正データＬＤｋ，ｈに画素線形内挿法を適用することによって求められるからである。
【００６３】
そこで、補正部３８は、画像全体（１５３６画素（縦方向）×２０４８画素（横方向））の内、外縁部から６４番目までの画素については、以下の方法で、画素毎の下地補正データＬＵｉ，ｊを求める。すなわち、補正部３８は、図１０（ａ）に示すように画素毎の下地補正データＬＵｉ，ｊを求める領域を、４隅の領域Ｒ１（６４画素×６４画素×４箇所）と、上下端の領域Ｒ２（６４画素×１９２０（＝２０４８−１２８）画素×２箇所）と、左右端の領域Ｒ３（１４０８（＝１５３６−１２８）画素×６４画素×２箇所）とに分割する。なお、図１０（ｂ）は、画像全体の左上端近傍を拡大したものであって、最小の正方形が小ブロック（４画素×４画素）を表わしている。
【００６４】
そして、補正部３８は、領域Ｒ１内の画素に対する下地補正データＬＵｉ，ｊとして、図１０（ａ）に示す斜線部の４隅の小ブロックの下地補正データＬＵｉ，ｊと同一の値を設定する。例えば、図１０（ｂ）に示す左上隅の領域Ｒ１内の画素に対する下地補正データＬＵｉ，ｊは、斜線部の領域の左上隅の小ブロックＳＢ１に含まれる画素の下地補正データＬＵｉ，ｊと同一の値が設定される。
【００６５】
また、補正部３８は、領域Ｒ２内の画素に対する下地補正データＬＵｉ，ｊとして、当該画素が含まれる小ブロックと同一の列にあって、図１０（ａ）に示す斜線部の上端（又は下端）の小ブロックの下地補正データＬＵｉ，ｊと同一の値を設定する。例えば、図１０（ｂ）において、領域Ｒ２内の小ブロックＳＢ２に含まれる画素に対する下地補正データＬＵｉ，ｊは斜線部内の小ブロックＳＢ３に含まれる画素の下地補正データＬＵｉ，ｊと同一の値が設定され、領域Ｒ２内の小ブロックＳＢ４に含まれる画素に対する下地補正データＬＵｉ，ｊは、斜線部内の小ブロックＳＢ５に含まれる画素の下地補正データＬＵｉ，ｊと同一の値が設定される。
【００６６】
更に、補正部３８は、領域Ｒ３内の画素に対する下地補正データＬＵｉ，ｊとして、当該画素が含まれる小ブロックと同一の行にあって、図１０（ａ）に示す斜線部の左端（又は右端）の小ブロックの下地補正データＬＵｉ，ｊと同一の値を設定する。例えば、図１０（ｂ）において、領域Ｒ３内の小ブロックＳＢ６に含まれる画素に対する下地補正データＬＵｉ，ｊは斜線部内の小ブロックＳＢ７に含まれる画素の下地補正データＬＵｉ，ｊと同一の値が設定され、領域Ｒ３内の小ブロックＳＢ８に含まれる画素に対する下地補正データＬＵｉ，ｊは、斜線部内の小ブロックＳＢ９に含まれる画素の下地補正データＬＵｉ，ｊと同一の値が設定される。
【００６７】
このようにして、補正部３８は、画像全体（１５３６画素（縦方向）×２０４８画素（横方向））の画素に対する下地補正データＬＵｉ，ｊを求める。
【００６８】
また、補正部３８は、後述するＹデータの先鋭化処理と、下地補正データＬＵｉ，ｊを用いた画像データの補正（下地とばし処理）とを行なう。すなわち、補正部３８は、図１１に示すフィルタを用いて各画素のＹデータに先鋭化処理を施す。具体的には、注目画素ＰＥｉ，ｊのＹデータＹｉ，ｊについて、画素ＰＥ（ｉ−１），ｊのＹデータＹ（ｉ−１），ｊ、画素ＰＥ（ｉ＋１），ｊのＹデータＹ（ｉ＋１），ｊ、画素ＰＥｉ，（ｊ−１）のＹデータＹｉ，（ｊ−１）及び画素ＰＥｉ，（ｊ＋１）のＹデータＹｉ，（ｊ＋１）を用いて下記の（３）式によって補正する。
Ｙｉ，ｊ←２×Ｙｉ，j−（Ｙ（ｉ−１），ｊ＋Ｙ（ｉ＋１），ｊ＋Ｙｉ，（ｊ−１）＋Ｙｉ，（ｊ＋１））／４（３）
ただし、使用するフィルタは図１１に示すフィルタに限定されず他の種々のフィルタが使用可能である。また、この処理は省略してもよい。
【００６９】
そして、補正部３８は、図１２に示す補正曲線を使用して、各画素のＹデータＹｉ，ｊを補正する。すなわち、ＹデータＹｉ，ｊが下地補正データＬＵｉ，ｊ以上か否か判断し、下地補正データＬＵｉ，ｊ以上の場合には、Ｙｉ，ｊを「２５５」（２５６階調の最大階調）とし、ＹデータＹｉ，ｊが下地補正データＬＵｉ，ｊ未満の場合には、ＹデータＹｉ，ｊに（２５５／ＬＵｉ，ｊ）を乗じて、新しいＹデータＹｉ，ｊを得る。
【００７０】
この処理によって、輝度Ｙデータが下地補正データの値以上の場合には、輝度が最大値とされるため、例えば照度不足によって下地が黒ずんでいる場合等において、下地を白色化する下地とばし処理が行なわれ、鮮明な文書画像データとすることができる。
【００７１】
後処理部３９は、以下に述べる黒レベル引き締め処理と、彩度強調処理と、ＲＧＢ変換処理とを行なうものである。
【００７２】
すなわち、後処理部３９は、補正部３８によって得られたＹデータＹｉ，ｊに対して黒レベル引き締め処理を施す。黒レベル引き締め処理では、図１３に示す補正曲線に基づいて画素毎の輝度データであるＹデータＹｉ，ｊを補正する。具体的には、ＹデータＹｉ，ｊが、所定階調（ここでは１４４階調）以下であるか否か判断し、１４４階調以下である場合には、ＹデータＹｉ，ｊを零とし、１４４階調以上である場合には、補正曲線に基づいてＹデータＹｉ，ｊを補正する。ＹデータＹｉ，ｊが、所定階調（ここでは１４４階調）以下である場合には、ＹデータＹｉ，ｊが零とされるため、例えば、照度過多で文字及び図形部分の輝度が高くなり、下地との境界が判別し難くなっている場合等においても、この処理を施すことによって、文字及び図形部分の輝度が零とされるため、鮮明な文書画像データとすることができる。
【００７３】
また、後処理部３９は、下記の（４−１）〜（４−６）式によって、彩度が低い（Ｃｒ，Ｃｂの値が小さい）画素程、彩度を強調する程度が大きくなるように彩度の補正を行なう彩度強調処理を施す。
Ｃｒ←Ｃｒ×ＥｍｐＬｖ／Ｍａｘ（Ｚ，Ｃ）（４−１）
Ｃｂ←Ｃｂ×ＥｍｐＬｖ／Ｍａｘ（Ｚ，Ｃ）（４−２）
ここで、
Ｚ＝（Ｃｒ＋Ｃｂ）／２（４−３）
Ｃ＝７０（４−４）
Ｇａｍｍａ（Ｚ）＝Ｃ＋Ｚ×（２５５−Ｃ）／２５５（４−５）
ＥｍｐＬｖ＝Ｍａｘ（Ｇａｍｍａ（Ｚ）−Ｙ／４，Ｚ）（４−６）
だだし、Ｍａｘ（α，β）は、α及びβの内、大きい方の値を返す関数である。
【００７４】
更に、後処理部３９は、下記の（５−１）〜（５−３）式によって、Ｙ，Ｃｒ，Ｃｂデータからなる画像データをＲ，Ｇ，Ｂデータからなる画像データに変換するＲＧＢ変換処理を施す。なお、（５−１）〜（５−３）式の結果値のＬＵＴ（ルックアップテーブル）を備える形態でもよい。
Ｒ＝Ｙ＋Ｃｒ（５−１）
Ｇ＝Ｙ−０．５１Ｃｒ−０．１９Ｃｂ（５−２）
Ｂ＝Ｙ＋Ｃｂ（５−３）
つぎに、図１４に示すフローチャートを参照して、文書画像データ補正部３の動作について説明する。まず、前処理部３０によって、Ｒ，Ｇ，Ｂデータからなる画像データがＹ，Ｃｒ，Ｃｂデータからなる画像データに変換される（ステップ＃１）。ついで、第１分割部３１によって、画像全体が横方向に１６個の縦長エリアＡＲｋ（ｋ＝１〜１６）に分割される（ステップ＃３）。そして、第１下地算出部３４によって、縦長エリアＡＲｋに含まれる画素の画像データから縦長エリアＡＲｋ毎に下地の下地補正データＬＡｋ（ｋ＝１〜１６）が求められる（ステップ＃５）。
【００７５】
つぎに、第２分割部３２によって、画像全体が縦方向に１２個の横長エリアＢＲｈ（ｈ＝１〜１２）に分割される（ステップ＃７）。そして、第２下地算出部３５によって、横長エリアＢＲｈに含まれる画素の画像データから横長エリアＢＲｈ毎に下地の下地補正データＬＢｈ（ｈ＝１〜１２）が求められる（ステップ＃９）。
【００７６】
ついで、第３分割部３３によって、第１エリアＡＲ１ｋが縦方向に１２個のブロックＣＲｋ，ｈ（ｋ＝１〜１６、ｈ＝１〜１２）に分割される（ステップ＃１１）。そして、第３下地算出部３６によって、ブロックＣＲｋ，ｈに含まれる画素の画像データからブロックＣＲｋ，ｈ毎に高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈ（ｋ＝１〜１６、ｈ＝１〜１２）が求められる（ステップ＃１３）。
【００７７】
つぎに、第４下地算出部３７によって、下地補正データＬＡｋ、下地補正データＬＢｈ、高輝度側下地補正データＬＣＨｋ,ｈ及び低輝度側下地補正データＬＣＬｋ,ｈを用いてブロックＣＲｋｈ毎に下地補正データＬＤｋ，ｈ（ｋ＝１〜１６、ｈ＝１〜１２）が求められる（ステップ＃１５）。
【００７８】
ついで、補正部３８によって、Ｙデータの先鋭化処理と、下地補正データＬＵｉ，ｊを用いた画像データの補正（下地とばし処理）とが施される（ステップ＃１７）。さらに、後処理部３９によって、黒レベル引き締め処理と、彩度強調処理と、ＲＧＢ変換処理とが行なわれる（ステップ＃１９、２１、２３）。
【００７９】
このようにして、本実施形態では、ブロック毎の情報に、そのブロックの画素が含まれる縦長エリア（及びその左右の縦長エリア）の情報と、そのブロックの画素が含まれる横長エリア（及びその上下の横長エリア）の情報とが加味されて補正された結果得られる下地補正データＬＤｋ，ｈを用いて画像データの補正を行なうようにしたので、局所性及び方向性に対する依存度が軽減された適正な下地補正が行なわれる。
【００８０】
なお、文書画像データ補正部３の各機能部は、本発明の文書画像処理プログラムをＣＰＵ等で実行することによって実現される形態でもよい。
【００８１】
また、本発明は以下の形態をとることができる。
【００８２】
（Ａ）本実施形態においては、ディジタルカメラによって画像データが生成される場合について説明したが、その他の種類の撮像装置よって画像データが生成される形態でもよい。例えば、ディジタルビデオカメラによって画像データが生成される形態でもよい。この場合には、動画を構成する各コマの画像データに対して本発明の画像データの補正処理を施す必要がある。
【００８３】
また、ビデオテープ等の記録媒体にアナログデータとして画像信号を格納するビデオカメラによって撮像する形態でもよい。この場合には、ビデオカメラによって生成された画像信号（アナログ信号）を画像データ（ディジタル信号）に変換するキャプチャーボード等のＡ／Ｄ変換器が必要となると共に、動画を構成する各コマの画像データに対して本発明の画像データの補正処理を施す必要がある。
【００８４】
（Ｂ）本実施形態においては、画像データが画像データ記録部によって記録媒体に格納される場合について説明したが、画像データがインターネット等の通信手段によってパーソナルコンピュータ等の通信端末に伝送される形態でもよい。なお、この場合には、パーソナルコンピュータ等の通信端末において、本発明の画像データの補正処理を実行する形態でもよい。
【００８５】
（Ｃ）本実施形態においては、全体画像を縦方向及び横方向に分割する場合について説明したが、他の異なる２方向に分割する形態でもよいし、用途によっては２方向のなす角は直角には限定されない。これによれば、それぞれの目的に合った処理が可能となる。
【００８６】
（Ｄ）本実施形態においては、Ｙデータを用いて下地とばし処理を行なう場合について説明したが、他のデータ（例えばＧデータ）を用いて下地とばし処理を行なう形態でもよい。この場合には、Ｒ，Ｇ，ＢデータとＹ，Ｃｒ，Ｃｂデータと間の変換処理を省略することができる。
【００８７】
（Ｅ）本実施形態においては、第３下地補正データが高輝度側下地補正データ及び低輝度側下地補正データからなる場合について説明したが、第３下地補正データが高輝度側下地補正データである形態でもよい。この場合には、処理が簡単になる。また、高輝度側下地補正データに代えて、最大度数のクラスの６４階調データを４倍したものを用いる形態でもよい。
【００８８】
（Ｆ）本実施形態においては、彩度強調処理、先鋭化処理及び黒レベル引き締め処理を行なう場合について説明したが、これらの処理は本発明の付帯的処理であるため、これらの処理の内少なくとも１つを省略する形態でもよい。
【００８９】
【発明の効果】
請求項１、２、４に記載の発明によれば、ブロックに含まれる画像データの特徴に、当該ブロックを含む第１及び第２エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データを得ることができる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正を行なうことができ、下地部分に対してより鮮明な画像データを得ることができる。
【００９０】
請求項３に記載の発明によれば、選択手段によって、外部から文書画像データであるか否かの選択が受け付けられるため、文書画像であるか否かの判別を確実に行なうことができ、文書画像データであるか否かの判別処理を不要とすることができる。更に、文書画像である場合の他、他種の画像、例えば写真画像に対しても、適正な補正処理を適用可能とすることができる。
【図面の簡単な説明】
【図１】本発明に係る一実施形態であるディジタルカメラの主要部の構成を示すブロック図である。
【図２】画像データ生成部の主要部の構成を示すブロック図である。
【図３】第１分割部による画像の分割方法の説明図である。
【図４】第２分割部による画像の分割方法の説明図である。
【図５】第３分割部による画像の分割方法の説明図である。
【図６】Ｙデータのヒストグラムの一例である。
【図７】Ｙデータのヒストグラムの一例である。
【図８】線形内挿法の説明図である。
【図９】下地補正データの算出方法の説明図である。
【図１０】下地補正データの算出方法の説明図である。
【図１１】先鋭化処理に用いられるフィルタの一例である。
【図１２】下地とばし処理に用いる補正曲線の一例である。
【図１３】黒レベル引き締め処理に用いる補正曲線の一例である。
【図１４】文書画像データ補正部の動作を説明するためのフローチャートの一例である。
【図１５】従来の下地とばし処理に用いる補正曲線の一例である。
【符号の説明】
１画像データ生成部
２選択部
３文書画像データ補正部
３０前処理部
３１第１分割部（第１分割手段）
３２第２分割部（第２分割手段）
３３第３分割部（第３分割手段）
３４第１下地算出部（第１下地算出手段）
３５第２下地算出部（第２下地算出手段）
３６第３下地算出部（第３下地算出手段）
３７第４下地算出部（第４下地算出手段）
３８補正部
３９後処理部
４画像データ記録部

Claims

撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理装置であって、文書画像全体を第１の方向について第１の所定数の第１エリアに分割する第１分割手段と、
文書画像全体を前記第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割する第２分割手段と、
前記第１エリアを前記第２の方向について前記第２分割手段による画像の分割位置と一致する位置で前記第２の所定数のブロックに分割する第３分割手段と、前記第１エリアに含まれる画素の画像データから前記第１エリア毎に下地の第１下地補正データを求める第１下地算出手段と、
前記第２エリアに含まれる画素の画像データから前記第２エリア毎に下地の第２下地補正データを求める第２下地算出手段と、
前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第３下地補正データを求める第３下地算出手段と、
前記第１下地補正データ、第２下地補正データ及び第３下地補正データを用いて前記ブロック毎に第４下地補正データを求める第４下地算出手段とを備えることを特徴とする文書画像処理装置。
被写体の画像データを生成する画像データ生成手段と、
画像全体を第１の方向について第１の所定数の第１エリアに分割する第１分割手段と、
画像全体を前記第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割する第２分割手段と、
前記第１エリアを前記第２の方向について前記第２分割手段による画像の分割位置と一致する位置で前記第２の所定数のブロックに分割する第３分割手段と、
前記第１エリアに含まれる画素の画像データから前記第１エリア毎に下地の第１下地補正データを求める第１下地算出手段と、
前記第２エリアに含まれる画素の画像データから前記第２エリア毎に下地の第２下地補正データを求める第２下地算出手段と、
前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第３下地補正データを求める第３下地算出手段と、
前記第１下地補正データ、第２下地補正データ及び第３下地補正データを用いて前記ブロック毎に第４下地補正データを求める第４下地算出手段とを備えることを特徴とする撮像装置。
外部から文書画像データであるか否かの選択を受け付ける選択手段を更に備えることを特徴とする請求項２に記載の撮像装置。
撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理プログラムであって、コンピュータを、文書画像全体を第１の方向について第１の所定数の第１エリアに分割する第１分割手段と、
文書画像全体を前記第１の方向と異なる第２の方向について第２の所定数の第２エリアに分割する第２分割手段と、
前記第１エリアを前記第２の方向について前記第２分割手段による画像の分割位置と一致する位置で前記第２の所定数のブロックに分割する第３分割手段と、前記第１エリアに含まれる画素の画像データから前記第１エリア毎に下地の第１下地補正データを求める第１下地算出手段と、
前記第２エリアに含まれる画素の画像データから前記第２エリア毎に下地の第２下地補正データを求める第２下地算出手段と、
前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第３下地補正データを求める第３下地算出手段と、
前記第１下地補正データ、第２下地補正データ及び第３下地補正データを用いて前記ブロック毎に第４下地補正データを求める第４下地算出手段として機能させることを特徴とする文書画像処理プログラム。