JP3697464B2 - 文書画像処理装置、撮像装置及び文書画像処理プログラム - Google Patents

文書画像処理装置、撮像装置及び文書画像処理プログラム Download PDF

Info

Publication number
JP3697464B2
JP3697464B2 JP2002051397A JP2002051397A JP3697464B2 JP 3697464 B2 JP3697464 B2 JP 3697464B2 JP 2002051397 A JP2002051397 A JP 2002051397A JP 2002051397 A JP2002051397 A JP 2002051397A JP 3697464 B2 JP3697464 B2 JP 3697464B2
Authority
JP
Japan
Prior art keywords
background
correction data
data
background correction
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002051397A
Other languages
English (en)
Other versions
JP2003256773A (ja
Inventor
大作 保理江
Original Assignee
コニカミノルタフォトイメージング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニカミノルタフォトイメージング株式会社 filed Critical コニカミノルタフォトイメージング株式会社
Priority to JP2002051397A priority Critical patent/JP3697464B2/ja
Publication of JP2003256773A publication Critical patent/JP2003256773A/ja
Application granted granted Critical
Publication of JP3697464B2 publication Critical patent/JP3697464B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Studio Devices (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、撮像装置で撮影された文書画像の画像データを補正する技術に関するものである。
【0002】
【従来の技術】
被写体のディジタル画像データを生成するディジタル撮像装置は、被写体とディジタル撮像装置との距離、照明条件等の撮像条件が予め設定されている密着型と撮像条件が自由に変化するオープン型とに大別される。ディジタルカメラ等のオープン型のディジタル撮像装置は、画像処理により撮影された画像の画質を自在に制御できることから、撮影の目的や被写体の種類の応じて撮影画像の画質の処理を適正に行なうことによって、通常の銀塩フィルムに撮影するカメラと比較してより好適な画質の画像を取り込むことができるという利点がある。このため、通常の写真撮影のためだけでなく、例えば会議場でホワイトボードに書かれた文字、図形等の文書情報を写し取るための機器として利用されている。
【0003】
一方、ディジタルカメラで文字や図形等が書かれたホワイトボードを撮影する場合には、ホワイトボード上の文書には照度ムラや文字または図形の掠れ等が発生するため、鮮明な画質の画像が得られにくい。そこで、このような撮影で得られた画像データに対して、白地部分(ホワイトボードの部分)を本来の白色に変更する(白く飛ばす)ことで文書情報部分(文字や図形の部分)の鮮明度を高める補正を行なうことが望ましい。
【0004】
上記の画像データの補正方法として、特開2001−45244号公報に開示されているように、1ライン毎に当該ラインに含まれる画素の画像データのピーク値(最大輝度値)を使用して1ライン毎に補正を行なう方法が知られている。この方法では、1ラインという局所的な情報によって1ライン毎に補正が行なわれるため、補正の精度が不充分であった。例えば、ホワイトボードに予め印刷されている格子線に含まれるラインについては、ピーク値が格子線の輝度に影響され、充分な補正が行なわれない場合がある。
【0005】
【発明が解決しようとする課題】
出願人は、全体画像を複数の小画像(ブロックという)に分割して小画像毎に各小画像の画像データに基づいて補正する方法を提案した(特開平10−210354)。この方法は、各ブロックの画像データの内、輝度への寄与の大きい緑色成分についてレベル分布のヒストグラムを作成し、最大度数の階級を白色飽和レベルWとして設定して、当該ブロックの画像データの緑色成分を図15に示すように白色飽和レベルWで出力レベルを飽和させる補正曲線を用いて補正するものである。
【0006】
この方法によれば、1ライン毎に補正する場合と比較して補正に使用する情報の局所性が軽減されるため、補正の精度が向上する。しかし、この方法は、ブロック毎に異なる補正曲線を用いて画像データが補正されるため、ブロック内の画像全体が暗く且つ文字(又は図形)の密度が多い場合に補正が過度に行なわれる場合が有った。さらに、1ライン毎に補正する場合と比較して局所性は軽減されるが、軽減の程度が充分ではなく、画像データの補正の精度を更に向上する必要がある場合があった。
【0007】
本発明は、上記の課題に鑑みてなされたもので、撮像装置で撮影された文書画像の画像データを補正するための適正な補正データを求める文書画像処理装置、撮像装置及び文書画像処理プログラムを提供することを目的としている。
【0008】
【課題を解決するための手段】
請求項1に記載の文書画像処理装置は、撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理装置であって、文書画像全体を第1の方向について第1の所定数の第1エリアに分割する第1分割手段と、文書画像全体を前記第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割する第2分割手段と、前記第1エリアを前記第2の方向について前記第2分割手段による画像の分割位置と一致する位置で前記第2の所定数のブロックに分割する第3分割手段と、前記第1エリアに含まれる画素の画像データから前記第1エリア毎に下地の第1下地補正データを求める第1下地算出手段と、前記第2エリアに含まれる画素の画像データから前記第2エリア毎に下地の第2下地補正データを求める第2下地算出手段と、前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第3下地補正データを求める第3下地算出手段と、前記第1下地補正データ、第2下地補正データ及び第3下地補正データを用いて前記ブロック毎に第4下地補正データを求める第4下地算出手段とを備えることを特徴としている。
【0009】
上記の構成によれば、第1分割手段によって、文書画像全体が第1の方向について第1の所定数の第1エリアに分割され、第1下地算出手段によって、この第1エリアに含まれる画素の画像データから第1エリア毎に下地の第1下地補正データが求められる。また、第2分割手段によって、文書画像全体が第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割され、第2下地算出手段によって、この第2エリアに含まれる画素の画像データから第2エリア毎に下地の第2下地補正データが求められる。さらに、第3分割手段によって、第1エリアが第2の方向について第2分割手段による画像の分割位置と一致する位置で第2の所定数のブロックに分割され、第3下地算出手段によって、このブロックに含まれる画素の画像データからブロック毎に下地の第3下地補正データが求められる。そして、第4下地算出手段によって、第1下地補正データ、第2下地補正データ及び第3下地補正データを用いてブロック毎に第4下地補正データが求められる。
【0010】
このようにして、第4下地補正データは、第1エリアに含まれる画素の画像データから求められる第1下地補正データと、第2エリアに含まれる画素の画像データから求められる第2下地補正データと、ブロックに含まれる画素の画像データから求められる第3下地補正データとを用いて求められるため、当該ブロックに含まれる画像データの特徴(照度、文字や図形の密度等)が反映され、且つ、第1又は第2エリアに含まれる周囲の画像データの特徴も反映された適正な下地補正データ(第4下地補正データ)が得られる。
【0011】
すなわち、ブロックに含まれる画像データの特徴に、当該ブロックを含む第1及び第2エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データが得られることになる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正が行なわれ、下地部分に対してより鮮明な文書画像データが得られる。
【0012】
請求項2に記載の撮像装置は、被写体の画像データを生成する画像データ生成手段と、画像全体を第1の方向について第1の所定数の第1エリアに分割する第1分割手段と、画像全体を前記第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割する第2分割手段と、前記第1エリアを前記第2の方向について前記第2分割手段による画像の分割位置と一致する位置で前記第2の所定数のブロックに分割する第3分割手段と、前記第1エリアに含まれる画素の画像データから前記第1エリア毎に下地の第1下地補正データを求める第1下地算出手段と、前記第2エリアに含まれる画素の画像データから前記第2エリア毎に下地の第2下地補正データを求める第2下地算出手段と、前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第3下地補正データを求める第3下地算出手段と、前記第1下地補正データ、第2下地補正データ及び第3下地補正データを用いて前記ブロック毎に第4下地補正データを求める第4下地算出手段とを備えることを特徴としている。
【0013】
上記の構成によれば、画像データ生成手段によって、被写体の画像データが生成される。そして、第1分割手段によって、この画像全体が第1の方向について第1の所定数の第1エリアに分割され、第1下地算出手段によって、この第1エリアに含まれる画素の画像データから第1エリア毎に下地の第1下地補正データが求められる。また、第2分割手段によって、画像全体が第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割され、第2下地算出手段によって、この第2エリアに含まれる画素の画像データから第2エリア毎に下地の第2下地補正データが求められる。さらに、第3分割手段によって、第1エリアが第2の方向について第2分割手段による画像の分割位置と一致する位置で第2の所定数のブロックに分割され、第3下地算出手段によって、このブロックに含まれる画素の画像データからブロック毎に下地の第3下地補正データが求められる。そして、第4下地算出手段によって、第1下地補正データ、第2下地補正データ及び第3下地補正データを用いてブロック毎に第4下地補正データが求められる。
【0014】
このようにして、第4下地補正データは、第1エリアに含まれる画素の画像データから求められる第1下地補正データと、第2エリアに含まれる画素の画像データから求められる第2下地補正データと、ブロックに含まれる画素の画像データから求められる第3下地補正データとを用いて求められるため、被写体が文書(文字や図形等)が書かれたホワイトボード等である場合に、当該ブロックに含まれる画像データの特徴(照度、文字や図形の密度等)が反映され、且つ、第1又は第2エリアに含まれる周囲の画像データの特徴も反映された適正な下地補正データ(第4下地補正データ)が得られる。
【0015】
すなわち、ブロックに含まれる画像データの特徴に、当該ブロックを含む第1及び第2エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データが得られることになる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正が行なわれ、下地部分に対してより鮮明な文書画像データが得られる。
【0016】
請求項3に記載の撮像装置は、請求項2に記載の撮像装置であって、外部から文書画像データであるか否かの選択を受け付ける選択手段を更に備えることを特徴としている。
【0017】
上記の構成によれば、選択手段によって、外部から文書画像データであるか否かの選択が受け付けられるため、文書画像であるか否かの判別が確実に行なわれ、文書画像データであるか否かの判別処理が不要となる。更に、文書画像である場合の他、他種の画像、例えば写真画像に対しても、適正な補正処理が適用可能となる。
【0018】
請求項4に記載の文書画像処理プログラムは、撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理プログラムであって、コンピュータを、文書画像全体を第1の方向について第1の所定数の第1エリアに分割する第1分割手段と、文書画像全体を前記第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割する第2分割手段と、前記第1エリアを前記第2の方向について前記第2分割手段による画像の分割位置と一致する位置で前記第2の所定数のブロックに分割する第3分割手段と、前記第1エリアに含まれる画素の画像データから前記第1エリア毎に下地の第1下地補正データを求める第1下地算出手段と、前記第2エリアに含まれる画素の画像データから前記第2エリア毎に下地の第2下地補正データを求める第2下地算出手段と、前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第3下地補正データを求める第3下地算出手段と、前記第1下地補正データ、第2下地補正データ及び第3下地補正データを用いて前記ブロック毎に第4下地補正データを求める第4下地算出手段として機能させることを特徴としている。
【0019】
上記のプログラムによれば、第1分割手段によって、文書画像全体が第1の方向について第1の所定数の第1エリアに分割され、第1下地算出手段によって、この第1エリアに含まれる画素の画像データから第1エリア毎に下地の第1下地補正データが求められる。また、第2分割手段によって、文書画像全体が第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割され、第2下地算出手段によって、この第2エリアに含まれる画素の画像データから第2エリア毎に下地の第2下地補正データが求められる。さらに、第3分割手段によって、第1エリアが第2の方向について第2分割手段による画像の分割位置と一致する位置で第2の所定数のブロックに分割され、第3下地算出手段によって、このブロックに含まれる画素の画像データからブロック毎に下地の第3下地補正データが求められる。そして、第4下地算出手段によって、第1下地補正データ、第2下地補正データ及び第3下地補正データを用いてブロック毎に第4下地補正データが求められる。
【0020】
このようにして、第4下地補正データは、第1エリアに含まれる画素の画像データから求められる第1下地補正データと、第2エリアに含まれる画素の画像データから求められる第2下地補正データと、ブロックに含まれる画素の画像データから求められる第3下地補正データとを用いて求められるため、当該ブロックに含まれる画像データの特徴(照度、文字や図形の密度等)が反映され、且つ、第1又は第2エリアに含まれる周囲の画像データの特徴も反映された適正な下地補正データ(第4下地補正データ)が得られる。
【0021】
すなわち、ブロックに含まれる画像データの特徴に、当該ブロックを含む第1及び第2エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データが得られることになる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正が行なわれ、下地部分に対してより鮮明な文書画像データが得られる。
【0022】
【発明の実施の形態】
図1は、本発明に係る一実施形態であるディジタルカメラの主要部の構成を示すブロック図である。
【0023】
図1に示すディジタルカメラは、文書等の被写体画像の画像データを生成する画像データ生成部1(画像データ生成手段に相当する)と、外部から文書画像データであるか否かの選択を受け付けるスライドスイッチ等からなる選択部2(選択手段に相当する)と、文書画像データの補正を行なう文書画像データ補正部3と、メモリカード等の記録媒体に画像データを格納する画像データ記録部4とを備える。
【0024】
図2は、画像データ生成部1の主要部の構成を示すブロック図である。画像データ生成部1は、被写体からの光を集光するレンズ11と、複数の受光素子が配列され、被写体からの光をそれぞれの受光素子で光電変換し、変換された電荷を蓄積するCCD(電荷結合素子)12と、CCD2を駆動するCCD駆動部13とを備える。
【0025】
撮像レンズ11は、例えば電動式のズームレンズである。レンズ駆動部111は、撮像レンズ11の合焦動作及びズーミング動作を行なう。撮像レンズ11の光軸L上の光束の結像位置には、露光制御用のメカニカルシャッタ112を介してCCD12が設けられている。なお、図示していないが、必要に応じて絞り、光学式ローパスフィルタ、赤外線カットフィルタ、又は光量調節用のNDフィルタ等が設けられている。
【0026】
CCD12の前面(被写体側)には、所定の(例えば、ベイヤー(Bayer)方式の)色配列を有する色フィルタ113(ここではR(赤)、G(緑)、B(青)の3原色からなる原色フィルタ)が配設されている。
【0027】
CCD12は、フォトダイオードからなる受光素子がマトリクス状に配列されたインタライン転送型CCDである。また、CCD12はタイミングジェネレータ131から出力される制御信号に応じて残留電荷の放出等の所定の動作を行ない、入射される光を光電変換し、更に露光時間に亘って得た蓄積電荷を画像信号として信号処理部132へ出力する。
【0028】
信号処理部132は、CCD12から出力された信号を相関二重サンプリング処理やA/D変換処理等の信号処理を施し、ディジタル化された画像データとして文書画像データ補正部3に出力するものである。なお、この画像データは受光素子に対応する個数の集合として得られ、ここでは、R,G,B色それぞれについて1画像当たり3145728画素(=1536画素(縦方向)×2048画素(横方向))分だけ出力される。
【0029】
文書画像データ補正部3は、R,G,Bデータからなる画像データを後述するY,Cr,Cbデータからなる画像データに変換する前処理部30と、画像全体を第1の方向(ここでは横方向)に所定数(ここでは16個)に分割して縦長エリアARk(k=1〜16)(図3参照)を形成する第1分割部31(第1分割手段に相当する)と、画像全体を第1の方向と異なる第2の方向(ここでは縦方向)に所定数(ここでは12個)に分割して横長エリアBRh(h=1〜12)(図4参照)を形成する第2分割部32(第2分割手段に相当する)と、第2分割部32による画像の分割位置と一致する位置で縦長エリアARkを第2の方向(ここでは縦方向)に12個のブロックCRk,h(k=1〜16、h=1〜12)(図5参照)に分割する第3分割部33(第3分割手段に相当する)とを備えると共に、縦長エリアARkに含まれる画素の画像データから縦長エリアARk毎に下地の下地補正データLAk(k=1〜16)を求める第1下地算出部34(第1下地算出手段に相当する)と、横長エリアBRhに含まれる画素の画像データから横長エリアBRh毎に下地の下地補正データLBh(h=1〜12)を求める第2下地算出部35(第2下地算出手段に相当する)と、ブロックCRk,hに含まれる画素の画像データからブロックCRk,h毎に高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,h(k=1〜16、h=1〜12)(第3下地補正データに相当する)を求める第3下地算出部36(第3下地算出手段に相当する)とを備え、更に、下地補正データLAk、下地補正データLBh、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを用いてブロックCRk,h毎に下地補正データLDk,h(k=1〜16、h=1〜12)を求める第4下地算出部37(第4下地算出手段に相当する)と、下地補正データLDk,hに基づいて画像データを補正する補正部38と、種々の後処理を行なう後処理部39とを備える。
【0030】
前処理部30は、以下に示す色変換のための(1−1)〜(1−3)式に従って、R,G,Bデータからなる画像データをY,Cr,Cbデータからなる画像データに変換するものである。なお、(1−1)〜(1−3)式の結果値のLUT(ルックアップテーブル)を備える形態でもよい。
Y=0.3R+0.59G+0.11B (1−1)
Cr=R−Y (1−2)
Cb=B−Y (1−3)
なお、(1−1)式で求められるYデータは輝度データである。また、ここでは、Yデータは256階調のデータであるものとする。以降の画像処理においては、Y,Cr,Cbデータが用いられる。
【0031】
第1分割部31は、図3に示すように、縦方向1536画素、横方向2048画素からなる全体画像データを、横方向にそれぞれ縦方向1536画素、横方向128画素からなる16個の縦長エリアARk(k=1〜16)に分割するものである。
【0032】
第2分割部32は、図4に示すように、縦方向1536画素、横方向2048画素からなる全体画像データを、縦方向にそれぞれ縦方向128画素、横方向2048画素からなる12個の横長エリアBRh(h=1〜12)に分割するものである。
【0033】
第3分割部33は、図5に示すように、縦方向1536画素、横方向128画素からなる16個の縦長エリアARk(k=1〜16)を、第2分割部32による画像の分割位置と一致する位置で縦方向にそれぞれ縦方向128画素、横方向128画素からなる12個のブロックCRk,h(k=1〜16、h=1〜12)に分割するものである。なお、ブロックCRk,hは、縦長エリアARkと横長エリアBRhとの共通画素の集合である。すなわち、ブロックCRk,hに含まれる画素は、縦長エリアARk及び横長エリアBRhの両方に含まれる画素である。
【0034】
第1下地算出部34は、縦長エリアARk(k=1〜16)毎の下地補正データLAk(k=1〜16)を求めるもので、以下の各処理を実行する。すなわち、第1下地算出部34は、縦長エリアARkについて、縦方向及び横方向共に所定画素毎(ここでは、8画素毎)にYデータを抽出し、その値を1/4倍して64階調データとして求めると共に、図6に示すように各階調毎のクラスでヒストグラムを作成し、このヒストグラム中より最大度数のクラスの64階調データを抽出し、且つ、4倍して(256階調データに戻して)下地補正データLAk(k=1〜16)を得る。
【0035】
また、第1下地算出部34は、縦長エリアARk(k=1〜16)毎に、注目縦長エリアARkと隣接する第1エリアAR(k−1)、AR(k+1)との下地補正データLAk、LA(k−1)、LA(k+1)の中央値を注目縦長エリアARkの下地補正データLAkとして求める(この処理を、平均化処理という)。更に、16個の下地補正データLAkから、最大のデータと最小のデータとを除いた14個のデータを抽出し、その平均値である縦長エリア平均値LAAVを求める。なお、左右両端の縦長エリアAR1、AR16の下地補正データLA1及びLA16と縦長エリア平均値LAAVとの差がそれぞれ所定階調(ここでは50階調)以上である場合には、下地補正データLA2を下地補正データLA1に代入し、下地補正データLA15を下地補正データLA16に代入する(この処理を端部処理という)。
【0036】
ここで、8画素毎のYデータを使用するのは、全画素を使用する場合と比較して、ヒストグラムの作成に使用するデータ数を削減することによって計算時間を削減するためである。また、Yデータを1/4倍した64階調データを使用するのは、ヒストグラムを作成するための集計計算に要する時間を削減するためである。なお、ここでは、8画素毎のデータを使用しているが、必ずしもこれに限定されるものではなく、計算時間と計算精度との関係で、適宜何画素毎の(又は全画素の)データを使用するかを設定することが可能である。また、ここでは、Yデータを1/4倍した64階調データを使用しているが、必ずしもこれに限定されるものではなく、計算時間と計算精度との関係で、適宜Yデータを何倍(1倍を含む)したデータを使用するかを設定することが可能である。
【0037】
ここで、平均化処理を施しているのは、隣接する縦長エリアARkの下地補正データLAk間の差が過大になることを防止するためである。また、端部処理を施しているのは、全体画像データの端部には、文書画像以外の画像(例えば背景画像)等の画像データが含まれている場合があり、この画像データが文書画像データの補正に影響を与えることを防止するためである。
【0038】
第2下地算出部35は、横長エリアBRh(h=1〜12)毎の下地補正データLBh(h=1〜12)を求めるもので、以下の各処理を実行する。すなわち、第2下地算出部35は、横長エリアBRhについて、縦方向及び横方向共に所定画素毎(ここでは、8画素毎)にYデータを抽出し、その値を1/4倍して64階調データとして求めると共に、図6に示すように各階調毎のクラスでヒストグラムを作成し、このヒストグラム中より最大度数のクラスの64階調データを抽出し、且つ、4倍して(256階調データに戻して)下地補正データLBh(h=1〜12)を得る。
【0039】
また、第2下地算出部35は、横長エリアBRh(h=1〜12)毎に、注目第2エリアBRhと隣接する横長エリアBR(h−1)、BR(h+1)との下地補正データLBh、LB(h−1)、LB(h+1)の中央値を注目横長エリアBRhの下地補正データLBhとして求める。更に、12個の下地補正データLBhから、最大のデータと最小のデータとを除いた10個のデータを抽出し、その平均値である横長エリア平均値LBAVを求める。なお、左右両端の横長エリアBR1、BR12の下地補正データLB1及びLB12と横長エリア平均値LBAVとの差がそれぞれ所定階調(ここでは50階調)以上である場合には、下地補正データLB2を下地補正データLB1に代入し、下地補正データLB11を第2下地補正データLB12に代入する。
【0040】
第3下地算出部36は、ブロックCRk,h(k=1〜16、h=1〜12)毎の高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,h(k=1〜16、h=1〜12)(第3下地補正データに相当する)を求める以下の処理を行なう。すなわち、第3下地算出部36は、ブロックCRk,hについて、縦方向及び横方向共に所定画素毎(ここでは、8画素毎)にYデータを抽出し、その値を1/4倍して64階調データとして求めると共に、図7に示すように各階調毎のクラスでヒストグラムを作成する。
【0041】
また、第3下地算出部36は、このヒストグラムについて、高輝度側から次の▲1▼及び▲2▼の2条件を満たすクラスを検索し、該当するクラス(第1クラスという)の64階調データを4倍して(256階調データに戻して)、高輝度側下地補正データLCHk,hを得る。
▲1▼度数>TH1
▲2▼度数が、そのクラスより低輝度側の3クラスの度数より大きい。
ここで、閾値TH1は、ここでは32(=128×128÷64÷8)であって、ヒストグラムを作成する対象とした画素のYデータが全クラスに均一に分布している場合の各クラスの度数である。
【0042】
更に、第3下地算出部36は、このヒストグラムについて、第1クラスから低輝度側に向けて次の▲3▼〜▲5▼の3条件を満たすクラスを検索し、該当するクラスの64階調データを4倍して(256階調データに戻して)低輝度側下地補正データLCLk,hを得る。
▲3▼度数>TH2
▲4▼度数が、そのクラスより高輝度側のクラスの度数より大きい。
▲5▼度数が、そのクラスより低輝度側の3クラスの度数より全て大きい。
ここで、閾値TH2は、閾値TH1と同様に32である。
【0043】
第4下地算出部37は、下地補正データLAk、下地補正データLBh、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを用いて、ブロックCRk,h毎の下地補正データLDk,hを求めるもので、以下の各処理を実行する。
【0044】
すなわち、第4下地算出部37は、ブロックCRk,hについて、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを、そのブロックの画素を含む縦長エリアARkの下地補正データLAkと比較し、下地補正データLAkの値に近い方を縦方向下地補正データLDAk,hとして設定する。
【0045】
ただし、縦方向下地補正データLDAk,hと下地補正データLAkとの差が予め設定されている所定値(ここでは60階調)以上である場合には、下地補正データLAkが縦方向下地補正データLDAk,hとされる。縦方向下地補正データLDAk,hと下地補正データLAkとの差が比較の結果、予め設定されている所定値の範囲(ここでは、40〜59階調)である場合には、下地補正データLAkと縦方向下地補正データLDAk,hとの平均値が縦方向下地補正データLDAk,hとされる。
【0046】
例えば、高輝度側下地補正データLCHk,hが「160」、低輝度側下地補正データLCLk,hが「110」、下地補正データLAkが「230」である場合には、高輝度側下地補正データLCHk,hの方が低輝度側下地補正データLCLk,hより下地補正データLAkの値に近いため、高輝度側下地補正データLCHk,hが縦方向下地補正データLDAk,hとされる。そして、縦方向下地補正データLDAk,h(=160)と下地補正データLAkとの差(=80)が60階調以上であるため、下地補正データLAkが縦方向下地補正データLDAk,hとされる。その結果、縦方向下地補正データLDAk,hは「230」となる。
【0047】
また、例えば、高輝度側下地補正データLCHk,hが「180」、低輝度側下地補正データLCLk,hが「110」、下地補正データLAkが「230」である場合には、高輝度側下地補正データLCHk,hの方が低輝度側下地補正データLCLk,hより下地補正データLAkの値に近いため、高輝度側下地補正データLCHk,hが縦方向下地補正データLDAk,hとされる。そして、縦方向下地補正データLDAk,hと下地補正データLAkとの差(=50)が40〜59階調の範囲内であるため、下地補正データLAkと縦方向下地補正データLDAk,hとの平均値(=(230+180)/2)が縦方向下地補正データLDAk,hとされる。その結果、縦方向下地補正データLDAk,hは「205」となる。
【0048】
さらに、第4下地算出部37は、ブロックCRk,h毎に注目ブロックCRk,hとその上下左右ブロックの計5ブロックの縦方向下地補正データを抽出し、最大のものと最小のものを除く3ブロックの縦方向下地補正データの平均値を注目ブロックCRk,hの縦方向下地補正データLDAk,hとして求める。
【0049】
例えば、注目ブロックCRk,hの縦方向下地補正データLDAk,hが「200」、注目ブロックCRk,hの左側のブロックCRk,(h−1)の縦方向下地補正データLDAk,(h−1)が「210」、注目ブロックCRk,hの右側のブロックCRk,(h+1)の縦方向下地補正データLDAk,(h+1)が「220」、注目ブロックCRk,hの上側のブロックCR(k−1),hの縦方向下地補正データLDA(k−1),hが「190」、注目ブロックCRk,hの下側のブロックCR(k+1),hの縦方向下地補正データLDA(k+1),hが「210」である場合、注目ブロックCRk,hの縦方向下地補正データLDAk,hは「207」(=(200+210+210)/3)とされる。
【0050】
ただし、4隅のブロックCR1,1、CR1,12、CR16,1、CR16,12の縦方向下地補正データについては、上記平均化処理を行なわず、第1下地算出部34によって算出された縦長エリア平均値LAAVとの差が予め設定された所定値(ここでは50階調)以上である場合には、それぞれブロックCR2,2、CR2,11、CR15,2、CR15,11の縦方向下地補正データが代入される。
【0051】
このようにして、第4下地算出部37は、ブロックCRk,h毎に、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを下地補正データLAkを用いて補正することによって縦方向下地補正データLDAk,hを求める。すなわち、縦方向下地補正データLDAk,hは、ブロック毎の情報にそのブロックの画素が含まれる縦長エリア(及びその左右の縦長エリア)の情報が加味されて補正された結果得られることになる。
【0052】
更に、第4下地算出部37は、ブロックCRk,hについて、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを、そのブロックの画素を含む横長エリアBRhの下地補正データLBhと比較し、下地補正データLBhの値に近い方を横方向下地補正データLDBk,hとして設定する。
【0053】
ただし、横方向下地補正データLDBk,hと下地補正データLBhとの差が予め設定されている所定値(ここでは60階調)以上である場合には、下地補正データLBhを横方向下地補正データLDBk,hとされる。横方向下地補正データLDBk,hと下地補正データLBhとの差が予め設定されている所定値の範囲(ここでは、40〜59階調)である場合には、下地補正データLBhと横方向下地補正データLDBk,hとの平均値が横方向下地補正データLDBk,hとされる。
【0054】
また、第4下地算出部37は、ブロックCRk,h毎に注目ブロックCRk,hとその上下左右ブロックの計5ブロックの横方向下地補正データを抽出し、最大のものと最小のものを除く3ブロックの横方向下地補正データの平均値を注目ブロックCRk,hの横方向下地補正データLDBk,hとして求める。
【0055】
ただし、4隅のブロックCR1,1、CR1,12、CR16,1、CR16,12の横方向下地補正データについては、上記平均化処理を行なわず、第2下地算出部34によって算出された横長エリア平均値LBAVとの差が予め設定された所定値(ここでは50階調)以上である場合には、それぞれブロックCR2,2、CR2,11、CR15,2、CR15,11の横方向下地補正データが代入される。
【0056】
このようにして、第4下地算出部37は、ブロックCRk,h毎に、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを下地補正データLBhを用いて補正することによって横方向下地補正データLDBk,hを求める。すなわち、横方向下地補正データLDBk,hは、ブロック毎の情報にそのブロックの画素が含まれる横長エリア(及びその上下の横長エリア)の情報が加味されて補正された結果得られることになる。
【0057】
更に、第4下地算出部37は、上記の処理で得られた縦方向下地補正データLDAk,hと横方向下地補正データLDBk,hとの内、いずれか(ここでは小さい方)を下地補正データLDk,hとして設定する。小さい方を選択する場合には、画像データの輝度を高く(白色化の程度を強く)補正することができる。なお、上記のようにして求められた下地補正データLDk,hは、ブロック毎の情報に、そのブロックの画素が含まれる縦長エリア(及びその左右の縦長エリア)の情報と、そのブロックの画素が含まれる横長エリア(及びその上下の横長エリア)の情報とが加味されて補正された結果得られるものであるため、局所性及び方向性に対する依存度が軽減され適正な下地補正を行ない得る下地補正データLDk,hが得られる。
【0058】
補正部38は、第4下地算出部37によってブロックCRk,h毎に得られる下地補正データLDk,hを用いてYデータ(輝度データ)を画素毎に補正するもので、以下の各処理を実行する。
【0059】
すなわち、補正部38は、以下に述べるようにして画素毎にYデータの補正データLUi,j(i=1〜1536、j=1〜2048)(下地補正データという)を算出する。ここで、下地補正データLDk,hは、ブロックCRk,hの中心位置に仮想的にある画素に対する下地補正データとして使用される。そして、図8に示すように、各ブロックの中心位置に仮想的にある画素に対する下地補正データLDk,hに線形内挿法を適用し、これによって各画素に対する下地補正データLUi,jを求める。
【0060】
具体的には、ブロックCRk,hの中心位置Aと、ブロックCRk,(h+1)の中心位置Bと、ブロックCR(k+1),(h+1)の中心位置Cと、ブロックCR(k+1),hの中心位置Dとによって規定される正方形ABCDの内部にある画素Pに対する下地補正データWpを、ここでは、計算量の削減のため正方形ABCDの内部にある左上隅の画素を基準にして縦方向及び横方向共に所定画素(ここでは、4画素)毎に、次の(2)式によって求める(図8参照)。
Wp=(1−m)×[(1−n)×Wa+n×Wc]+m×[(1−n)×Wb+n×Wd] (2)
ただし、Wa=LDk,h、Wb=LDk,(h+1)、Wc=LD(k+1),(h+1)、Wd=LD(k+1),hであって、画素Pは正方形ABCDの辺ABを、m:(1−m)の比に内分し、辺ADを、n:(1−n)の比に内分する位置にある画素である。
【0061】
また、補正部38は、(2)式によって下地補正データLUi,jが計算されなかった画素に対する下地補正データLUi,jを以下の方法で求める。図9に示すように、(2)式によって下地補正データLUi,jが計算された画素を左上隅(図の斜線部)の画素とする縦方向及び横方向ともに4画素からなる正方形の領域内(小ブロックという)にある画素(16画素)の下地補正データLUi,jの値を、小ブロックの左上隅の画素に対する下地補正データLUi,jの値と同一の値に設定する。すなわち、小ブロック内の16画素に対しては同じ値の下地補正データLUi,jが設定される。
【0062】
このようにして求められる画素毎の下地補正データLUi,jは、画像全体(1536画素(縦方向)×2048画素(横方向))の内、図10(a)に示す斜線部の領域である。なぜなら、画素毎の下地補正データLUi,jを求めるために使用する下地補正データLDk,hは、それぞれ縦方向及び横方向ともに128画素からなるブロックCRk,h毎に求められるものであって、画素毎の下地補正データは、図8に示すように各ブロックの中心位置に仮想的にある画素に対する下地補正データLDk,hに画素線形内挿法を適用することによって求められるからである。
【0063】
そこで、補正部38は、画像全体(1536画素(縦方向)×2048画素(横方向))の内、外縁部から64番目までの画素については、以下の方法で、画素毎の下地補正データLUi,jを求める。すなわち、補正部38は、図10(a)に示すように画素毎の下地補正データLUi,jを求める領域を、4隅の領域R1(64画素×64画素×4箇所)と、上下端の領域R2(64画素×1920(=2048−128)画素×2箇所)と、左右端の領域R3(1408(=1536−128)画素×64画素×2箇所)とに分割する。なお、図10(b)は、画像全体の左上端近傍を拡大したものであって、最小の正方形が小ブロック(4画素×4画素)を表わしている。
【0064】
そして、補正部38は、領域R1内の画素に対する下地補正データLUi,jとして、図10(a)に示す斜線部の4隅の小ブロックの下地補正データLUi,jと同一の値を設定する。例えば、図10(b)に示す左上隅の領域R1内の画素に対する下地補正データLUi,jは、斜線部の領域の左上隅の小ブロックSB1に含まれる画素の下地補正データLUi,jと同一の値が設定される。
【0065】
また、補正部38は、領域R2内の画素に対する下地補正データLUi,jとして、当該画素が含まれる小ブロックと同一の列にあって、図10(a)に示す斜線部の上端(又は下端)の小ブロックの下地補正データLUi,jと同一の値を設定する。例えば、図10(b)において、領域R2内の小ブロックSB2に含まれる画素に対する下地補正データLUi,jは斜線部内の小ブロックSB3に含まれる画素の下地補正データLUi,jと同一の値が設定され、領域R2内の小ブロックSB4に含まれる画素に対する下地補正データLUi,jは、斜線部内の小ブロックSB5に含まれる画素の下地補正データLUi,jと同一の値が設定される。
【0066】
更に、補正部38は、領域R3内の画素に対する下地補正データLUi,jとして、当該画素が含まれる小ブロックと同一の行にあって、図10(a)に示す斜線部の左端(又は右端)の小ブロックの下地補正データLUi,jと同一の値を設定する。例えば、図10(b)において、領域R3内の小ブロックSB6に含まれる画素に対する下地補正データLUi,jは斜線部内の小ブロックSB7に含まれる画素の下地補正データLUi,jと同一の値が設定され、領域R3内の小ブロックSB8に含まれる画素に対する下地補正データLUi,jは、斜線部内の小ブロックSB9に含まれる画素の下地補正データLUi,jと同一の値が設定される。
【0067】
このようにして、補正部38は、画像全体(1536画素(縦方向)×2048画素(横方向))の画素に対する下地補正データLUi,jを求める。
【0068】
また、補正部38は、後述するYデータの先鋭化処理と、下地補正データLUi,jを用いた画像データの補正(下地とばし処理)とを行なう。すなわち、補正部38は、図11に示すフィルタを用いて各画素のYデータに先鋭化処理を施す。具体的には、注目画素PEi,jのYデータYi,jについて、画素PE(i−1),jのYデータY(i−1),j、画素PE(i+1),jのYデータY(i+1),j、画素PEi,(j−1)のYデータYi,(j−1)及び画素PEi,(j+1)のYデータYi,(j+1)を用いて下記の(3)式によって補正する。
Yi,j←2×Yi,j−(Y(i−1),j+Y(i+1),j+Yi,(j−1)+Yi,(j+1))/4 (3)
ただし、使用するフィルタは図11に示すフィルタに限定されず他の種々のフィルタが使用可能である。また、この処理は省略してもよい。
【0069】
そして、補正部38は、図12に示す補正曲線を使用して、各画素のYデータYi,jを補正する。すなわち、YデータYi,jが下地補正データLUi,j以上か否か判断し、下地補正データLUi,j以上の場合には、Yi,jを「255」(256階調の最大階調)とし、YデータYi,jが下地補正データLUi,j未満の場合には、YデータYi,jに(255/LUi,j)を乗じて、新しいYデータYi,jを得る。
【0070】
この処理によって、輝度Yデータが下地補正データの値以上の場合には、輝度が最大値とされるため、例えば照度不足によって下地が黒ずんでいる場合等において、下地を白色化する下地とばし処理が行なわれ、鮮明な文書画像データとすることができる。
【0071】
後処理部39は、以下に述べる黒レベル引き締め処理と、彩度強調処理と、RGB変換処理とを行なうものである。
【0072】
すなわち、後処理部39は、補正部38によって得られたYデータYi,jに対して黒レベル引き締め処理を施す。黒レベル引き締め処理では、図13に示す補正曲線に基づいて画素毎の輝度データであるYデータYi,jを補正する。具体的には、YデータYi,jが、所定階調(ここでは144階調)以下であるか否か判断し、144階調以下である場合には、YデータYi,jを零とし、144階調以上である場合には、補正曲線に基づいてYデータYi,jを補正する。YデータYi,jが、所定階調(ここでは144階調)以下である場合には、YデータYi,jが零とされるため、例えば、照度過多で文字及び図形部分の輝度が高くなり、下地との境界が判別し難くなっている場合等においても、この処理を施すことによって、文字及び図形部分の輝度が零とされるため、鮮明な文書画像データとすることができる。
【0073】
また、後処理部39は、下記の(4−1)〜(4−6)式によって、彩度が低い(Cr,Cbの値が小さい)画素程、彩度を強調する程度が大きくなるように彩度の補正を行なう彩度強調処理を施す。
Cr←Cr×EmpLv/Max(Z,C) (4−1)
Cb←Cb×EmpLv/Max(Z,C) (4−2)
ここで、
Z=(Cr+Cb)/2 (4−3)
C=70 (4−4)
Gamma(Z)=C+Z×(255−C)/255 (4−5)
EmpLv=Max(Gamma(Z)−Y/4,Z) (4−6)
だだし、Max(α,β)は、α及びβの内、大きい方の値を返す関数である。
【0074】
更に、後処理部39は、下記の(5−1)〜(5−3)式によって、Y,Cr,Cbデータからなる画像データをR,G,Bデータからなる画像データに変換するRGB変換処理を施す。なお、(5−1)〜(5−3)式の結果値のLUT(ルックアップテーブル)を備える形態でもよい。
R=Y+Cr (5−1)
G=Y−0.51Cr−0.19Cb (5−2)
B=Y+Cb (5−3)
つぎに、図14に示すフローチャートを参照して、文書画像データ補正部3の動作について説明する。まず、前処理部30によって、R,G,Bデータからなる画像データがY,Cr,Cbデータからなる画像データに変換される(ステップ#1)。ついで、第1分割部31によって、画像全体が横方向に16個の縦長エリアARk(k=1〜16)に分割される(ステップ#3)。そして、第1下地算出部34によって、縦長エリアARkに含まれる画素の画像データから縦長エリアARk毎に下地の下地補正データLAk(k=1〜16)が求められる(ステップ#5)。
【0075】
つぎに、第2分割部32によって、画像全体が縦方向に12個の横長エリアBRh(h=1〜12)に分割される(ステップ#7)。そして、第2下地算出部35によって、横長エリアBRhに含まれる画素の画像データから横長エリアBRh毎に下地の下地補正データLBh(h=1〜12)が求められる(ステップ#9)。
【0076】
ついで、第3分割部33によって、第1エリアAR1kが縦方向に12個のブロックCRk,h(k=1〜16、h=1〜12)に分割される(ステップ#11)。そして、第3下地算出部36によって、ブロックCRk,hに含まれる画素の画像データからブロックCRk,h毎に高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,h(k=1〜16、h=1〜12)が求められる(ステップ#13)。
【0077】
つぎに、第4下地算出部37によって、下地補正データLAk、下地補正データLBh、高輝度側下地補正データLCHk,h及び低輝度側下地補正データLCLk,hを用いてブロックCRkh毎に下地補正データLDk,h(k=1〜16、h=1〜12)が求められる(ステップ#15)。
【0078】
ついで、補正部38によって、Yデータの先鋭化処理と、下地補正データLUi,jを用いた画像データの補正(下地とばし処理)とが施される(ステップ#17)。さらに、後処理部39によって、黒レベル引き締め処理と、彩度強調処理と、RGB変換処理とが行なわれる(ステップ#19、21、23)。
【0079】
このようにして、本実施形態では、ブロック毎の情報に、そのブロックの画素が含まれる縦長エリア(及びその左右の縦長エリア)の情報と、そのブロックの画素が含まれる横長エリア(及びその上下の横長エリア)の情報とが加味されて補正された結果得られる下地補正データLDk,hを用いて画像データの補正を行なうようにしたので、局所性及び方向性に対する依存度が軽減された適正な下地補正が行なわれる。
【0080】
なお、文書画像データ補正部3の各機能部は、本発明の文書画像処理プログラムをCPU等で実行することによって実現される形態でもよい。
【0081】
また、本発明は以下の形態をとることができる。
【0082】
(A)本実施形態においては、ディジタルカメラによって画像データが生成される場合について説明したが、その他の種類の撮像装置よって画像データが生成される形態でもよい。例えば、ディジタルビデオカメラによって画像データが生成される形態でもよい。この場合には、動画を構成する各コマの画像データに対して本発明の画像データの補正処理を施す必要がある。
【0083】
また、ビデオテープ等の記録媒体にアナログデータとして画像信号を格納するビデオカメラによって撮像する形態でもよい。この場合には、ビデオカメラによって生成された画像信号(アナログ信号)を画像データ(ディジタル信号)に変換するキャプチャーボード等のA/D変換器が必要となると共に、動画を構成する各コマの画像データに対して本発明の画像データの補正処理を施す必要がある。
【0084】
(B)本実施形態においては、画像データが画像データ記録部によって記録媒体に格納される場合について説明したが、画像データがインターネット等の通信手段によってパーソナルコンピュータ等の通信端末に伝送される形態でもよい。なお、この場合には、パーソナルコンピュータ等の通信端末において、本発明の画像データの補正処理を実行する形態でもよい。
【0085】
(C)本実施形態においては、全体画像を縦方向及び横方向に分割する場合について説明したが、他の異なる2方向に分割する形態でもよいし、用途によっては2方向のなす角は直角には限定されない。これによれば、それぞれの目的に合った処理が可能となる。
【0086】
(D)本実施形態においては、Yデータを用いて下地とばし処理を行なう場合について説明したが、他のデータ(例えばGデータ)を用いて下地とばし処理を行なう形態でもよい。この場合には、R,G,BデータとY,Cr,Cbデータと間の変換処理を省略することができる。
【0087】
(E)本実施形態においては、第3下地補正データが高輝度側下地補正データ及び低輝度側下地補正データからなる場合について説明したが、第3下地補正データが高輝度側下地補正データである形態でもよい。この場合には、処理が簡単になる。また、高輝度側下地補正データに代えて、最大度数のクラスの64階調データを4倍したものを用いる形態でもよい。
【0088】
(F)本実施形態においては、彩度強調処理、先鋭化処理及び黒レベル引き締め処理を行なう場合について説明したが、これらの処理は本発明の付帯的処理であるため、これらの処理の内少なくとも1つを省略する形態でもよい。
【0089】
【発明の効果】
請求項1、2、4に記載の発明によれば、ブロックに含まれる画像データの特徴に、当該ブロックを含む第1及び第2エリアの画像データの特徴が加味されて補正データが得られるため、局所性及び方向性が解消された適正な補正データを得ることができる。そして、この下地補正データを用いて画像データの補正を行なう場合には、適正な補正を行なうことができ、下地部分に対してより鮮明な画像データを得ることができる。
【0090】
請求項3に記載の発明によれば、選択手段によって、外部から文書画像データであるか否かの選択が受け付けられるため、文書画像であるか否かの判別を確実に行なうことができ、文書画像データであるか否かの判別処理を不要とすることができる。更に、文書画像である場合の他、他種の画像、例えば写真画像に対しても、適正な補正処理を適用可能とすることができる。
【図面の簡単な説明】
【図1】 本発明に係る一実施形態であるディジタルカメラの主要部の構成を示すブロック図である。
【図2】 画像データ生成部の主要部の構成を示すブロック図である。
【図3】 第1分割部による画像の分割方法の説明図である。
【図4】 第2分割部による画像の分割方法の説明図である。
【図5】 第3分割部による画像の分割方法の説明図である。
【図6】 Yデータのヒストグラムの一例である。
【図7】 Yデータのヒストグラムの一例である。
【図8】 線形内挿法の説明図である。
【図9】 下地補正データの算出方法の説明図である。
【図10】 下地補正データの算出方法の説明図である。
【図11】 先鋭化処理に用いられるフィルタの一例である。
【図12】 下地とばし処理に用いる補正曲線の一例である。
【図13】 黒レベル引き締め処理に用いる補正曲線の一例である。
【図14】 文書画像データ補正部の動作を説明するためのフローチャートの一例である。
【図15】 従来の下地とばし処理に用いる補正曲線の一例である。
【符号の説明】
1 画像データ生成部
2 選択部
3 文書画像データ補正部
30 前処理部
31 第1分割部(第1分割手段)
32 第2分割部(第2分割手段)
33 第3分割部(第3分割手段)
34 第1下地算出部(第1下地算出手段)
35 第2下地算出部(第2下地算出手段)
36 第3下地算出部(第3下地算出手段)
37 第4下地算出部(第4下地算出手段)
38 補正部
39 後処理部
4 画像データ記録部

Claims (4)

  1. 撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理装置であって、文書画像全体を第1の方向について第1の所定数の第1エリアに分割する第1分割手段と、
    文書画像全体を前記第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割する第2分割手段と、
    前記第1エリアを前記第2の方向について前記第2分割手段による画像の分割位置と一致する位置で前記第2の所定数のブロックに分割する第3分割手段と、前記第1エリアに含まれる画素の画像データから前記第1エリア毎に下地の第1下地補正データを求める第1下地算出手段と、
    前記第2エリアに含まれる画素の画像データから前記第2エリア毎に下地の第2下地補正データを求める第2下地算出手段と、
    前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第3下地補正データを求める第3下地算出手段と、
    前記第1下地補正データ、第2下地補正データ及び第3下地補正データを用いて前記ブロック毎に第4下地補正データを求める第4下地算出手段とを備えることを特徴とする文書画像処理装置。
  2. 被写体の画像データを生成する画像データ生成手段と、
    画像全体を第1の方向について第1の所定数の第1エリアに分割する第1分割手段と、
    画像全体を前記第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割する第2分割手段と、
    前記第1エリアを前記第2の方向について前記第2分割手段による画像の分割位置と一致する位置で前記第2の所定数のブロックに分割する第3分割手段と、
    前記第1エリアに含まれる画素の画像データから前記第1エリア毎に下地の第1下地補正データを求める第1下地算出手段と、
    前記第2エリアに含まれる画素の画像データから前記第2エリア毎に下地の第2下地補正データを求める第2下地算出手段と、
    前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第3下地補正データを求める第3下地算出手段と、
    前記第1下地補正データ、第2下地補正データ及び第3下地補正データを用いて前記ブロック毎に第4下地補正データを求める第4下地算出手段とを備えることを特徴とする撮像装置。
  3. 外部から文書画像データであるか否かの選択を受け付ける選択手段を更に備えることを特徴とする請求項2に記載の撮像装置。
  4. 撮像装置で撮影された文書画像の画像データを補正するための下地補正データを求める文書画像処理プログラムであって、コンピュータを、文書画像全体を第1の方向について第1の所定数の第1エリアに分割する第1分割手段と、
    文書画像全体を前記第1の方向と異なる第2の方向について第2の所定数の第2エリアに分割する第2分割手段と、
    前記第1エリアを前記第2の方向について前記第2分割手段による画像の分割位置と一致する位置で前記第2の所定数のブロックに分割する第3分割手段と、前記第1エリアに含まれる画素の画像データから前記第1エリア毎に下地の第1下地補正データを求める第1下地算出手段と、
    前記第2エリアに含まれる画素の画像データから前記第2エリア毎に下地の第2下地補正データを求める第2下地算出手段と、
    前記ブロックに含まれる画素の画像データから前記ブロック毎に下地の第3下地補正データを求める第3下地算出手段と、
    前記第1下地補正データ、第2下地補正データ及び第3下地補正データを用いて前記ブロック毎に第4下地補正データを求める第4下地算出手段として機能させることを特徴とする文書画像処理プログラム。
JP2002051397A 2002-02-27 2002-02-27 文書画像処理装置、撮像装置及び文書画像処理プログラム Expired - Fee Related JP3697464B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002051397A JP3697464B2 (ja) 2002-02-27 2002-02-27 文書画像処理装置、撮像装置及び文書画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002051397A JP3697464B2 (ja) 2002-02-27 2002-02-27 文書画像処理装置、撮像装置及び文書画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2003256773A JP2003256773A (ja) 2003-09-12
JP3697464B2 true JP3697464B2 (ja) 2005-09-21

Family

ID=28663375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002051397A Expired - Fee Related JP3697464B2 (ja) 2002-02-27 2002-02-27 文書画像処理装置、撮像装置及び文書画像処理プログラム

Country Status (1)

Country Link
JP (1) JP3697464B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4761217B2 (ja) * 2007-01-17 2011-08-31 富士ゼロックス株式会社 画像処理装置、画像形成装置、画像形成システム、および画像処理プログラム
JP7430554B2 (ja) 2020-03-19 2024-02-13 株式会社キーエンス 光学式情報読取装置、光学式情報読取方法、光学式情報読取プログラム及びコンピュータで読取可能な記録媒体並びに記録した機器

Also Published As

Publication number Publication date
JP2003256773A (ja) 2003-09-12

Similar Documents

Publication Publication Date Title
JP4163353B2 (ja) 画像処理装置
US8547451B2 (en) Apparatus and method for obtaining high dynamic range image
JP5018770B2 (ja) 画像信号処理装置及び画像信号処理方法
JP4233257B2 (ja) 撮像装置の効果的ダイナミックレンジを拡張する方法及び装置並びに残存画像の使用
US6825884B1 (en) Imaging processing apparatus for generating a wide dynamic range image
US7756330B2 (en) Producing an extended dynamic range digital image
JP4678218B2 (ja) 撮像装置及び画像処理方法
KR101388130B1 (ko) 화상처리장치 및 화상처리방법
KR101099401B1 (ko) 화상 처리 장치 및 컴퓨터가 판독 가능한 기록 매체
US7187409B2 (en) Level difference correcting method and image pick-up device using the method
JP4246428B2 (ja) トーンスケール関数の生成方法
JP4290965B2 (ja) デジタル画像の品質を改善する方法
JP2008085634A (ja) 撮像装置及び画像処理方法
JP3817635B2 (ja) カラ−画像処理装置および処理方法
JP2006333113A (ja) 撮像装置
JP4335728B2 (ja) 画像処理装置および方法
JP3697464B2 (ja) 文書画像処理装置、撮像装置及び文書画像処理プログラム
JP2008219230A (ja) 撮像装置及び画像処理方法
JP2010068465A (ja) 画像処理装置、撮像装置及び画像処理方法
JP2004304635A (ja) 画像処理方法及び画像処理装置
Brown Color processing for digital cameras
JP2009022044A (ja) 画像処理装置及び画像処理プログラム
JP2004304641A (ja) 画像処理方法及び画像処理装置
JP2008131291A (ja) 撮像装置
JP4478981B2 (ja) 色雑音低減手法およびカラー撮像装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050310

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050329

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20050422

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050422

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050411

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080715

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090715

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100715

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100715

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110715

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120715

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130715

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees