JP4577844B2 - 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体 Download PDF

Info

Publication number
JP4577844B2
JP4577844B2 JP2005362377A JP2005362377A JP4577844B2 JP 4577844 B2 JP4577844 B2 JP 4577844B2 JP 2005362377 A JP2005362377 A JP 2005362377A JP 2005362377 A JP2005362377 A JP 2005362377A JP 4577844 B2 JP4577844 B2 JP 4577844B2
Authority
JP
Japan
Prior art keywords
image
value
brightness
lightness
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005362377A
Other languages
English (en)
Other versions
JP2007166429A (ja
Inventor
啓嗣 小島
禎史 荒木
浩行 浮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2005362377A priority Critical patent/JP4577844B2/ja
Publication of JP2007166429A publication Critical patent/JP2007166429A/ja
Application granted granted Critical
Publication of JP4577844B2 publication Critical patent/JP4577844B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、ブック原稿を読み取ったスキャン画像の地肌又は陰影を処理する画像処理装置、画像処理方法、プログラム及び記憶媒体に関する。
フラットベッドスキャナを用いて読み取る原稿の多くはシート状の原稿であり、コンタクトガラス上に開閉自在の圧板を設け、コンタクトガラス上に原稿を載置した後に圧板を閉じて原稿をスキャンするようにしている。しかし、原稿としてはシート状のものに限られず、ブック原稿(本、冊子など)も原稿として扱われることがあり、そのような場合にもコンタクトガラス上にブック原稿を載置し、原稿をスキャンすることになる。
しかしながら、原稿としてブック原稿を用いた場合、ブック原稿の綴じ部がコンタクトガラスから浮き上がってしまう。図50は、ブック原稿のスキャン画像の一例を示す。図50に示すように、綴じ部がコンタクトガラスから浮き上がってしまった場合、綴じ部が焦点面から離れてしまうため、浮き上がった部分のスキャン画像には、画像歪み、影、文字ぼけなどの画像劣化が発生する。劣化した画像の綴じ部は読みにくく、また、OCR(Optical Character Reader)により文字認識処理を行うときの認識率が著しく低下する。特に、厚手製本では綴じ部の劣化が激しく、また、ブック原稿の綴じ部が焦点面から離れないように加圧作業した場合には、ブック原稿自体を破損してしまうこともある。そこで、ページ外形や文字行情報及び罫線情報を用いて綴じ部のゆがみを補正する画像読み取り装置が提案されている。
また、綴じ部の明度を補正するため、スキャンされた画像を複数のブロックに分割し、各ブロックに含まれる画素の中で最も明度の高い画素の明度値を当該各ブロックの地肌値として設定し、ブロックごとの地肌値に基づいて地肌補正処理を施す地肌補正装置が提案されている(例えば、特許文献1参照。)。
また、スキャンされた画像に対する地肌補正処理に係る複数の処理モードから選択された所望の処理モードに従ってスキャンされた画像における地肌値を指定し、この指定された地肌値に基づきスキャンされた画像に対する地肌補正処理を実行する地肌補正装置が提案されている(例えば、特許文献2参照。)。特許文献2記載の地肌補正装置では、地肌補正処理の基準とすべき地肌値を抽出する画像上の位置が画像読取手段の種類によって異なることから、ユーザは、使用する画像読取手段に最も適した処理モードを選択してスキャン画像に対する地肌補正処理を実行することができる。
特開2003−69824号公報 特開2003−198845号公報
しかしながら、従来の地肌補正装置では、綴じ部の両端部分(綴じ部の天及び地付近)の陰影を十分に補正できず、綴じ部の両端部分に陰影が残る結果となる(陰影は、画像データとしては明度と同じものであるが区別するため陰影と称す)。これは、イメージスキャナの光源(蛍光灯)の長さが有限であるため、ブック原稿の両端部分に近いほど照明光の強度が弱くなるためと考えられる。また、左右の書籍表面上には,各々反対側からの反射光(相互反射光)も照明として含まれているため、その影響によっても綴じ部の陰影に影響を及ぼしていると考えられる。
本発明は上記問題に鑑み、ブック原稿の綴じ部の両端付近において陰影の補正ができる画像処理装置、画像処理方法、プログラム及びプログラムが格納された記憶媒体を提供することを目的とする。
上記課題に鑑み、本発明は、画像読取手段が、コンタクトガラス上に載置されたブック原稿を読み取るステップと、第一の手段が、前記ブック原稿のスキャン画像の画素値から前記ブック原稿の平坦部を特定し、該平坦部の画素値を基準に、綴じ部両端を結ぶ方向の一次元画像と直交する方向の位置yに対する前記スキャン画像の明度を正規化して正規化明度プロフィールを生成するステップと、地肌補正手段が、前記正規化明度プロフィールを用いて前記スキャン画像の綴じ部付近の地肌を補正するステップと、第2の手段が、一次元画像と平行な方向の位置xに対する明度の分布に対し、明度が一次元画像の明度分布の略中央値となる位置をx0、略中央値と漸近的に一定となる明度との差をa、略中央値を通る位置xに対する明度の傾きをb、明度分布の略中央値をc、として、明度を
と定義した際、前記x0に所定値を与え、一次元画像のあるxにおける明度を前記式に代入することで前記bを推定し、一次元画像の明度分布を求めるステップと、陰影補正手段が、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、を有することを特徴とする画像処理方法にて解決する。
本発明によれば、スキャン画像の綴じ部両端付近の陰影を補正することで、ブック原稿の綴じ部の両端部分に生じる陰影を補正できる。画素値とはRGB等であるが、例えば、RGBの値により算出される明度のように画素値をどのように処理して得られる値であってもよい。
本発明の一形態として、前記第2の手段は、一次元画像の画素値にフィルタ演算を施し、前記スキャン画像の両端の座標xl、xrを推定し、座標xlよりも外側又は座標xrよりも外側の位置を前記x0の所定とする、ことを特徴とする。
本発明の一形態において、前記陰影補正手段が、画素毎にRGB値から明度、彩度及び色相を求めるステップと、前記ブック原稿の画素毎に有彩色か無彩色かを判定するステップと、有彩色の場合には彩度と明度の両方に前記正規化明度プロフィールによる地肌補正を行い、無彩色の場合には明度にのみ前記正規化明度プロフィールによる地肌補正を行うステップと、画素毎に、明度、彩度及び色相からRGB値を求めるステップと、を有することを特徴とする。
本発明の一形態において、前記陰影補正手段が、画素毎に明度を求めるステップと、画素値のR値,G値、B値のそれぞれに前記正規化明度プロフィールによる地肌補正を行うステップと、を有することを特徴とする。
本発明の一形態において、前記陰影補正手段が、画素値のR値,G値、B値のそれぞれの前記正規化明度プロフィールを求めるステップと、R値,G値、B値のそれぞれに、R値,G値、B値それぞれの前記正規化明度プロフィールによる地肌補正を行うステップと、を有することを特徴とする。
本発明の一形態において、前記陰影補正手段は、一次元画像と直交する方向の位置yに対応づけて、前記スキャン画像の明度分布を示す明度プロフィールを生成するステップと、前記スキャン画像の綴じ部にて前記明度プロフィールが下向きのピークを示す位置yを中心に所定の領域を特定するステップと、前記明度分布を用いて前記スキャン画像の前記領域のみ、綴じ部両端付近の陰影を補正するステップと、を有することを特徴とする。
本発明の一形態において、前記陰影補正手段が、前記領域の前記スキャン画像を一次元画像と平行な複数の領域に分割するステップと、前記第2の手段が、分割された前記領域の境界の一次元画像についてのみ一次元画像の前記明度分布を求めるステップと、一次元画像と直交する方向に前記明度分布を補完して、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、を有することを特徴とする。
本発明の一形態において、前記陰影補正手段が、前記スキャン画像を、一次元画像と直交する方向の複数の領域に分割するステップと、分割された領域毎に、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、を有することを特徴とする
本発明の一形態において、前記スキャン画像の外縁が内側に入り込んでいる形状に基づき、一次元画像と直交する方向の前記スキャン画像の中央部を特定して、中央部から2つの領域に分割するステップと、前記地肌補正手段が、分割された領域毎に地肌補正を行うステップと、前記陰影補正手段が、分割された領域毎に前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、を有することを特徴とする。
ブック原稿の綴じ部の両端付近において陰影の補正ができる画像処理装置、画像処理方法、プログラム及びプログラムが格納された記憶媒体を提供できる。
以下、本発明を実施するための最良の形態について、図面を参照しながら実施例を上げて説明する。本実施の形態の画像処理装置は画像形成装置であるデジタル複写機に適用されており、画像を読取ためデジタル複写機のスキャナ部を備える。すなわち、画像処理装置は、画像形成装置、スキャナ装置、ファクシミリ装置、これらの複合機MFP(Multi Function Printer)に適用できる。
また、デジタル複写機のスキャナ部のように一次元の撮像素子によるスキャン画像(単に画像データという場合がある)だけでなく、デジタルカメラのように2次元の撮像素子による画像データも本実施の形態の画像処理装置は同様に処理できる。スキャナ装置やデジタルカメラで撮影した画像データの場合、パーソナルコンピュータ(以下、単にPCという)に本実施の形態の画像処理を行うプログラムを実行させ、地肌補正や陰影の補正、歪み補正が行われる。
図1は、デジタル複写機のスキャナ部1の構成を示す縦断正面図を示す。図1に示すように、スキャナ部1は、原稿を載置するコンタクトガラス2と、原稿の露光用の露光ランプ(以下、線光源という)3および第一反射ミラー4からなる第一走行体5と、第二反射ミラー6及び第三反射ミラー7からなる第二走行体8と、原稿の画像を読み取る撮像素子としてのCCD(Charge Coupled Device)9と、このCCD9に結像させるためのレンズユニット10と、原稿を載置する基準になるとともにコンタクトガラス2のズレや外れを防止する原稿スケール11と、この原稿スケール11の下側に設置されたシェーディング補正用の白基準板12と、フレーム14とを備えている。CCD9はセンサボード13上に形成されている。
原稿の走査時には、第一走行体5および第二走行体8はモータによって副走査方向に移動する。すなわち、第一走行体5および第二走行体8がコンタクトガラス2の下を走行して、線光源3で原稿を露光走査し、その反射光を第一反射ミラー4、第二反射ミラー6および第三反射ミラー7で反射して、レンズユニット10を通してCCD9に結像させる。これにより画像読取手段が実現されている。
スキャナ部1は、このスキャナ部1で読み取られた原稿のスキャン画像に基づく画像データに応じ、例えば電子写真方式で用紙上に画像の形成を行う画像印刷装置であるプリンタ部(不図示)を備えるデジタル複写機16に搭載されている。
図2(a)は、スキャナ部1を搭載したデジタル複写機16の上部部分を示す斜視図である。図2(a)に示すように、スキャナ部1には、コンタクトガラス2に対して開閉自在な圧板17と、この圧板17の開閉を検出する開閉センサ18とが設けられている。なお、デジタル複写機16に備えられるプリンタとしては、電子写真方式のほか、インクジェット方式、昇華型熱転写方式、銀塩写真方式、溶融型熱転写方式など、種々の印刷方式を適用することができる。
図2(b)は、デジタルカメラ又はスキャナ装置で撮影した画像データをPCで画像処理する場合のシステム図を示す。ネットワーク100を介してPC101とスキャナ装置102及びPC101とデジタルカメラ103とが接続されている。スキャナ装置102又はデジタルカメラ101で撮影された画像データは、PC101に送信され後述するプログラムにより地肌補正や陰影の補正、歪み補正が行われる。
図3は、スキャナ部1の制御系の電気的な接続を示すブロック図である。図3に示すように、この制御系は、スキャナ部1の全体を制御するメイン制御部19に、CCD9で読み取った画像データに各種の画像処理を施す回路である画像処理部20と、第一走行体5および第二走行体8を制御する回路である走行体制御部21と、デジタル複写機16への各種操作を受け付け、また、各種メッセージを表示する操作パネル22と、CCD9で読み取った画像データや所定のデータ等を記憶するメモリ23とが接続されている。なお、操作パネル22には、コピー開始を宣言するためのコピースタートキー等が設けられている。
また、走行体制御部21には、線光源3と、第一走行体5および第二走行体8を駆動するステッピングモータ24と、第一走行体5および第二走行体8がホームポジションにあるか否かを検出するスキャナホームポジションセンサ(HPセンサ)25と、開閉センサ18とが接続されている。
図4は、画像処理部20の基本的な内部構成を示すブロック図である。図4に示すように、画像処理部20は、原稿をCCD9により読み取ったアナログ画像信号の増幅処理やデジタル変換処理等を行うアナログビデオ処理部26、シェーディング補正処理を行うシェーディング補正処理部27、シェーディング補正処理後のデジタル画像信号に、MTF(Modulation Transfer Function)補正、変倍処理、γ補正等の各種画像データ処理を行いスキャン画像を生成する画像データ処理部28、から構成されている。
また、画像データ処理部28は、地肌補正手段と陰影補正手段を有し、後述する画像処理方法を実現する。地肌補正手段と陰影補正手段については実施の形態を通して詳述するが、地肌補正手段は、ブック原稿のスキャン画像の画素値からブック原稿の平坦部を求め、平坦部の画素値に基づきスキャン画像に地肌補正処理を施す。陰影補正手段は、平坦部の画素値に基づきスキャン画像の綴じ部両端付近の陰影を補正する。
以上のような画像処理後のデジタル画像信号は、メイン制御部19を介して、印刷する場合にはプリンタ部に、ファクシミリ送信する場合にはファクシミリ部に、OCR処理を行う場合は所定の記憶装置に送信されて、それぞれの処理に供される。
メイン制御部19は、図5(a)に示すように、各部を集中的に制御するCPU(Central Processing Unit)31を備えており、このCPU31には、BIOSなどを記憶した読出し専用メモリであるROM(Read Only Memory)32と、各種データを書換え可能に記憶してCPU31の作業エリアとして機能するRAM(Random Access Memory)33とがバス34で接続されており、マイクロコンピュータを構成している。さらにバス34には、画像処理や制御のためのプログラムが記憶されたHDD35と、CD(Compact Disc)−ROM37を読み取るCD−ROMドライブ36と、プリンタ部等との通信を司るインタフェース(I/F)38、LAN(Local Area Network)に接続するためのNIC(Network Interface Card)とが接続されている。
図5(b)は、PC101のハードウェア構成図を示す。なお、図5(b)において図5(a)と機能的に同一の構成部分には同一の符号を付しその説明は省略する。入出力装置30はキーボードやマウスの操作、ディスクプレーなど表示装置とのインターフェイスである。
図5(a)又は(b)に示すCD−ROM37は、特許請求の範囲における記憶媒体に相当するものであり、特許請求の範囲におけるプログラムが記憶されている。すなわち、CD−ROM37には、PC101又はメイン制御部19に、地肌補正ステップと陰影補正ステップを実行させるためのプログラムが記憶されている。
CPU31は、CD−ROM37に記憶されている制御プログラムをCD−ROMドライブ36で読み取り、HDD35にインストールする。後述する各種の画像処理を行うプログラムをCPU31が実行することで、メイン制御部19が画像処理部20を制御すると共に、画像処理部20が後述するような各種の処理を行う。
なお、記憶媒体としては、CD−ROM37のみならず、DVDなどの各種の光ディスク、各種光磁気ディスク、フロッピー(登録商標)ディスクなどの各種磁気ディスク、半導体メモリ等、各種方式のメディアを用いることができる。また、インターネットなどのネットワークからプログラムをダウンロードし、HDD35にインストールするようにしてもよい。この場合に、送信側のサーバでプログラムを記憶している記憶装置も、この発明の記憶媒体である。なお、プログラムは、所定のOS(Operating System)上で動作するものであってもよいし、その場合に後述の各種処理の一部の実行をOSに肩代わりさせるものであってもよいし、ワープロソフトなど所定のアプリケーションソフトやOSなどを構成する一群のプログラムファイルの一部として含まれているものであってもよい。
続いて、本実施の形態における陰影補正について説明する。図6に示すようにブック原稿40がそのページ綴じ部(以下、単に綴じ部という)41とスキャナ部1の画像読み取りの主走査方向とが平行になるように位置させてコンタクトガラス2に載置されている。すなわち、ブック原稿40は一部が平坦部としてコンタクトガラス2に接するが綴じ部40がコンタクトガラス2から離れている(図6では距離d)。
図6の状態でブック原稿40をスキャンすると、図7に示すように、綴じ部41の付近において歪みが生じる。また、綴じ部の両端部分41A、Bの明度が中央付近に比べ十分でなく低い画像となる。本実施の形態の画像処理装置は、綴じ部の両端部分41A、Bの地肌を精度よく補正するものである。
スキャナ部1の線光源3は長さが有限であるので、1次元の光源が有限に配置された光学モデルについて検討する。図8は、ブック原稿をスキャンする場合の光源とブック原稿の構成図を示す。図8では、X方向が主走査方向、Y方向が副走査方向、Z方向がブック原稿40の厚み方向を示す。図8では、見開きのブック原稿40うち片面だけを示している。
図8において、点p(xp,yp,zp)はブック原稿40の紙面における所定点の3次元座標を、(nx,ny,nz) は、その点における法線ベクトル、(dy,dz)は、Y−Z 平面における線光源3の位置を示す。線光源3はX軸と平行に配置された有限の光源であり図1の露光ランプである。x1、x2は線光源3のX軸方向の位置を示す。
図8のように長さが有限な線光源3の照明光強度は、点光源が一列に並んでいるものとしてモデル化することができる。点光源の照明光強度は、光源からの距離の2乗に反比例して減衰する。したがって、点光源の位置をxとして点光源からの照明光強度をx1からx2まで積分すれば、所定点pにおける照明光強度を得られる。ブック原稿40の紙面表面上の所定点p における線光源3からの反射光強度P(xp,yp,zp) は、式(1)のように構成できる。
ここで、a、Δは、CCD内部での光電変換パラメータ、ρは点pにおける反射率、αは点光源の強度パラメータである。
ブック原稿40の断面形状はX軸方向に一定(スキュー歪み無し)としていることから、法線ベクトルの x 成分(nx) を 0 とできる。この条件で式(1)の積分を解くと式(2)が得られる。
ただし、実際のブック原稿40の紙面表面上では相互反射が生じており、この相互反射も、多数の長さ有限の線光源となることを考えると、相互反射光強度も同じようにモデル化できる。したがって、実際のP(xp,yp,zp)は、係数(パラメータ)が異なる同様の式の和、という形式になる。
以上から、ブック原稿40の紙面上の主走査方向に沿った、ある1次元画像における明度分布の光学モデルPx(xp)は概して、式(3)のように表せる。
続いて、式(3)をスキャナ部1の光学モデルに応じて近似する。式(3)において、(x1 < x2) とすると、x=x1 付近では、(x−x2)^2 → ∞となり、式(3)の括弧中の第2項は、ほぼ 1 となる。同様に、x=x2 付近では、第1項は、ほぼ 1 と考えてよい。つまり、一次元画像中の明度分布を、X軸方向のx1側とx2側の2つに分けて考えれば、片側の明度分布は、式(4)のように表されることになる。
図9に示すように、式(4)による照明光強度は基本的にアークタンジェント(tanθの逆関数)に似た分布を示す。この分布の一部が、1次元画像中の(片側)の明度変化を表している。
arctanはθに対し上下に漸近線を有するグラフ形状となるが、図9では上下の漸近線に平行な中心線を設け、パラメータaは式(4)で新たに定義した(式(1)(2)のaと異なる)。式(4)における各係数の内容は、以下のようになる。
a: 中心線から漸近線までの距離
b: 曲線の傾き(b ≧ 0 の場合)を規定する。
図9ではbの値に変動する傾きを点線で示している。
(b < 0 の時は、x=x0 を漸近線とした、±∞に発散した概形になる)
c: y(明度) = 0 から中心線までの距離
x0: 中心線と交わる点の x 座標
a>0 かつ x0 が小さい場合は、1次元画像中の図9の左側の明度分布に対応し、a < 0 かつ x0 が大きい場合は図9の右側の明度分布に対応する。
実際のスキャン画像にスキュー歪みが生じたり、「ハの字」配置になっている場合は、1次元明度分布は左右で非対称になっているため、図9のように分割して扱う方が有効である。
実際には、明度がマイナスになることはないので、1次元画像中の明度分布を0〜1 の値に正規化しておくことができる。この場合、式(4)の係数において、a = 1.0(または -1.0), c = 0.0 とすることができる。なお、明度の正規化については後述する明度プロフィールにおいて説明する。
したがって、式(4)の残る係数 b と x0 を推定することができれば、ブック原稿40の端部を含む1次元画像中の正規化明度分布を求めることができ、これによって、端部の陰影補正が可能になる。
ブック原稿40のスキャン画像は図7に示したように、形状のゆがみと明度分布を生じさせるものであるため、ゆがみ補正を行うことが好適である。したがって、図10に示すように、ブック原稿40の画像処理は式(4)による陰影補正を含む地肌補正処理(S1)、ゆがみ形状補正処理(S2)の処理手順により構成される。なお、本実施の形態では地肌補正と陰影補正とを同時に行う場合もあるが、以下では、特に式(4)を利用した処理を陰影補正という。また、ゆがみ形状補正処理については実施例の後に説明する。
係数 b と x0 を推定するには、まず地肌補正処理を行うための明度プロフィールを求めておく。
まず、地肌補正処理について説明する。スキャン部1のコンタクトガラス2から離れる(綴じ部付近に近づく)にしたがって、明度および彩度は低下し、一方、色相はほとんど変化しない。そこで、スキャン画像の綴じ部の色補正は、低下した明度・彩度をスキャン画像の平坦部分と同程度になるように強調することで可能になる。
入力画像中の各画素の色について、どの程度、明度・彩度を強調すればよいかについては、平坦部分における地肌色を検出し、その明度・彩度と一致するように補正する方法が考えられる。しかし、一般に地肌色は白あるいはクリーム色等の彩度の低い色である場合が多いため、この方法では曲面部分の彩度を十分に強調することができない。
そこで、本実施の形態では「正規化明度プロフィール」という考えを導入し、それを用いた地肌補正方法を提案する。本実施の形態では正規化明度プロフィールを用いた以下の3つの地肌補正処理を提供する。
〔地肌補正処理1〕
地肌補正処理1では図11のフローチャート図に示すように、以下の1〜7の処理を順次実行する。
1.スキャン画像の明度(Value)、彩度(Saturation)、色相(Hue)を求める。
入力画像の赤、緑、青成分を用いて、各画素における明度(Value)、彩度(Saturation)、色相(Hue)の値を求める。
各画素の座標(x,y)における赤、緑、青成分をそれぞれ、R(x,y),G(x,y),B(x,y)、明度、彩度、色相の値をそれそれV(x,y),S(x,y),H(x,y)とする。V、S、Hは、R・G・Bを用いて次にように表すことができる。
V(x,y) = 0.3*R(x,y) + 0.59*G(x,y) + 0.11*B(x,y)
C1(x,y)= R(x,y) - V(x,y)
C2(x,y) = B(x,y)‐ V(x,y)
H(x,y)= Tan^(-1)(C1(x,y)/C2(x,y))
S(x,y) = √(C1(x,y)^2 +C2(x,y)^2)
2. 有彩色、無彩色の判定
S(x,y) と適当なしきい値St(例えば、閾値St = 15)を用いて、各画素を有彩色または無彩色に分類する。
S(x,y) ≦ St ならば、無彩色
S(x,y) > St ならば、有彩色
3. 明度プロフィールの作成
V(x,y)を用いて、綴じ部に垂直な方向に沿った明度プロフィールV(y)を作成する。具体的には、
・各yにおけるV(x,y)の1次元画像V(x)についてヒストグラムを求め、明るい方からVt個(以上)の画素が存在する明度の範囲(v1,v2とする)を求める。Vtの値は、例えば、Vt = (画像の幅の画素数)×0.1である。
図12は一次元画像明度V(x)のヒストグラムの一例を示す。図12ではX軸が明度、Y軸が画素数である。そして、
・v1からv2の範囲について明度の平均値を求め、それをv(y)とする。これをライン毎に(y毎に)求める。
4. 明度プロフィールの平滑化
明度プロフィールv(y)を、雑音除去のため平滑化する。
各yについて、yを中心にしたv(y−n)からv(y+n)の平均値をv(y)の値にする。これを数回繰り返す。例えば、3〜10回繰り返す。
5. 明度プロフィールからブック原稿40のスキャン画像の平坦部分の明度を求める
具体的には、明度プロフィールv(y)から平坦部分の明度を算出する。
図13は明度プロフィールv(y)の画素と明度の関係の一例を示す。図13に示すように明度が小さい部分がスキャン画像の綴じ部である。
まず、
・v(y)の値(明度)についてのヒストグラムを作成する。
図14はv(y)のヒストグラムの一例を示す。図14ではX軸が明度、Y軸が画素数である。そして、
・最も頻度が高い明度が平坦部分の明度に対応すると考えられることから(図13では左右の平坦部)、その明度を中心に、±Vmの範囲について明度の平均値を求め、それを平坦部の明度Vflatとする。例えば、VmはVm =2である。
6. 正規化明度プロフィールを求める
正規化明度プロフィールvn(y)を以下の式で算出する。
平坦部分の値を1.0となるようにそのほかの明度を1以下の値で表し(比で表し)明度プロフィール全体に乗じ、0〜1の範囲に正規化する。
vn(y) = v(y) / Vflat
7. 地肌補正
各画素(x,y)について、
・その画素が有彩色の場合は、
S'(x,y) =S(x,y)/ vn(y)
V'(x,y) = V(x,y)/ vn(y)
として彩度と明度を補正し、H(x,y)、S'(x,y),V’(x,y)から、R,G,Bの値を求める。
・その画素が無彩色の場合は、
V’(x,y) = V(x,y)/vn(y)
として明度のみ補正し、H(x,y),S(x,y),V’(x,y)から,R,G,Bの値を求める。
〔地肌補正処理2〕
地肌補正処理2では図15のフローチャート図に示すように、以下の1〜6の処理を順次実行する。地肌補正処理2では地肌補正処理1とは異なり、有彩色/無彩色に分別せずに、R,G,B値を直接補正する。
1. 明度(Value)を求める
入力画像の赤、緑、青成分を用いて、各画素における明度(Value)の値を求める。座標(x,y)における赤、緑、青成分をR(x,y),G(x,y),B(x,y)、明度の値をV(x,y)とする。
明度の値Vは、例えば、
V(x,y) = 0.3*R(x,y) + 0.59*G(x,y) + 0.11*B(x,y)
となる。なお、グレースケール画像の場合は、画素値そのものをV(x,y)として扱い処理を行う。
2. 明度プロフィールの作成
V(x,y)を用いて、綴じ部に垂直な方向(y方向)に沿った明度プロフィールv(y)を作成する。具体的には、
・各yにおけるV(x,y)の1次元画像V(x)についてヒストグラムを求め、明るい方からVt個(以上)の画素が存在する明度の範囲(v1,v2とする)を求める(図12参照)。例えばVtは、Vt = (画像の幅の画素数)×0.1 である。
・v1からv2の範囲について明度の平均値を求め、それをv(y)とする。
3. 明度プロフィールの平滑化
明度プロフィールv(y)を、雑音除去のため平滑化する。
各yについて、yを中心にしたv(y−n)からv(y+n)の平均値をv(y)の値にする。これを数回繰り返す。例えば、3〜10回繰り返す。
4. 明度プロフィールから平坦部分明度を求める
明度プロフィールv(y)から平坦部分明度を算出する(図13参照)。
・v(y)の値(明度)についてのヒストグラムを作成する。
・最も頻度が高い明度が平坦部分の明度に対応することから、その明度を中心に、±Vmの範囲について明度の平均値を求め、それを平坦部の明度Vflatとする(図14参照)。例えば、Vm=2である。
5. 正規化明度プロフィールを求める
正規化明度プロフィールvn(y)を以下の式で算出する。平坦部分の値を1.0とする比を明度プロフィール全体に乗じ、0〜1の範囲に正規化する。
vn(y) = v(y) / Vflat
6. 地肌補正
各画素(x,y)について、R,G,Bの値を直接補正する。
R'(x,y) = R(x,y)/vn(y)
G’(x,y)= G(x,y)/vn(y)
B’(x,y)= B(x,y)/vn(y)
地肌補正処理2では、地肌補正処理1とは異なりV(x,y) のみ求めればよく、有彩色、無彩色の分類処理は必要ないため、処理速度を向上させ、処理に必要なメモリ容量を低減できる。
〔地肌補正処理3〕
地肌補正処理3では図16のフローチャート図に示すように、以下の1〜5の処理を順次実行する。地肌補正処理3では地肌補正処理1及び2とは異なり、画素値R,G,B の各画像について、直接正規化(R,G,B)プロフィールを求め、それを用いて、対応するR,G,B画像の補正を行う。
1. プロフィールの作成
R,G,Bの各画素値について、各1次元画像における画素値の最大値(ヒストグラムを求め、値の大きい方から、p%の画素値の平均値)を求め、それをr(y),g(y),b(y)とする。グレースケール画像の場合は、画素値そのものをg(y)として扱い同様の処理を行う。
2. プロフィールの平滑化
プロフィールr(y),g(y),b(y)を、雑音除去のため平滑化する。各yについて、yを中心にしたr(y−n)からr(y+n), g(y−n)からg(y+n),b(y−n)からb(y+n)の平均値をr(y),g(y),b(y)の値にする。これを数回繰り返す。例えば、3〜10回繰り返す
3. プロフィールから平坦部分明度を求める
プロフィールr(y),g(y),b(y)から平坦部分を算出する。
・r(y),g(y),b(y)についてのヒストグラムを作成する。
・最も頻度が高い値が平坦部分に対応することから、その値を中心に、±mの範囲について平均値を求め、それを平坦部の基準値をrflat,gflat,bflatとする。例えば、m = 2である。
4. 正規化プロフィールを求める
正規化明度プロフィールpr(y),pg(y),pb(y)を以下の式で算出する。平坦部分の値を1.0とする比をプロフィール全体に乗じ、0〜1の範囲に正規化する。
pr(y) = r(y) / rflat
pg(y) = g(y) / gflat
pb(y) = b(y) / bflat
5. 地肌補正
各画素(x,y)について、R,G,Bの値を直接補正する。
R’(x,y) = R(x,y) / pr(y)
G’(x,y) = G(x,y) / pg(y)
B’(x,y) = B(x,y) / pb(y)
地肌補正処理3では、地肌補正処理1及び2と異なりV(x,y),S(x,y),H(x,y)を求める必要がなく、有彩色、無彩色の分類処理も必要ないため、処理速度を向上させ、処理に必要なメモリ容量を低減できる。
次に、ブック原稿40のスキャン画像について、陰影補正を行う処理について説明する。上述したように、式(4)の係数 b,x0を求めることができれば、一次元画像中における正規化明度分布を推定することができる。正規化明度分布が得られれば、地肌補正と同様に、その分布の逆数を入力画像の明度(または画素値)に乗じることで陰影の補正が可能となる。
係数 b,x0 については、各一次元画像ごとに(つまり、y座標に対して)異なる値となるため、実際の画像での正規化明度分布を用いて求めることが適している。求める明度分布は地肌色のものである。例えば、一次元画像においてブック原稿の端の部分は一般的に余白部分であり地肌色であることが多いことから、この部分の正規化明度を用いることが可能である。
しかしながら、データが一つのみでは、2つの変数b,x0 双方の値を求めることは困難である。そこで、x0 については、ブック原稿の端よりも少し外側の位置になることは明らかであることから、あらかじめ適当な値を設定しておけば良い。そして、ブック原稿の端の部分の正規化明度から b の値を決定することで、一次元画像中における正規化明度分布を推定する。
本実施例における陰影補正の処理手順を図17のフローチャート図に示す。1次元画像における基本的な陰影補正手順は、次のようになる。
まず、 入力されたブック原稿のスキャン画像について、地肌補正処理1〜3のいずれかの方法で、正規化明度プロフィール t(y) を求めておく(S11)。
ついで、 ある y 座標における1次元画像 (R(x,y),G(x,y),B(x,y)) について、1次元明度分布 V(x) を求める(S12)。
ついで、一次元明度分布V(x)を求めた1次元画像について、ブック原稿両端の x 座標 xl, xr を推定する(13)。具体的には、図18に示す1次元差分フィルターを用いて畳み込み演算を行い、その絶対値が大きい二カ所を xl, xr とする。そして、xlと xr の中央の x 座標を xc とする。
ついで、t(y) を用いて V(x) を正規化し、v(x) とする(S14)。
ついで、1次元画像の左側 (xl 〜 xc) における正規化明度分布を推定する(S15)。具体的には、xl から xc へ向かって探索し、v(x) > thres(例えば0.8) となる x 座標 xpとその時の v(x) の値 pix を求める。係数 x0は、X0 = xl−(xr−xl)×Δとする。Δは例えば0.1である。そして、xp, pix, x0を式(4)に入力すれば、b の値を算出できる。なお、式(4)においてxpが「x」、pixは明度である。
bの値が算出されれば、x0, bの値を式(4)に設定することで、xl 〜 xc の明度分布 p(x) が求められる。
同様に、xr 〜 xc についての明度分布p(x)を算出する(S16)。
ついで、p(x) を用いて陰影を補正する。すなわち、前述した地肌補正に加え、両端部の照明不足による陰影を補正する。例えば、
R’(x,y)=R(x,y)/(rn(y)* p(x))
G’(x,y)=G(x,y)/(gn(y)* p(x))
B’(x,y)=B(x,y)/(bn(y)* p(x))
となる。
以上のように本実施例によれば、ブック原稿40をスキャンした場合、平坦部分の明度に基づき地肌補正すると共に、両端部の照明不足による陰影を補正することができる。
実施例1では副走査方向の全域に渡り地肌補正及び陰影補正したが、本実施例では、地肌補正及び陰影補正を行う範囲を限定して画像処理を高速化する場合について説明する。
補正範囲の限定は、ブック原稿の曲がり始めの位置を検出することで可能となる。
ブック原稿の曲がり始めの位置は、正規化明度プロフィールを用いてブック原稿の曲面部分の範囲を検出し、その部分のみ補正を行うようにする。なお、後述する処理で検出するページ外形を用いて曲面部分の範囲を検出してもよい。
ブック原稿の曲面部分については、ブック原稿のスキャン画像中の見開きページの双方で、平坦部から曲面部へ変化している「曲がり始め」の位置を検出することで、その間が曲面部とすることができる。図19は曲がり始めの位置の検出手順を示すフローチャート図である。
1.まず、y 軸方向の明度プロフィールおよび平坦部の明度を求める。図20は、y方向のある位置における明度プロフィールの一例を示す。明度が凹部を示す中央付近が綴じ部である。
2.ついで、図20の「平坦部明度 - 明度プロフィール」の分布についての重心位置を求める。重心位置は、例えば、凹部を3角形に近似した場合の重心位置である。
3.ついで、重心位置の y 座標から、左右に明度プロフィールの値を探索し、「平坦部明度 ‐ δ(例えば、δ=10)」 の明度となる2つのy 座標(図ではy1,y2)を求める。この y 座標を曲がり始めの位置とする。
2つのy座標の間でのみ、実施例1の地肌補正及び陰影補正を行えば、画像処理を高速化できる。
ところで、2つのy座標間のすべての主走査方向において(2つのy座標間の曲面部全てについて)、地肌補正及び陰影補正を行うことも効率的ではない。そこで、図21に示すように、2つのy座標間の曲面部を適当な個数の領域に分割し、その境界線上の1次元画像についてのみ、正規化明度分布を求める。そして、その間の1次元画像については、線形補間によって、対応する正規化明度分布を求めるようにする。この方法によって、更に高速な補正処理が可能になる。
また、これまで綴じ部の両端付近の陰影補正と同時に色補正したが、綴じ部両端付近の陰影補正については、地肌補正を行なった後に適用することも可能である。この場合でも補正の手順に変更はない。図22は、地肌補正を行なった後に綴じ部両端付近の陰影を補正する補正手順のフローチャート図である。
まず、ブック原稿40の外形を検出する等の処理によって、綴じ部両端点の座標を求める(S21)。ブック原稿40の外形の検出については後述する。
ついで、スキャン画像から明度画像を求め、明度プロフィールを算出する(S22)。図20と同様に曲がり始めの位置を検出する。
ついで、図21に示すように、曲がり始めの位置に挟まれた曲面部を、y 軸方向に M 個に分割する(S23)。そして、その境界線上におけるブック原稿両端点の位置を、スキャン画像から求める。
ついで、赤,緑,青の各単色画像について、以下の補正処理を行う(S24)。
・綴じ部両端点の座標から、入力画像を上下に2分割する
・上下それぞれの画像について、水平方向に N 個に分割し、地肌補正を行う
・補正した上下の画像を結合する
ついで、ステップS23 における境界線上の1次元画像の明度分布を求め、曲面部についてのみ、綴じ部両端における陰影補正を行う(S25)。
本実施例では、スキャン画像を綴じ部と垂直な方向に複数の領域に分割して地肌補正処理及び陰影補正を行う画像処理について説明する。
まず、図23に示すように、スキャン画像をブック原稿40の綴じ部41に垂直に分割し、X軸方向に複数の領域Lに分割する(すなわち、Y軸方向を長さ方向とする線で分割する)。そして、この各領域Lに対して、地肌補正処理1ないし3のいずれかを行い、また、両端部の陰影補正を行う。なお、図23の例では、X軸方向の分割は5分割している。
本実施例は、スキャン画像がスキューしている、又は、ブック原稿が「ハの字」配置にある場合に好適となる。このようなスキャン画像では、X軸方向において画像の地肌色のプロフィールが変化しているため、スキャン画像全体を同一のプロフィールを用いて補正するのではなく、X軸方向に画像を分割し、それぞれの領域Lにてプロフィールを求め、補正を行う方法が有効である。
本実施例によれば、綴じ部と平行な方向に画素値のプロフィールが変化している場合でも、変化しているそれぞれの領域からプロフィールを求めて、精度よく地肌色を補正できる。
本実施例では、スキャン画像を綴じ部と平行な方向に複数の領域に分割して地肌補正処理及び陰影補正を行う画像処理について説明する。
まず、図24に示すように、スキャン画像をブック原稿40の綴じ部41の長さ方向と平行な方向に複数の領域Lに分割する(すなわち、X軸方向の長さ方向とする線で分割する)。この各領域Lに対して、地肌補正処理1〜3いずれかを行い、また、両端部の陰影補正を行う。図24の例では、綴じ部41の線の上下で領域を2分割している。
この処理では、見開きの両ページがそれぞれ異なる地肌色のブック原稿40に対するもので、左右又は上下の両ページで地肌色が異なるために、画像のY軸(垂直)方向において地肌色のプロフィールが変化しているため、同一のプロフィールを用いて補正するので
はなく、Y軸方向に対して画像を分割し、それぞれの領域Lにおいてプロフィールを求め
、補正を行うものである。具体的には、次の1.2.の処理による。
1.入力スキャン画像において、綴じ部41の両端の位置を検出する(綴じ部41の直線を求める)。この位置の検出については、ブック原稿40のページ外形に基づき検出してもよいし(外形が一番内側に入り込んでいる箇所を検出する)、画像中央部の濃度に基づき検出してもよいし(一番濃い箇所)、又は、明度の変化を利用して検出してもよい。なお、ページ外形の検出処理については後述する。
2.1で求められた直線によって入力画像を上下に分割し、地肌補正及び陰影補正を行う。
本実施例によれば、見開きの両ページがそれぞれ異なる地肌色の場合でも、それぞれのページから明度プロフィールを求めて、精度よく地肌色を補正できる。
本実施例は、実施例3及び4を組み合わせるものであり、図25に示すように、ブック原稿40の綴じ部41の長さ方向(X軸方向)、綴じ部41の長さ方向と垂直な方向(Y軸方向)に、それぞれ複数の領域Lに複数に分割し、この各領域Lに対して地肌補正処理1〜3のいずれかを行い、また、両端部の陰影補正を行う。なお、図25の例では、X軸方向の分割は5分割し、Y軸方向の分割は綴じ部41の線の上下で2分割している。
本実施例の処理は、スキューしている、あるいは、「ハの字」配置にあるブック原稿40であり、かつ、左右又は上下のページがそれぞれ異なる地肌色のブック原稿40に対するものある。ブック原稿40が、スキューおよび「ハの字」配置、上下のページで地肌色が異なるという理由から、画像のX,Y軸方向において、地肌色のプロフィールが変化しているため、同一のプロフィールを用いて補正するのではなく、X,Y軸の両方向に対して画像を分割し、それぞれの部分画像にてプロフィールを求め、補正を行う方法が有効である。
以上のように、本実施の形態の画像処理装置は、ブック原稿40の綴じ部を地肌補正すると共に、綴じ部の両端付近の陰影を補正できる。
〔ゆがみ形状補正〕
続いて、図10のステップS2におけるゆがみ形状補正について説明する。
図26は、ステップS2のゆがみ形状補正処理の概要を説明するフローチャート図である。ステップS2の処理は、スキャン画像中のブック原稿40についてページ外形/罫線/文字行の抽出処理を行い(ステップS201)、ブック原稿40のスキャン画像の画像歪み補正処理を行なう(ステップS301)。
まず、ステップS201においては、ページ外形/罫線/文字行の抽出処理を実行する。ここで、図27は、ページ外形/罫線/文字行の抽出処理の流れを概略的に示すフローチ
ャートである。
・スキャン画像からのページ外形の抽出(S211)
まず、ステップS211におけるスキャン画像からのページ外形の抽出処理について説明する。図28は、スキャン画像の上端にページ外形が存在するスキャン画像の一例を示す。また、図29は図28に示したスキャン画像の綴じ部境界線左側の黒画素ヒストグラムである。
図29に示すヒストグラムのX軸はスキャン画像の主走査方向(図28の上下方向)を示すものであり、スキャン画像の上端はヒストグラムの左端に対応付けられている。なお、ページ外形が下端に存在するスキャン画像の場合には、スキャン画像の下端がヒストグラムの右端に対応付けられることになる。したがって、図28に示すようにスキャン画像の上端にページ外形が存在する場合、スキャン画像の上部に黒い帯が現れることから、図29に示すヒストグラムの左端には高い縦棒が現れることになる。本実施の形態では、このような特性を利用して、スキャン画像にページ外形が存在するか否かの判断を行う。
より具体的には、図29に示すように、綴じ部境界線からスキャン画像の左端(図29の左端)までの距離AO、ヒストグラム縦棒の高さBOとし、その比率を下記に示す式(5)により算出し、算出された比率kが、予め定められた閾値よりも大きい場合に、スキャン画像にページ外形が存在すると判断する。
なお、スキャン画像の上下にページ外形が存在する場合には、ヒストグラムの左右両端に高い縦棒が現れることになるので、このような場合には、ヒストグラムの左右両端の高い縦棒に基づいてスキャン画像にページ外形が存在するか否かの判断がそれぞれ実行される。
以上の処理により、スキャン画像にページ外形が存在すると判断された場合には、左右ページの上下辺のいずれにページ外形が存在しているのかという情報とともにページ外形を抽出し、RAM33に一時的に記憶する。
なお、このスキャン画像にページ外形が存在するか否かの判断処理は、スキャン画像の綴じ部境界線を境にした左右ページ毎に実行される。
・スキャン画像からの罫線の抽出(S212)
続くステップS212においては、スキャン画像からの罫線の抽出処理を実行する。
「罫線候補の検出」
図30は罫線が存在するスキャン画像の一例を示す説明図である。本実施の形態では、罫線の矩形抽出を導入し、図28に示すようなスキャン画像に存在する罫線を1つの矩形として抽出する。なお、詳細については後述するが、ただ単に矩形抽出を行うだけでは罫線が単独で抽出できない場合もあるために、ランの登録に制限を設けた矩形抽出を行う。
図30は、2値化した画像に矩形抽出を施した結果を示す。図30に示すように、黒画素が連結している箇所が1つの矩形として抽出される。図30のような罫線が存在していれば、副走査方向に細長い矩形として抽出されることから、細長い矩形の有無や抽出した矩形の形状(長さ・縦横比)や位置を基に罫線の有無の判定を行う。
ただし、ただ単に矩形抽出を行うだけでは、罫線が単独で抽出できない場合もある。図31に示すように、罫線がノイズと接触している場合、ノイズを含む矩形が抽出されてしまう。また、図32のような表が含まれるスキャン画像の場合は、副走査方向の罫線は主走査方向の罫線と交差するため、表全体が1つの矩形として抽出され罫線が単独で抽出できない。
[ランの登録に制限を設けた矩形抽出]
そこで、罫線を単独で抽出するために、ランの登録に制限を設けた矩形抽出を行う。図31に示すような罫線とノイズが接触している画像に対して、主走査方向(垂直方向)に一定値未満のランのみを登録し矩形を抽出すると、図33に示すように罫線を構成する黒画素は登録対象のランとなるが、ノイズを構成する黒画素はランとして登録されない。罫線を構成する黒画素を対象として矩形抽出を行うため、罫線を単独で抽出することができる。
なお、罫線を矩形抽出するにあたって、副走査方向(水平方向)に長いランのみを対象に矩形抽出を行う方法もあるが、この方法だと綴じ部付近の歪み部分は矩形内に含まれない。ところが、本実施の形態の方式を用いることにより、罫線の綴じ部付近の歪み部分も矩形内に含めることが可能となり、より正確な罫線の位置や長さを検出することが出来る。
「矩形統合」
表など、副走査方向(水平方向)の罫線と主走査方向(垂直方向)の罫線とが交差している画像に矩形抽出を行うと、主走査方向の罫線はランとして登録されないため、副走査方向に矩形が細切れに抽出されてしまう。すると、図34に示すように、副走査方向に長い罫線があるにもかかわらず、その罫線は1つの矩形として抽出されず、複数の細切れの矩形となって抽出される。
そこで、矩形統合を行う。副走査方向における距離が一定値以下の矩形同士を統合する。図35は、矩形統合を施した例である。矩形統合は、図35に示すように、細切れになっていた矩形を1つの矩形に統合し、罫線の矩形を抽出するものである。この矩形統合は、かすれた罫線や点線の罫線に対して行っても、罫線全体が1つの矩形として抽出されるため有効な方法である。
「最適罫線の選択」
次いで、一定値未満のランのみを登録した矩形抽出を行い、副走査方向に細長い矩形の有無にて罫線の有無を判定する。このような罫線の有無の判定は、画像の左上・左下・右上・右下の4箇所それぞれにおいて行う。例えば、図36に示す画像の場合、左上にのみ罫線が存在しないということになる。ある箇所にて複数罫線が存在する場合は、補正に利用する罫線を以下の優先順位で決定する。
1.綴じ部付近まで食い込んでいる罫線
例えば、図36に示す画像の右下の場合、綴じ部付近まで食い込んでいる罫線が補正に利用される。
2.長さが長い方の罫線
例えば、図36に示す画像の右上の場合、双方の罫線は綴じ部付近まで食い込んでいるため、長さが長い方の罫線が補正に利用される。
3.位置が外側の罫線
例えば、図36に示す画像の左下の場合、双方の罫線は綴じ部付近まで食い込んでいて、なおかつ、長さがほぼ同じため、画像の外側に位置する罫線が補正に利用される。
「最適罫線の座標値検出」
以上のようにして最適罫線を選択した後、各罫線の座標値を検出する。罫線の位置座標は、抽出された矩形の座標から得ることができる。なお、特殊な例として、副走査方向に細長い矩形の位置が画像の上端や下端に接している場合は、その矩形がノイズである可能性を考慮して、罫線とはみなさないものとする。また、左右のページそれぞれで細長い矩形が抽出された場合(例えば、左上と右上、左下と右下)、画像によっては、綴じ部をまたがる形で左右ページの矩形が統合されることがある。すると、水平方向画像全体に細長い矩形が抽出されることから、抽出された矩形にそのような特徴が見られた場合は、綴じ部位置を境にその矩形を分割する。
以上の処理により、スキャン画像に罫線が存在すると判断された場合には、左右各ページのいずれの位置に罫線が存在しているのかという情報とともに罫線を抽出し、RAM33に一時的に記憶する。
・スキャン画像からの文字行の抽出(S213)
続くステップS213においては、スキャン画像からの文字行の抽出処理を実行する。本実施の形態においては、まず、スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別を行う。
「文字行の判別」
スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別手法について説明する。ここで、図37は図50に示したスキャン画像の副走査方向の黒白反転数ヒストグラムである。図37の横軸は、副走査方向(左右方向)の黒画素(スキャン画像を黒白反転させた画素の中でその濃度値が予め定めた濃度値よりも濃い画素)の主走査方向上での位置を示し、図37中の縦軸はその位置毎の黒画素数を示すものである。
また、図38は図50に示した画像の主走査方向の黒白反転数ヒストグラムである。図38の横軸は、主走査方向(上下方向)の黒画素(スキャン画像を黒白反転させた画素の中でその濃度値が予め定めた濃度値よりも濃い画素)の副走査方向上での位置を示し、図38の縦軸は、その位置毎の黒画素数を示すものである。画像中の文字が横書きの図50に示したようなスキャン画像の場合、図37に示すような副走査方向のヒストグラムは激しく変化するが、図38に示すような主走査方向のヒストグラムの変化は少ない。また、特に図示しないが、スキャン画像中の文字行が縦書き文字行である場合には、主走査方向のヒストグラムは激しく変化するが、副走査方向のヒストグラムの変化は少ない。
上述したような判別手法は、具体的には下記に示す各式により実現される。まず、下記に示す式(6)により、主走査方向yの位置でのヒストグラム値Pnt(y)の平均値meanが算出される。ここで、heightは画像の高さである。
主走査方向yの位置でのヒストグラム値Pnt(y)の平均値meanが算出される。ここで、heightは画像の高さである。
そして、下記に示す式(7)により、副走査方向のヒストグラムの主走査方向に関する分散σが得られる。
同様に、下記に示す式(8)により、副走査方向xの位置でのヒストグラム値Pnt(x)の平均値meanが算出される。ここで、widthは画像の幅である。
そして、下記に示す式(9)により、主走査方向のヒストグラムの副走査方向に関する分散σが得られる。
上述したようにスキャン画像中の文字行が横書き文字行である場合には、副走査方向のヒストグラムの主走査方向に関する分散σが、主走査方向のヒストグラムの副走査方向に関する分散σより大きい。逆に、スキャン画像中の文字行が縦書き文字行である場合には、主走査方向のヒストグラムの副走査方向に関する分散σが、副走査方向のヒストグラムの主走査方向に関する分散σより大きい。つまり、分散σと分散σとの比較により、スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別が可能になっている。
なお、スキャン画像中の文字行が縦書き文字行なのか、横書き文字行なのかの判別に、黒白反転数ヒストグラムを用いたのは、文字行と写真部分との混同を避けるためである。一般に、黒画素ヒストグラムの値が同程度の場合、文字領域のほうが写真領域よりも黒白反転数ヒストグラムの値が大きくなるからである。
「横書き文字行の座標検出」
以上のようにして文字行を判別した後、まず、各横書き文字行の座標を検出する。横書き文字行の座標の検出にあたっては、文字単位の外接矩形抽出処理を行うとともに、横書き文字行の抽出処理を行う。なお、文字認識処理については周知の技術であるので、その説明は省略する。ここで、スキャン画像の文字外接矩形抽出処理および文字行抽出処理の結果の一例を図39に示す。そして、各文字の外接矩形の中心点の座標をその文字の座標とみなし、横書き文字行の座標を検出する。
「最適横書き文字行の選択」
次に、抽出した横書き文字行の中から歪み補正に最適な横書き文字行を選択する。複数の横書き文字行が検出される場合、どの横書き文字行を用いて歪み補正するかを選択する必要がある。最適な横書き文字行の選択基準の一例としては、前述した最適な罫線の選択基準と基本的に同様であって、図40に示すように横書き文字行の長さBCが予め定められた閾値より長く、かつ、綴じ部境界線を挟んだ左右の一定幅領域内(図40の網掛け領域)に横書き文字行の一部Cがかかっていることを条件とし、その中で上下何れかのページ外形に最も近い横書き文字行を選択するようにする。ここで、Bは文字行の一番左の矩形の中心であり、Cは一番右の矩形の中心である。なお、最適な横書き文字行の選択は、左右ページから各1本ずつのページ外形に最も近い横書き文字行を選択するものであっても良いし、左右ページをさらに上下部分に分け、その各4ブロックにおいて1本ずつのページ外形に最も近い横書き文字行を選択するものであっても良い。
なお、上記2条件(横書き文字行の長さが予め定められた閾値より長く、かつ、綴じ部境界線を挟んだ左右の一定幅領域内に横書き文字行の一部がかかっている)については、その両方ではなく何れか一方のみを満足するものであっても良い。また、選択基準として上例では「ページ外形に最も近い」を用いているが、これに限るものではなく、「横書き文字行の湾曲が最も大きい」を用いても良い。ここで、「横書き文字行の湾曲」は横書き文字行の両端の文字外接矩形の中心座標の主走査方向の座標値の差で表すものとする。
「最適横書き文字行の座標値の決定」
最適な横書き文字行が選択された場合には、横書き文字行の(主走査方向の)座標値を決定する。横書き文字行の(主走査方向の)座標値は、横書き文字行内の各文字外接矩形の中心点を連結し、直線部分と曲線部分とを近似して抽出することにより横書き文字行の(主走査方向の)座標値を決定することになる。より詳細には、図40に示すDは綴じ部境界線であり、BDの間は多項式近似曲線で(主走査方向の)座標値を推定し、一番左端のAとBとの間は近似直線の値で(主走査方向の)座標値を推定する。
「不適切な横書き文字行の排除」
最後に不適切な横書き文字行を排除する。これは、前述したように多項式近似により座標値を推定する際に、多項式近似による推定曲線の形状が不適切である場合には補正の際にかえって歪みが増大する恐れがあるので、このような横書き文字行を排除するものである。不適切な近似曲線形状の例としては、前述した罫線の場合と同様であって、特に図示しないが、曲線がブック原稿の外側へ向かうような場合や、中心線を超えて大きく内側へ食い込むような場合である。
なお、推定曲線の形状が不適切であるとして横書き文字行を排除した場合には、再び最適な横書き文字行を選択し、上記の処理を繰り返すことになる。
以上の処理により、スキャン画像に横書き文字行が存在すると判断された場合には、左右各ページのいずれの位置に横書き文字行が存在しているのかという情報とともに横書き文字行を抽出し、RAM33に一時的に記憶する。
「縦書き文字行に基づく横書き文字行の抽出」
次に、各縦書き文字行から横書き文字行を抽出する。
図41は、各縦書き文字行からの横書き文字行の抽出処理の流れを概略的に示すフローチャートである。図41に示すように、まず、縦書き文字行の行切り出し矩形を抽出する(S221)。なお、縦書き文字行の行切り出し矩形の抽出処理は、OCR等で一般に用いられている周知の技術をそのまま利用することができるので、その説明は省略する。図42は、抽出した行切り出し矩形を例示的に示す説明図である。
次いで、縦書き文字行の先頭(もしくは末尾)のy座標が最大(もしくは最小)の縦書き文字行を抽出し、さらに、そこから予め定めた距離範囲内に先頭(もしくは末尾)が存在する縦書き文字行を抽出する(S222)。より具体的には、図42に示した例においては、図43に示すように、縦書き文字行の先頭文字のy座標が最大の縦書き文字行はAで示した縦書き文字行である。そして、その先頭位置から予め定めた距離範囲h内に存在する行先頭文字は、図43中、黒丸“●”で示した文字である。すなわち、黒丸“●”で示す文字を含む縦書き文字行のみを抽出し、それ以外の縦書き文字行B,Cは除外する。なお、hはスキャン画像の解像度によって定められる定数である。
次に、抽出した縦書き文字行の先頭(もしくは末尾)のy座標に関してヒストグラムを構成する(S223)。図44では、ページの左端に近い縦書き文字行Dを基準行とし、その先頭のy座標(yD)を基準座標としている。以後、yDに対して一定幅d(例えば抽出した縦書き文字行の平均幅の1/2)の範囲内に先頭が存在する縦書き文字行の数を、yDに関するヒストグラムの値とする。図44では、yDを示す直線を上下に挟む点線の範囲内に先頭が存在する縦書き文字行がその対象となる。したがって、ページの左端に近い縦書き文字行Dの右隣の縦書き文字行Eは、その範囲外である。このように、既存の基準座標の対象範囲に先頭が含まれない縦書き文字行が出現した場合は、その縦書き文字行を新たな基準行とし、その先頭座標を新たな基準座標(ここでは、yE)とする。また、縦書き文字行Eの右隣の縦書き文字行Fの行先頭座標はyDの対象範囲に含まれるので、新たな基準座標を設けることなく、yDに関するヒストグラムの値を1だけカウントアップする。
以下、同様の処理を綴じ部境界線に向かって続けて行く。その結果、図44に示す例では、yDの対象範囲に含まれる縦書き文字行は斜線を施した矩形で囲まれた7つで、yEの対象範囲に含まれる縦書き文字行は網掛けを施した矩形で囲まれた4つとなる(これら以外の矩形で囲まれた縦書き文字行に関しても、基準行、基準座標と対象範囲がそれぞれ定められるが、図44では省略している)。なお、yDの対象範囲には本来無関係であるべき縦書き文字行Gも含まれているが、次のステップS224にてこれは除外される。
続いて、ステップS223にて構成したヒストグラムの中で、最大の値に対応する基準行の対象範囲に含まれる縦書き文字行の中で、最もページの左端(もしくは右端)にある縦書き文字行(基準行)を開始行として、綴じ部境界線へ向かって、先頭(もしくは末尾)のy座標が近接した縦書き文字行を抽出する(ステップS224)。図44では、基準座標yDの対象範囲に含まれる文字行が7つと最大であったので、その中の左端の縦書き文字行Dを開始行とし、開始行(縦書き文字行D)から綴じ部境界線へ向かって先頭のy座標が近接した縦書き文字行を抽出していく。
ところで、開始行(縦書き文字行D)から綴じ部境界線へ向かって先頭のy座標が近接した縦書き文字行を抽出する際には、画像の歪みを生じていない部分と歪みを生じている部分とで処理内容を切り替える。
まず、画像の歪みを生じていない部分における処理について図45を参照しつつ説明する。画像の歪みを生じていない部分では、着目行Hを基準として、次の2条件を満足する縦書き文字行を抽出する。
1.y座標の正方向(図45中、上方へ向かう方向)に関して、着目行Hの先頭位置から一定範囲内b1(例えば平均文字行幅の1/2)に抽出する縦書き文字行の先頭が存在すること
2.y座標の負方向(図45中、下方へ向かう方向)に関して、着目行Hの先頭位置から見てx座標の正方向(綴じ部境界線へ向かう方向)に対して予め定めた一定角度(ここでは、角度を直線の傾き(b2/a1)で表している)の範囲内に抽出する縦書き文字行の先頭が存在すること
すなわち、着目行Hの次の縦書き文字行Iの先頭は上記の範囲外なので除外することになるが、さらに次の縦書き文字行Jの先頭は範囲内に存在するので抽出することになる。以下、縦書き文字行Jを新たな着目行として同様の処理を続ける。
次に、画像の歪みを生じている部分における処理について図46を参照しつつ説明する。画像の歪みを生じている部分では、着目行Lを基準として、次の2条件を満足する縦書き文字行を抽出する。
1.y座標の負方向(図46中、下方へ向かう方向)に関して、着目行Lの先頭位置から見てx座標の正方向(綴じ部境界線へ向かう方向)に対して予め定めた一定角度(ここでは、角度を直線の傾き(b3/a2)で表しているが、歪みを生じている部分では基本的にページの内側へ文字行の先頭が食い込んでいくのを考慮して、b2/a1<b3/a2とする)の範囲内に抽出する縦書き文字行の先頭が存在すること
2.着目行Lの先頭位置と抽出する縦書き文字行の先頭位置を結ぶ直線の傾き(b4/a2)が、着目行Lの先頭位置と直前の抽出行Kの先頭位置を結ぶ直線の傾き(b5/a3)から一定値αを引いた値よりも大きい。すなわち、“b4/a2>b5/a3−α”を満足すること(基本的には、“b4/a2>b5/a3”で良いが、誤差を考慮して一定値αを導入する。一定値αは予め定めた値である)
すなわち、着目行Lの次の縦書き文字行Mの先頭はこの条件外なので除外することになるが、さらに次の縦書き文字行Nの先頭は条件を満足するので抽出することになる。以下、縦書き文字行Nを新たな着目行として同様の処理を続ける。
さて、ここで問題となるのは、歪みを生じていない部分と歪みを生じている部分をいかに識別するかであるが、これは次のように行っている。すなわち、着目行と次の抽出行の先頭のy座標をそれぞれyC,yNとすると、“yN−yC”が一定値(例えば、平均文字行幅の1/4)以上となれば、それ以降を歪みを生じている部分とする。
以上の方法により図44から抽出した縦書き文字行を、図47において斜線を施した矩形で囲んで示す。
最後に、抽出した縦書き文字行の先頭(もしくは末尾)の位置座標に関する近似曲線多項式を算出する(ステップS225)。抽出した各縦書き文字行の行切り出し矩形の先頭を連結して外形を形成する場合には、図48に示すように、連結する各縦書き文字行の行切り出し矩形の上辺中心点に基づき、抽出した縦書き文字行の先頭の位置座標に関する近似曲線多項式を算出する。また、抽出した各縦書き文字行の行切り出し矩形の末尾を連結して外形を形成する場合には、図48に示すように、連結する各縦書き文字行の行切り出し矩形の下辺中心点に基づき、抽出した縦書き文字行の末尾の位置座標に関する近似曲線多項式を算出する。
なお、最後に不適切な縦書き文字行の外形を排除する。これは、前述したように多項式近似により座標値を推定する際に、多項式近似による推定曲線の形状が不適切である場合には補正の際にかえって歪みが増大する恐れがあるので、このような縦書き文字行の外形を排除するものである。不適切な近似曲線形状の例としては、前述した罫線や横書き文字行の場合と同様であって、特に図示しないが、曲線がブック原稿の外側へ向かうような場合や、中心線を超えて大きく内側へ食い込むような場合である。
なお、推定曲線の形状が不適切であるとして縦書き文字行の外形を排除した場合には、歪み補正用の縦書き文字行の外形は無いということになる。
以上の処理により、スキャン画像に縦書き文字行の外形が存在すると判断された場合には、左右各ページのいずれの位置に縦書き文字行の外形が存在しているのかという情報とともに縦書き文字行の外形を抽出し、RAM33に一時的に記憶する。
なお、以下においては、横書き文字行及び縦書き文字行の外形を文字行として扱うものとする。
以上、ステップS211〜S213の処理により、図26のページ外形/罫線/文字行の抽出処理(ステップS201)が終了する。
続くステップS202においては、画像歪み補正処理を実行する。図49は歪み補正補処理の概略を示すフローチャート図である。
歪み補正補処理は、概略的には、歪み補正(伸長)に際しての基準となる線(基準線)としてスキャン画像の上辺(もしくは下辺)の近傍に位置するページ外形/罫線/文字行の何れかを選択する処理(ステップS301:基準線選択処理)、基準線に対応するものであって補正率(伸長率)の算出用の参照線としてスキャン画像の上辺(もしくは下辺)の近傍に位置するページ外形/罫線/文字行の何れかを選択する処理(ステップS302:参照線選択処理)、基準線が罫線や文字行の場合に、基準線より下部の画像情報の欠落を最小限にするための仮想的なページ外形を算出する処理(ステップS303:仮想ページ外形算出処理)、仮想的なページ外形に基づいてスキャン画像に伸長処理を施して主走査方向の歪みを補正する処理(ステップS304:主走査方向歪み補正処理)、補正画像の文字外接矩形に基づいてスキャン画像に伸長処理を施して副走査方向の歪みを補正する処理(ステップS305:副走査方向歪み補正処理)により構成されている。このステップS202の処理については公知であるため、詳細な説明は省略する(その詳細については、特開2003−69807号公報等を参照)。
以上のように、本実施の形態の画像処理装置によれば、有限な線光源の照明強度をモデル化することで、ブック原稿のスキャン画像において、綴じ部の両端付近の陰影を補正することができる。また、明度プロフィールを作成することで、平坦部の明度を用いて綴じ部の地肌を補正することができる。さらに、スキャン画像の綴じ部の歪みを補正することができる。
デジタル複写機のスキャナ部の構成を示す縦断正面図である。 スキャナ部を搭載したデジタル複写機の上部部分を示す斜視図である。 スキャナ部の制御系の電気的な接続を示すブロック図である。 画像処理部の基本的な内部構成を示すブロック図である。 メイン制御部のハードウェア構成図である。 コンタクトガラスに載置されたブック原稿を示す図である。 ページ綴じ部付近に歪みが生じたスキャン画像を示す。 ブック原稿をスキャンする場合の光源とブック原稿の構成図である。 照明光強度の分布の一例を示す図である。 ブック原稿の画像処理の手順を示すフローチャート図である。 地肌補正処理1の手順を示すフローチャート図である。 一次元画像明度V(x)のヒストグラムの一例である。 一次元画像の画素と明度の関係の一例を示す図である。 明度v(y)のヒストグラムの一例である。 地肌補正処理2の手順を示すフローチャート図である。 地肌補正処理3の手順を示すフローチャート図である。 陰影補正の処理手順を示すフローチャート図である。 1次元差分フィルターの一例である。 曲がり始めの位置の検出手順を示すフローチャート図である。 平坦部及び綴じ部の 明度プロフィールの一例である。 曲面部を適当な個数の領域に分割したスキャン画像を示す図である。 地肌補正を行なった後に綴じ部両端付近の陰影を補正する補正手順のフローチャート図である。 綴じ部に垂直に複数の領域Lに分割したスキャン画像を示す図である。 綴じ部の長さ方向と平行に複数の領域Lに分割したスキャン画像を示す図である。 綴じ部に垂直と平行に分割したスキャン画像を示す図である。 ゆがみ形状補正処理の概要を説明するフローチャート図である。 ページ外形/罫線/文字行の抽出処理の流れを概略的に示すフローチャートである。 上端にページ外形が存在するスキャン画像の一例を示す説明図である。 図50に示したスキャン画像の綴じ部境界線左側の黒画素ヒストグラムである。 2値化した画像に矩形抽出を施した結果を示す説明図である。 罫線がノイズと接触している場合を示す説明図である。 表が含まれる画像を示す説明図である。 一定値未満のランのみを登録し矩形を抽出した結果を示す説明図である。 副走査方向に矩形が細切れに抽出されてしまう場合を示す説明図である。 矩形統合を施した例を示す説明図である。 矩形抽出を行った結果を示す説明図である。 図50に示した画像の副走査方向の黒白反転数ヒストグラムである。 図50に示した画像の主走査方向の黒白反転数ヒストグラムである。 スキャン画像の文字外接矩形抽出処理および文字行抽出処理の結果の一例を示す説明図である。 最適な横書き文字行の選択を示す説明図である。 各縦書き文字行からの横書き文字行の抽出処理の流れを概略的に示すフローチャートである。 抽出した行切り出し矩形を例示的に示す説明図である。 予め定めた距離範囲内に先頭が存在する縦書き文字行を例示的に示す説明図である。 抽出した縦書き文字行の先頭のy座標に関してヒストグラムを構成する状態を示す説明図である。 画像の歪みを生じていない部分における処理を示す説明図である。 画像の歪みを生じている部分における処理を示す説明図である。 抽出した縦書き文字行を示す説明図である。 縦書き文字行の行切り出し矩形を示す説明図である。 画像歪み補正処理の流れを概略的に示すフローチャートである。 ブック原稿のスキャン画像の一例である。
符号の説明
1 スキャナ部
2 コンタクトガラス
3 線光源(露光ランプ)
19 メイン制御部
20 画像処理部
40 ブック原稿
41 綴じ部
41A,B 綴じ部両端付近

Claims (20)

  1. コンタクトガラス上に載置されたブック原稿を読み取る画像読取手段と、
    前記ブック原稿のスキャン画像の画素値から前記ブック原稿の平坦部を特定し、該平坦部の画素値を基準に、綴じ部両端を結ぶ方向の一次元画像と直交する方向の位置yに対する前記スキャン画像の明度を正規化して正規化明度プロフィールを生成する第一の手段と、
    前記正規化明度プロフィールを用いて前記スキャン画像の綴じ部付近の地肌を補正する地肌補正手段と、
    一次元画像と平行な方向の位置xに対する明度の分布に対し、明度が一次元画像の明度分布の略中央値となる位置をx0、略中央値と漸近的に一定となる明度との差をa、略中央値を通る位置xに対する明度の傾きをb、明度分布の略中央値をc、として、明度を
    と定義した際、前記x0に所定値を与え、一次元画像のあるxにおける明度を前記式に代入することで前記bを推定し、一次元画像の明度分布を求める第2の手段と、
    前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正する陰影補正手段と、
    を有することを特徴とする画像処理装置。
  2. 前記第2の手段は、一次元画像の画素値にフィルタ演算を施し、前記スキャン画像の両端の座標xl、xrを推定し、座標xlよりも外側又は座標xrよりも外側の位置を前記x0の所定値とする
    ことを特徴とする請求項1記載の画像処理装置。
  3. 前記地肌補正手段は、画素毎にRGB値から明度、彩度及び色相を求め、
    前記ブック原稿の画素毎に有彩色か無彩色かを判定し、
    有彩色の場合には彩度と明度の両方に前記正規化明度プロフィールによる地肌補正を行い、
    無彩色の場合には明度にのみ前記正規化明度プロフィールによる地肌補正を行い、
    画素毎に、明度、彩度及び色相からRGB値を求める
    ことを特徴とする請求項1又は2記載の画像処理装置。
  4. 前記地肌補正手段は、画素毎に明度を求め、
    画素値のR値、G値、B値のそれぞれに前記正規化明度プロフィールによる地肌補正を行う
    ことを特徴とする請求項1又は2記載の画像処理装置。
  5. 前記地肌補正手段は、
    画素値のR値、G値、B値のそれぞれの前記正規化明度プロフィールを求め、
    R値、G値、B値のそれぞれに、R値、G値、B値それぞれの前記正規化明度プロフィールによる地肌補正を行う、
    ことを特徴とする請求項1又は2記載の画像処理装置。
  6. 前記陰影補正手段は、
    一次元画像と直交する方向の位置yに対応づけて、前記スキャン画像の明度分布を示す明度プロフィールを生成し、
    前記スキャン画像の綴じ部にて前記明度プロフィールが下向きのピークを示す位置yを中心に所定の領域を特定し、
    前記明度分布を用いて前記スキャン画像の前記領域のみ、綴じ部両端付近の陰影を補正する、
    ことを特徴とする請求項1記載の画像処理装置。
  7. 前記陰影補正手段は、
    前記領域の前記スキャン画像を一次元画像と平行な複数の領域に分割し、
    前記第2の手段は、分割後の前記領域の境界の一次元画像についてのみ一次元画像の前記明度分布を求め、
    一次元画像と直交する方向に前記明度分布を補完して、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正する、
    ことを特徴とする請求項6記載の画像処理装置。
  8. 前記陰影補正手段は、
    前記スキャン画像を、一次元画像と直交する方向の複数の領域に分割し、
    分割された領域毎に、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正する
    ことを特徴とする請求項1記載の画像処理装置。
  9. 前記スキャン画像の外縁が内側に入り込んでいる形状に基づき、一次元画像と直交する方向の前記スキャン画像の中央部を特定して、中央部から2つの領域に分割し、
    前記地肌補正手段は、分割された領域毎に地肌補正を行い、
    前記陰影補正手段は、分割された領域毎に前記スキャン画像の綴じ部両端付近の陰影を補正する
    ことを特徴とする請求項1記載の画像処理装置。
  10. 画像読取手段が、コンタクトガラス上に載置されたブック原稿を読み取るステップと、
    第一の手段が、前記ブック原稿のスキャン画像の画素値から前記ブック原稿の平坦部を特定し、該平坦部の画素値を基準に、綴じ部両端を結ぶ方向の一次元画像と直交する方向の位置yに対する前記スキャン画像の明度を正規化して正規化明度プロフィールを生成するステップと、
    地肌補正手段が、前記正規化明度プロフィールを用いて前記スキャン画像の綴じ部付近の地肌を補正するステップと、
    第2の手段が、一次元画像と平行な方向の位置xに対する明度の分布に対し、明度が一次元画像の明度分布の略中央値となる位置をx0、略中央値と漸近的に一定となる明度との差をa、略中央値を通る位置xに対する明度の傾きをb、明度分布の略中央値をc、として、明度を
    と定義した際、前記x0に所定値を与え、一次元画像のあるxにおける明度を前記式に代入することで前記bを推定し、一次元画像の明度分布を求めるステップと、
    陰影補正手段が、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、
    を有することを特徴とする画像処理方法。
  11. 前記第2の手段は、一次元画像の画素値にフィルタ演算を施し、前記スキャン画像の両端の座標xl、xrを推定し、座標xlよりも外側又は座標xrよりも外側の位置を前記x0の所定値とする
    ことを特徴とする請求項10記載の画像処理方法。
  12. 前記陰影補正手段が、画素毎にRGB値から明度、彩度及び色相を求めるステップと、
    前記ブック原稿の画素毎に有彩色か無彩色かを判定するステップと、
    有彩色の場合には彩度と明度の両方に前記正規化明度プロフィールによる地肌補正を行い、無彩色の場合には明度にのみ前記正規化明度プロフィールによる地肌補正を行うステップと、
    画素毎に、明度、彩度及び色相からRGB値を求めるステップと、
    を有することを特徴とする請求項10又は11記載の画像処理方法。
  13. 前記陰影補正手段が、画素毎に明度を求めるステップと、
    画素値のR値,G値、B値のそれぞれに前記正規化明度プロフィールによる地肌補正を行うステップと、
    を有することを特徴とする請求項10又は11記載の画像処理方法。
  14. 前記陰影補正手段が、
    画素値のR値,G値、B値のそれぞれの前記正規化明度プロフィールを求めるステップと、
    R値,G値、B値のそれぞれに、R値,G値、B値それぞれの前記正規化明度プロフィールによる地肌補正を行うステップと
    を有することを特徴とする請求項10又は11記載の画像処理方法。
  15. 前記陰影補正手段は、
    一次元画像と直交する方向の位置yに対応づけて、前記スキャン画像の明度分布を示す明度プロフィールを生成するステップと、
    前記スキャン画像の綴じ部にて前記明度プロフィールが下向きのピークを示す位置yを中心に所定の領域を特定するステップと、
    前記明度分布を用いて前記スキャン画像の前記領域のみ、綴じ部両端付近の陰影を補正するステップと
    を有することを特徴とする請求項10記載の画像処理方法。
  16. 前記陰影補正手段が、前記領域の前記スキャン画像を一次元画像と平行な複数の領域に分割するステップと、
    前記第2の手段が、分割された前記領域の境界の一次元画像についてのみ一次元画像の前記明度分布を求めるステップと、
    一次元画像と直交する方向に前記明度分布を補完して、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正するステップと
    を有することを特徴とする請求項15記載の画像処理方法。
  17. 前記陰影補正手段が、前記スキャン画像を、一次元画像と直交する方向の複数の領域に分割するステップと、
    分割された領域毎に、前記明度分布を用いて前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、
    を有することを特徴とする請求項10記載の画像処理方法
  18. 前記スキャン画像の外縁が内側に入り込んでいる形状に基づき、一次元画像と直交する方向の前記スキャン画像の中央部を特定して、中央部から2つの領域に分割するステップと、
    前記地肌補正手段が、分割された領域毎に地肌補正を行うステップと、
    前記陰影補正手段が、分割された領域毎に前記スキャン画像の綴じ部両端付近の陰影を補正するステップと、
    を有することを特徴とする請求項10記載の画像処理方法。
  19. コンピュータに、請求項10ないし18いずれか記載の画像処理方法を実行させるためのプログラム。
  20. 請求項19記載のプログラムを格納したコンピュータ読み取り可能な記憶媒体。
JP2005362377A 2005-12-15 2005-12-15 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体 Expired - Fee Related JP4577844B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005362377A JP4577844B2 (ja) 2005-12-15 2005-12-15 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005362377A JP4577844B2 (ja) 2005-12-15 2005-12-15 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体

Publications (2)

Publication Number Publication Date
JP2007166429A JP2007166429A (ja) 2007-06-28
JP4577844B2 true JP4577844B2 (ja) 2010-11-10

Family

ID=38248787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005362377A Expired - Fee Related JP4577844B2 (ja) 2005-12-15 2005-12-15 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JP4577844B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5001115B2 (ja) * 2007-10-30 2012-08-15 京セラドキュメントソリューションズ株式会社 画像形成装置
JP7380270B2 (ja) 2020-01-31 2023-11-15 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
JP2007166429A (ja) 2007-06-28

Similar Documents

Publication Publication Date Title
US7016081B2 (en) Image distortion correction apparatus, distortion correction method therefor, recording media, image scanner and image construction apparatus
US20050280849A1 (en) Correcting background color of a scanned image
US7149349B2 (en) Scanning and detecting a number of images
JP4646130B2 (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体
JP4162633B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体
JP4577844B2 (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体
JP4111697B2 (ja) 画像輝度補正装置、画像読取装置、画像形成装置及びプログラム
JP3983721B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP2009303164A (ja) 画像読取装置及び画像読取装置の制御方法
JP4577845B2 (ja) 画像処理装置、画像処理方法、プログラム及びプログラムを格納した記憶媒体
JP2000261653A (ja) 画像処理装置
JP4507124B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP4318874B2 (ja) ボケ画像補正装置、画像読取装置、画像形成装置及びプログラム
JP3979639B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP4073877B2 (ja) 画像処理方法、画像処理装置及び画像形成装置並びにコンピュータプログラム
JP2003143407A (ja) 画像輝度補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体
JP4093970B2 (ja) 画像歪み補正装置、プログラム及び記憶媒体
JP4480291B2 (ja) 画像歪み補正装置、記憶媒体、プログラム、画像歪み補正方法、画像読取装置および画像形成装置
JP4198613B2 (ja) 画像歪み補正装置、プログラム及び記憶媒体
JP2003069807A (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP4257708B2 (ja) 影付き文字領域判定方法、画像処理方法、影付き文字領域判定装置、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム及び記録媒体
JP2003204428A (ja) 画像補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体
JP4061256B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
JP2004328705A (ja) 画像歪み補正装置、画像読取装置、画像形成装置、画像歪み補正方法、画像歪み補正プログラム、及び記録媒体
JP3877142B2 (ja) 画像歪み補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100413

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20100423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100423

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100727

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130903

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4577844

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees