A.実施例:
A−1:複合機200の構成
実施の形態を実施例に基づき説明する。図1は、画像処理装置の一例である複合機200の構成を示すブロック図である。複合機200は、画像処理装置を制御するプロセッサであるCPU210と、DRAMなどの揮発性記憶装置220と、フラッシュメモリやハードディスクドライブなどの不揮発性記憶装置230と、液晶ディスプレイなどの表示部240と、液晶ディスプレイと重畳されたタッチパネルやボタンを含む操作部250と、ユーザの端末装置100などの外部装置と通信を行うためのインタフェース(通信IF)270と、印刷実行部280と、読取実行部290と、を備えている。
読取実行部290は、CPU210の制御に従って、一次元イメージセンサを用いて原稿を光学的に読み取ることによってスキャンデータを生成する。印刷実行部280は、CPU210の制御に従って、複数種類のトナー、具体的には、シアン(C)、マゼンタ(M)、イエロ(Y)、ブラック(K)のトナーを、色材として用いて、レーザ方式で用紙などの印刷媒体に画像を印刷する。具体的には、印刷実行部280は、感光ドラムを露光して静電潜像を形成し、該静電潜像にトナーを付着させてトナー像を形成する。印刷実行部280は、感光ドラム上に形成されたトナー像を用紙に転写する。なお、変形例では、印刷実行部280は、色材としてのインクを吐出して、用紙上に画像を形成するインクジェット方式の印刷実行部であっても良い。
揮発性記憶装置220は、CPU210が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域を提供する。不揮発性記憶装置230には、コンピュータプログラムPGが格納されている。コンピュータプログラムPGは、CPU210に複合機200の制御を実現させる制御プログラムである。本実施例では、コンピュータプログラムPGは、複合機200の製造時に、不揮発性記憶装置230に予め格納される形態で提供される。これに代えて、コンピュータプログラムPGは、サーバからダウンロードされる形態で提供されても良く、DVD−ROMなどに格納される形態で提供されてもよい。CPU210は、コンピュータプログラムPGを実行することにより、後述する画像処理を実行することができる。
A−2:画像処理
図2は、画像処理のフローチャートである。この画像処理は、例えば、ユーザが、読取実行部290の原稿台に、原稿を載置して、コピーの実行指示を入力した場合に実行される。この画像処理は、原稿を、読取実行部290を用いて読み取ることによって生成されるスキャンデータを取得し、該スキャンデータを用いて、原稿を示す印刷データを生成することで、いわゆる原稿のコピーを実現する処理である。
S10では、CPU210は、ユーザが原稿台に設置した原稿を、読取実行部290を用いて読み取ることによって、対象画像データとしてのスキャンデータを生成する。原稿は、例えば、複合機200、あるいは、図示しないプリンタによって画像が印刷された印刷物である。生成されたスキャンデータは、揮発性記憶装置220(図1)のバッファ領域に格納される。スキャンデータは、複数個の画素の値を含み、複数個の画素の値のそれぞれは、画素の色をRGB表色系の色値(RGB値とも呼ぶ)で表す。すなわち、スキャンデータは、RGB画像データである。1個の画素のRGB値は、例えば、赤色(R)と緑色(G)と青色(B)との3個の色成分の値(以下、R値、G値、B値とも呼ぶ)を含んでいる。本実施例では、各成分値の階調数は、256階調である。
RGB画像データであるスキャンデータは、RGB表色系を構成する3個の色成分に対応する3個の成分画像データ(R成分画像データ、G成分画像データ、B成分画像データ)を含んでいると言うことができる。各成分画像データは、1種類の色成分の値を、画素の値とする画像データである。
S15では、CPU210は、スキャンデータに対して、スキャンデータによって示されるスキャン画像を、拡大率Lrで拡大する拡大処理を実行して、拡大処理済みのスキャンデータを生成する。拡大率Lrは、例えば、ユーザによって、コピーの実行指示とともに入力される。拡大率Lrは、例えば、0.1〜6(10%〜600%)の範囲の値であり、1未満の拡大率Lrでの拡大処理は、スキャン画像のサイズを小さくする処理であり、1より大きな拡大率Lrでの拡大処理は、スキャン画像のサイズを大きくする処理である。スキャン画像のサイズは、具体的には、縦方向および横方向の画素数で定義される。なお、拡大処理前のスキャンデータを元画像データとも呼び、拡大処理済みのスキャンデータを対象画像データとも呼ぶ。以下では、単にスキャンデータと呼ぶとき、拡大処理済みのスキャンデータを意味する。
図3は、画像処理で用いられる画像の一例を示す第1の図である。図3(A)には、スキャンデータによって示されるスキャン画像SIの一例が示されている。スキャン画像SIは、複数個の画素を含む。該複数個の画素は、第1方向D1と、第1方向D1と直交する第2方向D2と、に沿って、マトリクス状に配置されている。
図3(A)のスキャン画像SIは、原稿の用紙の地色を示す白色の背景Bg1と、2個の文字とは異なるオブジェクトOb1、Ob2と、4個の文字Ob3〜Ob6と、を含んでいる。本実施例では、文字とは異なるオブジェクトは、写真である。
S20では、CPU210は、スキャンデータに対して、文字特定処理を実行する。文字特定処理は、スキャン画像SI内の複数個の画素を、文字を示す複数個の文字画素と、文字を示さない複数個の非文字画素と、に分類することによって、文字画素を特定する処理である。
文字特定処理によって、例えば、文字画素の値が「1」とされ、非文字画素の値が「0」とされた二値画像データ(文字特定データとも呼ぶ)が生成される。図3(B)には、文字特定データによって示される文字特定画像TIの一例が示されている。この文字特定画像TIには、スキャン画像SI内の4個の文字Ob3〜Ob6のエッジを構成する複数個の画素が、文字画素Tp3〜Tp7として、特定されている。なお、比較的大きな文字については、文字のエッジを構成する画素が文字画素として特定され、比較的小さな文字については、文字を構成する画素の全体が文字画素として特定される。文字特定処理の詳細は、後述する。
S30では、CPU210は、スキャンデータに対して、網点平滑化処理を実行して、平滑化画像を示す平滑化画像データを生成する。具体的には、CPU210は、スキャンデータに含まれる複数個の非文字画素の値のそれぞれに対して、ガウスフィルタなどの平滑化フィルタを用いた平滑化処理を実行して、平滑化処理済みの複数個の非文字画素の値を算出する。平滑化処理の対象となる非文字画素は、S20の文字特定処理によって生成された文字特定データを参照して特定される。CPU210は、スキャンデータに含まれる複数個の文字画素の値と、平滑化処理済みの複数個の非文字画素の値と、を含む平滑化画像データを生成する。
図3(C)には、平滑化画像データによって示される平滑化画像GIが示されている。平滑化画像GIは、白色の背景Bg1gと、スキャン画像SI内のオブジェクトOb1〜Ob6が平滑化されたオブジェクトOb1g〜Ob6gと、を含んでいる。これらのオブジェクトOb1g〜Ob6g、背景Bg2gのうち、文字Ob3g〜Ob6g以外の部分(非文字部分とも呼ぶ)は、スキャン画像SIと比較して、平滑化されている。
S40では、CPU210は、平滑化画像データに対して、文字鮮鋭化処理を実行して、処理済み画像データを生成する。具体的には、CPU210は、平滑化画像データに含まれる複数個の文字画素の値のそれぞれに対して、アンシャープマスク処理や鮮鋭化フィルタを適用する処理などの鮮鋭化処理を実行して、鮮鋭化処理済みの複数個の文字画素の値を算出する。鮮鋭化処理の対象となる文字画素は、S20の文字特定処理によって生成された文字特定データを参照して特定される。そして、CPU210は、平滑化画像データに含まれる複数個の非文字画素の値(平滑化処理済みの複数個の非文字画素の値)と、鮮鋭化処理済みの複数個の文字画素の値と、を含む処理済み画像データを生成する。平滑化画像データに含まれる複数個の文字画素の値は、平滑化処理の対象ではないので、スキャンデータに含まれる複数個の文字画素の値と同じである。したがって、本ステップの文字鮮鋭化処理は、スキャンデータに含まれる複数個の文字画素の値に対して実行される、とも言うことができる。
図3(D)には、処理済み画像データによって示される処理済み画像FIが示されている。処理済み画像FIは、白色の背景Bg1fと、スキャン画像SI内のオブジェクトOb1〜Ob6に対応するオブジェクトOb1f〜Ob6fを含んでいる。これらのオブジェクトOb1f〜Ob6fのうち、文字Ob3f〜Ob6fのエッジは、スキャン画像SI内の文字Ob3〜Ob6や、平滑化画像GI内の文字Ob3g〜Ob6gと比較して、鮮鋭化されている。また、写真Ob1f、Ob2fのエッジは、鮮鋭化されていない。
以上の説明から解るように、処理済み画像FI内のオブジェクトOb1f〜Ob6f、背景Bg2fは、鮮鋭化された文字と、平滑化された非文字を含む。
S50では、CPU210は、処理済み画像データを用いて印刷データを生成する印刷データ生成処理を実行する。具体的には、RGB画像データである処理済み画像データに対して色変換処理が実行されて、印刷に用いられる色材に対応する色成分(C、M、Y、Kの成分)を有する色値であるCMYK値で画素ごとの色を示すCMYK画像データが生成される。色変換処理は、例えば、公知のルックアップテーブルを参照して実行される。CMYK値画像データに対して、ハーフトーン処理が実行されて、印刷に用いられる色材ごと、かつ、画素ごとに、ドットの形成状態を示すドットデータが生成される。ドットの形成状態は、例えば、ドット有、ドット無の2種類の状態や、大ドット、中ドット、小ドット、ドット無の4種類の状態を取り得る。ハーフトーン処理は、例えば、ディザ法や、誤差拡散法に従って実行される。該ドットデータは、印刷時に用いられる順に並べ替えられ、該ドットデータに、印刷コマンドが付加されることによって、印刷データが生成される。
S60では、CPU210は、印刷処理を実行して、画像処理を終了する。具体的には、CPU210は、印刷データを印刷実行部280に供給して、印刷実行部280に処理済み画像を印刷させる。
以上説明した画像処理によれば、スキャンデータのうち、特定済みの複数個の文字画素の値に対して第1の画像処理(具体的には、エッジ鮮鋭化処理)が実行され(S40)、複数個の非文字画素の値に対して第1の画像処理とは異なる第2の画像処理(具体的には、網点平滑化処理)が実行され(S30)、処理済み画像データが生成される。この結果、文字画素の値と、文字画素とは異なる画素の値と、に対して、互いに異なる画像処理が実行されるので、スキャンデータに対する適切な画像処理を実現できる。なお、変形例では、S40の文字鮮鋭化処理が先に実行され、その後に、S30の網点平滑化処理が実行されても良い。
より具体的には、鮮鋭化処理済みの複数個の文字画素の値と、平滑化処理済みの複数個の非文字画素の値と、を含む処理済み画像データが生成される(S30、S40)。この結果、見栄えの良い処理済み画像FIを示す処理済み画像データを生成することができる。
例えば、図3(D)の処理済み画像FIに示すように、処理済み画像データでは、文字画素の値には、鮮鋭化処理済みの値が用いられている。この結果、処理済み画像FIの文字がシャープに見えるので、例えば、印刷される処理済み画像FIの見栄えを向上することができる。
また、処理済み画像データでは、処理済み画像FI内の写真などの文字とは異なるオブジェクトを構成する非文字画素の値には、平滑化処理済みの値が用いられている。この結果、処理済み画像FIの文字とは異なる部分に、例えば、モアレの原因となる網点が表れることを抑制できるので、印刷される処理済み画像FIにモアレなどの不具合が発生することを抑制できる。この結果、印刷される処理済み画像FIの見栄えを向上することができる。また、写真内のエッジが過度に強調されることが抑制されるので、画像FIの見栄えをさらに向上することができる。
例えば、スキャンデータの生成に用いられた原稿は、画像が印刷された印刷物である。このため、例えば、原稿内の白とは異なる色を有する部分は、画像を形成するドットレベルでみると、網点を形成している。網点は、複数個のドットと、ドットが配置されていない部分(原稿の地色を示す部分)と、を含む。このために、スキャン画像SI内の原稿内の白とは異なる色を有する部分には、画素レベルでみると、網点が示されている。網点内のドットは、原稿の印刷時に用いられるディザマトリクスなどの影響によって、周期性を持って並んでいる。このためにスキャンデータを用いて印刷を行うと、ハーフトーン処理前の元画像(スキャン画像SI)内に存在している網点のドットの周期成分と、印刷画像を構成する網点のドットの周期成分と、が干渉して、モアレが表れやすい。本実施例の処理済み画像FIでは、平滑化処理によって、元画像(スキャン画像SI)内のエッジとは異なる部分のドットの周期成分が低減される。この結果、処理済み画像データを用いて、処理済み画像FIを印刷する場合に、例えば、印刷される処理済み画像FIにモアレが発生することを抑制できる。
特に、上記画像処理では、処理済み画像データを用いて、印刷データが生成される(S50)ので、例えば、印刷される処理済み画像FIに発生しやすいモアレを抑制可能な適切な印刷データを生成することができる。
A−3:文字特定処理
図2のS20の文字特定処理について説明する。S22では、CPU210は、スキャンデータを用いて、第1の二値画像データ生成処理を実行して、第1の二値画像データを生成する。第1の二値画像データは、エッジ画素と非エッジ画素とを示す二値データである。ここで、第1の二値画像データによって示されるエッジ画素を第1のエッジ画素とも呼び、第1の二値画像データによって示される非エッジ画素を第1の非エッジ画素とも呼ぶ。第1の二値画像データ生成処理の詳細は、後述する。
S24では、CPU210は、スキャンデータを用いて、第2の二値画像データ生成処理を実行して、第2の二値画像データを生成する。第2の二値画像データは、第1の二値画像データと同様に、エッジ画素と非エッジ画素とを示す二値データである。第2の二値画像データは、第1の二値画像データとは異なる処理によって生成され、第1の二値画像データとは異なるデータである。ここで、第2の二値画像データによって示されるエッジ画素を第2のエッジ画素とも呼び、第2の二値画像データによって示される非エッジ画素を第2の非エッジ画素とも呼ぶ。第2の二値画像データ生成処理の詳細は、後述する。
S26では、CPU210は、S22にて生成された第1の二値画像データと、S24にて生成された第2の二値画像データと、を合成する論理和合成処理を実行して、最終的に特定されるエッジ画素と非エッジ画素とを示す二値画像データ(エッジ特定データとも呼ぶ)を生成する。具体的には、CPU210は、第1の二値画像データと、第2の二値画像データと、の各画素の論理和を取ることによって、エッジ特定データとしての二値画像データを生成する。換言すれば、CPU210は、第1の二値画像データによって特定される複数個の第1のエッジ画素と、第2の二値画像データによって特定される複数個の第2のエッジ画素と、を含む画素群であって、第1のエッジ画素とも第2のエッジ画素とも異なる画素を含まない画素群を、最終的に、複数個のエッジ画素として特定する。この結果、第1の二値画像データと第2の二値画像データとを用いて、対象画像内の画素がエッジ画素であるか否かを精度良く判断することができる。例えば、スキャン画像SI内のエッジ画素の特定漏れを効果的に低減できる。
エッジ特定データによって特定されるエッジ画素は、文字画素の候補となる画素であり、文字候補画素とも呼ぶ。例えば、エッジ特定データは、文字候補画素(本実施例ではエッジ画素)の値が「1」とされ、文字候補画素ではない画素(本実施例では、非エッジ画素)の値が「0」とされた二値画像データである。
図4は、文字特定処理で用いられる画像の一例を示す図である。図4(A)には、エッジ特定データによって示されるエッジ特定画像EIの一例が示されている。このエッジ特定画像EIには、スキャン画像SI内のオブジェクトOb1〜Ob6のエッジEg1〜Eg6を構成する複数個のエッジ画素が、文字候補画素として特定されている。このように、文字候補画素によって示されるエッジは、文字のエッジを含む。また、該エッジは、文字とは異なるオブジェクト(例えば、写真)に含まれる細線などのエッジを含む。
S27では、S15の拡大処理における拡大率Lrは、閾値Lth未満であるか否かを判断する。例えば、拡大率の閾値Lthは、例えば、3(300%)である。拡大率Lrが閾値Lth未満である場合には(S27:YES)、CPU210は、S28に処理を進める。
S28では、CPU210は、スキャンデータに対して、非文字領域判定処理を実行して、非文字領域を特定する。すなわち、非文字領域を構成する複数個の画素と、非文字領域を構成しない複数個の画素と、を示す二値画像データ(非文字領域データとも呼ぶ)を生成する。詳細は、後述するが、非文字領域判定処理では、CPU210は、スキャンデータを用いて、スキャン画像SI内に配置される複数個の対象領域のそれぞれが、文字とは異なるオブジェクト(例えば、写真)を示す非文字領域であるか否かを対象領域ごとに判断する。CPU210は、対象領域ごとの判断結果に基づいて、非文字領域データを生成する。非文字領域データは、例えば、非文字領域を構成する画素の値が「1」とされ、非文字領域を構成しない画素の値が「0」とされた二値画像データである。
図4(B)には、非文字領域データによって示される非文字領域画像AIの一例が示されている。この非文字領域画像AIは、スキャン画像SI内の写真Ob1、Ob2に対応する領域に、非文字領域AA1、AA2が特定されている。
S29では、CPU210は、S26にて生成されたエッジ特定データと、S28にて生成された非文字領域データと、を合成する合成処理を実行して、文字画素と非文字画素とを示す上述した文字特定データ(図3(B)参照)を生成する。具体的には、CPU210は、エッジ特定データにて特定される複数個の文字候補画素のうち、非文字領域データにて特定される非文字領域AA1、AA2内に位置しない画素を、文字画素として特定する。CPU210は、エッジ特定データにて特定される複数個の文字候補画素のうち、非文字領域AA1、AA2内に位置する画素と、文字候補画素ではない画素を、非文字画素として特定する。換言すれば、スキャン画像SI内の複数個の画素のうち、S22〜S26にて文字候補画素であると決定され、かつ、S28にて決定される非文字領域とは異なる領域にある画素が、文字画素として特定される。文字特定データが生成されると、文字特定処理は、終了される。
拡大率Lrが閾値Lth以上である場合には(S27:NO)、CPU210は、S28、S29をスキップして文字特定処理を終了する。この場合には、S26の論理和合成処理によって生成されたエッジ特定データが、最終的な文字特定データとされる。すなわち、この場合には、CPU210は、S22〜S26において文字候補画素であると決定される画素を、文字画素として特定する。なお、変形例としては、CPU210は、S28の非文字領域判定処理を実行した後に、S27の判断を実行しても良い。すなわち、S28の後に、拡大率Lrが閾値Lth未満であるか否かが判断されても良い。この場合にも、拡大率Lrが閾値Lth未満である場合には、S29が実行されて、文字特定データが生成される。そして、拡大率Lrが閾値Lth以上である場合には、S29がスキップされ、S26の論理和合成処理によって生成されたエッジ特定データが、最終的な文字特定データとされる。
A−4:第1の二値画像データ生成処理
図2のS22の第1の二値画像データ生成処理について説明する。図5は、第1の二値画像データ生成処理のフローチャートである。S100では、CPU210は、スキャンデータに含まれる3個の成分画像データ、すなわち、R成分画像データ、G成分画像データ、B成分画像データのそれぞれに対して、平滑化処理を実行する。これによって、3個の平滑化済みの成分画像データ、すなわち、平滑化済みのR成分画像データ、平滑化済みのG成分画像データ、平滑化済みのB成分画像データが生成される。
平滑化処理は、処理対象の成分画像データによって示される成分画像を平滑化する処理である。本実施例の平滑化処理は、処理対象の成分画像データの各画素の値に対して、所定の平滑化フィルタを適用して、平滑化済みの各画素の値を算出する処理である。平滑化フィルタには、例えば、縦7画素×横7画素のサイズのガウスフィルタが用いられる。
S110では、3個の平滑化済みの成分画像データのそれぞれに対して、エッジ強調処理を実行して、3個のエッジ強調済みの成分画像データ、すなわち、エッジ強調済みのR成分画像データ、エッジ強調済みのG成分画像データ、エッジ強調済みのB成分画像データを生成する。
図6は、エッジ強調処理のフローチャートである。ここでは、平滑化済みのR成分画像データが処理対象であるとして説明する。平滑化済みのG成分画像データおよび平滑化済みのB成分画像データに対しても同様の処理が行われる。
S200では、CPU210は、エッジ強調済みのR成分画像データを生成するためのキャンバスデータをメモリ(具体的には、揮発性記憶装置220のバッファ領域)に準備する。キャンバスデータによって示されるキャンバス(初期画像)は、スキャン画像SIと同じサイズの画像、すなわち、同じ画素数の画像である。キャンバスデータの各画素の値は、所定の初期値(例えば、0)である。
S205では、CPU210は、平滑化済みのR成分画像データによって示される平滑化済みのR成分画像内の複数個の画素から1個の注目画素を選択する。
S210では、CPU210は、注目画素に対応するマスク値MVを算出する。マスク値MVは、注目画素の値TVと、注目画素に対して上下左右に隣接する4個の画素を含む所定個数の周辺画素の値と、を用いて、注目画素の値TVを平滑化する処理によって算出される。このために、マスク値MVを、平滑値とも呼ぶ。具体的には、注目画素を中心とする縦10画素×横10画素の矩形の範囲内の100個の画素の値の平均値が、注目画素に対応するマスク値MVとして算出される。
S220では、CPU210は、注目画素の値TVと、注目画素に対応するマスク値MVと、の差分ΔVを算出する(ΔV=(TV−MV))。
S230では、CPU210は、差分ΔVは、基準以上であるか否かを判断する。具体的には、差分ΔVが、予め定められた閾値TH以上であるか否かが判断される。閾値THは、成分値が、0〜255の範囲の256階調の値である場合に、例えば、20〜30程度の値である。
差分ΔVが基準以上である場合には(S230:YES)、S240にて、CPU210は、注目画素の値TVと、注目画素に対応する差分ΔVと、の和(TV+ΔV)を、処理済みの値として算出する。差分ΔVが基準未満である場合には(S230:NO)、CPU210は、S240をスキップする。
S245では、CPU210は、注目画素の値を、S200にて準備されたキャンバスデータに記録する。S240が実行された場合には、S240にて算出された注目画素の値TVと、注目画素に対応する差分ΔVと、の和が、処理済みの値としてキャンバスデータに記録される。S240がスキップされた場合には、平滑化済みのR成分画像データの注目画素の値が、そのまま、キャンバスデータに記録される。
S250では、CPU210は、R成分画像内の全ての画素を注目画素として処理したか否かを判断する。未処理の画素がある場合には(S250:NO)、CPU210は、S205に戻って、未処理の画素を注目画素として選択する。全ての画素が処理された場合には(S250:YES)、CPU210は、エッジ強調処理を終了する。この時点でエッジ強調済みのR成分画像データが生成されている。
図7は、平滑化済みのR成分画像データと、エッジ強調済みのR成分画像データと、の説明図である。図7(A)には、図5のS100の平滑化処理前のR成分画像データを概念的に示すグラフが図示されている。図7(B)、図7(C)には、それぞれ、平滑化処理済みのR成分画像データ、および、エッジ強調済みのR成分画像データを概念的に示すグラフが図示されている。各グラフのうち、左側の部分には、網点を示す網点領域が概念的に示され、右側の部分には、文字などのオブジェクトのエッジを示すエッジ領域が概念的に示されている。各グラフの縦軸は、R成分の値を示し、横軸は、所定の方向(例えば、図3の第1方向D1)の位置を示す。
平滑化処理前のR成分画像データには、例えば、網点領域において、複数個の網点と、該網点間の複数個の隙間と、に対応する複数個の谷部C1〜C3と、複数個の山部P1、P2と、が現れる(図7(A))。このような谷部C1〜C3と、複数個の山部P1、P2と、の間のR成分の値の差が大きいまま残存していると、後述するS150の二値化処理において、該R成分の値の差に起因して、網点を示すエッジ画素が特定されやすい。網点領域は、画素レベルの視点(網点を認識できる程度のミクロの視点)でみれば、網点を含むが、観察者の視点(網点を認識できない程度のマクロの視点)でみれば、均一な領域である。このため、本実施例では、網点領域内において、網点に起因するエッジ画素は、特定されるべきではない。網点領域は、図2のS30で平滑化されることが好ましく、S40にて、鮮鋭化されるべきではないからである。仮に、網点のエッジが鮮鋭化されると、網点の周期性が目立つために、該画像を印刷する場合に、モアレが目立ちやすくなるからである。例えば、スキャン画像SI内の写真などのオブジェクト内の均一な部分において、エッジ画素は、特定されるべきではない。
平滑化済みのR成分画像データでは、平滑化処理によって、例えば、網点領域において、複数個の谷部C1a〜C3aと、複数個の山部P1a、P2aと、のR成分の値の差が、平滑化処理前のR成分画像データと比較して十分に小さくなっている(図7(B))。
ここで、本実施例のエッジ強調処理では、注目画素の値TVと、注目画素に対応するマスク値MVと、の差分ΔVと、が大きいほど、エッジ強調の効果が大きくなる。このために、図7(B)の網点領域のように、比較的R成分の値の差が小さく平坦になっている領域では、エッジ強調の効果が小さくなる。また、本実施例のエッジ強調処理では、差分ΔVが基準未満である場合には、エッジ強調が行われずに、平滑化済みのR成分画像データの画素の値がそのまま採用される(図6のS230)。この結果、エッジ強調済みのR成分画像データでは、エッジ強調処理が行われたにも関わらずに、例えば、網点領域において、複数個の谷部C1b〜C3bと、複数個の山部P1b、P2bと、のR成分の値の差は、平滑化処理済みのR成分画像データと比較して大きくなってはいない(図7(C))。すなわち、平滑化済みのR成分画像データと同様に、エッジ強調済みのR成分画像データでは、複数個の谷部C1b〜C3bと、複数個の山部P1b、P2bと、のR成分の値の差が、平滑化処理前のR成分画像データ(図7(A))と比較して十分に小さくなっている(図7(C))。
平滑化処理前のR成分画像データには、例えば、文字などのオブジェクトのエッジを示すエッジ領域において、該エッジに対応してR成分の値が急激に変化する変動部E1が現れる(図7(A))。このような変動部E1において、値の変化が大きいほど、後述するS150の二値化処理において、該R成分の値の差に起因して、オブジェクトのエッジを示すエッジ画素が特定されやすい。
平滑化済みのR成分画像データでは、平滑化処理によって、例えば、エッジ領域において、変動部E1aにおける値の変化が、平滑化処理前のR成分画像データと比較して小さくなっている(緩やかになっている)(図7(B))。
しかしながら、文字などのオブジェクトのエッジに対応する変動部E1aにおける値の変化は、網点領域における値の変化よりは十分に大きいので、エッジ強調処理によって、再度、急激な変化に戻される。この結果、エッジ強調済みのR成分画像データでは、エッジ領域において、変動部E1bのR成分の値の変化は、平滑化処理済みのR成分画像データと比較して大きくなっている(図7(C))。このため、エッジ強調済みのR成分画像データでは、エッジ領域において、変動部E1bにおける値の変化が、平滑化処理前のR成分画像データと比較して、同程度、もしくは、急激になっている(図7(C))。
以上の説明から解るように、本実施例では、各成分画像データに対して、平滑化処理(S100)と、エッジ強調処理(S110)とを、この順序で実行するので、網点のエッジを示すエッジ画素が特定されることを抑制することができ、かつ、文字などのオブジェクトのエッジを示すエッジ画素が特定されることを促進することができる。この結果、スキャン画像SI内の複数個のエッジ画素を適切に特定することができる。
R、G、Bの3個の色成分に対応する3個の強調処理済みの成分画像データが生成されると、図5の120では、該3個の強調処理済みの成分画像データを用いて、輝度画像データを生成する。輝度画像データは、該3個の強調処理済みの成分画像データによって示される強調済画像内の複数個の画素の輝度を示すデータである。具体的には、CPU210は、該3個の強調処理済みの成分画像データから取得される各画素のR値、G値、B値を用いて、各画素の輝度Yを算出する。輝度Yは、例えば、上記3成分の加重平均であり、具体的には、Y=0.299×R+0.587×G+0.114×Bの式を用いて算出できる。輝度画像データは、1種類の成分値(輝度を示す値)で構成される単成分画像データである。輝度成分データは、スキャンデータの対応する画素の値(RGB値)に基づく輝度Yを画素ごとに含んでいる。
S130では、CPU210は、生成された輝度画像データに対して、当該輝度画像データによって示される輝度画像内のエッジを抽出するエッジ抽出処理を実行して、エッジ抽出データを生成する。具体的には、CPU210は、輝度画像データの各画素の値に、公知のエッジ抽出フィルタ、例えば、ソーベルフィルタ(Sobel filter)を適用して、各画素のエッジ強度を算出する。CPU210は、これらのエッジ強度を、複数個の画素の値とするエッジ抽出データを生成する。
S140では、CPU210は、エッジ抽出データに対して、レベル補正処理を実行して、補正処理済みのエッジ抽出データを生成する。レベル補正処理は、エッジ抽出データの画素の値が取り得る階調値の範囲(本実施例では、0〜255の範囲)内の特定範囲を拡大する補正処理である。
図8は、レベル補正処理のためのトーンカーブの一例を示す図である。具体的には、CPU210は、エッジ抽出データの各画素に対して、図8のトーンカーブを適用する。この結果、閾値Vb(例えば、245)以上の値は、全て最大値(255)に変換されるとともに、閾値Va(例えば、10)以下の値は、全て最小値(0)に変換される。そして、閾値Vaより大きく、かつ、閾値Vb未満の範囲は、0から255の範囲に拡大される。このように、後述するS150の二値化処理の前に、二値化閾値を含む範囲(図8の閾値Vaより大きく、かつ、閾値Vb未満の範囲)を拡大するので、二値化の精度を向上できる。
S150では、CPU210は、補正処理済みのエッジ抽出データに対して、二値化処理を実行して、二値画像データを生成する。例えば、CPU210は、エッジ画像データにおいて、画素の値(すなわち、エッジ強度)が閾値(例えば、128)以上である画素を、エッジ画素に分類し、画素の値が閾値未満である画素を、非エッジ画素に分類する。二値画像データでは、上述したように、エッジ画素の値は、「1」とされ、非エッジ画素の値は、「0」とされる。
以上説明した第1の二値画像データ生成処理によれば、図7を参照して説明したように、複数個の成分画像データのそれぞれに対して平滑化処理を実行することで、スキャン画像SI内に現れる網点の特徴を低減できる。さらに、図7を参照して説明したように、複数個の平滑化済みの成分画像データのそれぞれに対して、エッジ強調処理を実行することで、平滑化処理によって平滑化されたスキャン画像SI内のエッジを適切に強調できる。この結果、網点に起因するエッジ画素が特定されることを抑制しつつ、スキャン画像SI内のエッジ画素の適切に特定できる。
さらに、単成分画像データとして、輝度画像データが用いられるので、スキャン画像SI内の複数個のエッジ画素をより適切に特定できる。例えば、網点は、印刷に用いられるC、M、Yの原色を有することが多いが、このような複数種の原色間の差は、R、G、Bの各成分画像データにおいて比較的大きくなるが、輝度画像データでは、比較的小さくなる。このために、輝度画像データを用いることで、網点に起因するエッジ画素が特定されることを適切に抑制できる。また、文字の読みやすさのために、文字の色と背景の色とは、輝度に比較的大きな差があることが多い。このために、輝度画像データを用いることで、文字をはじめとするオブジェクトのエッジを示すエッジ画素を適切に特定できる。
さらに、図6のエッジ強調処理では、注目画素に対応するマスク値(平滑値とも呼ぶ)の算出(S210)と、注目画素の値TVと注目画素に対応するマスク値との差分ΔVの算出(S220)と、注目画素の値TVと対応する差分ΔVとの和(TV+ΔV)の算出(S240)と、を含むいわゆるアンシャープマスク処理が実行される。この結果、スキャン画像SIのエッジを適切に強調できるので、特定すべきエッジ画素の特定漏れを抑制できる。この結果、スキャン画像SI内のエッジ画素をより適切に特定できる。
さらに、図6のエッジ強調処理では、スキャン画像SI内の複数個の画素のうち、対応する差分ΔVが基準以上である画素については、アンシャープマスク処理の対象とされ、該差分ΔVが基準未満である画素については、アンシャープマスク処理の対象とされない(S230、240)。この結果、図7を参照して説明したように、スキャン画像SIの網点に起因する画素間の値の差が強調されることをさらに抑制できるので、網点に起因するエッジ画素の特定をさらに抑制できる。そして、文字などのオブジェクトのエッジについては適切に強調できる。したがって、スキャン画像SI内のエッジ画素をさらに適切に特定できる。
A−5:第2の二値画像データ生成処理
図2のS24の第2の二値画像データ生成処理について説明する。図9は、第2の二値画像データ生成処理のフローチャートである。S300では、CPU210は、スキャンデータを用いて、最小成分データを生成する。具体的には、CPU210は、スキャンデータに含まれる複数個の画素の値(RGB値)のそれぞれから、最小成分値Vminを取得する。最小成分値Vminは、RGB値に含まれる複数個の成分値(R値、G値、B値)のうちの最小値である。CPU210は、これらの最小成分値Vminを複数個の画素の値とする画像データを、最小成分データとして生成する。最小成分データは、スキャン画像SIと同じサイズの画像を示す画像データである。最小成分データに含まれる複数個の画素の値のそれぞれは、スキャンデータの対応する画素の値(RGB値)の最小成分値Vminである。
図10は、スキャンデータの最小成分値と最大成分値の説明図である。図10(A)〜図10(E)には、RGB値の一例として、シアン(C)、マゼンタ(M)、イエロ(Y)、黒(K)、白(W)のRGB値が、棒グラフで図示されている。図10に示すように、C、M、Y、K、WのRGB値(R、G、B)は、それぞれ、(0、255、255)、(255、0、255)(255、255、0)、(0、0、0)、(255、255、255)である。
これらのRGB値の輝度Yは、上述したように、例えば、Y=0.299×R+0.587×G+0.114×Bの式を用いて算出できる。C、M、Y、K、Wの輝度(0〜255の値で表す)は、約186、113、226、0、255であり、それぞれに異なる値となる(図10)。これに対して、C、M、Y、K、Wの最小成分値Vminは、図10に示すように、0、0、0、0、255となり、白(W)を除いて同じ値となる。
図11は、画像処理に用いられる画像の一例を示す第2の図である。図11(A)は、スキャン画像SIのうち、上述した網点領域の拡大図である。例えば、図11(A)の例では、スキャン画像SI内の網点領域は、複数個のMドットMDと、複数個のYドットYDと、を含んでいる。ここでは、説明のために、MドットMDを示す画像は、マゼンタの原色を有する均一な画像であり、YドットYDを示す画像は、イエロの原色を有する均一な画像であるとする。
図11(B)には、最小成分データによって示される最小成分画像MNIの一例が示されている。この最小成分画像MNIは、図11(A)のスキャン画像SIに対応している。最小成分画像MNIでは、スキャン画像SIのYドットMDに対応する領域MDb内の画素の値と、YドットYDに対応する領域YDb内の画素の値と、は互いに同じとなる。図11(C)には、比較例として、各画素の輝度を示す輝度画像データによって示される輝度画像YIが示されている。この輝度画像YIは、図11(A)のスキャン画像SIに対応している。輝度画像YIでは、最小成分画像MNIとは異なり、スキャン画像SIのMドットMDに対応する領域MDd内の画素の値と、YドットYDに対応する領域YDd内の画素の値と、は互いに異なる。
以上の説明から解るように、最小成分画像MNIでは、スキャン画像SIにおいて、原稿内のC、M、Y、Kドットが形成された部分に対応する複数個の画素の値の間の差が、輝度画像YIよりも小さくなる。そして、最小成分画像MNIでは、スキャン画像SIにおいて、原稿内の地色(用紙の白色)を示す領域に対応する地色領域の画素の値が、ドットが形成された部分に対応する画素の値よりも大きくなる。
S310では、CPU210は、生成された最小成分データに対して、該最小成分データによって示される最小成分画像MNIを平滑化する平滑化処理を実行して、平滑化済みの最小成分データを生成する。具体的には、CPU210は、最小成分データの各画素の値に、所定の平滑化フィルタ、本実施例では、縦5画素×横5画素のガウスフィルタを適用することによって、平滑化済みの各画素の値を算出する。平滑化済みの最小成分データは、スキャンデータの対応する画素の値(RGB値)に基づいて上述した処理で生成された平滑化済みの値を画素ごとに含んでいる。
S320では、CPU210は、平滑化済みの最小成分データに対して、当該平滑化済みの最小成分データによって示される平滑化済みの最小成分画像MNI内のエッジを抽出するエッジ抽出処理を実行して、エッジ抽出データを生成する。具体的には、CPU210は、平滑化済みの最小成分データの各画素の値に、図5のS130の処理と同一のソーベルフィルタを適用して、エッジ強度を算出する。CPU210は、これらのエッジ強度を、複数個の画素の値とするエッジ抽出データを生成する。
S330では、CPU210は、エッジ抽出データに対して、レベル補正処理を実行して、補正処理済みのエッジ抽出データを生成する。レベル補正処理は、図5のS140の処理と同一である。S340では、CPU210は、補正処理済みのエッジ抽出データに対して、図5のS150の処理と同様の二値化処理を実行して、二値画像データを生成する。二値画像データでは、上述したように、エッジ画素の値は、「1」とされ、非エッジ画素の値は、「0」とされる。
以上説明した第2の二値画像データ生成処理によれば、最小成分データに対してエッジ抽出処理が実行され、エッジ抽出データが生成される(S320)。そして、該エッジ抽出データを二値化する処理(S340)を含むエッジ画素特定処理が実行することによって、スキャン画像SIの複数個のエッジ画素が特定される(S330、S340、図2のS26)。最小成分データでは、図11を参照して説明したように、網点領域において、画素間の値の差を抑制できるので、その後に、エッジ画素を特定する際に、網点に起因するエッジ画素が特定されることを抑制できる。したがって、スキャン画像SI内のエッジ画素を適切に特定できる。
より具体的に説明すると、網点領域を構成する要素は、C、M、Y、Kの各ドットと、用紙の地色(白)と、の5種類である。最小成分データでは、これらの要素のうち、4種類の要素を示す画素の間の値の差を抑制できる。この結果、最小成分データを用いる場合には、網点のエッジを示すエッジ画素が特定されることを抑制することができる。
一方で、文字の色と背景の色とは、一方が、濃い色を有し、他方が薄い色を有する場合が多い。このために、文字と背景のうち、一方は、用紙の地色(白)を示す部分を比較的多く含み、他方は、C、M、Y、Kのドットを示す部分を比較的多く含む場合が多い。図10に示すように、最小成分データでは、C、M、Y、Kのドットを示す部分の画素の値と、用紙の地色(白)を示す部分の画素の値と、の間で、大きな差がある。このために、最小成分データを用いて、エッジ画素を特定すると、文字のエッジを構成するエッジ画素は、適切に特定できる可能性が高い。特に、イエロ(Y)は、C、M、Kと比較して濃度が低い(輝度が高い)。このために、用紙の地色(白)の背景に、イエロの文字がある場合には、輝度画像データを二値化しても、該イエロの文字のエッジを構成するエッジ画素を、適切に特定できない場合がある。本実施例では、このような場合でも該イエロの文字のエッジを構成するエッジ画素を、適切に特定できる。このために、輝度画像データを用いたエッジ画素の特定に加えて、最小成分データを用いたエッジ画素の特定を実行することで、輝度画像データだけでは、特定できない文字などのエッジ画素を特定し得る。この結果、スキャン画像SI内のエッジ画素の特定精度を向上できる。
さらに、最小成分データに対して、エッジ抽出処理の前に平滑化処理が実行される(S310)。この結果、平滑化処理によって、最小成分画像MNI内の網点領域おいて、画素間の値の差を、さらに抑制できる。例えば、スキャン画像SI内の網点領域において、C、M、Y、Kのドットの重なりや、読取実行部290での読取時のぼけなどによって、ドットを示す部分は、必ずしもC、M、Y、Kの原色を有している訳ではない。このために、最小成分画像MNI内では、C、M、Y、Kの各ドットを示す複数個の画素の間の値が、小さくなってはいるものの、ゼロではない。平滑化処理によって、該画素の間の値の差をさらに小さくすることができる。この結果、網点に起因するエッジ画素が特定されることを、さらに抑制できる。また、第2の二値画像データ生成処理においても、第1の二値画像データ生成処理と同様に、レベル補正処理(S330)が実行されるので、スキャン画像SI内のエッジ画素の特定精度を向上できる。
以上説明したように、上記実施例では、2種類の単成分画像データ、すなわち、輝度画像データと、最小成分データと、を用いて、最終的にエッジ画素が特定される(図2のS22〜S26)。このように互いに異なる処理を用いて生成される2種類の単成分画像データを用いて、スキャン画像SI内の複数個のエッジ画素が特定されるので、スキャン画像SI内の複数個のエッジ画素の特定漏れを抑制できる。例えば、白の背景にイエロの文字がある場合には、白とイエロの輝度の差は比較的小さいので、輝度画像データを用いて、該文字のエッジを構成するエッジ画素を特定することは困難である。これに対して、図10(C)、(E)から解るように、最小成分データでは、白とイエロとの差が大きく現れるので、白の背景にイエロの文字がある場合には、最小成分データを用いて、該文字のエッジを構成するエッジ画素を特定することは容易である。また、例えば、マゼンタの背景にイエロの文字がある場合には、最小成分データには、マゼンタとイエロとの差が現れないので、最小成分データを用いて、該文字のエッジを構成するエッジ画素を特定することは困難である。これに対して、マゼンタの背景にイエロの文字がある場合には、マゼンタとイエロの輝度の差は、比較的大きいので、輝度画像データを用いて、該文字のエッジを構成するエッジ画素を特定することは容易である。
また、輝度画像データに加えて用いられる単成分画像データは、最小成分データであるので、上述の通り、スキャン画像SI内の網点に起因するエッジ画素が特定されることは、抑制できる。
A−6:非文字領域判定処理
図2のS28の非文字領域判定処理について説明する。図12は、非文字領域判定処理のフローチャートである。図13は、非文字領域判定処理で用いられる画像の一例を示す図である。
CPU210は、スキャンデータに対して、S405〜S420の前処理を実行して、前処理済画像データを生成する。
S405では、CPU210は、スキャンデータを用いて、上述した図9のS300と同様に、最小成分データを生成する。図9のS300で生成した最小成分データを、揮発性記憶装置220または不揮発性記憶装置230に保存しておく場合には、該最小成分データを利用しても良い。
S410では、CPU210は、最小成分データを二値化して、二値画像データを生成する。例えば、CPU210は、最小成分データにおいて、画素の値が閾値(例えば、128)以上である画素を、特定対象画素に分類し、画素の値が閾値以上である画素を、非特定対象画素に分類する。二値画像データでは、例えば、特定対象画素の値は、「1」とされ、非特定対象画素の値は、「0」とされる。上述したように、最小成分データでは、図10、図11を参照して説明したように、スキャン画像SIにおいて、原稿内のC、M、Y、Kドットが形成された部分に対応する複数個の画素の値が、原稿内の地色(用紙の白色)を示す領域に対応する地色領域の画素の値よりも小さくなる。したがって、本ステップで生成される二値画像データでは、原稿内のドットが形成された部分に対応する複数個の画素が、地色領域の複数個の画素が非特定対象画素に分類される。このように、最小成分データを二値化することで、原稿に印刷されたオブジェクト(ドットで形成される画像)を構成するオブジェクト画素を精度良く特定することができる。
ここで、本ステップで生成される二値画像データは、後述するS415の膨張処理を実行する前の画像データであるので、膨張処理前画像データとも呼び、膨張処理前画像データによって示される画像を膨張処理前画像OIとも呼ぶ。図13(A)には、膨張処理前画像OIの一例が示されている。膨張処理前画像OIでは、スキャン画像SI内のオブジェクトOb1〜Ob6に対応する特定対象画素Op1〜Op6が特定されている。原稿の文字は、比較的濃い色であることが多いので、膨張処理前画像OIにおいて、文字に対応する領域には、概ね隙間無く特定対象画素Op3〜Op6が特定される。原稿の写真領域には、全体にドットが形成されるので、膨張処理前画像OIにおいて、写真に対応する領域には、全体に特定対象画素Op1、Op2が特定される。ただし、写真は、濃い色も薄い色も含み得るので、膨張処理前画像OIにおいて、写真に対応する領域には、非特定対象画素(図13(A)の膨張処理前画像OI内の白色部分)も全体に分散して配置されている。
S415、S420では、CPU210は、膨張処理前画像データに対して、膨張処理と収縮処理とを実行して、前処理済画像データを生成する。図14、図15は、膨張処理と収縮処理について説明する図である。
S415では、CPU210は、膨張処理前画像データに対して、1回の膨張処理を実行する。図14(A)には、膨張処理前画像OIのうち、スキャン画像SI内の文字Ob3〜Ob6に対応する細線を含む部分画像PI1が示されている。図15(A)には、膨張処理前画像OIのうち、スキャン画像SI内の写真Ob1、Ob2に対応する領域の一部である部分画像PI2が示されている。図14(A)においてハッチングされた部分は、文字に対応する特定対象画素Optを示し、図15(A)においてハッチングされた部分は、写真に対応する特定対象画素Oppを示す。
膨張処理は、例えば、所定サイズのフィルタ、図14(A)の例では、縦3画素×横3画素のサイズのフィルタFI1を用いて、実行される。具体的には、CPU210は、フィルタFI1を、膨張処理前画像データに対して適用して、膨張処理済みの二値画像データを生成する。すなわち、CPU210は、注目画素に、フィルタFI1の中心位置CC1(図14(A)参照)が重なるように、フィルタFI1を、膨張処理前画像OI上に配置する。CPU210は、フィルタFI1の範囲内に、特定対象画素が1個でも存在する場合には、生成すべき二値画像において注目画素に対応する画素を特定対象画素に設定する。CPU210は、フィルタFI1の範囲内に、特定対象画素が1つもない場合、すなわち、フィルタFI1の範囲内の9個の画素が、非特定対象画素である場合には、生成すべき二値画像において注目画素に対応する画素を非特定対象画素に設定する。CPU210は、二値画像BIの全ての画素を注目画素として、生成すべき二値画像内の対応する画素を、特定対象画素および非特定対象画素のいずれかに設定することによって、膨張処理済みの二値画像データを生成する。
図14(B)には、図14(A)の部分画像PI1に対応する膨張処理済みの部分画像PI1bが示されている。図15(B)には、図15(A)の部分画像PI2に対応する膨張処理済みの部分画像PI2bが示されている。図14(B)に示すように、膨張処理済みの二値画像(例えば、部分画像PI1b)では、文字に対応する特定対象画素Optによって示される線は、膨張処理前と比較して、太くなる。図15(B)に示すように、膨張処理済みの二値画像(例えば、部分画像PI2b)では、膨張処理前において写真に対応する領域内に混じっている非特定対象画素VA(図15(A))が、特定対象画素Oppに変更されて、写真に対応する領域内の全体が、特定対象画素Oppで構成される。
S420では、CPU210は、膨張処理済みの二値画像データに対して、3回の収縮処理を実行する。
収縮処理は、例えば、所定サイズのフィルタ、図14(B)の例では、縦3画素×横3画素のサイズのフィルタFI2を用いて、膨張処理済みの二値画像データに対して実行される。具体的には、CPU210は、フィルタFI2を、二値画像データに対して適用して、収縮処理済みの二値画像データを生成する。すなわち、CPU210は、注目画素に、フィルタFI2の中心位置CC2(図14(B)参照)が重なるように、フィルタFI2を膨張処理済みの二値画像(例えば、部分画像PI1b、PI2b)に配置する。CPU210は、フィルタFI2の範囲内に、非特定対象画素が1個でも存在する場合には、生成すべき二値画像において注目画素に対応する画素を非特定対象画素に設定する。そして、CPU210は、フィルタFI2の範囲内に、非特定対象画素が1つもない場合には、生成すべき二値画像において注目画素に対応する画素を特定対象画素に設定する。CPU210は、膨張処理済みの二値画像の全ての画素を注目画素として、生成すべき二値画像内の対応する画素を、特定対象画素および非特定対象画素のいずれかに設定することによって、収縮処理済みの二値画像データを生成する。
図14(C)には、図14(B)の部分画像PI1bに対応する収縮処理済みの部分画像PI1cが示されている。図15(C)には、図15(B)の部分画像PI2bに対応する収縮処理済みの部分画像PI2cが示されている。図14(C)に示すように、膨張処理済みの二値画像(例えば、部分画像PI1c)では、文字に対応する特定対象画素Optに示される線は、収縮処理前と比較して、細くなる。収縮処理前において写真に対応する領域には、非特定対象画素VAが混じっていないので(図15(B))、図15(C)に示すように、収縮処理済みの二値画像(例えば、部分画像PI2c)では、写真に対応する領域内の全体が、特定対象画素Oppのまま維持される。
CPU210は、1回目の収縮処理済みの二値画像データに対して、同様の収縮処理を実行して、2回目の収縮処理済みの二値画像データを生成し、2回目の収縮処理済みの二値画像データに対して、同様の収縮処理を実行して、3回目の収縮処理済みの二値画像データを生成する。3回目の収縮処理済みの二値画像データを、前処理済画像データともよび、前処理済画像データによって示される画像を、前処理済画像OIbとも呼ぶ。
図13(B)には、前処理済画像OIbの一例が示されている。前処理済画像OIbは、スキャン画像SI内のオブジェクトOb1〜Ob6に対応する特定対象画素Op1b〜Op6bが特定されている。
前処理済画像OIbでは、文字に対応する特定対象画素Op3b〜Op6bで示される線は、膨張処理前画像OIと比較して、細くなっている。これは、収縮処理の回数(本実施例では、3回)が、膨張処理の回数(本実施例では、1回)より多いために、収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きいからである。なお、膨張処理前画像OIにて文字に対応する特定対象画素Op3〜Op6で示される線が比較的細い場合には、収縮処理によって、文字に対応する特定対象画素Op3〜Op6の全部または一部が、消滅する場合もある。非文字領域判定処理では、非文字領域が特定できれば良いので、文字に対応する特定対象画素Op3〜Op6は、消滅しても構わない。
前処理済画像OIbでは、写真に対応する領域内の全体が、特定対象画素Op1b、Op2bで構成される。これは、膨張処理によって、一旦、写真に対応する領域内の全体が、特定対象画素になった後では、収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きくても、写真に対応する領域内の全体が、特定対象画素のまま維持されるためである。収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きいために、前処理済画像OIbでは、写真に対応する複数個の特定対象画素Op1b、Op2bが位置する領域の全体が、膨張処理前画像OIにて写真に対応する複数個の特定対象画素Op1、Op2が位置する領域の全体よりも僅かに小さくなるが、その差は問題にならない程度である。
S425では、CPU210は、前処理済画像データに対して、ラベリング処理を行うことによって、複数個の対象領域を決定する。具体的には、CPU210は、連続する1以上の特定対象画素で構成される1つの領域を一つの対象領域として、一つの識別子を割り当てる。そして、CPU210は、互いに離れた複数の対象領域に、互いに異なる識別子を割り当てる。このようなラベリング処理によって、複数個の対象領域が特定される。図13(B)の例では、スキャン画像SI内の4個の文字Ob3b〜Ob6に対応する4個の対象領域TA3〜TA6と、スキャン画像SI内の2個の写真Ob1、Ob2に対応する2個の対象領域TA1、TA2と、が決定される。スキャン画像SIの複数個の画素と、膨張処理前画像OIの複数個の画素とは、一対一で対応しているので、膨張処理前画像OI上に対象領域を決定することは、スキャン画像SI上に対象領域を決定することと同義である。
S430では、CPU210は、非文字領域データを生成するためのキャンバスデータをメモリ(具体的には、揮発性記憶装置220のバッファ領域)に準備する。キャンバスデータによって示されるキャンバス(初期画像)は、スキャン画像SIと同じサイズの二値画像、すなわち、同じ画素数の二値画像である。キャンバスデータの各画素の値は、非文字領域とは異なる領域の画素であることを示す所定の初期値(例えば、0)である。
S435では、CPU210は、前処理済画像OIbに決定済みの複数個の対象領域の中から、1個の注目対象領域を選択する。
S440では、CPU210は、注目対象領域を構成する特定対象画素の画素数PNを算出する。S445では、CPU210は、画素数PNが閾値TH1以上であるか否かを判断する。閾値TH1は、原稿のサイズやスキャン画像SIの解像度に応じた値であり、文字や写真を含む原稿に基づくスキャンデータを用いて、経験的に予め定められる。画素数PNが閾値TH1以上である場合には(S445:YES)、CPU210は、S450に処理を進める。
S450では、CPU210は、注目対象領域に外接する外接矩形OSに対する注目対象領域の占有率PRを算出する。例えば、図13(B)の対象領域TA5が、注目対象領域である場合には、破線で示す外接矩形OS5の画素数SNに対する、対象領域TA5の画素数PNが、占有率PRとして算出される(PR=SN/PN)。S455では、CPU210は、占有率PRが閾値TH2以上であるか否かを判断する。閾値TH2は、文字や写真を含む原稿に基づくスキャンデータを用いて、経験的に予め定められる。閾値TH2は、例えば、80%〜90%である。占有率PRが閾値TH2以上である場合には(S455:YES)、CPU210は、S460に処理を進める。
S460では、CPU210は、注目対象領域を非文字領域に設定する。具体的には、CPU210は、キャンバスデータにおいて、注目対象領域に対応する領域内の全ての画素の値を、非文字を示す値「1」に設定する。
画素数PNが閾値TH1未満である場合には(S445:NO)、および、占有率PRが閾値TH2未満である場合には(S455:NO)、CPU210は、S460をスキップして、S470に処理を進める。すなわち、この場合には、注目対象領域は、非文字領域とは異なる領域に設定される。したがって、キャンバスデータにおいて、注目対象領域に対応する領域内の全ての画素の値は、初期値「0」に維持される。
S470では、CPU210は、前処理済画像OIb内の全ての対象領域を注目対象領域として処理したか否かを判断する。未処理の対象領域がある場合には(S470:NO)、CPU210は、S435に戻って、未処理の対象領域を注目対象領域として選択する。全ての対象領域が処理された場合には(S470:YES)、CPU210は、非文字領域判定処理を終了する。この時点で、図4(B)に示す非文字領域データが生成されている。
以上説明した本実施例によれば、文字特定処理(図2のS20)のS22〜S26にて、CPU210は、スキャンデータを用いて、スキャン画像SI内の複数個の画素のそれぞれが、文字画素の候補であるか否かを画素ごとに判断することによって、複数個の文字候補画素を決定する(図2のS22〜S26)。非文字領域判定処理(図2のS28、図12)では、CPU210は、スキャンデータに対して、膨張処理(図12のS415)を含む前処理(図12のS405〜S420)を実行して、前処理済画像データを生成する。CPU210は、前処理済画像データに対応する画像(前処理済画像OIb)上に配置される複数個の対象領域のそれぞれが特定の判断条件を満たすか否かを判断することによって、スキャン画像SI内の非文字領域を特定する(図12のS435〜S470)。スキャン画像SI内の複数個の画素のうち、図2のS26にて文字候補画素であると決定され、かつ、図2のS28にて特定される非文字領域とは異なる領域にある画素が、文字画素として特定される(図2のS29)。前処理済画像データでは、写真の網点を構成する特定対象画素が、膨張処理によって一塊の画素群として現れやすい(図13(B))。この結果、スキャン画像SI内において、写真などの網点を構成する画素を含む領域が、非文字領域として精度良く特定できる。そして、非文字領域とは異なる領域にある画素が、文字画素として特定される。したがって、例えば、図2のS26にて網点を構成する画素が文字候補画素であると誤って決定されたとしても、図2のS28の前処理済画像データを用いた判断によって、網点を構成する画素を含む領域が非文字領域であると決定されることで、網点を構成する画素が文字画素であると誤って特定されることを抑制できる。したがって、網点を含む画像であっても、スキャン画像SI内の文字画素を精度良く特定できる。
さらに、本実施例の非文字領域判定処理では、前処理において、膨張処理(S415)の後に収縮処理(S420)を実行して、前処理済画像データが生成される。この結果、前処理済画像OIbにおいて、文字に対応する特定対象画素が一塊の画素群になることを抑制できる。例えば、文字を構成する細線が、膨張処理によって、隣接する他の線と部分的に繋がってしまったとしても、収縮処理によって再度分離することができる。この結果、スキャン画像SI内の文字に対応する領域が、非文字領域として誤って特定されることを抑制できる。
さらに、本実施例では、非文字領域を決定するための特定の判断条件は、外接矩形OSに占める特定対象画素の割合(占有率PR)が、基準割合(閾値TH2)以上であることを含む(図12のS455)。写真は、矩形の形状を有している可能性が高いのに対して、文字は、細線で構成される。このために、図13(B)に示すように、写真に対応する対象領域(例えば、対象領域TA1)は、文字に対応する対象領域(例えば、対象領域TA3)よりも占有率PRが高いと考えられる。占有率PRを用いることによって、非文字領域を適切に特定することができる。
さらに、本実施例では、非文字領域を決定するための特定の判断条件は、対象領域内の特定対象画素の個数(画素数PN)が、基準数(閾値TH1)以上であることを含む(図12のS445)。本実施例で非文字として想定している写真は、図13(B)に示すように一塊の特定対象画素で構成され、スキャン画像SI上である程度の面積を占めている可能性が高い。文字は、細線で構成されるので、文字の面積は比較的小さい可能性が高い。このために、図13(B)に示すように、写真に対応する対象領域(例えば、対象領域TA1)は、文字に対応する対象領域(例えば、対象領域TA3)よりも画素数PNが多いと考えられる。画素数PNを用いることによって、非文字領域を適切に特定することができる。
さらに、本実施例では、S420の収縮処理の収縮の程度は、S415の膨張処理の膨張の程度よりも大きい。この結果、収縮処理によって、膨張処理によって繋がってしまった細線をより確実に分離できる。したがって、文字に対応する特定対象画素が一塊の画素群になることをさらに効果的に抑制できる。
さらに、本実施例では、S415の膨張処理は、1回行われ、S420の膨張処理は、3回行われる。すなわち、本実施例では、膨張処理は、1回の単位膨張処理を含み、収縮処理は、3回の単位収縮処理を含む。この結果、容易に、S420の収縮処理の収縮の程度は、S415の膨張処理の膨張の程度よりも大きくすることができる。
さらに、本実施例の非文字領域判定処理では、CPU210は、前処理済画像データを用いて、前処理済画像OIb内の連続する複数個の特定対象画素によって構成される領域を、対象領域として決定する(図12のS425)。この結果、非文字領域であるか否かを決定するための適切な対象領域を決定することができる。
さらに、本実施例の非文字領域判定処理では、図12のS430にて準備されるキャンバスデータにおいて、各画素の初期値が、非文字領域とは異なる領域の画素であることを示す値(例えば、0)とされている。そして、対象領域のうち、非文字領域であると判断される領域だけが非文字領域に決定される(S460)。したがって、前処理済画像OIbにおいて、特定対象画素とは異なる画素(非特定対象画素)によって構成される領域(例えば、白地の背景領域)は、非文字領域とは異なる領域として特定される(図4(B))。この結果、例えば、文字に対応する特定対象画素が、S420の収縮処理によって消滅したとしても問題がない。したがって、文字画素を漏れなく特定することができる。
本実施例では、CPU210は、スキャンデータを用いて最小成分データを生成し(図12のS405)、最小成分データを用いて、膨張処理前画像データを生成し(図12のS410)、膨張処理前画像データに対して、膨張処理を含む処理(S415、S420)を実行して、前処理済画像データを生成する。この結果、最小成分データを用いることで、網点を構成する画素が特定対象画素として精度良く特定される。したがって、非文字領域が精度良く特定される。
さらに、上記実施例によれば、CPU210は、S15での拡大処理の拡大率Lrが閾値Lth未満である場合には(S27:YES)、S28の非文字領域判定処理とS29の合成処理とを実行する。すなわち、この場合には、スキャン画像SI内の複数個の画素のうち、S22〜S26にて文字候補画素であると決定され、かつ、S28にて非文字画素であると決定されない画素が、文字画素として特定される。そして、拡大率Lrが閾値Lth以上である場合には(S27:NO)、S28とS29の処理は実行されない。すなわち、この場合には、スキャン画像SI内の複数個の画素のうち、文字候補画素であると決定される画素が、文字画素として特定される。この結果、スキャンデータの生成時の拡大率Lrに応じて、適切な文字画素が特定される。詳しく説明すると、スキャン画像SIを閾値Lth以上の拡大率で拡大して出力(本実施例では印刷)する場合には、出力される画像において、網点自体が比較的大きいので、網点が目立っていても不自然な見栄えにはならないことが多い。このために、拡大率Lrが閾値Lth以上である場合には、出力される画像において、当該大きな網点がはっきりと見える方が、ぼけているよりも自然な見栄えになることが多い。また、拡大コピーは、原稿をそのまま拡大して示す画像を出力すべきであるので、拡大コピーでは、網点もそのまま拡大されて出力されること望ましいと考えられる。さらには、網点があるサイズ以上に拡大されると、印刷時のドットの周期成分との干渉によるモアレが発生しなくなる。このために、拡大率Lrが閾値Lth以上である場合には、網点のエッジは、文字のエッジと同様に、エッジ強調処理の対象となる方が、平滑化処理の対象となるよりも好ましいと考えられる。このために、拡大率Lrが閾値Lth以上である場合には、スキャン画像SI内の複数個の画素のうち、文字画素とともに網点のエッジを構成する画素を含み得る文字候補画素が、文字画素として特定されることが好ましいと考えられる。
以上の説明から解るように、本実施例における最小成分データは、第1の画像データの例であり、特定対象画素は、特定条件を満たす画素の例であり、膨張処理前画像データは、中間画像データの例である。
B.変形例:
(1)上記実施例の図12の非文字領域判定処理において、前処理は、S420の収縮処理を含んでいるが、S420の収縮処理は、省略されても良い。この場合でも、非文字領域判定処理において、写真Ob1、Ob2に対応する領域を、非文字領域として特定できる。この場合には、例えば、S455の判断において文字領域の占有率PRが上記実施例に比べて大きな値になるので、TH2などの閾値は、上記実施例に比べ大きく設定される。
(2)上記実施例の図12の非文字領域判定処理において、S420の収縮処理の収縮の程度は、S412の膨張処理の膨張の程度よりも大きい。これに代えて、S420の収縮処理の収縮の程度は、S412の膨張処理の膨張の程度と同じでも良よい。また、S420の収縮処理の収縮の程度は、S412の膨張処理の膨張の程度より小さくても良い。
(3)上記実施例の図12の非文字領域判定処理において、S415の膨張処理の回数は、1回であるが、1回に限られない。一般的には、S415の膨張処理は、N回(Nは1以上の整数)の単位膨張処理を含めば良い。同様に、S420の収縮処理の回数は、3回であるが、3回に限られない。一般的には、S420の収縮処理は、M回(Mは1以上の整数)の単位収縮処理を含めば良い。この場合に、収縮処理の収縮の程度を、膨張処理の膨張の程度よりも大きくするために、M>Nを満たすことが好ましい。
(4)上記実施例の図12の非文字領域判定処理において、S420の収縮処理の回数が、S415の膨張処理の回数より多くされることで、S420の収縮処理の収縮の程度が、S412の膨張処理の膨張の程度よりも大きくされている。これに代えて、S420の収縮処理で用いられるフィルタFI2が、S415の膨張処理で用いられるフィルタFI1よりも大きくされることで、収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きくされても良い。
(5)上記実施例の図12の非文字領域判定処理において、連続する複数個の特定対象画素が、1個の対象領域TA1〜TA6に決定されている(S425、図13(B))。これに代えて、例えば、前処理済画像OIbを升目状に分割することによって、前処理済画像OIb上に複数個の矩形の対象領域が決定されても良い。この場合には、対象領域には、特定対象画素と、非特定対象画素と、の両方が含まれ得る。この場合には、対象領域に含まれる特定対象画素の個数が閾値以上である場合に、該対象領域は非文字領域であると判断されても良いし、対象領域の総画素数に占める特定対象画素の画素数の割合が閾値以上である場合に、該対象領域は非文字領域であると判断されても良い。
(6)上記実施例の非文字領域判定処理において、対象領域が非文字領域であると判断されるための特定の判断条件は、画素数PNが閾値TH1以上であり、かつ、占有率PRが閾値TH2以上であることである。特定の判断条件は、これに限られない。例えば、特定の判断条件は、画素数PNが閾値TH1以上であること、または、占有率PRが閾値TH2以上であることであっても良い。また、特定の判断条件は、画素数PNが閾値TH1以上であることだけが用いられても良いし、占有率PRが閾値TH2以上であることだけが用いられても良い。また、特定の判断条件は、他の条件、例えば、対象領域の縦横比が、写真の領域として想定される所定の縦横比の範囲内であることを含んでも良い。
(7)上記実施例の図2の画像処理において、S24の第2の二値画像データ生成処理およびS26の合成処理は省略されても良い。すなわち、第1の二値画像データ生成処理において特定される複数個のエッジ画素が、最終的なエッジ特定データであっても良い。
(8)上記実施例の図2の画像処理において、図2のS27は省略されても良い。すなわち、CPU210は、スキャンデータの生成時の拡大率Lrに拘わらずに、S28、S29を常に実行しても良い。
(9)図5の第1の二値画像データ生成処理(図5)では、単成分画像データとして、輝度画像データが用いられる(S120)。これに代えて、スキャンデータの対応する画素のRGB値に含まれる3個の成分値(R値、G値、B値)の平均値を、各画素の値とする平均成分値画像データが用いられても良い。
(10)上記実施例の第2の二値画像データ生成処理(図9)では、単成分画像データとして、最小成分データが用いられる(S300)。これに代えて、最大成分データや反転最小成分データが用いられても良い。
最大成分データは、スキャンデータに含まれる複数個の画素に対応する複数個の値を含み、該複数個の値のそれぞれは、スキャンデータの対応する画素の最大成分値Vmaxである。最大成分値Vmaxは、スキャンデータの対応する画素のRGB値に含まれる複数個の成分値(R値、G値、B値)のうちの最大値である。
反転最小成分データは、以下のように、取得される。先ず、スキャンデータに含まれる複数個の画素の値(RGB値)のそれぞれについて、複数個の成分値(R値、G値、B値)が反転された反転済みの色値が生成される。反転前のRGB値を(Rin、Gin、Bin)とすると、反転済みのRGB値(Rout、Gout、Bout)は、以下の式(1)〜(3)で表される。
Rout=Rmax−Rin …(1)
Gout=Gmax−Gin …(2)
Bout=Bmax−Bin …(3)
ここで、Rmax、Gmax、Bmaxは、それぞれ、R値、G値、B値が取り得る値の最大値であり、本実施例では、Rmax=Gmax=Bmax=255である。これらの反転済みのRGB値を複数個の画素の値とする画像データが、反転画像データとして生成される。そして、反転画像データを用いて、反転最小成分データが生成される。具体的には、反転画像データに含まれる複数個の反転済みのRGB値のそれぞれから、反転最小成分値VRminが取得される。反転最小成分値VRminは、該反転済みのRGB値に含まれる複数個の成分値(R値、G値、B値)のうちの最小値である。反転最小成分データは、これらの反転最小成分値VRminを、複数個の画素の値とする画像データである。
反転最小成分値VRminは、最大成分値の反転値であり、VRmin=(255−Vmax)の関係が成り立つ。このために、最大成分データと反転最小成分データとは、両方とも、スキャンデータの各画素の値に含まれる複数個の成分値のうちの最大値に基づく値(最大値の反転値、あるいは、最大値そのもの)を、画素の値とする画像データである、と言うことができる。なお、実施例の最小成分データは、スキャンデータの各画素の値に含まれる複数個の成分値のうちの最小値に基づく値を、画素の値とする画像データである、と言うことができる。
図10に示すように、C、M、Y、K、Wの最大成分値Vmaxは、255、255、255、0、255となり、黒(K)を除いて同じ値となる。したがって、最大成分データや反転最小成分データにおいては、網点領域を構成する5種類の要素、すなわち、C、M、Y、Kの各ドットと、用紙の地色(白)と、のうちの4種類の要素(C、M、Yのドットと、用紙の地色(白))を示す画素間の値の差が抑制される。この結果、最大成分データや反転最小成分データを用いる場合には、最小成分データを用いる場合と同様に、網点に起因するエッジ画素が特定されることを抑制できる。
(11)上記各実施例では、文字画素に対して、文字鮮鋭化処理が実行され(図2のS40)、非文字画素に対して、網点平滑化処理が実行される(図2のS30)。これに代えて、文字画素に対しては、文字の見栄えを向上するためのアンチエイリアス処理が実行されても良い。また、非文字画素に対しては、例えば、印刷時の色材の使用量を減らすために、色を飛ばす処理(白に変換する処理)が実行されても良い。一般的には、文字画素と、非文字画素と、に互いに異なる画像処理が実行されることが好ましい。あるいは、文字画素と非文字画素のいずれか一方に対して、特定の画像処理が実行され、他方に対して、該特定の画像処理が実行されなくても良い。
(12)上記実施例では、図5のS130や図9のS320のエッジ抽出処理において、ソーベルフィルタ(Sobel filter)が用いられている。これに代えて、これらエッジ抽出処理では、ロバーツフィルタや、ラプラシアンフィルタなどの他のエッジ抽出フィルタが用いられても良い。
(13)上記実施例では、対象画像データは、スキャンデータであるが、これに限られない。対象画像データは、2次元イメージセンサを備えるデジタルカメラによって印刷物を読み取ることによって生成されても良い。
(14)上記実施例では、第1の二値画像データと、第2の二値画像データと、の論理和を取ることによって、エッジ特定データが生成される(図2のS26)。これに代えて、第1の二値画像データと、第2の二値画像データと、第3の二値画像データと、の論理和を取ることによって、エッジ特定データが生成されても良い。第3の二値画像データには、例えば、上述した最大成分データを用いて生成される二値画像データが用いられても良い。これによって、文字などのエッジの特定漏れをさらに抑制することができる。
(15)上記実施例の第1の二値画像データ生成処理(図5)や第2の二値画像データ生成処理(図9)は、適宜に変更可能である。例えば、図5のS110、S110、S140の処理の全部または一部は、省略可能である。また、図9のS310、S330のうちの全部または一部は、省略可能である。
(16)図2の画像処理を実現する画像処理装置は、複合機200に限らず、種々の装置であってよい。例えば、スキャナやデジタルカメラが、自身で生成された画像データを用いて、プリンタに供給するための印刷データを生成するために、図2の画像処理を実行しても良い。また、例えば、スキャナやプリンタと通信可能な接続される端末装置(例えば、端末装置100)やサーバ(図示省略)が、スキャナから取得したスキャンデータを用いて、図2の画像処理を実行して、印刷データを生成し、該印刷データをプリンタに供給しても良い。また、ネットワークを介して互いに通信可能な複数個のコンピュータ(例えば、クラウドサーバ)が、画像処理に要する機能を一部ずつ分担して、全体として、画像処理を実行してもよい。この場合、複数個のコンピュータの全体が、画像処理装置の例である。
(17)上記各実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部あるいは全部をハードウェアに置き換えるようにしてもよい。例えば、図12のS410の機械学習モデルを用いて文字確率Txrを算出する処理は、ASICなどの専用のハードウェアによって、実行されても良い。
以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。