JP6867609B2

JP6867609B2 - 画像処理装置、および、コンピュータプログラム

Info

Publication number: JP6867609B2
Application number: JP2018050232A
Authority: JP
Inventors: 竜司山田
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 2018-03-16
Filing date: 2018-03-16
Publication date: 2021-04-28
Anticipated expiration: 2038-03-16
Also published as: JP2019161623A

Description

本明細書は、画像データに対する画像処理に関し、特に、画像内の文字画素を特定するための画像処理に関する。

イメージセンサを用いて印刷物を読み取ることによって生成される画像データでは、該画像データによって示される画像内に、印刷物に含まれる網点が現れる。このような網点を構成する画素は、画像内の文字画素を特定する際に、文字画素として誤って特定されやすい。

特許文献１に開示された画像処理装置は、画素ごとにエッジであるか否かを判定するエッジ判定と、画素ごとに網点であるかを判定する網点判定と、を実行する。画像処理装置は、エッジであり、かつ、網点ではない画素を、文字を示す画素として特定する。

特開平６−１６４９２８号公報特開２００３−１８９０９０号公報特開２０１７−１３５６０９号公報

このように、網点を含む画像であっても、例えば、網点に起因して文字のない領域において文字画素が誤って特定されることを抑制して、文字画素を精度良く特定できる技術が求められていた。

本明細書は、網点を含む画像であっても、対象画像内の文字画素を精度良く特定できる技術を開示する。

本明細書に開示された技術は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。

［適用例１］画像処理装置であって、対象画像を示す対象画像データを取得する画像取得部と、前記対象画像データを用いて、前記対象画像内の複数個の画素のそれぞれが、文字画素の候補であるか否かを画素ごとに判断することによって、複数個の候補画素を決定する候補決定部と、前記対象画像データに対して膨張処理を含む前処理を実行して、前処理済画像データを生成する前処理部と、前記前処理済画像データに対応する画像上に配置される複数個の対象領域のそれぞれが特定の判断条件を満たすか否かを判断することによって、前記対象画像内の非文字領域を特定する非文字領域特定部と、前記対象画像内の複数個の画素のうち、前記候補画素であると決定され、かつ、前記非文字領域とは異なる領域にある画素を、前記文字画素として特定する文字特定部と、を備える、画像処理装置。

上記構成によれば、画素ごとの判断によって、複数個の第１の文字候補画素が決定され、ヒストグラムデータを用いたブロックごとの判断によって、複数個の第２の文字候補画素が決定される。そして、第１の文字候補画素であると決定され、かつ、第２の文字候補画素であると決定される画素が、文字画素として特定される。この結果、例えば、画素ごとの判断によって、網点を構成する画素が第１の文字候補画素であると誤って決定されたとしても、ブロックごとの判断によって、網点を構成する画素が第２の文字候補画素であると決定されない場合には、網点を構成する画素が文字画素であると誤って特定されることがない。ブロックごとの判断にヒストグラムデータを用いることにより、文字候補画素の特定に煩雑な処理を要することなく第２の文字候補画素を決定できる。したがって、例えば、網点を含む画像であっても、対象画像内の文字画素を精度良く特定できる。
［適用例２］
適用例１に記載の画像処理装置であって、
前記前処理部は、前記膨張処理の後に収縮処理を実行して、前記前処理済画像データを生成する、画像処理装置。
［適用例３］
適用例２に記載の画像処理装置であって、
前記前処理に含まれる前記収縮処理の収縮の程度は、前記前処理に含まれる前記膨張処理の膨張の程度よりも大きい、画像処理装置。
［適用例４］
適用例３に記載の画像処理装置であって、
前記前処理に含まれる前記膨張処理は、Ｎ回（Ｎは１以上の整数）の単位膨張処理を含み、
前記前処理に含まれる前記収縮処理は、Ｍ回（ＭはＭ＞Ｎを満たす整数）の単位収縮処理を含む、画像処理装置。
［適用例５］
適用例１〜４のいずれかに記載の画像処理装置であって、さらに、
前記前処理済画像データを用いて、画像内の特定条件を満たす連続する複数個の画素によって構成される領域を、前記対象領域として決定する、画像処理装置。
［適用例６］
適用例５のいずれかに記載の画像処理装置であって、
前記画像内の特定条件を満たす複数個の画素とは異なる複数個の画素によって構成される領域は、前記非文字領域とは異なる領域として特定される、画像処理装置。
［適用例７］
適用例１〜６のいずれかに記載の画像処理装置であって、
前記特定の判断条件は、前記対象領域に基づく判定領域に占める特定条件を満たす画素の割合が基準割合以上であることを含む、画像処理装置。
［適用例８］
適用例１〜７のいずれかに記載の画像処理装置であって、
前記特定の判断条件は、前記対象領域内の特定条件を満たす画素の個数が基準数以上であることを含む、画像処理装置。
［適用例９］
適用例１〜８のいずれかに記載の画像処理装置であって、
前記対象画像データに含まれる前記複数個の画素の値のそれぞれは、複数個の成分値を含む色値であり、
前記前処理部は、
前記対象画像データに含まれる前記複数個の画素の値に対応する複数個の第１値を含む第１の画像データと、前記対象画像データに含まれる前記複数個の画素の値に対応する複数個の第２値を含む第２の画像データと、のうちの少なくとも一方を生成し、
前記第１の画像データと前記第２の画像データとのうちの少なくとも一方を用いて中間画像データを生成し、
前記中間画像データに対して、前記膨張処理を含む処理を実行して、前記前処理済画像データを生成し、
前記第１の画像データに含まれる前記複数個の第１値のそれぞれは、対応する前記画素の値に含まれる前記複数個の成分値のうちの最小値に基づく値であり、
前記第２の画像データに含まれる前記複数個の第２値のそれぞれは、対応する前記画素の値に含まれる前記複数個の成分値のうちの最大値に基づく値である、画像処理装置。
［適用例１０］
適用例１〜９のいずれかに記載の画像処理装置であって、さらに、
前記対象画像データのうち、特定済みの前記文字画素の値に対して第１の画像処理を実行し、前記文字画素とは異なる画素の値に対して前記第１の画像処理とは異なる第２の画像処理を実行して、画像処理済みの前記対象画像データを生成する画像処理部を備える、画像処理装置。

上記構成によれば、文字画素の値と、文字画素とは異なる画素の値と、に対して、互いに異なる画像処理が実行されるので、対象画像データに対する適切な画像処理を実現できる。

なお、本明細書に開示される技術は、種々の形態で実現することが可能であり、例えば、複合機、スキャナ、プリンタ、画像処理方法、これら装置の機能または上記方法を実現するためのコンピュータプログラム、そのコンピュータプログラムを記録した記録媒体、等の形態で実現することができる。

画像処理装置の一例である複合機２００の構成を示すブロック図である。画像処理のフローチャートである。画像処理で用いられる画像の一例を示す第１の図である。文字特定処理で用いられる画像の一例を示す図である。第１の二値画像データ生成処理のフローチャートである。エッジ強調処理のフローチャートである。平滑化済みのＲ成分画像データとエッジ強調済みのＲ成分画像データとの説明図である。レベル補正処理のためのトーンカーブの一例を示す図である。第２の二値画像データ生成処理のフローチャートである。スキャンデータの最小成分値と最大成分値の説明図である。画像処理に用いられる画像の一例を示す第２の図である。非文字領域判定処理のフローチャートである。非文字領域判定処理で用いられる画像の一例を示す図である。膨張処理と収縮処理について説明する第１の図である。膨張処理と収縮処理について説明する第２の図である。

Ａ．実施例：
Ａ−１：複合機２００の構成
実施の形態を実施例に基づき説明する。図１は、画像処理装置の一例である複合機２００の構成を示すブロック図である。複合機２００は、画像処理装置を制御するプロセッサであるＣＰＵ２１０と、ＤＲＡＭなどの揮発性記憶装置２２０と、フラッシュメモリやハードディスクドライブなどの不揮発性記憶装置２３０と、液晶ディスプレイなどの表示部２４０と、液晶ディスプレイと重畳されたタッチパネルやボタンを含む操作部２５０と、ユーザの端末装置１００などの外部装置と通信を行うためのインタフェース（通信ＩＦ）２７０と、印刷実行部２８０と、読取実行部２９０と、を備えている。

読取実行部２９０は、ＣＰＵ２１０の制御に従って、一次元イメージセンサを用いて原稿を光学的に読み取ることによってスキャンデータを生成する。印刷実行部２８０は、ＣＰＵ２１０の制御に従って、複数種類のトナー、具体的には、シアン（Ｃ）、マゼンタ（Ｍ）、イエロ（Ｙ）、ブラック（Ｋ）のトナーを、色材として用いて、レーザ方式で用紙などの印刷媒体に画像を印刷する。具体的には、印刷実行部２８０は、感光ドラムを露光して静電潜像を形成し、該静電潜像にトナーを付着させてトナー像を形成する。印刷実行部２８０は、感光ドラム上に形成されたトナー像を用紙に転写する。なお、変形例では、印刷実行部２８０は、色材としてのインクを吐出して、用紙上に画像を形成するインクジェット方式の印刷実行部であっても良い。

揮発性記憶装置２２０は、ＣＰＵ２１０が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域を提供する。不揮発性記憶装置２３０には、コンピュータプログラムＰＧが格納されている。コンピュータプログラムＰＧは、ＣＰＵ２１０に複合機２００の制御を実現させる制御プログラムである。本実施例では、コンピュータプログラムＰＧは、複合機２００の製造時に、不揮発性記憶装置２３０に予め格納される形態で提供される。これに代えて、コンピュータプログラムＰＧは、サーバからダウンロードされる形態で提供されても良く、ＤＶＤ−ＲＯＭなどに格納される形態で提供されてもよい。ＣＰＵ２１０は、コンピュータプログラムＰＧを実行することにより、後述する画像処理を実行することができる。

Ａ−２：画像処理
図２は、画像処理のフローチャートである。この画像処理は、例えば、ユーザが、読取実行部２９０の原稿台に、原稿を載置して、コピーの実行指示を入力した場合に実行される。この画像処理は、原稿を、読取実行部２９０を用いて読み取ることによって生成されるスキャンデータを取得し、該スキャンデータを用いて、原稿を示す印刷データを生成することで、いわゆる原稿のコピーを実現する処理である。

Ｓ１０では、ＣＰＵ２１０は、ユーザが原稿台に設置した原稿を、読取実行部２９０を用いて読み取ることによって、対象画像データとしてのスキャンデータを生成する。原稿は、例えば、複合機２００、あるいは、図示しないプリンタによって画像が印刷された印刷物である。生成されたスキャンデータは、揮発性記憶装置２２０（図１）のバッファ領域に格納される。スキャンデータは、複数個の画素の値を含み、複数個の画素の値のそれぞれは、画素の色をＲＧＢ表色系の色値（ＲＧＢ値とも呼ぶ）で表す。すなわち、スキャンデータは、ＲＧＢ画像データである。１個の画素のＲＧＢ値は、例えば、赤色（Ｒ）と緑色（Ｇ）と青色（Ｂ）との３個の色成分の値（以下、Ｒ値、Ｇ値、Ｂ値とも呼ぶ）を含んでいる。本実施例では、各成分値の階調数は、２５６階調である。

ＲＧＢ画像データであるスキャンデータは、ＲＧＢ表色系を構成する３個の色成分に対応する３個の成分画像データ（Ｒ成分画像データ、Ｇ成分画像データ、Ｂ成分画像データ）を含んでいると言うことができる。各成分画像データは、１種類の色成分の値を、画素の値とする画像データである。

Ｓ１５では、ＣＰＵ２１０は、スキャンデータに対して、スキャンデータによって示されるスキャン画像を、拡大率Ｌｒで拡大する拡大処理を実行して、拡大処理済みのスキャンデータを生成する。拡大率Ｌｒは、例えば、ユーザによって、コピーの実行指示とともに入力される。拡大率Ｌｒは、例えば、０．１〜６（１０％〜６００％）の範囲の値であり、１未満の拡大率Ｌｒでの拡大処理は、スキャン画像のサイズを小さくする処理であり、１より大きな拡大率Ｌｒでの拡大処理は、スキャン画像のサイズを大きくする処理である。スキャン画像のサイズは、具体的には、縦方向および横方向の画素数で定義される。なお、拡大処理前のスキャンデータを元画像データとも呼び、拡大処理済みのスキャンデータを対象画像データとも呼ぶ。以下では、単にスキャンデータと呼ぶとき、拡大処理済みのスキャンデータを意味する。

図３は、画像処理で用いられる画像の一例を示す第１の図である。図３（Ａ）には、スキャンデータによって示されるスキャン画像ＳＩの一例が示されている。スキャン画像ＳＩは、複数個の画素を含む。該複数個の画素は、第１方向Ｄ１と、第１方向Ｄ１と直交する第２方向Ｄ２と、に沿って、マトリクス状に配置されている。

図３（Ａ）のスキャン画像ＳＩは、原稿の用紙の地色を示す白色の背景Ｂｇ１と、２個の文字とは異なるオブジェクトＯｂ１、Ｏｂ２と、４個の文字Ｏｂ３〜Ｏｂ６と、を含んでいる。本実施例では、文字とは異なるオブジェクトは、写真である。

Ｓ２０では、ＣＰＵ２１０は、スキャンデータに対して、文字特定処理を実行する。文字特定処理は、スキャン画像ＳＩ内の複数個の画素を、文字を示す複数個の文字画素と、文字を示さない複数個の非文字画素と、に分類することによって、文字画素を特定する処理である。

文字特定処理によって、例えば、文字画素の値が「１」とされ、非文字画素の値が「０」とされた二値画像データ（文字特定データとも呼ぶ）が生成される。図３（Ｂ）には、文字特定データによって示される文字特定画像ＴＩの一例が示されている。この文字特定画像ＴＩには、スキャン画像ＳＩ内の４個の文字Ｏｂ３〜Ｏｂ６のエッジを構成する複数個の画素が、文字画素Ｔｐ３〜Ｔｐ７として、特定されている。なお、比較的大きな文字については、文字のエッジを構成する画素が文字画素として特定され、比較的小さな文字については、文字を構成する画素の全体が文字画素として特定される。文字特定処理の詳細は、後述する。

Ｓ３０では、ＣＰＵ２１０は、スキャンデータに対して、網点平滑化処理を実行して、平滑化画像を示す平滑化画像データを生成する。具体的には、ＣＰＵ２１０は、スキャンデータに含まれる複数個の非文字画素の値のそれぞれに対して、ガウスフィルタなどの平滑化フィルタを用いた平滑化処理を実行して、平滑化処理済みの複数個の非文字画素の値を算出する。平滑化処理の対象となる非文字画素は、Ｓ２０の文字特定処理によって生成された文字特定データを参照して特定される。ＣＰＵ２１０は、スキャンデータに含まれる複数個の文字画素の値と、平滑化処理済みの複数個の非文字画素の値と、を含む平滑化画像データを生成する。

図３（Ｃ）には、平滑化画像データによって示される平滑化画像ＧＩが示されている。平滑化画像ＧＩは、白色の背景Ｂｇ１ｇと、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ６が平滑化されたオブジェクトＯｂ１ｇ〜Ｏｂ６ｇと、を含んでいる。これらのオブジェクトＯｂ１ｇ〜Ｏｂ６ｇ、背景Ｂｇ２ｇのうち、文字Ｏｂ３ｇ〜Ｏｂ６ｇ以外の部分（非文字部分とも呼ぶ）は、スキャン画像ＳＩと比較して、平滑化されている。

Ｓ４０では、ＣＰＵ２１０は、平滑化画像データに対して、文字鮮鋭化処理を実行して、処理済み画像データを生成する。具体的には、ＣＰＵ２１０は、平滑化画像データに含まれる複数個の文字画素の値のそれぞれに対して、アンシャープマスク処理や鮮鋭化フィルタを適用する処理などの鮮鋭化処理を実行して、鮮鋭化処理済みの複数個の文字画素の値を算出する。鮮鋭化処理の対象となる文字画素は、Ｓ２０の文字特定処理によって生成された文字特定データを参照して特定される。そして、ＣＰＵ２１０は、平滑化画像データに含まれる複数個の非文字画素の値（平滑化処理済みの複数個の非文字画素の値）と、鮮鋭化処理済みの複数個の文字画素の値と、を含む処理済み画像データを生成する。平滑化画像データに含まれる複数個の文字画素の値は、平滑化処理の対象ではないので、スキャンデータに含まれる複数個の文字画素の値と同じである。したがって、本ステップの文字鮮鋭化処理は、スキャンデータに含まれる複数個の文字画素の値に対して実行される、とも言うことができる。

図３（Ｄ）には、処理済み画像データによって示される処理済み画像ＦＩが示されている。処理済み画像ＦＩは、白色の背景Ｂｇ１ｆと、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ６に対応するオブジェクトＯｂ１ｆ〜Ｏｂ６ｆを含んでいる。これらのオブジェクトＯｂ１ｆ〜Ｏｂ６ｆのうち、文字Ｏｂ３ｆ〜Ｏｂ６ｆのエッジは、スキャン画像ＳＩ内の文字Ｏｂ３〜Ｏｂ６や、平滑化画像ＧＩ内の文字Ｏｂ３ｇ〜Ｏｂ６ｇと比較して、鮮鋭化されている。また、写真Ｏｂ１ｆ、Ｏｂ２ｆのエッジは、鮮鋭化されていない。

以上の説明から解るように、処理済み画像ＦＩ内のオブジェクトＯｂ１ｆ〜Ｏｂ６ｆ、背景Ｂｇ２ｆは、鮮鋭化された文字と、平滑化された非文字を含む。

Ｓ５０では、ＣＰＵ２１０は、処理済み画像データを用いて印刷データを生成する印刷データ生成処理を実行する。具体的には、ＲＧＢ画像データである処理済み画像データに対して色変換処理が実行されて、印刷に用いられる色材に対応する色成分（Ｃ、Ｍ、Ｙ、Ｋの成分）を有する色値であるＣＭＹＫ値で画素ごとの色を示すＣＭＹＫ画像データが生成される。色変換処理は、例えば、公知のルックアップテーブルを参照して実行される。ＣＭＹＫ値画像データに対して、ハーフトーン処理が実行されて、印刷に用いられる色材ごと、かつ、画素ごとに、ドットの形成状態を示すドットデータが生成される。ドットの形成状態は、例えば、ドット有、ドット無の２種類の状態や、大ドット、中ドット、小ドット、ドット無の４種類の状態を取り得る。ハーフトーン処理は、例えば、ディザ法や、誤差拡散法に従って実行される。該ドットデータは、印刷時に用いられる順に並べ替えられ、該ドットデータに、印刷コマンドが付加されることによって、印刷データが生成される。

Ｓ６０では、ＣＰＵ２１０は、印刷処理を実行して、画像処理を終了する。具体的には、ＣＰＵ２１０は、印刷データを印刷実行部２８０に供給して、印刷実行部２８０に処理済み画像を印刷させる。

以上説明した画像処理によれば、スキャンデータのうち、特定済みの複数個の文字画素の値に対して第１の画像処理（具体的には、エッジ鮮鋭化処理）が実行され（Ｓ４０）、複数個の非文字画素の値に対して第１の画像処理とは異なる第２の画像処理（具体的には、網点平滑化処理）が実行され（Ｓ３０）、処理済み画像データが生成される。この結果、文字画素の値と、文字画素とは異なる画素の値と、に対して、互いに異なる画像処理が実行されるので、スキャンデータに対する適切な画像処理を実現できる。なお、変形例では、Ｓ４０の文字鮮鋭化処理が先に実行され、その後に、Ｓ３０の網点平滑化処理が実行されても良い。

より具体的には、鮮鋭化処理済みの複数個の文字画素の値と、平滑化処理済みの複数個の非文字画素の値と、を含む処理済み画像データが生成される（Ｓ３０、Ｓ４０）。この結果、見栄えの良い処理済み画像ＦＩを示す処理済み画像データを生成することができる。

例えば、図３（Ｄ）の処理済み画像ＦＩに示すように、処理済み画像データでは、文字画素の値には、鮮鋭化処理済みの値が用いられている。この結果、処理済み画像ＦＩの文字がシャープに見えるので、例えば、印刷される処理済み画像ＦＩの見栄えを向上することができる。

また、処理済み画像データでは、処理済み画像ＦＩ内の写真などの文字とは異なるオブジェクトを構成する非文字画素の値には、平滑化処理済みの値が用いられている。この結果、処理済み画像ＦＩの文字とは異なる部分に、例えば、モアレの原因となる網点が表れることを抑制できるので、印刷される処理済み画像ＦＩにモアレなどの不具合が発生することを抑制できる。この結果、印刷される処理済み画像ＦＩの見栄えを向上することができる。また、写真内のエッジが過度に強調されることが抑制されるので、画像ＦＩの見栄えをさらに向上することができる。

例えば、スキャンデータの生成に用いられた原稿は、画像が印刷された印刷物である。このため、例えば、原稿内の白とは異なる色を有する部分は、画像を形成するドットレベルでみると、網点を形成している。網点は、複数個のドットと、ドットが配置されていない部分（原稿の地色を示す部分）と、を含む。このために、スキャン画像ＳＩ内の原稿内の白とは異なる色を有する部分には、画素レベルでみると、網点が示されている。網点内のドットは、原稿の印刷時に用いられるディザマトリクスなどの影響によって、周期性を持って並んでいる。このためにスキャンデータを用いて印刷を行うと、ハーフトーン処理前の元画像（スキャン画像ＳＩ）内に存在している網点のドットの周期成分と、印刷画像を構成する網点のドットの周期成分と、が干渉して、モアレが表れやすい。本実施例の処理済み画像ＦＩでは、平滑化処理によって、元画像（スキャン画像ＳＩ）内のエッジとは異なる部分のドットの周期成分が低減される。この結果、処理済み画像データを用いて、処理済み画像ＦＩを印刷する場合に、例えば、印刷される処理済み画像ＦＩにモアレが発生することを抑制できる。

特に、上記画像処理では、処理済み画像データを用いて、印刷データが生成される（Ｓ５０）ので、例えば、印刷される処理済み画像ＦＩに発生しやすいモアレを抑制可能な適切な印刷データを生成することができる。

Ａ−３：文字特定処理
図２のＳ２０の文字特定処理について説明する。Ｓ２２では、ＣＰＵ２１０は、スキャンデータを用いて、第１の二値画像データ生成処理を実行して、第１の二値画像データを生成する。第１の二値画像データは、エッジ画素と非エッジ画素とを示す二値データである。ここで、第１の二値画像データによって示されるエッジ画素を第１のエッジ画素とも呼び、第１の二値画像データによって示される非エッジ画素を第１の非エッジ画素とも呼ぶ。第１の二値画像データ生成処理の詳細は、後述する。

Ｓ２４では、ＣＰＵ２１０は、スキャンデータを用いて、第２の二値画像データ生成処理を実行して、第２の二値画像データを生成する。第２の二値画像データは、第１の二値画像データと同様に、エッジ画素と非エッジ画素とを示す二値データである。第２の二値画像データは、第１の二値画像データとは異なる処理によって生成され、第１の二値画像データとは異なるデータである。ここで、第２の二値画像データによって示されるエッジ画素を第２のエッジ画素とも呼び、第２の二値画像データによって示される非エッジ画素を第２の非エッジ画素とも呼ぶ。第２の二値画像データ生成処理の詳細は、後述する。

Ｓ２６では、ＣＰＵ２１０は、Ｓ２２にて生成された第１の二値画像データと、Ｓ２４にて生成された第２の二値画像データと、を合成する論理和合成処理を実行して、最終的に特定されるエッジ画素と非エッジ画素とを示す二値画像データ（エッジ特定データとも呼ぶ）を生成する。具体的には、ＣＰＵ２１０は、第１の二値画像データと、第２の二値画像データと、の各画素の論理和を取ることによって、エッジ特定データとしての二値画像データを生成する。換言すれば、ＣＰＵ２１０は、第１の二値画像データによって特定される複数個の第１のエッジ画素と、第２の二値画像データによって特定される複数個の第２のエッジ画素と、を含む画素群であって、第１のエッジ画素とも第２のエッジ画素とも異なる画素を含まない画素群を、最終的に、複数個のエッジ画素として特定する。この結果、第１の二値画像データと第２の二値画像データとを用いて、対象画像内の画素がエッジ画素であるか否かを精度良く判断することができる。例えば、スキャン画像ＳＩ内のエッジ画素の特定漏れを効果的に低減できる。

エッジ特定データによって特定されるエッジ画素は、文字画素の候補となる画素であり、文字候補画素とも呼ぶ。例えば、エッジ特定データは、文字候補画素（本実施例ではエッジ画素）の値が「１」とされ、文字候補画素ではない画素（本実施例では、非エッジ画素）の値が「０」とされた二値画像データである。

図４は、文字特定処理で用いられる画像の一例を示す図である。図４（Ａ）には、エッジ特定データによって示されるエッジ特定画像ＥＩの一例が示されている。このエッジ特定画像ＥＩには、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ６のエッジＥｇ１〜Ｅｇ６を構成する複数個のエッジ画素が、文字候補画素として特定されている。このように、文字候補画素によって示されるエッジは、文字のエッジを含む。また、該エッジは、文字とは異なるオブジェクト（例えば、写真）に含まれる細線などのエッジを含む。

Ｓ２７では、Ｓ１５の拡大処理における拡大率Ｌｒは、閾値Ｌｔｈ未満であるか否かを判断する。例えば、拡大率の閾値Ｌｔｈは、例えば、３（３００％）である。拡大率Ｌｒが閾値Ｌｔｈ未満である場合には（Ｓ２７：ＹＥＳ）、ＣＰＵ２１０は、Ｓ２８に処理を進める。

Ｓ２８では、ＣＰＵ２１０は、スキャンデータに対して、非文字領域判定処理を実行して、非文字領域を特定する。すなわち、非文字領域を構成する複数個の画素と、非文字領域を構成しない複数個の画素と、を示す二値画像データ（非文字領域データとも呼ぶ）を生成する。詳細は、後述するが、非文字領域判定処理では、ＣＰＵ２１０は、スキャンデータを用いて、スキャン画像ＳＩ内に配置される複数個の対象領域のそれぞれが、文字とは異なるオブジェクト（例えば、写真）を示す非文字領域であるか否かを対象領域ごとに判断する。ＣＰＵ２１０は、対象領域ごとの判断結果に基づいて、非文字領域データを生成する。非文字領域データは、例えば、非文字領域を構成する画素の値が「１」とされ、非文字領域を構成しない画素の値が「０」とされた二値画像データである。

図４（Ｂ）には、非文字領域データによって示される非文字領域画像ＡＩの一例が示されている。この非文字領域画像ＡＩは、スキャン画像ＳＩ内の写真Ｏｂ１、Ｏｂ２に対応する領域に、非文字領域ＡＡ１、ＡＡ２が特定されている。

Ｓ２９では、ＣＰＵ２１０は、Ｓ２６にて生成されたエッジ特定データと、Ｓ２８にて生成された非文字領域データと、を合成する合成処理を実行して、文字画素と非文字画素とを示す上述した文字特定データ（図３（Ｂ）参照）を生成する。具体的には、ＣＰＵ２１０は、エッジ特定データにて特定される複数個の文字候補画素のうち、非文字領域データにて特定される非文字領域ＡＡ１、ＡＡ２内に位置しない画素を、文字画素として特定する。ＣＰＵ２１０は、エッジ特定データにて特定される複数個の文字候補画素のうち、非文字領域ＡＡ１、ＡＡ２内に位置する画素と、文字候補画素ではない画素を、非文字画素として特定する。換言すれば、スキャン画像ＳＩ内の複数個の画素のうち、Ｓ２２〜Ｓ２６にて文字候補画素であると決定され、かつ、Ｓ２８にて決定される非文字領域とは異なる領域にある画素が、文字画素として特定される。文字特定データが生成されると、文字特定処理は、終了される。

拡大率Ｌｒが閾値Ｌｔｈ以上である場合には（Ｓ２７：ＮＯ）、ＣＰＵ２１０は、Ｓ２８、Ｓ２９をスキップして文字特定処理を終了する。この場合には、Ｓ２６の論理和合成処理によって生成されたエッジ特定データが、最終的な文字特定データとされる。すなわち、この場合には、ＣＰＵ２１０は、Ｓ２２〜Ｓ２６において文字候補画素であると決定される画素を、文字画素として特定する。なお、変形例としては、ＣＰＵ２１０は、Ｓ２８の非文字領域判定処理を実行した後に、Ｓ２７の判断を実行しても良い。すなわち、Ｓ２８の後に、拡大率Ｌｒが閾値Ｌｔｈ未満であるか否かが判断されても良い。この場合にも、拡大率Ｌｒが閾値Ｌｔｈ未満である場合には、Ｓ２９が実行されて、文字特定データが生成される。そして、拡大率Ｌｒが閾値Ｌｔｈ以上である場合には、Ｓ２９がスキップされ、Ｓ２６の論理和合成処理によって生成されたエッジ特定データが、最終的な文字特定データとされる。

Ａ−４：第１の二値画像データ生成処理
図２のＳ２２の第１の二値画像データ生成処理について説明する。図５は、第１の二値画像データ生成処理のフローチャートである。Ｓ１００では、ＣＰＵ２１０は、スキャンデータに含まれる３個の成分画像データ、すなわち、Ｒ成分画像データ、Ｇ成分画像データ、Ｂ成分画像データのそれぞれに対して、平滑化処理を実行する。これによって、３個の平滑化済みの成分画像データ、すなわち、平滑化済みのＲ成分画像データ、平滑化済みのＧ成分画像データ、平滑化済みのＢ成分画像データが生成される。

平滑化処理は、処理対象の成分画像データによって示される成分画像を平滑化する処理である。本実施例の平滑化処理は、処理対象の成分画像データの各画素の値に対して、所定の平滑化フィルタを適用して、平滑化済みの各画素の値を算出する処理である。平滑化フィルタには、例えば、縦７画素×横７画素のサイズのガウスフィルタが用いられる。

Ｓ１１０では、３個の平滑化済みの成分画像データのそれぞれに対して、エッジ強調処理を実行して、３個のエッジ強調済みの成分画像データ、すなわち、エッジ強調済みのＲ成分画像データ、エッジ強調済みのＧ成分画像データ、エッジ強調済みのＢ成分画像データを生成する。

図６は、エッジ強調処理のフローチャートである。ここでは、平滑化済みのＲ成分画像データが処理対象であるとして説明する。平滑化済みのＧ成分画像データおよび平滑化済みのＢ成分画像データに対しても同様の処理が行われる。

Ｓ２００では、ＣＰＵ２１０は、エッジ強調済みのＲ成分画像データを生成するためのキャンバスデータをメモリ（具体的には、揮発性記憶装置２２０のバッファ領域）に準備する。キャンバスデータによって示されるキャンバス（初期画像）は、スキャン画像ＳＩと同じサイズの画像、すなわち、同じ画素数の画像である。キャンバスデータの各画素の値は、所定の初期値（例えば、０）である。

Ｓ２０５では、ＣＰＵ２１０は、平滑化済みのＲ成分画像データによって示される平滑化済みのＲ成分画像内の複数個の画素から１個の注目画素を選択する。

Ｓ２１０では、ＣＰＵ２１０は、注目画素に対応するマスク値ＭＶを算出する。マスク値ＭＶは、注目画素の値ＴＶと、注目画素に対して上下左右に隣接する４個の画素を含む所定個数の周辺画素の値と、を用いて、注目画素の値ＴＶを平滑化する処理によって算出される。このために、マスク値ＭＶを、平滑値とも呼ぶ。具体的には、注目画素を中心とする縦１０画素×横１０画素の矩形の範囲内の１００個の画素の値の平均値が、注目画素に対応するマスク値ＭＶとして算出される。

Ｓ２２０では、ＣＰＵ２１０は、注目画素の値ＴＶと、注目画素に対応するマスク値ＭＶと、の差分ΔＶを算出する（ΔＶ＝（ＴＶ−ＭＶ））。

Ｓ２３０では、ＣＰＵ２１０は、差分ΔＶは、基準以上であるか否かを判断する。具体的には、差分ΔＶが、予め定められた閾値ＴＨ以上であるか否かが判断される。閾値ＴＨは、成分値が、０〜２５５の範囲の２５６階調の値である場合に、例えば、２０〜３０程度の値である。

差分ΔＶが基準以上である場合には（Ｓ２３０：ＹＥＳ）、Ｓ２４０にて、ＣＰＵ２１０は、注目画素の値ＴＶと、注目画素に対応する差分ΔＶと、の和（ＴＶ＋ΔＶ）を、処理済みの値として算出する。差分ΔＶが基準未満である場合には（Ｓ２３０：ＮＯ）、ＣＰＵ２１０は、Ｓ２４０をスキップする。

Ｓ２４５では、ＣＰＵ２１０は、注目画素の値を、Ｓ２００にて準備されたキャンバスデータに記録する。Ｓ２４０が実行された場合には、Ｓ２４０にて算出された注目画素の値ＴＶと、注目画素に対応する差分ΔＶと、の和が、処理済みの値としてキャンバスデータに記録される。Ｓ２４０がスキップされた場合には、平滑化済みのＲ成分画像データの注目画素の値が、そのまま、キャンバスデータに記録される。

Ｓ２５０では、ＣＰＵ２１０は、Ｒ成分画像内の全ての画素を注目画素として処理したか否かを判断する。未処理の画素がある場合には（Ｓ２５０：ＮＯ）、ＣＰＵ２１０は、Ｓ２０５に戻って、未処理の画素を注目画素として選択する。全ての画素が処理された場合には（Ｓ２５０：ＹＥＳ）、ＣＰＵ２１０は、エッジ強調処理を終了する。この時点でエッジ強調済みのＲ成分画像データが生成されている。

図７は、平滑化済みのＲ成分画像データと、エッジ強調済みのＲ成分画像データと、の説明図である。図７（Ａ）には、図５のＳ１００の平滑化処理前のＲ成分画像データを概念的に示すグラフが図示されている。図７（Ｂ）、図７（Ｃ）には、それぞれ、平滑化処理済みのＲ成分画像データ、および、エッジ強調済みのＲ成分画像データを概念的に示すグラフが図示されている。各グラフのうち、左側の部分には、網点を示す網点領域が概念的に示され、右側の部分には、文字などのオブジェクトのエッジを示すエッジ領域が概念的に示されている。各グラフの縦軸は、Ｒ成分の値を示し、横軸は、所定の方向（例えば、図３の第１方向Ｄ１）の位置を示す。

平滑化処理前のＲ成分画像データには、例えば、網点領域において、複数個の網点と、該網点間の複数個の隙間と、に対応する複数個の谷部Ｃ１〜Ｃ３と、複数個の山部Ｐ１、Ｐ２と、が現れる（図７（Ａ））。このような谷部Ｃ１〜Ｃ３と、複数個の山部Ｐ１、Ｐ２と、の間のＲ成分の値の差が大きいまま残存していると、後述するＳ１５０の二値化処理において、該Ｒ成分の値の差に起因して、網点を示すエッジ画素が特定されやすい。網点領域は、画素レベルの視点（網点を認識できる程度のミクロの視点）でみれば、網点を含むが、観察者の視点（網点を認識できない程度のマクロの視点）でみれば、均一な領域である。このため、本実施例では、網点領域内において、網点に起因するエッジ画素は、特定されるべきではない。網点領域は、図２のＳ３０で平滑化されることが好ましく、Ｓ４０にて、鮮鋭化されるべきではないからである。仮に、網点のエッジが鮮鋭化されると、網点の周期性が目立つために、該画像を印刷する場合に、モアレが目立ちやすくなるからである。例えば、スキャン画像ＳＩ内の写真などのオブジェクト内の均一な部分において、エッジ画素は、特定されるべきではない。

平滑化済みのＲ成分画像データでは、平滑化処理によって、例えば、網点領域において、複数個の谷部Ｃ１ａ〜Ｃ３ａと、複数個の山部Ｐ１ａ、Ｐ２ａと、のＲ成分の値の差が、平滑化処理前のＲ成分画像データと比較して十分に小さくなっている（図７（Ｂ））。

ここで、本実施例のエッジ強調処理では、注目画素の値ＴＶと、注目画素に対応するマスク値ＭＶと、の差分ΔＶと、が大きいほど、エッジ強調の効果が大きくなる。このために、図７（Ｂ）の網点領域のように、比較的Ｒ成分の値の差が小さく平坦になっている領域では、エッジ強調の効果が小さくなる。また、本実施例のエッジ強調処理では、差分ΔＶが基準未満である場合には、エッジ強調が行われずに、平滑化済みのＲ成分画像データの画素の値がそのまま採用される（図６のＳ２３０）。この結果、エッジ強調済みのＲ成分画像データでは、エッジ強調処理が行われたにも関わらずに、例えば、網点領域において、複数個の谷部Ｃ１ｂ〜Ｃ３ｂと、複数個の山部Ｐ１ｂ、Ｐ２ｂと、のＲ成分の値の差は、平滑化処理済みのＲ成分画像データと比較して大きくなってはいない（図７（Ｃ））。すなわち、平滑化済みのＲ成分画像データと同様に、エッジ強調済みのＲ成分画像データでは、複数個の谷部Ｃ１ｂ〜Ｃ３ｂと、複数個の山部Ｐ１ｂ、Ｐ２ｂと、のＲ成分の値の差が、平滑化処理前のＲ成分画像データ（図７（Ａ））と比較して十分に小さくなっている（図７（Ｃ））。

平滑化処理前のＲ成分画像データには、例えば、文字などのオブジェクトのエッジを示すエッジ領域において、該エッジに対応してＲ成分の値が急激に変化する変動部Ｅ１が現れる（図７（Ａ））。このような変動部Ｅ１において、値の変化が大きいほど、後述するＳ１５０の二値化処理において、該Ｒ成分の値の差に起因して、オブジェクトのエッジを示すエッジ画素が特定されやすい。

平滑化済みのＲ成分画像データでは、平滑化処理によって、例えば、エッジ領域において、変動部Ｅ１ａにおける値の変化が、平滑化処理前のＲ成分画像データと比較して小さくなっている（緩やかになっている）（図７（Ｂ））。

しかしながら、文字などのオブジェクトのエッジに対応する変動部Ｅ１ａにおける値の変化は、網点領域における値の変化よりは十分に大きいので、エッジ強調処理によって、再度、急激な変化に戻される。この結果、エッジ強調済みのＲ成分画像データでは、エッジ領域において、変動部Ｅ１ｂのＲ成分の値の変化は、平滑化処理済みのＲ成分画像データと比較して大きくなっている（図７（Ｃ））。このため、エッジ強調済みのＲ成分画像データでは、エッジ領域において、変動部Ｅ１ｂにおける値の変化が、平滑化処理前のＲ成分画像データと比較して、同程度、もしくは、急激になっている（図７（Ｃ））。

以上の説明から解るように、本実施例では、各成分画像データに対して、平滑化処理（Ｓ１００）と、エッジ強調処理（Ｓ１１０）とを、この順序で実行するので、網点のエッジを示すエッジ画素が特定されることを抑制することができ、かつ、文字などのオブジェクトのエッジを示すエッジ画素が特定されることを促進することができる。この結果、スキャン画像ＳＩ内の複数個のエッジ画素を適切に特定することができる。

Ｒ、Ｇ、Ｂの３個の色成分に対応する３個の強調処理済みの成分画像データが生成されると、図５の１２０では、該３個の強調処理済みの成分画像データを用いて、輝度画像データを生成する。輝度画像データは、該３個の強調処理済みの成分画像データによって示される強調済画像内の複数個の画素の輝度を示すデータである。具体的には、ＣＰＵ２１０は、該３個の強調処理済みの成分画像データから取得される各画素のＲ値、Ｇ値、Ｂ値を用いて、各画素の輝度Ｙを算出する。輝度Ｙは、例えば、上記３成分の加重平均であり、具体的には、Ｙ＝０．２９９×Ｒ＋０．５８７×Ｇ＋０．１１４×Ｂの式を用いて算出できる。輝度画像データは、１種類の成分値（輝度を示す値）で構成される単成分画像データである。輝度成分データは、スキャンデータの対応する画素の値（ＲＧＢ値）に基づく輝度Ｙを画素ごとに含んでいる。

Ｓ１３０では、ＣＰＵ２１０は、生成された輝度画像データに対して、当該輝度画像データによって示される輝度画像内のエッジを抽出するエッジ抽出処理を実行して、エッジ抽出データを生成する。具体的には、ＣＰＵ２１０は、輝度画像データの各画素の値に、公知のエッジ抽出フィルタ、例えば、ソーベルフィルタ（Sobel filter）を適用して、各画素のエッジ強度を算出する。ＣＰＵ２１０は、これらのエッジ強度を、複数個の画素の値とするエッジ抽出データを生成する。

Ｓ１４０では、ＣＰＵ２１０は、エッジ抽出データに対して、レベル補正処理を実行して、補正処理済みのエッジ抽出データを生成する。レベル補正処理は、エッジ抽出データの画素の値が取り得る階調値の範囲（本実施例では、０〜２５５の範囲）内の特定範囲を拡大する補正処理である。

図８は、レベル補正処理のためのトーンカーブの一例を示す図である。具体的には、ＣＰＵ２１０は、エッジ抽出データの各画素に対して、図８のトーンカーブを適用する。この結果、閾値Ｖｂ（例えば、２４５）以上の値は、全て最大値（２５５）に変換されるとともに、閾値Ｖａ（例えば、１０）以下の値は、全て最小値（０）に変換される。そして、閾値Ｖａより大きく、かつ、閾値Ｖｂ未満の範囲は、０から２５５の範囲に拡大される。このように、後述するＳ１５０の二値化処理の前に、二値化閾値を含む範囲（図８の閾値Ｖａより大きく、かつ、閾値Ｖｂ未満の範囲）を拡大するので、二値化の精度を向上できる。

Ｓ１５０では、ＣＰＵ２１０は、補正処理済みのエッジ抽出データに対して、二値化処理を実行して、二値画像データを生成する。例えば、ＣＰＵ２１０は、エッジ画像データにおいて、画素の値（すなわち、エッジ強度）が閾値（例えば、１２８）以上である画素を、エッジ画素に分類し、画素の値が閾値未満である画素を、非エッジ画素に分類する。二値画像データでは、上述したように、エッジ画素の値は、「１」とされ、非エッジ画素の値は、「０」とされる。

以上説明した第１の二値画像データ生成処理によれば、図７を参照して説明したように、複数個の成分画像データのそれぞれに対して平滑化処理を実行することで、スキャン画像ＳＩ内に現れる網点の特徴を低減できる。さらに、図７を参照して説明したように、複数個の平滑化済みの成分画像データのそれぞれに対して、エッジ強調処理を実行することで、平滑化処理によって平滑化されたスキャン画像ＳＩ内のエッジを適切に強調できる。この結果、網点に起因するエッジ画素が特定されることを抑制しつつ、スキャン画像ＳＩ内のエッジ画素の適切に特定できる。

さらに、単成分画像データとして、輝度画像データが用いられるので、スキャン画像ＳＩ内の複数個のエッジ画素をより適切に特定できる。例えば、網点は、印刷に用いられるＣ、Ｍ、Ｙの原色を有することが多いが、このような複数種の原色間の差は、Ｒ、Ｇ、Ｂの各成分画像データにおいて比較的大きくなるが、輝度画像データでは、比較的小さくなる。このために、輝度画像データを用いることで、網点に起因するエッジ画素が特定されることを適切に抑制できる。また、文字の読みやすさのために、文字の色と背景の色とは、輝度に比較的大きな差があることが多い。このために、輝度画像データを用いることで、文字をはじめとするオブジェクトのエッジを示すエッジ画素を適切に特定できる。

さらに、図６のエッジ強調処理では、注目画素に対応するマスク値（平滑値とも呼ぶ）の算出（Ｓ２１０）と、注目画素の値ＴＶと注目画素に対応するマスク値との差分ΔＶの算出（Ｓ２２０）と、注目画素の値ＴＶと対応する差分ΔＶとの和（ＴＶ＋ΔＶ）の算出（Ｓ２４０）と、を含むいわゆるアンシャープマスク処理が実行される。この結果、スキャン画像ＳＩのエッジを適切に強調できるので、特定すべきエッジ画素の特定漏れを抑制できる。この結果、スキャン画像ＳＩ内のエッジ画素をより適切に特定できる。

さらに、図６のエッジ強調処理では、スキャン画像ＳＩ内の複数個の画素のうち、対応する差分ΔＶが基準以上である画素については、アンシャープマスク処理の対象とされ、該差分ΔＶが基準未満である画素については、アンシャープマスク処理の対象とされない（Ｓ２３０、２４０）。この結果、図７を参照して説明したように、スキャン画像ＳＩの網点に起因する画素間の値の差が強調されることをさらに抑制できるので、網点に起因するエッジ画素の特定をさらに抑制できる。そして、文字などのオブジェクトのエッジについては適切に強調できる。したがって、スキャン画像ＳＩ内のエッジ画素をさらに適切に特定できる。

Ａ−５：第２の二値画像データ生成処理
図２のＳ２４の第２の二値画像データ生成処理について説明する。図９は、第２の二値画像データ生成処理のフローチャートである。Ｓ３００では、ＣＰＵ２１０は、スキャンデータを用いて、最小成分データを生成する。具体的には、ＣＰＵ２１０は、スキャンデータに含まれる複数個の画素の値（ＲＧＢ値）のそれぞれから、最小成分値Ｖｍｉｎを取得する。最小成分値Ｖｍｉｎは、ＲＧＢ値に含まれる複数個の成分値（Ｒ値、Ｇ値、Ｂ値）のうちの最小値である。ＣＰＵ２１０は、これらの最小成分値Ｖｍｉｎを複数個の画素の値とする画像データを、最小成分データとして生成する。最小成分データは、スキャン画像ＳＩと同じサイズの画像を示す画像データである。最小成分データに含まれる複数個の画素の値のそれぞれは、スキャンデータの対応する画素の値（ＲＧＢ値）の最小成分値Ｖｍｉｎである。

図１０は、スキャンデータの最小成分値と最大成分値の説明図である。図１０（Ａ）〜図１０（Ｅ）には、ＲＧＢ値の一例として、シアン（Ｃ）、マゼンタ（Ｍ）、イエロ（Ｙ）、黒（Ｋ）、白（Ｗ）のＲＧＢ値が、棒グラフで図示されている。図１０に示すように、Ｃ、Ｍ、Ｙ、Ｋ、ＷのＲＧＢ値（Ｒ、Ｇ、Ｂ）は、それぞれ、（０、２５５、２５５）、（２５５、０、２５５）（２５５、２５５、０）、（０、０、０）、（２５５、２５５、２５５）である。

これらのＲＧＢ値の輝度Ｙは、上述したように、例えば、Ｙ＝０．２９９×Ｒ＋０．５８７×Ｇ＋０．１１４×Ｂの式を用いて算出できる。Ｃ、Ｍ、Ｙ、Ｋ、Ｗの輝度（０〜２５５の値で表す）は、約１８６、１１３、２２６、０、２５５であり、それぞれに異なる値となる（図１０）。これに対して、Ｃ、Ｍ、Ｙ、Ｋ、Ｗの最小成分値Ｖｍｉｎは、図１０に示すように、０、０、０、０、２５５となり、白（Ｗ）を除いて同じ値となる。

図１１は、画像処理に用いられる画像の一例を示す第２の図である。図１１（Ａ）は、スキャン画像ＳＩのうち、上述した網点領域の拡大図である。例えば、図１１（Ａ）の例では、スキャン画像ＳＩ内の網点領域は、複数個のＭドットＭＤと、複数個のＹドットＹＤと、を含んでいる。ここでは、説明のために、ＭドットＭＤを示す画像は、マゼンタの原色を有する均一な画像であり、ＹドットＹＤを示す画像は、イエロの原色を有する均一な画像であるとする。

図１１（Ｂ）には、最小成分データによって示される最小成分画像ＭＮＩの一例が示されている。この最小成分画像ＭＮＩは、図１１（Ａ）のスキャン画像ＳＩに対応している。最小成分画像ＭＮＩでは、スキャン画像ＳＩのＹドットＭＤに対応する領域ＭＤｂ内の画素の値と、ＹドットＹＤに対応する領域ＹＤｂ内の画素の値と、は互いに同じとなる。図１１（Ｃ）には、比較例として、各画素の輝度を示す輝度画像データによって示される輝度画像ＹＩが示されている。この輝度画像ＹＩは、図１１（Ａ）のスキャン画像ＳＩに対応している。輝度画像ＹＩでは、最小成分画像ＭＮＩとは異なり、スキャン画像ＳＩのＭドットＭＤに対応する領域ＭＤｄ内の画素の値と、ＹドットＹＤに対応する領域ＹＤｄ内の画素の値と、は互いに異なる。

以上の説明から解るように、最小成分画像ＭＮＩでは、スキャン画像ＳＩにおいて、原稿内のＣ、Ｍ、Ｙ、Ｋドットが形成された部分に対応する複数個の画素の値の間の差が、輝度画像ＹＩよりも小さくなる。そして、最小成分画像ＭＮＩでは、スキャン画像ＳＩにおいて、原稿内の地色（用紙の白色）を示す領域に対応する地色領域の画素の値が、ドットが形成された部分に対応する画素の値よりも大きくなる。

Ｓ３１０では、ＣＰＵ２１０は、生成された最小成分データに対して、該最小成分データによって示される最小成分画像ＭＮＩを平滑化する平滑化処理を実行して、平滑化済みの最小成分データを生成する。具体的には、ＣＰＵ２１０は、最小成分データの各画素の値に、所定の平滑化フィルタ、本実施例では、縦５画素×横５画素のガウスフィルタを適用することによって、平滑化済みの各画素の値を算出する。平滑化済みの最小成分データは、スキャンデータの対応する画素の値（ＲＧＢ値）に基づいて上述した処理で生成された平滑化済みの値を画素ごとに含んでいる。

Ｓ３２０では、ＣＰＵ２１０は、平滑化済みの最小成分データに対して、当該平滑化済みの最小成分データによって示される平滑化済みの最小成分画像ＭＮＩ内のエッジを抽出するエッジ抽出処理を実行して、エッジ抽出データを生成する。具体的には、ＣＰＵ２１０は、平滑化済みの最小成分データの各画素の値に、図５のＳ１３０の処理と同一のソーベルフィルタを適用して、エッジ強度を算出する。ＣＰＵ２１０は、これらのエッジ強度を、複数個の画素の値とするエッジ抽出データを生成する。

Ｓ３３０では、ＣＰＵ２１０は、エッジ抽出データに対して、レベル補正処理を実行して、補正処理済みのエッジ抽出データを生成する。レベル補正処理は、図５のＳ１４０の処理と同一である。Ｓ３４０では、ＣＰＵ２１０は、補正処理済みのエッジ抽出データに対して、図５のＳ１５０の処理と同様の二値化処理を実行して、二値画像データを生成する。二値画像データでは、上述したように、エッジ画素の値は、「１」とされ、非エッジ画素の値は、「０」とされる。

以上説明した第２の二値画像データ生成処理によれば、最小成分データに対してエッジ抽出処理が実行され、エッジ抽出データが生成される（Ｓ３２０）。そして、該エッジ抽出データを二値化する処理（Ｓ３４０）を含むエッジ画素特定処理が実行することによって、スキャン画像ＳＩの複数個のエッジ画素が特定される（Ｓ３３０、Ｓ３４０、図２のＳ２６）。最小成分データでは、図１１を参照して説明したように、網点領域において、画素間の値の差を抑制できるので、その後に、エッジ画素を特定する際に、網点に起因するエッジ画素が特定されることを抑制できる。したがって、スキャン画像ＳＩ内のエッジ画素を適切に特定できる。

より具体的に説明すると、網点領域を構成する要素は、Ｃ、Ｍ、Ｙ、Ｋの各ドットと、用紙の地色（白）と、の５種類である。最小成分データでは、これらの要素のうち、４種類の要素を示す画素の間の値の差を抑制できる。この結果、最小成分データを用いる場合には、網点のエッジを示すエッジ画素が特定されることを抑制することができる。

一方で、文字の色と背景の色とは、一方が、濃い色を有し、他方が薄い色を有する場合が多い。このために、文字と背景のうち、一方は、用紙の地色（白）を示す部分を比較的多く含み、他方は、Ｃ、Ｍ、Ｙ、Ｋのドットを示す部分を比較的多く含む場合が多い。図１０に示すように、最小成分データでは、Ｃ、Ｍ、Ｙ、Ｋのドットを示す部分の画素の値と、用紙の地色（白）を示す部分の画素の値と、の間で、大きな差がある。このために、最小成分データを用いて、エッジ画素を特定すると、文字のエッジを構成するエッジ画素は、適切に特定できる可能性が高い。特に、イエロ（Ｙ）は、Ｃ、Ｍ、Ｋと比較して濃度が低い（輝度が高い）。このために、用紙の地色（白）の背景に、イエロの文字がある場合には、輝度画像データを二値化しても、該イエロの文字のエッジを構成するエッジ画素を、適切に特定できない場合がある。本実施例では、このような場合でも該イエロの文字のエッジを構成するエッジ画素を、適切に特定できる。このために、輝度画像データを用いたエッジ画素の特定に加えて、最小成分データを用いたエッジ画素の特定を実行することで、輝度画像データだけでは、特定できない文字などのエッジ画素を特定し得る。この結果、スキャン画像ＳＩ内のエッジ画素の特定精度を向上できる。

さらに、最小成分データに対して、エッジ抽出処理の前に平滑化処理が実行される（Ｓ３１０）。この結果、平滑化処理によって、最小成分画像ＭＮＩ内の網点領域おいて、画素間の値の差を、さらに抑制できる。例えば、スキャン画像ＳＩ内の網点領域において、Ｃ、Ｍ、Ｙ、Ｋのドットの重なりや、読取実行部２９０での読取時のぼけなどによって、ドットを示す部分は、必ずしもＣ、Ｍ、Ｙ、Ｋの原色を有している訳ではない。このために、最小成分画像ＭＮＩ内では、Ｃ、Ｍ、Ｙ、Ｋの各ドットを示す複数個の画素の間の値が、小さくなってはいるものの、ゼロではない。平滑化処理によって、該画素の間の値の差をさらに小さくすることができる。この結果、網点に起因するエッジ画素が特定されることを、さらに抑制できる。また、第２の二値画像データ生成処理においても、第１の二値画像データ生成処理と同様に、レベル補正処理（Ｓ３３０）が実行されるので、スキャン画像ＳＩ内のエッジ画素の特定精度を向上できる。

以上説明したように、上記実施例では、２種類の単成分画像データ、すなわち、輝度画像データと、最小成分データと、を用いて、最終的にエッジ画素が特定される（図２のＳ２２〜Ｓ２６）。このように互いに異なる処理を用いて生成される２種類の単成分画像データを用いて、スキャン画像ＳＩ内の複数個のエッジ画素が特定されるので、スキャン画像ＳＩ内の複数個のエッジ画素の特定漏れを抑制できる。例えば、白の背景にイエロの文字がある場合には、白とイエロの輝度の差は比較的小さいので、輝度画像データを用いて、該文字のエッジを構成するエッジ画素を特定することは困難である。これに対して、図１０（Ｃ）、（Ｅ）から解るように、最小成分データでは、白とイエロとの差が大きく現れるので、白の背景にイエロの文字がある場合には、最小成分データを用いて、該文字のエッジを構成するエッジ画素を特定することは容易である。また、例えば、マゼンタの背景にイエロの文字がある場合には、最小成分データには、マゼンタとイエロとの差が現れないので、最小成分データを用いて、該文字のエッジを構成するエッジ画素を特定することは困難である。これに対して、マゼンタの背景にイエロの文字がある場合には、マゼンタとイエロの輝度の差は、比較的大きいので、輝度画像データを用いて、該文字のエッジを構成するエッジ画素を特定することは容易である。

また、輝度画像データに加えて用いられる単成分画像データは、最小成分データであるので、上述の通り、スキャン画像ＳＩ内の網点に起因するエッジ画素が特定されることは、抑制できる。

Ａ−６：非文字領域判定処理
図２のＳ２８の非文字領域判定処理について説明する。図１２は、非文字領域判定処理のフローチャートである。図１３は、非文字領域判定処理で用いられる画像の一例を示す図である。

ＣＰＵ２１０は、スキャンデータに対して、Ｓ４０５〜Ｓ４２０の前処理を実行して、前処理済画像データを生成する。

Ｓ４０５では、ＣＰＵ２１０は、スキャンデータを用いて、上述した図９のＳ３００と同様に、最小成分データを生成する。図９のＳ３００で生成した最小成分データを、揮発性記憶装置２２０または不揮発性記憶装置２３０に保存しておく場合には、該最小成分データを利用しても良い。

Ｓ４１０では、ＣＰＵ２１０は、最小成分データを二値化して、二値画像データを生成する。例えば、ＣＰＵ２１０は、最小成分データにおいて、画素の値が閾値（例えば、１２８）以上である画素を、特定対象画素に分類し、画素の値が閾値以上である画素を、非特定対象画素に分類する。二値画像データでは、例えば、特定対象画素の値は、「１」とされ、非特定対象画素の値は、「０」とされる。上述したように、最小成分データでは、図１０、図１１を参照して説明したように、スキャン画像ＳＩにおいて、原稿内のＣ、Ｍ、Ｙ、Ｋドットが形成された部分に対応する複数個の画素の値が、原稿内の地色（用紙の白色）を示す領域に対応する地色領域の画素の値よりも小さくなる。したがって、本ステップで生成される二値画像データでは、原稿内のドットが形成された部分に対応する複数個の画素が、地色領域の複数個の画素が非特定対象画素に分類される。このように、最小成分データを二値化することで、原稿に印刷されたオブジェクト（ドットで形成される画像）を構成するオブジェクト画素を精度良く特定することができる。

ここで、本ステップで生成される二値画像データは、後述するＳ４１５の膨張処理を実行する前の画像データであるので、膨張処理前画像データとも呼び、膨張処理前画像データによって示される画像を膨張処理前画像ＯＩとも呼ぶ。図１３（Ａ）には、膨張処理前画像ＯＩの一例が示されている。膨張処理前画像ＯＩでは、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ６に対応する特定対象画素Ｏｐ１〜Ｏｐ６が特定されている。原稿の文字は、比較的濃い色であることが多いので、膨張処理前画像ＯＩにおいて、文字に対応する領域には、概ね隙間無く特定対象画素Ｏｐ３〜Ｏｐ６が特定される。原稿の写真領域には、全体にドットが形成されるので、膨張処理前画像ＯＩにおいて、写真に対応する領域には、全体に特定対象画素Ｏｐ１、Ｏｐ２が特定される。ただし、写真は、濃い色も薄い色も含み得るので、膨張処理前画像ＯＩにおいて、写真に対応する領域には、非特定対象画素（図１３（Ａ）の膨張処理前画像ＯＩ内の白色部分）も全体に分散して配置されている。

Ｓ４１５、Ｓ４２０では、ＣＰＵ２１０は、膨張処理前画像データに対して、膨張処理と収縮処理とを実行して、前処理済画像データを生成する。図１４、図１５は、膨張処理と収縮処理について説明する図である。

Ｓ４１５では、ＣＰＵ２１０は、膨張処理前画像データに対して、１回の膨張処理を実行する。図１４（Ａ）には、膨張処理前画像ＯＩのうち、スキャン画像ＳＩ内の文字Ｏｂ３〜Ｏｂ６に対応する細線を含む部分画像ＰＩ１が示されている。図１５（Ａ）には、膨張処理前画像ＯＩのうち、スキャン画像ＳＩ内の写真Ｏｂ１、Ｏｂ２に対応する領域の一部である部分画像ＰＩ２が示されている。図１４（Ａ）においてハッチングされた部分は、文字に対応する特定対象画素Ｏｐｔを示し、図１５（Ａ）においてハッチングされた部分は、写真に対応する特定対象画素Ｏｐｐを示す。

膨張処理は、例えば、所定サイズのフィルタ、図１４（Ａ）の例では、縦３画素×横３画素のサイズのフィルタＦＩ１を用いて、実行される。具体的には、ＣＰＵ２１０は、フィルタＦＩ１を、膨張処理前画像データに対して適用して、膨張処理済みの二値画像データを生成する。すなわち、ＣＰＵ２１０は、注目画素に、フィルタＦＩ１の中心位置ＣＣ１（図１４（Ａ）参照）が重なるように、フィルタＦＩ１を、膨張処理前画像ＯＩ上に配置する。ＣＰＵ２１０は、フィルタＦＩ１の範囲内に、特定対象画素が１個でも存在する場合には、生成すべき二値画像において注目画素に対応する画素を特定対象画素に設定する。ＣＰＵ２１０は、フィルタＦＩ１の範囲内に、特定対象画素が１つもない場合、すなわち、フィルタＦＩ１の範囲内の９個の画素が、非特定対象画素である場合には、生成すべき二値画像において注目画素に対応する画素を非特定対象画素に設定する。ＣＰＵ２１０は、二値画像ＢＩの全ての画素を注目画素として、生成すべき二値画像内の対応する画素を、特定対象画素および非特定対象画素のいずれかに設定することによって、膨張処理済みの二値画像データを生成する。

図１４（Ｂ）には、図１４（Ａ）の部分画像ＰＩ１に対応する膨張処理済みの部分画像ＰＩ１ｂが示されている。図１５（Ｂ）には、図１５（Ａ）の部分画像ＰＩ２に対応する膨張処理済みの部分画像ＰＩ２ｂが示されている。図１４（Ｂ）に示すように、膨張処理済みの二値画像（例えば、部分画像ＰＩ１ｂ）では、文字に対応する特定対象画素Ｏｐｔによって示される線は、膨張処理前と比較して、太くなる。図１５（Ｂ）に示すように、膨張処理済みの二値画像（例えば、部分画像ＰＩ２ｂ）では、膨張処理前において写真に対応する領域内に混じっている非特定対象画素ＶＡ（図１５（Ａ））が、特定対象画素Ｏｐｐに変更されて、写真に対応する領域内の全体が、特定対象画素Ｏｐｐで構成される。

Ｓ４２０では、ＣＰＵ２１０は、膨張処理済みの二値画像データに対して、３回の収縮処理を実行する。

収縮処理は、例えば、所定サイズのフィルタ、図１４（Ｂ）の例では、縦３画素×横３画素のサイズのフィルタＦＩ２を用いて、膨張処理済みの二値画像データに対して実行される。具体的には、ＣＰＵ２１０は、フィルタＦＩ２を、二値画像データに対して適用して、収縮処理済みの二値画像データを生成する。すなわち、ＣＰＵ２１０は、注目画素に、フィルタＦＩ２の中心位置ＣＣ２（図１４（Ｂ）参照）が重なるように、フィルタＦＩ２を膨張処理済みの二値画像（例えば、部分画像ＰＩ１ｂ、ＰＩ２ｂ）に配置する。ＣＰＵ２１０は、フィルタＦＩ２の範囲内に、非特定対象画素が１個でも存在する場合には、生成すべき二値画像において注目画素に対応する画素を非特定対象画素に設定する。そして、ＣＰＵ２１０は、フィルタＦＩ２の範囲内に、非特定対象画素が１つもない場合には、生成すべき二値画像において注目画素に対応する画素を特定対象画素に設定する。ＣＰＵ２１０は、膨張処理済みの二値画像の全ての画素を注目画素として、生成すべき二値画像内の対応する画素を、特定対象画素および非特定対象画素のいずれかに設定することによって、収縮処理済みの二値画像データを生成する。

図１４（Ｃ）には、図１４（Ｂ）の部分画像ＰＩ１ｂに対応する収縮処理済みの部分画像ＰＩ１ｃが示されている。図１５（Ｃ）には、図１５（Ｂ）の部分画像ＰＩ２ｂに対応する収縮処理済みの部分画像ＰＩ２ｃが示されている。図１４（Ｃ）に示すように、膨張処理済みの二値画像（例えば、部分画像ＰＩ１ｃ）では、文字に対応する特定対象画素Ｏｐｔに示される線は、収縮処理前と比較して、細くなる。収縮処理前において写真に対応する領域には、非特定対象画素ＶＡが混じっていないので（図１５（Ｂ））、図１５（Ｃ）に示すように、収縮処理済みの二値画像（例えば、部分画像ＰＩ２ｃ）では、写真に対応する領域内の全体が、特定対象画素Ｏｐｐのまま維持される。

ＣＰＵ２１０は、１回目の収縮処理済みの二値画像データに対して、同様の収縮処理を実行して、２回目の収縮処理済みの二値画像データを生成し、２回目の収縮処理済みの二値画像データに対して、同様の収縮処理を実行して、３回目の収縮処理済みの二値画像データを生成する。３回目の収縮処理済みの二値画像データを、前処理済画像データともよび、前処理済画像データによって示される画像を、前処理済画像ＯＩｂとも呼ぶ。

図１３（Ｂ）には、前処理済画像ＯＩｂの一例が示されている。前処理済画像ＯＩｂは、スキャン画像ＳＩ内のオブジェクトＯｂ１〜Ｏｂ６に対応する特定対象画素Ｏｐ１ｂ〜Ｏｐ６ｂが特定されている。

前処理済画像ＯＩｂでは、文字に対応する特定対象画素Ｏｐ３ｂ〜Ｏｐ６ｂで示される線は、膨張処理前画像ＯＩと比較して、細くなっている。これは、収縮処理の回数（本実施例では、３回）が、膨張処理の回数（本実施例では、１回）より多いために、収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きいからである。なお、膨張処理前画像ＯＩにて文字に対応する特定対象画素Ｏｐ３〜Ｏｐ６で示される線が比較的細い場合には、収縮処理によって、文字に対応する特定対象画素Ｏｐ３〜Ｏｐ６の全部または一部が、消滅する場合もある。非文字領域判定処理では、非文字領域が特定できれば良いので、文字に対応する特定対象画素Ｏｐ３〜Ｏｐ６は、消滅しても構わない。

前処理済画像ＯＩｂでは、写真に対応する領域内の全体が、特定対象画素Ｏｐ１ｂ、Ｏｐ２ｂで構成される。これは、膨張処理によって、一旦、写真に対応する領域内の全体が、特定対象画素になった後では、収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きくても、写真に対応する領域内の全体が、特定対象画素のまま維持されるためである。収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きいために、前処理済画像ＯＩｂでは、写真に対応する複数個の特定対象画素Ｏｐ１ｂ、Ｏｐ２ｂが位置する領域の全体が、膨張処理前画像ＯＩにて写真に対応する複数個の特定対象画素Ｏｐ１、Ｏｐ２が位置する領域の全体よりも僅かに小さくなるが、その差は問題にならない程度である。

Ｓ４２５では、ＣＰＵ２１０は、前処理済画像データに対して、ラベリング処理を行うことによって、複数個の対象領域を決定する。具体的には、ＣＰＵ２１０は、連続する１以上の特定対象画素で構成される１つの領域を一つの対象領域として、一つの識別子を割り当てる。そして、ＣＰＵ２１０は、互いに離れた複数の対象領域に、互いに異なる識別子を割り当てる。このようなラベリング処理によって、複数個の対象領域が特定される。図１３（Ｂ）の例では、スキャン画像ＳＩ内の４個の文字Ｏｂ３ｂ〜Ｏｂ６に対応する４個の対象領域ＴＡ３〜ＴＡ６と、スキャン画像ＳＩ内の２個の写真Ｏｂ１、Ｏｂ２に対応する２個の対象領域ＴＡ１、ＴＡ２と、が決定される。スキャン画像ＳＩの複数個の画素と、膨張処理前画像ＯＩの複数個の画素とは、一対一で対応しているので、膨張処理前画像ＯＩ上に対象領域を決定することは、スキャン画像ＳＩ上に対象領域を決定することと同義である。

Ｓ４３０では、ＣＰＵ２１０は、非文字領域データを生成するためのキャンバスデータをメモリ（具体的には、揮発性記憶装置２２０のバッファ領域）に準備する。キャンバスデータによって示されるキャンバス（初期画像）は、スキャン画像ＳＩと同じサイズの二値画像、すなわち、同じ画素数の二値画像である。キャンバスデータの各画素の値は、非文字領域とは異なる領域の画素であることを示す所定の初期値（例えば、０）である。

Ｓ４３５では、ＣＰＵ２１０は、前処理済画像ＯＩｂに決定済みの複数個の対象領域の中から、１個の注目対象領域を選択する。

Ｓ４４０では、ＣＰＵ２１０は、注目対象領域を構成する特定対象画素の画素数ＰＮを算出する。Ｓ４４５では、ＣＰＵ２１０は、画素数ＰＮが閾値ＴＨ１以上であるか否かを判断する。閾値ＴＨ１は、原稿のサイズやスキャン画像ＳＩの解像度に応じた値であり、文字や写真を含む原稿に基づくスキャンデータを用いて、経験的に予め定められる。画素数ＰＮが閾値ＴＨ１以上である場合には（Ｓ４４５：ＹＥＳ）、ＣＰＵ２１０は、Ｓ４５０に処理を進める。

Ｓ４５０では、ＣＰＵ２１０は、注目対象領域に外接する外接矩形ＯＳに対する注目対象領域の占有率ＰＲを算出する。例えば、図１３（Ｂ）の対象領域ＴＡ５が、注目対象領域である場合には、破線で示す外接矩形ＯＳ５の画素数ＳＮに対する、対象領域ＴＡ５の画素数ＰＮが、占有率ＰＲとして算出される（ＰＲ＝ＳＮ／ＰＮ）。Ｓ４５５では、ＣＰＵ２１０は、占有率ＰＲが閾値ＴＨ２以上であるか否かを判断する。閾値ＴＨ２は、文字や写真を含む原稿に基づくスキャンデータを用いて、経験的に予め定められる。閾値ＴＨ２は、例えば、８０％〜９０％である。占有率ＰＲが閾値ＴＨ２以上である場合には（Ｓ４５５：ＹＥＳ）、ＣＰＵ２１０は、Ｓ４６０に処理を進める。

Ｓ４６０では、ＣＰＵ２１０は、注目対象領域を非文字領域に設定する。具体的には、ＣＰＵ２１０は、キャンバスデータにおいて、注目対象領域に対応する領域内の全ての画素の値を、非文字を示す値「１」に設定する。

画素数ＰＮが閾値ＴＨ１未満である場合には（Ｓ４４５：ＮＯ）、および、占有率ＰＲが閾値ＴＨ２未満である場合には（Ｓ４５５：ＮＯ）、ＣＰＵ２１０は、Ｓ４６０をスキップして、Ｓ４７０に処理を進める。すなわち、この場合には、注目対象領域は、非文字領域とは異なる領域に設定される。したがって、キャンバスデータにおいて、注目対象領域に対応する領域内の全ての画素の値は、初期値「０」に維持される。

Ｓ４７０では、ＣＰＵ２１０は、前処理済画像ＯＩｂ内の全ての対象領域を注目対象領域として処理したか否かを判断する。未処理の対象領域がある場合には（Ｓ４７０：ＮＯ）、ＣＰＵ２１０は、Ｓ４３５に戻って、未処理の対象領域を注目対象領域として選択する。全ての対象領域が処理された場合には（Ｓ４７０：ＹＥＳ）、ＣＰＵ２１０は、非文字領域判定処理を終了する。この時点で、図４（Ｂ）に示す非文字領域データが生成されている。

以上説明した本実施例によれば、文字特定処理（図２のＳ２０）のＳ２２〜Ｓ２６にて、ＣＰＵ２１０は、スキャンデータを用いて、スキャン画像ＳＩ内の複数個の画素のそれぞれが、文字画素の候補であるか否かを画素ごとに判断することによって、複数個の文字候補画素を決定する（図２のＳ２２〜Ｓ２６）。非文字領域判定処理（図２のＳ２８、図１２）では、ＣＰＵ２１０は、スキャンデータに対して、膨張処理（図１２のＳ４１５）を含む前処理（図１２のＳ４０５〜Ｓ４２０）を実行して、前処理済画像データを生成する。ＣＰＵ２１０は、前処理済画像データに対応する画像（前処理済画像ＯＩｂ）上に配置される複数個の対象領域のそれぞれが特定の判断条件を満たすか否かを判断することによって、スキャン画像ＳＩ内の非文字領域を特定する（図１２のＳ４３５〜Ｓ４７０）。スキャン画像ＳＩ内の複数個の画素のうち、図２のＳ２６にて文字候補画素であると決定され、かつ、図２のＳ２８にて特定される非文字領域とは異なる領域にある画素が、文字画素として特定される（図２のＳ２９）。前処理済画像データでは、写真の網点を構成する特定対象画素が、膨張処理によって一塊の画素群として現れやすい（図１３（Ｂ））。この結果、スキャン画像ＳＩ内において、写真などの網点を構成する画素を含む領域が、非文字領域として精度良く特定できる。そして、非文字領域とは異なる領域にある画素が、文字画素として特定される。したがって、例えば、図２のＳ２６にて網点を構成する画素が文字候補画素であると誤って決定されたとしても、図２のＳ２８の前処理済画像データを用いた判断によって、網点を構成する画素を含む領域が非文字領域であると決定されることで、網点を構成する画素が文字画素であると誤って特定されることを抑制できる。したがって、網点を含む画像であっても、スキャン画像ＳＩ内の文字画素を精度良く特定できる。

さらに、本実施例の非文字領域判定処理では、前処理において、膨張処理（Ｓ４１５）の後に収縮処理（Ｓ４２０）を実行して、前処理済画像データが生成される。この結果、前処理済画像ＯＩｂにおいて、文字に対応する特定対象画素が一塊の画素群になることを抑制できる。例えば、文字を構成する細線が、膨張処理によって、隣接する他の線と部分的に繋がってしまったとしても、収縮処理によって再度分離することができる。この結果、スキャン画像ＳＩ内の文字に対応する領域が、非文字領域として誤って特定されることを抑制できる。

さらに、本実施例では、非文字領域を決定するための特定の判断条件は、外接矩形ＯＳに占める特定対象画素の割合（占有率ＰＲ）が、基準割合（閾値ＴＨ２）以上であることを含む（図１２のＳ４５５）。写真は、矩形の形状を有している可能性が高いのに対して、文字は、細線で構成される。このために、図１３（Ｂ）に示すように、写真に対応する対象領域（例えば、対象領域ＴＡ１）は、文字に対応する対象領域（例えば、対象領域ＴＡ３）よりも占有率ＰＲが高いと考えられる。占有率ＰＲを用いることによって、非文字領域を適切に特定することができる。

さらに、本実施例では、非文字領域を決定するための特定の判断条件は、対象領域内の特定対象画素の個数（画素数ＰＮ）が、基準数（閾値ＴＨ１）以上であることを含む（図１２のＳ４４５）。本実施例で非文字として想定している写真は、図１３（Ｂ）に示すように一塊の特定対象画素で構成され、スキャン画像ＳＩ上である程度の面積を占めている可能性が高い。文字は、細線で構成されるので、文字の面積は比較的小さい可能性が高い。このために、図１３（Ｂ）に示すように、写真に対応する対象領域（例えば、対象領域ＴＡ１）は、文字に対応する対象領域（例えば、対象領域ＴＡ３）よりも画素数ＰＮが多いと考えられる。画素数ＰＮを用いることによって、非文字領域を適切に特定することができる。

さらに、本実施例では、Ｓ４２０の収縮処理の収縮の程度は、Ｓ４１５の膨張処理の膨張の程度よりも大きい。この結果、収縮処理によって、膨張処理によって繋がってしまった細線をより確実に分離できる。したがって、文字に対応する特定対象画素が一塊の画素群になることをさらに効果的に抑制できる。

さらに、本実施例では、Ｓ４１５の膨張処理は、１回行われ、Ｓ４２０の膨張処理は、３回行われる。すなわち、本実施例では、膨張処理は、１回の単位膨張処理を含み、収縮処理は、３回の単位収縮処理を含む。この結果、容易に、Ｓ４２０の収縮処理の収縮の程度は、Ｓ４１５の膨張処理の膨張の程度よりも大きくすることができる。

さらに、本実施例の非文字領域判定処理では、ＣＰＵ２１０は、前処理済画像データを用いて、前処理済画像ＯＩｂ内の連続する複数個の特定対象画素によって構成される領域を、対象領域として決定する（図１２のＳ４２５）。この結果、非文字領域であるか否かを決定するための適切な対象領域を決定することができる。

さらに、本実施例の非文字領域判定処理では、図１２のＳ４３０にて準備されるキャンバスデータにおいて、各画素の初期値が、非文字領域とは異なる領域の画素であることを示す値（例えば、０）とされている。そして、対象領域のうち、非文字領域であると判断される領域だけが非文字領域に決定される（Ｓ４６０）。したがって、前処理済画像ＯＩｂにおいて、特定対象画素とは異なる画素（非特定対象画素）によって構成される領域（例えば、白地の背景領域）は、非文字領域とは異なる領域として特定される（図４（Ｂ））。この結果、例えば、文字に対応する特定対象画素が、Ｓ４２０の収縮処理によって消滅したとしても問題がない。したがって、文字画素を漏れなく特定することができる。

本実施例では、ＣＰＵ２１０は、スキャンデータを用いて最小成分データを生成し（図１２のＳ４０５）、最小成分データを用いて、膨張処理前画像データを生成し（図１２のＳ４１０）、膨張処理前画像データに対して、膨張処理を含む処理（Ｓ４１５、Ｓ４２０）を実行して、前処理済画像データを生成する。この結果、最小成分データを用いることで、網点を構成する画素が特定対象画素として精度良く特定される。したがって、非文字領域が精度良く特定される。

さらに、上記実施例によれば、ＣＰＵ２１０は、Ｓ１５での拡大処理の拡大率Ｌｒが閾値Ｌｔｈ未満である場合には（Ｓ２７：ＹＥＳ）、Ｓ２８の非文字領域判定処理とＳ２９の合成処理とを実行する。すなわち、この場合には、スキャン画像ＳＩ内の複数個の画素のうち、Ｓ２２〜Ｓ２６にて文字候補画素であると決定され、かつ、Ｓ２８にて非文字画素であると決定されない画素が、文字画素として特定される。そして、拡大率Ｌｒが閾値Ｌｔｈ以上である場合には（Ｓ２７：ＮＯ）、Ｓ２８とＳ２９の処理は実行されない。すなわち、この場合には、スキャン画像ＳＩ内の複数個の画素のうち、文字候補画素であると決定される画素が、文字画素として特定される。この結果、スキャンデータの生成時の拡大率Ｌｒに応じて、適切な文字画素が特定される。詳しく説明すると、スキャン画像ＳＩを閾値Ｌｔｈ以上の拡大率で拡大して出力（本実施例では印刷）する場合には、出力される画像において、網点自体が比較的大きいので、網点が目立っていても不自然な見栄えにはならないことが多い。このために、拡大率Ｌｒが閾値Ｌｔｈ以上である場合には、出力される画像において、当該大きな網点がはっきりと見える方が、ぼけているよりも自然な見栄えになることが多い。また、拡大コピーは、原稿をそのまま拡大して示す画像を出力すべきであるので、拡大コピーでは、網点もそのまま拡大されて出力されること望ましいと考えられる。さらには、網点があるサイズ以上に拡大されると、印刷時のドットの周期成分との干渉によるモアレが発生しなくなる。このために、拡大率Ｌｒが閾値Ｌｔｈ以上である場合には、網点のエッジは、文字のエッジと同様に、エッジ強調処理の対象となる方が、平滑化処理の対象となるよりも好ましいと考えられる。このために、拡大率Ｌｒが閾値Ｌｔｈ以上である場合には、スキャン画像ＳＩ内の複数個の画素のうち、文字画素とともに網点のエッジを構成する画素を含み得る文字候補画素が、文字画素として特定されることが好ましいと考えられる。

以上の説明から解るように、本実施例における最小成分データは、第１の画像データの例であり、特定対象画素は、特定条件を満たす画素の例であり、膨張処理前画像データは、中間画像データの例である。

Ｂ．変形例：

（１）上記実施例の図１２の非文字領域判定処理において、前処理は、Ｓ４２０の収縮処理を含んでいるが、Ｓ４２０の収縮処理は、省略されても良い。この場合でも、非文字領域判定処理において、写真Ｏｂ１、Ｏｂ２に対応する領域を、非文字領域として特定できる。この場合には、例えば、Ｓ４５５の判断において文字領域の占有率ＰＲが上記実施例に比べて大きな値になるので、ＴＨ２などの閾値は、上記実施例に比べ大きく設定される。

（２）上記実施例の図１２の非文字領域判定処理において、Ｓ４２０の収縮処理の収縮の程度は、Ｓ４１２の膨張処理の膨張の程度よりも大きい。これに代えて、Ｓ４２０の収縮処理の収縮の程度は、Ｓ４１２の膨張処理の膨張の程度と同じでも良よい。また、Ｓ４２０の収縮処理の収縮の程度は、Ｓ４１２の膨張処理の膨張の程度より小さくても良い。

（３）上記実施例の図１２の非文字領域判定処理において、Ｓ４１５の膨張処理の回数は、１回であるが、１回に限られない。一般的には、Ｓ４１５の膨張処理は、Ｎ回（Ｎは１以上の整数）の単位膨張処理を含めば良い。同様に、Ｓ４２０の収縮処理の回数は、３回であるが、３回に限られない。一般的には、Ｓ４２０の収縮処理は、Ｍ回（Ｍは１以上の整数）の単位収縮処理を含めば良い。この場合に、収縮処理の収縮の程度を、膨張処理の膨張の程度よりも大きくするために、Ｍ＞Ｎを満たすことが好ましい。

（４）上記実施例の図１２の非文字領域判定処理において、Ｓ４２０の収縮処理の回数が、Ｓ４１５の膨張処理の回数より多くされることで、Ｓ４２０の収縮処理の収縮の程度が、Ｓ４１２の膨張処理の膨張の程度よりも大きくされている。これに代えて、Ｓ４２０の収縮処理で用いられるフィルタＦＩ２が、Ｓ４１５の膨張処理で用いられるフィルタＦＩ１よりも大きくされることで、収縮処理の収縮の程度が、膨張処理の膨張の程度よりも大きくされても良い。

（５）上記実施例の図１２の非文字領域判定処理において、連続する複数個の特定対象画素が、１個の対象領域ＴＡ１〜ＴＡ６に決定されている（Ｓ４２５、図１３（Ｂ））。これに代えて、例えば、前処理済画像ＯＩｂを升目状に分割することによって、前処理済画像ＯＩｂ上に複数個の矩形の対象領域が決定されても良い。この場合には、対象領域には、特定対象画素と、非特定対象画素と、の両方が含まれ得る。この場合には、対象領域に含まれる特定対象画素の個数が閾値以上である場合に、該対象領域は非文字領域であると判断されても良いし、対象領域の総画素数に占める特定対象画素の画素数の割合が閾値以上である場合に、該対象領域は非文字領域であると判断されても良い。

（６）上記実施例の非文字領域判定処理において、対象領域が非文字領域であると判断されるための特定の判断条件は、画素数ＰＮが閾値ＴＨ１以上であり、かつ、占有率ＰＲが閾値ＴＨ２以上であることである。特定の判断条件は、これに限られない。例えば、特定の判断条件は、画素数ＰＮが閾値ＴＨ１以上であること、または、占有率ＰＲが閾値ＴＨ２以上であることであっても良い。また、特定の判断条件は、画素数ＰＮが閾値ＴＨ１以上であることだけが用いられても良いし、占有率ＰＲが閾値ＴＨ２以上であることだけが用いられても良い。また、特定の判断条件は、他の条件、例えば、対象領域の縦横比が、写真の領域として想定される所定の縦横比の範囲内であることを含んでも良い。

（７）上記実施例の図２の画像処理において、Ｓ２４の第２の二値画像データ生成処理およびＳ２６の合成処理は省略されても良い。すなわち、第１の二値画像データ生成処理において特定される複数個のエッジ画素が、最終的なエッジ特定データであっても良い。

（８）上記実施例の図２の画像処理において、図２のＳ２７は省略されても良い。すなわち、ＣＰＵ２１０は、スキャンデータの生成時の拡大率Ｌｒに拘わらずに、Ｓ２８、Ｓ２９を常に実行しても良い。

（９）図５の第１の二値画像データ生成処理（図５）では、単成分画像データとして、輝度画像データが用いられる（Ｓ１２０）。これに代えて、スキャンデータの対応する画素のＲＧＢ値に含まれる３個の成分値（Ｒ値、Ｇ値、Ｂ値）の平均値を、各画素の値とする平均成分値画像データが用いられても良い。

（１０）上記実施例の第２の二値画像データ生成処理（図９）では、単成分画像データとして、最小成分データが用いられる（Ｓ３００）。これに代えて、最大成分データや反転最小成分データが用いられても良い。

最大成分データは、スキャンデータに含まれる複数個の画素に対応する複数個の値を含み、該複数個の値のそれぞれは、スキャンデータの対応する画素の最大成分値Ｖｍａｘである。最大成分値Ｖｍａｘは、スキャンデータの対応する画素のＲＧＢ値に含まれる複数個の成分値（Ｒ値、Ｇ値、Ｂ値）のうちの最大値である。

反転最小成分データは、以下のように、取得される。先ず、スキャンデータに含まれる複数個の画素の値（ＲＧＢ値）のそれぞれについて、複数個の成分値（Ｒ値、Ｇ値、Ｂ値）が反転された反転済みの色値が生成される。反転前のＲＧＢ値を（Ｒｉｎ、Ｇｉｎ、Ｂｉｎ）とすると、反転済みのＲＧＢ値（Ｒｏｕｔ、Ｇｏｕｔ、Ｂｏｕｔ）は、以下の式（１）〜（３）で表される。

Ｒｏｕｔ＝Ｒｍａｘ−Ｒｉｎ …（１）
Ｇｏｕｔ＝Ｇｍａｘ−Ｇｉｎ …（２）
Ｂｏｕｔ＝Ｂｍａｘ−Ｂｉｎ …（３）

ここで、Ｒｍａｘ、Ｇｍａｘ、Ｂｍａｘは、それぞれ、Ｒ値、Ｇ値、Ｂ値が取り得る値の最大値であり、本実施例では、Ｒｍａｘ＝Ｇｍａｘ＝Ｂｍａｘ＝２５５である。これらの反転済みのＲＧＢ値を複数個の画素の値とする画像データが、反転画像データとして生成される。そして、反転画像データを用いて、反転最小成分データが生成される。具体的には、反転画像データに含まれる複数個の反転済みのＲＧＢ値のそれぞれから、反転最小成分値ＶＲｍｉｎが取得される。反転最小成分値ＶＲｍｉｎは、該反転済みのＲＧＢ値に含まれる複数個の成分値（Ｒ値、Ｇ値、Ｂ値）のうちの最小値である。反転最小成分データは、これらの反転最小成分値ＶＲｍｉｎを、複数個の画素の値とする画像データである。

反転最小成分値ＶＲｍｉｎは、最大成分値の反転値であり、ＶＲｍｉｎ＝（２５５−Ｖｍａｘ）の関係が成り立つ。このために、最大成分データと反転最小成分データとは、両方とも、スキャンデータの各画素の値に含まれる複数個の成分値のうちの最大値に基づく値（最大値の反転値、あるいは、最大値そのもの）を、画素の値とする画像データである、と言うことができる。なお、実施例の最小成分データは、スキャンデータの各画素の値に含まれる複数個の成分値のうちの最小値に基づく値を、画素の値とする画像データである、と言うことができる。

図１０に示すように、Ｃ、Ｍ、Ｙ、Ｋ、Ｗの最大成分値Ｖｍａｘは、２５５、２５５、２５５、０、２５５となり、黒（Ｋ）を除いて同じ値となる。したがって、最大成分データや反転最小成分データにおいては、網点領域を構成する５種類の要素、すなわち、Ｃ、Ｍ、Ｙ、Ｋの各ドットと、用紙の地色（白）と、のうちの４種類の要素（Ｃ、Ｍ、Ｙのドットと、用紙の地色（白））を示す画素間の値の差が抑制される。この結果、最大成分データや反転最小成分データを用いる場合には、最小成分データを用いる場合と同様に、網点に起因するエッジ画素が特定されることを抑制できる。

（１１）上記各実施例では、文字画素に対して、文字鮮鋭化処理が実行され（図２のＳ４０）、非文字画素に対して、網点平滑化処理が実行される（図２のＳ３０）。これに代えて、文字画素に対しては、文字の見栄えを向上するためのアンチエイリアス処理が実行されても良い。また、非文字画素に対しては、例えば、印刷時の色材の使用量を減らすために、色を飛ばす処理（白に変換する処理）が実行されても良い。一般的には、文字画素と、非文字画素と、に互いに異なる画像処理が実行されることが好ましい。あるいは、文字画素と非文字画素のいずれか一方に対して、特定の画像処理が実行され、他方に対して、該特定の画像処理が実行されなくても良い。

（１２）上記実施例では、図５のＳ１３０や図９のＳ３２０のエッジ抽出処理において、ソーベルフィルタ（Sobel filter）が用いられている。これに代えて、これらエッジ抽出処理では、ロバーツフィルタや、ラプラシアンフィルタなどの他のエッジ抽出フィルタが用いられても良い。

（１３）上記実施例では、対象画像データは、スキャンデータであるが、これに限られない。対象画像データは、２次元イメージセンサを備えるデジタルカメラによって印刷物を読み取ることによって生成されても良い。

（１４）上記実施例では、第１の二値画像データと、第２の二値画像データと、の論理和を取ることによって、エッジ特定データが生成される（図２のＳ２６）。これに代えて、第１の二値画像データと、第２の二値画像データと、第３の二値画像データと、の論理和を取ることによって、エッジ特定データが生成されても良い。第３の二値画像データには、例えば、上述した最大成分データを用いて生成される二値画像データが用いられても良い。これによって、文字などのエッジの特定漏れをさらに抑制することができる。

（１５）上記実施例の第１の二値画像データ生成処理（図５）や第２の二値画像データ生成処理（図９）は、適宜に変更可能である。例えば、図５のＳ１１０、Ｓ１１０、Ｓ１４０の処理の全部または一部は、省略可能である。また、図９のＳ３１０、Ｓ３３０のうちの全部または一部は、省略可能である。

（１６）図２の画像処理を実現する画像処理装置は、複合機２００に限らず、種々の装置であってよい。例えば、スキャナやデジタルカメラが、自身で生成された画像データを用いて、プリンタに供給するための印刷データを生成するために、図２の画像処理を実行しても良い。また、例えば、スキャナやプリンタと通信可能な接続される端末装置（例えば、端末装置１００）やサーバ（図示省略）が、スキャナから取得したスキャンデータを用いて、図２の画像処理を実行して、印刷データを生成し、該印刷データをプリンタに供給しても良い。また、ネットワークを介して互いに通信可能な複数個のコンピュータ（例えば、クラウドサーバ）が、画像処理に要する機能を一部ずつ分担して、全体として、画像処理を実行してもよい。この場合、複数個のコンピュータの全体が、画像処理装置の例である。

（１７）上記各実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部あるいは全部をハードウェアに置き換えるようにしてもよい。例えば、図１２のＳ４１０の機械学習モデルを用いて文字確率Ｔｘｒを算出する処理は、ＡＳＩＣなどの専用のハードウェアによって、実行されても良い。

以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。

１００…端末装置、２００…複合機、２１０…ＣＰＵ、２２０…揮発性記憶装置、２３０…不揮発性記憶装置、２４０…表示部、２５０…操作部、２７０…通信ＩＦ、２８０…印刷実行部、２９０…読取実行部、ＰＧ…コンピュータプログラム、ＳＩ…スキャン画像、ＴＩ…文字特定画像、ＧＩ…平滑化画像、ＦＩ…処理済み画像、ＥＩ…エッジ特定画像、ＢＩ…ブロック判定画像、ＹＩ…輝度画像、ＳＩ…スキャン画像、ＤＴ…網点、ＳＢ…サブブロック

Claims

画像処理装置であって、
対象画像を示す対象画像データを取得する画像取得部と、
前記対象画像データを用いて、前記対象画像内の複数個の画素のそれぞれが、文字画素の候補であるか否かを画素ごとに判断することによって、複数個の候補画素を決定する候補決定部と、
前記対象画像データに対して膨張処理と前記膨張処理の後に実行される収縮処理とを含む前処理を実行して、前処理済画像データを生成する前処理部と、
前記前処理済画像データに対応する画像上に配置される複数個の対象領域のそれぞれが特定の判断条件を満たすか否かを判断することによって、前記対象画像内の非文字領域を特定する非文字領域特定部と、
前記対象画像内の複数個の画素のうち、前記候補画素であると決定され、かつ、前記非文字領域とは異なる領域にある画素を、前記文字画素として特定する文字特定部と、
を備える、画像処理装置。
請求項１に記載の画像処理装置であって、
前記前処理に含まれる前記収縮処理の収縮の程度は、前記前処理に含まれる前記膨張処理の膨張の程度よりも大きい、画像処理装置。
請求項２に記載の画像処理装置であって、
前記前処理に含まれる前記膨張処理は、Ｎ回（Ｎは１以上の整数）の単位膨張処理を含み、
前記前処理に含まれる前記収縮処理は、Ｍ回（ＭはＭ＞Ｎを満たす整数）の単位収縮処理を含む、画像処理装置。
請求項１〜３のいずれかに記載の画像処理装置であって、
前記前処理は、
前記対象画像内の複数個の画素を、オブジェクトを構成するオブジェクト画素と、前記オブジェクト画素とは異なる非オブジェクト画素とに分類することによって、分類画像データを生成する処理と、
前記分類画像データに対して前記膨張処理を含む処理を実行して、前記前処理済画像データを生成する処理と、
を含み、
前記前処理済画像データを用いて、画像内の連続する複数個の前記オブジェクト画素によって構成される領域を、前記対象領域として決定する、画像処理装置。
請求項４に記載の画像処理装置であって、
前記画像内の前記対象領域とは異なる領域は、前記非文字領域とは異なる領域として特定される、画像処理装置。
請求項４または５に記載の画像処理装置であって、
前記特定の判断条件は、前記対象領域に基づく判定領域に占める前記オブジェクト画素の割合が基準割合以上であることを含む、画像処理装置。
請求項４〜６のいずれかに記載の画像処理装置であって、
前記特定の判断条件は、前記対象領域内の前記オブジェクト画素の個数が基準数以上であることを含む、画像処理装置。
請求項１〜７のいずれかに記載の画像処理装置であって、
前記対象画像データに含まれる前記複数個の画素の値のそれぞれは、複数個の成分値を含む色値であり、
前記前処理部は、
前記対象画像データに含まれる前記複数個の画素の値に対応する複数個の第１値を含む第１の画像データと、前記対象画像データに含まれる前記複数個の画素の値に対応する複数個の第２値を含む第２の画像データと、のうちの少なくとも一方を生成し、
前記第１の画像データと前記第２の画像データとのうちの少なくとも一方を用いて中間画像データを生成し、
前記中間画像データに対して、前記膨張処理を含む処理を実行して、前記前処理済画像データを生成し、
前記第１の画像データに含まれる前記複数個の第１値のそれぞれは、対応する前記画素の値に含まれる前記複数個の成分値のうちの最小値に基づく値であり、
前記第２の画像データに含まれる前記複数個の第２値のそれぞれは、対応する前記画素の値に含まれる前記複数個の成分値のうちの最大値に基づく値である、画像処理装置。
請求項１〜８のいずれかに記載の画像処理装置であって、さらに、
前記対象画像データのうち、特定済みの前記文字画素の値に対して第１の画像処理を実行し、前記文字画素とは異なる画素の値に対して前記第１の画像処理とは異なる第２の画像処理を実行して、画像処理済みの前記対象画像データを生成する画像処理部を備える、画像処理装置。
コンピュータプログラムであって、
対象画像を示す対象画像データを取得する画像取得機能と、
前記対象画像データを用いて、前記対象画像内の複数個の画素のそれぞれが、文字画素の候補であるか否かを画素ごとに判断することによって、複数個の候補画素を決定する候補決定機能と、
前記対象画像データに対して膨張処理と前記膨張処理の後に実行される収縮処理とを含む前処理を実行して、前処理済画像データを生成する前処理機能と、
前記前処理済画像データに対応する画像上に配置される複数個の対象領域のそれぞれが特定の判断条件を満たすか否かを判断することによって、前記対象画像内の非文字領域を特定する非文字領域特定機能と、
前記対象画像内の複数個の画素のうち、前記候補画素であると決定され、かつ、前記非文字領域とは異なる領域にある画素を、前記文字画素として特定する文字特定機能と、
をコンピュータに実現させる、コンピュータプログラム。