JP6145983B2

JP6145983B2 - 画像処理装置およびコンピュータプログラム

Info

Publication number: JP6145983B2
Application number: JP2012218014A
Authority: JP
Inventors: 良平小澤
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 2012-09-28
Filing date: 2012-09-28
Publication date: 2017-06-14
Anticipated expiration: 2032-09-28
Also published as: JP2014072750A

Description

本発明は、文字を表す文字領域と、文字領域とは異なる非文字領域と、を含む画像を表す画像データに対する画像処理に関する。

文字を含む対象画像を表す対象画像データを高い圧縮率で圧縮する技術が知られている（例えば、特許文献１）。この技術は、カラー文字を表すカラー文字画像データと、モノクロ文字を表すモノクロ文字画像データと、文字を含まない非文字画像データとに分離する。この技術は、分離された各画像を、各画像の圧縮に適した圧縮方式で圧縮することによって、対象画像データ全体の圧縮率を向上させている。

例えば、モノクロ文字画像データは、ＭＭＲ(Modified Modified Read）形式で圧縮され、カラー文字画像データは、ＧＩＦ（Graphic Interchange Format）形式で圧縮され、非文字画像データは、ＪＰＥＧ（Joint Photographic Experts Group）形式で圧縮される。

特開２００５−１２４０６６号公報

しかしながら、上記技術では、非文字画像データの圧縮について十分に工夫されているとは言えず、対象画像データを効果的に圧縮できない可能性があった。例えば、非文字画像データの割合に対して文字画像データの割合が少ない対象画像データは、十分にデータサイズを縮小できないなど、効果的にデータサイズを縮小できない可能性があった。

本発明の主な利点は、文字を表す文字領域と、文字領域とは異なる非文字領域と、を含む画像を表す画像データを効果的に圧縮する新たな技術を提供することである。

本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。

［適用例１］対象画像を表す対象画像データであって、複数の色成分に対応する複数の成分データを含む対象画像データを取得する取得部と、
前記対象画像において、文字を表す文字領域と、文字とは異なるグレー画像を表すグレー領域と、文字とは異なるカラー画像を表すカラー領域と、を特定する特定部と、
前記対象画像データのデータサイズを低減するための低減処理部であって、
前記文字領域に対応する部分画像データを用いて、第１の処理を実行することによって、圧縮済みの文字画像データを生成する第１処理部と、
前記グレー領域に対応する部分画像データを用いて、前記第１の処理とは異なる第２の処理を実行することによって、１種類の成分値で構成された圧縮済みのグレー画像データを生成する第２処理部であって、前記第２の処理は、１種類の成分値で構成されたグレー成分データを取得する処理と、前記グレー成分データを圧縮する処理と、を行うことで前記圧縮済みのグレー画像データを生成することを含む、前記第２処理部と、
前記カラー領域に対応する部分画像データを用いて、前記第１の処理および前記第２の処理とは異なる第３の処理を実行することによって、複数種類の成分値で構成された圧縮済みのカラー画像データを生成する第３処理部であって、前記第３の処理は、複数の成分データを含むカラー成分データを取得する処理と、前記カラー成分データを圧縮する処理と、を行うことで前記圧縮済みのカラー画像データを生成することを含む、前記第３処理部と、
を有する、前記低減処理部と、
前記圧縮済みの文字画像データと、前記圧縮済みのグレー画像データと、前記圧縮済みのカラー画像データと、を用いて、前記対象画像を表す圧縮済みの対象画像データを生成する生成部と、
を備える、画像処理装置。

上記構成によれば、圧縮済みの文字画像データと、圧縮済みのグレー画像データと、圧縮済みのカラー画像データと、をそれぞれ異なる処理を用いて生成する。そして、圧縮済みのグレー画像データは、１種類の成分値で構成されたグレー成分画像データを取得する処理と、グレー成分画像データを圧縮する処理と、を含む第２の処理によって生成される。また、圧縮済みのカラー画像データは、複数の成分データを含むカラー画像データを取得する処理と、カラー画像データを圧縮する処理を含む第３の処理によって生成される。この結果、文字、文字とは異なるグレー画像、文字とは異なるカラー画像とにそれぞれ適した処理を実行するので、対象画像データを効果的に圧縮して、圧縮済みの対象画像データを生成することができる。

本発明は、種々の形態で実現することが可能であり、例えば、上記装置の機能を実現する方法、上記装置の機能を実現するコンピュータプログラム、当該コンピュータプログラムを記録した記録媒体、等の形態で実現することができる。

本発明の一実施例としての計算機２００の構成を示すブロック図である。画像処理のフローチャートである。画像領域特定処理の全体の流れを示す概略図である。本実施例におけるエッジ強度の算出式を示している。統合処理のフローチャートである。２個の領域の統合を示す概略図である。第３条件Ｆ３の階調差ＴＤの算出式を示している。４個の領域Ｌ３４〜Ｌ３７の統合を示す概略図である。判断テーブル２９２の一例を示す図である。分布幅Ｗと色数Ｃとの説明図である。グレー判断処理のフローチャートである。ヒストグラムの作成のフローチャートである。非文字オブジェクト領域の外縁部の一例を示す図である。グレー領域とカラー領域の判断について説明する図である。第１実施例の低減処理のフローチャートである。第１実施例の低減処理で生成される画像データについて説明する図である。第２実施例の低減処理のフローチャートである。第２実施例の低減処理で生成される画像データについて説明する図である。

Ａ．第１実施例：
Ａ−１：計算機２００の構成
次に、本発明の実施の形態を実施例に基づき説明する。図１は、本発明の一実施例としての計算機２００の構成を示すブロック図である。計算機２００は、例えば、パーソナルコンピュータであり、ＣＰＵ２１０と、ＤＲＡＭ等を含む揮発性記憶装置２４０と、フラッシュメモリやハードディスクドライブ等を含む不揮発性記憶装置２９０と、タッチパネルやキーボード等の操作部２７０と、外部装置と通信を行うためのインタフェースである通信部２８０と、を備えている。

計算機２００は、通信部２８０を介して、外部装置（ここでは、スキャナ３００と複合機４００）に、通信可能に接続されている。スキャナ３００は、光学的に対象物（例えば、紙の文書）を読み取ることによってスキャンデータを取得する画像読取装置である。複合機４００は、光学的に対象物を読み取ることによってスキャンデータを取得する画像読取部（図示省略）を備えている。

揮発性記憶装置２４０には、ＣＰＵ２１０が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域２４１が設けられている。不揮発性記憶装置２９０は、ドライバプログラム２９１と、後述する画像処理にて用いられる判断テーブル２９２と、を格納している。ドライバプログラム２９１は、例えば、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどに格納された形態で提供される。あるいは、ドライバプログラム２９１は、ネットワークを介して計算機２００に接続されたサーバからダウンロードされる形態で提供される。

ＣＰＵ２１０は、ドライバプログラム２９１を実行することにより、スキャナドライバ１００として機能する。スキャナドライバ１００は、対象画像データ（例えば、スキャンデータ）に対して後述する画像処理を実行して、圧縮ＰＤＦファイルを生成する画像処理機能を備えている。スキャナドライバ１００は、当該画像処理機能を実現するための機能部として、取得部１１０と、特定部１２０と、低減処理部１３０と、生成部１５０と、を備えている。取得部１１０は、対象画像データを取得する。特定部１２０は、対象画像データを解析して領域特定を実行する。特定部１２０は、グレー領域判断処理を行う判断部１２５を備えている。低減処理部１３０は、対象画像データのデータサイズを低減するための低減処理を実行する。低減処理部１３０は、対象画像のうち、文字を表す文字領域に関する処理を行う第１処理部１３１と、対象画像に含まれる文字とは異なるグレー画像を表すグレー領域に関する処理を行う第２処理部１３２と、対象画像に含まれる文字とは異なるカラー画像を表すカラー領域に関する処理を行う第３処理部１３３と、を備えている。生成部１５０は、低減処理部１３０によって処理された画像データを用いて圧縮ＰＤＦファイルを生成する。これらの各機能部１１０〜１５０が実行する処理については後述する。

Ａ−２：画像処理
図２は、画像処理のフローチャートである。ステップＳ１００では、取得部１１０（図１）は、通信部２８０を介して、スキャンデータを、対象画像データとして取得し、取得したスキャンデータを、バッファ領域２４１（図１）に格納する。具体的には、取得部１１０は、スキャナ３００または複合機４００の画像読取部を制御して、スキャンデータを取得する。スキャンデータは、例えば、紙の文書（原稿とも呼ぶ）の読み取り結果を表している。また、スキャンデータは、複数の画素毎の色をＲＧＢ値で表すビットマップデータである。

図３は、画像領域特定処理（図２のステップＳ１５０〜Ｓ４５０の処理）の全体の流れを示す概略図である。図３（Ａ）の対象画像ＳＩは、対象画像データ（例えば、スキャンデータ）によって表される画像の一例である。対象画像ＳＩでは、図示しない複数の画素が、第一方向Ｄ１と、第一方向Ｄ１と直交する第二方向Ｄ２と、に沿って、マトリクス状に配置されている。１個の画素の画素データ（すなわち、ＲＧＢ値）は、例えば、赤（Ｒ）と緑（Ｇ）と青（Ｂ）との３個の色成分の階調値（以下、成分値とも呼ぶ）を含んでいる。本実施例では、各成分値の階調数は、２５６階調である。すなわち、対象画像データは、ＲＧＢの３個の成分にそれぞれ対応する３個の成分データを含んでいるということができる。成分データは、３個の成分値のうちの１個の成分値で構成される画像データである。

図３（Ａ）の例では、対象画像ＳＩは、背景Ｂｇと、３個の非文字オブジェクトＯｂ１〜Ｏｂ３と、４個の文字オブジェクトＯｂ４〜Ｏｂ７と、を含んでいる。非文字オブジェクトは、例えば、写真オブジェクトや描画オブジェクトである。写真オブジェクトは、デジタルカメラによる撮影等によって得られる写真を表すオブジェクトである。描画オブジェクトは、イラスト、表、グラフ、線図、ベクトルグラフィックス、模様等の、描画を表すオブジェクトである。本実施例の３個の非文字オブジェクトのうち、２個の非文字オブジェクトＯｂ１、Ｏｂ２は、グレー（無彩色）オブジェクトであり、１個の非文字オブジェクトＯｂ３は、カラー（有彩色）オブジェクトである。また、本実施例の４個の文字オブジェクトＯｂ４〜Ｏｂ７のうち、３個の文字オブジェクトＯｂ４〜Ｏｂ６（Ｅ、Ｆ、Ｇの文字）は、互いに同じ色の文字であり、１個の文字オブジェクトＯｂ７（Ｈの文字）は、他の３個の文字オブジェクトＯｂ４〜Ｏｂ６とは、異なる色の文字であるとする。

ここで、グレーオブジェクトは、観察者が通常の観察距離で観察した場合に、グレーに見えるオブジェクトである。例えば、原稿が、ＣＭＹの３種類の印刷材を用いて印刷された原稿である場合を例に説明する。当該原稿を読み取って得られるスキャン画像において、通常の観察距離で観察した場合に無彩色に見えるオブジェクトを表す個々の画素は、有彩色を有しているが、当該無彩色に見えるオブジェクトは、本実施例におけるグレーオブジェクトに、含まれる。カラーオブジェクトは、観察者が通常の観察距離で観察した場合に、有彩色に見えるオブジェクトである。

ここで、対象画像ＳＩのうち、文字オブジェクトを表す部分画像を文字画像とも呼び、写真オブジェクトを表す部分画像を写真画像とも呼び、描画オブジェクトを表す部分画像を描画画像とも呼ぶ。写真画像と描画画像とを総称して、非文字画像ともよぶ。また、グレーオブジェクトを表す部分画像をグレー画像とも呼び、カラーオブジェクトを表す部分画像をカラー画像とも呼ぶ。

図２のステップＳ１５０では、特定部１２０（図１）は、対象画像ＳＩ（スキャンデータ）を用いて、エッジ画像データを生成して、バッファ領域２４１に格納する。図３（Ｂ）は、エッジ画像データによって表されるエッジ画像ＥＩの概略図である。

エッジ画像ＥＩは、対象画像ＳＩ内の各画素位置におけるエッジ強度を表している。エッジ強度は、画像内の位置の変化に対する階調値の変化の大きさ（例えば、微分）、すなわち、互いに隣り合う複数個の画素間の階調値の差分の大きさを表している。図４は、本実施例におけるエッジ強度の算出式を示している。本実施例では、特定部１２０は、いわゆるソーベルオペレータ（Sobel operator）を用いて、ＲＧＢの３個の色成分毎に、エッジ強度Ｓｅを算出する。

図４の階調値Ｐ（ｘ，ｙ）は、対象画像ＳＩ内の特定の画素位置（ｘ，ｙ）の階調値を表している。位置ｘは、第一方向Ｄ１の画素位置を示し、位置ｙは、第二方向Ｄ２の画素位置を示している。図示するように、対象画像ＳＩ内の画素位置（ｘ，ｙ）におけるエッジ強度Ｓｅ（ｘ，ｙ）は、その画素位置（ｘ，ｙ）を中心とし隣り合う３行３列の９つの画素を用いて算出される。図４の算出式の第１項および第２項は、９つの位置の画素の階調値に、対応する係数をそれぞれ乗じた値の和の絶対値である。第１項は、第一方向Ｄ１の階調値の微分（すなわち、横方向の微分）であり、第２項は、第二方向Ｄ２の階調値の微分（すなわち、縦方向の微分）である。

図３（Ｂ）のエッジ画像ＥＩは、各画素位置における、Ｒ成分のエッジ強度とＧ成分のエッジ強度とＢ成分のエッジ強度とを平均して得られるエッジ強度（以下、参考エッジ強度と呼ぶ）を表している。図３（Ｂ）の一点破線Ｅｇ１〜Ｅｇ７は、参考エッジ強度が比較的大きい画素（エッジ画素とも呼ぶ）の位置を表している。図３（Ｂ）のエッジ画像ＥＩは、対象画像ＳＩのオブジェクトＯｂ１〜Ｏｂ７にそれぞれ対応するエッジ画素Ｅｇ１〜Ｅｇ７を含んでいることが解る。

エッジ画像データを生成した後、続くステップＳ２００では、特定部１２０は、複数個の画素を含むブロックＢＬをエッジ画像ＥＩ上に設定する。図３（Ｂ）の破線は、エッジ画像ＥＩ上にマトリクス状に配置されたブロックＢＬを示している。１個のブロックＢＬは、例えば、ＢＬｎ行×ＢＬｎ列（ＢＬｎは、２以上の整数）の画素ＰＸで構成されたブロックである。ＢＬｎの値には、例えば、１０〜５０の範囲内の値を採用可能である。エッジ画像ＥＩと対象画像ＳＩとは、互いに同じサイズ（縦横の画素数が等しい）であるので、ブロックＢＬは、対象画像ＳＩ上に設定されていると言うこともできる。

ブロックＢＬが設定されると、続くステップＳ２５０では、特定部１２０は、ブロックＢＬ単位で、ベタ領域と非ベタ領域とを特定する。ベタ領域は、領域が有するエッジ強度が所定の基準未満の領域であり、非ベタ領域とは、領域が有するエッジ強度が所定の基準以上の領域である。具体的には、特定部１２０は、ブロックＢＬ毎に、平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）を算出する。平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）は、ＲＧＢの３個の色成分毎に、算出される。特定部１２０は、処理対象のブロックＢＬの平均エッジ強度と所定の基準とを比較して、処理対象のブロックＢＬを、ベタブロックおよび非ベタブロックのいずれかに分類する。ベタブロックは、平均エッジ強度が所定の基準より小さいブロックＢＬである。非ベタブロックは、平均エッジ強度が所定の基準以上であるブロックＢＬである。本実施例では、特定部１２０は、平均エッジ強度（ＥＲａｖｅ、ＥＧａｖｅ、ＥＢａｖｅ）を、色成分ごとに定められた基準値（ＥＴｒ、ＥＴｇ、ＥＴｂ）と比較する。この結果、特定部１２０は、ＥＲａｖｅ＜ＥＴｒ、かつ、ＥＧａｖｅ＜ＥＴｇ、かつ、ＥＢａｖｅ＜ＥＴｂが成立する場合には、処理対象のブロックＢＬをベタブロックに分類する。ＥＲａｖｅ≧ＥＴｒ、および、ＥＧａｖｅ≧ＥＴｇ、および、ＥＢａｖｅ≧ＥＴｂのうちの少なくとも一つが成立する場合には、特定部１２０は、処理対象のブロックＢＬを非ベタブロックに分類する。

図３（Ｂ）のエッジ画像ＥＩにおいて、非ベタブロックには、ハッチングが付され、ベタブロックには、ハッチングが付されていない。全てのブロックＢＬを、ベタブロックと非ベタブロックとに分類された後、特定部１２０は、互いに隣り合う（連続する）１個以上の非ベタブロックに対応する領域を、１個の非ベタ領域として特定する。また、特定部１２０は、互いに隣り合う１個以上のベタブロックに対応する領域を、１個のベタ領域として特定する。このように、連続する１個以上の非ベタブロックは、１個の非ベタ領域に組み込まれるので、非ベタ領域は、通常は、ベタ領域に囲まれている。図３（Ｂ）の例では、対象画像ＳＩ（図３（Ａ））の３個の非文字オブジェクトＯｂ１〜Ｏｂ３にそれぞれ対応する３個の非ベタ領域Ｌ１１〜Ｌ１３が特定されている。また、対象画像ＳＩの２個の文字オブジェクトＯｂ４、Ｏｂ５に対応する１個の非ベタ領域Ｌ１４と、２個の文字オブジェクトＯｂ６、Ｏｂ７に対応する１個の非ベタ領域Ｌ１５と、が特定されている。さらに、対象画像ＳＩの背景Ｂｇに対応する１個のベタ領域Ｌ１０が特定されている。エッジ画像ＥＩにおいて、ベタ領域と非ベタ領域が特定されることは、対象画像ＳＩにおいて、同様にベタ領域と非ベタ領域が特定されること、と同義である。

続く、ステップＳ３００では、特定部１２０は、対象画像ＳＩ内の各非ベタ領域を二値化するための基準値（以下、二値化基準値とも呼ぶ）を、対象画像ＳＩ内の非ベタ領域の周囲を囲むベタ領域内の画素値（言い換えると、色値）を用いて、非ベタ領域Ｌ１１〜Ｌ１５毎に決定する。本実施例では、二値化基準値は、ＲＧＢの成分毎に決定される。具体的には、非ベタ領域の周囲を囲むベタ領域の全ての画素についての、ＲＧＢの各成分値の平均値（Ｒｒ、Ｇｒ、Ｂｒ）が、二値化基準値として採用される。図３（Ｂ）の例では、全ての非ベタ領域Ｌ１１〜Ｌ１５は、背景Ｂｇに対応する１個のベタ領域Ｌ１０に囲まれているので、全ての非ベタ領域Ｌ１１〜Ｌ１５の二値化基準値は、同じ値、すなわち、ベタ領域Ｌ１０内の各成分値の平均値となる。

二値化基準値（Ｒｒ、Ｇｒ、Ｂｒ）が決定されると、次のステップＳ３５０では、特定部１２０は、非ベタ領域Ｌ１１〜Ｌ１５毎に、二値画像データを生成して、バッファ領域２４１に格納する。本実施例では、特定部１２０は、二値化基準値（Ｒｒ、Ｇｒ、Ｂｒ）を用いて算出される６個の閾値Ｒ１、Ｒ２、Ｇ１、Ｇ２、Ｂ１、Ｂ２を用いて二値化処理を実行する。
Ｒ成分の下限閾値Ｒ１＝Ｒｒ−ｄＶ、Ｒ成分の上限閾値Ｒ２＝Ｒｒ＋ｄＶ
Ｇ成分の下限閾値Ｇ１＝Ｇｒ−ｄＶ、Ｇ成分の上限閾値Ｇ２＝Ｇｒ＋ｄＶ
Ｂ成分の下限閾値Ｂ１＝Ｂｒ−ｄＶ、Ｂ成分の上限閾値Ｂ２＝Ｂｒ＋ｄＶ
ここで、値ｄＶは、予め決められた値である。これらの値Ｒ１、Ｒ２、Ｇ１、Ｇ２、Ｂ１、Ｂ２は、二値化基準値（Ｒｒ、Ｇｒ、Ｂｒ）、すなわち、二値化対象のベタ領域を囲むベタ領域の平均色に比較的近い色の範囲、すなわち、背景の色に比較的近い色の範囲を、定めている。

特定部１２０は、これらの６個の閾値Ｒ１、Ｒ２、Ｇ１、Ｇ２、Ｂ１、Ｂ２を用いて、対象画像ＳＩにおける非ベタ領域内の各画素を、１画素毎に、オブジェクト画素と、非オブジェクト画素とに分類することによって、非ベタ領域の二値画像データを生成する。例えば、生成された二値画像データにおいて、画素値「１」は、オブジェクト画素を示し、画素値「０」は、非オブジェクト画素を示す。

具体的には、非ベタ領域内の画素Ｐｘｉの３個の色成分（ＲＧＢ）の階調値（Ｒｉ、Ｇｉ、Ｂｉ）が、以下の３つの条件を全て満たす場合に、特定部１２０は、画素Ｐｘｉを、非オブジェクト画素に分類し、以下の３つの条件のいずれかを満たさない場合に、画素Ｐｘｉをオブジェクト画素に分類する。
（第１条件）Ｒ１＜Ｒｉ＜Ｒ２
（第２条件）Ｇ１＜Ｇｉ＜Ｇ２
（第３条件）Ｂ１＜Ｂｉ＜Ｂ２

このように、ベタ領域内の画素の色を用いて算出された背景の色に比較的近い画素を、非オブジェクト画素に分類し、その他の画素をオブジェクト画素に分類することによって、オブジェクトを構成するオブジェクト画素を精度良く特定した二値画像データを生成することができる。

図３（Ｃ）には、生成された二値画像データによって表される二値画像ＢＩが示されている。実際には、上述した非ベタ領域Ｌ１１〜Ｌ１５毎に、別々の二値画像データが生成されるが、図３（Ｃ）では、１個の二値画像ＢＩで示している。

二値画像データを生成された後、続くステップＳ４００では、特定部１２０は、は、二値画像データを利用して、オブジェクト領域と非オブジェクト領域とを特定して、特定された領域に識別子を付すラベリングを実行する。ラベリングの結果、例えば、各領域と、識別子とを、対応付けたラベルデータが生成されて、バッファ領域２４１に格納される。

具体的には、特定部１２０は、連続する１個以上のオブジェクト画素（すなわち、二値化後の階調値が「１」である画素）で構成される１個の領域を、１個のオブジェクト領域として特定する。また、特定部１２０は、連続する１個以上の非オブジェクト画素（すなわち、二値化後の階調値が「ゼロ」である画素）で構成される１個の領域を、１個の非オブジェクト領域として特定する。

図３（Ｃ）の例では、対象画像ＳＩの６個のオブジェクトＯｂ１〜Ｏｂ７（図３（Ａ））にそれぞれ対応する７つのオブジェクト領域Ｌ２１〜Ｌ２７と、対象画像ＳＩの背景Ｂｇに対応する１個の非オブジェクト領域Ｌ２０と、が特定される。特定部１２０は、特定した領域に、領域を識別する識別子を割り当てる。二値画像ＢＩを構成する各画素は、対象画像ＳＩを構成する各画素と対応しているので、二値画像ＢＩにおいて、領域Ｌ２０〜Ｌ２７が特定されることは、図３（Ｄ）に示すように、対象画像ＳＩにおいて、同様に、領域Ｌ３０〜Ｌ３７が特定されること、と同義である。以下では、基本的に各領域（すなわち、オブジェクト領域および非オブジェクト領域）を表す符号には、図３（Ｄ）に示す符号Ｌ３０〜Ｌ３７を用いる。また、単にオブジェクト領域に対応する画像と呼ぶときには、対象画像ＳＩの対応する部分画像のことを指し、オブジェクト領域内の画素の画素値とは、対象画像ＳＩの対応する画素の画素値、すなわち、対象画像データに対応する画素値（例えば、ＲＧＢ値）のことを指すものとする。

ラベリングに続いて、ステップＳ４５０では、特定部１２０は、ラベリングされた複数個のオブジェクト領域のうち、統合条件を満たす複数個のオブジェクト領域を統合する統合処理を実行する。この統合処理は、互いに異なるオブジェクト領域として分離されている複数個の文字の領域を１個のオブジェクト領域として特定する統合するための処理である。

図５は、統合処理のフローチャートである。ステップＳ４５００では、特定部１２０は、特定部１２０によって特定された複数個の領域（例えば、図３（Ｄ）の領域Ｌ３０〜Ｌ３７）の中から、背景領域を選択する。背景領域は、対象画像ＳＩ（図３（Ａ））の縁部分に対応するベタ領域である。図３（Ｄ）の例では、非オブジェクト領域Ｌ３０が、背景領域として選択される。この背景領域Ｌ３０は、統合の対象から外される。

背景領域が選択された後、ステップＳ４５０５では、特定部１２０（図１）は、１個の未処理の領域を、処理対象領域Ｎとして選択する。次いで、ステップＳ４５１０では、特定部１２０は、処理対象領域Ｎの画素数が、所定の画素数基準以下であるか否かを判断する。画素数基準は、予め決められている。例えば、画素数基準としては、処理対象領域Ｎが他の領域と統合すべき文字を表す場合に、処理対象領域Ｎの画素数が取り得る最大値を若干上回る値を、採用可能である。画素数基準は、処理対象領域Ｎが１個の文字を表す場合の画素数が取り得る最大値を若干上回る値に、予め設定されている。処理対象領域Ｎの画素数が画素数基準を超える場合には（ステップＳ４５１０：ＮＯ）、特定部１２０は、ステップＳ４５０５に戻る、この結果、選択された処理対象領域Ｎは、統合の対象から外れる。この場合には、現行の処理対象領域Ｎは、典型的な文字よりも大きいので、文字以外のオブジェクトを表している可能性が高い。この画素数基準を適切に設定されることによって、図３（Ｃ）の例では、非文字オブジェクトを表す３個のオブジェクト領域Ｌ３１〜Ｌ３３は、統合の対象から外れ、文字オブジェクトを表す４個のオブジェクト領域Ｌ３４〜Ｌ３７は、統合の対象とされる。なお、本実施例では、処理対象領域Ｎの画素数は、対象画像ＳＩにおける、処理対象領域Ｎに外接する最小矩形に含まれる画素数である。

図６は、２個の領域の統合を示す概略図である。図中には、文字「Ｅ」を表す処理対象領域Ｌｎが示されている。図中の矩形ＬｎＲは、処理対象領域Ｌｎに外接する最小矩形である。この矩形ＬｎＲ内に含まれる画素数が、処理対象領域Ｌｎの画素数である。ここで、「領域に外接する最小矩形」は、以下のような矩形である。すなわち、矩形は、第一方向Ｄ１と平行な２本の辺と、第二方向Ｄ２と平行な２本の辺と、で構成されている。そして、矩形の上辺が、領域の上端と接し、矩形の下辺が、領域の下端と接し、矩形の左辺が、領域の左端と接し、矩形の右辺が、領域の右端と接している。ここで、上辺および上端は、第二方向Ｄ２の反対方向側の辺および端であり、下辺および下端は、第二方向Ｄ２側の辺および端であり、左辺および左端は、第一方向Ｄ１の反対方向側の辺および端であり、右辺および右端は、第一方向Ｄ１側の辺および端である。なお、特定部１２０は、処理対象領域Ｎの画素のみをカウントすることによって、処理対象領域Ｎの画素数を算出してもよい。すなわち、特定部１２０は、外接矩形内の複数個の画素のうちの処理対象領域Ｎに含まれない画素をカウントせずに、画素数を算出してもよい。

図５のＳ４５１０で、処理対象領域Ｎの画素数が、所定の画素数基準以下である場合（ステップＳ４５１０：ＹＥＳ）、ステップＳ４５１５では、特定部１２０は、統合の候補領域Ｍのリストを初期化する。特定部１２０は、ステップＳ４５０５で処理対象領域Ｎとして選択されたことがない領域のリストを、生成する。例えば、図３（Ｄ）の例では、初めて実行されるステップＳ４５０５で領域Ｌ３１が処理対象領域Ｎとして選択された場合には、残りの６個の領域Ｌ３２〜Ｌ３７が、リストに挙げられる。次回のステップＳ４５０５で領域Ｌ３２が処理対象領域Ｎとして選択された場合には、残りの５個の領域Ｌ３３〜Ｌ３７が、リストに挙げられる。なお、他の領域に統合済の領域は、リストから除かれる。

次いで、ステップＳ４５２０では、特定部１２０は、生成したリストの中から、１個の未選択の領域を、候補領域Ｍとして選択する。特定部１２０は、続く３つのステップＳ４５２５、Ｓ４５３０、Ｓ４５３５で、候補領域Ｍを処理対象領域Ｎに統合するか否かを判断する。各ステップＳ４５２５、Ｓ４５３０、Ｓ４５３５では、以下の条件が判断される。

（ステップＳ４５２５：第１条件Ｆ１）候補領域Ｍの画素数≦画素数基準
（ステップＳ４５３０：第２条件Ｆ２）第１距離Ｄｉｓ１≦距離基準、かつ、第２距離Ｄｉｓ２≦距離基準
（ステップＳ４５３５：第３条件Ｆ３）階調差ＴＤ≦階調差基準

候補領域Ｍが、これら全ての条件Ｆ１、Ｆ２、Ｆ３を満たす場合（ステップＳ４５２５：ＹＥＳ、かつ、Ｓ４５３０：ＹＥＳ、かつ、Ｓ４５３５：ＹＥＳ）に、図５のステップＳ４５４０で、特定部１２０は、候補領域Ｍを処理対象領域Ｎに統合する。

ステップＳ４５２５の第１条件Ｆ１は、ステップＳ４５１０の条件と同様の条件である。候補領域Ｍが第１条件Ｆ１を満たさない場合には（ステップＳ４５２５：ＮＯ）、候補領域Ｍは、文字とは異なる種類のオブジェクトを表している可能性が高い。この場合には、特定部１２０は、ステップＳ４５４０をスキップすることによって、候補領域Ｍを処理対象領域Ｎに統合しない。

ステップＳ４５３０の第２条件Ｆ２は、候補領域Ｍが処理対象領域Ｎに比較的近い場合に満たされる条件である。図６は、第２条件Ｆ２の第１距離Ｄｉｓ１と第２距離Ｄｉｓ２との概略を示している。図中には、処理対象領域Ｌｎと候補領域Ｌｍとが示されている。対象矩形ＬｎＲは、処理対象領域Ｌｎに外接する最小矩形であり、候補矩形ＬｍＲは、候補領域Ｌｍに外接する最小矩形である。

第１距離Ｄｉｓ１は、図６（Ａ）に示すように、対象矩形ＬｎＲと候補矩形ＬｍＲとの間の、第一方向Ｄ１に沿った最短距離であり、例えば、画素数で表される。図６（Ｂ）に示すように、対象矩形ＬｎＲの第一方向Ｄ１の位置の範囲（左端ＰｎＬ〜右端ＰｎＲ）が、候補矩形ＬｍＲの第一方向Ｄ１の位置の範囲（左端ＰｍＬ〜右端ＰｍＲ）の少なくとも一部と重なる場合には、第１距離Ｄｉｓ１は、ゼロである。

第２距離Ｄｉｓ２は、図６（Ｂ）に示すように、対象矩形ＬｎＲと候補矩形ＬｍＲとの間の、第二方向Ｄ２に沿った最短距離であり、例えば、画素数で表される。図６（Ａ）に示すように、対象矩形ＬｎＲの第二方向Ｄ２の位置の範囲（すなわち、上端ＰｎＴ〜下端ＰｎＢの範囲）が、候補矩形ＬｍＲの第二方向Ｄ２の位置の範囲（すなわち、上端ＰｍＴ〜下端ＰｍＢの範囲）の少なくとも一部と重なる場合には、第２距離Ｄｉｓ２は、ゼロである。

第２条件Ｆ２の距離基準は、予め決められている。例えば、距離基準としては、統合すべき２個の文字の間の距離がとり得る最大値を若干上回る値を、採用可能である。候補領域Ｍが第２条件Ｆ２を満たす場合には、候補領域Ｍと処理対象領域Ｎとが、同じ文字列に含まれる文字を表している可能性が高い。候補領域Ｍが第２条件Ｆ２を満たさない場合には（ステップＳ４５３０：ＮＯ）、候補領域Ｍは、処理対象領域Ｎとは関連しないオブジェクトを表している可能性が高い。この場合には、特定部１２０は、ステップＳ４５４０をスキップすることによって、候補領域Ｍを処理対象領域Ｎに統合しない。

ステップＳ４５３５の第３条件Ｆ３は、第３条件Ｆ３は、候補領域Ｍの色が処理対象領域Ｎと比較的近い場合に満たされる。図７は、第３条件Ｆ３の階調差ＴＤの算出式を示している。本実施例では、階調差ＴＤは、ＲＧＢ色空間における、処理対象領域Ｎの平均色（すなわち、Rav_n、Gav_n、Bav_n）と、候補領域Ｍの平均色（すなわち、Rav_m、Gav_m、Bav_m）との間のユークリッド距離の二乗である。第３条件Ｆ３の階調差基準は、予め決められている。例えば、階調差基準としては、実質的に同じ色であると、通常の観察者に認識される２つの色の色差の上限値が採用可能である。例えば、２つの色が、２個の文字の色としてそれぞれ用いられた場合に、当該２個の文字を見た通常の観察者が、当該２個の文字の色は互いに同じであると認識する場合に、当該２つの色は、実質的に同じ色であると、判断できる。ここで、第３条件Ｆ３を条件としているのは、後述するように、文字画像を圧縮する際に、実質的に異なる色で表現された複数個の文字は、別々に処理する必要があるからである。候補領域Ｍが第３条件Ｆ３を満たさない場合には（ステップＳ４５３０：ＮＯ）、特定部１２０は、ステップＳ４５４０をスキップすることによって、候補領域Ｍを処理対象領域Ｎに統合しない。

図５のステップＳ４５４０で、候補領域Ｍを処理対象領域Ｎに統合した後、または、ステップＳ４５２５、ステップＳ４５３０、ステップＳ４５３５のいずれかのステップでＮＯと判断した後、ステップＳ４５４５では、特定部１２０は、リストの全ての候補領域Ｍの処理が終了したか否かを判断する。未処理の候補領域Ｍが残っている場合には（ステップＳ４５４５：ＮＯ）、特定部１２０は、ステップＳ４５２０に戻り、未処理の候補領域Ｍに対して、ステップＳ４５２０〜Ｓ４５４０の処理を実行する。リストの全ての候補領域Ｍの処理が終了した場合には（ステップＳ４５４５：ＹＥＳ）、特定部１２０は、ステップＳ４５５０に処理を移行する。

ステップＳ４５５０では、特定部１２０は、最後にステップＳ４５１５が実行された後に、処理対象領域Ｎが拡張されたか否か、すなわち、処理対象領域Ｎに統合された候補領域Ｍの総数が１以上であるか否か、を判断する。処理対象領域Ｎが拡張された場合には（ステップＳ４５５０：ＹＥＳ）、特定部１２０は、拡張済の処理対象領域Ｎを利用して、再び、ステップＳ４５１５〜Ｓ４５４５の処理を実行する。従って、特定部１２０は、３個以上の領域を統合し得る。

図８は、４個の領域Ｌ３４〜Ｌ３７の統合を示す概略図である。ここでは、統合処理が、図８（Ａ）〜図８（Ｃ）の順に、進行する。

図８（Ａ）では、「Ｅ」の文字を表す領域Ｌ３４が、処理対象領域Ｎである（図５：Ｓ４５０５）。領域Ｌ３４の隣に配置された「Ｆ」の文字を表す領域Ｌ３５は、上記条件Ｆ１〜Ｆ３を満たすので、特定部１２０（図１）は、領域Ｌ３５を領域Ｌ３４に統合する（ステップＳ４５４０）。また、「Ｇ」の文字を表す領域Ｌ３６と「Ｈ」の文字を表す領域Ｌ３７とは、領域Ｌ３４からの距離が遠いので、第２条件Ｆ２を満たさない。したがって、２つの領域Ｌ３６、Ｌ３７は、領域Ｌ３４に統合されない。

上述したように、領域Ｌ３５が領域Ｌ３４に統合された場合、図５のステップＳ４５５０では、特定部１２０は、処理対象領域Ｎ（例えば、領域Ｌ３４）が拡張された、と判断する（Ｓ４５５０：ＹＥＳ）。続くステップＳ４５１５では、特定部１２０は、領域Ｌ３５を含む拡張済の領域Ｌ３４Ｂ（図８（Ｂ））のためのリストを生成する。生成されるリストは、領域Ｌ３６と領域Ｌ３７とを含んでいる。

図８（Ｂ）では、拡張済の領域Ｌ３４Ｂが、処理対象領域Ｎである。領域Ｌ３４Ｂの隣に配置された領域Ｌ３６は、上記条件Ｆ１〜Ｆ３を満たすので、特定部１２０は、領域Ｌ３６を、領域Ｌ３４Ｂに統合する（ステップＳ４５４０）。条件Ｆ１〜Ｆ３の判断には、拡張済の領域Ｌ３４Ｂ（すなわち、「Ｅ」の文字と「Ｆ」の文字とを表す領域）に外接する最小矩形が利用される。領域Ｌ３７は、領域Ｌ３４Ｂからの距離が遠いので、領域Ｌ３４Ｂに統合されない。

上述したように、領域Ｌ３６が拡張済みの領域Ｌ３４Ｂに統合された場合、図５のステップＳ４５５０では、特定部１２０（図１）は、処理対象領域Ｎ（この場合には、領域Ｌ３４Ｂ）が拡張された、と判断する（Ｓ４５５０：ＹＥＳ）。続くステップＳ４５１５では、特定部１２０は、領域Ｌ３６を含む拡張済の領域Ｌ３４Ｃ（図８（Ｃ））のためのリストを生成する。生成されるリストは、領域Ｌ３７を含んでいる。

図８（Ｃ）では、拡張済の領域Ｌ３４Ｃが、処理対象領域である。領域Ｌ３４Ｃの隣に配置された領域Ｌ３７は、領域Ｌ３４Ｃとの距離が比較的近いので、上記条件Ｆ１を満たすが、領域Ｌ３４Ｃと実質的に色が異なるので、条件Ｆ３を満たさない。したがって、特定部１２０は、領域Ｌ３７を、領域Ｌ３４Ｃには、統合しない。したがって、統合処理後には、図３（Ｄ）および図８（Ａ）の３個の文字オブジェクト領域Ｌ３４〜Ｌ３６が統合された１個の文字オブジェクト領域Ｌ３４Ｃと、文字オブジェクト領域Ｌ３７と、の２個の文字オブジェクト領域が特定されることになる（図３（Ｄ）、図８（Ｃ））。

図５のステップＳ４５５０にて、処理対象領域Ｎの拡張がされていない場合には（ステップＳ４５５０：ＮＯ）、ステップＳ４５５５で、特定部１２０は、全ての領域の処理が完了したか否かを判断する。未処理の領域が残っている場合には（ステップＳ４５５５：ＮＯ）、特定部１２０は、ステップＳ４５０５に戻る。全ての領域の処理が完了した場合には（ステップＳ４５５５：ＹＥＳ）、特定部１２０は、ステップＳ４５６０で、領域の識別子を更新する。具体的には、特定部１２０は、図２のＳ４００において生成されて、バッファ領域２４１に格納されたラベルデータを更新する。ラベルデータの更新が終了すると、特定部１２０は、統合処理を終了する。

統合処理の後、図２のステップＳ５００では、判断部１２５（図１）は、統合処理後に複数個の領域毎に、画像の種類、すなわち、領域内のオブジェクトの種類が「文字」であるか否かを判断するオブジェクト属性判断処理を実行する。

図９は、判断テーブル２９２の一例を示す図である。判断部１２５は、判断テーブル２９２を参照して、オブジェクト属性判断処理を実行する。判断部１２５は、色の分布幅Ｗと色数Ｃと画素密度Ｓとに応じて種類を識別する。判断部１２５は、特定されたオブジェクト領域ごとに、図１０に示すようなヒストグラムを生成して、分布幅Ｗと色数Ｃと画素密度Ｓとを算出する。生成されたヒストグラムおよび分布幅Ｗと色数Ｃと画素密度Ｓは、バッファ領域２４１に格納され、例えば、オブジェクト判断処理後に消去される。

図１０は、分布幅Ｗと色数Ｃとの説明図である。図中には、輝度のヒストグラムが示されている。この輝度ヒストグラムは、処理対象のオブジェクト領域（以下、対象領域と呼ぶ）内の画素値から算出される輝度のヒストグラムである。本実施例では、各画素の輝度は、各画素の階調値（赤Ｒと緑Ｇと青Ｂの３個の色成分の階調値）から、算出される。算出式としては、例えば、ＲＧＢの各階調値から、ＹＣｂＣｒ色空間のＹ成分（輝度成分）を算出する算出式が、利用される。

色数Ｃは、０〜２５５までの２５６個の輝度値のうち、頻度値（すなわち、画素数）が所定の閾値Ｔｈ以上である輝度値の数である。図１０のヒストグラムは、閾値Ｔｈを越える３個のピークＰ１、Ｐ２、Ｐ３を含んでいる。図１０の例では、色数Ｃは、第１ピークＰ１の閾値Ｔｈを越える部分の幅Ｃ１と、第２ピークＰ２の閾値Ｔｈを越える部分の幅Ｃ２と、第３ピークＰ３の閾値Ｔｈを越える部分の幅Ｃ３と、の和に相当する。一般的に、文字は少ない色で表現されることが多いので、対象領域が文字オブジェクトを表す場合には、色数Ｃは比較的少なくなる。対象領域が非文字オブジェクトを表す場合には、色数Ｃは、比較的多くなる。例えば、写真オブジェクトは、撮影された被写体の種々の色を表すので、対象領域が写真オブジェクトを表す場合には、色数Ｃが比較的多くなる。

分布幅Ｗは、頻度値（すなわち、画素数）が所定の閾値Ｔｈ以上である輝度値の最低値と最高値との間の差（幅）である。色数Ｃの説明と同じ理由により、対象領域が文字オブジェクトを表す場合には、分布幅Ｗが比較的小さくなり、対象領域が非文字オブジェクトを表す場合には、分布幅Ｗが比較的大きくなる。

画素密度Ｓは、対象領域に外接する最小矩形内の総画素数に対するオブジェクト画素の画素数（単位面積当たりの画素数）である。一般的に、文字は、背景上に、背景とは異なる色の細線で、書かれている。対象領域が文字オブジェクトを表す場合には、画素密度Ｓが比較的小さくなる。対象領域が非文字オブジェクトを表す場合には、画素密度Ｓが比較的大きくなる。例えば、写真オブジェクトは、外接する最小矩形の大部分を占める可能性が高いので、対象領域が写真オブジェクトを表す場合には、画素密度Ｓが比較的大きくなる。

図９の判断テーブル２９２は、上記説明を考慮して、作成されている。具体的には、判断部１２５は、所定の判断条件が満たされる場合には、対象領域は、文字オブジェクトを表す文字オブジェクト領域であると判断する。判断部１２５は、所定の判断条件が満たされない場合には、対象領域は、非文字オブジェクトを表す非文字オブジェクト領域であると判断する。

所定の判断条件は、判断テーブル２９２から解るように、以下の２つの条件のいずれかが満たされることである。
１）分布幅Ｗが分布幅閾値Ｗｔｈ以上、かつ、色数Ｃが色数閾値Ｃｔｈ未満、かつ、画素密度Ｓが画素密度閾値Ｓｔｈ未満であること
２）分布幅Ｗが分布幅閾値Ｗｔｈ未満、かつ、画素密度Ｓが画素密度閾値Ｓｔｈ未満であること

図３（Ｄ）の例では、オブジェクト領域Ｌ３１、Ｌ３２、Ｌ３３は、非文字オブジェクトを表す領域（以下、非文字オブジェクト領域とも呼ぶ）であると判断され、オブジェクト領域Ｌ３４Ｃ、Ｌ３７は、それぞれ文字オブジェクトを表す領域（以下、文字オブジェクト領域とも呼ぶ）であると判断される。

オブジェクト属性判断処理に続いて、ステップＳ５５０では、判断部１２５は、グレー判断処理を実行する。

図１１は、グレー判断処理のフローチャートである。
ステップＳ５５１では、判断部１２５は、ステップＳ５００で非文字オブジェクト領域であると判断された領域を選択する。図３（Ｄ）の例では、３個の非文字オブジェクト領域Ｌ３１〜Ｌ３３が順次に選択される。

ステップＳ５５２では、選択された非文字オブジェクト領域内の画像を平滑化する平滑化処理を実行する。具体的には、対象画像データのうち、選択された非文字オブジェクト領域に対応する部分画像データに対して、平滑化フィルタＦＬ（図１１）を適用する。なお、平滑化フィルタＦＬは、処理対象の部分画像データに含まれる３個の成分データ（すなわち、Ｒ成分データ、Ｇ成分データ、Ｂ成分データ）のそれぞれに対して適用される。すなわち、判断部１２５は、処理対象の成分データが表す画像内の注目画素に、平滑化フィルタＦＬの中心位置ＦＣが重なるように平滑化フィルタＦＬを配置する。判断部１２５は、注目画素を中心とした平滑化フィルタＦＬ（例えば、縦５画素×横５画素）内の複数個の成分値の平均値を算出する。判断部１２５は、注目画素の成分値を、算出された平均値に変更する。判断部１２５は、各成分データ内のすべての画素を注目画素に設定して、同様の処理を実行する。平滑化処理後の部分画像データは、バッファ領域２４１に格納される。

平滑化処理の意義について説明する。上述したように、原稿を読み取って得られるスキャンデータによって表される画像において、通常の観察距離で観察した場合に無彩色に見える画像の個々の画素が、有彩色を有している場合がある。例えば、原稿が、ＣＭＹの３種類の印刷材を用いて印刷された原稿である場合である。個々の画素が有彩色を有している場合であっても、通常の観察距離で観察した場合にグレーに見える画像（すなわち、領域）は、比較的狭い領域（例えば、通常の観察距離で識別可能な最小の大きさの領域）内の個々の画素の平均色は、無彩色であると考えられる。このために、平滑化処理を行うことによって、無彩色に見える領域内の個々の画素が有彩色を有している場合に、これらの画素の色を無彩色に近づけることができる。したがって、後述するグレー領域であるか否かの判断精度を向上することができる。

平滑化処理に続くステップＳ５５３では、判断部１２５は、機器独立色空間であるＣＩＥＬＡＢ色空間（以下、単にＬａＢ色空間とも呼ぶ）における＊ａ値と、＊ｂ値の分布を表すヒストグラムを作成して、バッファ領域２４１に格納する。このヒストグラムは、例えば、＊ａ値および＊ｂ値毎に、＊ａ値を有する画素数、および、＊ｂ値を有する画素数を、カウントしたヒストグラムである。

図１２は、ヒストグラムの作成のフローチャートである。
ステップＳ５５３１では、判断部１２５は、対象画像ＳＩにおいて、処理対象の非文字オブジェクト領域内の画素を処理対象画素として選択する。ステップＳ５５３２では、判断部１２５は、処理対象画素に対応する二値画像ＢＩ（図３（Ｃ））内の画素のエッジ強度ＥＰを算出する。エッジ強度ＥＰは、例えば、図４に示す算出式を用いて算出される。

エッジ強度ＥＰが算出されると、続くステップＳ５５３３では、判断部１２５は、エッジ強度ＥＰは、エッジ基準値Ｅｔｈ以下であるか否かを判断する。エッジ強度ＥＰがエッジ基準値Ｅｔｈ以下である場合には（ステップＳ５５３３：ＹＥＳ）、判断部１２５は、処理対象画素の画素値を用いて、ヒストグラムを更新する。すなわち、判断部１２５は、処理対象画素の画素値（ＲＧＢ値）をＬａｂ値に変換して、当該Ｌａｂ値に応じて、上述したヒストグラムを更新する。

エッジ強度ＥＰがエッジ基準値Ｅｔｈより大きい場合には（ステップＳ５５３３：ＮＯ）、判断部１２５は、ステップＳ５５３４をスキップする。すなわち、処理対象画素のエッジ強度ＥＰが基準値Ｅｔより大きい場合には、処理対象画素は、ヒストグラムの作成には使用されない。

図１３は、非文字オブジェクト領域の外縁部の一例を示す図である。図３（Ｃ）に示すように、二値画像ＢＩでは、オブジェクト領域の内部の画素値は、全て「１」である（具体的には、図３（Ｃ）の黒で表されている）ので、エッジ強度ＥＰが基準値Ｅｔより大きい画素は、オブジェクト領域の外縁部分（非オブジェクト領域と接する部分）に現れ、オブジェクト領域のうち、外縁部分を除いた領域には、現れない。したがって、図１３に示すように、各非文字オブジェクト領域Ｌ３１〜Ｌ３３の各外縁部ＯＥ１〜ＯＥ３（具体的には、図１３においてハッチングされた領域）の画素が、ヒストグラムの作成から除外される。すなわち、非文字オブジェクト領域Ｌ３１〜Ｌ３３の各外縁部ＯＥ１〜ＯＥ３の画素は、後述するステップＳ５５４〜Ｓ５５６の処理にて実行される、グレー領域であるか否かの判断には用いられない。

続くステップＳ５５３５では、判断部１２５は、処理対象の非文字オブジェクト領域内の全ての画素を選択したか否かを判断する。判断部１２５は、全ての画素を選択した場合には（ステップＳ５５３５：ＹＥＳ）、ヒストグラムの作成を終了する。判断部１２５は、未選択の画素がある場合には（ステップＳ５５３５：ＮＯ）、ステップＳ５５３１に戻って、未選択の画素を新たに選択して、上述したステップＳ５５３２〜Ｓ５５３５の処理を繰り返す。

ヒストグラムが作成されると、図１１のステップＳ５５４では、判断部１２５は、処理対象の非文字オブジェクト領域内の全画素に対する有彩色の画素が占める割合ＰＮ（すなわち、有彩色比率）が、グレー判断基準値Ｎｔｈ未満であるか否かを判断する。

図１４は、グレー領域とカラー領域の判断について説明する図である。
本実施例では、判断部１２５は、Ｌａｂ色空間における無彩色軸（すなわち、＊ａ＝＊ｂ＝０の軸）との距離Ｒが、所定の基準距離Ｒｔｈ（図１４）未満である色は、無彩色であると判断し、Ｌａｂ色空間における無彩色軸（すなわち、＊ａ＝＊ｂ＝０の軸）との距離Ｒが、所定の基準距離Ｒｔｈ以上である色は、有彩色であると判断する。ここで、距離Ｒは、Ｌａｂ色空間におけるユークリッド距離（具体的には、Ｒ^２＝（＊ａ）^２＋（＊ｂ）^２の式で表される。）である。基準距離Ｒｔｈは、観察者が無彩色であると認識する色と、有彩色であると認識する色と、を分離できる値であって、経験的に定められる。判断部１２５は、ヒストグラムを参照して、有彩色比率ＰＮを算出して、グレー判断基準値Ｎｔｈ未満であるか否かを判断する。

有彩色比率ＰＮがグレー判断基準値Ｎｔｈ未満である場合には（ステップＳ５５４：ＹＥＳ）、判断部１２５は、処理対象の非文字オブジェクト領域は、グレー領域であると判断する（ステップＳ５５５）。有彩色比率ＰＮがグレー判断基準値Ｎｔｈ以上である場合には（ステップＳ５５４：ＮＯ）、判断部１２５は、処理対象の非文字オブジェクト領域は、カラー領域であると判断する（ステップＳ５５６）。図１４（Ａ）は、グレー領域であると判断される非文字オブジェクト領域内の画像の色分布の例を示し、図１４（Ｂ）は、カラー領域であると判断される非文字オブジェクト領域内の画像の色分布の例を示している。図１４（Ａ）の例では、ほとんどの画素の色が、無彩色軸から基準距離Ｒｔｈ内の範囲（無彩色範囲とも呼ぶ）に分布していることが解る。一方、図１４（Ｂ）の例では、比較的高い割合の画素の色が、無彩色軸から基準距離Ｒｔｈ以上離れた範囲（有彩色範囲とも呼ぶ）に分布していることが解る。なお、グレー判断基準値Ｎｔｈは、一例として、０．３以下であることが好ましく、０．１５以下であることがさらに好ましい。判断部１２５は、処理対象の非文字オブジェクト領域が、グレー領域であるか、カラー領域であるかを判断すると、平滑化処理後の部分画像データ、および、ヒストグラムデータを、バッファ領域２４１から消去する。

続くステップＳ５５７では、判断部１２５は、全ての非文字オブジェクト領域を選択したか否かを判断する。判断部１２５は、全ての非文字オブジェクト領域を選択した場合には（ステップＳ５５７：ＹＥＳ）、グレー判定処理を終了する。判断部１２５は、未選択の非文字オブジェクト領域がある場合には（ステップＳ５５７：ＮＯ）、ステップＳ５５１に戻って、未選択の非文字オブジェクト領域を新たに選択して、上述したステップＳ５５２〜Ｓ５５７の処理を繰り返す。

ここで、非文字オブジェクト領域Ｌ３１〜Ｌ３３の各外縁部ＯＥ１〜ＯＥ３の画素を、グレー画像か否かの判断に用いない理由を説明する。これらの外縁部ＯＥ１〜ＯＥ３は、オブジェクト領域と、非オブジェクト領域（背景領域）との境界に位置する。これらの境界部分は、オブジェクト領域の本来の色とは異なる色を有する場合がある。一般的なスキャナは、イメージセンサの原稿に対する位置を副走査方向に移動させながら、イメージセンサによって原稿からの光を受光して、スキャンデータを生成する。このとき、境界部分の画素データは、原稿のオブジェクト領域からの光と、背景領域からの光との両方に基づいて生成され得る。したがって、本実施例のように、対象画像データがスキャンデータである場合には、境界部分は、オブジェクト領域の本来の色と、背景領域の色との中間色になる場合がある。本実施例では、各外縁部ＯＥ１〜ＯＥ３の画素を、グレー領域か否かの判断に用いないことによって、オブジェクト領域の本来の色が、無彩色であるか有彩色であるかを精度良く判断することができる。

図１１のグレー判断処理によって、図３（Ｄ）の例では、２個の非文字オブジェクト領域Ｌ３１、Ｌ３２は、グレー領域であると判断され、１個の非文字オブジェクト領域Ｌ３３は、カラー領域であると判断される。

グレー判断処理が終了すると、図２のステップＳ６００では、低減処理部１３０は、対象画像データのデータサイズを低減するための低減処理を実行する。

図１５は、第１実施例の低減処理のフローチャートである。
低減処理が開始されると、先ず、ステップＳ６０５では、処理対象の１個のオブジェクト領域（文字オブジェクト領域または非文字オブジェクト領域）が選択される。図３（Ｄ）の例では、５個のオブジェクト領域Ｌ３１〜Ｌ３３、Ｌ３４Ｃ、Ｌ３７が、１個ずつ順次に選択される。

処理対象のオブジェクト領域が選択されると、次のステップＳ６１０では、低減処理部１３０は、処理対象のオブジェクト領域が、文字オブジェクト領域であるか否かを判断する。低減処理部１３０は、処理対象のオブジェクト領域が、文字オブジェクト領域である場合には（ステップＳ６１０：ＹＥＳ）には、低減処理部１３０の第１処理部１３１は、処理対象の文字オブジェクト領域内の文字画像の色を表す文字色値ＴＣを決定する（ステップＳ６２０）。第１処理部１３１は、例えば、処理対象の文字オブジェクト領域内の全ての画素についての、ＲＧＢの各成分値の平均値（Ｒａｖｅ１、Ｇａｖｅ１、Ｂａｖｅ１）を、文字色値ＴＣとして算出する。第１処理部１３１は、文字色値ＴＣとして他の値を算出しても良く、例えば、文字オブジェクト領域内の画素のうち、文字オブジェクト領域の外縁部（背景との境界部）を除く画素のみを用いて、文字色値ＴＣを算出しても良い。

文字色値ＴＣが決定されると、続くステップＳ６２５では、低減処理部１３０の第３処理部１３３は、バッファ領域２４１に格納された対象画像データにおいて、処理対象の文字オブジェクト領域内の画素の画素値を背景色値ＢＣに変更する。すなわち、第３処理部１３３は、対象画像ＳＩから処理対象の文字オブジェクト領域の文字画像を消去する。背景色値ＢＣは、例えば、処理対象の文字オブジェクト領域を囲む非オブジェクト領域（背景領域）内の全ての画素についての、ＲＧＢの各成分値の平均値（Ｒａｖｅ２、Ｇａｖｅ２、Ｂａｖｅ２）が採用される。図３（Ｄ）の例では、文字オブジェクト領域Ｌ３４Ｃ、Ｌ３７の背景色値ＢＣは、非オブジェクト領域Ｌ３０内の画素の画素値を用いて算出される。背景色値ＢＣは、他の値が採用されても良く、例えば、第３処理部１３３は、処理対象の文字オブジェクト領域を囲む非オブジェクト領域内の複数個の画素のうち、文字オブジェクト領域に比較的近い複数個の画素のみを用いて、背景色値ＢＣを算出しても良い。

続くステップＳ６３０では、第１処理部１３１は、処理対象の文字オブジェクト領域に対応する二値画像データを取得して、当該二値画像データを、ＦＬＡＴＥ圧縮方式により圧縮する。本ステップにおいて、処理対象の文字オブジェクト領域内の文字を表す圧縮済みの文字画像データが生成される。生成された圧縮済みの文字画像データは、後述する圧縮ＰＤＦファイルの生成まで（図２：Ｓ７００）まで、バッファ領域２４１に格納される。文字オブジェクト領域に対応する二値画像データは、文字オブジェクトに外接する最小矩形に対応する二値画像を表す。例えば、図３（Ｄ）の文字オブジェクト領域Ｌ３４Ｃに対応する二値画像データによって表される二値画像は、図３（Ｃ）における二値画像ＢＩ４である。また、図３（Ｄ）の文字オブジェクト領域Ｌ３７に対応する二値画像データによって表される二値画像は、図３（Ｃ）における二値画像ＢＩ７である。

ＦＬＡＴＥ圧縮方式は、ＺＩＰファイルの作成などに使用されている可逆圧縮方式であり、比較的階調数の少ない画像の圧縮に適している。ＦＬＡＴＥ圧縮方式を用いれば、二値画像データを、高い圧縮率で、かつ、解像度を落とすことなく圧縮することができる。文字は、色の再現性よりも読みやすさが優先されると考えられるので、階調性の維持よりも解像度の維持が優先される。このために、本実施例では、圧縮済みの文字画像データを、二値画像データをＦＬＡＴＥ圧縮方式で圧縮することによって生成している。ＦＬＡＴＥ圧縮方式により圧縮済みの文字画像データが生成されると、低減処理部１３０は、ステップＳ６５０に処理を移行する。

上述した図６のステップＳ６１０にて、処理対象のオブジェクト領域が、文字オブジェクト領域でない場合には（ステップＳ６１０：ＮＯ）には、低減処理部１３０は、処理対象のオブジェクト領域が、グレー領域であるか否かを判断する（ステップＳ６１５）。グレー領域は、上述したとおり、非文字オブジェクト領域のうち、グレー判断処理（図２：ステップＳ５５０）にて、グレー領域であると判断された領域である。処理対象のオブジェクト領域が、グレー領域でない場合には（ステップＳ６１５：ＮＯ）、すなわち、処理対象のオブジェクト領域がカラー領域である場合には、低減処理部１３０は、ステップＳ６５０に処理を移行する。

処理対象のオブジェクト領域が、グレー領域である場合には（ステップＳ６１５：ＹＥＳ）、低減処理部１３０の第２処理部１３２は、処理対象のグレー領域内の画像を表す１個の成分データを取得する（ステップＳ６３５）。本実施例では、第２処理部１３２は、対象画像データのうち、処理対象のグレー領域に対応する部分画像データに含まれる３個の成分データ（すなわち、Ｒ成分データ、Ｇ成分データ、Ｂ成分データ）のうちの１個の成分データを選択する。無彩色（すなわち、グレー）は、３個の成分値が互いに等しいＲＧＢ値で表されるから、グレー領域に対応する部分画像データに含まれる３個の成分データは、互いにほぼ等しいと考えられる。したがって、本ステップでは、３個の成分データのうちいずれの成分データが選択されても良い。

続くステップＳ６４０では、第３処理部１３３は、バッファ領域２４１に格納された対象画像データにおいて、処理対象のグレー領域内の画素の画素値を背景色値ＢＣに変更する。すなわち、第３処理部１３３は、対象画像ＳＩから処理対象のグレー領域内の画像を消去する。背景色値ＢＣは、上述したステップＳ６２５において、文字オブジェクト領域内の文字を消去する際に使用した背景色値ＢＣと同様に、処理対象のグレー領域を囲む非オブジェクト領域（すなわち、背景領域）内の画素の画素値を用いて算出される。

次のステップＳ６４５では、第２処理部１３２は、ステップＳ６３５で取得された１個の成分データを、グレー成分データ上に配置する。具体的には、グレー成分データは、対象画像ＳＩと同じ大きさの領域を有する１個の成分データであり、初期状態では、全ての画素値が、白（すなわち、最大輝度値）を表す値、例えば、「２５５」にされている。先ず、初期状態のグレー成分データがバッファ領域２４１に準備され、本ステップでは、第２処理部１３２は、このグレー成分データのうち、処理対象のグレー領域に対応する部分データを、ステップＳ６３５で取得された１個の成分データに置換する。

次のステップＳ６４７では、第２処理部１３２は、処理対象のグレー領域に対応する二値画像データを取得して、グレーマスクデータ上に配置する。具体的には、グレーマスクデータは、対象画像ＳＩと同じ大きさの領域、すなわち、グレー成分データと同じ大きさの領域を有する二値画像データであり、初期状態では、全ての画素値が「０」にされている。先ず、初期状態のグレー成分データがバッファ領域２４１に準備され、本ステップでは、第２処理部１３２は、このグレーマスクデータのうち、処理対象のグレー領域に対応する部分データを、グレー領域に対応する二値画像データに置換する。グレー領域に対応する二値画像データは、グレー領域（すなわち、非文字オブジェクト）に外接する最小矩形に対応する二値画像を表す。例えば、図３（Ｄ）のグレー領域（すなわち、非文字オブジェクト領域）Ｌ３１に対応する二値画像データによって表される二値画像は、図３（Ｃ）における二値画像ＢＩ１である。また、図３（Ｄ）のグレー領域（すなわち、非文字オブジェクト領域）Ｌ３２に対応する二値画像データによって表される二値画像は、図３（Ｃ）における二値画像ＢＩ２である。処理対象のグレー領域に対応する二値画像データを取得して、グレーマスクデータ上に配置すると、低減処理部１３０は、ステップＳ６５０に処理を移行する。

ステップＳ６５０では、低減処理部１３０は、全てのオブジェクト領域を選択したか否かを判断する。低減処理部１３０は、全てのオブジェクト領域を選択した場合には（ステップＳ６５０：ＹＥＳ）、ステップＳ６５５に処理を進める。低減処理部１３０は、未選択のオブジェクト領域がある場合には（ステップＳ６５０：ＮＯ）、ステップＳ６０５に戻って、未選択のオブジェクト領域を新たに選択して、上述したステップＳ６１０〜Ｓ６５０の処理を繰り返す。

図１６は、第１実施例の低減処理で生成される画像データについて説明する図である。
対象画像ＳＩに対して上記の各処理を終え、ステップＳ６５５に移行した時点で、１個のカラー成分データ（図１６（Ａ））と、２個の圧縮済みの文字画像データ（図１６（Ｂ））と、１個のグレー成分データ（図１６（Ｃ））と、１個のグレーマスクデータ（図１６（Ｄ））と、が生成され、バッファ領域２４１に、それぞれ格納されている。

カラー成分データは、低減処理部１３０の第３処理部１３３による処理（図１５：ステップＳ６２５、Ｓ６４０）によって、生成される。ステップＳ６２５、Ｓ６４０の処理から解るように、カラー成分データは、対象画像データ内の複数個の画素値のうち、文字オブジェクト領域内の各画素の画素値と、グレー領域内の各画素の画素値とを、背景色値ＢＣに置換して得られる画像データである。カラー成分データは、対象画像データのうち、カラー領域に対応する部分画像データを、含んでいる。したがって、図１６（Ａ）に示すように、カラー成分データによって表されるカラー成分画像ＣＩは、対象画像ＳＩの非オブジェクト領域Ｌ３０（図３（Ｄ））に対応する背景Ｂｇと、カラー領域Ｌ３３（図３（Ｄ））に対応するカラーオブジェクトＯｂ３と、を表す部分画像を含んでいる。また、カラー成分データは、対象画像データと同じように、３個の色成分に対応する３個の成分データ（すなわち、Ｒ成分データ、Ｇ成分データ、Ｂ成分データ）を含んでいる。

圧縮済みの文字画像データは、低減処理部１３０の第１処理部１３１による処理（すなわち、図１５：ステップＳ６３０）によって、生成される。ステップＳ６３０の処理から解るように、圧縮済みの文字画像データは、対象画像データのうち、文字オブジェクト領域に対応する部分画像データを二値化して得られる二値画像データをＦＬＡＴ圧縮方式で圧縮したデータである。図１６（Ｂ）の例では、対象画像ＳＩの文字オブジェクト領域Ｌ３４Ｃ（図３（Ｄ））に対応する３個の文字オブジェクトＯｂ４〜Ｏｂ６を表す二値画像ＴＩ１と、領域Ｌ３７（図３（Ｄ））に対応する１個の文字オブジェクトＯｂ７を表す二値画像ＴＩ２と、をそれぞれ表す２個の圧縮済みの文字画像データが生成されている。

グレー成分データは、低減処理部１３０の第２処理部１３２による処理（図１５：ステップＳ６３５、Ｓ６４５）によって、生成される。ステップＳ６３５、Ｓ６４５の処理から解るように、グレー成分データは、対象画像ＳＩに含まれる１個以上のグレー領域をそれぞれ表す部分成分データを含んでいる。したがって、図１６（Ｃ）に示すように、グレー成分データによって表されるグレー成分画像ＧＩは、対象画像ＳＩ内の２個のグレー領域Ｌ３１、Ｌ３２にそれぞれ対応する２個のグレーオブジェクトＯｂ１、Ｏｂ２、を表す２個のグレー部分画像ＰＧ１、ＰＧ２を含んでいる。また、グレー成分データは、対象画像データとは異なり、１個の成分値から構成された１個の成分データである。

グレーマスクデータは、低減処理部１３０の第２処理部１３２による処理（図１５：ステップＳ６４７）によって、生成される。ステップＳ６４７の処理から解るように、グレーマスクデータによって表されるグレーマスク画像ＭＩは、対応するグレー成分画像ＧＩ（図１６（Ｃ））内の２個のグレー部分画像ＰＧ１、ＰＧ２にそれぞれ対応する２個のマスク部分画像ＰＭ１、ＰＭ２と、を含んでいる。２個のマスク部分画像ＰＭ１、ＰＭ２は、対応する２個のグレー部分画像ＰＧ１、ＰＧ２内のオブジェクト画素の位置を示している。すなわち、グレーマスクデータは、グレー成分画像ＧＩ内のオブジェクト画素の位置を表す値「１」と、非オブジェクト画素の位置を表す値「０」と、から構成される二値データである。言い換えれば、グレーマスク画像ＭＩは、グレー成分画像ＧＩが、カラー成分画像ＣＩ上に重ねて表示される場合に、表示すべき画素（すなわち、画素値「１」の画素）と、表示しない画素（すなわち、画素値「０」の画素）と、を規定した二値画像である。

ステップＳ６５５では、先ず、低減処理部１３０の第２処理部１３２は、グレー成分データをＪＰＥＧ圧縮方式で圧縮する。ＪＰＥＧ圧縮方式は、デジタルカメラで撮影することによって生成された画像データの圧縮などに使用されている不可逆圧縮方式であり、写真のように、比較的階調性が高い画像、すなわち、色数Ｃが多く、階調の変化が緩やかな画像の圧縮に適している。一方、ＪＰＥＧ圧縮方式は、急激に階調が変化するエッジを大きく劣化させるので、文字のように、読みやすさや見栄えの観点からエッジの再現性が重要な画像の圧縮には不向きである。本ステップにて圧縮されたグレー成分データを、圧縮済みのグレー画像データとも呼ぶ。生成された圧縮済みのグレー画像データは、バッファ領域２４１に格納され、圧縮前のグレー成分データは消去される。

圧縮済みのグレー画像データが生成されると、次のステップＳ６６０では、第２処理部１３２は、グレーマスクデータをＦＬＡＴＥ圧縮方式で圧縮して、圧縮済みのグレーマスクデータを生成する。ＦＬＡＴＥ圧縮方式は、上述したように、二値データのような階調数が比較的少ない画像の圧縮に適している。生成された圧縮済みのグレーマスクデータは、バッファ領域２４１に格納され、圧縮前のグレーマスクデータは消去される。

圧縮済みのグレーマスクデータが生成されると、次のステップＳ６６５では、低減処理部１３０の第３処理部１３３は、カラー成分データをＪＰＥＧ圧縮方式で圧縮する。カラー成分データは、上述したように、３個の成分データを含んでいるため、３個の成分データがそれぞれ圧縮されることになる。本ステップにて圧縮されたカラー成分データを、圧縮済みのカラー画像データとも呼ぶ。生成された圧縮済みのカラー画像データは、バッファ領域２４１に格納され、圧縮前のカラー成分データは消去される。圧縮済みのカラー画像データが生成されると、低減処理部１３０は、低減処理を終了する。

低減処理が終了されると、図２のステップＳ７００では、生成部１５０は、圧縮済みの文字画像データと、圧縮済みのグレー画像データと、圧縮済みのカラー画像データと、圧縮済みのグレーマスクデータと、を用いて圧縮ＰＤＦファイルを生成する。

具体的には、生成部１５０は、圧縮済みのカラー画像データを、最下層のレイヤーとして表示させる画像データとして、ＰＤＦファイルに格納する。

また、生成部１５０は、圧縮済みの文字画像データを、圧縮済みのカラー画像データより上位層のレイヤーとして表示する画像データとして、ＰＤＦファイルに格納する。圧縮済みの文字画像データは、文字色値ＴＣおよび座標値ＣＤと関連付けて、ＰＤＦファイルに格納される。文字色値ＴＣは、文字の色を表すＲＧＢ値であり、図１５のステップＳ６２０で算出された値である。座標値ＣＤは、圧縮済みのカラー画像データによって表されるカラー成分画像ＣＩに対して、圧縮済みの文字画像データによって表される二値画像ＴＩが配置されるべき位置を表す情報である。座標値ＣＤは、例えば、二値画像ＴＩに外接する最小矩形の左上の角の画素の座標値（Ｘ、Ｙ）で表される。図１６（Ｂ）の例では、３個の文字オブジェクトＯｂ４〜Ｏｂ６を表す二値画像ＴＩ１を表す文字画像データには、文字色値ＴＣ１（Ｒ１、Ｇ１、Ｂ１）と、座標値ＣＤ１（Ｘ１、Ｙ１）と、が関連付けられている。また、１個の文字オブジェクトＯｂ７を表す二値画像ＴＩ２には、文字色値ＴＣ２（Ｒ２、Ｇ２、Ｂ２）と、座標値ＣＤ２（Ｘ２、Ｙ２）と、が関連付けられている。

また、生成部１５０は、圧縮済みのグレー画像データを、圧縮済みのカラー画像データより上位層のレイヤーとして表示する画像データとして、ＰＤＦファイルに格納する。圧縮済みのグレー画像データは、圧縮済みのグレーマスクデータと関連付けて、ＰＤＦファイルに格納される。

圧縮ＰＤＦファイルが生成されると、例えば、スキャナドライバ１００は、生成されたＰＤＦファイルを、例えば、不揮発性記憶装置２９０に格納し、バッファ領域２４１に格納された圧縮済みの文字画像データと、圧縮済みのグレー画像データと、圧縮済みのカラー画像データと、圧縮済みのグレーマスクデータとをそれぞれ消去した後、画像処理を終了する。
ＰＤＦファイルは、複数個の異なる形式の画像データを１個のファイルに格納可能であり、当該ファイルを用いて画像を表示する際には、格納された複数個の画像データを重畳して１個の画像として再現可能なように規格が定められている。ステップＳ７００において、生成部１５０は、ＰＤＦ規格に従って、各圧縮済みの画像データ（図１６）をＰＤＦファイルに格納するので、本実施例にて作成された圧縮ＰＤＦファイルは、ＰＤＦファイルの閲覧ソフトを用いて表示すると、対象画像ＳＩ（図３（Ａ））を、再現することができる。

以上説明した第１実施例によれば、第１処理部１３１は、対象画像データのうち、文字領域に対応する部分画像データを用いて、圧縮済みの文字画像データを生成する。また、第２処理部１３２は、対象画像データのうち、グレー領域に対応する部分画像データを用いて、１種類の成分値で構成された圧縮済みのグレー画像データを生成する。第２処理部１３２は、１種類の成分値で構成されたグレー成分データを取得する処理（図１５：ステップＳ６３５、Ｓ６４５）と、グレー成分データを圧縮する処理（図１５：ステップＳ６５５）と、を行うことで圧縮済みのグレー画像データを生成する。第３処理部１３３は、対象画像データのうち、カラー領域に対応する部分画像データを用いて、複数種類の成分値で構成された圧縮済みのカラー画像データを生成する。第３処理部１３３は、複数個の成分データを含むカラー成分データを取得する処理（図１５：ステップＳ６２５、Ｓ６４０）と、カラー成分データを圧縮する処理（図１５：ステップＳ６６５）と、を行うことで圧縮済みのカラー画像データを生成する。第１処理部１３１と、第２処理部１３２と、第３処理部１３３と、が行う処理は、互いに異なる。この結果、文字、文字とは異なるグレー画像、文字とは異なるカラー画像とにそれぞれ適した処理を実行するので、対象画像データを効果的に圧縮して、圧縮済みの対象画像データを生成することができる。

具体的には、階調性よりエッジの再現性が重要であると考えられる文字領域については、二値画像データをＦＬＡＴＥ圧縮方式で圧縮して、圧縮済みの文字画像データを生成する。この結果、圧縮率を高く維持しつつ、かつ、文字の読みやすさを損なわない態様で、文字領域を表す画像を保存することができる。

さらに、エッジの再現性より階調性が重要であると考えられる写真領域を含み得る非文字領域のうち、グレー領域については、１個の成分で構成されたグレー成分データを、ＪＰＥＧ圧縮方式で圧縮して、圧縮済みのグレー画像データを生成する。この結果、１個の成分で構成されたグレー成分データを用いることで、圧縮率を高めることができるとともに、多階調の圧縮に適したＪＰＥＧ圧縮方式を用いることで、グレーの写真などを含み得るグレー領域の画質（階調性など）を損なわない態様で、グレー領域を表す画像を保存することができる。

さらに、エッジの再現性より階調性が重要であると考えられる写真領域を含み得る非文字領域のうち、カラー領域については、複数種類の色成分（例えば、ＲＧＢの３種類）で構成されたカラー成分データを、ＪＰＥＧ圧縮方式で圧縮して、圧縮済みのカラー画像データを生成する。この結果、カラー写真などを含み得るカラー領域の画質（色相や階調性）を損なわない態様で、カラー領域を表す画像を保存することができる。

以上の結果、文字領域と、グレー領域と、カラー領域と、を含む対象画像ＳＩを表す対象画像データを、全体として高い画質を維持しつつ、圧縮率を向上できる形式に変換して保存することができる。

さらに、第２処理部１３２は、グレー領域に対応する部分画像データに含まれる３個の成分データ（すなわち、Ｒ成分データ、Ｇ成分データ、Ｂ成分データ）のうちの１個の成分データを選択することによって、グレー成分データを生成する（図１５：ステップＳ６３５）。この結果、グレー成分データを簡単に取得することができる。

さらに、圧縮済みのグレー画像データは、図１６（Ｃ）に示すグレー成分画像ＧＩを表す画像データであり、図１６（Ｃ）から解るように対象画像ＳＩの全体に対応する領域を表す１個の画像データである。また、圧縮済みのカラー画像データは、図１６（Ａ）に示すカラー成分画像ＣＩを表す画像データであり、図１６（Ａ）から解るように、対象画像ＳＩの全体に対応する領域を表す１個の画像データである。この結果、例えば、比較的多数のグレー領域が存在する場合であっても、圧縮済みの画像データの数が過度に増加することを抑制できる。

さらに、判断部１２５は、判断対象のオブジェクト領域に含まれる複数個の画素のうちの有彩色を表す画素の割合ＰＮがグレー判断基準値Ｎｔｈ以上である場合には、判断対象のオブジェクト領域を、カラー領域であると判断し、有彩色を表す画素の割合ＰＮがグレー判断基準値Ｎｔｈ未満である場合には、判断対象の領域を、グレー領域であると判断する（図１１）。したがって、判断部１２５は、グレー領域であるか、カラー領域であるか、を適切に判断することができる。

さらに、判断部１２５は、処理対象のオブジェクト領域に含まれる色数Ｃ（言い換えれば、色の種類の数）に応じて、文字領域と、グレー領域およびカラー領域を含む非文字領域と、を特定する（図９、図１０）。この結果、特定部１２０は、色数Ｃで表される領域の階調性の違いを利用して、文字領域と、非文字領域とを、精度良く特定することができる。

さらに、上記実施例では、特定部１２０は、ラベリングや統合処理（図５）を行うことにより、文字領域を文字の色毎に分離して特定する。そして、文字領域ごとに圧縮された二値データを作成して、各二値データに文字色値ＴＣを関連付けている（図１６）。したがって、文字色を再現しつつ、高い圧縮率で圧縮された圧縮ＰＤＦファイルを作成することができる。

Ｂ．第２実施例
図１７は、第２実施例の低減処理のフローチャートである。図１７において、第１実施例の低減処理（図１５）と同一のステップには、図１５と同一の符号を付し、第１実施例の低減処理と異なるステップには、符号の末尾に「Ａ」を付した。

第２実施例の低減処理では、第１実施例におけるステップＳ６４５、Ｓ６４７（図１５）に代えて、図１７に示すステップＳ６４５Ａ、Ｓ６４７Ａを実行し、第１実施例におけるステップＳ６５５、Ｓ６６０を実行しない。

図１７のステップＳ６４５Ａでは、第２処理部１３２は、ステップＳ６３５にて取得されて、バッファ領域２４１に格納されている処理対象のグレー領域の画像を表す１個の成分データの階調数（例えば、２５５階調）を低減して、グレー領域の画像を表すグレー成分データを生成する。本実施例では、第２処理部１３２は、グレー領域の画像を表す１個の成分データを二値データに変換する（階調数を２階調に低減する）。

続くステップＳ６４７Ａでは、第２処理部１３２は、ステップＳ６４５Ａで生成された２階調のグレー成分データを、比較的階調数の少ない画像の圧縮に適したＦＬＡＴＥ圧縮方式により圧縮して、圧縮済みのグレー成分データを生成する。本ステップにおいて、処理対象のグレー領域の画像を表す圧縮済みのグレー画像データが生成される。生成された圧縮済みのグレー画像データは、バッファ領域２４１に格納され、圧縮前の二値化された成分データは、消去される。

以上の説明から解るように、本実施例では、グレー領域毎に、圧縮済みのグレー画像データが生成される。従って、複数個のグレー領域が存在する場合には、複数個の圧縮済みのグレー画像データが生成されて、バッファ領域２４１に格納される。

第２実施例の低減処理では、グレー領域毎に圧縮済みのグレー画像データが生成されるので、第１実施例のステップＳ６５５の処理（１個のグレー成分データを圧縮する処理）は、存在しない。また、第２実施例の低減処理では、圧縮済みのグレー画像データは二値データであるので、カラー成分画像ＣＩと重畳された場合に、表示すべき画素（すなわち、画素値「１」の画素）と、表示しない画素（すなわち、画素値「０」の画素）と、の区別は明らかである。このために、第２実施例の低減処理では、グレーマスクデータ（図１６（Ｄ））が生成されない。したがって、第２実施例の低減処理では、第１実施例のステップＳ６６０の処理は、存在しない。

図１８は、第２実施例の低減処理で生成される画像データについて説明する図である。
第２実施例の低減処理では、図３（Ａ）の対象画像ＳＩを表す対象画像データを用いる場合には、図１８に示すように、１個の圧縮済みのカラー成分データ（図１８（Ａ））と、２個の圧縮済みの文字画像データ（図１８（Ｂ））と、２個の圧縮済みのグレー成分データ（図１８（Ｃ））と、が生成されて、バッファ領域２４１に、それぞれ格納される。

１個の圧縮済みのカラー成分データ（図１８（Ａ））と、２個の圧縮済みの文字画像データ（図１８（Ｂ））とは、第１実施例の同名のデータ（図１６（Ａ）、図１６（Ｂ））と同じである。

圧縮済みのグレー成分データは、グレー領域、すなわち、グレーと判断された非文字オブジェクト領域毎に生成され、グレー領域に外接する最小矩形に対応するサイズを有する二値画像を表すデータである。したがって、図１８（Ｃ）の例では、２個のグレーオブジェクトＯｂ１、Ｏｂ２をそれぞれ表す２個の二値画像ＧＩ１、ＧＩ２をそれぞれ表す２個の圧縮済みのグレー画像データが生成される。図２のステップＳ７００にて、二値画像ＧＩ１を表す圧縮済みのグレー画像データは、座標値ＣＤ３（Ｘ３、Ｙ３）と関連付けて、ＰＤＦファイルに格納され、二値画像ＧＩ２を表す圧縮済みのグレー画像データは、座標値ＣＤ４（Ｘ４、Ｙ４）と関連付けて、ＰＤＦファイルに格納される。

以上説明した第２実施例によれば、第１実施例と同様に、文字領域と、グレー領域と、カラー領域と、を含む対象画像ＳＩを表す対象画像データを、全体として高い画質を維持しつつ、圧縮率を向上できる形式に変換して保存することができる。

さらに、第２実施例によれば、第２処理部１３２は、グレー成分データに含まれる成分値の諧調数を減らす処理を実行する（図１７：ステップＳ６４５Ａ）。この結果、さらに、グレー成分データのデータ量を低減することができる。

さらに、グレー成分データの階調数を２階調に減らしたことに応じて、グレー成分データを圧縮する圧縮方式に、比較的少ない階調に適したＦＬＡＴＥ圧縮方式が採用されている（図１７：ステップＳ６４７Ａ）。この結果、グレー成分データの階調数に応じて、より圧縮率の向上を図ることができる。

また、圧縮済みのカラー画像データは、対象画像ＳＩの全体に対応する領域（すなわち、カラー成分画像ＣＩ（図１８（Ａ）））を表す１個の画像データである。そして、圧縮済みのグレー画像データは、対象画像ＳＩの一部分に対応する領域を表す１個以上のグレー成分画像（図１８（Ｃ）の例では、２個のグレー成分画像ＧＩ１、ＧＩ２）を表す１個以上の部分画像データである。１個以上の圧縮済みのグレー画像データは、対象画像ＳＩ内の位置を表す位置情報（図１８の例では、座標値ＣＤ１、ＣＤ２）と対応付けられている。この結果、例えば、グレー領域が比較的小さい場合に、一部分の領域のグレー画像データを保持すれば良いので、効率的である。

Ｃ．変形例：
（１）上記第１および第２実施例では、圧縮済みの文字画像データの生成には、ＦＬＡＴＥ圧縮方式が採用されているが、これに限られない。例えば、二値画像データの圧縮に適した他の圧縮方式が採用されても良く、例えば、可逆圧縮方式であるＭＭＲ（Modified Modified Read）方式（CCITT-G4方式とも呼ばれる。）が採用されても良い。

（２）上記第１実施例では、圧縮済みのグレー画像データの生成および圧縮済みのカラー画像データの生成には、共にＪＰＥＧ圧縮方式が採用されているが、これに限られない。例えば、ＧＩＦ（Graphic Interchange Format）形式や、ＴＩＦＦ(Tagged Image File Format)形式の画像ファイルの圧縮に用いられるＬＺＷ圧縮などが採用されても良い。

（３）上記第２実施例のステップＳ６４５Ａ（図１７）では、第２処理部１３２は、処理対象のグレー領域の画像を表す１個の成分データの階調数（例えば、２５５階調（８ビット））を２階調（１ビット）に低減しているが、これに限られない。これに代えて、第２処理部１３２は、グレー領域の画像を表す１個の成分データの階調数を、４階調（２ビット）、８階調（３ビット）、１６階調（４ビット）、３２階調（５ビット）、６４階調（６ビット）、１２８階調（７ビット）のいずれかに低減しても良い。

（４）スキャナドライバ１００は、第１実施例における画像処理の一部の処理と、第２実施例における画像処理の一部の処理と、を組合わせた画像処理を実行しても良い。具体的には、スキャナドライバ１００は、第１実施例の低減処理（図１５）のステップＳ６３５にて取得されたグレー領域内の画像を表す１個の成分データに対して、第２実施例の低減処理（図１７）のステップＳ６４５Ａの階調数を低減する処理を実行しても良い。この場合には、階調数が低減された１個のグレー成分データであって、対象画像ＳＩの全体に対応する領域を表す１個のグレー成分データが生成される。逆に、スキャナドライバ１００は、第２実施例の低減処理（図７）において、ステップＳ６４５Ａの階調数を低減する処理は、省略されても良い。この場合には、階調数が低減されていない、例えば、２５６階調の成分値で構成された１個以上のグレー成分データであって、対象画像ＳＩの一部分に対応する領域を表す１個以上のグレー成分データが生成される。

（５）上記第１実施例では、ステップＳ６３５（図１５）において、第２処理部１３２は、対象画像データのうち、処理対象のグレー領域に対応する部分画像データに含まれる３個の成分データ（すなわち、Ｒ成分データ、Ｇ成分データ、Ｂ成分データ）のうちの１個の成分データを選択することによって、グレー領域を表す１個の成分データを取得している。これに代えて、第２処理部１３２は、処理対象のグレー領域内の画像を表す１個の成分データを、当該グレー領域に対応する部分画像データに含まれる３個の成分データ（すなわち、Ｒ成分データ、Ｇ成分データ、Ｂ成分データ）を用いて生成しても良い。具体的には、第２処理部１３２は、当該グレー領域内の複数個の画素のそれぞれの輝度値Ｙを、以下の式によって算出しても良い。
Ｙ＝Ｒ×０．２９８９１＋Ｇ×０．５８６６１＋Ｂ×０．１１４４８
上記の式のＲ、Ｇ、Ｂは、３個の成分データの対応する画素の画素値、すなわち、Ｒ成分値、Ｇ成分値、Ｂ成分値である。第２処理部１３２は、算出された輝度値を各画素の１個の成分値とする１個の成分データを、当該グレー領域内の画像を表す１個の成分データとしても良い。

（６）図２：ステップＳ１５０におけるエッジ強度Ｓｅの算出や、図１２のステップＳ５５３２におけるエッジ強度ＥＰの算出の算出式としては、図５のソーベルオペレータを用いた算出法に限らず、他の任意の方法を採用可能である。例えば、プレウィットオペレータ（Prewitt operator）、または、ロバーツクロスオペレータ（Roberts Cross operator）など種々のエッジ検出用オペレータを利用可能である。また、エッジ強度は、ＲＧＢの各色成分に限らず、他の色成分（例えば、輝度）の階調値を用いて算出されてもよい。

（７）上記実施例では、判断部１２５は、各画素の色が有彩色であるか否かの判断を、Ｌａｂ色空間を用いて行っている。すなわち、判断部１２５は、当該画素の画素値（言い換えれば、色値）をＬａｂ色空間の表色値に変換して、当該表色値とＬａｂ色空間の無彩色軸との距離Ｒが、基準距離Ｒｔｈ未満か否かによって、当該画素の色が有彩色であるか否か判断している。これに限らず、一般的には、判断部１２５は、無彩色軸を有する任意の色空間、例えば、ＲＧＢ色空間、Ｌａｂ色空間、ＨＳＶ色空間、ＹＣｒＣｂ色空間において、無彩色軸に比較的近い色を表す画素を、無彩色を有する画素であると判断し、無彩色軸から比較的遠い色を表す画素を、有彩色を有する画素であると判断すれば良い。

（８）計算機２００のスキャナドライバ１００による画像処理機能は、光学的に対象物を読み取ることによって対象物を表す画像データを生成する画像読取部を含む画像処理装置によって実現されてもよい（例えば、複合機４００やスキャナ３００や図示しないデジタルカメラ）。この場合には、画像処理装置は、自身の画像読取部によって生成された画像データを用いて、画像処理（例えば、図２の処理）を行えばよい。

一般的には、画像処理（例えば、図２の処理）を実現する画像処理装置は、計算機２００に限らず、種々の装置であってよい。例えば、プリンタ、デジタルカメラ、スキャナなどの画像関連機器の内部のコンピュータ、汎用のパーソナルコンピュータ、ネットワークに接続されたサーバ等を採用可能である。また、ネットワークを介して互いに通信可能な複数個のコンピュータが、画像処理に要する機能を一部ずつ分担して、全体として、画像処理の機能を提供してもよい。この場合、複数個のコンピュータの全体が、特許請求の範囲における画像処理装置に対応する。

（９）上記各実施例において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部あるいは全部をハードウェアに置き換えるようにしてもよい。

以上、実施例、変形例に基づき本発明について説明してきたが、上記した発明の実施の形態は、本発明の理解を容易にするためのものであり、本発明を限定するものではない。本発明は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれる。

１００...スキャナドライバ、１１０...取得部、１２０...特定部、１２５...判断部、１３０...低減処理部、１３１...第１処理部、１３２...第２処理部、１３３...第３処理部、１５０...生成部、２００...計算機、２１０...ＣＰＵ、２４０...揮発性記憶装置、２４１...バッファ領域、２７０...操作部、２８０...通信部、２９０...不揮発性記憶装置、２９１...ドライバプログラム、２９２...判断テーブル、３００...スキャナ、４００...複合機

Claims

文字と、文字とは異なるグレー画像と、文字とは異なるカラー画像と、を含む対象画像を表す対象画像データであって、複数の色成分に対応する複数の成分データを含む対象画像データを取得する取得部と、
前記対象画像において、文字を表す文字領域と、文字とは異なる前記グレー画像を表すグレー領域と、文字とは異なる前記カラー画像を表すカラー領域と、を特定する特定部と、
前記対象画像データのデータサイズを低減するための低減処理部であって、
前記文字領域に対応する部分画像データを用いて、第１の処理を実行することによって、圧縮済みの文字画像データを生成する第１処理部と、
前記グレー領域に対応する部分画像データを用いて、前記第１の処理とは異なる第２の処理を実行することによって、１種類の成分値で構成された圧縮済みのグレー画像データを生成する第２処理部であって、前記第２の処理は、１種類の成分値で構成されたグレー成分データを取得する処理と、前記グレー成分データを圧縮する処理と、を行うことで前記圧縮済みのグレー画像データを生成することを含み、前記圧縮済みのグレー画像データは、前記対象画像の全体に対応する領域を表す１個の画像データである、前記第２処理部と、
前記カラー領域に対応する部分画像データを用いて、前記第１の処理および前記第２の処理とは異なる第３の処理を実行することによって、複数種類の成分値で構成された圧縮済みのカラー画像データを生成する第３処理部であって、前記第３の処理は、複数の成分データを含むカラー成分データを取得する処理と、前記カラー成分データを圧縮する処理と、を行うことで前記圧縮済みのカラー画像データを生成することを含み、前記圧縮済みのカラー画像データは、前記対象画像の全体に対応する領域を表す１個の画像データである、前記第３処理部と、
を有する、前記低減処理部と、
前記圧縮済みの文字画像データと、前記圧縮済みのグレー画像データと、前記圧縮済みのカラー画像データと、を用いて、前記対象画像を表す圧縮済みの対象画像データを生成する生成部と、
を備える、画像処理装置。
請求項１に記載の画像処理装置であって、さらに、
前記圧縮済みのグレー画像データによって表される前記対象画像の全体に対応する領域と、前記圧縮済みのカラー画像データによって表される前記対象画像の全体に対応する領域と、が重ねられて表示される場合に、一方の領域について表示すべき画素と表示しない画素とを規定したマスクデータを生成する第４処理部を備え、
前記生成部は、前記圧縮済みの文字画像データと、前記圧縮済みのグレー画像データと、前記圧縮済みのカラー画像データと、前記マスクデータと、を用いて、前記圧縮済みの対象画像データを生成する、画像処理装置。
請求項１または請求項２に記載の画像処理装置であって、
前記グレー成分データは、前記グレー領域に対応する部分画像データに含まれる前記複数の成分データの中から選択された１個の成分データを含む、画像処理装置。
請求項１ないし請求項３のいずれかに記載の画像処理装置であって、
前記第２処理部による前記グレー成分データの圧縮に用いられる圧縮方式と、前記第３処理部による前記カラー成分データに含まれる前記複数の成分データのそれぞれの圧縮に用いられる圧縮方式とは、同じ方式である、画像処理装置。
請求項１ないし請求項４のいずれかに記載の画像処理装置であって、
前記第２の処理は、前記グレー成分データに含まれる成分値の階調数を減らす処理を含む、画像処理装置。
請求項１ないし請求項５のいずれかに記載の画像処理装置であって、
前記特定部は、前記対象画像内の領域が、前記グレー領域であるか、前記カラー領域であるか、を判断する判断部を備え、
前記判断部は、判断対象の領域に含まれる有彩色を表す画素の割合が基準値以上である場合には、前記判断対象の領域を、前記カラー領域であると判断し、
前記判断部は、判断対象の領域に含まれる有彩色を表す画素の割合が基準値未満である場合には、前記判断対象の領域を、前記グレー領域であると判断する、画像処理装置。
請求項６に記載の画像処理装置であって、
前記判断部は、前記判断対象の領域に含まれる複数の画素の中から、前記判断対象の領域の外縁部分に位置する複数の外縁画素を除いた複数の画素を用いて、前記グレー領域であるか、前記カラー領域であるか、を判断する、画像処理装置。
請求項１ないし請求項７のいずれかに記載の画像処理装置であって、
前記特定部は、処理対象の領域に含まれる色の種類の数に応じて、前記文字領域と、前記グレー領域および前記カラー領域を含む領域と、を特定する、画像処理装置。
文字と、文字とは異なるグレー画像と、文字とは異なるカラー画像と、を含む対象画像を表す対象画像データであって、複数の色成分に対応する複数の成分データを含む対象画像データを取得する取得機能と、
前記対象画像において、文字を表す文字領域と、文字とは異なる前記グレー画像を表すグレー領域と、文字とは異なる前記カラー画像を表すカラー領域と、を特定する特定機能と、
前記対象画像データのデータサイズを低減するための低減処理機能であって、
前記文字領域に対応する部分画像データを用いて、第１の処理を実行することによって、圧縮済みの文字画像データを生成する第１処理機能と、
前記グレー領域に対応する部分画像データを用いて、前記第１の処理とは異なる第２の処理を実行することによって、１種類の成分値で構成された圧縮済みのグレー画像データを生成する第２処理機能であって、前記第２の処理は、１種類の成分値で構成されたグレー成分データを取得する処理と、前記グレー成分データを圧縮する処理と、を行うことで前記圧縮済みのグレー画像データを生成することを含み、前記圧縮済みのグレー画像データは、前記対象画像の全体に対応する領域を表す１個の画像データである、前記第２処理機能と、
前記カラー領域に対応する部分画像データを用いて、前記第１の処理および前記第２の処理とは異なる第３の処理を実行することによって、複数種類の成分値で構成された圧縮済みのカラー画像データを生成する第３処理機能であって、前記第３の処理は、複数の成分データを含むカラー成分データを取得する処理と、前記カラー成分データを圧縮する処理と、を行うことで前記圧縮済みのカラー画像データを生成することを含み、前記圧縮済みのカラー画像データは、前記対象画像の全体に対応する領域を表す１個の画像データである、前記第３処理機能と、
を有する、前記低減処理機能と、
前記圧縮済みの文字画像データと、前記圧縮済みのグレー画像データと、前記圧縮済みのカラー画像データと、を用いて、前記対象画像を表す圧縮済みの対象画像データを生成する生成機能と、
をコンピュータに実現させる、コンピュータプログラム。