JP2007019673A - 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造 - Google Patents

画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造 Download PDF

Info

Publication number
JP2007019673A
JP2007019673A JP2005196908A JP2005196908A JP2007019673A JP 2007019673 A JP2007019673 A JP 2007019673A JP 2005196908 A JP2005196908 A JP 2005196908A JP 2005196908 A JP2005196908 A JP 2005196908A JP 2007019673 A JP2007019673 A JP 2007019673A
Authority
JP
Japan
Prior art keywords
data
ruled line
image data
image
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005196908A
Other languages
English (en)
Inventor
Toshihiro Mori
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2005196908A priority Critical patent/JP2007019673A/ja
Publication of JP2007019673A publication Critical patent/JP2007019673A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

【課題】 画像データを圧縮しても罫線のガタツキを目立たなくすること。
【解決手段】 MFPは、画像データを入力するスキャナ部103と、入力された画像データから罫線を含む罫線領域を抽出する領域判別部11と、罫線領域の画像データから罫線の中心画素を少なくとも含む罫線2値化データを生成し、罫線領域の画像データから罫線データを補間するための補間2値化データを生成する罫線2値化部14と、罫線2値化データおよび補間2値化データそれぞれを圧縮して第1および第2圧縮データを生成する可逆圧縮部15と、画像データから罫線領域を除いた領域を圧縮して第3および第4圧縮データを生成するか逆圧縮部13および非可逆圧縮部17と、第1圧縮データと、第2圧縮データと、第3圧縮データとを結合して結合データを生成する結合部18と、を備える。
【選択図】 図2

Description

この発明は、画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造に関し、画像データを圧縮する画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮した画像のデータ構造に関する。
近年、情報の電子化が進み、文書を紙ではなく電子化して保存あるいは送信する需要が高まっている。さらに、電子化データを送信する場合には、通信の効率化のためにデータを圧縮して送信するのが一般的である。文書を電子化する際にスキャナで原稿を読み取って画像データが得られる。この画像データ全体に対して非可逆的な方式で圧縮すると、圧縮後のデータ量を小さくすれば文字が読めなくなり、文字を読める程度で圧縮すると圧縮後のデータ量が大きくなってしまう。このため、画像データを文字領域と背景領域とで異なる圧縮方式で圧縮する技術が知られている(たとえば、特許文献1)。この場合、文字領域は2値化した後に可逆的な方式で圧縮され、背景領域は非可逆的な方式で圧縮される。この技術によれば、圧縮率を高めても文字を判読できるように圧縮することができる。
一方、原稿に罫線が表されている場合には、罫線は輪郭が鮮明であることが望ましいため、画像データに含まれる罫線を文字と同様に2値化するのが好ましい。しかしながら、原稿をスキャナで読み取るときに原稿が傾かないように原稿をセットするのは困難であるため、原稿が傾いた状態で読み取られることが多い。このため、傾いて読み取られた罫線部分を2値化すると罫線のガタツキが強調されてしまう。罫線を背景と同様に非可逆圧縮すると、ガタツキは解消されるが罫線の輪郭がぼけてしまう。
特開2005−500709号公報
この発明は上述した問題点を解決するためになされたもので、この発明の目的の一つは、画像データを圧縮しても罫線のガタツキを目立たなくすることが可能な画像処理装置、画像圧縮方法および画像圧縮プログラムを提供することである。
この発明の他の目的は、復元された罫線のガタツキが目立たないように、画像データを圧縮したデータを記憶可能な圧縮画像のデータ構造を提供することである。
上述した目的を達成するためにこの発明のある局面によれば、画像処理装置は、画像データを入力する入力手段と、入力された画像データから罫線を含む罫線領域を抽出する罫線領域抽出手段と、罫線領域の画像データから罫線の中心画素を少なくとも含む罫線データを生成する第1生成手段と、罫線領域の画像データから罫線データを補間するための補間データを生成する第2生成手段と、罫線データおよび補間データそれぞれを圧縮して第1および第2圧縮データを生成する第1圧縮手段と、画像データから罫線領域を除いた領域を圧縮して第3圧縮データを生成する第2圧縮手段と、第1圧縮データと、第2圧縮データと、第3圧縮データとを結合して結合データを生成する結合手段と、を備える。
罫線は、直線、曲線、アンダーライン、枠、表、大きな文字の直線部分、斜線、破線を含む。この発明に従えば、罫線の中心画素を少なくとも含む罫線データが、補間データにより補間される。罫線データは、罫線の中心画素を含むので、データ量を削減することができるが、ガタツキが発生する確率が高い。このガタツキが補間データにより補間される。罫線領域の画像データをそのまま圧縮することなく、罫線の中心画素を含む罫線データと、それを補間するための補間データとに分けて圧縮するので、画像データを圧縮しても罫線のガタツキを目立たなくすることが可能な画像処理装置を提供することができる。
好ましくは、第1生成手段は、罫線領域の画像データに含まれる罫線を構成する画素のうちから明度が第1のしきい値以下の画素を抽出する第1抽出手段を含み、第2生成手段は、罫線領域の画像データに含まれる罫線を構成する画素のうちから明度が第1のしきい値を超える画素を抽出する第2抽出手段を含む、請求項1に記載の画像処理装置。
この発明に従えば、明度が第1しきい値以下の画素が罫線の中心画素として抽出され、明度が第1のしきい値を超える画素が罫線の中心画素を補間する画素として抽出される。このため、補間データは、罫線の中心画素の近傍の画素を含むことになり、罫線の中心画素をその近傍の画素で補間することができる。
好ましくは、第1抽出手段は、罫線領域の画像データを第1のしきい値で2値化して罫線データを生成する第1の2値化手段を含む。
この発明によれば、2値化するので罫線データのデータ量を削減することができる。
好ましくは、罫線データと画像データとから罫線データに含まれる罫線の第1罫線色を決定する第1罫線色決定手段をさらに備え、結合手段は、第1圧縮データと第1罫線色とを関連付ける罫線色関連付手段を含む。
この発明に従えば、罫線データと画像データとから決定される第1罫線色と、第1圧縮データとが関連付けられるので、罫線の中心画素を第1罫線色で復元することができる。
好ましくは、第2抽出手段は、罫線領域の画像データを第1のしきい値と第2のしきい値との内外で2値化して前記補間データを生成する第2の2値化手段を含む。
この発明によれば、2値化するので補間データのデータ量を削減することができる。
好ましくは、罫線データと画像データとから罫線データに含まれる罫線の第1罫線色を決定する第1罫線色決定手段と、補間データと画像データとから補間データに含まれる第2罫線色を決定する第2罫線色決定手段とをさらに備え、結合手段は、第1圧縮データと第1罫線色とを関連付け、第2圧縮データを第2罫線色と関連付ける罫線色関連付手段を含む。
この発明に従えば、罫線データと画像データとから決定された第1罫線色と、第1圧縮データとが関連付けられ、補間データと画像データとから決定された第2罫線色と第2圧縮データとが関連付けられるので、罫線の中心画素を第1罫線色で復元し、罫線の中心画素を補間する画素を第2罫線色で復元することができる。
好ましくは、第1生成手段は、罫線領域の画像データを2値化する2値化手段と、2値化されたデータを解像度の低い罫線データに変換する解像度変換手段とを含み、第2生成手段は、罫線領域の画像データを2値化する2値化手段と、2値化されたデータから前記罫線データに含まれる罫線成分を除去して補間データを生成する差分抽出手段とを含む。
この発明に従えば、罫線領域の画像データを2値化したデータを低解像度に変換して罫線データが生成され、罫線領域の画像データを2値化したデータから罫線データに含まれる罫線成分を除去して補間データが生成される。罫線データは解像度が小さくなるのでデータ量が削減されるが、罫線のガタツキが目立つようになる。補間データは、2値化したデータから罫線データに含まれる罫線成分が除去されるのでデータ量が削減される。罫線データと補間データとで、罫線領域の画像データの罫線の形状を復元することができる。その結果、画像データを圧縮しても罫線のガタツキを目立たなくすることが可能な画像処理装置を提供することができる。
好ましくは、罫線領域の画像データから色相および彩度の組が近似する罫線を集めて罫線領域の画像データを色相および彩度の組別に分割して複数の分割データを生成する分割手段をさらに備え、第1および第2生成手段それぞれは、複数の分割データが入力され、色相および彩度の組ごとに罫線データおよび補間データを抽出する。
この発明に従えば、カラーの画像データを圧縮率する場合であっても、罫線のガタツキを目立たなくすることができる。
この発明の他の局面によれば、画像圧縮方法は、画像データを入力するステップと、入力された画像データから罫線を含む罫線領域を抽出するステップと、罫線領域の画像データから罫線の中心画素を少なくとも含む罫線データを生成するステップと、罫線領域の画像データから罫線データを補間するための補間データを生成するステップと、罫線データおよび補間データそれぞれを圧縮して第1および第2圧縮データを生成するステップと、画像データから罫線領域を除いた領域を圧縮して第3圧縮データを生成するステップと、第1圧縮データと、第2圧縮データと、第3圧縮データとを結合して結合データを生成するステップとを含む。
この発明に従えば、画像データを圧縮しても罫線のガタツキを目立たなくすることが可能な画像圧縮方法を提供することができる。
この発明のさらに他の局面によれば、画像圧縮プログラムは、画像データを入力するステップと、入力された画像データから罫線を含む罫線領域を抽出するステップと、罫線領域の画像データから罫線の中心画素を少なくとも含む罫線データを生成するステップと、罫線領域の画像データから罫線データを補間するための補間データを生成するステップと、罫線データおよび補間データそれぞれを圧縮して第1および第2圧縮データを生成するステップと、画像データから罫線領域を除いた領域を圧縮して第3圧縮データを生成するステップと、第1圧縮データと、第2圧縮データと、第3圧縮データとを結合して結合データを生成するステップとを含む。
この発明に従えば、画像データを圧縮しても罫線のガタツキを目立たなくすることが可能な画像圧縮プログラムを提供することができる。
この発明のさらに他の局面によれば、圧縮画像のデータ構造は、画像データに含まれる罫線領域から罫線の中心画素を抽出し、該中心画素を少なくとも含む罫線データを圧縮した第1の圧縮データと、画像データに含まれる罫線領域から罫線データを補間するための補間データを生成し、該補間データを圧縮した第2の圧縮データと、画像データから罫線領域を除いた領域を圧縮した第3圧縮データとを含む。
この発明に従えば、復元された罫線のガタツキが目立たないように、画像データを圧縮したデータを記憶可能な圧縮画像のデータ構造を提供することができる。
以下、本発明の実施の形態について図面を参照して説明する。以下の説明では同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがってそれらについての詳細な説明は繰返さない。
<第1の実施の形態>
図1は、本発明の第1の実施の形態におけるMFPのハード構成を示すブロック図である。図1を参照して、MFP(Multi Function Peripheral)100は、スキャナ部103と、用紙などの記録媒体に画像を形成する画像形成部106と、それぞれがバス111に接続されたCPU(Central Processing Unit)101と、記憶部102と、スキャナ部103が出力する画像データを処理する入力画像処理部104と、画像データに出力するのに適した処理を行う出力画像処理部105と、ネットワークインターフェイス(I/F)107と、モデム108と、操作パネル109と、カードI/F110とを含む。
CPU101は、MFP100の全体を制御する。記憶部102は、ROM(Read Only Memory)、RAM(Random Access Memory)およびEEPROM(Electrically Erasable/Programable ROM)などの半導体メモリおよびハードディスクドライブ(HDD)等の磁気記憶装置を含む。CPU101は、ROMに記録された画像圧縮プログラムをRAMにロードして実行する。
スキャナ部103は、原稿台とCCD(Charge Coupled Device)等の光電変換素子とを含み、原稿台に載置された原稿を光学的に読取って電子データとしての画像データを入力画像処理部104に出力する。入力画像処理部104は、入力された画像データに対して、色変換処理、色補正処理などを実行して、処理した画像データを記憶部102に記憶する。
出力画像処理部105は、記憶部102から画像データを読み出して、スクリーン制御処理、スムージング処理、パルス幅変調(PWM)を行い、処理後の画像データを画像形成部106に出力する。画像形成部106は、レーザプリンタであり、出力画像処理部105から入力される画像データを紙などの記録媒体に可視化する。画像形成部106は、カラープリントの場合には、イエロー、マゼンタ、シアン、ブラックの4色のトナーで画像を形成する。画像形成部106は、インクジェットプリンタであってもよい。
カードI/F110には、ICカード110Aが装着される。CPU101は、カードI/F110を介してICカード110Aにアクセスが可能である。ネットワークI/F107は、MFP100をネットワーク112と接続する。ネットワークI/F107は、データを所定の通信プロトコルに従ってネットワークに出力し、ネットワーク112から所定の通信プロトコルに従ってデータを受信する。CPU101は、ネットワークI/F107を介してネットワーク112に接続された他のコンピュータと通信することが可能となる。このため、たとえば、電子メールを用いて画像データの送受信が可能である。
モデム108は、MFP100を電話回線113と接続する。モデム108は、データをファクシミリの通信プロトコルに従ってファクシミリ通信を可能とする。モデム108は、ファクシミリ受信されたデータを記憶部102のHDDに記憶する。また、モデム108は、電話回線113に接続されたコンピュータとの通信を可能とするためNCU(Network Control Unit)を含む。モデム108により他のコンピュータから受信されたデータは、記憶部102のHDDに記憶される。
操作パネル109は、入力部109Aと表示部109Bとを含む。入力部109Aは、MFP100のユーザによる操作の入力を受付けるためのタッチパネル、キーボードまたはマウス等の入力装置である。表示部109Bは、液晶表示装置または有機EL(Electro−Luminescence)ディスプレイパネルである。入力部109Aに透明な部材からなるタッチパネルを用いる場合には、表示部109B上にタッチパネルを重ねて設置することで、表示部109Bに表示されたボタンの指示を検出することができる。これにより、種々の操作の入力が可能となる。
なお、CPU101で実行する画像圧縮プログラムは、ROMに記憶されたものに限られず、EEPROMに記憶するようにしてもよい。EEPROMに記憶するようにすれば、画像圧縮プログラムを書き換えるまたは追加して書き込みすることが可能となる。このため、ネットワーク112に接続された他のコンピュータが、MPP100のEEPROMに記憶された画像圧縮プログラムを書換える、または、新たな画像圧縮プログラムを追加して書き込むことができる。さらに、MFP100が、ネットワーク112に接続された他のコンピュータから画像圧縮プログラムをダウンロードして、その画像圧縮プログラムをEEPROMに記憶することができる。さらに、画像圧縮プログラムをICカード110Aに記憶するようにし、カードI/F110に装着されたICカード110Aに記録された画像圧縮プログラムをRAMにロードして実行するようにしてもよい。
なお、画像圧縮プログラムを記憶する記録媒体としては、ICカード110Aに限られず、フレキシブルディスク、カセットテープ、光ディスク(CD−ROM(Compact Disc−ROM)/MO(Magnetic Optical Disc/MD(Mini Disc)/DVD(Digital Versatile Disc))、光カード、マスクROM、EPROM、EEPROMなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。
ここでいうプログラムは、CPU101により直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
図2は、第1の実施の形態におけるMFPの機能の概略を示す機能ブロック図である。図2を参照して、CPU101には、スキャナ部103で読み取られて出力される画像データ(イメージデータ)が入力画像処理部104で処理されて入力される。CPU101は、前処理部10と、前処理部10により処理された画像データが入力される領域判別部11と、領域判別部11が出力する文字領域の画像データが入力される文字2値化部12と、文字2値化部12に接続された可逆圧縮部13と、領域判別部11が出力する罫線領域の画像データが入力される罫線2値化部14と、罫線2値化部14に接続された可逆圧縮部15と、領域判別部11が出力する背景領域の画像データが入力される低解像度化部16と、低解像度化部16に接続された非可逆圧縮部17と、可逆圧縮部13,15および非可逆圧縮部17に接続された結合部18とを含む。
なお、CPU101に入力される画像データは、スキャナ部103が出力する画像データに限られず、他のコンピュータから受信される画像データであてもよい。この場合、画像データは、ネットワーク112または電話回線113を介して、または、ICカード110Aを介して入力される。
前処理部10は、入力される画像データに対して、画像形式の変換処理、解像度変換処理、下地除去処理を実行する。これらの処理は、画像データを領域判別部11で処理するのに適したデータとするための処理であり、これらの処理に限らず、これらの処理を実行しなくてもよいし、他の処理を実行するようにしてもよい。スキャナ部103の性能や、入力される画像データに応じて適宜組み合わせればよい。
領域判別部11は、前処理された画像データが入力される。ここで入力される画像データは、1画素が24ビットの3つのRGBプレーンを有するフルカラーの画像データである。領域判別部11は、フルカラーの画像データを1画素が8ビットの明度プレーンを有する画像データに変換する。以下単に画像データというときは明度プレーンを有する画像データを示し、RGBプレーンを有するフルカラーの画像データを「RGB画像データ」という。
領域判別部11は、画像データから図、写真、下地の各領域を抽出する。図、写真および下地の領域は、背景領域として低解像度化部16に出力される。また、画像データからエッジ画像を生成し、エッジ画像から罫線を含む罫線領域を抽出する。罫線は、直線、曲線、アンダーライン、枠、表、大きな文字の直線部分、斜線、破線を含む。罫線領域は罫線2値化部14に出力される。そして、エッジ画像から罫線領域を除いたものから文字ブロックを検出する。さらに検出された文字ブロックのRGB画像データの画素値から文字の色を算出する。複数の文字ブロックのブロック間の距離と算出した文字色の差から近傍で似た色の文字ブロックを統合して文字領域とする。文字ブロックの数を減らすことで、データ量を削減することができるからである。そして文字領域を文字2値化部12に出力する。
文字2値化部12は、文字領域と画像データとが入力される。文字2値化部12は、画像データの文字領域を2値化する。そして、文字領域で文字とされた画素のRGB画像データにおける画素値から文字領域の色を決定する。RGB画像データの文字とされた画素のRGB各色の平均値または中央値をその文字領域の色に決定する。文字2値化部12は、文字領域の2値化データを可逆圧縮部13に出力し、その文字領域の色を結合部18に出力する。可逆圧縮部13は、文字2値化部12から入力される2値化データを可逆圧縮する。ここでは、可逆圧縮方式としてMMR(Modified
Modified Read)符号化を用いている。可逆圧縮部13は、2値化データを可逆圧縮して得られる第3圧縮データを結合部18に出力する。
罫線2値化部14には、罫線領域と画像データとRGB画像データとが入力される。罫線2値化部14は、入力される複数の罫線領域の色相および彩度をRGB画像データから求め、色相および彩度が近似する罫線領域を集めて統合した分割データを生成する。これにより、色相および彩度の組の数の分割データが生成される。罫線2値化部14は、複数の分割データそれぞれについて、分割データに含まれる複数の罫線領域それぞれの画像データから罫線の中心画素を少なくとも含む罫線2値化データと、罫線データを補間するための補間2値化データとを生成し、可逆圧縮部15に出力する。罫線2値化部14は、罫線2値化データで特定されるRGB画像データの画素値から第1罫線色を決定して結合部18に出力し、補間2値化罫線データで特定されるRGB画像データの画素値から第2罫線色を決定して結合部18に出力する。
可逆圧縮部15は、罫線2値化データと補間2値化データとが入力される。罫線2値化データと補間2値化データとは、色相および彩度の組ごと(分割データごと)に入力される。可逆圧縮部15は、色相および彩度の組ごとに入力される罫線2値化データを可逆圧縮して得られる第1圧縮データを結合部18に出力し、色相および彩度の組ごとに入力される補間2値化データを可逆圧縮して得られる第2圧縮データを結合部18に出力する。
低解像度化部16は、背景領域とRGB画像データとが入力され、RGB画像データの背景領域について解像度を低減する。解像度を低くすることによりデータ量を減少して圧縮効率を高めるためである。低解像度化部16は、解像度を低下させたRGB画像データの背景領域を非可逆圧縮部17に出力する。非可逆圧縮部17は、低解像度化部16から入力される解像度を低下させた背景領域のRGB画像データを非可逆圧縮する。ここでは、非可逆圧縮方式としてJPEG(Joint Photographic Experts Group)符号化を用いている。なお、非可逆的な圧縮方式であればJPEG以外を用いてもよい。
結合部18は、可逆圧縮部13から第3圧縮データが、可逆圧縮部15から第1および第2圧縮データが、非可逆圧縮部17から第4圧縮データが、文字2値化部12から文字領域の色が、罫線2値化部14から第1罫線色および第2罫線色とが入力される。結合部18は、第1圧縮データと第1罫線色とを関連付けた第1関連データと、第2圧縮データと第2罫線色とを関連付けた第2関連データと、第3圧縮データと文字領域の色とを関連付けた第3関連データと、第1〜第4圧縮データとを結合して結合圧縮データを生成して出力する。出力は、記憶部102またはICカード110Aへの記憶、ネットワークI/F107またはモデム108から他のコンピュータへの送信のいずれであってもよい。結合データは、PDF(Portable Document Format)のフォーマットであってもよい。
図3は、第1の実施の形態における罫線2値化部の詳細な機能を示す機能ブロック図である。図3を参照して、罫線2値化部14は、罫線領域の画像データを第1のしきい値で2値化して罫線2値化データを抽出する第1の2値化部21と、罫線領域の画像データを第1および第2のしきい値の内外で2値化して補間2値化データを抽出する第2の2値化部23と、罫線2値化データで特定されるRGB画像データの画素値から第1罫線色を決定する第1罫線色決定部22と、補間2値化データで特定されるRGB画像データの画素値から第2罫線色を決定する第2罫線色決定部24とを含む。
ここでは、色相および彩度の組で特定される1つの分割データについて、その分割データに含まれる罫線領域が入力される場合について説明する。実際には、分割データが複数ある場合には、複数の分割データそれぞれについて罫線2値化データおよび補間2値化データが生成され、罫線2値化データに対応する第1罫線色および補間2値化データに対応する第2罫線色が決定される。換言すれば、罫線2値化部14では、色相と彩度の組ごとに、罫線2値化データおよび補間2値化データが生成され、罫線2値化データに対応する第1罫線色および補間2値化データに対応する第2罫線色が決定される。
ここで、第1のしきい値と第2のしきい値の決定について説明する。図4は、画像データの罫線領域近傍における明度のヒストグラムを示す図である。図4を参照して、横軸は図面右側から左側方向に明度が低くなる次元を示す。縦軸は、画素数を示す。ヒストグラムの左側(明度の低い側)の山が罫線部分に相当し、右側(明度の高い側)の山が背景領域に相当する。左側の山のピークより明度の高い位置に第1のしきい値が設定される。この第1のしきい値よりも明度の低い画素は、罫線の濃度の濃い部分、換言すれば罫線の中心付近の画素に相当する。第2のしきい値は、第1のしきい値よりも明度が高い。第1しきい値と第2しきい値との間の明度の画素は、主に罫線の濃度の薄い部分の画素、換言すれば罫線のエッジ付近の画像に相当する。
第1のしきい値および第2のしきい値は、罫線領域のヒストグラムから次の手順で決定される。
(1)ヒストグラムのノイズを取るために、明度の階調数を256階調から64階調に削減する。
(2)ヒストグラムの罫線領域のピーク値を求める。
(3)ヒストグラムの画素数のピーク値の10%の画素数に当たる2つの明度のうちピーク値の明度よりも高い明度を第2のしきい値に決定する。
(4)罫線領域の第2しきい値以上の明度の画素の数の上位70%の画素を含むことのできる明度を第1のしきい値に決定する。
なお、第1しきい値と第2しきい値とを定めるパラメータは、ヒストグラムの形状や処理の対象となる画素数等に応じて適切に変更するようにしてもよい。
図3に戻って、第1の2値化部21は、罫線領域の画像データを第1のしきい値で2値化して罫線2値化データを生成する。換言すれば、第1の2値化部21は、罫線領域の画像データの画素のうち明度が第1のしきい値以下の画素を「1」とし、他を「0」とする罫線2値化データを生成する。罫線2値化データは、罫線領域の画像データにおける罫線の中心付近の画素を「1」とし、他を「0」とした2値のデータとなる。このため、罫線領域の画像データが傾いた罫線を含んでいる場合、または曲線である場合には、直線にならないのでガタツキが目立つ罫線となる。
第1罫線色決定部22には、RGB画像データと罫線2値化データとが入力される。第1罫線色決定部22は、罫線2値化データで画素値が「1」とされる画素に対応するRGB画像データの画素のRGB値それぞれの平均値または中央値を第1罫線色として決定する。この第1罫線色は、罫線2値化データで画素値「1」とされた画素の罫線色とされる。第1罫線色決定部22は、第1罫線色を結合部18に出力する。
第2の2値化部23は、罫線領域の画像データを第1および第2のしきい値の内外で2値化して補間2値化データを生成する。換言すれば、第2の2値化部23は、罫線領域の画像データの画素のうち明度が第1しきい値より高く第2のしきい値以下の画素を「1」とし、他を「0」とした補間2値化データを生成する。このため、補間2値化データは、罫線領域の画像データでは、罫線のエッジ付近の明度の高い画素を「1」とし、他を「0」とした2値のデータである。このような画素は、第1の2値化部21で2値化された罫線のガタツキ部分の近傍に存在することが多い。
第2罫線色決定部24には、RGB画像データと、補間2値化データとが入力される。第2罫線色決定部24は、補間2値化データで画素値が「1」とされる画素に対応するRGB画像データの画素のRGB値それぞれの平均値または中央値を第2罫線色として決定する。この第2罫線色は、補間2値化データで画素値「1」とされた画素の罫線色とされる。第2罫線色決定部24は、第2罫線色を結合部18に出力する。
図5は、罫線2値化データと補間2値化データの関係を示す図である。図5(A)は、罫線2値化データを示し、図5(B)は、罫線2値化データおよび補間2値化データを示す。図5(A)を参照して、原稿が傾いてスキャナで読み取られた場合に、罫線がスキャナの主走査方向に垂直または平行とならない。罫線2値化データは、画像データで罫線の中心付近に相当する画素を「1」としたデータであるので、図に示すように直線とはならず、2つの直線が重なる部分でカタツキが存在する。
図5(B)を参照して、罫線2値化データに含まれる罫線を細かいハッチングで示し、補間2値化データに含まれる罫線を粗いハッチングで示している。罫線2値化データに含まれる罫線のガタツキ部分の近傍に補間2値化データに含まれる罫線が位置する。補間2値化データに含まれる罫線の明度は、罫線2値化データに含まれる罫線の明度より高いので、ガタツキ部分が補間2値化データに含まれる罫線によって見た目上緩和される。
図6は、MFPで実行される領域別圧縮処理の流れを示すフローチャートである。図6を参照して、領域別圧縮処理では、まず、RGB画像データが入力されるまで待機状態となっており(ステップS01でNO)、RGB画像データが入力されるとステップS02に進む。ステップS02では、RGB画像データの各画素の明度を算出して、RGB画像データを1画素が8ビットの明度プレーンを有する画像データに変換する。明度を算出して画像データに変換するのは、以降に実行される領域判別処理において、判別精度を向上させるため、および演算負荷を低減させるために、明度を処理するからである。
次のステップS03では、画像データをスムージングする。これにより画像データからノイズが除去されて、誤検出を低減することができる。そして、写真ブロックが検出される(ステップS04)。写真ブロックの検出は、画像データを2値化して、2値化したデータをラベリング処理することにより、画像データ中に含まれる矩形の写真ブロックの位置が検出される。写真ブロックを矩形とするのは、以降に実行される写真判定処理が、矩形毎に判定するからである。
次のステップS05では、写真ブロック内の画像の特性に応じて、写真ブロックが図領域、写真領域、下地領域、その他の領域のいずれであるかを判定する。ステップS05における判定結果は、文字と罫線の判別に利用される。たとえば、写真領域にある文字または罫線を文字または罫線と判定するために、白地上の文字または罫線の判定で用いるしきい値と異なるしきい値を用いる必要があるからである。また、罫線分離処理では、画像全体の罫線を検出する他、図領域と判別された領域に特化した罫線検出を行うことに利用できるからである。
そして、次の写真ブロックが存在するか否かが判断され(ステップS06)、存在する場合にはステップS05に戻り、存在しない場合にはステップS07に進む。
次のステップS07およびステップS08では、ステップS02およびステップS03と同様にRGB画像データが明度プレーンを有する画像データに変換されて、スムージングされる。そして、スムージングされた画像データからエッジが抽出される(ステップS09)。エッジの抽出は、たとえば、画像データに一次微分フィルタまたは二次部分フィルタを用いてフィルタ処理して、エッジ画像を生成することにより行われる。写真領域のように明度を2値化したデータを用いずに、エッジを抽出するのは、明度の高い領域の文字や反転文字を検出するためである。
そして、エッジ画像を用いて罫線を抽出する。罫線の抽出は、画像の全体に対して行う他、ステップS05で図領域と判定された領域のみ、および写真領域と判定された領域のみに対しても行われる。画像全体から罫線を抽出することで、文字を修飾するアンダーライン等を抽出することができる。また、図属性または写真領域と判定された領域から罫線を正確に抽出することができる。さらに、縦横の連続性を考慮して罫線を検出することができる。
ここで、罫線分離処理について詳細に説明する。図7は、図6のステップS10で実行される罫線分離処理の流れを示すフローチャートである。図7を参照して、まず、画像データの傾きが検出される(ステップS41)。この傾き検出のため、まずエッジ画像を低解像度化する。処理速度と検出精度に応じて、適切な解像度に縮小される。そして、傾き検出領域を抽出する。傾き検出は、文字の多い領域で精度が高くなるため、エッジの多い領域を検出領域として抽出する。検出領域において、ラインごとにエッジ画素のヒストグラムを作成する。検出領域を回転させていき、それぞれの回転角においてヒストグラムを作成する。そして、ヒストグラムの形状が原稿の傾がない場合の形状となったときの回転角を傾き角度として検出する。
次のステップS42では、ステップS41で検出した傾き角だけエッジ画像を回転させる。そして、罫線を検出する(ステップS43)。罫線の検出は、まず、回転させたエッジ画像の行方向のヒストグラムを作成し、ヒストグラムの形状およびピーク値をしきい値と比較し、所定の条件を満たせばピーク値の行を罫線領域として検出する。検出された罫線領域は、エッジ画像から分離される。ピーク値の行が複数あれば、複数が罫線領域として検出される。次に列方向のヒストグラムを作成する。そして、ピーク値の列を罫線領域として分離する。ピーク値の列が複数あれば、複数が分離される。検出された罫線領域は、エッジ画像から分離される。そして、検出した罫線領域および罫線領域が分離されたエッジ画像を、ステップS42で回転させたのと逆方向に同じ角度だけ回転させる。
図6に戻って、ステップS11では、罫線が分離されたエッジ画像から文字ブロックが検出される。エッジ画像をラベリングすることにより単語1つ程度の大きさの文字ブロックを検出する。文字ブロックを単語1つ程度の大きさとすることにより、処理時間を低減して、文字の判定制度を向上させることができる。なお、文字ブロックの大きさは、これに限られず、これより大きいたとえば1ライン程度の大きさとしてもよいし、これより小さいたとえば1文字程度の大きさとしてもよい。
そして、文字ブロックが文字特性を有するか否かを、文字ブロックの画像データを用いて判定する(ステップS12)。すなわち、画像データにおける文字ブロックに含まれる画素の明度を用いて文字特性を有するか否かが判定される。文字特性を有するとされた文字ブロックは、文字領域とされ、そうでなければ文字ブロックは文字領域とされない。
次のステップS13では、文字領域の画像データに網点除去処理を行う。文字領域の背景に網点が存在する場合、網点は2値化されるとノイズとなるため、網点が2値化されるのを防ぐためである。次のステップS14では、文字領域の画像データを2値化する(ステップS14)。これにより、文字と背景とが分離され、データ量が削減される。2値化により文字とされた画素は「1」とされ、背景とされた画素は「0」となる。
そして、文字色が決定される(ステップS15)。文字色の決定は、文字領域ごとに決定され、文字領域に対して1色が決定される。具体的には、文字領域における文字とされた画素のRGB画像データにおける画素値の平均値または中央値が、文字領域の文字の色とされる。複数の文字領域の文字領域間の距離と、決定した文字色の差とから、近傍でかつ類似する色の文字領域を統合して、文字領域の数が削減される。これにより、データ量が削減される。
そして、次に処理対象とする文字ブロックの有無が判断され(ステップS16)、そのような文字ブロックが有ればステップS12に戻り、なければステップS17に進む。ステップS17では、画像データ全体からステップS12で文字と判定された文字領域とステップS10で抽出された罫線領域とを除いた領域を背景領域とし、RGB画像データから背景領域を抽出した背景領域の画像データ(背景領域データ)が生成される。そして、背景領域データが低解像度に変換され(ステップS18)、非可逆圧縮方式で圧縮される(ステップS19)。これにより、第4圧縮データが生成される。ここでは、JPEG方式で圧縮される。
ステップS20では、近似する色の文字領域を統合した文字領域データが生成される(ステップS20)。統合された文字領域データは、全て同じ色とされる。同じ色は、文字とされた画素のRGB値の平均または中央値とすればよい。ここでは、黒色、赤色、青色および緑色それぞれの色の文字領域データが生成されるものとする。そして、色別に生成された文字領域データを可逆圧縮する(ステップS21)。これにより、色別の第3圧縮データが生成される。ここでは、黒色の文字領域を圧縮した第3圧縮データと、赤色の文字領域を圧縮した第3圧縮データと、青色の文字領域を圧縮した第3圧縮データと、緑色の文字領域を圧縮した第3圧縮データとが生成される。
次のステップS22では、同色の罫線が統合される(ステップS22)。ステップS13で検出された罫線領域に含まれる画素のRGB値から、各罫線領域の色相および彩度の組が決定される。そして、色相および彩度の組が近似する罫線領域を統合するのである。これにより、色相および彩度の組別に罫線領域が特定される。ここでは、説明のため罫線領域の色相および彩度の組が黒、赤、緑、青の4色である場合を例に説明する。なお、ここでは、色相および彩度の組別に罫線領域を特定するようにしたが、ステップS10で分離された罫線ごとにステップS23からステップS28の処理を実行するようにしてもよい。
ステップS23からS28は、色相および彩度の組別に統合された罫線領域のうち、色相および彩度の組が同じ罫線領域の全てに対して行われる。ステップS23では、罫線領域の画像データを第1のしきい値で2値化する。これにより罫線2値化データが生成される。罫線2値化データは、罫線領域の画像データのうち第1のしきい値よりも明度が低い画素を「1」とし、そうでない画素を「0」としたデータである。罫線2値化データにおいて、画素値「1」の画素は、罫線であることを示す。そして、生成された罫線2値化データが可逆圧縮される(ステップS24)。これにより、罫線2値化データを可逆圧縮した第1圧縮データが生成される。そして、罫線2値化データで特定されるRGB画像データの画素値から第1罫線色が決定される(ステップS25)。第1罫線色は、たとえば、罫線2値化データで画素値が「1」とされる画素に対応するRGB画像データの画素のRGB値それぞれの平均値または中央値である。
ステップS26では、罫線領域の画像データを第1のしきい値および第2しきい値の内外で2値化する。これにより補間2値化データが生成される。補間2値化データは、罫線領域の画像データのうち第1しきい値より高く第2のしきい値以下の画素を「1」とし、そうでない画素を「0」としたデータである。補間2値化データにおいて、画素値「1」の画素は、罫線であることを示す。そして、生成された補間2値化データが可逆圧縮される(ステップS27)。これにより、補間2値化データを可逆圧縮した第2圧縮データが生成される。そして、補間2値化データで特定されるRGB画像データの画素値から第2罫線色が決定される(ステップS25)。第2罫線色は、たとえば、補間2値化データで画素値が「1」とされる画素に対応するRGB画像データの画素のRGB値それぞれの平均値または中央値である。
次のステップS29では、未処理の色相および彩度の組の罫線領域が存在するか否かが判断される。そのような罫線領域が存在する場合にはステップS23に戻り、存在しなければステップS30に進む。これにより、ステップS22で色相および彩度の組別に統合された罫線領域の全てについて、ステップS23からS28までの処理が実行される。したがって、罫線2値化データおよび補間2値化データは、色相および彩度の組別に罫線領域を統合した分割データの数だけ生成されて可逆圧縮される。換言すれば、第1圧縮データおよび第2圧縮データは、色相および彩度の組別に生成される。ここでは、色相と彩度の組を、黒、赤、緑、青としたので、これら4つの組の分割データそれぞれに対して、第1圧縮データと第1罫線色、第2圧縮データと第2罫線色が求められる。
ステップS30では、色相および彩度の組別の第1圧縮データ、色相および彩度の組別の第2圧縮データ、色別の第3圧縮データおよび第4圧縮データを統合して1つのデータとする。この際、第1圧縮データと第1罫線色とを関連付けた関連データと、第2圧縮データと第2罫線色とを関連付けた関連データと、第3圧縮データと文字領域の色とを関連付けた関連データとが併せて結合される。ここでは、色相および彩度の組が黒、赤、緑および青それぞれので、第1圧縮データおよび第2圧縮データが生成されるので、色相および彩度の組が黒、赤、緑および青それぞれで、第1圧縮データと第1罫線色とを関連つけた関連データと、第2圧縮データと第2罫線色とを関連付けた関連データとが記憶され、さらに、黒の色と第3圧縮データとを関連付けた関連データと、赤の色と第3圧縮データとを関連付けた関連データと、青の色と第3圧縮データとを関連付けた関連データと、緑の色と第3圧縮データとを関連付けた関連データとが記憶される。
図8は、結合データのデータ構造を示す図である。図8を参照して、結合データは、ヘッダと、ボディと、相互参照表と、トレーラとを含む。ボディは、作成日付などを含む文字情報と、第1ページ〜最終ページそれぞれのデータブロックと、各ページに対応する子ページ辞書と、親ページ辞書と、カタログ辞書とを含む。
第1ページ〜最終ページのデータブロックそれぞれは、背景領域を圧縮した第4圧縮データと、黒色の文字領域を圧縮した第3圧縮データと、赤色の文字領域を圧縮した第3圧縮データと、青色の文字領域を圧縮した第3圧縮データと、緑色の文字領域を圧縮した第3圧縮データと、色相および彩度の組が黒のうち第1罫線色(濃い黒)の第1圧縮データと、色相および彩度の組が黒のうち第2罫線色(薄い黒)の第2圧縮データと、色相および彩度の組が赤のうち第1罫線色(濃い赤)の第1圧縮データと、色相および彩度の組が赤のうち第2罫線色(薄い赤)の第2圧縮データと、色相および彩度の組が緑のうち第1罫線色(濃い緑)の第1圧縮データと、色相および彩度の組が緑のうち第2罫線色(薄い緑)の第2圧縮データと、色相および彩度の組が青のうち第1罫線色(濃い青)の第1圧縮データと、色相および彩度の組が青のうち第2罫線色(薄い青)の第2圧縮データと、レイヤ情報とを含む。レイヤ情報は、色相および彩度の組が黒、赤、緑および青それぞれについて第1罫線色と第1圧縮データとを関連付けた4つの関連データと、色相および彩度の組が黒、赤、緑および青それぞれについて第2罫線色と第2圧縮データとを関連付けた4つの関連データとを含み、さらに、黒の色と第3圧縮データとを関連付けた関連データと、赤の色と第3圧縮データとを関連付けた関連データと、青の色と第3圧縮データとを関連付けた関連データと、緑の色と第3圧縮データとを関連付けた関連データとを含む。
図9は、罫線2値化データと補間2値化データの関係を示す別の図である。図9(A)は、罫線2値化データを示し、図9(B)は、罫線2値化データおよび補間2値化データを示す。図9(A)を参照して原稿に曲線の罫線が含まれている場合、罫線がスキャナの主走査方向に垂直または平行とならない。罫線2値化データは、画像データで罫線の中心付近に相当する画素を「1」としたデータであるので、図に示すように曲線が複数の短い直線の集合となり、直線の接する部分でカタツキが存在する。
図9(B)を参照して、罫線2値化データに含まれる罫線を細かいハッチングで示し、補間2値化データに含まれる罫線を粗いハッチングで示している。罫線2値化データに含まれる罫線のガタツキ部分の近傍に補間2値化データに含まれる罫線が位置する。補間2値化データに含まれる罫線の明度は、罫線2値化データに含まれる罫線の明度より高いので、ガタツキ部分が補間2値化データに含まれる罫線によって見た目上緩和される。
以上説明したように第1の実施の形態におけるMFPは、RGB画像データ中の罫線領域を色相および彩度の組別に第1罫線色の罫線2値化データと、第1罫線色よりも明度の高い第2罫線色の補間2値化データとに分割して圧縮する。第1罫線色の罫線2値化データのデータ量を削減することにより発生する罫線のガタツキが、第2罫線色の補間2値化データで補間される。このため、画像データを圧縮しても罫線のガタツキを目立たなくすることができる。
<第2の実施の形態>
次に第2の実施の形態における画像処理装置について説明する。第2の実施の形態における画像処理装置のハード構成は第1の実施の形態における画像処理装置のそれと同じなので、ここでは説明を繰り返さない。第2の実施の形態における画像処理装置は、罫線を低解像度化して圧縮する際に発生する罫線のガタツキを目立たなくするようにする。
図10は、第2の実施の形態におけるMFPの機能の概略を示す機能ブロック図である。図10を参照して、図2と異なる点は、罫線2値化部14Aである。その他の機能は図2に示したのと同じなのでここでは説明を繰り返さない。
図11は、第2の実施の形態における罫線2値化部の詳細な機能を示す機能ブロック図である。図11を参照して、第2の実施の形態における罫線2値化部14Aは、罫線領域と画像データとが入力され、罫線領域の画像データを2値化する2値化部31と、2値化されたデータとRGB画像データとが入力され、2値化されたデータで特定されるRGB画像データの画素値から罫線色を決定する罫線色決定部34と、2値化されたデータを低い解像度に変換して罫線2値化データを出力する解像度変換部32と、2値化されたデータと罫線2値化データとが入力され、2値化されたデータから罫線2値化データの罫線成分を除去して補間2値化データを出力する差分抽出部33とを含む。
2値化部31は、罫線領域と画像データとが入力され、罫線領域の画像データを2値化する。画像データは、高解像度のデータであり、ここでは600dpi(dot per inch)としている。罫線領域は、300dpiであるので、罫線領域を600dpiに解像度変換して、罫線領域の画像データが特定される。罫線色決定部34は、2値化されたデータで画素値が「1」とされる画素(罫線)に対応するRGB画像データの画素のRGB値それぞれの平均値または中央値を第1罫線色として決定する。この罫線色は、罫線2値化データで画素値「1」とされた画素の罫線色とされるとともに、補間2値化データで画素値「1」とされた画素の罫線色とされる。罫線色決定部34は、罫線色を結合部18に出力する。
解像度変換部32は、2値化された罫線領域の画像データが入力され、2値化されたデータを低解像度に変換して罫線2値化データを可逆圧縮部15に出力する。ここでは罫線2値化データを300dpiとしている。差分抽出部33は、罫線領域の画像データを2値化したデータと、罫線2値化データの解像度を元に戻したデータとが入力され、罫線領域の画像データを2値化したデータと罫線2値化データの解像度を元に戻したデータとの差分を補間2値化データとして出力する。換言すれば、罫線領域の画像データを2値化したデータのうちから罫線2値化データで罫線とされた成分を除去した補間2値化データを抽出する。
罫線領域の画像データを2値化したデータは解像度が画像データと同じ600dpiであるが、罫線2値化データは、解像度変換部32で300dpiに変換される。一方、補間2値化データは、画像データを2値化したデータ(600dpi)から罫線2値化データ(300dpi)の解像度を元に戻したデータ(600dpi)との差分とされる。このため、補間2値化データは、画像データと同じ600dpiの解像度のままである。すなわち、補間2値化データは、罫線領域に含まれる罫線のうち解像度変換部32で低解像度化することにより削除されてしまった罫線部分のみを含むことになる。
なお、解像度は例示的に示したもので、これに限られることはない。また、差分抽出部33は、ここでは解像度変換部32により縦横それぞれが1/2に低解像度化されるので、罫線領域の画像データを2値化したデータのうち縦横2×2のサイズの領域の画素が全て「1」となる画素の画素値を「0」とするようにしてもよい。また、ここでは、罫線2値化データを、罫線領域の画像データを2値化してから低解像度化しているが、罫線領域の画像データを低解像度化してから2値化するようにしてもよい。
図10に戻って、結合部18には、可逆圧縮部15から第1圧縮データと第2圧縮データとが入力され、罫線2値化部14Aから罫線色が入力される。結合部18は、第1圧縮データと罫線色とを関連付けた関連データ、および第2圧縮データと罫線色とを関連付けた関連データを生成して、レイヤ情報として結合圧縮データに含める。
図12は、第2の実施の形態におけるMFPで実行される領域別圧縮処理の流れを示すフローチャートである。第2の実施の形態における画像処理装置では、図6に示した領域別圧縮処理と同様の処理が実行されるが、ステップS23からステップS28の処理が異なり、これらに代えてステップS41〜S46が実行される。図12を参照して、ステップS41〜S46は、色相および彩度の組別に統合された罫線領域のうち、色相および彩度の組が同じ罫線領域の全てに対して行われる。ステップS41では、罫線領域の画像データを所定のしきい値で2値化する。ここでは、罫線領域は解像度が300dpiであり、画像データは解像度が600dpiの高解像度であるので、罫線領域を600dpiに解像度変換して、罫線領域の画像データが特定される。罫線領域の画像データを2値化したデータは、罫線領域の画像データのうち所定のしきい値よりも明度が低い画素を「1」とし、そうでない画素を「0」としたデータである。2値化されたデータにおいて、画素値「1」の画素は、高解像度の画像データにおいて罫線であることを示す。そして、2値化されたデータで特定されるRGB画像データの画素値から罫線色が決定される(ステップS42)。罫線色は、たとえば、2値化されたデータで画素値が「1」とされる画素に対応するRGB画像データの画素のRGB値それぞれの平均値または中央値である。
そして、罫線2値化データが生成される(ステップS43)。罫線2値化データは、2値化されたデータを低解像度に変換することにより生成される。ここでは罫線2値化データの解像度を300dpiとしている。生成された罫線2値化データが可逆圧縮される(ステップS44)。これにより、罫線2値化データを可逆圧縮した第1圧縮データが生成される。次に、補間2値化データが生成される(ステップS45)。補間2値化データは、ステップS41で2値化されたデータと、罫線2値化データの解像度を元に戻したデータとの差分である。換言すれば、ステップS41で2値化されたデータのうちから罫線2値化データで罫線とされた成分を除去したものを補間2値化データとする。補間2値化データは、画像データと同じ600dpiの解像度のままであり、罫線領域に含まれる罫線のうち低解像度の罫線2値化データに含めることのできない罫線部分のみを含むことになる。そして、生成された補間2値化データが可逆圧縮される(ステップS46)。これにより、補間2値化データを可逆圧縮した第2圧縮データが生成される。
図13は、罫線2値化データと補間2値化データの関係を示すさらに別の図である。図13(A)は、画像データの罫線部分を示す図であり、図13(B)は罫線2値化データを示し、図13(C)は、補間2値化データを示す。図13(A)を参照して、罫線2値化データは、画像データの解像度を縦横1/2に低解像度化したデータを2値化したデータである。画像データを低解像度化することにより画像データの罫線の一部が失われ、罫線の形状が変形していることがわかる。この罫線2値化データを復元しても、画像データに存在した罫線と同じ形状にはならない。図13(C)を参照して、補間2値化データは、罫線2値化データを生成するために画像データを低解像度化することにより画像データから失われた画素を「1」とし、他を「0」とするデータである。このため、罫線2値化データを復元したものと、補間2値化データを復元したものとを合成すれば、図13(A)に示した罫線の形状となることがわかる。このため、画像データの罫線領域を2値化したのと同じ結果が得られる。罫線2値化データは、解像度を縦横1/2に低解像度化しているのでデータ量が少なくなっている。このため、罫線2値化データと補間2値化データとは、画像データの罫線領域を2値化したものと比較して、データ量は少なくなる。
第2の実施の形態におけるMFP100によれば、RGB画像データ中の罫線領域から、色別に、罫線領域の画像データを低解像度化したデータを2値化した罫線2値化データと、罫線領域の画像データを2値化したデータから罫線データに含まれる罫線成分を除去した補間2値化データとに分割して圧縮する。罫線領域の画像データを低解像度化することによりデータ量が削減される。また、一方で罫線の形状のガタツキが目立つようになるが、補間2値化データにより罫線のガタツキが緩和される。補間2値化データは、罫線領域の画像データを2値化したデータから罫線データに含まれる罫線成分を除去したデータなので、データ量が削減される。このため、罫線領域の画像データを復元することができ、画像データを圧縮しても罫線のガタツキを目立たなくすることができる。
なお、本実施の形態においては、画像処理装置の一例としてMFPを例に説明したが、MFPに限らず、画像データを処理可能な装置であればよく、たとえばコンピュータであってもよい。また、本実施の形態においては、MFPを例に説明したが、図6および図7に示した圧縮処理をコンピュータに実行させるための画像圧縮方法、および画像圧縮プログラムとして発明を捕らえることができるのは言うまでもない。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
<付記>
(1)前記第1圧縮手段は、可逆圧縮方式で圧縮する、請求項1に記載の画像処理装置。
(2)(1)において、前記第2圧縮手段は、非可逆圧縮方式で圧縮する。
(3) 前記入力手段は、原稿を読み取って得られる画像データを出力する読み取り手段を含む、請求項1に記載の画像処理装置。
本発明の第1の実施の形態におけるMFPのハード構成を示すブロック図である。 第1の実施の形態におけるMFPの機能の概略を示す機能ブロック図である。 第1の実施の形態における罫線2値化部の詳細な機能を示す機能ブロック図である。 画像データの罫線領域近傍における明度のヒストグラムを示す図である。 罫線2値化データと補間2値化データの関係を示す図である。 MFPで実行される領域別圧縮処理の流れを示すフローチャートである。 図6のステップS13で実行される罫線分離処理の流れを示すフローチャートである。 結合データのデータ構造を示す図である。 罫線2値化データと補間2値化データの関係を示す別の図である。 第2の実施の形態におけるMFPの機能の概略を示す機能ブロック図である。 第2の実施の形態における罫線2値化部の詳細な機能を示す機能ブロック図である。 第2の実施の形態におけるMFPで実行される領域別圧縮処理の流れを示すフローチャートである。 罫線2値化データと補間2値化データの関係を示すさらに別の図である。
符号の説明
10 前処理部、11 領域判別部、12 文字値化部、13,15 可逆圧縮部、14,14A 罫線2値化部、16 低解像度化部、17 非可逆圧縮部、18 結合部、21 第1の2値化部、22 第1罫線色決定部、23 第2の値化部、24 第2罫線色決定部、31 2値化部、32 解像度変換部、33 差分抽出部、34 罫線色決定部、102 記憶部、103 スキャナ部、104 入力画像処理部、105 出力画像処理部、106 画像形成部、107 ネットワークI/F、108 モデム、109 操作パネル、109A 入力部、109B 表示部、110 カードI/F、110A ICカード、111 バス、112 ネットワーク、113 電話回線。

Claims (11)

  1. 画像データを入力する入力手段と、
    前記入力された画像データから罫線を含む罫線領域を抽出する罫線領域抽出手段と、
    前記罫線領域の画像データから罫線の中心画素を少なくとも含む罫線データを生成する第1生成手段と、
    前記罫線領域の画像データから前記罫線データを補間するための補間データを生成する第2生成手段と、
    前記罫線データおよび前記補間データそれぞれを圧縮して第1および第2圧縮データを生成する第1圧縮手段と、
    前記画像データから前記罫線領域を除いた領域を圧縮して第3圧縮データを生成する第2圧縮手段と、
    前記第1圧縮データと、前記第2圧縮データと、前記第3圧縮データとを結合して結合データを生成する結合手段と、を備えた画像処理装置。
  2. 前記第1生成手段は、前記罫線領域の画像データに含まれる罫線を構成する画素のうちから明度が第1のしきい値以下の画素を抽出する第1抽出手段を含み、
    前記第2生成手段は、前記罫線領域の画像データに含まれる罫線を構成する画素のうちから明度が前記第1のしきい値を超える画素を抽出する第2抽出手段を含む、請求項1に記載の画像処理装置。
  3. 前記第1抽出手段は、前記罫線領域の画像データを前記第1のしきい値で2値化して前記罫線データを生成する第1の2値化手段を含む、請求項2に記載の画像処理装置。
  4. 前記罫線データと前記画像データとから前記罫線データに含まれる罫線の第1罫線色を決定する第1罫線色決定手段をさらに備え、
    前記結合手段は、前記第1圧縮データと前記第1罫線色とを関連付ける罫線色関連付手段を含む、請求項3に記載の画像処理装置。
  5. 前記第2抽出手段は、前記罫線領域の画像データを前記第1のしきい値と第2のしきい値との内外で2値化して前記補間データを生成する第2の2値化手段を含む、請求項3に記載の画像処理装置。
  6. 前記罫線データと前記画像データとから前記罫線データに含まれる罫線の第1罫線色を決定する第1罫線色決定手段と、
    前記補間データと前記画像データとから前記補間データに含まれる第2罫線色を決定する第2罫線色決定手段とをさらに備え、
    前記結合手段は、前記第1圧縮データと前記第1罫線色とを関連付け、前記第2圧縮データを前記第2罫線色と関連付ける罫線色関連付手段を含む、請求項5に記載の画像処理装置。
  7. 前記第1生成手段は、前記罫線領域の画像データを2値化する2値化手段と、
    前記2値化されたデータを解像度の低い罫線データに変換する解像度変換手段とを含み、
    前記第2生成手段は、前記罫線領域の画像データを2値化する2値化手段と、
    前記2値化されたデータから前記罫線データに含まれる罫線成分を除去して補間データを生成する差分抽出手段とを含む、請求項1に記載の画像処理装置。
  8. 前記罫線領域の画像データから色相および彩度の組が近似する罫線を集めて前記罫線領域の画像データを色相および彩度の組別に分割して複数の分割データを生成する分割手段をさらに備え、
    前記第1および第2生成手段それぞれは、前記複数の分割データが入力され、色相および彩度の組ごとに前記罫線データおよび前記補間データを抽出する、請求項1に記載の画像処理圧縮装置。
  9. 画像データを入力するステップと、
    前記入力された画像データから罫線を含む罫線領域を抽出するステップと、
    前記罫線領域の画像データから罫線の中心画素を少なくとも含む罫線データを生成するステップと、
    前記罫線領域の画像データから前記罫線データを補間するための補間データを生成するステップと、
    前記罫線データおよび前記補間データそれぞれを圧縮して第1および第2圧縮データを生成するステップと、
    前記画像データから前記罫線領域を除いた領域を圧縮して第3圧縮データを生成するステップと、
    前記第1圧縮データと、前記第2圧縮データと、前記第3圧縮データとを結合して結合データを生成するステップとを含む、画像圧縮方法。
  10. 画像データを入力するステップと、
    前記入力された画像データから罫線を含む罫線領域を抽出するステップと、
    前記罫線領域の画像データから罫線の中心画素を少なくとも含む罫線データを生成するステップと、
    前記罫線領域の画像データから前記罫線データを補間するための補間データを生成するステップと、
    前記罫線データおよび前記補間データそれぞれを圧縮して第1および第2圧縮データを生成するステップと、
    前記画像データから前記罫線領域を除いた領域を圧縮して第3圧縮データを生成するステップと、
    前記第1圧縮データと、前記第2圧縮データと、前記第3圧縮データとを結合して結合データを生成するステップとをコンピュータに実行させる、画像圧縮プログラム。
  11. 画像データに含まれる罫線領域から罫線の中心画素を抽出し、該中心画素を少なくとも含む罫線データを圧縮した第1の圧縮データと、
    画像データに含まれる罫線領域から前記罫線データを補間するための補間データを生成し、該補間データを圧縮した第2の圧縮データと、
    前記画像データから前記罫線領域を除いた領域を圧縮した第3圧縮データとを含む、圧縮画像のデータ構造。
JP2005196908A 2005-07-05 2005-07-05 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造 Pending JP2007019673A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005196908A JP2007019673A (ja) 2005-07-05 2005-07-05 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005196908A JP2007019673A (ja) 2005-07-05 2005-07-05 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造

Publications (1)

Publication Number Publication Date
JP2007019673A true JP2007019673A (ja) 2007-01-25

Family

ID=37756463

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005196908A Pending JP2007019673A (ja) 2005-07-05 2005-07-05 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造

Country Status (1)

Country Link
JP (1) JP2007019673A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009105768A (ja) * 2007-10-24 2009-05-14 Fujitsu Ltd 画像処理プログラム、画像処理装置、および画像処理方法
JP2010074376A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像符号化装置
JP2010527190A (ja) * 2007-05-04 2010-08-05 イー・エル・イー・エス・ソシエテ・アノニム スキャンされたドキュメントを含むデジタル画像の圧縮
JP2011009924A (ja) * 2009-06-24 2011-01-13 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP2011010023A (ja) * 2009-06-25 2011-01-13 Sharp Corp 画像圧縮装置、画像圧縮方法、画像伸張装置、画像伸張方法、画像形成装置、コンピュータプログラム及び記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010527190A (ja) * 2007-05-04 2010-08-05 イー・エル・イー・エス・ソシエテ・アノニム スキャンされたドキュメントを含むデジタル画像の圧縮
US8666185B2 (en) 2007-05-04 2014-03-04 I.R.I.S. Compression of digital images of scanned documents
US8995780B2 (en) 2007-05-04 2015-03-31 I.R.I.S. Compression of digital images of scanned documents
JP2009105768A (ja) * 2007-10-24 2009-05-14 Fujitsu Ltd 画像処理プログラム、画像処理装置、および画像処理方法
JP2010074376A (ja) * 2008-09-17 2010-04-02 Ricoh Co Ltd 画像符号化装置
JP2011009924A (ja) * 2009-06-24 2011-01-13 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
US8532385B2 (en) 2009-06-24 2013-09-10 Canon Kabushiki Kaisha Image processing apparatus and image processing method
JP2011010023A (ja) * 2009-06-25 2011-01-13 Sharp Corp 画像圧縮装置、画像圧縮方法、画像伸張装置、画像伸張方法、画像形成装置、コンピュータプログラム及び記録媒体

Similar Documents

Publication Publication Date Title
JP5875637B2 (ja) 画像処理装置、画像処理方法
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
US7660014B2 (en) Image processing apparatus capable of extracting rule from document image with high precision
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP5887770B2 (ja) 画像処理装置及び画像処理プログラム
US7321688B2 (en) Image processor for character recognition
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP4383157B2 (ja) 画像処理装置、プログラム及び記憶媒体
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2007019673A (ja) 画像処理装置、画像圧縮方法、画像圧縮プログラムおよび圧縮画像のデータ構造
JP6607490B2 (ja) 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体
US8577132B2 (en) Electronic document generation system, electronic document generation method, and program
JP6197840B2 (ja) 画像処理装置、電子ファイル生成方法及びプログラム
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2009141597A (ja) 画像処理装置、文字領域特定方法、および文字領域特定プログラム
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
JP3910120B2 (ja) 画像処理装置、方法、該方法を実行するプログラム及び記録媒体
US20080043269A1 (en) Method and apparatus for processing image containing picture and characters
JP2003219187A (ja) 画像処理方法及び画像処理装置
JP5517028B2 (ja) 画像処理装置
RU2737001C1 (ru) Устройство и способ обработки изображений и носитель данных
US8553294B2 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same
JP2006222940A (ja) 画像処理装置