JP2010056691A - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP2010056691A
JP2010056691A JP2008217322A JP2008217322A JP2010056691A JP 2010056691 A JP2010056691 A JP 2010056691A JP 2008217322 A JP2008217322 A JP 2008217322A JP 2008217322 A JP2008217322 A JP 2008217322A JP 2010056691 A JP2010056691 A JP 2010056691A
Authority
JP
Japan
Prior art keywords
region
adjacent
pixel
block
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008217322A
Other languages
English (en)
Other versions
JP5049922B2 (ja
JP2010056691A5 (ja
Inventor
Shigeo Fukuoka
茂雄 福岡
Taeko Yamazaki
妙子 山▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008217322A priority Critical patent/JP5049922B2/ja
Priority to US12/545,682 priority patent/US8229214B2/en
Publication of JP2010056691A publication Critical patent/JP2010056691A/ja
Publication of JP2010056691A5 publication Critical patent/JP2010056691A5/ja
Application granted granted Critical
Publication of JP5049922B2 publication Critical patent/JP5049922B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Processing (AREA)

Abstract

【課題】画像データ内のグラデーションを精度良く分割することにより、分割誤りによる画質の劣化を抑制すること。
【解決手段】画像データを入力する入力部201と、入力部201で入力した画像データの各画素毎に属性情報を生成する属性情報生成部203と、入力部201で入力した画像データを、予め定められたサイズの複数のブロックに分割するブロック分割部211と、ブロック分割部211で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成するヒストグラム生成部212と、ヒストグラム生成部212で生成したヒストグラムによって規定される領域毎に色置換処理を行う色置換部213と、グラデーションが存在するか否かを予め定められた条件に基づいて判定するグラデーション判定部214と、グラデーションが存在すると判定された場合には、着目領域と隣接領域とを統合して、着目領域及び隣接領域に連続するグラデーションを生成するブロック統合部215と、を備える。
【選択図】図2

Description

本発明は、画像データから文字や写真等の各要素を抽出する画像処理技術に関する。
画像データから文字や写真等の各要素を抽出する技術として、例えば、特許文献1には、入力画像を複数のブロックに分割し、ブロック単位で色置換を行う技術が開示されている。
国際公開WO2006/066325号公報
ここで、分割された画像には、複数のブロックにわたって、連続して明暗や色調の段階的な変化(すなわち、グラデーション)が存在する場合がある。
しかしながら、特許文献1で開示された技術では、分割されたブロック毎に色置換処理を行うため、グラデーションがブロックの境界を挟んで連続して存在する場合に、急激な色の変化が生じる可能性がある。
従って、本発明の目的は、画像データ内のグラデーションを精度良く分割することにより、分割誤りによる画質の劣化を抑制することにある。
上記課題を解決するため、本発明の画像処理装置は、画像データを入力する入力手段と、前記入力手段で入力した画像データの各画素毎に属性情報を生成する属性情報生成手段と、前記入力手段で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割手段と、前記分割手段で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成手段と、前記生成手段で生成したヒストグラムによって規定される領域毎に色置換処理を行う色置換手段と、前記色置換手段での色置換結果に基づいて、前記着目ブロックにおける着目領域内で、前記着目ブロックと該着目ブロックに隣接する隣接ブロックとの境界に接する着目画素と、前記隣接ブロックにおける、前記着目領域に隣接する隣接領域内で前記境界に接し、前記着目画素に隣接する隣接画素との色差を算出する算出手段と、前記算出手段で算出された色差が予め定められた範囲内であるか否かを判定する第1の判定手段と、前記第1の判定手段で前記色差が予め定められた範囲内であると判定された、前記着目画素と前記隣接画素との組の数Xに対する、前記属性情報が前記着目画素及び前記隣接画素のうちの少なくとも一方に付加された前記着目画素と前記隣接画素との組の数Yの割合Y/Xが予め定められた閾値以下であるか否かを判定する第2の判定手段と、前記第2の判定手段で前記割合Y/Xが前記閾値以下であると判定された場合に、前記境界を横断するグラデーションが存在するとみなして、前記着目領域と前記隣接領域とを統合して、前記着目領域及び前記隣接領域に連続するグラデーションを生成する統合手段と、を備える。
また、本発明の画像処理方法は、画像データを入力する入力工程と、前記入力工程で入力した画像データの各画素毎に属性情報を生成する属性情報生成工程と、前記入力工程で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割工程と、前記分割工程で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成工程と、前記生成工程で生成したヒストグラムによって規定される領域毎に色置換処理を行う色置換工程と、前記色置換工程での色置換結果に基づいて、前記着目ブロックにおける着目領域内で、前記着目ブロックと該着目ブロックに隣接する隣接ブロックとの境界に接する着目画素と、前記隣接ブロックにおける、前記着目領域に隣接する隣接領域内で前記境界に接し、前記着目画素に隣接する隣接画素との色差を算出する算出工程と、前記算出工程で算出された色差が予め定められた範囲内であるか否かを判定する第1の判定工程と、前記第1の判定工程で前記色差が予め定められた範囲内であると判定された、前記着目画素と前記隣接画素との組の数Xに対する、前記属性情報が前記着目画素及び前記隣接画素のうちの少なくとも一方に付加された前記着目画素と前記隣接画素との組の数Yの割合Y/Xが予め定められた閾値以下であるか否かを判定する第2の判定工程と、前記第2の判定工程で前記割合Y/Xが前記閾値以下であると判定された場合に、前記境界を横断するグラデーションが存在するとみなして、前記着目領域と前記隣接領域とを統合して、前記着目領域及び前記隣接領域に連続するグラデーションを生成する統合工程と、を有する。
本発明によれば、画像データ内のグラデーションを精度良く分割することにより、分割誤りによる画質の劣化を抑制することができる。
以下に、本発明の実施の形態について添付図面を参照して詳細に説明する。なお、以下に説明する実施の形態は、本発明の実現手段としての一例であり、本発明は、その趣旨を逸脱しない範囲で以下の実施形態を修正又は変形したものに適用可能である。
<第1の実施形態>
図1は、本発明の第1の実施形態に係るシステムの機能的構成を示すブロック図である。100は本発明を実現するための画像処理装置である。画像処理装置100は、読み取った文書の紙面情報を画像データに変換するスキャナ101と、画像データに本発明の処理を施すためのプログラムを実行するCPU102とを有する。また、画像処理装置100は、プログラムを実行する際のワークメモリやデータの一時保存等に利用されるメモリ103と、プログラムやデータを格納するハードディスク104と、外部装置とデータの入出力を行うためのネットワークI/F105とを有する。パーソナルコンピュータ(以下、PCと言う。)120は、画像処理装置100とLAN110等のネットワークで接続され、画像処理装置100から送信されたデータを受信する。
図2は、第1の実施形態に係る画像処理装置100の機能的構成を示すブロック図である。なお、ここで示す各処理は、CPU102で電子ドキュメント生成プログラムを実行することによって実現されるものとするが、その一部又は全部を電気回路で構成するようにしても構わない。
201はスキャナ101により文書を入力する入力部である。202は文書を電子化して画像を生成するスキャン画像処理部である。203は画素毎に属性データを生成する画素毎の属性情報生成部である。
画素毎の属性データとは、原稿画像に含まれる画像の特徴に応じて最適な画像処理を施すために原稿画像の特徴を抽出して像域属性を画素毎に示す信号(以下、フラグデータ)を言う。例えば、イメージスキャナ等によって読み取られた画像には、原稿画像中に連続階調のフルカラーの写真領域や、黒一色の文字領域又は新聞印刷のような網点印刷領域等のように、種々の画像領域が混在している。
これらを一律に同一の画像処理手順で処理して出力すると、その出力画像は一般に好ましい画質が得られない場合が多い。そこで、入力部201から入力されるカラー画像データを用いて原画像中に含まれる画像データの属性を検出し、この画像データの属性を識別するためのフラグデータを生成する。
なお、具体的な手順は、特開2004−350240に開示された技術を用いることができる。例えば、文字属性については以下のように行う。すなわち、画像データをラスタースキャン順に順次着目し、着目画素近傍の一定範囲の画素(例えば、7×7画素領域)についてラプラシアンフィルタを用いたフィルタ処理を行い、着目画素値が閾値よりも大きい場合には、その画素はエッジを構成すると判定される。文字検出用である場合には、文字は主として線から構成されるため、一定方向について比較的低周波に対応したフィルタを用いることにより、文字領域を効率的に検出することができる。
そして、着目画素近傍の一定領域内に、文字のエッジであると判定された画素が一定数以上含まれている場合には、着目画素は文字領域として対応する文字フラグがセットされる。当然のことではあるが、文字属性以外にも網点属性や図形属性等のように、画像処理に応じてあらゆる属性データが生成される。
なお、イメージスキャナの属性データだけでなく、ページ記述言語からPDLコマンドを解釈してプリント画像を生成する際に、このときのコマンドの種別を示す情報を参照してもよい。この場合には、文字領域を構成する画素を識別するためのフラグデータを画素毎に検出することとなる。
いずれにしても、文字属性であると判定された画素を「1」とし、それ以外の画素を「0」として、1ビットを出力する信号である。
図3において、(a)は入力された画像データを示す図であり、(b)は図3(a)で入力された画像データから生成された属性データを示す図である。また、図4において、(a)は図3(b)で生成した属性データをフラグデータで示す図であり、(b)は図4(a)で示すフラグデータの変形例を示す図である。
例えば、図3(a)に示す画像データが入力された場合には、画像データと同時に、図3(b)に示す画素毎の属性データが生成される。ここで生成された属性データは、図4(a)で示すように、黒い部分が「0」、白い部分が「1」を示す情報である。
なお、画素毎の属性データは、本実施形態では、文字領域全体を示す情報としたが、図4(b)で示すように、文字のエッジ部分のみを示す情報であっても構わない。
210はカラー画像を色置換し、類似する色領域に分割する類似色領域統合部である。入力される画像には、スキャンノイズやモスキートノイズが付加され、本来同一の色であった領域が微妙に色味が変化する場合がある。この処理では領域の色情報の統計を取得し、類似色の色置換を行う。
類似色領域統合部210は、ブロック分割部211と、ヒストグラム生成部212と、色置換部213と、グラデーション判定部214と、ブロック統合部215とを有する。
ブロック分割部211は、入力部201で入力した画像データを、予め設定されたサイズの複数のブロックに分割する。ヒストグラム生成部212は、ブロック分割部211で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する。色置換部213は、ヒストグラム生成部212で生成したヒストグラムによって規定される領域毎に色置換処理を行う。また、色置換部213は、後述する所定の条件に基づいて、着目色の領域を、着目色の領域が接する他の色の領域に統合するため、着目色の領域内の画素の色を他の色に置換する。なお、グラデーション判定部214の詳細については後述する。
ブロック統合部215は、後述する所定の条件を満たした場合には、着目領域と着目領域が接するブロック内の領域とを統合する。
図5において、(a)は類似色領域統合部210に入力された画像500を示す図であり、(b)はブロック分割部211で画像500を分割した状態を示す図である。また、図6において、(a)は図5(b)で示すブロック501の色情報の分布を模式的に示す図であり、(b)は図5(b)で示すブロック504の色情報の分布を模式的に示す図である。
ブロックの縦横のサイズは定数とし、本実施形態では、図5(b)で示すように、6つのブロック501、502、503、504、505、506に分割する。また、ヒストグラム生成部212では、ブロック内の色情報を公知の技術を用いて抽出する。ヒストグラム生成部212は、本実施形態では、色情報とその分布を抽出する。
色置換部213では、ブロック内の画素を先に求めた色情報で色置換する。ここで、色置換部213の動作手順について、図7を用いて説明する。
図7は、色置換部213の動作手順を示す図である。また、図8において、(a)はブロック501を示す図であり、(b)はブロック501のフラグデータの一例を示す図であり、(c)は色置換後の画素領域800を示す図であり、(d)は色置換後の画像500を示す図である。
まず、ステップS701では、ヒストグラム生成部212で生成したヒストグラムで得られた着目色を持つ着目領域の面積を算出する。すなわち、前述した分布に基づいて、色情報が類似する領域をグループ化して画素数を算出する。
次に、ステップS702では、着目領域の面積Sが予め設定された閾値以下(S<=th1)であるか否かを判定する。ステップS702で着目領域の面積が閾値Th1よりも大きいと判定された場合には、ステップS705に進み、着目色の領域を有意な領域として決定し、色置換処理を行わずにその領域単独の領域とする。
例えば、図5で示すブロック501の場合、領域vの面積は閾値Th1よりも大きいため、ステップS705に進み、領域w及び領域xの面積は閾値Th1以下であるため、ステップS703へ進む。また、ブロック504の場合、領域y及び領域zの面積はいずれも閾値Th1よりも大きいため、ステップS705に進む。
ここで、ある程度小さな領域は、ノイズとみなして他の領域の色に置換する処理が一般的である。しかし、ブロック内での面積は小さくても、ブロックの境界で分断された領域であり、ノイズではない可能性がある。よって、本実施形態では、ステップS703以降の処理を追加する。
ステップS703では、着目領域が、着目ブロックと隣接ブロックとの境界線と接する画素を有するか否かを判定する。なお、境界線と接する画素だけでなく、境界線から一定範囲の画素分内側の領域と定義してもよい。ステップS703で境界線と接する画素を有すると判定された場合にはステップS704に進み、ステップS703で境界線と接する画素を有しないと判定された場合にはステップS706へ進む。
ここで、図8(a)で示す画素領域800は、本実施形態では、着目するブロック501の端とみなす画素領域である。ステップS703に進んだブロック501の領域wと領域xのうち、領域wは画素領域800に含まれないため、ステップS706へ進み、領域xは画素領域800に含まれるため、ステップS704へ進む。
ステップS704では、画素毎の属性情報生成部203で生成したフラグデータを参照して、境界線と接する位置にフラグデータが連続して存在するか否かを判定する。ステップS704でフラグデータが連続して存在すると判定された場合には、ステップS705へ進み、ステップS704でフラグデータが連続して存在しないと判定された場合には、ステップS706へ進む。ここでは、単にフラグの有無を判定するだけでなく連続性を加味することにより、ノイズと誤認識することを抑制している。
図8(b)で示すように、ブロック501の領域xに該当する位置にフラグが連続して「1」となっている。よって、ステップS705の単独領域として扱う処理へ進む。
このようにして、画素領域800を色置換すると、図8(c)で示すような状態となる。ここで、スキャンノイズとみなされた領域wは隣接する領域の色に置換され、分割前には大きな領域であったが、ブロック分割により小さな領域になった領域xは単独の領域として色置換処理を行うことなく残存する。そして、ステップS707で色置換後に残存する領域を出力する。その結果、画像500は、図8(d)に示す状態となる。
[グラデーション判定部214の構成及び動作手順]
グラデーション判定部214は、色置換部213でブロック毎に色置換された情報と、画素毎の属性情報生成部203で生成された画素毎の属性情報とを用いて、グラデーションであるか否かを判定する。更に、グラデーション判定部214は、各ブロック毎に色置換された色情報にグラデーションであるか否かを示す情報を付加する。
すなわち、グラデーション判定部214は、画素間の色差を算出する算出部と、算出部で算出された色差が予め定められた閾値以下であるか否かを判定する第1の判定部と、後述のエッジ率が予め定められた範囲内であるか否かを判定する第2の判定部とを備える。
算出部は、色置換部213での色置換結果に基づいて、着目ブロックにおける着目領域内で着目ブロックと隣接ブロックとの境界に接する着目画素と、隣接ブロックにおける隣接領域内で境界に接し、着目画素に隣接する隣接画素との色差を算出する。
第2の判定部で用いられるエッジ率は、色差が予め定められた範囲内であると判定された、着目画素と隣接画素との組の数Xに対する、属性情報が着目画素及び隣接画素のうちの少なくとも一方に付加された着目画素と隣接画素との組の数Yの割合Y/Xである。
なお、着目ブロックに隣接するブロックを隣接ブロックと呼び、隣接ブロック内の領域を隣接領域と呼び、隣接領域内の画素を隣接画素と呼ぶ。
図9乃至図11は、グラデーション判定部214の処理の一例を示す図である。グラデーション判定部214は、例えば、図9に示すように、ブロックの高さhに相当するセンサを有しており、このセンサを右方向に走査することにより、1ライン分のブロックを1回で処理する。なお、グラデーション判定部214は、本実施形態では、右方向のみで処理を行い、左方向は移動するだけとしたが、左右方向の双方で処理を行うものであってもよい。
1ライン目を処理する場合には、図10に示すように、前のラインは存在しないため、同一ライン内のブロック境界のみを処理する。n(nは2以上の整数)ライン目を処理する場合には、n−1ライン目のブロックとの境界と、nライン目のブロック同士の境界を処理する。すなわち、図11で示す太い実線を処理していくこととなる。このようにして、画像全体の処理が終了した場合には、グラデーション判定を終了する。
図12は、グラデーション判定部214の動作手順を示す図であり、図13は、色置換部213での処理後のブロック境界を模式的に示す図である。また、図14は、画素毎の属性情報生成部203で生成された画素毎の属性情報の境界部分を示す図であり、図15は、図13で示すブロック境界の各画素における色の組み合わせとその個数を示す図である。
まず、ステップS1201では、着目ブロックと着目ブロックに隣接する隣接ブロックとの境界に接し、互いに隣接する画素における色の組み合わせと各組み合わせ毎の個数を抽出する。例えば、図13で示すような色の組み合わせの場合には、図15で示すように、色の組み合わせとその個数が抽出される。この処理を上述のように、ライン毎に行っていく。
ステップS1202は、ステップS1201で取得した境界部分の色置換後の色の組み合わせに対して、ステップS1203以降の処理を実行させるループ処理指令である。ステップS1203では、ステップS1201で抽出された着目する組み合わせの色差Δが閾値th11以下であるか否かを判定する。
ステップS1203で色差Δが閾値th11以下であると判定された場合には、その組み合わせの色が同じ色であり、グラデーションではないとみなして、ループ処理内の一連の処理を終了し、次の組み合わせの判定に進む。一方、ステップS1203で色差Δが閾値th11より大きいと判定された場合には、ステップS1204へ進む。
ステップS1204では、更に、ステップS1201で抽出された着目する組み合わせの色差Δが閾値th12より大きいか否かを判定する。ステップS1204で色差が閾値th12より大きいと判定された場合には、その組み合わせの色が異なる色であり、グラデーションではないとみなして、ループ処理内の一連の処理を終了し、次の色の判定に進む。一方、ステップS1204で色差が閾値th12以下であると判定された場合には、ステップS1205へ進む。
ステップS1205は、ステップS1203及びステップS1204の条件を満たす場合(すなわち、閾値th11<=色差Δ<閾値th12)に行われる。つまり、色差Δが閾値th11以下である場合には、本来同じ領域とされるもの(例えば、図5(b)に示す領域X及びZ)が細分化されたものに過ぎないため、グラデーションではないとみなす。一方、色差Δが閾値th12より大きい場合には、異なる領域とされるものが正常に分割されているものに過ぎないため、グラデーションではないとみなす。
ステップS1205では、ステップS1203で色差Δが閾値th11以下であると判定された全ての組み合わせの数Yに対する、ステップS1201で抽出された色の組み合わせの中で、エッジフラッグが有る組み合わせの数Xの割合Y/Xを算出する。
例えば、図15に示す組み合わせにおいて、下式のような関係が成立していることとする。
ΔA−D<=th11
th11<ΔA−E<=th12
th11<ΔB−E<=th12
th12<ΔC−E
th12<ΔC−F
この場合、AとDとの組み合わせは、ステップS1203で同じ色であるとみなされ、CとEとの組み合わせ及びCとFとの組み合わせは、ステップS1204で異なる色とみなされることになる。よって、AとEとの組み合わせ及びBとEとの組み合わせのみがステップS1205で処理される。
ステップS1205では、AとEとの組み合わせのうち、エッジフラグを参照すると1である部分が2つあるため、2/2=1.0がエッジ率として算出される。またBとEとの組み合わせは、エッジフラグが1である画素が無いため、0/7=0がエッジ率として算出される。
ステップS1206では、ステップS1205で算出されたエッジ率が閾値th13以下であるか否かを判定する。ステップS1206でエッジ率が閾値th13以下であると判定された場合には、グラデーションであるとみなして、ステップS1207に進む。一方、ステップS1206でエッジ率が閾値th13より大きいと判定された場合には、グラデーションではないとみなして、次の色の判定に進む。例えば、閾値th13を0.2とした場合には、th13<Y/X(=1.0)であるため、AとEとの組み合わせはグラデーションではないと判定される。一方、Y/X(=0)<th13であるため、BとEとの組み合わせはグラデーションであると判定される。
ステップS1207では、ステップ1206でグラデーションであると判定された色の組にグラデーションであることを示す情報(以下、グラデーション情報と呼ぶ。)を付加する。この例では、BとEとの組み合わせをグラデーションであるとみなし、この組み合わせに対して、境界を挟んで隣接する2つの領域にグラデーション情報を付加する。
このようして、1つのブロック境界を処理することができる。ブロックの他の境界も同様に処理を行い、1ブロックの処理を終了する。
[ブロック統合部215の動作手順]
ブロック統合部215は、ブロック毎に色置換した領域を近接するブロックの類似色領域と統合する。図16は、ブロック統合部215の動作手順を示す図である。図17は、入力された画像データを示す図であり、図18は、図17の画像データを色置換した結果を示す図である。また、図19は、図18の色置換後の領域を統合した結果を示す図である。
ステップS1601では、グラデーション判定部214から出力された着目する領域Aを取得する。ステップS902では、領域Aを含む着目ブロックに隣接する他のブロックで有意と決定された領域B[num]を取得する。
なお、隣接ブロックは、本実施形態では、処理対象となる着目ブロックの上側及び左側に接するブロックとする。例えば、処理対象となるブロックが図5(b)で示すブロック505である場合には、隣接ブロックは、ブロック502、504となる。
ステップS1603は、ステップS1602で取得した隣接ブロックの領域Bのすべての領域に対して、ステップS1604以降の処理を実行させるループ処理指令である。
ステップS1604では、領域A及び領域Bがグラデーション情報を有するか否かを判定する。ステップS1604で領域A及び領域Bがグラデーション情報を有すると判定された場合には、境界を横断して領域A及び領域Bに連続するグラデーションが有るとみなせるため、ステップS1610の統合処理に進む。一方、ステップS1604で領域A及び領域Bがグラデーション情報を有しないと判定された場合には、領域A及び領域Bに連続するグラデーションが無い可能性が高いため、この段階では統合処理には進まず、ステップS1605に進む。
例えば、図17のようなグラデーションを有する画像に対して、色置換部213で図18で示すような色置換が行われ、グラデーション判定部214で領域1801と領域1802、及び領域1802と領域1803がグラデーションであると判定されたとする。この場合、領域1801を領域Aとし、領域1802を領域B[x]とすれば、ステップS1604でグラデーションであるとみなされた結果、ステップS1610で領域の統合が行われることとなる。同様に、領域1802を領域Aとし、領域1803を領域B[x]とすれば、ステップS1604でグラデーションであるとみなされた結果、ステップS1610で領域1802と領域1803の統合が行われる。この結果、領域1801乃至1803が、図19で示すように1つの領域に統合されることとなる。
ステップS1605では、領域Aと領域Bの色情報の色差を求める。なお、色差の求め方は、公知の技術を用いることとし、本実施形態では、一般的な色空間上における互いの色情報の距離を求めることとする。
ステップS1606では、ステップS1605で求めた色差が予め定められた閾値th21以下であるか否かを判定する。すなわち、領域Aと領域B[xs]の色情報が類似するか否かが判定されることとなる。ステップS1606で色差が閾値th21以下であると判定された場合には、ステップS1610の統合処理へ進む。一方、ステップS1606で色差が閾値th21より大きいと判定された場合には、ステップS1607の処理へ進む。
ステップS1607では、着目する領域が、着目ブロックと隣接するブロックとの境界線と接する画素を有するか否かを判定する。ステップS1607で境界線と接する画素を有すると判定された場合には、ステップS1608に進み、ステップS1607で境界線と接する画素を有しないと判定された場合には、ステップS1611へ進む。
ステップS1608では、画素毎の属性情報生成部203で領域B[x]に生成したフラグデータを参照し、境界線と接する位置にフラグデータが連続して存在しているか否かを判定する。ステップS1608でフラグデータが連続して存在していると判定された場合には、ステップS1609へ進み、ステップS1608でフラグデータが連続して存在していないと判定された場合には、ステップS1611へ進む。ここでは、単にフラグの有無を判定するだけではなく、連続性を加味することでノイズとの切り分けを行う。
ここまでの処理だけでは、領域B[x]はいずれかの領域の一部分であるが、ブロック分割処理によって小さな領域になり、色置換処理でブロック内に支配的に存在する色情報により色置換結果に影響が出てしまう可能性がある。よって、ステップS1609では、閾値Th21を、閾値Th21とは異なる閾値Th22に変更し、類似色の判定を行う。閾値Th22は、例えば、領域bの場合、ステップS1606で用いた閾値th21にブロック上最大の面積を有する領域aの色情報の明度に関する距離をaから反対の向きへ重み付けして算出する。すなわち、ステップS1609では、領域A及び領域B[x]の色情報が類似するか否かを判定する。
ステップS1609で色情報が類似すると判定された場合には、ステップS1610へ進み、統合処理を行う。一方、ステップS1609で色情報が類似しないと判定された場合には、ステップS1611へ進み、統合処理を行わないこととする。
なお、ステップS1605乃至ステップS1609の処理は、実装形態を想定したものであり、グラデーション部分を統合する処理だけを行うのであれば、省略することが可能である。この場合には、ステップS1604でグラデーション情報を有すると判定された場合には、ステップS1611に直接進み、統合処理を行わないこととする。
ブロック統合部215は、このような統合処理を行った画像データを画像解析部に入力する。画像解析部220は、領域分割部221と、文字変換部223と、写真変換部225と、線画変換部227と、表変換部229と、それらの変換結果を1つにまとめる合成部2210とを有する。
領域分割部221は、公知の領域分割技術を用いて、文字、写真、線画、表に分割する。領域分割技術の具体例としては、米国特許5680478号公報(特許文献2)に記載の処理等を用いることができる。
特許文献2では、文書画像中の黒画素塊、白画素塊の集合を抽出し、その形状、大きさ、集合状態等に基づいて、文字、絵、図、表、枠、線等の特徴的な領域を抽出する技術が開示されている。また、特許文献2以外にも、領域分割に用いる特徴量を入力多値画像から近似色画素塊を抽出する技術、多値画像を二値化して得た黒画素塊に基づいて抽出する技術、又は多値画像から微分エッジ情報等を生成してエッジ内の画素として抽出する技術等がある。本実施形態では、これらのいずれかの技術を用いることとする。
領域分割部221で、文字、写真、線画、表に分割された各領域は、それぞれの分類毎の変換処理を行う。例えば、文字変換部223では、公知の文字認識技術を用いて各文字領域内の文字認識を行い、文字コードデータを生成する。
次に、文字認識技術の具体例について説明する。まず、文字領域の行方向(すなわち、縦書きであるか、横書きであるか)を判断する。これは、例えば、画像を二値化し、縦横の射影を取得して射影分散の低い方を行方向と判定することができる。
次に、画像をそれぞれの文字画像に分割する。これは、二値画像の行方向への射影を用いて切断すべき行間を検出することで行画像に分割し、さらに、行画像を行と垂直方向への射影を用いて切断すべき文字間を検出することで文字画像に分割すればよい。
そして、それぞれの文字画像に対して特徴を取り、予め全字種分の特徴を保存した辞書から一番特徴が近似するものを検索し、辞書が示す文字コードを各文字の認識結果とする。また、写真変換部225では、公知の高解像度変換処理を用いて、高画質ラスタデータを生成する。
線画変換部227では、公知のベクトル化技術を用いて、線画の画像データから線画のベクトル描画データを生成する。ベクトル化技術の具体例としては、特許第3026592号(特許文献3)や特開2005−346137号公報(特許文献4)記載の処理等がある。
特許文献3では、画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、水平方向及び垂直方向の画素間ベクトルを検出する。次に、これら画素間ベクトル同士の接続状態に基づいて、画像データの輪郭を抽出することにより、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術が開示されている。また、特許文献4では、アウトラインベクトルを直線や2次又は3次のベジェ曲線で近似することで、大きく変倍しても高画質なベクトル記述データを生成する技術が開示されている。
表変換部229では、罫線部分を前述した公知のベクトル化技術によってベクトル描画データを生成し、文字部分を前述した公知の文字認識技術によって文字コードデータを生成する。
なお、文字変換部223、写真変換部225、線画変換部227、又は表変換部229では、上記以外の変換処理を行ってもよい。例えば、文字変換部223では、ベクトル変換を行ってもよいし、高画質ラスタデータ変換を行ってもよい。また、表変換部229では、高画質ラスタデータを生成してもよい。
合成部2210は、各変換部から生成されたデータを1つに合成する。図20は、合成部2210で合成されたデータの一例を示す図である。
2000は、合成部2210で生成されたデータの全体構成である。text object2001は、領域分割部221が文字と判断した領域の変換結果と画像中の位置情報を保持し、また、Picture2002は写真と判断した領域の変換結果と位置情報を保持する。更に、Line Art2003は、線画と判断した領域の変換結果と位置情報を保持し、Table2004は、表と判断した領域の変換結果と位置情報を保持する。Property2005は、入力データの書誌情報(例えば、ページ数、ページサイズ、入力機器情報、タイムスタンプ等)を保持する。
電子ファイル変換部204は、合成データを電子ファイルに変換する。電子ファイル変換部204は、本実施形態では、PC120で再生、編集等が可能な電子ファイルへ変換する。
以上述べた通り、本実施形態によれば、画像データ内のグラデーションを精度良く分割することにより、分割誤りによる画質の劣化を抑制することができる。
<その他の実施形態>
なお、本実施形態は、複数の機器(例えば、ホストコンピュータ、インターフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、1つの機器からなる装置(例えば、複写機、複合機、ファクシミリ装置等)に適用してもよい。
また、本発明は、前述した実施形態の機能を実現するソフトウェアのコンピュータプログラムのコードを記憶したコンピュータ可読記憶媒体(又は記録媒体)を、システム又は装置に供給してもよい。また、そのシステム又は装置のコンピュータ(又はCPUやMPU)が記憶媒体に格納されたプログラムコードを読み込み実行することに適用してもよい。この場合、記憶媒体から読み込まれたプログラムコード自体が前述の実施形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本実施形態を構成することになる。また、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読み込まれたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれる。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPU等が実際の処理の一部又は全部を行い、その処理によって前述した実施形態の機能が実現される場合も本発明に含まれることは言うまでもない。
また、本実施形態を上述のコンピュータ可読記憶媒体に適用する場合、その記憶媒体には、前述のフローチャートや機能構成に対応するコンピュータプログラムのコードが格納されることになる。
本発明の第1の実施形態に係るシステムの機能的構成を示すブロック図である。 第1の実施形態に係る画像処理装置100の機能的構成を示すブロック図である。 (a)は入力された画像データを示す図であり、(b)は図3(a)で入力された画像データから生成された属性データを示す図である。 (a)は図3(b)で生成した属性データをフラグデータで示す図であり、(b)は図4(a)で示すフラグデータの変形例を示す図である。 (a)は類似色領域統合部210に入力された画像500を示す図であり、(b)はブロック分割部211で画像500を分割した状態を示す図である。 (a)は図5(b)で示すブロック501の色情報の分布を模式的に示す図であり、(b)は図5(b)で示すブロック504の色情報の分布を模式的に示す図である。 色置換部213の動作手順を示す図である。 (a)はブロック501を示す図であり、(b)はブロック501のフラグデータの一例を示す図であり、(c)は色置換後の画素領域800を示す図であり、(d)は色置換後の画像500を示す図である。 グラデーション判定部214の処理の一例を示す図である。 グラデーション判定部214の処理の一例を示す図である。 グラデーション判定部214の処理の一例を示す図である。 グラデーション判定部214の動作手順を示す図である。 色置換部213での処理後のブロック境界を模式的に示す図である。 画素毎の属性情報生成部203で生成された画素毎の属性情報の境界部分を示す図である。 図13で示すブロック境界の各画素における色の組み合わせとその個数を示す図である。 ブロック統合部215の動作手順を示す図である。 入力された画像データを示す図である。 図17の画像データを色置換した結果を示す図である。 図18の色置換後の領域を統合した結果を示す図である。 合成部2210で合成されたデータの一例を示す図である。

Claims (5)

  1. 画像データを入力する入力手段と、
    前記入力手段で入力した画像データの各画素毎に属性情報を生成する属性情報生成手段と、
    前記入力手段で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割手段と、
    前記分割手段で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成手段と、
    前記生成手段で生成したヒストグラムによって規定される領域毎に色置換処理を行う色置換手段と、
    前記色置換手段での色置換結果に基づいて、前記着目ブロックにおける着目領域内で、前記着目ブロックと該着目ブロックに隣接する隣接ブロックとの境界に接する着目画素と、前記隣接ブロックにおける、前記着目領域に隣接する隣接領域内で前記境界に接し、前記着目画素に隣接する隣接画素との色差を算出する算出手段と、
    前記算出手段で算出された色差が予め定められた範囲内であるか否かを判定する第1の判定手段と、
    前記第1の判定手段で前記色差が予め定められた範囲内であると判定された、前記着目画素と前記隣接画素との組の数Xに対する、前記属性情報が前記着目画素及び前記隣接画素のうちの少なくとも一方に付加された前記着目画素と前記隣接画素との組の数Yの割合Y/Xが予め定められた閾値以下であるか否かを判定する第2の判定手段と、
    前記第2の判定手段で前記割合Y/Xが前記閾値以下であると判定された場合に、前記境界を横断するグラデーションが存在するとみなして、前記着目領域と前記隣接領域とを統合して、前記着目領域及び前記隣接領域に連続するグラデーションを生成する統合手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記属性情報生成手段は、前記着目画素が、前記着目領域のエッジに位置するか否かを識別する前記属性情報を生成することを特徴とする請求項1に記載の画像処理装置。
  3. 画像データを入力する入力工程と、
    前記入力工程で入力した画像データの各画素毎に属性情報を生成する属性情報生成工程と、
    前記入力工程で入力した画像データを、予め定められたサイズの複数のブロックに分割する分割工程と、
    前記分割工程で分割した着目ブロック内に出現する色と画素数のヒストグラムを生成する生成工程と、
    前記生成工程で生成したヒストグラムによって規定される領域毎に色置換処理を行う色置換工程と、
    前記色置換工程での色置換結果に基づいて、前記着目ブロックにおける着目領域内で、前記着目ブロックと該着目ブロックに隣接する隣接ブロックとの境界に接する着目画素と、前記隣接ブロックにおける、前記着目領域に隣接する隣接領域内で前記境界に接し、前記着目画素に隣接する隣接画素との色差を算出する算出工程と、
    前記算出工程で算出された色差が予め定められた範囲内であるか否かを判定する第1の判定工程と、
    前記第1の判定工程で前記色差が予め定められた範囲内であると判定された、前記着目画素と前記隣接画素との組の数Xに対する、前記属性情報が前記着目画素及び前記隣接画素のうちの少なくとも一方に付加された前記着目画素と前記隣接画素との組の数Yの割合Y/Xが予め定められた閾値以下であるか否かを判定する第2の判定工程と、
    前記第2の判定工程で前記割合Y/Xが前記閾値以下であると判定された場合に、前記境界を横断するグラデーションが存在するとみなして、前記着目領域と前記隣接領域とを統合して、前記着目領域及び前記隣接領域に連続するグラデーションを生成する統合工程と、
    を有することを特徴とする画像処理方法。
  4. コンピュータに読み込ませ実行させることで、前記コンピュータを請求項1又は2に記載の画像処理装置として機能させることを特徴とするコンピュータプログラム。
  5. 請求項4に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
JP2008217322A 2008-08-26 2008-08-26 画像処理装置及び画像処理方法 Expired - Fee Related JP5049922B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008217322A JP5049922B2 (ja) 2008-08-26 2008-08-26 画像処理装置及び画像処理方法
US12/545,682 US8229214B2 (en) 2008-08-26 2009-08-21 Image processing apparatus and image processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008217322A JP5049922B2 (ja) 2008-08-26 2008-08-26 画像処理装置及び画像処理方法

Publications (3)

Publication Number Publication Date
JP2010056691A true JP2010056691A (ja) 2010-03-11
JP2010056691A5 JP2010056691A5 (ja) 2011-09-29
JP5049922B2 JP5049922B2 (ja) 2012-10-17

Family

ID=41725537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008217322A Expired - Fee Related JP5049922B2 (ja) 2008-08-26 2008-08-26 画像処理装置及び画像処理方法

Country Status (2)

Country Link
US (1) US8229214B2 (ja)
JP (1) JP5049922B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012238042A (ja) * 2011-05-09 2012-12-06 Canon Inc 画像処理装置、画像処理方法、及び、プログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5843474B2 (ja) * 2011-05-09 2016-01-13 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
JP5974589B2 (ja) * 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
JP6370080B2 (ja) * 2014-04-02 2018-08-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム。
US10606242B2 (en) * 2015-03-12 2020-03-31 Canon Kabushiki Kaisha Print data division apparatus and program
JP6779688B2 (ja) * 2016-07-25 2020-11-04 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3026592B2 (ja) 1990-10-22 2000-03-27 キヤノン株式会社 輪郭抽出方法及びその装置
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP2004350240A (ja) 2003-05-26 2004-12-09 Canon Inc 画像処理装置及び画像処理方法
US7873218B2 (en) 2004-04-26 2011-01-18 Canon Kabushiki Kaisha Function approximation processing method and image processing method
ATE501487T1 (de) 2004-12-21 2011-03-15 Canon Kk Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation
FR2889371A1 (fr) * 2005-07-29 2007-02-02 Commissariat Energie Atomique Dispositif de conversion de l'energie mecanique en energie electrique par cycle de charges et de decharges electriques sur les peignes d'un condensateur
JP4773179B2 (ja) * 2005-10-14 2011-09-14 富士フイルム株式会社 撮像装置
JP4799246B2 (ja) * 2006-03-30 2011-10-26 キヤノン株式会社 画像処理方法及び画像処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012238042A (ja) * 2011-05-09 2012-12-06 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
US8995761B2 (en) 2011-05-09 2015-03-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium

Also Published As

Publication number Publication date
US20100054587A1 (en) 2010-03-04
JP5049922B2 (ja) 2012-10-17
US8229214B2 (en) 2012-07-24

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
JP5049920B2 (ja) 画像処理装置及び画像処理方法
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
JP5274495B2 (ja) 文書画像サイズ変更方法
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US20110002547A1 (en) Image processing device and image processing method
US20090284801A1 (en) Image processing apparatus and image processing method
JP2007172132A (ja) レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP5049921B2 (ja) 画像処理装置及び画像処理方法
KR101224936B1 (ko) 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체
JP5335581B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2006345314A (ja) 画像処理装置および画像処理方法
JP2009141597A (ja) 画像処理装置、文字領域特定方法、および文字領域特定プログラム
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
US8295602B2 (en) Image processing apparatus and image processing method
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP4998176B2 (ja) 翻訳装置及びプログラム
JP5517028B2 (ja) 画像処理装置
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP4552757B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2001222717A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP3720748B2 (ja) 画像処理装置及びその制御方法並びにコンピュータプログラム及び記録媒体
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP2006201885A (ja) 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110812

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110812

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120615

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120625

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees