JP4361946B2 - 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体 - Google Patents

画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体 Download PDF

Info

Publication number
JP4361946B2
JP4361946B2 JP2007205949A JP2007205949A JP4361946B2 JP 4361946 B2 JP4361946 B2 JP 4361946B2 JP 2007205949 A JP2007205949 A JP 2007205949A JP 2007205949 A JP2007205949 A JP 2007205949A JP 4361946 B2 JP4361946 B2 JP 4361946B2
Authority
JP
Japan
Prior art keywords
feature
image
feature point
point
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007205949A
Other languages
English (en)
Other versions
JP2009042942A (ja
Inventor
雅和 大平
秀義 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007205949A priority Critical patent/JP4361946B2/ja
Priority to US12/187,153 priority patent/US7986838B2/en
Priority to CN2008101461226A priority patent/CN101364268B/zh
Publication of JP2009042942A publication Critical patent/JP2009042942A/ja
Application granted granted Critical
Publication of JP4361946B2 publication Critical patent/JP4361946B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18143Extracting features based on salient regional features, e.g. scale invariant feature transform [SIFT] keypoints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明は、入力された原稿画像データと予め登録された画像データの類似度を判定するための画像処理装置に関する。
従来、この種の画像処理装置では、スキャナで原稿を読み取り、読み取って得られた画像データと、予め登録されている画像データとを照合して、画像の類似度を判定する画像処理が行われている。
例えば、OCR(Optical Character Reader)で読み取った画像データからキーワードを抽出し、抽出したキーワードにより画像の類似度を判定する方法、類似度の判定を行う画像を罫線のある帳票画像に限定して、罫線の特徴を抽出して画像の類似度を判定する方法、画像データの文字列等を点に置き換えて、点(特徴点)の位置関係を特徴量として求め画像の類似度を判定する方法などが提案されている。
また、特許文献1には、次のような画像処理装置が開示されている。すなわち、デジタルカメラで撮像された画像やスキャナで読み取った画像に対して、画像の連結部分を単語領域と見なして、その重心を特徴点として求め、この特徴点を用いて幾何学的不変量を算出し、さらに幾何学的不変量より特徴量を求め、特徴量、特徴点を表すインデックスおよび画像を表すインデックスをハッシュテーブルに登録する。
検索を行う際には、検索質問(入力画像)から、同様の処理で特徴点、特徴量、特徴点を表すインデックスを求めてハッシュテーブルにアクセスし、登録されている画像に対して投票を行って検索を行う。
上記特徴量を求める際に、ある注目特徴点に最も近いn点の特徴点を選択し、選択したn点の特徴点からm個(m<n)をさらに選択し、このm個の特徴点からd個(dはm以下の値)を抽出し、全ての組み合わせについてd個の点に係る特徴量を算出する。
国際公開第WO2006/92957A1号パンフレット(公開日:2006年9月8日)
ところで、特許文献1の検索方法では、文字の重心を特徴点とした場合に、長い英単語など、重心の変動がほとんどないパターンから計算される特徴量は、本来異なる文字列であるにも拘わらず、特徴量が一致してしまう場合がある。そのため、このようなパターンを多数含む画像に対しての判定精度が低下するといった問題がある。
本発明は、上記に鑑み、原稿画像から特徴点を求め、これらの特徴点を用いて特徴量(ハッシュ値)を算出する際、判定精度の低下を防止できる画像処理装置及び画像処理方法の提供を目的としている。
上記目的を達成するため、本発明では、原稿画像から特徴点を求め、これらの特徴点を用いて特徴量(ハッシュ値)を算出する際、複数の特徴点を選択するときに、注目特徴点に対して、最近傍の特徴点から予め指定された点数までの特徴点を注目特徴点に対して近い順に除いた上で、所定の数の特徴点を選択することで、判定精度を低下させることなく、画像の類似度を検索しようとするものである。
すなわち、本発明は、入力された原稿画像データから抽出された特徴量と、予め登録されている登録画像の特徴量とを比較して、前記入力された原稿画像データが予め登録されている登録画像に類似しているか否かの判定処理を行う画像処理装置において、前記特徴量は、前記入力された原稿画像データの複数の画素値より求められる画像の局所的な特徴を表す点を抽出して特徴点とし、ある注目特徴点に対して、その周辺の複数の特徴点を選択して、これら複数の特徴点の位置関係に基づいて計算される値であり、前記複数の特徴点を選択する際に、前記注目特徴点に対して、最近傍の特徴点から予め指定された点数までの特徴点を、注目特徴点に対して近い順に除いた上で、所定の数の特徴点を選択する近傍点選択部を備えたことを特徴とする。
上記構成によると、特徴量の計算に用いる特徴点の数を増やすことなく、したがって、計算量、データ量を増加することなく、より広範な特徴点を参照することが可能になり、異なる画像データから抽出された特徴点の形状が局所的に類似してしまう場合の特徴量を異なる値として算出可能になる。
これにより、異なる文字列から求められた特徴点の特徴量が一致してしまい、誤って一致している特徴点と判定されて、最終的な文書画像の類似判定精度が低下することを抑制することができる。
例えば、文字の重心を特徴点とした場合に、長い英単語など、重心の変動がほとんどないパターンから計算される特徴量が一致してしまう場合があるが、このようなパターンを多数含んだ画像を識別しなければならないケースで特に効果がある。
ここで、「入力された原稿画像データ」とは、(ア)スキャナにより原稿を読み取ることにより入力される画像データ、(イ)電子データのフォーマットに、コンピュータ(ソフトウェア)を用いて必要事項を入力して作成される電子データ、の2通りを意味する。実使用を考えた場合、紙ベースのデータをスキャナーにより読み取って電子化したものと、電子データで直接作成したものとの2通りが考えられる。
また、本発明の画像形成装置は、上記したいずれかに記載の画像処理装置と、入力画像データに応じた画像を記録材上に形成する画像出力部とを備えていることを特徴とする。
上記構成によると、特徴量の計算に用いる特徴点の数を増やすことなく、したがって、計算量、データ量を増加することなく、より広範な特徴点を参照することが可能となり、異なる画像データから抽出された特徴点の形状が局所的に類似してしまう場合の特徴点と判定されて、最終的な文書画像の類似判定精度が低下することを抑制することができる。
これにより、異なる文字列から求められた特徴点の特徴量が一致してしまい、誤って一致している特徴点と判定されて、最終的な文書画像の類似判定精度が低下することを抑制することができる。
また、本発明に係る画像処理方法では、入力された原稿画像データから抽出された特徴量と、予め登録されている登録画像の特徴量とを比較して、上記入力された原稿画像データが予め登録されている登録画像に類似しているか否かの判定を行う画像処理方法において、上記特徴量は、上記入力された原稿画像データの複数の画素値より求められる画像の局所的な特徴を表す点を抽出して特徴点とし、ある注目特徴点に対してその周辺の複数の特徴点を選択してこれら複数の特徴点の位置関係に基づいて計算される値であり、上記複数の特徴点を選択する際に、上記注目特徴点の少なくとも最近接の位置に存在する特徴点を除いて複数の特徴点を選択することを特徴とする。
上記構成によると、特徴量の計算に用いる点の数を増やすことなく、したがって、計算量、データ量を増加することなく、より広範な特徴点を参照することが可能になり、異なる画像データから抽出された特徴点の形状が局所的に類似してしまう場合の特徴量を異なる値として算出可能になる。
さらに、本発明に係る画像処理装置を動作させるプログラムは、コンピュータを上記各手段として機能させるためのプログラムを備えている。
上記構成によると、異なる文字列から求められた特徴量が一致してしまい、誤って一致していると判定されるのを抑制することができるので、照合精度が向上した処理をソフトウェアで実現することができる。
さらに、本発明に係る記録媒体は、上記プログラムを記録した、コンピュータで読取り可能な記録媒体も提供することができる。
上記構成によると、記録媒体から読み出されたプログラムによって、画像読取装置、画像形成装置の動作を制御することができる。また、コンピュータを用いて、上記画像処理方法をコンピュータ上に実現することができる。
以上のとおり、本発明によると、注目特徴点の近傍の特徴点を除いて特徴点を抽出し、これらの特徴点を用いて特徴量を算出することで、判定精度を低下させることなく、画像の類似度を検索することができる。
以下、本発明の実施形態を図面に基づいて説明する。図1は本発明で用いる特徴点算出部の構成例を示す。図2は本発明で用いる文書照合処理部の構成ブロック図である。図3は文書照合処理のフローチャートである。
まず、本発明の本質的特徴部分である文書照合処理部の構成を図2に基づいて説明する。文書照合処理部101は、特徴点算出部102、特徴量算出部103、投票処理部104、類似度判定処理部105、登録処理部106、制御部107およびメモリ108から構成される。
特徴点算出部102は、文字列や罫線の連結成分を抽出し、連結成分の重心を特徴点110として算出する。図4は英文字「A」の連結成分の重心110を示す図である。図5は文字列111における特徴点抽出結果を示す図である。
特徴量算出部103は、特徴点算出部102で算出された特徴点110を用いて、回転、拡大、縮小に対して不変な量、すなわち、原稿画像の回転、平行移動、拡大縮小を含む幾何学的変化に対して不変なパラメータである特徴量を算出する。特徴量を計算するために注目特徴点の近傍の特徴点を選択して用いる。
本発明では、この特徴点を選択する際に、あらかじめ指定された点数分の最近傍の特徴点は除いて、特徴点を選択する。その理由および算出方法の一例は後述する。
投票処理部104は、原稿より算出された特徴量(ハッシュ値)を用いて、ハッシュテーブルに登録されている原稿に投票する。図9は原稿と得票数との関係を示すグラフである。
類似度判定処理部105は、投票処理部104の投票処理結果に基づいて、最大の得票数を得た原稿(インデックス)および得票数を抽出する。また、抽出された得票数を予め定められている閾値と比較して類似度を算出する。あるいは、抽出された得票数をその原稿が有している最大得票数で除算して正規化し、その結果と予め定められている閾値との比較を行う。この場合の閾値の例としては、例えば、0.8以上に設定する方法が挙げられる。手書き部分があると、投票数は最大得票数より大きくなることがあるため、類似度が1より大きくなる場合もあり得る。
最大得票数は、特徴点の数×1つの特徴点(注目特徴点)から算出されるハッシュ値の数で表される。図6および図7の例では、最も簡単例として、1つの特徴点から1つのハッシュ値が算出される例を示しているが、注目特徴点の周辺の特徴点を選択する方法を変えると、1つの特徴点から複数のハッシュ値を算出することができる。例えば、注目特徴点の周辺の特徴点として6点を抽出し、この6点から5点を抽出する組合せは6通り存在する。そして、これら6通りのそれぞれについて、5点から3点を抽出して不変量を求め、ハッシュ値を算出する方法が挙げられる。
登録処理部106は、原稿より算出された特徴量(ハッシュ値)に応じて原稿を表すインデックス(原稿ID)を登録する。登録処理を行う場合、投票処理部104および類似度判定処理部105の処理はスルー(何も処理を行わない)となる。また、逆に、文章照合処理を行う場合は、登録処理部106の処理はスルーになる。
制御部107は、マイクロコンピュータのCPUから構成され、上記各処理部102〜106およびメモリ108へのアクセスを制御する。
次に、特徴点算出部102の構成を図1に基づいて説明する。特徴点算出部102は、無彩化処理部112、解像度変換部113、MTF補正処理部114、2値化処理部115、および重心算出部116から構成される。
無彩化処理部112は、入力画像データがカラー画像であった場合に無彩化して、明度もしくは輝度信号に変換するための処理部である。例えば、下記式より輝度Yを求める。
Figure 0004361946
上記の方法ではなく、RGB信号をCIE1976L***信号(CIE: Commission International de l'Eclairage、 L*: 明度、a* , b*::色度)に変換しても良い。
解像度変換部113は、入力画像データが画像入力装置で光学的に変倍されていた場合に、所定の解像度になるように再度変倍する処理を行う。また、解像度変換部113では、後段の処理量を軽減するために、画像入力装置で等倍時に読み込まれる解像度よりも解像度を落とすための解像度変換としても用いられる。例えば、600dpi(dot per inch )で読み込まれた画像データを300dpiに変換する。
MTF補正処理部114は、電子回路における光ピックアップの持つ伝達特性(MTF:Modulation Transfer Function:振幅伝達関数)を補正処理するもので、画像入力装置の空間周波数特性が機種ごとに異なることを吸収するために用いられる。
CCDの出力する画像信号には、レンズやミラー等の光学部品、CCDの受光面のアパーチャ開口度、転送効率や残像、物理的な走査による積分効果及び操作むら等に起因し、MTF(Modulation Transfer Function:振幅伝達関数)の劣化が生じている。そのため、MTFの劣化により、読み込まれた画像がぼやけたものとなっている。
MTF補正処理部では、適切なフィルタ処理(強調処理)を施すことにより、MTFの劣化により生じるぼやけを修復する処理を行う。また、後段の特徴点抽出処理に不要な高周波成分を抑制するためにも用いる。すなわち、混合フィルタ(フィルタ係数は図13を参照)を用いて強調及び平滑化処理を行う。
2値化処理部115は、無彩化された画像データ(輝度値(輝度信号)又は明度値(明度信号))を閾値と比較することにより画像を二値化する。
重心算出部116では、2値化された画像データ(例えば、「1」、「0」で表される)に基づいて、各画素に対してラベリング(ラベル付け処理)を行い、同一ラベルが付された画素が連結した連結領域を特定し、特定した連結領域の重心110を特徴点として抽出し、抽出した特徴点110を特徴量算出部103へ出力する。なお、特徴点110は、二値画像における座標値(x座標、y座標)で表すことができる。
次に、特徴量算出部103の構成と特徴量算出方法の例を示す。特徴量算出部103は、図10に示すように、特徴点算出部102で抽出した複数の特徴点から注目特徴点に周辺の特徴点を選択する処理を行う近傍点選択部117と、選択された近傍点からハッシュ値(特徴量)を算出するハッシュ値算出部118とを備えている。
また、特徴量の算出方法の例を以下に示す。
・ 特徴点算出部102において、2値化された画像データの連結部分について、重心(特徴点)を算出する。図4および図5は文字列に対して特徴点を算出した例を示す。
・ 注目特徴点に対して、周辺の特徴点を選択する(近傍点選択部117)。図6に示すように、注目特徴点aに対して、周辺の特徴点をb,c,d,e,fとすると、注目特徴点aに対して距離が近いものから順に周辺の特徴点b,c,d,eの4点が選択される。
・ 選択した特徴点4点からさらに3点を選択し(近傍点選択部117)、3種類(図7(a)〜(c)、(d)〜(f))の不変量Hijが求められる。例えば、下記式により、余りをハッシュ値Hi(特徴量)とする(ハッシュ値算出部118)。
Figure 0004361946
あるいは、選択した特徴点4点からさらに3点を選択し、4種類(図8(a)〜(d)、(e)〜(h))の不変量Hijが求められる。例えば、下記式により、ハッシュ値Hi(特徴量)を求めるようにしても良い。
Figure 0004361946
ここで、ハッシュ値を算出する式は上記以外の一般的に知られているハッシュ関数を用いても構わない。
また、不変量Hijは、例えば、次式で算出する。
Figure 0004361946
特徴点間の距離Aij、Bijは、それぞれの特徴点の座標より算出する。これによりHijは相似変換に対して不変な値となる。
・ ハッシュ値と原稿を表すインデックス(IDk)をハッシュテーブルに登録する(図9参照)。ハッシュ値が同じ場合(図9(b)では、H1=H5)、テーブルを1つにまとめても良い。
次に、特徴量を算出する際の特徴点選択方法について説明する。注目特徴点に対して、例えば、周辺の特徴点を4点選択し、さらに選択した特徴点4点より3点を選択して、3種類、あるいは4種類の不変量を求める場合、互いに異なる文字列であるが、重心の位置変動が小さい場合などに、特徴点の形状が類似していて、同じ特徴量が算出される場合がある。
例えば、図16は重心の位置変動が小さい例を模擬的に表したものであり、同図(a)、(b)は異なる文字列を現す。図16において、丸は特徴点を表し、塗りつぶした丸は注目特徴点の特徴量を計算するために選択された特徴点を示す。
図16(a)(b)に示すように、異なる文字列から抽出された特徴点であるのに、一致していると判定される。このために、判定精度が低下する。特に、英文等で顕著である。
そこで、本発明では、注目特徴点に対して、周辺の特徴点を選択する際に、最近傍の点から予め指定された点数までの特徴点を注目特徴点に対して近い順に除いた上で、所定の数の特徴点を選択する。
注目特徴点からより離れた特徴点までを選択することにより、異なる画像パターン(文字列)から同じ形状の特徴点が選択される可能性が小さくなり、異なるパターンについて誤って特徴量が一致する確率を小さくできる。
図17は図16(a)(b)の文字列に対応する特徴点の選択する本発明の方法を示す図であり、特徴点の選択時に指定点数を「1」とし、つまり、最近傍の特徴点を除く例を示したものである。異なる文字列であるのに、注目特徴点の特徴量を計算するために、選択された特徴点4点の形状が類似しており、そのため、求めた注目特徴点の特徴量が一致してしまう例を示している。
これに対して、図17(a)(b)の例では、最近傍の特徴点を除いて4点を選択したことで、図16の場合よりも一点分遠い点が参照されるために、選択された4点の形状に差異が発生して特徴点が異なる値をとることを示している。
図18(a)(b)は、指定点数として最近傍から2点の特徴点を除く例を示す。この例では、図17の場合よりもさらに遠い点が注目特徴点の特徴量計算に用いられる。そのため、算出された特徴量が誤って一致する可能性はさらに小さくなる。
次に、図3のフローチャートに基づいて文書照合全体の処理を説明すると、まず、登録モードが選択された否かを判断し、登録モードの場合、入力された原稿画像データから特徴点を算出する処理を行い、算出した特徴点から特徴量を算出する処理を行い、特徴量、原稿を表すインデックスをテーブルに登録する処理を行って終了する。
登録モードでない場合、登録モードと同様にまず、特徴点を算出する処理を行い、その算出された特徴点から特徴量を算出し、登録されている登録画像の特徴量とを比較して、前記入力された原稿画像データが予め登録されている登録画像に類似しているか否かの判定を行い、その判定結果が類似性がある場合、所定の処理が必要か否かを判断し、必要な場合、判定信号「1」を出力して終了する。処理が不要な場合、または類似性がない場合には、判定信号「0」を出力して終了する。
本発明は、このような文書照合処理において、特徴量の算出において、注目特徴点に対して、周辺の特徴点を選択する際に、最近傍の点から予め指定された点数までの特徴点を注目特徴点に対して近い順に除いた上で、所定の数の特徴点を選択することにある。指定点数は、例えば「1」とすれば、注目特徴点に最も近い特徴点を除いて、特徴点を選択する。指定点数「2」の場合、注目特徴点に最も近い特徴点と2番目に近い特徴点とを除いて、所定の数の特徴点を選択する。
上記特徴点の選択により特徴量を算出することで、判定精度を低下させることなく、画像の類似度を検索することができる。
図12は本発明を適用する画像処理装置としてのデジタルカラー複写機の構成ブロックを示す。デジタルカラー複写機121は、カラー画像入力装置122、カラー画像処理装置123、およびカラー画像出力装置124により構成される。
カラー画像入力装置122は、例えば、CCDなどの光学情報を電気信号に変換するデバイスを備えたスキャナ部より構成され、原稿からの反射光像を、RGBのアナログ信号として出力する。
カラー画像入力装置122にて読み取られたアナログ信号は、カラー画像処理装置123内を、A/D変換部125、シェーディング補正部126、文書照合処理部127、入力階調補正部128、領域分離処理部129、色補正部130、黒生成下色除去部131、空間フィルタ処理部132、出力階調補正部133、および階調再現処理部134の順で送られ、C(シアン)、M(マゼンタ)、Y(イエロー)、K(ブラック)のデジタルカラー信号として、カラー画像出力装置124へ出力される。
A/D変換部125は、RGB(R:赤・G:緑・B:青)のアナログ信号をデジタル信号に変換するもので、シェーディング補正部126では、A/D変換部125より送られてきたデジタルのRGB信号に対して、カラー画像入力装置122の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施す。また、カラーバランスを整えると同時に、濃度信号などカラー画像処理装置123に採用されている画像処理システムの扱い易い信号に変換する処理を施す。
文書照合処理部127では、特徴点算出処理を行い、その結果を用いて事前に登録されている文書画像データとの類似度を判定する。類似ありと判定された場合は、図3に示すように、複写、電子配信、ファクシミリ送信、ファイリングなどの処理を禁止する。文書照合処理部127は、入力されたRGB信号をそのまま後段の入力階調補正部128へ出力する。
入力階調補正部128は、シェーディング補正部126にて各種の歪みが取り除かれたRGB信号に対して、下地濃度の除去やコントラストなどの画質調整処理が施される。
領域分離処理部129は、RGB信号より、入力画像中の各画素を文字領域、網点領域、写真領域のいずれかに分離するものである。領域分離処理部129は、分離結果に基づき、画素がどの領域に属しているかを示す領域識別信号を、黒生成下色除去部131、空間フィルタ処理部132および階調再現処理部134へと出力すると共に、入力階調補正部128より出力された入力信号をそのまま後段の色補正部130に出力する。
色補正部130では、色再現の忠実化を図るために、不要吸収成分を含むCMY色材の分光特性に基づいた色濁りを取り除く処理を行う。
黒生成下色除去部131は、色補正後のCMYの3色信号から黒(K)信号を生成する黒生成、元のCMY信号から黒生成で得たK信号を差し引いて新たなCMY信号を生成する処理を行う。これによりCMYの3色信号はCMYKの4色信号に変換される。
空間フィルタ処理部132は、黒生成下色除去部131より入力されるCMYK信号の画像データに対して、領域識別信号を基にデジタルフィルタによる空間フィルタ処理を行い、空間周波数特性を補正する。これにより出力画像のぼやけや粒状性劣化を軽減することができる。
階調再現処理部134では、空間フィルタ処理部132と同様に、CMYK信号の画像データに対して、領域識別信号に基づいて後述する所定の処理が施される。
例えば、領域分離処理部129にて文字に分離された領域は、文字の再現性を高めるために、空間フィルタ処理部132における空間フィルタに高周波成分の強調量が大きいフィルタが用いられる。同時に、階調再現処理部134においては、高域周波成分の再現に適した高解像度のスクリーンによる二値化もしくは多値化処理が実施される。
また、領域分離処理部129にて網点に分離された領域に関しては、空間フィルタ処理部132において、入力網点成分を除去するためのローパス・フィルタ処理が施される。
そして、出力階調補正部133では、濃度信号などの信号をカラー画像出力装置124の特性値である網点面積率に変換する出力階調補正処理を行った後、階調再現処理部134で、最終的に画像を画素に分離してそれぞれの階調を再現できるように処理する階調再現処理が施される。領域分離処理部129にて写真に分離された領域に関しては、階調再現性を重視したスクリーンでの二値化または多値化処理が行われる。
上述した各処理が施された画像データは、いったん記憶装置に記憶され、所定のタイミングで読み出されてカラー画像出力装置に入力される。
このカラー画像出力装置124は、画像データを紙などの記録媒体上に出力するもので、例えば、電子写真方式やインクジェット方式を用いたカラー無像出力装置等をあげることができるが、特にこれに限定されるものではない。なお、以上の処理は不図示のCPU(Central Processing Unit)により制御される。
なお、本発明は、デジタル複写機ではなく、コピア機能、プリンタ機能、ファクシミリ送信機能、scan to e-mail機能等を備えるデジタルカラー複合機141(図15参照)に適用してもよい。
図15に示すように、デジタルカラー複合機141は、さらに、例えば、モデムやネットワークカードよりなる通信装置142を備えている。ファクシミリの送信を行うときは、モデムにて、相手先との送信手続きを行い送信可能な状態が確保されると、所定の形式で圧縮された画像データ(スキャナで読み込まれた画像データ)をメモリから読み出し、圧縮形式の変更など必要な処理を施して、相手先に通信回線を介して順次送信する。
ファクシミリを受信する場合、CPUは、通信手続きを行いながら相手先から送信されてくる画像データを受信して画像処理装置123に入力する。画像処理装置123では、受信した画像データを、不図示の圧縮/伸張処理部にて伸張処理を施す。伸張された画像データは、必要に応じて、回転処理や解像度変換処理が行なわれ、出力階調補正、階調再現処理が施され、画像出力装置124より出力される。
また、ネットワークカード、LANケーブルを介して、ネットワークに接続されたコンピュータや他のデジタル複合機とデータ通信を行なうこともできる。
なお、上記では、カラー複合機141について説明したが、モノクロの複合機であっても構わない。また、単体のファクシミリ通信装置であっても構わない。
図13は本発明の本質的特徴部分を構成する文書照合処理部を備えた画像読取装置(フラットベッドスキャナ)の構成を示すブロック図である。図に示すように、カラー画像処理装置123は、A/D変換部125、シェーディング補正部126および文書照合処理部127から構成されており、これに、カラー画像入力装置122が接続され、全体として画像読取装置151を構成している。
カラー画像入力装置(画像読取部)122は、例えばCCD(Charge Coupled Device )を備えたスキャナ部より構成され、原稿からの反射光像を、RGB(R:赤・G:緑・B:青)のアナログ信号としてCCDにて読み取って、カラー画像処理装置に入力するものである。
カラー画像入力装置122にて読み取られたアナログ信号は、カラー画像処理装置123内を、A/D変換部125、シェーディング補正部126、文書照合処理部127の順で送られる。
A/D(アナログ/デジタル)変換部125は、RGBのアナログ信号をデジタル信号に変換するもので、シェーディング補正部126は、A/D変換部125より送られてきたデジタルのRGB信号に対して、カラー画像入力装置122の照明系、結像系、撮像系で生じる各種の歪みを取り除く処理を施すものである。また、シェーディング補正部126では、カラーバランスの調整を行う。また、シェーディング補正部126では、RGBの反射率信号を濃度信号に変換する。
文書照合処理部127は、特徴点算出処理を行い、その結果を用いて事前に登録されている文書画像データとの類似度を判定する。類似ありと判定された場合は、複写、電子配信、ファクシミリ送信、ファイリングなどの処理を禁止する判定信号を出力する。
判定信号は、読み込まれた画像データとともにネットワークを介してプリンタや複合機に送信され出力される。あるいは、コンピュータを介してプリンタに、もしくは、直接プリンタに入力される。この場合、プリンタや複合機、コンピュータ側で処理内容を表す信号を判断できるようにしておく必要がある。上記判定信号を出力するのではなく、特徴量を出力するようにしても良い。
なお、本実施形態の画像読取装置として、デジタルカメラを用いても良い。
また、本発明は、コンピュータに実行させるためのプログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を記録したコンピュータ読み取り可能な記録媒体に、上記した文書照合並びに出力制御を行う画像処理方法を記録することができる。
この結果、文書照合並びに出力制御、原稿画像の登録処理を行う画像処理方法を行うプログラムコードを記録した記録媒体を持ち運び自在に提供することができる。
なお、本実施の形態では、この記録媒体としては、マイクロコンピュータで処理が行われるために、図示していないメモリ、例えばROMのようなもの、そのものがプログラムメディアであっても良いし、また、図示していないが外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであっても良い。
いずれの場合においても、格納されているプログラムは、マイクロプロセッサがアクセスして実行させる構成であっても良いし、あるいは、いずれの場合もプログラムコードを読み出し、読み出されたプログラムコードは、マイクロコンピュータの図示されていないプログラム記憶エリアにダウンロードされて、そのプログラムコードが実行される方式であってもよい。このダウンロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であっても良い。
また、本実施の形態においては、インターネットを含む通信ネットワークを接続可能なシステム構成であることから、通信ネットワークからプログラムコードをダウンロードするように流動的にプログラムを担持する媒体であっても良い。
なお、このように通信ネットワークからプログラムコードをダウンロードする場合には、そのダウンロード用のプログラムは予め本体装置に格納しておくか、あるいは別な記録媒体からインストールされるものであっても良い。
なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
上記記録媒体は、デジタルカラー画像形成装置やコンピュータシステムに備えられるプログラム読み取り装置により読み取られることで上述した画像処理方法が実行される。
コンピュータシステムは、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、所定のプログラムがロードされることにより上記画像処理方法など様々な処理が行われるコンピュータ、コンピュータの処理結果を表示するCRTディスプレイ・液晶ディスプレイなどの画像表示装置およびコンピュータの処理結果を紙などに出力するプリンタより構成される。さらには、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどが備えられる。
以上のとおり、本発明は、注目特徴点の近傍の予め指定する点数の特徴点を除いて、特徴点を抽出し、これらの特徴点を用いて特徴量を算出することで、判定精度を低下させることなく、画像の類似度を検索することができる。
本発明の実施形態である画像処理装置の特徴点算出部の構成ブロック図 本発明の画像処理装置における文書照合処理部の構成ブロック図 本発明の文書照合処理のフローチャート 文字の連結成分の重心を示す図 本発明の特徴点抽出結果を示す図 特徴点と注目特徴点との関係を示す図 (a)〜(f)は1つの特徴点から1つのハッシュ値が算出される例を示す図 (a)〜(h)は1つの特徴点から1つのハッシュ値が算出される別の例を示す図 (a)(b)はハッシュ値と原稿を表すインデックスとの関係を示す図 本発明の投票処理部の処理方法を示すための原稿と得票数との関係図 本発明の特徴量算出部の構成ブロック図 本発明を適用したデジタルカラー複写機の構成ブロック図 本発明を適用した画像読取装置の構成ブロック図 ハッシュテーブルを表す図 本発明を適用したデジタルカラー複合機の構成ブロック図 (a)(b)はそれぞれ異なる文字列において、重心の位置変動が小さい例を模擬的に表した図 図16に対応する文字列について、本発明の特徴点の選択例を示す図 図16に対応する文字列について、本発明の別の特徴点選択例を示す図
符号の説明
101 文書照合処理部
102 特徴点算出部
103 特徴量算出部
104 投票処理部
105 類似度判定処理部
106 登録処理部
107 制御部
108 メモリ
112 無彩化処理部
113 解像度変換部
114 MTF補正処理部
115 2値化処理部
116 重心算出部

Claims (7)

  1. 入力された原稿画像データから抽出された特徴量と、予め登録されている登録画像の特徴量とを比較して、前記入力された原稿画像データが予め登録されている登録画像に類似しているか否かの判定処理を行う画像処理装置において、
    前記特徴量は、前記入力された原稿画像データの複数の画素値より求められる画像の局所的な特徴を表す点を抽出して特徴点とし、ある注目特徴点に対して、その周辺の複数の特徴点を選択して、これら複数の特徴点の位置関係に基づいて計算される値であり、前記複数の特徴点を選択する際に、前記注目特徴点に対して、最近傍の特徴点から予め指定された点数までの特徴点を、前記注目特徴点に対して近い順に除いた上で、所定の数の特徴点を選択する近傍点選択部を備えたことを特徴とする画像処理装置。
  2. 前記近傍点選択部では、複数の特徴点を選択する際に、前記注目特徴点の少なくとも最近接の位置に存在する特徴点を除いて複数の特徴点を選択することを特徴とする請求項1に記載の画像処理装置。
  3. 前記近傍点選択部では、複数の特徴点を選択する際に、前記注目特徴点の少なくとも最近接の位置に存在する特徴点と、2番目に近い位置に存在する特徴点とを除いて複数の特徴点を選択することを特徴とする請求項1に記載の画像処理装置。
  4. 請求項1〜3のいずれかに記載の画像処理装置と、入力画像データに応じた画像を記録材上に形成する画像出力部とを備えていることを特徴とする画像形成装置。
  5. 入力された原稿画像データから抽出された特徴量と、予め登録されている登録画像の特徴量とを比較して、前記入力された原稿画像データが予め登録されている登録画像に類似しているか否かの判定を行う画像処理方法において、
    前記特徴量は、前記入力された原稿画像データの複数の画素値より求められる画像の局所的な特徴を表す点を抽出して特徴点とし、ある注目特徴点に対してその周辺の複数の特徴点を選択してこれら複数の特徴点の位置関係に基づいて計算される値であり、前記複数の特徴点を選択する際に、前記注目特徴点に対して、最近傍の特徴点から予め指定された点数までの特徴点を、前記注目特徴点に対して近い順に除いた上で、所定の数の特徴点を選択することを特徴とする画像処理方法。
  6. 請求項1〜3のいずれかに記載の画像処理装置を動作させるためのプログラムであって、コンピュータを前記特徴点算出部として機能させるプログラム。
  7. 請求項6に記載のプログラムを格納した、コンピュータで読取り可能な記録媒体。
JP2007205949A 2007-08-07 2007-08-07 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体 Active JP4361946B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2007205949A JP4361946B2 (ja) 2007-08-07 2007-08-07 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体
US12/187,153 US7986838B2 (en) 2007-08-07 2008-08-06 Image processing apparatus and image processing method
CN2008101461226A CN101364268B (zh) 2007-08-07 2008-08-06 图像处理装置和图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007205949A JP4361946B2 (ja) 2007-08-07 2007-08-07 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体

Publications (2)

Publication Number Publication Date
JP2009042942A JP2009042942A (ja) 2009-02-26
JP4361946B2 true JP4361946B2 (ja) 2009-11-11

Family

ID=40346611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007205949A Active JP4361946B2 (ja) 2007-08-07 2007-08-07 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体

Country Status (3)

Country Link
US (1) US7986838B2 (ja)
JP (1) JP4361946B2 (ja)
CN (1) CN101364268B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2671374B1 (en) 2011-01-31 2015-07-22 Dolby Laboratories Licensing Corporation Systems and methods for restoring color and non-color related integrity in an image
JP2012234258A (ja) * 2011-04-28 2012-11-29 Sony Corp 画像処理装置と画像処理方法およびプログラム
JP5821598B2 (ja) * 2011-12-12 2015-11-24 富士ゼロックス株式会社 画像処理装置及びプログラム
CN102915540A (zh) * 2012-10-10 2013-02-06 南京大学 基于改进的Harris-Laplace和SIFT描述符的影像匹配方法
CN105659287B (zh) 2013-08-28 2018-08-17 株式会社理光 图像处理装置、图像处理方法和成像***
JP7312357B2 (ja) * 2019-05-16 2023-07-21 京セラドキュメントソリューションズ株式会社 画像形成装置
EP4016464A1 (en) 2020-11-26 2022-06-22 Ricoh Company, Ltd. Apparatus, system, method, and carrier means

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903454A (en) * 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US5465353A (en) * 1994-04-01 1995-11-07 Ricoh Company, Ltd. Image matching and retrieval by multi-access redundant hashing
WO2006092957A1 (ja) 2005-03-01 2006-09-08 Osaka Prefecture University Public Corporation 文書・画像検索方法とそのプログラム、文書・画像登録装置および検索装置
CN100444190C (zh) * 2006-10-30 2008-12-17 邹采荣 一种基于加权主动形状建模的人脸特征定位方法

Also Published As

Publication number Publication date
CN101364268B (zh) 2011-08-31
CN101364268A (zh) 2009-02-11
US7986838B2 (en) 2011-07-26
US20090041360A1 (en) 2009-02-12
JP2009042942A (ja) 2009-02-26

Similar Documents

Publication Publication Date Title
JP4604100B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラムおよび記憶媒体
JP4538507B2 (ja) 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
JP4137890B2 (ja) 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
US8351706B2 (en) Document extracting method and document extracting apparatus
US8452100B2 (en) Image processing apparatus, image forming apparatus and image reading apparatus including the same, and image processing method
JP4495197B2 (ja) 画像処理装置、画像形成装置、画像処理プログラムおよび画像処理プログラムを記録する記録媒体
US20080219560A1 (en) Image processing method, image processing apparatus, and image forming apparatus
US8300944B2 (en) Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, image processing system, and storage medium
JP4913094B2 (ja) 画像照合方法、画像照合装置、画像データ出力処理装置、プログラム及び記憶媒体
JP4362538B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
JP4361946B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびそのプログラムが格納された記録媒体
JP4457140B2 (ja) 画像処理方法、画像処理装置、画像形成装置、画像読取装置、コンピュータプログラム及び記録媒体
JP2006203701A (ja) 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体
JP4362537B2 (ja) 画像処理装置、画像形成装置、画像送信装置、画像読取装置、画像処理システム、画像処理方法、画像処理プログラムおよびその記録媒体
US8184912B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
JP4588771B2 (ja) 画像処理方法、画像処理装置、画像形成装置、プログラム及び記憶媒体
JP4105539B2 (ja) 画像処理装置およびそれを備えた画像形成装置ならびに画像処理方法、画像処理プログラムおよび記録媒体
JP4393556B2 (ja) 画像処理方法、画像処理装置、画像読取装置、画像形成装置、コンピュータプログラム及びコンピュータでの読み取りが可能な記録媒体
JP2009095007A (ja) 画像データ出力処理装置、画像データ出力処理方法、プログラム及び記録媒体
US20080181534A1 (en) Image processing method, image processing apparatus, image reading apparatus, image forming apparatus and recording medium
JP2010273119A (ja) 画像処理装置、画像形成装置、画像処理方法、コンピュータプログラム及び記録媒体
JP4378408B2 (ja) 画像処理装置、画像読取装置、及び画像形成装置
JP6618307B2 (ja) 画像処理装置、画像形成装置、及び、解像度決定方法
JP6441772B2 (ja) 画像処理装置、画像形成装置、及び、画像処理方法
JP2004214908A (ja) 画像処理装置、及びそれを備えた画像形成装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090721

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090813

R150 Certificate of patent or registration of utility model

Ref document number: 4361946

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130821

Year of fee payment: 4