JP6569500B2 - 画像処理装置及び画像処理方法 - Google Patents

画像処理装置及び画像処理方法 Download PDF

Info

Publication number
JP6569500B2
JP6569500B2 JP2015236467A JP2015236467A JP6569500B2 JP 6569500 B2 JP6569500 B2 JP 6569500B2 JP 2015236467 A JP2015236467 A JP 2015236467A JP 2015236467 A JP2015236467 A JP 2015236467A JP 6569500 B2 JP6569500 B2 JP 6569500B2
Authority
JP
Japan
Prior art keywords
picture
image
background
area
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015236467A
Other languages
English (en)
Other versions
JP2016110647A (ja
Inventor
シエ・シュフゥ
リィウ・ウェイ
ファヌ・ウエイ
俊 孫
俊 孫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2016110647A publication Critical patent/JP2016110647A/ja
Application granted granted Critical
Publication of JP6569500B2 publication Critical patent/JP6569500B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

本公開は、画像処理分野に関し、具体的には透き通しの除去装置及び方法に関する。
この部分は本公開に関する背景情報を提供し、必ずしも従来技術ではない。
両面に手書き又は印刷のテキスト/ピクチャが存在する文書では、裏面文書の内容の影響により、表面文書の背景領域には裏面の透き通しのテキスト又はピクチャが存在することがある。同様な現象は裏面文書にも存在する。図1A及び図1Bに示すように、このような現象が透き通し(show−through又はbleed−through)と称される。通常、スキャンした文書画像内の透き通しを除去する方法は、主に2種類がある。1つは、片面の画像の情報に基づいてのみ透き通しを除去する。もう1つは、両面の画像の情報に基づいて透き通しを除去する。2つ目の方法は、1つ目の方法に比べて、両面の画像の情報に基づいて文書画像の前景領域を取得する。より多くの情報を用いるため、透き通し領域をより正確に除去できる。2つ目の方法では、文書画像の前景領域を効果的に抽出するのは重要である。
図2A及び図2Bに示すように、文書画像の前景層はピクチャ及びテキストの2つの部分を含む。多くの従来のローカル二値化/グローバル二値化の方法は、画像の前景層を抽出するために用いられてもよい。例えば、設定された色又は輝度の閾値に基づいて、画像の画素を前景画素と背景画素に分類する。しかし、これらのローカル二値化/グローバル二値化の方法は、単一の画素又は局所領域内の情報のみ利用している。文書のピクチャ領域では、ある画素の色と背景画素の色と非常に近いため、背景画素に誤って分類されてしまう。これは前景画素の紛失に繋がる。テキスト行を位置決めする方法を用いることができるが、画像におけるピクチャが複雑な色分布及び不規則な形状を有するため、これらの方法はピクチャ領域の前景層を効果的に抽出しにくい。よって、本公開は、文書の前景領域を効果的に抽出する方法を提供する。
この部分は本公開の一般的な概要を提供するが、その全ての範囲又はその全ての特徴を全て開示するものではない。
本公開は、文書画像の前景層を直接に位置決めすることなく、相対的に位置決めやすい背景層を検出し、検出された背景層を除去することで、文書画像の前景層をより効果的に取得できる画像処理装置及び画像処理方法を提供することを目的とする。
本公開の一の態様では、画像処理装置であって、画素を含む画像を取得する画像取得手段と、前記画像からピクチャ領域を検索するピクチャ検索手段と、前記画像の前記ピクチャ領域を含まない非ピクチャ領域及び前記ピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得する背景取得手段であって、前記非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、前記ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる、背景取得手段と、前記非ピクチャ領域及び前記ピクチャ領域から前記非ピクチャ背景連結成分及び前記ピクチャ背景連結成分をそれぞれ除去することで、前記非ピクチャ領域の非ピクチャ前景領域及び前記ピクチャ領域のピクチャ前景領域をそれぞれ取得する前景取得手段であって、前記非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、前記ピクチャ前景領域における各画素がピクチャ前景画素と見なされる、前景取得手段と、前記非ピクチャ領域の非ピクチャ前景領域と前記ピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得する合併手段であって、前記画像前景領域における各画素が画像前景画素と見なされる、合併手段と、を含む、装置を提供する。
本公開の他の態様では、画像処理方法であって、画素を含む画像を取得するステップと、前記画像からピクチャ領域を検索するステップと、前記画像の前記ピクチャ領域を含まない非ピクチャ領域及び前記ピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得するステップであって、前記非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、前記ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる、ステップと、前記非ピクチャ領域及び前記ピクチャ領域から前記非ピクチャ背景連結成分及び前記ピクチャ背景連結成分をそれぞれ除去することで、前記非ピクチャ領域の非ピクチャ前景領域及び前記ピクチャ領域のピクチャ前景領域をそれぞれ取得するステップであって、前記非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、前記ピクチャ前景領域における各画素がピクチャ前景画素と見なされる、ステップと、前記非ピクチャ領域の非ピクチャ前景領域と前記ピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得するステップであって、前記画像前景領域における各画素が画像前景画素と見なされる、ステップと、を含む、方法を提供する。
本公開の他の態様では、コンピュータが命令コードを読み取って実行する時に前記コンピュータに本公開に記載の画像処理方法を実行させるための機器読み取り可能な前記命令コードを記憶したプログラムプロダクトを提供する。
本公開の他の態様では、本公開に記載のプログラムプロダクトを記録した機器読み取り可能な記憶媒体を提供する。
本公開の画像処理装置及び方法を用いることで、文書画像を候補ピクチャ領域と非候補ピクチャ領域に分類できる。そして、この2種類の領域の背景層を位置決めする。この2種類の領域の背景層を検出した後に、背景層を除去し、文書画像の初期前景層を取得する。最後に、文書の初期前景層に対して小さなノイズを除去して、最終的な前景層画像を取得することで、文書画像の前景層をより効果的に取得できる。
この概要に記述、特定された例は、単なる例示的なものであり、本公開の範囲を限定するものではない。
ここに記述された図面は、全てが可能な実施形態ではなく、単なる実施例を例示的に説明するものであり、本公開の範囲を限定するものではない。
図1Aは、本公開の実施形態に係る存在する透き通しを示す図である。図1Bは、本公開の実施形態に係る存在する透き通しを示す図である。 図2Aは、ピクチャ領域及びテキスト領域を含む入力画像を示す図である。図2Bは、図2Aの入力画像の前景層を示す図である。 本公開の実施形態の基本的な思想のフローチャートである。 本公開の実施例に係る画像処理装置のブロック図である。 本公開の実施例に係る画像処理装置の一部のブロック図である。 本公開の実施例に係る連結成分の外接矩形を示す図である。 本公開の実施例に係る画像処理装置の一部のブロック図である。 本公開の他の実施例に係る画像処理装置のブロック図である。 本公開の実施例に係る画像処理装置の一部のブロック図である。 本公開の実施例に係る画像処理装置の一部のブロック図である。 本公開の実施例に係る画像処理方法のフローチャートである。 図12Aは、初期前景画素層を示す図である。図12Bは、図12Aの初期前景画素層に対応する二値化距離画像を示す図である。図12Cは、図12Aの初期前景画素層に対応する最終前景画像層を示す図である。 ソース画像をカットして得られた画像ブロックを示す図である。 本公開の実施例に係る画像処理装置及び方法を実現可能な汎用パーソナルコンピュータの例示的な構成を示すブロック図である。
本公開を容易に修正、変更できるが、その特定の実施例は例として図面に示され、ここで詳細に説明される。なお、本公開は特定の実施例の説明により具体的な形式に限定されず、本公開の主旨及び範囲内の全ての修正、均等的なもの、変更をカバーする。なお、全ての図面において、同様な部材について同様な符号を付与する。
以下、図面を参照しながら本発明の例示的な実施例を詳細に説明する。以下の説明は、単なる例示的なものであり、本公開、応用又は用途を限定するものではない。
以下は、本公開を具体的に説明し、当業者に本公開の範囲を十分に伝えるために、例示的な実施例を提供する。本公開の実施例を具体的に説明するために、多くの特定の詳細なもの、例えば特定のユニット、装置及び方法の例を説明する。なお、当業者が特定の詳細なものを用いる必要がなく、例示的な実施例を異なる形で実施することができ、これらの実施例が本公開の範囲を限定するものではない。ある例示的な実施例では、周知のプロセス、周知の構造及び周知の技術を詳細に説明していない。
図1A及び図1Bは本公開の実施形態に係る存在する透き通しを示す図である。例えば文書をスキャンする際に、通常、透き通しという現象が発生し、即ち1つのページで他のページの内容を見える。図1A及び図1Bに示すように、得られたスキャン画像では、前景画素により構成された正常の画像部分も存在し、透き通し画素により構成された透き通し画像も存在する。透き通し画素の存在が文書の可読性に大きな影響を与え、自動的な文字認識に影響を与える可能性がある。よって、スキャン画像における透き通し部分を除去する必要がある。
上述したように、透き通しの除去方法は、主に片面画像の情報に基づいて透き通しを除去する方法及び両面画像の情報に基づいて透き通しを除去する方法がある。2つ目の方法では、重要なのは文書画像の前景層を効果的に抽出することである。図2Aはピクチャ領域及びテキスト領域を含む入力画像を示し、図2Bは該入力画像の前景層を示している。図2Bにおいて、黒色画素は前景画素を表し、白色画素は背景画素を表す。多くの従来のローカル二値化/グローバル二値化の方法は、画像の前景層を抽出するために用いられてもよい。しかし、これらの方法は、単一の画素又は局所領域内の情報のみ利用している。また、文書のピクチャ領域では、ある画素の色と背景画素の色と非常に近いため、背景画素に誤って分類されてしまう。これは前景画素の紛失に繋がる。テキスト行を位置決めする方法を用いることができるが、画像におけるピクチャが複雑な色分布及び不規則な形状を有するため、これらの方法はピクチャ領域の前景層を効果的に抽出しにくい。よって、本公開は、文書の前景領域を効果的に抽出する方法を提供する。
本公開の実施形態の基本的な思想によれば、文書画像の前景層を直接に位置決めすることなく、相対的に位置決めやすい背景層を検出し、検出された背景層を除去することで、文書画像の前景層を取得する。
図3は本公開の実施形態の基本的な思想のフローチャートである。図3に示すように、入力画像において候補ピクチャ領域を位置決めすると共に、候補ピクチャ領域が除去された非候補ピクチャ領域を取得する。即ち、ここで、画像は候補ピクチャ領域と非候補ピクチャ領域の2つの部分に分けられる。そして、候補ピクチャ領域及び非候補ピクチャ領域において、連結成分解析によりそれぞれの背景領域を検出する。そして、候補ピクチャ領域及び非候補ピクチャ領域から、背景領域をそれぞれ除去して、候補ピクチャ領域及び非候補ピクチャ領域の前景領域を取得する。そして、取得された候補ピクチャ領域の前景領域と非候補ピクチャ領域の前景領域を合併し(図示せず)、該入力画像の前景領域を出力する。
以上は本公開の実施形態の基本的な思想を簡単に説明した。以下は、図面を参照しながら、本公開の実施形態をさらに詳細に説明する。
図4は本公開の実施例に係る画像処理装置400を示している。図4に示すように、本公開の実施例に係る画像処理装置400は、画像取得部410、ピクチャ検索部420、背景取得部430、前景取得部440、及び合併部450を含んでもよい。
画像取得部410は、画素を含む画像、例えば所定の入力画像I(x,y)を取得してもよい。
ピクチャ検索部420は、画像からピクチャ領域を検索してもよい。本公開の1つの実施例では、ピクチャ検索部420は、入力画像I(x,y)に対して例えば連結成分取得処理を実行し、ピクチャ領域を取得してもよい。図2A及び図2Bに示すように、ピクチャ検索部420は、図2Bにおける4つの黒い影部分に対応する、図2Aにおける4つのピクチャをピクチャ領域として位置決めし、位置決めされたピクチャ領域以外の領域を非ピクチャ領域として位置決めしてもよい。
背景取得部430は、画像のピクチャ領域を含まない非ピクチャ領域及びピクチャ領域において、背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得してもよい。非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされてもよく、ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされてもよい。本公開の1つの実施例では、入力画像I(x,y)には色が均一な背景が存在すると仮定し、非ピクチャ領域について、サイズが比較的に大きい連結成分を該非ピクチャ領域の背景連結成分(以下は、CCbgとも称される)として位置決めしてもよい。同様に、ピクチャ領域について、サイズが比較的に大きい連結成分を該ピクチャ領域の背景連結成分として位置決めしてもよい。また、非ピクチャ背景連結成分及びピクチャ背景連結成分の取得プロセスにおいて、各画素の値をそれが属する連結成分の標識、例えば(1〜n)に設定してもよい。
前景取得部440は、非ピクチャ領域及びピクチャ領域から非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ除去して、非ピクチャ領域の非ピクチャ前景領域及びピクチャ領域のピクチャ前景領域をそれぞれ取得してもよい。非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされてもよく、ピクチャ前景領域における各画素がピクチャ前景画素と見なされてもよい。本公開の1つの実施例では、入力画像I(x,y)の非ピクチャ領域について、背景連結成分CCbgを位置決めした後に、該背景連結成分CCbgに属する背景画素を除去し、該非ピクチャ領域の初期前景画像、例えばMaskfore,initを取得してもよい。
Figure 0006569500

ここで、label(bg)は背景連結成分CCbgの標識を表し、label(x,y)は画素(x,y)が属する連結成分の標識を表す。同様に、入力画像I(x,y)のピクチャ領域について、背景連結成分を位置決めした後に、該背景連結成分に属する背景画素を除去し、該ピクチャ領域の初期前景画像を取得してもよい。
合併部450は、非ピクチャ領域の非ピクチャ前景領域とピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得してもよい。該画像前景領域における各画素は画像前景画素と見なされてもよい。
図4に示される画像処理装置400を用いることで、文書画像の前景層を直接に位置決めすることなく、相対的に位置決めやすい背景層を検出し、検出された背景層を除去することで、文書画像の前景層をより効果的に取得できる。
本公開のもう1つの実施例では、図5に示すように、ピクチャ検索部420は、第1の勾配画像取得部4201、第1の画像変換部4202、候補ピクチャ連結成分取得部4203、ピクチャ選択部4204、及びピクチャ標示部4205を含んでもよい。
第1の勾配画像取得部4201は、画像の画素情報に基づいて、画像の勾配画像を取得してもよい。本公開の1つの実施例では、1つの入力画像I(x,y)を設定し、第1の勾配画像取得部4201は、Sobel演算子により該入力画像に対応する勾配画像IGrad(x,y)を計算してもよい。なお、本分野の他の公知の演算子を用いて、画像に対応する勾配画像を計算してもよい。
第1の画像変換部4202は、画像の勾配画像を二値画像に変換してもよい。例えば、第1の画像変換部4202は、グローバル閾値化方法により、入力画像I(x,y)の勾配画像IGrad(x,y)を二値画像MaskGrad(x,y)に変換してもよい。
Figure 0006569500

なお、本分野の他の公知方法を用いて閾値tを選択し、或いは本分野の他の方法を用いて勾配画像を二値画像に変換してもよい。
候補ピクチャ連結成分取得部4203は、二値画像に対して連結成分解析アルゴリズムを実行し、候補ピクチャ連結成分を取得してもよい。本公開の1つの実施例では、上記の二値画像MaskGrad(x,y)において、候補ピクチャ連結成分取得部4203は、値が「1」の画素の連結成分CC(1)、CC(1)、…、CC(1)を候補ピクチャ連結成分として位置決めしてもよい。ここで、各値が「1」の画素の値を、それが属する連結成分の標識(1〜n)に設定してもよい。
しかし、位置決めされた候補ピクチャ連結成分は異なるサイズを有する可能性がある。通常、サイズが比較的に大きい候補ピクチャ連結成分を候補ピクチャ領域であると判定してもよい。ピクチャ選択部4204は、サイズ(例えば高さ又は幅)が第1の所定閾値よりも大きい候補ピクチャ連結成分をピクチャ領域として選択してもよい。連結成分を特定するためのサイズを満たすため、連結成分について所定の閾値(例えば高さ又は幅)を設定してもよく、該所定の閾値は経験値に基づいて決定されてもよい。
ピクチャ標示部4205は、ピクチャ領域と非ピクチャ領域を分割するように、ピクチャ領域の境界を標示してもよい。本公開の1つの実施例では、図6に示すように、ピクチャ標示部4205は、サイズが比較的に大きい候補ピクチャ連結成分(即ちピクチャ領域)の外接矩形に位置する画素を前景画素(値が「1」である)に設定してもよい。
Figure 0006569500

ここで、x、y、x、yは候補ピクチャ連結成分の外接矩形の座標をそれぞれ表し、即ち外接矩形の幅wはx−xであり、外接矩形の高さhはy−yである。
本公開のもう1つの実施例では、図7に示すように、背景取得部430は、第2の勾配画像取得部4301、第2の画像変換部4302、分割部4303、候補背景取得部4304、及び背景選択部4305を含んでもよい。
第2の勾配画像取得部4301は、画像の画素情報に基づいて前記画像の勾配画像を取得する。本公開の1つの実施例では、上記所定の入力画像I(x,y)について、第2の勾配画像取得部4301は、例えばSobel演算子により該入力画像に対応する勾配画像IGrad(x,y)を計算してもよい。同様に、本分野の他の公知の演算子を用いて、画像に対応する勾配画像を計算してもよい。
第2の画像変換部4302は、画像の勾配画像を二値画像に変換する。本公開の1つの実施例では、第2の画像変換部4302は、グローバル閾値化方法により、入力画像I(x,y)の勾配画像IGrad(x,y)を二値画像MaskGrad(x,y)に変換してもよい。同様に、本分野の他の公知方法を用いて閾値tを選択し、或いは本分野の他の公知方法を用いて勾配画像を二値画像に変換してもよい。
分割部4303は、画像の二値画像を非ピクチャ領域とピクチャ領域に分割する。本公開の1つの実施例では、二値画像MaskGrad(x,y)について、分割部4303は、画素値が「1」の連結成分CC(1)、CC(1)、…、CC(1)をピクチャ領域として分割し、画素値が「0」の連結成分CC(0)、CC(0)、…、CC(0)を非ピクチャ領域として分割してもよい。
候補背景取得部4304は、非ピクチャ領域及びピクチャ領域に対して連結成分解析アルゴリズムをそれぞれ実行し、非ピクチャ領域の候補背景連結成分及びピクチャ領域の候補背景連結成分をそれぞれ取得する。通常、非ピクチャ領域について、例えばRMaskGrad(x,y)画像において、値が「0」の画素は比較的に小さい勾配レスポンスを有するため、値が「0」の画素は非ピクチャ領域背景画素に対応する。従って、本公開の1つの実施例では、二値画像RMaskGrad(x,y)において、候補背景取得部4304は、非ピクチャ領域及びピクチャ領域において値が「0」の連結成分CC(0)、CC(0)、…、CC(0)を位置決めし、非ピクチャ領域及びピクチャ領域の候補背景連結成分とする。ここで、値が「0」の各画素の値は、それが属する連結成分の標識(1〜n)に設定されてもよい。
本実施例では、単独の非ピクチャ領域及びピクチャ領域にはいずれも色が均一な背景が存在すると仮定してもよい。よって、非ピクチャ領域又はピクチャ領域の候補背景領域はサイズが大きい連結成分である可能性がある。
背景選択部4305は、非ピクチャ領域及びピクチャ領域から最大サイズを有する候補背景連結成分をそれぞれ選択し、非ピクチャ領域の非ピクチャ背景連結成分及び前記ピクチャ領域のピクチャ背景連結領域とする。本公開の1つの実施例では、非ピクチャ領域について、最大サイズを有する候補背景連結成分は、背景連結成分CCbgと標示されてもよい。
Figure 0006569500
ここで、size(CC(0))は候補背景連結成分CC(0)に含まれる背景画素の数を表し、WCC(0)i及びhCC(0)iは該候補背景連結成分の外接矩形の幅及び高さ(図6に示されるように)をそれぞれ表す。
なお、取得された文書画像の前景層にノイズが存在する可能性があるため、該前景層に対して補正処理を行ってもよい。よって、本公開の他の実施例の画像処理装置を提供する。図8は本公開の他の実施例に係る画像処理装置800を示している。補正部860を除いて、図8に示される画像処理装置800の他の構成部分は図4に示される画像処理装置400と同一であり、本公開はその説明を省略する。
図8に示すように、画像処理装置800は、画像取得部410、ピクチャ検索部420、背景取得部430、前景取得部440及び合併部450以外に、補正部860をさらに含んでもよい。
図9に示すように、補正部860は、背景色取得部8601、背景色計算部8602、日距離画像計算部8603、計数部8604及び設定部8605を含んでもよい。
背景色取得部8601は、画像の非ピクチャ背景連結成分における非ピクチャ背景画素の情報に基づいて、画像の参照背景色を取得してもよい。例えば、背景取得部8601により取得された非ピクチャ背景連結成分CCbgに基づいて、非ピクチャ背景領域の色平均値(即ち参照背景色)を取得してもよい。
Figure 0006569500

好ましくは、最大頻度を有する色は参照背景色と見なされてもよい。具体的には、各非ピクチャ背景画素の色をビン(bin)(例えば、0、1、…、31、合計32個のbinである)に量子化し、各非ピクチャ背景画素の、これらのビンにおけるヒストグラムh、h、…、hを計算し、最大値を有するbinにおける画素の平均色値を参照背景色としてもよい。
背景色計算部8602は、画像における各画素の色と画像の参照背景色との間の距離を計算し、距離画像を取得してもよい。本公開の1つの実施例では、入力画像I(x,y)の色画像と背景色取得部8601により取得された参照背景色に基づいて距離画像dist(x,y)を計算してもよい。
Figure 0006569500

ここで、|・|はL1(幾何学的)距離を表す。
二値距離画像計算部8603は、距離画像に基づいて二値距離画像を計算してもよい。本公開の1つの実施例では、二値距離画像計算部8603は、背景色計算部8602により計算された距離画像dist(x,y)に基づいて、例えばグローバル二値化方法(例えばOTSU)により1つの距離二値画像(以下はテンプレート画像とも称される)Maskdist(x,y)を取得してもよい。
Figure 0006569500

ここで、tはOTSUアルゴリズムに基づいて計算された閾値である。なお、本分野の他の公知方法を用いて二値距離画像を計算してもよい。この距離二値画像(テンプレート画像)では、値が「1」の画素は、該画素が前景画素となる確率が高いことを表す。
計数部8604は、二値距離画像の、画像前景画素を中心として一定の範囲内の参照画像前景画素の数を計数してもよい。本公開の1つの実施例では、初期前景画像Maskfore,initでは、計数部8604は、テンプレート画像Maskdistの、初期画像前景画素を中心として一定の範囲内の参照画像前景画素の数を計数してもよい。好ましくは、計数部8604は、初期画像前景領域における各連結成分について、テンプレート画像Maskdistにおける対応領域に含まれる参照画像前景画素の数を計算してもよい。
Figure 0006569500

ここで、x、y、x、yは連結成分CC(0)iの外接矩形の座標をそれぞれ表す。
設定部8605は、参照画像前景画素の数が第2の所定閾値よりも小さい画像前景画素を画像の背景画素に設定してもよい。本実施例では、Numfore(CC)の値が第2の所定閾値よりも小さい場合、該連結成分が無効のものと見なされる。即ち、無効と判断された全ての連結成分について、これらの連結成分に属する前景画素を背景画素に設定し、最終的な前景画素層を取得する。
図12A、図12B及び図12Cは、初期前景画素層Maskfore,init、図12Aの初期前景画素層Maskfore,initに対応する二値化距離画像及び図12Aの初期前景画素層Maskfore,initに対応する最終前景画像層Maskforeをそれぞれ示している。
また、これらのピクチャ領域について、各ピクチャ領域を1つの単独画像として処理してもよい。図13に示すように、画像におけるフローチャートは比較的に大きい連結成分であり、オリジナルの画像からカットする。上述した非ピクチャ前景層の抽出方法は該画像ブロックに適用され、画像ブロックの前景層を抽出する。
図8に示す画像処理装置800を用いることで、文書画像を候補ピクチャ領域と非候補ピクチャ領域に分類できる。そして、この2種類の領域の背景層を位置決めする。この2種類の領域の背景層を検出した後に、背景層を除去し、文書画像の初期前景層を取得する。最後に、文書の初期前景層に対して小さなノイズを除去して、最終的な前景層画像を取得することで、文書に複数種類の色及び複雑なピクチャ領域が存在するためピクチャ領域の前景層を抽出しにくいという課題を解決できる。
本公開の他の実施例では、図10に示すように、補正部860は、ピクチャ補正部8606、ピクチャ色距離計算部8607及びピクチャ前景保留部8608を含んでもよい。
ピクチャ補正部8606は、ピクチャ背景連結成分におけるピクチャ背景画素の情報に基づいて、ピクチャ領域の背景色を取得してもよい。
ピクチャ色距離計算部8607は、ピクチャ領域の背景色と画像の参照背景色との間の距離を計算し、背景色距離を取得してもよい。本実施例では、ピクチャ領域の背景色をcolorbg,kと標示し、ピクチャ色距離計算部8607は、ピクチャ領域の背景色colorbg,kと画像の参照背景色colorbgとの間の距離を計算してもよい。
Figure 0006569500

ピクチャ前景保留部8608は、背景色距離が閾値よりも大きい場合、ピクチャ領域の全体をピクチャ領域のピクチャ前景領域として保留してもよい。本実施例では、difの値が所定の閾値を超えた場合、候補ピクチャ領域の背景色と画像全体の背景色と異なることを意味するため、候補ピクチャ領域の全体が保留される。そうでない場合、上述した前景抽出方法を用いて該候補ピクチャ領域の前景を抽出する。
以下は図11を参照しながら本公開の実施例に係る画像処理方法を説明する。図11に示すように、本公開の実施例に係る画像処理方法はステップS1110から始まる。ステップS1110において、画素を含む画像を取得する。
そして、ステップS1120において、画像からピクチャ領域を検索する。
そして、ステップS1130において、画像のピクチャ領域を含まない非ピクチャ領域及びピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得する。非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる。
そして、ステップS1140において、非ピクチャ領域及びピクチャ領域から非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ除去することで、非ピクチャ領域の非ピクチャ前景領域及びピクチャ領域のピクチャ前景領域をそれぞれ取得する。非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、ピクチャ前景領域における各画素がピクチャ前景画素と見なされる。
そして、ステップS1150において、非ピクチャ領域の非ピクチャ前景領域とピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得する。画像前景領域における各画素が画像前景画素と見なされる。この後、処理が終了する。
本公開の他の実施例では、画像からピクチャ領域を検索するステップは、画像の画素情報に基づいて画像の勾配画像を取得するステップと、画像の勾配画像を二値画像に変換するステップと、二値画像に対して連結成分解析アルゴリズムを実行し、候補ピクチャ連結成分を取得するステップと、サイズが第1の所定閾値よりも大きい候補ピクチャ連結成分をピクチャ領域として選択するステップと、ピクチャ領域と非ピクチャ領域を分割するように、ピクチャ領域の境界を標示するステップと、を含んでもよい。
本公開の他の実施例では、非ピクチャ背景連結成分及びピクチャ背景連結成分を取得するステップは、画像の画素情報に基づいて画像の勾配画像を取得するステップと、画像の勾配画像を二値画像に変換するステップと、画像の二値画像を非ピクチャ領域とピクチャ領域に分割するステップと、非ピクチャ領域及びピクチャ領域に対して連結成分解析アルゴリズムをそれぞれ実行し、非ピクチャ領域の候補背景連結成分及びピクチャ領域の候補背景連結成分をそれぞれ取得するステップと、非ピクチャ領域及びピクチャ領域から最大サイズを有する候補背景連結成分をそれぞれ選択し、非ピクチャ領域の非ピクチャ背景連結成分及びピクチャ領域のピクチャ背景連結領域とするステップと、を含む。
本公開の他の実施例では、補正ステップをさらに含み、該補正ステップは、画像の非ピクチャ背景連結成分における非ピクチャ背景画素の情報に基づいて、画像の参照背景色を取得するステップと、画像における各画素の色と画像の参照背景色との間の距離を計算し、距離画像を取得するステップと、距離画像に基づいて二値距離画像を計算するステップと、二値距離画像の、画像前景画素を中心として一定の範囲内の参照画像前景画素の数を計数するステップと、参照画像前景画素の数が第2の所定閾値よりも小さい画像前景画素を画像の背景画素に設定するステップと、を含んでもよい。
本公開の他の実施例では、補正ステップは、ピクチャ背景連結成分におけるピクチャ背景画素の情報に基づいて、ピクチャ領域の背景色を取得するステップと、ピクチャ領域の背景色と画像の参照背景色との間の距離を計算し、背景色距離を取得するステップと、背景色距離が閾値よりも大きい場合、ピクチャ領域の全体をピクチャ領域のピクチャ前景領域として保留するステップと、を含んでもよい。
本公開の他の実施例では、画像の参照背景色を取得するステップは、各非ピクチャ背景画素の色をビン(bin)に量子化するステップと、各非ピクチャ背景画素の、対応するビンにおけるヒストグラムを計算するステップと、最大値を有するビンにおける画素の平均色値を画像の参照背景色として選択するステップと、を含む。
本公開の実施例に係る画像処理方法の上記ステップの各種の具体的な実施形態は既に詳細に説明されたため、ここでその説明を省略する。
なお、本公開の画像処理方法の各操作プロセスは、各種の機器読み取り可能な記憶媒体におけるコンピュータ実行可能なプログラムに記憶される形で実現されてもよい。
また、本公開の目的は以下の方式で実現されてもよい。上記実行可能なプログラムコードを記憶した記憶媒体を直接、或いは間接にシステム又は装置に提供し、該システム又は装置におけるコンピュータ又は中央処理部(CPU)が上記プログラムコードを読み出して、実行する。この場合は、該システム又は装置がプログラムを実行する機能さえ有すれば、本公開の実施形態はプログラムに限定されず、該プログラムも任意の形、例えばオブジェクトプログラム、インタープリタにより実行されるプログラム又はオペレーションシステムに提供されるスクリプトプログラム等であってもよい。
上記の機器読み取り可能な記憶媒体は、各種の記憶装置又は記憶ユニット、半導体装置、例えば光ディスク、磁気ディスク及び光磁気ディスクを含むディスクユニット、及び情報を記憶可能な他の媒体などを含むが、これらに限定されない。
また、コンピュータはインターネットを介して対応するウェブサイトに接続され、本公開のコンピュータプログラムコードをダウンロードして、コンピュータで該プログラムを実行することで、本公開の実施形態を実現してもよい。
図14は本公開の実施例に係る画像処理装置及び方法を実現可能な汎用パーソナルコンピュータの例示的な構成を示すブロック図である。
図14に示すように、CPU1301は、読み出し専用メモリ(ROM)1302に記憶されているプログラム、又は記憶部1308からランダムアクセスメモリ(RAM)1303にロードされたプログラムにより各種の処理を実行する。RAM1303には、必要に応じて、CPU1301が各種の処理を実行するに必要なデータが記憶されている。CPU1301、ROM1302、及びRAM1303は、バス1304を介して互いに接続されている。入力/出力インターフェース1305もバス1304に接続されている。
入力部1306(キーボード、マウスなどを含む)、出力部1307(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む)、記憶部1308(例えばハードディスクなどを含む)、通信部1309(例えばネットワークのインタフェースカード、例えばLANカード、モデムなどを含む)は、入力/出力インターフェース1305に接続されている。通信部1309は、ネットワーク、例えばインターネットを介して通信処理を実行する。必要に応じて、ドライブ部1310は、入力/出力インターフェース1305に接続されてもよい。取り外し可能な媒体1311は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであり、必要に応じてドライブ部1310にセットアップされて、その中から読みだされたコンピュータプログラムは必要に応じて記憶部1308にインストールされている。
ソフトウェアにより上記処理を実施する場合、ネットワーク、例えばインターネット、又は記憶媒体、例えば取り外し可能な媒体1311を介してソフトウェアを構成するプログラムをインストールする。
なお、これらの記憶媒体は、図14に示されている、プログラムを記憶し、機器と分離してユーザへプログラムを提供する取り外し可能な媒体1311に限定されない。取り外し可能な媒体1311は、例えば磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(光ディスク−読み出し専用メモリ(CDROM)、及びデジタル多目的ディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標))及び半導体メモリを含む。或いは、記憶媒体は、ROM1302、記憶部1308に含まれるハードディスクなどであってもよく、プログラムを記憶し、それらを含む機器と共にユーザへ提供される。
本公開の装置及び方法では、各ユニット又は各ステップは分解及び/又は再組み合わせられたものであってもよい。これらの分解及び/又は再組み合わせは本公開と等価する態様と見なされるべきである。また、上記処理のステップは明細書に説明された時間順で実行されてもよいし、時間順以外の順序で実行されてもよい。あるステップは、並行又は単独で実行されもよい。
本発明の特定の実施形態は、後述の説明及び図面に示すように、詳細に開示され、本発明の原理を採用されることが可能な方式を示している。なお、本発明の実施形態は、範囲上には限定されるものではない。本発明の実施形態は、添付されている特許請求の範囲の主旨及び内容の範囲内、各種の改変、修正、及び均等的なものが含まれる。
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
画像処理装置であって、
画素を含む画像を取得する画像取得手段と、
前記画像からピクチャ領域を検索するピクチャ検索手段と、
前記画像の前記ピクチャ領域を含まない非ピクチャ領域及び前記ピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得する背景取得手段であって、前記非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、前記ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる、背景取得手段と、
前記非ピクチャ領域及び前記ピクチャ領域から前記非ピクチャ背景連結成分及び前記ピクチャ背景連結成分をそれぞれ除去することで、前記非ピクチャ領域の非ピクチャ前景領域及び前記ピクチャ領域のピクチャ前景領域をそれぞれ取得する前景取得手段であって、前記非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、前記ピクチャ前景領域における各画素がピクチャ前景画素と見なされる、前景取得手段と、
前記非ピクチャ領域の非ピクチャ前景領域と前記ピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得する合併手段であって、前記画像前景領域における各画素が画像前景画素と見なされる、合併手段と、を含む、装置。
(付記2)
前記ピクチャ検索手段は、
前記画像の画素情報に基づいて前記画像の勾配画像を取得する第1の勾配画像取得手段と、
前記画像の勾配画像を二値画像に変換する第1の画像変換手段と、
前記二値画像に対して連結成分解析アルゴリズムを実行し、候補ピクチャ連結成分を取得する候補ピクチャ連結成分取得手段と、
サイズが第1の所定閾値よりも大きい候補ピクチャ連結成分を前記ピクチャ領域として選択するピクチャ選択手段と、
前記ピクチャ領域と前記非ピクチャ領域を分割するように、前記ピクチャ領域の境界を標示するピクチャ標示手段と、を含む、付記1に記載の装置。
(付記3)
前記背景取得手段は、
前記画像の画素情報に基づいて前記画像の勾配画像を取得する第2の勾配画像取得手段と、
前記画像の勾配画像を二値画像に変換する第2の画像変換手段と、
前記画像の二値画像を前記非ピクチャ領域と前記ピクチャ領域に分割する分割手段と、
前記非ピクチャ領域及び前記ピクチャ領域に対して連結成分解析アルゴリズムをそれぞれ実行し、前記非ピクチャ領域の候補背景連結成分及び前記ピクチャ領域の候補背景連結成分をそれぞれ取得する候補背景取得手段と、
前記非ピクチャ領域及び前記ピクチャ領域から最大サイズを有する候補背景連結成分をそれぞれ選択し、前記非ピクチャ領域の非ピクチャ背景連結成分及び前記ピクチャ領域のピクチャ背景連結領域とする背景選択手段と、を含む、付記1に記載の装置。
(付記4)
補正手段をさらに含み、
前記補正手段は、
前記画像の非ピクチャ背景連結成分における非ピクチャ背景画素の情報に基づいて、前記画像の参照背景色を取得する背景色取得手段と、
前記画像における各画素の色と前記画像の参照背景色との間の距離を計算し、距離画像を取得する背景色計算手段と、
前記距離画像に基づいて二値距離画像を計算する二値距離画像計算手段と、
前記二値距離画像の、前記画像前景画素を中心として一定の範囲内の参照画像前景画素の数を計数する計数手段と、
前記参照画像前景画素の数が第2の所定閾値よりも小さい前記画像前景画素を前記画像の背景画素に設定する設定手段と、を含む、付記1乃至3のいずれかに記載の装置。
(付記5)
前記補正手段は、
前記ピクチャ背景連結成分におけるピクチャ背景画素の情報に基づいて、前記ピクチャ領域の背景色を取得するピクチャ補正手段と、
前記ピクチャ領域の背景色と前記画像の参照背景色との間の距離を計算し、背景色距離を取得するピクチャ色距離計算手段と、
前記背景色距離が閾値よりも大きい場合、前記ピクチャ領域の全体を前記ピクチャ領域のピクチャ前景領域として保留するピクチャ前景保留手段と、を含む、付記4に記載の装置。
(付記6)
前記背景色取得手段は、
各非ピクチャ背景画素の色をビン(bin)に量子化する色量子化手段と、
各非ピクチャ背景画素の、対応するビンにおけるヒストグラムを計算するヒストグラム計算手段と、
最大値を有するビンにおける画素の平均色値を前記画像の参照背景色として選択する色選択手段と、を含む、付記4に記載の装置。
(付記7)
前記計数手段は、前記画像前景領域における各連結成分について、前記二値距離画像における対応領域に含まれる参照画像前景画素の数を計算する、付記4に記載の装置。
(付記8)
前記二値距離画像計算手段は、OTSUアルゴリズムにより二値距離画像を計算する、付記4に記載の装置。
(付記9)
前記非ピクチャ領域及び前記ピクチャ領域にはいずれも色が均一な背景が存在する、付記1に記載の装置。
(付記10)
画像処理方法であって、
画素を含む画像を取得するステップと、
前記画像からピクチャ領域を検索するステップと、
前記画像の前記ピクチャ領域を含まない非ピクチャ領域及び前記ピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得するステップであって、前記非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、前記ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる、ステップと、
前記非ピクチャ領域及び前記ピクチャ領域から前記非ピクチャ背景連結成分及び前記ピクチャ背景連結成分をそれぞれ除去することで、前記非ピクチャ領域の非ピクチャ前景領域及び前記ピクチャ領域のピクチャ前景領域をそれぞれ取得するステップであって、前記非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、前記ピクチャ前景領域における各画素がピクチャ前景画素と見なされる、ステップと、
前記非ピクチャ領域の非ピクチャ前景領域と前記ピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得するステップであって、前記画像前景領域における各画素が画像前景画素と見なされる、ステップと、を含む、方法。
(付記11)
前記画像からピクチャ領域を検索するステップは、
前記画像の画素情報に基づいて前記画像の勾配画像を取得するステップと、
前記画像の勾配画像を二値画像に変換するステップと、
前記二値画像に対して連結成分解析アルゴリズムを実行し、候補ピクチャ連結成分を取得するステップと、
サイズが第1の所定閾値よりも大きい候補ピクチャ連結成分を前記ピクチャ領域として選択するステップと、
前記ピクチャ領域と前記非ピクチャ領域を分割するように、前記ピクチャ領域の境界を標示するステップと、を含む、付記10に記載の方法。
(付記12)
前記非ピクチャ背景連結成分及びピクチャ背景連結成分を取得するステップは、
前記画像の画素情報に基づいて前記画像の勾配画像を取得するステップと、
前記画像の勾配画像を二値画像に変換するステップと、
前記画像の二値画像を前記非ピクチャ領域と前記ピクチャ領域に分割するステップと、
前記非ピクチャ領域及び前記ピクチャ領域に対して連結成分解析アルゴリズムをそれぞれ実行し、前記非ピクチャ領域の候補背景連結成分及び前記ピクチャ領域の候補背景連結成分をそれぞれ取得するステップと、
前記非ピクチャ領域及び前記ピクチャ領域から最大サイズを有する候補背景連結成分をそれぞれ選択し、前記非ピクチャ領域の非ピクチャ背景連結成分及び前記ピクチャ領域のピクチャ背景連結領域とするステップと、を含む、付記10に記載の方法。
(付記13)
補正ステップをさらに含み、
前記補正ステップは、
前記画像の非ピクチャ背景連結成分における非ピクチャ背景画素の情報に基づいて、前記画像の参照背景色を取得するステップと、
前記画像における各画素の色と前記画像の参照背景色との間の距離を計算し、距離画像を取得するステップと、
前記距離画像に基づいて二値距離画像を計算するステップと、
前記二値距離画像の、前記画像前景画素を中心として一定の範囲内の参照画像前景画素の数を計数するステップと、
前記参照画像前景画素の数が第2の所定閾値よりも小さい前記画像前景画素を前記画像の背景画素に設定するステップと、を含む、付記10乃至12のいずれかに記載の方法。
(付記14)
前記補正ステップは、
前記ピクチャ背景連結成分におけるピクチャ背景画素の情報に基づいて、前記ピクチャ領域の背景色を取得するステップと、
前記ピクチャ領域の背景色と前記画像の参照背景色との間の距離を計算し、背景色距離を取得するステップと、
前記背景色距離が閾値よりも大きい場合、前記ピクチャ領域の全体を前記ピクチャ領域のピクチャ前景領域として保留するステップと、を含む、付記13に記載の方法。
(付記15)
前記画像の参照背景色を取得するステップは、
各非ピクチャ背景画素の色をビン(bin)に量子化するステップと、
各非ピクチャ背景画素の、対応するビンにおけるヒストグラムを計算するステップと、
最大値を有するビンにおける画素の平均色値を前記画像の参照背景色として選択するステップと、を含む、付記13に記載の方法。
(付記16)
前記画像前景領域における各連結成分について、前記二値距離画像における対応領域に含まれる参照画像前景画素の数を計算する、付記13に記載の方法。
(付記17)
OTSUアルゴリズムにより二値距離画像を計算する、付記13に記載の方法。
(付記18)
前記非ピクチャ領域及び前記ピクチャ領域にはいずれも色が均一な背景が存在する、付記10に記載の方法。
(付記19)
コンピュータが命令コードを読み取って実行する時に前記コンピュータに付記10乃至18のいずれかに記載の方法を実行させるための機器読み取り可能な前記命令コードを記憶したプログラムプロダクトを記録した機器読み取り可能な記憶媒体。

Claims (10)

  1. 画像処理装置であって、
    画素を含む画像を取得する画像取得手段と、
    前記画像からピクチャ領域を検索するピクチャ検索手段と、
    前記画像の前記ピクチャ領域を含まない非ピクチャ領域及び前記ピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得する背景取得手段であって、前記非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、前記ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる、背景取得手段と、
    前記非ピクチャ領域及び前記ピクチャ領域から前記非ピクチャ背景連結成分及び前記ピクチャ背景連結成分をそれぞれ除去することで、前記非ピクチャ領域の非ピクチャ前景領域及び前記ピクチャ領域のピクチャ前景領域をそれぞれ取得する前景取得手段であって、前記非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、前記ピクチャ前景領域における各画素がピクチャ前景画素と見なされる、前景取得手段と、
    前記非ピクチャ領域の非ピクチャ前景領域と前記ピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得する合併手段であって、前記画像前景領域における各画素が画像前景画素と見なされる、合併手段と、を含む、装置。
  2. 前記ピクチャ検索手段は、
    前記画像の画素情報に基づいて前記画像の勾配画像を取得する第1の勾配画像取得手段と、
    前記画像の勾配画像を二値画像に変換する第1の画像変換手段と、
    前記二値画像に対して連結成分解析アルゴリズムを実行し、候補ピクチャ連結成分を取得する候補ピクチャ連結成分取得手段と、
    サイズが第1の所定閾値よりも大きい候補ピクチャ連結成分を前記ピクチャ領域として選択するピクチャ選択手段と、
    前記ピクチャ領域と前記非ピクチャ領域を分割するように、前記ピクチャ領域の境界を標示するピクチャ標示手段と、を含む、請求項1に記載の装置。
  3. 前記背景取得手段は、
    前記画像の画素情報に基づいて前記画像の勾配画像を取得する第2の勾配画像取得手段と、
    前記画像の勾配画像を二値画像に変換する第2の画像変換手段と、
    前記画像の二値画像を前記非ピクチャ領域と前記ピクチャ領域に分割する分割手段と、
    前記非ピクチャ領域及び前記ピクチャ領域に対して連結成分解析アルゴリズムをそれぞれ実行し、前記非ピクチャ領域の候補背景連結成分及び前記ピクチャ領域の候補背景連結成分をそれぞれ取得する候補背景取得手段と、
    前記非ピクチャ領域及び前記ピクチャ領域から最大サイズを有する候補背景連結成分をそれぞれ選択し、前記非ピクチャ領域の非ピクチャ背景連結成分及び前記ピクチャ領域のピクチャ背景連結領域とする背景選択手段と、を含む、請求項1に記載の装置。
  4. 補正手段をさらに含み、
    前記補正手段は、
    前記画像の非ピクチャ背景連結成分における非ピクチャ背景画素の情報に基づいて、前記画像の参照背景色を取得する背景色取得手段と、
    前記画像における各画素の色と前記画像の参照背景色との間の距離を計算し、距離画像を取得する背景色計算手段と、
    前記距離画像に基づいて二値距離画像を計算する二値距離画像計算手段と、
    前記二値距離画像の、前記画像前景画素を中心として一定の範囲内の参照画像前景画素の数を計数する計数手段と、
    前記参照画像前景画素の数が第2の所定閾値よりも小さい前記画像前景画素を前記画像の背景画素に設定する設定手段と、を含む、請求項1乃至3のいずれかに記載の装置。
  5. 前記補正手段は、
    前記ピクチャ背景連結成分におけるピクチャ背景画素の情報に基づいて、前記ピクチャ領域の背景色を取得するピクチャ補正手段と、
    前記ピクチャ領域の背景色と前記画像の参照背景色との間の距離を計算し、背景色距離を取得するピクチャ色距離計算手段と、
    前記背景色距離が閾値よりも大きい場合、前記ピクチャ領域の全体を前記ピクチャ領域のピクチャ前景領域として保留するピクチャ前景保留手段と、を含む、請求項4に記載の装置。
  6. 前記背景色取得手段は、
    各非ピクチャ背景画素の色をビン(bin)に量子化する色量子化手段と、
    各非ピクチャ背景画素の、対応するビンにおけるヒストグラムを計算するヒストグラム計算手段と、
    最大値を有するビンにおける画素の平均色値を前記画像の参照背景色として選択する色選択手段と、を含む、請求項4に記載の装置。
  7. 前記計数手段は、前記画像前景領域における各連結成分について、前記二値距離画像における対応領域に含まれる参照画像前景画素の数を計算する、請求項4に記載の装置。
  8. 前記二値距離画像計算手段は、OTSUアルゴリズムにより二値距離画像を計算する、請求項4に記載の装置。
  9. 前記非ピクチャ領域及び前記ピクチャ領域にはいずれも色が均一な背景が存在する、請求項1に記載の装置。
  10. 画像処理方法であって、
    画素を含む画像を取得するステップと、
    前記画像からピクチャ領域を検索するステップと、
    前記画像の前記ピクチャ領域を含まない非ピクチャ領域及び前記ピクチャ領域において背景連結成分取得処理をそれぞれ実行し、非ピクチャ背景連結成分及びピクチャ背景連結成分をそれぞれ取得するステップであって、前記非ピクチャ背景連結成分における各画素が非ピクチャ背景画素と見なされ、前記ピクチャ背景連結成分における各画素がピクチャ背景画素と見なされる、ステップと、
    前記非ピクチャ領域及び前記ピクチャ領域から前記非ピクチャ背景連結成分及び前記ピクチャ背景連結成分をそれぞれ除去することで、前記非ピクチャ領域の非ピクチャ前景領域及び前記ピクチャ領域のピクチャ前景領域をそれぞれ取得するステップであって、前記非ピクチャ前景領域における各画素が非ピクチャ前景画素と見なされ、前記ピクチャ前景領域における各画素がピクチャ前景画素と見なされる、ステップと、
    前記非ピクチャ領域の非ピクチャ前景領域と前記ピクチャ領域のピクチャ前景領域を合併し、最終的な画像前景領域を取得するステップであって、前記画像前景領域における各画素が画像前景画素と見なされる、ステップと、を含む、方法。
JP2015236467A 2014-12-04 2015-12-03 画像処理装置及び画像処理方法 Active JP6569500B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410734194.8 2014-12-04
CN201410734194.8A CN105719243B (zh) 2014-12-04 2014-12-04 图像处理装置和方法

Publications (2)

Publication Number Publication Date
JP2016110647A JP2016110647A (ja) 2016-06-20
JP6569500B2 true JP6569500B2 (ja) 2019-09-04

Family

ID=56094754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015236467A Active JP6569500B2 (ja) 2014-12-04 2015-12-03 画像処理装置及び画像処理方法

Country Status (3)

Country Link
US (1) US9524559B2 (ja)
JP (1) JP6569500B2 (ja)
CN (1) CN105719243B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101547862B1 (ko) * 2014-12-17 2015-08-31 스타십벤딩머신 주식회사 영상 합성 방법 및 시스템
US9805662B2 (en) * 2015-03-23 2017-10-31 Intel Corporation Content adaptive backlight power saving technology
US10332262B2 (en) * 2017-02-16 2019-06-25 Adobe Inc. Removal of background information from digital images
CN108573469A (zh) * 2017-03-07 2018-09-25 富士通株式会社 图像处理装置和方法
CN108647680B (zh) * 2018-04-28 2021-11-12 北京盒子鱼教育科技有限公司 图像定位框检测方法和装置
US10885689B2 (en) * 2018-07-06 2021-01-05 General Electric Company System and method for augmented reality overlay
CN110865856B (zh) * 2018-08-27 2022-04-22 华为技术有限公司 一种界面元素颜色显示方法及装置
CN109389165A (zh) * 2018-09-29 2019-02-26 南京理工大学 基于巡检机器人的变压器油位计识别方法
CN110298813A (zh) * 2019-06-28 2019-10-01 北京金山安全软件有限公司 一种处理图片的方法、装置及电子设备
CN111681244B (zh) * 2020-05-29 2022-06-21 山东大学 叶片图像分割方法、***、设备及存储介质
CN112464720B (zh) * 2020-10-27 2021-11-23 中电金信软件有限公司 文档图像处理、模型训练方法、装置和计算机设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
KR100524072B1 (ko) * 2003-06-28 2005-10-26 삼성전자주식회사 화질 개선 방법
TWI479891B (zh) * 2007-06-26 2015-04-01 Apple Inc 動態背光調適
JP5020771B2 (ja) * 2007-10-22 2012-09-05 クラリオン株式会社 車載機、そのメータ表示方法
US8582876B2 (en) * 2011-11-15 2013-11-12 Microsoft Corporation Hybrid codec for compound image compression
CN102663388B (zh) * 2012-03-27 2014-01-08 复旦大学 从背景图片中对手写体字符进行分割的方法
CN102750718B (zh) * 2012-05-31 2015-03-25 山东神思电子技术股份有限公司 一种背景蒙版生成方法
CN103336965B (zh) * 2013-07-18 2016-08-31 国家电网公司 基于轮廓差异及区块主方向直方图的前景与特征提取方法
CN103473780B (zh) * 2013-09-22 2016-05-25 广州市幸福网络技术有限公司 一种人像背景抠图的方法

Also Published As

Publication number Publication date
US9524559B2 (en) 2016-12-20
CN105719243A (zh) 2016-06-29
CN105719243B (zh) 2018-09-07
US20160163059A1 (en) 2016-06-09
JP2016110647A (ja) 2016-06-20

Similar Documents

Publication Publication Date Title
JP6569500B2 (ja) 画像処理装置及び画像処理方法
JP6547386B2 (ja) 画像処理装置及び方法
US8965127B2 (en) Method for segmenting text words in document images
JP5492205B2 (ja) 印刷媒体ページの記事へのセグメント化
US7715628B2 (en) Precise grayscale character segmentation apparatus and method
Rigaud et al. Robust frame and text extraction from comic books
JP5695257B1 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP2014057306A (ja) 画像位相一致を用いた文書画像の二値化及び分割
US10169673B2 (en) Region-of-interest detection apparatus, region-of-interest detection method, and recording medium
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
JP2004126648A (ja) 画像処理方法、画像処理装置および画像処理プログラム
Hadjadj et al. ISauvola: Improved Sauvola’s algorithm for document image binarization
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
JP2011065643A (ja) 文字認識方法及び文字認識装置
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
KR101082665B1 (ko) 관심 객체 추출 장치 및 방법
JP6686460B2 (ja) 文書画像におけるマークの除去方法及び除去装置
JP5979008B2 (ja) 画像処理装置、画像処理方法及びプログラム
US9773472B2 (en) Text extraction from graphical user interface content
Khatib et al. A hybrid multilevel text extraction algorithm in scene images
JP2001034763A (ja) 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
WO2017088478A1 (zh) 数字分离方法及装置
Sambyal et al. Connected component based English character set segmentation
US11778122B2 (en) Apparatus, method, and storage medium for removing shading dots
JP6493559B2 (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190722

R150 Certificate of patent or registration of utility model

Ref document number: 6569500

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150