JP2003271973A - 画像処理方法および画像処理プログラム - Google Patents

画像処理方法および画像処理プログラム

Info

Publication number
JP2003271973A
JP2003271973A JP2002074000A JP2002074000A JP2003271973A JP 2003271973 A JP2003271973 A JP 2003271973A JP 2002074000 A JP2002074000 A JP 2002074000A JP 2002074000 A JP2002074000 A JP 2002074000A JP 2003271973 A JP2003271973 A JP 2003271973A
Authority
JP
Japan
Prior art keywords
circumscribed rectangle
label
pixel
attribute
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002074000A
Other languages
English (en)
Inventor
Kenji Ebiya
賢治 蛯谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2002074000A priority Critical patent/JP2003271973A/ja
Publication of JP2003271973A publication Critical patent/JP2003271973A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 複雑なレイアウトであっても画像の領域を正
確に識別すること。 【解決手段】 本発明は、入力画像に対する2値化ステ
ップ(S201)と、2値画像の黒画素に対し、上下・
左右・斜めで連続している画素に同一ラベルを付加し、
外接矩形をかたどっていく第1ラベリングステップ(S
202)と、2値画像の白画素に対し、上下・左右で連
続している画素に同一ラベルを付加し、外接矩形をかた
どっていく第2ラベリングステップ(S203)と、第
1のラベリングステップでラベル付けされた外接矩形と
第2のラベリングステップでラベル付けされた外接矩形
との包含関係を検出する包含関係検出ステップ(S20
4)と、包含関係、第1のラベリングステップでの外接
矩形、第2のラベリングステップでの外接矩形を用い
て、全画素に対し属性を区別する属性検出ステップ(S
205)とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力画像に対する
領域識別を行う画像処理方法および画像処理プログラム
に関する。
【0002】
【従来の技術】近年、コンピュータの処理能力が著しく
向上し、それに伴い表現豊かな文書作成ツールが発達
し、文書のカラー化、多様化が進んでいる。また、文書
管理の電子化が進み、従来紙文書で保管されていたもの
をスキャナーで取り込むという紙文書の電子化が進んで
いる。
【0003】これに対し、従来技術は、2値画像に対す
るランレングスの分布を調べ白ラン黒ランの長さにより
文字領域や図形領域等を分割するランレングス分析方式
を用いたものや、入力画像のフーリエスペクトルを分析
して各種領域に識別するスペクトル分析方式を用いたも
のや、特開昭64-15889号公報に記載されている
ように垂直および水平方向の射影を交互に繰り返して、
領域を分割していく射影分析方式を用いたものがある。
【0004】一方、コンピュータの処理能力向上で、文
書処理ツールに対しても高機能化が求められる状況にな
り、文字領域の抽出に留まらず、図形や写真、背景など
も的確に抽出し、スキャン文書を再利用できる形式、例
えば構造化文書への変換等の機能が望まれるようになっ
ている。
【0005】
【発明が解決しようとする課題】しかしながら、ランレ
ングス分析法式や射影分析方式等は一定の単位領域(矩
形単位等)毎の領域識別であり、オブジェクト単位の識
別でないため、絵柄の外形が矩形でない場合は絵柄領域
部分のみを分離識別すことが難しい。また、背景が網点
でその上に文字や網点写真が構成されているような文書
ではフーリエスペクトルに差がでないため、このようの
文書に対して、スペクトル分析方式を用いて領域識別を
するのは難しい。このように従来技術では、文書のカラ
ー化、レイアウトの複雑化している現状を鑑みれば、文
書の領域識別技術として、十分満足が得られているとは
言い難い。
【0006】
【課題を解決するための手段】本発明はこのような課題
を解決するために成されたものである。すなわち、本発
明は、入力画像を黒画素に対応したエッジと白画素に対
応した非エッジとに分離する2値化ステップと、2値化
ステップで2値化された2値画像の黒画素に対し、上下
・左右・斜めで連続している画素に同一ラベルを付加
し、同一ラベルの付された画素群の外接矩形をかたどっ
ていく第1のラベリングステップと、2値化ステップで
2値化された2値画像の白画素に対し、上下・左右で連
続している画素に同一ラベルを付加し、同一ラベルの付
された画素群の外接矩形をかたどっていく第2のラベリ
ングステップと、第1のラベリングステップでラベル付
けされた外接矩形と第2のラベリングステップでラベル
付けされた外接矩形との包含関係を検出する包含関係検
出ステップと、包含関係検出ステップの結果と、第1の
ラベリングステップでラベル付けされた外接矩形に関す
る第1の情報(幅、高さ、面積、画素密度、分散)と前
記第2のラベリングステップでラベル付けされた外接矩
形に関する第2の情報(幅、高さ)とを用いて、全画素
に対し、属性を区別する属性検出ステップと、属性検出
ステップの検出結果に基づいて入力画像の領域分割を行
う領域分割ステップとを備える画像処理方法である。ま
た、これらのステップを備える画像処理プログラムでも
ある。
【0007】このような本発明では、第1のラベリング
ステップと第2のラベリングステップとでラベリングの
条件を変えていることから、黒画素の群による外接矩形
と白画素の群による外接矩形との包含関係を的確に把握
でき、入力画像の領域分割を正確に行うことができるよ
うになる。
【0008】
【発明の実施の形態】以下、本発明の実施の形態を図に
基づき説明する。図1は本実施形態の画像処理方法を実
現する装置の構成図である。すなわち、本装置は、画像
入力部101、CPU102、記憶部103、領域識別
部104から構成される。
【0009】画像入力部101はスキャナーなどの原稿
画像を入力する部分である。CPU102は中央処理装
置であって、記憶部103に格納されている画像処理プ
ログラムに従って本実施形態に係る処理を行う。記憶部
103はRAMおよびROM等から構成され、CPU1
02が実行する画像処理プログラムや、その処理に用い
る各種パラメータ、入力画像等、各種データの格納を行
う。領域識別部104は記憶部103に格納されている
本実施形態の画像処理プログラムに従って、入力画像に
対する領域識別を行う。
【0010】次に領域識別部104の動作について説明
する。図2は領域識別部で実行される領域識別処理の流
れを表すフローチャートである。
【0011】<ステップS201>ここでは、画像入力
部101から入力された画像データをエッジと非エッジ
とに分離する処理を行う。本実施形態では、入力画像を
カラー画像として、注目画素とその8近傍の画素との間
に以下の(1)式および(2)式の条件を満たすものが
あれば、その画素をエッジとみなし、2値化の出力をO
N(黒画素)にし、満たさない場合は非エッジとみなし、
2値化の出力をOFF(白画素)にする。ここで2値化さ
れた画像は記憶部103に格納される。
【0012】 ((R-R’)2+(G-G’)2+(B-B’)2)1/2 > th1 …(1) Y < Y’ …(2)
【0013】ここで、注目画素の画像信号をR、G、B、
近傍の画像信号をR’、G’、B’とし、式(3)で得ら
れる輝度信号をY、Y’とする。 Y=0.3R + 0.59G+ 0.11B …(3)
【0014】<ステップS202>ここでは、ステップ
S201で2値化された2値画像の黒画素に対し、上下
・左右・斜めで連続している画素に同一ラベルを付加
し、この同一ラベルの付された画素群の外接矩形をかた
どっていく。また、この処理とともに矩形情報を求め
る。この処理ステップで得られるラベル情報および矩形
情報は記憶装置103に記憶され、後段の処理で用いら
れる。矩形情報は以下の内容である。 (A)外接矩形の幅 (B)外接矩形の高さ (C)外接矩形の面積 (D)外接矩形の左端座標値 (E)外接矩形の右端座標値 (F)外接矩形の上端座標値 (G)外接矩形の下端座標値 (H)外接矩形内有効画素数 (I)輝度の分散:ON画素部分に対応する入力画像を
参照して算出する (J)セル候補数:ON画素群(領域)が直接包含する表
・枠のセルとなり得るOFF画素群(領域)の数 (K)非セル候補数:ON画素群(領域)が直接包含する
表・枠のセルとなり得ないOFF画素群(領域)の数 (L)包含ラベル:ON画素群を直接包含するOFF画素群
のラベル (M)属性 この段階では(A)〜(H)の情報を取得し、(I)〜
(M)は包含関係検出処理などの後段の処理で得られ
る。これらを用いて最終的に属性判定を行う。
【0015】ここで、ラベル付けの動作を図3を例にし
て説明する。まず主走査方向に左から右にラベル付けさ
れていない黒画素があるかをチェックする。主走査方向
右端までいき、存在しない場合は、次ラインの左端から
同様の処理を行う。図3(a)に示すように、最初に検
出される黒画素aにラベル1を付加する。
【0016】次に黒画素aを起点として、画素aの8近傍
にラベル付けされていない黒画素をチェックすると、黒
画素bが該当するので、これは連続する黒画素と判定し
画素aと同一ラベル1を付ける。次に画素a,bの8近傍
画素でラベル付けされていない黒画素があるかをチェッ
クして、あれば前記同様に同一ラベルを付ける。この操
作を繰り返して、ラベル1が付加されている全画素の8
近傍にラベル付けされていない黒画素が無くなるまで行
う。
【0017】次に黒画素aの右の画素からラベル付けさ
れていない黒画素があるかをチェックする処理を再開す
る。図3(a)では黒画素gが検出され、この黒画素gに
ラベル1を付加する。このあと黒画素aのときと同様に
ラベル2が付加されている全画素の8近傍にラベル付け
されていない黒画素が無くなるまでラベル2を付加する
処理を繰り返す。図3(a)の場合は、(b)のように
黒画素a〜fまでラベル1が付加され、黒画素g〜lまで
ラベル2が付加される。
【0018】次に、矩形情報の抽出および算出について
説明する。ここで左端座標値をLeft、右端座標値をRigh
t、上端座標値をTop、下端座標値をBottom、画素数(同
一のラベルを付与された画素群の画素総数)をcountと
する。まず、ラベルXが付与される1個目の画素が特定さ
れた時に上記変数を初期化する。1個目の画素の座標値
を(X1、Y1)、1個目の画素に対応する輝度をY1とすると
以下のようになる。 Left = X1 Right = X1 Top = Y1 Bottom = Y1 count = 1
【0019】ラベルXが付与される2個目以降の画素に関
しては、次の様な動作を行う。n個目の画素の座標値を
(Xn、Yn)、n個目の画素に対応する輝度をYnとする。
【0020】 Left ≧ Xn ならば Left = Xnに更新する。 Right ≦ Xn ならば Right = Xnに更新する。 Top ≧ Yn ならば Top = Ynに更新する。 Bottom ≦ Yn ならば Bottom= Ynに更新する。 count = count + 1
【0021】この動作をラベルXの付与が終わるまで行
う。求める矩形情報は上記変数から、以下の様に求めら
れる。 幅(以下Wと示す) = Right − Left + 1 高さ(以下Hと示す) = Bottom− Top + 1 面積(以下Sと示す) = 幅 × 高さ 外接矩形内有効画素数 = count 左端座標値、右端座標値、上端座標値、下端座標値はそ
れぞれ、最終的に得られたLeft、Right、Top、Bottomと
なる。これらの動作を各ラベルに対して行う。
【0022】<ステップS203>ここでは、ステップ
S201で2値化された2値画像の白画素に対し、上下
・左右で連続している画素に同一ラベルを付加し、同時
に矩形をかたどっていく。この処理と同時に矩形情報を
求める。この処理ステップで得られるラベル情報および
矩形情報は記憶装置103に記憶され、後段の処理で用
いられる。矩形情報は以下の内容である。 (A’)外接矩形の幅 (B’)外接矩形の高さ (C’)外接矩形の左端座標値 (D’)外接矩形の右端座標値 (E’)外接矩形の上端座標値 (F’)外接矩形の下端座標値 (G’)外接矩形の面積 (H’)文字包含数:OFF画素群(領域)が直接包含する
文字候補数 (I’)包含ラベル:OFF画素群を直接包含するON画素
群 (J’)属性
【0023】この段階では(A’)〜(G’)の情報を
取得し、(H’)〜(J’)は包含関係検出処理などの
後段の処理で得られる。これらを用いて最終的に属性判
定を行う。
【0024】ここで、ラベル付けの動作を図4を例にし
て説明する。まず主走査方向に左から右にラベル付けさ
れていない白画素があるかをチェックする。主走査方向
右端までいき、存在しない場合は、次ラインの左端から
同様の処理を行う。図4(a)に示す例では、最初に検
出される白画素aにラベル1を付加する。
【0025】次に白画素aを起点として、画素aの上下左
右4近傍にラベル付けされていない白画素をチェックす
ると、画素bが該当するので、これは連続する白画素と
判定し画素aと同一ラベル1を付ける。次に画素a,bの
上下左右4近傍画素でラベル付けされていない白画素が
あるかをチェックして、あれば前記同様に同一ラベルを
付ける。この操作を繰り返して、ラベル1が付加されて
いる全画素の上下左右4近傍にラベル付けされていない
白画素が無くなるまで行う。
【0026】ここでステップS202との違いは、白画
素cに対して白画素dが画素cに連続する白画素とは判
定しないことである。同様に、画素eに対する画素f、
画素gに対する画素h、画素iに対する画素h、画素j
に対する画素k、画素lに対する画素mも連続する白画
素とは判定しない。
【0027】次に白画素aの右の画素からラベル付けさ
れていない白画素があるかをチェックする処理を再開す
る。図4(a)では白画素dが検出され、この白画素d
にラベル2を付加する。
【0028】このあと白画素aのときと同様にラベル2
が付加されている全画素の上下左右4近傍にラベル付け
されていない白画素が無くなるまでラベル2を付加する
処理を繰り返す。上記の処理をラベル付けされていない
白画素がなくなるまで行う。
【0029】図4(a)の場合は、図4(b)に示すよ
うに白画素aから始まる連続画素にはラベル1が付加さ
れ、白画素dから始まる連続画素にはラベル2が付加さ
れ、白画素hから始まる連続画素にはラベル3が付加さ
れる。
【0030】矩形情報の抽出は、ステップS202と同
様に行うため、ここでは説明を省略する。
【0031】<ステップS204>次に、ステップS2
02およびステップS203で抽出され、ラベル付けさ
れたON画素群とOFF画素群の包含関係の検出を行
う。ここでは直接包含関係にある対象画素群を検出す
る。この処理ステップで得られる矩形情報(包含ラベル)
は記憶装置103に記憶され、後段の処理で用いられ
る。
【0032】ここで、包含関係検出の動作を図5に基づ
き説明する。図5(a)に対し、上記ステップS202
およびステップS203の処理を行うと、図5(b)の
ようになる。ここで、ステップS202の処理でのラベ
ルとステップS203の処理でのラベルとを区別するた
めに、ステップS202の処理で付与されたラベルは
およびという形式で表現している。また、各ラベルの
矩形情報は以下のようになる(この包含関係検出ステッ
プでは、座標値データのみの使用であるため、座標値デ
ータのみ示す)。
【0033】ラベル1:Left_1=1、Right_1=11、T
op_1=1、Bottom_1=9 ラベル2:Left_2=3、Right_2=4、Top_2=3、Bott
om_2=6 ラベル3:Left_3=8、Right_3=9、Top_3=3、Bott
om_3=6 ラベル:Left_=2、Right_=5、Top_=2、B
ottom_=7 ラベル:Left_=7、Right_=10、Top_=
2、Bottom_=7
【0034】ここでは、ステップS202でラベル付け
されたものを基準として、包含関係を検出する。まずラ
ベルを付与された画素と隣接する2値化OFF画素を
探索し、それに付与されてるラベル(ステップS203
で付与されたもの)を抽出する。図5(b)のの場合
は、ラベル1と2となる。
【0035】次にラベルとラベル1とラベル2の矩形
情報を基にそれぞれの包含関係を判断する。判断は以下
の方法で行う。
【0036】対象となるラベル(A)の矩形情報をLeft、R
ight、Top、Bottom、対象ラベルの画素と隣接する画素
から構成される画素群のラベル(B)の矩形情報をLef
t’、Right’、Top’、Bottom’とする。
【0037】Left≧Left’ かつRight≦Right’ かつ T
op≧Top’ かつBottom≦Bottom’のとき、ラベル(A)は
ラベル(B)に包含されていると判断する。また、Left≦L
eft’ かつRight≧Right’ かつ Top≦Top’ かつBotto
m≧Bottom’のとき、ラベル(A)はラベル(B)を包含して
いると判断する。上記ラベルとラベル1との関係は、 Left_≧Left_1、Right_≦Right_1、 Top_≧Top_1、Bottom_≦Bottom_1 が成り立つため、ラベルはラベル1に直接包含されて
いると判断する。この場合ラベルの矩形情報(12)は
『1』となる。なお、説明中()が付された数字(数式以
外)は丸付きの数字を意味し、以下同様とする。
【0038】上記ラベルとラベル2との関係は、 Left_≦Left_1、Right_≧Right_1、 Top_≦Top_1、Bottom_≧Bottom_1 が成り立つため、ラベルはラベル2を直接包含してい
ると判断する。この場合ラベル2の矩形情報は『』
となる。
【0039】ここのステップS204では上記のように
各ラベルに対し包含関係を検出し、矩形情報の1つ(包
含ラベル)として対象ラベルを包含するラベルのナンバ
ーを保持する。
【0040】上記例ではラベルの包含ラベルとして
『1』、ラベル2の包含ラベルとしては『』となり、
ラベル1の包含ラベルは『無し』となる。上述のように
この包含関係検出ステップでは2値化のON領域とOF
F領域がどのような構造になっているかを的確に抽出す
ることが大事となる。
【0041】また、ステップS203で斜め方向に連続
する画素に同じラベルを付与しないことが、この包含関
係検出ステップで効果として表れている。なお、ステッ
プS203でステップS202と同様に斜め方向に連続
する画素にも同じラベルを付与すると図5(c)のよう
になり、この包含関係検出ステップではラベル1がラベ
ルとラベルを包含するという情報しか抽出できず、
的確なON領域とOFF領域の構造が抽出できない。
【0042】<ステップS205>ここでは、ステップ
S202、ステップS203、ステップS204で抽出
された矩形情報を基に属性判定を行う。また、本実施形
態において、文字(線分なども)というのは、背景もしく
は枠や表のセル内に存在するものであり、絵柄中に存在
する文字らしきものは絵柄の一部としている。これは本
方式がOCRのような文字認識のために文字を出来るだ
け多く抽出することを目的としているのではなく、スキ
ャン文書を構造的に分解するために行う属性識別を目的
ととしているためである。
【0043】ここで、属性判別の動作を図6を入力画像
として、説明する。図6中のA〜Eの領域はそれぞれ異な
った色で構成されているもので、車の絵も複数色で構成
されているものとする。
【0044】図6に対し、上記説明したステップS20
1〜ステップS204の処理を行った結果を図7(a)
として、以下に説明する。図7中のラベルは、ステップ
S204で説明したと同様にステップS202でラベル
付けされたものは丸で囲まれた数字で表記し、ステップ
S203でラベル付けされたものは数字のみで表記して
いる。図7(b)はステップS204で得られる包含ラ
ベルを示している。
【0045】まずは背景の検出について説明する。本実
施形態では、背景を他のオブジェクト(絵柄、文字、
表、枠など)に一切包含されない領域と定義する。これ
を基に図8に示すフローチャートで2値化OFF画素群
から背景を抽出する。
【0046】図7(a)の例では、2値化OFF画素群
のラベル1〜30について、包含ラベルが存在するかをチ
ェックし、背景を抽出する。図7(b)より、図7
(a)ではラベル1の2値化OFF画素群(領域)が包含
ラベルを有しないため、背景であると判断される。
【0047】次に、2値化ON画素群の属性検出につい
て、図9のフローチャートを用いて説明する。まずは、
本文に用いられる平均的なフォントサイズから予め求め
られる閾値th1を用い、外接矩形サイズの幅(W)および高
さ(H)が共に閾値th1を越えるものは、文書本文中の文字
になり得ないものと判断する。
【0048】しかし、上記処理だけでは文字であると判
断できるわけでなく、更に外接矩形のサイズ(HやW)と外
接矩形縦横比(H/W)を用いる。上記処理で得られた外接
矩形の幅(W)もしくは高さ(H)がth1より小さいものの中
で、WもしくはHが閾値th5より小さいものはノイズ・線
分候補であると判断し、H/Wがth6より大きいもしくはth
7より小さいものは線分候補と判断し、それ以外を文字
候補とする。これをまとめると以下のようになる。 th5≦W …(4) th5≦H …(5) th7≦H/W≦th6 …(6) W≦th1 …(7) H≦th1 …(8)
【0049】上記式(4)(5)(6)全ての条件を満
足し、式(7)(8)のいずれか1つ以上の条件を満足
するものが文字候補で、式(7)(8)のいずれか1つ
以上の条件を満足し、式(4)(5)(6)のいずれか
1つ以上条件を満足しないものがノイズ・線分候補にな
る。
【0050】ここで候補としているのは、前述している
ようにこれら文字(線分なども)は背景もしくは枠や表の
セル内に存在するものしているため、包含ラベルの属性
が確定していないとこれら候補の属性が決まらない。
【0051】この段階では、図8の処理で背景が確定し
ているので、これら候補の中で、包含ラベルの属性が背
景であるものは、ノイズ・線分、文字という属性に確定
する。図7(a)の例では、ラベル〜(148)、(150)〜
(365)、(367)〜(402)である『車の写真、』が文字候補
である。図7(b)より、ラベル〜(148)、(150)〜(3
65)、(367)〜(402)の包含ラベルにラベル1が存在しない
ため、この段階では文字候補のままである。これらの属
性は包含ラベルの属性が確定するまで決まらない。
【0052】次は式(7)(8)の条件を共に満足しな
いものについての属性判定について説明する。式(7)
(8)の条件を共に満足しないものは、th1が本文に用
いられる平均的なフォントサイズから予め求めたもので
あるから、見出し文字や枠・表、絵柄等のように外接矩
形サイズが比較的大きいものである。これらを区別する
ために、像密度(=外接矩形内有効画素数/外接矩形面
積、以下IDと示す)、外接矩形の幅(W)、高さ(H)、
分散(V)、を用いる。
【0053】まず図9に示すように、外接矩形の像密度
(ID)がth2以下の時、その属性は絵柄・枠・表候補と
し、更にWとHの少なくともどちらか一方がth3以上の
時、その属性は絵柄・枠・表候補とする。IDがth2より
大きく、WとHがともにth3より小さい場合は、輝度の分
散(V)を記憶部103に記憶されているラベル画像と入力画
像を基に求め、Vがth4以上の場合は、その属性は絵柄・
枠・表候補とし、th4より小さい場合は、その属性を文
字候補とする。この文字候補に対しては、上述と同様に
その包含ラベルの属性が背景であれば、属性が文字して
確定する。図7(a)の例では、、、、、(14
9)、(366)が絵柄・枠・表候補として判定される。
【0054】次に図9の処理で絵柄・枠・表候補と判定
された黒画素群については、その領域が包含する白画素
群の特徴によって判断する。具体的には、以下のような
それぞれの特徴を利用する。表は、表のセルと想定でき
るような文字を含んだ白画素群を多く含んでいるという
特徴を持っている。
【0055】枠は、包含する白画素群の数が少なく、ま
たその白画素群が更に絵柄・枠・表候補を包含すること
も少なくないという特徴を持っている。絵柄は、表のセ
ルと想定できるような文字を含んだ白画素群を殆ど持っ
ていないという特徴を持っている。
【0056】この前処理として、図8で背景と判断され
なかった2値化OFF画素群についてセル候補か非セル
候補かを判断する。判断の方法は、2値化OFF画素群
が包含している文字候補の数で行う。
【0057】図10は、2値化OFF画素群が包含して
いる文字候補の数を計数する流れであり、2値化ON画
素群が文字候補の場合、その包含ラベルの外接矩形特徴
量である文字候補数をカウントアップする。これを全て
の2値化ON画素群に対して行う。その結果、各2値化
OFF画素群が包含している文字候補の数が計数でき
る。
【0058】これをもとに図11に示すようなフローチ
ャートで、各2値化OFF画素群に対し、セル候補か、
非セル候補かを判断する。判断は2値化OFF画素群が
包含している文字候補数が閾値th7以上か否かで行う。
また、同時に、この2値化OFF画素群の包含ラベルの
外接矩形情報である、セル候補数、非セル候補数をカウ
ントアップする。
【0059】次に図12に示すフローチャートで絵柄・
枠・表候補に対する属性判定を行う。まず、非セル候補
数がth8より少なく、セル候補数が0のものは、枠と想
定されるので枠・表と判定する。また、セル候補数の包
含する2値化OFF画素群の数に占める割合がth9より
大きいものは表と想定されるので枠・表と判定する。上
記2条件を満たさないものを絵柄と判定する。
【0060】図13はこの段階で属性が確定していない
領域に対する判定のフローである。まず2値化OFF領
域に対しその包含ラベルの属性が絵柄であればその属性
を絵柄にし、枠・表であればその属性をセルとする。ま
たどちらの場合でもない場合は、未確定とし、iをカウ
ントアップする。これは、2値化ON画素群と2値化O
FF画素の包含関係が数階層にもなっていることがある
ためで、この段階では包含ラベルの属性として、文字候
補が存在するためである。
【0061】これを図14で説明する。図14(a)
は、車の絵の中に文字があるもので、その点線円部を拡
大したものが図14(b)である。図14(b)に示す
ように、属性が絵柄判定されたフレーム部分(A)、それ
が包含する2値化OFF領域(B)、その2値化OFF領
域が包含する文字候補(C)、その文字候補が包含する2
値化OFF領域(D)と構造になっている。
【0062】Aの属性が絵柄であるため、Bの属性は絵柄
と確定するが、Dに関してはその包含ラベル(C)の属性が
文字候補である。この段階ではDの属性を絵柄と判定で
きない。この処理を全ての属性未確定な2値化OFF群
に対して行う。
【0063】次に属性未確定な2値化ON画素群に対す
る属性を判定する。2値化ON領域に対しその包含ラベ
ルの属性が絵柄であればその属性を絵柄にし、セルであ
ればその属性を文字とする。またどちらの場合でもない
場合は、未確定とし、jをカウントアップする。これ処
理を全ての属性未確定な2値化ON群に対して行う。このj
は上記iと同じ理由であるため、説明は省略する。図1
4の例では、この段階でCの属性は絵柄と確定する。
【0064】この段階でi=0、j=0であるかをチェックし
そうでない場合は、iおよびjを一旦0にリセットした
後、再度上記処理を繰り返し、およびjが0になるまで行
う。図14の例では、Dの包含ラベルの属性が絵柄であ
るため、Dの属性も絵柄と確定し、全ての属性が確定す
る。
【0065】以上のようにして求めた各種領域の属性デ
ータを画像データと共に外部へ出力する。
【0066】次に、本実施形態の他の例を説明する。他
の例では、上述のステップS203、S204、S20
5において2値画像の白画素に対する外接矩形情報とし
て、下記(A’)〜(J’)の10種の情報を取得し、
それを用いて各種領域の属性データを確定しているが、
更にその白画素群(領域)の色情報(K’)を矩形情報に
追加することで、背景および表・枠のセルを白地の背
景、表・枠のセル、非白地の背景、表・枠のセルと属性
を細分類できる。
【0067】色情報は白画素に対応した記憶部103に
記憶されている入力画像を参照することにより、求め
る。求める方法は、公知の代表色決定方法で構わない。
【0068】矩形情報に色情報が追加されたことによ
り、この属性データを基に画像データに対する補正処理
(空間フィルタ、下地除去、明度補正、彩度補正等)を行
う場合に、先に説明した実施形態より細かな設定が可能
となる。 (A’)外接矩形の幅 (B’)外接矩形の高さ (C’)外接矩形の左端座標値 (D’)外接矩形の右端座標値 (E’)外接矩形の上端座標値 (F’)外接矩形の下端座標値 (G’)外接矩形の面積 (H’)文字包含数:OFF画素群(領域)が直接包含する
文字候補数 (I’)包含ラベル:OFF画素群を直接包含するON画素
群 (J’)属性 (K’)色情報
【0069】また、先に説明した実施形態では、文字、
ノイズ・線分、背景、表・枠、絵柄、表・枠のセルとい
う属性を属性データとして、画像データと共に外部へ出
力するとしているが、特にこれに限定するものではな
い。ここで得られた属性情報を用いて、実施される処理
の目的などによって、上記属性を組み合わせて1つの属
性として出力しても構わない。
【0070】例えば、背景と文字の属性のものを同一の
属性にして、文字領域として出力することも可能であ
る。特に上述のような属性データを基に画像データに対
する補正処理を行う場合は、このように文字とそれを直
接包含する領域をまとめて、文字領域とした方が扱いや
すい。
【0071】また、上述のステップS205において、
いくつかの2値化ON画素群に対し、記憶装置103に
記憶されている入力画像から、そのON画素に対応する
画像データ参照し輝度の分散を求めているが、これは属
性を識別する際に、全てのラベルに対して不可欠な情報
ではないためである。しかし、輝度の分散を求めるのは
ステップS205である必要はなく、ステップS202
の段階で求めても構わない。同様に2値化OFF群の色
情報抽出に関しても同様で、ステップS203の段階で
抽出しても構わない。
【0072】
【発明の効果】以上説明したように、本発明によれば、
2値化ON画素およびOFF画素それぞれにラベリング
を行って得られた外接矩形情報と2値化ON画素群およ
びOFF画素群の包含関係情報を用いることで、文字、
表・枠、写真、背景等の領域を分割するようにしたの
で、複雑な領域構成の分割精度の向上が得られる効果が
ある。
【図面の簡単な説明】
【図1】 本実施形態の画像処理方法を実現する装置の
構成図である。
【図2】 領域識別部で実行される領域識別処理の流れ
を表すフローチャートである。
【図3】 黒画素へのラベル付けの動作を説明する模式
図である。
【図4】 白画素へのラベル付けの動作を説明する模式
図である。
【図5】 包含関係の動作を説明する模式図である。
【図6】 属性判別の動作を説明する図である。
【図7】 処理結果を説明する図である。
【図8】 背景抽出のフローチャートである。
【図9】 ON画素の属性検出のフローチャートであ
る。
【図10】 文字候補の数の計数のフローチャートであ
る。
【図11】 セル候補の判断のフローチャートである。
【図12】 絵柄・枠・表候補に対する属性判定のフロ
ーチャートである。
【図13】 属性が確定していない領域に対する判定の
フローチャートである。
【図14】 属性が確定していない領域に対する判定を
説明する図である。
【符号の説明】
101…画像入力部、102…CPU、103…記憶
部、104…領域識別部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 入力画像を黒画素に対応したエッジと白
    画素に対応した非エッジとに分離する2値化ステップ
    と、 前記2値化ステップで2値化された2値画像の黒画素に
    対し、上下・左右・斜めで連続している画素に同一ラベ
    ルを付加し、同一ラベルの付された画素群の外接矩形を
    かたどっていく第1のラベリングステップと、 前記2値化ステップで2値化された2値画像の白画素に
    対し、上下・左右で連続している画素に同一ラベルを付
    加し、同一ラベルの付された画素群の外接矩形をかたど
    っていく第2のラベリングステップと、 前記第1のラベリングステップでラベル付けされた外接
    矩形と前記第2のラベリングステップでラベル付けされ
    た外接矩形との包含関係を検出する包含関係検出ステッ
    プと、 前記包含関係検出ステップの結果と、前記第1のラベリ
    ングステップでラベル付けされた外接矩形に関する第1
    の情報と、前記第2のラベリングステップでラベル付け
    された外接矩形に関する第2の情報とを用いて、全画素
    に対し、属性を区別する属性検出ステップと、 前記属性検出ステップの検出結果に基づいて前記入力画
    像の領域分割を行う領域分割ステップとを備えることを
    特徴とする画像処理方法。
  2. 【請求項2】 前記第2のラベリングステップで同一ラ
    ベルを付与された画素に対応する入力画像からラベル毎
    に色味を求める色味検出ステップを更に有することを特
    徴とする請求項1記載の画像処理方法。
  3. 【請求項3】 前記属性検出ステップが区別する属性の
    種類に、少なくとも文字、図形または写真、表または
    枠、背景が含まれていることを特徴とする請求項1また
    は2記載の画像処理方法。
  4. 【請求項4】 前記属性検出ステップが区別する属性の
    種類に、少なくとも文字、図形または写真、表または
    枠、背景、表・枠のセルが含まれていることを特徴とす
    る請求項1または2記載の画像処理方法。
  5. 【請求項5】 前記属性検出ステップが区別する属性の
    種類において、背景、表・枠のセルを彩度および明度の
    少なくともどちらかを用いて細分類することを特徴とす
    る請求項4記載の画像処理方法。
  6. 【請求項6】 前記第1の情報は、外接矩形の幅、高
    さ、面積、画素密度、分散であり、前記第2の情報は、
    外接矩形の幅、高さであることを特徴とする請求項1記
    載の画像処理方法。
  7. 【請求項7】 入力画像を白黒の2値画像に変換してエ
    ッジと非エッジとに分離する2値化ステップと、 前記2値化ステップで2値化された2値画像の黒画素に
    対し、上下・左右・斜めで連続している画素に同一ラベ
    ルを付加し、同一ラベルの付された画素群の外接矩形を
    かたどっていく第1のラベリングステップと、 前記2値化ステップで2値化された2値画像の白画素に
    対し、上下・左右で連続している画素に同一ラベルを付
    加し、同一ラベルの付された画素群の外接矩形をかたど
    っていく第2のラベリングステップと、 前記第1のラベリングステップでラベル付けされた外接
    矩形と前記第2のラベリングステップでラベル付けされ
    た外接矩形との包含関係を検出する包含関係検出ステッ
    プと、 前記包含関係検出ステップの結果と、前記第1のラベリ
    ングステップでラベル付けされた外接矩形に関する第1
    の情報と、前記第2のラベリングステップでラベル付け
    された外接矩形に関する第2の情報とを用いて、全画素
    に対し、属性を区別する属性検出ステップと、 前記属性検出ステップの検出結果に基づいて前記入力画
    像の領域分割を行う領域分割ステップとを備えることを
    特徴とする画像処理プログラム。
  8. 【請求項8】 前記第2のラベリングステップで同一ラ
    ベルを付与された画素に対応する入力画像からラベル毎
    に色味を求める色味検出ステップを更に有することを特
    徴とする請求項7記載の画像処理プログラム。
  9. 【請求項9】 前記属性検出ステップが区別する属性の
    種類に、少なくとも文字、図形または写真、表または
    枠、背景が含まれていることを特徴とする請求項7また
    は8記載の画像処理プログラム。
  10. 【請求項10】 前記属性検出ステップが区別する属性
    の種類に、少なくとも文字、図形または写真、表または
    枠、背景、表・枠のセルが含まれていることを特徴とす
    る請求項7または8記載の画像処理プログラム。
  11. 【請求項11】 前記属性検出ステップが区別する属性
    の種類において、背景、表・枠のセルを彩度および明度
    の少なくともどちらかを用いて細分類することを特徴と
    する請求項10記載の画像処理プログラム。
  12. 【請求項12】 前記第1の情報は、外接矩形の幅、高
    さ、面積、画素密度、分散であり、前記第2の情報は、
    外接矩形の幅、高さであることを特徴とする請求項7記
    載の画像処理プログラム。
JP2002074000A 2002-03-18 2002-03-18 画像処理方法および画像処理プログラム Pending JP2003271973A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002074000A JP2003271973A (ja) 2002-03-18 2002-03-18 画像処理方法および画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002074000A JP2003271973A (ja) 2002-03-18 2002-03-18 画像処理方法および画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2003271973A true JP2003271973A (ja) 2003-09-26

Family

ID=29203515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002074000A Pending JP2003271973A (ja) 2002-03-18 2002-03-18 画像処理方法および画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2003271973A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007235679A (ja) * 2006-03-02 2007-09-13 Ricoh Co Ltd 画像出力システム、プログラム及び情報記録媒体
US7889280B2 (en) 2006-09-06 2011-02-15 Canon Kabushiki Kaisha Image processing apparatus and method thereof
US8218178B2 (en) 2008-01-17 2012-07-10 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, recording medium storing image processing program, and computer data signal embedded in carrier wave
JP7408490B2 (ja) 2020-06-04 2024-01-05 株式会社東芝 動画像速度検出装置、動画像速度検出方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007235679A (ja) * 2006-03-02 2007-09-13 Ricoh Co Ltd 画像出力システム、プログラム及び情報記録媒体
US7889280B2 (en) 2006-09-06 2011-02-15 Canon Kabushiki Kaisha Image processing apparatus and method thereof
US8218178B2 (en) 2008-01-17 2012-07-10 Fuji Xerox Co., Ltd. Image processing apparatus, image processing method, recording medium storing image processing program, and computer data signal embedded in carrier wave
JP7408490B2 (ja) 2020-06-04 2024-01-05 株式会社東芝 動画像速度検出装置、動画像速度検出方法

Similar Documents

Publication Publication Date Title
USRE47889E1 (en) System and method for segmenting text lines in documents
US6993185B2 (en) Method of texture-based color document segmentation
CN107093172B (zh) 文字检测方法及***
JP4745296B2 (ja) デジタル画像の領域分離方法および領域分離システム
KR100525692B1 (ko) 컬러 화상 처리 장치 및 패턴 추출 장치
JP4745297B2 (ja) デジタル画像における均一な色の領域を特定する方法およびシステム
US9158986B2 (en) Character segmentation device and character segmentation method
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2000172849A (ja) 画像処理装置及びパターン抽出装置
JP2007272601A (ja) 画像処理装置、制御方法、コンピュータプログラム
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
CN101122952A (zh) 一种图片文字检测的方法
US20090245640A1 (en) Image determination apparatus, image search apparatus and a recording medium on which an image search program is recorded
JP2010218420A (ja) 文字認識装置、画像読取装置、およびプログラム
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
EP0949579A2 (en) Multiple size reductions for image segmentation
JP3851742B2 (ja) 帳票処理方法及び装置
CN113971792A (zh) 交通标志牌的字符识别方法、装置、设备和存储介质
JP2005317042A (ja) 画像処理装置
Hemachander et al. Locally adaptive block thresholding method with continuity constraint
JPH05166002A (ja) ソース画像を分析する方法
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JP2003271973A (ja) 画像処理方法および画像処理プログラム
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法