JPH0916713A

JPH0916713A - 画像領域分割方法

Info

Publication number: JPH0916713A
Application number: JP7159541A
Authority: JP
Inventors: Hisafumi Saika; 尚史斎鹿
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1995-06-26
Filing date: 1995-06-26
Publication date: 1997-01-17
Anticipated expiration: 2018-12-10
Also published as: JP3476595B2

Abstract

(57)【要約】【構成】濃淡画像中のピクセルを、互いに近接し、且
つその濃度レベルの差が閾値よりも小さいという関係に
基づいてラベリングし、同一ラベルを有するピクセルか
らなる領域に分割する（Ｓ３）。分割後の各領域の属性
を、各領域の幾何学的特徴、濃度分布、相互の包含関係
に基づいて判定する（Ｓ５）。【効果】多種多様な入力画像に対して、複雑な処理を
行うことなく、正確に文字領域及び非文字領域とに分割
することができる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字認識装置および画
像認識装置に適用され、濃淡画像を文字領域及びその他
の領域等の属性に応じて分割する画像領域分割方法に関
するものである。

【０００２】

【従来の技術】従来より、濃淡画像を、文字領域及びそ
の他の背景領域等の属性に応じて分割する際、画像濃度
の２値化によって分割することが知られており、例えば
２値化の方法としては、「Ｐタイル法」、「双峰性ヒス
トグラムの分散最大による二分割法」（長尾真著「画像
認識論」、コロナ社、３８頁〜４５頁）等がある。

【０００３】上記Ｐタイル法は、例えば図９（ａ）に示
すように、画像中の各ピクセル（画素）の濃度レベル差
の濃度差閾値θ以上（または以下）のピクセルの割合
が、予め定められた比率になるように上記濃度差閾値θ
の値を決定するものである。

【０００４】また、双峰性ヒストグラムの分散最大によ
る二分割法は、例えば図９（ｂ）に示すように、濃度値
ヒストグラムを濃度差閾値θで二分するとき、２つのピ
クセルの濃度のクラス間分散が最大となるように上記濃
度差閾値θの値を決定するものである。

【０００５】ところで、画像中の文字領域を認識するた
めに、上記Ｐタイル法では、以下の仮定が必要である。（１）画像中で文字領域が占めるピクセル数は一定範囲
にある。

【０００６】また、上記Ｐタイル法および双峰性ヒスト
グラムの分散最大による二分割法では、以下の仮定が必
要である。（２）画像中で文字領域を構成する濃度帯域、非文字領
域を構成する濃度帯域はそれぞれ連続している。

【０００７】つまり、上記の両２値化法では、図１０
（ａ）に示すように、文字領域と非文字領域の濃度帯域
がそれぞれ連続していれば、画像と文字領域を認識する
ことができるが、図１０（ｂ）に示すように、文字領域
と非文字領域の濃度帯域のいずれかが不連続であれば、
画像と文字領域を認識することができない。

【０００８】しかも、上記した仮定（１）（２）は、単
色の紙に、文字が別の単色で書かれた紙面を入力する際
には多くの場合有効であるが、入力画像の範囲をカラー
文書や種々の物体を含んだ画像にまで拡げると、一般に
成立しない。これは、カラー文書では、文字が種々の異
なる色で書かれている場合があり、このような場合文字
領域の濃度レベルが一定ではなくなり、また種々の物体
を含んだ一般画像では、文字が画像中にどれほど含まれ
るかは各画像によって大きく変化するためである。

【０００９】尚、上記の種々の物体とは、画像に含まれ
るが、本来の処理対称と無関係なものを示している。例
えば、風景の中から、速度制限を示し文字列を取り出
し、認識するシステムを車両に搭載して走行する場合で
は、画像内の処理対称である上記速度制限を示し文字列
の他に存在する物、例えば他の車両、人物、看板、信号
機等が種々の物体となる。また、自動車のナンバープレ
ートの認識を行うため、走行中の車両を定点から撮影し
たシステムにおいても、画像内の処理対称である自動車
のナンバープレートの他に存在するものが種々の物体と
なる。

【００１０】したがって、上記従来の２値化法では、カ
ラー文書等を含む画像において、自動的に、且つ正確な
２値化を行い、文字部分を抽出することは不可能であっ
た。

【００１１】そこで、カラー文書等を含む種々の画像に
対して、文字部分を抽出するための方法が、例えば、（Ａ）特開平４−２７３７８８号公報（Ｂ）特開平３−１０８０７８号公報に開示されている。

【００１２】上記公報（Ａ）に開示された方法では、画
像の濃度帯域を複数に分割し、それぞれに属するピクセ
ルについてラベリング等の処理を行うことで、カラー文
書等を含む種々の画像に対して、文字部分を抽出するよ
うになっている。

【００１３】また、上記公報（Ｂ）に開示された方法で
は、対象となる画像の特定の濃度レベルに着目して、そ
の濃度レベルおよび近い濃度レベルのピクセルを取り出
してラベリング等の処理を行い、カラー文書等を含む種
々の画像に対して、文字部分を抽出するようになってい
る。

【００１４】

【発明が解決しようとする課題】ところが、上記公報
（Ａ）の方法では、画像の濃度帯域の切れ目の両側に属
するピクセルは別の領域に分離されてしまうので、本来
同一の領域に属すべき近い濃度レベルの２つの近接した
ピクセルが別々の領域に分離される虞がある。このた
め、例えば、画像中の濃度がなだらかに変化する領域
が、濃度帯域の切れ目で複数の領域に分割された場合、
濃度レベルの近い近接したピクセルを含む領域、即ち本
来同一の領域に属すべき領域の再統合が必要となり、文
字領域を抽出するための処理が複雑になるという問題が
生じる。

【００１５】また、上記公報（Ｂ）の方法では、予め対
象となる画像の着目する濃度帯域の少なくとも中心濃度
帯域を知る必要がある。このため、例えば、異なる文字
が異なる色で印刷されているような紙面から文字部分を
取り出す場合等、処理が始まる時点で、文字領域の濃度
帯域が判っていない場合には、何度も着目濃度帯域を変
えて処理をやり直し、処理結果を比較、合成する等の複
雑な処理がさらに必要となり、文字領域を抽出するため
の処理が複雑になるという問題が生じる。

【００１６】本発明は、上記問題点に鑑みなされたもの
であって、その目的は、文字領域の抽出のために複雑な
処理を行うことなく、カラー文書を含む画像等の多様な
入力画像から文字領域を抽出し、画像の文字領域と非文
字領域といった属性に応じた領域を正確に分割し得る画
像領域分割方法を提供することにある。

【００１７】

【課題を解決するための手段】請求項１の画像領域分割
方法は、濃淡画像を、文字、非文字等の属性に応じて分
割する画像領域分割方法において、濃淡画像中のピクセ
ルを、互いに近接し、且つその濃度レベルの差が閾値よ
りも小さいという関係に基づいてラベリングし、同一ラ
ベルを有するピクセルからなる領域に分割し、分割後の
各領域の属性を判定することを特徴としている。

【００１８】請求項２の画像領域分割方法は、請求項１
の画像領域分割方法において、分割後の各領域の属性
を、各領域の幾何学的特徴、濃度分布、相互の包含関係
に基づいて判定することを特徴としている。

【００１９】

【作用】請求項１の方法によれば、近接し、且つ濃度レ
ベル差が閾値以下のピクセルを同一領域として画像領域
を分割し、分割後の各領域に対して、例えば請求項２記
載のように各領域の幾何学的特徴、濃度分布、相互の包
含関係によりその属性（文字、非文字など）を決定して
いるので、画像中に濃度レベルが異なる文字領域がいく
つあっても、それらと、近接した非文字領域との濃度レ
ベル差が十分であれば、正確に文字領域を構成するピク
セルを抽出することが可能である。

【００２０】つまり、「同一の領域に属するべき近接し
たピクセルは、近い濃度レベルを有する」という仮定以
外に、領域の濃度レベルや画像中の濃度分布について何
の仮定も行わずに画像領域を分割することができるの
で、従来のように、画像から文字領域を認識するため
に、「画像中で文字領域が占めるピクセル数は一定範囲
にある。」、「画像中で文字領域を構成する濃度帯域、
非文字領域を構成する濃度帯域はそれぞれ連続してい
る。」といった仮定をする必要がなくなる。

【００２１】また、近接したピクセルが同一の領域に属
するか否かを判定する際、濃度レベルの小さな差を許容
し、しかもあらかじめ濃度帯域を分割して処理しないの
で、本来同一の領域に属すべき、近い濃度レベルを有す
る２つの近接したピクセルが別の領域に分割されること
がなくなる。

【００２２】したがって、例えば、なだらかに濃度が変
化する領域が、濃度帯域の切れ目で複数の領域に分割さ
れてしまうことがなくなり、濃度レベルの近い近接した
ピクセルを含む領域の再統合が不要となり、文字領域の
抽出処理を簡単に行うことができる。

【００２３】さらに、上記したように、画像中に濃度レ
ベルが異なる文字領域がいくつあっても、それらと、近
接した非文字領域との濃度差が十分であれば、正確に文
字領域を構成するピクセルを抽出することが可能とな
る。

【００２４】これにより、異なる色で書かれた文字が同
一画像中にある場合など、処理したい領域の濃度レベル
があらあじめ不明でも、問題なく文字領域の抽出処理が
行える。

【００２５】したがって、複雑な処理を行うことなく、
濃度レベルの異なる領域が複数存在するようなカラー文
書を含む多種多様な入力画像から文字領域を抽出するこ
とができ、この結果、画像を、文字領域と非文字領域等
の属性に応じて正確に分割することができる。

【００２６】

【実施例】本発明の一実施例について図１ないし図８に
基づいて説明すれば、以下の通りである。尚、本実施例
では、本発明の画像領域分割方法を、光学式文字読取装
置を備えた文字認識システムに適用した場合について説
明する。

【００２７】本実施例に係る文字認識システムは、図３
に示すように、スキャナ１、画像バッファ２、関係判定
部３、ラベルバッファ４、分割結果出力部５、分割結果
バッファ６、領域属性判定部７、属性判定ルールベース
８、領域属性バッファ９、二値画像生成部１０、二値画
像バッファ１１、文字切り出し部１２、文字座標バッフ
ァ１３、文字認識部１４、認識結果バッファ１５、言語
処理部１６、言語辞書１７、結果修正部１８、ディスプ
レイ１９、キーボード２０、結果出力部２１、プリンタ
２２からなっている。

【００２８】スキャナ１は、用紙等の文字領域および非
文字領域からなる画像を光学的に読み取るようになって
いる。画像バッファ２は、スキャナ１によって読み取ら
れた画像の画像情報として、例えば各画素（以下、ピク
セルと称する）毎の位置座標および濃度レベルを記憶す
るようになっている。

【００２９】関係判定部３は、画像バッファ２に記憶さ
れた画像情報から、「位置座標が近接しており、濃度レ
ベルが近い」２つのピクセルに共通のラベルを付与する
ラベリング処理を行い、ラベルバッファ４の内容を書き
換えるようになっている。尚、関係判定部３における画
像分割処理、即ちラベルバッファ４の内容の書換えにつ
いては、後で詳細に述べる。

【００３０】ラベルバッファ４は、画像中のピクセルと
１対１に対応する整数を格納する配列であり、ラベルバ
ッファ要素Ｌ

〔０〕，Ｌ〔１〕，Ｌ〔２〕，・・・と表
すものとする。尚、上記ラベルバッファ４は、関係判定
部３による書換え前に、全ての要素Ｌに異なる数値が入
るように初期化される。例えば、Ｌ〔ｉ〕＝ｉ（ｉ＝
０，１，・・・・・）となるように初期化される。

【００３１】分割結果出力部５は、画像バッファ２とラ
ベルバッファ４との内容を参照し、画像中のピクセル
を、対応するラベルバッファ４の要素の値が共通なもの
ごとに分け、後の処理に必要な情報を取り出して分割結
果バッファ６に格納するようになっている。ここで、対
応するラベルバッファ４の要素の値が共通なピクセル
は、同一の領域に属するものである。

【００３２】分割結果バッファ６には、例えば以下の情
報が格納される。Ｉ．各領域の外接長方形の頂点座標 II．ピクセルの濃度値の領域ごとの平均値 III. 各領域を構成するピクセル数尚、分割結果バッファ６には、後の処理の必要に応じ
て、ここまでの処理において得られる上記Ｉ〜III まで
の情報以外の他のいかなる情報を格納しても良い。

【００３３】上記情報のうち、Ｉは、領域を構成するピ
クセルの水平方向、鉛直方向の最小、最大座標を算出す
ることで得られる。IIは、ラベルバッファ４の要素の値
が共通なピクセルを集めてその濃度平均値を計算するこ
とで得られる。III は、ラベルバッファの要素の値が共
通なピクセルの個数を計算することで得られる。

【００３４】領域属性判定部７は、分割後の各領域の属
性を、各領域の幾何学的特徴、濃度分布、相互の包含関
係に基づいて判定するようになっている。即ち、領域属
性判定部７では、分割結果バッファ６の情報および属性
判定ルールベース８の内容を参照して、各領域の属性
（例えば、文字であるか非文字であるか）を判定し、そ
の判定結果を領域属性バッファ９に格納するようになっ
ている。

【００３５】属性判定ルールベース８には、以下のルー
ルが用いられる。領域の外接長方形の面積と比較して、領域を構成す
るピクセル数が小さいものには文字属性を与える。外接長方形が一定以上の大きさをもつものには非文
字属性を与える。文字属性を持った他の領域を内部に持つ、一定以上
の大きさの領域には非文字属性を与える。外接長方形の面積が小さな非文字領域について、濃
度平均値及び外接長方形の座標のいずれも近い文字領域
が存在する場合には文字属性を与える。

【００３６】上記ルールのうち、は、大多数の文字は
線から構成されるため、文字を構成するピクセル数は、
外接長方形の面積に比して小さいことを利用したもので
ある。は、大多数の文字のサイズが一定範囲に収まる
ことを利用したものである。は、文字が文字を含むこ
とが通常使用される文字ではあり得ないことを利用した
ものである。は、句読点はサイズが小さく、且つの
ルールの例外となり得るが、その近傍には大抵別の文字
が存在するということを利用したものである。尚、属性
判定ルールベース８では、上記以外の他の公知のルール
を使用しても良い。

【００３７】二値画像生成部１０は、上記した画像バッ
ファ２、ラベルバッファ４、分割結果バッファ６および
領域属性バッファ９を参照して、文字に対応するピクセ
ルには１、それ以外のピクセルには０を濃度レベルとし
て与えた画像を作成し、その二値画像を二値画像バッフ
ァ１１に格納するようになっている。

【００３８】尚、単に、文字を構成するピクセルを取り
出したい場合には、いわゆる二値化処理は全く不要であ
り、画像バッファ２、分割結果バッファ６および領域属
性バッファ９の内容を適宜組み合わせて出力すれば十分
であるが、本実施例では、異なる色で書かれた文字につ
いても、従来の白黒画像に適用された同一の認識方法が
適用できるように、上記したように文字領域と非文字領
域とにそれぞれ別の一定の濃度レベルを与えた２値画像
を作成している。

【００３９】文字切り出し部１２は、上記二値画像バッ
ファ１１の情報を参照して、画像中の文字位置を取り出
し、その文字座標を文字座標バッファ１３に格納するよ
うになっている。このとき、二値画像バッファ１１の情
報に加えて、分割結果バッファ６と領域属性バッファ９
とに含まれる情報を利用して非文字領域は処理対象から
除外する。

【００４０】文字認識部１４は、二値画像バッファ１１
と文字座標バッファ１３との情報を参照して文字認識を
行い、その結果を認識結果バッファ１５に格納するよう
になっている。尚、認識結果バッファ１５には、各文字
の認識結果からなる文字列が格納される。

【００４１】言語処理部１６は、認識結果バッファ１５
に格納された文字列から単語を取り出し、言語辞書１７
を参照して、文字列に含まれる単語で言語辞書１７にな
いものがあれば、その単語の認識結果が疑わしいことを
示すマークを該単語に付与し、再び認識結果バッファ１
５に格納するようになっている。

【００４２】結果修正部１８は、認識結果バッファ１５
の内容をディスプレイ１９に出力するようになってい
る。このとき、結果修正部１８は、言語処理部１６によ
って付与された認識が疑わしいマークが付与された単語
を反転表示させ、これによって、使用者に対して誤認識
した単語についての変更を促すようになっており、使用
者がキーボード２０を操作することで上記マークの付与
された単語を正しい単語に変更した後、再び認識結果バ
ッファ１５に変更前の誤認識の単語を変更後の単語に書
き換えて格納するようになっている。

【００４３】結果出力部２１は、認識結果バッファ１５
の内容をプリンタ２２に出力するようになっている。

【００４４】ここで、関係判定部３における画像分割処
理について、図４ないし図８を参照しながら以下に説明
する。尚、各図中に示したピクセルの位置は、図中、上
から数えて何行目、左から数えて何列目（以下、本実施
例では何行何列目とする）と表現する。

【００４５】まず、スキャナ１で画像バッファ２に格納
された画像中の任意の２つのピクセルに対して、関係Ｓ
を以下の手順で定義しておく。尚、下記で「近接してい
る」とは、いわゆる４連結または８連結の意味で「隣接
している」という条件でもよく、また「互いの距離が小
さい」という条件でも良い。ただし、４連結の意味で隣
接しているとは、着目ピクセルの１つ上、１つ下、１つ
左、１つ右のいずれかに位置することを意味し、８連結
の意味で隣接しているとは、上記のいずれかまたは、１
つ右上、１つ右下、１つ左上、１つ左下のいずれかに位
置することを意味する。ここで、上記４連結および８連
結とは、例えば図８を用いて説明すると、格子状に配置
された９つのピクセルＡ〜ＩのうちピクセルＥに着目し
た場合に、図中Ｄ、Ｂ、Ｆ、Ｈの４点をＥの隣接点とみ
なしてピクセルの連結関係を考えるのが４連結、また、
図中Ａ、Ｂ、Ｃ、Ｄ、Ｆ、Ｇ、Ｈ、Ｉを全てピクセルＥ
の隣接点とみなしてピクセルの連結関係を考えるのが８
連結である。

【００４６】次に、任意の２つのピクセルＸ₀，Ｘ₁に
ついて、「２つのピクセルＸ₀，Ｘ₁が近接しており、
その濃度レベルの差が濃度差閾値α以下である」とき、
「関係Ｒ（Ｘ₀，Ｘ₁）が成り立つ」と定義する。但
し、上記αは、画像全体にわたって同じ値を定めておい
てもよいし、２つのピクセルの濃度レベルの関数αを予
め定めておき、その値をとっても良い。また、２つのピ
クセルの座標等を、αを定めるパラメータに入れても良
い。

【００４７】上記「関係Ｒ（Ｘ₀，Ｘ₁）が成り立つ」
について、図４を参照しながら以下に説明する。但し、
濃度差閾値αは画像全体に対して２とし、「近接してい
る」とは８連結の意味で隣接していることとする。ま
た、図中の小さな円はピクセルを、円中の数字は濃度レ
ベルを表す。

【００４８】図４において、例えば３行３列目にある濃
度レベル３のピクセルに着目し、このピクセルと直線で
結ばれているのが、同ピクセルとの間に関係Ｒが成り立
つピクセルである。例えば、３行３列目のピクセルをＸ
₀、３行２列目のピクセルをＸ₁とすれば、Ｘ₀の濃度
レベルは３、Ｘ₁の濃度レベルは４であり、濃度レベル
の差が１となる関係、即ち濃度差閾値α≦２の関係とな
る。したがって、３行３列目のピクセルＸ₀と３行２列
目のピクセルＸ₁は、関係Ｒ（Ｘ₀，Ｘ₁）が成り立っ
ていることになる。

【００４９】また、２つのピクセルａ，ｂについて、
「ピクセル列｛Ｘｉ｝（ｉ＝０，１，・・，ｎ−１；ｎ
はある正の整数、Ｘ₀＝ａ、Ｘ_n-1＝ｂ）が存在して、
Ｒ（Ｘ_i，Ｘ_i+1）（但し、０≦ｉ≦ｎー２）が全て成
り立つ」という関係が成立するとき、「関係Ｓ（ａ，
ｂ）が成り立つ」と定める。

【００５０】つまり、関係Ｓ（ａ，ｂ）が成り立つと
は、ピクセルａから出発して、現在いるピクセルとの間
で関係Ｒが成り立つような近接したピクセル（関係Ｒの
定義から、関係Ｒが成り立つような２つのピクセルは必
ず近接している）の１つに移動することを繰り返して、
ピクセルｂに到達できることを示している。

【００５１】上記「関係Ｓ（ａ，ｂ）が成り立つ」につ
いて、図５を参照しながら以下に説明する。但し、濃度
差閾値αは画像全体に対して２とし、「近接している」
とは８連結の意味で隣接していることとする。また、図
中の小さな円はピクセルを、円中の数字は濃度レベルを
表す。

【００５２】図５において、互いに直線で結ばれている
のが、３行３列目のピクセルに着目すると、このピクセ
ルとの間に関係Ｓが成り立つピクセルである。つまり、
直線で結ばれているピクセルは、互いに関係Ｒが成り立
つものであり、この関係Ｒが成り立つピクセル同士をた
どって行くことで、３行３列目のピクセルと関係Ｓが成
り立つ全てのピクセルに到達できるようになっている。

【００５３】但し、説明の便宜上、図４および図５にお
いて、３行３列目のピクセルと隣接しているが関係Ｒの
成り立たないピクセル、例えば２行４列目のピクセル
（濃度レベル１８）については、このピクセルと隣接し
た他のピクセル、例えば３行４列目のピクセルあるいは
１行４列目のピクセルとの間に関係Ｒが成立していたと
しても、関係Ｒを示す直線は省略している。

【００５４】また、上記関係判定部３の目的は、画像中
の２つのピクセル（以下、Ｘｉ，Ｘｊとする）からなる
全ての組合せを取り出して、実際に関係Ｓ（Ｘｉ，Ｘ
ｊ）が成り立つか否かを判定し、成り立つ場合には、Ｘ
ｉ，Ｘｊに対応するラベルバッファ４の２つの要素Ｌ
〔ｉ〕，Ｌ〔ｊ〕に同一のラベルの値を与えるラベリン
グ処理を行うことである。

【００５５】しかしながら、関係判定部３において、Ｓ
（Ｘｉ，Ｘｊ）が成り立つか否かを判定するのではな
く、Ｒ（Ｘｉ，Ｘｊ）が成り立つか否かを判定し、成り
立つ場合には、２つの要素Ｌ〔ｉ〕，Ｌ〔ｊ〕、および
その時点での要素のいずれかと等しい値のラベルバッフ
ァ４に格納された要素全てに対して、共通の値（以下、
Ｖ₀とする）を代入するようにしても良い。この場合、
Ｖ₀は、その時点でのＬ〔ｉ〕，Ｌ〔ｊ〕のいずれかの
小さい値の方で良い。

【００５６】このように関係Ｒを用いても関係Ｓを用い
た場合と同様の結果が得られるのは、関係Ｒを介して直
接的に、または他の１個あるいは複数のピクセルを介し
て間接的に繋がっている２つのピクセルに、同一のラベ
ルを与える処理であり、このことから、関係Ｓが成り立
つ２つのピクセルに同一のラベルを与える処理と同じこ
とになるためである。

【００５７】上記構成の文字認識システムを用いて、濃
度レベルがなだらかに変化する背景部分と、文字部分と
が同時に切り出される場合について、図６を用いて以下
に説明する。尚、画像の各領域の分離には、上記した関
係Ｒ、Ｓが使用され、このとき使用される濃度差閾値α
は画像全体に対して２とし、「近接している」とは８連
結の意味で隣接していることとする。また、図中の小さ
な円はピクセルを、円中の数字は濃度レベルを表す。

【００５８】スキャナ１によって読み取られた画像情報
には、図６（ａ）に示すように、ピクセル毎に濃度レベ
ルが付与されており、この画像情報から文字部分に対応
したピクセル群、即ち互いに近接し、且つ濃度差閾値α
が２以下のピクセル群が切り出される。即ち、図６
（ａ）に示す画像情報が、図６（ｂ）に示す背景部分
と、図６（ｃ）に示す文字部分とが同時に切り出され
る。上記の文字部分は、図６（ａ）に示す５行９列目の
濃度レベル３のピクセルから関係Ｓによって１つに繋が
ったものである。

【００５９】また、上記の図６で説明した入力画像と同
一画像において、ラベルバッファ４の要素Ｌ〔ｉ〕，Ｌ
〔ｊ〕における文字部分の抽出処理について、図７を参
照しながら以下に説明する。尚、図中、各グリッドがラ
ベルバッファ４の要素を示し、その中の数字がラベルバ
ッファの要素の値を示す。

【００６０】図７（ａ）は、関係判定部３によってラベ
ルバッファ４の内容が書き換えられる前のグリッドのラ
ベルバッファの数値を示し、図７（ｂ）は、関係判定部
３によってラベルバッファ４の内容が書き換えられた後
のグリッドのラベルバッファの数値を示している。つま
り、図７（ｂ）では、文字領域を構成するピクセルに対
応するラベルバッファの値は２２、非文字領域を構成す
るピクセルに対応するラベルバッファの値は０に書き換
えられている。このことから、ラベルバッファの数値に
よって、対応するピクセルがどの領域に属するかを決定
していることが判る。但し、各ピクセルの関係は上記し
た図６に示す関係Ｒ、Ｓと同じとする。

【００６１】ここで、関係Ｒを用いて関係判定部３で
の、ラベルバッファ４の要素内容の書き換えについて、
図２に示すフローチャートを参照しながら以下に説明す
る。

【００６２】まず、画像中の未処理の２つのピクセルＸ
ｉ，Ｘｊ（ｉ≠ｊ）を取り出す（Ｓ２１）。

【００６３】次に、取り出した２つのピクセルＸｉ，Ｘ
ｊが関係Ｒ（Ｘｉ，Ｘｊ）が成り立つか否かを判定する
（Ｓ２２）。ここで、関係Ｒが成り立たなければ、Ｓ２
４に移行する。

【００６４】Ｓ２２で関係Ｒが成り立てば、２つのピク
セルＸｉ，Ｘｊに対応するラベルバッファ４の要素Ｌ
〔ｉ〕，Ｌ〔ｊ〕、およびそのいずれかと値が等しい全
てのラベルバッファ４の要素に共通の値を代入する（Ｓ
２３）。

【００６５】その後、画像中の全てのピクセルＸｉ，Ｘ
ｊの組合せについて処理を行ったか否かを判定する（Ｓ
２４）。ここで、全てのピクセルＸｉ，Ｘｊの組合せに
ついて処理を行っていると判定すれば、関係判定部３に
おける処理を終了する。一方、全てのピクセルＸｉ，Ｘ
ｊの組合せについて処理を行っていないと判定すれば、
再びＳ２１に移行して処理を行う。

【００６６】また、上記構成の文字認識システムにおけ
る画像領域分割方法について、図１に示すフローチャー
トを参照しながら以下に説明する。

【００６７】まず、濃淡画像が形成された用紙をスキャ
ナ１によって光学的に走査し、画像バッファ２に画像情
報を入力する（Ｓ１）。このとき、ラベルバッファ４を
全て異なる値が入るように初期化する（Ｓ２）。例え
ば、Ｌ〔ｉ〕＝ｉ（ｉ＝０，１，・・・）となるように
初期化する。

【００６８】次に、関係判定部３にて、画像バッファ２
に格納された画像情報に基づいて、ラベルバッファ４の
内容を上記した図２に示すフローチャートに示す手順で
書き換えて、画像分割処理を行う（Ｓ３）。

【００６９】次いで、分割結果出力部５にて、画像バッ
ファ２の内容と書き換えられたラベルバッファ４の内容
とを参照して、画像中のピクセルを対応するラベルバッ
ファＬ〔ｉ〕の要素の値が共通なものごとに分割して分
割結果バッファ６に格納する（Ｓ４）。

【００７０】そして、領域属性判定部７にて、分割結果
バッファ６の内容および属性判定ルールベース８を参照
して、各領域の属性（文字あるいは非文字）を判定し、
その属性を領域属性バッファ９に格納する（Ｓ５）。

【００７１】次に、二値画像生成部１０にて、画像バッ
ファ２、ラベルバッファ４、分割結果バッファ６および
領域属性バッファ９の内容を参照して、ピクセルの２値
化を行い、そのデータを二値画像バッファ１１に格納す
る（Ｓ６）。

【００７２】次いで、文字切り出し部１２にて、二値画
像バッファ１１の内容を参照して、画像中の文字位置を
取り出し、文字座標バッファ１３に可能する（Ｓ７）。

【００７３】そして、文字認識部１４にて、二値画像バ
ッファ１１と文字座標バッファ１３の内容を参照して文
字認識を行い、その結果を認識結果バッファ１５に格納
する（Ｓ８）。

【００７４】その後、言語処理部１６にて、認識結果バ
ッファ１５に格納された文字列から単語を取り出し、認
識の疑わしい単語には、疑わしいことを示すマークを付
与して、再び認識結果バッファ１５に格納する（Ｓ
９）。

【００７５】次に、結果修正部１８にて、認識結果バッ
ファ１５の内容をディスプレイ１９に出力し、使用者が
誤認識の単語をキーボード２０にて修正して、再び認識
結果バッファ１５に格納する（Ｓ１０）。

【００７６】最後に、結果出力部２１にて、修正した単
語を格納した認識結果バッファ１５の内容をプリンタ２
２から出力する（Ｓ１１）。

【００７７】以上のように、本画像領域分割方法によれ
ば、近接し、且つ濃度レベル差が閾値以下のピクセルを
同一領域として画像領域を分割し、分割後の各領域に対
して、各領域の幾何学的特徴、濃度分布、相互の包含関
係に基づいて、その属性（文字、非文字など）を決定し
ているので、画像中に濃度レベルが異なる文字領域がい
くつあっても、それらと、近接した非文字領域との濃度
レベル差が十分であれば、正確に文字領域を構成するピ
クセルを抽出することが可能である。

【００７８】つまり、「同一の領域に属するべき近接し
たピクセルは、近い濃度レベルを有する」という仮定以
外に、領域の濃度レベルや画像中の濃度分布について何
の仮定も行わずに画像領域を分割することができるの
で、従来のように、画像から文字領域を認識するため
に、「画像中で文字領域が占めるピクセル数は一定範囲
にある。」、「画像中で文字領域を構成する濃度帯域、
非文字領域を構成する濃度帯域はそれぞれ連続してい
る。」といった仮定をする必要がなくなる。

【００７９】したがって、カラー文書等を含む多種多様
な画像において、従来の２値化法では不可能であった２
値化の自動化を可能とし、正確に文字部分を抽出するこ
とが可能となる。

【００８０】また、本画像領域分割方法では、近接した
ピクセルが同一の領域に属するか否かを判定する際、濃
度レベルの小さな差を許容し、しかもあらかじめ濃度帯
域を分割して処理しないので、本来同一の領域に属すべ
き、近い濃度レベルを有する２つの近接したピクセルが
別の領域に分割されることがない。

【００８１】したがって、例えば、なだらかに濃度が変
化する領域が、濃度帯域の切れ目で複数の領域に分割さ
れてしまうことがなくなり、濃度レベルの近い近接した
ピクセルを含む領域の再統合が不要となり、文字領域の
抽出処理を簡単に、しかも正確に行うことができる。

【００８２】さらに、本画像領域分割方法では、上記し
たように、画像中に濃度レベルが異なる文字領域がいく
つあっても、それらと、近接した非文字領域の濃度差が
十分であれば、正確に文字領域を構成するピクセルを抽
出することが可能となる。

【００８３】これにより、異なる色で書かれた文字が同
一画像中にある場合など、処理したい領域の濃度レベル
があらあじめ不明でも、問題なく処理が行える。

【００８４】また、本画像領域分割方法では、画像中の
各ピクセル毎に、どの領域に属するかが分かるため、領
域の形状を正確に決定することができる。

【００８５】また、本画像領域分割方法では、文字領域
がほぼ連結成分レベルで切り出されるため、文字、また
は文字の一部を構成するピクセルを常に塊として、画像
中から取り出し、これらを統合することで文字列抽出ま
たは文字認識を行う方法（本願出願人が先に出願した特
開平５−８１４７４号公報に開示の方法）と組み合わせ
た場合、文字列抽出または文字認識処理の一部を省略す
ることができる。

【００８６】尚、本実施例では、画像読取り手段として
スキャナ１を使用したが、カメラ等を使用しても良い。

【００８７】

【発明の効果】請求項１の発明の画像領域分割方法は、
以上のように、濃淡画像中のピクセルを、互いに近接
し、且つその濃度レベルの差が閾値よりも小さいという
関係に基づいてラベリングし、同一ラベルを有するピク
セルからなる領域に分割し、分割後の各領域の属性を判
定する構成である。

【００８８】これにより、近接し、且つ濃度レベル差が
閾値以下のピクセルを同一領域として画像領域を分割
し、分割後の各領域の文字あるいは非文字等の属性を、
請求項２記載のように各領域の幾何学的特徴、濃度分
布、相互の包含関係に基づいて決定しているので、画像
中に濃度レベルが異なる文字領域がいくつあっても、そ
れらと、近接した非文字領域の濃度レベル差が十分であ
れば、正確に文字領域を構成するピクセルを抽出するこ
とが可能である。

【００８９】したがって、複雑な処理を行うことなく、
濃度レベルの異なる領域が複数存在するようなカラー文
書を含む多種多様な入力画像から文字領域を抽出するこ
とができ、この結果、画像を、文字領域と非文字領域等
の属性に応じて正確に分割することができるという効果
を奏する。

【図面の簡単な説明】

【図１】本発明の一実施例に係る画像領域分割方法を示
すフローチャートである。

【図２】図１に示した画像領域分割方法の画像分割処理
の一例を示すフローチャートである。

【図３】図１に示した画像領域分割方法を適用した文字
認識システムの概要を示すブロック図である。

【図４】図１に示した画像領域分割方法の画像分割処理
における各ピクセルの関係を示す説明図である。

【図５】図１に示した画像領域分割方法の画像分割処理
における各ピクセルの関係を示す説明図である。

【図６】図１に示した画像領域分割方法における画像分
割処理の説明図である。

【図７】図１に示した画像領域分割方法における画像分
割処理の他の説明図である。

【図８】ピクセルの連結関係を示す説明図である。

【図９】従来の画像領域分割方法を示す説明図である。

【図１０】従来の画像領域分割方法を示す説明図であ
る。

【符号の説明】

１スキャナ３関係判定部５分割結果出力部４ラベルバッファ７領域属性判定部

Claims

【特許請求の範囲】

【請求項１】濃淡画像を、文字、非文字等の属性に応じ
て分割する画像領域分割方法において、濃淡画像中のピクセルを、互いに近接し、且つその濃度
レベルの差が閾値よりも小さいという関係に基づいてラ
ベリングし、同一ラベルを有するピクセルからなる領域
に分割し、分割後の各領域の属性を判定することを特徴
とする画像領域分割方法。
【請求項２】上記分割後の各領域の属性を、各領域の幾
何学的特徴、濃度分布、相互の包含関係に基づいて判定
することを特徴とする請求項１記載の画像領域分割方
法。