JP3268552B2

JP3268552B2 - 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置

Info

Publication number: JP3268552B2
Application number: JP28517699A
Authority: JP
Inventors: 弘晏高橋
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1999-10-06
Filing date: 1999-10-06
Publication date: 2002-03-25
Anticipated expiration: 2019-10-06
Also published as: GB0024221D0; JP2001109887A; GB2355100A; GB2355100B; US6683967B1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、例えば郵便物の宛
名自動読み取り機などに用いられる画像処理装置等に関
し、特に宛名領域を含む特定の領域を抽出する画像処理
装置等に関する。

【０００２】

【従来の技術】例えば、郵便物の処理分野では、大量に
存在する郵便物を連日、短時間にて処理する必要があ
る。従前では、人間による目視と手作業による分類がな
されており、郵便局員の負担が非常に大きかった。その
ために、自動化読み取り装置による機械化が進められ、
例えば、我が国における郵便番号欄に記載された郵便番
号の読み取り等、送達区域毎の区分には大きな進展が見
られている。しかしながら、郵便番号欄が設けられてい
ない諸外国の郵便物では、郵便番号の位置を認識するこ
とが難しい。また、ますますの増加が予想される今後の
郵便物処理において、郵便番号以外に郵便物上の宛名情
報を即座に読み取り送達区域に区分する技術の発展は、
将来においても強く望まれている技術事項である。

【０００３】このように、郵便番号欄が無い郵便物から
郵便番号を抽出することや、宛名情報の読み取りについ
て、その要望は強いものの、現状の技術では郵便物から
これらの情報を読み取ることは非常に難しい。これは、
郵便物には、宛名領域以外に差出人の領域や広告情報、
絵、写真等の様々な模様が含まれており、かつ、手書き
と印刷文字の混在や、縦書きや横書き等、バリエーショ
ンの数があまりにも多いことがその主たる理由である。
その為に、これらの混在する情報の中から郵便番号や宛
名情報を正しく抽出するためには、全ての領域をサーチ
する等、非常に複雑な処理が必要となる。

【０００４】ここで、宛名情報を抽出する既存の方法と
して、まず、宛名領域を抽出した後に実際の宛名を読み
取る技術が存在する。例えば、印字宛名はラベルとして
郵便物に貼り付けられていると仮定し、その反射属性や
ラベルの有するエッジの影を検出して宛名領域を抽出す
る方法や、横方向と縦方向に関して投影を取り、濃度の
高い場所を文字行として宛名領域を推定する方法があ
る。また、特開平７-２６５８０７号公報では、近接し
ている画素連結成分を統合化して文字行を推定し、また
更にそれを統合化して宛名領域の候補とする技術が開示
されている。

【０００５】

【発明が解決しようとする課題】しかしながら、印字宛
名がラベルとして貼り付けられていると仮定して領域を
抽出する方法では、ラベルが貼られておらず印字宛名が
直接、郵便物に記載されている場合には全く対応するこ
とができず、抽出できる郵便物が大きく限定される。ま
た、濃度の高い場所を文字行として推定する方法では、
背景部に多くの画像情報が存在する場合に宛名領域以外
との区別をつけることが難しく、正確な宛名領域を検出
することができない。更に、特開平７-２６５８０７号
公報に開示された技術では、全画素から固まりを拾い、
それを全部サーチする作業を固まり毎に全て繰り返す、
といった全画素内における複雑な統合化処理を施す必要
性がある。その為に、ロジックが非常に難しく、処理速
度が非常に遅くなると共に、構成があまりにも複雑とな
り、システム上からみて現実的なものとは言い得ない。

【０００６】本発明はこのような課題を解決するために
なされたものであって、全画素内での複雑な統合化処理
を避け、高速に精度高く宛名領域等の特定領域を抽出す
ることを主たる目的とする。更に他の目的は、模様やノ
イズから開放された数個の宛名領域候補を抽出し、以後
の処理を大幅に簡易化することにある。

【０００７】

【課題を解決するための手段】かかる目的のもと、本発
明の領域抽出方法は、入力された画像を構成する画素の
連結画素群を抽出するステップと、抽出された連結画素
群の大きさを予め定められた閾値と比較して閾値内連結
画素群を抽出するステップと、入力された画像を所定の
大きさに区分したメッシュ画像を想定し、抽出された閾
値内連結画素群に対応するメッシュ画像をＯＮとするス
テップと、このＯＮとされたメッシュ画像の連結状態か
ら特定領域を抽出するステップとを備えたことを特徴と
している。

【０００８】ここで、この画像は、宛名領域を含む郵便
物上の画像であり、また、特定領域を抽出するステップ
は、宛名領域の候補を抽出するものであることを特徴と
すれば、様々な情報が混在する郵便物等の画像から精度
高く宛名領域を抽出することが可能となる点で好まし
い。また、この閾値内連結画素群を抽出するステップ
は、連結画素群の高さ及び/又は幅を、想定される宛名
の文字サイズが有する所定の高さ及び/又は幅と比較す
ることにより閾値内連結画素群を抽出することを特徴と
すれば、例えばノイズを取り除いた状態で連結画素群を
検出することも可能となり、更に高い精度で宛名領域を
抽出できる点で優れている。より具体的には、例えば、
連結画素群の高さ又は幅が第１の定数値(例えば４本/ｍ
ｍに圧縮した解像度で３０ポイント)以下であれば閾値
内連結画素群とする構成が挙げられる。また、連結画素
群の高さ又は幅を長方形領域として閾値を持つことも可
能である。このような閾値を有することで、宛名文字と
は無関係な背景印刷文字を排除することや、破線やラベ
ルのエッジ等の細線を排除することができる点で優れて
いる。更に、画像を区分するメッシュ画像の大きさは、
想定される宛名の中から大きめの文字サイズに均等する
範囲内で決定されることを特徴とすれば、郵便物におけ
る宛名の文字に着目して処理を簡易化できる点で好まし
い。この大きめの文字サイズに均等する範囲内とは、例
えば最大３０ポイントを想定した場合には２４ポイント
×２４ポイントの正方形である矩形領域をメッシュ画像
として選定する等が挙げられる。また更に、メッシュ画
像をＯＮとするステップは、閾値内連結画素群の中心座
標を含むメッシュ画像をＯＮとすることを特徴とするこ
ともできる。

【０００９】また、本発明の宛名領域抽出方法は、入力
された宛名領域を含む画像から所定の大きさを有する画
素群を抽出し、この画像を小エリアに分割して１ポイン
トとして簡易化した矩形領域を想定し、抽出された画素
群が想定された矩形領域のどれに属するかを判定して対
応する対応矩形領域を選定し、選定されたこの対応矩形
領域の連結状態から宛名領域候補を抽出することを特徴
としている。

【００１０】この宛名領域候補の抽出は、複数の属性を
判定して宛名領域候補を抽出することを特徴とすれば、
より確実性を高めて宛名領域候補を選定できる点から好
ましい。具体的には、２行以上の文字列があるか、充分
な数の矩形領域があるか、画像の端に寄っていないか、
文字列の形がそれらしいか、等の属性を組み合わせるこ
とが挙げられる。また、宛名領域候補の抽出として、宛
名らしさを判断して優先順位をつけるように構成すれ
ば、その優先順位の高いものから実際の宛名読み取りを
実行し、読み取れた時点で処理を終了することが可能と
なり、処理速度を更に上げることができる点で好まし
い。

【００１１】また、本発明の宛名領域抽出装置は、入力
された宛名領域を含む画像から所定の大きさを有する画
素群を抽出する画素群抽出手段と、画像を小エリアに分
割して１ポイントとして簡易化した矩形領域を想定する
矩形領域想定手段と、この画素群抽出手段により抽出さ
れた画素群がこの矩形領域想定手段により想定された矩
形領域のどれに属するかを判定し、属すると判定される
対応矩形領域を選定する対応矩形領域選定手段と、この
対応矩形領域選定手段により選定された対応矩形領域の
連結状態から宛名領域候補を抽出する宛名領域候補抽出
手段とを備えたことを特徴としている。

【００１２】この画素群抽出手段としては、上下、左
右、斜めの８連結画素群や、上下、左右の４連結画素群
を用いて抽出し、所定の閾値に入るものを抽出すること
が挙げられる。また、矩形領域想定手段としては、予め
定められた大きさで分割するものの他、連結画素群の分
布状況等からダイナミックに大きさを決定して矩形領域
を想定する態様がある。この矩形領域は、正方形の他、
主走査方向と副走査方向で長さの異なる長方形領域を想
定しても良い。また、対応矩形領域選定手段としては、
画素群抽出手段により抽出された画素群の中心領域が存
在する矩形領域を対応矩形領域と選定する態様の他、画
素群が少しでも重なっている矩形領域を対応矩形領域と
選定する態様もある。また、宛名領域候補抽出手段は、
対応矩形領域の少なくとも上下、左右を含む４連結の固
まりを囲む矩形領域を宛名領域候補として抽出すること
を特徴とすれば、高速に精度高く宛名領域を抽出できる
点で好ましい。尚、上下、左右に斜め方向も加えた８連
結の固まりを囲む矩形領域を宛名領域候補とすることも
できる。

【００１３】また、本発明を適用した画像処理装置は、
画像を入力する画像入力部と、この画像入力部により入
力された画像を２値化する２値化部と、この２値化部に
より２値化された画素の連結画素群を検出する連結画素
群検出部と、この連結画素群検出部により検出された連
結画素群の大きさを予め定められた閾値と比較する比較
部と、画像入力部により入力された画像を所定の大きさ
に区分したメッシュ画像を形成するメッシュ画像形成部
と、このメッシュ画像形成部により形成されたメッシュ
画像の中から、比較部により閾値内にあると判断される
連結画素群が対応する対応メッシュ画像を検出する対応
メッシュ画像検出部と、この対応メッシュ画像検出部に
より検出された対応メッシュ画像の連結状態から特定領
域を抽出する特定領域抽出部と、この特定領域抽出部に
より抽出された前記特定領域に位置する画像に対して画
像の認識を実行する画像認識部とを備えたことを特徴と
している。

【００１４】また、この画像入力部により入力される画
像は宛名を含む郵便物であり、比較部における閾値は想
定される宛名の文字の大きさから決定されることを特徴
とすることができる。更に、このメッシュ画像形成部に
おけるメッシュ画像が区分される所定の大きさは、宛名
の大きさに基づいて決定されることを特徴とすれば、宛
名の文字の大きさを加味して宛名領域を抽出でき、郵便
物における宛名領域を、高速、且つ精度高く抽出するこ
とができる点で好ましい。また更に、このメッシュ画像
形成部における所定の大きさは、連結画素群検出部によ
り検出された連結画素群の大きさに基づいて決定される
ことを特徴とすれば、全画素内における複雑な統合化処
理を施す従来技術と比べて、ロジックが非常に簡単とな
り、処理速度の高速化を図ることが可能となる。

【００１５】

【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいて、この発明を詳細に説明する。図１は、本実
施の形態における画像処理装置の全体構成を示した説明
図である。同図に示すように、本実施の形態における画
像処理装置は、大きく、画像入力装置１０と、領域抽出
装置１１と、画像認識装置２３とにより構成される。こ
の画像入力装置１０は、例えば主走査方向にラインセン
サを備え、副走査方向にスキャンして画像を読み取るス
キャナーや、フォトによる画像全面の読み取り等の光学
的文字読取装置から構成され、郵便物の全体イメージを
取得できるように構成されている。また、この画像入力
装置１０には、図示しない光電変換回路が備えられ、光
学的に読み取った画像を電気信号に変換するように構成
されている。

【００１６】次に、本実施の形態における領域抽出装置
１１について説明する。画像入力装置１０により出力さ
れる電気信号は、２値化部１２により白画素と黒画素の
２値信号に変換される。また、この２値化部１２では、
小さいノイズを除去するノイズ除去も実行される。尚、
場合によっては、画像入力装置１０に２値化手段を備
え、２値化された状態で領域抽出装置１１に入力される
場合もあり得る。この場合には、領域抽出装置１１には
２値化部１２を有さない態様となるであろう。次に２値
化された画像データは縮小部１３にて縮小される。例え
ばこの縮小部１３では、８本/ｍｍの解像度を有する画
像を４本/ｍｍの解像度に変換するように構成されてお
り、処理スピードを上げるために行われる作業である。
この縮小方式としては、簡易な方法として例えば、連続
ラインのＡＮＤをとって出力する方法等があるが、領域
抽出精度に影響が出ることから、処理スピードに問題が
ない場合には縮小部１３を設ける必要はない。また、２
値化部１２と縮小部１３との順序を逆にすることも可能
である。

【００１７】この縮小部１３から縮小された画像データ
は、連結画素群検出部１４に入力される。本実施の形態
における連結画素群検出部１４では、２値化された全体
イメージから、８連結画素群、即ち黒画素の８連結から
なる連結画素群(Connected Component:ＣＣ)を全て抽出
している。この８連結画素群とは、中心画素に対して左
右、上下、斜めの８画素を捉え、これらの黒画素の連結
を取り出すことで連結画素群を検出している。尚、連結
画素群の検出方法としては、左右、上下である４連結画
素群を取り出す方法もあるが、斜め方向の画素が切れて
しまうことから、斜め方向の繋がりも考慮して、経験
上、８連結画素群を採用することが好ましい。閾値格納
部１５には文字サイズを決定する際に用いる閾値が格納
されており、連結画素群検出部１４により検出された連
結画素群を比較部１６にてこの閾値と比較し、閾値内連
結画素群である文字サイズ連結画素群(CharＣＣ)１７を
抽出している。この閾値格納部１５に格納される閾値で
は、まず、連結画素群の高さ又は幅が所定量以上の値を
取らないような条件として、最大定数値として例えば３
０が格納されている。この値は、印刷等がなされた郵便
物における大きな模様や長い罫線を取り除くために設け
られ、４本/ｍｍの解像度で３０画素、即ち約８ｍｍを
超える連結画素群は文字サイズ連結画素群(CharＣＣ)１
７から除かれるように定められている。また、連結画素
群の長方形領域(矩形領域)が所定大きさ以下の値を取ら
ないような条件として、長方形領域の短いものが３以
上、長いものが８以上という値が格納されている。この
値は、細い線はラベルにおけるエッジ等のノイズの可能
性があることや、破線等を取り除く意味から、３画素×
８画素以下の長方形領域を文字サイズ連結画素群(Char
ＣＣ)１７から取り除くように定められている。

【００１８】一方、比較部１６により決定された文字サ
イズ連結画素群(CharＣＣ)１７の状況は、メッシュ画像
形成部１８に入力される。このメッシュ画像形成部１８
では、画像を小エリアに分割して１ポイントとして簡易
化した矩形領域を想定する所謂メッシュ画像を形成して
いる。このメッシュの分割方法は、例えば入力された文
字サイズ連結画素群(CharＣＣ)１７の縦方向、横方向の
頻度分布を把握し、最適な大きさのメッシュを決定する
ように構成されている。このように構成することによ
り、郵便物に多く現われている文字サイズに基づいて簡
易化した矩形領域を想定することが可能となり、より正
確な領域抽出の実行が可能となる。尚、文字サイズ連結
画素群(CharＣＣ)１７の頻度分布等を用いてダイナミッ
クにメッシュ分割を行うのではなく、予め分割サイズを
決定するように構成することもできる。この場合には、
例えば、想定される宛名の中から大き目の文字サイズに
均等する範囲でメッシュの大きさを決定することが有効
であり、例えば、最大の文字サイズ連結画素群(CharＣ
Ｃ)１７が３０画素であれば、予め定めた大きさである
２４×２４の小エリアからなる矩形領域でメッシュに分
割するように構成することが可能である。

【００１９】次に、対応メッシュ画像検出部１９では、
抽出された閾値内連結画素群である文字サイズ連結画素
群(CharＣＣ)１７が、メッシュ画像形成部１８により想
定された矩形領域であるメッシュ画像のどれに属するか
(どれに対応するか)を検出し、対応矩形領域を選定して
メッシュ画像をＯＮとしている。この検出の方法として
は、例えば、抽出された文字サイズ連結画素群(CharＣ
Ｃ)１７の中心座標が属するメッシュ画像をＯＮとする
方法が挙げられる。また、メッシュ画像形成部１８にて
小さ目のメッシュが想定されている場合には、文字サイ
ズ連結画素群(CharＣＣ)１７の長方形が少しでも重なっ
ているメッシュ画像をＯＮとする方法もある。

【００２０】この対応メッシュ画像検出部１９からの出
力を受け、メッシュ画像連結検出部２０では、ＯＮとな
ったメッシュの連結状態を検出する。例えば、一行分離
れていても同一領域とするために縦と横に関してＯＮと
なったメッシュに挟まれている１単位のメッシュをＯＮ
とする。また、メッシュ画像の中で、メッシュが縦、横
に繋がっている４連結や、それに斜めの繋がりを考慮し
た８連結の連結メッシュ(Connected Mesh:ＣＭ)を検出
している。

【００２１】このメッシュ画像連結検出部２０からの結
果を受け、属性情報格納部２１からの属性情報を加味し
て特定領域抽出部２２により宛名領域候補が抽出され
る。この属性情報格納部２１には、宛名領域候補とし
て、そのサイズが小さすぎず大きすぎないものを選定す
るための閾値情報が格納されている。また、例えば、２
行以上の文字列があるか、十分な数の連結画素群(ＣＣ)
があるか、文字列の形がそれらしいか等の属性情報が格
納されている。また、郵便物の宛名情報は、通常、その
郵便物の中央に寄っていることが多いことから、全体イ
メージの端に寄っていないか、領域が中央に近いか等の
属性情報も格納されている。特定領域抽出部２２では、
この属性情報格納部２１からの属性情報に基づいて、例
えばメッシュ画像連結検出部２０による連結メッシュ
(ＣＭ)に対して評価点を付けることで宛名領域候補であ
る特定領域を抽出している。この結果、宛名領域を数個
に限定することができ、実際に宛名を認識する画像認識
装置２３にこの結果を出力することで、宛名の読み取り
精度を格段に向上させることができると共に、宛名読み
取りの高速化を図ることができる。領域抽出装置１１の
後処理装置である画像認識装置２３では、２値化部１２
からの全体画像の２値化信号と、特定領域抽出部２２か
らの領域情報に基づいて、例えば評価点の高い、優先順
の高い領域から順に宛名読み取りが実行され、満足な結
果が得られた段階で読み取り作業を終了させている。

【００２２】このように、本実施の形態では、１画素１
ピクセルである画素単位の世界から、所定の大きさを有
するエリアであるメッシュの世界へ移し、このメッシュ
を１ポイントとして簡易化する方法を採用しているため
に、既存の方式に比べて簡単なアルゴリズムで高速に宛
名領域を抽出できる。更に、宛名の文字サイズやメッシ
ュの連結性、属性情報等を加味して抽出することで、精
度の高い領域抽出を実現している。また、評価点を付与
して優先順位の高い領域から宛名読み取りを実行するこ
とで、無駄な宛名読み取り作業を極力、少なくし、更に
効率的かつ迅速な宛名読み取りが可能となる。

【００２３】次に、本実施の形態における郵便物の宛名
読み取り作業の流れを、図１〜図１２を用いて説明す
る。ここで、図２は本実施の形態における郵便物の宛名
読み取りの大まかな流れを説明するためのフローチャー
トである。また、図３〜図１２は第１及び第２の実用例
として、元画像(図３、図８)、文字サイズ連結画素群(C
harＣＣ)１７の抽出状態(図４、図９)、メッシュ画像を
ＯＮした状態(図５、図１０)、統合化してメッシュ画像
をＯＮした状態(図６、図１１)、抽出された宛名領域候
補(図７、図１２)を示した図である。

【００２４】まず、画像入力装置１０により郵便物の画
像が読み取られる(ステップ１０１)。図３に示すような
郵便物５０には、宛名情報５１の他、差出人情報５２や
連絡情報５３等が含まれている。また、図８に示すよう
な郵便物７０には、宛名情報７１の他、料金別納印刷７
２、配信情報７３、商標等の表示７４、連絡情報７５、
背景印刷情報７６等、多種多様な画像情報が含まれてい
る。これらの画像情報は２値化部１２により適切な方法
にて２値化され(ステップ１０２)、連結画素群検出部１
４により連結画素群(ＣＣ)が検出されてメモリ(図示せ
ず)に登録される(ステップ１０３)。この連結画素群(Ｃ
Ｃ)は、比較部１６にて閾値格納部１５に格納されてい
る閾値と比較され、大きすぎず小さすぎない文字サイズ
連結画素群(CharＣＣ)１７が抽出される(ステップ１０
４)。図４及び図９では、文字サイズ連結画素群(CharＣ
Ｃ)１７を黒い長方形にし、理解し易いように元画像に
重ね合わせたものである。図４では、文字サイズ連結画
素群(CharＣＣ)１７として宛名情報５１、差出人情報５
２、連絡情報５３のほぼ全ての文字が抽出されている。
但し、「・」(点)５５や「−」(線)５６は、前述の閾値
の条件を満たしていないことから抽出されていない。ま
た、図９では、多くの文字情報が抽出されているが、商
標等の表示７４の文字や模様、背景印刷情報７６の
「Ｍ」の文字８２や「２０００」の文字８３は、３０画
素を超える大きな文字として除外されている。また、絵
柄８４におけるペンの柄の部分も省かれている。尚、宛
名情報７１の「川」の文字８０や「二」の文字８１は抽
出されていない。

【００２５】次に、文字サイズ連結画素群(CharＣＣ)１
７の中心画素を、メッシュ画像形成部１８にて想定され
た矩形領域である、簡易化したメッシュ画像のどれに属
するかを対応メッシュ画像検出部１９にて計算し、その
メッシュを黒メッシュとしている(ステップ１０５)。図
５及び図１０に示されるように、ここでは、画像を２４
画素×２４画素の小エリアでメッシュ５８、８８に分割
している。ここでは、メッシュ５８、８８の境界線は表
示されていない。また、図４にて説明した「・」(点)５
５等が抽出されなかった結果、図５にて行間が白になっ
ている部分が存在する。図１０においても宛名情報７１
の「―」文字部が白になっている。このような場合を補
間するために、次のステップ処理が実行される。即ち、
メッシュ画像連結結合部２０では、１行分や１文字分の
隙間があっても統合化するために、上下か左右が黒メッ
シュである白メッシュを黒に変換する(ステップ１０
６)。その結果が図６及び図１１に示されている。図５
及び図１０と比較して明らかなように、１行分や１文字
分の隙間があっても統合化がなされて黒に変換されてい
ることが理解できる。これにより、宛名領域の可能性の
ある部分が１つの連結メッシュ(ＣＭ)としてのブロック
として把握することが可能となる。

【００２６】次に、特定領域抽出部２２では、１メッシ
ュを１画素のごとく見做し、８連結を囲む長方形を宛名
領域の候補とする(ステップ１０７)。図７及び図１２の
破線で囲まれた部分がこのステップにより抽出された部
分であり、領域６０〜６２、及び領域９０〜９４が宛名
領域の候補に該当する。図７に示されている郵便物５０
では、全ての領域が宛名領域の候補となっているが、図
１２に示されている郵便物７０では、図１１に示されて
いる料金別納印刷７２、配信情報７３、商標等の表示７
４、及び背景印刷情報７６の一部の連結メッシュ(ＣＭ)
が選定されていないことが解る。これらは、例えば文字
列が１行であったり、充分な連結画素群(ＣＣ)が存在し
ない等の理由により、宛名領域の候補から除外されたも
のである。その後、領域内で文字行抽出等が行われ、種
々の属性で各領域が評価され、宛名候補として順位付け
がなされる(ステップ１０８)。この種々の属性は、前述
したように、画像の端に寄っていないか、文字列の形が
それらしいか等の内容であり、これによって、図７で
は、領域６０が第１候補、領域６２が第２候補、領域６
１は第３候補として順位付けがなされる。また、図１２
では、上から順に、領域９０が第１候補、９１が第２、
９２が第３、９３が第４、９４が第５として順位付けが
なされるであろう。次に、優先順位の高い領域順に、画
像認識装置２３にて宛名の認識が行われ、満足な結果が
得られた場合には、そこで宛名認識を終了させる(ステ
ップ１０９)。これらの処理の流れによって、本実施の
形態における一連の郵便宛名の読み取りが終了する。

【００２７】以上説明したように、本実施の形態によれ
ば、宛名領域以外に差出人の領域や様々な模様を含んだ
郵便物に対し、簡単なアルゴリズムで宛名領域を含む矩
形領域を抽出することが可能となる。即ち、各領域候補
が、全体イメージに比べて面積が非常に狭く、模様やノ
イズから開放されていること、また、領域内の文字列が
垂直方向か水平方向かが予測できることから、かかる領
域候補に対して宛名認識を実行することで検出精度の向
上と処理の簡潔化、及びそれに伴う処理速度の向上を図
ることができる。本実施の形態におけるアルゴリズムに
よれば、領域内の特にプリンタで印刷された印字の宛名
領域はかなり高い確率にて抽出することが可能となる。
また、手書きであっても、欧米の郵便のように横書きで
纏めて書かれた宛名に対して精度良く抽出することが可
能となる。

【００２８】

【発明の効果】以上説明したように、本発明によれば、
全画素内での複雑な統合化処理を避け、高速に精度高く
宛名領域等の特定領域を抽出することができる。更に、
模様やノイズから開放された数個の領域候補を抽出する
ことで、以後の処理を大幅に簡易化することが可能とな
る。

【図面の簡単な説明】

【図１】本実施の形態における画像処理装置の全体構
成を示した説明図である。

【図２】本実施の形態における郵便物の宛名読み取り
の大まかな流れを説明するためのフローチャートであ
る。

【図３】第１の実用例における元画像を示す図であ
る。

【図４】第１の実用例における文字サイズ連結画素群
(CharＣＣ)の抽出状態を示した図である。

【図５】第１の実用例におけるメッシュ画像をＯＮし
た状態を示した図である。

【図６】第１の実用例における統合化してメッシュ画
像をＯＮした状態を示した図である。

【図７】第１の実用例における抽出された宛名領域候
補を示した図である。

【図８】第２の実用例における元画像を示す図であ
る。

【図９】第２の実用例における文字サイズ連結画素群
(CharＣＣ)の抽出状態を示した図である。

【図１０】第２の実用例におけるメッシュ画像をＯＮ
した状態を示した図である。

【図１１】第２の実用例における統合化してメッシュ
画像をＯＮした状態を示した図である。

【図１２】第２の実用例における抽出された宛名領域
候補を示した図である。

【符号の説明】

１０…画像入力装置、１１…領域抽出装置、１２…２値
化部、１３…縮小部、１４…連結画素群検出部、１５…
閾値格納部、１６…比較部、１７…文字サイズ連結画素
群(CharＣＣ)、１８…メッシュ画像形成部、１９…対応
メッシュ画像検出部、２０…メッシュ画像連結検出部、
２１…属性情報格納部、２２…特定領域抽出部、２３…
画像認識装置、５０…郵便物、５１…宛名情報、５２…
差出人情報、５３…連絡情報、５８…メッシュ、６０〜
６２…領域、７０…郵便物、７１…宛名情報、７２…料
金別納印刷、７３…配信情報、７４…商標等の表示、７
５…連絡情報、７６…背景印刷情報、８８…メッシュ、
９０〜９４…領域

フロントページの続き (56)参考文献特開平７−265807（ＪＰ，Ａ) 特開平６−274685（ＪＰ，Ａ) 特開平４−270484（ＪＰ，Ａ) 特開平８−305794（ＪＰ，Ａ) 特開2001−109844（ＪＰ，Ａ) 特開平９−103747（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06T 7/40 B07C 3/14 G06K 9/20

Claims

(57)【特許請求の範囲】

【請求項１】入力された画像を構成する画素の連結画
素群を抽出するステップと、抽出された前記連結画素群の大きさを予め定められた閾
値と比較して閾値内連結画素群を抽出するステップと、前記画像を所定の大きさに区分したメッシュ画像を想定
し、抽出された前記閾値内連結画素群に対応するメッシ
ュ画像をＯＮとするステップと、ＯＮとされたメッシュ画像の連結状態から特定領域を抽
出するステップとを備えたことを特徴とする領域抽出方
法。
【請求項２】前記画像は、宛名領域を含む郵便物上の
画像であり、前記特定領域を抽出するステップは、前記宛名領域の候
補を抽出するものであることを特徴とする請求項１記載
の領域抽出方法。
【請求項３】前記閾値内連結画素群を抽出するステッ
プは、連結画素群の高さ及び/又は幅を、想定される宛
名の文字サイズが有する所定の高さ及び/又は幅と比較
することにより閾値内連結画素群を抽出することを特徴
とする請求項２記載の領域抽出方法。
【請求項４】前記画像を区分するメッシュ画像の大き
さは、想定される宛名の中から大きめの文字サイズに均
等する範囲内で決定されることを特徴とする請求項２記
載の領域抽出方法。
【請求項５】メッシュ画像をＯＮとするステップは、
前記閾値内連結画素群の中心座標を含む前記メッシュ画
像をＯＮとすることを特徴とする請求項１記載の領域抽
出方法。
【請求項６】入力された宛名領域を含む画像から所定
の大きさを有する画素群を抽出し、前記画像を小エリアに分割して１ポイントとして簡易化
した矩形領域を想定し、抽出された前記画素群が想定された前記矩形領域のどれ
に属するかを判定して対応する対応矩形領域を選定し、選定された前記対応矩形領域の連結状態から宛名領域候
補を抽出することを特徴とする宛名領域抽出方法。
【請求項７】前記宛名領域候補の抽出は、複数の属性
を判定して当該宛名領域候補を抽出することを特徴とす
る請求項６記載の宛名領域抽出方法。
【請求項８】入力された宛名領域を含む画像から所定
の大きさを有する画素群を抽出する画素群抽出手段と、前記画像を小エリアに分割して１ポイントとして簡易化
した矩形領域を想定する矩形領域想定手段と、前記画素群抽出手段により抽出された前記画素群が前記
矩形領域想定手段により想定された前記矩形領域のどれ
に属するかを判定し、属すると判定される対応矩形領域
を選定する対応矩形領域選定手段と、前記対応矩形領域選定手段により選定された前記対応矩
形領域の連結状態から宛名領域候補を抽出する宛名領域
候補抽出手段とを備えたことを特徴とする宛名領域抽出
装置。
【請求項９】前記宛名領域候補抽出手段は、前記対応
矩形領域の少なくとも上下、左右を含む４連結の固まり
を囲む矩形領域を前記宛名領域候補として抽出すること
を特徴とする請求項８記載の宛名領域抽出装置。
【請求項１０】画像を入力する画像入力部と、前記画像入力部により入力された画像を２値化する２値
化部と、前記２値化部により２値化された画素の連結画素群を検
出する連結画素群検出部と前記連結画素群検出部により
検出された連結画素群の大きさを予め定められた閾値と
比較する比較部と、前記画像入力部により入力された画像を所定の大きさに
区分したメッシュ画像を形成するメッシュ画像形成部
と、前記メッシュ画像形成部により形成されたメッシュ画像
の中から前記比較部により前記閾値内にあると判断され
る連結画素群が対応する対応メッシュ画像を検出する対
応メッシュ画像検出部と、前記対応メッシュ画像検出部により検出された対応メッ
シュ画像の連結状態から特定領域を抽出する特定領域抽
出部と、前記特定領域抽出部により抽出された前記特定領域に位
置する画像に対して画像の認識を実行する画像認識部と
を備えたことを特徴とする画像処理装置。
【請求項１１】前記画像入力部により入力される画像
は宛名を含む郵便物であり、前記比較部における閾値は
想定される前記宛名の文字の大きさから決定されること
を特徴とする請求項６記載の画像処理装置。
【請求項１２】前記メッシュ画像形成部における前記
メッシュ画像が区分される所定の大きさは、前記宛名の
大きさに基づいて決定されることを特徴とする請求項１
１記載の画像処理装置。
【請求項１３】前記メッシュ画像形成部における所定
の大きさは、前記連結画素群検出部により検出された連
結画素群の大きさに基づいて決定されることを特徴とす
る請求項１０記載の画像処理装置。