JP3206579B2 - 宛名領域検出装置 - Google Patents

宛名領域検出装置

Info

Publication number
JP3206579B2
JP3206579B2 JP00680199A JP680199A JP3206579B2 JP 3206579 B2 JP3206579 B2 JP 3206579B2 JP 00680199 A JP00680199 A JP 00680199A JP 680199 A JP680199 A JP 680199A JP 3206579 B2 JP3206579 B2 JP 3206579B2
Authority
JP
Japan
Prior art keywords
address
probability
area
destination
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00680199A
Other languages
English (en)
Other versions
JP2000202371A (ja
Inventor
博義 宮野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP00680199A priority Critical patent/JP3206579B2/ja
Priority to US09/479,337 priority patent/US6574351B1/en
Publication of JP2000202371A publication Critical patent/JP2000202371A/ja
Application granted granted Critical
Publication of JP3206579B2 publication Critical patent/JP3206579B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/424Postal images, e.g. labels or addresses on parcels or postal envelopes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Sorting Of Articles (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、郵便物の宛名が記
載された宛名領域を検出する宛名領域検出装置に関する
ものである。
【0002】
【従来の技術】従来、このような宛名領域検出装置で
は、郵便画像を分割して郵便画像中の宛名である領域を
含むいくつかの郵便画像の部分領域(以下、宛名である
領域のことを宛名領域、郵便画像の部分領域のことを宛
名領域候補と呼ぶ)を得ている。この場合、差出人の住
所のような宛名領域以外に宛名領域と同じような住所の
構造を持っている領域(以下、差出領域と呼ぶ)を混同
して検出しないようにして宛名領域を出力しなければな
らない。
【0003】そこで、従来においては各宛名領域候補に
対して宛名領域らしさの尺度のみを設けてその尺度の大
きいものから、ある与えられた数の候補数だけ宛名領域
を出力している。例えば、1996年のインターナショ
ナル・コンフェレンス・オン・パターン・レコグニショ
ン、第3巻(Proceedings of 13th International Conf
erence on Pattern Recognition , Volume III Track
C)の、Adrian P.Whichello とHong Yan の論文“Loca
ting Address Blocks and Postcodes in Maii-Piece Im
ages”(p.716〜p.720)中、p.719に記
載されているように、郵便画像の中央下方の点からの距
離が小さい宛名領域候補ほど宛名領域である可能性が高
いことを利用して郵便画像の中央下方の点から近い順に
宛名領域候補を選択する方法が知られている。
【0004】
【発明が解決しようとする課題】従来の技術において
は、宛名領域らしさの尺度のみで宛名領域であるかを判
断していて、宛名と思われる郵便画像の部分画像を、差
出人を表わす住所のような宛名と同じ構造を持つ郵便画
像の部分画像と区別する対策を施していない。そのた
め、差出人住所を宛名住所であると誤ることがあり、必
ずしも宛名領域を検出する精度は高くなかった。
【0005】本発明は、上記従来の問題点に鑑み、差出
人住所等のような宛名と同じ住所の構造を持つ領域を誤
検出する危険性を低減し、宛名領域の検出精度を高める
ことが可能な宛名領域検出装置を提供することを目的と
する。
【0006】
【課題を解決するための手段】本発明は、上記目的を達
成するために、郵便画像の部分画像に基づいて宛名情報
の領域である宛名領域を含む複数の宛名領域候補を生成
する手段と、生成された宛名領域候補毎に宛名領域候補
が宛名領域であるかを評価する場合の指標を表わす特徴
量を抽出する手段と、前記特徴量と宛名領域候補の宛名
領域である確率を示す宛名確率及び宛名領域候補の宛名
以外の住所の構造を持つ領域の確率を示す差出確率とを
対応させて記憶する手段と、前記抽出手段により抽出さ
れた各々の宛名領域候補の特徴量を前記記憶手段を参照
して宛名確率及び差出確率に変換する手段と、変換され
た宛名確率及び差出確率に基づいて宛名である確率が高
い順に宛名領域候補の順序を決定する手段と、決定され
た順序に基づいて宛名領域候補の中から宛名領域である
確率が高い順に所定数の宛名領域候補を選択する手段と
を備えたことを特徴としている。
【0007】本発明では、郵便画像の部分画像に基づい
て生成された宛名領域候補が宛名である確率の他に、差
出人の住所等のような宛名以外の住所の構造を持つ差出
確率を新たに考慮している。そして、この2つの宛名確
率と差出確率を用いて宛名領域候補の順序を決定し、得
られた順序に基づいて宛名である確率が高い順に所定数
の宛名領域候補を選択している。これによって、宛名以
外の住所の構造を持つ領域の誤検出を低減し、宛名領域
の検出精度を高めている。
【0008】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。図1は本発明の宛名
領域検出装置の第1の実施形態の構成を示すブロック図
である。図1において、1はスキャナ等の入力装置、2
はプログラム制御により動作するデータ処理装置、3は
情報を記憶する記憶装置、4は出力装置である。入力装
置1は処理対象の郵便画像を入力する装置である。デー
タ処理装置2は、宛名領域候補生成手段21、特徴量抽
出手段22、宛名・差出確率計算手段23、順序決定手
段24、出力候補決定手段25から構成されている。記
憶装置3は宛名・差出分布辞書31を含んでいる。出力
装置4は宛名領域候補の中から宛名である確率の高い順
に所定数の宛名領域候補を出力する。
【0009】次に、データ処理装置2の内部構成につい
て説明する。始めに、本明細書で用いる用語について定
義する。まず、領域とは入力装置1で入力された郵便画
像の部分画像であると定義する。また、宛名領域とは入
力装置1で入力された郵便画像中の宛名の部分を示す領
域であると定義する。差出人の住所等、宛名でなく住所
を表している領域のことを差出領域という。また、宛名
でも宛名以外の住所を表している領域でもない領域のこ
とを文様領域という。文様領域は宛名領域でも差出領域
でもない領域のことである。
【0010】宛名領域候補生成手段21は入力装置1か
ら入力された郵便画像から宛名領域を含む複数の領域を
生成する。以下、この領域それぞれを宛名領域候補とい
う。例えば、図2に示すような郵便画像を例とすると、
宛名領域候補生成手段21により図3に示すように宛名
領域候補G1 ,G2 ,G3 ,G4 及びG5 が生成され
る。また、図4は宛名領域候補生成手段21で生成され
た5つの宛名領域候補の場所のみを示している。宛名領
域候補生成手段21で生成された複数の宛名領域候補の
中で宛名領域を示す宛名領域候補はただ一つである。宛
名領域以外の各宛名領域候補は、差出領域か文様領域で
ある。
【0011】特徴量抽出手段22は、宛名領域候補生成
手段21で得られた各宛名領域候補から、宛名・差出分
布辞書31に基づいて宛名・差出確率を計算するのに必
要な特徴量を抽出する手段である。特徴量の例として
は、図5に示すように郵便画像に原点0及びx軸y軸を
設定した時の、宛名領域候補の中心点の絶対位置のx座
標値、y座標値としている。ここでは、座標値は画素数
で表現することとするが、それは本質的なものではな
い。図4の宛名領域候補G1 ,G2 ,G3 ,G4 及びG
5 の場合の特徴量を図6に示している。例えば、宛名領
域候補G1 の特徴量はxは600、yは80、宛名領域
候補G2 の特徴量はxは480、yは80である。この
特徴量は、宛名・差出分布辞書31に基づいて宛名・差
出確率を計算するのに用いられる。
【0012】ここで、宛名確率、差出確率及び文様確率
の定義について説明する。まず、ある一つの宛名領域候
補に対して宛名領域候補から抽出した特徴量に基づいて
宛名領域候補が宛名領域と見なせる確率を、宛名領域候
補の宛名確率と定義する。また、宛名領域候補から抽出
した特徴量に基づいて宛名領域候補が差出領域と見なせ
る確率を、宛名領域候補の差出確率と定義する。更に、
宛名領域候補から抽出した特徴量に基づいて宛名領域候
補が文様領域と見なせる確率を、宛名領域候補の文様確
率と定義する。各宛名領域候補の文様確率は、1から宛
名領域候補の宛名確率、差出確率を引くことにより得ら
れる。図4の場合の宛名領域候補G1 ,G2 ,G3 ,G
4 及びG5 の宛名確率、差出確率、文様確率は、例えば
図7に示すような確率となる。図7の例では、例えば、
宛名領域候補G2 の宛名確率は0.10、差出確率は
0.20、文様確率は0.70である。
【0013】宛名・差出確率計算手段23は、特徴量抽
出手段22で得られた宛名領域候補の特徴量をもとに宛
名・差出分布辞書31を利用して各々の宛名領域候補の
宛名確率、差出確率、文様確率を計算する。この作業を
すべての宛名領域候補に対して実行する。順序決定手段
24は、宛名・差出確率計算手段23で得られた各宛名
領域候補の宛名確率及び差出確率に基づいて宛名領域候
補を宛名領域としてふさわしい順序に並べる手段であ
る。全ての宛名領域候補に対する順序は、以下のような
処理で得られる。まず、ある宛名領域候補に対してその
宛名確率及び差出確率から宛名領域候補の得点を計算す
る。宛名領域候補の得点をmで表わすと、宛名領域候補
の得点mの付け方は、宛名領域候補の宛名確率p、差出
確率qから次の数式(1)に従った計算により求められ
る。
【0014】
【数1】 m=f(p)−g(q/(p+q)) …(1) 但し、関数f及びgは引数をuとして、f(u)=u、
関数g(u)=uである。数式(1)が良いのは、q/
(p+q)は宛名領域候補が宛名領域か差出領域である
と仮定した場合の、宛名領域候補が宛名領域でない可能
性を示しているからである。この得点計算を全ての宛名
領域候補に対して実行し、得られた得点に基づいて全て
の宛名領域候補の得点の大きい順序を決定する。これが
順序決定処理で得られた全ての宛名領域候補の順序であ
る。得点mの計算において数式(1)では引数uに対
し、f(u)=u、g(u)=uとしたが、f(u),
g(u)は引数uの単調増加関数であれば何でも良い。
【0015】また、得点計算として数式(1)の代わり
に次のような数式(2)、数式(3)、数式(4)、数
式(5)、数式(6)を用いても良い。
【0016】
【数2】 m=f(p)/g(q/(p+q)) …(2)
【0017】
【数3】m=f(p)−g(q) …(3)
【0018】
【数4】m=f(p)/g(q) …(4)
【0019】
【数5】 m=f(p)+g(p/(p+q)) …(5)
【0020】
【数6】 m=f(p)×g(p/(p+q)) …(6) 数式(2)が良いのは、数式(1)と同様にq/(p+
q)は宛名領域候補が宛名領域か差出領域であると仮定
した場合の、宛名領域候補が宛名領域でない可能性を表
しているからである。数式(3)及び数式(4)が良い
理由は、f(p)は宛名領域候補の宛名領域らしさを、
g(q)は宛名領域候補の差出領域らしさを表している
からである。また、数式(5)及び数式(6)が良い理
由は、1−q/(p+q)=p/(p+q)であるの
で、数式(1)及び数式(2)と同じ理由である。
【0021】順序決定手段24において宛名領域候補の
順序は各宛名領域候補の宛名確率及び差出確率から得点
を計算して全ての宛名領域候補を得点の大きい順序に並
べる方法の他にも次のようにしても良い。例えば、宛名
領域候補がn個あるとする。n個の宛名領域候補にある
順序を与えた時にこの順序で始めからi番目(i=1,
…,n)の宛名領域候補に対する宛名確率をpi 、差出
確率をqi 、文様確率をri とすると、以上の順序に対
して宛名領域が差出領域よりも始めの方にくる確率P
は、
【0022】
【数7】 で計算できる。n個の宛名領域候補の全ての順序を求
め、それぞれの宛名領域候補の順序に対して数式(7)
に基づいて確率Pを計算し、確率Pが最大となるような
順序を求める。
【0023】出力候補決定手段25は、順序決定手段2
4で得られた宛名領域候補に対する順序に基づいて順序
の始めから与えられた候補数だけ宛名領域候補を選び、
それらの宛名領域候補を出力する。
【0024】次に、記憶装置3について説明する。記憶
装置3内には、宛名・差出分布辞書31が設けられてい
る。宛名・差出分布辞書31は、図8に示すように特徴
量の範囲、その範囲に属する特徴量を持つ宛名領域候補
の宛名確率、差出確率及び文様確率の値の変換テーブル
から構成されている。但し、図8は変換テーブルの一部
を示している。ここで、図8において“100〜11
0”とは、100以上110未満という意味を表わす。
図8の変換テーブルを用いて特徴量を確率値に変換する
場合、例えば、宛名領域候補の中心位置のx座標値が1
10以上120未満の値で、且つ、y座標値が50以上
55未満の値であったとすると、宛名領域候補の宛名確
率、差出確率及び文様確率はそれぞれ、0.70,0.
20,0.10である。
【0025】次に、本実施形態の具体的な動作について
説明する。まず、宛名読取対象となる郵便物は、スキャ
ナやカメラからなる入力装置1により読み取られ、その
郵便物の宛名が書かれている面の画像情報が読み取られ
る。例えば、入力装置1により図2の郵便画像が読み取
られたものとする。入力装置1により読み取られた郵便
画像の情報は宛名領域候補生成手段21に入力され、宛
名領域候補生成手段21では前述のように郵便画像の部
分画像に基づいて宛名領域を含む複数の宛名領域候補が
生成される。
【0026】宛名領域候補生成手段21では、例えば、
1992年のパターン・レコグニション、第25巻、第
12番(Pattern Recognition ,Vol .25,No.12,19
92)中の Anil K .Jain とSushil K.Bhattacharjee の
論文“ADDRESS BLOCK LOCATION ON ENVELOPES USING GA
BOR FILTERS ”(p.1459〜p.1477)中、
p.1470に記載されている方法を用いて宛名領域を
含む複数の宛名領域候補を作成し、図3に示すようにG
1 ,G2 ,G3 ,G4 及びG5 の5つの宛名領域候補を
生成する。図4は宛名領域候補生成手段21で得られた
5つの宛名領域候補の場所のみを示しているが、G1
切手の領域なので文様領域、G2 は消印の領域なので文
様領域、G3 は絵の領域なので文様領域、G4 は差出人
の住所の領域なので差出領域、G5 は宛名領域である。
但し、それぞれの宛名領域候補が宛名領域なのか差出領
域なのか文様領域なのかは、宛名領域候補生成手段21
が宛名領域候補を生成した直後の時点では分かっていな
い。
【0027】宛名領域候補生成手段21で生成された宛
名領域候補G1 ,G2 ,G3 ,G4及びG5 は特徴量抽
出手段22に供給される。図10は特徴量抽出手段22
の処理の流れを示すフローチャートである。まず、全て
の宛名領域候補に対して処理を実行したか否かを判定し
(ステップA1)、未処理の候補があればその中から1
つを選ぶ(ステップA2)。選ぶ順番は何でも良い。次
いで、選んだ宛名領域候補について特徴量を計算する
(ステップA3)。特徴量は図5で説明したように郵便
画像に原点0及びx軸及びy軸を定めた時の、宛名領域
候補の中心点の絶対位置の座標値x,yである。特徴量
抽出手段22はステップA1〜A3の処理を繰り返し行
い、すべての宛名領域候補について特徴量を計算する。
図4における宛名領域候補G1 ,G2 ,G3 ,G4 ,G
5 の中心点の絶対位置の座標値x及びyは図6の通りで
ある。図6では、例えば、宛名領域候補G2 の特徴量x
は480、特徴量yは80である。本実施形態では座標
値の単位は画素数である。但し、これは本質的な問題で
はない。
【0028】なお、宛名領域候補の特徴量としては、宛
名領域候補の絶対位置の他に様々な特徴量を用いてもよ
い。例えば、他の宛名領域候補との相対位置、郵便画像
の大きさを正規化して得られた位置、宛名領域候補の外
接矩形の幅や高さがある。また、宛名領域候補から、例
えば特願平7−105575号に記載された方法で文字
行抽出を行い、抽出した文字行に対する特徴量、例えば
文字行の左端のx座標を見てその座標値がすべての行で
一致しているか否かといった行の配置情報であってもよ
い。更に、行画像を例えば1992年、画像の処理と認
識、安居院猛・長尾智晴共著、p.14〜p.17にあ
るような手法で二値化して、行画像に対して横方向の白
画素/黒画素反転数や横方向の黒画素連続数の平均値や
最頻値等の特徴量を求めて、すべての文字行に対して特
徴量の平均をとった値を用いてもよい。
【0029】宛名・差出分布辞書31は図8に示すよう
に宛名領域候補の特徴量の範囲とその範囲に対応する宛
名確率、差出確率、文様確率との変換テーブルである。
図8ではx,yという特徴量そのものの組合せと確率値
との変換テーブルを示しているが、x,y以外の特徴量
を含む複数個の特徴量をもとに演算を行って新しい特徴
量を算出し、それと確率値との変換テーブルを作成して
も良い。
【0030】宛名・差出確率計算手段23では、宛名・
差出分布辞書31を参照して特徴量抽出手段22で計算
された特徴量をもつ各宛名領域候補が、宛名領域なの
か、差出領域なのか、文様領域なのかの確からしさ、即
ち、各々の宛名領域候補の宛名確率、差出確率、文様確
率を求める処理を行う。例えば、宛名領域候補から特徴
量抽出手段22により宛名領域候補の中心点の位置が
(x=115,y=53)であることが分かると、図8
の変換テーブルを参照して、xは特徴量xの範囲110
〜120に属し、yは特徴量yの範囲50〜55に属す
るので、この宛名領域候補の宛名確率は0.70、差出
確率は0.20、文様確率は0.10であると各確率を
求めることができる。宛名・差出確率計算手段23で
は、図6の特徴量から図7に示すように各宛名領域候補
の宛名確率p、差出確率q及び文様確率rを得ることが
できる。
【0031】次に、順序決定手段24では、宛名・差出
確率計算手段23で得られた各宛名領域候補の宛名確率
及び差出確率に基づいて全ての宛名領域候補の順序を決
定する処理を行う。図11は順序決定手段24の処理の
流れを示すフローチャートである。まず、全ての宛名領
域候補に対して処理を実行したか否かを判定し(ステッ
プB1)、未処理の候補があればその中から1つを選ぶ
(ステップB2)。選ぶ順番は何でも良い。次いで、選
んだ宛名領域候補について宛名領域候補の宛名確率を
p、差出確率をqとして、pとqから数式(1)に従っ
た計算で宛名領域候補の得点を計算する(ステップB
3)。但し、関数f及びgは、引数をuとして、f
(u)=u、関数g(u)=uである。
【0032】以下、ステップB1〜B3の処理を繰り返
し行い、各宛名領域候補の得点を計算していく。全ての
宛名領域候補の得点を計算すると、得点の大きい順に宛
名領域候補をソートする(ステップB4)。これが順序
決定処理で得られた全ての宛名領域候補の順序である。
ステップB3では、例えば、図6の場合を例として、数
式(1)に基づいて得点を計算すると、図9に示すよう
な結果が得られ、G5,G4 ,G3 ,G1 ,G2 という
順序が得られる。なお、f(u)=u及びg(u)=u
としたが、f(u),g(u)は引数uの単調増加関数
であれば何でも良い。また、先にも説明したが、得点計
算として数式(1)の代わりに数式(2)〜数式(6)
を用いても良い。
【0033】図12は順序決定手段24の他の順序決定
方法を示すフローチャートである。まず、複数の宛名領
域候補の取り得る順序を全て作成する(ステップC
1)。次に、得られた全ての順序に対し、処理が終了し
たか否かを判定し(ステップC2)、未処理のものがあ
れば、全ての順序の中から未処理のものを1つ選ぶ(ス
テップC3)。選ぶ順番は何でもよい。次いで、選んだ
宛名領域候補の順序について、その順序に対する宛名領
域が差出領域よりも始めの方にくる確率Pを、数式
(7)に基づいて計算する(ステップC4)。このよう
にしてステップC2〜C4の処理を繰り返し行い、全て
の順序ついて確率Pを求める処理を行う。また、宛名領
域候補の全ての順序の中から確率Pを最大とするような
宛名領域候補の順序を求める処理を行う(ステップC
5)。これが順序決定処理で得られた全ての宛名領域候
補に対する順序である。
【0034】出力候補決定手段25では、順序決定手段
24で得られた宛名領域候補の順序に基づいて順序の先
頭から宛名領域候補を出力する。出力する宛名領域候補
の数が例えば2個と予め決められているならば、G5
4 を出力する。また、出力する宛名領域候補の数が1
個であればG5 を出力する。
【0035】次に、宛名・差出分布辞書31の作成方法
について説明する。宛名・差出分布辞書とは、特徴量の
範囲とその範囲にある特徴量を持つ宛名領域候補の宛名
確率、差出確率、文様確率を、いろいろな特徴量の範囲
について並べたものである。今、特徴量の範囲をAで表
わし、その範囲にある特徴量を持つ宛名領域候補の宛名
確率をp(A)、差出確率をq(A)、文様確率をr
(A)で表わすものとする。また、各範囲Aに対する関
数hp(A)、hq(A)、hr(A)を用意し、それ
ぞれ宛名領域の頻度、差出領域の頻度、文様領域の頻度
という。
【0036】図13は宛名・差出分布辞書31の作成方
法を示すフローチャートである。まず、予めm個の郵便
画像を学習データとして用意する。また、特徴量、即
ち、宛名領域候補の中心点の絶対位置x,yに対し、x
の取り得る値の最小値xs 、最大値xl 、yの取り得る
値の最小値ys 、最大値yl を予め適当に決定する。例
えば、xs として0、xl として学習データであるm個
の郵便画像の横幅(横とは図5のx軸の方向)の最大
値、ys として0、yl として学習データであるm個の
郵便画像の縦幅(縦とは図5のy軸の方向)の最大値を
それぞれ設定する。横幅、縦幅としては特徴値x,yと
同様に画素値を用いるものとする。そして、ある整数k
に対し、xs +(i×(xl −xs ))/k〜xs
((i+l)×(xl −xs ))/k、且つ、ys
(j×(yl −ys ))/k〜ys +((j+l)×
(yl−ys ))/k(i=0,1,2,…,k−1、
j=0,1,2,…,k−1の全ての組み合わせを考え
る)のk2 個の範囲を考える。本実施形態では、kを1
0として合計100個の範囲を用いている。なお、本実
施形態では各特徴量に対し、等間隔で範囲を設定してい
るが、それは本質的な問題ではない。
【0037】具体的な方法としては、まず、m個の郵便
画像を入力する(図13のステップD1)。次いで、全
ての特徴量の範囲Aに対し、宛名頻度hp(A)、差出
頻度hq(A)、文様頻度hr(A)に0を代入し、頻
度の初期化を行う(ステップD2)。また、m個の郵便
画像全てに対してステップD5の処理を実行したか否か
を判定し(ステップD3)、未処理のものがあれば、m
個の郵便画像の中から未処理の郵便画像を1つ選ぶ(ス
テップD4)。順番は何でも良い。また、選んだ郵便画
像について郵便画像を入力として宛名領域候補生成手段
21によりn個の宛名領域候補を生成する(ステップD
5)。次いで、宛名領域候補について特徴量抽出手段2
1により特徴量、即ち、宛名領域候補の中心点の絶対位
置x,yを計算する(ステップD6)。
【0038】ここで、ある宛名領域候補に対して、宛名
領域がもつ特徴量が特徴量の範囲Aに属するものとし
て、宛名領域候補が宛名領域であるか差出領域であるか
文様領域であるかを人手により判定し、宛名領域候補が
宛名領域であるならば、hp(A)の値を1増やし、宛
名領域候補が差出領域であるならば、hq(A)の値を
1増やし、宛名領域候補が文様領域であるならば、hr
(A)の値を1増やす処理を行う(ステップD7)。ス
テップD7では、郵便画像の宛名領域候補に対して以上
のような処理を施すことにより頻度の更新を行う。以
下、ステップD3〜D7の処理を繰り返し行い、全ての
郵便画像について同様の処理を行う。全ての郵便画像に
ついて処理を終了すると、数式(8)、数式(9)、数
式(10)を用いてその特徴量の範囲に対する宛名確率
p(A)、差出確率q(A)、文様確率r(A)を計算
する(ステップD8)。
【0039】
【数8】 p(A)=hp(A)/(hp(A)+hq(A)+hr(A))…(8)
【0040】
【数9】 q(A)=hq(A)/(hp(A)+hq(A)+hr(A))…(9)
【0041】
【数10】 r(A)=hr(A)/(hp(A)+hq(A)+hr(A))…(10) このようにして特徴量と各確率が得られ、全ての確率の
範囲Aとp(A),q(A),r(A)を対応させて宛
名・差出分布辞書31に記憶させておく。
【0042】図14は本発明の第2の実施形態の構成を
示すブロック図である。本実施形態では、第1の実施形
態の記憶装置3内に宛名確率変換辞書32が設けられ、
データ処理装置2内に宛名確率変換手段26が設けられ
ている。宛名確率変換手段26は、宛名・差出確率計算
手段23で得られた宛名確率、差出確率、文様確率を、
その宛名確率、差出確率、文様確率をもとにして別の宛
名確率、差出確率、文様確率に補正する手段である。宛
名確率変換辞書32は、宛名確率変換手段26により旧
宛名確率等を新宛名確率等に変換するのに必要な情報を
格納するための辞書である。
【0043】第1の実施形態における各宛名領域候補の
宛名確率や差出確率は各領域毎に独立して算出したもの
であり、宛名領域が宛名領域候補のなかでただ一つ存在
するという状況を反映していない。本実施形態では、こ
の点を改良し、更に宛名領域の検出精度を向上するもの
である。まず、以下に必要な用語を定義する。ある宛名
領域候補に対して特徴量抽出手段22で得られた特徴量
をもとに全ての宛名領域候補の中で、宛名領域候補が宛
名領域である確率を、その対象とする宛名領域候補の宛
名確率と改めて定義する。また、宛名領域候補以外の宛
名領域候補が宛名領域であるという条件の下で、宛名領
域候補が差出領域である確率を差出確率と改めて定義す
る。更に、宛名領域候補以外が宛名領域であるという条
件の下で宛名領域候補が文様領域である確率を文様確率
と改めて定義する。
【0044】宛名領域候補が差出領域及び文様領域であ
る確率は、ここで定義した宛名確率をp′、差出確率を
q′、文様確率をr′として、それぞれ(1−p′)
q′及び(1−p′)r′と表わすことができる。以
下、混同を避ける為に宛名・差出確率計算手段23で得
られる確率のことを旧確率、宛名確率変換手段26で得
られる確率のことを新確率という。例えば、図4に示す
ようなG1 ,G2 ,G3 ,G4 ,G5 の宛名領域候補が
得られた場合の、新宛名確率p′、新差出確率q′、新
文様確率r′は図15に示す通りとなる。図15では、
宛名領域候補G1 、G2 、G3 、G4 、G5 の中で、例
えばG1 の新宛名確率は0.04、G2 の新宛名確率は
0.08である。
【0045】宛名確率変換手段26は、宛名・差出確率
計算手段23で得られた旧宛名確率p、旧差出確率q、
旧文様確率rを、宛名確率変換辞書32に基づいて新宛
名確率p′、新差出確率q′、新文様確率r′に変換す
る。宛名確率変換手段26では宛名・差出確率計算手段
23で得られた旧宛名確率pから、新宛名確率p′を例
えば次の数式(11)を用いて計算する。
【0046】
【数11】p′=p/S …(11) 但し、Sは全ての宛名領域候補に対する旧宛名確率の、
全ての宛名領域候補での総和である。
【0047】または、例えば、宛名領域候補の旧宛名確
率pの範囲、宛名領域候補以外の宛名領域候補の旧宛名
確率の最大値pmax の範囲、宛名領域候補の新宛名確率
p′の変換テーブルを宛名確率変換辞書32に用意して
おく。この時の宛名確率変換辞書32は、例えば、図1
6のように表わせる。但し、データ量が多いので一部の
みを示している(…の部分は省略した部分である)。
今、確率の範囲をAと表わし、その範囲にあるp及びp
max を持つ宛名領域候補の新宛名確率をp′(A)、新
差出確率をq′(A)、新文様確率をr′(A)で表わ
すものとする。また、各範囲Aに対する関数hp
(A)、hq(A)、hr(A)を用意し、それぞれ宛
名領域の頻度、差出領域の頻度、文様領域の頻度とい
う。
【0048】図17は宛名確率変換辞書32の作成方法
を示すフローチャートである。まず、予めm個の郵便画
像を学習データとして用意する。また、確率p及びp
max に対し、pの取り得る値の最小値as 、最大値a
l 、pmax の取り得る値の最小値bs 、最大値bl を予
め適当に決定する。例えば、as として0、al として
1、bs として0、bl として1をそれぞれ設定する。
そして、ある整数kに対し、特徴量pが、as +(i×
(al −as ))/k〜as +((i+l)×(al
s ))/kで、且つ、特徴量pmax が、bs +(j×
(bl −bs ))/k〜bs +((j+l)×(bl
s ))/k(i=0,1,2,…,k−1、j=0,
1,2,…,k−1の全ての組み合わせを考える)のk
2 個の範囲を考える。本実施形態はkを20として、合
計400の範囲を用いている。なお、本実施形態では各
特徴量に対し、等間隔で範囲を設定しているが、それは
本質的な問題ではない。
【0049】具体的な方法としては、まず、m個の郵便
画像を入力する(図17のステップE1)。次いで、全
ての特徴量の範囲Aに対し、宛名頻度hp(A)、差出
頻度hq(A)、文様頻度hr(A)に0を代入し、頻
度の初期化を行う(ステップE2)。また、m個の郵便
画像全てに対して処理を実行したか否かを判定し(ステ
ップE3)、未処理のものがあれば、m個の郵便画像の
中から未処理のものを1つ選ぶ(ステップE4)。順番
は何でも良い。次に、選んだ郵便画像について宛名領域
候補生成手段21によりn個の宛名領域候補を生成する
(ステップE5)。また、n個の宛名領域候補について
特徴量抽出手段21により各宛名領域候補の特徴量、即
ち、宛名領域候補の中心点の絶対位置x,yを計算する
(ステップE6)。更に、n個の宛名領域候補について
ステップD5で得られた特徴量を用いて、宛名・確率計
算手段23により旧宛名確率、旧差出確率、旧文様確率
を計算する(ステップE7)。
【0050】ここで、ある宛名領域候補に対して、宛名
領域がもつ旧宛名確率及び宛名領域候補が持つ旧宛名確
率の最大値が確率の範囲Aに属するものとして、宛名領
域候補が宛名領域であるか差出領域であるか文様領域で
あるかを人手により判定し、宛名領域候補が宛名領域で
あるならば、hp(A)の値を1増やし、差出領域であ
るならば、hq(A)の値を1増やし、文様領域である
ならば、hr(A)の値を1増やす処理を行う(ステッ
プE8)。ステップE8では、郵便画像のn個の宛名領
域候補に対して以上の処理を施すことにより頻度の更新
を行う。以下、ステップE3〜E8の処理を繰り返し行
い、すべての郵便画像について同様の処理を行う。
【0051】全ての郵便画像について処理を終了する
と、次の数式(12)、数式(13)、数式(14)を
用いてその特徴量の範囲に対する新宛名確率p′
(A)、新差出確率q′(A)、新文様確率r′(A)
を計算する処理を行う(ステップE9)。
【0052】
【数12】 p′(A)=hp(A)/(hp(A)+hq(A)+hr(A))…(12)
【0053】
【数13】 q′(A)=hq(A)/(hp(A)+hq(A)+hr(A))…(13)
【0054】
【数14】 r′(A)=hr(A)/(hp(A)+hq(A)+hr(A))…(14) このようにして新確率が得られ、全ての確率の範囲Aと
p′(A),q′(A),r′(A)を対応させて宛名
確率変換辞書32に記憶させておく。図16は2つの宛
名領域候補の旧宛名確率pの値をもとにして宛名確率
p′に変換するテーブルであるが、もちろんもとにする
宛名領域候補の数はより多くしても良いし、旧宛名確率
だけでなく旧差出確率や旧文様確率を用いても良い。
【0055】次に、各宛名領域候補毎にその宛名領域候
補に対する新差出確率q′及び新文様確率r′を、旧差
出確率をq、旧文様確率をrとして、数式(15)、数
式(16)を用いて計算する。
【0056】
【数15】q′=q/(q+r) …(15)
【0057】
【数16】r′=r/(q+r) …(16) 例として、宛名・差出確率計算手段23で図6のように
旧宛名確率p、旧差出確率q、旧文様確率rが得られた
場合、宛名確率変換手段26で、数式(11)、数式
(15)及び数式(16)を用いて計算することにより
図15に示すように新宛名確率p′、新差出確率q′、
新文様確率r′が得られる。後は新宛名確率、新差出確
率、新文様確率をそれぞれ宛名確率、差出確率、文様確
率とみなして、第1の実施形態と全く同じ処理を行う。
例えば、図15の例の場合、数式(1)を用いて得点を
計算すると、図18に示すような結果が得られ、宛名領
域候補G5 の得点0.07が最も高得点となる。但し、
関数f,gは引数uに対し、f(u)=u,g(u)=
uである。
【0058】
【発明の効果】以上説明したように本発明によれば、郵
便物の宛名領域候補から宛名領域を検出する際に差出人
の住所等のような宛名ではないが住所の構造を持ってい
る差出領域の差出確率を新たに考慮して、宛名である宛
名確率から差し引くことにより差出領域を出力しにくい
ようにしているので、宛名ではないが住所の構造を持っ
ている領域を宛名領域として誤検出する危険性を低減で
き、宛名領域の検出精度を高めることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の構成を示すブロック
図である。
【図2】郵便画像の例を示す図である。
【図3】図2の郵便画像から複数の宛名領域候補を生成
した場合の図である。
【図4】図3の宛名領域候補を画像を除いて示す図であ
る。
【図5】特徴量抽出手段の特徴量を説明するための図で
ある。
【図6】特徴量抽出手段による宛名領域候補毎の特徴量
の例を示す図である。
【図7】宛名・差出確率計算手段による宛名領域候補毎
の各確率の例を示す図である。
【図8】宛名・差出分布辞書の変換テーブルの具体例を
示す図である。
【図9】順序決定手段による得点結果の例を示す図であ
る。
【図10】特徴量抽出手段の処理の流れを示すフローチ
ャートである。
【図11】順序決定手段の処理の流れを示すフローチャ
ートである。
【図12】順序決定手段の他の処理の流れを示すフロー
チャートである。
【図13】宛名・差出分布辞書の作成方法を示すフロー
チャートである。
【図14】本発明の第2の実施形態の構成を示すブロッ
ク図である。
【図15】宛名確率変換手段による宛名領域候補毎の新
確率の例を示す図である。
【図16】宛名確率変換辞書の例を示す図である。
【図17】宛名確率変換辞書の作成方法を示すフトーチ
ャートである。
【図18】順序決定手段による宛名領域候補毎の得点結
果の例を示す図である。
【符号の説明】
1 入力装置 2 データ処理装置 3 記憶装置 4 出力装置 21 宛名領域候補生成手段 22 特徴量抽出手段 23 宛名・差出確率計算手段 24 順序決定手段 25 出力候補決定手段 26 宛名確率変換手段 31 宛名・差出分布辞書 32 宛名確率変換辞書

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】郵便画像の部分画像に基づいて宛名情報の
    領域である宛名領域を含む複数の宛名領域候補を生成す
    る手段と、生成された宛名領域候補毎に宛名領域候補が
    宛名領域であるかを評価する場合の指標を表わす特徴量
    を抽出する手段と、前記特徴量と宛名領域候補の宛名領
    域である確率を示す宛名確率及び宛名領域候補の宛名以
    外の住所の構造を持つ領域の確率を示す差出確率とを対
    応させて記憶する手段と、前記抽出手段により抽出され
    た各々の宛名領域候補の特徴量を前記記憶手段を参照し
    て宛名確率及び差出確率に変換する手段と、変換された
    宛名確率及び差出確率に基づいて宛名である確率が高い
    順に宛名領域候補の順序を決定する手段と、決定された
    順序に基づいて宛名領域候補の中から宛名領域である確
    率が高い順に所定数の宛名領域候補を選択する手段とを
    備え、前記順序決定手段は、前記宛名領域候補のとり得るすべ
    ての順序について宛名確率及び差出確率に基づいて宛名
    確率が差出確率よりも始めの方にくる確率を計算し、こ
    の確率が最大となるような順序を選択することにより宛
    名領域候補の順序を決定することを 特徴とする宛名領域
    検出装置。
  2. 【請求項2】郵便画像の部分画像に基づいて宛名情報の
    領域である宛名領域を含む複数の宛名領域候補を生成す
    る手段と、生成された宛名領域候補毎に宛名領域候補が
    宛名領域であるかを評価する場合の指標を表わす特徴量
    を抽出する手段と、前記特徴量と宛名領域候補の宛名領
    域である確率を示す宛名確率及び宛名領域候補の宛名以
    外の住所の構造を持つ領域の確率を示す差出確率とを対
    応させて記憶する手段と、前記抽出手段により抽出され
    た各々の宛名領域候補の特徴量を前記記憶手段を参照し
    て宛名確率及び差出確率に変換する手段と、変換された
    宛名確率及び差出確率に基づいて宛名である確率が高い
    順に宛名領域候補の順序を決定する手段と、決定された
    順序に基づいて宛名領域候補の中から宛名領域である確
    率が高い順に所定数の宛名領域候補を選択する手段とを
    備え、 前記宛名確率及び差出確率をそれぞれ宛名領域は1つで
    あることを反映させる確率値に補正する手段を有するこ
    とを特徴とする宛名領域検出装置。
JP00680199A 1999-01-13 1999-01-13 宛名領域検出装置 Expired - Fee Related JP3206579B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP00680199A JP3206579B2 (ja) 1999-01-13 1999-01-13 宛名領域検出装置
US09/479,337 US6574351B1 (en) 1999-01-13 2000-01-07 Destination address area detection apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00680199A JP3206579B2 (ja) 1999-01-13 1999-01-13 宛名領域検出装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2001084835A Division JP2001314820A (ja) 2001-03-23 2001-03-23 宛名領域検出装置

Publications (2)

Publication Number Publication Date
JP2000202371A JP2000202371A (ja) 2000-07-25
JP3206579B2 true JP3206579B2 (ja) 2001-09-10

Family

ID=11648301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00680199A Expired - Fee Related JP3206579B2 (ja) 1999-01-13 1999-01-13 宛名領域検出装置

Country Status (2)

Country Link
US (1) US6574351B1 (ja)
JP (1) JP3206579B2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3268552B2 (ja) * 1999-10-06 2002-03-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US8024112B2 (en) * 2005-09-29 2011-09-20 Microsoft Corporation Methods for predicting destinations from partial trajectories employing open-and closed-world modeling methods
JP4396657B2 (ja) * 2006-03-16 2010-01-13 ソニー株式会社 通信装置及び送信制御方法及び送信制御プログラム
US20080004926A1 (en) * 2006-06-30 2008-01-03 Microsoft Corporation Methods and architectures for context-sensitive reminders and service facilitation
US9846049B2 (en) * 2008-07-09 2017-12-19 Microsoft Technology Licensing, Llc Route prediction
US8725288B2 (en) * 2009-10-28 2014-05-13 Canada Post Corporation Synthesis of mail management information from physical mail data
US8565783B2 (en) 2010-11-24 2013-10-22 Microsoft Corporation Path progression matching for indoor positioning systems
US9134137B2 (en) 2010-12-17 2015-09-15 Microsoft Technology Licensing, Llc Mobile search based on predicted location
US9163952B2 (en) 2011-04-15 2015-10-20 Microsoft Technology Licensing, Llc Suggestive mapping
US8981995B2 (en) 2011-06-03 2015-03-17 Microsoft Technology Licensing, Llc. Low accuracy positional data by detecting improbable samples
US9470529B2 (en) 2011-07-14 2016-10-18 Microsoft Technology Licensing, Llc Activating and deactivating sensors for dead reckoning
US9464903B2 (en) 2011-07-14 2016-10-11 Microsoft Technology Licensing, Llc Crowd sourcing based on dead reckoning
US8538686B2 (en) 2011-09-09 2013-09-17 Microsoft Corporation Transport-dependent prediction of destinations
US10184798B2 (en) 2011-10-28 2019-01-22 Microsoft Technology Licensing, Llc Multi-stage dead reckoning for crowd sourcing
US9429657B2 (en) 2011-12-14 2016-08-30 Microsoft Technology Licensing, Llc Power efficient activation of a device movement sensor module
US9756571B2 (en) 2012-02-28 2017-09-05 Microsoft Technology Licensing, Llc Energy efficient maximization of network connectivity
US9817125B2 (en) 2012-09-07 2017-11-14 Microsoft Technology Licensing, Llc Estimating and predicting structures proximate to a mobile device
JP6203084B2 (ja) * 2014-03-06 2017-09-27 株式会社東芝 配達物区分処理システム、および配達物区分処理方法
JP2016051211A (ja) 2014-08-28 2016-04-11 株式会社東芝 住所認識装置、区分装置、統括住所認識装置、住所認識方法
US9727800B2 (en) 2015-09-25 2017-08-08 Qualcomm Incorporated Optimized object detection

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307639A (ja) 1992-04-30 1993-11-19 Toshiba Corp 郵便物の宛名領域検出装置
JP3388867B2 (ja) 1994-03-31 2003-03-24 株式会社東芝 宛名領域検出装置および宛名領域検出方法
US6269171B1 (en) * 1995-04-12 2001-07-31 Lockheed Martin Corporation Method for exploiting correlated mail streams using optical character recognition
GB9605207D0 (en) * 1996-03-12 1996-05-15 Ibm Address block location
US6421451B2 (en) * 1997-09-16 2002-07-16 Kabushiki Kaisha Toshiba Step difference detection apparatus and processing apparatus using the same

Also Published As

Publication number Publication date
US6574351B1 (en) 2003-06-03
JP2000202371A (ja) 2000-07-25

Similar Documents

Publication Publication Date Title
JP3206579B2 (ja) 宛名領域検出装置
US7519226B2 (en) Form search apparatus and method
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
CN110598581B (zh) 基于卷积神经网络的光学乐谱识别方法
JPH08287184A (ja) 画像切り出し装置及び文字認識装置
CN112861865A (zh) 一种基于ocr技术的辅助审计方法
CN110135407B (zh) 样本标注方法及计算机存储介质
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
JPH09311905A (ja) 行検出方法および文字認識装置
JP2001314820A (ja) 宛名領域検出装置
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2001034763A (ja) 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
JP2827960B2 (ja) 宛名行抽出装置
JP2985813B2 (ja) 文字列認識装置および知識データベース学習方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2995818B2 (ja) 文字切り出し方法
WO2001026024A1 (fr) Dispositif et procede d'identification de document
JP2021184140A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2576080B2 (ja) 文字切出し方法
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JP2616995B2 (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JP2778436B2 (ja) 文字切り出し装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070706

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080706

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090706

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100706

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110706

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120706

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130706

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees