JP2009146393A - 住所db構築装置及びその方法 - Google Patents

住所db構築装置及びその方法 Download PDF

Info

Publication number
JP2009146393A
JP2009146393A JP2008291276A JP2008291276A JP2009146393A JP 2009146393 A JP2009146393 A JP 2009146393A JP 2008291276 A JP2008291276 A JP 2008291276A JP 2008291276 A JP2008291276 A JP 2008291276A JP 2009146393 A JP2009146393 A JP 2009146393A
Authority
JP
Japan
Prior art keywords
address
valid
read
effective
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008291276A
Other languages
English (en)
Other versions
JP4847505B2 (ja
Inventor
Ho Young Kim
ホ ヨン キム
Seung-Ick Jang
スン−イク チャン
Jung Hyun Park
ジョン ヒュン パク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2009146393A publication Critical patent/JP2009146393A/ja
Application granted granted Critical
Publication of JP4847505B2 publication Critical patent/JP4847505B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Character Discrimination (AREA)
  • Sorting Of Articles (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】郵便物に記載された住所情報から読み取った住所情報を検証して、信頼度の高い住所DBを構築する装置及びその方法を提供する。
【解決手段】本発明は、住所情報が含まれた住所映像を利用して住所DBを構築する方法において、住所映像から住所を読み取る住所読取り部、住所読取り部で読み取った住所である読取り住所と、読取り住所の累積回数を算出した読取り住所の累積値とを貯蔵する読取り結果貯蔵部、実在する住所の有効住所が含まれた有効住所DBを貯蔵する有効住所貯蔵部、及び読取りの結果貯蔵部からロードした読取り住所の累積値が事前に設定された臨界値以上であるかどうかによって読取り住所を有効住所貯蔵部に貯蔵する有効住所抽出部を含む。本発明によると、郵便物に記載された住所情報から読み取った住所情報を検証して、住所DBを構築することによって、住所DBの信頼度と完成度を向上させる効果がある。
【選択図】図1

Description

本発明は一般に、住所DB(データベース)構築装置及びその方法に関し、より詳しくは、住所が記入された郵便物から住所を抽出して住所DBを構築する装置及びその方法に関する。
本発明は情報通信部及び情報通信研究振興員の友情技術開発事業の一環として行った研究から導出されたものである[課題管理番号:2006-X-004-01、課題名:実時間郵便物流要素技術開発]。
住所情報は多様な目的に活用でき、特に、郵便物の自動仕分け性能を向上させるための正確な住所DBの構築は、郵便業務の効率性を高めるための重要な必要条件のうちの1つである。したがって、全国規模の住所情報を収集して住所DBを構築し、これを持続的に現行化する必要がある。このためには莫大な人力の動員と持続的な努力が要求されるだけでなく、よく精製された住所DBを得ることも要求されるため、韓国では郵便住所DB構築の本格的な試みが最近行われた。
従来の郵便住所DBは集配人を通じて住所を収集し、収集された住所を整理及び管理する住所管理者が入力する方式で構築されてきたが、この場合、集配人の資料収集過程における住所脱落やオペレーターの入力過程での誤入力などによって、住所DBの信頼性と完成度が多少落ちる傾向があった。
これを補完するために、自動仕分け機を使用して住所DBを検証して持続的に補完すると完成度を向上させることもできるが、初期の住所DB構築とデータベース現行化段階での頻繁な試行錯誤によって多くの費用が発生する。
また、住所DBがある程度完結性を有するように構築された後でも繰り返される住所の生成、消滅によって、一定期間が経過すると住所DBは完成度が落ちて集配人などの努力に依存して現行化するしかないために、全国的な住所DBを構築及び維持するためには莫大な費用が継続して発生するという問題がある。
また、住所自動認識技術を活用して郵便物などに記入された住所から住所情報だけを抽出することができるが、このように抽出した住所情報は信頼度に問題があるため、高い信頼度が要求される住所DBに追加することは無理である。
本発明は、このような問題を解決するためになされたものであり、その目的は、郵便物に記載された住所情報から読み取った住所情報を検証して信頼度の高い住所DB構築する装置及びその方法を提供することにある。
このような技術的課題を達成するために、請求項1に記載の発明は、住所情報が含まれた住所映像を利用して住所DBを構築する装置において、前記住所映像から住所を読み取る住所読取り部、前記住所読取り部で読み取った住所の読取り住所と前記読取り住所の累積回数を算出した前記読取り住所の累積値を貯蔵する読取り結果貯蔵部、実在する住所である有効住所が含まれた有効住所DBを貯蔵する有効住所貯蔵部、及び前記読取りの結果貯蔵部からロードした前記読取り住所の累積値が、事前に設定された臨界値以上であるかどうかによって前記読取り住所を前記有効住所貯蔵部に貯蔵する有効住所抽出部を含む。
また、請求項4に記載の発明は、住所情報が含まれた住所映像を利用して住所DBを構築する方法において、a)前記住所映像から読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値を貯蔵する段階、b)前記読取り住所の累積値が、事前に設定された臨界値以上であるかどうかを判断する段階、及びc)前記読取り住所の累積値が事前に設定された臨界値以上である場合に、前記読取り住所を、実在する住所が貯蔵される有効住所DBに貯蔵する段階を含む。
また、請求項6に記載の発明は、住所情報が含まれた住所映像を利用して住所DBを構築する装置において、前記住所映像から住所を読み取る住所読取り部、前記住所読取り部が読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値を貯蔵する読取り結果貯蔵部、実在する住所である有効住所が含まれた有効住所DBを貯蔵する有効住所貯蔵部、前記読取りの結果貯蔵部からロードした前記読取り住所の累積値が事前に設定された臨界値以上であるかどうかによって前記読取り住所を実在する住所の可能性の高い有効住所候補として設定する有効住所候補抽出部、及び前記住所映像と前記有効住所候補を出力し、住所管理者から入力され、前記住所映像の住所と前記有効住所候補の一致有無を示す情報によって、前記有効住所候補を前記有効住所貯蔵部に貯蔵する有効住所検証部を含む。
また、請求項13に記載の発明は、住所情報が含まれた住所映像を利用して住所DBを構築する方法において、a)前記住所映像から読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値を貯蔵する段階、b)前記読取り住所の累積値が事前に設定された臨界値以上である場合に、前記読取り住所を実在する可能性の高い有効住所候補として設定する段階、c)前記住所映像と前記有効住所候補を出力して住所管理者から前記住所映像と前記有効住所候補の一致有無に対する情報の入力を受ける段階、及びd)前記入力を受けた一致有無に対する情報によって前記有効住所候補を、実在する住所が貯蔵される有効住所DBに貯蔵する段階を含む。
本発明によると、郵便物に記載された住所情報から読み取った住所情報を検証して住所DBとして構築することによって、住所DBの信頼度と完成度を向上させる効果がある。
また、郵便物に記載された住所情報から住所を読み取りながら住所収集と現行化を同時に進行することによって、住所DBに構築することに消耗する努力と費用を減らす効果がある。
以下、添付した図面を参照して本発明の実施例について、本発明が属する技術分野における通常の知識を有する者が容易に実施できるように詳しく説明する。しかし、本発明は、多様で相異なる形態によって実現することができ、ここで説明する実施例に限られない。なお、図面によって本発明を明確に説明するために、説明上不必要な部分は省略し、明細書全体にわたって類似の部分については類似の図面符号を付した。
また、或る部分が何らかの構成要素を「含む」とすると、これは特に反対になる記載のない限り、他の構成要素を除くことではなく、他の構成要素をさらに含むことを意味する。
図1は、本発明の第1実施例による有効住所DB構築装置の構成を概略的に示す図面である。
図1を参照すると、本発明の第1実施例による有効住所DB構築装置100は、住所映像供給部110、住所読取り部120、読取り結果貯蔵部130、有効住所抽出部140及び有効住所貯蔵部180を含む。
住所映像供給部110は、住所情報が記載された郵便物をスキャンして住所映像を生成し、スキャンした住所映像を住所読取り部120に提供する。ここで、住所映像供給部110は、郵便自動仕分け機のように郵便物自動供給装置であるか、または、カメラやスキャナーなどから既にスキャンした映像を供給する装置である。
住所読取り部120は、文字またはバーコードが含まれた住所映像を前処理し、認識して、住所文字列を生成し、バーコード読取、文字認識、住所解釈などの技術を利用して住所映像供給部110から受信する住所映像から住所を自動的に読み取る。
ここで、一般に住所情報が貯蔵された住所DBに存在する住所のみを後処理して読み取ることができる認識器では、新たに追加された住所情報を得ることができないため、住所読取り部120は、一般的な住所情報が含まれた住所DBを活用せずに住所映像で住所を読み取る。
また、住所読取り部120は文字列で構成された住所だけでなく、バーコードで収録された住所情報の読取が可能であり、認識過程のエラーを減らすことができる。
読取り結果貯蔵部130は、住所読取り部120で読み取った結果である複数の読取り住所を貯蔵し、管理するデータベースである。読取り結果貯蔵部130は、同一の読取り住所が入力されると、読取り住所別累積値を算出して貯蔵する。ここで、累積値は有効住所抽出のために利用される。
読取り結果貯蔵部130は、住所読取り部120を通じて認識された文字列を貯蔵し、認識された文字列の中で建物の棟/号のような詳細情報はそのまま貯蔵する。この時、読取り結果貯蔵部130は、行政区域名のような住所情報が住所解釈及び後処理された結果を利用することも可能である。ここで、住所の体系に相当する行政区域名データベースは相対的に構築しやすいために、番号及び号程度の水準の詳細な住所情報を抽出して分析する。
有効住所抽出部140は、読取り結果貯蔵部130に貯蔵された複数の住所映像を読み取った結果である読取り住所と、読取り住所の累積値をロードしてこれらを分析し、その中で実在する有効住所である可能性の高い住所を抽出する。ここで、有効住所抽出部140は、読取り住所別累積値を確認して、読取り住所別に累積値が事前に設定された臨界値以上である読取り住所を有効住所として判断し、有効住所として判断された住所情報を抽出して有効住所貯蔵部180に貯蔵する。
有効住所貯蔵部180は、実際に存在する住所をデータベース化した有効住所DBを貯蔵し、管理する。
有効住所貯蔵部180は、住所読取り部120で認識された住所が実在する住所であるかどうかを確認するのに必要な情報を提供し、有効住所抽出部140が読取り結果貯蔵部130に貯蔵された複数の読取り住所から有効住所を抽出するために必要な情報を提供する。
また、有効住所貯蔵部180は、有効住所抽出部140で実在する住所として判断した有効住所を貯蔵する。
図2は、本発明の第1実施例による有効住所DB構築過程を示す流れ図である。
以下、図2を参照して、本発明の第1実施例による有効住所DBを構築する過程について説明する。ここで、本発明の第1実施例による有効住所DBを構築する過程は、住所映像が入力されると実時間で入力された住所映像が有効住所であるかどうかを判断して有効住所DBを構築することである。
まず、住所映像供給部110が郵便物に記載された住所情報をスキャンした住所映像を生成して、住所読取り部120に入力すると(S210)、住所読取り部120は、入力された住所映像から住所を読取り(S220)、読取り結果貯蔵部130に読み取った住所である読取り住所と読取り住所の累積値を貯蔵する(S230)。
次いで、有効住所抽出部140は、読取り結果貯蔵部130に読取り住所と読取り住所の累積値が含まれた住所読取り結果をロードして、それぞれの住所別に累積値が事前に設定された臨界値を超過するかどうかを判断する(S240)。
もし、段階S240において累積値が事前に設定された臨界値を超える住所があると、臨界値を超える読取り住所が有効住所貯蔵部180の有効住所DBに存在するかどうかを確認して、臨界値を超える読取り住所が新たな有効住所であるかどうかを判断する(S250)。
もし、段階S250において臨界値を超える読取り住所が新たな有効住所であると判断されると、有効住所抽出部140は、臨界値を超える読取り住所を新たな有効住所として設定して、有効住所貯蔵部180の有効住所DBに貯蔵する(S260)。
もし、段階S240において累積値が事前に設定された臨界値を超える住所がなかったり、段階S250において臨界値を超える住所が新たな有効住所でないと判断されたりすると、この過程を終了する。
図3は、本発明の第2実施例による有効住所DB構築装置の構成を概略的に示す図面である。
図3を参照すると、本発明の第2実施例による有効住所DB構築装置300は、住所映像供給部310、住所読取り部320、読取り結果貯蔵部330、有効住所候補抽出部340、有効住所検証部350、非有効住所候補抽出部360、非有効住所検証部370及び有効住所貯蔵部380を含む。
ここで、本発明の第2実施例による有効住所DB構築装置300は、上述した本発明の第1実施例による有効住所DB構築装置110とその構造が類似するため、説明の便宜上本発明の第1実施例と重複する構成要素に対する説明は省略する。
有効住所候補抽出部340は、読取り結果貯蔵部330で累積された住所読取り結果をロードしてこれを分析し、実際に存在する住所である有効住所の可能性の高い住所を抽出する。ここで、有効住所候補抽出部340は、第1実施例で説明した有効住所抽出部140と同様に累積した統計を利用して有効住所を選択する。例えば、一定期間や一定量の住所読取り結果が累積した後に、臨界値以上に繰り返される住所を実在する住所である有効住所と判断し、もし判断した有効住所が有効住所貯蔵部380の有効住所DBに含まれていない場合には、有効住所候補として設定する。
有効住所検証部350は、有効住所候補抽出部340から抽出された有効住所候補と住所映像をビデオ画面に出力し、住所管理者が出力された住所の有効性を判断して有効住所DBに追加有無の質問を受けて、住所管理者が有効住所候補と住所映像の住所が一致して有効性があると判断した有効住所候補を、有効住所貯蔵部380の有効住所DBに貯蔵する。この時、有効住所検証部350は、ビデオ画面に有効住所候補として選定され、資料になる住所映像を出力し、住所管理者に住所映像を見せて、住所映像の認識が正確であるかどうかを判断させる。
ここで、有効住所検証は大別して、住所読取システムで読み取られて提示された住所と、住所映像に表示された住所とが同一であるかどうかを確認する段階と、提示された住所が実際有効な住所であるかどうかを確認する段階とに分けることができる。この時、後者の段階は、現場に対する知識がなければ判断が不可能であるため、担当区域の集配人や区役所職員などのように当該地域をよく知っている人が必要となる。これは、同一作業者が行いにくいこともあるので、必要に応じて有効住所検証部350は、住所映像を見て読取り結果の有効性を検証する段階と、追加する有効住所自体の有効性を検証する段階とに分けて構成することができる。
また、有効住所の追加は、住所読取り結果が追加されるたびに有効住所の資格有無を分析するオンライン実時間有効住所DB追加方法と、累積された住所読取り結果を一度に分析して有効住所を抽出するオフライン有効住所DB追加方法とに分けて実現することができる。
非有効住所候補抽出部360は、読取り結果貯蔵部330で累積された住所読取り結果をロードしてこれを分析し、有効住所貯蔵部380にある住所の中で実際に存在しない住所である非有効住所の可能性の高い住所を抽出する。ここで、非有効住所候補抽出部360は、累積した統計を活用して非有効住所を選択する。例えば、一定期間や一定量の住所読取り結果が累積した後、事前に設定された臨界値未満で発生した住所を非有効住所と判断し、もし判断した非有効住所が有効住所貯蔵部380の有効住所DBに含まれている場合、それを非有効住所候補として設定する。
非有効住所検証部370は、非有効住所候補抽出部360で抽出された非有効住所候補と住所映像をビデオ画面に出力し、住所管理者が出力された住所の非有効性を判断して有効住所DBでの削除可否を決め、住所管理者が非有効住所候補と住所映像の住所が一致して有効性がないと判断すると、非有効住所候補を有効住所DBから削除する。この時、非有効住所検証部350は、ビデオ画面に非有効住所候補として選定され、資料になる住所映像を出力し、住所管理者に住所映像を見せて、住所映像の認識が正確であるかどうかを判断させる。
以下、本発明の第2実施例によるオンライン実時間有効住所DB構築方法とオフライン有効住所DB構築方法について図面と共に詳しく説明する。
ここで、オンライン実時間有効住所DB構築方法は、住所映像供給部310を通じて住所映像が入力されると、実時間で入力された住所映像が有効住所であるかどうかを判断し、入力された住所映像が有効住所である場合には入力された住所映像の住所を有効住所DBに追加する方式である。
また、オフライン有効住所DB構築方法は、住所映像供給部310を通じて住所映像が事前に設定された個数だけ読取り結果貯蔵部330に累積されると、入力された住所映像が有効住所であるかどうかを判断し、入力された住所映像が有効住所である場合には入力された住所映像の住所を有効住所DBに追加する方式である。
説明の便宜のために、オンライン実時間有効住所DB構築方法についてまず説明する。
図4は、本発明の第2実施例によるオンライン実時間住所DB構築する過程を示す流れ図であり、図5は、本発明の第2実施例によるオンライン実時間住所DB構築する段階S493の詳細過程を示す図面である。
以下、図4及び図5を参照して、住所DBを構築する過程について詳細に説明する。
まず、住所映像供給部310が郵便物に記載された住所情報をスキャンした住所映像を生成して、住所読取り部320に入力すると(S410)、住所読取り部320は、入力された住所映像から住所を読み取り(S420)、読取り結果貯蔵部330に読み取った住所の読取り住所を貯蔵する(S230)。この時、読取り結果貯蔵部330には住所読取り部320で読み取った複数の読取り住所が貯蔵され、それぞれの住所別に累積した回数である累積値が共に貯蔵される。
次いで、有効住所候補抽出部340は、読取り結果貯蔵部330から読取り住所と読取り住所の累積値の提供を受けて分析し(S440)、読取り住所の累積値が事前に設定された臨界値未満であるかどうかを判断する(S450)。
もし、段階S450において累積値が事前に設定された臨界値未満であると判断されると、有効住所候補抽出部340は臨界値を調整する(S460)。この時、臨界値の調整は、下記の数式1または数式2を利用して行われる。
Figure 2009146393
Figure 2009146393
(ここで、Tは有効住所であるかどうかを判別する基準臨界値、Nは全体供給した住所映像個数、Eは有効住所を有する郵便物の数(E<=N)、Dは供給された住所映像当該地域の有効住所DBの集配地点数、及びPは有効住所郵便物が出現した集配地点数(P<=D)を意味する。)
ここで、「N、E、D、P>m」を満足し、Lは最小臨界値で、mは統計的意味を有するように調整できる最小投入集配地点個数である。
n(a)を読取られた住所aの発生累積頻度であるとすると、n(a)>=Tであれば有効住所であり、n(a)<Tであれば効力のない非有効住所である。
次いで、有効住所候補抽出部340は、読取り結果貯蔵部330の新たな読取り住所の更新有無を判断して、住所映像供給部310から次の住所映像が入力されるかどうかを判断し(S470)、次の住所映像が入力されないとこの過程を終了する。
もし、段階S450において累積値が事前に設定された臨界値以上であると判断されると、有効住所候補抽出部340は、読取り住所が有効住所候補であると判断し、読取り住所が有効住所貯蔵部380の有効住所DBに存在する有効住所であるかどうかを判断する(S480)。
もし、段階S480において読取り住所が有効住所貯蔵部380の有効住所DBに存在しているが、有効住所ではないと判断されると、有効住所候補抽出部340は有効住所を自動的に有効住所貯蔵部380の有効住所DBに貯蔵する自動追加モード状態であるかどうかを判断する(S491)。
もし、段階S491において自動追加モード状態でないと判断されると、有効住所検証部350は、有効住所候補抽出部360で有効住所候補として判断された有効住所候補と、住所映像供給部310で入力された住所映像をビデオ画面に出力し(S493b)、住所管理者から有効住所候補と住所映像の住所との一致有無に対する情報の入力を受ける(S493c)。この時、段階S493とS493bとの間に、住所管理者の手作業効率性を高めるために住所累積頻度に応じて有効住所候補を整列させる段階(S493a)を追加することができる。
次いで、有効住所検証部350は、住所管理者から入力を受けた情報を確認して、有効住所候補と住所映像の住所とが一致するかどうかを判断する(S494)。
もし、段階S494において有効住所候補と住所映像の住所とが一致すると判断されると、有効住所検証部350は、有効住所貯蔵部380の有効住所DBに有効住所候補を追加(S495)して段階S460を行う。
もし、段階S494において有効住所候補と住所映像の住所とが一致しないと判断されると、読取り結果貯蔵部330の貯蔵された有効住所候補に相当する読取り住所の累積値を補正(S496)して段階S460を行う。この時、有効住所候補と住所映像の住所とが一致しないので、例えば、有効住所候補抽出部340は、有効住所候補に相当する住所の累積値から「1」を引く。
もし、段階S491において自動追加モード状態であると判断されると、有効住所検証部350は、有効住所候補抽出部360で有効住所候補として判断された有効住所候補が有効住所貯蔵部380の有効住所DBに存在するかどうかを判断する(S492)。
もし、段階S492において有効住所候補が有効住所貯蔵部380の有効住所DBに存在すると判断されると段階S460を行い、段階S492において有効住所候補が有効住所貯蔵部380の有効住所DBに存在しないと判断されると段階S495を行う。
次に、オフライン有効住所データベース追加方法について説明する。
図6は、本発明の第2実施例によるオフライン有効住所DB構築する方法において、読取り結果を貯蔵する過程を示す流れ図であり、図7は、本発明の第2実施例によるオフライン有効住所DB構築する方法において、有効住所DBに有効住所候補を追加する過程を示す流れ図であり、図8は、本発明の第2実施例によるオフライン有効住所DB構築する方法において、有効住所DBから非有効住所候補を削除する過程を示す流れ図である。
以下、図6を参照して、本発明の第2実施例によるオフライン有効住所DBを構築する方法において、読取り結果を貯蔵する過程について説明する。
まず、住所映像供給部310が郵便物に記載された住所情報をスキャンした住所映像を生成して、住所読取り部320に入力すると(S610)、住所読取り部320は、入力された住所映像から住所を読み取り(S620)、読取り結果貯蔵部330に読み取った住所の読取り住所を貯蔵する(S630)。この時、読取り結果貯蔵部330には住所読取り部320で読み取った複数の読取り住所が貯蔵され、それぞれの読取り住所別に累積した回数の累積値も共に貯蔵される。
次いで、住所映像供給部310は、新たな郵便物がスキャンされて新たな住所映像が入力されるかどうかを判断し(S640)、新たな郵便物の住所映像が入力受信されないとこの過程を終了する。この時、住所映像供給部310は、次の郵便物の住所映像が入力されるとこの過程を継続して繰り返す。
以下、図7を参照して、本発明の第2実施例によるオフライン有効住所DBを構築する方法において、有効住所DBに有効住所候補を追加する過程について説明する。
まず、読取り結果貯蔵部330で事前に設定された時間が経過したり、住所映像から読み取った読取り住所が事前に設定された個数以上であったりすると、有効住所抽出部340は、読取り結果貯蔵部330に貯蔵された住所読取り結果をロードし(S710)、読取り住所別累積値を分析する(S720)。
次いで、有効住所候補抽出部340は、読取り住所の累積値が事前に設定された臨界値以上で、有効住所貯蔵部380の有効住所DBに存在しない読取り住所を選別する(S730)。この時、選別された読取り住所は有効住所候補となる。
次いで、有効住所検証部350は、有効住所候補抽出部340で選別された複数の有効住所候補のうちの1つの有効住所候補を選択し(S740)、有効住所候補を自動的に有効住所DBに追加する自動追加モード状態であるかどうかを判断する(S750)。
もし、段階S750において自動追加モード状態であると判断されると、有効住所検証部350は、有効住所候補を有効住所貯蔵部380の有効住所DBに貯蔵し(S760)、残った有効住所候補が存在するかどうかを判断する(S770)。
もし、段階S770において残った有効住所候補が存在すると判断されると、段階S740を行う。
もし、段階S750において自動追加モード状態でないと判断されると、有効住所検証部350は、住所管理者に住所映像と有効住所候補をビデオ画面に出力し、住所管理者から検証結果の入力を受ける(S780)。
次いで、有効住所検証部350は、住所管理者から入力を受けた検証結果を確認して、有効住所候補と住所映像の住所とが一致するかどうかを判断する(S790)。
もし、段階S790において有効住所候補と住所映像の住所とが一致すると判断されると段階S760を行い、段階S790において有効住所候補と住所映像の住所とが一致しないと判断されると段階S770を行う。
以下、図8を参照して、本発明の第2実施例によるオフライン有効住所DB構築する方法において、有効住所DBから非有効住所候補を削除する過程について説明する。
まず、読取り結果貯蔵部330で事前に設定された時間が経過したり、住所映像を読み取った読取り住所が事前に設定された個数以上であったりすると、非有効住所抽出部360は、読取り結果貯蔵部330に貯蔵された住所読取り結果をロードし(S810)、読取り住所別累積値を分析する(S820)。
次いで、非有効住所候補抽出部360は、読取り住所の累積値が事前に設定された臨界値未満で、有効住所貯蔵部380の有効住所DBに存在する読取り住所を選別する(S830)。この時、選別された読取り住所は非有効住所候補となる。
次いで、非有効住所検証部370は、非有効住所候補抽出部360で選別された複数の非有効住所候補のうちの1つの非有効住所候補を選択し(S840)、自動的に非有効住所候補を有効住所DBから削除する自動削除モード状態であるかどうかを判断する(S850)。
もし、段階S850において自動削除モード状態であると判断されると、非有効住所検証部370は、非有効住所候補を有効住所貯蔵部380の有効住所DBから削除し(S860)、残った非有効住所候補が存在するかどうかを判断する(S870)。
もし、段階S870において残った非有効住所候補が存在すると判断されると段階S840を行う。
もし、段階S850において自動削除モード状態でないと判断されると、非有効住所検証部370は、住所管理者に住所映像と非有効住所候補をビデオ画面に出力し、住所管理者から検証結果の入力を受ける(S880)。
次いで、非有効住所検証部370は、住所管理者から入力を受けた検証結果を確認して、非有効住所候補と住所映像の住所とが一致するかどうかを判断する(S890)。
もし、段階S890において非有効住所候補と住所映像の住所とが一致すると判断されると段階S860を行い、段階S890において非有効住所候補と住所映像の住所とが一致しないと判断されると段階S870を行う。
以上、本発明の実施例について詳細に説明したが、本発明の権利範囲はこれに限定されず、特許請求の範囲で定義している本発明の基本概念を利用した当業者の多用な変形及び改良形態もまた本発明の権利範囲に属する。
本発明の第1実施例による有効住所DB構築装置の構成を概略的に示す図面である。 本発明の第1実施例による有効住所DBの構築過程を示す流れ図である。 本発明の第2実施例による有効住所DB構築装置の構成を概略的に示す図面である。 本発明の第2実施例によるオンライン実時間住所DBを構築する過程を示す流れ図である。 本発明の第2実施例によるオンライン実時間住所DBを構築する過程の段階S493の詳細過程を示す図面である。 本発明の第2実施例によるオフライン有効住所DBを構築する方法において読取り結果を貯蔵する過程を示す流れ図である。 本発明の第2実施例によるオフライン有効住所DBを構築する方法において有効住所DBに有効住所候補を追加する過程を示す流れ図である。 本発明の第2実施例によるオフライン有効住所DBを構築する方法において有効住所DBから非有効住所候補を削除する過程を示す流れ図である。
符号の説明
100 有効住所DB構築装置
110 住所映像供給部
120 住所読取り部
130 読取り結果貯蔵部
140 有効住所抽出部
180 有効住所貯蔵部
300 有効住所DB構築装置
310 住所映像供給部
320 住所読取り部
330 読取り結果貯蔵部
340 有効住所候補抽出部
350 有効住所検証部
360 非有効住所候補抽出部
370 非有効住所検証部
380 有効住所貯蔵部

Claims (19)

  1. 住所情報が含まれた住所映像を利用して住所DBを構築する装置において、
    前記住所映像から住所を読み取る住所読取り部、
    前記住所読取り部で読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値とを貯蔵する読取り結果貯蔵部、
    実在する住所の有効住所が含まれた有効住所DBを貯蔵する有効住所貯蔵部、及び、
    前記読取り結果貯蔵部からロードした前記読取り住所の累積値が事前に設定された臨界値以上であるかどうかによって、前記読取り住所を前記有効住所貯蔵部に貯蔵する有効住所抽出部を含むことを特徴とする住所DB構築装置。
  2. 前記有効住所抽出部は、
    前記読取り住所の累積値が、事前に設定された臨界値以上である場合に、前記読取り住所を前記有効住所として判断して、前記読取り住所を前記有効住所貯蔵部に貯蔵することを特徴とする請求項1に記載の住所DB構築装置。
  3. 前記有効住所抽出部は、
    前記読取り住所の累積値が、事前に設定された臨界値以上であり、前記有効住所貯蔵部の前記有効住所DBに前記読取り住所と一致する住所がない場合に、前記読取り住所を前記有効住所貯蔵部に貯蔵することを特徴とする請求項2に記載の住所DB構築装置。
  4. 住所情報が含まれた住所映像を利用して住所DBを構築する方法において、
    a)前記住所映像から読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値とを貯蔵する段階、
    b)前記読取り住所の累積値が事前に設定された臨界値以上であるかどうかを判断する段階、及び、
    c)前記読取り住所の累積値が事前に設定された臨界値以上である場合に、前記読取り住所を、実在する住所が貯蔵される有効住所DBに貯蔵する段階を含むことを特徴とする住所DB構築方法。
  5. 前記段階b)において、
    前記読取り住所の累積値が、事前に設定された臨界値以上であり、前記有効住所DBに前記読取り住所と一致する住所がない場合に、前記読取り住所を前記有効住所DBに貯蔵することを特徴とする請求項4に記載の住所DB構築方法。
  6. 住所情報が含まれた住所映像を利用して住所DBを構築する装置において、
    前記住所映像から住所を読み取る住所読取り部、
    前記住所読取り部で読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値とを貯蔵する読取り結果貯蔵部、
    実在する住所である有効住所が含まれた有効住所DBを貯蔵する有効住所貯蔵部、
    前記読取り結果貯蔵部からロードした前記読取り住所の累積値が、事前に設定された臨界値以上であるかどうかによって前記読取り住所を有効住所候補として設定する有効住所候補抽出部、及び、
    前記住所映像と前記有効住所候補を出力し、住所管理者から入力され、前記住所映像の住所と前記有効住所候補との一致有無を示す情報によって、前記有効住所候補を前記有効住所貯蔵部に貯蔵する有効住所検証部を含むことを特徴とする住所DB構築装置。
  7. 前記有効住所候補抽出部は、
    前記読取り住所の累積値が、事前に設定された臨界値以上であり、前記読取り住所が前記有効住所貯蔵部の前記有効住所DBに存在しない場合に、前記読取り住所を前記有効住所候補として設定することを特徴とする請求項6に記載の住所DB構築装置。
  8. 前記有効住所検証部は、
    前記住所管理者から前記住所映像の住所と前記有効住所候補とが一致するという情報が入力されると、前記有効住所候補を前記有効住所貯蔵部に貯蔵することを特徴とする請求項7に記載の住所DB構築装置。
  9. 前記有効住所検証部は、
    前記住所管理者から前記住所映像の住所と前記有効住所候補とが不一致であるという情報が入力されると、前記読取り結果貯蔵部に貯蔵された前記有効住所候補の累積値を補正することを特徴とする請求項8に記載の住所DB構築装置。
  10. 前記有効住所候補抽出部は、
    前記読取り結果貯蔵部からロードした前記読取り住所の累積値が、事前に設定された臨界値以上であるかどうかを判断しながら、前記住所映像の個数、前記有効住所を有する郵便物の数、前記住所映像当該地域の有効住所DBの集配地点数及び前記有効住所を有する郵便物が出現した集配地点数を考慮して、前記臨界値を調整することを特徴とする請求項6乃至9のいずれかに記載の住所DB構築装置。
  11. 前記有効住所候補抽出部は、
    前記住所映像の個数をN、前記有効住所を有する郵便物の数をE、前記住所映像当該地域の有効住所DBの集配地点数をD、前記有効住所を有する郵便物が出現した集配地点数をPとすると、
    下記の数式
    Figure 2009146393
    または、
    Figure 2009146393
    を利用して、前記臨界値を調整することを特徴とする請求項10に記載の住所DB構築装置。
  12. 前記有効住所候補抽出部は、
    前記読取り住所の累積値が、事前に設定された臨界値未満である場合に、前記読取り住所を実在しない住所の可能性の高い非有効住所候補として設定する非有効住所候補抽出部、及び、
    前記住所映像と前記有効住所候補を出力し、前記住所管理者から前記住所映像の住所と前記有効住所候補とが不一致であるという情報が入力されると、前記非有効住所候補と一致する有効住所を前記有効住所貯蔵部の前記有効住所DBから削除する非有効住所検証部をさらに含むことを特徴とする請求項10に記載の住所DB構築装置。
  13. 住所情報が含まれた住所映像を利用して住所DBを構築する方法において、
    a)前記住所映像から読み取った住所である読取り住所と、前記読取り住所の累積回数を算出した前記読取り住所の累積値を貯蔵する段階、
    b)前記読取り住所の累積値が、事前に設定された臨界値以上である場合に、前記読取り住所を有効住所候補として設定する段階、
    c)前記住所映像と前記有効住所候補を出力して、住所管理者から前記住所映像と前記有効住所候補との一致有無に対する情報の入力を受ける段階、及び、
    d)前記入力を受けた一致有無に対する情報によって、前記有効住所候補を、実在する住所が貯蔵される有効住所DBに貯蔵する段階を含む住所DB構築方法。
  14. 前記段階b)において、
    前記読取り住所の累積値が、事前に設定された臨界値以上であり、前記読取り住所が前記有効住所DBに存在しない場合に、前記読取り住所を前記有効住所候補として設定することを特徴とする請求項13に記載の住所DB構築方法。
  15. 前記段階d)において、
    前記住所管理者から、前記住所映像の住所と前記有効住所候補とが一致するという情報が入力されると、前記有効住所候補を前記有効住所DBに貯蔵することを特徴とする請求項14に記載の住所DB構築方法。
  16. 前記段階d)において、
    前記住所管理者から、前記住所映像の住所と前記有効住所候補とが不一致であるという情報が入力されると、前記有効住所候補の累積値を補正することを特徴とする請求項15に記載の住所DB構築方法。
  17. 前記段階b)において、
    前記読取り住所の累積値が、事前に設定された臨界値未満であり、前記読取り住所が前記有効住所DBに存在する場合に、前記読取り住所を非有効住所候補として設定することを特徴とする請求項13に記載の住所DB構築方法。
  18. 前記段階b)を行いながら、前記住所映像の個数、前記有効住所を有する郵便物の数、前記住所映像当該地域の有効住所DBの集配地点数及び前記有効住所を有する郵便物が出現した集配地点数を考慮して、前記臨界値を調整することを特徴とする請求項17に記載の住所DB構築方法。
  19. 前記住所映像の個数をN、前記有効住所を有する郵便物の数をE、前記住所映像当該地域の有効住所DBの集配地点数をD、前記有効住所を有する郵便物が出現した集配地点数をPとすると、
    下記の数式
    Figure 2009146393
    または、
    Figure 2009146393
    を利用して、前記臨界値を調整することを特徴とする請求項18に記載の住所DB構築方法。
JP2008291276A 2007-12-13 2008-11-13 住所db構築装置及びその方法 Expired - Fee Related JP4847505B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070130132A KR100926565B1 (ko) 2007-12-13 2007-12-13 주소 데이터베이스 구축 장치 및 그 방법
KR10-2007-0130132 2007-12-13

Publications (2)

Publication Number Publication Date
JP2009146393A true JP2009146393A (ja) 2009-07-02
JP4847505B2 JP4847505B2 (ja) 2011-12-28

Family

ID=40754636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008291276A Expired - Fee Related JP4847505B2 (ja) 2007-12-13 2008-11-13 住所db構築装置及びその方法

Country Status (4)

Country Link
US (1) US8099443B2 (ja)
JP (1) JP4847505B2 (ja)
KR (1) KR100926565B1 (ja)
CN (1) CN101458702B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2367124A1 (en) 2010-03-17 2011-09-21 Kabushiki Kaisha Toshiba Address database update apparatus and address database update method
JP2015170037A (ja) * 2014-03-05 2015-09-28 株式会社東芝 住所データベース構築装置、住所データベース構築システム、および住所データベース構築方法

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2259210A2 (de) * 2009-06-05 2010-12-08 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Analyse einer Datenbank
JP5390440B2 (ja) * 2010-03-17 2014-01-15 株式会社東芝 集中情報処理装置及び集中情報処理システム
US8526743B1 (en) 2010-11-01 2013-09-03 Raf Technology, Inc. Defined data patterns for object handling
CN102024024B (zh) * 2010-11-10 2013-07-10 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN101996247B (zh) * 2010-11-10 2013-02-20 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
US9443298B2 (en) 2012-03-02 2016-09-13 Authentect, Inc. Digital fingerprinting object authentication and anti-counterfeiting system
US8774455B2 (en) 2011-03-02 2014-07-08 Raf Technology, Inc. Document fingerprinting
US9152862B2 (en) 2011-09-15 2015-10-06 Raf Technology, Inc. Object identification and inventory management
JP2015176241A (ja) * 2014-03-13 2015-10-05 株式会社東芝 データベース管理装置、および住所認識装置
US10572883B2 (en) 2016-02-19 2020-02-25 Alitheon, Inc. Preserving a level of confidence of authenticity of an object
US10867301B2 (en) 2016-04-18 2020-12-15 Alitheon, Inc. Authentication-triggered processes
US10614302B2 (en) 2016-05-26 2020-04-07 Alitheon, Inc. Controlled authentication of physical objects
US10740767B2 (en) 2016-06-28 2020-08-11 Alitheon, Inc. Centralized databases storing digital fingerprints of objects for collaborative authentication
US10915612B2 (en) 2016-07-05 2021-02-09 Alitheon, Inc. Authenticated production
US10534782B1 (en) 2016-08-09 2020-01-14 American Express Travel Related Services Company, Inc. Systems and methods for name matching
US11176180B1 (en) * 2016-08-09 2021-11-16 American Express Travel Related Services Company, Inc. Systems and methods for address matching
US10902540B2 (en) 2016-08-12 2021-01-26 Alitheon, Inc. Event-driven authentication of physical objects
US10839528B2 (en) 2016-08-19 2020-11-17 Alitheon, Inc. Authentication-based tracking
US11055653B2 (en) * 2017-03-06 2021-07-06 United States Postal Service System and method of providing informed delivery items using a hybrid-digital mailbox
EP3435287A3 (en) 2017-07-25 2019-05-01 Alitheon, Inc. Model-based digital fingerprinting
EP3514715A1 (en) 2018-01-22 2019-07-24 Alitheon, Inc. Secure digital fingerprint key object database
CN109325014A (zh) * 2018-08-23 2019-02-12 北京信安世纪科技股份有限公司 一种关系数据库建库完整性效验方法及装置
CN109655762B (zh) * 2019-01-09 2024-03-22 安徽省航嘉智源科技有限公司 电池管理单元的地址标定***和方法
US10963670B2 (en) 2019-02-06 2021-03-30 Alitheon, Inc. Object change detection and measurement using digital fingerprints
EP3734506A1 (en) 2019-05-02 2020-11-04 Alitheon, Inc. Automated authentication region localization and capture
EP3736717A1 (en) 2019-05-10 2020-11-11 Alitheon, Inc. Loop chain digital fingerprint method and system
US11238146B2 (en) 2019-10-17 2022-02-01 Alitheon, Inc. Securing composite objects using digital fingerprints
US11934379B2 (en) * 2019-12-20 2024-03-19 Lob.com, Inc. Method and system for address verification
EP3859603A1 (en) 2020-01-28 2021-08-04 Alitheon, Inc. Depth-based digital fingerprinting
EP3885982A3 (en) 2020-03-23 2021-12-22 Alitheon, Inc. Hand biometrics system and method using digital fingerprints
US11568683B2 (en) 2020-03-23 2023-01-31 Alitheon, Inc. Facial biometrics system and method using digital fingerprints
EP3929806A3 (en) 2020-04-06 2022-03-09 Alitheon, Inc. Local encoding of intrinsic authentication data
US11663849B1 (en) 2020-04-23 2023-05-30 Alitheon, Inc. Transform pyramiding for fingerprint matching system and method
EP3916631A1 (en) 2020-05-28 2021-12-01 Alitheon, Inc. Irreversible digital fingerprints for preserving object security
EP3926496A1 (en) 2020-06-17 2021-12-22 Alitheon, Inc. Asset-backed digital security tokens

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10327185A (ja) * 1997-05-27 1998-12-08 Tec Corp ファクシミリ型電子メール装置
JP2002352189A (ja) * 2001-05-30 2002-12-06 Toshiba Corp 配達原簿情報入力システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742769A (en) * 1996-05-06 1998-04-21 Banyan Systems, Inc. Directory with options for access to and display of email addresses
US5991369A (en) * 1997-06-06 1999-11-23 Nortel Networks Corporation System and method for message delivery for non-published directory numbers to voice mail boxes
EP0889418A3 (en) * 1997-06-30 1999-08-18 Sun Microsystems, Inc. Abstract URL resolution via relocation service
ES2202151T3 (es) * 1999-07-05 2004-04-01 Ptt Post Holdings B.V. Instalacion y metodo para actualizar una base de datos de direcciones con registros dedirecciones grabadas.
CA2555220A1 (en) * 2003-03-28 2004-10-14 Dun & Bradstreet, Inc. System and method for data cleansing
JP2007004584A (ja) * 2005-06-24 2007-01-11 Toshiba Corp 情報処理装置
JP4706379B2 (ja) 2005-08-04 2011-06-22 日本電気株式会社 住所認識装置
KR100771198B1 (ko) * 2005-09-12 2007-10-29 (주)와이즈그램 영상 데이터를 전자 액자로 전송하는 방법 및 그 장치
US20090055206A1 (en) * 2007-08-24 2009-02-26 Bowe Bell + Howell Company Method and system for performing address resolution processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10327185A (ja) * 1997-05-27 1998-12-08 Tec Corp ファクシミリ型電子メール装置
JP2002352189A (ja) * 2001-05-30 2002-12-06 Toshiba Corp 配達原簿情報入力システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2367124A1 (en) 2010-03-17 2011-09-21 Kabushiki Kaisha Toshiba Address database update apparatus and address database update method
JP2015170037A (ja) * 2014-03-05 2015-09-28 株式会社東芝 住所データベース構築装置、住所データベース構築システム、および住所データベース構築方法

Also Published As

Publication number Publication date
KR20090062714A (ko) 2009-06-17
US20090157733A1 (en) 2009-06-18
CN101458702B (zh) 2012-05-23
JP4847505B2 (ja) 2011-12-28
CN101458702A (zh) 2009-06-17
US8099443B2 (en) 2012-01-17
KR100926565B1 (ko) 2009-11-12

Similar Documents

Publication Publication Date Title
JP4847505B2 (ja) 住所db構築装置及びその方法
JP6938228B2 (ja) 計算機、文書識別方法、及びシステム
US10783366B2 (en) Computer and document identification method
Guo et al. Eaten: Entity-aware attention for single shot visual text extraction
US8108764B2 (en) Document recognition using static and variable strings to create a document signature
JP2003242171A (ja) 文書の検索方法
CN110276236B (zh) 计算机及模板管理方法
CN103559880B (zh) 语音输入***和方法
CN113766314B (zh) 视频切分方法、装置、设备、***及存储介质
CN116362210B (zh) 一种基于aigc技术的热点资讯生成编辑***
CN111050191B (zh) 一种视频生成方法、装置、计算机设备和存储介质
US20110229018A1 (en) Centralized information processing apparatus and centralized information processing system
CN102227723B (zh) 辅助误译的检测的装置及方法
JP2012198684A (ja) 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
US10438097B2 (en) Recognition device, recognition method, and computer program product
CN109858980B (zh) 基于开源ocr上的高速扫描增值税***勾选认证***及方法
CN111898433A (zh) 一种纸质票据数字化方法和装置
JP6174466B2 (ja) 帳票認識装置、帳票認識方法、及びプログラム
CN110688998A (zh) 票据识别方法及装置
US20190220388A1 (en) Boundary search test support device and boundary search test support method
CN110634480A (zh) 语音对话***与模型创建装置及其方法
US20210264218A1 (en) Character recognition system and method
CN111651960B (zh) 一种从合同简体迁移到繁体的光学字符联合训练及识别方法
JP2009146245A (ja) 画像照合方法及び画像照合装置並びに画像照合プログラム
JP2021033743A (ja) 情報処理装置、文書識別方法、及び情報処理システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111013

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees