JP2005284503A - 紙葉類認識装置 - Google Patents

紙葉類認識装置 Download PDF

Info

Publication number
JP2005284503A
JP2005284503A JP2004094993A JP2004094993A JP2005284503A JP 2005284503 A JP2005284503 A JP 2005284503A JP 2004094993 A JP2004094993 A JP 2004094993A JP 2004094993 A JP2004094993 A JP 2004094993A JP 2005284503 A JP2005284503 A JP 2005284503A
Authority
JP
Japan
Prior art keywords
image
image area
detection
detected
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004094993A
Other languages
English (en)
Inventor
Toshiyuki Tanaka
利之 田中
Tomoyuki Hamamura
倫行 浜村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004094993A priority Critical patent/JP2005284503A/ja
Publication of JP2005284503A publication Critical patent/JP2005284503A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 スキャナ部と認識部を通信回線で接続し、スキャナ部で読み取った原画像データから圧縮画像と2値画像を生成し、これらの画像情報を認識部に送信することによって画像の検出切り出し処理が可能な紙葉類認識装置を提供する。
【解決手段】 スキャナ部11で読み取った読取画像からJPEG画像及び2値画像を生成する。これらの画像データを認識部15に送信し文字の検出切り出し処理を行う。この検出切り出し処理は当該JPEG画像から2値画像を生成して画像領域の検出切り出しを行う(処理A、S2)。また、受信した2値画像から画像領域の検出切り出しを行う(処理B、S3)。これら処理A及び処理Bの処理結果を比較して共通の画像領域が検出されたとき、この検出された当該画像領域を画像領域候補とする。
【選択図】 図8

Description

本発明は、紙葉類に記載されている配達区分先などの画像情報から圧縮画像及び2値画像を生成し、これらの画像情報を認識部に送信し、当該画像情報から郵便番号及び住所などの画像領域を検出切り出しする紙葉類認識装置に関する。
例えば、郵便物など紙葉類を区分する装置では、紙葉類に記載されている配達先の住所、氏名、郵便番号をスキャナ部で撮影し、この撮影したデータを認識する認識手段として認識部が用いられ、その認識結果に基づいて配達先を区分する区分処理を行う紙葉類読取区分機が知られている。
この紙葉類読取区分機において、スキャナ部と認識部との距離が近い場合のデータ伝送にはSCSI(Small Computer System Interface)、LVDS(Low Voltage Differrential Signaling)、IEEE1394などが使用されている。しかしながら、これらのインターフェースは通信距離を長くできないという問題があった。従って、スキャナ部と認識部が離れた場所に配置されるリアルタイム文字認識システムなどのように、スキャナ部から取り込んだ原画像データを当該認識部に高速に通信してリアルタイム処理を行うことが必要なシステムでは、高速なデータ伝送が可能で、設置が容易で、かつ設置費用も低価格で実現できる通信方式が検討されてきた。
この問題を解決するために、伝送路としては、構成がシンプルであるため安価に設置でき、かつ高速伝送が可能であるLANを用い、通信データとしては、従来からあるJPEG(Joint Photograph Expert Group)などの圧縮方法で原画像を圧縮したデータ、及びこの原画像を2値化処理したデータを用いる方法が検討されてきた。
また、画像切り出し方法に関しては、文書画像の背景色を特定し、背景領域以外の画素を抽出し、この抽出した画素を統合して連結成分を生成し、その連結成分の形状特徴から領域識別を行う方法が知られている(例えば、特許文献1参照。)。
特開2001−297303号公報 (第1頁、図3)
しかしながら、JPEG画像や2値画像を文字認識に用いる場合、以下のような問題がある。第1に、JPEG圧縮などの画像圧縮方式には、可逆圧縮方式と非可逆圧縮方式とがあるが、可逆圧縮方式は、圧縮率が小さく通信データ量が小さくならないという問題がある。また、非可逆圧縮方式は、圧縮率は大きくとれるが圧縮率を大きくすると、高周波成分が失われるため、画像内の微細情報が失われ、画像がぼけてくるという問題がある。画像をぼけないようにするためには圧縮率を小さくする必要があり、結果的に通信データ量が小さくならないという問題である。
第2に、2値画像を用いる場合、原画像の微細情報は残るが原画像の持っている濃淡情報が失われるという問題である。
文字認識処理において画像内に含まれる濃淡情報は、画像内から認識対象を検出する検出切り出し処理において重要な情報であり、微細情報は、文字を認識する文字認識処理において重要な情報である。そのため、高精度の文字認識処理を行うためには濃淡情報及び微細情報は必要不可欠である。
本発明は上記問題を解決するためになされたもので、スキャナ部と認識部を通信回線で接続し、スキャナ部で読み取った原画像データから圧縮画像と2値画像を生成し、これらの画像データを認識部に送信することによって画像領域の検出切り出し処理が可能な紙葉類認識装置を提供することを目的とする。
上記目的を達成するために、本発明の紙葉類認識装置は、紙葉類の画像を読み取る読取手段と、この読取手段で読み取られた読取画像からデータを間引く間引き手段と、前記読取画像又は前記データ間引き手段によって生成された間引き画像の何れか一方を圧縮して圧縮画像を生成する圧縮手段と、前記読取画像を2値化して2値画像を生成する2値化手段と、前記圧縮画像及び前記2値画像から文字を検出切り出しする検出切り出し手段と、前記圧縮画像及び前記2値画像を前記検出切り出し手段に通信する通信手段回線とを有することを特徴とする。
本発明によれば、スキャナ部と認識部を通信回線で接続し、スキャナ部で読み取った原画像データから圧縮画像と2値画像とを生成し、これらの画像データを認識部に送信することによって、圧縮画像の濃淡情報と2値画像の微細情報とを用いて画像領域を検出する方法であるので、スキャナ部と認識部が離れた位置に設置された場合であっても紙葉類の画像検出切り出しを行うことができる。
以下、図面を参照して本発明の実施例を説明する。
図1は、本発明の実施例による紙葉類読取区分機の概略構成図である。この紙葉類読取区分機は、郵便物など紙葉類Pの区分先を示す情報(文字情報)を認識して区分する装置で、読取区分機本体1、認識装置3、及びこの認識装置3にて区分先が認識できなかった紙葉類Pの区分先を示す情報を当該紙葉類Pの表示画面に基づいてオペレータが入力するビデオコーディングシステム(コーディング装置)(以下、VCSと称する)2から構成されている。
まず、読取区分機本体1について説明する。図1に示すように、読取区分機本体1は、搬送区分機本体1aを有している。この搬送区分機本体1aには、第1面に区分先を示す情報としての数字や文字などが書き込まれ或いは印刷された複数の紙葉類Pを、この第1面が同一方向を向くように揃えて立位で収容すると共に、これらの紙葉類Pを所定の取出位置へ順次供給する供給部10を備えている。この供給部10には、紙葉類Pを主搬送路17に沿って所定の間隔で一通づつ取り出す取出部(図示しない)が配置されている。
上記供給部10に供給される紙葉類Pには、その第1面に区分先を示す情報に対応した文字のみが記載されたもの以外に、機械コードとして大口の区分先に予め決められているカスタマコードや紙葉類Pの区分先に対応して読取区分機本体1内で決められる局内バーコード、又は認識部15(認識手段)にて区分情報の認識が不能となった紙葉類Pに付与されるIDコードなどが記載されたものがある。なお、これらの各コードは、バーコード化した情報として紙葉類Pの第1面に付与されるものである。
上記供給部10に供給されている紙葉類Pは、一定間隔で取り出されて、一定速度で搬送する主搬送路17により一定の搬送間隔(ピッチ)で搬送される。主搬送路17上を搬送される紙葉類Pは、機械処理が不可能な異物の場合には排除され、機械処理が可能な紙葉類Pのみが搬送される。
主搬送路17上には、スキャナ部(読取手段)11、IDコード読取部12、バーコードプリンタ部13、及び区分部14が設けられている。
上記スキャナ部11は、主搬送路17上の紙葉類Pの区分先を示す情報が記載されている面を読み取り、その読み取った画像をLAN(LAN回線)4を介して認識装置3の画像バッファ19に送信する。画像バッファ19は、受信した当該画像を紙葉Pの読み取りに対応して順次記憶する。そして、この記憶された画像は、区分先を示す情報を認識する認識部15へ順次送信される。なお、この送信処理は後述する制御部16のCPU(記載しない)によってLAN6を介して行われる。
さらに、上記IDコード読取部12は、主搬送路17上を搬送される紙葉類Pの第1面にIDコードあるいは機械コードが付与されている場合に、そのIDコード、あるいは機械コードを読み取るものである。
上記バーコードプリンタ部13は、必要に応じて紙葉類Pの第1面にIDコード、あるいは機械コードを印刷するものである。これは、認識部15により区分情報が認識できた場合に、その区分情報をバーコード化して紙葉類上に機械コードを印刷し、認識部15により区分情報が認識できなかった場合に、IDコードを印刷するものである。
このバーコードプリンタ部13の紙葉類の搬送方向の下流側には、主搬送路17上を搬送されてきた紙葉類Pが区分先に応じて区分される区分部14が設けられている。この区分部14は、複数の段、複数の列に区画された複数の区分ポケットから構成されている。各ポケットは、区分先ごとに対応して設定されており、区分情報あるいは機械コードに基づいて区分された紙葉類Pを各ポケットに順次集積する。また、区分部14には、区分先が認識できなかった紙葉類が集積されるVCS排除ポケット(図示しない)が設けられている。このVCS排除ポケットに集積された紙葉類は、オペレータにより区分先を示す情報がVCS2にて入力された後に、供給部10に再供給されるようになっている。
また、図1に示すように、上記読取区分機本体1の各部は、制御部16により制御される。この制御部16には、供給部10、スキャナ部11、IDコード読取部12、バーコードプリンタ部13、及び区分部14などが接続されている。
次に、スキャナ部11から認識装置3に送信される送信データの説明を行う。スキャナ部11は、紙葉類の区分情報が記載されている第1面を光学的に読み取る(読取手段)。そして、この読み取った読取画像(原画像)の画像データを減らすために例えばJPEG方式で圧縮した(圧縮手段)JPEG画像(圧縮画像)を生成すると共に、この読取画像(原画像)を2値化した(2値化手段)2値画像を生成する。また、スキャナ部11は、このようにして生成されたJPEG画像及び2値画像に当該画像データの付帯情報(後で詳述する)である画像ヘッダを付加し、LAN4を介して認識装置3に送信する。
次に、認識装置3を説明する。認識装置3は、認識部15、画像バッファ19及びリジェクトデータ制御部18を有して構成される。画像バッファ19は、上記スキャナ部11で生成されたJPEG画像、2値画像及び画像ヘッダを受信し、この受信したデータを逐次記憶する。
上記認識部15は、画像バッファ19に順次記憶された上記JPEG画像及び2値画像から区分情報となる郵便番号及び住所を検出切り出しして文字認識を行い、図示しない文字辞書及び住所辞書と比較してマッチング法などによって区分情報の認識を行う。この認識結果は、LAN6を介して制御部16へ送信されるようになっている。さらに、認識部15は、区分先を示す情報が認識できなかった場合、読取画像に付帯するOCR情報、すなわち紙葉類の大きさ、文字の大きさ、文字の向き、区分先を示す情報の表記方法、文字種、認識深度、及びVCS処理が必要な箇所を示す情報などを生成し、上記画像ヘッダに付加し、上記読取画像と共にリジェクトデータ制御部18に送る。
リジェクトデータ制御部18は、認識部15が紙葉類Pの区分情報を認識できなかったとき、上記画像ヘッダ、JPEG画像及び2値画像をLAN5を介してVCS2に送信する制御を行う。
上記制御部16は、主搬送路17上を搬送される紙葉類PにIDコードが付与されていた場合に、そのIDコードにより図示しないデータベースからIDコードに対応する区分先を検索し、その区分先に基づいて紙葉類Pを区分部14に設定した区分先に区分する制御を行う。
次に、VCS2について説明する。図1に示すように、VCS2は、蓄積分配装置20及び複数のビデオコーディング端末(以下、VCDと称する)30から構成される。
上記蓄積分配装置20は、メモリ制御部21、大容量記憶装置22、画像メモリ23、ビデオ分配制御部24、タイミング制御部25、入出力制御部27及び専用認識部28を有して構成される。このように構成された上記蓄積分配装置20は、認識部15で認識できなかった紙葉類Pの画像ヘッダ、JPEG画像及び2値画像をリジェクトデータ制御部18からLAN5を介して受信し、当該紙葉類Pの郵便番号エリア候補及び住所エリア候補の検出切り出しを行う。
上記メモリ制御部21は、読取区分機本体1から送信される認識できなかった紙葉類Pの画像ヘッダ、JPEG画像及び2値画像を受信し、大容量記憶装置22に記憶するものである。
上記大容量記憶装置22は、ハードディスクドライブ(HDD)などで構成され、上記メモリ制御部21の制御に基づいて読取区分機本体1から受信した画像ヘッダ及び圧縮画像を記憶する。この大容量記憶装置22に記憶された画像データは、メモリ制御部21からの送信要求に応じて画像メモリ23上に読み出される。
上記専用認識部(検出手段)28は、この大容量記憶装置22に記憶された画像データのJPEG画像及び2値画像を認識することによって、郵便番号エリア候補及び住所エリア候補を検出する。これらの検出されたエリア候補は、画像ヘッダに付加される。
上記ビデオ分配制御部24は、メモリ制御部21及びタイミング制御部25と接続されている。このビデオ分配制御部24は、各VCD30、・・から送信されてくる分配要求に従って生成される分配要求テーブル(図示しない)の内容に基づいて画像データの送信先(分配先)のVCD30を判断する。すなわち、ビデオ分配制御部24は、分配要求テーブルによりコーディング(区分先の打鍵入力)可能で、画像データの入力待ちとなっているVCD30を判断し、メモリ制御部21を制御することにより各VCD30に画像データを送信する。
VCD30は、蓄積分配装置20から分配される紙葉類Pの上記郵便番号エリア候補の画像及び住所エリア候補の画像を画像表示部(表示手段)33に表示し、この表示された画像に基づいてオペレータが区分先を示す情報を入力することができる。
また、各VCD30・・・で入力されたコーディング情報は、入出力制御部27により受信される。入出力制御部27は、各VCD30・・・から受信したコーディング情報をタイミング制御部25を介して読取区分機本体1の制御部16に送信する。
上記VCD30は、制御部31、記憶部32、表示部33及び入力部34などを有して構成される。制御部31は、各VCD30の全体を制御し、また、蓄積分配装置20からの紙葉類Pに対する画像データを受信し、入力部34による入力結果(コーディング情報)を上記入出力制御部27へ送信する機能を有している。
上記記憶部32は、蓄積分配装置20から供給された紙葉類Pの画像データを記憶する。この記憶部32では、現在(先に)コーディング処理中の画像や次にコーディング処理する画像などの複数の画像データを記憶できるようになっている。
上記表示部33は、蓄積分配装置20から供給された紙葉類PのJPEG画像62を表示する。
次に、上述した画像データの流れを図2を参照して説明する。ここでは、画像データを区別するために符号を付けて説明する。
図2(A)は、スキャナ11が紙葉類Pの画像を読み込んだ読取画像をJPEG圧縮して生成したJPEG画像51、当該読取画像を2値化処理しさらにランレングス符号化処理を行って生成した2値画像52、及び画像ヘッダ55から構成された画像データ60の画像データフォーマットを示す。
認識装置3は、伝送されてきた画像データ60のJPEG画像51及び2値画像52から後述する処理(図8参照)を行い文字情報の検出切り出しを行う。このようにして検出された文字情報の認識を行い郵便番号及び住所などの配達区分先を設定する。このとき、正しく認識できなかった場合は、この認識結果を受信した画像ヘッダ55に付加して画像ヘッダ56を生成し、JPEG画像51及び2値画像52と共に構成された画像データ61をLAN5を介してVCS2の蓄積分配装置20に送信する。図2(B)は、このようにして生成された画像データ61を認識装置3から蓄積分配装置20に送信するときの画像データフォーマットである。
蓄積分配装置20は、JPEG画像及51及び2値画像52を用いて上記郵便番号エリア候補及び住所エリア候補の検出切り出しを行う(図8と同様の処理を行う)。次に、このようにして検出した文字情報の連続性(接続関係)を調べ、この文字情報の紙葉類P上の配置位置から郵便番号エリア候補及び住所エリア候補を設定する。次に、このようにして設定された郵便番号エリア候補及び住所エリア候補に基づくJPEG画像51、及び画像ヘッダ57で構成した画像データ62をVCD30に送信する。図2(C)は、このようにして生成された画像データ62を蓄積分配装置20からVCD30に送信するときの画像データフォーマットである。
次に、図3乃至図6を参照して上記JPEG画像及び2値画像の生成方法を説明する。図3は、JPEG画像及び2値画像の生成方法を説明するブロック図である。図4は、JPEG画像又は2値画像を説明するためにスキャナ11で読み取った読取画像(原画像)の一例である。図5は、図4に示す原画像を1/4間引き(縦、横略半分)JPEG方式で圧縮したJPEG画像の一例である。図6は、図4に示す原画像を2値化した2値画像の一例である。
以下、図3のブロック図を参照して、図4に示す読取画像(原画像)を用いてJPEG圧縮を行った場合のJPEG画像、及び2値化処理を行った場合の2値画像を順に説明する。スキャナ11で読み取られた読取画像(原画像)は、スキャナ信号受信部100で受信されJPEG画像生成及び2値画像生成が同時に行われる。最初にJPEG画像の生成方法を説明する。
スキャナ信号受信部100で受信された図4に示す読取画像(原画像)は、画像メモリ101に記憶される。この画像メモリ101に記憶された読取画像は、本紙葉類読取区分機を設置する国又は地域の紙葉類に記載されている文字の特徴によって、例えば原画像を間引き回路102に入力し縦、横共1/2に間引くことによって1/4に間引いた画像にして用いるか、又は原画像のまま用いるかの何れを用いるかが選択されてJPEG圧縮回路(JPEG圧縮手段)103に入力される。JPEG圧縮回路103は、入力された画像をJPEG方式により圧縮してJPEG画像を生成する。図5は、このようにして図4の原画像から生成されたJPEG画像である。このJPEG画像は、JPEGデータメモリ104に記憶される。
図5は、図に示すように縦、横方向に1/2に間引いてあるため画像の大きさは1/4に圧縮されている。このJPEG画像は、間引いたこととJPEG圧縮したことによって画像内の細かな情報が失われ、かつ、ぼけた画像になっているが、JPEG画像の特徴である画像の濃淡は失われていないことがわかる。
次に、2値画像の生成方法を説明する。上記スキャナ信号受信部100で受信された読取画像(原画像)は適応2値化回路(適応2値化手段)及びヒストグラム生成回路(ヒストグラム生成手段)に入力される。適応2値化回路は、2値化しようとしている画素の周辺画素濃度によって閾値を設定し、この設定された閾値を基に2値化処理を行うハードウェアである(詳細は、後述する。)。そして、この2値化処理の結果は、画像メモリ112に記憶される。一方ヒストグラム生成回路111は、読取画像の濃度ヒストグラムを生成する回路で、このようにして生成されたヒストグラムは、画像メモリ112に記憶される。
上記適応2値化回路で2値化処理された2値画像は、既に2値化処理が終了しているため単純2値化回路113による処理を行わずにランレングス符号化回路(ランレングス符号化手段)114に入力される(詳細は、後述する。)。
一方、ヒストグラム生成回路111で生成されたヒストグラムを用いて閾値が設定された場合は、この閾値を用いて単純2値化回路(単純2値化手段)113によって2値化される。なお、適応2値化手段と単純2値化手段は閾値の設定方法が異なるが共に2値化手段となるもので、何れを使用するかは、使用される紙葉類の種類によって設定される。
図6はこのようにして2値化処理された2値画像の一例である。この2値化画像は、画像濃淡情報がなくなるため原画像よりデータ容量が小さくなるが、鱗模様内にある「43435KAWASAKI」という文字と鱗模様が同一色になり原画像より鱗が強調されて表現される。
ここで、図7(A)を参照して上記適応2値化回路113の動作を説明する。適応2値化回路113は、画像を構成する画素に注目し、注目画素及びその近傍の画素との関係から2値化を行う方法である。例えば、注目画素Nを2値化するための閾値に、この注目画素Nの近傍の画素P1乃至P8の平均濃度を用いる方法である。この方法を用いることによって、例えば紙葉類Pの背景が全体的に汚れてしまった場合、又は色が付いている場合などでも、この汚れと文字を区別して2値化することができる。
次に、図7(B)及び図7(C)を参照してランレングス符号化回路の動作を説明する。ランレングス符号化回路は、例えば2値化された”1”、”0”データが図に示すように四角120と三角121の場合、ラインA1乃至ラインA4を左側から右側に図示矢印に沿って走査したときの白画素(画像がない部分)と黒画素(画像がある部分)の画素数を計数し、その計数値によって2値画像を表現する方法である。ただし、ここでは、最初に白画素から始まることを前提としている。
図7(C)にラインA2の場合の変換例を示す。最初の6画素は白で、次の5画素は黒で、次の14画素は白で、次の2画素は黒で、次の13画素は白となっている。これら計数値を順に並べると”6 5 14 2 13”と表現される。同様にラインA1乃至A4ラインに付いて符号化したものを下記(1)乃至(4)に示す。
A1ライン:40・・・・・・・・・・・・・・・(1)
A2ライン:6 5 14 2 13・・・・・・(2)
A3ライン:6 5 12 7 11・・・・・・(3)
A4ライン:21 11 8・・・・・・・・・・(4)
上述したランレングス符号化回路114を用いることによって、2値画像の画像データはさらに圧縮される。しかしながら、可逆符号化方式であるためデータを失うことなく復元可能である。
このようにして符号化されたJPEG画像及び2値画像はデータ読み出し回路115から読み出され、LAN(通信手段)4を介して認識装置3に伝送される。
次に、図8を参照して、認識装置3に送信されてきた上記JPEG画像及び2値画像を用いて検出切り出しを行う方法(検出切り出し手段)を述べる。最初に、当該JPEG画像から2値画像(第1の2値画像)を生成する(S1)。
次に、ステップ1で生成された第1の2値画像を用いて画像領域の検出切り出し処理を行う(第1の画像領域検出切り出し手段)。この処理を処理Aとする(S2)。
次に、認識装置に送信されてきた当該2値画像を用いて画像領域の検出切り出し処理を行う(第2の画像領域検出切り出し手段)。この処理を処理Bとする(S3)。
次に、上記処理A及び処理Bのそれぞれの処理結果を比較する(比較手段)。この比較手段による比較の結果、これら処理A及び処理Bに共通の画像領域が検出された場合(S4のYes)、該当画像領域を画像領域候補として採用する(S5)。検出された当該画像領域情報を文字認識処理(図示しない)へ送信する(S6)。
また、上記処理A及び処理Bのそれぞれの処理結果に共通の画像領域が検出されなかった場合(S4のNo)、処理Bで切り出した画像領域に処理Aの画像領域が複数含まれるかどうかの確認を行う(確認手段)(S7)。
次に、ステップS7の検証の結果、処理Bで切り出した画像領域に処理Aの画像領域が複数含まれる場合(S7のYes)、処理Aの結果を用いて処理Bの画像領域候補から文字検出切り出し処理を行う(S8)。
また、ステップS7の検証の結果、処理Bで切り出した画像領域に処理Aの画像領域が複数含まれない場合(S7のNo)、処理Bで候補となっていないところを処理Aの結果を用いて文字検出切り出し処理を行う(S9)。
紙葉類読取区分機の概略構成図。 画像データを説明する図。 JPEG画像及び2値画像の生成方法を説明するブロック図。 スキャナで読み取った読取画像の一例。 図4に示す読取画像を1/4間引き後JPEG圧縮を行ったJPEG画像。 図4に示す読取画像を2値化処理を行った2値画像。 適応2値化回路及びランレングス符号化回路を説明する図。 検出切り出し処理フローチャート。
符号の説明
1 読取区分機本体
2 ビデオコーディングシステム(VCS)
3 認識装置
4、5、6 LAN
11 スキャナ
14 区分部
15 認識部
18 リジェクトデータ制御部
19 画像バッファ
20 蓄積分配装置
30 ビデオコーディング端末(VCD)
55〜58 画像ヘッダ
51 JPEG画像
52 2値画像
60〜63 画像データフォーマット
100 スキャナ信号受信部
101、112 画像メモリ
102 間引き回路
103 JPEG圧縮回路
110 適応2値化回路
111 ヒストグラム生成回路
113 単純2値化回路
114 ランレングス符号化回路
115 データ読み出し回路

Claims (6)

  1. 紙葉類の画像を読み取る読取手段と、
    この読取手段で読み取られた読取画像からデータを間引く間引き手段と、
    前記読取画像又は前記データ間引き手段によって生成された間引き画像の何れか一方を圧縮して圧縮画像を生成する圧縮手段と、
    前記読取画像を2値化して2値画像を生成する2値化手段と、
    前記圧縮画像及び前記2値画像を認識部へ送信する通信手段と、
    前記認識部に設けられ、前記通信手段によって送信されてきた前記圧縮画像及び前記2値画像から文字を検出切り出す検出切り出し手段と、
    前記認識部に設けられ、前記検出切り出し手段によって切り出された当該紙葉類の文字検出切り出しエリア内の文字を認識する認識手段と、
    を有することを特徴とする紙葉類認識装置。
  2. 前記間引き手段は、
    前記読取画像を縦、横共に略半分に間引いて前記間引き画像を生成する手段であることを特徴とする請求項1記載の紙葉類認識装置。
  3. 前記2値化手段は、
    2値化する前記読取画像を構成する画素の周辺画素濃度から閾値を算出して当該読取画像を2値化して2値画像を生成する適応2値化手段と、
    当該読取画像のヒストグラムを生成するヒストグラム生成手段と、このヒストグラム生成手段で生成した当該読取画像のヒストグラムから閾値を設定して2値化する単純2値化手段と、
    前記適応2値化手段と、前記単純2値化手段の何れか一方の手段を選択的に使用して生成された2値画像を圧縮するランレングス符号化手段と
    を有することを特徴とする紙葉類認識装置。
  4. 前記検出切り出し手段は、
    前記圧縮画像を2値化して生成した第1の2値画像から画像領域を検出する第1の画像領域検出切り出し手段と、
    前記2値化手段によって2値化された2値画像から画像領域を検出する第2の画像領域検出切り出し手段と、
    前記第1の画像領域検出切り出し手段と、前記第2の画像領域検出切り出し手段の処理結果を比較する比較手段と
    を有しこの比較手段による比較の結果、前記第1の画像領域検出切り出し手段と前記第2の画像領域検出切り出し手段の処理結果に共通の画像領域が存在するとき、当該共通の画像領域を画像領域候補とすることを特徴とする請求項1記載の紙葉類認識装置。
  5. 前記検出切り出し手段はさらに、
    前記第1の画像領域検出切り出し手段と、前記第2の画像領域検出切り出し手段の処理結果に共通の画像領域が存在しないとき、前記第2の画像領域検出切り出し手段で検出された画像領域に前記第1の画像領域検出切り出し手段で検出されたの画像領域が複数含まれるかどうかを確認する確認手段を有し、
    この確認手段による確認の結果、前記第2の領域検出切り出し処理で検出された画像領域に前記第1の画像領域検出切り出し手段で検出された画像領域が複数含まれるとき、前記第1の画像領域検出切り出し手段で検出された画像領域の中から前記第2の画像領域検出切り出し手段で検出された画像領域候補を検出することを特徴とする請求項4記載の紙葉類認識装置。
  6. 前記検出切り出し手段はさらに、
    前記第1の画像領域検出切り出し手段と、前記第2の画像領域検出切り出し手段の処理結果に共通の画像領域が存在しないとき、前記第2の画像領域検出切り出し手段で検出された画像領域に前記第1の画像領域検出切り出し手段で検出されたの画像領域が複数含まれるかどうかを確認する確認手段を有し、
    この確認手段による確認の結果、前記第2の画像領域検出切り出し手段で検出された画像領域に前記第1の画像領域検出切り出し手段で検出された画像領域が含まれないとき、前記第2の画像領域検出切り出し手段で検出された画像領域以外から前記第1の画像領域検出切り出し手段で検出された画像領域候補を検出することを特徴とする請求項4記載の紙葉類認識装置。
JP2004094993A 2004-03-29 2004-03-29 紙葉類認識装置 Pending JP2005284503A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004094993A JP2005284503A (ja) 2004-03-29 2004-03-29 紙葉類認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004094993A JP2005284503A (ja) 2004-03-29 2004-03-29 紙葉類認識装置

Publications (1)

Publication Number Publication Date
JP2005284503A true JP2005284503A (ja) 2005-10-13

Family

ID=35182836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004094993A Pending JP2005284503A (ja) 2004-03-29 2004-03-29 紙葉類認識装置

Country Status (1)

Country Link
JP (1) JP2005284503A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181211A (ja) * 2015-03-25 2016-10-13 日本電気株式会社 ラベル領域検知装置、ラベル領域検知方法、ラベル領域検知プログラム、及びラベル領域検知システム
CN108564035A (zh) * 2018-04-13 2018-09-21 杭州睿琪软件有限公司 识别单据上记载的信息的方法及***
CN112485457A (zh) * 2020-11-18 2021-03-12 天津德祥生物技术有限公司 一种检测结果识别方法
CN116168409A (zh) * 2023-04-20 2023-05-26 广东聚智诚科技有限公司 一种应用于标准、专利分析报告自动生成***

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181211A (ja) * 2015-03-25 2016-10-13 日本電気株式会社 ラベル領域検知装置、ラベル領域検知方法、ラベル領域検知プログラム、及びラベル領域検知システム
CN108564035A (zh) * 2018-04-13 2018-09-21 杭州睿琪软件有限公司 识别单据上记载的信息的方法及***
CN108564035B (zh) * 2018-04-13 2020-09-25 杭州睿琪软件有限公司 识别单据上记载的信息的方法及***
US10977513B2 (en) 2018-04-13 2021-04-13 Hangzhou Glorify Software Limited Method, system and computer readable storage medium for identifying information carried on sheet
CN112485457A (zh) * 2020-11-18 2021-03-12 天津德祥生物技术有限公司 一种检测结果识别方法
CN112485457B (zh) * 2020-11-18 2023-04-18 天津德祥生物技术股份有限公司 一种检测结果识别方法
CN116168409A (zh) * 2023-04-20 2023-05-26 广东聚智诚科技有限公司 一种应用于标准、专利分析报告自动生成***
CN116168409B (zh) * 2023-04-20 2023-07-21 广东聚智诚科技有限公司 一种应用于标准、专利分析报告自动生成***

Similar Documents

Publication Publication Date Title
CN103914858B (zh) 文档图像压缩方法及其在文档认证中的应用
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
US8462394B2 (en) Document type classification for scanned bitmaps
US6959121B2 (en) Document image processing device, document image processing method, and memory medium
EP0113410A2 (en) Image processors
KR101081086B1 (ko) 바코드 처리 장치 및 바코드 처리 방법
JPH0157394B2 (ja)
EP3252669A2 (en) Method and device for classifying scanned documents
JP3388867B2 (ja) 宛名領域検出装置および宛名領域検出方法
JP2018171579A (ja) 宛先認識装置、小包自動区分システム、宛先認識方法及びプログラム
JP2005284503A (ja) 紙葉類認識装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2002032711A (ja) 帳票認識装置および帳票認識方法
JP3710866B2 (ja) 郵便物区分装置、郵便物処理システム及び郵便物処理方法
JP3105918B2 (ja) 文字認識装置、および文字認識方法
JP2005288345A (ja) 紙葉類読取区分機
JP3715473B2 (ja) 宛名読取装置
JP3160347B2 (ja) 郵便物の宛名読取装置
JP2002086073A (ja) 区分機システムおよび区分方法
JPS5949671A (ja) 光学的文字読取装置
JPH04200677A (ja) 郵便物宛名自動読取区分機および郵便物宛名自動読取方法
JPH07171505A (ja) 郵便物宛名コード読取装置
JPH08164365A (ja) 宛名読取装置
JP2571236B2 (ja) 文字切出し識別判定方法
JPH10174934A (ja) 未符号化情報のあるカスタマーバーコードを認識する郵便物処理装置