JP2005115573A - 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 - Google Patents
帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 Download PDFInfo
- Publication number
- JP2005115573A JP2005115573A JP2003347688A JP2003347688A JP2005115573A JP 2005115573 A JP2005115573 A JP 2005115573A JP 2003347688 A JP2003347688 A JP 2003347688A JP 2003347688 A JP2003347688 A JP 2003347688A JP 2005115573 A JP2005115573 A JP 2005115573A
- Authority
- JP
- Japan
- Prior art keywords
- page
- registered
- similarity
- registration
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 50
- 238000011156 evaluation Methods 0.000 abstract description 8
- 238000005192 partition Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Computer Hardware Design (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】 類似度評価対象として登録帳票ID1、ID2が抽出され、登録帳票ID1の重みが1頁目0.3、2頁目0.5、3頁目0.2であり、登録帳票ID2の重みが、1頁目0.1、2頁目0.1、3頁目0.8であり、認識対象の入力帳票との類似度が、1頁目についてID1が98、ID2が85、2頁目についてID1が82、ID2が82、3頁目について、ID1が80、ID2が96だったとする。この場合、登録帳票ID1の類似度は98×0.3+82×0.5+80×0.2=86.4であり、登録帳票ID2の類似度は85×0.1+82×0.1+96×0.8=93.5となる。その結果、ID2の類似度がID1を上回り、ID2の登録帳票が認識結果となる。
【選択図】 図7
Description
本発明はこのような従来の問題点を解決するために創案されたもので、複数頁で構成された帳票を、容易にかつ精度よく認識処理することを目的とする。
図1において、帳票認識装置は、磁気ディスク等の外部記憶装置104およびイメージスキャナ108を備え、帳票の画像データを外部記憶装置104から読み込み、あるいは帳票をイメージスキャナ108で読み取る。
なお必要に応じ、帳票認識に先立ってノイズ除去等の前処理を実行する。
[帳票登録処理]
図2は帳票認識装置に帳票を登録する処理を示す。
[重み修正処理]
ステップS207で実行した、既に登録されている類似帳票の重み修正処理は図4の各ステップによって実行される。
[帳票認識処理]
次に図3のフローチャートを用いて帳票認識処理を説明する。
102・・・ROM
103・・・RAM
104・・・外部記憶装置
105・・・ディスプレイ
106・・・キーボード
107・・・ポインティングデバイス
108・・・スキャナ部
109・・・ネットワークインターフェース
Claims (16)
- 複数ページで構成される帳票画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識装置であって、
前記登録帳票について、各ページの特徴量と重み情報とを登録する登録手段と、
入力された帳票画像の各ページの特徴量と、前記登録手段で登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページ毎の類似度を算出するページ類似度算出手段と、
前記ページ類似度算出手段で算出したページ毎の類似度に対して、前記登録手段で登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出手段と、
前記帳票類似度算出手段で算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定手段と、
を有することを特徴とする帳票認識装置。 - 前記登録手段は、
新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて前記重み情報を算出することを特徴とする請求項1に記載の帳票認識装置。 - 前記登録手段は、
新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて前記重み情報を算出することを特徴とする、請求項1に記載の帳票認識装置。 - 前記登録手段は、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて第1の重み係数情報を決定し、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて第2の重み係数情報を決定し、前記決定された第1の重み係数と第2の重み係数とに基づいて前記重み情報を算出することを特徴とする請求項1に記載の帳票認識装置。
- 前記登録手段は、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて、前記既に登録されている登録帳票の重み情報の更新も行うことを特徴とする請求項3又は4に記載の帳票認識装置。
- 前記ページ類似度算出手段で算出されたページの類似度が、所定値よりも低いと判断された登録帳票に関しては、前記帳票画像との比較対象から外すことを特徴とする請求項1に記載の帳票認識装置。
- 前記決定手段で決定された前記帳票画像に対応する登録帳票のページ数より、前記帳票画像のページ数が多い場合、当該超過した帳票画像のページを次の認識処理対象の帳票画像の少なくとも一部として扱うことを特徴とする請求項1に記載の帳票認識装置。
- 複数ページで構成される帳票画像が、予め登録されている複数の登録帳票のいずれに対応するか認識する帳票認識方法であって、
前記登録帳票について、各ページの特徴量と重み情報とを登録する登録ステップと、
入力された帳票画像の各ページの特徴量と、前記登録ステップで登録された登録帳票の対応するページの特徴量とを比較することによって、各登録帳票についてページごとの類似度を算出するページ類似度算出ステップと、
前記ページ類似度算出ステップで算出したページ毎の類似度に対して、前記登録ステップで登録された各ページの重み情報を用いて重み付けをおこなうことにより、前記帳票画像に対する各登録帳票の類似度を算出する帳票類似度算出ステップと、
前記帳票類似度算出ステップで算出した登録帳票ごとの類似度に基づいて、前記帳票画像に対応する登録帳票を決定する決定ステップと、
を有することを特徴とする帳票認識方法。 - 前記登録ステップは、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて前記重み情報を算出することを特徴とする請求項8に記載の帳票認識方法。
- 前記登録ステップは、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて前記重み情報を算出することを特徴とする請求項8に記載の帳票認識方法。
- 前記登録ステップは、新たな登録帳票を登録する際、該新たな登録帳票の各ページの特徴量に基づいて第1の重み係数情報を決定し、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて第2の重み係数情報を決定し、前記決定された第1の重み係数と第2の重み係数とに基づいて前記重み情報を算出することを特徴とする請求項8に記載の帳票認識方法。
- 前記登録ステップは、該新たな登録帳票の各ページの特徴量と既に登録されている登録帳票の各ページの特徴量とを比較して求めた類似度に基づいて、前記既に登録されている登録帳票の重み情報の更新も行うことを特徴とする請求項10又は11に記載の帳票認識方法。
- 前記ページ類似度算出ステップで算出されたページの類似度が、所定値よりも低いと判断された登録帳票に関しては、前記帳票画像との比較対象から外すことを特徴とする請求項8に記載の帳票認識方法。
- 前記決定ステップで決定された前記帳票画像に対応する登録帳票のページ数より、前記帳票画像のページ数が多い場合、当該超過した帳票画像のページを次の認識処理対象の帳票画像の少なくとも一部として扱うことを特徴とする請求項8に記載の帳票認識方法。
- 請求項8乃至14のいずれかに記載の帳票認識方法の各ステップをコンピュータによって実現させるためのプログラムコードを含むコンピュータ実行可能なプログラム。
- 請求項15に記載のコンピュータ実行可能なプログラムのプログラムコードが格納されたコンピュータ読取可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003347688A JP4154308B2 (ja) | 2003-10-06 | 2003-10-06 | 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 |
US10/950,212 US7450262B2 (en) | 2003-10-06 | 2004-09-23 | Form recognizing apparatus, form recognizing method, program and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003347688A JP4154308B2 (ja) | 2003-10-06 | 2003-10-06 | 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005115573A true JP2005115573A (ja) | 2005-04-28 |
JP4154308B2 JP4154308B2 (ja) | 2008-09-24 |
Family
ID=34386411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003347688A Expired - Fee Related JP4154308B2 (ja) | 2003-10-06 | 2003-10-06 | 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7450262B2 (ja) |
JP (1) | JP4154308B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345305B2 (en) | 2009-06-24 | 2013-01-01 | Fuji Xerox Co., Ltd. | Image-processing device and image-processing method |
JP2019115019A (ja) * | 2017-12-26 | 2019-07-11 | ブラザー工業株式会社 | プログラム |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007257308A (ja) * | 2006-03-23 | 2007-10-04 | Canon Inc | 文書管理装置、文書管理システム、及びその制御方法、プログラム、記憶媒体 |
CN102945342B (zh) * | 2012-09-29 | 2015-08-05 | 北京奇虎科技有限公司 | 进程识别方法、装置和终端设备 |
JP6481957B2 (ja) * | 2014-08-20 | 2019-03-13 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
JP6768537B2 (ja) * | 2017-01-19 | 2020-10-14 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
CN108090433B (zh) * | 2017-12-12 | 2021-02-19 | 厦门集微科技有限公司 | 人脸识别方法及装置、存储介质、处理器 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5784485A (en) * | 1994-08-25 | 1998-07-21 | Xu; Youguang | Method and apparatus for automated pattern recognition |
JPH10269311A (ja) | 1997-03-25 | 1998-10-09 | Oki Electric Ind Co Ltd | 帳票処理単位指定方法 |
JP4074366B2 (ja) * | 1998-02-24 | 2008-04-09 | コニカミノルタビジネステクノロジーズ株式会社 | 画像検索装置及び方法並びに画像検索プログラムを記録した記録媒体 |
US6606402B2 (en) * | 1998-12-18 | 2003-08-12 | Cognex Corporation | System and method for in-line inspection of stencil aperture blockage |
JP4416202B2 (ja) | 1999-03-31 | 2010-02-17 | キヤノン株式会社 | 帳票認識装置、情報システム、及び記憶媒体 |
JP4006239B2 (ja) * | 2002-02-21 | 2007-11-14 | 株式会社日立製作所 | 文書の検索方法および検索システム |
US7319791B1 (en) * | 2003-09-22 | 2008-01-15 | Matrox Electronic Systems, Ltd. | Subtractive primitives used in pattern matching |
-
2003
- 2003-10-06 JP JP2003347688A patent/JP4154308B2/ja not_active Expired - Fee Related
-
2004
- 2004-09-23 US US10/950,212 patent/US7450262B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345305B2 (en) | 2009-06-24 | 2013-01-01 | Fuji Xerox Co., Ltd. | Image-processing device and image-processing method |
JP2019115019A (ja) * | 2017-12-26 | 2019-07-11 | ブラザー工業株式会社 | プログラム |
Also Published As
Publication number | Publication date |
---|---|
US7450262B2 (en) | 2008-11-11 |
US20050073721A1 (en) | 2005-04-07 |
JP4154308B2 (ja) | 2008-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7013182B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP3689455B2 (ja) | 情報処理方法及び装置 | |
US8838657B1 (en) | Document fingerprints using block encoding of text | |
EP1555600A2 (en) | Information processing apparatus and control method therefor | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2006338313A (ja) | 類似画像検索方法,類似画像検索システム,類似画像検索プログラム及び記録媒体 | |
KR102114367B1 (ko) | 객체 영역 추출을 수행하는 인공 신경망을 위한 학습 데이터를 생성하는 방법 및 장치 | |
JP2010146376A (ja) | 画像処理装置及びプログラム | |
JP4154308B2 (ja) | 帳票認識装置、帳票認識方法、プログラムおよび記憶媒体 | |
WO2024012138A1 (zh) | 目标检测模型训练方法、目标检测方法及装置 | |
CN111612004A (zh) | 一种基于语义内容的图像裁剪方法及装置 | |
US6928186B2 (en) | Semantic downscaling and cropping (SEDOC) of digital images | |
CN110689026B (zh) | 一种图像中对象的标注方法、装置及电子设备 | |
JP2004363786A (ja) | 画像処理装置 | |
JP2007316950A (ja) | 画像処理方法及び装置及びプログラム | |
JP2006252562A (ja) | 画像認識方法 | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
CN111967312B (zh) | 识别图片中重要人物的方法和*** | |
JP2005063419A (ja) | 言語識別装置、プログラム及び記録媒体 | |
US7623714B2 (en) | Form recognition system, method, program, and storage medium | |
JP2012226429A (ja) | 画像検索および認識システム | |
CN115311649A (zh) | 一种卡证类别识别方法、装置、电子设备及存储介质 | |
CN115687673B (zh) | 图片归档的方法、装置、电子设备及可读存储介质 | |
JP2008158626A (ja) | テンプレート作成装置,テンプレート作成方法,その方法を実装したテンプレート作成プログラム,そのプログラムを格納した記憶媒体と、テンプレートマッチング装置,テンプレートマッチング方法,その方法を実装したテンプレートマッチングプログラム,そのプログラムを格納した記憶媒体 | |
JPH05314320A (ja) | 認識距離の差と候補順を利用した認識結果の評価方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050613 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080701 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080707 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110711 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120711 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120711 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130711 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |