JP3996579B2 - 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム - Google Patents
機械可読フォームのアクティブ領域を識別するためのフォーム処理システム Download PDFInfo
- Publication number
- JP3996579B2 JP3996579B2 JP2004015005A JP2004015005A JP3996579B2 JP 3996579 B2 JP3996579 B2 JP 3996579B2 JP 2004015005 A JP2004015005 A JP 2004015005A JP 2004015005 A JP2004015005 A JP 2004015005A JP 3996579 B2 JP3996579 B2 JP 3996579B2
- Authority
- JP
- Japan
- Prior art keywords
- landmarks
- landmark
- active area
- machine
- instance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K17/00—Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations
- G06K17/0032—Apparatus for automatic testing and analysing marked record carriers, used for examinations of the multiple choice answer type
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
- Document Processing Apparatus (AREA)
- Image Analysis (AREA)
Description
202 フォーム分析部
203 フォーム解釈部
204 ページレイアウト/ドキュメント作成プログラム
205 作成されたフォーム
206 フォーム制御ファイル
207 作成されたフォームのインスタンス
Claims (1)
- 所定のレジストレーションマークがない機械可読フォームのアクティブ領域を識別するためのフォーム処理システムであって、前記システムは、
機械可読フォームのインスタンスをスキャンしてビットマップ表現を作成するスキャナと、
前記機械可読フォームの前記インスタンスに関連するフォーム制御ファイルを受け取る受け取り回路であって、前記フォーム制御ファイルは前記機械可読フォームのオリジナルランドマークの集合を有し、前記オリジナルランドマークはテキストブロック、グラフィックブロック、水平バー、又は垂直バーを含み、前記フォーム制御ファイルはさらに前記機械可読フォームの各アクティブ領域のオリジナル位置情報を有する、該受け取り回路と、
前記機械可読フォームの前記ビットマップ表現を分析して、テキストブロック、グラフィックブロック、水平バー、又は垂直バーからなるインスタンスランドマークの集合を識別する機能を提供するように適切に適合された第1の処理回路と、
前記オリジナルランドマークの集合の中のランドマークと前記インスタンスランドマークの中のランドマークを所定の空間位置と所定の形状閾値に基づいてマッチして、マッチしたランドマークの対を作成する機能を提供するように適切に適合された第2の処理回路と、
前記マッチしたランドマークの対と処理されるアクティブ領域のオリジナル位置情報とに基づいてオフセットを生成する機能を提供するように適切に適合された第3の処理回路であって、
前記処理されるアクティブ領域に最も近い、ランドマークの第1及び第2の対を識別する回路と、
前記ランドマークの第1及び第2の対が前記処理されるアクティブ領域から所定の距離内であるか否かを判定する回路と、
前記ランドマークの第1及び第2の対が前記処理されるアクティブ領域から所定の距離内であると判定する場合に、前記ランドマークの第1の対の間の距離と前記ランドマークの第2の対の間の距離とを平均することによりオフセットを決定する回路と、
前記ランドマークの第1及び第2の対が前記処理されるアクティブ領域から所定の距離内ではないと判定する場合に、前記ランドマークの第1及び第2の対のオリジナルランドマークと前記ランドマークの第1及び第2の対のインスタンスランドマークとの間のアフィン変換関数を構築することにより前記オフセットを決定し、前記アフィン変換を前記処理されるアクティブ領域に適用する回路と
を有する該第3の処理回路と、
前記処理されるアクティブ領域についてのオリジナル位置情報に前記オフセットを適用する機能を提供するように適切に適合された第4の処理回路と
を有する、システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US42635495A | 1995-04-21 | 1995-04-21 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8090826A Division JPH08305778A (ja) | 1995-04-21 | 1996-04-12 | ユーザの作成したマークの存在を調査するための方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004158036A JP2004158036A (ja) | 2004-06-03 |
JP3996579B2 true JP3996579B2 (ja) | 2007-10-24 |
Family
ID=23690457
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8090826A Withdrawn JPH08305778A (ja) | 1995-04-21 | 1996-04-12 | ユーザの作成したマークの存在を調査するための方法 |
JP2004015005A Expired - Fee Related JP3996579B2 (ja) | 1995-04-21 | 2004-01-23 | 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8090826A Withdrawn JPH08305778A (ja) | 1995-04-21 | 1996-04-12 | ユーザの作成したマークの存在を調査するための方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5748809A (ja) |
EP (1) | EP0738987B1 (ja) |
JP (2) | JPH08305778A (ja) |
DE (1) | DE69633809T2 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6201894B1 (en) * | 1996-01-23 | 2001-03-13 | Canon Kabushiki Kaisha | Method and apparatus for extracting ruled lines or region surrounding ruled lines |
US6236463B1 (en) | 1997-01-17 | 2001-05-22 | Moore U.S.A., Inc. | Generating high speed variable information printed multiple page documents |
CA2286707C (en) * | 1997-05-09 | 2006-06-06 | Neomedia Technologies, Inc. | Method and system for accessing electronic resources via machine-readable data on intelligent documents |
JP3580670B2 (ja) * | 1997-06-10 | 2004-10-27 | 富士通株式会社 | 入力画像を基準画像に対応付ける方法、そのための装置、及びその方法を実現するプログラムを記憶した記憶媒体 |
US6351559B1 (en) * | 1998-12-22 | 2002-02-26 | Matsushita Electric Corporation Of America | User-enclosed region extraction from scanned document images |
US6549935B1 (en) * | 1999-05-25 | 2003-04-15 | Silverbrook Research Pty Ltd | Method of distributing documents having common components to a plurality of destinations |
US7170499B1 (en) * | 1999-05-25 | 2007-01-30 | Silverbrook Research Pty Ltd | Handwritten text capture via interface surface |
US6816274B1 (en) * | 1999-05-25 | 2004-11-09 | Silverbrook Research Pty Ltd | Method and system for composition and delivery of electronic mail |
AUPQ291299A0 (en) * | 1999-09-17 | 1999-10-07 | Silverbrook Research Pty Ltd | A self mapping surface and related applications |
US6640010B2 (en) * | 1999-11-12 | 2003-10-28 | Xerox Corporation | Word-to-word selection on images |
US7149347B1 (en) | 2000-03-02 | 2006-12-12 | Science Applications International Corporation | Machine learning of document templates for data extraction |
US6741738B2 (en) | 2000-03-13 | 2004-05-25 | Tms, Inc. | Method of optical mark recognition |
US6950553B1 (en) * | 2000-03-23 | 2005-09-27 | Cardiff Software, Inc. | Method and system for searching form features for form identification |
US6816630B1 (en) * | 2000-05-22 | 2004-11-09 | Electro-Sensors, Inc. | System and method for creating and processing data forms |
US6832349B1 (en) * | 2001-01-08 | 2004-12-14 | Cardiff Software, Inc. | Remote activation of enhanced functionality features in locally created documents |
DE60204066T2 (de) * | 2001-02-22 | 2006-02-02 | Oce Print Logic Technologies S.A. | Automatische Lokalisierung von Tabellen in Dokumenten |
US6961482B2 (en) * | 2001-03-05 | 2005-11-01 | Ncs Pearson, Inc. | System for archiving electronic images of test question responses |
US6810232B2 (en) * | 2001-03-05 | 2004-10-26 | Ncs Pearson, Inc. | Test processing workflow tracking system |
US7561734B1 (en) | 2002-03-02 | 2009-07-14 | Science Applications International Corporation | Machine learning of document templates for data extraction |
US7142728B2 (en) * | 2002-05-17 | 2006-11-28 | Science Applications International Corporation | Method and system for extracting information from a document |
US20040008212A1 (en) * | 2002-07-11 | 2004-01-15 | Sun Microsystems, Inc., A Delaware Corporation | Reshaping irregularly-shaped images for improved compression |
US9224040B2 (en) | 2003-03-28 | 2015-12-29 | Abbyy Development Llc | Method for object recognition and describing structure of graphical objects |
RU2003108434A (ru) * | 2003-03-28 | 2004-09-27 | "Аби Софтвер Лтд." (CY) | Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата |
US9015573B2 (en) | 2003-03-28 | 2015-04-21 | Abbyy Development Llc | Object recognition and describing structure of graphical objects |
US7305612B2 (en) * | 2003-03-31 | 2007-12-04 | Siemens Corporate Research, Inc. | Systems and methods for automatic form segmentation for raster-based passive electronic documents |
US20060187466A1 (en) * | 2005-02-18 | 2006-08-24 | Timbre Technologies, Inc. | Selecting unit cell configuration for repeating structures in optical metrology |
US7916972B2 (en) * | 2006-07-31 | 2011-03-29 | Xerox Corporation | Landmark-based form reading with declarative language |
US9740692B2 (en) | 2006-08-01 | 2017-08-22 | Abbyy Development Llc | Creating flexible structure descriptions of documents with repetitive non-regular structures |
US8233714B2 (en) | 2006-08-01 | 2012-07-31 | Abbyy Software Ltd. | Method and system for creating flexible structure descriptions |
US20090015875A1 (en) * | 2007-06-20 | 2009-01-15 | Ctb/Mcgraw-Hill Companies, Inc. | Image manipulation of digitized images of documents |
US9917975B2 (en) * | 2013-05-29 | 2018-03-13 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Facsimile requirements monitoring |
US10025766B2 (en) * | 2015-12-21 | 2018-07-17 | Xerox Corporation | Relational database for assigning orphan fillable fields of electronic fillable forms with associated captions |
US10067926B2 (en) | 2015-12-21 | 2018-09-04 | Xerox Corporation | Image processing system and methods for identifying table captions for an electronic fillable form |
US10002291B2 (en) | 2016-05-25 | 2018-06-19 | Xerox Corporation | Method and system of identifying fillable fields of an electronic form |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
US5140650A (en) * | 1989-02-02 | 1992-08-18 | International Business Machines Corporation | Computer-implemented method for automatic extraction of data from printed forms |
US5060980A (en) * | 1990-05-30 | 1991-10-29 | Xerox Corporation | Form utilizing encoded indications for form field processing |
US5452379A (en) * | 1991-09-13 | 1995-09-19 | Meadowbrook Industries, Ltd. | Image capture and storage techniques in association with optical mark reading |
US5201011A (en) * | 1991-11-19 | 1993-04-06 | Xerox Corporation | Method and apparatus for image hand markup detection using morphological techniques |
US5282052A (en) * | 1992-03-20 | 1994-01-25 | Xerox Corporation | Techniques for automatic form creation by combining partial operations |
US5317646A (en) * | 1992-03-24 | 1994-05-31 | Xerox Corporation | Automated method for creating templates in a forms recognition and processing system |
TW274597B (ja) * | 1992-04-27 | 1996-04-21 | Philips Electronics Nv | |
US5481621A (en) * | 1992-05-28 | 1996-01-02 | Matsushita Electric Industrial Co., Ltd. | Device and method for recognizing an image based on a feature indicating a relative positional relationship between patterns |
US5416849A (en) * | 1992-10-21 | 1995-05-16 | International Business Machines Corporation | Data processing system and method for field extraction of scanned images of document forms |
US5428694A (en) * | 1993-10-14 | 1995-06-27 | International Business Machines Corporation | Data processing system and method for forms definition, recognition and verification of scanned images of document forms |
-
1996
- 1996-04-12 JP JP8090826A patent/JPH08305778A/ja not_active Withdrawn
- 1996-04-12 EP EP96302573A patent/EP0738987B1/en not_active Expired - Lifetime
- 1996-04-12 DE DE69633809T patent/DE69633809T2/de not_active Expired - Lifetime
-
1997
- 1997-06-23 US US08/880,202 patent/US5748809A/en not_active Expired - Lifetime
-
2004
- 2004-01-23 JP JP2004015005A patent/JP3996579B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE69633809D1 (de) | 2004-12-16 |
EP0738987B1 (en) | 2004-11-10 |
JP2004158036A (ja) | 2004-06-03 |
EP0738987A3 (en) | 1999-04-07 |
US5748809A (en) | 1998-05-05 |
JPH08305778A (ja) | 1996-11-22 |
DE69633809T2 (de) | 2005-03-17 |
EP0738987A2 (en) | 1996-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3996579B2 (ja) | 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム | |
JP3805005B2 (ja) | 画像処理装置及び光学的文字認識装置及びそれらの方法 | |
JP4310288B2 (ja) | 画像処理装置及びその方法、プログラム並びに記憶媒体 | |
JP3278471B2 (ja) | 領域分割方法 | |
EP0621553A2 (en) | Methods and apparatus for inferring orientation of lines of text | |
US20070228168A1 (en) | OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
JP3962891B2 (ja) | 文書画像処理装置、文書画像処理方法、及び記憶媒体 | |
CA2341108A1 (en) | Method and apparatus for identification of documents, and computer product | |
EP2136318A2 (en) | Image processing apparatus and image processing method | |
KR100570224B1 (ko) | 전표정의데이터 작성방법 및 전표처리장치 | |
KR19990036622A (ko) | 비트맵 이미지의 처리 방법 및 처리 장치, 비트맵 이미지의처리를 행하는 이미지 처리 프로그램을 저장한 기억 매체 | |
JPH04195692A (ja) | 文書読取装置 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
US20020015524A1 (en) | Image processing device, program product and system | |
JP2021044803A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JPH08166865A (ja) | 画面生成方法及びその装置 | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JP2002108846A (ja) | 文書画像処理装置、文書画像処理方法、および記録媒体 | |
JP3442847B2 (ja) | 文字読取装置 | |
JP2022090469A (ja) | 書式定義装置、書式定義方法、及びプログラム | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
CN117391045B (zh) | 可复制蒙文的可携带文件格式文件输出方法 | |
JP4651407B2 (ja) | 画像処理装置およびコンピュータプログラムおよび記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070320 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070802 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100810 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110810 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120810 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |