CN1158044A - 图像处理方法和设备以及存储媒体 - Google Patents

图像处理方法和设备以及存储媒体 Download PDF

Info

Publication number
CN1158044A
CN1158044A CN96119794A CN96119794A CN1158044A CN 1158044 A CN1158044 A CN 1158044A CN 96119794 A CN96119794 A CN 96119794A CN 96119794 A CN96119794 A CN 96119794A CN 1158044 A CN1158044 A CN 1158044A
Authority
CN
China
Prior art keywords
image
line
image information
extracted
proposed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN96119794A
Other languages
English (en)
Other versions
CN1099800C (zh
Inventor
手塚信彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN1158044A publication Critical patent/CN1158044A/zh
Application granted granted Critical
Publication of CN1099800C publication Critical patent/CN1099800C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

本发明的目的是正确识别图像信息中的各字符串之间的分界,即不仅要正确识别和提取每一列被横分项表格线划分了的图像,而且还要正确识别和提取每一列没有被横分项表格线划分的图像。为此,本发明首先按照从图像信息中提取的各行式图像的特性对有关从图像信息中提取的表格图像是否为一个无横分项表格线表格的特征加以鉴别。按照被鉴别的特征,确定被提取的每个行式图像是否要添加行分界信息,从而保持了正确的表格格式。

Description

图像处理方法和设备以及存储媒体
本发明涉及OCR(光学字符识别)设备、复印机、传真机之类的图像处理设备,具体地说,涉及能从含有表格图像的输入图像中正确提取字符的图像处理方法和设备以及存储媒体。
本发明还涉及能在从一个输入表格图像中提取字符图像时鉴别这个输入表格的格式从而正确提取字符图像的图像处理方法和设备以及存储媒体。
本发明还涉及能自动鉴别输入图像中所含的表格图像的特征而不需要由用户人工指定的图像处理方法和设备以及存储媒体。
具有自动区域划分功能的OCR设备执行一系列处理过程,自动将一个被表格线(rule)包围的图像鉴别为一个表格图像,而将一个表格中的表格线包围的各小区分别提取出来作为相应的字符区。
在对字符进行了识别后,通过在由字符区中识别得到的字符串之间***一个制表键代码(tab code),而在行之间***一个换行键代码(return code),就将从表格图象中提取的小区的信息在完成字符识别后反映为资料文本数据,从而使数据可很方便地提供给表格计算软件或其他类似软件。
然而,按照上述传统技术,当用作字符识别目标的表格图像是一个如图7所示那样的没有横分项表格线的表格时,由于在垂直方向所列的一系列项是作为一个字符区鉴别的,从而得到形式上与输入表格不同的资料文本,需要操作人员校正为输入表格的形式,因此增加了操作人员的负担。
按照如上所述的本发明,从图像信息中提取行式图像(lineimage),根据所提取的行式图像的特性鉴别图像信息的特征,然后将所鉴别的特征与图像信息对应存储起来,使得表格特征指明所输入的表格图象是一个具有横分项表格线的表格还是一个没有横分项表格线的表格而不需要由操作人员人工指定,因此可以自动鉴别表格特征,从而改善了操作性能。
按照上述本发明,通过将图像信息设置为被分项表格线包围的图像信息,可以自动鉴别在被分项表格线包围的一个小区中所列的各项。
按照上述本发明,通过将图像信息设置为光学读出的图像信息,可以自动处理光学读出的图像,而不需要对键之类进行操作。
按照上述本发明,通过对行式图像进行字符识别和将一个行定界符代码与字符识别结果一起输出,使得表格形式即使在由字符识别形成资料文本后仍能保持不变。
按照上述本发明,通过按照输出的信息显示资料文本,可以在显示器的显示屏幕上确认输入图像字符识别结果和表格形式。
按照上述本发明,将输入图像划分为一些被表格线包围的小图像区,从所划分的这些小图像区图像信息中分别提取相应的行式图像,再对输入图像信息中所包含的这些行式图像按照各行式图像所在的小图像区的位置关系和各行式图像在相应小图像区内的位置关系进行排序,从而可以正确鉴别无横分项表格线的特别表格的形式。
按照上述本发明,通过鉴别图像信息的特征和按照特征鉴别装置的鉴别结果确定是否执行行式图像提取,从而只在相应的情况下进行相应的处理,使得表格的形式即使在由字符识别形成资料文本后仍能保持不变。
在本说明的附图中:
图1为一种图像处理设备功能配备的方框图;
图2为整个处理过程的流程图;
图3为表格特征鉴别处理过程的流程图;
图4为无横分项表格线表格处理过程的流程图;
图5为接受表格特征鉴别处理的表格图像的示意图;
图6为无横分项表格线表格处理过程的示意图;以及
图7为传统的表格图像处理过程的示意图。
图1为本发明所推出的图像处理设备的一个实施例所配备的功能方框图。输入装置101用来输入作为字符识别的目标的图像信息和操作人员所给出的各种指令。输入装置101具有一个键盘,可用来编辑文件之类。对于图像信息输入而言,图像信息可以从一个光读原件的扫描仪输入,也可以通过存储装置或通信装置输入已经光读好的图像信息。处理器(CPU)102用来执行对设备和算术运算的控制,以及按照下面将要说明的流程控制程序执行对每个处理装置的控制。存储器103用来存储使处理器102执行下面将予以说明的流程所示处理过程的控制程序,以及在各处理过程中使用的数据或在各处理过程中产生的数据。作为储存在存储器103中的本发明处理过程的控制程序,可以使用存储在可从设备卸下的诸如FD或CD-ROM那样的存储媒体上的控制程序,或者,使用由另一个终端通过通信线路提供而存储起来的控制程序。输出装置104用来输出算术运算处理结果,图像处理结果,以及图像数据。输出装置104包括诸如CRT、液晶显示器之类的显示器,诸如LBP、彩色喷墨打印机之类的打印机,以及向其他终端或外部存储装置提供输出的输出端。排序装置105用来对图像信息中所包含的句子段落和标题进行排序。区域划分器106用来执行对图像信息的区域划分处理。表格特征鉴别器107通过对图象信息中所包含的表格图像的特征进行检测和分析,自动鉴别表格图像的特征。表格处理器108执行从图像信息中所包含的表格图像中提取表格格式从而形成资料文本的处理。字符识别器109用来从图像信息中提取字符图像,再对所提取的字符图像进行识别。
图2为从输入装置101输入一个图像起,到字符识别和产生作为资料文本数据从输出装置104输出的这段时间内所执行的整个处理过程的流程图。控制程序已存储在存储器103内,在处理器102的控制下执行。
图像信息从输入装置101输入(S201)。所输入的图像信息也可以通过输出装置104中的显示器显示,由操作人员加以确认。区域划分器106将所输入的图象划分成区,提取诸如资料文本、分隔、图形、表格之类的图像数据区(S202)。所提取的图像数据区的信息存入存储器103。对于区域划分的详细方法,可参阅在日本专利申请No.4-243252中所揭示的技术或其他类似的技术。作为区域划分的结果,如果所输入的图像中有一个表格图像(即S203的判断为“是”),则进入步骤S204,执行自动鉴别这个表格图像的特征的处理过程(S204)。表格图像特征的自动鉴别过程详细地示于图3所示的流程图,这在下面将进一步予以说明。作为在步骤S204执行表格特征鉴别的结果,如果表格图象是一个无横分项表格线表格(即S205的判断为“是”),则进至步骤S206,执行无横分项表格线表格的表格处理过程。在步骤S206执行的无横分项表格线表格的表格处理过程是:以字符(相当于小区)为单位进行提取,再以所提取的字符组为单位进行排序,以便保持无横分项表格线表格图象的表格格式形成资料文本,这在下面还要结合图4所示流程图进行详细说明。作为在步骤S204执行表格特征鉴别的结果,如果表格图象是一个带横分项表格线表格(即S205的判断为“否”),则进至步骤S209,执行带横分项表格线表格的表格处理过程。在步骤S209执行的带横分项表格线表格的表格处理过程是:提取小区,再对所提取的这些小区进行排序,以便保持表格格式形成资料文本。在排序处理过程中,按照从左到右、从上到下的次序进行编号。次序在这种情况下与图4流程图的步骤S402中的相同,这在下面将要予以说明。
当在步骤S203确定没有表格时,或者在步骤S206或S209中的处理过程结束时,进至步骤S207,排序装置105对由输入图像中除去表格图像后的句子部分构成的各标题和主体段落进行排序。在排序时,例如在句子是垂直书写的情况下,从右到左进行排序。对于垂直方向,方式与前面类似,从上到下进行排序。
在步骤S208,由字符识别器109执行字符识别处理,字符串按照在步骤S206、S209和S207中所安排的次序输出,从而结束了对输入图像形成资料文本的处理。对于在表格图象中的字符的输出来说,在小区之间***一个制表键代码,作为指示小区分界的代码;在行之间***一个换行键代码,作为指示行分界的代码。
如上所述,通过执行图2这个流程图所示的处理过程,即使是在输入图像中含有无横分项表格线表格,由于无横分项表格线表格自动得到鉴别而无需人工干预,因此仍能保持这种表格的表格格式,形成资料文本。
现在结合图3这个流程图说明在步骤S204中由表格特征鉴别器107执行的表格特征自动鉴别处理过程。在这个处理过程中的目标是由步骤S202的区域划分处理过程确定为表格图像的这个区域中的图像,如图5所例示。
首先提取表格图像50中由表格线包围的各个小区(即小区1至4),对每个小区中的字符行一一进行计数(S301)。例如,小区1至3每个都有6行,而小区4有2行。然后,对于在步骤S301所提取的各小区,执行步骤S302和S303的相继鉴别处理过程。在步骤S302执行的是鉴别在步骤S301所计得的行数是否等于或大于3的过程。在步骤303执行的是鉴别小区中一个字符图像的高度a与在字符图像的垂直字符方向上的间隔b之间的关系是否满足b>3a的过程。如果有一个小区,使得步骤S302或S303的判断为“是”,则这样一个小区的表格图像就判定为无横分项表格线表格,于是除了储存在存储器103的表格图像的区域信息还将无横分项表格线表格的特征存储起来(S304)。对于作为目标的表格图像的所有小区,如果步骤S302和S303的判断都是“否”,则这个表格图像就判定为有横分项表格线表格,于是除了储存在存储器103的表格图像的区域信息,还将有横分项表格线表格的特征存储起来以图5所示的表格图像为例,由于在步骤S302确定小区1至3每个的行数都满足等于或大于3,而在小区4中的两行之间的间隔6满足b>3a,因此无横分项表格线表格的特征在步骤S304存入存储器103。
通过执行图3所示流程图的处理过程,输入图像中所包含的表格图像是一个无横分项表格线表格图像还是一个有横分项表格线表格图像就能自动地加以鉴别,而不需要由操作人员人工指定。
下面结合图4所示流程图说明在步骤S206中由表格处理器108执行的无横分项表格线表格的处理过程。在这个处理过程中的目标是由步骤S202的区域划分处理过程确定为一个表格图像的这个区域内的图像,如图6中所例示的表格图像60。
从表格图像60中所提取的小区1至3每个都以行为单位划分成块(S401)。小区1划分为5个行块,小区2和3每个也同样划分为5个行块。然后,对在步骤S401中所划分出的各行块进行排序(S402)。排序是从左到右再从上到下进行。因此,排序处理过程执行成:小区1的最上面的块编为序号(1),小区2最上面的块编为(2),小区3最上面的块编为(3)。由于在横方向小区3是最后一个小区,因此对下一行的块继续排序:小区1的上面第二块编为(4),小区2的上面第二块编为(5)…。这样的次序信息与相应的块信息一起存入存储器103。
如上面所提到的那样,由于在无横分项表格线表格的情况下通过以行为单位提取各块将一个小区内的各项划分开来后进行排序,方式与对每个小区进行字符串提取、排序的有横分项表格线表格的情况相同,然后再按照所排的次序形成资料文本,使得表格格式能保持不变。

Claims (21)

1.一种图像处理设备,其特征是所述设备包括:
行式图像提取装置,用来从图像信息中提取各行式图像;
特征鉴别装置,用来按照所述被提取的各行式图像的特性鉴别所述图像信息的特征;以及
存储装置,用来储存所述被鉴别的特征,使之与所述图像信息对应。
2.一种在权利要求1中所提出的设备,其中所述特征鉴别装置按照从被表格线包围的一个区域的图像信息中所提取的各行式图像的特性鉴别被所述这些表格线包围的这个区域的所述图像信息的特征。
3.一种在权利要求1中所提出的设备,其中所述特征鉴别装置对所述被提取的各行式图像是否已被一些线段划分进行鉴别。
4.一种在权利要求1中所提出的设备,其中所述特征鉴别装置按照所述被提取的各行式图像的特性对从中提取所述各行式图像的所述图像信息是否为一个含有横分项表格线的图像进行鉴别。
5.一种在权利要求1中所提出的设备,其特征是所述设备还包括行划分信息添加控制装置,用来按照由所述特征鉴别装置得出的结果使所述被提取的一个行的每个行式图像加上或不加行划分信息。
6.一种在权利要求1中所提出的设备,其特征是所述设备还包括鉴别装置,用来对所述图像信息是否为含有表格线的图像信息进行鉴别,而在所述鉴别装置鉴定所述图像信息是含有表格线时,所述特征鉴别装置就执行特征鉴别处理过程。
7.一种在权利要求1中所提出的设备,其特征是所述设备还包括:
小区提取装置,用来从输入图像信息中提取被表格线包围的小区,其中各行式图像是由所述行式图像提取装置从所述小区提取装置所提取的小区的图像信息中提取的;以及
次序确定装置,用来按照由所述小区提取装置提取的各小区的相互位置关系和由所述行式图像提取装置提取的各行式图像的相互位置关系确定从所述输入图像中提取的各行式图像的读出次序。
8.一种在权利要求5中所提出的设备,其特征是所述设备还包括:
识别装置,用来识别由所述行式图像提取装置提取的各行式图像中的字符;以及
输出装置,用来将加在与由所述行划分信息添加控制装置添加的行划分信息相应的位置上的行定界符代码连同所述字符识别装置所得的字符代码一起输出。
9.一种在权利要求8中所提出的设备,其特征是所述设备还包括显示装置,用来显示与要输出的所述各代码相应的模式。
10.一种在权利要求1中所提出的设备,其中所述图像信息是光读的图像信息。
11.一种图像处理方法,其特征是所述方法包括下列步骤:
从图像信息中提取各行式图像;
按照所述被提取的各行式图像的特性鉴别所述图像信息的特征;以及
存储所述被鉴别的特征,使之与所述图像信息对应。
12.一种在权利要求11中所提出的方法,其中在所述特征鉴别步骤,按照从被表格线包围的一个区域的图像信息中所提取的各行式图像的特性鉴别被所述这些表格线包围的这个区域的所述图像信息的特征。
13.一种在权利要求11中所提出的方法,其中在所述特征鉴别步骤,对所述被提取的各行式图像是否已被一些线段划分进行鉴别。
14.一种在权利要求11中所提出的方法,其中在所述特征鉴别步骤,按照所述被提取的各行式图像的特性对从中提取所述各行式图像的所述图像信息是否为一个含有横分项表格线的图像进行鉴别。
15.一种在权利要求11中所提出的方法,其特征是所述方法还包括一个控制步骤,按照所述特征鉴别所得的结果使所述被提取的一个行中的每个行式图像加上或不加行划分信息。
16.一种在权利要求11中所提出的方法,其特征是所述方法还包括下列步骤:
鉴别所述图像信息是否为含有表格线的图象信息;以及
如果所述鉴别步骤确定所述图象信息是含有表格线,则执行所述特征鉴别步骤。
17.一种在权利要求11中所提出的方法,其特征是所述方法还包括下列步骤:
从输入图象信息中提取被表格线包围的小区;
从所述被提取的小区的图像信息中提取所述各行式图像;以及
按照所述被提取的各小区的相互位置关系和所述被提取的各行式图象的相互位置关系确定从所述输入图像中提取的各行式图像的读出次序。
18.一种在权利要求15中所提出的方法,其特征是所述方法还包括下列步骤:
识别所述被提取的各行式图像中的字符;
将加在与由所述行划分信息添加控制步骤添加的行划分信息相应的位置上的行定界符代码连同所述字符识别步骤所得的字符代码一起输出。
19.一种在权利要求18中所提出的方法,其特征是所述方法还包括显示与输出到显示装置的所述各代码相应的模式这一步骤。
20.一种在权利要求11中所提出的方法,其特征是所述图像信息是光读的图像信息。
21.一种存有控制图像处理设备的程序的存储媒体,其特征是所述存储媒体所存的程序包括下列程序步:
从图像信息中提取各行式图像;
按照所述被提取的各行式图像的特性鉴别所述图像信息的特征;以及
储存所述被鉴别的特征,使之与所述图像信息对应。
CN96119794A 1995-12-14 1996-12-13 图像处理方法和设备 Expired - Fee Related CN1099800C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP32563395A JP3814320B2 (ja) 1995-12-14 1995-12-14 画像処理方法及び装置
JP325633/1995 1995-12-14
JP325633/95 1995-12-14

Publications (2)

Publication Number Publication Date
CN1158044A true CN1158044A (zh) 1997-08-27
CN1099800C CN1099800C (zh) 2003-01-22

Family

ID=18179032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96119794A Expired - Fee Related CN1099800C (zh) 1995-12-14 1996-12-13 图像处理方法和设备

Country Status (7)

Country Link
US (1) US6275608B1 (zh)
EP (1) EP0779593B1 (zh)
JP (1) JP3814320B2 (zh)
KR (1) KR100268367B1 (zh)
CN (1) CN1099800C (zh)
DE (1) DE69624663T2 (zh)
TW (1) TW419628B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100367757C (zh) * 2004-03-12 2008-02-06 松下电器产业株式会社 图像识别方法和图像识别装置
CN100454312C (zh) * 2006-03-27 2009-01-21 索尼株式会社 信息处理设备、方法和程序产品
CN101526998B (zh) * 2008-03-03 2012-01-04 夏普株式会社 图像的处理装置及方法、读取装置和数据输出处理装置
CN104156683A (zh) * 2014-06-30 2014-11-19 黄志康 公安出入境表格的自动录入***
CN113408323A (zh) * 2020-03-17 2021-09-17 华为技术有限公司 表格信息的提取方法、装置、设备及存储介质

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001150745A (ja) * 1999-11-30 2001-06-05 Canon Inc 画像処理装置および方法
US7054871B2 (en) * 2000-12-11 2006-05-30 Lucent Technologies Inc. Method for identifying and using table structures
US8887038B2 (en) * 2010-10-08 2014-11-11 Business Objects Software Limited Extrapolating tabular structure in a freeform document
WO2013110289A1 (en) 2012-01-23 2013-08-01 Microsoft Corporation Borderless table detection engine
WO2013110287A1 (en) 2012-01-23 2013-08-01 Microsoft Corporation Vector graphics classification engine
JP2013161268A (ja) * 2012-02-06 2013-08-19 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP5701839B2 (ja) 2012-10-26 2015-04-15 株式会社東芝 電子機器および方法
US9953008B2 (en) 2013-01-18 2018-04-24 Microsoft Technology Licensing, Llc Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally
JP5717831B2 (ja) * 2013-12-10 2015-05-13 株式会社東芝 電子機器および手書き文書処理方法
JP6481204B2 (ja) * 2015-11-13 2019-03-13 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
US20170220858A1 (en) * 2016-02-01 2017-08-03 Microsoft Technology Licensing, Llc Optical recognition of tables
US10592738B2 (en) * 2017-12-01 2020-03-17 International Business Machines Corporation Cognitive document image digitalization
JP6795770B2 (ja) * 2019-02-06 2020-12-02 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4998285A (en) * 1988-03-11 1991-03-05 Kabushiki Kaisha Toshiba Character recognition apparatus
JP2812982B2 (ja) * 1989-04-05 1998-10-22 株式会社リコー 表認識方法
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
JP2930612B2 (ja) * 1989-10-05 1999-08-03 株式会社リコー 画像形成装置
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
JPH03290774A (ja) * 1990-04-06 1991-12-20 Fuji Facom Corp 文書画像の文章領域抽出装置
JPH04243252A (ja) 1991-01-18 1992-08-31 Fuji Photo Film Co Ltd ハロゲン化銀感光材料の現像処理方法
JPH05188919A (ja) * 1992-01-14 1993-07-30 Hitachi Ltd 文書可視化処理方法
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH0696275A (ja) 1992-09-11 1994-04-08 Canon Inc 画像処理装置
DE69333694T2 (de) * 1992-09-11 2005-10-20 Canon K.K. Verfahren und Anordnung zur Bildverarbeitung
US5625719A (en) * 1992-10-19 1997-04-29 Fast; Bruce B. OCR image preprocessing method for image enhancement of scanned documents
JP2789971B2 (ja) * 1992-10-27 1998-08-27 富士ゼロックス株式会社 表認識装置
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
US5737442A (en) * 1995-10-20 1998-04-07 Bcl Computers Processor based method for extracting tables from printed documents

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100367757C (zh) * 2004-03-12 2008-02-06 松下电器产业株式会社 图像识别方法和图像识别装置
CN100454312C (zh) * 2006-03-27 2009-01-21 索尼株式会社 信息处理设备、方法和程序产品
CN101526998B (zh) * 2008-03-03 2012-01-04 夏普株式会社 图像的处理装置及方法、读取装置和数据输出处理装置
CN104156683A (zh) * 2014-06-30 2014-11-19 黄志康 公安出入境表格的自动录入***
CN113408323A (zh) * 2020-03-17 2021-09-17 华为技术有限公司 表格信息的提取方法、装置、设备及存储介质
CN113408323B (zh) * 2020-03-17 2023-03-03 华为技术有限公司 表格信息的提取方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JPH09167246A (ja) 1997-06-24
EP0779593A2 (en) 1997-06-18
CN1099800C (zh) 2003-01-22
KR100268367B1 (ko) 2000-10-16
EP0779593A3 (en) 1998-02-11
US6275608B1 (en) 2001-08-14
JP3814320B2 (ja) 2006-08-30
KR970049402A (ko) 1997-07-29
TW419628B (en) 2001-01-21
DE69624663D1 (de) 2002-12-12
DE69624663T2 (de) 2003-07-03
EP0779593B1 (en) 2002-11-06

Similar Documents

Publication Publication Date Title
CN1099800C (zh) 图像处理方法和设备
US4926492A (en) Optical character reading apparatus and method
EP1016033B1 (en) Automatic language identification system for multilingual optical character recognition
US5701500A (en) Document processor
EP0481979B1 (en) Document recognition and automatic indexing for optical character recognition
CA2080966C (en) Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities
CN102782702B (zh) 在光学字符识别(ocr)过程中的段落识别
US6212299B1 (en) Method and apparatus for recognizing a character
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP2002312385A (ja) 文書自動分割装置
EP0725359A1 (en) Image processing method and apparatus
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
US5956433A (en) Method and device for removing spots from a character image in an optical character reader
EP0496531A2 (en) Method and system for layout analysis of a document image
EP1202213B1 (en) Document format identification apparatus and method
CN114581900A (zh) 用于视频字幕识别的方法及装置、电子设备、存储介质
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH07220023A (ja) 表認識方法及びその装置
US6678427B1 (en) Document identification registration system
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、***
CN118227773A (zh) 一种基于多模态大模型的问答方法及装置
JP3720405B2 (ja) 領域識別装置及び方法
CN116453148A (zh) 一种报纸版面特征的提取方法
JPH0589279A (ja) 文字認識装置
JPH0728952A (ja) 文書認識システム

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20030122

Termination date: 20151213

EXPY Termination of patent right or utility model