CN100474329C - 信息处理装置和信息处理方法 - Google Patents

信息处理装置和信息处理方法 Download PDF

Info

Publication number
CN100474329C
CN100474329C CNB2006101357346A CN200610135734A CN100474329C CN 100474329 C CN100474329 C CN 100474329C CN B2006101357346 A CNB2006101357346 A CN B2006101357346A CN 200610135734 A CN200610135734 A CN 200610135734A CN 100474329 C CN100474329 C CN 100474329C
Authority
CN
China
Prior art keywords
color
information
additional
unit
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006101357346A
Other languages
English (en)
Other versions
CN101030251A (zh
Inventor
伊藤笃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN101030251A publication Critical patent/CN101030251A/zh
Application granted granted Critical
Publication of CN100474329C publication Critical patent/CN100474329C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了信息处理装置、信息处理方法及计算机可读介质。信息处理装置包括:颜色提取单元,其输入通过以不同颜色向原始文档写入附加写入信息而提供的附加写入文档,并获取该附加写入文档上的颜色信息;颜色分析单元,其基于所提取的颜色,分析通过颜色混合产生的颜色组合和颜色空间之一与所提取的颜色之间的对应关系;接合和整合单元,其基于所述颜色分析单元的分析结果来确定所述附加写入文档上的不同颜色之间的重叠,并接合与重叠和附加写入信息的中断之间的对应部分相对应的附加写入信息的中断;确定单元,其根据经接合的附加写入信息来确定所述附加写入文档的指定区域;以及信息分析单元,其读取包含在分析出的指定区域中的信息。

Description

信息处理装置和信息处理方法
技术领域
本发明涉及信息处理装置、信息处理方法以及计算机程序,更具体地,涉及一种使得可以分析在利用彩色标记的附加写入中的多条附加写入信息之间的重叠或附加写入信息与原始信息之间的重叠、并执行精确的附加写入区域提取的信息处理装置、信息处理方法以及计算机程序。
背景技术
在对文档的数据处理领域,从文档图像数据获得各文档区域的属性的处理(例如针对各属性对图像区域进行分类,然后执行字符识别处理(OCR:光学字符识别),以生成经分类的文本数据并将该文本数据保存在数据库中)公知为索引提取处理。例如,JP-A-5-342326(这里使用的术语“JP-A”是指“未审查已公开日本专利申请”)和JP-A-2002-123815公开了该索引提取处理的现有技术。
JP-A-2003-271942描述了用于进行如下操作的结构:定义预定文档形式,设定附加写入区域以允许按照文档形式进行附加写入,在设定的附加写入区域中嵌入位置信息,以及当从文档提取附加写入信息时为了高效地获得附加写入信息而消除与原始信息进行核对的需要。此外,JP-A-2003-18393描述一种用于将区域识别信息嵌入文档的分割区域中并当提取附加写入信息时从该区域高效地提取附加写入信息的处理结构。
此外,JP-A-10-255027和JP-A-11-272654等描述了如下的结构:如果针对纸原稿执行诸如附加写入的变化处理,则确定和提取变化部分并将提取的变化部分信息添加到原始信息作为管理用数据,例如附加写入部分提取处理结构。
如上所述,在针对文档的数据处理中,提出了用于按照类型对包含在文档中的各条数据进行分类或归类并以分类方式将数据保存在数据库等的存储部中的各种技术。然而,从包含在文档中的文档区域提取属性的自动处理涉及性能限制,并且,为了执行精确的属性提取,在目前条件下需要人(操作员)的介入。
为通过人(操作员)的介入而执行属性提取,执行如下处理:由人在纸原稿上标记与预定属性相对应的属性值并扫描原稿,然后提取标记区域信息作为属性值。例如,按照如下方式来预设信息类型与标记颜色之间的对应:红色标记设定部分是日期数据、蓝色标记设定部分是文档名称数据,并且通过判断标记颜色来获取属性信息。
然而,判断标记颜色来获取属性信息的结构带来下面的问题:例如,如果利用各种颜色的标记向原稿进行附加写入,则可能发生不同标记颜色之间的重叠(例如,红色与蓝色之间的重叠等)。此外,可能发生作为附加写入的标记颜色(例如红色)与原始信息(例如黑色)之间的重叠。在不同色彩之间的发生重叠的部分中,在通过扫描仪进行读取时,无法识别基本的标记颜色,并将其读取为不同颜色。因此,如果读取这种原稿,则在重叠部分中不能执行精确的标记颜色提取,并且不能精确地执行基于标记颜色的附加写入区域确定;这是一个问题。
因此,本发明的目的是提供一种信息处理装置、信息处理方法以及计算机程序,其使得可以分析在作为属性设定处理而执行的利用彩色标记的附加写入中的多条附加写入信息之间的重叠或附加写入信息与原始信息之间的重叠、并且执行精确的附加写入区域提取。
发明内容
(1)根据本发明的第一方面,一种信息处理装置,该信息处理装置包括:颜色提取单元,其输入通过以不同颜色向原始文档写入附加写入信息而提供的附加写入文档,并获取该附加写入文档上的颜色信息;颜色分析单元,其基于由所述颜色提取单元提取的颜色,分析通过颜色混合产生的颜色组合和颜色空间两者之一与由所述颜色提取单元提取的颜色之间的对应关系;接合和整合单元,其基于所述颜色分析单元的分析结果来确定所述附加写入文档上的不同颜色之间的重叠,并接合附加写入信息的中断,所述附加写入信息的中断与该重叠相对应;确定单元,其根据在所述接合和整合单元中接合的附加写入信息来确定所述附加写入文档的指定区域;以及信息分析单元,其读取由所述确定单元分析出的指定区域中包含的信息。
(2)如项(1)中所述的信息处理装置,其中所述颜色分析单元基于由所述颜色提取单元提取的颜色来在颜色空间中提取可能发生减色法混合的部分颜色空间。
(3)如项(1)中所述的信息处理装置,其中所述颜色分析单元基于由所述颜色提取单元提取的颜色来提取与所述颜色提取单元提取的颜色相对应的减色法混合组合。
(4)如项(1)中所述的信息处理装置,其中所述信息分析单元对由所述确定单元分析出的指定区域中包含的信息执行字符识别处理。
(5)如项(1)中所述的信息处理装置,其中所述信息分析单元获取由所述确定单元分析出的指定区域中包含的信息作为图像数据。
(6)如项(1)中所述的信息处理装置,其中所述信息分析单元读取以下两种信息之一:(i)所述附加写入信息中包括的区域中包含的信息,以及(ii)内包区域与所述附加写入信息接触并重叠的区域中包含的信息。
(7)如项(1)所述的信息处理装置,该信息处理装置包括:图像处理单元,其输入原始文档和附加写入文档并执行差值提取,其中所述颜色提取单元获取关于所述图像处理单元产生的差值图像数据的颜色信息。
(8)如项(1)所述的信息处理装置,该信息处理装置包括:图像处理单元,其输入原始文档和附加写入文档并执行差值提取,其中所述颜色提取单元获取关于所述图像处理单元产生的差值图像数据的颜色信息。
(9)如项(1)所述的信息处理装置,该信息处理装置包括:图像处理单元,其输入附加写入文档并去除该附加写入文档中的分格线,其中所述颜色提取单元获取关于由所述图像处理单元产生的已去除分格线的图像数据的颜色信息。
(10)根据本发明的第二方面,一种信息处理方法,该信息处理方法包括以下步骤:输入通过以不同颜色将附加写入信息写入原始文档中而提供的附加写入文档;获取所述附加写入文档上的颜色信息;基于所提取的颜色,分析通过颜色混合产生的颜色组合和颜色空间两者之一与所提取的颜色之间的对应关系;基于分析所获得的分析结果来确定所述附加写入文档上的不同颜色之间的重叠;接合附加写入信息的中断,所述附加写入信息的中断与该重叠相对应;根据经接合的附加写入信息来确定所述附加写入文档的指定区域;以及读取分析出的指定区域中包含的信息。
(11)如项(10)所述的信息处理方法,其中分析对应关系的步骤是基于所提取的颜色来在颜色空间中提取可能发生减色法混合的部分颜色空间。
(12)如项(10)所述的信息处理方法,其中分析对应关系的步骤是基于所提取的颜色来提取与所提取的颜色相对应的减色法混合组合。
(13)如项(10)所述的信息处理方法,其中读取信息的步骤是对包含在分析出的指定区域中的信息执行字符识别处理。
(14)如项(10)所述的信息处理方法,其中读取信息的步骤是获取包含在分析出的指定区域中的信息作为图像数据。
(15)如项(10)所述的信息处理方法,其中读取信息的步骤是读取以下两种信息之一:(i)所述附加写入信息中包括的区域中包含的信息,以及(ii)内包区域与所述附加写入信息接触并重叠的区域中包含的信息。
(16)如项(10)所述的信息处理方法,该信息处理方法包括以下步骤:输入原始文档和附加写入文档;和执行差值提取,其中获取颜色信息的步骤是获取关于所产生的差值图像数据的颜色信息。
(17)如项(10)所述的信息处理方法,该信息处理方法包括以下步骤:输入附加写入文档;和去除该附加写入文档中的分格线,其中获取颜色信息的步骤是获取关于所产生的已去除分格线的图像数据的颜色信息。
(18)如项(10)所述的信息处理方法,该信息处理方法包括以下步骤:基于所提取的颜色信息而生成限于多条预设颜色信息的限定颜色图像,其中分析对应关系的步骤是基于所述限定颜色图像来分析通过颜色混合产生的颜色组合和颜色空间之一与所提取的颜色之间的对应关系。
(19)根据本发明的第三方面,一种计算机可读介质存储有使计算机执行用以执行文档分析处理的处理的程序,该文档分析处理包括以下步骤:输入通过以不同颜色将附加写入信息写入原始文档中而提供的附加写入文档;获取所述附加写入文档上的颜色信息;基于所提取的颜色,分析通过颜色混合所产生的颜色组合和颜色空间之一与所提取的颜色之间的对应关系;基于分析所获得的分析结果来确定所述附加写入文档中的不同颜色之间的重叠;接合与在重叠和附加写入信息的中断之间的对应部分相对应的附加写入信息的中断;根据经接合的附加写入信息来确定所述附加写入文档的指定区域;以及读取分析出的指定区域中包含的信息。
本发明的计算机程序例如是可由诸如CD、FD或MO的记录介质或诸如网络的通信介质提供的计算机程序,所述记录介质或通信介质用于为可执行计算机可读格式的各种程序代码的计算机***提供计算机程序。以计算机可读格式来提供这种程序,由此在计算机***中实现响应于该程序的处理。
根据结合附图对本发明的优选实施例的以下详细描述,本发明的上述和其它目的、特征和优点将变得显而易见。该说明书中的***是由多个单元(装置)组成的逻辑组,并不限于容纳在单个机柜中的一组单元(装置)。
根据本发明的构成,例如,在对涉及利用彩色标记进行附加写入(其被执行为针对文档的属性设定处理)的附加写入文档的分析处理中,图像处理装置检测多条附加写入信息之间的重叠或附加写入信息与原始信息之间的重叠,分析重叠的颜色是按照哪种颜色组合产生的,恢复在该重叠中中断的附加写入信息,并可靠地读取经恢复的附加写入信息的指定信息。图像处理装置对包含在经恢复的附加写入信息的指定信息中的字符(文本)进行字符识别等的信息分析,并将分析结果存储在数据库等中。根据该构成,例如,如果在附加写入文档中发生不同颜色标记之间的重叠或彩色标记与原始信息之间的重叠,则可以提取精确的附加写入信息,并提取和分析附加写入信息所确定的信息。
附图说明
基于附图详细描述本发明的示例性实施例,在附图中:
图1是描述利用附加写入部分索引处理的针对文档的数据处理的一般处理示例的图;
图2是描述利用附加写入部分索引处理的索引设定示例的图;
图3是描述利用附加写入部分索引处理的针对文档的数据处理的一般处理示例的图;
图4是描述由本发明的信息处理装置执行的利用附加写入部分索引处理的针对文档的数据处理示例的图;
图5是描述由本发明的信息处理装置执行的利用附加写入部分索引处理的针对文档的数据处理示例的图;
图6A和6B是描述由本发明的信息处理装置执行的利用附加写入部分索引处理的针对文档的数据处理示例的图;
图7A和7B是描述减色法混合的发生情况的图;
图8A和8B是描述由本发明的信息处理装置执行的利用附加写入部分索引处理的针对文档的数据处理示例的图;
图9A1、9A2、9B1和9B2是描述由本发明的信息处理装置执行的利用附加写入部分索引处理的针对文档的数据处理示例的图;
图10是表示本发明的信息处理装置的构成示例的框图;
图11A和11B是描述由本发明的信息处理装置执行的处理顺序的流程图;
图12是表示本发明的信息处理装置的构成示例的框图;
图13A和13B是描述由本发明的信息处理装置执行的处理顺序的流程图;
图14A和14B是描述由本发明的信息处理装置执行的处理顺序的流程图;
图15A和15B是描述由本发明的信息处理装置执行的处理顺序的流程图;以及
图16是表示本发明的信息处理装置的硬件配置示例的框图。
具体实施方式
将参照附图来介绍根据本发明实施例的信息处理装置、信息处理方法以及计算机程序。
首先,将参照图1至3来介绍利用附加写入部分索引处理的文档处理的一般处理示例。附加写入部分索引处理如下:例如,操作员利用响应于类别设定的特定颜色的标记对文档上的字符串等的信息进行检查处理,通过扫描仪读取处理后的文档,根据读取的图像数据来判断标记颜色,对文档上的信息进行分类,并将文档的索引信息存储在数据库中。
例如,如下地响应于信息类型来预先关联要使用的标记颜色:
红色:文件名,
蓝色:日期,
绿色:关键字等,
并且操作员从文档中选择与信息类型相对应的信息,并检查具有分配给该信息类型的标记的选择信息。然后,诸如PC的信息处理装置从通过扫描仪读取的图像数据获取标记颜色信息,通过执行例如字符识别(OCR)处理等将颜色信息的指示部分的文档信息等转换为数据,并将该数据存储在数据库中作为对应的索引信息。
例如,图1所示的信息处理装置51通过打印机52输出存储在数据库54中的文档。该文档是图中所示的原始文档11。操作员基于信息类型与使用的标记颜色之间的预设对应关系来利用标记执行对原始文档11的附加写入。结果是图中所示的附加写入文档12。
例如,基于预定规则在附加写入文档上设置红色、蓝色和绿色标记21至23。例如,标记颜色与信息类型之间的对应关系设定为
红色:文件名,
蓝色:日期,
绿色:关键字。
通过扫描仪53读取附加写入文档12,信息处理装置51执行数据处理并执行与要处理的文档相对应的索引信息的设定处理。
下面将参照图2来介绍信息处理装置51中执行的索引设定处理。将与先前参照图1描述的原始文档11相对应的文档数据文件71存储在数据库54中,信息处理装置51基于先前参照图1描述的附加写入文档12来提取与原始文档11相对应的索引信息,并将该索引信息存储在数据库中作为与所述文档相对应的索引信息。
信息处理装置51基于标记颜色与信息类型之间的如下对应关系信息从附加写入文档12读取信息:
红色:文件名,
蓝色:日期,
绿色:关键字,
并通过结合利用字符识别处理(OCR)等来获取图2所示的索引信息。在该图所示的示例中,从附加写入文档12提取下面的多条索引信息并将其存储在数据库54中作为文档的索引信息:
(1)标记颜色=红色->文件名:“备忘录”,“安全措施课程CD-ROM发布及开发”
(2)标记颜色=蓝色->日期:“2004年3月29日”
(3)标记颜色=绿色->关键字:“安全措施课程网络社会中存在风险!!”。
下面将参照图3来介绍给出索引处理的顺序。图3所示的文档101是对其应用索引提取处理的文档。在步骤S11,操作员利用与信息类型相对应的预定标记颜色对文档101执行标记附加写入,以产生标记附加写入文档102。
信息处理装置51通过扫描仪读取标记附加写入文档102,并执行数据处理(步骤S12处的彩色标注提取处理)。
信息处理装置51基于如下对应关系信息从标记附加写入文档102提取信息:
红色:文件名,
蓝色:日期,
绿色:关键字。
如图中所示,提取出:
(1)红色标记记录数据103a
(2)蓝色标记记录数据103b
(3)绿色标记记录数据103c
信息处理装置51在步骤S13从提取的数据中执行字符串提取,获得如图所示的以下索引信息并将这些索引信息存储在数据库中作为文档101的索引信息:
(1)索引数据104a=[标记颜色=红色->文件名:“备忘录”,“安全措施课程CD-ROM发布及开发”]
(2)索引数据104b=[标记颜色=蓝色->日期:“2004年3月29日”]
(3)索引数据104c=[标记颜色=绿色->关键字:“安全措施课程网络社会中存在风险!!”]。
因此,可以针对各类型对包含在文档中的各条数据进行分类或归类,并将与文档相对应的索引信息存储在数据库等的存储部中。在处理中,人(操作员)输入标记。然而,如上所述,如果利用各种彩色标记附加写入到原稿,则可能发生作为附加写入信息的不同标记颜色之间的重叠,此外,可能发生作为附加写入的标记颜色与原始信息之间的重叠。在不同颜色之间的发生重叠的部分中,当通过扫描仪进行读取时,基本的标记颜色被读取为不同的颜色。因此,如果读取这种原稿,则存在如下问题:在重叠部分中无法执行精确的标记颜色提取,且无法精确地执行基于标记颜色对附加写入区域的确定。
本发明具有解决这种问题的构成。即,在作为属性设定处理而执行的利用彩色标记的附加写入中,使得可以分析作为不同标记颜色的多条附加写入信息之间的重叠或附加写入信息与原始信息之间的重叠,并使得可以精确地提取附加写入区域。下面将参照图4及其以后的图来详细地介绍本发明的信息处理装置51执行的处理。
图4是描述在作为对文档的属性设定处理而执行的利用彩色标记的附加写入中发生作为不同标记颜色的多条附加写入信息之间的重叠或附加写入信息与原始信息之间的重叠的具体示例的图。
操作员利用各种彩色标记对图4所示的原始文档201进行作为属性设定的检查。这里,示出了利用与各属性相关联的彩色标记执行围绕与特定属性(例如,日期、文件名、关键字等)相对应的文档区域的处理的示例。在图4所示的示例中,标记颜色是黄色(Y)、品红色(M)以及蓝色(B),原稿的颜色是黑色(K)。
操作员利用标记得到的属性赋予结果是附加写入文档202。利用黄色(Y)、品红色(M)和蓝色(B)的彩色标记来检查附加写入文档202。然而,在具有标记附加写入的附加写入文档202中发生附加写入信息重叠211(不同标记颜色之间的重叠)以及附加写入与原始信息重叠212(标记颜色与原稿的原始信息之间的重叠)。
在附加写入信息重叠211和附加写入与原始信息重叠212中,当通过扫描仪读取附加写入文档原稿时,不能识别出作为基本附加写入信息的标记颜色。结果,不可能精确地把握具有标记颜色的指定区域。
本质上,必须从图5所示的附加写入文档202中精确地读取下面三个指定区域:
黄色(Y)标记颜色指定区域221,
品红色(M)标记颜色指定区域222,和
蓝色(B)标记颜色指定区域223,
针对这三个区域中的文本信息执行OCR处理,并存储在数据库等的存储部中作为与各属性相对应的索引信息。然而,在通过扫描仪进行读取时,在附加写入信息重叠211或附加写入与原始信息重叠212中无法检测到基本标记颜色,从而难以把握具有标记的指定区域。
本发明的信息处理装置51分析附加写入信息重叠211和附加写入与原始信息重叠212,并可以检测基本标记颜色。下面将参照附图来介绍分析处理示例。图6A和6B是描述基于对不同标记颜色之间的重叠的颜色分析而彼此区分不同标记颜色的附加写入区域的处理的图。
图6A表示其中当使用黄色(Y)和品红色(M)作为两种不同标记颜色时发生重叠的示例。如图6A所示,设定黄色(Y)标记附加写入区域231和品红色(M)标记附加写入区域232,在两条附加写入信息中发生重叠233。
当通过扫描仪来读取原稿时,重叠233被识别为红色(R)。即,根据下式将其识别为红色(R):
黄色(Y)+品红色(M)=红色(R)。
假定通过扫描仪读取的颜色信息是先前用于原稿的原始信息颜色(例如,黑色)以及用于附加写入的标记颜色(这里为黄色(Y)和品红色(M))。即,基本上通过扫描仪读取的颜色信息原则上是黑色(K)、黄色(Y)和品红色(M)三种颜色中的任一种。
如果从扫描仪读取的原稿中检测到除基本使用的颜色之外的任何颜色,则本发明的信息处理装置51确定该颜色是通过混合颜色而产生的颜色,并基于检测到的颜色来分析混合了哪些颜色。
在图6A和6B所示的示例中,在重叠233中检测到红色(R)。本发明的信息处理装置51分析混合了黑色(K)、黄色(Y)和品红色(M)三种颜色中的哪些而产生了检测到的红色。信息处理装置51将原始颜色信息和用作附加写入标记的颜色信息(例如,黑色、黄色和品红色)保存在存储部中,并在使用颜色信息与通过扫描仪读取的颜色信息之间进行比较,以分析混合了哪种使用颜色而产生检测到的不包含在使用颜色信息(例如,黑色、黄色和品红色)中的颜色(红色)。
在图6A和6B所示的示例中,在重叠233中检测到红色(R)。红色(R)被分析为是通过混合黄色(Y)和品红色(M)而产生的颜色。即,确定
红色(R)=黄色(Y)+品红色(M)
并确定重叠223是黄色(Y)标记与品红色(M)标记之间的重叠。根据先前制定的规则来进行基于检测到的颜色的颜色分析。
信息处理装置51可预先将扫描仪检测到的颜色信息与检测到的颜色信息中包含的多个使用颜色之间的对应关系表保存在信息处理装置51的存储部中,并可利用该对应关系表基于检测到的颜色来分析使用颜色,或可基于检测到的颜色而执行颜色分离处理并可依次分析实际使用颜色。为生成该表或进行颜色分析,可应用在颜色分析领域中已知的颜色空间中的减色法混合区域信息。
下面将参照图7A和7B来介绍减色法混合。图7A和7B是描述在不同颜色空间中的减色法混合的如下发生状况的图:
(1)在CMYK(或RGB)空间中的减色法混合的发生状况;和
(2)在Lab空间中的减色法混合的发生状况。
在示出CMYK(或RGB)空间中的减色法混合的发生状况的图7A中,顶点表示C(青色)、M(品红色)、Y(黄色)、K(黑色)、R(红色)、G(绿色)、B(蓝色)和W(白色)。例如,采用图中所示的提取颜色241作为提取颜色。如果任何其它颜色与提取颜色混合而产生的颜色区域是由图中所示的长方体所表示的作为可能发生减色法混合的部分颜色空间242的区域。
即,由以连接提取颜色和黑色(K)的线作为对角线的长方体表示可能发生减色法混合的部分颜色空间。因此,例如,如果从扫描仪读取信息中获得未用作原始颜色或附加写入标记颜色的颜色,则可以根据可能发生减色法混合的部分颜色空间来逆向分析该混合颜色。
例如,如果假设当通过扫描仪读取的颜色是红色(R)时,红色(R)是通过减色法混合而产生的,则可确定该混合颜色位于M(品红色)、Y(黄色)、R(红色)和W(白色)的平面上。例如,如果用作原稿和标记的颜色是M(品红色)和Y(黄色),则确定R(红色)是通过混合M(品红色)和Y(黄色)而产生的颜色,并可确定扫描仪检测到的R(红色)是通过混合M(品红色)和Y(黄色)而产生的。
图7A是示出CMYK(或RGB)空间中的减色法混合的发生状况的图;不仅在CMYK(或RGB)空间中,而且在Lab空间中,如图7B所示,可将图中示出为若任何其它颜色与提取颜色251混合而产生的颜色的区域的锥形区域定义为可能发生减色法混合的部分颜色空间252。因此,可在CMYK、RGB、Lab等的各种颜色空间中单独地定义可能发生减色法混合的部分颜色空间,并可使用根据扫描仪读取信息而分析的颜色信息的各种设定。
应用上述减色法混合区域信息,从而本发明的信息处理装置51生成扫描仪检测到的颜色信息与检测到的颜色信息中包含的多个使用颜色之间的对应关系表,并预先将该对应关系表保存在信息处理装置51的存储部中,并利用该对应关系表基于检测到的颜色来分析使用颜色。另选地,信息处理装置51通过应用上述减色法混合区域信息而基于检测到的颜色执行颜色分离处理,并依次分析实际使用颜色。在任一种情况下,必须预先获得读取原稿中使用的原始和附加写入信息的使用颜色信息。
已参照图6A和6B描述了当发生不同颜色的多条附加写入信息之间的重叠时的颜色分析。当利用彩色标记对文档进行附加写入时,还发生彩色标记与原始信息之间的重叠。即,例如,如图8A所示,发生原始信息=黑色(K)与附加写入标记颜色=品红色(M)之间的重叠等。
在该情况下,也进行应用上述减色法混合区域信息的分析,或基于检测到的颜色信息与检测到的颜色信息中包含的多个使用颜色之间的对应关系表而进行分析。如图中所示,
品红色(M)+黑色(K)=黑色(K)
在该情况下,原始信息=黑色(K)与附加写入标记颜色=品红色(M)之间的重叠变为黑色(K),这与原始信息相同。信息处理装置51检测到附加写入区域的中断(break),并且如果该中断被设定为上述的条件颜色,例如,
品红色(M)+黑色(K)=黑色(K),
则信息处理装置51确定检测到的中断是品红色(M)与黑色(K)之间的重叠,并执行以附加写入颜色(品红色(M))连接中断的处理,以恢复为如图8B所示的没有中断的附加写入信息261,从而获得由该经恢复的附加写入信息所指定的部分(包含区域与重叠)中包含的原始信息262,并提取该原始信息作为具有由附加写入信息261所指定的属性的信息。
本发明的信息处理装置51执行这样的分析处理,由此执行对附加写入信息与任何其它信息(原始信息或任何其它附加写入信息)之间的重叠的颜色分析,并精确地获得与基本使用颜色相对应的准确的附加写入信息区域和由附加写入指定的原始信息。
图9示出在如下示例中基于颜色分析对附加写入信息记录区域的检测处理示例:
(1)黑线与单色附加写入重叠的示例
(2)黑线与双色附加写入重叠的示例。
在图9A的示例中,例如,使用黑色(K)作为原始信息并使用品红色(M)作为附加写入信息,黑色(K)与品红色(M)之间的重叠变为
品红色(M)+黑色(K)=黑色(K)
并从扫描仪读取信息中将作为附加写入信息的品红色(M)获得为中断信息。信息处理装置51确定品红色(M)的附加写入信息的中断是否为与通过基于使用颜色(品红色(M)与黑色(K))的上述减色法混合所产生的颜色信息相对应的颜色。如果信息处理装置51确定其为可能发生的颜色,则信息处理装置51确定该区域是由于使用颜色之间的重叠而出现的区域,即,在本示例中为通过如下混合而产生的黑色(K):
品红色(M)+黑色(K)=黑色(K)
并确定检测到的中断是品红色(M)与黑色(K)之间的重叠,且执行以附加写入颜色(品红色(M))连接中断的处理,以恢复为如图9A2所示的没有中断的附加写入信息,从而获得由经恢复的附加写入信息所指定的部分(内包区域与重叠)中包含的原始信息,并在存储部(数据库)中登记该原始信息作为具有与附加写入颜色相对应的属性的信息。
在图9B的示例中,例如,使用黑色(K)作为原始信息并使用品红色(M)和黄色(Y)作为附加写入信息。在本示例中,发生下面三种不同的重叠:
(a)黄色(Y)与品红色(M)之间的重叠->黄色(Y)+品红色(M)=红色(R);
(b)黄色(Y)与黑色(K)之间的重叠->黄色(Y)+黑色(K)=黑色(K);以及
(c)品红色(M)与黑色(K)之间的重叠->品红色(M)+黑色(K)=黑色(K)。
从扫描仪读取信息中将作为附加写入信息的品红色(M)和黄色(Y)获得为中断信息。信息处理装置51确定品红色(M)和黄色(Y)的附加写入信息的中断是否为与通过基于使用颜色(品红色(M)、黄色(Y)和黑色(K))的上述减色法混合所产生的颜色信息相对应的颜色。如果信息处理装置51确定其为可能发生的颜色,则信息处理装置51确定该区域是由于使用颜色之间的重叠而出现的区域。
在该示例中,如果品红色(M)的附加写入信息的中断是通过如下混合而产生的黑色(K):
品红色(M)+黑色(K)=黑色(K),
则确定检测到的中断是品红色(M)与黑色(K)之间的重叠,并以附加写入颜色(品红色(M))连接该中断。
同理,如果黄色(Y)的附加写入信息的中断是通过如下混合而产生的黑色(K):
黄色(Y)+黑色(K)=黑色(K),
则确定检测到的中断是黄色(Y)与黑色(K)之间的重叠,并以附加写入颜色(黄色(Y))连接该中断。
未包含在使用颜色中的红色(R)的检测部分被确定是通过上述减色法混合而产生的颜色,并且由于
黄色(Y)+品红色(M)=红色(R),
所以确定在红色(R)的检测部分中混合的以前的颜色信息是黄色(Y)和品红色(M),并确定该区域是黄色(Y)与品红色(M)之间的重叠区域。
基于该分析,执行如下处理:恢复为如图9B2所示的没有中断的附加写入信息,获得由经恢复的附加写入信息所指定的部分(内包区域与重叠)中包含的原始信息,并在存储部(数据库)中对该原始信息进行登记,作为具有与附加写入颜色相对应的属性的信息。
接下来,将参照图10和11来介绍本发明的信息处理装置的一个实施例的构成。图10是示出本发明的信息处理装置的一个实施例的构成的框图,而图11是与图10中所示的信息处理装置中执行的处理示例相对应的流程图。
如图10所示,信息处理装置400具有数据输入单元401、颜色提取单元402、颜色分析单元403、接合和整合单元(后文也简称为“附加写入区域接合和整合单元”)404、确定单元(后文也简称为“附加写入区域指定部分确定单元”)405、信息分析单元(后文也简称为“附加写入区域指定部分信息分析单元”)406、以及分析信息存储单元407。将参照图11的流程图来介绍具有该构成的信息处理装置400中的处理示例。
图11提供与两个处理顺序相对应的两个流程图。首先,介绍根据图11A的流程图的处理示例。首先,在步骤S101,图10所示的数据输入单元401输入要处理的图像数据。例如,该图像数据是具有以不同彩色标记设定的属性(即,用标记进行了检查)的文档图像数据;输入通过扫描仪读取的数据、存储在存储部中的图像数据等作为要处理的数据。
在步骤S102,颜色提取单元402提取在输入的图像数据中使用的颜色。例如,提取用在原始信息中的黑色(K)和用作附加写入信息的黄色(Y)和品红色(M)。
在步骤S103,颜色分析单元403在颜色空间(YMCK、GBR等的颜色空间)中针对在步骤102提取的颜色而提取可能发生减色法混合的各部分颜色空间。例如,如果例如使用黑色(K)作为原始信息并使用黄色(Y)和品红色(M)作为附加写入信息,则提取颜色241被设定为图7A所示的颜色空间中的黑色(K)、黄色(Y)和品红色(M),找出可能发生减色法混合的各部分颜色空间,并将其作为接合和恢复时的目标颜色区域。例如,红色(R)成为黄色(Y)和品红色(M)的接合和恢复时的目标颜色区域。
接下来,在步骤S104,附加写入区域接合和整合单元404利用减色法混合的部分颜色空间信息针对各像素进行接合和整合。如果黑色(K)、黄色(Y)和品红色(M)是使用颜色,则由减色法混合所产生的颜色是根据下面关系式的黑色(K)和红色(R)区域:
品红色(M)+黑色(K)=黑色(K)
黄色(Y)+黑色(K)=黑色(K)
黄色(Y)+品红色(M)=红色(R)
并且如果以品红色(M)或黄色(Y)设定的附加写入信息中的中断的发生部分是黑色(K)或红色(R),则确定该区域为使用区域之间的重叠区域并发生了中断,接合该部分以产生恢复的附加写入信息。
接着,在步骤S105,附加写入区域指定部分确定单元405提取文本信息、图像信息作为由经恢复的附加写入信息所包括的信息。例如,如图5所示,提取由附加写入信息221至223所包括的原始信息(文本信息、图像信息)。
接着,在步骤S106,图10所示的附加写入区域指定部分信息分析单元406和分析信息存储单元407分析附加写入信息的内包区域中的信息(文本信息、图像信息),并且例如通过执行OCR来分析文本信息,且将图像信息存储在存储部中作为图像数据。
在图11B所示的处理流程中,S201和S202类似于图11A所示的处理流程的S101和S102。在S201,输入要处理的文档图像,在步骤S202从输入的文档图像提取颜色。在图11B所示的处理流程中,在S203,颜色分析单元403针对在S202从文档中提取的颜色检查减色法混合组合。
例如,如果
使用黑色(K)作为原始信息并
使用黄色(Y)和品红色(M)作为附加写入信息,则颜色分析单元403基于使用颜色来检查可能是由减色法混合所产生的颜色。在该情况下,根据下面关系式确定减色法混合所产生的颜色为黑色(K)和红色(R):
品红色(M)+黑色(K)=黑色(K)
黄色(Y)+黑色(K)=黑色(K)
黄色(Y)+品红色(M)=红色(R)。
接下来,在步骤S204,附加写入区域接合和整合单元404参照在S203分析的减色法混合组合,接合并整合各像素的区域。即,如果黑色(K)和红色(R)区域是通过减色法混合以多个颜色产生的颜色,并且以品红色(M)或黄色(Y)设定的附加写入信息中的中断的发生部分是黑色(K)或红色(R),则确定该区域为使用区域之间的重叠区域并发生了中断,接合该部分以产生经恢复的附加写入信息。
S205和S206类似于图11A所示的处理流程中的S105和S106。通过图10所示的附加写入区域指定部分信息分析单元406和分析信息存储单元407,提取由经恢复的附加写入信息所包括的信息,分析附加写入信息的内包区域中的信息并将其存储在存储部中。
接下来,将参照图12来介绍本发明的信息处理装置的第二实施例的构成。类似于先前参照图10描述的信息处理装置,图12所示的信息处理装置420具有数据输入单元401、颜色提取单元402、颜色分析单元403、附加写入区域接合和整合单元404、附加写入区域指定部分确定单元405、附加写入区域指定部分信息分析单元406、以及分析信息存储单元407。除了这些部件,信息处理装置420还具有图像处理单元421和限定颜色图像生成单元422。
作为对要处理的输入图像的预处理,图像处理单元421例如执行差值提取处理:根据附加有彩色标记的附加写入图像数据与附加写入前的原始图像之差而仅仅提取附加写入信息,或者如果原始文档包含分格线(rule line)则执行去除分格线等的处理等。
限定颜色图像生成单元422执行下面的处理:将在颜色提取单元402中从要处理的文档获得的颜色信息只分配到特定颜色,例如,先前输入到信息处理装置的使用颜色信息和可能是由减色法混合所产生的颜色。例如,如果对于原始信息使用黑色(K)并使用黄色(Y)和品红色(M)作为附加写入信息,则将在颜色提取单元402中从要处理的文档获得的颜色信息分配到使用颜色和可能是由减色法混合所产生的“红色(R)”。即,即使由于扫描仪读取错误等而检测到具有小误差的颜色,也将该颜色分配到少数限定颜色中的任一个,由此可靠地提取全部信息。
下面将参照图13至15的流程图来介绍具有图12所示的构成的信息处理装置420中的处理示例。图13至15示出13A到15B的六个处理流程。在图13和14所示的流程13A到14B是在图12所示的信息处理装置420中不应用图像处理单元421的处理的处理,是使用下面单元的处理:数据输入单元401、颜色提取单元402、限定颜色图像生成单元422、颜色分析单元403、附加写入区域接合和整合单元404、附加写入区域指定部分确定单元405、附加写入区域指定部分信息分析单元406、以及分析信息存储单元407。图15A和15B所示的流程是描述除上述部件外还应用图像处理单元421的处理顺序的处理流程。
首先,介绍根据图13A的流程图的处理。首先,在S301,图12所示的数据输入单元401输入要处理的图像数据。例如,该图像数据是具有以不同彩色标记设定的属性(即,用标记进行了检查)的文档图像数据;输入通过扫描仪读取的数据、存储在存储部中的图像数据等作为要处理的数据。
在步骤S302,颜色提取单元402和限定颜色图像生成单元422执行处理。首先,颜色提取单元402提取输入的图像数据中使用的颜色。例如,提取在原始信息中使用的黑色(K)和用作附加写入信息的黄色(Y)及品红色(M),还有从附加写入信息重叠(例如,黄色(Y)和品红色(M))等中检测的红色(R),此外,还检测由于打印时或扫描时的误差而被确定为接近于黄色(Y)、品红色(M)或红色(R)的颜色的颜色区域。
限定颜色图像生成单元422执行限定颜色转换,以通过限定颜色转换确定包含小误差的颜色区域是有限个颜色。例如,执行下面的处理,即仅将颜色信息分配到先前输入至信息处理装置的使用颜色信息和可能由减色法混合所产生的颜色。如果对于原始信息使用黑色(K)并使用黄色(Y)和品红色(M)作为附加写入信息,则将在颜色提取单元402中从要处理的文档获取的颜色信息分配到使用颜色和可能由减色法混合所产生的颜色“红色(R)”。
在S303,颜色分析单元403针对从302产生的限定颜色文档提取的颜色来检查减色法混合组合。例如,如果
使用黑色(K)作为原始信息并且
使用黄色(Y)和品红色(M)作为附加写入信息,则颜色分析单元403基于使用颜色而检查可能由减色法混合所产生的颜色。在该示例中,根据以下关系式确定由减色法混合所产生的颜色为黑色(K)和红色(R):
品红色(M)+黑色(K)=黑色(K)
黄色(Y)+黑色(K)=黑色(K)
黄色(Y)+品红色(M)=红色(R)。
接下来,在S304,附加写入区域接合和整合单元404参照在S303处分析的减色法混合的组合,接合并整合各像素的区域。即,如果黑色(K)和红色(R)区域是通过减色法混合以多个颜色产生的颜色,且以品红色(M)或黄色(Y)设定的附加写入信息中的中断的发生部分是黑色(K)或红色(R),则确定该区域为使用区域之间的重叠区域并发生中断,并且接合该部分以产生经恢复的附加写入信息。
S305和S306类似于图11A所示的处理流程中的S105和S106。通过图12所示的附加写入区域指定部分信息分析单元406和分析信息存储单元407,提取由经恢复的附加写入信息所包括的信息,分析附加写入信息的内包区域中的信息并将其存储在存储部中。
在图13B所示的处理流程中,步骤S401到S403类似于图13A所示的处理流程中的S301到S303。在图13B所示的处理流程中,在步骤S404,附加写入区域接合和整合单元404参照在步骤S403分析的减色法混合的组合,接合并整合各像素的区域。即,如果黑色(K)和红色(R)区域是通过减色法混合以多个颜色产生的颜色,且以品红色(M)或黄色(Y)设定的附加写入信息中的中断的发生部分是黑色(K)或红色(R),则确定该区域为使用区域之间的重叠区域并发生了中断,并且接合该部分以产生经恢复的附加写入信息。为执行处理,如果对应于重叠颜色(减色法混合)的颜色区域大于预定值(阈值),则附加写入区域接合和整合单元404执行针对各像素的接合,并当以最短距离到达当前像素时,接合并整合该颜色区域。
步骤S405和S406类似于图11A所示的处理流程中的S105和S106。通过图12所示的附加写入区域指定部分信息分析单元406和分析信息存储单元407,提取由经恢复的附加写入信息所包括的信息,分析附加写入信息的内包区域中的信息并将其存储在存储部中。
类似于图13中的处理流程,图14所示的处理流程是在图12所示的信息处理装置420中不应用图像处理单元421的处理的处理,是使用下面单元的处理:数据输入单元401、颜色提取单元402、限定颜色图像生成单元422、颜色分析单元403、附加写入区域接合和整合单元404、附加写入区域指定部分确定单元405、附加写入区域指定部分信息分析单元406、以及分析信息存储单元407。
首先,将介绍图14A所示的处理流程。在该处理流程中,S501到S505类似于图13A所示的处理流程中的S301到S305。即,在S501,数据输入单元401输入要处理的图像数据。在S502,颜色提取单元402提取使用颜色,限定颜色图像生成单元422将提取颜色转换为限定颜色。在S503,颜色分析单元403针对从在S502产生的限定颜色图像提取的颜色检查减色法混合的组合。
接着,在S504,附加写入区域接合和整合单元404参照在S503分析的减色法混合的组合,针对各像素进行接合和整合。此外,在S505,通过经恢复的附加写入信息来确定内包区域。
在该处理示例中,S506不同于图13A所示的S306。在S506,图12所示的附加写入区域指定部分信息分析单元406获取与经恢复的附加写入信息接触且重叠的区域以及经恢复的附加写入信息所包括的区域作为分析目标信息,并且进行分析,例如执行字符识别(OCR)处理。该处理是基于如下确定的:附加写入信息与作为原始信息的字符信息之间的重叠区域例如也包含在由附加写入信息对其赋予属性的信息中。
接下来,将介绍图14B所示的处理流程。图14B中的处理流程也在图12所示的信息处理装置中执行。S601至S605类似于图13A的流程图中的S301至S305以及图14A的流程图中的S501至S505,因此将不再对其进行介绍。
在该处理示例中,S606不同于图13A中的S306和图14A中的S506。在该处理示例中,在S606,图12所示的附加写入区域指定部分信息分析单元406和分析信息存储单元407将附加写入信息的内包区域中的图像信息存储在存储部中。在迄今描述的处理流程中,针对文本图像信息执行字符识别处理(OCR),并将该信息转换为例如文本数据,然后将其存储在存储部中。然而,在该处理示例中,获取由附加写入信息指定的区域中的图像数据,并将其存储在存储部中。在该情况下,将图像数据存储在存储部中作为与特定属性相关联的图像数据。
接下来,将介绍图15所示的处理流程。在图15A和15B中所示的流程是在图12所示的信息处理装置420中应用图像处理单元421的处理的处理,是使用下面单元的处理:数据输入单元401、图像处理单元421、颜色提取单元402、限定颜色图像生成单元422、颜色分析单元403、附加写入区域接合和整合单元404、附加写入区域指定部分确定单元405、附加写入区域指定部分信息分析单元406、以及分析信息存储单元407。
首先将介绍图15A所示的处理流程。首先,在S701,图12所示的数据输入单元401输入要处理的图像数据。例如,该图像数据是具有以不同彩色标记设定的属性(即,用标记进行了检查)的文档图像数据;输入通过扫描仪读取的数据、存储在存储部中的图像数据等作为要处理的数据。
接着,在图像处理单元421中执行S702和S703。在S702,图像处理单元421利用要处理文档的标识符(例如,打印输出ID)作为关键字在信息处理装置的存储部、通过网络连接的数据库等中搜索原稿(不带附加写入的文档或图像),并输入或下载所发现的原稿。
例如,如果输入图4所示的附加写入文档202作为要处理的图像数据,则输入与附加写入文档202相对应的原始文档201,此外,在S703,图像处理单元421提取具有附加写入的图像与原稿之间的差,并提取附加写入部分的差值图像。即,例如执行图4所示的附加写入文档202与原始文档201之间的差值分析,用以提取附加写入部分的差值图像。
下面将介绍差值提取处理的概要。首先,执行对原始文档图像和附加写入文档图像两个图像的对准处理。关于两个图像的对准技术,可应用任何现有的各种技术。基本上,从图像提取类似的特征区域,并将它们彼此关联。基于相关联的特征区域计算两个图像之间的偏移量,并在基于偏移量对图像数据进行校正的同时将这些图像对准。
接着,提取经对准的原始文档图像数据与附加写入文档图像数据之差。在该处理中,例如,检测原始文档图像数据的坐标位置(x,y)与附加写入文档图像数据的坐标位置(X,Y)是否存在差值,并且仅当存在差值时,才假设该差值是用于执行数据提取的附加写入信息。在执行该处理时,提取原始文档图像数据中不存在的且仅在附加写入文档图像数据中存在的数据。
接着,在S704,颜色提取单元402基于该差值图像数据来提取使用颜色。例如,如果用作附加写入信息的颜色是黄色(Y)、品红色(M)等,则提取黄色(Y)和品红色(M)。
接着,在S705,颜色分析单元403在颜色空间(YMCK、GBR等)中针对在S704提取的各颜色提取可能发生减色法混合的部分颜色空间。例如,如果使用例如黄色(Y)和品红色(M)作为附加写入信息,则在图7A所示的颜色空间中将提取颜色241设定为黄色(Y)和品红色(M),并找出可能发生减色法混合的各部分颜色空间。
接着,在S706,附加写入区域接合和整合单元404使用减色法混合的部分颜色空间信息,参照输入的图像(附加写入文档)和差值图像,接合并整合附加写入信息的中断。如上所述,使用颜色与通过减色法混合产生的颜色之间的关系例如是:
黄色(Y)+品红色(M)=红色(R)。
基于该关系式,如果中断的发生部分的颜色是红色(R),则确定该区域为使用区域之间的重叠区域且发生了中断,并且接合该部分以产生经恢复的附加写入信息。
S707和S708类似于图11A所示的处理流程中的S105和S106。通过图12所示的附加写入区域指定部分信息分析单元406和分析信息存储单元407,提取由经恢复的附加写入信息包括的信息,分析附加写入信息的内包区域中的信息并将其存储在存储部中。
接下来,将介绍根据图15B的流程图的处理示例。图15B所示的处理流程是当原始文档为例如包含表数据的分格线等的文档时执行的处理;它是通过去除包含在附加写入文档中的分格线并消除在图12所示的信息处理装置420的图像处理单元421中的额外数据而执行处理的顺序。
首先,在S801,图12所示的数据输入单元401输入要处理的图像数据。例如,图像数据是具有以不同彩色标记设定的属性(即,用标记进行了检查)的文档图像数据;输入通过扫描仪读取的数据、存储在存储部中的图像数据等作为要处理的数据。该输入数据是通过对包含表的分格线等的原始文档赋予属性(例如通过彩色标记来赋予)而提供的附加写入文档。
接着,在图像处理单元421中执行S802和S803。图像处理单元421在S802从输入图像(附加写入文档)提取表分格线,在S803删除提取的表分格线。
接着,在S804,颜色提取单元402基于去除了分格线的图像数据而提取使用的颜色。例如,如果用作附加写入信息的颜色是黄色(Y)、品红色(M)等,则提取黄色(Y)和品红色(M)还有红色(R)等。此外,限定颜色图像生成单元422将提取颜色转换为限定颜色以产生限定颜色图像。
接着,在S805,颜色分析单元403针对从在S804处产生的限定颜色图像提取的颜色检查减色法混合的组合。此外,在S806,附加写入区域接合和整合单元404参照在S805处分析的减色法混合的组合,接合并整合各像素的区域。此外,通过图12中示出的附加写入区域指定部分信息分析单元406和分析信息存储单元407,在S807处提取经恢复的附加写入信息包括的信息,并在S808处分析附加写入信息的内包区域中的信息且将其存储在存储部中。
最后,将参照图16来介绍本发明的图像处理装置的硬件配置示例。图16所示的配置是实现为PC等的图像处理装置的硬件配置示例,该图像处理装置例如包括诸如扫描仪的图像数据读取部531和诸如打印机的数据输出部532。
CPU(中央处理单元)501是用于按照程序执行处理的控制部,所述程序记载了在实施例中先前描述的各种类型的数据处理(即,图像处理、颜色提取处理、限定颜色图像生成处理、颜色分析处理、附加写入区域接合和整合处理、附加写入区域指定部分确定处理、附加写入区域指定部分信息分析处理、分析信息存储处理等)的执行顺序。
ROM(只读存储器)502存储CPU 501使用的程序、操作参数等,RAM(随机存取存储器)503存储CPU 501的执行中使用的程序、CPU 501的执行中适当改变的参数等。它们通过实现为CPU总线等的主机总线504而连接。
主机总线504通过桥接器505连接到诸如PCI(***设备互连/接口)总线的外部总线506。
键盘508和定点设备509是由用户操作的输入设备。显示器510实现为用于显示诸如文本和图像信息的各条信息的液晶显示器、CRT(阴极射线管)等。
HDD(硬盘驱动器)511包含硬盘,并驱动该硬盘以记录或回放CPU501执行的程序和信息。该硬盘存储作为文档的原始文档、赋予了属性值的附加写入文档、应用于基于减色法混合的颜色分析处理的数据等。此外,硬盘存储各种数据处理程序、各种计算机程序等。
驱动器512读取记录在诸如磁盘、光盘、磁光盘或半导体存储器的经安装的可移动记录介质521上的数据或程序,并将数据或程序提供到通过接口507、外部总线506、桥接器505以及主机总线504连接的RAM503。可移动记录介质521也可用于像硬盘的数据记录区域。
连接端口514是用于连接外部连接机522的端口,并具有USB、IEEE1394等的连接部。连接端口514通过接口507、外部总线506、桥接器505以及主机总线504等连接到CPU 501等。通信部515连接到网络,用于执行与外部***的数据通信处理。数据读取部531执行文档读取处理,数据输出部532执行文档数据输出处理。
图16所示的图像处理装置的硬件配置示例是一个***示例,本发明的图像处理装置不限于图16所示的构成,而可以是可执行先前在实施例中描述的处理的任何构成。
尽管参照具体的实施例详细地描述了本发明,但应理解,在不脱离本发明的精神和范围的情况下对于本领域技术人员来说很多变型都是显而易见的。即,仅出于阐述的目的公开了本发明,应当理解本发明并不限于这些具体的实施例,而是由权利要求来限定。
可通过硬件和软件两者或任一个来执行说明书中描述的处理顺序。为了执行软件处理,可将记录处理顺序的程序安装在并入于执行用的专用硬件中的计算机的存储器中,或可将其安装在可执行各种类型的执行用处理的通用计算机中。
例如,可将程序预先记录在作为记录介质的硬盘或ROM(只读存储器)中,或可将其临时或永久地存储(记录)在诸如软盘、CD-ROM(光盘只读存储器)、MO(磁光)盘、DVD(数字多功能盘)、磁盘或半导体存储器的可移动记录介质中。这样的可移动记录介质可被提供为封装软件产品。
不仅可以如上所述从可移动记录介质将程序安装在计算机中,而且可以通过无线电波将程序从下载站点传送到计算机,或以有线方式通过诸如因特网的网络传送到计算机,使计算机接收如此传送的程序,并将该程序安装在并入的诸如硬盘的记录介质上。
说明书中描述的各种类型的处理不仅可按照根据描述的时间顺序来执行,而且可响应于执行处理的装置的处理能力或根据需要并行地或单独地执行。本说明书中的***是由多个单元(装置)组成的逻辑组,而并不限于容纳在单个机柜中的一组单元(装置)。
如上所述,例如,在对涉及利用彩色标记进行附加写入(其被作为针对文档的属性设定处理而执行)的附加写入文档的分析处理中,本发明的图像处理装置检测多条附加写入信息之间的重叠或附加写入信息与原始信息之间的重叠,分析重叠的颜色是由哪种颜色组合产生的,恢复在该重叠中中断的附加写入信息,并可靠地读取经恢复的附加写入信息的指定信息。图像处理装置对包含在经恢复的附加写入信息的指定信息中的字符(文本)进行字符识别等的信息分析,并将分析结果存储在数据库等中。根据该构成,例如,如果在附加写入文档中发生不同颜色标记之间的重叠或彩色标记与原始信息之间的重叠,则可以提取精确的附加写入信息,并提取和分析附加写入信息所确定的信息。

Claims (18)

1.一种信息处理装置,该信息处理装置包括:
颜色提取单元,其输入通过以不同颜色向原始文档写入附加写入信息而提供的附加写入文档,并获取该附加写入文档上的颜色信息;
颜色分析单元,其基于由所述颜色提取单元提取的颜色,分析通过颜色混合产生的颜色组合和颜色空间两者之一与由所述颜色提取单元提取的颜色之间的对应关系;
接合和整合单元,其基于所述颜色分析单元的分析结果来确定所述附加写入文档上的不同颜色之间的重叠,并接合附加写入信息的中断,所述附加写入信息的中断与该重叠相对应;
确定单元,其根据在所述接合和整合单元中接合的附加写入信息来确定所述附加写入文档的指定区域;以及
信息分析单元,其读取由所述确定单元分析出的指定区域中包含的信息。
2.根据权利要求1所述的信息处理装置,其中,所述颜色分析单元基于由所述颜色提取单元提取的颜色来在颜色空间中提取可能发生减色法混合的部分颜色空间。
3.根据权利要求1所述的信息处理装置,其中,所述颜色分析单元基于由所述颜色提取单元提取的颜色来提取与所述颜色提取单元提取的颜色相对应的减色法混合组合。
4.根据权利要求1所述的信息处理装置,其中,所述信息分析单元对由所述确定单元分析出的指定区域中包含的信息执行字符识别处理。
5.根据权利要求1所述的信息处理装置,其中,所述信息分析单元获取由所述确定单元分析出的指定区域中包含的信息作为图像数据。
6.根据权利要求1所述的信息处理装置,其中,所述信息分析单元读取以下两种信息之一:
(i)所述附加写入信息包括的区域中包含的信息,以及
(ii)所述附加写入信息包括的区域和与所述附加写入信息接触并重叠的区域中包含的信息。
7.根据权利要求1所述的信息处理装置,该信息处理装置包括:
图像处理单元,其输入原始文档和附加写入文档,并执行差值提取,
其中,
所述颜色提取单元获取关于由所述图像处理单元产生的差值图像数据的颜色信息。
8.根据权利要求1所述的信息处理装置,该信息处理装置包括:
图像处理单元,其输入附加写入文档并去除该附加写入文档上的分格线,
其中,
所述颜色提取单元获取关于由所述图像处理单元产生的已去除分格线的图像数据的颜色信息。
9.根据权利要求1所述的信息处理装置,该信息处理装置包括:
图像生成单元,其基于由所述颜色提取单元提取的颜色信息而生成限于多条预设颜色信息的限定颜色图像,
其中,
所述颜色分析单元基于该图像生成单元产生的限定颜色图像,分析通过颜色混合产生的颜色组合和颜色空间两者之一与所述颜色提取单元所提取的颜色之间的对应关系。
10.一种信息处理方法,该信息处理方法包括以下步骤:
输入通过以不同颜色将附加写入信息写入原始文档中而提供的附加写入文档;
获取所述附加写入文档上的颜色信息;
基于所提取的颜色,分析通过颜色混合产生的颜色组合和颜色空间两者之一与所提取的颜色之间的对应关系;
基于分析所获得的分析结果来确定所述附加写入文档上的不同颜色之间的重叠;
接合附加写入信息的中断,所述附加写入信息的中断与该重叠相对应;
根据经接合的附加写入信息来确定所述附加写入文档的指定区域;以及
读取分析出的指定区域中包含的信息。
11.根据权利要求10所述的信息处理方法,其中,分析对应关系的步骤是基于所提取的颜色而在颜色空间中提取可能发生减色法混合的部分颜色空间。
12.根据权利要求10所述的信息处理方法,其中,分析对应关系的步骤是基于所提取的颜色而提取与所提取的颜色相对应的减色法混合组合。
13.根据权利要求10所述的信息处理方法,其中,读取信息的步骤是对分析出的指定区域中包含的信息执行字符识别处理。
14.根据权利要求10所述的信息处理方法,其中,读取信息的步骤是获取分析出的指定区域中包含的信息作为图像数据。
15.根据权利要求10所述的信息处理方法,其中,读取信息的步骤是读取以下两种信息之一:
(i)所述附加写入信息包括的区域中包含的信息;以及
(ii)所述附加写入信息包括的区域和与所述附加写入信息接触并重叠的区域中包含的信息。
16.根据权利要求10所述的信息处理方法,该信息处理方法包括以下步骤:
输入原始文档和附加写入文档;和
执行差值提取,
其中,
获取颜色信息的步骤是获取关于所产生的差值图像数据的颜色信息。
17.根据权利要求10所述的信息处理方法,该信息处理方法包括以下步骤:
输入附加写入文档;和
去除该附加写入文档中的分格线,
其中,
获取颜色信息的步骤是获取关于所产生的已去除分格线的图像数据的颜色信息。
18.根据权利要求10所述的信息处理方法,该信息处理方法包括以下步骤:
基于所提取的颜色信息而生成限于多条预设颜色信息的限定颜色图像,
其中,
分析对应关系的步骤是基于所述限定颜色图像来分析通过颜色混合产生的颜色组合和颜色空间两者之一与所提取的颜色之间的对应关系。
CNB2006101357346A 2006-03-03 2006-10-18 信息处理装置和信息处理方法 Expired - Fee Related CN100474329C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2006057276A JP4631749B2 (ja) 2006-03-03 2006-03-03 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2006057276 2006-03-03

Publications (2)

Publication Number Publication Date
CN101030251A CN101030251A (zh) 2007-09-05
CN100474329C true CN100474329C (zh) 2009-04-01

Family

ID=38471539

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101357346A Expired - Fee Related CN100474329C (zh) 2006-03-03 2006-10-18 信息处理装置和信息处理方法

Country Status (3)

Country Link
US (1) US7925082B2 (zh)
JP (1) JP4631749B2 (zh)
CN (1) CN100474329C (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4697035B2 (ja) * 2006-04-28 2011-06-08 富士ゼロックス株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP4911065B2 (ja) * 2008-02-22 2012-04-04 富士ゼロックス株式会社 画像処理装置及びプログラム
JP4748333B2 (ja) * 2009-03-18 2011-08-17 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP2011166403A (ja) * 2010-02-09 2011-08-25 Seiko Epson Corp 画像処理装置、方法及びコンピュータプログラム
CN101794150A (zh) * 2010-04-20 2010-08-04 杭州和利时自动化有限公司 一种现场总线仪表管理***的数据管理方法及***
CN101916327B (zh) * 2010-07-09 2011-11-09 北京商纳科技有限公司 一种生成错题本的方法及***
JP5824444B2 (ja) * 2012-12-05 2015-11-25 京セラドキュメントソリューションズ株式会社 画像形成装置及びプログラム
JP6160168B2 (ja) * 2013-03-28 2017-07-12 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP6331772B2 (ja) * 2014-06-30 2018-05-30 ブラザー工業株式会社 画像処理装置およびコンピュータプログラム
JP2016181111A (ja) * 2015-03-24 2016-10-13 富士ゼロックス株式会社 画像処理装置、及び画像処理プログラム
JP6406282B2 (ja) * 2016-02-29 2018-10-17 京セラドキュメントソリューションズ株式会社 電子機器
JP6477585B2 (ja) * 2016-04-28 2019-03-06 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像処理システム
CN107358227A (zh) * 2017-06-29 2017-11-17 努比亚技术有限公司 一种标记识别方法、移动终端以及计算机可读存储介质
CN108073922A (zh) * 2017-12-21 2018-05-25 广东小天才科技有限公司 一种基于颜色限定的信息搜索方法及电子设备
US11972197B2 (en) 2018-08-27 2024-04-30 Kyocera Document Solutions Inc. OCR system
JP2020160553A (ja) * 2019-03-25 2020-10-01 東芝テック株式会社 画像処理プログラム、及び画像処理装置
CN111950231B (zh) * 2020-07-24 2022-07-29 苏州浪潮智能科技有限公司 一种bmc传感器信息检查比对方法及***
CN113362428B (zh) * 2021-06-30 2023-09-15 北京百度网讯科技有限公司 用于配置颜色的方法、装置、设备、介质和产品

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0424885A (ja) * 1990-05-21 1992-01-28 Oki Electric Ind Co Ltd 読書処理装置
JP3178483B2 (ja) 1992-06-09 2001-06-18 富士ゼロックス株式会社 文書処理装置
JP3897392B2 (ja) 1997-03-12 2007-03-22 キヤノン株式会社 画像処理装置
JPH10336466A (ja) * 1997-05-29 1998-12-18 Toshiba Corp 画像形成装置および画像処理装置
JPH11272654A (ja) 1998-03-20 1999-10-08 Toshiba Corp 文書編集装置及び方法
JP3748172B2 (ja) * 1998-12-09 2006-02-22 富士通株式会社 画像処理装置
JP2002123815A (ja) 2000-10-17 2002-04-26 Oki Electric Ind Co Ltd ファイリング装置
JP2003018393A (ja) 2001-07-03 2003-01-17 Ricoh Co Ltd 画像処理システム
JP2003050970A (ja) * 2001-08-07 2003-02-21 Ricoh Co Ltd 情報入力装置
JP2003271942A (ja) 2002-03-18 2003-09-26 Ricoh Co Ltd バーコード記録方法、画像補正方法および画像補正装置
JP4300083B2 (ja) * 2003-09-18 2009-07-22 株式会社日立製作所 帳票読取り装置

Also Published As

Publication number Publication date
JP2007233900A (ja) 2007-09-13
CN101030251A (zh) 2007-09-05
US7925082B2 (en) 2011-04-12
JP4631749B2 (ja) 2011-02-16
US20070206851A1 (en) 2007-09-06

Similar Documents

Publication Publication Date Title
CN100474329C (zh) 信息处理装置和信息处理方法
US7936929B2 (en) Image processing method and apparatus for removing noise from a document image
CN101661465B (zh) 图像处理装置及图像处理方法
US20070263930A1 (en) Character recognition processing system and computer readable medium storing program for character recognition processing
WO2010073540A1 (en) Business document processor
US7844080B2 (en) Image processing system and image processing method, and computer program
US20030039394A1 (en) Image processing device, image processing method, image processing program, and computer readable recording medium on which image processing program is recorded
US20060285763A1 (en) Image processing apparatus, image processing method, and computer program
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2007006059A (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2003087562A (ja) 画像処理装置および画像処理方法
JP5673277B2 (ja) 画像処理装置およびプログラム
JP4200824B2 (ja) カラー画像出力装置、画像データ制御プログラム及びそのプログラムを記憶した記憶媒体
CN112132008A (zh) 文档文件检测方法、装置、电子设备及可读存储介质
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
KR101664185B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 컴퓨터 판독 가능한 기억 매체
JP2007219682A (ja) 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
CN112613290A (zh) 单证模板生成方法、装置、设备及存储介质
JP2006201965A (ja) 帳票識別システム
EP1852805A2 (en) Information processing apparatus, information processing method, and infomation storing medium
JP4333297B2 (ja) 印刷イメージ表示装置
CN103327216A (zh) 图像处理装置和图像处理方法
JP4050677B2 (ja) 画像処理装置、画像処理方法及びプログラム並びに記録媒体
JP2005055996A (ja) 図面の電子化保管方法と図面の電子化保管システム及び図面データ提供システム
JP2002015323A (ja) 文書画像レイアウト識別方法および装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090401

Termination date: 20181018