CN1655584A - 将图像数据组织到区域中的***和方法 - Google Patents

将图像数据组织到区域中的***和方法 Download PDF

Info

Publication number
CN1655584A
CN1655584A CNA200510009471XA CN200510009471A CN1655584A CN 1655584 A CN1655584 A CN 1655584A CN A200510009471X A CNA200510009471X A CN A200510009471XA CN 200510009471 A CN200510009471 A CN 200510009471A CN 1655584 A CN1655584 A CN 1655584A
Authority
CN
China
Prior art keywords
cluster
spot
color
space
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200510009471XA
Other languages
English (en)
Other versions
CN100446542C (zh
Inventor
D·J·库里
A·纳发里赫
D·克勒特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 6 LLC
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of CN1655584A publication Critical patent/CN1655584A/zh
Application granted granted Critical
Publication of CN100446542C publication Critical patent/CN100446542C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

图像数据初始地以类似用于将图像数据变换成三层的混合光栅内容格式的方式被处理。在图像数据通过三层分段过程的第一阶段被初始地处理之后,不是完成分段成前景和背景平面的分段,而是分析图像数据以识别具有类似图像特性的区域。如果这些区域共享颜色特性并在空间上接近,它们在一个集群中被分组在一起。接着根据集群的大小排序这些集群,并基于一个或多个颜色特性将它们放到一个二元前景平面中。每个集群被聚集在具有与该集群相同颜色的二元前景平面中。

Description

将图像数据组织到区域中的***和方法
技术领域
本发明涉及与本申请同一日期提交的美国专利申请(代理案号117521,117544,117745,117747,117748,118584,118591,118601和118664),在这里引用其全部并作为参考。
本发明涉及将图像数据组织到具有相似位置和颜色特性的区域中。
背景技术
在高分辨率下扫描的文档通常要求很大量的存储空间。另外,大量的图像数据要求显著更多时间和带宽来操纵,比如在局域网或广域网上、在内联网、外联网或互联网或其他分布式网络上传递。
在使用扫描仪等扫描文档之后,通常使用RGB颜色空间(即以原始RGB(raw RGB)格式)定义所述文档。然而,文档图像数据并不是以该原始扫描的RGB格式被存储的,而通常是受到某种形式的数据压缩来减少其量,从而避免了存储这样的扫描的RGB文档图像数据的高成本。
诸如Lempel-Ziv(LZ)或Lempel-Ziv-Welch(LZW)的无损游程(run-length)压缩方案,对扫描的图像数据或一般来说对具有平滑变化的低空间频率(诸如梯度和/或自然照片数据)的图像数据执行得不是特别好,然而诸如JPEG的有损方法对于平滑变化的连续色调图像数据工作良好。但是,有损方法通常例如对二元文本和/或线艺术(line art)图像数据或一般来说对包含尖锐的边缘或颜色过渡的任何高空间频率图像数据工作得不那么良好。
发明内容
满足诸如上述不同类型的图像数据的对数据的压缩需要的一种新途径是使用解码器管道,其使用混合光栅内容(MRC)格式来描述数据。数据图像(例如定义具有与颜色和/或灰度信息互相混合的文本的合成图像的图像数据)被分段成两个或多个平面。这些平面通常被称之为背景平面和前景平面。选择器平面被生成来为合成图像中的每个像素指示哪些图像平面包含应当用来重建最后输出图像的实际的图像数据。按这种方式将图像数据分段成平面往往会改善图像的总体压缩,因为数据可被安排成不同的平面,使得每个平面比原始图像数据更平滑和更可压缩。分段还允许对不同的平面应用不同的压缩方法。因此,对于每个平面中的数据类型来说的最适合的压缩技术可被应用来压缩该平面的数据。
不幸的是,一些诸如便携文档格式(PDF)的图像文档格式当前不完全支持原始文档的这样的三层混合光栅内容分解。结果,当试图打印或呈现已经使用该图像文档格式被压缩和存储为混合光栅内容图像数据文件的文档时,该文档要么根本不能被呈现,要么在呈现时包含讨厌的伪像。
提供用于将文档变换成具有多个二元前景平面的混合光栅内容格式的***和方法。在扫描文档之后,使用边界连续性和/或颜色连续性来分析图像数据,以识别区域(或斑点)。给每个像素分配一个id,只要求该id在斑点边界矩形内是唯一的,并且构造通过边界矩形和像素id识别斑点并列出其他属性的表格。分析该表格以排序和过滤斑点并将具有类似位置和颜色特性的斑点集群在一起。所述集群接着被放置到多个前景层之一中。二元前景层的每一个被分配有一个颜色值,该颜色值近似于分配给该层的所有斑点的平均颜色。通过这种方式,用可接受的颜色变化在输出图像中呈现高质量的图像。
附图说明
下面详细描述本发明,并参考以下附图,其中:
图1说明被分解到多个二元前景图像平面和一个背景平面中的图像的示例实施例;
图2说明斑点ID图像数据的一个示例实施例;
图3说明其中可操作斑点集群处理模块的***的一个示例实施例;
图4说明在斑点全局表格中的斑点或集群的一个条目的一个示例实施例;
图5说明图3的斑点集群处理模块的一个示例实施例;
图6说明边界框的示例实施例;
图7说明图像数据的页面如何被分成多个拼接块;
图8说明扩展边界框的一个示例实施例;
图9说明用于根据斑点的集群的空间和颜色关系描述斑点的集群的数据结构的一个示例实施例;
图10说明新的集群如何通过图4的斑点集群处理模块的构建集群模块在集群链开始处被***;
图11说明具有下一个及内容链接字段的集群表格条目;
图12说明要确定一个集群在空间上与另一个集群重叠的要求;
图13说明具有在空间上重叠的扩展边界框的斑点如何通过图5的斑点集群处理模块的构建集群模块被添加到集群链表上;
图14说明如何通过组合图像页面的拼接块来组合集群;
图15说明颜色集群的顶部级别如何通过斑点集群处理模块的集群合并模块被移除;
图16说明空间集群如何通过斑点集群处理模块的集群合并模块被合并;
图17说明由斑点集群处理模块的内部斑点模块检测内部斑点;
图18是说明执行内部斑点的检测的状态机的图表;
图19是说明由集群排序模块使用的斑点排序例程的图表;
图20是概述用于把斑点组织和标记到二元平面数据中的示例方法的流程图,所述二元平面数据用于产生页面的压缩表示;
图21是更详细地概述用于根据各个测试标准标记集群的示例方法的流程图;
图22是更详细地概述用于组织和关联斑点的各个集群的示例方法的流程图;
图23是更详细地概述用于识别和标记完全包含在另一个斑点内的斑点的示例方法的流程图。
具体实施方式
公开了自动处理扫描的和/或打印的彩色文档以生成小的、高压缩的精确捕获原始文档内容的图像数据文件的***和方法的不同示例实施方式。通过在文档中扫描并且分析数据以确定图像的哪些像素可因为它们具有类似颜色和由闭合的曲线边界定义而被分组在一起来生成数据文件。接着,通过组合在空间上互相接近的类似颜色的区域来将这些区域集群在一起。组合的区域(集群的区域)接着被放置在多个二元前景层的其中之一中,并且可例如被压缩以作为PDF文件输出。
图1显示被分解成一个背景连续色调或灰度层(背景层)210和N个二元前景层的文档的图像数据。在本例中,存在6(N=6)个二元前景层220-270。图像数据包含被分离成6个不同颜色值的低空间频率颜色数据。6个颜色值的每一个与多个二元前景层220-270的特定一个相关联,所述二元前景层220-270包括包含6个颜色其中之一的区域220’-270’的空间范围。不包括在区域220’-270’其中之一的数据保留在背景层210中。描述了用于生成其每一个将被分配到二元前景层中的空间区域220’-270’的***和方法。
在多个二元前景层220-270的任何一个中的图像数据部分不与其他多个二元前景层220-270的任何一个中的其他图像数据重叠。结果,二元前景层220-270的每一个可单独地与背景层210组合而不用考虑顺序或次序。当所有多个二元前景层220-270与背景层210组合时,获得重建的图像280。二元平面的进一步处理可产生稍好的压缩,但是却要求对前景平面的至少部分的空间排序。
图像数据中的像素可被识别为属于一个“斑点”,其是一个由一个闭合的曲线边界限定并包含具有类似颜色值的像素的区域。可产生图像数据的映射,其将一个非唯一的小id分配给每个像素,使得该id只在分配有这个id的斑点的边界矩形内是唯一的。还可产生图像数据的替换的映射,其将一个唯一的id分配给每个斑点,但是id的大小就要求足够的大,以寻址所有的斑点。接下来的描述集中使用小的id(8比特)映射,因为其在当前实现方式的关键点上要求较少的资源。斑点ID图像的例子在图2中示出。具有斑点ID“1”的斑点被显示为大致具有字母“A”的形状的轮廓。用于描述斑点的一个参数是斑点边界框,其是完全封闭该斑点的最小矩形。在x维中的最小值min_x1、在x维中的最大值max_x1、在y维中的最小值min_y1和在y维中的最大值max_y1定义图2中斑点#1的斑点边界框的范围。
斑点#2是另一个斑点,其由min_x2、max_x2、min_y2和max_y2定界。这两个斑点可通过斑点集群处理模块集群在一起。该集群可接着被分配给N个二元前景层的其中之一,如在下面完整描述的。
图3显示用于从扫描的文档图像生成N个二元前景层的示例***。图3显示由扫描仪400扫描的文档300,生成例如在RGB颜色空间中的图像数据,并且图像数据被输入到N层图像数据生成***1000。由N层图像数据生成***1000产生的N层接着由压缩模块800压缩并作为例如PDF文件输出。
N层图像数据生成***1000中的第一模块是颜色变换模块500。颜色变换模块500可例如将RGB数据变换到YCC颜色空间。如周知的那样,YCC颜色空间包括亮度分量(Y)和两个色度分量(CC)。该色度分量可以以2:1的比率至少在一个方向上(如果不是两个方向的话)作子采样,使得色度分量中的数据点是亮度分量中的数据点的一半。还可以使用诸如Lab的其他颜色空间。
在YCC颜色空间中的图像可接着被输入到斑点识别模块600,该模块生成出现在图像中的区域(或斑点)的列表。斑点是基于边缘连续性和颜色特性被识别的。斑点是具有连续边界的区域,该边界封闭具有几乎相同的颜色值的像素。斑点识别模块600将斑点ID分配给图像中每个像素,以指示(如果有斑点的话)像素属于哪个斑点。不属于斑点的像素被分配给背景层。每个像素位置的斑点ID的映射是斑点标识(斑点ID)图像,并由斑点识别模块600生成。
斑点识别模块600还生成斑点的全局表格(GTB),其是在文档图像280中找到的所有斑点的列表。在图4中示出GTB中的单个条目。GTB包含和斑点一样多的斑点条目。每个GTB条目的前四个字段310-340是与该斑点关联的边界框的坐标。作为整体的斑点的行和列的位置由边界框的min_x、max_y(左上角)确定。斑点集群处理模块700使用边界框,以确定斑点是否相互接近,并将在空间上接近的斑点组合。
亮度350和色度值360和370是分配给一个斑点的颜色总和;总的像素计数380是在斑点ID图像中的已被分配给给定斑点的像素的总数(例如图2中斑点#1的总的像素计数是163);可选的var值是斑点的色度值的差异;ID字段410是在映射图像中使用的斑点(非唯一的)ID;索引字段420是可选的唯一斑点标识符。包括在每个GTB条目中的标记字段430,根据斑点是否通过一组测试标准来存储由斑点集群处理模块应用到斑点的标记,这将在下面作进一步的描述。斑点的“下一个”字段440和“内容”字段450存储指示当前斑点所链接到的斑点的指针。
并且,由斑点识别模块生成的是增强的颜色数据(ENH),其是扫描的、YCC变换的图像。在ENH中的数据是“增强的”,因为斑点的边缘特征已经基于周围像素的对比度而被增强。ENH以及GTB和斑点ID映射图像被输入到斑点集群处理模块700。
斑点集群处理模块700输入斑点ID映射图像、GTB和ENH,分析斑点的全局表格,并将共享特定颜色和空间特性的那些斑点组合到N个集群的区域中。斑点集群处理模块700根据集群的区域的颜色值将集群的区域分配给N+1个二元前景层中的一个。第一层(层0)是选择器层,其通过对层1到N取OR(或)而获得。剩余的层1到N包含N层信息。这些层接着在以例如PDF格式输出之前被压缩模块800压缩。
图5显示斑点集群处理(BCP)模块700的示例实施例,包括CPU710、输入/输出端口780、存储器770、构建集群模块720、集群排序模块730、标记斑点模块740、生成层模块750、合并集群模块705和内部斑点模块760。上述部件710-780可经由总线790被耦合到一起。虽然使用总线体系结构图说明斑点集群处理模块700,但也可以使用任何其他类型的硬件配置,诸如使用特定用途集成电路(ASIC)来实现一个或多个部件,或写一个在CPU710中执行的计算机程序来执行斑点集群处理模块700的所有功能。
斑点集群处理模块700通过输入/输出端口780从斑点识别模块600输入ENH、斑点ID映射数据(BID)和GTB,并且生成N+1个二元前景层。输入数据可以被全部存储在存储器770中,或按所需要的量被存储,用以处理工作中的数据。
当从斑点识别模块600接收GTB时,集群排序模块730排序斑点以按方便后来的斑点集群处理阶段的顺序放置它们。可通过交换GTB中的表格记录内容来“原地”地完成排序。集群排序模块730首先按垂直位置(慢扫描)顺序排序斑点,接着按水平位置(快扫描)顺序排序斑点。集群排序模块730基于斑点边界框的左上角排序斑点。只要两个或多个斑点没有落在同一条线上,那么就根据边界框左上角位于哪条线上来按线号顺序地排序斑点,在两个或多个斑点落在同一条线上的情况下可根据哪个斑点边界框落在最左边的像素上来排序它们。
集群排序模块730还通过将颜色总和除以像素计数来规格化GTB中的颜色总和,以获得平均的斑点颜色。通过四舍五入到最近的一个整数来完成规格化。在获得平均斑点颜色的精确值后,斑点像素计数被调节为小于或等于预定的上限。该最后的步骤在非常大的斑点的情况下防止在后续的步骤中出现算术溢出。在处理的这个时刻之后,该计数只被用于确定斑点的权重,以便计算斑点的集群的平均。
排序模块730接着将GTB传递给标记斑点模块740。标记斑点模块740分析GTB中的每个斑点,并将一个标记应用于标记字段430,这取决于许多测试条件的结果。在创建GTB时,标记字段430被斑点识别模块600初始化成0。标记斑点的目的是为了指示哪些斑点可由下游过程消除,以便减少斑点的数量,从而减少处理的负担。因此,标记过程使用标记字段430,用以达到处理负担减少的目的。
标记斑点模块740根据5个不同的条件测试斑点。如果满足条件,在标记字段中的比特被改变,以标记该斑点。每个条件导致标记字段中不同的比特模式。为了加速这个过程,基于边界框而不是基于精确的斑点形状来使用简单的测试。标记斑点模块740条件按下列顺序被应用:
1)检查斑点区域是否太小。
2)检查像素计数密度是否小于预定的最小密度。
3)检查边界框的高宽比(宽度/高度)是否太大或太小。该条件可指示斑点是一条线。
4)检查边界框宽度或高度是否太大。
5)检查斑点区域是否足够大,以及平均亮度是否接近白色。
根据所应用的如上列出的测试条件的结果来设置标记字段430的一些比特。其他比特可以在稍后被设置。测试条件的顺序表示重要性递增的顺序。在完成时,标记字段430包含来自所满足的最后一个测试的代码。只有当所有5个测试都失败,斑点才将保持为未标记(代码0)。
标记斑点模块740不移除和改变任何斑点,而只是当满足一个或多个测试条件时改变标记字段。后续模块可检测以上标记代码的一个或多个以消除标记的斑点。另外,后续步骤可改变或添加其他标记的代码。
标记斑点模块740进一步测试以确定斑点的颜色是否具有落入特定预定限制的可变性。如果没有,斑点由此被标记。只有具有至少最小像素计数(例如至少500像素)和还没有被标记图形模块标记的斑点才被检查颜色的可变性。
虽然斑点内的所有或大部分的像素可被用于颜色可变性测试,以增加颜色可变性测试的速度,但是只有位于诸如中线的单个线上的像素可被测试,如图6所示。通过对斑点边界框的顶部和底部的线求平均并四舍五入到最近的整数来确定每个斑点的中线。从由边界框确定的左边的第一个斑点像素开始并在右边的最后一个斑点像素结束,标记斑点模块740评估中线上的斑点像素。标记斑点模块740接着检查在中线上的斑点像素的颜色变化。
对于每一个在属于由斑点ID图像指示的当前斑点的中线上的像素,从增强的颜色数据ENH获取像素色度值。如图6所示,只使用被标记为“X”的像素。标记为“O”的像素不是当前斑点的一部分,从而不被使用。标记斑点模块740通过测量当前“X”像素颜色和平均斑点色度的色度差来计算颜色变化,平均斑点色度由Cb、Cr颜色总和给出。对于每个“X”像素,色度平方的贡献被加在一起:
SUM=(ENH1(pixe1)-ave[1])2+(ENH2(pixe2)-ave[2])2    (1)其中ENH1和ENH2是像素色度分量值(Cb、Cr),ave[1]和ave[2]是斑点平均色度值(Cb、Cr)。
同时,计数“X”像素(属于中间的扫描线上的当前斑点)的数目。在遇到中间线上的最后一个像素之后,由像素计数规格化根据公式(1)计算的累加的色度平方差。
标记斑点模块740接着将计算的色度平方差与预定的限制作比较。如果色度平方差超过这个限制,由此标记该斑点。标记斑点模块740接着进行检查在斑点的全局表格中的下一个斑点。该过程重复直到检查了最后一个斑点为止。
在标记了斑点之后,它们被集群以组合那些具有类似颜色特性和在位置上邻近的斑点。因为每个集群将最终被分配到其自己的二元前景平面,所以构建集群模块720寻求将尽可能多的斑点合并到尽可能少的集群中。构建集群模块720基于所排序和标记的斑点的颜色和空间关系将它们组织成集群。
构建集群模块720通过将图像区域划分成邻近且并不重叠的正方形拼接块而启动。拼接块的目的是将被评估的图像区域减少为更可管理的大小。拼接块的大小是可编程的(例如,256×256个像素)。为了方便,拼接块的大小被限制为二的二进制幂。图像区域和拼接块关系在图7中说明。构建集群模块通过将图像区域的宽度和高度除以拼接块的大小来(加1以向上取整到下一个整数)确定在图像区域上的拼接块的数量。
构建集群模块720按颜色和空间位置分组斑点,以形成斑点的颜色集群和空间集群。每个颜色集群包含一个或多个在颜色上类似的斑点,即颜色的不同量小于预定颜色门限的区域。如在现有技术中是周知的,颜色门限可按照斑点之间的亮度差的平方、或者色度平方差来定义。每个颜色集群包含至少一个空间集群,以及每个空间集群包含至少一个斑点。如果一个颜色集群包含多个空间集群,它们必须在颜色上相近。如果空间集群包含多个斑点,这些斑点必须相互接近。
为了确定斑点是否应当加入到空间集群,使用一个扩展边界框。扩展边界框的目的是定义仍然被考虑为在相同空间集群中的斑点之间的可接收的距离门限。具有重叠的扩展边界框的斑点被认为是足够的相互接近以属于同一个空间集群。聚集的边界框与空间集群相关联,所述聚集的边界框包括被包含在集群内的所有斑点的扩展边界框。附加的斑点被添加到集群中,调节空间集群的聚集的边界框,以包括附加斑点的扩展边界框。
在图8中示出的是扩展边界框的例子。扩展边界框754对于原始的边界框752的宽高成比例地扩展,直到预定的限制。通过加上每一侧上的原始宽度的可编程分数来计算扩展的宽度756。同样,通过从上面和下面加上原始高度的可编程分数来计算扩展的高度。在两种情况下,扩展的量受到另一个参数的限制(例如,在每一侧上不超过60个像素)。
例如,返回到图2,被识别为斑点“1”的斑点(字母“A”)具有在x方向上扩展两列的扩展边界框,给出ex_max_x1的扩展边界框边界。类似,斑点#2也被扩展两列,给出ex_min_x2的扩展边界框边界。因此,斑点#1被包括在与被识别为斑点“2”的斑点相同空间集群内(如果它们的颜色值足够接近的话),因为斑点“1”的扩展边界框边界(exp_max_x1)与斑点“2”的扩展边界框边界(exp_min_x2)重叠。
基于在最终得到的二元前景层的数量和所述二元层的压缩效率之间的扩展来选择边界框扩展的大小。因为使用较大的扩展边界框,在较大程度上分离的斑点将被斑点集群处理模块结合到一起,使得再现图像只需要更少的前景层。但是,这会影响具有宽间隔的斑点二元层的压缩效率。虽然,扩展的边界框754跨过图像的该分段上的所有4个拼接块,扩展的边界框754的左上角的位置751确定初始的集群所属于的拼接块。因此,图8的斑点将被初始地包括在拼接块1的集群中。
为了当集群被从斑点集合时跟踪集群的内容,构建集群模块720维持在每个拼接块生根的两个级别的集群数据。例如,如果图8的斑点是拼接块1的第一个斑点,拼接块1将包含一个颜色集群,该颜色集群包含一个将包含该斑点的空间集群。该空间集群的扩展边界框将是该斑点的扩展边界框。并且,空间和颜色集群的颜色都与该斑点的相同。集群数据结构使用与斑点相同的记录类型(图4)。字段的使用稍微不同,这在于斑点的cont(内容)字段总是空的,而空间集群的cont字段总是指向斑点列表的头部,并且颜色集群的cont字段总是指向空间集群列表的头部。
next字段指向列表中下一个记录。斑点的next字段指向一个斑点。空间集群的next字段指向一个空间集群。并且颜色集群的next字段指向一个颜色集群。在列表的末尾,next字段是NULL。由构建集群模块720使用的一个示例数据结构在图9中示出。
图9显示了一个三个级别的数据结构,该结构被用于当斑点被合并到集群中时跟踪每个斑点。例如,数据结构的顶部级别735包含颜色集群746、747和748。颜色集群是空间集群的分组,其与预定颜色门限(比如20)比较具有相同或相似的颜色。数据结构的第二级别736包含空间集群731、732、733和734,它们包含具有重叠扩展边界框的斑点。通过在单个空间集群下将斑点链接在一起而把具有相似颜色并且其对应的扩展边界框重叠的斑点集群在一起。空间集群cont字段指向该斑点列表。因此,空间集群734包含斑点874、该斑点又通过next指针被链接到斑点873和872。
底部级别737包含通过cont指针被链接到空间集群和通过next指针被链接到在相同集群内的斑点的原始斑点。因此,使用“下一个”指针,每个集群或斑点被链接到相同级别上的其他集群或斑点,并且通过“cont”指针,集群被链接到较低级别上的其他集群。因此,“next”指针链接了一个集群或斑点的链,并且“cont”指针链接集群或斑点的内容。所有集群列表可使用相同的基本数据结构。
构建集群模块720一次一个斑点地处理来自GTB的斑点,并且为了下列讨论的目的,来自列表的每个斑点依次变为“当前”斑点。从GTB条目检索当前斑点的左上边界框角的坐标,并且用于通过将该坐标除以拼接块的大小来确定对应的拼接块号。
在每个拼接块中找到的第一个斑点开始新的集群链表,之后的斑点将被链接到该第一个斑点。拼接块条目识别集群所属于的拼接块。来自GTB中的斑点条目的斑点数据包括像素数、亮度和色度,所述斑点数据可被拷贝到新的颜色和空间集群记录中。通过扩展斑点边界框来计算新的集群边界框。颜色集群cont字段将指向空间集群,并且空间集群内容字段将指向斑点。
在拼接块中找到的下一个斑点可被分配给现有的空间集群,或可创建新的集群以将其包含。例如,如果当前斑点872被确定为不匹配任何已经创建的颜色集群,那么在集群列表中创建新的颜色集群846,并将其***到颜色集群链表的开头。
图10显示用于将新的颜色集群846***到已经包含845和844的集群链表中的程序。为了***新的颜色集群,在***新的颜色集群之前的对应拼接块条目中的集群索引被拷贝到新的颜色集群的next字段中,并且拼接块条目被修改成包含新的颜色集群的索引。这有效地在链的开始添加当前集群846。
因为新添加的集群846是顶部级别735颜色集群,下两个级别736和737也需要在此时建立。颜色集群846的cont字段被设置成指向在级别736创建的新的空间集群858。
最后,通过链接新建立的空间斑点858和当前斑点872来更新集群数组的斑点级别737。如上所述,当新的空间和颜色集群858和846被创建时,只存在一个关联的斑点。但是在此之后,如果附加的斑点或集群在颜色上紧密地匹配并且满足空间重叠,那么可添加附加的斑点或集群。
如可从图10中看出的,新添加的颜色集群846被加入到其所位于的拼接块的链的开始处。所有三个级别735-737被创建并经由cont和next指针链接在一起。初始地,三个级别735-737的内容几乎相同(除了顶部两级735和736的扩展边界框,以及不同的内容和next指针)。但是在此之后,如果找到颜色匹配以及空间匹配,就可添加附加的斑点,并且接着集群将开始累加平均颜色和聚集的边界框,如下进一步所述。
图11显示来自集群数据结构的链接的集群条目的示例图。集群条目对应在图10的较低部分中显示的集群。集群846经由其next指针链接到集群845,并且集群845经由其next指针链接到集群844。集群846还经由其cont指针链接到集群858,并且集群858经由其cont指针链接到集群872。集群8 57经由其cont指针链接到集群871,并且集群871经由其next指针链接到集群870。最后,集群844经由其cont指针链接到集群856,并且集群856经由其cont指针链接到集群869。
如果两个颜色集群具有落入颜色门限内的颜色值,或两个空间集群具有重叠的扩展边界框,可将它们合并。进行合并包括更新平均颜色和像素计数。用于更新这些值的公式为:
cnt=cnt1+cnt2                                      (2)
Y1=(Y1*cnt1+Y2*cnt2)/cnt                           (3)
Cb1=(Cb1*cnt1+Cb2*cnt2)/cnt                        (4)
Cr1=(Cr1*cnt1+Cr2*cnt2)/cnt                        (5)
若(cnt1>MaxCount),则新的cnt1=MaxCount            (6)其中Y1、Y2、Cb1、Cb2、Cr1、Cr2是亮度和色度值,并且cnt1和cnt2是像素计数。组合两个扩展边界框,产生定界这两个边界框的边界框。最后,由两个集群的cont字段所指向的任何内容列表通过将一个列表附着到另一个来被组合,并且该组合的列表将被新的cont字段所指向。如果两个被合并的集群已经在相同的列表中,必须从该列表移除一个并且另一个可用于包含所合并的数据。
因为优化了上面的集群合并方法,还可以在初始将斑点***到拼接块集群结构期间使用该方法。创建候选的临时空间集群,其具有为当前斑点计算的扩展斑点边界框并且其cont字段指向该斑点。它的next字段是空的,因为它还不是列表的一部分。为一个颜色匹配搜索颜色集群链表。如果没有找到匹配的颜色集群,使用当前集群的颜色和扩展边界框字段来初始化新的颜色集群。接着,为任何具有与当前空间集群相交的扩展边界框的空间集群搜索匹配的(或新的)颜色集群的空间集群列表。如果找到空间匹配,当前集群被合并到匹配的空间集群。如果没有找到匹配,当前集群被添加到颜色集群的任何现有内容的开始。在图12中说明了对空间匹配的测试。空间匹配的测试只在已经在颜色上紧密匹配的集群之间执行。空间匹配的要求是在集群的两个扩展边界框之间(例如在图12中框881、882、883和884与885间)存在至少一个像素的重叠。为了达到在文本字和字符之间的空间匹配,使用扩展边界框,同时如上所述那样,所述扩展与边界框区域成比例直到特定的限制。
如果找到这样的重叠集群,当前集群数据被合并到该空间集群中。建立新的聚集的边界框,其包括所合并的边界框的范围。因此,聚集的边界框具有x维的范围,该范围包括在新合并的集群内的斑点在x方向上最宽的扩展。类似的,聚集的边界框具有y维的范围,该范围包括在新合并的集群内的斑点在y方向上最宽的扩展。
如上所述,如果没有找到空间重叠的集群,当前空间集群被添加到(可能是新的)颜色集群的内容列表的开头。图13示例说明了将新的空间集群***到现有的集群链中的过程。如图13所示。新的空间集群859被指定为当前空间集群的拷贝。新的集群859在空间集群链的开始处被***。颜色集群846的先前的cont字段被拷贝到集群859的next字段,并且修改先前指向集群858的颜色集群846的next字段,以指示新的集群859。这在空间链表中建立了新的集群859的位置。最后,新的空间斑点859的cont字段被更新为当前斑点873。这完成了用于该种情况的3级别结构735-737。
构建集群模块720接着进行检查GTB中的下一个斑点。重复该过程直到所有斑点基于其颜色匹配和空间近似性被***到3级别结构735-737中为止。
一旦已经完成整个3级别结构735-737,构建集群模块720开始合并集群以减少剩余集群的数量。仅当颜色集群的平均颜色如由可编程参数定义的那样足够接近,才将这些颜色集群合并。仅当空间集群的扩展边界框重叠时,才将这些空间集群合并(参看图12)。
在集群合并之后,通过合并重叠穿过拼接块边界的集群,移除每组2×2相邻拼接块之间的边界。图14说明了拼接块边界的移除和集群的合并。在移除拼接块边界之间的边界之前,图14中的左上拼接块具有3个颜色集群810、814和818,右上的具有两个颜色集群812和816,并且其他拼接块每个只有一个集群820和822(总共6个集群)。假设平均颜色紧密地匹配,图14的底部示出只有4个颜色集群在一个合并步骤之后被保留,即824、826、828和830。成对的红色、蓝色和黑色集群被合并在一起,并且为每个颜色更新新的边界框以覆盖组合的区域。但是,如果颜色不紧密地匹配(对于颜色集群),或者扩展边界框不重叠(对于空间集群),那么不合并这些集群。
此刻,新的集群数组被指定为在每个方向上具有一半数量的拼接块,并且用组合的数据填充条目。对于一组2*2拼接块的合并操作在图14中说明。合并操作重复直到拼接块的大小覆盖整个图像数据。
最后的集群结构被传递给合并集群模块705。合并集群模块705首先从集群结构移除顶部级别735的颜色集群。这只留下了空间颜色集群及其关联的斑点。合并集群模块705的操作在图15中示出。移除颜色集群并释放存储器。接着空间集群经由它们的next字段被链接到长的链表上,如图15所示。例如,集群859的next字段被修改以指向集群858,并且集群858的next字段指向集群857,和集群857的next字段指向集群856,等等。
合并集群模块705为基于颜色匹配和空间重叠合并集群的可能性再次搜索空间集群链表。如果找到匹配,如所述的那样将数据合并到第一集群,并且删除第二集群。链接被重新连接,以在没有被消除的集群情况下保持列表。合并集群模块705的操作在图16中说明。通过首先基于边界框最小y坐标对列表进行优化的排序,极大地加快了用每个其他集群对每个集群的穷尽测试。接着,每个集群被针时列表中的位置在其之上的所有的集群而测试。对于特定的参考集群,检查只沿列表向下进行(从参考集群的next字段开始),直到遇到了具有比当前参考集群的最大y更大的最小y的集群。该意味着,通常只有列表的较短范围才需要与每个集群比较。
如图16所示,如果合并集群模块705检测到与现有空间集群858重叠的空间集群857,集群857的内容被***到858的集群链表中,这是通过更新包含在集群858中的斑点872的next指针以参考前一个集群857的内容。因此,先前现有的集群858现在包含现有的斑点872,其又链接到链表中的新的斑点871,该新的斑点又链接到斑点869。没有受到合并过程影响的集群859和856以及它们的相关内容斑点875、874、873和868保持和以前一样。
合并集群模块705直接从关联的斑点数据内容重新计算空间集群。合并集群模块705通过评估空间集群链表进行重新计算。对于每个空间集群,基于包含在集群内的斑点重新计算像素计数、颜色平均值和聚集的边界框(没有扩展)。可监视累加的YCC颜色总和,以防止溢出,这例如是通过必要时将总和和像素计数除以2。用重新计算的数据替代空间集群数据。重新计算过程除了使用精确的边界框而不是扩展的边界框之外,类似于上述由集群排序模块730执行的过程。
重新计算的原因是由构建集群模块720集群的斑点依靠扩展边界框来连接集群。但是,完成集群之后,在被分离成N层之前需要精确的边界框来计算区域的大小。另外,重复的集群合并操作可能遭受累积的错误。最后,合并集群模块705检查没有扩展的实际的集群像素计数,以便消除太小的集群。
合并集群模块705消除可能是坏的集群,并且重新调节斑点的mark字段。空间集群被认为是标记的,如果它太小(在特定门限之下的像素计数)或者包含在其中的被标记的斑点分数超过特定的级别。在该情况下,被链接到集群的所有斑点的标记字段被设置为非零值。否则,被链接到集群的所有斑点的mark字段被清零(没有标记)。消除被如上指示那样标记的空间集群,并更新next链接,以在没有所消除的集群的情况下维护空间集群列表。这种过滤允许包括入非常小的斑点(诸如通常可能因为太小而被消除的文本中的句号),因为它们将是与大部分没有被标记的文本斑点集群的。另一方面,可能标记在图像中不经意发现的不期望的斑点并且使得它们的集群被移除。
斑点识别过程的自然结果是,每个斑点要么完全在其他每个斑点内,要么完全在其外。在合并集群模块705完成合并过程之后,内部斑点模块760检查每个斑点,以查看其是否完全包含在另一个未标记的斑点内,也就是说,如果是的话,它就是“内部”。从集群中移除任何被确定为内部的斑点。内部斑点的一个典型例子是包含在字符内的孔,诸如“b”、“e”和“o”等等。内部的孔通常可被斑点识别模块600归类为斑点。
内部斑点模块760的操作要求检查所有斑点对之间的可能内部斑点。因为这种情况带来的计算负载,在合并集群模块705之后应用内部斑点模块,其中许多坏的和小的斑点被消除(标记)。这留下了更少的斑点供内部斑点模块760测试内部斑点之用。
为了进一步提升性能,可使用简单的检查。例如只检查边界框条件和仅一条扫描线的斑点ID信息,简单的检查减少了计算的数量。
内部斑点模块760检查斑点对的所有可能组合。从GTB顺序地选出在之前已经被边界框的最小y排序的第一斑点,斑点A。接着,从紧接A之后的GTB开始处选出第二斑点,斑点B。对于每个斑点,从斑点的全局表格检索边界框和斑点ID。相对于斑点A,斑点B被测试为内部斑点。测试过程被设计为在可能的时候利用捷径。该模块应用了以下的测试:
(1)检查每个斑点的mark字段。如果斑点A或斑点B已经被标记,不进行测试(只测试之前没有被标记的对)。
(2)基于边界框检查斑点对的垂直重叠。如果斑点B的顶部线超过斑点A的底部线,那么B不可能在A的内部,并且因为列表被排序,所以不需要对A进行测试。
(3)对斑点B的边界框在所有边上进行检查,以确保其完全包含在斑点A的边界框的内侧。如果即使有一条边突出到斑点A的边界框的外侧,那么B就不可能完全在A的内部。
(4)如果斑点A和斑点B通过上面的测试(1)到(3),斑点B的中间扫描线上的斑点ID像素被检查,检查是如边界框所确定的那样从斑点A的最小x像素开始的并且进行到这条线上的斑点A的最大x像素。使用状态机来检测斑点ID状态以确认从斑点A到斑点B的过渡。如果适当的状态被检测到,将斑点B标记为内部的。
在图17中说明确定斑点B是否是斑点A的内部斑点的过程。图17显示了边界框884的中间线881,其包括斑点A。中间线881的前三个像素的每一个被确定为在斑点A的内部,并且到斑点B的过渡出现在像素883。因为已经满足前面的条件的每一个,斑点B被识别为A的内部。
在图18中示出的状态机890说明确定内部斑点的一个示例过程。状态机890对于A和B斑点的每个候选对被重置为0状态。如图17中所示的那样,像素在斑点B的中间线上移动时,检查这些像素的斑点ID。状态机890查找斑点ID=A的第一次出现。只要看到任何不同于A或B的ID,其保持为0。但是,如果在第一个斑点IDA之间看到斑点IDB,就意味着B不在A的内部。在这种情况下,状态可被设置为10,表明B不是内部斑点。
一旦看到第一斑点IDA,状态变化到1。现在状态机890开始查找斑点IDB的出现。只要斑点IDA继续被观察到,状态保持为1。但是,如果不同于A或B的任何ID在斑点IDA之后并且在斑点IDB之前出现,状态被重置为0以重新开始。仅当斑点IDB正好出现在斑点IDA之后,状态变化为2,以表明B是内部斑点。只要达到该状态,就可以退出该测试。
如果找到状态2,通过打开B斑点的mark字段430中的inner位而把B斑点标记为内部斑点。在所有其他情况下,B斑点不被标记为内部。
应当注意到,A到B的过渡(状态2)是足够的。不需要检查在另一边上的B到A的过渡,因为这是由斑点识别模块600保证的。
如上所述,在检查了B是否是A的内部斑点之后,过程继续以检查在GTB中的下一个B斑点。这样继续GTB中的最后一个斑点被评估,或者B的最小y大于A的最大y时。此刻,A所有的内部斑点都已被识别和被标记。该过程接着继续以选出在GTB中的下一个A斑点,并且再次在它和所有后续B斑点之间检查内部斑点。不需要检查A之间的斑点,因为已经测试过这样的组合了,并且A不可能在具有小于或等于A的最小y值的斑点的外部。该过程继续直到斑点A到达斑点的全局表格中的最后的斑点。此刻,内部斑点组合的所有有效对都被检查了。
内部斑点模块760检查每个空间集群的斑点内容,以查看是否存在任何被内部斑点模块760标记为内部斑点的斑点,即是被完全包含在另一个斑点内的斑点。内部斑点模块760接着沿着与每个集群关联的斑点列表并在排除内部斑点的同时重新计算集群信息。这包括了基于每个斑点内的像素的数目对边界框联合(排除内部斑点)和新的加权平均颜色的重新计算。此外,监视累加的YCC颜色总和,以防止溢出,这例如是通过必要时将总和和计数除以2。
接着,内部斑点模块760检查最终得到的排除了内部斑点的集群像素计数,并且将其与预定的门限比较。如果最终得到的集群的大小太小了,就移除整个集群并且与其相关的所有斑点被标记。
但是,如果所得的集群大小足够得大,则更新的YCC颜色总和被像素计数规格化,并且排除了内部斑点的新的平均颜色被加载到集群数据中以代替前一总和。同样,排除了内部斑点的新的像素计数和更新的边界框信息被加载到集群数据中。
集群排序模块730从最大到最小的像素计数按大小排序空间集群。排序的目的是通过首先绘出较大的层来提供最快的PDF观看。因为在此刻,层的数目相对较小,该排序方法可基于冒泡排序算法,如以下参考图19所描述的。
空间集群链991、992和993每次被一个集群跟随。在每一步,当前集群991的大小与后续集群992的大小比较。后续集群992是通过跟随来自当前集群991的next链接而被识别的。集群的大小由count字段给出,其包含了在该集群中聚集的像素的数量。如果在991中的像素数量小于在992的count字段中的像素的数量,则交换在链表中的集群位置,并更新它们的next链接以反映出新的位置。
例如,图19中的集群991包含比下一个集群992更少的像素。因此,交换集群991和992。接着,第二集群(交换之后为991)相对于第三集群993被测试。因为991小于993,再次交换这两个集群。过程继续直到到达链表中最后一个集群。在第一遍结束时,具有最小大小的集群被确保为链表中最后的集群,因为最小的集群无论在哪里都是被从其在链表中的当前的位置选出并被冒泡排序到达链表的末尾。但是,在它之前的集群仍然没有按大小递减被排序。如图19所示,在第一遍排序结束时,即使993更大,集群992也在993之前。因此,过程必须被重复N次以确保所有的集群按照大小递减被排序。每一次,下一个更小的集群被冒泡排序到链表的末尾。最后的状态如图19的底部所示。
应当注意到,在每个排序步骤,集群内容不改变。修改的只是集群在链表中的相对位置。新的位置是经由next字段通过更新的链接顺序给出的。还应当注意到,每个集群的cont条目保持不变。这意味着每个集群保留其自身关联的本来的斑点链表。
生成层模块750接在集群排序模块730之后。生成层模块750将空间集群变换成二元屏蔽平面。顺序地分配给每个集群一个从1开始的层号。如前所述,空间集群、以及因此二元平面按像素计数值的降序排序。选择器平面(一个附加的二元屏蔽平面号0),将是层1到N的联合并具有与背景层相同的大小。因此,层的数目与所剩的空间集群的数目加上1相等。
生成层模块750还可移除每个平面周围的白色边界,并且将每个平面字节对准(byte-align)偶数字节边界。对各个平面的字节对准加快了创建层0(即所有层的联合)的过程。为了产生一个字节对准的层,生成层模块750减小边界框的左边坐标(最小x),使得它变为8的倍数。这可稍微增加层的大小。只有边界框的左边坐标被生成层模块750修改。
生成层模块750接着创建二元(N+1)平面。平面1到N包含对应层的二元数据。基于由生成层模块750计算的(字节对准的)边界框来确定每个平面的大小。平面0包含相当于从层1到N组合的做了OR(或)运算的数据的二元选择器平面。平面0的大小与背景平面相同。
生成层模块750每次创建一个平面。如前所述,集群排序模块730将平面按像素计数值递减顺序排序。对于每个平面,字节对准的边界框被用来计算平面的大小并为二元图像分派适量的存储器存储。该平面被初始设置为0。接着处理在平面的集群内容列表中的每个斑点。对于每个斑点,检查对应于斑点的边界框的ID映射图像的所有的位置。对于在具有等于斑点ID的ID的该边界框中的每个映射像素,层平面中的对应比特被设置为1。在创建每个平面之后,所述比特还被OR(或)运算到平面0,即选择器平面。当所有的层预先被生成层模块750字节对准时,OR(或)运算过程被极大地简化,使得不需要在子字节边界上移位的数据。平面的数量等于所剩的层的数量。每个平面是打包的二进制格式(每个像素1比特,每字节8像素)。
虽然前面的描述是参考硬件实施例给出的,斑点集群处理还可作为在微处理器上执行的软件实现。在这种情况下,所述方法的每个步骤由适当编程的微处理器执行,或由硬件和软件的组合执行。
图20是说明用于将列在斑点全局表格中的斑点变换成n个二元前景层的方法的一个示例实施例的流程图。如图20所示,在步骤S200中开始方法的操作,其中斑点的全局表格中的每个斑点被规格化。在不同的示例实施例中,斑点是根据其像素计数被规格化的。过程接着进行到步骤S300。在步骤S300中,斑点的YCC被变换为一个连续的灰度色调(如果选择这个选项的话)。过程接着进行到步骤S400。在步骤S400中,根据像素在扫描的图像中的位置排序像素。过程接着进行到步骤S500。在步骤S500中,将索引分配给每个斑点以存储其排序后的顺序。过程接着进行到步骤S600。在步骤S600中,根据多个测试条件中的一个来分析和标记每个斑点。过程接着进行到步骤S800。在步骤S800中,标记其颜色可变性超过特定门限的斑点。过程接着进行到步骤S900。
在步骤S900中,从GTB构建集群,其中从在颜色上类似并相互接近的斑点得到集群。在步骤S1000,在步骤S900中创建的集群表格的顶部级别(颜色级别)被移除。在步骤S1100,在颜色上足够类似并且在空间上重叠的集群被合并,以减少所剩的集群的数量。在步骤S1200中,重新计算剩余的集群颜色,并且集群计数在步骤S1100的合并操作之后被更新。在步骤S1300中,从集群列表中消除不包括最小门限数量的像素的集群。在步骤S1400中,被完全包含在另一个斑点内的斑点被标记为“内部”。在步骤S1500中,移除先前被标记为内部的斑点。在步骤S1600中,剩余的集群在步骤S1500中的移除内部斑点之后被重新计算。在步骤S1700中,按照大小排序斑点。
在步骤S1800中,剩余的集群斑点被顺序地分配到二元前景平面。在步骤S1900中,不同的前景平面被字节对准到偶数字节边界。接着,在步骤S2000中,生成N+1个二元平面。平面0(即选择器平面)被用来屏蔽灰度背景平面内的图像数据。调节灰度背景平面以提高可压缩度。接着,在步骤S2100中,使用适合于二元前景平面的压缩技术来压缩在步骤S1900中确定的分离的二元前景平面的每一个。操作接着进行到步骤S2200。
在步骤S2200中,使用适合于背景平面数据的压缩技术来压缩背景平面。接着,在步骤S2300中,从压缩的二元前景平面和压缩的灰度背景平面生成便携文档格式(PDF)文档文件。接着,在步骤S2400中,所生成的便携文档格式(PDF)文档文件被输出到下游处理器和/或被存储到存储器中。接着操作结束。
应当理解,在不同的示例实施例中,任何已知或后来开发的文档格式可代替便携文档格式(PDF)在步骤S2300和S2400中被使用。
图21显示图20的步骤S600的进一步的细节。过程在步骤S605开始,其中从斑点全局表格选择第一或下一个斑点。过程接着进行到步骤S610。在步骤S610中,确定斑点区域是否小于特定的预定门限。如果是,控制进行到步骤S615,其中用表明斑点区域太小的代码标记斑点。过程接着进行到步骤S620。在步骤S620中,确定是否已经到达斑点全局表格中的最后的斑点,如果没有,则控制返回到步骤S610,其中选择表格中的下一个斑点。如果已经到达最后的斑点,则过程结束,并且控制返回到图20的步骤S800。
如果在步骤S610中确定斑点区域不小于特定预定的门限,则操作接着进行到步骤S630,其中确定斑点像素密度是否小于一个预定的门限。如果是,在步骤S635用表明像素密度太小的代码标记斑点。在步骤S640,确定是否已经到达斑点全局表格中的最后的斑点,如果没有,控制返回到步骤S605,其中选择表格中的下一个斑点。如果已到达表格中最后的斑点,过程结束,并且控制返回到图20的步骤S800。
如果在步骤S630中确定像素密度不小于该预定的门限,操作接着进行到步骤S650,其中确定斑点斑点的高宽比是否大于或小于一个特定预定的门限。如果高宽比小于或大于该预定门限,用表明高宽比小于或大于特定门限的代码标记斑点。在步骤S660,确定是否已经到达表格中的最后的斑点,如果没有,控制返回到步骤S605,其中选择表格中的下一个斑点。如果已到达表格中最后的斑点,控制返回到图20的步骤S800。
如果在步骤S650中确定高宽比不小于或不大于特定预定门限,操作接着进行到步骤S675,其中确定斑点边界框的高度或宽度是否小于一个预定的门限。如果是,控制进行到步骤S680,其中用表明边界框的高度或宽度小于一个预定的门限的代码来标记斑点。在步骤S685,确定是否已经到达表格中的最后的斑点。如果没有,控制返回到步骤S605,其中选择表格中的下一个斑点。在步骤S685,如果已到达表格中最后的斑点,控制返回到图20的步骤S800。
如果确定斑点边界框的高度和宽度不小于一个特定预定的门限,控制接着进行到步骤S695,其中确定斑点是否足够大于一个特定的预定门限,以及亮度是否接近白色。如果是,在步骤S700用表明斑点足够大于一个特定的预定门限以及亮度接近白色的代码标记斑点。在步骤S705,确定是否已经到达表格中的最后的斑点。如果没有,控制返回到步骤S605,其中选择表格中的下一个斑点。如果已到达表格中最后的斑点,控制返回到图20的步骤S800。
如果在步骤S695中确定斑点不足够大以及亮度不接近白色,那么在步骤S715确定是否已经到达表格中的最后的斑点。如果没有,控制返回到步骤S605,其中选择下一个斑点。如果是,控制返回到图20的步骤S800。
图22显示图20的步骤S900的进一步的细节。根据图22,过程在步骤S905开始,其中页面区域被分成正方形的拼接块。过程接着进行到步骤S910。在步骤S910中,初始化一个集群数组,其将包含指向属于各个列在该集群数组中的集群的斑点的指针。过程接着进行到步骤S915。在步骤S915中,选择来自斑点全局表格中的第一或下一个斑点。过程接着进行到步骤S920。在步骤S920中,将斑点颜色与在集群数组中的集群的颜色比较,以确定是否存在颜色匹配。如果不存在,在步骤S925中在集群数组中创建新的颜色集群,并且控制跳到步骤S945,其中确定是否到达表格中最后的斑点。如果颜色的确与现有的颜色集群匹配,在步骤S930中确定在颜色集群的内容列表中是否存在空间上重叠的集群。如果不存在,新的空间集群被添加到颜色集群的内容列表中,并且控制跳到步骤S945,其中确定是否到达表格中最后的斑点。如果存在在空间上重叠的集群,在步骤S940,当前斑点被添加到该空间集群的cont字段中的斑点链表中。在步骤S945,确定是否到达表格中最后的斑点。如果没有,控制反回到步骤S915以获得下一个斑点。如果是,操作进行到步骤S950。
在步骤S950,如果颜色之间的距离足够接近,合并在集群数组中的集群。在步骤S955,具有相同颜色并在空间上重叠的集群被合并。在步骤S960,组合各组2×2拼接块的集群列表。该组合的结果是,在步骤S965中合并具有相同颜色的集群。在步骤S970中还合并作为该组合的结果的具有相同颜色并在空间上重叠的集群。在步骤S975中,确定所组合的拼接块的大小是否与页面图像大小相同。如果不同,控制返回到步骤S960,其中另一组2×2拼接块的集群列表被组合。如果所组合的拼接块的大小与页面图像大小相同,程序在步骤S980结束,并且返回到图20的步骤S1000。
图23显示概述图21的步骤S1400的进一步细节的流程图。根据图23,程序在步骤S1405开始,其中从斑点全局表格选择第一斑点A。在步骤S1410中,确定斑点A是否已经被标记。如果是,控制进行到步骤S1455,其中确定是否到达在表格中的最后的斑点。如果不是,控制返回到步骤步骤S1405,其中从斑点全局表格选择下一个斑点A。如果A没有被标记,在步骤S1415从斑点全局表格选择斑点对的第二个斑点,斑点B。在步骤S1420中,确定斑点B是否已经被标记。如果是,控制跳到步骤S1447,其中确定是否到达在表格中的最后的斑点B。如果不是,控制进行到步骤S1415,其中选择下一个斑点B。如果已到达在表格中的最后的斑点B,控制跳到步骤S1445,其中确定是否到达最后的斑点A。如果是,过程在步骤S1460结束。
如果B没有被标记,控制进行到步骤S1425,其中确定斑点B是否与斑点A在垂直方向重叠。如果没有,控制返回到步骤S1447,其中确定是否到达在表格中的最后的斑点B。如果斑点B是与斑点A在垂直方向重叠,则在步骤S1430确定斑点A的边界框是否在所有边上包围斑点B的边界框。如果没有,控制返回到步骤S1447,其中确定是否到达在表格中的最后的斑点B。如果斑点A的边界框是在所有边上包围斑点B的边界框,控制进行到步骤S1440,其中确定在中间线分段上是否存在两个邻近的像素,其中第一个像素属于斑点A,第二个斑点属于斑点B。如果没有,控制返回到步骤S1445,其中从斑点全局表格中选择下一个斑点B。如果在跨越A的宽度的线分段上找到A到B的斑点对,那么在步骤S1450斑点B被标记为斑点A的内部斑点。接着,控制进行到步骤S1447。
在步骤S1447,确定是否到达在斑点全局表格中的最后的斑点B。如果没有,控制返回到步骤S1415,其中从斑点全局表格选择下一个斑点B。如果在步骤S1447已到达在斑点全局表格中的最后的斑点B,那么控制进行到步骤S1455,其中确定是否到达在表格中的最后的斑点A。如果是,控制进行到步骤S1460,其中通过返回到图20的步骤S1500,过程结束。
虽然已结合各个示例实施例描述了本发明,但是这些实施例应当被视为说明性的,而不是限制性的。可在本发明的精神和范围内进行各种修改、替换等。

Claims (3)

1.一种用于组织在图像数据中被识别的区域的方法,包括一个或多个以下步骤:
形成一个或多个颜色集群,每个颜色集群包括具有小于一个颜色门限的颜色差的图像数据的区域;和
如果被包括在颜色集群中的两个或更多的区域的最接近的边界位于一个距离门限内,则将所述两个或更多的区域分组成一个或多个空间集群的其中之一。
2.一种用于组织在图像数据中被识别的区域的方法,包括:
将图像数据的图像区域分成多个拼接块;
基于每个区域的边界框的位置,将图像数据的一个或多个区域分配给拼接块,以及一个或多个以下步骤:
通过在每个颜色集群中包括具有小于一个颜色门限的颜色差别的拼接块区域,以形成一个或多个颜色集群;和
如果被包括在第一颜色集群内的两个或更多的区域的最接近的边界位于一个距离门限内,将包括在第一颜色集群内的所述两个或更多的区域分组到一个空间集群中。
3.一种用于处理图像数据的区域的设备,包括:
颜色集群处理器,它通过对处于彼此的颜色门限内的图像数据区域进行分组来形成一个或多个颜色集群;和/或空间集群处理器,它为颜色集群的每一个形成一个或多个空间集群,当颜色集群的相应的边界框位于彼此的距离门限内时,该颜色集群的区域被包括在空间集群中;和
平面生成器,其基于颜色或空间集群创建二元输出平面。
CNB200510009471XA 2004-02-12 2005-02-08 将图像数据组织到区域中的***和方法 Expired - Fee Related CN100446542C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/776,602 US7343046B2 (en) 2004-02-12 2004-02-12 Systems and methods for organizing image data into regions
US10/776602 2004-02-12

Publications (2)

Publication Number Publication Date
CN1655584A true CN1655584A (zh) 2005-08-17
CN100446542C CN100446542C (zh) 2008-12-24

Family

ID=34701361

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200510009471XA Expired - Fee Related CN100446542C (zh) 2004-02-12 2005-02-08 将图像数据组织到区域中的***和方法

Country Status (5)

Country Link
US (1) US7343046B2 (zh)
EP (1) EP1564684B1 (zh)
JP (1) JP4587832B2 (zh)
CN (1) CN100446542C (zh)
TW (1) TWI380234B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102089785A (zh) * 2008-07-11 2011-06-08 佳能株式会社 文档管理设备、文档管理方法和存储介质
CN101527779B (zh) * 2009-03-12 2012-06-27 北京大学 一种校色的方法和装置
CN101887409B (zh) * 2009-05-12 2012-10-03 上海易狄欧电子科技有限公司 阅读器间共享电子书数据的传输方法

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590291B2 (en) * 2004-12-06 2009-09-15 Intel Corporation Method and apparatus for non-parametric hierarchical clustering
US7814129B2 (en) * 2005-03-11 2010-10-12 Ross Neil Williams Method and apparatus for storing data with reduced redundancy using data clusters
US7792359B2 (en) 2006-03-02 2010-09-07 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US8630498B2 (en) * 2006-03-02 2014-01-14 Sharp Laboratories Of America, Inc. Methods and systems for detecting pictorial regions in digital images
US7889932B2 (en) * 2006-03-02 2011-02-15 Sharp Laboratories Of America, Inc. Methods and systems for detecting regions in digital images
US8437054B2 (en) * 2006-06-15 2013-05-07 Sharp Laboratories Of America, Inc. Methods and systems for identifying regions of substantially uniform color in a digital image
US7864365B2 (en) 2006-06-15 2011-01-04 Sharp Laboratories Of America, Inc. Methods and systems for segmenting a digital image into regions
US7876959B2 (en) 2006-09-06 2011-01-25 Sharp Laboratories Of America, Inc. Methods and systems for identifying text in digital images
ITVA20060079A1 (it) * 2006-12-19 2008-06-20 St Microelectronics Srl Metodo di classificazione cromatica di pixel e metodo di miglioramento adattativo di un'immagine a colori
US8621064B2 (en) * 2007-03-28 2013-12-31 Yahoo! Inc. System and method for associating a geographic location with an Internet protocol address
US8024454B2 (en) * 2007-03-28 2011-09-20 Yahoo! Inc. System and method for associating a geographic location with an internet protocol address
US8068684B2 (en) 2007-05-04 2011-11-29 I.R.I.S. Compression of digital images of scanned documents
US20090041344A1 (en) * 2007-08-08 2009-02-12 Richard John Campbell Methods and Systems for Determining a Background Color in a Digital Image
US7907778B2 (en) * 2007-08-13 2011-03-15 Seiko Epson Corporation Segmentation-based image labeling
US8121403B2 (en) * 2007-10-30 2012-02-21 Sharp Laboratories Of America, Inc. Methods and systems for glyph-pixel selection
US8339399B2 (en) 2007-10-31 2012-12-25 Microsoft Corporation Declustering point-of-interest icons
US8503036B2 (en) * 2008-06-23 2013-08-06 Xerox Corporation System and method of improving image quality in digital image scanning and printing by reducing noise in output image data
US8446463B2 (en) * 2008-08-22 2013-05-21 Genprime, Inc. Apparatus, method and article to perform assays using assay strips
US20100124372A1 (en) * 2008-11-12 2010-05-20 Lockheed Martin Corporation Methods and systems for identifying/accessing color related information
US8351691B2 (en) * 2008-12-18 2013-01-08 Canon Kabushiki Kaisha Object extraction in colour compound documents
JP4698743B2 (ja) * 2009-01-22 2011-06-08 シャープ株式会社 画像圧縮方法、画像圧縮装置、画像形成装置、コンピュータプログラム及び記録媒体
JP5173898B2 (ja) * 2009-03-11 2013-04-03 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム
JP4998496B2 (ja) * 2009-03-16 2012-08-15 富士ゼロックス株式会社 画像処理装置、情報処理装置および画像読取装置
US8761465B2 (en) * 2009-03-18 2014-06-24 Microsoft Corporation Centroid processing
US8659620B2 (en) * 2009-04-13 2014-02-25 Accusoft Corporation Methods and apparatus for rendering images
DE102010028894B4 (de) * 2009-05-13 2018-05-24 Koh Young Technology Inc. Verfahren zur Messung eines Messobjekts
US8532437B2 (en) * 2009-05-18 2013-09-10 Citrix Systems, Inc. Systems and methods for block recomposition for compound image compression
US20100296734A1 (en) * 2009-05-20 2010-11-25 Colorcom, Ltd. Identifying and clustering blobs in a raster image
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
JP5327469B2 (ja) * 2009-08-10 2013-10-30 富士ゼロックス株式会社 画像処理装置、画像処理プログラム
JP2011040970A (ja) * 2009-08-10 2011-02-24 Canon Inc データ処理装置、および、データ処理方法
US8306345B2 (en) * 2009-09-22 2012-11-06 Xerox Corporation 3+N layer mixed raster content (MRC) images and processing thereof
US8565531B2 (en) * 2009-10-09 2013-10-22 Xerox Corporation Edge detection for mixed raster content (MRC) images for improved compression and image quality
US20110134245A1 (en) * 2009-12-07 2011-06-09 Irvine Sensors Corporation Compact intelligent surveillance system comprising intent recognition
CN102110122B (zh) 2009-12-24 2013-04-03 阿里巴巴集团控股有限公司 一种建立样本图片索引表和图片过滤、搜索方法及装置
US8335379B2 (en) * 2009-12-28 2012-12-18 Xerox Corporation System and method for cleanup of MRC images for improved compression and image quality
JP5636674B2 (ja) * 2010-01-07 2014-12-10 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8582906B2 (en) * 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
US9697751B2 (en) * 2010-03-09 2017-07-04 Microsoft Technology Licensing, Llc Interactive representation of clusters of geographical entities
US20110225546A1 (en) * 2010-03-09 2011-09-15 Ramos Gonzalo A Map spotlights
US8345998B2 (en) 2010-08-10 2013-01-01 Xerox Corporation Compression scheme selection based on image data type and user selections
US8457426B1 (en) * 2011-05-18 2013-06-04 Adobe Systems Incorporated Method and apparatus for compressing a document using pixel variation information
CN102253970B (zh) * 2011-06-09 2013-11-13 北京新媒传信科技有限公司 一种图像处理方法
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5842441B2 (ja) * 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
JP5853470B2 (ja) 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5796392B2 (ja) 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
US9552129B2 (en) 2012-03-23 2017-01-24 Microsoft Technology Licensing, Llc Interactive visual representation of points of interest data
US20130257885A1 (en) * 2012-03-28 2013-10-03 Intel Corporation Low Power Centroid Determination and Texture Footprint Optimization For Decoupled Sampling Based Rendering Pipelines
US10002310B2 (en) 2014-04-29 2018-06-19 At&T Intellectual Property I, L.P. Method and apparatus for organizing media content
US10045029B2 (en) * 2014-05-06 2018-08-07 Intel Corporation Clustering and encoding for color compression
US9582727B2 (en) 2015-01-16 2017-02-28 Sony Corporation Text recognition system with feature recognition and method of operation thereof
US10361919B2 (en) 2015-11-09 2019-07-23 At&T Intellectual Property I, L.P. Self-healing and dynamic optimization of VM server cluster management in multi-cloud platform
US20180047193A1 (en) * 2016-08-15 2018-02-15 Qualcomm Incorporated Adaptive bounding box merge method in blob analysis for video analytics
US10576475B2 (en) 2016-09-15 2020-03-03 Genprime, Inc. Diagnostic assay strip cassette
US10158784B2 (en) 2016-12-07 2018-12-18 Xerox Corporation System and method for adaptively compressing data having noisy images using lossless compression
US10409451B2 (en) * 2017-07-01 2019-09-10 Ledvance Llc Apparatus containing color coded group and member icons and method of grouping and degrouping members icons in lighting applications
WO2019157025A1 (en) 2018-02-06 2019-08-15 Vatbox, Ltd. System and method for generating an electronic template corresponding to an image of an evidence

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4849914A (en) 1987-09-22 1989-07-18 Opti-Copy, Inc. Method and apparatus for registering color separation film
US5515452A (en) 1992-12-31 1996-05-07 Electroglas, Inc. Optical character recognition illumination method and system
US5544256A (en) * 1993-10-22 1996-08-06 International Business Machines Corporation Automated defect classification system
US5577135A (en) * 1994-03-01 1996-11-19 Apple Computer, Inc. Handwriting signal processing front-end for handwriting recognizers
US5583659A (en) 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
US5745596A (en) 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US6024018A (en) * 1997-04-03 2000-02-15 Intex Israel Technologies Corp., Ltd On press color control system
US6741655B1 (en) * 1997-05-05 2004-05-25 The Trustees Of Columbia University In The City Of New York Algorithms and system for object-oriented content-based video search
US5900953A (en) 1997-06-17 1999-05-04 At&T Corp Method and apparatus for extracting a foreground image and a background image from a color document image
AUPO960297A0 (en) * 1997-10-03 1997-10-30 Canon Information Systems Research Australia Pty Ltd Colour advising and selection method
US6058214A (en) 1998-01-20 2000-05-02 At&T Corp. Compression of partially masked still images
IL124616A0 (en) * 1998-05-24 1998-12-06 Romedix Ltd Apparatus and method for measurement and temporal comparison of skin surface images
US6236764B1 (en) * 1998-11-30 2001-05-22 Equator Technologies, Inc. Image processing circuit and method for reducing a difference between pixel values across an image boundary
US6400844B1 (en) * 1998-12-02 2002-06-04 Xerox Corporation Method and apparatus for segmenting data to create mixed raster content planes
US6324305B1 (en) * 1998-12-22 2001-11-27 Xerox Corporation Method and apparatus for segmenting a composite image into mixed raster content planes
US6598054B2 (en) * 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US6115031A (en) * 1999-04-23 2000-09-05 Lexmark International, Inc. Method of converting color values
US6469706B1 (en) * 1999-11-16 2002-10-22 International Business Machines Corporation Method and apparatus for detecting regions belonging to a specified color surface in an unsegmented image
US6473522B1 (en) * 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
US6633670B1 (en) * 2000-03-31 2003-10-14 Sharp Laboratories Of America, Inc. Mask generation for multi-layer image decomposition
US7672022B1 (en) 2000-04-07 2010-03-02 Hewlett-Packard Development Company, L.P. Methods and apparatus for analyzing an image
EP1173003B1 (en) * 2000-07-12 2009-03-25 Canon Kabushiki Kaisha Image processing method and image processing apparatus
JP2002209103A (ja) * 2001-01-09 2002-07-26 Minolta Co Ltd 画像処理装置
US7145676B2 (en) * 2001-01-31 2006-12-05 Hewlett-Packard Development Company, L.P. Compound document image compression using multi-region two layer format
US6721448B2 (en) * 2001-02-20 2004-04-13 International Business Machines Corporation Color clustering and segmentation using sigma filtering
DE60109278T2 (de) * 2001-06-26 2006-03-30 Nokia Corp. Verfahren und Gerät zur Lokalisierung von Schriftzeichen in Bildern aus einer Digitalkamera
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US20030165263A1 (en) * 2002-02-19 2003-09-04 Hamer Michael J. Histological assessment
TW577227B (en) * 2002-04-23 2004-02-21 Ind Tech Res Inst Method and apparatus for removing background of visual content
US7324120B2 (en) * 2002-07-01 2008-01-29 Xerox Corporation Segmentation method and system for scanned documents
US7403661B2 (en) * 2004-02-12 2008-07-22 Xerox Corporation Systems and methods for generating high compression image data files having multiple foreground planes
US7379587B2 (en) * 2004-02-12 2008-05-27 Xerox Corporation Systems and methods for identifying regions within an image having similar continuity values
US7386166B2 (en) * 2004-02-12 2008-06-10 Xerox Corporation Systems and methods for connecting regions image data having similar characteristics

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102089785A (zh) * 2008-07-11 2011-06-08 佳能株式会社 文档管理设备、文档管理方法和存储介质
CN102089785B (zh) * 2008-07-11 2014-01-08 佳能株式会社 文档管理设备和文档管理方法
US8650473B2 (en) 2008-07-11 2014-02-11 Canon Kabushiki Kaisha Document managing apparatus, document managing method, and storage medium
CN101527779B (zh) * 2009-03-12 2012-06-27 北京大学 一种校色的方法和装置
CN101887409B (zh) * 2009-05-12 2012-10-03 上海易狄欧电子科技有限公司 阅读器间共享电子书数据的传输方法

Also Published As

Publication number Publication date
EP1564684A2 (en) 2005-08-17
US7343046B2 (en) 2008-03-11
EP1564684A3 (en) 2007-12-05
JP2005228341A (ja) 2005-08-25
CN100446542C (zh) 2008-12-24
TWI380234B (en) 2012-12-21
EP1564684B1 (en) 2015-04-08
JP4587832B2 (ja) 2010-11-24
US20050180647A1 (en) 2005-08-18
TW200535729A (en) 2005-11-01

Similar Documents

Publication Publication Date Title
CN1655584A (zh) 将图像数据组织到区域中的***和方法
CN1617567A (zh) 彩色图像压缩方法和装置
US7623259B2 (en) Image processing apparatus and image processing method to store image data for subsequent retrieval
CN1655583A (zh) 生成具有多个前景平面的高压缩图像数据文件的***和方法
US7876471B2 (en) Image processing apparatus, control method and program thereof which searches for corresponding original electronic data based on a paper document
US20010014176A1 (en) Document image processing device and method thereof
CN101046848A (zh) 图像处理设备和图像处理方法
CN1453747A (zh) 聚类
CN1102778C (zh) 能简单修饰文件数据的文件处理装置
US8792719B2 (en) Image processing device determining attributes of regions
CN1220964C (zh) 图象处理装置和图象处理方法
US6731789B1 (en) Image processing apparatus and method, and storage medium
CN1173283C (zh) 文献图象处理装置和方法
US8248426B2 (en) Image processing apparatus for displaying colors included in a color image and an image processing method, and a storage medium therefor
US8830529B2 (en) Image processing device for accurately identifying region in image without increase in memory requirement
JP2005107691A (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US20230316697A1 (en) Association method, association system, and non-transitory computer-readable storage medium
CN1674634A (zh) 用于进行颜色转换的方法和设备
CN1254764C (zh) 表单处理装置和表单处理方法
JP4217969B2 (ja) 画像処理装置及びプログラム
JP4396331B2 (ja) 画像処理装置
JP2007295275A (ja) プリンタ間のマッチング精度を確認するためのシステム、方法及びプログラム
JP4259310B2 (ja) 画像処理装置及びプログラム
JP4507656B2 (ja) 画像処理装置
JP4193687B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20151022

Address after: Delaware, USA

Patentee after: III holdings sixth LLC

Address before: Connecticut, USA

Patentee before: Xerox Corp.

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081224

CF01 Termination of patent right due to non-payment of annual fee