CN110888611B - 图像处理装置和图像处理方法以及存储介质 - Google Patents

图像处理装置和图像处理方法以及存储介质 Download PDF

Info

Publication number
CN110888611B
CN110888611B CN201910857783.8A CN201910857783A CN110888611B CN 110888611 B CN110888611 B CN 110888611B CN 201910857783 A CN201910857783 A CN 201910857783A CN 110888611 B CN110888611 B CN 110888611B
Authority
CN
China
Prior art keywords
character
image
color
block
units
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910857783.8A
Other languages
English (en)
Other versions
CN110888611A (zh
Inventor
村石雅明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN110888611A publication Critical patent/CN110888611A/zh
Application granted granted Critical
Publication of CN110888611B publication Critical patent/CN110888611B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1203Improving or facilitating administration, e.g. print management
    • G06F3/1208Improving or facilitating administration, e.g. print management resulting in improved quality of the output result, e.g. print layout, colours, workflows, print preview
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1237Print job management
    • G06F3/1242Image or content composition onto a page
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/405Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels
    • H04N1/4051Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels producing a dispersed dots halftone pattern, the dots having substantially the same size
    • H04N1/4052Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels producing a dispersed dots halftone pattern, the dots having substantially the same size by error diffusion, i.e. transferring the binarising error to neighbouring dot decisions
    • H04N1/4053Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels producing a dispersed dots halftone pattern, the dots having substantially the same size by error diffusion, i.e. transferring the binarising error to neighbouring dot decisions with threshold modulated relative to input image data or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • H04N1/60Colour correction or control
    • H04N1/6072Colour correction or control adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/25Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with scene description coding, e.g. binary format for scenes [BIFS] compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

公开了图像处理装置和图像处理方法以及存储介质。图像处理装置将多值图像转换成二值图像,确定二值图像中的字符区域和非字符区域,从字符区域中提取以字符为单位的区块,确定每个区块是字符区域还是非字符区域,并且对于被确定为字符区域的每个区块,从包括在该区块中的多值图像中提取第一代表性颜色,并生成与第一代表性颜色对应的二值图像。该装置通过将第一代表性颜色与目标像素的颜色进行比较来决定最接近于目标像素的颜色的第二代表性颜色,并将与第一代表性颜色对应的区块的二值图像改变为所决定的第二代表性颜色的二值图像。

Description

图像处理装置和图像处理方法以及存储介质
技术领域
本发明涉及图像处理装置、图像处理方法以及存储介质。
背景技术
近年来,由于彩色打印机、彩色扫描仪等的广泛使用,因此彩色打印原稿的数量增大,并且执行扫描以读取这些原稿并将它们存储为电子文件或通过互联网向第三方发送它们的机会增多。但是,如果按其原样以全色数据来处置数据,那么存储装置或线上的负载大,因此需要通过执行压缩处理来减少数据量。
作为压缩彩色图像数据的已知方法,例如,存在使用误差扩散等将彩色图像转换成具有伪半色调的二值图像(binary image)的压缩方法、将彩色图像转换成JPEG格式的压缩方法、以及将彩色图像转换成8位调色板颜色并且对其执行ZIP压缩或LZW压缩的压缩方法。
日本专利特许公开No.2003-8909公开了一种技术,其中检测包括在输入图像中的字符区域(character region),将字符区域中的每个字符部分转换成二值图像,对其执行MMR压缩(二值无损压缩),并且将得到的数据与字符的字符颜色信息一起保存为文件。而且,通过用周围区域的颜色填充输入图像的字符部分来生成背景图像,在降低分辨率的同时对其执行JPEG压缩(有损压缩),并且将得到的数据保存在文件中。通过使用这种压缩方法对文件进行压缩,可以在保持字符区域的高质量的同时提高压缩率。而且,利用日本专利特许公开No.2003-8909中的方法,将字符区域中的字符分离成以字符为单位,每个分离的字符被指派有关于字符区域计算的代表性颜色值之一,因此,即使在字符区域中存在具有多个颜色的字符的情况下,也可以良好再现字符颜色。
在上述日本专利特许公开No.2003-8909的方法中,使用通过对输入图像进行二值化而获得的二值图像来生成主扫描方向和副扫描方向上的黑色像素的投影直方图。而且,从投影直方图中检测行和列方向上的断开点,因此,指定每一个字符的区块(area)(下文中,称为“字符裁剪区块”)。在这里,当在与字符裁剪区块中的二值图像的黑色像素部分对应的多值图像中存在多个颜色时,如果字符裁剪区块由一种代表性颜色表示,那么存在用与原始字符颜色不同的颜色再现字符的情况。
图11是用于描述其中字符颜色改变的已知示例的图。
这些情况例如包括黑色字符1102被红色圆圈框1101以重叠方式包围的情况,以及通过红色笔等在黑色字符1104上写下对勾标记1103的情况。而且,作为示例,图示了在黑色字符串1106上用荧光笔等绘制标记1105和1107的情况。当从图11中的输入图像生成二值图像时,黑色字符部分和存在红色框的部分或者用红色笔或荧光笔绘制的部分两者在被二值化之后都由黑色像素表示。以这种方式,在二值图像中连接的黑色和红色部分不能根据从二值图像生成的投影直方图而分离。关于图11中的二值图像,如标号1108、1109和1110所指示的,生成字符裁剪区块。在这种情况下,在与一个字符裁剪区块中的黑色像素部分对应的多值图像中存在多个颜色。因此,如果向每个字符裁剪区块指派一个代表性颜色,那么向一个字符区域指派一个颜色,因此生成颜色与原始字符颜色不同的字符图像,如上所述。
发明内容
本发明的一个方面是消除常规技术的上面提到的问题。
本发明的特征在于提供一种技术,其中,当字符区域被二值化时,指派代表性颜色,并且再现字符颜色,当再现时抑制字符颜色相对于原始颜色改变。
根据本发明的第一方面,提供了一种图像处理装置,包括:转换单元,被配置成将多值图像转换成二值图像;第一确定单元,被配置成确定二值图像中的字符区域和非字符区域;字符裁剪单元,被配置成从由第一确定单元确定为字符区域的区域中提取以字符为单位的区块;第二确定单元,被配置成确定以字符为单位的区块中的每个区块是字符区域还是非字符区域;生成单元,被配置成对于由第二确定单元确定为字符区域的以字符为单位的区块中的每个区块,从包括在以字符为单位的区块中的多值图像中提取第一代表性颜色,并且生成与第一代表性颜色对应的以字符为单位的区块的二值图像;决定单元,被配置成通过将第一代表性颜色与在以字符为单位的区块中的目标像素的颜色进行比较来决定最接近于目标像素的颜色的第二代表性颜色;以及改变单元,被配置成将由生成单元生成的与第一代表性颜色对应的以字符为单位的区块的二值图像改变为由决定单元决定的第二代表性颜色的二值图像。
根据本发明的第二方面,提供了一种图像处理方法,包括:将多值图像转换成二值图像;确定二值图像中的字符区域和非字符区域;从被确定为字符区域的区域中提取以字符为单位的区块;确定以字符为单位的区块中的每个区块是字符区域还是非字符区域;对于被确定为字符区域的以字符为单位的区块中的每个区块,从包括在以字符为单位的区块中的多值图像中提取第一代表性颜色,并且生成与第一代表性颜色对应的以字符为单位的区块的二值图像;通过将第一代表性颜色与以字符为单位的区块中的目标像素的颜色进行比较来决定最接近于目标像素的颜色的第二代表性颜色;以及将所生成的与第一代表性颜色对应的以字符为单位的区块的二值图像改变为所决定的第二代表性颜色的二值图像。
参考附图,根据示例性实施例的以下描述,本发明的其它特征将变得清楚。
附图说明
结合在说明书中并构成说明书一部分的附图图示了本发明的实施例,并且与说明书一起用于说明本发明的原理。
图1是用于描述包括根据本发明第一实施例的图像处理装置的***的整体配置的图。
图2是图示根据第一实施例的压缩/解压缩单元的压缩处理单元的功能配置的功能框图。
图3是用于描述由根据第一实施例的压缩/解压缩单元解压缩从另一个装置发送的PDF格式的压缩数据的配置的框图。
图4是用于描述在根据第一实施例的图像处理装置中从读取原稿直到生成文件的处理的流程图。
图5是用于描述在图4中的步骤S405中示出的、由压缩/解压缩单元压缩图像数据的处理的流程图。
图6是用于描述在图5中的步骤S509中由字符颜色校正模块校正字符颜色的处理的流程图。
图7是用于描述根据第一实施例的压缩/解压缩单元的二值化模块、区域确定模块和字符裁剪模块的处理结果的具体示例的图。
图8A至图8C是用于描述这样一个示例的图,其中,关于由根据第一实施例的代表性颜色提取模块提取的代表性颜色分类二值图像并且将二值图像存储在图像缓冲区中。
图9A至图9C是用于描述这样一个示例的图,其中,在根据第一实施例的字符颜色校正模块执行了关于字符颜色的校正处理之后,关于代表性颜色分类二值图像并将二值图像存储在图像缓冲区中。
图10A至图10C是用于描述由根据第一实施例的字符颜色校正模块执行的用于校正字符颜色的处理的示例的图。
图11是用于描述其中字符颜色改变的常规技术的示例的图。
图12是用于描述由根据第二实施例的区域确定模块执行的关于一个字符裁剪区块的处理的流程图。
图13是用于描述在图5的步骤S509中由根据第二实施例的字符颜色校正模块校正字符颜色的处理的流程图。
图14是用于描述各实施例中的区域确定的具体示例的图。
具体实施方式
以下将参考附图详细描述本发明的实施例。应当理解的是,以下实施例并非旨在限制本发明的权利要求,并且并非根据以下实施例描述的方面的所有组合就解决根据本发明的问题的手段而言都是必需的。
第一实施例
图1是用于描述包括根据本发明第一实施例的图像处理装置的***的整体配置的图。
图像处理装置是例如包括控制单元100、扫描仪115、打印机116和控制台(console)单元117的多功能一体机。控制单元100连接到扫描仪115和打印机116,扫描仪115读取原稿并将其图像数据输入到控制单元100,打印机116打印与图像数据对应的图像。而且,控制单元100经由LAN 118与主计算机119通信,并且接收和输出图像数据和设备信息。CPU 103用作对图像处理装置执行整体控制的控制器。RAM(随机存取存储器)104在CPU103控制下用作控制数据的临时存储器或工作存储器。ROM(只读存储器)105存储将由CPU103执行的程序等。HDD 106是硬盘驱动器,并且存储***软件、图像数据等。CPU 103通过执行存储在ROM 105中的启动程序、将存储在HDD 106中的程序部署到RAM 104并执行该程序来控制图像处理装置的操作。控制台单元I/F 107是与控制台单元117的接口单元,并将要由控制台单元117显示的图像数据输出到控制台单元117。而且,控制台单元I/F 107将由用户使用控制台单元117输入的信息发送到CPU 103。用户可以通过操作控制台单元117向图像处理装置输入各种类型的指令。例如,用户指定要向其发送数据的目的地、各种传输设置(诸如分辨率和压缩率)以及数据格式(诸如JPEG/TIFF/PDF/PDF高压缩)。
在第一实施例中,描述了在彩色图像的压缩技术中校正字符颜色的情况,因此作为示例将描述将PDF高压缩指定为数据格式的情况。稍后将描述PDF高压缩技术的细节。网络I/F 108连接到LAN 118,并接收和输出信息。上述组成元件布置在***总线101上。
图像总线I/F 110是将***总线101与以高速传送图像数据的图像总线102连接的总线桥,并转换数据结构。图像总线102是高速总线,诸如PCI总线或IEEE1394。设备I/F 111将扫描仪115和打印机116与控制单元100连接,并执行同步与异步***之间的转换。
输入图像处理单元112对从扫描仪115输入的图像数据执行诸如阴影校正处理、伽马校正处理、颜色偏移校正处理、颜色转换处理和滤波处理之类的图像处理。输出图像处理单元113对要输出到打印机116的位图图像数据执行诸如颜色转换处理和伪半色调处理之类的图像处理。压缩/解压缩单元114通过执行PDF高压缩处理来生成PDF格式的稍后描述的压缩数据220(图2)。生成的压缩数据220经由网络I/F 108和LAN 118被发送到指定目的地(例如,主计算机119)。而且,压缩/解压缩单元114还可以执行经由网络I/F 108和LAN 118接收的压缩数据的解压缩。在经过由输出图像处理单元113执行的图像处理之后,解压缩的图像数据经由设备I/F 111发送到打印机116以进行打印。稍后将描述压缩/解压缩单元114的细节。
通过利用从照明灯发出的光对原稿上的图像进行曝光扫描,并将反射光输入到线性图像传感器(CCD传感器),扫描仪115将原稿的图像信息转换成电信号。扫描仪115还将电信号转换成R、G和B亮度信号,并经由设备I/F 111将亮度信号作为图像数据输出到控制单元100。打印机116从控制单元100接收以预定图像格式创建的图像数据,并且在从馈送单元(未示出)馈送的转印片材上执行打印。在这里,例如,通过带电、曝光、显影、转印和定影的处理,将图像打印在作为转印材料的记录片材上。
接下来,将参考图2和图3描述由根据第一实施例的压缩/解压缩单元114实现的图像压缩处理单元和图像解压缩处理单元的配置。在第一实施例中,压缩/解压缩单元114的功能通过CPU 103执行从HDD 106部署到RAM 104的程序来实现。可替代地,压缩/解压缩单元114的一些或所有功能可以由诸如ASIC之类的硬件实现。
如上所述,压缩/解压缩单元114执行PDF高压缩处理。在这里,PDF高压缩是用于压缩彩色和单色多值图像的技术。在PDF高压缩中,对图像数据执行区域确定,并且通过根据每个区域的属性在MMR二值无损压缩和JPEG有损压缩之间自适应地切换来压缩图像数据。由此,能够进行可以提高压缩率的压缩,并且关于字符区域可以获得高质量图像。
图2是用于描述根据第一实施例的压缩/解压缩单元114的压缩处理单元的功能配置的功能框图。在这里,通过压缩输入图像数据来生成高压缩PDF。在这里,将假设要输入到压缩/解压缩单元114的图像数据是通过使用扫描仪115读取原稿而获得的并且已经经过由输入图像处理单元112执行的处理的图像数据而给出描述。而且,在给出描述的同时适当地参考图7。要注意的是,当通过CPU 103执行程序来实现压缩/解压缩单元114的功能时,通过CPU 103执行程序来实现图2所示的功能模块的功能。
图7是用于描述根据第一实施例的压缩/解压缩单元114的二值化模块202、区域确定模块203和字符裁剪模块204的处理结果的具体示例的图。
二值化模块202从作为多值图像的输入图像201生成二值图像。在二值图像中,例如,输入图像中浓度为阈值或更大的高浓度像素是黑色像素,而浓度小于阈值的像素是白色像素。当然,代替黑色和白色,二值化的结果可以用其它颜色表示,或者代替颜色用数字1和0表示。而且,阈值可以是固定值(例如,8位数据中的128),或者可以使用从多值图像生成直方图并且计算用于在字符部分与非字符部分之间进行分离的最佳阈值的方法。
在这里,例如,当输入图像201是由图7中的标号701指示的图像时,经过二值化的二值图像是由标号702指示的图像。
在输入图像701中,由标号711指示的对象是红色,并且字符串712中的黑色字符“A”由红色圆圈围绕。而且,假设字符串712中的“BCDEFGH”是黑色字符。要注意的是,当输入图像201是彩色多值图像时,对于多值图像的亮度(例如,YUV中的Y)执行二值化。
区域确定模块203从由二值化模块202生成的二值图像中检测可能包括字符的字符区域和不包括字符的非字符区域。在这里,将使用图14描述概要。
图14是用于描述第一实施例中的区域确定的具体示例的图。
(1)通过对于二值图像跟踪黑色像素的轮廓来提取黑色像素的集群(cluster)(黑色像素集群)。在轮廓的跟踪中,确定黑色像素是否在如下八个方向中的一个方向上连续,即,左上、左、左下、下、右下、右和右上方向。例如,在图14的(1)中,提取由框线1400包围的黑色像素集群。
(2)如果在提取出的黑色像素集群中存在尺寸超过某个尺寸的黑色像素集群,那么指定在该区域中是否存在白色像素集群。即,通过跟踪黑色像素集群的区域内的白色像素的轮廓来提取白色像素集群。例如,通过跟踪图14的(2)中的框线内的白色像素的轮廓来提取白色像素集群。而且,如果提取出的白色像素集群的尺寸超过某个尺寸,那么通过跟踪白色像素集群内的黑色像素的轮廓来再次提取黑色像素集群。例如,通过跟踪图14的(2)中的黑色字符部分的轮廓来提取黑色像素集群。重复执行这些处理,直到像素集群的尺寸减小到某个尺寸以下为止。例如,执行这个处理以便提取由框线1400围绕的区域内的字符区域。
(3)使用尺寸、形状和黑色像素密度中的至少一个将所获得的黑色像素集群分类为字符和非字符之一。例如,如果黑色像素集群具有接近1的纵横比和预定范围内的尺寸,如图14的(3)中的字符那样,那么可以确定黑色像素集群是构成字符的黑色像素集群。而且,确定剩余的黑色像素集群是构成非字符的像素集群。
(4)如果每个构成字符的黑色像素集群的端部之间的距离小,那么将黑色像素集群分类到相同的组中。然后,包括已被分类到相同组的所有黑色像素集群的外接矩形区块1401被确定为字符区域。例如,如果字符之间的距离小,如图14的(4)中所示,那么字符串“ABC”被确定为一个字符区域。要注意的是,如果构成字符的另一个黑色像素集群不存在于预定距离范围内,那么构成字符的黑色像素集群自身构成一个组。因此,单个黑色像素集群的外接矩形区块被确定为字符区域。要注意的是,假设对构成非字符的黑色像素集群执行与项(4)中描述的处理类似的处理。
以这种方式获得的每个区域的位置以及每个区域的属性确定信息(字符或非字符)作为确定结果被输出。
作为上述项(1)至(4)中的处理的结果,当输入到区域确定模块203的二值图像是图7中的二值图像702时,输出由图7中标号703指示的确定结果。即,输出确定结果,其中区域713和715被确定为很可能包括字符的字符区域,并且区域714被确定为不包括字符的非字符区域。区域确定模块203的描述如上所述。
字符裁剪模块204执行对于由区域确定模块203确定的每个字符区域裁剪字符裁剪矩形的处理。在这里,如由标号704指示的,通过对于已经由区域确定模块203确定为字符区域的区域713和715(如图7中的标号703所指示)执行字符裁剪而获得的结果被示出。裁剪结果如标号716、717、718、719和720所指示的那样。裁剪处理包括以下处理。
(1)选择字符区域中的一个字符区域(例如,选择区域713)。
(2)取得由字符区域指定的一个二值图像的横向方向上的投影。具体而言,对沿着横向方向延伸的线上的黑色像素的数量进行计数,并且计数的结果是该投影。所取得的投影由标号705指示。在投影705中,各自的黑色像素的数量超过阈值Th_hm的在纵向方向上连续的线形成一个组。这个组由标号706指示。因此,对于字符区域713,形成了一个组。
(3)关于这个组取得纵向方向上的投影。具体而言,计数在纵向方向上存在的黑色像素的数量,并且计数的结果是该投影。以这种方式获得的投影由标号707指示。
(4)在项(3)中获得的投影707中,各自的黑色像素的数量超过阈值Th_hs的在横向方向上连续的线形成一个组。这个组由标号708指示。例如,在投影707中,形成了六个组。这六个组分别由字符S、A、M、P、L和E构成。
(5)将在项(4)中获得的每组线的外接矩形裁剪为字符裁剪区块。因此,例如,每个字符的外接矩形被裁剪为字符裁剪区块。由标号716指示的外接矩形通过裁剪获得。
(6)重复上述项(1)至(5)的处理,直到没有剩余未被选择的字符区域为止。通过项(1)至(6)的处理,输出字符裁剪区块结果716、717、718、719和720。字符裁剪模块204的描述如上所述。
区域确定模块205以字符裁剪区块为单位确定由字符裁剪模块204裁剪的每个字符裁剪区块中的字符图像是否是字符。在这里,例如,基于字符裁剪区块内的黑色像素密度来确定字符图像是否是字符。例如,在字符的情况下,构成字符的线之间存在间隙。因此,存在一定量的白色像素。另一方面,在非字符的情况下,在许多情况下,字符裁剪区块内的大多数像素是黑色像素。因此,如果黑色像素密度大于阈值,那么确定图像不是字符,而如果黑色像素密度小于阈值,那么图像是字符。而且,除了这种方法之外,还可以基于字符裁剪区块的纵横比进行确定。而且,区域确定模块205基于已由区域确定模块203确定为非字符的字符裁剪区块的信息来校正由区域确定模块203生成的字符区域信息和由字符裁剪模块204生成的字符裁剪区块信息。即,从由区域确定模块203生成的字符区域信息和由字符裁剪模块204生成的字符裁剪区块信息中去除被区域确定模块205确定为非字符的字符区域的信息。
缩小模块206通过对输入图像201执行缩小处理(分辨率降低处理)来生成缩小的多值图像。在第一实施例中,输入图像是300dpi,并且执行用于将分辨率降低到150dpi的处理。
代表性颜色提取模块207基于由区域确定模块205校正的字符区域信息和字符裁剪矩形区域信息来指定构成二值图像中的每个字符的像素(黑色像素)的位置。而且,代表性颜色提取模块207通过基于字符的指定像素位置参考缩小的多值图像中的对应位置的颜色来以字符裁剪区块为单位计算字符的代表性颜色,并获得关于每个字符的字符颜色信息。而且,代表性颜色提取模块207对相同代表性颜色的二值图像进行合并,并生成用于每个代表性颜色的图像缓冲区。通过对与在字符裁剪区块中的二值图像中变为黑色的一组像素对应的多值图像的颜色执行求平均值或求加权平均值来计算代表性颜色。可替代地,代表性颜色是在这样的一组像素中频率最高的颜色。可以想到获得代表性颜色的各种方法,但是在多值图像中,在字符裁剪区块中的二值图像中变为黑色的一组像素中的至少一个像素的颜色被用于计算代表性颜色。在第一实施例中,将描述通过求平均值来计算代表性颜色的示例。
而且,在第一实施例中,多值图像是指缩小的多值图像,但是可以指输入图像的多值图像。
接下来,将参考图7和图8A-图8C描述由代表性颜色提取模块207执行的处理的结果。
图7中所示的图像701是输入图像201的示例,并且图像704中的标号716、717、718、719和720每个指示由字符裁剪模块204生成的字符裁剪区块。通过关于由代表性颜色提取模块207提取的代表性颜色对这些字符裁剪区块的二值图像进行分类而获得的图像缓冲区的示例在图8A至图8C中示出。
图8A至图8C是用于描述关于由根据第一实施例的代表性颜色提取模块207提取的代表性颜色分类二值图像并且将二值图像存储在图像缓冲区中的示例的图。
图8A示出了如下视图,其图示出代表性颜色已被确定为(R,G,B)=(20,20,20)的一组字符裁剪区块。图8B示出了如下视图,其图示出代表性颜色已被确定为(R,G,B)=(255,32,32)的一组字符裁剪区块。而且,图8C示出了如下视图,其图示出代表性颜色已被确定为(R,G,B)=(98,24,24)的一组字符裁剪矩形区块。
图8C中检测到的字符裁剪区块是输入图像701中黑色字符A被红色圆圈包围的区域。由二值化模块202执行的二值化处理是阈值处理,因此高浓度部分要由黑色像素构成。因此,关于输入图像701中由红色圆圈包围的黑色字符A,通过二值化处理将黑色字符A和红色圆圈部分二者转换成黑色像素。在这种情况下,因为黑色字符A和红色圆圈部分在经过二值化的二值图像中连接,因此这些部分无法通过由字符裁剪模块204执行的处理来分离。在这种情况下,与一个字符裁剪区块内的黑色像素对应的多值图像包括黑色和红色二者的颜色值。因此,代表性颜色提取模块207通过计算与黑色像素部分对应的多值图像的平均值来确定代表性颜色,并确定当要再现字符裁剪区块内的黑色像素部分时要使用的颜色。在这里,当存在黑色和红色二者时,其平均值指示类似棕色的颜色,并且原本是黑色的字符A的部分和原本是红色的红色圆圈部分的部分将以棕色再现。
因此,在第一实施例中,通过校正由代表性颜色提取模块207提取的代表性颜色以便成为接近于输入图像的颜色值的代表性颜色,抑制了以与原始颜色不同的颜色再现字符颜色的情况。稍后将描述校正代表性颜色的方法。
字符区域填充模块208基于由区域确定模块205生成的字符区域信息来指定构成二值图像中的每个字符的像素(黑色像素)的位置。而且,字符区域填充模块208执行基于指定的像素位置来利用周边颜色填充缩小的多值图像中的对应位置处的像素的处理。在这里,围绕字符的像素的像素值的平均值被用作周边颜色,并且字符的像素的像素值可以被获得的周边颜色代替。
字符颜色校正模块209基于由区域确定模块205校正的字符裁剪区块信息、由代表性颜色提取模块207生成的各字符裁剪区块的代表性颜色以及由缩小模块206生成的缩小的多值图像来校正字符颜色信息。稍后将描述字符颜色校正模块209的细节。
MMR压缩模块210对由字符颜色校正模块209生成的每个代表性颜色的二值图像执行MMR压缩,并生成压缩代码1,如标号221所示。
JPEG压缩模块211对经过由字符区域填充模块208执行的填充处理的多值图像执行JPEG压缩,并生成压缩代码2,如标号224所示。
以这种方式,以PDF格式生成包括从相应组成元件获得的压缩代码1、字符区域信息222、字符颜色信息223和压缩代码2的压缩数据220的文件。如上所述,将生成的PDF格式的文件发送到用户指定的目的地。
图3是用于描述由根据第一实施例的压缩/解压缩单元114解压缩已经从另一个装置发送的PDF格式的压缩数据的配置的框图。当要通过解压缩压缩数据等执行打印时,执行图3中的处理。在这里,作为示例,将描述从主计算机119发送的压缩数据是与上述压缩数据220相同的文件格式的情况。要注意的是,当通过CPU 103执行程序来实现压缩/解压缩单元114的功能时,通过CPU 103执行程序来实现图3所示的功能模块的功能。
MMR解压缩模块301对包括在压缩数据220的文件中的如标号221所示的压缩代码1执行MMR解压缩处理,并再现二值图像。JPEG解压缩模块302对包括在压缩数据220的文件中的如标号224所示压缩代码2执行JPEG解压缩处理,并再现缩小的多值图像。放大模块303通过对已经由JPEG解压缩模块302解压缩的缩小的多值图像执行放大处理来生成具有与经历压缩之前的输入图像201的尺寸相同的尺寸的多值图像。
组合模块304在参考字符区域信息222的同时,将由字符颜色信息指示的颜色(下文中,称为“字符颜色”)指派给已经由MMR解压缩模块301解压缩的二值图像中的黑色像素。而且,组合模块304通过将已经指派了字符颜色的二值图像与由放大模块303生成的多值图像组合来生成解压缩图像305。当执行组合时,将透明颜色指派给二值图像中的白色像素,并且可以看到背景多值图像。以这种方式,压缩/解压缩单元114通过解压缩压缩数据来生成解压缩图像305。在经过输出由图像处理单元113执行的图像处理之后,这个解压缩图像305经由设备I/F 111被发送到打印机116并被打印。
图4是用于描述在根据第一实施例的图像处理装置中从读取原稿到生成文件的处理的流程图。通过CPU 103执行部署在上面提到的RAM 104中的程序来实现图4中的流程图所示的处理。
首先,在步骤S401中,CPU 103检测控制台单元117上的开始键(未示出)的按下。接下来,CPU 103使处理前进到步骤S402,并且获得用户已经使用控制台单元117设置的设置值(诸如文件格式、分辨率和发送目的地)。然后,CPU 103使处理前进到步骤S403,并通过控制扫描仪115来读取原稿。而且,CPU 103使处理前进到步骤S404,并且执行如下处理:使输入图像处理单元112对在步骤S403中由已经读取了原稿的扫描仪115获得的图像数据执行图像处理,并且经处理的图像数据被存储在RAM 104中。接下来,CPU 103使处理前进到步骤S405,通过使压缩/解压缩单元114对存储在RAM 104中的图像数据执行图像压缩处理来生成压缩数据220。稍后将参考图5中的流程图描述压缩代码1、字符区域信息222和字符颜色信息223的生成流程的细节。然后,CPU 103使处理前进到步骤S406,从由压缩/解压缩单元114生成的压缩数据220生成PDF格式的文件,并结束这个处理。
图5是用于描述由压缩/解压缩单元114压缩图像数据的处理(其在图4中的步骤S405中示出)的流程图。在这里,将假设通过CPU 103执行程序来实现压缩/解压缩单元114的功能来给出描述。
首先,在步骤S501中,CPU 103用作缩小模块206,并且通过对输入图像201执行图像缩小处理来生成缩小的多值图像数据。接下来,CPU 103使处理前进到步骤S502,用作二值化模块202,并对输入图像201执行二值化处理。接下来,CPU 103使处理前进到步骤S503,用作区域确定模块203,对在步骤S502中生成的二值图像执行区域确定处理1,识别包括在二值图像中的区域,并确定每个识别出的区域是字符区域还是非字符区域。
然后,CPU 103使处理前进到步骤S504,用作区域确定模块205,顺序地将由区域确定模块203确定的区域中的一个区域设置为目标区域,并确定区域确定模块203关于目标区域的确定结果是否是字符区域。在这里,如果目标区域是字符区域,那么CPU 103使处理前进到步骤S505,并且如果目标区域是非字符区域,那么CPU 103使处理前进到步骤S507。在步骤S505中,CPU 103用作字符裁剪模块204,并且从被确定为字符区域的目标区域中提取以字符为单位的字符裁剪区块。接下来,CPU 103使处理前进到步骤S506,用作代表性颜色提取模块207,针对由字符裁剪模块204生成的每个字符裁剪矩形区块计算指示二值图像的颜色的代表性颜色。然后,CPU 103使处理前进到步骤S507,确定是否已关于由区域确定模块203生成的所有区域完成了步骤S504到S506中的处理,并且如果确定已经关于所有区域完成处理,那么CPU 103使处理前进到步骤S508,如果不是,那么CPU 103使处理前进到步骤S504。
在步骤S508中,CPU 103用作区域确定模块205,确定在步骤S505中生成的每个字符裁剪区块是否是字符,并校正关于字符区域的确定。具体而言,通过从在步骤S503中提取出的字符区域中移除在由区域确定模块205执行的确定处理中已被确定为非字符的字符裁剪区块来校正字符区域。接下来,CPU 103使处理前进到步骤S509,用作字符颜色校正模块209,并校正由代表性颜色提取模块207计算的每个字符裁剪区块的代表性颜色。稍后将参考图6描述这个处理的细节。接下来,CPU 103使处理前进到步骤S510,用作字符区域填充模块208,并且执行对于由缩小模块206生成的缩小的多值图像用周边颜色填充字符部分中的像素的处理。然后,CPU 103使处理前进到步骤S511,用作MMR压缩模块210,并且通过基于由字符颜色校正模块209校正的二值图像和字符颜色信息对二值图像执行MMR压缩来生成如标号221所示的压缩代码1。而且,CPU103用作JPEG压缩模块211,通过对由字符区域填充模块208生成的多值图像执行JPEG压缩来生成如标号224所示的压缩代码2,并且结束这个处理。
图6是用于描述在图5中的步骤S509中由字符颜色校正模块209校正字符颜色的处理的流程图。而且,在描述这个流程图时,适当地参考图9A至图9C和图10A至图10C。
图9A至图9C是用于描述在根据第一实施例的字符颜色校正模块209执行了关于字符颜色的校正处理之后关于代表性颜色对二值图像进行分类并且将二值图像存储在图像缓冲区中的示例的图。
图10A至图10C是用于描述由根据第一实施例的字符颜色校正模块209校正字符颜色的处理的示例的图。
首先,在步骤S601中,CPU 103执行由代表性颜色提取模块207计算的各字符裁剪区块的N个代表性颜色的颜色转换。在这里,由代表性颜色提取模块207计算的代表性颜色处在由R,G和B表示的基于亮度的颜色空间中,因此代表性颜色被转换成作为均等颜色空间的Lab颜色空间中的颜色。要注意的是,可以使用标准转换式子实现从RGB颜色空间到Lab颜色空间的转换。在这里,执行到Lab颜色空间的转换以便计算稍后描述的颜色差异信号,但是转换不限于此,而是可以转换成YCbCr颜色空间。而且,可以以简化的方式根据RGB颜色空间中的颜色差异来计算稍后描述的颜色差异,而不执行颜色空间转换。
图10B示出了如下视图,其图示出当使用标准转换式子将图8A至图8C中所示的代表性颜色转换成Lab颜色空间中的颜色值时的颜色值。在这里,No.1至No.3的代表性颜色分别与图8A至图8C中的代表性颜色对应。图8A中代表性颜色的Lab值为(L,a,b)=(33,0,0),图8B中代表性颜色的Lab值为(L,a,b)=(69,59,31),并且图8C中代表性颜色的Lab值为(L,a,b)=(46,33,15)。要注意的是,在第一实施例中,将假设代表性颜色的数量N=3来给出描述。
接下来,CPU 103使处理前进到步骤S602,依次将已被确定为字符的字符裁剪区块内的二值图像中的黑色像素部分的一个黑色像素设置为目标像素,并将多值图像中与目标像素的位置对应的RGB信号转换成Lab信号。
图10A示出了如下视图,其图示出图7中所示的一部分的多值图像,在该部分的多值图像中黑色字符A被红色圆圈框围绕。在这里,当目标像素1000被设置为红色框部分的目标像素时,假设多值图像中的信号值为(R,G,B)=(255,32,32)。当使用一般转换式子将这个值转换成Lab值时,获得(L,a,b)=(63,59,31)。另一方面,当目标像素1001被设置为黑色字符A的部分的目标像素时,假设多值图像的信号值为(R,G,B)=(20,20,20)。当这个值被转换成Lab值时,获得(L,a,b)=(33,0,0)。
接下来,CPU 103使处理前进到步骤S603,并且根据在步骤S602中计算的目标像素的Lab信号(L1,a1,b1)以及目标字符裁剪区块的代表性颜色的Lab信号(L2,a2,b2)来计算颜色差异ΔE。可以使用以下式子(1)来计算这个颜色差异ΔE。
颜色差异
在这里,ΔL=L1-L2,Δa=a1-a2,并且Δb=b1-b2,并且指示获得平方根的函数。在这里计算的颜色差异ΔE存储在RAM 104中提供的变量Min中。
接下来,CPU 103使处理前进到步骤S604,并且根据在步骤S602中计算的目标像素的Lab信号(L1,a1,b1)以及在步骤S601中计算的第n个(n存储在RAM 104中,并且n的初始值是“1”)代表性颜色的Lab信号(Ln,an,bn)来计算颜色差异ΔEn。接下来,CPU 103使处理前进到步骤S605,并且确定在步骤S604中计算的颜色差异ΔEn是否小于Min。然后,如果颜色差异ΔEn小于Min,即,如果与目标字符裁剪区块的代表性颜色相比,目标像素的字符颜色更接近于第n个代表性颜色,那么CPU 103使处理前进到步骤S606。如果否,那么CPU 103使处理前进到步骤S607。在步骤S606中,CPU 103将颜色差异ΔEn存储到Min,并且将代表性颜色更新为与目标像素的颜色值的颜色差异较小的第n个代表性颜色。在这里,为了保持第n个颜色值信息,将n设置为在RAM 104中提供的变量MinN,并且存储与目标像素的颜色值的颜色差异较小的代表性颜色的编号。
然后,CPU 103使处理前进到步骤S607,并且确定是否已经关于目标像素完成了与所有N个代表性颜色的比较。如果已经完成与所有N个代表性颜色的比较,那么CPU 103使处理前进到步骤S609,否则,CPU 103使处理前进到步骤S608。在步骤S608中,CPU 103对变量n进行递增计数,并且使处理前进到步骤S604,以便与下一个代表性颜色进行颜色差异比较。
在步骤S609中,CPU 103将二值图像数据移动到由其编号(n)存储在变量MinN中的代表性颜色指示的二值图像的缓冲区。以这种方式,如果找到比为当前字符裁剪矩形区块保持的代表性颜色更接近目标像素的颜色值的代表性颜色,那么通过找到的代表性颜色来再现目标像素的颜色值。
图10C示出了如下视图,其图示出目标像素1000和1001的颜色值与各代表性颜色之间的颜色差异的示例。关于目标像素1000,与各代表性颜色的颜色差异对于代表性颜色No.2是最小的。在这种情况下,与目标像素1000对应的二值图像被移动到代表性颜色No.2的图像缓冲区。通过这样做,图8C中红色圆圈框部分的二值图像从图9C中代表性颜色(R,G,B)=(98,24,24)的缓冲区移动到图9B中所示的代表性颜色No.2的图像缓冲区。
而且,关于目标像素1001,与各代表性颜色的颜色差异对于代表性颜色No.1是最小的。在这种情况下,与目标像素1001对应的二值图像从图9C中的代表性颜色(R,G,B)=(98,24,24)的缓冲区移动到图9A中代表性颜色No.1的图像缓冲区。通过这样做,图8C中黑色字符“A”部分的二值图像被移动到如图9A所示的代表性颜色No.1的图像缓冲区。
因而,即使在一个字符裁剪区块中存在多个颜色的情况下,也可以抑制字符颜色的改变,并且可以适当地再现字符颜色。
接下来,CPU 103使处理前进到步骤S610,并且确定是否已经参考了字符裁剪矩形区块内的二值图像中的所有黑色像素,并且如果已经参考了所有黑色像素,那么CPU 103使处理进入步骤S612。如果还没有参考所有黑色像素,那么CPU 103使处理前进到步骤S611,CPU 103将下一个黑色像素设置为目标像素,并且使处理前进到步骤S602。在步骤S612中,CPU 103确定是否已经关于所有字符裁剪矩形区块完成了处理。如果已经关于所有字符裁剪矩形区块完成了处理,那么CPU 103结束这个处理,如果不是,那么CPU 103使处理前进到步骤S613,将下一个字符裁剪矩形区块设置为目标字符裁剪矩形区块,并将处理前进到步骤S602。
如上所述,根据第一实施例,当字符区域被二值化并且通过代表性颜色再现字符颜色时,将目标像素的颜色值与作为代表性颜色被提取的颜色值进行比较,并且重新选择最接近于目标像素的颜色值的代表性颜色。通过这样做,即使在与一个字符裁剪区块内的黑色像素部分对应的多值图像中存在多个颜色的情况下,也可以抑制用与原始颜色不同的颜色再现字符颜色,并且可以适当地再现字符颜色。
第二实施例
在上述第一实施例中,已经描述了如下示例,其中将目标像素的颜色值与已经作为代表性颜色被提取的颜色值进行比较,并且获得最接近于目标像素的颜色值的代表性颜色。但是,存在如下情况:当将目标像素的颜色值与已经作为代表性颜色被提取的颜色值进行比较时,需要执行比较计算,其负荷取决于已被确定为字符的字符裁剪矩形区块中包括的黑色像素的数量以及已经作为代表性颜色被提取的颜色的数量,并且处理速度降低。因此,在第二实施例中,将描述这样一个示例:确定在字符裁剪矩形内是否存在多个颜色,并且字符颜色校正模块209仅对已经被确定为字符并包括多个颜色的字符裁剪矩形区块执行处理。要注意的是,根据第二实施例的图像处理装置的硬件配置等类似于上述第一实施例的硬件配置等,因此将省略其描述。而且,由根据第二实施例的压缩/解压缩单元114执行的用于压缩图像数据的处理与图5中的上述流程图中所示的处理相同,但是在步骤S506中用于校正字符颜色的处理与第一实施例中的不同(图6)。稍后将参考图13对此进行描述。
图12是用于描述由根据第二实施例的区域确定模块205执行的关于一个字符裁剪区块的处理的流程图。通过CPU 103执行部署在上面提到的RAM 104中的程序来实现图12中的流程图中所示的处理。
首先,在步骤S1201中,CPU 103根据字符裁剪区块中的二值图像计算黑色像素密度。可以通过将字符裁剪区块内的黑色像素的数量除以字符裁剪区块中的像素的数量来获得黑色像素密度。接下来,CPU 103使处理前进到步骤S1202,并且确定在步骤S1201中获得的黑色像素密度是否小于阈值ThM。在这里,如果确定黑色像素密度小于阈值ThM,那么CPU103使处理前进到步骤S1203,否则,CPU 103使处理前进到步骤S1208。
在步骤S1203中,CPU 103根据与字符裁剪区块中的二值图像中的黑色像素位置对应的多值图像来计算色散。具体而言,RGB值被转换成Lab值,并且计算黑色像素位置部分处的a和b的方差值。CPU 103使处理前进到步骤S1204,并确定在步骤S1203中获得的色散是否小于阈值ThS1。在这里,如果确定色散小于阈值ThS1,那么CPU 103使处理前进到步骤S1205,如果不是,那么CPU 103使处理前进到步骤S1206。在这里,为了确定显然是单个颜色的字符裁剪区块,将“50”设置为阈值ThS1,但是不限于此。在步骤S1205中,CPU 103输出表示已经被确定为单个颜色的字符裁剪区块的颜色信息的结果,并结束这个处理。即,在这里,如果字符裁剪区块中的黑色像素的密度小于第一预定值(阈值ThM),并且黑色像素的色散小于第二预定值(阈值ThS1),那么确定字符裁剪区块的字符颜色信息是单个颜色。
另一方面,如果色散大于阈值ThS1,那么在步骤S1206中,CPU 103确定在步骤S1203中获得的色散是否大于或等于阈值ThS1并且小于阈值ThS2(ThS1<ThS2)。如果满足上述条件,那么CPU 103使处理前进到步骤S1207,如果不满足,那么CPU 103使处理前进到步骤S1208。在这里,阈值ThS2是用于区分具有大量颜色并且显然不是字符的字符裁剪区块的阈值,并且例如在这里是“300”,但是不限于此。在步骤S1207中,CPU103输出表示已经被确定为是多个颜色的字符裁剪区块的颜色信息的结果,并且结束这个处理。即,在这里,当字符裁剪区块中的黑色像素的密度小于第一预定值并且黑色像素的色散大于第二预定值,但是可以确定字符裁剪区块是字符时,确定字符裁剪区块的字符颜色信息是多个颜色。
而且,如果字符裁剪区块中黑色像素的密度大于阈值ThM,那么在步骤S1208中,CPU 103确定字符裁剪区块是非字符区域,并校正由区域确定模块203生成的字符区域信息和由字符裁剪模块204生成的字符裁剪信息。即,CPU 103从字符区域信息和字符裁剪信息中移除这个字符裁剪区块,并且结束这个处理。
图13是用于描述在图5的步骤S509中由根据第二实施例的字符颜色校正模块209校正字符颜色的处理的流程图。要注意的是,图13中的步骤S1301至S1313中的处理与步骤S601至S613中的上述处理相同,因此将省略其描述。
在步骤S1314中,CPU 103参考在图12中的步骤S1205或S1207中生成的字符裁剪区块的颜色信息,并确定在字符裁剪区块中是否存在多个字符颜色。在这里,如果确定在字符裁剪区块中存在多个字符颜色,那么CPU 103使处理前进到步骤S1302,并且执行与上述图6中的处理类似的处理。另一方面,如果确定在字符裁剪区块中存在单个字符颜色,那么CPU103跳过图6中的处理,并使处理前进到步骤S1312。
如上所述,根据第二实施例,确定字符裁剪区块中是否存在多个字符颜色,并且仅当存在多个字符颜色时,才执行类似于上述第一实施例的处理的处理。通过这样做,抑制了对所有字符裁剪区块执行用于校正字符颜色的处理。因而,抑制了处理速度的降低,并且抑制了以与原始颜色不同的颜色再现字符颜色,因此,可以适当地再现字符颜色。
要注意的是,在第二实施例中,当确定字符裁剪区块中是否存在多个字符颜色时,使用色散,但是本发明不限于此。例如,配置可以是这样的:通过生成多值图像的RGB值或Lab值的二维或三维直方图来生成颜色集,并且基于集合的数量来确定是否存在多个颜色。
其它实施例
本发明的(一个或多个)实施例还可以通过读出并执行记录在存储介质(其也可以被更完整地称为“非瞬态计算机可读存储介质”)上的计算机可执行指令(例如,一个或多个程序)以执行上述(一个或多个)实施例中的一个或多个实施例的功能和/或包括用于执行上述(一个或多个)实施例中的一个或多个实施例的功能的一个或多个电路(例如,专用集成电路(ASIC))的***或装置的计算机来实现,以及通过例如从存储介质读出并执行计算机可执行指令以执行上述(一个或多个)实施例中的一个或多个实施例的功能和/或控制一个或多个电路执行上述(一个或多个)实施例中的一个或多个实施例的功能而通过由***或装置的计算机执行的方法来实现。计算机可以包括一个或多个处理器(例如,中央处理单元(CPU)、微处理单元(MPU)),并且可以包括单独计算机或单独处理器的网络以读出并执行计算机可执行指令。计算机可执行指令可以例如从网络或存储介质提供给计算机。存储介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算***的存储装置、光盘(诸如紧凑盘(CD)、数字多功能盘(DVD)或蓝光盘(BD)TM)、闪存设备、存储卡等。
其它实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给***或装置,该***或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然已经参考示例性实施例描述了本发明,但是应当理解的是,本发明不限于所公开的示例性实施例。以下权利要求的范围将被赋予最广泛的解释,以便涵盖所有此类修改以及等同的结构和功能。

Claims (12)

1.一种图像处理装置,包括:
转换单元,被配置成将多值图像转换成二值图像;
第一确定单元,被配置成确定二值图像中的字符区域和非字符区域;
字符裁剪单元,被配置成从由第一确定单元确定为字符区域的区域中提取以字符为单位的区块;
第二确定单元,被配置成确定以字符为单位的区块中的每个区块是字符区域还是非字符区域;
决定单元,被配置成通过对于由第二确定单元确定为字符区域的以字符为单位的区块中的每个区块,从包括在以字符为单位的区块中的多值图像中提取第一代表性颜色来决定多个第一代表性颜色;
生成单元,被配置为生成与多个第一代表性颜色中的每个第一代表性颜色对应的以字符为单位的区块的二值图像;
选择单元,被配置成对于每个像素执行如下处理:指定目标像素的颜色与多个第一代表性颜色之间的差异和基于所指定的差异从多个第一代表性颜色中选择在以字符为单位的区块中最接近于目标像素的颜色的第二代表性颜色;以及
改变单元,被配置成将由生成单元生成的与第一代表性颜色对应的以字符为单位的区块的二值图像改变为由选择单元选择的第二代表性颜色的二值图像。
2.根据权利要求1所述的图像处理装置,其中,转换单元被配置成将包括在多值图像中的浓度大于或等于阈值的像素转换成黑色像素,并将浓度小于阈值的像素转换成白色像素。
3.根据权利要求1所述的图像处理装置,其中,第一确定单元被配置成通过跟踪二值图像中黑色像素的轮廓来提取黑色像素的集群,并使用黑色像素的集群的尺寸、形状、黑色像素密度中的至少一个来确定区域是字符区域和非字符区域中的哪一个。
4.根据权利要求1至3中任一项所述的图像处理装置,还包括:被配置成缩小多值图像的缩小单元,
其中,决定单元被配置成指定构成在已被确定为字符区域的以字符为单位的区块中的各字符的像素的位置,并且通过基于所指定的字符的像素的位置来参考在已被缩小单元缩小的多值图像中的对应位置处的颜色,决定在以字符为单位的区块中的每个区块中的第一代表性颜色。
5.根据权利要求4所述的图像处理装置,其中,决定单元被配置成基于与在以字符为单位的区块中的每个区块中的二值图像中的一组黑色像素对应的多值图像的颜色的平均值或加权平均值,决定第一代表性颜色。
6.根据权利要求4所述的图像处理装置,其中,决定单元被配置成基于在以字符为单位的区块中的每个区块中的二值图像中的一组黑色像素中最频繁出现的颜色,决定第一代表性颜色。
7.根据权利要求1所述的图像处理装置,还包括:第三确定单元被配置成计算与在以字符为单位的区块中的每个区块中的二值图像中的黑色像素的位置对应的多值图像的色散,并且如果色散小于第一阈值,那么确定以字符为单位的区块是单个颜色的区块,并且如果色散大于或等于第一阈值并且小于第二阈值,那么确定以字符为单位的区块是多个颜色的区块。
8.根据权利要求1所述的图像处理装置,还包括:被配置成对由改变单元改变后的二值图像执行二值无损压缩的压缩单元。
9.根据权利要求8所述的图像处理装置,还包括:文件生成单元,被配置成基于通过由压缩单元执行二值无损压缩而获得的数据来生成文件。
10.根据权利要求8所述的图像处理装置,还包括:解压缩单元,被配置成对通过由压缩单元执行二值无损压缩而获得的数据来执行解压缩;以及
打印单元,被配置成基于通过由扩展单元执行扩展而获得的图像数据来执行打印。
11.一种图像处理方法,包括:
将多值图像转换成二值图像;
确定二值图像中的字符区域和非字符区域;
从被确定为字符区域的区域中提取以字符为单位的区块;
确定以字符为单位的区块中的每个区块是字符区域还是非字符区域;
通过对于被确定为字符区域的以字符为单位的区块中的每个区块,从包括在以字符为单位的区块中的多值图像中提取第一代表性颜色来决定多个第一代表性颜色;
生成与多个第一代表性颜色中的每个第一代表性颜色对应的以字符为单位的区块的二值图像;
对于每个像素执行如下处理:指定目标像素的颜色与多个第一代表性颜色之间的差异和基于所指定的差异从多个第一代表性颜色中选择以字符为单位的区块中最接近于目标像素的颜色的第二代表性颜色;以及
将所生成的与第一代表性颜色对应的以字符为单位的区块的二值图像改变为所选择的第二代表性颜色的二值图像。
12.一种计算机可读存储介质,存储有用于使处理器执行根据权利要求11所述的图像处理方法的程序。
CN201910857783.8A 2018-09-10 2019-09-09 图像处理装置和图像处理方法以及存储介质 Active CN110888611B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018169119A JP7185451B2 (ja) 2018-09-10 2018-09-10 画像処理装置と画像処理方法、及びプログラム
JP2018-169119 2018-09-10

Publications (2)

Publication Number Publication Date
CN110888611A CN110888611A (zh) 2020-03-17
CN110888611B true CN110888611B (zh) 2024-06-11

Family

ID=69719823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910857783.8A Active CN110888611B (zh) 2018-09-10 2019-09-09 图像处理装置和图像处理方法以及存储介质

Country Status (4)

Country Link
US (1) US11283963B2 (zh)
JP (1) JP7185451B2 (zh)
CN (1) CN110888611B (zh)
RU (1) RU2737001C1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004242075A (ja) * 2003-02-06 2004-08-26 Canon Inc 画像処理装置および方法
CN1525403A (zh) * 2003-02-24 2004-09-01 ������������ʽ���� 图像处理装置
JP2006304063A (ja) * 2005-04-22 2006-11-02 Canon Inc 画像処理装置、画像処理方法、プログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US6002813A (en) 1997-07-10 1999-12-14 Samsung Electronics Co., Ltd. Interpolation method for binary image
US6002812A (en) 1997-07-10 1999-12-14 Samsung Electronics Co., Ltd. Interpolation method for binary image
JP3715905B2 (ja) * 2001-06-26 2005-11-16 キヤノン株式会社 画像処理装置、画像処理方法、プログラム並びに記憶媒体
DE60138073D1 (de) 2000-07-12 2009-05-07 Canon Kk Bildverarbeitungsverfahren und Bildverarbeitungsvorrichtung
US7133565B2 (en) 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP4534594B2 (ja) 2004-05-19 2010-09-01 ソニー株式会社 画像処理装置、画像処理方法、画像処理方法のプログラム及び画像処理方法のプログラムを記録した記録媒体
JP4615462B2 (ja) 2006-03-15 2011-01-19 株式会社リコー 画像処理装置、画像形成装置、プログラムおよび画像処理方法
JP2008236204A (ja) 2007-03-19 2008-10-02 Kyocera Mita Corp 画像処理装置
JP5049920B2 (ja) * 2008-08-26 2012-10-17 キヤノン株式会社 画像処理装置及び画像処理方法
JP5137759B2 (ja) 2008-09-18 2013-02-06 キヤノン株式会社 画像処理装置
TWI423146B (zh) * 2009-06-05 2014-01-11 Univ Nat Taiwan Science Tech 動態偵測與識別指示牌的方法與系統
KR101907414B1 (ko) * 2011-12-13 2018-10-15 삼성전자주식회사 촬영 이미지 기반의 문자 인식 장치 및 방법
JP5958023B2 (ja) * 2012-03-30 2016-07-27 ブラザー工業株式会社 画像処理装置および画像処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004242075A (ja) * 2003-02-06 2004-08-26 Canon Inc 画像処理装置および方法
CN1525403A (zh) * 2003-02-24 2004-09-01 ������������ʽ���� 图像处理装置
JP2006304063A (ja) * 2005-04-22 2006-11-02 Canon Inc 画像処理装置、画像処理方法、プログラム

Also Published As

Publication number Publication date
RU2737001C1 (ru) 2020-11-24
JP7185451B2 (ja) 2022-12-07
CN110888611A (zh) 2020-03-17
US11283963B2 (en) 2022-03-22
US20200084337A1 (en) 2020-03-12
JP2020043461A (ja) 2020-03-19

Similar Documents

Publication Publication Date Title
US10455117B2 (en) Image processing apparatus, method, and storage medium
US8384964B2 (en) Image processing apparatus and image processing method
US10115011B2 (en) Document type recognition apparatus, image forming apparatus, document type recognition method, and computer program product
JP4557843B2 (ja) 画像処理装置及びその方法
JP4861967B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム、画像形成装置、記憶媒体
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP2008099149A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US9948824B2 (en) Image compressing device, image forming apparatus, image compressing method, and recording medium
US11736652B2 (en) Image processing apparatus, image processing method, and storage medium
US7190837B2 (en) Compression of mixed raster content (MRC) image data
JP6693310B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN110888611B (zh) 图像处理装置和图像处理方法以及存储介质
US10931852B2 (en) Image processing apparatus, image processing method, and storage medium, with determining whether or not character clipping rectangle determined to be non-character region is character region
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2006197172A (ja) 白黒/カラー原稿判別装置および白黒/カラー原稿判別方法およびそれらを備えた画像読取装置
JP2006229817A (ja) 下地検出方法、プログラム、記録媒体、画像処理装置及び画像形成装置
JP7413751B2 (ja) 画像処理システムおよびプログラム
US11924390B2 (en) Apparatus, method, and storage medium for performing color reduction processing
US20230245270A1 (en) Image processing apparatus that improves compression efficiency of image data, method of controlling same, and storage medium
US20240064262A1 (en) Image processing apparatus capable of generating color-reduced image with high object reproducibility, control method for image processing apparatus, and storage medium
JP2007189275A (ja) 画像処理装置
JPH118770A (ja) 画像圧縮装置
JP6618307B2 (ja) 画像処理装置、画像形成装置、及び、解像度決定方法
JP2024085492A (ja) スキャンシステム、ファイル生成方法、及びプログラム
JP3070174B2 (ja) 画像形成装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant