CN101216828B - 一种图像文件转换方法及装置 - Google Patents

一种图像文件转换方法及装置 Download PDF

Info

Publication number
CN101216828B
CN101216828B CN200710304443XA CN200710304443A CN101216828B CN 101216828 B CN101216828 B CN 101216828B CN 200710304443X A CN200710304443X A CN 200710304443XA CN 200710304443 A CN200710304443 A CN 200710304443A CN 101216828 B CN101216828 B CN 101216828B
Authority
CN
China
Prior art keywords
file
image
destination
image file
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200710304443XA
Other languages
English (en)
Other versions
CN101216828A (zh
Inventor
殷延伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN200710304443XA priority Critical patent/CN101216828B/zh
Publication of CN101216828A publication Critical patent/CN101216828A/zh
Application granted granted Critical
Publication of CN101216828B publication Critical patent/CN101216828B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种图像文件转换方法及装置,用以解决现有技术中存在的将图像文件转换为通用的可流转的文件时,工作效率低的问题。本发明方法包括:根据图像文件的格式,对图像文件进行解析,获得图像信息;根据目标文件的格式要求,将所述图像信息写入具有所述格式要求的目标文件中。本发明用于将图像文件转换为通用的可流转的文件,以提高文件转换效率。

Description

一种图像文件转换方法及装置
技术领域
本发明涉及电子出版技术领域,尤其涉及一种图像文件转换方法及装置。
背景技术
对企业或组织来说,随着信息化的深入,需要将大量纸质档案电子化,实现在线查询和共享。对个人来说,随着家用数码相机等设备的普及,越来越多的人希望将电子图像信息转换成方便浏览和共享的文件,如便携文档格式(PDF,Portable Document Format)文件,有时需要将大批量的存盘文件转换成通用的可流转格式文件。那么,现有技术将图像文件转换成通用的可流转的文件的方法包括:
步骤1、设置一虚拟打印机。
步骤2、通过图像浏览软件打开图像文件,在收到打印命令后,如同在真实打印机上打印一样,将图像文件中的图像逐像素地描绘到虚拟“纸”上,形成发送给虚拟打印机的数据流。
步骤3、虚拟打印机收到数据流后,根据图像的色彩空间等信息,选择合适的压缩算法,对数据流进行压缩,然后将压缩后的数据流存入。
图像文件,例如JPEG(Joint Photographic Experts Group,联合照片专家组)格式的图像文件,文件扩展名为.jpg或者.jpeg,是经过压缩后得到的文件,所以上述步骤2中,打开图像文件时是需要进行解压缩的,而步骤3中得到的PDF文件也是对数据流进行压缩后得到的。由此可见,现有技术将图像文件转换成可流转格式文件的过程包括对图像数据进行的压缩、解压缩、以及再次压缩的过程。因此,当要转换的图像数据量很大的时候,现有技术的工作效率会很低。
发明内容
本发明实施例提供了一种图像文件转换方法及装置,用以解决现有技术中存在的将图像文件转换为通用的可流转的文件时,工作效率低的问题。
本发明实施例提供的一种图像文件转换方法包括:
打开图像文件,根据图像文件的格式,对图像文件进行解析,获得图像信息;
建立并打开目标文件,根据目标文件的格式要求,写入文件头数据;根据目标文件的格式要求,写入文件体数据;根据目标文件的格式要求,写入交叉引用表数据;根据目标文件的格式要求,写入文件尾数据;以及,将图像文件的页面大小和页面个数信息写入目标文件;
其中,所述文件头,为表明文件格式的信息;所述文件体,包括页面对象、父页对象、文档根对象、内容对象以及资源对象;所述交叉引用表,为记录各个对象的地址的结构;所述文档根,为描述树形文档结构的根节点;所述文件尾,用于记录交叉引用表在文件中的位置以及文档的根节点;
关闭所述目标文件;
关闭所述图像文件。
本发明实施例提供的一种图像文件转换装置包括:
解析单元,用于打开图像文件,根据图像文件的格式,对图像文件进行解析,获得图像信息;
转换单元,用于建立并打开目标文件,根据目标文件的格式要求,写入文件头数据;根据目标文件的格式要求,写入文件体数据;根据目标文件的格式要求,写入交叉引用表数据;根据目标文件的格式要求,写入文件尾数据;以及,将图像文件的页面大小和页面个数信息写入目标文件;其中,所述文件头,为表明文件格式的信息;所述文件体,包括页面对象、父页对象、文档根对象、内容对象以及资源对象;所述交叉引用表,为记录各个对象的地址的结构;所述文档根,为描述树形文档结构的根节点;所述文件尾,用于记录交叉引用表在文件中的位置以及文档的根节点;
关闭所述目标文件;关闭所述图像文件。
本发明实施例,根据图像文件的格式,对图像文件进行解析,获得图像信息;根据目标文件的格式要求,将所述图像信息写入具有所述格式要求的目标文件中。从而在实现对图像文件的转换过程中,避免了对图像文件的解压缩以及对图像数据流的压缩过程,提高了转换图像文件的工作效率。
附图说明
图1为本发明实施例提供的图像转换方法总体流程示意图;
图2为本发明实施例提供的当图像文件为jpg格式的文件,目标文件为PDF格式的文件时的图像文件转换方法具体流程示意图;
图3为本发明实施例提供的图像转换装置结构示意图。
具体实施方式
本发明实施例,提供了一种图像文件转换方法及装置。通过对图像文件的解析,获取图像信息,并按照目标文件的格式要求,将所述图像信息写入具有所述格式要求的目标文件中。即本发明实施例直接利用压缩的图像信息数据实现将图像文件转换为通用的可流转的文件(以下简称为可流转格式文件,即对图像文件转换得到的目标文件),从而达到提高工作效率的目的。
下面结合附图,对本发明实施例的具体实现方式进行介绍。
参见图1,本发明实施例提供的图像文件转换方法包括:
S101、根据图像文件的格式要求,解析该图像文件,获得该图像文件的图像信息数据。
S102、建立可流转格式文件,并根据该可流转格式文件的格式要求,将所述图像信息数据写入所述可流转格式文件中。
S103、将所述可流转格式文件的格式要求的文件格式信息写入所述可流转格式文件中。
其中,所述图像信息包括:
图像数据、图像宽度、图像高度、图像颜色空间、图像样点占用的比特数、图像数据长度以及图像数据压缩方式等。
解析图像文件时,按照该图像文件的格式,反解该图像文件得到图像宽度。
所述图像宽度用于描述图像采样点在水平方向上的个数。
所述图像高度用于描述图像采样点在垂直方向上的个数。
所述图像颜色空间用于描述图像采样点所用的颜色类型。例如,三原色(RGB,Red Green Blue)颜色空间,采用红色(R,RED)、绿色(G,GREEN)和蓝色(B,BLUE)三个颜色分量来描述图像采样点。
所述图像样点占用的比特数为图像样点占用的位数,例如,用RGB颜色空间来描述图像采样点,每个图像采样点有三个分量,每个分量用8比特来描述。
所述图像压缩方式用于描述图像数据在存盘时所采用的压缩类型。
所述图像数据长度用于描述图像采样点数据经过压缩后的比特数。
所述图像数据为描述图像采样点的比特流。
所述图像文件可以为若干图像文件和/或若干包含图像文件的文件夹。
所述解析操作,包括将图像文件读入内存,然后获取图像文件的图像信息数据。
所述可流转格式文件为通用的可流转格式文件,即文件格式标准公开的、可靠的、便易的文件。例如:PDF文件;XML(Extensible Markup Language)文件,它是用可扩展标识语言描述的一种文件;超文本标识语言(HTML,HyperText Markup Language)文件,它是用超文本标识语言描述的一种文件;PS(PostScript),它是用PostScript语言描述的一种文件。
PDF格式的文件标准已公开,任何人可根据其规范制定任意的PDF文件,该文件独立于创建它的操作***、应用软件和硬件,并可方便、可靠地传递信息。
所述可流转格式文件格式要求,为数据在磁盘上的存储规则。
所述文件格式信息,包括如文件头,文件体(除图像信息外)和文件尾信息。
所述文件头,为表明文件格式的信息;所述文件体,包括页面对象、父页对象、文档根对象、内容对象以及资源对象等;所述交叉引用表,为记录各个对象的地址的结构;所述文档根为描述树形文档结构的根节点;所述文件尾,记录交叉引用表在文件中的位置以及文档的根节点。
进一步,还可以将图像文件的页面大小、页面个数等信息写入所述可流转格式文件中。
所述图像文件包含了描述图像的所有信息,这些信息按照一定格式存储在磁盘中。
当图像文件包括多个文件扩展名为jpg的文件,对这些图像文件进行转换得到的文件格式为PDF的文件时,参见图2,本发明实施例提供的方法具体包括:
S201、开始。
S202、判断是否能打开需要被转换的jpg文件,如果是,则进行步骤S203;否则,否则进行步骤S211。
S203、根据jpg文件格式要求,解析所述需要被转换的jpg文件,获得图像信息。
所述图像信息包括:图像数据、图像宽度、图像高度、图像数据的长度、图像数据的压缩方式、图像的颜色空间、图像每个采样点所占的位数和图像的样点数据。
S204、建立并打开PDF文件。
PDF文件的名称,根据所述建立的文件输出格式为PDF的要求,追加所述PDF文件的扩展名为PDF。
S205、根据PDF文件格式要求,写入文件头数据。
所述文件头数据,为PDF文件格式信息。
S206、根据PDF文件格式要求,写入文件体数据。
所述文件体数据,包括所述图像信息对象、文档根目录对象、父页对象、页对象、内容流对象和资源对象。
S207、根据PDF文件格式要求,写入交叉引用表数据。
所述交叉引用表数据,记录了文件体中各个数据对象的文件偏移位置。
S208、根据PDF文件格式要求,写入文件尾数据。
所述文件尾数据,记录了文档根目录和交叉引用表的文件偏移位置。
S209、关闭所述PDF文件。
S210、关闭所述jpg文件。
S211、根据用户指令,判断是否还有未被转换的jpg文件,如果是,则进行步骤S202,否则进行步骤S212。
S212、结束。
下面介绍一下本发明实施例提供的装置。
参见图3,本发明实施例提供的图像转换装置包括:
解析单元31,用于根据图像文件的格式,对图像文件进行解析,获得图像信息。
转换单元32,用于根据可流转格式文件的格式,将所述图像信息写入所述可流转格式文件中。
文件格式信息写入单元33,用于将可流转格式文件的文件格式信息写入所述可流转格式文件中。
所述文件格式信息包括:文件头、文件体以及文件尾信息。
所述图像信息包括:图像数据、图像宽度、图像高度、图像颜色空间、图像样点占用的比特数、图像数据长度以及图像数据压缩方式等。
所述解析单元31,根据所述图像文件的格式,对图像文件进行解析,得到图像数据位置,并根据所述图像数据位置,得到所述图像文件的图像数据。
综上所述,本发明实施例提供了一种对图像文件直接进行转换的技术方案,利用本发明实施例提供的技术方案可以直接将图像文件转换成可流转的文件,并且,使图像文件得以快速、有效地输出。尤其对于数据量较大的图像文件,可以极大地提高工作效率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种图像文件转换方法,其特征在于,该方法包括:
打开图像文件,根据图像文件的格式,对图像文件进行解析,获得图像信息;
建立并打开目标文件,根据目标文件的格式要求,写入文件头数据;根据目标文件的格式要求,写入文件体数据;根据目标文件的格式要求,写入交叉引用表数据;根据目标文件的格式要求,写入文件尾数据;以及,将图像文件的页面大小和页面个数信息写入目标文件;
其中,所述文件头,为表明文件格式的信息;所述文件体,包括页面对象、父页对象、文档根对象、内容对象以及资源对象;所述交叉引用表,为记录各个对象的地址的结构;所述文档根,为描述树形文档结构的根节点;所述文件尾,用于记录交叉引用表在文件中的位置以及文档的根节点;
关闭所述目标文件;
关闭所述图像文件。
2.根据权利要求1所述的方法,其特征在于,所述图像信息包括:
图像数据、图像宽度、图像高度、图像颜色空间、图像样点占用的比特数、图像数据长度以及图像数据压缩方式。
3.根据权利要求2所述的方法,其特征在于,所述打开图像文件,根据图像文件的格式,对图像文件进行解析,获得图像信息包括:
打开图像文件,根据所述图像文件的格式,对图像文件进行解析,得到图像数据位置;
根据所述图像数据位置,得到所述图像文件的图像数据。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
将目标文件的文件格式信息写入所述目标文件中。
5.根据权利要求4所述的方法,其特征在于,所述文件格式信息包括:
文件头、文件体以及文件尾信息。
6.一种图像文件转换装置,其特征在于,该装置包括:
解析单元,用于打开图像文件,根据图像文件的格式,对图像文件进行解析,获得图像信息;
转换单元,用于建立并打开目标文件,根据目标文件的格式要求,写入文件头数据;根据目标文件的格式要求,写入文件体数据;根据目标文件的格式要求,写入交叉引用表数据;根据目标文件的格式要求,写入文件尾数据;以及,将图像文件的页面大小和页面个数信息写入目标文件;其中,所述文件头,为表明文件格式的信息;所述文件体,包括页面对象、父页对象、文档根对象、内容对象以及资源对象;所述交叉引用表,为记录各个对象的地址的结构;所述文档根,为描述树形文档结构的根节点;所述文件尾,用于记录交叉引用表在文件中的位置以及文档的根节点;关闭所述目标文件;关闭所述图像文件。
7.根据权利要求6所述的装置,其特征在于,所述图像信息包括:
图像数据、图像宽度、图像高度、图像颜色空间、图像样点占用的比特数、图像数据长度以及图像数据压缩方式。
8.根据权利要求7所述的装置,其特征在于,所述解析单元,打开图像文件,根据所述图像文件的格式,对图像文件进行解析,得到图像数据位置,并根据所述图像数据位置,得到所述图像文件的图像数据。
9.根据权利要求6所述的装置,其特征在于,该装置还包括:
文件格式信息写入单元,用于将目标文件的文件格式信息写入所述目标文件中。
10.根据权利要求9所述的装置,其特征在于,所述文件格式信息包括:
文件头、文件体以及文件尾信息。
CN200710304443XA 2007-12-27 2007-12-27 一种图像文件转换方法及装置 Expired - Fee Related CN101216828B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200710304443XA CN101216828B (zh) 2007-12-27 2007-12-27 一种图像文件转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710304443XA CN101216828B (zh) 2007-12-27 2007-12-27 一种图像文件转换方法及装置

Publications (2)

Publication Number Publication Date
CN101216828A CN101216828A (zh) 2008-07-09
CN101216828B true CN101216828B (zh) 2012-01-11

Family

ID=39623260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710304443XA Expired - Fee Related CN101216828B (zh) 2007-12-27 2007-12-27 一种图像文件转换方法及装置

Country Status (1)

Country Link
CN (1) CN101216828B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI508516B (zh) * 2012-09-06 2015-11-11 Avision Inc 掃描影像檔案自動轉換格式之方法及電腦程式產品
CN105308554B (zh) * 2013-04-10 2019-08-06 惠普深蓝有限责任公司 数据传输***、传输数据的方法、以及***
CN105302775A (zh) * 2014-06-30 2016-02-03 鸿合科技有限公司 一种文件格式转换方法及装置
CN105488049A (zh) * 2014-09-17 2016-04-13 腾讯科技(深圳)有限公司 网页图像解析方法、装置及浏览器
CN107423338B (zh) * 2017-04-28 2020-12-25 中国铁道科学研究院 一种铁路综合检测数据显示方法及装置
CN111310415A (zh) * 2018-11-23 2020-06-19 珠海金山办公软件有限公司 一种文档转换的方法、装置、计算机存储介质及终端
CN109948123B (zh) * 2018-11-27 2023-06-02 创新先进技术有限公司 一种图像合并方法及装置

Also Published As

Publication number Publication date
CN101216828A (zh) 2008-07-09

Similar Documents

Publication Publication Date Title
CN101216828B (zh) 一种图像文件转换方法及装置
CN102131020B (zh) 图像处理设备和图像处理方法
US8892990B2 (en) Automatic creation of a table and query tools
US8493595B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP2002132547A (ja) 電子情報管理サーバ、電子情報管理クライアントおよび電子情報管理方法ならびに電子情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体
CN101408874A (zh) 图像文字翻译装置及方法
JP2007166541A (ja) 画像処理方法およびその装置
EP2682881A2 (en) Document Processing Apparatus, Image Processing Apparatus, Document Processing Method, and Medium
CN102541948A (zh) 用于提取文档结构的方法和装置
KR100893829B1 (ko) 포맷 개작을 이용한 오브젝트 전송 방법
CN103399857A (zh) 一种通用文档结构信息抽取方法
US20120215864A1 (en) Document management apparatus and method of controlling the same
CN110232161A (zh) 一种基于浏览器的文档在线预览方法
US8988692B2 (en) Information processing apparatus, information processing method, and storage medium
JP6232736B2 (ja) 文書読解支援装置、文書読解支援システム、文書読解支援方法およびプログラム
CN103853849B (zh) 高压缩可回流文件的建立和绘制方法
JP2009037558A (ja) 画像処理装置、画像処理方法ならびにそのプログラム及び記憶媒体
JP4246531B2 (ja) 画像ファイル内のインク情報に関わる処理方法、コンピュータ可読媒体、およびシステム
KR101218087B1 (ko) 하둡 맵리듀스에서 바이너리 형태의 데이터 분석을 위한 입력포맷 추출방법 및 이를 이용한 바이너리 데이터의 분석방법
KR20130080745A (ko) 스마트폰의 카메라 모듈과 원격지 서버의 ocr 엔진을 이용한 전자문서 생성 방법 및 이를 위한 단말장치
CN102541818B (zh) 大版再编辑方法和装置
US20040054971A1 (en) System and method for managing patent documents
CN101340649A (zh) 带扫描识别功能的手机
JP4205603B2 (ja) 可変長マルチフォーマット変換装置及び方法並びにこれを用いたファイル転送システム
KR100708389B1 (ko) 디지탈 카메라에서 디지털 데이터를 보안성의 피디에프 파일로 압축 저장하는 장치 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120111

Termination date: 20191227