CN103034815A - 用于pdf文件的检测方法和装置 - Google Patents

用于pdf文件的检测方法和装置 Download PDF

Info

Publication number
CN103034815A
CN103034815A CN2011103001568A CN201110300156A CN103034815A CN 103034815 A CN103034815 A CN 103034815A CN 2011103001568 A CN2011103001568 A CN 2011103001568A CN 201110300156 A CN201110300156 A CN 201110300156A CN 103034815 A CN103034815 A CN 103034815A
Authority
CN
China
Prior art keywords
pdf document
encryption
document
file
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103001568A
Other languages
English (en)
Other versions
CN103034815B (zh
Inventor
康怡暖
张立业
孙雯文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201110300156.8A priority Critical patent/CN103034815B/zh
Publication of CN103034815A publication Critical patent/CN103034815A/zh
Application granted granted Critical
Publication of CN103034815B publication Critical patent/CN103034815B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)

Abstract

本发明提供了一种用于PDF文件的检测方法,包括:监控目标文件夹中产生的新的PDF文件;判断PDF文件中的加密信息字段是否符合加密标准;如果符合,则进一步获取PDF文件所对应的解密文件;通过判断解密文件是否正确,以确定PDF文件的加密是否正确。本发明提供了一种用于PDF文件的检测装置,包括:监控模块,用于监控目标文件夹中产生的新的PDF文件;字段判断模块,用于判断PDF文件中的加密信息字段是否符合加密标准;获取模块,用于如果符合,则进一步获取PDF文件所对应的解密文件;解密判断模块,用于通过判断解密文件是否正确,以确定PDF文件的加密是否正确。本发明实现了对PDF文件加解密的自动测试。

Description

用于PDF文件的检测方法和装置
技术领域
本发明涉及印前工作流程技术领域,具体而言,涉及一种用于PDF文件的检测方法和装置。
背景技术
现有技术中,在基于PDF文件的印前工作流程中,出于安全性的考虑,处理过程中生成的PDF文件往往会通过加密锁等方式进行加密。流程中不可避免还要对加密PDF文件进行解密后处理,如生成预览图、预飞等操作。对于测试人员来说验证PDF文件加密是否正确是一项非常重要的测试内容,主要的测试内容包括:
1在不安装任何Acrobat解密插件的情况下手工打开加密PDF文件,若无法打开,则文件加密成功;若可以打开,则文件加密失效。
2检索PDF文件解密后是否生成JPG预览图,通过JPG预览图的生成判断文件加密的正确性。
以上测试前提是测试过程中使用的源文件在不经过加密锁的情况下,通过规范化器内核解释结果正确。
发明内容
本发明旨在提供一种用于PDF文件的检测方法和装置,以解决PDF文件的加密测试的问题。
在本发明的实施例中,提供了一种用于PDF文件的检测方法,包括:监控目标文件夹中产生的新的PDF文件;判断PDF文件中的加密信息字段是否符合加密标准;如果符合,则进一步获取PDF文件所对应的解密文件;通过判断解密文件是否正确,以确定PDF文件的加密是否正确。
在本发明的实施例中,提供了一种用于PDF文件的检测装置,包括:监控模块,用于监控目标文件夹中产生的新的PDF文件;字段判断模块,用于判断PDF文件中的加密信息字段是否符合加密标准;获取模块,用于如果符合,则进一步获取PDF文件所对应的解密文件;解密判断模块,用于通过判断解密文件是否正确,以确定PDF文件的加密是否正确。
本发明上述实施例的用于PDF文件的检测方法和装置,实现了对PDF文件加密的自动测试。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例的用于PDF文件的检测方法的流程图;
图2示出了根据本发明优选实施例的用于PDF文件的检测方法的流程图;
图3示出了根据本发明实施例的用于PDF文件的检测装置的示意图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
图1示出了根据本发明实施例的用于PDF文件的检测方法的流程图,包括:
步骤S10,监控目标文件夹中产生的新的PDF文件;
步骤S20,判断PDF文件中的加密信息字段是否符合加密标准;
步骤S30,如果符合,则进一步获取PDF文件所对应的解密文件;
步骤S40,通过判断解密文件是否正确,以确定PDF文件的加密是否正确。
因为通过加密锁加密的结果对每个PDF文件都不相同,如果要验证加密结果是否准确,需要测试大量的文件才可以获得相对稳定的结论。当测试文件数量很多时,如果用人工的方法进行测试,测试的效率会变得很低,准确度也会降低。而本实施例中,提供了一个测试流程,可以通过计算机编程来实现该测试流程,例如用监控函数来执行步骤S10,用正则表达式来执行步骤S20,用流程控制算法来执行步骤S30,用判断语句和文件函数等来执行步骤S40,从而可以自动地实现大批量PDF文件的加密测试。这可以提高印前处理流程中文件加密测试的效率,节省人力和时间资源,增加缺陷的命中率。
优选地,在步骤S20之前,还包括:
读取数据表;
判断数据表中是否记载PDF文件已经处理过;
如果记载已经处理过,则忽略PDF文件;
否则,继续执行步骤S20。
优选地,步骤S20之后,还包括:
如果不存在加密信息字段,则确定PDF文件未加密,并将确定结果记录到数据表中;
如果加密信息字段的格式不符合加密标准,则确定PDF文件加密错误,并将确定结果记录到数据表中(即为已处理);
如果加密信息字段的格式符合加密标准,则在数据表中记录加密字符序列及判断结果。
现有技术需要人工填写一定的测试记录,测试结果的统计很不方便。上述优选实施例采用数据表来记载PDF文件的处理情况,从而可以形成历史记录,可以给出直观的测试报告,有利于进行日志查阅等,帮助测试人员进行大规模兼容性测试。还可以将文件名称、大小、时间等属性存入数据表,已存储文件不进行重复处理。对于数据表,可以提供打印、保存、发送邮件等功能。
优选地,步骤S30包括:获取具有与PDF文件的文件名相对应的文件名的预览图文件,例如,查找与PDF文件同名的JPG文件是否存在。在PDF解释器生成PDF的同时,一般都要生成JPG预览图供检查使用,生成JPG预览图必须要先对生成的加密PDF文件进行解密读取,若加密无效或错误时,该预览图一定不会生成,因此,利用这一特性,JPG预览图是否生成可以作为测试文件是否加密正确的重要依据。通过对预览图文件的检测,即可确定PDF文件的加密是否正确。该优选实施例比较简单,容易实现。
优选地,步骤S40包括:
如果预览图文件存在,其创建时间晚于PDF文件的创建时间,且其文件大小不为零,则确定PDF文件加密正确;
如果上述任一条件不满足,则确定PDF文件加密错误。
上述条件判断过程可以用一些很简单的文件函数来实现,从而很容易进行计算机编程。
图2示出了根据本发明优选实施例的用于PDF文件的检测方法的流程图,包括如下步骤:
步骤S202,监控扫描加密PDF文件生成目录;
步骤S204,当监控文件夹内容发生变化时,即新的加密PDF文件产生时,判断文件是否为未处理的新PDF文件,当获取到的PDF文件已处理过时,在数据表中可以获取到相应的记录,则不再继续处理该文件,继续扫描文件目录;
步骤S206,当获取到的PDF文件未处理时,打开PDF文件流,获取PDF文件中记录的加密信息字段;
步骤S208,判断加密信息字段是否存在;
步骤S210,PDF文件的加密信息字段如果不存在,则不再继续处理该文件,直接在数据表中记录PDF文件未加密;
步骤S212,PDF文件的加密信息字段如果存在,则进一步判断加密信息字段的格式是否符合加密标准;
步骤S214,若不符合,则确定文件加密错误,并将判断结果记录到数据表中;
步骤S216,PDF文件加密信息字段如果符合标准,则在数据表中记录文件加密字符序列及判断结果;
步骤S218,查找与PDF文件同名的JPG文件,如PDF文件名称[407_ZBA05705C_ps_p0001_b30.pdf],对应同名JPG预览图文件[407_ZBA05705C_ps_p0001_b30_Pre.jpg][407_ZBA05705C_ps_p0001_b30_Tmb.jpg];
步骤S214,如果JPG预览图文件不存在,则在数据表中记录文件加密错误。
步骤S220,如果JPG预览图文件存在,且大小不为0K,在数据表中记录文件加密正确。
步骤S222,以上测试结果均记录在数据表中,可以打印或作为附件发送邮件到相关测试人员。
图3示出了根据本发明实施例的用于PDF文件的检测装置的示意图,包括:
监控模块10,用于监控目标文件夹中产生的新的PDF文件;
字段判断模块20,用于判断PDF文件中的加密信息字段是否符合加密标准;
获取模块30,用于如果符合,则进一步获取PDF文件所对应的解密文件;
解密判断模块40,用于通过判断解密文件是否正确,以确定PDF文件的加密是否正确。
优选地,本装置还包括:
读取模块,用于读取数据表;
处理判断模块,用于判断数据表中是否记载PDF文件已经处理过;
忽略模块,用于如果记载已经处理过,则忽略PDF文件;
调用模块,用于否则调用字段判断模块。
优选地,本装置还包括:
第一模块,用于如果不存在加密信息字段,则确定PDF文件未加密,并将确定结果记录到数据表中;
第二模块,用于如果加密信息字段的格式不符合加密标准,则确定PDF文件加密错误,并将确定结果记录到数据表中;
第三模块,用于如果加密信息字段的格式符合加密标准,则在数据表中记录加密字符序列及判断结果。
优选地,获取模块获取具有与PDF文件的文件名相对应的文件名的预览图文件。
优选地,解密判断模块如果预览图文件存在,其创建时间晚于PDF文件的创建时间,且其文件大小不为零,则确定PDF文件加密正确;如果上述任一条件不满足,则确定PDF文件加密错误。
从以上的描述中可以看出,本发明提高了PDF加密正确性测试的效率,并可以给出直观的测试报告。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用于PDF文件的检测方法,其特征在于,包括:
监控目标文件夹中产生的新的PDF文件;
判断所述PDF文件中的加密信息字段是否符合加密标准;
如果符合,则进一步获取所述PDF文件所对应的解密文件;
通过判断所述解密文件是否正确,以确定所述PDF文件的加密是否正确。
2.根据权利要求1所述的方法,其特征在于,在判断所述PDF文件中的加密信息字段是否符合加密标准之前,还包括:
读取数据表;
判断所述数据表中是否记载所述PDF文件已经处理过;
如果记载已经处理过,则忽略所述PDF文件;
否则,继续执行所述判断所述PDF文件中的加密信息字段是否符合加密标准的步骤。
3.根据权利要求2所述的方法,其特征在于,判断所述PDF文件中的加密信息字段是否符合加密标准之后,还包括:
如果不存在所述加密信息字段,则确定所述PDF文件未加密,并将确定结果记录到所述数据表中;
如果所述加密信息字段的格式不符合加密标准,则确定所述PDF文件加密错误,并将确定结果记录到所述数据表中;
如果所述加密信息字段的格式符合加密标准,则在所述数据表中记录加密信息字段及判断结果。
4.根据权利要求3所述的方法,其特征在于,获取所述PDF文件所对应的解密文件包括:
获取具有与所述PDF文件的文件名相对应的文件名的预览图文件。
5.根据权利要求4所述的方法,其特征在于,判断所述解密文件是否正确包括:
如果所述预览图文件存在,其创建时间晚于所述PDF文件的创建时间,且其文件大小不为零,则确定所述PDF文件加密正确;
如果上述任一条件不满足,则确定所述PDF文件加密错误。
6.一种用于PDF文件的检测装置,其特征在于,包括:
监控模块,用于监控目标文件夹中产生的新的PDF文件;
字段判断模块,用于判断所述PDF文件中的加密信息字段是否符合加密标准;
获取模块,用于如果符合,则进一步获取所述PDF文件所对应的解密文件;
解密判断模块,用于通过判断所述解密文件是否正确,以确定所述PDF文件的加密是否正确。
7.根据权利要求6所述的装置,其特征在于,还包括:
读取模块,用于读取数据表;
处理判断模块,用于判断所述数据表中是否记载所述PDF文件已经处理过;
忽略模块,用于如果记载已经处理过,则忽略所述PDF文件;
调用模块,用于否则调用所述字段判断模块。
8.根据权利要求7所述的装置,其特征在于,还包括:
第一模块,用于如果不存在所述加密信息字段,则确定所述PDF文件未加密,并将确定结果记录到所述数据表中;
第二模块,用于如果所述加密信息字段的格式不符合加密标准,则确定所述PDF文件加密错误,并将确定结果记录到所述数据表中;
第三模块,用于如果所述加密信息字段的格式符合加密标准,则在所述数据表中记录加密信息字段及判断结果。
9.根据权利要求8所述的装置,其特征在于,所述获取模块获取具有与所述PDF文件的文件名相对应的文件名的预览图文件。
10.根据权利要求9所述的装置,其特征在于,所述解密判断模块如果所述预览图文件存在,其创建时间晚于所述PDF文件的创建时间,且其文件大小不为零,则确定所述PDF文件加密正确;如果上述任一条件不满足,则确定所述PDF文件加密错误。
CN201110300156.8A 2011-09-30 2011-09-30 用于pdf文件的检测方法和装置 Expired - Fee Related CN103034815B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110300156.8A CN103034815B (zh) 2011-09-30 2011-09-30 用于pdf文件的检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110300156.8A CN103034815B (zh) 2011-09-30 2011-09-30 用于pdf文件的检测方法和装置

Publications (2)

Publication Number Publication Date
CN103034815A true CN103034815A (zh) 2013-04-10
CN103034815B CN103034815B (zh) 2015-07-22

Family

ID=48021701

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110300156.8A Expired - Fee Related CN103034815B (zh) 2011-09-30 2011-09-30 用于pdf文件的检测方法和装置

Country Status (1)

Country Link
CN (1) CN103034815B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750675A (zh) * 2015-04-01 2015-07-01 山东省计算中心(国家超级计算济南中心) 一种未知格式加密文件的识别方法
CN108038441A (zh) * 2017-12-07 2018-05-15 庞军良 一种基于图像识别的***与方法
CN109767516A (zh) * 2018-12-14 2019-05-17 北京摩拜科技有限公司 日志设置和打印方法、设置和打印设备、及日志***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289639A1 (en) * 2004-06-23 2005-12-29 Leung Wai K System and method of securing the management of documentation
CN1770051A (zh) * 2004-11-04 2006-05-10 华为技术有限公司 一种文件安全检测方法
CN101051339A (zh) * 2007-05-24 2007-10-10 炬力集成电路设计有限公司 文件保护方法及其装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050289639A1 (en) * 2004-06-23 2005-12-29 Leung Wai K System and method of securing the management of documentation
CN1770051A (zh) * 2004-11-04 2006-05-10 华为技术有限公司 一种文件安全检测方法
CN101051339A (zh) * 2007-05-24 2007-10-10 炬力集成电路设计有限公司 文件保护方法及其装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
龙飞宇等: "基于文件***过滤驱动的文件标识研究", 《通信技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750675A (zh) * 2015-04-01 2015-07-01 山东省计算中心(国家超级计算济南中心) 一种未知格式加密文件的识别方法
CN104750675B (zh) * 2015-04-01 2017-09-26 山东省计算中心(国家超级计算济南中心) 一种未知格式加密文件的识别方法
CN108038441A (zh) * 2017-12-07 2018-05-15 庞军良 一种基于图像识别的***与方法
CN108038441B (zh) * 2017-12-07 2021-03-16 潘晓梅 一种基于图像识别的***与方法
CN109767516A (zh) * 2018-12-14 2019-05-17 北京摩拜科技有限公司 日志设置和打印方法、设置和打印设备、及日志***

Also Published As

Publication number Publication date
CN103034815B (zh) 2015-07-22

Similar Documents

Publication Publication Date Title
US8166313B2 (en) Method and apparatus for dump and log anonymization (DALA)
CN112217835B (zh) 报文数据的处理方法、装置、服务器和终端设备
US20090292930A1 (en) System, method and apparatus for assuring authenticity and permissible use of electronic documents
US8874932B2 (en) Method for order invariant correlated encrypting of data and SQL queries for maintaining data privacy and securely resolving customer defects
CN106874461A (zh) 一种工作流引擎支持多数据源配置安全访问***及方法
CN109376133A (zh) 文件访问方法及文件访问***
CN112685436B (zh) 一种溯源信息处理方法及装置
WO2020087877A1 (zh) 一种隐私信息溯源取证方法、装置及***
CN112329042A (zh) 一种大数据安全存储***及方法
CN103745166A (zh) 文件属性值的检验方法和装置
CN110378134A (zh) 一种基于标签的混合云信息保护和数据流转跟踪方法
CN103034815B (zh) 用于pdf文件的检测方法和装置
CN109104458B (zh) 一种用于云平台可信性验证的数据采集方法及***
CN107423583A (zh) 一种软件保护设备重置方法及装置
CN109088872A (zh) 带使用期限的云平台的使用方法、装置、电子设备及介质
CN114925337B (zh) 数据的标注方法、装置和电子设备
CN111859876A (zh) 一种表格自动录入方法及***
CN106612283A (zh) 一种识别下载文件来源的方法及装置
CN116633555A (zh) 一种用于终端设备数据采集交互的方法及***
CN116009791A (zh) 数据分类存储管理方法、装置、设备及介质
Voisin et al. The metadata anonymization toolkit
CN115033900A (zh) 一种基于区块链的电子数据取证方法及***
CN108075932B (zh) 一种数据监控方法和装置
CN111949476A (zh) 一种实时监控app内业务健康度的轻量化方法及***
CN111934949A (zh) 一种基于数据库注入测试的安全测试***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150722

Termination date: 20190930

CF01 Termination of patent right due to non-payment of annual fee