CN103034646A - Pdf样例文件的检索方法和装置 - Google Patents

Pdf样例文件的检索方法和装置 Download PDF

Info

Publication number
CN103034646A
CN103034646A CN2011102999543A CN201110299954A CN103034646A CN 103034646 A CN103034646 A CN 103034646A CN 2011102999543 A CN2011102999543 A CN 2011102999543A CN 201110299954 A CN201110299954 A CN 201110299954A CN 103034646 A CN103034646 A CN 103034646A
Authority
CN
China
Prior art keywords
file
attribute
pdf
object properties
pdf sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011102999543A
Other languages
English (en)
Other versions
CN103034646B (zh
Inventor
张立业
康怡暖
孙雯文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University Founder Group Co Ltd
Priority to CN201110299954.3A priority Critical patent/CN103034646B/zh
Publication of CN103034646A publication Critical patent/CN103034646A/zh
Application granted granted Critical
Publication of CN103034646B publication Critical patent/CN103034646B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种PDF样例文件的检索方法和装置,方法包括:按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索,确定对应的PDF样例文件;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页。本发明的方法有效扩展了检索的范围,提高了后续测试的效率。

Description

PDF样例文件的检索方法和装置
技术领域
本发明涉及计算机检索技术领域,具体而言,涉及一种PDF样例文件的检索方法和装置。
背景技术
印刷行业的软件测试过程中,通过PDF的样例文件对软件进行测试。这些PDF样例文件具有用于测试的属性,如字符属性、颜色属性等。当需要测试软件的某项功能时,需要查找具有相应属性的PDF样例文件。
目前,相关技术中检索用于测试的PDF样例文件的过程包括:将PDF样例文件用于测试的属性按照命名规则构成其自身的名称;确定用于测试的样例文件所具有的属性;在PDF样例文件的名称中检索是否包含确定的属性,如果包含,则将检索到的PDF样例文件作为用于测试的PDF样例文件。
由于文件名长度有限,不能记录文件的全部属性,所以查找的范围比较有限。
发明内容
本发明旨在提供一种PDF样例文件的检索方法和装置,以解决上述由于文件名长度有限,不能记录文件的全部属性,所以查找的范围比较有限的问题。
在本发明的实施例中,提供了一种PDF样例文件的检索方法,包括:按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索,确定对应的PDF样例文件;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页。
在本发明的实施例中,还提供了一种PDF样例文件的检索装置,包括:检索模块,用于按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页;确定模块,根据所述检索的结果确定对应的PDF样例文件。
本发明因为采用总记录存储文件属性、通过分记录存储对象属性,所以克服了文件名长度有限,不能记录文件的全部属性,查找的范围有限的问题,进而达到了按照存储的文件属性和对象属性,确定对应的各个PDF样例文件,扩大了检索范围,缩短了检索时间,提高了后续的测试的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了优选实施例的流程图;
图2示出了实施例中将总记录和分记录存储到数据库的流程图;
图3示出了实施例中在数据库中通过检索总记录和/或分记录确定对应的PDF文件的流程图;
图4示出了实施例中的装置结构框图。
具体实施方式
下面将参考附图并结合实施例,来详细说明本发明。
参见图1,包括以下步骤:
S11:按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索。
其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;
所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页。
S12:确定对应的PDF样例文件。
通过上述实施例的步骤,预先在数据库中建立对应PDF样例文件的总记录和分记录,通过总记录和分记录的数据关系,存储每个PDF样例文件中***所需要的全部属性。在后续的查找过程中,采用含有各种属性的检索式,都可通过存储的属性找到相应的PDF样例文件,有效扩展了检索的范围,提高了后续测试的效率。
优选地,上述实施例中的总记录、分记录通过以下步骤存储到数据库中,参见图2,包括:
S21:选择PDF样例文件;
接收对文件夹中各个PDF样例文件的选择,或接收存储路径,按照存储路径批量获得路径下的所有PDF样例文件。
S22:解析各个PDF样例文件,获得文件头、内容流文件、交叉索引表;
交叉索引表用于记录各个对象在内容流文件中的位置,如第几页,第几行等。
S23:通过交叉索引表在内容流文件中解析出各个对象;
这些对象分布在PDF样例文件的各个页面中,每个对象可以是页面中的一个字符、或一个图形、或图形的一部分等。
S24:检索文件属性集合中与解析的文件头相同的文件属性;
在解析的文件头中,包括多个文件属性。这些文件属性至少包括以下之一:生成所述PDF样例文件的软件类型属性、PDF版本属性、预分色属性、总页码属性、输出描述属性、加密属性、PDFX版本属性等。
其中,预分色属性为解析的PDF样例文件是否为预分色文件,输出描述属性为是否存在输出的描述信息。
文件属性为用户预先设置的属性的集合,用于存储测试过程中所需要的各个文件属性。这种属性的集合也可称为属性字典。属性字典中不仅存储各个文件属性;优选地,还可存储有每个文件属性的属性项,如文件属性为PDF版本属性的各个属性项。
S25:检索对象属性集合中与从内容流文件中解析的对象相同的对象属性;
步骤S24与S25可同时执行,也可先后执行,执行的先后顺序不相互影响其它步骤的执行。对象属性至少包括以下之一:注释内容属性、图像对象属性、渐变属性、路径属性、字体属性、字体内容属性、色彩空间类型属性、函数属性、透明属性、填充属性。存储的对象属性除了各个属性外,也还存储有每个属性的属性项。
具体如下:注释内容属性【注释类型(Widget Type、Link、FreeText、CirCle、Polygon、Ployline、Highlight、Underline、Squiggly、StrikeOut、Stamp、Caret、Ink、FileAttachment、sound、Movie、PrinterMark、TrapNet、WaterMark、ThreeD)、Widge是否可以输出、AP字典内N对象类型(流对象、词典对象、其它对象)】
图像对象属性【图像类型(Normal、InlineImage、Mask、explictMask、ColorkeyMask、Smask)、位深(1、2、4、6、8、16)、是否存在线高为1的图像、是否存在线宽为1的图像、X方向分辨率、Y方向分辨率、是否存在缺省的Decode、呈色意向、叠印模式、是否叠印、是否前端组装、图像处理类型、是否前端变倍、图像变倍算法、trasfer类型、是否裁切、色面数量、是否变形、是否含有UCR、是否含有BG、挂网类型、挂网中是否存在Transfer、挂网Spot函数类型、bHasTwoSquaresThreshold)】
渐变属性【渐变类型、是否定义了背景颜色、叠印模式、是否定义了BBox、是否含有UCR、是否为类型2的Pattern、Transfer类型、是否多输出函数、是否叠印、是否含有BG、函数类型、是否多输出、是否多输入、是否存在Range项】
路径属性【路径类型、是否存在闭合SubPath、是否存在曲线、是否存在零向量、是否存在定点数越界、绘制操作符、Trasfer类型、是否叠印、是否含有UCR、是否存在多个SubPath、是否存在不闭合SubPath、是否被缓冲、Flatness是否比默认值小、存在接近垂直/水平直线、叠印模式、Flatness且是否为曲线、是否含有BG】
字体属性【字体类型(Type0、Type1、Type3、TrueTYpe)、字体名称、基础字体名称、字体编码类型、宽度表类型、字体文件是否内嵌、字体PaintTYpe、是否合成粗体效果、是否合成斜体效果、是否OpenTYpe字体、是否非间接引用对象、是否Symbolic类型的字体)、隐藏图元属性(具有OC属性的图元类型、被隐藏图元类型(Stroke Element、Fill Element、Text Element、Shading Element、Xobject Element)、是否在Marked Content中嵌套多层)】
字体内容属性【TextRenderMode、TextKnockOut、是否存在要进cache的Type3字符、是否存在不进cache的Type3字符、是否存在包含Image的Type3字符、是否存在包含Form的Type3字符、是否存在包含Font的Type3字符、是否存在包含seac指令的Type1字符、是否存在包含Stem Hint的Type1字符、是否存在包含CounterHint的Type1字符、字典中的宽度表信息是否与字体文件中的度量信息不一致、TransferType、是否存在包含Instruction的TrueType字符、是否含有UCR、叠印模式、是否含有UCR、是否含有BG、是否叠印、字体类型】
色彩空间类型属性【CS_DeviceGray、CS_DeviceRGB、CS_DeviceCMYK、CS_CalGray、CS_CalRGB、CS_ICCBased、CS_Separation、CS_DeviceN、CS_Indexed、CS_Lab、CS_Pattern】
函数属性【函数类型(Sample Func、Exp Func、Stitch Func、PS Func)、是否多输出、是否多输入、是否存在Range项】
透明属性【透明组内图元、图元含有专色、含有softImageMask、父透明属性、透明组自身属性(Isolated、Konckout、PageGroup)、透明图像状态属性(BlendMode、AIS、OP、OPM、SoftMask类型、背景色)】
填充属性FilterType【ASCIIHEX、ASCII85、RLE、LZW、FLATE、FAX、DCT、JBIG2、CRYPT、SUBFILE、RESTREAM、SPECIAL、JPX】。
S26:存储相同的文件属性、对象属性;
可在文件属性集合中检索从PDF样例文件中解析的文件属性,并将检索到的文件属性作为一条总记录存储,并在总记录中存储该PDF样例文件的ID,以建立总记录和PDF样例文件的对应关系。
可在总记录中存储对应的表索引,该表索引指向一个存储表,用于存储多条分记录,每条分记录用于存储在对象属性集合中检索到的与内容流文件中解析到对象的属性相同的对象属性。在内容流文件中解析PDF样例文件中的对象时,可以按照页面分别解析各页的对象,并在对象属性中进行检索。在存储时,每条分记录存储的对象属性对应PDF样例文件中一页的对象属性。
在存储的总记录和分记录中,还记录每个文件属性或对象属性的多个属性项,在后续检索时,可按照属性检索,也可以按照属性项进行检索。
由于按照总记录和分记录的数据关系存储文件属性和对象属性,在检索PDF样例文件时,可按照检索式在文件属性中检索对应的PDF样例文件,也可按照检索式在对象属性中检索对应的PDF样例文件,以减少检索范围,提高检索效率。
优选地,还可在总记录或分记录中按照每个文件属性、对象属性的类型添加分类标记,用于标识其属性类。
优选地,参见图3所示出的流程图,通过上述实施例中存储的总记录、分记录,检索PDF样例文件的过程包括以下步骤,包括:
S31:接收输入的检索式;
通过测试要求选择定制的测试条件;测试条件至少包括以下之一:文件属性、对象属性、文件属性的属性项、对象属性的属性项、属性类等,测试条件中还包括属性、属性项、属性类之间的逻辑关系。
S32:按照接收的检索式在数据库中检索;
按照检索式中的内容以及逻辑关系在数据库中存储的总记录和/或分记录中检索,查找相应的文件属性和/或对象属性,或查找文件属性或对象属性中的属性项。
例如:查找文件属性为PDF版本属性的属性项,查找对象属性为图像对象属性的属性项。
S33:获得各个PDF样例文件的ID;
S34:通过获得的ID找到PDF样例文件在数据库中存储的总记录。
将获得的ID通过数组的形式记录下来。
S35:将数据库中的各条总记录逐条的填充到界面表格中,以分页的形式进行输出展示。
在界面表格中,可以“ID”+“文件路径”+“文件名”的形式存储。每条结果间以分号分隔,以便于后续被测试程序识别。
本发明的实施例,可在检索后,导出本次根据测试需求筛选出PDF样例文件的列表,并提供给被测试软件进行批量自动化提交测试。避免了手动将每个筛选结果逐个提交给被测试程序所带来的操作繁琐,效率底,浪费资源的情况,减少了人工成本,缩减了提交时间,提高了工作效率。
本发明的实施例,由于可在文件属性集合、对象属性集合中设置筛选的属性、属性项,即可根据每次测试过程的需要动态的调整PDF属性筛选的条件和处理的过程,当测试目的发生变化时,只需通过检索式更改属性筛选条件即可。作为属性字典的文件属性集合、对象属性集合的扩展性非常强,如果有了新增的属性要求,只需要修改字典即可。PDF样例文件在解析后可存入数据库,扩充了检索的范围,便于以后的长期使用和维护。
本发明还提供一种PDF样例文件的检索装置,包括:
检索模块41,用于按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页;
确定模块42,根据检索模块41检索的结果确定对应的PDF样例文件。
优选地,总记录和/或分记录存储在数据库51中。
优选地,该装置还包括:
第一解析模块43,用于从每个所述PDF样例文件中解析出文件头;
第一判断模块44,用于判断所述第一解析模块43解析的文件头中是否具有与文件属性集合中相同的文件属性;
总记录写入模块45,用于如果第一判断模块44判断出有相同的文件属性,则将所述相同的文件属性存储在每个所述PDF样例文件对应的每条所述总记录中,并写入数据库51。
优选地,该装置还包括:
第二解析模块46,用于从每个所述PDF样例文件解析出所述文件头的同时,解析出内容流和交叉索引表;
定位模块47,用于通过所述第二解析模块46解析出的交叉索引表在所述内容流中定位当前解析的PDF样例文件中每页的对象;
第二判断模块48用于判断定位模块47定位到每页的对象中是否具有与所述对象属性集合中相同的对象属性;
分记录写入模块49,用于如果第二判断模块48判断到有相同的对象属性,则将所述相同的对象属性存储在对应的每条所述分记录中,并写入数据库51。
优选地,所述装置还包括:
显示模块50,用于在所述确定模块42确定对应的PDF样例文件之后,呈现所述确定的每个PDF样例文件的标识、存储路径和名称。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种PDF样例文件的检索方法,其特征在于,包括:
按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索,确定对应的PDF样例文件;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页。
2.根据权利要求1所述的方法,其特征在于,所述总记录通过以下步骤生成:
从每个所述PDF样例文件中解析出文件头;
判断所述文件头中是否具有与文件属性集合中相同的文件属性;
如果有,则将所述相同的文件属性存储在每个所述PDF样例文件对应的每条所述总记录中。
3.根据权利要求2所述的方法,其特征在于,所述分记录通过以下步骤生成:
从每个所述PDF样例文件解析出所述文件头的同时,解析出内容流和交叉索引表;
通过所述交叉索引表在所述内容流中定位当前解析的PDF样例文件中每页的对象;
判断所述每页的对象中是否具有与所述对象属性集合中相同的对象属性;
如果有,则将所述相同的对象属性存储在对应的每条所述分记录中。
4.根据权利要求1或2所述的方法,其特征在于,所述文件属性至少包括以下之一:
生成所述PDF样例文件的软件类型属性、PDF版本属性、预分色属性、总页码属性、输出描述属性、加密属性、PDFX版本属性。
5.根据权利要求1或3所述的方法,其特征在于,所述对象属性至少包括以下之一:
注释内容属性、图像对象属性、渐变属性、路径属性、字体属性、字体内容属性、色彩空间类型属性、函数属性、透明属性、填充属性。
6.根据权利要求1所述的方法,其特征在于,所述确定对应的PDF样例文件之后,还包括:
呈现所述确定的每个PDF样例文件的标识、存储路径和名称。
7.一种PDF样例文件的检索装置,其特征在于,包括:
检索模块,用于按照由文件属性和/或对象属性组成的逻辑表达式在存储的多条总记录和/或分记录中检索;其中,每条所述总记录用于存储从每个PDF样例文件解析的与文件属性集合中相同的文件属性、以及对应的表索引;所述表索引指向的表包括:多条分记录,每条所述分记录用于存储从所述总记录对应的PDF样例文件解析的与对象属性集合中相同的对象属性;每条所述分记录存储的对象属性来源于所述总记录对应的PDF样例文件中的一页;
确定模块,根据所述检索的结果确定对应的PDF样例文件。
8.根据权利要求7所述的装置,其特征在于,还包括:
第一解析模块,用于从每个所述PDF样例文件中解析出文件头;
第一判断模块,用于判断所述文件头中是否具有与文件属性集合中相同的文件属性;
总记录写入模块,用于如果有相同的文件属性,则将所述相同的文件属性存储在每个所述PDF样例文件对应的每条所述总记录中。
9.根据权利要求8所述的装置,其特征在于,还包括:
第二解析模块,用于从每个所述PDF样例文件解析出所述文件头的同时,解析出内容流和交叉索引表;
定位模块,用于通过所述交叉索引表在所述内容流中定位当前解析的PDF样例文件中每页的对象;
第二判断模块,用于判断所述每页的对象中是否具有与所述对象属性集合中相同的对象属性;
分记录写入模块,用于如果有相同的对象属性,则将所述相同的对象属性存储在对应的每条所述分记录中。
10.根据权利要求7所述的装置,其特征在于,还包括:
显示模块,用于在所述确定对应的PDF样例文件之后,呈现所述确定的每个PDF样例文件的标识、存储路径和名称。
CN201110299954.3A 2011-09-30 2011-09-30 Pdf样例文件的检索方法和装置 Expired - Fee Related CN103034646B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110299954.3A CN103034646B (zh) 2011-09-30 2011-09-30 Pdf样例文件的检索方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110299954.3A CN103034646B (zh) 2011-09-30 2011-09-30 Pdf样例文件的检索方法和装置

Publications (2)

Publication Number Publication Date
CN103034646A true CN103034646A (zh) 2013-04-10
CN103034646B CN103034646B (zh) 2016-04-13

Family

ID=48021548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110299954.3A Expired - Fee Related CN103034646B (zh) 2011-09-30 2011-09-30 Pdf样例文件的检索方法和装置

Country Status (1)

Country Link
CN (1) CN103034646B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366008A (zh) * 2013-07-22 2013-10-23 天津汉柏信息技术有限公司 一种查找资源的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408876A (zh) * 2007-10-09 2009-04-15 中兴通讯股份有限公司 一种电子文档全文检索的方法及***
CN101866348A (zh) * 2009-04-17 2010-10-20 精工爱普生株式会社 打印装置、图像处理装置、图像处理方法及计算机程序
CN102096845A (zh) * 2009-12-10 2011-06-15 黑龙江省森林工程与环境研究所 森林分类经营知识库全文搜索引擎***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408876A (zh) * 2007-10-09 2009-04-15 中兴通讯股份有限公司 一种电子文档全文检索的方法及***
CN101866348A (zh) * 2009-04-17 2010-10-20 精工爱普生株式会社 打印装置、图像处理装置、图像处理方法及计算机程序
CN102096845A (zh) * 2009-12-10 2011-06-15 黑龙江省森林工程与环境研究所 森林分类经营知识库全文搜索引擎***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PDFMAKER: ""一个简单的PDF文件结构的分析"", 《HTTP://BLOG.CSDN.NET/PDFMAKER/ARTICLE/DETAILS/573990》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366008A (zh) * 2013-07-22 2013-10-23 天津汉柏信息技术有限公司 一种查找资源的方法和装置

Also Published As

Publication number Publication date
CN103034646B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
US6708166B1 (en) Method and apparatus for storing data as objects, constructing customized data retrieval and data processing requests, and performing householding queries
CN109635120B (zh) 知识图谱的构建方法、装置和存储介质
US8977606B2 (en) Method and apparatus for generating extended page snippet of search result
US20060293879A1 (en) Learning facts from semi-structured text
CN105677764A (zh) 信息提取方法和装置
CN104185845A (zh) 用于提供网页的二进制表示的***和方法
CN107015948B (zh) 一种日志信息格式化方法及***
CN102375807A (zh) 文字校对方法和装置
CN112861489A (zh) 一种对word文档进行处理的方法和装置
CN107145538B (zh) 表格数据查询方法、装置与***
CN107526755B (zh) 数据的处理方法及装置
KR101340588B1 (ko) 웹페이지 구성방법 및 그 장치
CN116415206A (zh) 运营商多数据融合方法、***、电子设备及计算机存储介质
CN102737030A (zh) 专利文档的数据输出方法、终端及***
CN110222251A (zh) 一种基于网页分割和搜索算法的服务包装方法
CN114201620A (zh) 用于挖掘pdf文件中的pdf表格的方法、设备和介质
US10824803B2 (en) System and method for logical identification of differences between spreadsheets
CN111898351B (zh) 基于Aviator的Excel数据自动导入方法、装置、终端设备及存储介质
US10346421B1 (en) Data profiling of large datasets
US7873902B2 (en) Transformation of versions of reports
CN102541905B (zh) 用于pdf文件的属性处理方法及装置
CN103034646B (zh) Pdf样例文件的检索方法和装置
CN109408704B (zh) 基金数据关联方法、***、计算机设备和存储介质
CN114861614A (zh) 用于填充数据的方法及装置、电子设备、介质
CN108572997B (zh) 一种具有网络属性的多源数据的整合存储***及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160413

Termination date: 20190930

CF01 Termination of patent right due to non-payment of annual fee