CN111832264A - 基于pdf文件的签名位置确定方法、装置及设备 - Google Patents
基于pdf文件的签名位置确定方法、装置及设备 Download PDFInfo
- Publication number
- CN111832264A CN111832264A CN202010489992.4A CN202010489992A CN111832264A CN 111832264 A CN111832264 A CN 111832264A CN 202010489992 A CN202010489992 A CN 202010489992A CN 111832264 A CN111832264 A CN 111832264A
- Authority
- CN
- China
- Prior art keywords
- signature
- block data
- keyword
- determining
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于计算机技术领域,提供了一种基于PDF文件的签名位置确定方法、装置及设备。方法包括获取待签名的PDF文件的文件属性,并根据文件属性确定用于表征签署人的关键词;根据预先设置的关键词配置表确定关键词的目标签字格式;对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息;根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置。本申请实施例提供基于PDF文件的签名位置确定方法,实现了PDF文件的签名位置的自动定位。
Description
技术领域
本申请属于计算机技术领域,尤其涉及一种基于PDF文件的签名位置确定方法、装置及设备。
背景技术
随着互联网技术的发展,商业活动中文件的签署需求量越来越大。
为了解决传统签署方式中存在的效率低下的问题,通常采用基于区块链的电子签名的方法进行PDF文件的签署,即基于区块链的分布式数据以及共识机制实现电子文件的多方快速签署。
基于区块链的电子签名方法,仅可以实现PDF电子文件的自动签署,无法自动识别签名位置,需要人工预先指定各待签署文件的签名位置;由于待签署文件具有多样化性,不同待签署文件的签名位置不同,甚至一份签署文件中的可能有多个签名位置,导致PDF电子文件的签署效率大大降低。
发明内容
有鉴于此,本申请实施例提供了一种基于PDF文件的签名位置确定方法、装置及设备,以解决现有技术中无法自动定位签名位置,导致PDF电子文件的签署效率大大降低的技术问题。
第一方面,本申请实施例提供了一种基于PDF文件的签名位置确定方法,包括:
获取待签名的PDF文件的文件属性,并根据文件属性确定用于表征签署人的关键词;其中,文件属性包括公司名称、会议类型以及文件名称;
根据预先设置的关键词配置表确定关键词的目标签字格式;其中,关键词配置表包括文件属性、签署人以及签字格式之间的对应关系,对应关系用于指示文件属性对应的文件中签署人可使用的签字格式;
对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息;
根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置。
在第一方面的一种可能的实现方式中,对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息,包括:
获取待签名的PDF文件的文本信息;
将文本信息划分为多个自然句,并确定每个自然句的位置信息;
将每个自然句作为一个分块数据,并将多个分块数据基于上下文顺序设置。
在第一方面的一种可能的实现方式中,关键词配置表中每个签署人对应多种签字格式,且与每个签署人对应的多种签字格式具有不同的优先级;
根据预先设置的关键词配置表确定关键词的目标签字格式,包括:
从关键词配置表中查找关键词对应的多种候选签字格式;
根据多种候选签字格式各自分别对应的优先级,将多种候选签字格式进行排序,并将排序后的多种候选签字格式作为关键词的目标签字格式。
在第一方面的一种可能的实现方式中,根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,包括:
从多个分块数据中查找至少两个包含关键词的第一分块数据;
将每个第一分块数据中的关键词与该关键词的上下文信息组合生成签名块,解析获得每个签名块的签字格式;
将多个签名块中每个签名块的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,其中,N为大于或等于2的整数。
在第一方面的一种可能的实现方式中,每个分块数据的位置信息均包含页码信息;
从多个分块数据中查找至少两个包含关键词的第一分块数据,包括:
根据每个分块数据的页码信息,将对应于相同页码的多个分块数据组合生成一个字符串,获得多个待比较字符串;
针对每个待比较字符串,在待比较字符串包含关键词的情况下,将待比较字符串中的每个分块数据与关键词进行一一比对,并将与关键词相匹配的分块数据保存为第一分块数据。
在第一方面的一种可能的实现方式中,将多个签名块中每个签名块的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,包括:
针对目标签字格式中的每种候选签字格式,将多个签名块中每个签名块的签字格式与该候选签字格式进行匹配分析,保存与候选签字格式相匹配的签名块为候选签名块;
按照目标签字格式中多种候选签字格式的优先级顺序对多个候选签名块进行排序;
将顺序为前N个候选签名块各自分别对应的分块数据,确定为与关键词的目标签字格式相似度最高的N个目标分块数据。
在第一方面的一种可能实现方式中,关键词配置表还包括用于表征签署人的签字样式;
将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置之后,方法还包括:
根据关键词配置表,确定签署人的签字样式,并将签字样式与多个候选签字格式分别组合保存生成多个签字效果;
针对N个目标分块数据中的每个目标分块数据,响应于接收到的签字效果查看操作信息,依次将多个签字效果的添加至该目标分块数据对应的位置并显示;
响应于接收到的签字确定操作信息,根据当前显示的签字效果生成签名后的PDF文件。
第二方面,本申请实施例提供了一种基于PDF文件的签名位置的确定装置,包括:
获取模块,用于获取待签名的PDF文件的文件属性,并根据文件属性确定用于表征签署人的关键词;其中,文件属性包括公司名称、会议类型以及文件名称;
格式确定模块,用于根据预先设置的关键词配置表确定关键词的目标签字格式;其中,关键词配置表包括文件属性、签署人以及签字格式之间的对应关系,对应关系用于指示文件属性对应的文件中签署人可使用的签字格式;
解析模块,用于对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息;
位置确定模块,用于根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置。
第三方面,本申请实施例提供了一种基于PDF文件的签名位置确定设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述第一方面任一项方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任一项方法的步骤。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项的方法。
本申请实施例提供的基于PDF文件的签名位置确定方法,通过待签名的PDF文件的文件属性确定表征签署人的关键词,基于预先设置的关键词配置表确定关键词的目标签字格式,然后通过对待签名的PDF文件进行解析处理获得多个分块数据以及每个分块数据的位置信息,则将包含关键词且与该关键词的目标签字格式相匹配的分块数据作为目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置,实现了待签名的PDF文件的签名位置的自动定位,从而不需要人工预先指定各待签名的PDF文件的签名位置,大大提高了PDF电子文件签署效率。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的基于PDF文件的签名位置确定方法的流程示意图;
图2是本申请一实施例提供的确定关键词的目标签字格式的流程示意图;
图3为本申请一实施例提供的确定多个分块数据方法的流程示意图;
图4是本申请一实施例提供的确定关键词的目标分块数据的流程示意图;
图5是本申请另一实施例提供的确定目标分块数据的流程示意图;
图6是本申请一实施例提供的生成签名后PDF文件方法的流程示意图;
图7是本申请一实施例提供的签名后的PDF文件的签字效果示意图;
图8是本申请一实施例提供的基于PDF文件的签名位置确定装置的结构示意图;
图9是本申请一实施例提供的基于PDF文件的签名位置确定设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行示例性说明。值得说明的是,下文中列举的具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图1为本申请一实施例提供的基于PDF文件的签名位置确定方法的流程示意图,本实施例的执行主体为基于PDF的签名位置确定设备,基于PDF的签名位置确定设备可以包括但不限于智能手机、平板电脑、可穿戴设备等的移动终端,还可以是台式电脑、机器人、服务器等。如图1所示,基于PDF文件的签名位置确定方法包括:
S10、获取待签名的PDF文件的文件属性,并根据文件属性确定用于表征签署人的关键词。
本实施例中,待签名的PDF文件的文件属性可以包括公司名称、会议类型、文件类型以及文件名称中一项或多项。
其中,待签名的PDF文件可以为三会需要签署的任意会议文件,例如,待表决的表决表、决议文件以及授权委托文件等。应理解的是,三会是指股东大会,董事会以及监事会。
例如,待签名的PDF文件为A公司第一届董事会第三次临时会议的表决表,具体为“关于公司组织架构调整议案”的表决票。则待签名PDF文件的公司名称为A公司,会议类型为董事会中的临时会议,文件类型为表决票,文件名称为“关于公司组织架构调整议案”。
本实施例中,用于表征签署人的关键词可以是指签署人的姓名。
本实施例中,根据文件属性确定用于表征签署人的关键词可以是指在预先设置的关键词配置表中查找确定文件属性对应的关键词。
其中,预先设置的关键词配置表(下述简称为关键词配置表)可以包括不同文件属性对应的文件中的需要进行签名的签署人。
本实施例中,待签名的PDF文件中签署人可以有多个。例如,待签名的PDF文件为“关于公司组织架构调整议案”的表决票,则待签名的PDF文件中的签署人可以包括董事会中的多位董事。
应理解的是,确定每个签署人的签署位置的过程相同,后续的实施例中仅描述了确定某一个签署人的签名位置的示例性实施例过程,但是并不对签署人的个数造成限定。
S20、根据预先设置的关键词配置表确定关键词的目标签字格式。
本步骤中的关键词配置表与步骤10中的关键词配置表相同,除了包括不同文件属性对应的文件中的需要进行签名的签署人之外,关键词配置表还可以包括文件属性以及签署人之间包括文件属性、签署人以及签字格式之间的对应关系,对应关系用于指示文件属性对应的文件中的签署人可使用的签字格式。
本实施例中,关键词配置表根据大量的三会签字文件的文件属性、签署人以及签字格式预先确定的。可选地,每个公司可以对应有一个关键词配置表。
示例性的,请一并参阅表1,表1为本申请实施例提供的Y公司的关键词配置表。该Y公司的关键词配置表包括会议类型、文件名称、签署人以及签署人可使用的多种签字格式。其中,关键词配置表中会议类型可以分为多种,例如董事会会议、股东会议以及监事会会议。每种会议类型对应的文件名称可以有多个,每个文件对应的签署人可以有多个,每个签署人可使用的签字格式可以有多种。
示例性的,如表1所示,董事会会议中文件A的签署人有张三和李四两位,在文件A中,张三可使用的签字格式为冒号签、横线上下签、横线左右签以及括号签,李四可使用的签字格式为冒号签以及括号签。
董事会会议中文件B的签署人包含李四和王五两位;在文件B中,李四可使用的签字格式为冒号签以及括号签,王五可使用的签字格式为冒号签以及横线上下签。
表1Y公司关键词配置表
应理解的是,多个公司的关键词配置表可以为多个,表1仅为一个示例性的描述,不对关键词配置表的造成限定。
本实施例中,关键词的目标签字格式可以是指关键词表征的签署人对应的签字格式中的至少一种。
其中,每个签署人对应的多种签字格式可以具有不同的优先级,关键词的目标签字格式可以为优先级较高的一种或多种签字格式。
S30、对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息。
本实施例中,确定签名位置需要首先确定关键词的位置,为了快速的获取待签名的PDF文件中关键词的位置,可以将待签名的PDF文件进行分块处理,确定每个分块数据的文本信息以及每个分块数据的位置信息。
S40、根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置。
本实施例中,待签名的PDF文件中多个分块数据均包含有关键词,在不同的分块数据中,关键词可以是单独成行,也可以是与签名指示符组合,还可以是与上下文的字符串组合。
其中,签名指示符可以包括冒号、括号、横线等。
其中,关键词单独成行以及与签名指示符组合的位置可以表征一个签名位置,关键词与上下文的字符串组合表征一个语义的位置不是签名位置。
本实施例中,根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据可以是指,首先查找确定包含关键词的多个第一分块数据,然后根据每个第一分块数据的上下文信息,确定各第一分块数据中关键词的格式,最后将与目标签字格式相匹配的关键词的格式对应的第一分块数据确定为目标分块数据。
其中,目标签字格式可以有多个,目标分块数据也可以有多个。
示例性的,关键词表征的签署人为张三,张三在董事会会议中文件A中可使用的签字格式按照优先级自高至低依次为冒号签、横线上下签、横线左右签以及括号签,则将排序后的上述四种签字格式作为关键词的目标签字格式。
在待签署的PDF文件找查找包含“张三”的多个第一分块数据,根据每个第一分块数据中张三的上下文信息,确定每个第一分块数据中“张三”的格式,例如,若“张三”的上下文均为空格,则可知“张三”的格式为单独成行,若“张三”的下文为冒号,则可知“张三”与签名指示符冒号构成一个签名位置,若“张三”的上下问均为字符串,则可知“张三”构成一个语义信息。
针对目标签字格式中的每种签字格式,将该签字格式依次与多个第一分块数据中“张三”的格式进行相似度比较,确定与该签字格式相匹配的关键词的格式对应的第一分块数据为目标分块数据。
其中,相匹配可以是指签字格式中的签名指示符相同,且签名指示符与关键词的相对位置关系相同。
其中签名指示符与关键词的相关位置关系可以包括:签名指示符位于关键词的左侧、右侧、下方、上方以及外部等。
例如,签名指示符为横线时,横线可以位于关键词的上方或下方;签名指示符为括号时,签名指示符可以位于关键词的外部,即关键词位于括号内部。
本实施例中,在确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据后,可以将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置。
其中,目标分块数据的位置信息表征的位置可以根据目标分块数据中的签名指示符以及关键词和签名指示符的相对位置关系确定。
一种示例中,签名指示符为冒号,且签名指示符位于关键词的右侧,则目标分块数据的位置信息表征的位置的起始位置为目标分块数据中冒号右侧的第m个字符的位置,其中m为预设值,例如可以为2。
另一种示例中,签名指示符为横线,且横线位于关键词的下方,则目标分块数据的位置信息表征的位置位于该横线的下方。
应理解的是,若目标分块数据有多个,则表征待签名的PDF文件的签名位置有多个。
本申请实施例提供的基于PDF文件的签名位置确定方法,通过待签名的PDF文件的文件属性确定表征签署人的关键词,基于预先设置的关键词配置表确定关键词的目标签字格式,然后通过对待签名的PDF文件进行解析处理获得多个分块数据以及每个分块数据的位置信息,则将包含关键词且与该关键词的目标签字格式相匹配的分块数据作为目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置,实现了待签名的PDF文件的签名位置的自动定位。
图2为本申请一实施例提供的确定关键词的目标签字格式的流程示意图,描述了图1实施例中步骤20中根据预先设置的关键词配置表确定关键词的目标签字格式的一种可能实施方式。如图2所示,根据预先设置的关键词配置表确定关键词的目标签字格式包括:
S201、从关键词配置表中查找关键词对应的多种候选签字格式。
本实施例中,关键词配置表中每个签署人可以对应多种签字格式。其中,关键词对应的候选签字格式可以是指关键词表征的签署人对应的签字格式。
可选地,可以根据文件属性中的公司名称确定对应的关键词配置表,并在该文件词配置表中查找对应的签署人可使用的多种签字格式。
由于关键词表征的签署人在不同的文件中可使用的签字格式可以不同,则查找签署人至少一个对应的候选签字格式可以是指,根据文件属性中的会议类型以及文件名称确定目标文件,查找确定对应的签署人在该目标文件中可使用的签字格式。
S202、根据多种候选签字格式各自分别对应的优先级,将多种候选签字格式进行排序,并将排序后的多种候选签字格式作为关键词的目标签字格式。
本实施例中,与每个签署人对应的多种签字格式可以具有不同的优先级。
其中,优先级表征了签署人在历史签署文件中使用该签字格式的次数,优先级越高则表征使用次数越多。
示例性的,请一并参阅表1,关键词表征的签署人为张三,张三在董事会会议中文件A中可使用的签字格式按照优先级自高至低依次为冒号签、横线上下签、横线左右签以及括号签,则将排序后的上述四种签字格式作为关键词的目标签字格式。
图3为本申请一实施例提供的确定多个分块数据方法的流程示意图,描述了图1实施例中步骤30的一种可能的实施方式。如图3所示,对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息,可以是指:
S301、获取待签名的PDF文件的文本信息。
本步骤中,文本信息包括大量的文本序列,其中,文本序列为多于一个的字符按顺序构成的字符串。
本步骤中,获取待签名的PDF文件的文本信息,可以是指通过信息分析脚本将待签名的PDF文件转换为文本信息。
S302、将文本信息划分为多个自然句,并确定每个自然句的位置信息。
PDF文件中,文本信息的句或段落之间一般通过分界符来化界,可以通过识别文本信息中的分界符将文本信息划分为多个自然句。
其中,分界符可以为标点符号等,则可以通过识别文本信息的标点符号,将文本信息划分为多个自然句。
本步骤中,确定每个自然句的位置信息可以是指,确定每个自然句在PDF文件中页码、行数以及每个自然句的起始位置以及终止位置的列数。
S303、将每个自然句作为一个分块数据,并将多个分块数据基于上下文顺序设置。
本步骤中,将多个分块数据基于上下文的语义信息进行排序。
图4为本申请一实施例提供的确定关键词的目标分块数据的流程示意图,描述了图1实施例步骤40中确定关键词的目标分块数据的一种可能的实施方式。如图4所示,根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,包括:
S401、从多个分块数据中查找至少两个包含关键词的第一分块数据。
本实施例中,从多个分块数据中查找包含关键词的第一分块数据可以为将关键词与每个分块数据依次进行比较,确定包含关键词的第一分块数据;还可以为:将至少两个分块数据进行组合生成组合数据,判断该组合数据中是否包含关键词,在组合数据中包含关键词的情况下,再确定关键词所属的分块数据为第一分块数据。
示例性地,从多个分块数据中查找包含关键词的多个第一分块数据,可以包括:
步骤1、根据每个分块数据的页码信息,将对应于相同页码的多个分块数据组合生成一个字符串,获得多个待比较字符串。
其中,对应于相同页码的多个分块数据可以是指在待签字的PDF文件中处于相同页码上的多个分块数据。
将对应于相同页码的多个分块数据组合生成一个字符串可以是指,待签字的PDF文件中处于相同页码上的多个分块数据的文本序列按照上下文的语义信息进行拼接,获得各页码对应的待比较字符串。
步骤2、针对每个待比较字符串,在待比较字符串包含关键词的情况下,将待比较字符串中的每个分块数据与关键词进行一一比对,并将与关键词相匹配的分块数据保存为第一分块数据。
本步骤中,可以按照各待比较字符串对应的页码信息,按照页码从小到大的顺序依次判断各待比较字符串是否包含关键词。
例如,若页码1对应的待比较字符串包含关键词时,则将页面1对应的待比较字符串中的每个分块数据与关键词进行一一比对,并将与关键词相匹配的分块数据保存为第一分块数据,并将第一分块数据保存至预设文件列表,并清空页码1对应的待比较字符串。
若页码1对应的待比较字符串不包含关键词,则直接清空页码1对应的待比较字符串。然后对页码2对应的待比较字符串执行上述判断,直至将各页码对应的待比较字符串一一进行判断,获得最终的文件列表,该文件列表中存储了第一分块数据的文本信息和位置信息。
S402、将每个第一分块数据中的关键词与该关键词的上下文信息组合生成签名块,解析获得每个签名块的签字格式。
本实施例中,在不同的第一分块数据中,关键词可以是单独成行,也可以是与签名指示符组合,还可以是与上下文的字符串组合。
其中,签名指示符可以包括冒号、括号、横线等。
本实施例中,签名块包含了关键词的文本信息以及关键词的签字格式。
本实施例中,每个签名块的签字格式包括关键词的签字格式。
其中,解析获得每个签名块的签字格式可以是指,确定每个签名块中关键词的上下文信息,以及关键词相对于上下文信息的相对位置。
例如,关键词单独成行,则关键词的上下文信息均为空格;关键词与签名指示符组合,则关键词的上下文信息为签名指示符中的一个,确定该关键词相对于该签名指示符的相对位置;若关键词与上下文的字符串组合,则关键词的上下文信息均为字符串。
S403、将多个签名块中每个签名块的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,其中,N为大于或等于2的整数。
本实施例中,关键词的目标签字格式中可以包括多种候选签字格式,且该多种候选签字格式的优先级各不相同。
其中,确定与关键词的目标签字格式相似度最高的N个目标分块数据,可以是指将与每一种候选签字格式相匹配的分块数据确定为一个目标分块数据;也可以是指将与每一种候选签字格式相匹配的分块数据确定为候选分块数据,根据多种候选签字格式的优先级大小,按照从高到低的顺序对多个候选分块数据进行排序,确定其中排名最靠前的N个候选分块数据作为N个目标分块数据。
其中,确定与候选签字格式相匹配的分块数据的步骤可以为针对每种候选签字格式,查找确定与该候选签字格式相匹配的签名块,将该签名块对应的分块数据确定为目标分块数据。
本实施例中,一方面将对应于相同页码的多个分块数据组合生成一个字符串,获得多个待比较字符串,在待比较字符串中包含关键词的情况下,再确定关键词所属的分块数据为第一分块数据,提高了确定第一分块数据的效率。
另一方面,待签名的PDF文件通常需要有多个签名位置,每个签名位置的中关键词的签字格式可能不同,本实施例通过将每个第一分块数据中关键词的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,并将该N个目标分块数据的位置信息表征的位置作为待签名的PDF文件的签名位置,实现待签名PDF文件中多个签名位置的确定。
图5为本申请另一实施例提供的确定目标分块数据的流程示意图,描述了图4实施例中确定与关键词的目标签字格式相似度最高的N个目标分块数据的一种可能的实施方式。如图5所示,将多个签名块中每个签名块的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,包括:
S411、针对目标签字格式中的每种候选签字格式,将多个签名块中每个签名块的签字格式与候选签字格式进行匹配分析,在存在与候选签字格式相匹配的签名块的情况下,保存该与候选签字格式相匹配的签名块为候选签名块。
本实施例中,可以根据多个签名块的在待签名PDF文件中的页码,根据页码从小到大的顺序依次将每个签名块的签字个数与候选签字格式进行匹配分析。
本实施例中,将签名块的签字格式与候选签字格式进行匹配分析可以是指,首先判断签名块中关键词的上下文信息与候选签字格式中签名指示符是否一致,在签名块中关键词的上下文信息与候选签字格式中签名指示符一致情况下,判断上述两种签字格式中,关键词相对于签名指示符的相对位置是否一致,若相对位置一致,则可以判定签名块的签字格式与候选签字格式相匹配。
可以理解的是,本步骤可以获得与候选签字格式一一对应的多个候选签名块。
S412、按照关键词的多种候选签字格式的优先级顺序对多个候选签名块进行排序。
本实施例中,按照关键词的多种候选签字格式的优先级从高到低的顺序对多个候选签名块进行排序。
S413、将顺序为前N个候选签名块各自分别对应的分块数据,确定为与关键词的目标签字格式相似度最高的N个目标分块数据。
本实施例中,目标分块数据的个数N可以为根据待签名的PDF文件的文件属性进行设定,并预先存储在关键词配置表中,即不同文件属性的目标分块数据的个数可以不同。
可选地,目标分块数据的个数N也可以为设定值,各待签名的PDF文件的目标分块数据均为设定值,例如均为3。
图6为本申请一实施例提供的生成签名后PDF文件方法的流程示意图,描述了基于上述实施例中的方法确定待签名的PDF的签名位置之后,生成签名后的PDF文件的一种可能的实现方式。如图6所示,将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置之后,方法还包括:
S501、根据关键词配置表,确定签署人的签字样式,并将签字样式与多种候选签字格式分别组合保存生成多个签字效果。
本实施例中,关键词配置表还包括用于表征签署人的签字样式。例如签署人的“张三”的签字样式为楷体的张三。
其中,关键词配置表中签署人的签字样式可以为根据签署人的历史签字样式确定。
为了获得符合签署人签署习惯的签名效果,可以将首先根据关键词配置表,确定签署人的签字样式,然后将签字样式与多种候选签字格式分别组合保存生成多个签字效果,以便签署人从多个签字效果中进行选择。
其中,多种候选签字格式可以为签署人的多个优先级排序较高的候选签字格式。
示例性的,关键词表征的签署人为张三,张三在董事会会议中文件A中可使用的签字格式按照优先级自高至低依次为冒号签、横线上下签、横线左右签以及括号签,张三的签字样式为楷体的张三,则将该签字样式与上述四种签字格式依次组合生成四种签字效果并保存。
S502、针对N个目标分块数据中的每个目标分块数据,响应于接收到的签字效果查看操作信息,依次将多个签字效果的添加至该目标分块数据对应的位置并显示。
本步骤的目的在于,在每个目标分块数据对应的签名位置依次预览显示步骤501中的签字效果,以使得签署人查看签名后的PDF文件的显示效果。
由于目标分块数据可以有多个,即自动定位确定的签名位置可以有多个,则需要针对每个目标分块数据,确定该目标分块数据的最佳签字效果。
本实施例中,基于PDF文件的签名位置确定设备按照N个目标分块数据的位置信息,依次选中各目标分块数据。针对当前选中的目标分块数据,基于PDF文件的签名位置确定设备响应于接收到的签字效果查看操作,依次将多个签字效果的添加至当前选中的目标分块数据对应的位置并显示。
其中,多个签字效果按照分别对应的签字格式的优先级依次显示。
其中,按照多个目标分块数据的位置信息依次选中各目标分块数据,可以是指按照多个目标分块数据的页码的大小从小到大选中各目标分块数据。
示例性的,请一并参阅图7,图7为本申请一实施例提供的签名后的PDF文件的签字效果示意图。其中,待签名的PDF文件中目标分块数据有两个,两个目标分块数据表征的签名位置分别为第一页的第8行第25列以及第2页的第15行第25列,应理解的是图5中显示的“张三:”为第2页的目标分块数据。
如图7所示,该签名后的PDF文件下方设有取消、预览、下一组以及确定四个按钮,其中,签字效果查看操作可以是指签署人选中“预览”或“下一组”按钮。
例如,当前选中的目标分块数据为第2页的第15行第25列,响应于接收到的签署人的“预览”操作(即签署人选中预览按钮),基于PDF文件的签名位置将优先级最高的签字格式对应的签字效果显示在该目标分块数据指示的位置上;若签署人满意该签字效果,则可以直接选中“确定”按钮,若签署人不满意该签字效果,则可以选中“下一组”按钮,基于PDF文件的签名位置响应于签署人选中“下一组”按钮的操作,按照签字效果的优先级从高到低的顺序依次显示,直至签署人选中“确定”按钮或者“取消”按钮。
可选地,若四个签字效果均显示完毕,则重新按照多个签字效果的优先级顺序从高至低的顺序显示。
可选地,若签署人选中“取消”按钮,则返回至上一个目标分块数据的签字效果预览效果图。本示例中,即返回签名位置为第一页的第8行第25列的目标分块数据,并预览显示该位置的目标分块数据的选中后的签字效果,以根据签署人的选择更换签字效果。应理解的是,若当前选中的目标分块数据为页码数据中最小的目标分块数据,则“取消”按钮为不可选状态。
本实施例中,每个目标分块数据对应位置的签字效果可以不同。
S503、响应于接收到的签字确定操作信息,根据当前显示的签字效果生成签名后的PDF文件。
本实施例中,签字确定操作可以是指签署人选中图7实施例中“确定”按钮。
本实施例中,当前显示的签字效果可以是指每个目标分块数据中签署人选中“确定”按钮选中的签字效果。
请一并参阅图7,若签署人选中“确定”按钮,则跳转至下一个目标分块数据,若当前为最后一个目标分块数据,则根据各目标分块数据确定的签字效果生成签名后的PDF文件。
本申请实施例提供的生成签名后PDF文件的方法,可以响应于签署人的签字效果查看操作,在每个目标分块数据指定的签名位置依次显示签署人的多个签字效果,并根据签署人的签字确定操作生成签名后的PDF文件,保障签名的PDF文件满足签署人的要求。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
基于上述实施例所提供的基于PDF文件的签名位置确定方法,本发明实施例进一步给出实现上述方法实施例的装置实施例。
图8为本申请一实施例提供的基于PDF文件的签名位置确定装置的结构示意图。如图8所示,基于PDF文件的签名位置确定装置60包括获取模块601,格式确定模块602、解析模块603、位置确定模块604;其中,
获取模块601,用于获取待签名的PDF文件的文件属性,并根据文件属性确定用于表征签署人的关键词;其中,文件属性包括公司名称、会议类型以及文件名称;
格式确定模块602,用于根据预先设置的关键词配置表确定关键词的目标签字格式;其中,关键词配置表包括文件属性、签署人以及签字格式之间的对应关系,对应关系用于指示文件属性对应的文件中签署人可使用的签字格式;
解析模块603,用于对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息;
位置确定模块604,用于根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,并将目标分块数据的位置信息表征的位置确定为待签名的PDF文件的签名位置。
可选地,解析模块603对待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个分块数据的位置信息,可以包括:
获取待签名的PDF文件的文本信息;
将文本信息划分为多个自然句,并确定每个自然句的位置信息;
将每个自然句作为一个分块数据,并将多个分块数据基于上下文顺序设置。
可选地,关键词配置表中每个签署人对应多种签字格式,且与每个签署人对应的多种签字格式具有不同的优先级。
格式确定模块602根据预先设置的关键词配置表确定关键词的目标签字格式,包括:
从关键词配置表中查找关键词对应的多种候选签字格式;
根据多种候选签字格式各自分别对应的优先级,将多种候选签字格式进行排序,并将排序后的多种候选签字格式作为关键词的目标签字格式。
可选地,位置确定模块604根据多个分块数据的上下文信息,确定包含关键词且与关键词的目标签字格式相匹配的目标分块数据,包括:
从多个分块数据中查找至少两个包含关键词的第一分块数据;
将每个第一分块数据中的关键词与该关键词的上下文信息组合生成签名块,解析获得每个签名块的签字格式;
将多个签名块中每个签名块的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,其中,N为大于或等于2的整数。
可选地,每个分块数据的位置信息均包含页码信息;位置确定模块604从多个分块数据中查找至少两个包含关键词的第一分块数据,包括:
根据每个分块数据的页码信息,将对应于相同页码的多个分块数据组合生成一个字符串,获得多个待比较字符串;
针对每个待比较字符串,在待比较字符串包含关键词的情况下,将待比较字符串中的每个分块数据与关键词进行一一比对,并将与关键词相匹配的分块数据保存为第一分块数据。
可选地,位置确定模块604将多个签名块中每个签名块的签字格式与关键词的目标签字格式进行相似度分析,确定与关键词的目标签字格式相似度最高的N个目标分块数据,包括:
针对目标签字格式中的每种候选签字格式,将多个签名块中每个签名块的签字格式与该候选签字格式进行匹配分析,保存与候选签字格式相匹配的签名块为候选签名块;
按照目标签字格式中多种候选签字格式的优先级顺序对多个候选签名块进行排序;
将顺序为前N个候选签名块各自分别对应的分块数据,确定为与关键词的目标签字格式相似度最高的N个目标分块数据。
可选地,关键词配置表还包括用于表征签署人的签字样式;基于PDF文件的签名位置的确定装置600还包括显示模块。
可选地,显示模块用于:根据关键词配置表,确定签署人的签字样式,并将签字样式与多个候选签字格式分别组合保存生成多个签字效果;针对N个目标分块数据中的每个目标分块数据,响应于接收到的签字效果查看操作信息,依次将多个签字效果的添加至目标分块数据对应的位置并显示;响应于接收到的签字确定操作信息,根据当前显示的签字效果生成签名后的PDF文件。
图8所示实施例提供的基于PDF文件的签名位置确定装置,可用于执行上述方法实施例中的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图9是本申请一实施例提供的基于PDF文件的签名位置确定设备的示意图。如图9所示,该实施例的基于PDF文件的签名位置确定设备70包括:至少一个处理器701、存储器702以及存储在所述存储器702中并可在所述处理器701上运行的计算机程序。基于PDF文件的签名位置的确定设备还包括通信部件703,其中,处理器701、存储器702以及通信部件703通过总线704连接。
处理器701执行所述计算机程序时实现上述各个基于PDF文件的签名位置确定方法实施例中的步骤,例如图1所示实施例中的步骤S10至步骤S40。或者,处理器701执行计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图8所示模块601至604的功能。
示例性的,计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器702中,并由处理器701执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在所述基于PDF文件的签名位置确定设备70中的执行过程。
本领域技术人员可以理解,图9仅仅是基于PDF文件的签名位置确定设备的示例,并不构成对基于PDF文件的签名位置的确定设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。
所称处理器701可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器702可以是基于PDF文件的签名位置的确定设备的内部存储单元,也可以是基于PDF文件的签名位置的确定设备的外部存储设备,例如插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。所述存储器702用于存储所述计算机程序以及基于PDF文件的签名位置的确定设备所需的其他程序和数据。存储器702还可以用于暂时地存储已经输出或者将要输出的数据。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于PDF文件的签名位置确定方法,其特征在于,包括:
获取待签名的PDF文件的文件属性,并根据所述文件属性确定用于表征签署人的关键词;其中,所述文件属性包括公司名称、会议类型以及文件名称;
根据预先设置的关键词配置表确定所述关键词的目标签字格式;其中,所述关键词配置表包括文件属性、签署人以及签字格式之间的对应关系,所述对应关系用于指示所述文件属性对应的文件中所述签署人可使用的签字格式;
对所述待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个所述分块数据的位置信息;
根据所述多个分块数据的上下文信息,确定包含所述关键词且与所述关键词的目标签字格式相匹配的目标分块数据,并将所述目标分块数据的位置信息表征的位置确定为所述待签名的PDF文件的签名位置。
2.如权利要求1所述的基于PDF文件的签名位置确定方法,其特征在于,所述对所述待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个所述分块数据的位置信息,包括:
获取所述待签名的PDF文件的文本信息;
将所述文本信息划分为多个自然句,并确定每个自然句的位置信息;
将每个自然句作为一个分块数据,并将所述多个分块数据基于上下文顺序设置。
3.如权利要求1所述的基于PDF文件的签名位置确定方法,其特征在于,所述关键词配置表中每个签署人对应多种签字格式,且与每个签署人对应的所述多种签字格式具有不同的优先级;
所述根据预先设置的关键词配置表确定所述关键词的目标签字格式,包括:
从所述关键词配置表中查找所述关键词对应的多种候选签字格式;
根据所述多种候选签字格式各自分别对应的优先级,将所述多种候选签字格式进行排序,并将排序后的多种候选签字格式作为所述关键词的目标签字格式。
4.如权利要求3所述的基于PDF文件的签名位置确定方法,其特征在于,所述根据所述多个分块数据的上下文信息,确定包含所述关键词且与所述关键词的目标签字格式相匹配的目标分块数据,包括:
从所述多个分块数据中查找至少两个包含所述关键词的第一分块数据;
将每个所述第一分块数据中的关键词与该关键词的上下文信息组合生成签名块,解析获得每个签名块的签字格式;
将所述多个签名块中每个签名块的签字格式与所述关键词的目标签字格式进行相似度分析,确定与所述关键词的目标签字格式相似度最高的N个目标分块数据,其中,N为大于或等于2的整数。
5.如权利要求4所述的基于PDF文件的签名位置确定方法,其特征在于,每个所述分块数据的位置信息均包含页码信息;
所述从所述多个分块数据中查找至少两个包含所述关键词的第一分块数据,包括:
根据每个所述分块数据的页码信息,将对应于相同页码的多个分块数据组合生成一个字符串,获得多个待比较字符串;
针对每个待比较字符串,在所述待比较字符串包含所述关键词的情况下,将所述待比较字符串中的每个分块数据与所述关键词进行一一比对,并将与所述关键词相匹配的分块数据保存为所述第一分块数据。
6.如权利要求4所述的基于PDF文件的签名位置确定方法,其特征在于,所述将所述多个签名块中每个签名块的签字格式与所述关键词的目标签字格式进行相似度分析,确定与所述关键词的目标签字格式相似度最高的N个目标分块数据,包括:
针对所述目标签字格式中的每种候选签字格式,将所述多个签名块中每个签名块的签字格式与所述候选签字格式进行匹配分析,保存与所述候选签字格式相匹配的签名块为候选签名块;
按照所述目标签字格式中多种候选签字格式的优先级顺序对所述多个候选签名块进行排序;
将顺序为前N个候选签名块各自分别对应的分块数据,确定为与所述关键词的目标签字格式相似度最高的N个目标分块数据。
7.如权利要求4至6任一项所述的基于PDF文件的签名位置确定方法,其特征在于,所述关键词配置表还包括用于表征签署人的签字样式;
所述将所述目标分块数据的位置信息表征的位置确定为所述待签名的PDF文件的签名位置之后,方法还包括:
根据所述关键词配置表,确定所述签署人的签字样式,并将所述签字样式与多个所述候选签字格式分别组合保存生成多个签字效果;
针对所述N个目标分块数据中的每个目标分块数据,响应于接收到的签字效果查看操作信息,依次将所述多个签字效果的添加至所述目标分块数据对应的位置并显示;
响应于接收到的签字确定操作信息,根据当前显示的签字效果生成签名后的PDF文件。
8.一种基于PDF文件的签名位置确定装置,其特征在于,包括:
获取模块,用于获取待签名的PDF文件的文件属性,并根据所述文件属性确定用于表征签署人的关键词;其中,所述文件属性包括公司名称、会议类型以及文件名称;
格式确定模块,用于根据预先设置的关键词配置表确定所述关键词的目标签字格式;其中,所述关键词配置表包括文件属性、签署人以及签字格式之间的对应关系,所述对应关系用于指示所述文件属性对应的文件中所述签署人可使用的签字格式;
解析模块,用于对所述待签名的PDF文件进行文本解析处理,获得基于上下文顺序设置的多个分块数据以及每个所述分块数据的位置信息;
位置确定模块,用于根据所述多个分块数据的上下文信息,确定包含所述关键词且与所述关键词的目标签字格式相匹配的目标分块数据,并将所述目标分块数据的位置信息表征的位置确定为所述待签名的PDF文件的签名位置。
9.一种基于PDF文件的签名位置确定设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010489992.4A CN111832264B (zh) | 2020-06-02 | 2020-06-02 | 基于pdf文件的签名位置确定方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010489992.4A CN111832264B (zh) | 2020-06-02 | 2020-06-02 | 基于pdf文件的签名位置确定方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111832264A true CN111832264A (zh) | 2020-10-27 |
CN111832264B CN111832264B (zh) | 2023-09-15 |
Family
ID=72897559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010489992.4A Active CN111832264B (zh) | 2020-06-02 | 2020-06-02 | 基于pdf文件的签名位置确定方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111832264B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612815A (zh) * | 2020-12-29 | 2021-04-06 | 鲁班(北京)电子商务科技有限公司 | 一种对评标文件进行定位的方法、装置及电子设备 |
CN113112222A (zh) * | 2021-04-02 | 2021-07-13 | 北京点聚信息技术有限公司 | 一种基于大数据分析的ofd版式文件的自动签章方法及*** |
CN113407665A (zh) * | 2021-05-25 | 2021-09-17 | 北京有竹居网络技术有限公司 | 文本比对方法、装置、介质及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101751612A (zh) * | 2008-12-18 | 2010-06-23 | 鸿富锦精密工业(深圳)有限公司 | 合约电子签核***及方法 |
US20100235727A1 (en) * | 2009-03-14 | 2010-09-16 | Ashton Brian G | Systems and Methods for Dynamic Electronic Signature Placement |
CN101903901A (zh) * | 2007-12-14 | 2010-12-01 | 鲁特宛有限公司 | 用于电子合同订立交易中的电子签名捕获的***和方法 |
US20180039828A1 (en) * | 2015-02-18 | 2018-02-08 | Fuji Xerox Australia Pty Limited | Generating a signed electronic document |
CN109543444A (zh) * | 2018-10-25 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 一种文件签署方法、装置、存储介质和服务器 |
CN109672536A (zh) * | 2018-12-24 | 2019-04-23 | 航天信息股份有限公司 | 一种批量pdf文件数字签名方法及*** |
CN109960785A (zh) * | 2017-12-25 | 2019-07-02 | 顺丰科技有限公司 | 文件在线签署方法、装置、存储介质及设备 |
CN110245220A (zh) * | 2019-05-05 | 2019-09-17 | 深圳法大大网络科技有限公司 | 电子文件签署方法、装置及服务器、存储介质 |
CN110750964A (zh) * | 2019-09-18 | 2020-02-04 | 平安科技(深圳)有限公司 | 一种添加信息方法及相关装置 |
-
2020
- 2020-06-02 CN CN202010489992.4A patent/CN111832264B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101903901A (zh) * | 2007-12-14 | 2010-12-01 | 鲁特宛有限公司 | 用于电子合同订立交易中的电子签名捕获的***和方法 |
CN101751612A (zh) * | 2008-12-18 | 2010-06-23 | 鸿富锦精密工业(深圳)有限公司 | 合约电子签核***及方法 |
US20100235727A1 (en) * | 2009-03-14 | 2010-09-16 | Ashton Brian G | Systems and Methods for Dynamic Electronic Signature Placement |
US20180039828A1 (en) * | 2015-02-18 | 2018-02-08 | Fuji Xerox Australia Pty Limited | Generating a signed electronic document |
CN109960785A (zh) * | 2017-12-25 | 2019-07-02 | 顺丰科技有限公司 | 文件在线签署方法、装置、存储介质及设备 |
CN109543444A (zh) * | 2018-10-25 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 一种文件签署方法、装置、存储介质和服务器 |
CN109672536A (zh) * | 2018-12-24 | 2019-04-23 | 航天信息股份有限公司 | 一种批量pdf文件数字签名方法及*** |
CN110245220A (zh) * | 2019-05-05 | 2019-09-17 | 深圳法大大网络科技有限公司 | 电子文件签署方法、装置及服务器、存储介质 |
CN110750964A (zh) * | 2019-09-18 | 2020-02-04 | 平安科技(深圳)有限公司 | 一种添加信息方法及相关装置 |
Non-Patent Citations (3)
Title |
---|
孟晓冬;: "浅谈电子签名***在工程设计中的开发与应用", 锅炉制造, no. 4, pages 62 - 64 * |
方伟: "基于PDM的异地协同设计平台的研究与应用", 中国优秀硕士学位论文全文数据库 信息科技辑, pages 138 - 2276 * |
杨威: "细粒度安全中XML数字签名原始语义保护研究", 中国优秀硕士学位论文全文数据库 信息科技辑, pages 138 - 173 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112612815A (zh) * | 2020-12-29 | 2021-04-06 | 鲁班(北京)电子商务科技有限公司 | 一种对评标文件进行定位的方法、装置及电子设备 |
CN112612815B (zh) * | 2020-12-29 | 2024-04-19 | 鲁班(北京)电子商务科技有限公司 | 一种对评标文件进行定位的方法、装置及电子设备 |
CN113112222A (zh) * | 2021-04-02 | 2021-07-13 | 北京点聚信息技术有限公司 | 一种基于大数据分析的ofd版式文件的自动签章方法及*** |
CN113112222B (zh) * | 2021-04-02 | 2024-02-09 | 北京点聚信息技术有限公司 | 一种基于大数据分析的ofd版式文件的自动签章方法及*** |
CN113407665A (zh) * | 2021-05-25 | 2021-09-17 | 北京有竹居网络技术有限公司 | 文本比对方法、装置、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111832264B (zh) | 2023-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832264B (zh) | 基于pdf文件的签名位置确定方法、装置及设备 | |
US8577882B2 (en) | Method and system for searching multilingual documents | |
CN110929125B (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN108701121B (zh) | 将用户输入分派到用户界面中的多个输入域 | |
CN107526846B (zh) | 频道排序模型的生成、排序方法、装置、服务器和介质 | |
US10402474B2 (en) | Keyboard input corresponding to multiple languages | |
CN109948122B (zh) | 输入文本的纠错方法、装置及电子设备 | |
CN109033385A (zh) | 图片检索方法、装置、服务器及存储介质 | |
CN111198936B (zh) | 一种语音搜索方法、装置、电子设备及存储介质 | |
JP2019520662A (ja) | 商標画像のコンテンツ・ベースの検索及び取得 | |
CN111506608A (zh) | 一种结构化文本的比较方法和装置 | |
CN111602129B (zh) | 针对注释和墨迹的智能搜索 | |
CN109545223B (zh) | 应用于用户终端的语音识别方法及终端设备 | |
CN114297143A (zh) | 一种搜索文件的方法、显示文件的方法、装置及移动终端 | |
US20160196256A1 (en) | Method to input content in a structured manner with real-time assistance and validation | |
US20160314130A1 (en) | Computing device with spell-check feature | |
CN105893614A (zh) | 信息推荐的方法、装置及电子设备 | |
CN112989011B (zh) | 数据查询方法、数据查询装置和电子设备 | |
US9600480B2 (en) | Systems and methods for indexing and linking electronic documents | |
KR102254329B1 (ko) | 사용자 맞춤형 검색 결과 제공 방법 및 장치 | |
CN112181167A (zh) | 输入法侯选词处理方法和电子设备 | |
CN104182061A (zh) | 一种多字输入方法及设备 | |
US20240221056A1 (en) | Method and apparatus for presenting search screening items, electronic device, and storage medium | |
CN116578693B (zh) | 一种文本检索方法及装置 | |
JP7268316B2 (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |