CN117610503A - 一种word文档页眉数据更新方法、装置和服务器 - Google Patents

一种word文档页眉数据更新方法、装置和服务器 Download PDF

Info

Publication number
CN117610503A
CN117610503A CN202311522136.4A CN202311522136A CN117610503A CN 117610503 A CN117610503 A CN 117610503A CN 202311522136 A CN202311522136 A CN 202311522136A CN 117610503 A CN117610503 A CN 117610503A
Authority
CN
China
Prior art keywords
data
filled
word document
header
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311522136.4A
Other languages
English (en)
Inventor
林加旗
郝华
魏巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mingdu Zhiyun Zhejiang Technology Co Ltd
Original Assignee
Mingdu Zhiyun Zhejiang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mingdu Zhiyun Zhejiang Technology Co Ltd filed Critical Mingdu Zhiyun Zhejiang Technology Co Ltd
Priority to CN202311522136.4A priority Critical patent/CN117610503A/zh
Publication of CN117610503A publication Critical patent/CN117610503A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开的一种word文档页眉数据更新方法、装置和服务器,在根据所获取到的待填充的目标word文档对应的页眉的填充配置信息中的待填充数据名称在所查询到的该目标word文档的审批流程数据采集对应的待填充数据后,筛选出需页眉中需要填充更新的目标域元素,并判断所述目标word文档页眉区域中是否有表格类型数据存在,根据表格类型数据和非表格类型数据的不同数据填充方式采取***表格行或直接填充的方式将待填充数据填入目标Word文档的页眉区域形成最终文档,增加文档页眉信息更新的效率和多样性,使用户在查看文档时通过页眉直观的获取到更多信息。

Description

一种word文档页眉数据更新方法、装置和服务器
技术领域
本发明涉及数据处理技术领域,尤其涉及一种word文档页眉数据更新方法、装置和服务器。
背景技术
页眉作为文件管理***中各类文档不可或缺的一部分,常常位于每个文档页面的顶部区域,用于显示时间、图形、公司微标、文档标题、文件名等文档附加信息,帮助相关人员索引、查找、快速识别文档内容。因此,在对相关文档的内容信息进行更新时,页眉作为重要的一部分也需随之进行更新。目前市面上常见的页眉更新方式包括手动和自动两种,其中手动更新方式过于依赖人力操作,耗费时间过长且容易出现错误,而自动更新方式中往往只考虑的简单更新情况,忽略了页眉中所存在的表格等复杂设计,并且不能在保留页眉历史数据的基础上填充页眉数据。
发明内容
本发明针对现有技术中的不足,公开了一种word文档页眉数据更新方法,包括如下步骤:
S1,获取待填充的目标word文档对应的页眉的填充配置信息,所述填充配置信息包括待填充数据名称,根据所述目标word文档的身份信息从文件管理***中查询该目标word文档的审批流程数据,根据所述待填充数据名称从所述审批流程数据中采集获取对应的待填充数据;
S2,解析目标word文档中的各域元素,判断目标word文档的页眉区域是否存在需填充更新的目标域元素;
S3,若存在目标域元素则判断目标word文档页眉区域是否有表格类型数据存在,如存在表格类型数据判断是否有目标域元素在表格位置区域内;
S4,如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头行,根据表头元素个数获取需填充的列个数,在表格类型数据中***具有对应列个数的表格行,根据表头行内的目标域元素分布将对应的待填充数据填充至***的表格行各单元格中;
S5,如果不存在表格类型数据、或存在表格类型数据但没有目标域元素在表格位置区域内,则将待填充数据向对应的目标域元素中进行填充,更新形成最终文档。
优选的,所述步骤S3包括:根据目标word文档中定位到的Columns属性判断在目标word文档中是否有表格类型数据存在;如果存在表格类型数据则对文档编码进行解析,根据Columns属性信息定位到目标word文档中的表格位置区域,判断是否有目标域元素在表格位置区域内。
优选的,所述步骤S2包括:解析获取位于页眉区域的域元素中所包含的文本内容,分布将文本内容与待填充数据进行匹配,若文本内容中能匹配至少一待填充数据名称则将所属域元素作为需进行填充更新的一目标域元素;若还剩余部分无法进行匹配的待填充数据,则根据填充配置信息中的新建域属性在页眉区域新建立与剩余待填充数据匹配的目标域元素。
优选的,所述步骤S4还包括:获取表格类型数据中的单元格格式信息,对新***的表格行设置对应单元格格式,若以Array结尾则将相应的待填充数据进行换行填充,若以Str结尾会将相应的待填充数据以逗号拼接填充。
优选的,所述步骤S5还包括:
在获取活动窗体对象后,通过活动窗格对象中的视窗抓取页眉位置,通过核查段落的样式属性是否为分节符来确定所在页眉处是否存在分节符;
如果存在分节符,则从目标word文档首页开始从前往后依次对各页面的页眉进行待填充数据的填充更新后,再从目标word文档尾页开始从后往前依次对各页面的页眉再次进行待填充数据的填充更新后,形成最终文档。
本发明还公开了一种word文档页眉数据更新装置,包括:数据获取模块,用于获取待填充的目标word文档对应的页眉的填充配置信息,所述填充配置信息包括待填充数据名称,根据所述目标word文档的身份信息从文件管理***中查询该目标word文档的审批流程数据,根据所述待填充数据名称从所述审批流程数据中采集获取对应的待填充数据;域元素筛选模块,用于解析目标word文档中的各域元素,判断目标word文档的页眉区域是否存在需填充更新的目标域元素;数据类型判断模块,用于若存在目标域元素则判断目标word文档页眉区域是否有表格类型数据存在,如存在表格类型数据判断是否有目标域元素在表格位置区域内;表格类型数据填充模块,用于如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头行,根据表头元素个数获取需填充的列个数,在表格类型数据中***具有对应列个数的表格行,根据表头行内的目标域元素分布将对应的待填充数据填充至***的表格行各单元格中;非表格类型数据填充模块,用于如果不存在表格类型数据、或存在表格类型数据但没有目标域元素在表格位置区域内,则将待填充数据向对应的目标域元素中进行填充,更新形成最终文档。
优选的,所述数据类型判断模块还被配置为根据目标word文档中定位到的Columns属性判断在目标word文档中是否有表格类型数据存在;如果存在表格类型数据则对文档编码进行解析,根据Columns属性信息定位到目标word文档中的表格位置区域,判断是否有目标域元素在表格位置区域内。
优选的,所述域元素筛选模块还被配置为解析获取位于页眉区域的域元素中所包含的文本内容,分布将文本内容与待填充数据进行匹配,若文本内容中能匹配至少一待填充数据名称则将所属域元素作为需进行填充更新的一目标域元素;若还剩余部分无法进行匹配的待填充数据,则根据填充配置信息中的新建域属性在页眉区域新建立与剩余待填充数据匹配的目标域元素。
本发明还公开了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如前述任一word文档页眉数据更新方法的步骤。
本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前述任一所述word文档页眉数据更新方法的步骤。
本发明公开的word文档页眉数据更新方法、***和服务器,在根据所获取到的待填充的目标word文档对应的页眉的填充配置信息中的待填充数据名称在所查询到的该目标word文档的审批流程数据采集对应的待填充数据后,筛选出需页眉中需要填充更新的目标域元素,并判断所述目标word文档页眉区域中是否有表格类型数据存在,根据表格类型数据和非表格类型数据的不同数据填充方式采取***表格行或直接填充的方式将待填充数据填入目标Word文档的页眉区域形成最终文档,使得该***的页眉区域可以在保留历史信息的情况下将更新信息以填充的形式***页眉中,增加文档页眉信息的多样性,使用户在查看文档时通过页眉直观的获取到更多信息。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例公开的word文档页眉数据更新方法的流程示意图。
图2为本发明另一实施例公开的word文档页眉数据更新装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明专利申请说明书以及权利要求书中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。
页眉作为文件管理***中各类文档不可或缺的一部分,常常位于每个文档页面的顶部区域,可帮助相关人员索引、查找、快速识别文档内容。因此,在对相关文档的内容信息进行更新时,页眉作为重要的一部分也需随之进行更新。目前市面上常见的页眉更新方式包括手动和自动两种,其中手动更新方式过于依赖人力操作,耗费时间过长且容易出现错误,而自动更新方式中往往只考虑的简单更新情况,忽略了页眉中所存在的表格等复杂设计,并且不能在保留页眉历史数据的基础上填充页眉数据。
在本实施例中,如图1所示,公开了一种word文档页眉数据更新方法,具体可以包括如下内容。
步骤S1,获取待填充的目标word文档对应的页眉的填充配置信息,所述填充配置信息包括待填充数据名称,根据所述目标word文档的身份信息从文件管理***中查询该目标word文档的审批流程数据,根据所述待填充数据名称从所述审批流程数据中采集获取对应的待填充数据。
具体的, 页眉中常包含文档的文件名称、文件版本、文件编号等相关属性信息,帮助操作人员在阅读时迅速获取该文档整体信息;还常包含文档的短期标题,帮助操作人员识别判断文档当前页面的内容;还包含该文档的起草信息、审核信息等审批内容,帮助操作人员简单获取当前文档的历史信息。则所述待填充数据包括审批流程数据、文档页面信息和文档属性信息,所述审批流程数据包括但不限于目标word文档的起草信息、审核信息和/或批准信息,所述文档页面信息包括但不限于文档当前页面内容标题,所述文档属性信息包括但不限于该目标word文档的文件名称、文件版本或文件编号。
当操作人员对该文档进行更新时,该***调用文件填充组件,使用jacob创建一个ActiveXComponent对象,并使用Documents属性来获取并打开待填充的目标Word文档。其中,所获取的待填充数据名称和待填充数据以map数据结构形式存储于填充数据库中。
在实施例中,该步骤S1可以具体包括如下内容。
步骤S11,识别获取所述目标word文档的文档类别,根据所述文档类别查询模板数据库获取对应的标准文档模板,对所述标准文档模板进行解析后获取填充配置信息,所述填充配置信息包括待填充数据名称。
步骤S12,获取所述目标word文档的文件名称,根据所述文件名称在文件管理***中查询关联该文件名称的各个审批流程。
步骤S13,在各个审批流程中采集对应所述待填充数据名称的审批过程信息,形成对应该目标word文档的待填充数据保存至填充数据库中。
在优选实施例中,该步骤S1还包括,根据所述待填充数据名称从所述审批流程数据中获取对应校验数据,根据校验数据对所述文档属性信息进行校验调整后形成第三待填充数据。
具体的,从所述审批流程数据中获取各审批节点的多个节点数据组作为校验数据,所述节点数据组包括该节点的文件名称、文件版本和节点建立时间。
将校验数据中的各审批节点的文件名称与所述文档属性信息中的文件名称进行对比,如果不一致则对各审批节点的文件名称进行对比,若各审批节点的文件名称一致则将其作为第三待填充数据中的文件名称,若各审批节点的文件名称不一致则保留所述文档属性信息中的文件名称作为第三待填充数据内的文件名称。其中,其具体可包括:
查找所述文档属性信息中是否包含文件版本,如果包含则判断校验数据中的各审批节点的文件版本是否相同,若相同则获取该文件版本作为第三待填充数据内的文件版本。
若不相同则比对各节点对应的文件版本是否高于或等于前一节点的文件版本,若是则判断所述文档属性信息内的文件版本是否高于或等于各节点内的最高文件版本,若高于或等于则保留所述文档属性信息中的文件版本作为第三待填充数据内的文件版本,否则发出文件版本校验提醒。
如果所述文档属性信息中不包含文件版本则将最后一节点数据组中的文件版本作为第三待填充数据内的文件版本。
步骤S2,解析目标word文档中的各域元素,判断目标word文档的页眉区域是否存在需填充更新的目标域元素。具体的,Word文档的页眉区域包含多种域元素,需对其进行筛选选择出需要进行更新和填充的目标域元素,以避免识别到无需更新域元素对其原有内容产生不必要更改,影响Word页眉原布局和数据的正确性。
具体的,步骤S2包括:解析获取位于页眉区域的域元素中所包含的文本内容,分布将文本内容与待填充数据进行匹配,若文本内容中能匹配至少一待填充数据名称则将所属域元素作为需进行填充更新的一目标域元素。根据域元素内部文本内容与待填充数据名称的匹配关系筛选所需进行填充的目标域元素。
若还剩余部分无法进行匹配的待填充数据,则根据填充配置信息中的新建域属性在页眉区域新建立与剩余待填充数据匹配的目标域元素。
进一步地,若该目标Word文档的填充配置信息中存在部分待填充数据名称未能与该目标Word文档内所识别域元素的文本内容匹配,则需将该部分填充数据名称通过新建域或***域的形式添加至该目标Word文件中,则可定义还未匹配成功的待填充数据名称为第一关键词、已匹配成功的待填充数据名称为第二关键词,则所述步骤S3还包括,
步骤S201,判断各第一关键词在第二关键词组中是否存在与其关联的关联关键词,该关联关键词被配置为具有关联关系的关键词,该第二关键词组包含所有第二关键词。
步骤S202,若在该第二关键词组中存在与该第一关键词关联的关联关键词,则将该第一关键词***该关联关键词所在域元素中;若该第二关键词组中不存在与该第一关键词关联的关联关键词,则新建域元素并将该第一关键词填充至该新建域元素中。
若存在多个在该第二关键词组无关联关键词的第一关键词,则判断此类第一关键词之间是否存关联关系,若存在关联关系,则新建域并将具有关联关系的此类第一关键词***同一个新建域中。
其中,所述不同关键词之间的关联关系可通过预先设置得到,也可通过两关键词关联概率值判断得到。当两关键词之间的关联概率值超过第一预设值时,这两个关键词之间具有关联关系。其中,所述关联概率值可通过该文件管理***中存储的其他填充Word文档经过分析计算得到,具体步骤如下:
获取该文件管理***中存储的所有填充Word文档。解析各填充word文档中的所有域元素并获取域元素中的文本内容,将各填充Word文档中解析获取的文本内容作为关键词与其对应的域元素记录至过程数据库中。设置任意两关键词之间的初始关联概率值为0,遍历过程数据库中存储的各关键词,若两关键词在同一域元素内存在一次,则将两关键词之间的初始概率值加1。
步骤S3,若存在目标域元素则判断目标word文档页眉区域是否有表格类型数据存在,如存在表格类型数据判断是否有目标域元素在表格位置区域内。表格类型数据以其结构化和组织化的表现方式清晰的展现了数据之间的关联性,便于相关人员进行查看,因此,在页眉中对于文档的审批信息大多以表格形式进行呈现。
根据目标word文档中定位到的Columns属性判断在目标word文档中是否有表格类型数据存在;如果存在表格类型数据则对文档编码进行解析,根据Columns属性信息定位到目标word文档中的表格位置区域,判断是否有目标域元素在表格位置区域内。
具体的,Columns属性通常用于表示表格中的列信息,它描述了每个列的名称、数据类型和其他相关属性。通过使用Columns属性,可对该目标Word文档各个位置处所获取的目标域元素信息是否为表格类型数据进行判断,以将该目标Word文档中获取到的目标域元素信息分为表格类型数据和非表格类型数据两类,使***可在后续过程中对不同类型的数据采取不同的数据填充方式。
步骤S4,如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头行,根据表头元素个数获取需填充的列个数,在表格类型数据中***具有对应列个数的表格行,根据表头行内的目标域元素分布将对应的待填充数据填充至***的表格行各单元格中。
具体的,当目标域元素在表格位置区域内时,说明需要将待填充数据填充至该表格内部。在该种情况下,可通过添加表格行的形式添加待填充数据。所述步骤S4具体可包括如下内容。
步骤S41,获取表头行内目标域元素信息的文本信息并根据表头行内的目标域元素个数获取需要填充的列个数。
步骤S42,根据预设表格行填充规则在该表格预设位置处***具有对应列个数的新表格行。比如,设置在表格表头行下方***新表格行、设置在表格最后一行下方***新表格行。
步骤S43,将获取的各文本信息与待填充数据库中的待填充信息名称依次匹配,若匹配成功,则将匹配成功的待填充信息名称所对应的待填充数据填入该目标域元素所对应的新表行中的单元格中。
在另一实施例中,表格表头信息也可以列的形式呈现,则步骤S4还可为:如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头列,根据表头元素个数获取需填充的行个数,在表格类型数据中***具有对应行个数的表格列,根据表头列内的目标域元素分布将对应的待填充数据填充至***的表格列各单元格中。
所述步骤S4还包括:获取表格类型数据中的单元格格式信息,对新***的表格行设置对应单元格格式,若以Array结尾则将相应的待填充数据进行换行填充,若以Str结尾会将相应的待填充数据以逗号拼接填充。
具体的,同一单元格中可能存在多个数据,比如,在审批文件中,同一审批流程中的审批人可能为多个,其所对应的审批时间、审批结果也可能存在多个,则需设置相应填充格式使多个数据清晰的呈现。在本实施例中,通过采用Array和Str两种格式来对多个数据的情况进行设置。当单元格格式信息以Array结尾时,表明该单元格内的多个数据分布在不同行;当单元格格式信息以Str结尾时,表明该单元格内的多个数据之间通过逗号进行分隔。
进一步地,当该表格已触及该页眉边缘时,可设置调整单元格格式以缩小表格以及内部字体的尺寸,该过程具体包括:获取表格类型数据中的单元格格式信息查询当前单元格尺寸信息,并根据表头行内的文本信息获取该表格行列数量。根据所获取的当前单元格尺寸信息以及该表格行列数量计算该表格整体尺寸。获取该页眉尺寸信息,并将该页眉尺寸信息与该表格尺寸信息进行比较,当该表格尺寸信息达到该页眉尺寸的预设比例时,调整该表格单元格格式尺寸以及内部字体尺寸。在本实施例中,当该表格单元格尺寸达到预设值时,可设置删除预设位置处的表格行列。
步骤S5,如果不存在表格类型数据、或存在表格类型数据但没有目标域元素在表格位置区域内,则将待填充数据向对应的目标域元素中进行填充,更新形成最终文档。具体的,若获取到的目标域元素不在表格中,则直接将待填充数据填入目标域元素中。
在更新完成形成最终文档后,调用forceSaveAs将文件另存为pdf文件。同时,因为doc文件存在兼容性问题,在处理时若检测到文件损坏,会弹出警告框,以提示用户是否尝试修复文档,导致程序阻塞,无法正常执行,所以针对word的不同格式比如doc、docx采取了兼容做法,设置文档在打开时,禁用修复对话框的显示,支持启用宏,不开启密码保护,禁用文档转换器。
在具体实施例中,Word文档还可能存在含有分节符的情况,则该方法还包括:
步骤S501,在获取活动窗体对象后,通过活动窗格对象中的视窗抓取页眉位置,通过核查段落的样式属性是否为分节符来确定所在页眉处是否存在分节符。
具体的,因页眉独特性,往往不同页面的页眉之间具有关联性,即一页的页眉更新后,与其关联页面的页眉也随之自动更新,无需对每页页眉进行更新添加数据,仅更新关联页面中其中一页的页眉即可。若该文档存在分节符,因分节符对页眉具有分割作用,不同节之间页眉互相通常不关联,则该种情况下通常需要将不同节之间的页眉均更新一次。因此***需在文档接收到文档更新指令时,首先对该文档是否存在分节符进行判断,以进行后续操作。
步骤S502.,如果存在分节符,则从目标word文档首页开始从前往后依次对各页面的页眉进行待填充数据的填充更新后,再从目标word文档尾页开始从后往前依次对各页面的页眉再次进行待填充数据的填充更新后,形成最终文档。
具体的,若文档中存在分节符,即存在多个不同的页眉,则***无法扫描到正确的页眉页脚数量,则此时可根据所获取到的分节符数量决定填充次数并按照从前至后和从后至前的顺序遍历页面进行更新检查
本实施例公开的word文档页眉数据更新方法,在根据所获取到的待填充的目标word文档对应的页眉的填充配置信息中的待填充数据名称在所查询到的该目标word文档的审批流程数据采集对应的待填充数据后,筛选出需页眉中需要填充更新的目标域元素,并判断所述目标word文档页眉区域中是否有表格类型数据存在,根据表格类型数据和非表格类型数据的不同数据填充方式采取***表格行或直接填充的方式将待填充数据填入目标Word文档的页眉区域形成最终文档,使得该***的页眉区域可以在保留历史信息的情况下将更新信息以填充的形式***页眉中,增加文档页眉信息的多样性,使用户在查看文档时通过页眉直观的获取到更多信息。
在另一实施例中,如附图2所示,还公开了一种word文档页眉数据更新装置,包括数据获取模块1、域元素筛选模块2、数据类型判断模块3、表格类型数据填充模块4、非表格类型数据填充模块5。其中数据获取模块1,用于获取待填充的目标word文档对应的页眉的填充配置信息,所述填充配置信息包括待填充数据名称,根据所述目标word文档的身份信息从文件管理***中查询该目标word文档的审批流程数据,根据所述待填充数据名称从所述审批流程数据中采集获取对应的待填充数据。域元素筛选模块,用于解析目标word文档中的各域元素,判断目标word文档的页眉区域是否存在需填充更新的目标域元素。数据类型判断模块,用于若存在目标域元素则判断目标word文档页眉区域是否有表格类型数据存在,如存在表格类型数据判断是否有目标域元素在表格位置区域内。表格类型数据填充模块,用于如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头行,根据表头元素个数获取需填充的列个数,在表格类型数据中***具有对应列个数的表格行,根据表头行内的目标域元素分布将对应的待填充数据填充至***的表格行各单元格中。非表格类型数据填充模块,用于如果不存在表格类型数据、或存在表格类型数据但没有目标域元素在表格位置区域内,则将待填充数据向对应的目标域元素中进行填充,更新形成最终文档。
在本实施例中,所述数据类型判断模块3还被配置为根据目标word文档中定位到的Columns属性判断在目标word文档中是否有表格类型数据存在;如果存在表格类型数据则对文档编码进行解析,根据Columns属性信息定位到目标word文档中的表格位置区域,判断是否有目标域元素在表格位置区域内。
在本实施例中,所述域元素筛选模块2还被配置为解析获取位于页眉区域的域元素中所包含的文本内容,分布将文本内容与待填充数据进行匹配,若文本内容中能匹配至少一待填充数据名称则将所属域元素作为需进行填充更新的一目标域元素;若还剩余部分无法进行匹配的待填充数据,则根据填充配置信息中的新建域属性在页眉区域新建立与剩余待填充数据匹配的目标域元素。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相似部分互相参见即可。对于实施例公开的word文档页眉数据更新装置而言,由于其与实施例公开的word文档页眉数据更新方法相对应,所以描述的比较简单,相关之处参见前述方法部分说明即可。
在另一些实施例中,还提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述各实施例中描述的word文档页眉数据更新方法的各个步骤。其中该服务器可包括但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是服务器的示例,并不构成对该服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
所述word文档页眉数据更新装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个word文档页眉数据更新方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (10)

1.一种word文档页眉数据更新方法,其特征在于,包括如下步骤:
S1,获取待填充的目标word文档对应的页眉的填充配置信息,所述填充配置信息包括待填充数据名称,根据所述目标word文档的身份信息从文件管理***中查询该目标word文档的审批流程数据,根据所述待填充数据名称从所述审批流程数据中采集获取对应的待填充数据;
S2,解析目标word文档中的各域元素,判断目标word文档的页眉区域是否存在需填充更新的目标域元素;
S3,若存在目标域元素则判断目标word文档页眉区域是否有表格类型数据存在,如存在表格类型数据判断是否有目标域元素在表格位置区域内;
S4,如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头行,根据表头元素个数获取需填充的列个数,在表格类型数据中***具有对应列个数的表格行,根据表头行内的目标域元素分布将对应的待填充数据填充至***的表格行各单元格中;
S5,如果不存在表格类型数据、或存在表格类型数据但没有目标域元素在表格位置区域内,则将待填充数据向对应的目标域元素中进行填充,更新形成最终文档。
2.根据权利要求1所述的word文档页眉数据更新方法,其特征在于,所述步骤S3包括:
根据目标word文档中定位到的Columns属性判断在目标word文档中是否有表格类型数据存在;如果存在表格类型数据则对文档编码进行解析,根据Columns属性信息定位到目标word文档中的表格位置区域,判断是否有目标域元素在表格位置区域内。
3.根据权利要求2所述的word文档页眉数据更新方法,其特征在于,所述步骤S2包括:
解析获取位于页眉区域的域元素中所包含的文本内容,分布将文本内容与待填充数据进行匹配,若文本内容中能匹配至少一待填充数据名称则将所属域元素作为需进行填充更新的一目标域元素;
若还剩余部分无法进行匹配的待填充数据,则根据填充配置信息中的新建域属性在页眉区域新建立与剩余待填充数据匹配的目标域元素。
4.根据权利要求3所述的word文档页眉数据更新方法,其特征在于,所述步骤S4还包括:
获取表格类型数据中的单元格格式信息,对新***的表格行设置对应单元格格式,若以Array结尾则将相应的待填充数据进行换行填充,若以Str结尾会将相应的待填充数据以逗号拼接填充。
5.根据权利要求4所述的word文档页眉数据更新方法,其特征在于,所述步骤S5还包括:
在获取活动窗体对象后,通过活动窗格对象中的视窗抓取页眉位置,通过核查段落的样式属性是否为分节符来确定所在页眉处是否存在分节符;
如果存在分节符,则从目标word文档首页开始从前往后依次对各页面的页眉进行待填充数据的填充更新后,再从目标word文档尾页开始从后往前依次对各页面的页眉再次进行待填充数据的填充更新后,形成最终文档。
6.一种word文档页眉数据更新装置,其特征在于,包括:
数据获取模块,用于获取待填充的目标word文档对应的页眉的填充配置信息,所述填充配置信息包括待填充数据名称,根据所述目标word文档的身份信息从文件管理***中查询该目标word文档的审批流程数据,根据所述待填充数据名称从所述审批流程数据中采集获取对应的待填充数据;
域元素筛选模块,用于解析目标word文档中的各域元素,判断目标word文档的页眉区域是否存在需填充更新的目标域元素;
数据类型判断模块,用于若存在目标域元素则判断目标word文档页眉区域是否有表格类型数据存在,如存在表格类型数据判断是否有目标域元素在表格位置区域内;
表格类型数据填充模块,用于如果在表格位置区域内存在目标域元素则获取携带有相应的目标域元素信息的表头行,根据表头元素个数获取需填充的列个数,在表格类型数据中***具有对应列个数的表格行,根据表头行内的目标域元素分布将对应的待填充数据填充至***的表格行各单元格中;
非表格类型数据填充模块,用于如果不存在表格类型数据、或存在表格类型数据但没有目标域元素在表格位置区域内,则将待填充数据向对应的目标域元素中进行填充,更新形成最终文档。
7.根据权利要求6所述的一种文档信息自动填充装置,其特征在于:
所述数据类型判断模块还被配置为根据目标word文档中定位到的Columns属性判断在目标word文档中是否有表格类型数据存在;如果存在表格类型数据则对文档编码进行解析,根据Columns属性信息定位到目标word文档中的表格位置区域,判断是否有目标域元素在表格位置区域内。
8.根据权利要求6所述的一种文档信息自动填充装置,其特征在于:
所述域元素筛选模块还被配置为解析获取位于页眉区域的域元素中所包含的文本内容,分布将文本内容与待填充数据进行匹配,若文本内容中能匹配至少一待填充数据名称则将所属域元素作为需进行填充更新的一目标域元素;若还剩余部分无法进行匹配的待填充数据,则根据填充配置信息中的新建域属性在页眉区域新建立与剩余待填充数据匹配的目标域元素。
9.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1-5任一所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1-5任一所述方法的步骤。
CN202311522136.4A 2023-11-15 2023-11-15 一种word文档页眉数据更新方法、装置和服务器 Pending CN117610503A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311522136.4A CN117610503A (zh) 2023-11-15 2023-11-15 一种word文档页眉数据更新方法、装置和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311522136.4A CN117610503A (zh) 2023-11-15 2023-11-15 一种word文档页眉数据更新方法、装置和服务器

Publications (1)

Publication Number Publication Date
CN117610503A true CN117610503A (zh) 2024-02-27

Family

ID=89952661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311522136.4A Pending CN117610503A (zh) 2023-11-15 2023-11-15 一种word文档页眉数据更新方法、装置和服务器

Country Status (1)

Country Link
CN (1) CN117610503A (zh)

Similar Documents

Publication Publication Date Title
US8112401B2 (en) Analyzing externally generated documents in document management system
US20140358973A1 (en) Methods and Data Structures for Multiple Combined Improved Searchable Formatted Documents including Citation and Corpus Generation
CN112528602B (zh) 一种医药文档结构化内容分析方法、***和存储介质
US20090327277A1 (en) Methods and apparatus for reusing data access and presentation elements
US7937657B2 (en) User specific error analysis
US20090234852A1 (en) Sub-linear approximate string match
US20230267267A1 (en) Knowledge discovery based on user-posed queries
CN111369294B (zh) 软件造价估算方法及装置
CN111143370B (zh) 用于分析多个数据表之间关系的方法、设备和计算机可读存储介质
US8290950B2 (en) Identifying locale-specific data based on a total ordering of supported locales
US6907434B2 (en) Message analysis tool
CN117539893A (zh) 数据处理方法、介质、装置和计算设备
CN111078564B (zh) 一种ui测试用例管理方法、装置、计算机设备以及计算机可读存储介质
CN110909532B (zh) 用户名称匹配方法、装置、计算机设备和存储介质
CN117610503A (zh) 一种word文档页眉数据更新方法、装置和服务器
CN116775488A (zh) 异常数据确定方法、装置、设备、介质及产品
CN117272953B (zh) 一种文档信息自动填充方法、***和存储介质
JP2009181479A (ja) データ管理システムおよび方法並びにプログラム
CN114238654A (zh) 一种知识图谱的构建方法、装置和计算机可读存储介质
CN113779218A (zh) 问答对构建方法、装置、计算机设备和存储介质
US6968339B1 (en) System and method for selecting data to be corrected
CN115599976B (zh) 用户分群方法、装置、电子设备及存储介质
CN117454858A (zh) 一种文档管控信息调整更新方法、***和存储介质
JP2004206468A (ja) 文書管理システム及び文書管理プログラム
CN116701615B (zh) 业务文档在线管理方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination