CN109783784B - 一种基于最小表单组合的数据处理方法和表单生成器 - Google Patents

一种基于最小表单组合的数据处理方法和表单生成器 Download PDF

Info

Publication number
CN109783784B
CN109783784B CN201811604568.9A CN201811604568A CN109783784B CN 109783784 B CN109783784 B CN 109783784B CN 201811604568 A CN201811604568 A CN 201811604568A CN 109783784 B CN109783784 B CN 109783784B
Authority
CN
China
Prior art keywords
minimum
fields
dimensional
field
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811604568.9A
Other languages
English (en)
Other versions
CN109783784A (zh
Inventor
李毅俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yuanguang Software Co Ltd
Original Assignee
Yuanguang Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yuanguang Software Co Ltd filed Critical Yuanguang Software Co Ltd
Priority to CN201811604568.9A priority Critical patent/CN109783784B/zh
Publication of CN109783784A publication Critical patent/CN109783784A/zh
Application granted granted Critical
Publication of CN109783784B publication Critical patent/CN109783784B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于最小表单组合的数据处理方法和表单生成器,其中方法包括确定需要处理的目标二维表格;对所述目标二维表格进行解析,对目标二维表格进行拆分组合后,形成多个表单字段组;对多个表单字段组,按照用户定义的填单顺序对字段进行排序,再对每个表单设置好表单顺序,生成最终完整的最小表单组合。本发明主要解决网页二维表格单填写方式的各种弊端,依靠最小表单来拆分二维表格的相关内容,让用户能够直观的关注最小表单需要填写的信息;每个最小表单之间没有相互依赖的关系,不会产生冗余的信息,确保填写内容的完整性和准确性;最小表单组合可以有效指引用户填单的步骤,达到让用户更直观、容易和快速的填充表单信息。

Description

一种基于最小表单组合的数据处理方法和表单生成器
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于最小表单组合的数据处理方法和表单生成器。
背景技术
目前,网页中常用的二维表格受网页宽度的限制,存在表格的单元格宽度受限,需要下滚动条辅助显示单元格内容,即无法在一个网页中全面显示;并且各表格项中相关信息无法聚合产生冗余的信息,新增明细有冗余信息使得表项较大,占用较大空间,且数据处理效率低下。
发明内容
鉴于上述的分析,本发明旨在提供一种基于最小表单组合的数据处理方法和表单生成器,以最小表单群组合来代替二维表格,使得表格占用空间小、显示全面、数据处理效率高。
本发明的目的主要是通过以下技术方案实现的:
一种基于最小表单组合的数据处理方法,包括以下步骤:
确定需要处理的目标二维表格;
对所述目标二维表格进行解析,抽取表格中的实体字段和表格信息;
根据抽取的实体字段和表格信息,对目标二维表格进行拆分组合后,形成多个表单字段组;
对于每个表单字段组,按照设定的填单顺序对字段进行排序,形成最小表单,再设置每个表单的顺序,生成最终完整的最小表单组合。
进一步地,所述拆分组合后形成的表单为最小表单,即表单内的字段内容存在关联关系,不同表单具有独立性,不存在数据依赖关系。
进一步地,所述关联关系根据表格信息中确定的字段关联程度进行自动分析确定或通过人工手动分析确定。
进一步地,所述最小表单中每个单元包括新增、修改、复制和删除控制键。
进一步地,还包括,结合具体的业务场景,按照业务流程的顺序建立填表顺序索引及填单说明,用于对用户的操作进行引导。
一种基于最小表单组合的表单生成器,包括,目标二维表格获取模块、目标二维表格解析模块、表单拆分组合模块、表单剥离模块;
所述目标二维表格获取模块,用于获取需要处理的目标二维表格;
所述目标二维表格解析模块,用于对所述目标二维表格进行解析,抽取表格中的实体字段和表格信息;
表单拆分组合模块,用于根据抽取的实体字段和表格信息,对目标二维表格进行拆分组合后,形成多个表单字段组;
表单设计模块,用于对于每个表单字段组,按照设定的填单顺序对字段进行排序,形成最小表单,再设置每个表单的顺序,生成最终完整的最小表单组合。
进一步地,所述拆分组合后形成的表单为最小表单,即表单内的字段内容的关联关系,不同表单具有独立性,不存在数据依赖关系。
进一步地,所述关联关系根据表格信息中确定的字段关联程度进行自动分析确定或通过人工手动分析确定。
进一步地,所述最小表单中每个单元包括新增、修改、复制和删除控制键。
进一步地,还包括索引生成及填单说明生成模块,用于结合具体的业务场景,按照业务流程的顺序建立填表顺序索引及填单说明,对用户的操作进行引导。
本发明有益效果如下:
本发明主要解决网页二维表格单填写方式的各种弊端,依靠最小表单来拆分二维表格的相关内容,让用户能够直观的关注最小表单需要填写的信息;
并且把二维表格中依赖关系剥离开,不会在新增明细时产生冗余和无用的信息,每个最小表单之间没有相互依赖的关系,不会产生冗余的信息,确保填写内容的完整性和准确性;
最小表单组合可以有效指引用户填单的步骤,达到让用户更直观、容易和快速的填充表单信息。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1为本发明实施例中的基于最小表单组合的数据处理方法流程图;
图2为本发明实施例中的基于最小表单组合的表单生成器组成连接示意图;
图3为本发明实施例中的获取需要处理的报销单示意例图;
图4为本发明实施例中的获取需要处理的报销单示意例图;
图5为本发明实施例中的拆解后的交通费用表单示意图;
图6为本发明实施例中的报销单最小表单组合示意图。
具体实施方式
下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的原理。
实施例一、
本发明实施例公开了一种基于最小表单组合的数据处理方法,如图1所示,包括以下步骤:
步骤S101、确定需要处理的目标二维表格;
步骤S102、对所述目标二维表格进行解析;抽取表格中的实体字段和表格信息;
具体的,所述解析包括:
1)从目标二维表格中抽取各单个表格中的字段;
2)判断抽取的字段是否存在子表格;否,则提取字段在二维表格中的坐标,即位于表格的行数和列数;是,则进入3);
3)抽取子表格中包括的字段,记录隶属关系,并判断所述字段是否存在子表格,否,则提取字段的坐标;是,则按照上述方法继续抽取子表格中包括的字段,记录隶属关系;直至对二维表格中所有字段进行抽取处理;
4)对抽取的字段进行筛选,删除只包括数字、符号在内的无实体内容的字段;
5)记录包括字段在二维表格中的坐标、子表格及隶属关系在内的表格信息。
步骤S103、根据抽取的实体字段和表格信息,对目标二维表格进行拆分组合后,形成多个最小表单字段组;
具体的,通过人工分析二维表格的字段内容确定字段内容的关联关系,如时间、地点和事件场景等关联字段都可以组合成一个最小表单字段组;并定义好每个最小表单字段组的名称,把分好组的关联字段设置成同一个的最小表单编号,每个字段只允许引用一次,确保最小表单的字段唯一性。
或者,通过表格信息确定字段的关联程度,对隶属于同一子表格的字段向上进行归类,确定划分子表格的母表格项,并自动识别母表格项字段是否构成某一业务种类,是,则以该母表格项以及所属子表格构成一个表单字段组,根据母表格项字段的内容定义好表单字段组名称,把分好组的关联字段设置成同一个表单字段组内编号,每个字段在表单字段组内只允许引用一次,得到最小表单字段组;
特殊的,通过检测不同单字段组内是否包含二维表格中的坐标相同的字段,来判断表单字段组内字段是否具有唯一性,即表单字段组是否存在相互依赖关系,当不存在相互依赖关系时,输出表单字段组;如果存在相互依赖关系,则通过人机交互,由用户进行修正,消除相互依赖关系。
步骤S104、对于每个表单字段组,按照设定的填单顺序对字段进行排序,形成最小表单设计,再设置每个表单的顺序,生成最终完整的最小表单组合设计;
所述每一个最小表单字段组构成某一业务,最小表单内的填单顺序可按完成某一业务固有的顺序进行排序,也可按照简明原则进行调整形成一个最小表单格式设计;不同最小表单之间的填单顺序可按业务之间本身存在的承接关系,结合网页的宽度限制与每个表单的宽度进行网页布局,实现表格占用空间小、显示全面、数据处理效率高。
每个独立的表单单元不允许存在相互依赖关系,因为每个表单单元都可以单独被新增和修改而不受任何其他表单单元及其衍生表单的影响。
每个表单单元都可以独立新增、修改、复制和删除,通过步骤S103的表单字段拆分组合成最小表单后,确保了表单数据之间没有依赖关系和确保表单字段的唯一性,因此不会产生冗余信息。
步骤S105、基于最小表单组合设计,产生填表顺序索引及填单说明;
对设计好的最小表单组合,按填表单顺序建立索引,定义好用户操作步骤以及填单说明。
通过索引的向导指引和填单说明,让用户在填写表单的体验更顺利和便捷。
实施例二、
本发明实施例公开了一种基于最小表单组合的表单生成器,如图2所示,包括,目标二维表格获取模块、目标二维表格解析模块、表单拆分组合模块、表单设计模块、索引生成及填单说明生成模块;
所述目标二维表格获取模块,用于获取需要处理的目标二维表格;
所述目标二维表格解析模块,用于对所述目标二维表格进行解析;抽取表格中的实体字段和表格信息;
表单拆分组合模块,用于根据抽取的实体字段和表格信息,对目标二维表格进行拆分组合后,形成多个最小表单字段组;
具体的,通过人工分析二维表格的字段内容确定字段内容的关联关系,如时间、地点和事件场景等关联字段都可以组合成一个最小表单字段组;并定义好每个最小表单字段组的名称,把分好组的关联字段设置成同一个的最小表单编号,每个字段只允许引用一次,确保最小表单的字段唯一性。
或者,通过表格信息确定字段的关联程度,对隶属于同一子表格的字段向上进行归类,确定划分子表格的母表格项,并自动识别母表格项字段是否构成某一业务种类,是,则以该目表格项以及所属子表格构成一个表单字段组,根据母表格项字段的内容定义好表单字段组名称,把分好组的关联字段设置成同一个表单字段组内编号,每个字段在表单字段组内只允许引用一次,得到最小表单字段组。
表单设计模块,对于每个表单字段组,按照设定的填单顺序对字段进行排序,形成最小表单设计,再设置每个表单的顺序,生成最终完整的最小表单组合设计;
每个独立的表单单元不允许存在相互依赖关系,因为每个表单单元都可以单独被新增和修改而不受任何其他表单单元及其衍生表单的影响。
每个表单单元都可以独立新增、修改、复制和删除,通过表单字段拆分组合成最小表单后,确保了表单数据之间没有依赖关系和确保表单字段的唯一性,因此不会产生冗余信息。
索引生成及填单说明生成模块,用于对设计好的最小表单组合,按填表单顺序建立索引,定义好用户操作步骤以及填单说明。
实施例三、
本实施例,以差旅费报销单为例子,
步骤S101、获取需要处理的报销单;
所述表格如图3、图4所示,
报销单中的费用明细子表拥有交通费用信息、住宿费用信息、出差补助信息以及收款人信息等。在实际的填单过程中,每新增一条费用明细同时也会把其他信息附带上,但是各种信息之间又不存在必联的关系,就会造成信息之间的错对或者冗余。
步骤S102、对所述报销单进行解析,获取所述目标二维表格字段内容。
步骤S103、对报销单进行表单拆分;
采用最小表单来拆解费用明细子表的各种信息组合,依次拆分成交通费用表单、住宿费用表单、出差补助表单以及收款人表单。
具体的,通过人工分析二维表格的字段内容确定存在联系的字段内容,把费用明细子表的字段拆分成交通费用信息、住宿费用信息、出差补助信息以及收款人信息的最小表单单元;定义好每个最小表单名称,把相关字段引用到最小表单里,每个字段只允许引用一次,确保最小表单的字段唯一性。
拆解后的交通费用表单如图5所示,让交通费用中的行程起止和时间起止及其交通工具与费用金额都能聚合在一个最小表单内完整呈现。如果一次差旅报销涉及多条交通费用明细的场景,只需要单独新增一个交通费用最小表单,而不需要新增整条费用明细包含一些不需要填写的表单信息。让用户更加专注于交通费用信息填写上,清楚的展示一个完整的行程费用报销概括。
步骤S104、对已设置好字段的最小表单,按照用户定义的填单顺序对字段进行排序,再对每个最小表单设置好表单顺序,生成最终完整的最小表单组合设计;
每个独立的表单单元不允许存在相互依赖关系,因为每个表单单元都可以单独被新增和修改而不受任何其他表单单元及其衍生表单的影响。如交通费用表单、住宿费用表单、出差补助表单、其他费用表单和收款人表单都依赖于报销人信息,因此需要把报销人信息独立于其他最小表单进行新增。
每个表单单元都可以独立新增、修改、复制和删除,通过步骤S103的表单字段拆分组合成最小表单后,确保了表单数据之间没有依赖关系和确保表单字段的唯一性,因此不会产生冗余信息。
步骤S105、基于最小表单组合设计,产生报销单填写顺序索引及填单说明;
如图6所示,对设计好的最小表单组合,按填表单顺序建立索引,定义好用户操作步骤以及填单说明。一般的二维表单只能从左到右依次填写信息,不符合实际的业务场景填写要求,而且用户填写过程中缺乏填写步骤指引和说明,更容易产生填单疑问和错误。最小表单组合就是为了解决以上问题,结合业务场景和步骤指引,让用户更容易理解设计表单的目的和用意,减少填单的时间和纠错成本。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于最小表单组合的数据处理方法,其特征在于,包括以下步骤:
确定需要处理的目标二维表格;
对所述目标二维表格进行解析,抽取表格中的实体字段和表格信息;
根据抽取的实体字段和表格信息,对目标二维表格进行拆分组合后,形成多个表单字段组;
具体的,通过表格信息确定实体字段的关联程度,对隶属于同一子表格的实体字段向上进行归类,确定划分子表格的母表格项,并自动识别母表格项实体字段是否构成某一业务种类,是,则以该母表格项以及所属子表格构成一个表单字段组,根据母表格项字段的内容定义好表单字段组名称,把分好组的关联字段设置成同一个表单字段组内编号,每个字段在表单字段组内只允许引用一次,得到最小表单字段组;
最小表单内的实体字段内容存在关联关系,不同表单具有独立性,不存在数据依赖关系;
通过检测不同表单字段组内是否包含二维表格中的坐标相同的字段,来判断表单字段组内字段是否具有唯一性,即表单字段组是否存在相互依赖关系,当不存在相互依赖关系时,输出表单字段组;如果存在相互依赖关系,则通过人机交互,由用户进行修正,消除相互依赖关系;对于每个表单字段组,按照设定的填单顺序对字段进行排序,形成最小表单,再设置每个表单的顺序,生成最终完整的最小表单组合。
2.根据权利要求1所述的数据处理方法,其特征在于,所述最小表单中每个单元包括新增、修改、复制和删除控制键。
3.根据权利要求1或2所述的数据处理方法,其特征在于,还包括,结合具体的业务场景,按照业务流程的顺序建立填表顺序索引及填单说明,用于对用户的操作进行引导。
4.一种基于最小表单组合的表单生成器,其特征在于,包括,目标二维表格获取模块、目标二维表格解析模块、表单拆分组合模块、表单剥离模块;
所述目标二维表格获取模块,用于获取需要处理的目标二维表格;
所述目标二维表格解析模块,用于对所述目标二维表格进行解析,抽取表格中的实体字段和表格信息;
表单拆分组合模块,用于根据抽取的实体字段和表格信息,对目标二维表格进行拆分组合后,形成多个表单字段组;
具体的,通过表格信息确定字段的关联程度,对隶属于同一子表格的字段向上进行归类,确定划分子表格的母表格项,并自动识别母表格项实体字段是否构成某一业务种类,是,则以该母表格项以及所属子表格构成一个表单字段组,根据母表格项字段的内容定义好表单字段组名称,把分好组的关联字段设置成同一个表单字段组内编号,每个字段在表单字段组内只允许引用一次,得到最小表单字段组;
表单设计模块,用于对于每个表单字段组,按照设定的填单顺序对字段进行排序,形成最小表单,再设置每个表单的顺序,生成最终完整的最小表单组合;
所述最小表单内的字段内容存在关联关系,不同表单具有独立性,不存在数据依赖关系;
通过检测不同表单字段组内是否包含二维表格中的坐标相同的字段,来判断表单字段组内字段是否具有唯一性,即表单字段组是否存在相互依赖关系,当不存在相互依赖关系时,输出表单字段组;如果存在相互依赖关系,则通过人机交互,由用户进行修正,消除相互依赖关系。
5.根据权利要求4所述的表单生成器,其特征在于,所述最小表单中每个单元包括新增、修改、复制和删除控制键。
6.根据权利要求4或5所述的表单生成器,其特征在于,还包括索引生成及填单说明生成模块,用于结合具体的业务场景,按照业务流程的顺序建立填表顺序索引及填单说明,对用户的操作进行引导。
CN201811604568.9A 2018-12-26 2018-12-26 一种基于最小表单组合的数据处理方法和表单生成器 Active CN109783784B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811604568.9A CN109783784B (zh) 2018-12-26 2018-12-26 一种基于最小表单组合的数据处理方法和表单生成器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811604568.9A CN109783784B (zh) 2018-12-26 2018-12-26 一种基于最小表单组合的数据处理方法和表单生成器

Publications (2)

Publication Number Publication Date
CN109783784A CN109783784A (zh) 2019-05-21
CN109783784B true CN109783784B (zh) 2023-08-15

Family

ID=66497715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811604568.9A Active CN109783784B (zh) 2018-12-26 2018-12-26 一种基于最小表单组合的数据处理方法和表单生成器

Country Status (1)

Country Link
CN (1) CN109783784B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111209073B (zh) * 2020-01-07 2023-06-02 北京唐颐惠康生物医学技术有限公司 一种基于多维模型的表单构建方法及***
CN111859895B (zh) * 2020-07-28 2023-11-03 明度智云(浙江)科技有限公司 一种对批量文档内表格进行比对的方法、***和存储介质
CN112434078A (zh) * 2020-11-20 2021-03-02 广州奇享科技有限公司 一种锅炉数据的处理方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294389A (zh) * 2015-05-20 2017-01-04 上海纳鑫信息科技有限公司 一种实现自定义表单的方法及***
CN107357913A (zh) * 2017-07-19 2017-11-17 微鲸科技有限公司 多终端协同的表单填写方法及用于实现其的终端
CN108921420A (zh) * 2018-06-27 2018-11-30 深圳供电局有限公司 一种电力厂站设备生成生产计划的方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090204881A1 (en) * 2008-02-08 2009-08-13 M/S. Scmooth (India) Private Limited Method and system for knowledge-based filling and verification of complex forms

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294389A (zh) * 2015-05-20 2017-01-04 上海纳鑫信息科技有限公司 一种实现自定义表单的方法及***
CN107357913A (zh) * 2017-07-19 2017-11-17 微鲸科技有限公司 多终端协同的表单填写方法及用于实现其的终端
CN108921420A (zh) * 2018-06-27 2018-11-30 深圳供电局有限公司 一种电力厂站设备生成生产计划的方法及***

Also Published As

Publication number Publication date
CN109783784A (zh) 2019-05-21

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
CN109783784B (zh) 一种基于最小表单组合的数据处理方法和表单生成器
US10169311B2 (en) Workflow system and method for creating, distributing and publishing content
CN110292775B (zh) 获取差异数据的方法及装置
CN102629263B (zh) 对企业间交互的业务数据进行格式转换的方法及***
CN1664810A (zh) 辅助表格填充
CN101988961B (zh) 地理位置数据采集***
KR20060061790A (ko) 가상 문서 아키텍쳐를 통해 공동 편집과 어카운트빌리티를용이하게 하는 자동 출판 시스템
CN110543303A (zh) 一种可视化业务平台
CN101976394B (zh) 数据采集和统计***及方法
CN112926299B (zh) 一种文本比对方法、合同审阅方法、审核***
CN109784738B (zh) 审批方法及审批装置
CN105630839A (zh) 网页信息的获取方法和装置
CN112445897A (zh) 文本类数据大规模分类标注方法、***、装置及存储介质
CN112102443A (zh) 一种适用于变电站设备巡检图像的标注***及标注方法
JP2012123607A (ja) データ入出力装置
CN111291051A (zh) 运价数据处理方法及装置、存储介质及电子设备
CN113158988A (zh) 财务报表处理方法、装置以及计算机可读存储介质
CN113033177B (zh) 一种电子病历数据的解析方法及装置
CN116644728B (zh) 一种基于条款数字化的合同生成方法及***
CN115936017B (zh) 一种支持界面多语言和数据多语言的主数据管理方法
JP5766438B2 (ja) 電子メディアにおけるクリックスルー機能に関する方法およびシステム
CN113407678B (zh) 知识图谱构建方法、装置和设备
CN115577100A (zh) 一种不平衡风险事件标注方法及***
CN115186638A (zh) 一种基于零代码开发平台的工程资料表格制作方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant