CN111797613B - 数据文件处理方法及装置 - Google Patents

数据文件处理方法及装置 Download PDF

Info

Publication number
CN111797613B
CN111797613B CN202010663465.0A CN202010663465A CN111797613B CN 111797613 B CN111797613 B CN 111797613B CN 202010663465 A CN202010663465 A CN 202010663465A CN 111797613 B CN111797613 B CN 111797613B
Authority
CN
China
Prior art keywords
information
template
analysis
data file
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010663465.0A
Other languages
English (en)
Other versions
CN111797613A (zh
Inventor
武和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Original Assignee
Taikang Insurance Group Co Ltd
Taikang Pension Insurance Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Insurance Group Co Ltd, Taikang Pension Insurance Co Ltd filed Critical Taikang Insurance Group Co Ltd
Priority to CN202010663465.0A priority Critical patent/CN111797613B/zh
Publication of CN111797613A publication Critical patent/CN111797613A/zh
Application granted granted Critical
Publication of CN111797613B publication Critical patent/CN111797613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/226Validation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供一种数据文件处理方法及装置,数据文件处理方法包括:获取数据文件,数据文件中包括文件标识;根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息;若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板;根据第二解析模板,对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。用于节省人力劳动和抄录时间,提高了业务处理的效率。

Description

数据文件处理方法及装置
技术领域
本申请涉及计算机领域,尤其涉及一种数据文件处理方法及装置。
背景技术
企业年金的信息披露主要涉及以下管理机构:托管机构、投管机构、受托机构、帐管机构、委托机构。
通常在每个季度,受托机构的业务员通过电子设备接收来自某业务计划相关的托管机构、投管机构、帐管机构中的业务员通过电子设备发送的信批报告,受托机构的业务员将每个信批报告中的数据信息抄录至预设处理模板中,并将包括数据信息的预设处理模板导入至业务处理***,以使业务处理***对预设处理模板中的数据信息进行核对校验,在校验通过后,根据数据信息进行业务处理。
在上述过程中,受托机构的业务员将每个信批报告中的数据信息抄录至预设处理模板中,耗时费力,而且需要对预设处理模板中的数据信息进行校验以确定抄录的数据信息是否正确,降低了业务处理的效率。
发明内容
本申请提供一种数据文件处理方法及装置,用于节省人力劳动和抄录时间,提高了业务处理的效率。
第一方面,本申请提供一种数据文件处理方法,方法包括:
获取数据文件,数据文件中包括文件标识;
根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息;
若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板;
根据第二解析模板,对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。
在一种可能的设计中,解析信息包括:字段信息、单元信息和文件信息;根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息,包括:
根据第一解析模板,对数据文件进行字段查询处理,得到字段信息;
根据第一解析模板,对数据文件进行单元查询处理,得到单元信息;
根据第一解析模板,对数据文件进行单元变更查询处理,得到文件信息。
在一种可能的设计中,解析信息存在错误包括:字段信息、单元信息和文件信息中的至少一种存在错误。
在一种可能的设计中,根据解析信息和第一解析模板,确定第二解析模板,包括:
在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板;
其中,错误信息包括字段信息、单元信息、文件信息中的至少一种。
在一种可能的设计中,根据错误信息更新第一解析模板,得到第二解析模板,包括:
显示错误信息和第一解析模板;
接收用户根据错误信息在第一解析模板中输入的模板变更指令,根据模板变更指令更新第一解析模板,得到第二解析模板。
在一种可能的设计中,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息之前,还包括:
判断是否预先存储有第一解析模板;
若未存储第一解析模板,则进行模板配置,得到第一解析模板。
在一种可能的设计中,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息之前,还包括:
接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新。
在一种可能的设计中,若解析信息正确,则在根据第一解析模板对数据文件进行解析处理之后,得到数据信息。
第二方面,本申请提供一种种数据文件处理装置,装置包括:获取模块、解析模块、确定模块和业务处理模块,其中,
获取模块用于,获取数据文件,数据文件中包括文件标识;
解析模块用于,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息;
确定模块用于,若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板;
解析模块还用于,根据第二解析模板,对数据文件进行解析处理,得到数据信息;
业务处理模块用于,根据数据信息进行业务处理。
在一种可能的设计中,解析信息包括:字段信息、单元信息和文件信息;解析模块具体用于:
根据第一解析模板,对数据文件进行字段查询处理,得到字段信息;
根据第一解析模板,对数据文件进行单元查询处理,得到单元信息;
根据第一解析模板,对数据文件进行单元变更查询处理,得到文件信息。
在一种可能的设计中,解析信息存在错误包括:字段信息、单元信息和文件信息中的至少一种存在错误。
在一种可能的设计中,确定模块具体用于:
在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板;
其中,错误信息包括字段信息、单元信息、文件信息中的至少一种。
在一种可能的设计中,确定模块具体用于:
显示错误信息和第一解析模板;
接收用户根据错误信息在第一解析模板中输入的模板变更指令,根据模板变更指令更新第一解析模板,得到第二解析模板。
在一种可能的设计中,装置还包括判断模块和配置模块,其中,
判断模块用于,在根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息之前,判断是否预先存储有第一解析模板;
配置模块用于,若未存储第一解析模板,则进行模板配置,得到第一解析模板。
在一种可能的设计中,装置还包括接收模块,其中,
接收模块用于,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息之前,接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新。
在一种可能的设计中,解析模块还用于,若解析信息正确,则在根据第一解析模板对数据文件进行解析处理之后,得到数据信息。
第三方面,本申请提供一种电子设备,包括:处理器和存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,使得处理器执行如第一方面任一项的数据文件处理方法。
第四方面,本申请提供一种可读存储介质,包括程序或指令,当程序或指令在计算机上运行时,如上述第一方面任意一项的数据文件处理方法被执行。
本实施例提供的数据文件处理方法包括:获取数据文件,数据文件中包括文件标识;根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息;若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板;根据第二解析模板,对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。在上述方法中,根据解析模板,对数据文件进行解析处理,得到数据信息,可以避免业务员将每个信批报告中的数据信息抄录至预设处理模板中,节省人力劳动和抄录时间,进一步地,通过解析模板对数据文件进行解析处理得到数据信息较为准确,无需在对数据信息进行校验,提高了业务处理的效率。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的企业年金业务***的结构示意图;
图2为本申请提供的数据文件处理方法的流程示意图一;
图3为本申请提供的一种解析模板的配置结构示意图;
图4为本申请提供的数据文件处理方法的流程示意图二;
图5为本申请提供的数据文件处理方法的流程示意图三;
图6为申请提供的第一数据文件;
图7为申请提供的第二数据文件;
图8为申请提供的第三数据文件;
图9为申请提供的第四数据文件;
图10为本申请提供的数据文件处理装置的结构示意图一;
图11为本申请提供的数据文件处理装置的结构示意图二;
图12为本申请提供的数据文件处理装置的结构示意图三;
图13为本申请提供的电子设备的硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,结合图1对企业年金的信息披露主要涉及的管理机构组成的企业年金业务***进行说明,具体的,请参见图1。
图1为本申请提供的企业年金业务***的结构示意图。如图1所示,企业年金业务***10包括:托管机构101、投管机构102、受托机构103、帐管机构104和委托机构105。
其中,托管机构101为接受受托机构103(例如:某企业)委托、并保管企业年金基金财产的银行机构;投管机构102为接受受托机构103委托、并对企业年金资金进行投资的专业投资机构;受托机构103为接受委托机构105委托、并管理企业年金基金的法人受托机构;帐管机构104为接受受托机构委托、管理企业年金基金账户、并进行记账的专业机构。
通常在每个季度末(例如4月、7月、10月、1月的第一天),受托机构103中的业务员分别向托管机构101、投管机构102和帐管机构104发送电子版、或者纸质版信批业务通知单,以通知托管机构101、投管机构102和帐管机构104开始运作本季度信批业务。托管机构101的业务员向受托机构103发送电子版、或者纸质版托管信批报告,帐管机构104的业务员向受托机构103发送电子版、或者纸质版帐管信批报告,投管机构102的业务员向受托机构103发送电子版、或者纸质版投管信批报告。
在现有技术中,受托机构103的业务员将托管信批报告、帐管信批报告以及投管信批报告中的数据信息抄录至一个预设处理模板中,并将包括数据信息的预设处理模板导入至业务处理***,以使业务处理***对预设处理模板中的数据信息进行核对校验,在校验通过后,根据数据信息进行业务处理,生成受托信批报告,并在当月底最后一天前向委托机构105发送其对应的受托信批报告(包括:计划级受托信批报告、企业级受托信批报告、定制化受托信批报告)。
其中,计划级受托信批报告、企业级受托信批报告、定制化受托信批报告主要区别在于格式、样式、数据项的不同,对于相同的数据项,数据产生的算法相同。
在上述现有技术中,受托机构的业务员将每个信批报告中的数据信息抄录至预设处理模板中,耗时费力,而且为了避免人工抄录错误,需要对预设处理模板中的数据信息进行校验,降低了业务处理的效率。
而在本申请中,为了实现省时省力,提高业务处理的效率,本申请提供一种数据文件处理方法,业务员将每个信批报告中的数据信息抄录至预设处理模板,就可以直接获取每个信批报告中的数据信息,而且不需要对获取到的数据信息进行校验。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图2为本申请提供的数据文件处理方法的流程示意图一。如图2所示,本实施例提供的数据文件处理方法包括:
S201:获取数据文件,数据文件中包括文件标识。
可选地,本申请实施例的执行主体可以为电子设备(例如:服务器、台式电脑等),也可以为设置在电子设备中的数据表处理装置,该数据表处理装置处理装置可以为通过软件和/或硬件的结合来实现。
可选地,上述电子设备可以为图1中受托机构103中的电子设备,上述数据文件为上述托管机构101、投管机构102以及帐管机构104中任意一个机构通过例如邮箱发送的信批报告(例如:图6、图7、图8、图9所示)。
可选地,电子设备可以直接从邮箱中获取数据文件,也可以在业务员执行文件上传操作之后获取到数据文件。其中,业务员执行文件上传操作包括,从邮箱中找到数据文件,并将数据文件上传至电子设备。
其中,上述文件标识可以为图6、图7、图8、图9中的“XXX企业年金集合计划--XXX有限公司企业年金计划”。
S202:根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息。
需要说明的是,电子设备中预先存储有多个已经配置好的解析模板,解析模板的配置结构通常如下图3所示。图3为本申请提供的一种解析模板的配置结构示意图。如图3所示,包括:文件级配置、单元级配置和字段级配置。其中,文件级配置中包括多个解析单元(例如:解析单元1、解析单元2、解析单元3、解析单元4等),每个解析单元具有各自对应的单元样式,各个解析单元具有预先设定的顺序。针对每个解析单元,单元级配置中包括多个字段(例如:字段1、字段2、字段3、字段4等),各个字段具有预先设定的顺序。针对每个字段,在字段级配置中包括每个字段对应的字段名称(例如:图6中的“账户管理人名称:”、“法定代表人:”等)。
在实际配置过程中,可以先配置“字段”,再将“字段”配置到“单元”,最后将“单元”配置到“文件模板”中,得到上述解析模板。
具体的,“字段”对应数据文件中的字段(例如:图6中的字段标识“账户管理人名称:”、“法定代表人:”等),“单元”对应数据文件中的表格(如图6中的单元标识“账户管理人基本情况”、“企业账户信息”各自对应的表格),“文件模板”对应数据文件(例如:图6、图7、图8、图9所示)。
在实际应用中,通过业务员对不同的数据文件进行分析之后,发现如下关系:一个数据文档是一份数据文件,一份数据文件也只对应一个数据文档,即,数据文档和数据文件的关系是一对一;一份数据文件按照顺序排布着多个表格,一个表格也可能存在于不同的数据文件,即,数据文件和表格的关系是:多对多;一个表格包含多个字段,一个字段也可能存在于不同的表格,即,表格和字段的关系是:多对多。
在实际应用中,对于不同“单元”中的相同字段,可直接引用已有的“字段”配置,对于不同“文件模板”中的相同单元,可直接引用已有的“单元”配置。
可选地,解析信息可以包括:字段信息、单元信息、以及文件信息等。
可选地,字段信息包括字段名称,单元信息包括称单元标识、字段标识、字段个数、字段位置等,文件信息包括解析单元的个数和位置等。
S203:若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板。
可选地,解析信息存在错误包括字段信息、单元信息、以及文件信息中的至少一种存在错误。
可选地,解析信息存在错误,电子设备可以显示提示信息,该提示信息用于指示字段信息、单元信息、或者文件信息中的至少一种存在错误。
具体的,若解析信息正确,则在根据第一解析模板对数据文件进行处理,可以得到S204中的数据信息,无需再执行S204所示的方法。
S204:根据第二解析模板,对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。
需要说明的是,针对来自图1实施例中的托管机构101、投管机构102、帐管机构104的各个数据文件(信批报告)均执行S201至S204,得到每个数据文件对应的数据信息,从而将根据上述每个数据文件对应的数据信息进行业务处理。
本实施例提供的数据文件处理方法包括:获取数据文件,数据文件中包括文件标识;根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息;若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板;根据第二解析模板,对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。在上述方法中,根据解析模板,对数据文件进行解析处理,得到数据信息,可以避免业务员将每个信批报告中的数据信息抄录至预设处理模板中,节省人力劳动和抄录时间,进一步地,通过解析模板对数据文件进行解析处理得到数据信息较为准确,无需在对数据信息进行校验,提高了业务处理的效率。
在上述实施例的基础上,下面结合图4对本申请提供的数据文件处理方法做进一步地详细说明,具体的,请参见图4。
图4为本申请提供的数据文件处理方法的流程示意图二。如图4所示,本实施例提供的数据文件处理方法包括:
S401:获取数据文件,数据文件中包括文件标识。
具体的,S401的执行方法与S201的执行方法相同,此处,不再赘述S401的执行过程。
S402:根据文件标识确定预先存储有文件标识对应的第一解析模板。
S403:接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新。
可选地,更新标识为预先设定的1(或者0)或者0(或者1),其中,1(或者0)指示进行模板更新,0(或者1)指示不进行模板更新。具体的,本申请不对更新标识的具体表示形式进行限定。
S404:根据更新标识判断是否进行模板更新。
若是,则执行S405。
若否,则执行S406。
例如,若更新标识为1,则确定进行模板更新;若更新标识为0,则确定不进行模板更新。
S405:通过用户根据预先得知的更新信息输入的配置指令,更新第一解析模板。
可选地,更新信息为托管机构101、投管机构102、或者帐管机构104的业务员告知受托机构103的业务员的更新信息。
可选地,更新信息中包括字段信息、单元信息、以及文件信息中的任意至少一种。
可选地,配置指令中可以包括上述更新信息。
S406:根据第一解析模板,对数据文件进行解析处理,得到解析信息,解析信息包括字段信息、单元信息和文件信息。
在一种可能的设计中,根据文件标识对应的第一解析模板,对数据文件进行字段查询处理,得到字段信息;
根据第一解析模板,对数据文件进行单元查询处理,得到单元信息;
根据第一解析模板,对数据文件进行单元变更查询处理,得到文件信息。
S407:判断解析信息是否存在错误。
若否,则执行S408。
若是,则执行S409。
S408:根据第一解析模板对数据文件进行解析处理之后,得到数据信息。
S409:在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板。
其中,错误信息包括字段信息、单元信息、以及文件信息中的至少一种。
可选地,在根据第一解析模板对数据文件进行解析处理的过程中,可以显示解析信息中确定错误信息,进而根据错误信息更新第一解析模板。
在一种可能的设计中,可以显示错误信息和第一解析模板;
接收用户根据错误信息在第一解析模板中输入的模板变更指令,根据模板变更指令更新第一解析模板,得到第二解析模板。
其中,模板变更指令中包括上述错误信息。
S410:根据第二解析模板对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。
具体的,S410的执行方法与S204的执行方法相同,此处不再赘述S410的执行过程。
本实施例提供数据文件处理方法包括:获取数据文件,数据文件中包括文件标识;根据文件标识确定预先存储有文件标识对应的第一解析模板;接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新;根据更新标识判断是否进行模板更新;若是,则通过用户根据预先得知的更新信息输入的配置指令,更新第一解析模板;若否,则根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息,解析信息包括字段信息、单元信息和文件信息;判断解析信息是否存在错误;若否,则根据第一解析模板对数据文件进行解析处理之后,得到数据信息;若是,在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板,错误信息包括字段信息、单元信息、以及文件信息中的至少一种;根据第二解析模板对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。在上述方法中,根据解析模板,对数据文件进行解析处理,得到数据信息,可以避免业务员将每个信批报告中的数据信息抄录至预设处理模板中,节省人力劳动和抄录时间,进一步地,通过解析模板对数据文件进行解析处理得到数据信息较为准确,无需在对数据信息进行校验,提高了业务处理的效率。
在上述实施例的基础上,下面结合图5对本申请提供的数据文件处理方法做进一步地详细说明,具体的,请参见图5。
图5为本申请提供的数据文件处理方法的流程示意图三。如图5所示,本实施例提供的数据文件处理方法包括:
S501:获取数据文件,数据文件中包括文件标识。
具体的,S501的执行方法与S401的执行方法相同,此处不再赘述S501的执行过程。
S502:判断是否预先存储文件标识对应的第一解析模板。
若否,则执行S503。
若是,则执行S504。
可选地,第一解析模板具有对应的模板标识,该模板标识可以与文件标识相同,也可以与文件标识不相同。
例如,当模板标识与文件标识不相同时,可以根据预设映射关系,确定是否预先存储有文件标识对应的第一解析模板,其中,预设映射关系包括至少一个文件标识和每个文件标识对应的模板标识。
S503:进行模板配置,得到第一解析模板。
可选地,可以根据如图3所示的解析模板的配置结构,根据数据文件进行模板配置,得到第一解析模板。
S504:接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新。
具体的,S504的执行方法与S403的执行方法相同,此处不再赘述S503的执行过程。
S505:根据更新标识判断是否进行模板更新。
若是,则执行S506。
若否,则执行S507。
例如,若更新标识为1,则确定进行模板更新;若更新标识为0,则确定不进行模板更新。
S506:通过用户根据预先得知的更新信息输入的配置指令,更新第一解析模板。
S507:根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息,解析信息包括字段信息、单元信息和文件信息。
S508:判断解析信息是否存在错误。
若否,则执行S509。
若是,则执行S510。
S509:根据第一解析模板对数据文件进行解析处理之后,得到数据信息。
S510:在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板,错误信息包括字段信息、单元信息、以及文件信息中的至少一种。
S511:根据第二解析模板对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。
具体的,S504~S511的执行方法与S410~S410的执行方法对应相同,此处不再赘述S504~S511的执行过程。
本实施例提供的数据文件处理方法包括:获取数据文件,数据文件中包括文件标识;判断是否预先存储有文件标识对应的第一解析模板;若否,则进行模板配置,得到第一解析模板;若是,则接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新;根据更新标识判断是否进行模板更新;若是,则通过用户根据预先得知的更新信息输入的配置指令,更新第一解析模板;若否,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息,解析信息包括字段信息、单元信息和文件信息;判断解析信息是否存在错误;若否,则根据第一解析模板对数据文件进行解析处理之后,得到数据信息;若是,则在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板,错误信息包括字段信息、单元信息、以及文件信息中的至少一种,根据第二解析模板对数据文件进行解析处理,得到数据信息,并根据数据信息进行业务处理。在上述方法中,根据解析模板,对数据文件进行解析处理,得到数据信息,可以避免业务员将每个数据文件中的数据信息抄录至预设处理模板中,节省人力劳动和抄录时间,进一步地,通过解析模板对数据文件进行解析处理得到数据信息较为准确,无需在对数据信息进行校验,提高了业务处理的效率。
在上述实施例的基础上,下面以需要修改解析模板中的字段及解析单元为例,结合图6和图7说明本申请提供的数据文件处理方法的执行过程。图6为申请提供的第一数据文件。图7为申请提供的第二数据文件。需要说明的是,第一数据文件为第一季度对应的数据文件,第二数据文件为第二季度对应的数据文件,其中,图6和图7仅是示例性的示出一种数据文件。
在实际应用中,例如需要对第二数据文件进行数据文件处理时,可以执行以下步骤:
S601:业务员可以将第二数据文件上传至电子设备,第二数据文件包括文件标识。
可选地,电子设备可以根据数据文件的文件标识,确定第一数据文件和第二数据文件均来自同一机构。其中,第一数据文件和第二数据文件的文件标识相同。
可选地,电子设备还可以自动从邮箱中获取预先存储的第二数据文件,并根据第一数据文件所在邮件标识和第二数据文件所在邮件标识确定第一数据文件和第二数据文件均来自同一机构。其中,邮件标识可以为邮件地址。
S602:在业务员不知道第一数据文件和第二数据文件中的字段发生变化的情况下,业务员按照正常操作惯性向电子设备中输入了更新指令,更新指令中的更新标识指示不进行模板更新。
S603:电子设备接收到不进行模板更新的更新指令之后,根据第二数据文件的文件标识正常匹配到第一解析模板(能够用于解析第一数据文件,得到第一数据文件中的数据信息),并根据第一解析模板对第二数据文件进行解析处理,得到解析信息,在确定解析信息存在错误时,显示提示信息“本期报告‘企业账户信息’存在字段变动,请新增解析单元字段配置”。
例如,图7所示的第二数据文件中具有字段名称“新增企业数”和“退出企业数”,在使用第一数据文件对应的第一解析模板对第二数据文件进行解析处理时,由于图6所示的第一数据文件中没有字段名称“新增企业数”和“退出企业数”,因此解析信息存在错误,而且由于字段名称“新增企业数”和“退出企业数”存在于解析单元“企业账户信息”中,因此电子设备提示“企业账户信息”存在字段变动。
其中,“企业账户信息”为解析单元的单元标识。
S604:电子设备查询第一解析模板中的所有字段,若未查询到字段名称“新增企业数”和“退出企业数”,则代表没有配置过“新增企业数”和“退出企业数”,此时配置“新增企业数”和“退出企业数”;若查询到存在字段名称“新增企业数”和“退出企业数”,则可以继续查询第一解析模板中的单元样式,确定解析单元“企业账户信息”存在错误之后,可以将字段名称“新增企业数”和“退出企业数”配置到第一解析模板中的解析单元“企业账户信息”中,接着继续查询第一解析模板中解析单元的个数和位置,在确定上述个数及位置没有变化之后,保存第一解析模板得到第二解析模板。
需要说明的是,上述字段信息(包括字段名称“新增企业数”和“退出企业数”)、单元信息(包括单元标识“企业账户信息”)、文件信息(包括解析单元的个数和位置)均为解析信息。
S605:电子设备根据第二解析模板对第二数据文件进行解析处理,得到数据信息。
在上述实施例的基础上,下面以需要修改解析单元与解析模板为例,结合图8和图9说明本申请提供的数据文件处理方法在实际应用中的执行过程。图8为申请提供的第三数据文件。图9为申请提供的第四数据文件。需要说明的是,第三数据文件为第三季度对应的数据文件,第四数据文件为第四季度对应的数据文件,其中,图8和图9仅是示例性的示出一种数据文件。
在实际应用中,例如需要对第四数据文件进行数据文件处理时,可以执行以下步骤:
S701:业务员可以将第四数据文件上传至电子设备,第四数据文件包括文件标识。
其中,S701的执行方法与S601的执行方法相同,此处不再赘述S701的执行过程。
S702:在业务员不知道第三数据文件和第四数据文件中的字段发生变化的情况下,业务员按照正常操作惯性向电子设备中输入了更新指令,更新指令中的更新标识指示不进行模板更新。
其中,S702的执行方法与S602的执行方法相同,此处不再赘述S702的执行过程。
S703:电子设备接收到不进行模板更新的更新指令之后,根据第四数据文件的文件标识正常匹配到第一解析模板(能够用于解析第三数据文件,得到第三数据文件中的数据信息),并根据第一解析模板对第三数据文件进行解析处理,得到解析信息,在确定解析信息存在错误时,显示提示信息“本期报告《个人账户信息》表不存在,请减少解析模板单元配置”。
S704:电子设备查询第一解析模板中的所有字段,未查询到字段名称变化(增加或减少),继续查询第一解析模板中的单元样式,未查询到单元样式发生变化,接着继续查询第一解析模板中解析单元的个数和位置,并根据提示信息“本期报告《个人账户信息》表不存在,请减少解析模板单元配置”从第一解析模板中删除解析单元《个人账户信息》,得到第二解析模板。
S705:电子设备根据第二解析模板对第二数据文件进行解析处理,得到数据信息。
图10为本申请提供的数据文件处理装置的结构示意图一。如图10所示,数据文件处理装置20包括:获取模块21、解析模块22、确定模块23和业务处理模块24,其中,
获取模块21用于,获取数据文件,数据文件中包括文件标识;
解析模块22用于,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息;
确定模块23用于,若解析信息存在错误,则根据解析信息和第一解析模板,确定第二解析模板;
解析模块22还用于,根据第二解析模板,对数据文件进行解析处理,得到数据信息;
业务处理模块24用于,根据数据信息进行业务处理。
本申请提供的数据文件处理装置20可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的设计中,解析信息包括:字段信息、单元信息和文件信息;解析模块22具体用于:
根据第一解析模板,对数据文件进行字段查询处理,得到字段信息;
根据第一解析模板,对数据文件进行单元查询处理,得到单元信息;
根据第一解析模板,对数据文件进行单元变更查询处理,得到文件信息。
在一种可能的设计中,解析信息存在错误包括:字段信息、单元信息和文件信息中的至少一种存在错误。
在一种可能的设计中,确定模块23具体用于:
在解析信息中确定错误信息,根据错误信息更新第一解析模板,得到第二解析模板;
其中,错误信息包括字段信息、单元信息、文件信息中的至少一种。
在一种可能的设计中,确定模块23具体用于:
显示错误信息和第一解析模板;
接收用户根据错误信息在第一解析模板中输入的模板变更指令,根据模板变更指令更新第一解析模板,得到第二解析模板。
图11为本申请提供的数据文件处理装置的结构示意图二。如图11所示,数据文件处理装置20还包括:判断模块25和配置模块26,其中,
判断模块25用于,在根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息之前,判断是否预先存储有第一解析模板;
配置模块26用于,若未存储第一解析模板,则进行模板配置,得到第一解析模板。
本申请提供的数据文件处理装置20可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
图12为本申请提供的数据文件处理装置的结构示意图三。如图12所示,数据文件处理装置20还包括:接收模块27,其中,
接收模块27用于,根据文件标识对应的第一解析模板,对数据文件进行解析处理,得到解析信息之前,接收用户输入的更新指令,更新指令中包括更新标识,更新标识用于指示进行模板更新或者不进行模板更新。
本申请提供的数据文件处理装置20可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。
在一种可能的设计中,解析模块还用于:若解析信息正确,则在根据第一解析模板对数据文件进行解析处理之后,得到数据信息。
图13为本申请提供的电子设备的硬件结构示意图。如图13所示,该电子设备30包括:处理器31、存储器32,
其中,处理器31、存储器32通过总线33连接。
在具体实现过程中,处理器31执行存储器32存储的计算机执行指令,使得处理器31执行如上的数据文件处理方法。
处理器31的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述图13所示的实施例中,应理解,处理器可以是中央处理单元(英文:CentralProcessing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignal Processor,简称:DSP)、专用集成电路(英文:Application Specific IntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当处理器执行计算机执行指令时,实现如上的数据文件处理方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (5)

1.一种数据文件处理方法,其特征在于,所述方法包括:
获取数据文件,所述数据文件中包括文件标识;
根据所述文件标识对应的第一解析模板,对所述数据文件进行解析处理,得到解析信息;
若所述解析信息存在错误,则根据所述解析信息和所述第一解析模板,确定第二解析模板;
根据所述第二解析模板,对所述数据文件进行解析处理,得到数据信息,并根据所述数据信息进行业务处理;
所述解析信息包括:字段信息、单元信息和文件信息;所述根据所述文件标识对应的第一解析模板,对所述数据文件进行解析处理,得到解析信息,包括:
根据所述第一解析模板,对所述数据文件进行字段查询处理,得到字段信息;
根据所述第一解析模板,对所述数据文件进行单元查询处理,得到单元信息;
根据所述第一解析模板,对所述数据文件进行单元变更查询处理,得到文件信息;
所述解析信息存在错误包括:所述字段信息、所述单元信息和所述文件信息中的至少一种存在错误;
所述根据所述解析信息和所述第一解析模板,确定第二解析模板,包括:
在所述解析信息中确定错误信息,根据所述错误信息更新所述第一解析模板,得到所述第二解析模板;
其中,所述错误信息包括所述字段信息、所述单元信息、所述文件信息中的至少一种;
所述根据所述错误信息更新所述第一解析模板,得到所述第二解析模板,包括:
显示所述错误信息和所述第一解析模板;
接收用户根据所述错误信息在所述第一解析模板中输入的模板变更指令,根据所述模板变更指令更新所述第一解析模板,得到所述第二解析模板;
所述根据所述文件标识对应的第一解析模板,对所述数据文件进行解析处理,得到解析信息之前,还包括:
判断是否预先存储有所述第一解析模板;
若未存储所述第一解析模板,则进行模板配置,得到所述第一解析模板。
2.根据权利要求1所述的方法,其特征在于,所述根据所述文件标识对应的第一解析模板,对所述数据文件进行解析处理,得到解析信息之前,还包括:
接收用户输入的更新指令,所述更新指令中包括更新标识,所述更新标识用于指示进行模板更新或者不进行模板更新。
3.根据权利要求1所述的方法,其特征在于,若所述解析信息正确,则在根据所述第一解析模板对所述数据文件进行解析处理之后,得到所述数据信息。
4.一种电子设备,其特征在于,包括:处理器和存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如权利要求1至3任一项所述的数据文件处理方法。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至3任一项所述的数据文件处理方法。
CN202010663465.0A 2020-07-10 2020-07-10 数据文件处理方法及装置 Active CN111797613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010663465.0A CN111797613B (zh) 2020-07-10 2020-07-10 数据文件处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010663465.0A CN111797613B (zh) 2020-07-10 2020-07-10 数据文件处理方法及装置

Publications (2)

Publication Number Publication Date
CN111797613A CN111797613A (zh) 2020-10-20
CN111797613B true CN111797613B (zh) 2024-04-09

Family

ID=72806900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010663465.0A Active CN111797613B (zh) 2020-07-10 2020-07-10 数据文件处理方法及装置

Country Status (1)

Country Link
CN (1) CN111797613B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112732641A (zh) * 2020-12-30 2021-04-30 山东浪潮通软信息科技有限公司 一种电子档案的归档方法及装置、介质
CN113094345A (zh) * 2021-04-15 2021-07-09 浪潮通用软件有限公司 一种表格数据文件的导入方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108040040A (zh) * 2017-11-30 2018-05-15 北京锐安科技有限公司 一种应用协议报文的自动化解析方法和装置
CN108804140A (zh) * 2018-06-15 2018-11-13 中国建设银行股份有限公司 一种批量指令解析方法、装置及设备
CN110704381A (zh) * 2019-09-06 2020-01-17 平安城市建设科技(深圳)有限公司 数据解析方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769363B2 (en) * 2015-11-10 2020-09-08 Hyland Switzerland Sàrl System and methods for transmitting clinical data having multi-segment fields from one or more modalities to a dictation machine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108040040A (zh) * 2017-11-30 2018-05-15 北京锐安科技有限公司 一种应用协议报文的自动化解析方法和装置
CN108804140A (zh) * 2018-06-15 2018-11-13 中国建设银行股份有限公司 一种批量指令解析方法、装置及设备
CN110704381A (zh) * 2019-09-06 2020-01-17 平安城市建设科技(深圳)有限公司 数据解析方法、装置及存储介质

Also Published As

Publication number Publication date
CN111797613A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111291024B (zh) 数据处理方法、装置、电子设备及存储介质
CN105719168B (zh) 打印***的方法及***
CN111797613B (zh) 数据文件处理方法及装置
CN110750654A (zh) 知识图谱获取方法、装置、设备和介质
CN109739957B (zh) 基于数据处理的单据信息录入方法、装置、设备及存储介质
CN111309586A (zh) 一种命令测试方法、装置及其存储介质
CN114266539A (zh) 文件流程处理方法、***、装置及计算机可读存储介质
CN111598707B (zh) 一种页面的生成方法及电子设备
US11182375B2 (en) Metadata validation tool
JP5400496B2 (ja) 決算書の分析結果に基づく記事を作成するシステム
CN108804889B (zh) 一种网站注册方法及装置
CN115203300B (zh) 一种数据验证方法及装置
CN115809228A (zh) 数据比对方法、装置、存储介质及电子设备
CN113157890B (zh) 智能问答方法、装置、电子设备及可读存储介质
CN114860305A (zh) 数据处理方法和装置
CN109739876B (zh) 基于Sqltoy-orm框架的数据库的数据查询方法和装置
CN111241082B (zh) 数据修正方法及装置
CN110737642B (zh) 数据库信息分析方法、装置、计算机装置及存储介质
US20050228679A1 (en) Automated account statement generation process
TW201423620A (zh) 專利費用稽核系統及方法
CN113434734A (zh) 一种生成文件、读取文件的方法、装置、设备及存储介质
WO2021073264A1 (zh) 票据信息采集方法、装置、计算机设备及可读存储介质
CN112860722A (zh) 数据核对方法、装置、电子设备和可读存储介质
CN111445330A (zh) 对账的方法及装置
CN113505159B (zh) 数据检测方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant