CN111125221B - 基于Excel格式的数据提取***及配置方法 - Google Patents

基于Excel格式的数据提取***及配置方法 Download PDF

Info

Publication number
CN111125221B
CN111125221B CN201911317938.5A CN201911317938A CN111125221B CN 111125221 B CN111125221 B CN 111125221B CN 201911317938 A CN201911317938 A CN 201911317938A CN 111125221 B CN111125221 B CN 111125221B
Authority
CN
China
Prior art keywords
data
template
extracted
unit
excel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911317938.5A
Other languages
English (en)
Other versions
CN111125221A (zh
Inventor
吴非
陆欢旺
徐剑刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Sandao Intelligent Technology Co ltd
Original Assignee
Shanghai Sandao Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Sandao Intelligent Technology Co ltd filed Critical Shanghai Sandao Intelligent Technology Co ltd
Priority to CN201911317938.5A priority Critical patent/CN111125221B/zh
Publication of CN111125221A publication Critical patent/CN111125221A/zh
Application granted granted Critical
Publication of CN111125221B publication Critical patent/CN111125221B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24561Intermediate data storage techniques for performance improvement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据处理的技术领域,具体公开了一种基于Excel格式的数据提取***及配置方法,***包括依次连接的模板生成单元、模板匹配单元、数据提取单元。方法包括:首先通过模板生成单元生成多个模板,通过模板定义需要提取的数据以及数据间的关系,然后上传Excel数据文件,并将Excel数据文件与各模板依次进行匹配,以确定匹配值最高的模板,通过数据提取单元以具有最高匹配值的模板从Excel数据文件中提取对应的有效数据,从而实现了从Excel数据文件提取数据,本发明提供的基于Excel格式的数据提取***及配置方法,代替了人工手动录入,提高了据导入效率,简化了流程,同时也降低了错误率。

Description

基于Excel格式的数据提取***及配置方法
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种基于Excel格式的数据提取***及配置方法。
背景技术
互联网信息时代的今天,计算机数据处理代替了人工办公,但是,在某些***的某些场景中,需要通过Excel 表格导入数据到***中。现有的导入方式是提供固定的模板,用户仍需通过依次填充数据后再导入应用***中。
比如,在学生管理***中,需要将全班学生的姓名、性别、学号等信息导入,现有的导入方式是需要在学生管理***中建立固定的模板,然后将全班学生的姓名、性别、学号等信息依次输入至模板中;又如在进出口货物装船出运前,均需向海关进行申报,同一属性的数据(即同一货物申报的数据)均包括箱单、***、运单、合同等多种数据,在向***中导入相关数据时,也是需要在管理***中建立固定的模板,然后将需要的数据依次输入至模板中以实现数据的导入。以上操作不仅繁琐,耗时耗力,而且容易出错。
发明内容
针对现有技术存在的不足,本发明的目的之一是提供一种基于Excel格式的数据提取***,其能够提高数据导入效率,同时简化了流程,降低了错误率。
本发明提供的基于Excel格式的数据提取***,包括:
模板生成单元,以定义需要提取的数据,以及数据间的关系,生成多个模板;
模板匹配单元,用于将Excel数据文件与模板生成单元生成的各模板进行匹配,以期确定匹配值最高的模板;
数据提取单元,与所述模板匹配单元连接,采用具有最高匹配值的模板从Excel数据文件中提取对应的有效数据。
通过采用上述技术方案,首先通过模板生成单元生成多个模板,通过模板定义需要提取的数据以及数据间的关系,然后上传Excel数据文件,并将Excel数据文件与各模板依次进行匹配,以确定匹配值最高的模板,通过数据提取单元以具有最高匹配值的模板从Excel数据文件中提取对应的有效数据,从而实现了从Excel数据文件提取数据,代替了人工手动录入,提高了据导入效率,简化了流程,同时也降低了错误率。另外,在上述技术方案中,通过模板生成单元生成多个模板的目的是根据实际需求,提高***的实用性。
本发明在一较佳示例中可以进一步配置为:所述模板生成单元包括:
字段定义单元,定义参照物,并结合正则表达式以定义需要提取的数据的“点”位;
列表定义单元,定义需要提取的数据的区域;
自用列表定义单元,结合定义参照物,以及定义需要提取的数据的区域以确定所述提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系。
通过采用上述技术方案,字段定义单元,用于定义需要提取的数据所在位置的参照物,以及数据与该参照物的位置关系,即所需要提取的数据与该参照物相邻,比如位于该参照物之后或之前过个字符,从而定义需要提取的数据的“点”位,同时,结合正则表达式提高所要提取数据“点”位的准确性;列表定义单元,定义需要提取的数据的区域,比如定义需要提取的数据位于文件的某行某列;自用列表定义单元,结合字段定义单元和列表定义单元的效果,定义参照物,以及定义需要提取的数据的区域以确定提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系。
本发明在一较佳示例中可以进一步配置为:还包括:
数据结构化处理单元,分别对数据提取单元提取的有效数据进行结构化处理,以期使各数据生成可结构化存储的中间文件;
数据内容规则模块,预先设定有多种类型标准模型,并分配有对应的类型库,按照类型标准模型对数据结构化处理单元生成的各中间文件进行分类别存储。
通过采用上述技术方案,数据结构化处理单元分别将提取的有效数据进行结构化处理,转化成中间文件,中间文件的特点为具有扩展功能,相同类型的中间文件具有相同的标记,相同类型且不同格式的数据文件对应的中间文件高度相似,因此,便于后续不同格式相同类型的数据文件按照类型进行分类;数据内容规则模块预先设定有多种类型标准模型,并分配有对应的类型库,因此,将中间文件一一与各标准模型进行比对,能够实现匹配的中间文件放置对应的类型库中,从而实现了了数据文件按照类型分类。
本发明在一较佳示例中可以进一步配置为:还包括:
数据存储规则单元,预先设定有最终所需输出数据文件的标准结构;
数据输出单元,分别与所述数据内容规则模块及所述数据存储规则单元连接,以输出与数据存储规则单元设定的标准结构数据。
通过采用上述技术方案,使用者通过数据存储规则单元可预先设定需要输出的数据文件的标准结构,使该***可运用于不同领域,提高了本***的实用性,数据输出单元用于输出与数据存储规则单元设定的标准结构数据。
本发明的第二目的在于提供基于上述基于Excel格式的数据提取***的数据提取方法,包括以下步骤:
S1:模板制作,通过模板定义需要提取的数据,以及数据间的关系,其中,包括若干个不同形式的模板;
S2:匹配模板,上传Excel数据文件,将Excel数据文件依次与各模板进行匹配,选择有效数值匹配最多的模板;
S3:数据解析,抓取Excel数据文件中与所选模板匹配的数据,并将数据转化成中间文件;
S4:数据吐出:将抓取的数据中需要的字段进行清洗、分类、整理融合成一份特定格式的数据,然后输出融合后的数据。
通过采用上述技术方案,首先通过模板生成单元生成多个模板,通过模板定义需要提取的数据以及数据间的关系,然后上传Excel数据文件,并将Excel数据文件与各模板依次进行匹配,以确定匹配值最高的模板,通过数据提取单元以具有最高匹配值的模板从Excel数据文件中提取对应的有效数据,从而实现了从Excel数据文件提取数据,代替了人工手动录入,提高了据导入效率,简化了流程,同时也降低了错误率。
提取数据后,数据结构化处理单元分别将提取的有效数据进行结构化处理,转化成中间文件,中间文件便于后续不同格式相同类型的数据文件按照类型进行分类;数据内容规则模块预先设定有多种类型标准模型,并分配有对应的类型库,因此,将中间文件一一与各标准模型进行比对,能够实现匹配的中间文件放置对应的类型库中,从而实现了了数据文件按照类型分类;使用者通过数据存储规则单元预先设定需要输出的数据文件的标准结构,使该***可运用于不同领域,数据输出单元用于输出与数据存储规则单元设定的标准结构数据。
本发明在一较佳示例中可以进一步配置为,每个模板中包括多个数据项,每个数据项中的数据分别通过字段和/或列表和/或自由列表的方式定义需要提取的数据,并通过自由列表的方式定义数据间的关系。
通过采用上述技术方案,
本发明在一较佳示例中可以进一步配置为:通过字段的方式定义需要提取的数据具体为通过参照物以及正则表达式确定需要提取的数据的“点”位。
通过采用上述技术方案,字段定义单元,用于定义需要提取的数据所在位置的参照物,以及数据与该参照物的位置关系,即所需要提取的数据与该参照物相邻,比如位于该参照物之后或之前过个字符,从而定义需要提取的数据的“点”位,同时,结合正则表达式提高所要提取数据“点”位的准确性。
本发明在一较佳示例中可以进一步配置为:通过列表的方式定义需要提取的数据具体为通过确定数据所在的行和列确定需要提取的数据的区域。
通过采用上述技术方案,;列表定义单元,定义需要提取的数据的区域,比如定义需要提取的数据位于文件的某行某列。
本发明在一较佳示例中可以进一步配置为:通过自由列表的方式定义需要提取的数据具体为通过字段加列表的混合形式确定需要提取的数据的位置,通过自由列表的方式定义数据间的关具体为通过字段加列表的混合形式确定数据之间的相互关系。
通过采用上述技术方案,自用列表定义单元,结合字段定义单元和列表定义单元的效果,定义参照物,以及定义需要提取的数据的区域以确定提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系。
本发明在一较佳示例中可以进一步配置为:S3包括:
S31:抓取Excel数据文件中与所选模板匹配的数据;
S32:分别对抓取的数据进行结构化处理,以期使各数据生成可结构化存储的中间文件;
S33:按照预先设定有标准模型,对结构化处理后的中间文件进行清洗、分类,存储至对应的类型库中;
S34:按照标准结构,从各类型库中抓取并输出与数据存储规则单元设定的标准结构数据。
通过采用上述技术方案,通过模板从Excel数据文件中提取数据后,数据结构化处理单元分别将提取的有效数据进行结构化处理,转化成中间文件,中间文件便于后续不同格式相同类型的数据文件按照类型进行分类;数据内容规则模块预先设定有多种类型标准模型,并分配有对应的类型库,因此,将中间文件一一与各标准模型进行比对,能够实现匹配的中间文件放置对应的类型库中,从而实现了了数据文件按照类型分类;使用者通过数据存储规则单元预先设定需要输出的数据文件的标准结构,使该***可运用于不同领域,数据输出单元用于输出与数据存储规则单元设定的标准结构数据。
综上所述,本发明包括以下至少一种有益技术效果:
1.通过模板生成单元生成多个模板,通过模板定义需要提取的数据以及数据间的关系,然后上传Excel数据文件,并将Excel数据文件与各模板依次进行匹配,以确定匹配值最高的模板,通过数据提取单元以具有最高匹配值的模板从Excel数据文件中提取对应的有效数据,从而实现了从Excel数据文件提取数据,代替了人工手动录入,提高了据导入效率,简化了流程,同时也降低了错误率。
附图说明
图1是本发明提供的基于Excel格式的数据提取***的结构示意图。
图2是本发明提供的基于Excel格式的数据提取方法的流程图。
图中,1、模板生成单元;2、模板匹配单元;3、数据提取单元;11、字段定义单元;12、列表定义单元;13、自用列表定义单元;4、数据结构化处理单元;5、数据内容规则模块;51、类型库;6、数据存储规则单元;7、数据输出单元。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例1:
为本发明公开的一种基于Excel格式的数据提取***,参照图1所示,包括:
模板生成单元1,根据业务需求,生成多个数据提取模板,模板用于定义需要从Excel数据文件中提取的数据,以及定义数据间的关系;具体的,包括:
字段定义单元11,用于定义需要提取的数据所在位置的参照物,以及数据与该参照物的位置关系,即所需要提取的数据与该参照物相邻,比如位于该参照物之后或之前过个字符,从而定义需要提取的数据的“点”位,同时,结合正则表达式提高所要提取数据“点”位的准确性;
列表定义单元12,定义需要提取的数据的区域,比如定义需要提取的数据位于文件的某行某列;
自用列表定义单元13,结合字段定义单元11和列表定义单元12的效果,定义参照物,以及定义需要提取的数据的区域以确定提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系,比如,定义需要提取的“父”集数据的“点”位,以及提取该“父”集数据下某个区域的“子”集数据,并确定该“父”集数据与“子”集数据之间的关系。
如图1所示,本发明提供披露的基于Excel格式的数据提取***还包括:
模板匹配单元2,分别与字段定义单元11、列表定义单元12及自用列表定义单元13连接,用于将Excel数据文件与模板生成单元1生成的各模板进行匹配,以期确定匹配值最高的模板;
为了提高本发明提供的基于Excel格式的数据提取***的实用性,在使用时候,通常通过模板生成单元1生成多个模板,上传Excel数据文件后,将Excel数据文件依次与各模板进行匹配以确定匹配值最高的模板,其确定的依据即为有效数值匹配最多的模板;
如图1所示,本发明提供披露的基于Excel格式的数据提取***还包括:
数据提取单元3,与模板匹配单元2连接,数据提取单元3采用模板匹配单元2确定的具有最高匹配值的模板从Excel数据文件中提取对应的有效数据;
数据结构化处理单元4,与数据提取单元3连接,分别对数据提取单元3提取的有效数据进行结构化处理,以期使各数据生成可结构化存储的中间文件,在本发明此实施方式中,数据结构化处理单元4转成可扩展标记语言(XML)文件;
数据内容规则模块5,与数据结构化处理单元4连接,预先设定有多种类型标准模型,并分配有对应的类型库51,按照类型标准模型对数据结构化处理单元4生成的各中间文件进行分类别存储;
数据存储规则单元6,预先设定有最终所需输出数据文件的标准结构;
数据输出单元7,分别与数据内容规则模块5及数据存储规则单元6连接,以输出与数据存储规则单元6设定的标准结构数据。
实施例2:
本发明还披露了基于上述Excel格式的数据提取***的数据提取方法,如图2所示,包括以下步骤:
S1:模板制作,基于模板生成单元1设定提取数据的模板,通过模板定义需要提取的数据,以及数据间的关系,其中,通过模板生成单元1设定若干个不同形式的模板,提高可选性,提高匹配率;另外,每个模板中包括多个数据项,每个数据项中的数据分别通过字段和/或列表和/或自由列表的方式定义需要提取的数据,并通过自由列表的方式定义数据间的关系,通过字段的方式定义需要提取的数据具体为通过参照物以及正则表达式确定需要提取的数据的“点”位;通过列表的方式定义需要提取的数据具体为通过确定数据所在的行和列确定需要提取的数据的区域;通过自由列表的方式定义需要提取的数据具体为通过字段加列表的混合形式确定需要提取的数据的位置,通过自由列表的方式定义数据间的关具体为通过字段加列表的混合形式确定数据之间的相互关系。
S2:匹配模板,上传Excel数据文件,模板匹配单元2将上传的Excel数据文件依次与各模板进行匹配,选择有效数值匹配最多的模板;
S31:数据解析,通过数据提取单元3抓取Excel数据文件中与所选模板匹配的数据;
S32:数据结构化处理单元4分别对抓取的数据进行结构化处理,以期使各数据文件生成可结构化存储的中间文件,在本发明此实施方式中数据结构化处理单元4转成可扩展标记语言(XML)文件;
S33:按照业务要求,预先在数据内容规则模块5中设置存储若干所需的标准模型,同时为对应的标准模型设置对应的类型库51,比如,在本发明此实施方式中,在数据内容规则模块5中设置存储箱单、***、合同、运单等标准模型,并为对应的标准模型设置对用的类型库51,然后按照预先设定的标准模型对结构化处理后的中间文件进行清洗、分类,将不与任何标准模型匹配的数据文件剔除,并将与标准模型匹配的数据文件存储至对应的类型库51中,因此,属于箱单的类型库51中包含符合箱单标准模型的所有格式的数据文件,即Excel、PDF等所有格式的符合箱单标准模型的数据均被融合存储至属于箱单的类型库51,属于***的类型库51中包含符合***标准模型的所有格式的数据文件,即Excel、PDF等所有格式的符合***标准模型的数据均被融合存储至属于***的类型库51,等等;
S34:按照标准结构,按照业务要求,预先在数据存储规则单元6中设置存储最终所需输出数据文件的标准结构,并从各类型库51中抓取并输出与数据存储规则单元6设定的标准结构数据;
S4:数据吐出:数据输出单元7按照数据存储规则单元6中设置存储的最终所需输出数据文件的标准结构从各类型库51中抓取相同属性的数据文件整理融合后输出,比如,预先在数据存储规则单元6中设置的标准结构为具备A属性的货品的箱单、运单及合同,则数据输出单元7分别从箱单、运单及合同的类型库51中抓取具备A属性的数据文件,并按照标准结构输出,从而实现了多格式混合数据的分类再拼接。
本具体实施方式的实施例均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。

Claims (8)

1.基于Excel格式的数据提取***,其特征在于,包括:
模板生成单元(1),以定义需要提取的数据,以及数据间的关系,生成多个模板;所述模板生成单元(1)包括:
字段定义单元(11),定义参照物,并结合正则表达式以定义需要提取的数据的“点”位;
列表定义单元(12),定义需要提取的数据的区域;
自用列表定义单元(13),结合定义参照物,以及定义需要提取的数据的区域以确定所述提取的数据的位置;并且通过字段加列表的混合形式确定数据之间的相互关系;
模板匹配单元(2),用于将Excel数据文件与模板生成单元(1)生成的各模板进行匹配,以期确定匹配值最高的模板;
数据提取单元(3),与所述模板匹配单元(2)连接,采用具有最高匹配值的模板从Excel数据文件中提取对应的有效数据。
2.根据权利要求1所述的基于Excel格式的数据提取***,其特征在于,还包括:
数据结构化处理单元(4),分别对数据提取单元(3)提取的有效数据进行结构化处理,以期使各数据生成可结构化存储的中间文件;
数据内容规则模块(5),预先设定有多种类型标准模型,并分配有对应的类型库(51),按照类型标准模型对数据结构化处理单元(4)生成的各中间文件进行分类别存储。
3.根据权利要求2所述的基于Excel格式的数据提取***,其特征在于,还包括:
数据存储规则单元(6),预先设定有最终所需输出数据文件的标准结构;
数据输出单元(7),分别与所述数据内容规则模块(5)及所述数据存储规则单元(6)连接,以输出与数据存储规则单元(6)设定的标准结构数据。
4.基于Excel格式的数据提取方法,其特征在于,包括以下步骤:
S1:模板制作,通过模板定义需要提取的数据,以及数据间的关系,其中,包括若干个不同形式的模板,每个模板中包括多个数据项,每个数据项中的数据分别通过字段和/或列表和/或自由列表的方式定义需要提取的数据,并通过自由列表的方式定义数据间的关系;
S2:匹配模板,上传Excel数据文件,将Excel数据文件依次与各模板进行匹配,选择有效数值匹配最多的模板;
S3:数据解析,抓取Excel数据文件中与所选模板匹配的数据,并将数据转化成中间文件;
S4:数据吐出:将抓取的数据中需要的字段进行清洗、分类、整理融合成一份特定格式的数据,然后输出融合后的数据。
5.根据权利要求4所述的基于Excel格式的数据提取方法,其特征在于,通过字段的方式定义需要提取的数据具体为通过参照物以及正则表达式确定需要提取的数据的“点”位。
6.根据权利要求4所述的基于Excel格式的数据提取方法,其特征在于,通过列表的方式定义需要提取的数据具体为通过确定数据所在的行和列确定需要提取的数据的区域。
7.根据权利要求4所述的基于Excel格式的数据提取方法,其特征在于,通过自由列表的方式定义需要提取的数据具体为通过字段加列表的混合形式确定需要提取的数据的位置,通过自由列表的方式定义数据间的关具体为通过字段加列表的混合形式确定数据之间的相互关系。
8.根据权利要求4所述的基于Excel格式的数据提取方法,其特征在于,S3包括:
S31:抓取Excel数据文件中与所选模板匹配的数据;
S32:分别对抓取的数据进行结构化处理,以期使各数据生成可结构化存储的中间文件;
S33:按照预先设定有标准模型,对结构化处理后的中间文件进行清洗、分类,存储至对应的类型库(51)中;
S34:按照标准结构,从各类型库(51)中抓取并输出与数据存储规则单元(6)设定的标准结构数据。
CN201911317938.5A 2019-12-19 2019-12-19 基于Excel格式的数据提取***及配置方法 Active CN111125221B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911317938.5A CN111125221B (zh) 2019-12-19 2019-12-19 基于Excel格式的数据提取***及配置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911317938.5A CN111125221B (zh) 2019-12-19 2019-12-19 基于Excel格式的数据提取***及配置方法

Publications (2)

Publication Number Publication Date
CN111125221A CN111125221A (zh) 2020-05-08
CN111125221B true CN111125221B (zh) 2023-05-05

Family

ID=70500111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911317938.5A Active CN111125221B (zh) 2019-12-19 2019-12-19 基于Excel格式的数据提取***及配置方法

Country Status (1)

Country Link
CN (1) CN111125221B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111597261A (zh) * 2020-05-12 2020-08-28 广东巴金斯科技有限公司 一种数据申报制单***、方法和存储介质
CN111813849A (zh) * 2020-09-14 2020-10-23 杭州数梦工场科技有限公司 数据抽取方法、装置及设备、存储介质
CN113094345A (zh) * 2021-04-15 2021-07-09 浪潮通用软件有限公司 一种表格数据文件的导入方法及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120547A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム
CN106055585A (zh) * 2016-05-20 2016-10-26 北京神州绿盟信息安全科技股份有限公司 一种日志解析方法及装置
CN110399420A (zh) * 2019-07-30 2019-11-01 广州吉信网络科技开发有限公司 一种可配置化Excel格式的导出方法、电子设备和介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019155384A1 (en) * 2018-02-06 2019-08-15 Thomson Reuters Global Resources Unlimited Company Systems and method for generating a structured report from unstructured data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013120547A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム
CN106055585A (zh) * 2016-05-20 2016-10-26 北京神州绿盟信息安全科技股份有限公司 一种日志解析方法及装置
CN110399420A (zh) * 2019-07-30 2019-11-01 广州吉信网络科技开发有限公司 一种可配置化Excel格式的导出方法、电子设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
郝舒欣 ; 吕然 ; 刘婕 ; 刘悦 ; 徐东群 ; .空气污染对人群就诊影响时间序列分析的数据前处理方法.环境与健康杂志.2017,(05),全文. *
高宁 ; 庞立会 ; .一种可扩展的格式化文件内容检查方法.计算机工程与科学.2012,(06),全文. *

Also Published As

Publication number Publication date
CN111125221A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111125221B (zh) 基于Excel格式的数据提取***及配置方法
US8312041B2 (en) Resource description framework network construction device and method using an ontology schema having class dictionary and mining rule
CN110532309B (zh) 一种高校图书馆用户画像***的生成方法
CN103250149A (zh) 用于从数学语句提取语义距离并且按照语义距离对数学语句分类的方法、用于该方法的装置和计算机可读记录介质
CN105335348A (zh) 基于目标语句的依存句法分析方法、装置及服务器
CN112434691A (zh) 基于智能解析识别的hs编码匹配、展示方法、***及存储介质
CN109684957A (zh) 一种自动按照纸质表单展现***数据的方法及***
US11720597B2 (en) Generating an OLAP model from a spreadsheet
CN111191429A (zh) 数据表格自动填充的***和方法
CN104951630A (zh) Pds三维数据转换为pipestress建模代码的***及方法
KR20180080408A (ko) 정형 및 비정형 데이터 추출 시스템 및 방법
JP2015069256A (ja) 文字識別システム
CN115309864A (zh) 评论文本的情感智能分类方法、装置、电子设备及介质
Cao et al. GMN: generative multi-modal network for practical document information extraction
CN111190880A (zh) 一种数据库检测方法、装置和计算机可读存储介质
KR101684579B1 (ko) 지식 생성 시스템 및 방법
CN117420998A (zh) 一种客户端ui交互组件生成方法、装置、终端及介质
CN107562949A (zh) 实现合并报表Excel模板写入数据库的方法
US20180067916A1 (en) Analysis apparatus, analysis method, and recording medium
CN105573972A (zh) 报表校验公式的生成方法及装置
CN117112902A (zh) 一种基于多模态对比学习的离线强化学习商品推荐***
US20230023636A1 (en) Methods and systems for preparing unstructured data for statistical analysis using electronic characters
CN113642291B (zh) 上市公司报告的逻辑结构树构建方法、***、存储介质及终端
CN101334793A (zh) 一种自动识别需求依赖关系的方法
JP2019185140A (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant