CN112861490B - 基于openpyxl的工程量清单目录比对***及方法 - Google Patents
基于openpyxl的工程量清单目录比对***及方法 Download PDFInfo
- Publication number
- CN112861490B CN112861490B CN202110270362.2A CN202110270362A CN112861490B CN 112861490 B CN112861490 B CN 112861490B CN 202110270362 A CN202110270362 A CN 202110270362A CN 112861490 B CN112861490 B CN 112861490B
- Authority
- CN
- China
- Prior art keywords
- keyword
- file
- excel file
- folder
- excel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 42
- 230000006835 compression Effects 0.000 claims description 18
- 238000007906 compression Methods 0.000 claims description 18
- 230000006837 decompression Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 10
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及技术语言文档处理技术领域,具体为一种基于openpyxl的工程量清单目录比对***及方法。一种基于openpyxl的工程量清单目录比对***,包括excel文件获取模块,用于上传同一批次的目录数据并获取具有sheet表名称为工程量清单的excel文件;总表文档创建模块,用于创建总表文档;excel文件处理模块,用于获取excel文件的关键词信息;关键词信息记录模块,用于将所述excel文件的关键词信息记录在所述总表文档中;总表文档导出模块,用于导出所述总表文档。本发明***及方法能够通过总表文档将关键词信息汇总到一起以方便用户查看,有效提高了物资项目管理领域下工程量清单目录的处理效果和处理效率,减轻了物资项目管理人员的工作复杂度。
Description
技术领域
本发明涉及技术语言文档处理技术领域,具体为一种基于openpyxl的工程量清单目录比对***及方法。
背景技术
技术语言文档处理技术主要是针对庞杂的表格及文本信息按照特殊的逻辑关系标识出有用的技术词语。随着海量表格及文本数据的增加,如何从海量文本信息中迅速捕获到适用于自身的信息,进而对这些信息进行合理的应用和管理是当前急需解决的问题。
目前,物资项目管理领域下,表格及文档大都直接人为处理,例如,工程量清单,导致在工程量清单的整理过程中,工作效率较低且容易出现错漏,进而使工程量清单的处理效率及处理效果都不太理想。
发明内容
本发明针对现有技术存在的问题,提出了一种基于openpyxl的工程量清单目录比对***及方法,能够将工程量清单目录上的关键信息快速有效地汇总到总表文档上,有效减轻了物资项目管理人员的工作复杂度。
本发明解决其技术问题所采用的技术方案是:一种基于openpyxl的工程量清单目录比对***,包括
excel文件获取模块,用于上传同一批次的目录数据并获取具有sheet表名称为工程量清单的excel文件;
总表文档创建模块,用于创建总表文档;
excel文件处理模块,用于获取excel文件的关键词信息;
关键词信息记录模块,用于将所述excel文件的关键词信息记录在所述总表文档中;
总表文档导出模块,用于导出所述总表文档。
本发明***能够通过excel文件获取模块对目录文档进行分类以及对sheet表名称进行读取以得到sheet表名称为工程量清单的excel文件,并能够通过excel文件处理模块读取名称为工程量清单的sheet表中的内容并将读取的内容与数据库中一二级采购目录进行关键词匹配以得到工程量清单的关键词信息,还能够通过总表文档将关键词信息汇总到一起以方便用户查看,有效提高了物资项目管理领域下工程量清单目录的处理效果和处理效率,减轻了物资项目管理人员的工作复杂度。
作为优选,所述excel文件获取模块包括
总文件夹建立单元,用于建立存放所述目录数据的批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;
压缩包解压单元,用于在所述批次文件总文件夹中将所述压缩包解压为文件夹;
次文件夹建立单元,用于建立存放所述批次文件总文件夹以及所述文件夹中的word文件和excel文件的批次文件次文件夹;
文档分类单元,用于通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件;
excel文件确定单元,用于通过openpyxl功能模块读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
作为优选,所述excel文件处理模块用于将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息;所述关键词信息包括关键词本体、关键词类型、关键词行列坐标信息、关键词所在sheet表的页数以及关键词所在excel文件的名称。
作为优选,所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。
作为优选,所述关键词信息记录模块包括
第一记录单元,用于将所述关键词信息的关键词本体记录在所述总表文档中;
第二记录单元,用于将所述关键词本体所对应的类型记录在所述总表文档中;
第三记录单元,用于将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中;
第四记录单元,用于将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中;
第五记录单元,用于将所述关键词本体所对应的excel文件的名称记录在所述总表文档中。
一种基于openpyxl的工程量清单目录比对方法,包括以下步骤
L1上传同一批次的目录数据,并获取具有sheet表名称为工程量清单的excel文件;
L2创建总表文档;
L3通过excel文件处理模块获取excel文件的关键词信息,并通过关键词信息记录模块将所述excel文件的关键词信息记录在所述总表文档中;
L4导出所述总表文档。
本发明方法能够对目录文档进行分类以及对sheet表名称进行读取以得到sheet表名称为工程量清单的excel文件,并能够通过excel文件处理模块读取名称为工程量清单的sheet表中的内容并将读取的内容与数据库中一二级采购目录进行关键词匹配以得到工程量清单的关键词信息,还能够通过总表文档将关键词信息汇总到一起以方便用户查看,有效提高了物资项目管理领域下工程量清单目录的处理效果和处理效率,减轻了物资项目管理人员的工作复杂度。
作为优选,所述L1具体包括
L11建立批次文件总文件夹,并将目录数据上传至所述批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;
L12在所述批次文件总文件夹中将所述压缩包解压为文件夹;
L13在所述批次文件总文件夹中建立批次文件次文件夹,将所述批次文件总文件夹以及所述文件夹中的word文件和excel文件移动至所述批次文件次文件夹以形成待处理文档;
L14通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件;
L15通过openpyxl功能模块读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
作为优选,所述L3具体包括
L31通过excel文件处理模块将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息;
L32通过关键词信息记录模块将所述excel文件的关键词信息记录在所述总表文档中。
作为优选,所述L31中,所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。
作为优选,所述L32具体包括
L321将所述关键词信息的关键词本体记录在所述总表文档中;
L322将所述关键词本体所对应的类型记录在所述总表文档中;
L323将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中;
L324将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中;
L325将所述关键词本体所对应的excel文件的名称记录在所述总表文档中。
有益效果
本发明***及方法能够通过Openpyxl功能模块对目录文档进行分类以及对sheet表名称进行读取以得到sheet表名称为工程量清单的excel文件,并能够通过excel文件处理模块读取名称为工程量清单的sheet表中的内容并将读取的内容与数据库中一二级采购目录进行关键词匹配以得到工程量清单的关键词信息,还能够通过总表文档将关键词信息汇总到一起以方便用户查看,有效提高了物资项目管理领域下工程量清单目录的处理效果和处理效率,减轻了物资项目管理人员的工作复杂度。
附图说明
图1为本发明目录数据的组成图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
一种基于openpyxl的工程量清单目录比对***,包括excel文件获取模块,总表文档创建模块,excel文件处理模块,关键词信息记录模块和总表文档导出模块。
excel文件获取模块用于上传同一批次的目录数据并获取具有sheet表名称为工程量清单的excel文件。所述excel文件获取模块包括总文件夹建立单元,压缩包解压单元,次文件夹建立单元,文档分类单元和excel文件确定单元。总文件夹建立单元用于建立存放所述目录数据的批次文件总文件夹,所述目录数据如图1所示,包括压缩包、文件夹、word文件和excel文件。压缩包解压单元用于在所述批次文件总文件夹中将所述压缩包解压为文件夹,首先获取压缩包的文件名称,通过压缩包的文件名称的后缀判断压缩包的文件格式,常见的压缩包的文件格式包括zip、tar、rar、7z等常用格式,对于不同格式的压缩包采用不同的解压方法。次文件夹建立单元用于建立存放所述批次文件总文件夹以及所述文件夹中的word文件和excel文件的批次文件次文件夹。文档分类单元用于通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件。Openpyxl功能模块是一个读写excel2010 文档的 Python 库,它是一款比较综合的工具,不仅能够同时读取和修改 excel 文件,而且可以对excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表***、打印设置等内容,使用 openpyxl 功能模块可以读写xltm, xltx, xlsm, xlsx 等类型的文件,且可以处理数据量较大的excel 文件。本发明***通过openpyxl功能模块能够判定待处理文档是否为excel文件,如果待处理文档不是excel文件,则该待处理文档必定是word文件。excel文件确定单元用于通过openpyxl功能模块的fileParse功能函数读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
总表文档创建模块用于创建总表文档。一个总表文档用于统计同一批次目录数据的工程量清单的关键信息。总表文档可以以报表-批次-批次文件总文件夹名称命名。
excel文件处理模块用于获取excel文件的关键词信息。所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。xlrd功能模块是读取excel的扩展工具,可以实现对指定表单、指定单元格的读取,使用时只需要确保已经安装python环境即可。所述excel文件处理模块用于将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息;所述关键词信息包括关键词本体、关键词类型、关键词行列坐标信息、关键词所在sheet表的页数以及关键词所在excel文件的名称。
关键词信息记录模块用于将所述excel文件的关键词信息记录在所述总表文档中。所述关键词信息记录模块包括用于将所述关键词信息的关键词本体记录在所述总表文档中的第一记录单元,用于将所述关键词本体所对应的类型记录在所述总表文档中的第二记录单元,用于将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中的第三记录单元,用于将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中的第四记录单元,用于将所述关键词本体所对应的excel文件的名称记录在所述总表文档中第五记录单元。
总表文档导出模块用于导出所述总表文档,便于用户后续查看。
本发明***能够通过Openpyxl功能模块对目录文档进行分类以及对sheet表名称进行读取以得到sheet表名称为工程量清单的excel文件,并能够通过excel文件处理模块读取名称为工程量清单的sheet表中的内容并将读取的内容与数据库中一二级采购目录进行关键词匹配以得到工程量清单的关键词信息,还能够通过总表文档将关键词信息汇总到一起以方便用户查看,有效提高了物资项目管理领域下工程量清单目录的处理效果和处理效率。
一种基于openpyxl的工程量清单目录比对方法,包括以下步骤,
L1上传同一批次的目录数据,并获取具有sheet表名称为工程量清单的excel文件。具体包括L11建立批次文件总文件夹,并将目录数据上传至所述批次文件总文件夹,所述目录数据如图1所示,包括压缩包、文件夹、word文件和excel文件。L12在所述批次文件总文件夹中将所述压缩包解压为文件夹,首先获取压缩包的文件名称,通过压缩包的文件名称的后缀判断压缩包的文件格式,常见的压缩包的文件格式包括zip、tar、rar、7z等常用格式,对于不同格式的压缩包采用不同的解压方法。L13在所述批次文件总文件夹中建立批次文件次文件夹,将所述批次文件总文件夹以及所述文件夹中的word文件和excel文件移动至所述批次文件次文件夹以形成待处理文档。L14通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件。Openpyxl功能模块是一个读写excel 2010 文档的Python 库,它是一款比较综合的工具,不仅能够同时读取和修改 excel 文件,而且可以对excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表***、打印设置等内容,使用 openpyxl 功能模块可以读写xltm, xltx, xlsm, xlsx 等类型的文件,且可以处理数据量较大的excel 文件。本发明***通过openpyxl功能模块能够判定待处理文档是否为excel文件,如果待处理文档不是excel文件,则该待处理文档必定是word文件。L15通过openpyxl功能模块的fileParse功能函数读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
L2创建总表文档。一个总表文档用于统计同一批次目录数据的工程量清单的关键信息。总表文档可以以报表-批次-批次文件总文件夹名称命名。
L3通过excel文件处理模块获取excel文件的关键词信息,并通过关键词信息记录模块将所述excel文件的关键词信息记录在所述总表文档中。具体包括L31通过excel文件处理模块将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息。所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。xlrd功能模块是读取excel的扩展工具,可以实现对指定表单、指定单元格的读取,使用时只需要确保已经安装python环境即可。
L32通过关键词信息记录模块将所述excel文件的关键词信息记录在所述总表文档中。以及包括L321将所述关键词信息的关键词本体记录在所述总表文档中。L322将所述关键词本体所对应的类型记录在所述总表文档中。L323将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中。L324将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中。L325将所述关键词本体所对应的excel文件的名称记录在所述总表文档中。
L4导出所述总表文档,便于用户后续查看。
本发明方法能够通过Openpyxl功能模块对目录文档进行分类以及对sheet表名称进行读取以得到sheet表名称为工程量清单的excel文件,并能够通过excel文件处理模块读取名称为工程量清单的sheet表中的内容并将读取的内容与数据库中一二级采购目录进行关键词匹配以得到工程量清单的关键词信息,还能够通过总表文档将关键词信息汇总到一起以方便用户查看,有效提高了物资项目管理领域下工程量清单目录的处理效果和处理效率。
上面所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的构思和范围进行限定。在不脱离本发明设计构思的前提下,本领域普通人员对本发明的技术方案做出的各种变型和改进,均应落入到本发明的保护范围,本发明请求保护的技术内容,已经全部记载在权利要求书中。
Claims (6)
1.基于openpyxl的工程量清单目录比对***,其特征在于:包括
excel文件获取模块,用于上传同一批次的目录数据并获取具有sheet表名称为工程量清单的excel文件;
总表文档创建模块,用于创建总表文档;
excel文件处理模块,用于获取excel文件的关键词信息;
关键词信息记录模块,用于将所述excel文件的关键词信息记录在所述总表文档中;
总表文档导出模块,用于导出所述总表文档;
所述excel文件处理模块用于将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息;所述关键词信息包括关键词本体、关键词类型、关键词行列坐标信息、关键词所在sheet表的页数以及关键词所在excel文件的名称;
所述关键词信息记录模块包括
第一记录单元,用于将所述关键词信息的关键词本体记录在所述总表文档中;
第二记录单元,用于将所述关键词本体所对应的类型记录在所述总表文档中;
第三记录单元,用于将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中;
第四记录单元,用于将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中;
第五记录单元,用于将所述关键词本体所对应的excel文件的名称记录在所述总表文档中。
2.根据权利要求1所述的基于openpyxl的工程量清单目录比对***,其特征在于:所述excel文件获取模块包括
总文件夹建立单元,用于建立存放所述目录数据的批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;
压缩包解压单元,用于在所述批次文件总文件夹中将所述压缩包解压为文件夹;
次文件夹建立单元,用于在所述批次文件总文件夹中建立批次文件次文件夹,将所述批次文件总文件夹以及所述文件夹中的word文件和excel文件移动至所述批次文件次文件夹以形成待处理文档;
文档分类单元,用于通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件;
excel文件确定单元,用于通过openpyxl功能模块读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
3.根据权利要求1所述的基于openpyxl的工程量清单目录比对***,其特征在于:所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。
4.基于openpyxl的工程量清单目录比对方法,其特征在于:包括以下步骤
L1上传同一批次的目录数据,并获取具有sheet表名称为工程量清单的excel文件;
L2创建总表文档;
L3通过excel文件处理模块获取excel文件的关键词信息,并通过关键词信息记录模块将所述excel文件的关键词信息记录在所述总表文档中;
L4导出所述总表文档;
所述L3具体包括
L31通过excel文件处理模块将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息;
L32通过关键词信息记录模块将所述excel文件的关键词信息记录在所述总表文档中;
所述L32具体包括
L321将所述关键词信息的关键词本体记录在所述总表文档中;
L322将所述关键词本体所对应的类型记录在所述总表文档中;
L323将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中;
L324将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中;
L325将所述关键词本体所对应的excel文件的名称记录在所述总表文档中。
5.根据权利要求4所述的基于openpyxl的工程量清单目录比对方法,其特征在于:所述L1具体包括
L11建立批次文件总文件夹,并将目录数据上传至所述批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;
L12在所述批次文件总文件夹中将所述压缩包解压为文件夹;
L13在所述批次文件总文件夹中建立批次文件次文件夹,将所述批次文件总文件夹以及所述文件夹中的word文件和excel文件移动至所述批次文件次文件夹以形成待处理文档;
L14通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件;
L15通过openpyxl功能模块读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
6.根据权利要求4所述的基于openpyxl的工程量清单目录比对方法,其特征在于:所述L31中,所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110270362.2A CN112861490B (zh) | 2021-03-12 | 2021-03-12 | 基于openpyxl的工程量清单目录比对***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110270362.2A CN112861490B (zh) | 2021-03-12 | 2021-03-12 | 基于openpyxl的工程量清单目录比对***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112861490A CN112861490A (zh) | 2021-05-28 |
CN112861490B true CN112861490B (zh) | 2024-02-20 |
Family
ID=75994321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110270362.2A Active CN112861490B (zh) | 2021-03-12 | 2021-03-12 | 基于openpyxl的工程量清单目录比对***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112861490B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000231560A (ja) * | 1999-02-10 | 2000-08-22 | Ricoh Co Ltd | 文書自動分類方式 |
KR20020067160A (ko) * | 2001-02-15 | 2002-08-22 | 전석진 | 문서 색인 시스템 및 그 방법 |
JP2007058804A (ja) * | 2005-08-26 | 2007-03-08 | Hitachi Ltd | コンテンツ配信システム、コンテンツ配信方法、およびコンテンツ配信プログラム |
KR20170016657A (ko) * | 2015-08-04 | 2017-02-14 | 서울시립대학교 산학협력단 | 목차를 이용한 문서 관리를 위한 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체 |
CN110889310A (zh) * | 2018-09-07 | 2020-03-17 | 上海怀若智能科技有限公司 | 金融文档信息智能提取***及方法 |
CN111796800A (zh) * | 2020-06-28 | 2020-10-20 | 上海建科造价咨询有限公司 | 一种基于Python的工程量清单准确性校验方法 |
-
2021
- 2021-03-12 CN CN202110270362.2A patent/CN112861490B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000231560A (ja) * | 1999-02-10 | 2000-08-22 | Ricoh Co Ltd | 文書自動分類方式 |
KR20020067160A (ko) * | 2001-02-15 | 2002-08-22 | 전석진 | 문서 색인 시스템 및 그 방법 |
JP2007058804A (ja) * | 2005-08-26 | 2007-03-08 | Hitachi Ltd | コンテンツ配信システム、コンテンツ配信方法、およびコンテンツ配信プログラム |
KR20170016657A (ko) * | 2015-08-04 | 2017-02-14 | 서울시립대학교 산학협력단 | 목차를 이용한 문서 관리를 위한 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체 |
CN110889310A (zh) * | 2018-09-07 | 2020-03-17 | 上海怀若智能科技有限公司 | 金融文档信息智能提取***及方法 |
CN111796800A (zh) * | 2020-06-28 | 2020-10-20 | 上海建科造价咨询有限公司 | 一种基于Python的工程量清单准确性校验方法 |
Non-Patent Citations (3)
Title |
---|
基于BIM 的建筑专业设计合规性自动审查***及其关键技;邢雪娇;土木工程与管理学报;129-136 * |
基于Python的Excel文档合并***的设计与实现;张孟研;;福建电脑(第06期);123-124 * |
基于Python的Excel文档处理程序的设计与实现;周延熙;;信息与电脑(理论版)(第23期);85-87 * |
Also Published As
Publication number | Publication date |
---|---|
CN112861490A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11036808B2 (en) | System and method for indexing electronic discovery data | |
US20190236102A1 (en) | System and method for differential document analysis and storage | |
CN110083805B (zh) | 一种将Word文件转换为EPUB文件的方法及*** | |
US8315997B1 (en) | Automatic identification of document versions | |
CN100361493C (zh) | 文档处理装置和文档处理方法 | |
US7372993B2 (en) | Gesture recognition | |
US9068920B2 (en) | System and method for scanning and processing printed media | |
CN111597150A (zh) | 一种自动化归档整理信息*** | |
CN112463726A (zh) | 一种移动财务票据的自动化归档方法 | |
CN104035993B (zh) | 电子书的存储检索方法、电子书管理***、阅读*** | |
CN109284273B (zh) | 一种采用后缀数组索引的海量小文件查询方法及*** | |
CN101408882B (zh) | 一种授权文档的检索方法和*** | |
Sankar et al. | Digitizing a million books: Challenges for document analysis | |
CN1588352A (zh) | 一种可扩展标记语言文档修改痕迹的记录方法 | |
CN112861490B (zh) | 基于openpyxl的工程量清单目录比对***及方法 | |
Boenig et al. | Labelling OCR Ground Truth for Usage in Repositories | |
CN102306175A (zh) | 一种个人知识管理方法及装置 | |
CN112861473B (zh) | 基于openpyxl的目录审查结果汇总***及方法 | |
US20090077127A1 (en) | Devices and methods enabling a user to manage a plurality of objects and in particular paper documents | |
TW420777B (en) | A query method of dynamitic attribute database management | |
CN114218347A (zh) | 多个文件内容的快速索引查找方法 | |
Estill | Shakespearean Extracts, Manuscript Cataloguing, and the Misrepresentation of the Archive | |
Holler | Toward a reference theory | |
CN113298914B (zh) | 知识组块提取方法、装置、电子设备和存储介质 | |
Veena et al. | A Personalized and Scalable Machine Learning-Based File Management System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |