CN116756395A - 一种用于城建档案的电子化归档方法及*** - Google Patents

一种用于城建档案的电子化归档方法及*** Download PDF

Info

Publication number
CN116756395A
CN116756395A CN202310538661.9A CN202310538661A CN116756395A CN 116756395 A CN116756395 A CN 116756395A CN 202310538661 A CN202310538661 A CN 202310538661A CN 116756395 A CN116756395 A CN 116756395A
Authority
CN
China
Prior art keywords
electronic
document
classifying
urban construction
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202310538661.9A
Other languages
English (en)
Inventor
严福
叶润生
张勇
严怀玉
徐彦洁
董道娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202310538661.9A priority Critical patent/CN116756395A/zh
Publication of CN116756395A publication Critical patent/CN116756395A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出了一种用于城建档案的电子化归档方法及***,涉及计算机领域。该方法包括:采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件;将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性;对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引;将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。通过数字文档在***中轻松存储和访问。

Description

一种用于城建档案的电子化归档方法及***
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种用于城建档案的电子化归档方法及***。
背景技术
城建档案是城市规划、建设和管理过程中的真实历史记录,是城市建设发展的载体,是城市宝贵的信息资源和社会财富,为城市建设、规划和管理提供重要的参考作用。城建档案记录了城市建设的各个方面,包括房屋建筑、市政道路、地下管网、城市园林绿化及其他基础设施。项目类型的多样化对管理人员或审核人员有较高的知识储备要求,对档案的管理造成了困难,以至于档案的建档、归档和审核等环节不仅工作量较大,而且有很大的复杂性,提高了城建档案的管理难度。现有技术采用对大批量不同项目类型的城建档案进行统一建档、统一审核以及统一归档的管理方式,审核结果容易出错,占用较多的计算资源,且管理效率低下。
发明内容
本申请的目的在于提供一种用于城建档案的电子化归档方法,其能够更加高效和节省空间,因为数字文档不仅可以在任何能够访问互联网的设备上轻松存储和访问,而且能够在内网安全存储和查阅。
本申请的另一目的在于提供一种用于城建档案的电子化归档***,其能够运行一种用于城建档案的电子化归档方法。
本申请的实施例是这样实现的:
第一方面,本申请实施例提供一种用于城建档案的电子化归档方法,其包括采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件;将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性;对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引;将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。
在本申请的一些实施例中,上述采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件包括:通过OCR技术采集原始城建档案文件信息,然后根据原始城建档案文件的类型和内容将文档组织成逻辑组进行归类区分。
在本申请的一些实施例中,上述将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性包括:通过OCR技术将扫描后的原始城建档案文件转换为电子格式的可编辑电子副本,然后使用自动文档分类算法对电子副本进行分类,将电子副本按类型和内容自动分配到不同的类中。
在本申请的一些实施例中,上述对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引包括:通过机器学习或自然语言处理技术,对电子副本的关键词、标签、主题和内容信息进行分类。
在本申请的一些实施例中,上述还包括:将电子副本按照内容和使用途径分类的过程,包括,按照类型和项目进行分类,分类通过手动输入数据、使用预定义的标准分类***、机器学习算法方式实现。
在本申请的一些实施例中,上述将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容,包括:建立权限和访问控制机制,以确保文档的安全性和完整性,包括建立授权机制、加密机制、审计机制和备份机制。授权机制确保只有经过授权的用户才能访问和操作文档,加密机制保护文档在传输和存储过程中的安全,审计机制记录文档的访问和操作记录,以便追踪和查找文档的历史记录,备份机制确保文档在***故障或灾难恢复时的可靠性。
在本申请的一些实施例中,上述还包括:通过搜索引擎根据查询关键字从索引中查找相关的文档,通过元数据提供文档的标题信息、日期信息、关键词信息、类别信息。
第二方面,本申请实施例提供一种用于城建档案的电子化归档***,其包括文档采集模块,用于采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件;
转换模块,用于将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性;
分类索引模块,用于对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引;
存储搜索模块,用于将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。
第三方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如一种用于城建档案的电子化归档方法中任一项的方法。
相对于现有技术,本申请的实施例至少具有如下优点或有益效果:
通过文档的分类和组织,可以实现对城市建设档案的有效管理和快速查找。建立相应的元数据和索引,可以快速地定位和访问需要的文档,避免了传统纸质档案繁琐的查找过程。通过电子化归档和文档存储的机制,可以实现文档的长期保存和备份,避免了纸质档案易受损坏和丢失的问题。同时,文档的权限控制、加密和审计机制,保证了文档的安全性和完整性,避免了档案信息泄露和篡改的风险。通过文档的检索和使用,可以提高城市建设档案的利用价值和效率。采用搜索引擎和元数据等技术,可以快速、准确地查找需要的文档,提高了档案利用效率。同时,采用文档共享和协作的方式,可以促进不同部门和个人之间的信息交流和共享,避免了传统纸质档案不易协作和共享的问题。综上所述,可以实现城市建设档案的电子化归档,提高了档案管理效率和准确性,促进了城市建设档案的利用和共享,为城市建设和管理提供了可靠的信息支持
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种用于城建档案的电子化归档方法步骤示意图;
图2为本申请实施例提供的一种用于城建档案的电子化归档***模块示意图;
图3为本申请实施例提供的一种电子设备。
图标:101-存储器;102-处理器;103-通信接口。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
实施例1
请参阅图1,图1为本申请实施例提供的一种用于城建档案的电子化归档方法步骤示意图,其如下所示:
步骤S100,采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件。
在一些实施方式中,通过OCR技术采集原始城建档案文件信息,然后根据原始城建档案文件的类型和内容将文档组织成逻辑组进行归类区分。
在一些实施方式中,针对城市建设项目涉及的各类文档,例如项目设计图纸、招标文件、合同、报告等,可以根据文档的类型进行分类。对于每一类文档,可以建立相应的文件夹,将同类型的文档组织在一起。其次,对于同一类文档中,可以根据文档的内容进行进一步的组织和分类。例如,对于项目设计图纸,可以根据图纸所涉及的部位和功能,将图纸进一步分类和组织。对于招标文件,可以根据招标公告、投标文件、评标文件等不同阶段的文档进行组织。然后,在对文档进行分类和组织的过程中,可以使用计算机的文件管理工具,自动化处理文档的复制、移动、重命名等操作。例如,可以使用批处理脚本和命令行工具,自动地将文档按照一定的规则复制或移动到相应的文件夹中,并自动为文档命名和打标签,以便后续的检索和使用。最后,在对文档进行分类和组织的过程中,需要注意文档的版本管理和变更记录。可以采用文档版本控制工具,如Git和SVN等,对文档的版本进行管理和追踪,以便保证文档的可追溯性和持续更新。通过计算机实现自动化处理,可以对城市建设项目中涉及的各类文档进行分类和组织,提高档案管理的效率和准确性。同时,注意文档的版本管理和变更记录,可以保证文档的可追溯性和持续更新。
步骤S110,将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性。
在一些实施方式中,通过OCR技术将扫描后的原始城建档案文件转换为电子格式的可编辑电子副本,然后使用自动文档分类算法对电子副本进行分类,将电子副本按类型和内容自动分配到不同的类中。
在一些实施方式中,针对城市建设项目设计图纸的纸质版,需要进行扫描。可以使用专业的扫描设备,将图纸进行高精度扫描,以保证扫描图像的质量和清晰度。同时,可以采用批量扫描的方式,一次性扫描多张图纸,提高扫描效率。在图纸扫描完成后,需要进行OCR文字识别。可以使用OCR软件对图纸中的文字进行识别,并将识别结果保存为可编辑文本。在进行OCR识别时,需要对识别的字体和字号进行设置,以保证识别结果的准确性和一致性。然后将OCR识别结果和图纸扫描图像进行关联,可以使用数据库或文档管理***,将OCR识别结果与图纸扫描图像进行关联,以便后续的检索和使用。在进行关联时,需要注意识别结果的格式和可读性,以便后续的文本处理和数据分析。最后,在对图纸进行OCR识别的过程中,需要注意保密和版权。针对一些涉密或版权保护的图纸,需要采用安全措施进行处理和存储,以保证图纸的安全性和合法性。通过OCR技术的自动化处理,可以对城市建设项目设计图纸进行扫描和识别,提高档案管理的效率和准确性。
步骤S120,对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引。
在一些实施方式中,通过机器学习或自然语言处理技术,对电子副本的关键词、标签、主题和内容信息进行分类。将电子副本按照内容和使用途径分类的过程,包括,按照类型和项目进行分类,分类通过手动输入数据、使用预定义的标准分类***、机器学习算法方式实现。
在一些实施方式中,针对城市建设项目规划设计方案的电子文档,需要进行自动分类。可以使用基于机器学习或深度学习的文本分类算法,对文档的内容进行分析和分类。以城市规划设计方案为例,可以将文档分为城市总体规划、区域规划、城市设计等几个类别。在进行文本分类时,需要准备好足够数量的文本样本,并对算法进行训练和优化,以提高分类准确率和泛化能力。对于已经分类好的文档,需要进行标签化处理。可以使用自然语言处理技术,对文档中的关键词和短语进行识别和抽取,生成文档的标签。以城市总体规划为例,可以将文档中的“城市总体规划”、“城市功能布局”、“道路交通规划”等关键词作为文档的标签。在进行标签化时,需要注意选择合适的关键词和短语,并对文档进行深度分析和抽象,以确保标签的准确性和覆盖率。然后将分类和标签化后的文档进行存储和管理。可以使用文档管理***或数据库,将文档和对应的分类、标签信息进行关联和存储。在进行存储和管理时,需要注意文档的版本控制和权限管理,以确保文档的安全性和可访问性。在进行分类和标签化的过程中,需要不断进行优化和改进。可以根据实际应用场景和用户反馈,对算法和模型进行调整和改进,以提高分类准确率和标签化效果。通过文本分类和标签化技术的自动化处理,可以对城市建设项目规划设计方案进行自动化分类和标签化,提高档案管理的效率和准确性。同时,需要不断进行优化和改进,以适应不同的应用场景和需求。
步骤S130,将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。
在一些实施方式中,建立权限和访问控制机制,以确保文档的安全性和完整性,包括建立授权机制、加密机制、审计机制和备份机制。授权机制确保只有经过授权的用户才能访问和操作文档,加密机制保护文档在传输和存储过程中的安全,审计机制记录文档的访问和操作记录,以便追踪和查找文档的历史记录,备份机制确保文档在***故障或灾难恢复时的可靠性。通过搜索引擎根据查询关键字从索引中查找相关的文档,通过元数据提供文档的标题信息、日期信息、关键词信息、类别信息。
在一些实施方式中,在对城市建设项目规划设计方案的文档进行全文检索时,可以使用全文检索引擎(如Elasticsearch、Solr等)对文档进行索引。通过索引建立倒排索引表,以加速检索速度。对于新上传的文档,需要对其进行索引,并将索引结果与文档关联存储。在进行全文检索时,用户可以输入关键词进行检索,检索结果将按照相关性排序。在进行关键词检索时,可以根据用户需求预先设定关键词,对文档进行关键词标注。例如,对于城市规划设计方案的文档,可以将其标注为“城市总体规划”、“区域规划”、“城市设计”等关键词。用户可以根据设定的关键词进行检索,检索结果将按照相关性排序。对于已经进行全文检索和关键词检索的文档,可以通过界面友好的检索界面进行检索。检索结果将按照相关性和其他设定条件进行排序和过滤。例如,可以设置检索结果按照时间、文档类型、文档大小等条件进行排序和过滤,以满足不同的用户需求。在进行检索过程中,需要不断进行优化和改进。可以根据实际应用场景和用户反馈,对检索算法和界面进行调整和改进,以提高检索效率和准确性。通过全文检索和关键词检索技术的应用,可以对城市建设项目规划设计方案的文档进行快速检索和定位,提高档案管理的效率和准确性。同时,需要不断进行优化和改进,以适应不同的应用场景和需求。
实施例2
请参阅图2,图2为本申请实施例提供的一种用于城建档案的电子化归档***模块示意图,其如下所示:
文档采集模块,用于采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件;
转换模块,用于将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性;
分类索引模块,用于对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引;
存储搜索模块,用于将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。
如图3所示,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及***,也可以通过其它的方式实现。以上所描述的方法及***实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
另一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
综上所述,本申请实施例提供的一种用于城建档案的电子化归档方法及***,通过文档的分类和组织,可以实现对城市建设档案的有效管理和快速查找。建立相应的元数据和索引,可以快速地定位和访问需要的文档,避免了传统纸质档案繁琐的查找过程。通过电子化归档和文档存储的机制,可以实现文档的长期保存和备份,避免了纸质档案易受损坏和丢失的问题。同时,文档的权限控制、加密和审计机制,保证了文档的安全性和完整性,避免了档案信息泄露和篡改的风险。通过文档的检索和使用,可以提高城市建设档案的利用价值和效率。采用搜索引擎和元数据等技术,可以快速、准确地查找需要的文档,提高了档案利用效率。同时,采用文档共享和协作的方式,可以促进不同部门和个人之间的信息交流和共享,避免了传统纸质档案不易协作和共享的问题。综上所述,可以实现城市建设档案的电子化归档,提高了档案管理效率和准确性,促进了城市建设档案的利用和共享,为城市建设和管理提供了可靠的信息支持
以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (9)

1.一种用于城建档案的电子化归档方法,其特征在于,包括:
采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件;
将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性;
对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引;
将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。
2.如权利要求1所述的一种用于城建档案的电子化归档方法,其特征在于,所述采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件包括:
通过OCR技术采集原始城建档案文件信息,然后根据原始城建档案文件的类型和内容将文档组织成逻辑组进行归类区分。
3.如权利要求1所述的一种用于城建档案的电子化归档方法,其特征在于,所述将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性包括:
通过OCR技术将扫描后的原始城建档案文件转换为电子格式的可编辑电子副本,然后使用自动文档分类算法对电子副本进行分类,将电子副本按类型和内容自动分配到不同的类中。
4.如权利要求1所述的一种用于城建档案的电子化归档方法,其特征在于,所述对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引包括:
通过机器学习或自然语言处理技术,对电子副本的关键词、标签、主题和内容信息进行分类。
5.如权利要求4所述的一种用于城建档案的电子化归档方法,其特征在于,还包括:
将电子副本按照内容和使用途径分类的过程,包括,按照类型和项目进行分类,分类通过手动输入数据、使用预定义的标准分类***、机器学习算法方式实现。
6.如权利要求1所述的一种用于城建档案的电子化归档方法,其特征在于,所述将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容包括:
建立权限和访问控制机制,以确保文档的安全性和完整性,包括建立授权机制、加密机制、审计机制和备份机制,授权机制确保只有经过授权的用户才能访问和操作文档,加密机制保护文档在传输和存储过程中的安全,审计机制记录文档的访问和操作记录,以便追踪和查找文档的历史记录,备份机制确保文档在***故障或灾难恢复时的可靠性。
7.如权利要求6所述的一种用于城建档案的电子化归档方法,其特征在于,还包括:
通过搜索引擎根据查询关键字从索引中查找相关的文档,通过元数据提供文档的标题信息、日期信息、关键词信息、类别信息。
8.一种用于城建档案的电子化归档***,其特征在于,包括:
文档采集模块,用于采集整理原始城建档案文件,采集过程包括审查文件的完整性和准确性,以及识别任何重复或丢失的文件;
转换模块,用于将文档转换为电子格式,即,将原始城建档案文件数字化以创建电子副本,电子副本格式化为标准文件格式以确保跨不同平台和设备的兼容性;
分类索引模块,用于对电子副本进行分类和索引,即,电子副本根据类别和子类别进行分类和索引,通过对电子副本分配数据标签进行分类和索引;
存储搜索模块,用于将电子副本存储在基于云存储***中,后续通过智能搜索引擎根据关键字或搜索参数进行检索,检索内容包括电子副本对应的原始城建档案文件内容。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
CN202310538661.9A 2023-05-12 2023-05-12 一种用于城建档案的电子化归档方法及*** Withdrawn CN116756395A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310538661.9A CN116756395A (zh) 2023-05-12 2023-05-12 一种用于城建档案的电子化归档方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310538661.9A CN116756395A (zh) 2023-05-12 2023-05-12 一种用于城建档案的电子化归档方法及***

Publications (1)

Publication Number Publication Date
CN116756395A true CN116756395A (zh) 2023-09-15

Family

ID=87954151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310538661.9A Withdrawn CN116756395A (zh) 2023-05-12 2023-05-12 一种用于城建档案的电子化归档方法及***

Country Status (1)

Country Link
CN (1) CN116756395A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117112872A (zh) * 2023-10-20 2023-11-24 浪潮软件股份有限公司 一种基于半监督学习的政务文本归档方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117112872A (zh) * 2023-10-20 2023-11-24 浪潮软件股份有限公司 一种基于半监督学习的政务文本归档方法及***

Similar Documents

Publication Publication Date Title
US7797336B2 (en) System, method, and computer program product for knowledge management
CN102741803B (zh) 用于促进数据发现的***和方法
US8973128B2 (en) Search result presentation
US20130018805A1 (en) Method and system for linking information regarding intellectual property, items of trade, and technical, legal or interpretive analysis
US20060206462A1 (en) Method and system for document manipulation, analysis and tracking
US20040103102A1 (en) System and method for automatically linking items with multiple attributes to multiple levels of folders within a content management system
EP3270303A1 (en) An automated monitoring and archiving system and method
US20210216578A1 (en) Interactive patent visualization systems and methods
CN112015962A (zh) 一种政务智能大数据中心体系架构
CN112182148B (zh) 一种基于全文检索的标准辅助编写方法
CN103026334A (zh) 数据分类
CN112836018A (zh) 应急预案的处理方法及装置
CN116756395A (zh) 一种用于城建档案的电子化归档方法及***
CN111914282A (zh) 一种文件管理分析方法和***
JP5764080B2 (ja) Web検索システムおよびWeb検索方法
CN115168401A (zh) 数据分级处理方法及装置、电子设备及计算机可读介质
CN101763424B (zh) 根据文件内容确定特征词并用于检索的方法
US8145647B2 (en) System, method and computer program product for electronically responding to requests for product related data
CN115982429B (zh) 一种基于流程控制的知识管理方法及***
CN112800100A (zh) 一种数据资产标签管理***及方法
Pham et al. Legal terminology extraction with the termolator
Asfoor Applying Data Science Techniques to Improve Information Discovery in Oil And Gas Unstructured Data
US20020178140A1 (en) Method for characterizing and storing data analyses in an analysis database
Demidova et al. Creating open citation data with BCite
CN111324711B (zh) 一种帖子时效性判别方法、装置、及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20230915