CN113761033B - 基于档案数字化管理的信息整理方法及*** - Google Patents

基于档案数字化管理的信息整理方法及*** Download PDF

Info

Publication number
CN113761033B
CN113761033B CN202111065996.0A CN202111065996A CN113761033B CN 113761033 B CN113761033 B CN 113761033B CN 202111065996 A CN202111065996 A CN 202111065996A CN 113761033 B CN113761033 B CN 113761033B
Authority
CN
China
Prior art keywords
behavior data
archive
interaction behavior
interest
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111065996.0A
Other languages
English (en)
Other versions
CN113761033A (zh
Inventor
严莹
周奇
史燕峰
董秀伟
郭倩
鲁君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Chufeng Information Technology Co ltd
Original Assignee
Jiangsu Chufeng Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Chufeng Information Technology Co ltd filed Critical Jiangsu Chufeng Information Technology Co ltd
Priority to CN202111065996.0A priority Critical patent/CN113761033B/zh
Publication of CN113761033A publication Critical patent/CN113761033A/zh
Application granted granted Critical
Publication of CN113761033B publication Critical patent/CN113761033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种基于档案数字化管理的信息整理方法及***,依据当前档案优化需求对初始数字化档案数据进行筛选,获得与当前档案优化需求相关的目标数字化档案数据,对目标数字化档案数据相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据,对目标档案互动行为数据进行大数据挖掘,获得目标档案互动行为大数据的互动兴趣点分布,并基于互动兴趣点分布与当前档案优化需求进行关联配置。如此设计,相较于针对全量数字化档案数据相关的档案互动行为数据进行大数据挖掘,可以降低数据处理量和负载压力,并且提高互动兴趣点分布挖掘与当前档案优化需求之间的匹配性,进而进行后续的针对性业务优化,提高档案管理体验。

Description

基于档案数字化管理的信息整理方法及***
技术领域
本发明涉及数字化管理技术领域,具体而言,涉及一种基于档案数字化管理的信息整理方法及***。
背景技术
随着信息化不断发展,档案信息化、档案数字化概念也被引用到档案行业这一领域。建立专门的档案信息***来管理和利用档案迫在眉睫。在各行业对档案管理***推出了越来越高定位的同时,也面临这很多问题。例如,当前通常针对全量数字化档案数据相关的档案互动行为数据进行大数据挖掘,导致数据处理量和负载压力较大,并且也难以匹配当前档案优化需求,导致后续的针对性业务优化的参考依据存在噪声。
发明内容
为了至少克服现有技术中的上述不足,本发明的目的在于提供一种基于档案数字化管理的信息整理方法及***。
第一方面,本发明提供一种基于档案数字化管理的信息整理方法,应用于基于档案数字化管理的信息整理***,所述方法包括:
获取由各个档案数字化管理服务平台上传的初始数字化档案数据;
依据当前档案优化需求对所述初始数字化档案数据进行筛选,获得与所述当前档案优化需求相关的目标数字化档案数据;
对所述目标数字化档案数据相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据;
对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布,并基于所述互动兴趣点分布与所述当前档案优化需求进行关联配置。
第二方面,本发明实施例还提供一种基于档案数字化管理的信息整理***,所述基于档案数字化管理的信息整理***包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现前述的基于档案数字化管理的信息整理方法。
基于上述任意一个方面,获取由各个档案数字化管理服务平台上传的初始数字化档案数据,依据当前档案优化需求对初始数字化档案数据进行筛选,获得与当前档案优化需求相关的目标数字化档案数据,对目标数字化档案数据相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据,对目标档案互动行为数据进行大数据挖掘,获得目标档案互动行为大数据的互动兴趣点分布,并基于互动兴趣点分布与当前档案优化需求进行关联配置。如此设计,相较于针对全量数字化档案数据相关的档案互动行为数据进行大数据挖掘,可以降低数据处理量和负载压力,并且提高互动兴趣点分布挖掘与当前档案优化需求之间的匹配性,进而进行后续的针对性业务优化,提高档案管理体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要启用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以基于这些附图获得其它相关的附图。
图1为本发明实施例提供的基于档案数字化管理的信息整理方法的流程示意图;
图2为本发明实施例提供的用于实现上述的基于档案数字化管理的信息整理方法的基于档案数字化管理的信息整理***的结构示意框图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施和利用本发明,并且该描述是在特定的应用场景及其要求的环境下提供的。对于本领域的普通技术人员来讲,显然可以对所公开的实施例作出各种改变,并且在不偏离本发明的原则和范围的情况下,本发明中所定义的普遍原则可以适用于其它实施例和应用场景。因此,本发明并不限于所描述的实施例,而应该被给予与权利要求一致的最广泛的范围。
本发明中所使用的术语仅用于描述特定的示例性实施例,并不限制本发明的范围。如本发明使用的单数形式“一”、“一个”及“该”可以同样包括复数形式,除非上下文明确提示例外情形。还应当理解,如在本发明说明书中,术语“包括”、“包含”仅提示存在所述特征、整体、步骤、操作、组件和/或部件,但并不排除存在或添加一个或以上其它特征、整体、步骤、操作、组件、部件和/或其组合的情况。
根据以下对附图的描述,本发明的这些和其它的特征、特点以及相关结构元件的功能和操作方法,以及部件组合和制造经济性,可以变得更加显而易见,这些附图都构成本发明说明书的一部分。然而,应当理解的是,附图仅仅是为了说明和描述的目的,并不旨在限制本发明的范围。应当理解的是,附图并不是按比例绘制的。
本发明中使用了流程图用来说明根据本发明的一些实施例的***所执行的操作。应当理解的是,流程图中的操作可以不按顺序执行。相反,可以按照倒序或同时处理各种步骤。此外,可以向流程图添加一个或以上其它操作。也可以从流程图中删除一个或以上操作。
下面结合说明书附图对本发明进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或***实施例中。
图1是本发明一种实施例提供的基于档案数字化管理的信息整理方法的流程示意图,下面对该基于档案数字化管理的信息整理方法进行详细介绍。
步骤S110,获取由各个档案数字化管理服务平台上传的初始数字化档案数据。
本实施例中,对于每个档案数字化管理服务平台而言,依据其具体的业务类型通常会管理不同的数字化档案数据,因此其可以在获得数据授权许可的情况下上传对应的初始数字化档案数据。
步骤S120,依据当前档案优化需求对所述初始数字化档案数据进行筛选,获得与所述当前档案优化需求相关的目标数字化档案数据。
本实施例中,相关技术中通常是针对全局的初始数字化档案数据进行大数据挖掘,如此设计会增加数据处理量和负载压力,发明人研究发现通常只有在针对某个特定的档案优化需求(如某个档案项目的兴趣点整理需求)时才进行相关的大数据挖掘后进行关联配置,因此本实施例可以依据当前档案优化需求对所述初始数字化档案数据进行筛选,获得与所述当前档案优化需求相关的目标数字化档案数据,进而可以降低数据处理量和负载压力。
步骤S130,对所述目标数字化档案数据相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据。
本实施例中,在确定目标数字化档案数据后,即可针对性地针对其相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据,以便于后续挖掘。
步骤S140,对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布,并基于所述互动兴趣点分布与所述当前档案优化需求进行关联配置。
本实施例中,通过获得目标档案互动行为大数据的互动兴趣点分布,并基于所述互动兴趣点分布与前述的当前档案优化需求进行关联配置,从而可以为当前档案优化需求提供相关的兴趣点参考依据,进而进行后续的针对性业务优化,提高档案管理体验。
基于以上步骤,本实施例获取由各个档案数字化管理服务平台上传的初始数字化档案数据,依据当前档案优化需求对初始数字化档案数据进行筛选,获得与当前档案优化需求相关的目标数字化档案数据,对目标数字化档案数据相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据,对目标档案互动行为数据进行大数据挖掘,获得目标档案互动行为大数据的互动兴趣点分布,并基于互动兴趣点分布与当前档案优化需求进行关联配置。如此设计,相较于针对全量数字化档案数据相关的档案互动行为数据进行大数据挖掘,可以降低数据处理量和负载压力,并且提高互动兴趣点分布挖掘与当前档案优化需求之间的匹配性,进而进行后续的针对性业务优化,提高档案管理体验。
一种可能的实施方式中,在步骤S140,在对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布的过程中,例如可以依据训练完成的目标互动兴趣点挖掘模型对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布;
其中,所述目标互动兴趣点挖掘模型的模型配置过程如下:
步骤S201、获取示例档案互动行为数据序列。
其中,示例档案互动行为数据序列包括多个携带示例兴趣点的示例档案互动行为数据,示例兴趣点可以为用户在示例档案互动行为数据中添加的携带的有效性兴趣点,该有效性兴趣点用于指示示例档案互动行为数据中互动行为数据的兴趣点。
步骤S202、依据初始兴趣点挖掘模型对示例档案互动行为数据序列中的示例档案互动行为数据进行行为倾向向量挖掘,获得行为倾向向量簇。
例如,可以依据初始兴趣点挖掘模型的行为倾向向量挖掘网络提取示例档案互动行为数据序列中各个示例档案互动行为数据的行为倾向向量,获得行为倾向向量簇。
步骤S203、基于行为倾向向量簇,将示例档案互动行为数据确定为训练单元配置兴趣学习关系信息。
其中,配置兴趣学习关系信息的例如可以是:
在行为倾向向量簇中,获得各个示例档案互动行为数据关联的行为倾向向量,并依据示例档案互动行为数据的行为倾向向量,获得示例档案互动行为数据之间的行为迁移代价信息,依据行为迁移代价信息,在示例档案互动行为数据序列中获得示例档案互动行为数据的联系示例档案互动行为数据,获得示例档案互动行为数据的联系示例档案互动行为数据序列,基于联系示例档案互动行为数据序列,将示例档案互动行为数据确定为训练单元配置兴趣学习关系信息。
其中,获得示例档案互动行为数据之间的行为迁移代价信息的方式可依据常规的数据差异算法进行确定,从而得到示例档案互动行为数据之间的行为迁移代价信息。
其中,基于联系示例档案互动行为数据序列,配置兴趣学习关系信息例如可以是:获取示例档案互动行为数据与对应的联系示例档案互动行为数据序列中的示例档案互动行为数据之间的互动行为节点联系信息,获得示例档案互动行为数据的联系向量,基于联系向量,将示例档案互动行为数据确定为训练单元配置基础兴趣学习关系信息,并对基础兴趣学习关系信息进行扩展,获得兴趣学习关系信息。
其中,联系向量用于表征示例档案互动行为数据与联系示例档案互动行为数据序列中的示例档案互动行为数据之间的联系程度、互动行为节点联系信息等信息。得到联系向量例如可以是:在行为迁移代价信息中获得示例档案互动行为数据与对应的联系示例档案互动行为数据序列中的示例档案互动行为数据之间的推定行为迁移代价信息,对所述推定行为迁移代价信息进行拼接,以得到示例档案互动行为数据与联系示例档案互动行为数据序列中示例档案互动行为数据之间的互动行为节点联系信息,依据互动行为节点联系信息,获得示例档案互动行为数据的联系向量。
其中,对推定行为迁移代价信息进行拼接,以得到示例档案互动行为数据与联系示例档案互动行为数据序列中示例档案互动行为数据之间的互动行为节点联系信息例如可以是:对推定行为迁移代价信息进行拼接,获得拼接后的行为迁移代价信息,并对拼接后的行为迁移代价信息进行次序整理,基于次序整理结果,获得示例档案互动行为数据之间的互动行为节点联系信息。在配置完基础兴趣学习关系信息之后,即可对基础兴趣学习关系信息进行扩展,获得兴趣学习关系信息。
步骤S204、依据兴趣学习关系信息对示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列。
例如,可以将示例档案互动行为数据的示例兴趣点在兴趣学习关系信息的训练单元的流向关系进行共享学习,获得示例档案互动行为数据的共享学习兴趣点,依据共享学习兴趣点,对示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列,例如实施方式可以是:
(A)将示例档案互动行为数据的示例兴趣点在兴趣学习关系信息的训练单元的流向关系进行共享学习,获得示例档案互动行为数据的共享学习兴趣点。
其中,将示例档案互动行为数据的示例兴趣点在兴趣学习关系信息的训练单元的流向关系进行共享学习,获得示例档案互动行为数据的共享学习兴趣点例如可以是:
基于示例档案互动行为数据的示例兴趣点,配置示例档案互动行为数据序列对应的示例兴趣点分布,依据设定共享学习路径,将示例兴趣点在兴趣学习关系信息的训练单元的流向关系进行共享学习,获得示例档案互动行为数据的共享学习兴趣点,例如实施方式可以是:
(1)基于示例档案互动行为数据的示例兴趣点,配置示例档案互动行为数据序列对应的示例兴趣点分布。
示例兴趣点分布可以为将示例档案互动行为数据序列中所有的示例档案互动行为数据的示例兴趣点进行聚合得到的携带兴趣点分布矩阵。
(2)依据设定共享学习路径,将示例兴趣点分布在兴趣学习关系信息的训练单元的流向关系进行共享学习,获得示例档案互动行为数据的共享学习兴趣点。
例如,可以基于兴趣学习关系信息计算示例档案互动行为数据之间的共享度量值,获取共享度量值关联的共享程度,并依据共享程度,对示例档案互动行为数据的示例兴趣点变量进行聚合,将融合示例兴趣点变量进行拼接,获得示例档案互动行为数据的共享学习兴趣点。
其中,基于兴趣学习关系信息计算示例档案互动行为数据之间的共享度量值例如可以是:在兴趣学习关系信息中挖掘分析训练单元之间的互动行为节点联系信息,基于互动行为节点联系信息,获得训练单元的联系程度相减值,将联系程度相减值转换为共享度量值,联系程度相减值越小,即表征示例档案互动行为数据的共享度量值越大。
(B)依据共享学习兴趣点,对示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列。
例如,在共享学习兴趣点中提取示例档案互动行为数据的共享学习兴趣点变量,基于共享学习兴趣点变量,获得示例档案互动行为数据的共享兴趣节点,依据共享兴趣节点,对示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据。
在挖掘示例档案互动行为数据的共享学习兴趣点变量之后,便可以确定示例档案互动行为数据的共享兴趣节点,获得例如可以是:在共享学习兴趣点变量中获得兴趣强度最大的兴趣点成员,在共享学习兴趣点变量中挖掘分析兴趣点成员的成员节点向量,获取成员节点向量对应的指定兴趣点,将指定兴趣点确定为示例档案互动行为数据的共享兴趣节点。
获得示例档案互动行为数据的共享兴趣节点,即可对示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列,纠正例如可以是:将共享兴趣节点与对应的示例档案互动行为数据的示例兴趣点进行分析,当共享兴趣节点与示例兴趣点不相匹配是,获得示例档案互动行为数据为待优化的目标示例档案互动行为数据,将目标示例档案互动行为数据的示例兴趣点优化配置为对应的共享兴趣节点,获得优化示例档案互动行为数据序列。
步骤S205、依据优化示例档案互动行为数据序列对初始兴趣点挖掘模型进行模型配置,并通过目标兴趣点挖掘模型对待识别图像进行识别。
例如,例如实施方式可以是:
C1、依据优化示例档案互动行为数据序列对初始兴趣点挖掘模型进行模型配置。
例如,依据优化示例档案互动行为数据序列中的行为倾向向量和携带兴趣点分布,对初始兴趣点挖掘模型进行模型配置,依据初始兴趣点挖掘模型对优化示例档案互动行为数据序列中的示例档案互动行为数据进行行为倾向向量挖掘,依据推定行为倾向向量簇,对示例档案互动行为数据的携带兴趣点分布进行优化,返回执行依据优化示例档案互动行为数据序列中示例档案互动行为数据的行为倾向向量和携带兴趣点分布,对初始兴趣点挖掘模型进行模型配置的步骤,直至初始兴趣点挖掘模型收敛完成,获得目标兴趣点挖掘模型。例如实施方式可以是:
(1)依据优化示例档案互动行为数据序列中示例档案互动行为数据的行为倾向向量和携带兴趣点分布,对初始兴趣点挖掘模型进行模型配置。
例如,可以基于优化示例档案互动行为数据序列中示例档案互动行为数据的携带兴趣点分布,获得示例档案互动行为数据的第一兴趣代价信息,依据优化示例档案互动行为数据序列中示例档案互动行为数据的行为倾向向量,获得示例档案互动行为数据的第二兴趣代价信息,将第一兴趣代价信息和第二兴趣代价信息进行聚合,并基于聚合兴趣代价信息对初始兴趣点挖掘模型进行模型配置。
其中,获得示例档案互动行为数据的第二兴趣代价信息例如可以是:基于优化示例档案互动行为数据序列中示例档案互动行为数据的携带兴趣点分布,对示例档案互动行为数据进行聚簇,获得每个携带兴趣点分布对应的示例档案互动行为数据分簇,依据示例档案互动行为数据分簇中示例档案互动行为数据的行为倾向向量,获得示例档案互动行为数据分簇对应的推定行为倾向向量,将示例档案互动行为数据的行为倾向向量和示例档案互动行为数据分簇对应的推定行为倾向向量进行聚合,获得示例档案互动行为数据的第二兴趣代价信息。
其中,获得示例档案互动行为数据分簇对应的推定行为倾向向量例如可以是:计算示例档案互动行为数据分簇中示例档案互动行为数据的行为倾向向量的均值代价信息,将该均值代价信息作为示例档案互动行为数据分簇对应的推定行为倾向向量。
在计算完示例档案互动行为数据分簇对应的推定行为倾向向量之后,便可以将示例档案互动行为数据的行为倾向向量和示例档案互动行为数据分簇对应的推定行为倾向向量进行聚合,获得示例档案互动行为数据的第二兴趣代价信息,聚合实施方式可以是:基于示例档案互动行为数据的行为倾向向量,获得示例档案互动行为数据分簇中示例档案互动行为数据之间的学习代价信息,获得第一学习代价信息,依据示例档案互动行为数据分簇对应的推定学习代价信息,获得示例档案互动行为数据分簇之间的学习代价信息,获得第二学习代价信息,获得第一学习代价信息和第二学习代价信息之间的学习代价信息,获得第三学习代价信息,并将第三学习代价信息与设定代价系数信息进行聚合,获得第四学习代价信息,当第四学习代价信息大于设定代价,获得聚合后的均值代价信息,获得示例档案互动行为数据的收敛评估信息。
其中,将第一兴趣代价信息和第二兴趣代价信息进行聚合,并基于聚合代价信息对初始兴趣点挖掘模型进行模型配置,例如可以获取第一兴趣代价信息和第二兴趣代价信息对应的共享程度,基于共享程度,分别对第一兴趣代价信息和第二兴趣代价信息进行聚合,并将融合的第一兴趣代价信息和第二兴趣代价信息进行聚合,获得聚合代价信息,并基聚合代价信息对初始兴趣点挖掘模型中的权重信息进行优化,以配置初始兴趣点挖掘模型
(2)依据初始兴趣点挖掘模型对优化示例档案互动行为数据序列中的示例档案互动行为数据进行行为倾向向量挖掘,获得推定行为倾向向量簇。
例如,可以依据初始兴趣点挖掘模型的行为倾向向量挖掘单元提取优化示例档案互动行为数据序列中各个示例档案互动行为数据的行为倾向向量,获得行为倾向向量簇。
(3)依据推定行为倾向向量簇,对示例档案互动行为数据的携带兴趣点分布进行优化。
例如,可以基于推定行为倾向向量簇,将示例档案互动行为数据确定为训练单元配置目标兴趣学习关系信息,将示例档案互动行为数据的携带兴趣点分布在目标兴趣学习关系信息的训练单元的流向关系进行共享学习,获得示例档案互动行为数据的目标共享学习兴趣点,依据目标共享学习兴趣点对示例档案互动行为数据的携带兴趣点分布进行优化,获得优化示例档案互动行为数据序列。
(4)返回执行依据优化示例档案互动行为数据序列中示例档案互动行为数据的行为倾向向量和携带兴趣点分布,对初始兴趣点挖掘模型进行模型配置的步骤,直至初始兴趣点挖掘模型满足模型训练终止条件,获得目标兴趣点挖掘模型。
基于以上步骤,本实施例获取示例档案互动行为数据序列后,依据初始兴趣点挖掘模型对示例档案互动行为数据序列中的示例档案互动行为数据进行行为倾向向量挖掘,获得行为倾向向量簇,之后,基于行为倾向向量簇,将示例档案互动行为数据确定为训练单元配置兴趣学习关系信息,之后,依据兴趣学习关系信息对示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列,之后,依据优化示例档案互动行为数据序列对初始兴趣点挖掘模型进行模型配置,并通过目标兴趣点挖掘模型进行兴趣点挖掘;如此可基于行为倾向向量簇配置兴趣学习关系信息,利用示例档案互动行为数据进行兴趣点优化后进行模型配置,提高示例档案互动行为数据的携带兴趣点的参考价值,进而提高兴趣点挖掘精度。
图2示出了本发明实施例提供的用于实现上述的基于档案数字化管理的信息整理方法的基于档案数字化管理的信息整理***100的硬件结构意图,如图2所示,基于档案数字化管理的信息整理***100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
在一些实施例中,基于档案数字化管理的信息整理***100可以是单个基于档案数字化管理的信息整理***,也可以是基于档案数字化管理的信息整理***组。所述基于档案数字化管理的信息整理***组可以是集中式的,也可以是分布式的(例如,基于档案数字化管理的信息整理***100可以是分布式的***)。在一些实施例中,基于档案数字化管理的信息整理***100可以是本地的,也可以是远程的。例如,基于档案数字化管理的信息整理***100可以经由网络访问存储于机器可读存储介质120中的信息和/或数据。又例如,基于档案数字化管理的信息整理***100可以直接连接到机器可读存储介质120以访问存储的信息和/或数据。在一些实施例中,基于档案数字化管理的信息整理***100可以在云平台上实施。仅作为示例,该云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
机器可读存储介质120可以储存数据和/或指令。在一些实施例中,机器可读存储介质120可以存储从外部终端获取的数据。在一些实施例中,机器可读存储介质120可以储存基于档案数字化管理的信息整理***100用来执行或使用来完成本发明中描述的示例性方法的数据及/或指令。在一些实施例中,机器可读存储介质120可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。示例性的大容量存储器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性易失性读写存储器可以包括随机存取内存(RAM)。示例性RAM可包括主动随机存取存储器(DRAM)、双倍数据速率同步主动随机存取存储器(DDRSDRAM)、被动随机存取存储器(SRAM)、晶闸管随机存取存储器(T-RAM)和零电容随机存取存储器(Z-RAM)等。示例性只读存储器可以包括掩模型只读存储器(MROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(PEROM)、电可擦除可编程只读存储器(EEPROM)、光盘只读存储器(CD-ROM)和数字多功能磁盘只读存储器等。在一些实施例中,机器可读存储介质120可以在云平台上实现。仅作为示例,云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云,多层云等,或其任意组合。
在具体实现过程中,多个处理器110执行机器可读存储介质120存储的计算机可执行指令,使得处理器110可以执行如上方法实施例的基于档案数字化管理的信息整理方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作。
处理器110的具体实现过程可参见上述基于档案数字化管理的信息整理***100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本发明实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机可执行指令,当处理器执行所述计算机可执行指令时,实现如上基于档案数字化管理的信息整理方法。
应当理解的是,以上描述仅出于说明的目的,并不旨在限制本发明的范围。对于本领域的普通技术人员来说,可以根据本发明的描述,做出多种修改和变化。然而,这些修改和变化不会背离本发明的范围。
上文已对基本概念做了描述,显然,对于阅读此申请后的本领域的普通技术人员来说,上述发明公开仅作为示例,并不构成对本发明的限制。虽然此处并没有明确说明,本领域技术人员可能会对本发明进行各种修改、改进和修正。该类修改、改进和修正在本发明中被建议,所以该类修改、改进、修正仍属于本发明示范实施例的精神和范围。
同时,本发明使用了特定词语来描述本发明的实施例。例如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本发明至少一个实施例相关的某一特征、结构或特性。因此,应当强调并注意的是,本说明书中在不同位置两次或以上提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定系指同一实施例。此外,本发明的一个或以上实施例中的某些特征、结构或特性可以进行适当的组合。
此外,本领域的普通技术人员可以理解,本发明的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的过程、机器、产品或物质的组合,或对其任何新的和有用的改良。相应地,本发明的各个方面可以完全由硬件执行、可以完全由软件(包括韧体、常驻软件、微代码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“单元”、“模块”或“***”。此外,本发明公开的各方面可以采取体现在一个或以上计算机可读介质中的计算机程序产品的形式,其中计算机可读程序代码包含在其中。
计算机可读信号介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。此类传播信号可以有多种形式,包括电磁形式、光形式等或任何合适的组合形式。计算机可读信号介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行***、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读信号介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质等或其任意组合。
本发明各部分操作所需的计算机程序编码可以用任意一种或以上程序语言编写,包括面向主体编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,主动编程语言如Python、Ruby和Groovy,或其它编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或基于档案数字化管理的信息整理***上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本发明所述处理元素和序列的顺序、数字字母的使用、或其它名称的使用,并非用于限定本发明流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本发明实施例实质和范围的修正和等价组合。例如,虽然以上所描述的***组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的基于档案数字化管理的信息整理***或移动设备上安装所描述的***。
同理,应当注意的是,为了简化本发明披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本发明实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。同理,应当注意的是,为了简化本发明披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本发明实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。

Claims (9)

1.一种基于档案数字化管理的信息整理方法,其特征在于,应用于基于档案数字化管理的信息整理***,所述方法包括:
获取由各个档案数字化管理服务平台上传的初始数字化档案数据;
依据当前档案优化需求对所述初始数字化档案数据进行筛选,获得与所述当前档案优化需求相关的目标数字化档案数据;
对所述目标数字化档案数据相关的档案互动行为数据进行搜集与整理,获得目标档案互动行为大数据;
对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布,并基于所述互动兴趣点分布与所述当前档案优化需求进行关联配置;
所述对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布的步骤,包括:
依据训练完成的目标互动兴趣点挖掘模型对所述目标档案互动行为数据进行大数据挖掘,获得所述目标档案互动行为大数据的互动兴趣点分布;
其中,所述目标互动兴趣点挖掘模型的模型配置过程如下:
获取示例档案互动行为数据序列,所述示例档案互动行为数据序列包括多个携带示例兴趣点的示例档案互动行为数据,所述示例兴趣点表征所述示例档案互动行为数据中携带的有效性兴趣点;
依据初始兴趣点挖掘模型对所述示例档案互动行为数据序列中的示例档案互动行为数据进行行为倾向向量挖掘,获得行为倾向向量簇;
基于所述行为倾向向量簇,将所述示例档案互动行为数据确定为训练单元配置兴趣学习关系信息;
基于所述示例档案互动行为数据的示例兴趣点,配置所述示例档案互动行为数据序列对应的示例兴趣点分布;
依据设定共享学习路径,将所述示例兴趣点分布在所述兴趣学习关系信息的训练单元的流向关系进行共享学习,获得所述示例档案互动行为数据的共享学习兴趣点;
在所述共享学习兴趣点中挖掘所述示例档案互动行为数据的共享学习兴趣点变量;
基于所述共享学习兴趣点变量,获得所述示例档案互动行为数据的共享兴趣节点;
依据所述共享兴趣节点,对所述示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列;
依据所述优化示例档案互动行为数据序列对所述初始兴趣点挖掘模型进行模型配置。
2.根据权利要求1所述的基于档案数字化管理的信息整理方法,其特征在于,所述基于所述共享学习兴趣点变量,获得所述示例档案互动行为数据的共享兴趣节点,包括:
在所述共享学习兴趣点变量中获得兴趣强度最大的兴趣点成员;
在所述共享学习兴趣点变量中挖掘分析所述兴趣点成员的成员节点向量;
获取所述成员节点向量对应的指定兴趣点,将所述指定兴趣点确定为所述示例档案互动行为数据的共享兴趣节点。
3.根据权利要求2所述的基于档案数字化管理的信息整理方法,其特征在于,所述依据所述共享兴趣节点,对所述示例档案互动行为数据的示例兴趣点进行优化,获得优化示例档案互动行为数据序列,包括:
将所述共享兴趣节点与对应的示例档案互动行为数据携带的示例兴趣点进行分析;
当所述共享兴趣节点与示例兴趣点不相匹配时,获得所述示例档案互动行为数据为待优化的目标示例档案互动行为数据;
将所述目标示例档案互动行为数据的示例兴趣点优化配置为对应的共享兴趣节点,获得所述优化示例档案互动行为数据序列。
4.根据权利要求1所述的基于档案数字化管理的信息整理方法,其特征在于,所述示例兴趣点分布包括各个示例档案互动行为数据关联的示例兴趣点变量,所述依据设定共享学习路径,将所述示例兴趣点分布在所述兴趣学习关系信息的训练单元的流向关系进行共享学习,获得所述示例档案互动行为数据的共享学习兴趣点,包括:
基于所述兴趣学习关系信息计算所述示例档案互动行为数据之间的共享度量值;
获取所述共享度量值关联的共享程度,并依据所述共享程度,对所述示例档案互动行为数据的示例兴趣点变量进行聚合;将融合示例兴趣点变量进行拼接,获得所述示例档案互动行为数据的共享学习兴趣点。
5.根据权利要求2-4中任意一项所述的基于档案数字化管理的信息整理方法,其特征在于,所述基于所述行为倾向向量簇,将所述示例档案互动行为数据确定为训练单元配置兴趣学习关系信息,包括:
在所述行为倾向向量簇中获得各个示例档案互动行为数据关联的行为倾向向量,并依据所述示例档案互动行为数据的行为倾向向量,获得所述示例档案互动行为数据之间的行为迁移代价信息;
依据所述行为迁移代价信息,在所述示例档案互动行为数据序列中获得所述示例档案互动行为数据的联系示例档案互动行为数据,获得所述示例档案互动行为数据的联系示例档案互动行为数据序列;
基于所述联系示例档案互动行为数据序列,将所述示例档案互动行为数据确定为训练单元配置兴趣学习关系信息。
6.根据权利要求5所述的基于档案数字化管理的信息整理方法,其特征在于,所述基于所述联系示例档案互动行为数据序列,将所述示例档案互动行为数据确定为训练单元配置兴趣学习关系信息,包括:
获取所述示例档案互动行为数据与对应的联系示例档案互动行为数据序列中的示例档案互动行为数据之间的互动行为节点联系信息,获得所述示例档案互动行为数据的联系向量;
基于所述联系向量,将所述示例档案互动行为数据确定为训练单元配置基础兴趣学习关系信息,并对所述基础兴趣学习关系信息进行扩展,获得所述兴趣学习关系信息。
7.根据权利要求6所述的基于档案数字化管理的信息整理方法,其特征在于,所述获取所述示例档案互动行为数据与所述联系示例档案互动行为数据序列中的示例档案互动行为数据之间的互动行为节点联系信息,获得所述示例档案互动行为数据的联系向量,包括:
在所述行为迁移代价信息中获得所述示例档案互动行为数据与对应的联系示例档案互动行为数据序列中示例档案互动行为数据之间的推定行为迁移代价信息;
对所述推定行为迁移代价信息进行拼接,以得到所述示例档案互动行为数据与所述联系示例档案互动行为数据序列中的示例档案互动行为数据之间的互动行为节点联系信息;
依据所述互动行为节点联系信息,获得所述示例档案互动行为数据的联系向量。
8.根据权利要求2-4中任意一项所述的基于档案数字化管理的信息整理方法,其特征在于,所述依据所述优化示例档案互动行为数据序列对所述初始兴趣点挖掘模型进行模型配置,包括:
基于所述优化示例档案互动行为数据序列中示例档案互动行为数据的携带兴趣点分布,获得所述示例档案互动行为数据的第一兴趣代价信息,基于所述优化示例档案互动行为数据序列中示例档案互动行为数据的携带兴趣点分布,对所述示例档案互动行为数据进行聚簇,获得每个携带兴趣点分布对应的示例档案互动行为数据分簇;
依据所述示例档案互动行为数据分簇中示例档案互动行为数据的行为倾向向量,获得所述示例档案互动行为数据分簇对应的推定行为倾向向量;
基于所述示例档案互动行为数据的行为倾向向量,获得所述示例档案互动行为数据分簇中示例档案互动行为数据之间的学习代价信息,获得第一学习代价信息;
依据所述示例档案互动行为数据分簇对应的推定学习代价信息,获得所述示例档案互动行为数据分簇之间的学习代价信息,获得第二学习代价信息;
计算所述第一学习代价信息和第二学习代价信息之间的学习代价信息,获得第三学习代价信息,并将所述第三学习代价信息与设定代价系数信息进行聚合,获得第四学习代价信息;
当所述第四学习代价信息大于设定代价时,获得所述第四学习代价信息的均值代价信息,获得所述示例档案互动行为数据的第二兴趣代价信息;将所述第一兴趣代价信息和第二兴趣代价信息进行聚合,并基于聚合兴趣代价信息对所述初始兴趣点挖掘模型进行模型配置;
依据所述初始兴趣点挖掘模型对所述优化示例档案互动行为数据序列中的示例档案互动行为数据进行行为倾向向量挖掘,获得推定行为倾向向量簇;
依据所述推定行为倾向向量簇,对所述示例档案互动行为数据的携带兴趣点分布进行优化;
返回执行所述依据所述优化示例档案互动行为数据序列中示例档案互动行为数据的行为倾向向量和携带兴趣点分布,对所述初始兴趣点挖掘模型进行模型配置的操作,直到判定所述初始兴趣点挖掘模型符合配置终止条件,获得目标兴趣点挖掘模型。
9.一种基于档案数字化管理的信息整理***,其特征在于,所述基于档案数字化管理的信息整理***包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现权利要求1-8中任意一项所述 的基于档案数字化管理的信息整理方法。
CN202111065996.0A 2021-09-13 2021-09-13 基于档案数字化管理的信息整理方法及*** Active CN113761033B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111065996.0A CN113761033B (zh) 2021-09-13 2021-09-13 基于档案数字化管理的信息整理方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111065996.0A CN113761033B (zh) 2021-09-13 2021-09-13 基于档案数字化管理的信息整理方法及***

Publications (2)

Publication Number Publication Date
CN113761033A CN113761033A (zh) 2021-12-07
CN113761033B true CN113761033B (zh) 2022-03-25

Family

ID=78795043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111065996.0A Active CN113761033B (zh) 2021-09-13 2021-09-13 基于档案数字化管理的信息整理方法及***

Country Status (1)

Country Link
CN (1) CN113761033B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114564522B (zh) * 2022-03-08 2022-11-15 山邮数字科技(山东)有限公司 基于区块链和大数据挖掘的智能推送处理方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10133791B1 (en) * 2014-09-07 2018-11-20 DataNovo, Inc. Data mining and analysis system and method for legal documents
CN109739850A (zh) * 2019-01-11 2019-05-10 安徽爱吉泰克科技有限公司 一种档案大数据智能分析清洗挖掘***
CN110232126A (zh) * 2019-06-14 2019-09-13 腾讯科技(深圳)有限公司 热点挖掘方法及服务器和计算机可读存储介质
CN112214617A (zh) * 2020-11-11 2021-01-12 广东新禾道信息科技有限公司 一种基于区块链技术的数字档案管理方法及***
CN113254659A (zh) * 2021-02-04 2021-08-13 天津德尔塔科技有限公司 一种基于知识图谱技术的档案研判方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10133791B1 (en) * 2014-09-07 2018-11-20 DataNovo, Inc. Data mining and analysis system and method for legal documents
CN109739850A (zh) * 2019-01-11 2019-05-10 安徽爱吉泰克科技有限公司 一种档案大数据智能分析清洗挖掘***
CN110232126A (zh) * 2019-06-14 2019-09-13 腾讯科技(深圳)有限公司 热点挖掘方法及服务器和计算机可读存储介质
CN112214617A (zh) * 2020-11-11 2021-01-12 广东新禾道信息科技有限公司 一种基于区块链技术的数字档案管理方法及***
CN113254659A (zh) * 2021-02-04 2021-08-13 天津德尔塔科技有限公司 一种基于知识图谱技术的档案研判方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数据挖掘在高校档案管理中的应用研究;陈源;《办公室业务》;20131125;全文 *

Also Published As

Publication number Publication date
CN113761033A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN108229419B (zh) 用于聚类图像的方法和装置
US20210042628A1 (en) Building a federated learning framework
CN113868010B (zh) 应用于业务***的异常数据处理方法及***
CN113326126A (zh) 任务处理方法、任务调度方法、装置及计算机设备
CN109583594B (zh) 深度学习训练方法、装置、设备及可读存储介质
CN114564522B (zh) 基于区块链和大数据挖掘的智能推送处理方法及***
CN110765320B (zh) 数据处理方法、装置、存储介质和计算机设备
CN114564566A (zh) 应用云业务联动大数据处理方法及云业务人工智能***
CN112257801B (zh) 图像的增量聚类方法、装置、电子设备及存储介质
CN113706180B (zh) 欺诈社团识别方法及***
CN113761033B (zh) 基于档案数字化管理的信息整理方法及***
CN113689292A (zh) 基于图像背景识别的用户聚集识别方法及***
CN113285960B (zh) 一种服务数据共享云平台的数据加密方法及***
CN113689291B (zh) 基于异常移动的反欺诈识别方法及***
CN111897864B (zh) 一种基于互联网ai外呼的专家库数据抽取方法及***
WO2021121349A1 (en) System and method for testing multiple variants
CN114691630B (zh) 一种智慧供应链大数据共享方法及***
CN115454781A (zh) 基于企业架构***的数据可视化展现方法及***
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN112437132B (zh) 基于云计算和数字化升级的业务资源共享方法及云服务器
CN113870965A (zh) 基于健康大数据档案的数据共享方法及***
CN113596061A (zh) 基于区块链技术的网络安全漏洞响应方法及***
CN113835988B (zh) 指标信息预测方法及***
CN113552802B (zh) 重卡智能空调控制方法及***
CN113515465B (zh) 基于区块链技术的软件兼容性测试方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant