CN111782736B - 一种数据分类管理的方法及*** - Google Patents

一种数据分类管理的方法及*** Download PDF

Info

Publication number
CN111782736B
CN111782736B CN202010696437.9A CN202010696437A CN111782736B CN 111782736 B CN111782736 B CN 111782736B CN 202010696437 A CN202010696437 A CN 202010696437A CN 111782736 B CN111782736 B CN 111782736B
Authority
CN
China
Prior art keywords
label
prefix
predefined
labels
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010696437.9A
Other languages
English (en)
Other versions
CN111782736A (zh
Inventor
郑敏
吴呈良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Original Assignee
Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chaozhou Zhuoshu Big Data Industry Development Co Ltd filed Critical Chaozhou Zhuoshu Big Data Industry Development Co Ltd
Priority to CN202010696437.9A priority Critical patent/CN111782736B/zh
Publication of CN111782736A publication Critical patent/CN111782736A/zh
Application granted granted Critical
Publication of CN111782736B publication Critical patent/CN111782736B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据管理领域,具体提供了一种数据分类管理的方法及***,用户对未标签化表进行标签标记,检查是否存在未标记表,若存在,则检查是否已尝试预定义标签,若已尝试,则进行自动化标记,若没有尝试,则进行人工标记;若不存在,则需要完善标签或者标签分类,对表进行展示。与现有技术相比,本发明通过一定程度的自动化标记功能,可以有效的减少在数据管理中人力的投入,通过表‑标签‑标签分类三级的形式,方便用户对现有数据进行多维度的分类查看,通过警告‑反馈的模式不断完善现有的数据管理。

Description

一种数据分类管理的方法及***
技术领域
本发明涉及数据管理领域,具体提供一种数据分类管理的方法及***。
背景技术
随着计算机科学和信息科学的发展,各个企业单位对信息***建设日益重视,各类信息***逐步被完善,并在日常的运行中产生海量的数据。
多个不同的信息***所产生的数据在组织形式和结构上存在差异,甚至产生表义不明确的表或者是临时表。而企业数据管理中,由于缺乏相应的管理手段,企业往往难以实现对数据的有效利用,或者存在一些实际已废弃但由于未标记导致长期占用***资源的数据。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的数据分类管理的方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的数据分类管理的***。
本发明解决其技术问题所采用的技术方案是:
一种数据分类管理的方法,用户对未标签化表进行标签标记,检查是否存在未标记表,若存在,则检查是否已尝试预定义标签,若已尝试,则进行自动化标记,若没有尝试,则进行人工标记;
若不存在,则需要完善标签或者标签分类,对表进行展示。
进一步的,用户对未标签化表进行标签标记之前,首先要在数据库中创建标签对应表来存放数据表和标签的对应关系,并创建预定义标签表,按照具体业务规则初始化标明前缀与标签的对应关系。
作为优选,在标签对应表中包括的字段名为TABLE_NAME、LABEL_NAME、LABEL_TYPE和PREFIX_CHECK;
在预定义标签表中包括的字段名为TABLE_PREFIX、LABEL_NAME和LABEL_TYPE。
进一步的,检查是否存在未标记表,根据用户定义的周期,对所需管理的数据库的表进行巡检操作,根据对比***表列表和标签对应表,检查是否存在未标签化的表;
若存在未标签化的表,则对其检查是否存在PREFIX_CHECK字段,且PREFIX_CHECK字段是否为空,即未经过预定义标签化流程;
若符合此类情况,则结合预定义标签表,对表进行打标签操作;
如果PREFIX_CHECK字段不为空,即已经过预定义标签化流程,则通知用户对未标签化的表进行自定义打标签的处理,所有预定义或自定义的表与标签的对应关系,记录至标签对应表。
进一步的,在初次标签化完毕之后,用户对已有标签进行完善和分类,通过标签的标准化,对这部分标签进行合并和统一,并更新标签对应表中的标签名称字段。
一种数据分类管理***,包括巡检模块、标记模块、警告模块和表展示模块,所述巡检模块用于根据用户定义的周期,对所需管理的数据库内的表进行巡检操作;
所述标记模块用于对表进行打标签操作;所述警告模块用于通知用户对未标签化的表进行自定义打标签处理;所述表展示模块,用于对已标签化的表按照标签进行查看。
进一步的,在数据库中创建标签对应表,用于后续存放数据表和标记对应关系,且在数据库中创建预定义标签表,按照具体业务规则初始化表名前缀与标签的对应关系。
作为优选,在标签对应表中包括的字段名为TABLE_NAME、LABEL_NAME、LABEL_TYPE和PREFIX_CHECK;
在预定义标签表中包括的字段名为TABLE_PREFIX、LABEL_NAME和LABEL_TYPE。
进一步的,所述巡检模块用于根据用户定义的周期,对所需管理的数据库内的表进行巡检操作,根据对比***表列表和标签对应表,检查是否存在未标签化的表;
若存在未标签化的表,则对其检查是否存在PREFIX_CHECK字段,且PREFIX_CHECK字段是否为空,即未经过预定义标签化流程;
若符合此类情况,则结合预定义标签表,通过标记模块对表进行打标签操作;
如果PREFIX_CHECK字段不为空,即已经过预定义标签化流程,则警告模块用于通知用户对未标签化的表进行自定义打标签的处理;
所有预定义或自定义的表与标签的对应关系,通过标记模块记录至标签对应表。
进一步的,在初次标签化完成以后,用户对已有标签进行完善和分类,通过标签的标准化,对这部分标签进行合并和统一,并更新标签对应表中的标签名称字段。
本发明的一种数据分类管理的方法及***和现有技术相比,具有以下突出的有益效果:
(1)本发明通过一定程度的自动化标记功能,可以有效的减少在数据管理中人力的投入。
(2)通过表-标签-标签分类三级的形式,方便用户对现有数据进行多维度的分类查看。通过警告-反馈的模式不断完善现有的数据管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图1是一种数据分类管理***的结构示意图。
具体实施方式
为了使本技术领域的人员更好的理解本发明的方案,下面结合具体的实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例都属于本发明保护的范围。
下面给出一个最佳实施例:
如图1所示,本实施例中的一种数据分类管理的方法为:用户对未标签化表进行标签标记,检查是否存在未标记表,若存在,则检查是否已尝试预定义标签,若已尝试,则进行自动化标记,若没有尝试,则进行人工标记。若不存在,则需要完善标签或者标签分类,对表进行展示。
具体的过程如下:
用户对未标签化表进行标签标记之前,首先要在数据库中创建标签对应表R_TABLE_LABEL来存放数据表和标签的对应关系,并创建预定义标签表R_PREFIX_LABEL,按照具体业务规则初始化标明前缀与标签的对应关系。
在标签对应表R_TABLE_LABEL中包括的字段名为TABLE_NAME、LABEL_NAME、LABEL_TYPE和PREFIX_CHECK。在预定义标签表R_PREFIX_LABEL中包括的字段名为TABLE_PREFIX、LABEL_NAME和LABEL_TYPE。
检查是否存在未标记表,根据用户定义的周期,对所需管理的数据库的表进行巡检操作,根据对比***表列表和标签对应表,检查是否存在未标签化的表。
若存在未标签化的表,则对其检查是否存在PREFIX_CHECK字段,且PREFIX_CHECK字段是否为空,即未经过预定义标签化流程。
若符合此类情况,则结合预定义标签表R_PREFIX_LABEL,对表进行打标签操作。
如果PREFIX_CHECK字段不为空,即已经过预定义标签化流程,则通知用户对未标签化的表进行自定义打标签的处理,所有预定义或自定义的表与标签的对应关系,记录至标签对应表。
在初次标签化完毕之后,用户对已有标签进行完善和分类,通过标签的标准化,对这部分标签进行合并和统一,并更新标签对应表中的标签名称字段。
实现上述方法的***为:
一种数据分类管理***,包括巡检模块、标记模块、警告模块和表展示模块,巡检模块用于根据用户定义的周期,对所需管理的数据库内的表进行巡检操作。
标记模块用于对表进行打标签操作;警告模块用于通知用户对未标签化的表进行自定义打标签处理;表展示模块,用于对已标签化的表按照标签进行查看。
具体的步骤为:
(1)在数据库中创建标签对应表R_TABLE_LABEL,用于后续存放数据表和标签的对应关系。
字段名 数据类型 注释
TABLE_NAME 字符型 数据表名
LABEL_NAME 字符型 标签名称
LABEL_TYPE 字符型 标签类型
PREFIX_CHECK 字符型 是否已进行预定义标记流程
(2)在数据库中创建预定义标签表R_PREFIX_LABEL,并按照具体业务规则初始化表名前缀与标签的对应关系。
字段名 数据类型 注释
TABLE_PREFIX 字符型 表名前缀
LABEL_NAME 字符型 标签名称
LABEL_TYPE 字符型 标签类型5
(3)巡检模块用于根据用户定义的周期,对所需管理的数据库内的表进行巡检操作,根据对比***表列表和标签对应表R_TABLE_LABEL,检查是否存在未标签化的表。
如果存在未标签化的表,则对其检查是否存在PREFIX_CHECK字段是否为空,即未经过预定义标签化流程。
如果符合此类情况,则结合预定义标签表R_PREFIX_LABEL,通过标记模块对表进行打标签操作。如果PREFIX_CHECK字段不为空,即已经过预定义标签化流程,则通过告警模块,通知用户对未标签化的表进行自定义打标签的处理。所有预定义或自定义的表与标签的对应关系,通过标记模块记录至标签对应表R_TABLE_LABEL。
(4)在初次标签化完毕以后,用户可以对已有标签进行完善和分类。标签的完善主要涉及标签的标准化工作,由于数据可能由多个信息***产生,不同业务领域的用户对同一实体的或存在不同的称谓,在用户自定义标签的过程中,导致出现不同名而同义的标签,在此环节通过标签的标准化,对这部分标签进行合并和统一,并更新标签对应表R_TABLE_LABEL中的标签名称字段。标签的分类主要涉及对标签本身的类型划分,在实际的使用过程中用于缩小筛选范围,提高查询效率。
(5)通过表展示模块,对已标签化的表,按照标签进行查看。
上述具体的实施方式仅是本发明具体的个案,本发明的专利保护范围包括但不限于上述具体的实施方式,任何符合本发明的一种数据分类管理的方法及***权利要求书的且任何所述技术领域普通技术人员对其做出的适当变化或者替换,皆应落入本发明的专利保护范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种数据分类管理的方法,其特征在于,用户对未标签化表进行标签标记,检查是否存在未标记表,若存在,则检查是否已尝试预定义标签,若已尝试,则进行自动化标记,若没有尝试,则进行人工标记;
若不存在,则需要完善标签或者标签分类,对表进行展示;
用户对未标签化表进行标签标记之前,首先要在数据库中创建标签对应表来存放数据表和标签的对应关系,并创建预定义标签表,按照具体业务规则初始化标明前缀与标签的对应关系;
在标签对应表中包括的字段名为TABLE_NAME、LABEL_NAME、LABEL_TYPE和PREFIX_CHECK;
在预定义标签表中包括的字段名为TABLE_PREFIX、LABEL_NAME和LABEL_TYPE;
检查是否存在未标记表,根据用户定义的周期,对所需管理的数据库的表进行巡检操作,根据对比***表列表和标签对应表,检查是否存在未标签化的表;
若存在未标签化的表,则对其检查是否存在PREFIX_CHECK字段,且PREFIX_CHECK字段是否为空,即未经过预定义标签化流程;
若符合此类情况,则结合预定义标签表,对表进行打标签操作;
如果PREFIX_CHECK字段不为空,即已经过预定义标签化流程,则通知用户对未标签化的表进行自定义打标签的处理,所有预定义或自定义的表与标签的对应关系,记录至标签对应表。
2.根据权利要求1所述的一种数据分类管理方法,其特征在于,在初次标签化完毕之后,用户对已有标签进行完善和分类,通过标签的标准化,对这部分标签进行合并和统一,并更新标签对应表中的标签名称字段。
3.一种数据分类管理***,其特征在于,包括巡检模块、标记模块、警告模块和表展示模块,所述巡检模块用于根据用户定义的周期,对所需管理的数据库内的表进行巡检操作;
所述标记模块用于 对表进行打标签操作;所述警告模块用于通知用户对未标签化的表进行自定义打标签处理;所述表展示模块,用于对已标签化的表按照标签进行查看;
在数据库中创建标签对应表,用于后续存放数据表和标记对应关系,且在数据库中创建预定义标签表,按照具体业务规则初始化表名前缀与标签的对应关系;
在标签对应表中包括的字段名为TABLE_NAME、LABEL_NAME、LABEL_TYPE和PREFIX_CHECK;
在预定义标签表中包括的字段名为TABLE_PREFIX、LABEL_NAME和LABEL_TYPE;
所述巡检模块用于根据用户定义的周期,对所需管理的数据库内的表进行巡检操作,根据对比***表列表和标签对应表,检查是否存在未标签化的表;
若存在未标签化的表,则对其检查是否存在PREFIX_CHECK字段,且PREFIX_CHECK字段是否为空,即未经过预定义标签化流程;
若符合此类情况,则结合预定义标签表,通过标记模块对表进行打标签操作;
如果PREFIX_CHECK字段不为空,即已经过预定义标签化流程,则警告模块用于通知用户对未标签化的表进行自定义打标签的处理;
所有预定义或自定义的表与标签的对应关系,通过标记模块记录至标签对应表。
4.根据权利要求3所述的一种数据分类管理***,其特征在于,在初次标签化完成以后,用户对已有标签进行完善和分类,通过标签的标准化,对这部分标签进行合并和统一,并更新标签对应表中的标签名称字段。
CN202010696437.9A 2020-07-20 2020-07-20 一种数据分类管理的方法及*** Active CN111782736B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010696437.9A CN111782736B (zh) 2020-07-20 2020-07-20 一种数据分类管理的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010696437.9A CN111782736B (zh) 2020-07-20 2020-07-20 一种数据分类管理的方法及***

Publications (2)

Publication Number Publication Date
CN111782736A CN111782736A (zh) 2020-10-16
CN111782736B true CN111782736B (zh) 2022-07-26

Family

ID=72763547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010696437.9A Active CN111782736B (zh) 2020-07-20 2020-07-20 一种数据分类管理的方法及***

Country Status (1)

Country Link
CN (1) CN111782736B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239539A (zh) * 2017-06-02 2017-10-10 山东浪潮商用***有限公司 一种基于关系型数据库的自定义建模方法
CN110750514A (zh) * 2019-09-17 2020-02-04 福建天泉教育科技有限公司 一种为主数据打标签的方法及终端
CN111090656A (zh) * 2020-03-23 2020-05-01 北京大数元科技发展有限公司 一种动态构建对象画像的方法及***
CN111191125A (zh) * 2019-12-24 2020-05-22 长威信息科技发展股份有限公司 一种基于标签化的数据分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239539A (zh) * 2017-06-02 2017-10-10 山东浪潮商用***有限公司 一种基于关系型数据库的自定义建模方法
CN110750514A (zh) * 2019-09-17 2020-02-04 福建天泉教育科技有限公司 一种为主数据打标签的方法及终端
CN111191125A (zh) * 2019-12-24 2020-05-22 长威信息科技发展股份有限公司 一种基于标签化的数据分析方法
CN111090656A (zh) * 2020-03-23 2020-05-01 北京大数元科技发展有限公司 一种动态构建对象画像的方法及***

Also Published As

Publication number Publication date
CN111782736A (zh) 2020-10-16

Similar Documents

Publication Publication Date Title
CN111459985A (zh) 标识信息处理方法及装置
CN108376364A (zh) 一种支付***对账的方法、设备及终端设备
CN111506559A (zh) 数据存储方法、装置、电子设备及存储介质
CN112100181B (zh) 一种基于沙盘的数据资源管理方法
CN112508671A (zh) 一种企业财务数据处理方法、***、装置及介质
CN112800755A (zh) 一种数据治理方法及***
CN116205396A (zh) 一种基于数据中台的数据全景监控方法及***
CN115809653A (zh) 一种智能合同审核方法及***
CN104766240A (zh) 电子银行业务数据处理***及方法
CN114969040A (zh) 一种数据展示方法、装置、电子设备及存储介质
US10922328B2 (en) Method and system for implementing an on-demand data warehouse
CN113673889A (zh) 一种智能化数据资产识别的方法
CN111782736B (zh) 一种数据分类管理的方法及***
CN112669133A (zh) 一种根据应用场景自动匹配的智能费控报销方法
CN115952160B (zh) 一种数据盘点方法
CN113568873B (zh) 一种政策文件智能匹配方法及装置
CN113344527B (zh) 一体化管理存储司法建议信息的方法及平台
CN112000870A (zh) 一种基于用户信息的申报方案生成方法及***
CN111026705A (zh) 建筑工程文件管理方法、***及终端设备
CN118071304B (zh) 一种工程项目资料管理方法、装置、设备及可读存储介质
CN110928979B (zh) 管理技术元数据的方法和装置
CN118313133A (zh) 基于PloughCAE模型的螺栓自动化标签构建方法、***及存储介质
CN115689786A (zh) 基于行业特征的财务报销核查方法、介质、设备和***
CN115774997A (zh) 代用物资确定方法、***及设备
CN112766889A (zh) 一种工作任务动态分类管理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant