CN116894113A - 基于深度学习的数据安全分类方法及数据安全管理*** - Google Patents

基于深度学习的数据安全分类方法及数据安全管理*** Download PDF

Info

Publication number
CN116894113A
CN116894113A CN202310875777.1A CN202310875777A CN116894113A CN 116894113 A CN116894113 A CN 116894113A CN 202310875777 A CN202310875777 A CN 202310875777A CN 116894113 A CN116894113 A CN 116894113A
Authority
CN
China
Prior art keywords
data
model
neural network
hidcnn
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310875777.1A
Other languages
English (en)
Inventor
吉欣晨
曹孙佳
程威威
谢俊杰
仇成群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yancheng Teachers University
Original Assignee
Yancheng Teachers University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yancheng Teachers University filed Critical Yancheng Teachers University
Priority to CN202310875777.1A priority Critical patent/CN116894113A/zh
Publication of CN116894113A publication Critical patent/CN116894113A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于深度学习的数据安全分类方法及数据安全管理***,该方法包括以下步骤:S1、通过大数据配置中心获取业务信息***中对应的业务数据;S2、对业务数据进行预处理,并对处理后的业务数据进行存储;S3、构建新型卷积神经网络HIDCNN组合模型;S4、对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型;S5、根据训练后的新型卷积神经网络HIDCNN组合模型对数据进行分级分类。本发明将采集到的原始数据转换为所需的目标信息,在采集完成后,对数据进行清洗转换,提高了数据的安全性,避免发生数据丢失。

Description

基于深度学习的数据安全分类方法及数据安全管理***
技术领域
本发明涉及数据安全分类技术领域,具体来说,涉及基于深度学习的数据安全分类方法及数据安全管理***。
背景技术
深度学习是一种机器学习的分支,旨在通过模仿人脑的神经网络结构和功能,学习数据的特征和模式,从而实现人工智能的目标,深度学习的核心是深度神经网络,它由多个神经元层组成,每层之间通过权重进行连接,以便从输入数据中提取有意义的特征。这些特征进一步用于分类、回归、聚类等任务。深度学习通过模拟人类大脑的工作方式构建深度神经网络来学习样本数据的内在规律和表示层次,是一种实现人工智能的新方法,使机器能够模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能技术取得了很大进步。
机器学习通过解析数据、采用相应的算法模型从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。作为机器学习领域的最新分支,深度学习本身也会用到有监督和无监督的学习方法来训练深度神经网络。近几年该领域发展迅猛,一些特有的学习手段相继被提出(如卷积网络、残差网络、对抗网络等),因此越来越多的研究者利用深度神经网络来解决特定领域的特征表达学习。深度神经网络包含多个隐含层,通过多层处理,逐渐将初始的“低层”特征表示转化为“高层”特征表示后,用“简单模型”即可完成复杂的分类等学习任务。
在数据治理领域,常需要数据管理员对数据根据应用场景及数据内容进行分级分类,但是人工对数据实现分级分类不仅耗费大量的人力,效率低下,同时无法适用于需要实时对具有大量数据类别的海量数据进行实时分级分类场景,且在分类过程中数据的安全也得不到保障,易造成数据信息外漏,此时,为了解决上述问题,亟需一种能够提高数据安全分级分类的方法。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种基于深度学习的数据安全分类方法,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
一种基于深度学习的数据安全分类方法,该方法包括以下步骤:
S1、通过大数据配置中心获取业务信息***中对应的业务数据;
S2、对业务数据进行预处理,并对处理后的业务数据进行存储;
S3、构建新型卷积神经网络HIDCNN组合模型;
S4、对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型;
S5、根据训练后的新型卷积神经网络HIDCNN组合模型对数据进行分级分类。
进一步的,所述对业务数据进行预处理,并对处理后的业务数据进行存储包括以下步骤:
S21、对业务数据进行数据整合并形成统一的数据集;
S22、对数据集中的数据进行数据清洗,并将不同格式的数据进行统一转换;
S23、对数据集中的数据进行聚类化处理;
S24、验证处理完成的数据是否准确,并将处理完成的数据进行存储至对应位置,得到所需的目标数据;
S25、将得到的目标数据进行备份。
进一步的,所述对数据集中的数据进行聚类化处理包括以下步骤:
S231、在原始数据中找出多个数据点中两两之间的相似性,得到相似度矩阵A;
S232、计算矩阵D,使矩阵D对角元是相似度矩阵A的对应的列值之和,令矩阵B=D-A,求B矩阵的某个本征值与本征矢,并将数据点投影至一个K维空间;
S233、根据每个数据点的K维空间坐标,在K维空间内对数据进行聚类。
进一步的,所述根据每个数据点的K维空间坐标,在K维空间内对数据进行聚类包括以下步骤:
S2331、随机找出多个中心位置,将每个数据点归类至与其最近的中心;
S2332、将数据点划分为若干组簇,并找到每个簇的中心点,并且利用最小化函数,将中心转移到簇内部数据点的平均位置。
进一步的,所述将得到的目标数据进行备份包括以下步骤:
S251、拷贝目标数据至备份目录中,将需要备份的表空间开始备份模式;
S252、同时拷贝表空间并将表空间置于结束备份模式中;
S253、对数据库中的每个表空间执行S251与S252步骤;
S254、通过在svrmgrl上执行命令获取当前的数据顺序号,并执行命令强迫数据切换,便于所有的数据都被归档。
进一步的,所述构建新型卷积神经网络HIDCNN组合模型包括以下步骤:
S31、将模型架构分为混合特征输入层和模型主体框架层;
S32、混合特征输入层采用分类目标向量和随即初始化空间向量的方式,并将数据转换为连续空间向量,作为模型的输入向量;
S33、模型主体框架层选择模型类型为文本分类模型,将迭代式空洞卷积神经网络引入;
S34、将高速神经网络与IDCNN结合构建新型卷积神经网络HIDCNN组合模型;
S35、采用迭代法堆叠DCNN网络块,构成迭代式空洞卷积神经网络;
S36、将Highway网络作为空洞卷积神经网络和Softmax分类层的连接层,构成基于HIDCNN的分级分类模型,同时优化卷积层提取的特征;
S37、HIDCNN的分级分类模型连接Dropout层和Softmax分类层,构成完整的分类模型。
进一步的,所述HIDCNN的计算公式为:
Yi=H(hi-1,WH)*T(hi-1,WT)+hi-1*C(hi-1,WC)
式中,hi为第i层Highway层输出向量;
H为非线性仿射变换函数;
T为转换门;
C为携带门;
且T与C均为双曲正切函数,C为1-T。
进一步的,所述对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型包括以下步骤:
S41、定义数据安全分级分类的目标;
S42、使用目标对对新型卷积神经网络HIDCNN组合模型进行训练;
S44、对训练完成的模型进行评估与调整。
进一步的,所述定义数据安全分级分类的目标包括以下步骤:
S411、从数据签中集中取出m个样本构成分级分类目标样本,将其余数据样本组成的集合记为N;
S412、采用QP方法对目标样本求解最优化问题,得到支持向量,并构成一组分类目标;
S413、用分类目标测试集合N中的样本,若N中的样本为空集则结束,反之则继续;
S414、将集合N中不满足最优化条件的样本放入目标样本中,同时从目标样本中取出同样数量的样本放入集合N中;
S415、重复步骤S412,定义多组分类目标。
进一步的,所述使用目标对对新型卷积神经网络HIDCNN组合模型进行训练包括以下步骤:
S421、将分类目标构成数据集作为训练数据,获得初始训练模型;
S422、对所述初始训练模型进行评估,取得评估中产生的异常数据集;
S423、对取得的异常数据集进行分组,获得多个异常数据集组;
S424、按照获得的异常数据集组,确定模型训练信息;
S425、依据训练结果不断调整检测模型参数,直至检测模型训练准确性及损失率最优,即检测模型训练完毕。
本发明的有益效果为:
1、本发明以原始业务信息***数据源为初始数据与深度学习方法相结合,根据需要,将数据动态调整分级,实现业务信息***数据的自动化分级,可以实时对不同业务信息***的数据进行分级标记,提高数据管理员的工作效率。
2、本发明通过使用新型卷积神经网络HIDCNN组合模型来调节不同级数据的判别标准,可达到按照不同业务信息***的不同数据安全要求来输出标记不同的业务分级数据,还通过对数据进行聚类处理,可以使得数据更易于理解和分析,减少数据处理的复杂性,并且可以提高分级分类模型的准确性。
3、本发明将采集到的原始数据转换为所需的目标信息,在采集完成后,对数据进行清洗转换,不仅能够便于提取出有价值的信息,使数据更加准确、完整和一致,使得数据可以被更好地利用和分析,从而提高数据分析的质量和效率,还将处理完成的数据进行备份,提高了数据的安全性,避免发生数据丢失。
4、本发明使用新型卷积神经网络HIDCNN组合模型,在模型构建完成后使用数据对模型进行训练,并验证数据来调整模型参数和防止过拟合,同时使用测试数据来评估模型的性能,根据需要进行调整,最终对模型进行持续监控,保证分级分类的准确性和模型的性能,在需要时能够进行修复和更新。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种基于深度学习的数据安全分类方法流程图。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
根据本发明的实施例,提供了一种基于深度学习的数据安全分类方法。
现结合附图和具体实施方式对本发明进一步说明,如图1所示,根据本发明实施例的基于深度学习的数据安全分类方法,该方法包括以下步骤:
S1、通过大数据配置中心获取业务信息***中对应的业务数据。
S2、对业务数据进行预处理,并对处理后的业务数据进行存储。
具体的,对业务数据进行预处理,并对处理后的业务数据进行存储。
具体的,所述对业务数据进行预处理,并对处理后的业务数据进行存储包括以下步骤:
S21、对业务数据进行数据整合并形成统一的数据集;
数据合并指的是将多个数据集中的数据合并成一个数据集,这通常是为了将不同来源或格式的数据组合在一起,以便进行更全面的数据分析或处理。
S22、对数据集中的数据进行数据清洗,并将不同格式的数据进行统一转换。
具体的,数据转换是指将一种数据格式或类型转换为另一种数据格式或类型的过程。在计算机科学中,数据转换通常涉及到将数据从一个编程语言、文件格式、数据库类型、网络协议等转换到另一个。
数据转换可以是单向的,即将数据从一种格式转换到另一种格式,也可以是双向的,即将数据在两种格式之间相互转换。例如,将一个字符串转换为数字,将一个JSON对象转换为XML格式等都是数据转换的例子。
数据转换通常需要使用专门的工具或库来完成。常见的数据转换工具包括编程语言自带的数据类型转换函数、第三方库如Pandas和NumPy、ETL工具如Talend和Informatica等。
S23、对数据集中的数据进行聚类化处理;
具体的,所谓聚类就是将相似的事物聚集在一起,而将不相似的事物划分到不同的类别的过程,其是数据分析之中十分重要的一种手段。
其中,所述对数据集中的数据进行聚类化处理包括以下步骤:
S231、在原始数据中找出多个数据点中两两之间的相似性,得到相似度矩阵A;
S232、计算矩阵D,使矩阵D的对角元是相似度矩阵A的对应的列值之和,令矩阵B=D-A,求B矩阵的某个本征值与本征矢,并将数据点投影至一个K维空间;
具体的,
D(i,i)=∑jA(i,j)
其中,i与j为数据点。
具体的,在对数据集中的数据进行聚类化时,首先给出N个数据点两两之间的相似性,也就是一个N*N的相似性矩阵A,A(i,j)代表i和j两个数据点的相似度,数值越大则表示越相似,注意
A(i,j)=A(j,i),A(i,j)=0。
进而计算矩阵D,使它的对角元是A矩阵的对应的那一列(或行)的值之和,其余地方为0,也就是使得
D(i,i)=∑jA(i,j)
令B=D-A,B矩阵的前k个本征值和本征矢,将数据点投影到一个k维空间,第i本征矢的第j个值,就表示第j个数据点在k维空间中第i维的投影,就是说如果把k个特征矢量并成一个N*k的矩阵,则每一行代表一个数据点在k维空间的坐标,根据每个数据点的k维空间坐标,再聚类算法在k维空间对数据进行聚类。
S233、根据每个数据点的K维空间坐标,在K维空间内对数据进行聚类。
具体的,所述根据每个数据点的K维空间坐标,在K维空间内对数据进行聚类包括以下步骤:
S2331、随机找出多个中心位置,将每个数据点归类至与其最近的中心;
S2332、将数据点划分为若干组簇,并找到每个簇的中心点,并且利用最小化函数,将中心转移到簇内部数据点的平均位置。
通过对数据进行聚类处理,可以使得数据更易于理解和分析,减少数据处理的复杂性,并且可以提高分级分类模型的准确性。
S24、验证处理完成的数据是否准确,并将处理完成的数据进行存储至对应位置,得到所需的目标数据;
S25、将得到的目标数据进行备份。
其中,所述将得到的目标数据进行备份包括以下步骤:
S251、拷贝目标数据至备份目录中,将需要备份的表空间开始备份模式;
S252、同时拷贝表空间并将表空间置于结束备份模式中;
S253、对数据库中的每个表空间执行S251与S252步骤;
S254、通过在svrmgrl上执行命令获取当前的数据顺序号,并执行命令强迫数据切换,便于所有的数据都被归档。
将采集到的原始数据转换为所需的目标信息,在采集完成后,对数据进行清洗转换,不仅能够便于提取出有价值的信息,使数据更加准确、完整和一致,使得数据可以被更好地利用和分析,从而提高数据分析的质量和效率。还将处理完成的数据进行备份,提高了数据的安全性,避免发生数据丢失。
S3、构建新型卷积神经网络HIDCNN组合模型。
具体的,所述构建新型卷积神经网络HIDCNN组合模型包括以下步骤:
S31、将模型架构分为混合特征输入层和模型主体框架层;
S32、混合特征输入层采用分类目标向量和随即初始化空间向量的方式,并将数据转换为连续空间向量,作为模型的输入向量;
S33、模型主体框架层选择模型类型为文本分类模型,将迭代式空洞卷积神经网络引入;
S34、将高速神经网络与IDCNN结合构建新型卷积神经网络HIDCNN组合模型;
S35、采用迭代法堆叠DCNN网络块,构成迭代式空洞卷积神经网络;
S36、将Highway网络作为空洞卷积神经网络和Softmax分类层的连接层,构成基于HIDCNN的分级分类模型,同时优化卷积层提取的特征;
S37、HIDCNN的分级分类模型连接Dropout层和Softmax分类层,构成完整的分类模型。
其中,所述HIDCNN的计算公式为:
Yi=H(hi-1,WH)*T(hi-1,WT)+hi-1*C(hi-1,WC)
式中,hi为第i层Highway层输出向量;
H为非线性仿射变换函数;
T为转换门;
C为携带门;
且T与C均为双曲正切函数,C为1-T。
S4、对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型。
具体的,所述对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型包括以下步骤:
S41、定义数据安全分级分类的目标。
其中,所述定义数据安全分级分类的目标包括以下步骤:
S411、从数据签中集中取出m个样本构成分级分类目标样本,将其余数据样本组成的集合记为N;
S412、采用QP方法对目标样本求解最优化问题,得到支持向量,并构成一组分类目标;
S413、用分类目标测试集合N中的样本,若N中的样本为空集则结束,反之则继续;
S414、将集合N中不满足最优化条件的样本放入目标样本中,同时从目标样本中取出同样数量的样本放入集合N中;
S415、重复步骤S412,定义多组分类目标。
具体的,数据安全分级分类的主要目标是确保数据的机密性、完整性和可用性,并简化数据管理过程。
通过将数据分为不同级别,可以将数据分开管理,并为其提供更高的安全保护措施,从而保护数据的机密性,在分类数据时数据分级分类可以确保重要数据的完整性,防止数据被篡改或损坏,便于数据管理,通过对数据进行分类,可以更轻松地对数据进行管理,从而简化数据管理流程。
S42、使用目标对对新型卷积神经网络HIDCNN组合模型进行训练。
其中,所述使用目标对对新型卷积神经网络HIDCNN组合模型进行训练包括以下步骤:
S421、将分类目标构成数据集作为训练数据,获得初始训练模型;
S422、对所述初始训练模型进行评估,取得评估中产生的异常数据集;
S423、对取得的异常数据集进行分组,获得多个异常数据集组;
S424、按照获得的异常数据集组,确定模型训练信息;
S425、依据训练结果不断调整检测模型参数,直至检测模型训练准确性及损失率最优,即检测模型训练完毕。
S43、对训练完成的模型进行评估与调整。
具体的使用测试数据来评估模型的性能,根据需要进行调整,最终对模型进行持续监控,保证分级分类的准确性和模型的性能,在需要时能够进行修复和更新。
S5、根据训练后的新型卷积神经网络HIDCNN组合模型对数据进行分级分类。
具体的,在使用时可结合分类的结构对模型进行监控,对模型监控是指对分级分类模型进行定期监控、分析和评估,以确保其在生产环境中的良好表现和正确性,通过对模型进行监控,可以及时发现和处理模型的问题,从而提高模型的性能和可靠性,保证其在生产环境中的有效性。
监控可以涵盖以下方面:
数据质量监控:检查输入数据的质量,例如检查数据是否有缺失、异常值和重复值等。
模型性能监控:监测模型在生产环境中的表现,例如模型的准确性、精确度、召回率等指标。
实时预测监控:监测模型的实时预测结果,以检测模型是否出现了异常行为或偏差。
可解释性监控:通过监测模型的解释能力来确保其预测结果的正确性和可靠性。
安全监控:监控模型是否受到攻击或滥用,例如对抗性攻击或数据泄露等。
自适应监控:对模型进行自适应监控和反馈,以便在出现新的数据分布或概念漂移时及时更新模型。
综上所述,借助于本发明的上述技术方案,本发明以原始业务信息***数据源为初始数据与深度学习方法相结合,根据需要,将数据动态调整分级,实现业务信息***数据的自动化分级,可以实时对不同业务信息***的数据进行分级标记,提高数据管理员的工作效率。本发明通过使用新型卷积神经网络HIDCNN组合模型来调节不同级数据的判别标准,可达到按照不同业务信息***的不同数据安全要求来输出标记不同的业务分级数据,还通过对数据进行聚类处理,可以使得数据更易于理解和分析,减少数据处理的复杂性,并且可以提高分级分类模型的准确性。本发明将采集到的原始数据转换为所需的目标信息,在采集完成后,对数据进行清洗转换,不仅能够便于提取出有价值的信息,使数据更加准确、完整和一致,使得数据可以被更好地利用和分析,从而提高数据分析的质量和效率,还将处理完成的数据进行备份,提高了数据的安全性,避免发生数据丢失。本发明使用新型卷积神经网络HIDCNN组合模型,在模型构建完成后使用数据对模型进行训练,并验证数据来调整模型参数和防止过拟合,同时使用测试数据来评估模型的性能,根据需要进行调整,最终对模型进行持续监控,保证分级分类的准确性和模型的性能,在需要时能够进行修复和更新。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于深度学习的数据安全分类方法,其特征在于,该方法包括以下步骤:
S1、通过大数据配置中心获取业务信息***中对应的业务数据;
S2、对业务数据进行预处理,并对处理后的业务数据进行存储;
S3、构建新型卷积神经网络HIDCNN组合模型;
S4、对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型;
S5、根据训练后的新型卷积神经网络HIDCNN组合模型对数据进行分级分类。
2.根据权利要求1所述的一种基于深度学习的数据安全分类方法,其特征在于,所述对业务数据进行预处理,并对处理后的业务数据进行存储包括以下步骤:
S21、对业务数据进行数据整合并形成统一的数据集;
S22、对数据集中的数据进行数据清洗,并将不同格式的数据进行统一转换;
S23、对数据集中的数据进行聚类化处理;
S24、验证处理完成的数据是否准确,并将处理完成的数据进行存储至对应位置,得到所需的目标数据;
S25、将得到的目标数据进行备份。
3.根据权利要求2所述的一种基于深度学习的数据安全分类方法,其特征在于,所述对数据集中的数据进行聚类化处理包括以下步骤:
S231、在原始数据中找出多个数据点中两两之间的相似性,得到相似度矩阵A;
S232、计算矩阵D,使矩阵D的对角元是相似度矩阵A的对应的列值之和,令矩阵B=D-A,求B矩阵的某个本征值与本征矢,并将数据点投影至一个K维空间;
S233、根据每个数据点的K维空间坐标,在K维空间内对数据进行聚类。
4.根据权利要求3所述的一种基于深度学习的数据安全分类方法,其特征在于,所述根据每个数据点的K维空间坐标,在K维空间内对数据进行聚类包括以下步骤:
S2331、随机找出多个中心位置,将每个数据点归类至与其最近的中心;
S2332、将数据点划分为若干组簇,并找到每个簇的中心点,并且利用最小化函数,将中心转移到簇内部数据点的平均位置。
5.根据权利要求2所述的一种基于深度学习的数据安全分类方法,其特征在于,所述将得到的目标数据进行备份包括以下步骤:
S251、拷贝目标数据至备份目录中,将需要备份的表空间开始备份模式;
S252、同时拷贝表空间并将表空间置于结束备份模式中;
S253、对数据库中的每个表空间执行S251与S252步骤;
S254、通过在svrmgrl上执行命令获取当前的数据顺序号,并执行命令强迫数据切换,便于所有的数据都被归档。
6.根据权利要求1所述的一种基于深度学习的数据安全分类方法,其特征在于,所述构建新型卷积神经网络HIDCNN组合模型包括以下步骤:
S31、将模型架构分为混合特征输入层和模型主体框架层;
S32、混合特征输入层采用分类目标向量和随即初始化空间向量的方式,并将数据转换为连续空间向量,作为模型的输入向量;
S33、模型主体框架层选择模型类型为文本分类模型,将迭代式空洞卷积神经网络引入;
S34、将高速神经网络与IDCNN结合构建新型卷积神经网络HIDCNN组合模型;
S35、采用迭代法堆叠DCNN网络块,构成迭代式空洞卷积神经网络;
S36、将Highway网络作为空洞卷积神经网络和Softmax分类层的连接层,构成基于HIDCNN的分级分类模型,同时优化卷积层提取的特征;
S37、HIDCNN的分级分类模型连接Dropout层和Softmax分类层,构成完整的分类模型。
7.根据权利要求1所述的一种基于深度学习的数据安全分类方法,其特征在于,所述对新型卷积神经网络HIDCNN组合模型进行训练,得到训练后的新型卷积神经网络HIDCNN组合模型包括以下步骤:
S41、定义数据安全分级分类的目标;
S42、使用目标对对新型卷积神经网络HIDCNN组合模型进行训练;
S43、对训练完成的模型进行评估与调整。
8.根据权利要求7所述的一种基于深度学习的数据安全分类方法,其特征在于,所述定义数据安全分级分类的目标包括以下步骤:
S411、从数据签中集中取出m个样本构成分级分类目标样本,将其余数据样本组成的集合记为N;
S412、采用QP方法对目标样本求解最优化问题,得到支持向量,并构成一组分类目标;
S413、用分类目标测试集合N中的样本,若N中的样本为空集则结束,反之则继续;
S414、将集合N中不满足最优化条件的样本放入目标样本中,同时从目标样本中取出同样数量的样本放入集合N中;
S415、重复步骤S412,定义多组分类目标。
9.根据权利要求8所述的一种基于深度学习的数据安全分类方法,其特征在于,所述使用目标对对新型卷积神经网络HIDCNN组合模型进行训练包括以下步骤:
S421、将分类目标构成数据集作为训练数据,获得初始训练模型;
S422、对所述初始训练模型进行评估,取得评估中产生的异常数据集;
S423、对取得的异常数据集进行分组,获得多个异常数据集组;
S424、按照获得的异常数据集组,确定模型训练信息;
S425、依据训练结果不断调整检测模型参数,直至检测模型训练准确性及损失率最优,即检测模型训练完毕。
CN202310875777.1A 2023-07-17 2023-07-17 基于深度学习的数据安全分类方法及数据安全管理*** Pending CN116894113A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310875777.1A CN116894113A (zh) 2023-07-17 2023-07-17 基于深度学习的数据安全分类方法及数据安全管理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310875777.1A CN116894113A (zh) 2023-07-17 2023-07-17 基于深度学习的数据安全分类方法及数据安全管理***

Publications (1)

Publication Number Publication Date
CN116894113A true CN116894113A (zh) 2023-10-17

Family

ID=88314639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310875777.1A Pending CN116894113A (zh) 2023-07-17 2023-07-17 基于深度学习的数据安全分类方法及数据安全管理***

Country Status (1)

Country Link
CN (1) CN116894113A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117271679A (zh) * 2023-11-22 2023-12-22 华信咨询设计研究院有限公司 一种基于训练模型的数据库表分类分级方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117271679A (zh) * 2023-11-22 2023-12-22 华信咨询设计研究院有限公司 一种基于训练模型的数据库表分类分级方法及***

Similar Documents

Publication Publication Date Title
Bashar et al. TAnoGAN: Time series anomaly detection with generative adversarial networks
CN109800875A (zh) 基于粒子群优化和降噪稀疏编码机的化工故障检测方法
CN107133569A (zh) 基于泛化多标记学习的监控视频多粒度标注方法
CN111127385A (zh) 基于生成式对抗网络的医学信息跨模态哈希编码学习方法
CN107292097B (zh) 基于特征组的中医主症选择方法
CN104636751A (zh) 基于时间递归神经网络的人群异常检测和定位***及方法
CN108182445A (zh) 基于大数据智能核独立元分析的过程故障识别方法
Luan et al. Out-of-distribution detection for deep neural networks with isolation forest and local outlier factor
Khalid Activity classification and anomaly detection using m-mediods based modelling of motion patterns
CN116894113A (zh) 基于深度学习的数据安全分类方法及数据安全管理***
CN116227624A (zh) 面向异构模型的联邦知识蒸馏方法和***
Wang et al. R2-trans: Fine-grained visual categorization with redundancy reduction
CN115373879A (zh) 一种面向大规模云数据中心智能运维的磁盘故障预测方法
Zhang et al. Zero-small sample classification method with model structure self-optimization and its application in capability evaluation
CN108664607A (zh) 一种基于迁移学习的电力通信网数据质量提升方法
CN116665054A (zh) 一种基于改进YOLOv3的遥感影像小目标检测方法
CN116306969A (zh) 基于自监督学习的联邦学习方法和***
CN110045691A (zh) 一种多源异构大数据的多任务处理故障监测方法
CN115293249A (zh) 一种基于动态时序预测的电力***典型场景概率预测方法
Guo et al. Zero-sample surface defect detection and classification based on semantic feedback neural network
CN110855467B (zh) 一种基于计算机视觉技术的网络综合态势预测方法
CN116861175B (zh) 一种基于神经网络的运行轨迹校正方法
Li et al. On Testing and Evaluation of Artificial Intelligence Models
CN111881942B (zh) 一种基于压缩学习的目标分类方法及***
US20240135547A1 (en) A data-generating procedure from raw tracking inputs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination