CN113127881A

CN113127881A - 一种基于大数据的数据安全处理方法

Info

Publication number: CN113127881A
Application number: CN202110421989.3A
Authority: CN
Inventors: 刘忠利
Original assignee: Chongqing College of Electronic Engineering
Current assignee: Chongqing College of Electronic Engineering
Priority date: 2021-04-20
Filing date: 2021-04-20
Publication date: 2021-07-16

Abstract

本发明公开了一种基于大数据的数据安全处理方法，包括以下步骤：步骤一，生成密钥；步骤二，构建模型；步骤三，优化模型；步骤四，数据采集；步骤五，数据加密；步骤六，数据解密；该发明用公开密钥加密法处理采集数据，从而降低了传输过程中数据被恶意窃取和篡改的风险，确保了数据的可用性、完整性和保密性，保障了数据的流通安全，且利用大数据构建安全漏洞分析模型，对数据进行全面的安全漏洞分析，并匹配合适的加密方法，从而扩大了加密方法针对的安全漏洞范围，提高了加密方法的加密效果，防止数据因未知的安全漏洞遭到破坏、更改和泄露，适用范围广、可靠性强、保密等级高，降低了数据的安全风险。

Description

一种基于大数据的数据安全处理方法

技术领域

本发明涉及大数据处理技术领域，具体为一种基于大数据的数据安全处理方法。

背景技术

数据安全处理，顾名思义就是通过采用各种安全防护技术，使数据在采集、存储、检索、加工、变换和传输的过程中不会发生增加、修改、丢失和泄露等问题，确保数据的可用性、完整性和保密性，保障数据的流通安全。

然而，传统的数据安全处理方法大多未对采集的数据进行加密处理，数据在传输过程中容易被恶意窃取和篡改，破坏了数据的可用性、完整性和保密性，影响了数据的流通安全，而少数进行加密处理的，只能根据本地已知的数据安全漏洞选择加密方法，针对的安全漏洞范围有限，加密效果不足，当遇到本地未知的数据安全漏洞时，数据容易在处理过程中遭到破坏、更改和泄露，适用范围小、可靠性差、保密等级低，存在一定的安全隐患。

因此，设计一种基于大数据的数据安全处理方法是很有必要的。

发明内容

本发明的目的在于提供一种基于大数据的数据安全处理方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种基于大数据的数据安全处理方法，包括以下步骤：步骤一，生成密钥；步骤二，构建模型；步骤三，优化模型；步骤四，数据采集；步骤五，数据加密；步骤六，数据解密；

其中在上述步骤一中，数据云端根据待处理数据的特征，从大数据中筛选出大量具有对应特征的原始数据、原始数据具备的安全漏洞以及安全漏洞可用的加密方法，并根据加密方法的不同生成相应的密钥对；

其中在上述步骤二中，将步骤一中得到的原始数据划分成训练集数据和测试集数据，利用决策树算法对训练集数据以及步骤一中得到的安全漏洞和加密方法进行逻辑计算，构建出原始分析模型；

其中在上述步骤三中，将步骤二中得到的测试集数据代入步骤二中得到的原始分析模型中，通过评价指标评估原始分析模型判断结果的好坏，并通过代价复杂性剪枝法得到安全漏洞分析模型；

其中在上述步骤四中，数据终端关闭常规输入程序，并启用安全输入程序，引导用户进行数据输入操作，采集完毕后得到输入数据；

其中在上述步骤五中，数据终端调用数据云端从步骤三中得到的安全漏洞分析模型，对步骤四中得到的输入数据进行安全漏洞分析，根据步骤一中得到的密钥对判断出与输入数据相匹配的密钥对，再通过密钥对中的公钥对输入数据进行加密，得到加密数据；

其中在上述步骤六中，数据终端通过加密网络将步骤五中得到的加密数据上传至数据云端，数据云端再通过密钥对中的私钥对加密数据进行解密，得到解密数据。

根据上述技术方案，所述步骤一中，密钥对由加密公钥和解密私钥组成，且加密公钥和解密私钥分别保存在数据终端和数据云端。

根据上述技术方案，所述步骤二中，训练集数据和测试集数据分别占原始数据的70%和30%。

根据上述技术方案，所述步骤二中，决策树算法选用分类回归决策树算法。

根据上述技术方案，所述步骤三中，评价指标为正确率、查全率、查准率和AUC值四项。

根据上述技术方案，所述步骤三中，代价复杂性剪枝法先剪去原始分析模型决策树中判断结果坏的支干，再保留原始分析模型决策树中判断结果好的主干。

根据上述技术方案，所述步骤五中，安全漏洞分析先得出输入数据所有安全漏洞可用的多个加密方法，并优选出其中为映射合集的最佳加密方法，再对最佳加密方法进行密钥对匹配。

与现有技术相比，本发明所达到的有益效果是：该基于大数据的数据安全处理方法，用公开密钥加密法处理采集数据，从而降低了传输过程中数据被恶意窃取和篡改的风险，确保了数据的可用性、完整性和保密性，保障了数据的流通安全；利用大数据构建安全漏洞分析模型，为加密方法提供科学支持从而扩大了加密方法针对的安全漏洞范围，提高了加密方法的加密效果，防止数据因未知的安全漏洞遭到破坏、更改和泄露，适用范围广、可靠性强、保密等级高，降低了数据的安全风险；通过代价复杂性剪枝法对安全漏洞分析模型进行优化，从而提高了安全漏洞分析模型的质量，提升了安全漏洞分析模型的正确率、查全率、查准率和AUC值，增强了加密方法的安全性，确保了数据的流通安全。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明的方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种基于大数据的数据安全处理方法，包括以下步骤：步骤一，生成密钥；步骤二，构建模型；步骤三，优化模型；步骤四，数据采集；步骤五，数据加密；步骤六，数据解密；

其中在上述步骤一中，数据云端根据待处理数据的特征，从大数据中筛选出大量具有对应特征的原始数据、原始数据具备的安全漏洞以及安全漏洞可用的加密方法，并根据加密方法的不同生成相应的密钥对，密钥对由加密公钥和解密私钥组成，且加密公钥和解密私钥分别保存在数据终端和数据云端；

其中在上述步骤二中，将步骤一中得到的原始数据划分成训练集数据和测试集数据，训练集数据和测试集数据分别占原始数据的70%和30%，利用决策树算法对训练集数据以及步骤一中得到的安全漏洞和加密方法进行逻辑计算，决策树算法选用分类回归决策树算法，构建出原始分析模型；

其中在上述步骤三中，将步骤二中得到的测试集数据代入步骤二中得到的原始分析模型中，通过评价指标评估原始分析模型判断结果的好坏，评价指标为正确率、查全率、查准率和AUC值四项，并通过代价复杂性剪枝法得到安全漏洞分析模型，代价复杂性剪枝法先剪去原始分析模型决策树中判断结果坏的支干，再保留原始分析模型决策树中判断结果好的主干；

其中在上述步骤五中，数据终端调用数据云端从步骤三中得到的安全漏洞分析模型，对步骤四中得到的输入数据进行安全漏洞分析，安全漏洞分析先得出输入数据所有安全漏洞可用的多个加密方法，并优选出其中为映射合集的最佳加密方法，再对最佳加密方法进行密钥对匹配，根据步骤一中得到的密钥对判断出与输入数据相匹配的密钥对，再通过密钥对中的公钥对输入数据进行加密，得到加密数据；

基于上述，本发明的优点在于，本发明用公开密钥加密法处理采集数据，从而降低了传输过程中数据被恶意窃取和篡改的风险，确保了数据的可用性、完整性和保密性，保障了数据的流通安全，且利用大数据构建安全漏洞分析模型，为加密方法提供科学支持从而扩大了加密方法针对的安全漏洞范围，提高了加密方法的加密效果，防止数据因未知的安全漏洞遭到破坏、更改和泄露，适用范围广、可靠性强、保密等级高，降低了数据的安全风险。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于大数据的数据安全处理方法，包括以下步骤：步骤一，生成密钥；步骤二，构建模型；步骤三，优化模型；步骤四，数据采集；步骤五，数据加密；步骤六，数据解密；其特征在于：

2.根据权利要求1所述的一种基于大数据的数据安全处理方法，其特征在于：所述步骤一中，密钥对由加密公钥和解密私钥组成，且加密公钥和解密私钥分别保存在数据终端和数据云端。

3.根据权利要求1所述的一种基于大数据的数据安全处理方法，其特征在于：所述步骤二中，训练集数据和测试集数据分别占原始数据的70%和30%。

4.根据权利要求1所述的一种基于大数据的数据安全处理方法，其特征在于：所述步骤二中，决策树算法选用分类回归决策树算法。

5.根据权利要求1所述的一种基于大数据的数据安全处理方法，其特征在于：所述步骤三中，评价指标为正确率、查全率、查准率和AUC值四项。

6.根据权利要求1所述的一种基于大数据的数据安全处理方法，其特征在于：所述步骤三中，代价复杂性剪枝法先剪去原始分析模型决策树中判断结果坏的支干，再保留原始分析模型决策树中判断结果好的主干。

7.根据权利要求1所述的一种基于大数据的数据安全处理方法，其特征在于：所述步骤五中，安全漏洞分析先得出输入数据所有安全漏洞可用的多个加密方法，并优选出其中为映射合集的最佳加密方法，再对最佳加密方法进行密钥对匹配。