CN117494215A - 计算机网络数据库的安全管理***及方法 - Google Patents

计算机网络数据库的安全管理***及方法 Download PDF

Info

Publication number
CN117494215A
CN117494215A CN202311625679.9A CN202311625679A CN117494215A CN 117494215 A CN117494215 A CN 117494215A CN 202311625679 A CN202311625679 A CN 202311625679A CN 117494215 A CN117494215 A CN 117494215A
Authority
CN
China
Prior art keywords
log record
scale
log
context
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311625679.9A
Other languages
English (en)
Inventor
刘罡
张�成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Linxi Technology Service Co ltd
Original Assignee
Qingdao Linxi Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Linxi Technology Service Co ltd filed Critical Qingdao Linxi Technology Service Co ltd
Priority to CN202311625679.9A priority Critical patent/CN117494215A/zh
Publication of CN117494215A publication Critical patent/CN117494215A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及智能管理领域,其具体地公开了一种计算机网络数据库的安全管理***及方法,其采用基于深度神经网络模型的人工智能技术,获取操作和审计日志记录,进行词嵌入得到嵌入向量后通过上下文关联特征提取器捕捉到序列中的依赖关系和演变模式,再通过多尺度感知器考虑到局部和全局的上下文信息,以得到用于表示网络是否有安全威胁的分类结果。进而能实现对网络安全威胁的实时监测和预警,提高网络安全管理的效果和效率。

Description

计算机网络数据库的安全管理***及方法
技术领域
本申请涉及智能管理领域,且更为具体地,涉及一种计算机网络数据库的安全管理***及方法。
背景技术
计算机网络数据库的安全管理是指通过一系列措施和策略来保护数据库***及其数据免受未经授权的访问、恶意攻击、数据泄露和损坏等安全威胁的管理过程。
网络数据库通常存储着组织或个人的敏感信息,如客户数据、财务数据、知识产权等。安全管理可以确保这些数据不被未经授权的人员访问、泄露或篡改,保护数据的机密性和完整性。另外,网络数据库是常见的攻击目标,黑客可能试图通过各种手段获取敏感数据、破坏数据库或进行勒索攻击。安全管理可以帮助识别和防止这些攻击,提高数据库的安全性。
但由于传统的安全管理方法通常需要人工干预和管理,通常是基于离线分析和批量处理的,包括手动配置和更新安全规则、监测和分析安全事件等无法实时监测和响应安全事件,这会增加管理的复杂性和成本,并可能导致人为错误和延迟响应,使得对新兴的安全威胁和攻击技术的检测和防御存在滞后性。
因此,期待一种优化的计算机网络数据库的安全管理方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种计算机网络数据库的安全管理***及方法,其采用基于深度神经网络模型的人工智能技术,获取操作和审计日志记录,进行词嵌入得到嵌入向量后通过上下文关联特征提取器捕捉到序列中的依赖关系和演变模式,再通过多尺度感知器考虑到局部和全局的上下文信息,以得到用于表示网络是否有安全威胁的分类结果。进而能实现对网络安全威胁的实时监测和预警,提高网络安全管理的效果和效率。
根据本申请的一个方面,提供了一种计算机网络数据库的安全管理***,其包括:
日志记录获取模块,用于获取操作和审计日志记录;
日志词嵌入模块,用于将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量;
日志上下文关联模块,用于将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量;
多尺度语义提取模块,用于将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量;
高斯密度融合模块,用于将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵;
特征参数优化模块,用于对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵;
网络安全判断模块,用于将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。
在上述计算机网络数据库的安全管理***中,所述日志词嵌入模块,包括:分词单元,用于对所述操作和审计日志记录进行分词处理以将所述操作和审计日志记录转化为由多个词组成的词序列;以及,嵌入单元,用于使用所述词嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到多个日志记录嵌入向量。
在上述计算机网络数据库的安全管理***中,所述日志上下文关联模块,包括:日志一维排列单元,用于将所述多个日志记录嵌入向量进行一维排列以得到日志记录全局词嵌入向量;向量相乘单元,用于计算所述日志记录全局词嵌入向量与所述多个日志记录嵌入向量中各个日志记录嵌入向量的转置向量之间的乘积以得到多个日志记录自注意力关联矩阵;矩阵标准化单元,用于分别对所述多个日志记录自注意力关联矩阵中各个日志记录自注意力关联矩阵进行标准化处理以得到多个标准化后日志记录自注意力关联矩阵;概率值计算单元,用于将所述多个标准化后日志记录自注意力关联矩阵中各个标准化后日志记录自注意力关联矩阵通过分类函数以得到多个日志记录概率值;以及,向量加权单元,用于分别以所述多个日志记录概率值中各个日志记录概率值作为权重对所述多个日志记录嵌入向量中各个日志记录嵌入向量进行加权以得到多个上下文日志记录语义特征向量。
在上述计算机网络数据库的安全管理***中,所述多尺度语义提取模块,包括:第一尺度卷积单元,用于使用所述多尺度感知器的第一卷积神经网络模型对所述上下文日志记录语义特征向量基于所述第一卷积核进行第一尺度深度卷积编码以得到第一尺度上下文日志记录语义特征向量;第一尺度卷积单元,用于使用所述多尺度感知器的第二卷积神经网络模型对所述上下文日志记录语义特征向量基于所述第二卷积核进行第二尺度深度卷积编码以得到第二尺度上下文日志记录语义特征向量;以及,尺度融合单元,用于融合所述第一尺度上下文日志记录语义特征向量和所述第二尺度上下文日志记录语义特征向量以得到所述多尺度日记记录特征向量。
在上述计算机网络数据库的安全管理***中,所述多尺度语义提取模块,用于:所述第一卷积神经网络模型使用具有第一尺度的第一卷积核,所述第二卷积神经网络模型使用具有第二尺度的第二卷积核,所述第一尺度不同于所述第二尺度。
在上述计算机网络数据库的安全管理***中,所述高斯密度融合模块,包括:高斯密度图单元,用于使用高斯密度图来融合所述多个多尺度日记记录特征向量以得到融合日志记录高斯密度图;以及,高斯离散化单元,用于对所述融合日志记录高斯密度图中各个位置的高斯分布进行离散化处理以得到所述日志记录特征矩阵。
根据本申请的另一方面,提供了一种计算机网络数据库的安全管理方法,其包括:
获取操作和审计日志记录;
将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量;
将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量;
将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量;
将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵;
对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵;
将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。
与现有技术相比,本申请提供的一种计算机网络数据库的安全管理***及方法,其采用基于深度神经网络模型的人工智能技术,获取操作和审计日志记录,进行词嵌入得到嵌入向量后通过上下文关联特征提取器捕捉到序列中的依赖关系和演变模式,再通过多尺度感知器考虑到局部和全局的上下文信息,以得到用于表示网络是否有安全威胁的分类结果。进而能实现对网络安全威胁的实时监测和预警,提高网络安全管理的效果和效率。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的计算机网络数据库的安全管理***的框图。
图2为根据本申请实施例的计算机网络数据库的安全管理***的架构示意图。
图3为根据本申请实施例的计算机网络数据库的安全管理***中日志上下文关联模块的框图。
图4为根据本申请实施例的计算机网络数据库的安全管理***中特征参数优化模块的框图。
图5为根据本申请实施例的计算机网络数据库的安全管理方法的流程图。
图6为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
示例性***
图1为根据本申请实施例的计算机网络数据库的安全管理***的框图。图2为根据本申请实施例的计算机网络数据库的安全管理***的架构示意图。如图1和图2所示,根据本申请实施例的计算机网络数据库的安全管理***100,包括:日志记录获取模块110,用于获取操作和审计日志记录;日志词嵌入模块120,用于将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量;日志上下文关联模块130,用于将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量;多尺度语义提取模块140,用于将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量;高斯密度融合模块150,用于将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵;特征参数优化模块160,用于对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵;以及,网络安全判断模块170,用于将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。
在本申请实施例中,所述日志记录获取模块110,用于获取操作和审计日志记录。考虑到操作日志记录包含了执行的操作类型、操作时间、执行者、操作的目标对象(如表、字段、记录等)以及操作的具体细节(如查询条件、更新的数值等)。这些信息通常以结构化的文本格式存储,例如日志文件、数据库表或其他存储介质。审计日志记录则更加强调安全和合规方面的信息,记录了对数据库进行的敏感操作、安全事件、异常行为等。当发生安全事件或威胁时,操作和审计日志记录可以提供有关事件发生的详细信息,例如攻击者的行为、攻击路径、受影响的***和数据等。这对于进行安全事件调查和恢复非常重要。通过分析操作和审计日志记录,可以识别出异常或可疑的活动模式,以帮助检测潜在的安全威胁。例如,异常登录尝试、特权访问、异常数据传输等都可能指示着安全问题。总之,这些日志记录提供了有关***和网络活动的关键信息,可以帮助组织及时发现和应对安全威胁,并提高***的可靠性和性能。
在本申请实施例中,所述日志词嵌入模块120,用于将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量。考虑到通计算机通常需要将文本数据转换为数值表示形式进行处理。词嵌入层可以将每个单词或词组映射到一个固定长度的向量,从而将文本数据转化为数值形式,便于后续的计算和分析。具体地,词嵌入层可以捕捉单词之间的语义关联。通过将相似含义的单词映射到相似的嵌入向量,词嵌入层可以在向量空间中保留单词之间的语义关系,使得模型能够更好地理解和表示文本的含义。另外,操作和审计日志记录通常包含大量的单词或词组,如果直接使用原始文本进行处理,会导致高维稀疏的表示形式,增加了计算和存储的复杂性。通过词嵌入层,可以将文本数据映射到低维的嵌入向量空间,减少了数据的维度,提高了计算效率。即使未见过的单词或词组,通过词嵌入层,模型也可以将其映射到与语义相近的向量空间中,从而能够更好地处理未知的文本数据。
具体地,在本申请实施例中,所述日志词嵌入模块,包括:分词单元,用于对所述操作和审计日志记录进行分词处理以将所述操作和审计日志记录转化为由多个词组成的词序列;以及,嵌入单元,用于使用所述词嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到多个日志记录嵌入向量。
在本申请实施例中,所述日志上下文关联模块130,用于将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量。考虑到在日志记录中,单个日志条目通常无法完整地捕捉到相关的上下文信息。通过使用基于转换器的上下文关联特征提取器,可以考虑到日志记录之间的关联关系,从而更好地捕捉到上下文信息。这有助于更准确地理解和表示日志记录的语义含义。另外,日志记录通常是按照时间顺序组织的序列数据。基于转换器的上下文关联特征提取器能够有效地对序列数据进行建模,捕捉到序列中的依赖关系和演变模式。这对于分析和理解日志记录的动态变化非常重要。此外,基于转换器的上下文关联特征提取器可以通过自注意力机制,对不同位置的日志记录进行加权关注,从而更加关注重要的上下文信息。这有助于提取出与任务相关的关键特征,提高模型的表现能力。
图3为根据本申请实施例的计算机网络数据库的安全管理***中日志上下文关联模块的框图。具体地,在本申请实施例中,如图3所示,所述日志上下文关联模块130,包括:日志一维排列单元131,用于将所述多个日志记录嵌入向量进行一维排列以得到日志记录全局词嵌入向量;向量相乘单元132,用于计算所述日志记录全局词嵌入向量与所述多个日志记录嵌入向量中各个日志记录嵌入向量的转置向量之间的乘积以得到多个日志记录自注意力关联矩阵;矩阵标准化单元133,用于分别对所述多个日志记录自注意力关联矩阵中各个日志记录自注意力关联矩阵进行标准化处理以得到多个标准化后日志记录自注意力关联矩阵;概率值计算单元134,用于将所述多个标准化后日志记录自注意力关联矩阵中各个标准化后日志记录自注意力关联矩阵通过分类函数以得到多个日志记录概率值;以及,向量加权单元135,用于分别以所述多个日志记录概率值中各个日志记录概率值作为权重对所述多个日志记录嵌入向量中各个日志记录嵌入向量进行加权以得到多个上下文日志记录语义特征向量。
在本申请实施例中,所述多尺度语义提取模块140,用于将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量。考虑到日志记录中的信息可能存在于不同的尺度上。通过使用多尺度感知器,可以同时考虑不同尺度的特征,从而更全面地表示日志记录的特征。应可以理解,多尺度感知器可以在不同层次和尺度上对上下文关联进行建模。这使得模型能够同时考虑到局部和全局的上下文信息,从而更好地理解日志记录的语义含义。通过多尺度感知器,模型可以捕捉到不同层次的上下文关联,可以将不同尺度的特征进行融合,得到更综合和全局的特征表示。具体地,多尺度感知器可以对日志记录的空间和时间维度进行建模。通过在不同尺度上进行卷积操作,可以捕捉到不同时间窗口或空间范围内的特征。
具体地,在本申请实施例中,所述多尺度语义提取模块,包括:第一尺度卷积单元,用于使用所述多尺度感知器的第一卷积神经网络模型对所述上下文日志记录语义特征向量基于所述第一卷积核进行第一尺度深度卷积编码以得到第一尺度上下文日志记录语义特征向量;第一尺度卷积单元,用于使用所述多尺度感知器的第二卷积神经网络模型对所述上下文日志记录语义特征向量基于所述第二卷积核进行第二尺度深度卷积编码以得到第二尺度上下文日志记录语义特征向量;以及,尺度融合单元,用于融合所述第一尺度上下文日志记录语义特征向量和所述第二尺度上下文日志记录语义特征向量以得到所述多尺度日记记录特征向量。
更具体地,在本申请实施例中,所述多尺度语义提取模块,用于:所述第一卷积神经网络模型使用具有第一尺度的第一卷积核,所述第二卷积神经网络模型使用具有第二尺度的第二卷积核,所述第一尺度不同于所述第二尺度。
在本申请实施例中,所述高斯密度融合模块150,用于将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵。考虑到高斯密度图可以用于对不同尺度的特征向量进行加权融合。通过高斯密度图,可以为不同尺度的特征向量赋予不同的权重,以反映它们在整体特征表示中的重要性。这样可以确保更重要的特征向量对最终的特征矩阵贡献更大的影响。具体地,高斯密度图具有平滑的性质,可以对特征向量进行平滑的融合。通过高斯密度图的平滑性质,可以减少特征向量之间的突变和不连续性,使得最终的特征矩阵更加平滑和连续。这有助于提高特征的稳定性和鲁棒性。另外,高斯密度图可以考虑到特征向量之间的上下文关联。通过高斯密度图,可以为相邻的特征向量赋予更高的权重,从而更好地捕捉到它们之间的关联关系,可以将多个多尺度特征向量综合为一个更全局和综合的特征矩阵。这有助于提取出更丰富和完整的特征信息,增强模型的表征能力。
具体地,在本申请实施例中,所述高斯密度融合模块,包括:高斯密度图单元,用于使用高斯密度图来融合所述多个多尺度日记记录特征向量以得到融合日志记录高斯密度图;以及,高斯离散化单元,用于对所述融合日志记录高斯密度图中各个位置的高斯分布进行离散化处理以得到所述日志记录特征矩阵。
在本申请实施例中,所述特征参数优化模块160,用于对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵。
在本申请的技术方案中,考虑到所述日志记录特征矩阵存在特征冗余和噪声,且所述日志记录特征矩阵的各个局部特征之间存在关系和顺序,即,所述日志记录特征矩阵的各个局部特征之间存在秩序性,因此,如果能够利用所述日志记录特征矩阵中隐含的秩序信息和局部特征之间的上下文关联,在可以对所述日志记录特征矩阵进行有序化建模以提高所述日志记录特征矩阵的特征表达的稀疏性和确定性。基于此,对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵。
具体地,首先基于所述日志记录特征矩阵的局部特征分布对其进行特征矩阵切分以得到关联局部特征矩阵的序列。接着,将所述关联局部特征矩阵的序列通过基于Softmax函数的秩序性权重生成器以得到秩序权重值的序列,所述秩序权重值用于表示各个关联局部特征矩阵在类概率域对于关联结果的贡献度,相应地,所述秩序权重值的序列则构成了所述关联局部特征矩阵的序列的序列信息,即,各个关联局部特征矩阵在类概率域的影响力排名。接着,基于所述秩序权重值的序列,对所述关联局部特征矩阵的序列进行排序以得到重排关联局部特征矩阵的序列,也就是,基于所述秩序权重值的序列所提供的秩序信息,将所述关联局部特征矩阵的序列按照从小到大或从大到小的顺序排列,以增强所述关联局部特征矩阵中各个局部特征的秩序性信息,同时减少区间内的信息损失。接着,对所述重排关联局部特征矩阵的序列进行特征展平化以得到重排关联局部特征向量的序列,病将所述重排关联局部特征向量的序列通过基于转换器的上下文编码器以得到上下文重排关联局部特征向量的序列。也就是,基于转换器机制(Transformer机制)来捕捉所述日志记录特征矩阵中各个局部特征之间的上下文关联信息。进一步的,对所述秩序权重值的序列进行基于最大值的归一化处理以得到归一化秩序权重值的序列,并以所述归一化秩序权重值的序列中各个位置的归一化秩序权重值作为权重,分别对所述上下文重排关联局部特征向量的序列进行加权以得到优化上下文重排关联局部特征向量的序列。也就是,将隐形秩序信息和上下文信息在高维特征空间中进行融合和叠置。最终,对所述优化上下文重排关联局部特征向量的序列进行维度重构以得到所述优化特征矩阵。
图4为根据本申请实施例的计算机网络数据库的安全管理***中特征参数优化模块的框图。具体地,在本申请实施例中,如图4所示,所述特征参数优化模块160,包括:特征矩阵切分单元161,用于沿对所述日志记录特征矩阵进行特征矩阵切分以得到关联局部特征矩阵的序列;秩序性权重生成单元162,用于将所述关联局部特征矩阵的序列通过基于Softmax函数的秩序性权重生成器以得到秩序权重值的序列;序列排序单元163,用于基于所述秩序权重值的序列,对所述关联局部特征矩阵的序列进行排序以得到重排关联局部特征矩阵的序列;特征展平化单元164,用于对所述重排关联局部特征矩阵的序列进行特征展平化以得到重排关联局部特征向量的序列;序列上下文提取单元165,用于将所述重排关联局部特征向量的序列通过基于转换器的上下文编码器以得到上下文重排关联局部特征向量的序列;归一化秩序权重值提取单元166,用于对所述秩序权重值的序列进行基于最大值的归一化处理以得到归一化秩序权重值的序列;序列加权单元167,用于以所述归一化秩序权重值的序列中各个位置的归一化秩序权重值作为权重,分别对所述上下文重排关联局部特征向量的序列进行加权以得到优化上下文重排关联局部特征向量的序列;以及,向量维度重构单元168,用于对所述优化上下文重排关联局部特征向量的序列进行维度重构以得到所述优化特征矩阵。
这样,对所述日志记录特征矩阵进行基于特征工程的秩序性参数化,以利用所述日志记录特征矩阵中各个局部特征之间的关联信息以及各个局部特征在类概率域的秩序信息,从而减少维度和噪声,增加信息量和可解释性,并且,还可以提高模型的准确度和泛化能力,因为参数化后的特征可以更好地反映数据的真实结构和规律。
在本申请实施例中,所述网络安全判断模块170,用于将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。考虑到分类器可以对网络日志记录的特征进行学习和分类,以判断是否存在安全威胁。通过训练分类器使用已知的安全威胁样本和正常样本,它可以学习到不同类型的网络活动模式和特征,从而能够对异常或恶意行为进行检测和识别。分类器可以将日志记录特征与已知的安全威胁模式进行比较,从而判断网络是否受到威胁。当分类器检测到网络存在安全威胁时,它可以发出相应的告警,通知安全管理员或***操作员采取相应的措施来应对威胁。这可以快速、准确地分析大量的日志记录特征,自动判断网络的安全状态,并生成相应的告警指示。这提高了安全管理的效率和及时性,使得安全事件可以更快地得到处理和解决。
综上,基于本申请实施例的计算机网络数据库的安全管理***100被阐明,其采用基于深度神经网络模型的人工智能技术,获取操作和审计日志记录,进行词嵌入得到嵌入向量后通过上下文关联特征提取器捕捉到序列中的依赖关系和演变模式,再通过多尺度感知器考虑到局部和全局的上下文信息,以得到用于表示网络是否有安全威胁的分类结果。进而能实现对网络安全威胁的实时监测和预警,提高网络安全管理的效果和效率。
示例性方法
图5为根据本申请实施例的计算机网络数据库的安全管理方法的流程图。如图5所示,根据本申请实施例的计算机网络数据库的安全管理方法,包括:S110,获取操作和审计日志记录;S120,将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量;S130,将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量;S140,将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量;S150,将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵;S160,对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵;以及,S170,将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。
这里,本领域技术人员可以理解,上述计算机网络数据库的安全管理方法中的各个步骤的具体操作已经在上面参考图1到图4的计算机网络数据库的安全管理***的描述中得到了详细介绍,并因此,将省略其重复描述。
示例性电子设备
下面,参考图6来描述根据本申请实施例的电子设备。图6为根据本申请实施例的电子设备的框图。如图6所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理模块(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理模块,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的计算机网络数据库的安全管理***及方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如操作和审计日志记录等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图6中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的计算机网络数据库的安全管理方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的计算机网络数据库的安全管理方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

Claims (10)

1.一种计算机网络数据库的安全管理***,其特征在于,包括:
日志记录获取模块,用于获取操作和审计日志记录;
日志词嵌入模块,用于将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量;
日志上下文关联模块,用于将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量;
多尺度语义提取模块,用于将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量;
高斯密度融合模块,用于将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵;
特征参数优化模块,用于对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵;
网络安全判断模块,用于将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。
2.根据权利要求1所述的计算机网络数据库的安全管理***,其特征在于,所述日志词嵌入模块,包括:
分词单元,用于对所述操作和审计日志记录进行分词处理以将所述操作和审计日志记录转化为由多个词组成的词序列;
嵌入单元,用于使用所述词嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到多个日志记录嵌入向量。
3.根据权利要求2所述的计算机网络数据库的安全管理***,其特征在于,所述日志上下文关联模块,包括:
日志一维排列单元,用于将所述多个日志记录嵌入向量进行一维排列以得到日志记录全局词嵌入向量;
向量相乘单元,用于计算所述日志记录全局词嵌入向量与所述多个日志记录嵌入向量中各个日志记录嵌入向量的转置向量之间的乘积以得到多个日志记录自注意力关联矩阵;
矩阵标准化单元,用于分别对所述多个日志记录自注意力关联矩阵中各个日志记录自注意力关联矩阵进行标准化处理以得到多个标准化后日志记录自注意力关联矩阵;
概率值计算单元,用于将所述多个标准化后日志记录自注意力关联矩阵中各个标准化后日志记录自注意力关联矩阵通过分类函数以得到多个日志记录概率值;
向量加权单元,用于分别以所述多个日志记录概率值中各个日志记录概率值作为权重对所述多个日志记录嵌入向量中各个日志记录嵌入向量进行加权以得到多个上下文日志记录语义特征向量。
4.根据权利要求3所述的计算机网络数据库的安全管理***,其特征在于,所述多尺度语义提取模块,包括:
第一尺度卷积单元,用于使用所述多尺度感知器的第一卷积神经网络模型对所述上下文日志记录语义特征向量基于所述第一卷积核进行第一尺度深度卷积编码以得到第一尺度上下文日志记录语义特征向量;
第一尺度卷积单元,用于使用所述多尺度感知器的第二卷积神经网络模型对所述上下文日志记录语义特征向量基于所述第二卷积核进行第二尺度深度卷积编码以得到第二尺度上下文日志记录语义特征向量;
尺度融合单元,用于融合所述第一尺度上下文日志记录语义特征向量和所述第二尺度上下文日志记录语义特征向量以得到所述多尺度日记记录特征向量。
5.根据权利要求4所述的计算机网络数据库的安全管理***,其特征在于,所述多尺度语义提取模块,用于:
所述第一卷积神经网络模型使用具有第一尺度的第一卷积核,所述第二卷积神经网络模型使用具有第二尺度的第二卷积核,所述第一尺度不同于所述第二尺度。
6.根据权利要求5所述的计算机网络数据库的安全管理***,其特征在于,所述高斯密度融合模块,包括:
高斯密度图单元,用于使用高斯密度图来融合所述多个多尺度日记记录特征向量以得到融合日志记录高斯密度图;
高斯离散化单元,用于对所述融合日志记录高斯密度图中各个位置的高斯分布进行离散化处理以得到所述日志记录特征矩阵。
7.根据权利要求6所述的计算机网络数据库的安全管理***,其特征在于,所述特征参数优化模块,包括:
特征矩阵切分单元,用于沿对所述日志记录特征矩阵进行特征矩阵切分以得到关联局部特征矩阵的序列;
秩序性权重生成单元,用于将所述关联局部特征矩阵的序列通过基于Softmax函数的秩序性权重生成器以得到秩序权重值的序列;
序列排序单元,用于基于所述秩序权重值的序列,对所述关联局部特征矩阵的序列进行排序以得到重排关联局部特征矩阵的序列;
特征展平化单元,用于对所述重排关联局部特征矩阵的序列进行特征展平化以得到重排关联局部特征向量的序列;
序列上下文提取单元,用于将所述重排关联局部特征向量的序列通过基于转换器的上下文编码器以得到上下文重排关联局部特征向量的序列;
归一化秩序权重值提取单元,用于对所述秩序权重值的序列进行基于最大值的归一化处理以得到归一化秩序权重值的序列;
序列加权单元,用于以所述归一化秩序权重值的序列中各个位置的归一化秩序权重值作为权重,分别对所述上下文重排关联局部特征向量的序列进行加权以得到优化上下文重排关联局部特征向量的序列;
向量维度重构单元,用于对所述优化上下文重排关联局部特征向量的序列进行维度重构以得到所述优化特征矩阵。
8.一种计算机网络数据库的安全管理方法,其特征在于,包括:
获取操作和审计日志记录;
将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量;
将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量;
将所述多个上下文日志记录语义特征向量通过包含第一卷积神经网络模型和第二卷积神经网络模型的多尺度感知器以得到多个多尺度日记记录特征向量;
将所述多个多尺度日记记录特征向量通过高斯密度图进行融合以得到日志记录特征矩阵;
对所述日志记录特征矩阵进行基于特征工程的秩序性参数化以得到优化日志记录特征矩阵;
将所述优化日志记录特征矩阵通过分类器以得到分类结果,所述分类结果用于表示网络是否有安全威胁,并基于所述分类结果生成安全告警指示。
9.根据权利要求8所述的计算机网络数据库的安全管理方法,其特征在于,将所述操作和审计日志记录通过词嵌入层以得到多个日志记录嵌入向量,包括:
对所述操作和审计日志记录进行分词处理以将所述操作和审计日志记录转化为由多个词组成的词序列;
使用所述词嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到多个日志记录嵌入向量。
10.根据权利要求9所述的计算机网络数据库的安全管理方法,其特征在于,将所述多个日志记录嵌入向量通过基于转换器的上下文关联特征提取器以得到多个上下文日志记录语义特征向量,包括:
将所述多个日志记录嵌入向量进行一维排列以得到日志记录全局词嵌入向量;
计算所述日志记录全局词嵌入向量与所述多个日志记录嵌入向量中各个日志记录嵌入向量的转置向量之间的乘积以得到多个日志记录自注意力关联矩阵;
分别对所述多个日志记录自注意力关联矩阵中各个日志记录自注意力关联矩阵进行标准化处理以得到多个标准化后日志记录自注意力关联矩阵;
将所述多个标准化后日志记录自注意力关联矩阵中各个标准化后日志记录自注意力关联矩阵通过分类函数以得到多个日志记录概率值;
分别以所述多个日志记录概率值中各个日志记录概率值作为权重对所述多个日志记录嵌入向量中各个日志记录嵌入向量进行加权以得到多个上下文日志记录语义特征向量。
CN202311625679.9A 2023-11-30 2023-11-30 计算机网络数据库的安全管理***及方法 Pending CN117494215A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311625679.9A CN117494215A (zh) 2023-11-30 2023-11-30 计算机网络数据库的安全管理***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311625679.9A CN117494215A (zh) 2023-11-30 2023-11-30 计算机网络数据库的安全管理***及方法

Publications (1)

Publication Number Publication Date
CN117494215A true CN117494215A (zh) 2024-02-02

Family

ID=89670938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311625679.9A Pending CN117494215A (zh) 2023-11-30 2023-11-30 计算机网络数据库的安全管理***及方法

Country Status (1)

Country Link
CN (1) CN117494215A (zh)

Similar Documents

Publication Publication Date Title
Sarker Machine learning for intelligent data analysis and automation in cybersecurity: current and future prospects
CN109347801B (zh) 一种基于多源词嵌入和知识图谱的漏洞利用风险评估方法
Selim et al. Anomaly events classification and detection system in critical industrial internet of things infrastructure using machine learning algorithms
CN116405299A (zh) 一种基于网络安全的报警器
CN111931935B (zh) 基于One-shot 学习的网络安全知识抽取方法和装置
CN117094184B (zh) 基于内网平台的风险预测模型的建模方法、***及介质
CN116866054A (zh) 公共信息安全监测***及其方法
CN116015703A (zh) 模型训练方法、攻击检测方法及相关装置
CN116112194A (zh) 用户行为分析方法、装置、电子设备及计算机存储介质
Hassan et al. SQL injection vulnerability detection using deep learning: a feature-based approach
CN111049839B (zh) 一种异常检测方法、装置、存储介质及电子设备
CN117370548A (zh) 用户行为风险识别方法、装置、电子设备及介质
Luz et al. Data preprocessing and feature extraction for phishing URL detection
CN117494215A (zh) 计算机网络数据库的安全管理***及方法
WO2022239030A1 (en) Method and system for anomaly detection in the banking system with graph neural networks (gnns)
US20220237289A1 (en) Automated malware classification with human-readable explanations
CN117436073B (zh) 一种基于智能标签的安全日志告警方法、介质和设备
Mena et al. Detecting Anomalies in Simulated Nuclear Data Using Autoencoders
CN117056209B (zh) 软件缺陷预测模型、解释方法以及量化评估方法
CN111598159B (zh) 机器学习模型的训练方法、装置、设备及存储介质
CN115225532B (zh) 网络安全态势预测方法、装置、设备及存储介质
CN114610982B (zh) 一种计算机网络数据采集分析管理方法、设备及存储介质
CN118094560A (zh) 供应链安全检测方法、装置、存储介质及处理器
Alquaifil et al. Big data (BD)-based approach to network security (NS) and intelligence
Godse et al. Role of Cyber Physical System in Insider Trading

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination