CN113688386A - 一种基于图结构的恶意pdf文档智能检测方法及*** - Google Patents

一种基于图结构的恶意pdf文档智能检测方法及*** Download PDF

Info

Publication number
CN113688386A
CN113688386A CN202110844055.0A CN202110844055A CN113688386A CN 113688386 A CN113688386 A CN 113688386A CN 202110844055 A CN202110844055 A CN 202110844055A CN 113688386 A CN113688386 A CN 113688386A
Authority
CN
China
Prior art keywords
document
graph structure
malicious
pdf
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110844055.0A
Other languages
English (en)
Inventor
王金双
俞远哲
孙蒙
邹霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Army Engineering University of PLA
Original Assignee
Army Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Army Engineering University of PLA filed Critical Army Engineering University of PLA
Priority to CN202110844055.0A priority Critical patent/CN113688386A/zh
Publication of CN113688386A publication Critical patent/CN113688386A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • G06F21/562Static detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Virology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图结构的恶意PDF文档智能检测方法及***,包括:获取待检测的PDF文档;解析PDF文档,得到文档的图结构特征,对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,计算精简后的图结构特征的拉普拉斯矩阵作为输入特征;将输入特征输入到获取预先训练好的卷积神经网络模型,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。优点:本发明的图结构提取和图精简方法降低了特征的维度,减轻了深度学习模型的训练压力,提高了***的高效性;根据输入特征,利用卷积神经网络模型对文档进行检测分类或是自动训练模型的参数,提高了***的准确性和易用性。

Description

一种基于图结构的恶意PDF文档智能检测方法及***
技术领域
本发明涉及一种基于图结构的恶意PDF文档智能检测方法及***,属于信息安全技术领域。
背景技术
传统的恶意PDF文档检测方法主要基于签名识别和启发式规则匹配,优点是误报率低,但局限于对病毒库中已有的恶意样本进行检测,面对未知恶意文档反应迟缓,攻击者可以通过伪造新的恶意文档来绕过检测。
现有基于机器学习的恶意文档检测方法其特征选择大多数依赖于专家的知识驱动,在恶意文档的手动分析期间进行观察来选择特征集(如调用类对象的数量、文档页数或版本号等),或是通过对元素的数学统计分析将特征细化(如某类对象在所有对象中的占比)。通过各类数学变换,这类特征可选取的数量很大,如果仅仅根据经验选取了一部分作为特征集,就会丧失文档的部分信息。
现有的恶意PDF文档检测方法技术的缺点包括:依赖于专家经验来遴选特征,无法全面反映文档属性;在面对对抗样本时,检测器性能下降明显;特征空间维度较大,导致深度学习模型的训练效率比较低,依赖***的配置。
发明内容
本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于图结构和卷积神经网络的恶意PDF文档检测方法,提高识别结果的准确性、高效性和易用性。
为解决上述技术问题,本发明提供一种基于图结构的恶意PDF文档智能检测方法,其特征在于,包括:
获取待检测的PDF文档;
解析PDF文档,得到文档的图结构特征,对图结构特征进行精简,计算精简后的拉普拉斯矩阵作为输入特征;
将输入特征输入到获取预先训练好的卷积神经网络模型,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
进一步的,所述解析PDF文档,得到文档的图结构特征,包括:
通过解析PDF文档中各标签对象的引用关系,提取得到文档的结构路径,根据多条结构路径得到文档的图结构特征。
进一步的,所述对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,包括:
使用TF-IDF算法对图结构特征的所有标签对象进行分类重要性排序,保留总重要性影响超过99%的节点,对剩下1%的结点进行合并,得到精简后的图结构特征。
进一步的,所述计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,包括:
将精简后的图结构特征转化为邻接矩阵,记作A;
将精简后的图结构特征转化为度矩阵,记作D;
根据邻接矩阵和度矩阵得到拉普拉斯矩阵L,表达形式为:
L=D-A。
进一步的,所述卷积神经网络模型的训练过程包括:
获取已确定的若干恶意PDF文档和若干良性PDF文档,对每个恶意PDF文档和每个良性PDF文档进行解析,得到图结构特征,对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,得到输入特征训练集,给定良性文档训练标签为0,恶意文档训练标签为1;
对2D-CNN模型的网络各层的神经元权值进行初始化,输入特征训练集中的一个训练数据经过网络各层向前传播得到输出值,与已给定的标签进行比较,计算预测误差,将预测误差传回网络中,求得各层的误差,对权值进行更新,再重新输入一个训练数据向前传播,多次迭代后得到训练好的神经网络模型。
一种基于图结构的恶意PDF文档智能检测***,包括:
获取模块,用于获取待检测的PDF文档;
解析处理模块,用于解析PDF文档,得到文档的图结构特征,对图结构特征进行精简,计算精简后的拉普拉斯矩阵作为输入特征;
学习检测模块,用于将输入特征输入到获取预先训练好的卷积神经网络模型,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
进一步的,所述解析处理模块包括:
结构路径生成模块,用于通过解析PDF文档中各标签对象的引用关系,提取得到文档的结构路径,根据多条结构路径得到文档的图结构特征。
进一步的,所述解析处理模块包括:
图精简模块,用于使用TF-IDF算法对图结构特征的所有标签对象进行分类重要性排序,保留总重要性影响超过99%的节点,对剩下1%的结点进行合并,得到精简后的图结构特征。
进一步的,所述解析处理模块包括:
特征提取模块,用于
将精简后的图结构特征转化为邻接矩阵,记作A;
将精简后的图结构特征转化为度矩阵,记作D;
根据邻接矩阵和度矩阵得到拉普拉斯矩阵L,表达形式为:
L=D-A。
进一步的,所述学习检测模块包括:
训练模块,用于
获取已确定的若干恶意PDF文档和若干良性PDF文档,对每个恶意PDF文档和每个良性PDF文档进行解析,得到图结构特征,对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,得到输入特征训练集,给定良性文档训练标签为0,恶意文档训练标签为1;
对2D-CNN模型的网络各层的神经元权值进行初始化,输入特征训练集中的一个训练数据经过网络各层向前传播得到输出值,与已给定的标签进行比较,计算预测误差,将预测误差传回网络中,求得各层的误差,对权值进行更新,再重新输入一个训练数据向前传播,多次迭代后得到训练好的神经网络模型。
本发明所达到的有益效果:
相对于现有技术,本发明的图结构提取和图精简方法降低了特征的维度,减轻了深度学习模型的训练压力,提高了***的高效性;根据输入特征,利用卷积神经网络模型对文档进行检测分类或是自动训练模型的参数,提高了***的准确性和易用性。
附图说明
图1为本发明工作流程图;
图2为本发明***结构图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于图结构的恶意PDF文档智能检测方法,
输入一个文档,对其进行解析,提取它的图结构特征;使用TF-IDF算法对图结构进行精简,然后计算图的拉普拉斯矩阵作为输入特征;将其送入2D-CNN模型训练或是检测分类。
所述图结构特征是指基于对PDF文档的结构解析,根据对象的引用关系,提取得到文档的结构路径,然后根据结构路径集合,构造得到文档的图结构。
所述图结构的精简过程为:
使用TF-IDF算法对所有节点进行分类重要性排序,保留总重要性影响超过99%的节点,对剩下1%的结点进行合并,得到精简后的图结构。
所述的输入特征为:
将图结构转化为邻接矩阵的形式,邻接矩阵反映了图中各节点之间的相邻关系,记作A。将图结构转化为度矩阵的形式,度矩阵对角线上的元素是各个顶点的度,表示和该顶点相关联的边的数量,记作D。拉普拉斯矩阵L定义为L=D-A。
所述模型训练的过程为:
根据输入的聚合特征,利用2D-CNN模型自动地更新2D-CNN模型参数。
所述模型分类检测的过程为:
将聚合特征以向量的形式输入2D-CNN模型在经过卷积层、池化层、dropout层、全连接层后得到输出,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
如图2所示,本实施例涉及一种基于图结构的恶意PDF文档智能检测***,包括:
获取模块,用于获取待检测的PDF文档;
解析处理模块,用于解析PDF文档,得到文档的图结构特征,对图结构特征进行精简,计算精简后的拉普拉斯矩阵作为输入特征;
学习检测模块,用于将输入特征输入到获取预先训练好的卷积神经网络模型,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
进一步的,所述解析处理模块包括:
结构路径生成模块,用于通过解析PDF文档中各标签对象的引用关系,提取得到文档的结构路径,根据多条结构路径得到文档的图结构特征。
进一步的,所述解析处理模块包括:
图精简模块,用于使用TF-IDF算法对图结构特征的所有标签对象进行分类重要性排序,保留总重要性影响超过99%的节点,对剩下1%的结点进行合并,得到精简后的图结构特征。
进一步的,所述解析处理模块包括:
特征提取模块,用于
将精简后的图结构特征转化为邻接矩阵,记作A;
将精简后的图结构特征转化为度矩阵,记作D;
根据邻接矩阵和度矩阵得到拉普拉斯矩阵L,表达形式为:
L=D-A。
进一步的,所述学习检测模块包括:
训练模块,用于
获取已确定的若干恶意PDF文档和若干良性PDF文档,对每个恶意PDF文档和每个良性PDF文档进行解析,得到图结构特征,对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,得到输入特征训练集,给定良性文档训练标签为0,恶意文档训练标签为1;
对2D-CNN模型的网络各层的神经元权值进行初始化,输入特征训练集中的一个训练数据经过网络各层向前传播得到输出值,与已给定的标签进行比较,计算预测误差,将预测误差传回网络中,求得各层的误差,对权值进行更新,再重新输入一个训练数据向前传播,多次迭代后得到训练好的神经网络模型。
如图1所示,本实施例包括以下详细操作步骤:
步骤1)结构路径生成,结构解析单元对PDF文档进行解析,然后利用路径生成单元根据对象的引用关系,利用深度优先算法生成得到文档的结构路径。
步骤2)图精简,对象提取单元提取结构路径集合中的所有对象,TF-IDF计算单元依据TF-IDF算法计算对象的贡献度,对象精简单元将总贡献度占比低于1%的对象合并,得到精简后的对象集合。
步骤3)特征提取,图结构生成单元根据精简后的对象集合和文档的结构路径,生成文档的图结构;拉普拉斯矩阵计算单元,计算图的度矩阵和邻接矩阵,然后得到图的拉普拉斯矩阵,并作为输入特征。
步骤4)学习检测,当模式选择单元根据需求输入’train’时,模型学习单元根据特征提取模块生成的输入特征,利用2D-CNN深度学习模型进行训练,并对模型的参数进行更新;当模式选择单元根据需求输入’valid’时,文档检测单元将输入特征输入2D-CNN模型后得到输出,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
使用例一:
用户输入文档test.pdf;
进行文档结构路径生成,提取得到的结构路径的集合structure_path.txt;
进行图精简,分析结构路径集合,并计算各对象的TFIDF进行精简,得到精简对象集合dict.json;
进行特征提取,依据structure_path.txt和dict.json生成文档的图结构并计算得到其拉普拉斯矩阵,保存为文件lpls.npy;
选择训练模式时,输入’train’,模型进行学习并更新参数。
使用例二:
用户输入文档test.pdf;
进行文档结构路径生成,提取得到的结构路径的集合structure_path.txt;
进行图精简,分析结构路径集合,并计算各对象的TFIDF进行精简,得到精简对象集合dict.json;
进行特征提取,依据structure_path.txt和dict.json生成文档的图结构并计算得到其拉普拉斯矩阵,保存为文件lpls.npy
选择测试模式时,输入’valid’,模型进行检测,输出结果为1,检测为恶意文档。
使用例三
用户输入文档test.pdf;
进行文档结构路径生成,提取得到的结构路径的集合structure_path.txt;
进行图精简,分析结构路径集合,并计算各对象的TFIDF进行精简,得到精简对象集合dict.json;
进行特征提取,依据structure_path.txt和dict.json生成文档的图结构并计算得到其拉普拉斯矩阵,保存为文件lpls.npy;
选择测试模式时,输入’valid’,模型进行检测,输出结果为0,检测为良性文档。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (10)

1.一种基于图结构的恶意PDF文档智能检测方法,其特征在于,包括:
获取待检测的PDF文档;
解析PDF文档,得到文档的图结构特征,对图结构特征进行精简,计算精简后的拉普拉斯矩阵作为输入特征;
将输入特征输入到获取预先训练好的卷积神经网络模型,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
2.根据权利要求1所述的基于图结构的恶意PDF文档智能检测方法,其特征在于,所述解析PDF文档,得到文档的图结构特征,包括:
通过解析PDF文档中各标签对象的引用关系,提取得到文档的结构路径,根据多条结构路径得到文档的图结构特征。
3.根据权利要求2所述的基于图结构的恶意PDF文档智能检测方法,其特征在于,所述对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,包括:
使用TF-IDF算法对图结构特征的所有标签对象进行分类重要性排序,保留总重要性影响超过99%的节点,对剩下1%的结点进行合并,得到精简后的图结构特征。
4.根据权利要求1所述的基于图结构的恶意PDF文档智能检测方法,其特征在于,所述计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,包括:
将精简后的图结构特征转化为邻接矩阵,记作A;
将精简后的图结构特征转化为度矩阵,记作D;
根据邻接矩阵和度矩阵得到拉普拉斯矩阵L,表达形式为:
L=D-A。
5.根据权利要求1所述的基于图结构的恶意PDF文档智能检测方法,其特征在于,所述卷积神经网络模型的训练过程包括:
获取已确定的若干恶意PDF文档和若干良性PDF文档,对每个恶意PDF文档和每个良性PDF文档进行解析,得到图结构特征,对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,得到输入特征训练集,给定良性文档训练标签为0,恶意文档训练标签为1;
对2D-CNN模型的网络各层的神经元权值进行初始化,输入特征训练集中的一个训练数据经过网络各层向前传播得到输出值,与已给定的标签进行比较,计算预测误差,将预测误差传回网络中,求得各层的误差,对权值进行更新,再重新输入一个训练数据向前传播,多次迭代后得到训练好的神经网络模型。
6.一种基于图结构的恶意PDF文档智能检测***,其特征在于,包括:
获取模块,用于获取待检测的PDF文档;
解析处理模块,用于解析PDF文档,得到文档的图结构特征,对图结构特征进行精简,计算精简后的拉普拉斯矩阵作为输入特征;
学习检测模块,用于将输入特征输入到获取预先训练好的卷积神经网络模型,若输出为1,则判定为恶意文档;若输出0,则判定为良性文档。
7.根据权利要求6所述的基于图结构的恶意PDF文档智能检测***,其特征在于,所述解析处理模块包括:
结构路径生成模块,用于通过解析PDF文档中各标签对象的引用关系,提取得到文档的结构路径,根据多条结构路径得到文档的图结构特征。
8.根据权利要求7所述的基于图结构的恶意PDF文档智能检测***,其特征在于,所述解析处理模块包括:
图精简模块,用于使用TF-IDF算法对图结构特征的所有标签对象进行分类重要性排序,保留总重要性影响超过99%的节点,对剩下1%的结点进行合并,得到精简后的图结构特征。
9.根据权利要求6所述的基于图结构的恶意PDF文档智能检测***,其特征在于,所述解析处理模块包括:
特征提取模块,用于
将精简后的图结构特征转化为邻接矩阵,记作A;
将精简后的图结构特征转化为度矩阵,记作D;
根据邻接矩阵和度矩阵得到拉普拉斯矩阵L,表达形式为:
L=D-A。
10.根据权利要求6所述的基于图结构的恶意PDF文档智能检测***,其特征在于,所述学习检测模块包括:
训练模块,用于
获取已确定的若干恶意PDF文档和若干良性PDF文档,对每个恶意PDF文档和每个良性PDF文档进行解析,得到图结构特征,对图结构特征的所有节点进行分类重要性排序,根据排序结果进行保留和合并处理,得到精简后的图结构特征,计算精简后的图结构特征的拉普拉斯矩阵作为输入特征,得到输入特征训练集,给定良性文档训练标签为0,恶意文档训练标签为1;
对2D-CNN模型的网络各层的神经元权值进行初始化,输入特征训练集中的一个训练数据经过网络各层向前传播得到输出值,与已给定的标签进行比较,计算预测误差,将预测误差传回网络中,求得各层的误差,对权值进行更新,再重新输入一个训练数据向前传播,多次迭代后得到训练好的神经网络模型。
CN202110844055.0A 2021-07-26 2021-07-26 一种基于图结构的恶意pdf文档智能检测方法及*** Pending CN113688386A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110844055.0A CN113688386A (zh) 2021-07-26 2021-07-26 一种基于图结构的恶意pdf文档智能检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110844055.0A CN113688386A (zh) 2021-07-26 2021-07-26 一种基于图结构的恶意pdf文档智能检测方法及***

Publications (1)

Publication Number Publication Date
CN113688386A true CN113688386A (zh) 2021-11-23

Family

ID=78577937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110844055.0A Pending CN113688386A (zh) 2021-07-26 2021-07-26 一种基于图结构的恶意pdf文档智能检测方法及***

Country Status (1)

Country Link
CN (1) CN113688386A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778278A (zh) * 2017-02-15 2017-05-31 中国科学院信息工程研究所 一种恶意文档检测方法及装置
US10169579B1 (en) * 2012-03-06 2019-01-01 Palo Alto Networks, Inc. Malicious PDF detection
CN112241530A (zh) * 2019-07-19 2021-01-19 中国人民解放军战略支援部队信息工程大学 恶意pdf文档的检测方法及电子设备
CN113157957A (zh) * 2021-03-05 2021-07-23 北京工业大学 一种基于图卷积神经网络的属性图文献聚类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10169579B1 (en) * 2012-03-06 2019-01-01 Palo Alto Networks, Inc. Malicious PDF detection
CN106778278A (zh) * 2017-02-15 2017-05-31 中国科学院信息工程研究所 一种恶意文档检测方法及装置
CN112241530A (zh) * 2019-07-19 2021-01-19 中国人民解放军战略支援部队信息工程大学 恶意pdf文档的检测方法及电子设备
CN113157957A (zh) * 2021-03-05 2021-07-23 北京工业大学 一种基于图卷积神经网络的属性图文献聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NEDIM SRNDIC ET AL.: "Detection of malicious pdf files based on hierarchical document structure", 《NDSS-SYMPOSIUM.ORG》, 31 December 2013 (2013-12-31) *
田小娣: "Word和PDF文档的恶意性检测算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 April 2018 (2018-04-15) *

Similar Documents

Publication Publication Date Title
Chawla et al. Host based intrusion detection system with combined CNN/RNN model
CN110348214B (zh) 对恶意代码检测的方法及***
CN111027069B (zh) 恶意软件家族检测方法、存储介质和计算设备
KR102221492B1 (ko) 텍스트 마이닝 기반 보안 이벤트 자동 검증 시스템 및 방법
CN116361801B (zh) 基于应用程序接口语义信息的恶意软件检测方法及***
CN109886021A (zh) 一种基于api全局词向量和分层循环神经网络的恶意代码检测方法
NL2029433B1 (en) Method and system for clustering executable files
CN110287311A (zh) 文本分类方法及装置、存储介质、计算机设备
CN108920446A (zh) 一种工程文本的处理方法
CN112527958A (zh) 用户行为倾向识别方法、装置、设备及存储介质
Kakisim et al. Sequential opcode embedding-based malware detection method
CN111260220A (zh) 群控设备识别方法、装置、电子设备和存储介质
CN117113163A (zh) 基于双向时域卷积网络和特征融合的恶意代码分类方法
CN112035345A (zh) 一种基于代码片段分析的混合深度缺陷预测方法
CN115577357A (zh) 一种基于堆叠集成技术的Android恶意软件检测方法
CN109583208A (zh) 基于移动应用评论数据的恶意软件识别方法和***
CN112733144B (zh) 一种基于深度学习技术的恶意程序智能检测方法
CN116361788A (zh) 一种基于机器学习的二进制软件漏洞预测方法
CN114139636B (zh) 异常作业处理方法及装置
CN113688386A (zh) 一种基于图结构的恶意pdf文档智能检测方法及***
CN113836005A (zh) 一种虚拟用户的生成方法、装置、电子设备和存储介质
CN113420127A (zh) 威胁情报处理方法、装置、计算设备及存储介质
CN111581640A (zh) 一种恶意软件检测方法、装置及设备、存储介质
CN111079143A (zh) 一种基于多维特征图的木马检测方法
CN115412335B (zh) 5g电力物联网边缘设备漏洞检测方法、装置及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination