CN107958156A - 一种基于模板获取漏洞信息的方法 - Google Patents

一种基于模板获取漏洞信息的方法 Download PDF

Info

Publication number
CN107958156A
CN107958156A CN201711176206.XA CN201711176206A CN107958156A CN 107958156 A CN107958156 A CN 107958156A CN 201711176206 A CN201711176206 A CN 201711176206A CN 107958156 A CN107958156 A CN 107958156A
Authority
CN
China
Prior art keywords
template
vulnerability information
network address
loophole
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711176206.XA
Other languages
English (en)
Inventor
孔美琪
季统凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
G Cloud Technology Co Ltd
Original Assignee
G Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by G Cloud Technology Co Ltd filed Critical G Cloud Technology Co Ltd
Priority to CN201711176206.XA priority Critical patent/CN107958156A/zh
Publication of CN107958156A publication Critical patent/CN107958156A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及云计算安全技术领域,特别是一种基于模板获取漏洞信息的方法。本发明所述的方法是按照漏洞网站的网页结构定义数据格式模板,根据模板将从漏洞网站爬取的页面信息进行抽取;从而获得漏洞信息。本发明解决了传统获取漏洞信息方法无法根据需要获取特定信息的问题,保障了获取漏洞信息的灵活性。

Description

一种基于模板获取漏洞信息的方法
技术领域
本发明涉及云计算安全技术领域,特别是一种基于模板获取漏洞信息的方法。
背景技术
随着互联网深入千家万户,信息安全日益重要。当需要了解漏洞信息时,简练、精准的获取漏洞信息就显得异常重要,而传统的获取方法会带来以下问题:
一是耗时且繁琐,需要逐个访问漏洞网站,找到对应的漏洞模块,再逐个了解漏洞详情,非常耗时,而且操作麻烦;
二是不够精准,访问漏洞网站时会有各种其他的信息,需要在大量信息中搜索到需要的漏洞信息;
三是不够灵活,无法根据需要来获取漏洞信息。
为了便捷地获取漏洞信息,确保获取漏洞信息的精准性,提高获取的灵活性,需要一种更便捷灵活的漏洞获取方法。
发明内容
本发明解决的技术问题在于提出一种基于模板获取漏洞信息的方法,可以更便捷、灵活地获取漏洞信息,确保漏洞信息的精准性,解决了传统校验方法耗时长、操作繁琐、无法根据需要获取特定漏洞信息等问题。
本发明解决上述技术问题的技术方案是:
所述的方法是按照漏洞网站的网页结构定义数据格式模板,根据模板将从漏洞网站爬取的页面信息进行抽取;从而获得漏洞信息。
所述的方法具体包括如下步骤:
步骤1:配置获取漏洞的网址;
步骤2:定义数据格式模板;
步骤3:根据网址爬取页面信息;
步骤4:根据模板抽取特定漏洞信息;
步骤5:按照指定的结构把数据存储到指定的数据库。
所述的获取漏洞的网址是能正常连通,并且能获取到漏洞信息的网址。
所述根据网址爬取页面信息是通过爬虫程序爬取漏洞信息网址获取到的整个页面内容。
所述的根据模板抽取特定漏洞信息是按照模板定义的规则匹配出需要的漏洞信息。
本发明通过自定义模板,搜索匹配时能直接按照模板定义的规则匹配出需要的信息;无需通过人工逐一访问漏洞网站,筛选、排除大量其他信息后才能获取到想要的漏洞信息,节省70%的时间。本发明也可以解决传统漏洞收集工具在增加、删除和修改所需信息时需要改动代码,重新编译发布的问题,只需修改模板定义即可。
附图说明
下面结合附图对本发明进一步说明:
图1为本发明的方法流程图。
具体实施方式
如图1所示,本发明实施的步骤流程如下:
1、配置获取漏洞的网址,在配置文件中配置如下:
#获取漏洞信息的网址
vul.url=${url_cnnvd}
2、定义数据格式模板,模板定义如下:
#漏洞标题
vul.title=//div[@class=\\"list_list\\"]/ul/li
#漏洞链接
vul.link=//div[@class=\\"fl\\"]/a
#漏洞ID
vul.id=//div[@class=\\"fl\\"]/p/a/text()
#漏洞级别
vul.level=//div[@class=\\"fr\\"]/img/@title
#漏洞更新时间
vul.updateTime=//div[@class=\"fr\"]/text()
3、根据网址爬取页面信息,代码如下:
4、根据模板抽取特定漏洞信息,代码如下:
5、保存到数据库,代码如下:
整个流程结束。

Claims (6)

1.一种基于模板获取漏洞信息的方法,其特征在于:所述的方法是按照漏洞网站的网页结构定义数据格式模板,根据模板将从漏洞网站爬取的页面信息进行抽取;从而获得漏洞信息。
2.根据权利要求1所述的方法,其特征在于:所述的方法具体包括如下步骤:
步骤1:配置获取漏洞的网址;
步骤2:定义数据格式模板;
步骤3:根据网址爬取页面信息;
步骤4:根据模板抽取特定漏洞信息;
步骤5:按照指定的结构把数据存储到指定的数据库。
3.根据权利要求2所述的方法,其特征在于:所述的获取漏洞的网址是能正常连通,并且能获取到漏洞信息的网址。
4.根据权利要求2所述的方法,其特征在于:所述根据网址爬取页面信息是通过爬虫程序爬取漏洞信息网址获取到的整个页面内容。
5.根据权利要求3所述的方法,其特征在于:所述根据网址爬取页面信息是通过爬虫程序爬取漏洞信息网址获取到的整个页面内容。
6.根据权利要求1至5任一项所述的方法,其特征在于:所述的根据模板抽取特定漏洞信息是按照模板定义的规则匹配出需要的漏洞信息。
CN201711176206.XA 2017-11-22 2017-11-22 一种基于模板获取漏洞信息的方法 Withdrawn CN107958156A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711176206.XA CN107958156A (zh) 2017-11-22 2017-11-22 一种基于模板获取漏洞信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711176206.XA CN107958156A (zh) 2017-11-22 2017-11-22 一种基于模板获取漏洞信息的方法

Publications (1)

Publication Number Publication Date
CN107958156A true CN107958156A (zh) 2018-04-24

Family

ID=61961633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711176206.XA Withdrawn CN107958156A (zh) 2017-11-22 2017-11-22 一种基于模板获取漏洞信息的方法

Country Status (1)

Country Link
CN (1) CN107958156A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109413050A (zh) * 2018-10-05 2019-03-01 国网湖南省电力有限公司 一种访问速率自适应的互联网漏洞信息采集方法及***
CN109474609A (zh) * 2018-12-07 2019-03-15 国云科技股份有限公司 一种云平台下租户安全威胁告警***及其实现方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103001946A (zh) * 2012-10-31 2013-03-27 北京奇虎科技有限公司 网站安全检测方法、设备和***
CN103065095A (zh) * 2013-01-29 2013-04-24 四川大学 一种基于指纹识别技术的web漏洞扫描方法和漏洞扫描器
CN103428219A (zh) * 2013-08-25 2013-12-04 金华比奇网络技术有限公司 一种基于网页模板匹配的web漏洞扫描方法
CN104363236A (zh) * 2014-11-21 2015-02-18 西安邮电大学 一种自动化漏洞验证的方法
CN106778280A (zh) * 2016-11-02 2017-05-31 北京知道未来信息技术有限公司 一种填充式远程漏洞PoC编写方法及漏洞检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103001946A (zh) * 2012-10-31 2013-03-27 北京奇虎科技有限公司 网站安全检测方法、设备和***
CN103065095A (zh) * 2013-01-29 2013-04-24 四川大学 一种基于指纹识别技术的web漏洞扫描方法和漏洞扫描器
CN103428219A (zh) * 2013-08-25 2013-12-04 金华比奇网络技术有限公司 一种基于网页模板匹配的web漏洞扫描方法
CN104363236A (zh) * 2014-11-21 2015-02-18 西安邮电大学 一种自动化漏洞验证的方法
CN106778280A (zh) * 2016-11-02 2017-05-31 北京知道未来信息技术有限公司 一种填充式远程漏洞PoC编写方法及漏洞检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109413050A (zh) * 2018-10-05 2019-03-01 国网湖南省电力有限公司 一种访问速率自适应的互联网漏洞信息采集方法及***
CN109413050B (zh) * 2018-10-05 2020-11-24 国网湖南省电力有限公司 一种访问速率自适应的互联网漏洞信息采集方法及***
CN109474609A (zh) * 2018-12-07 2019-03-15 国云科技股份有限公司 一种云平台下租户安全威胁告警***及其实现方法

Similar Documents

Publication Publication Date Title
CN107204184B (zh) 语音识别方法及***
CN102663023B (zh) 一种提取网页内容的实现方法
US7941420B2 (en) Method for organizing structurally similar web pages from a web site
CN109582799B (zh) 知识样本数据集的确定方法、装置及电子设备
CN102270206A (zh) 一种有效网页内容的抓取方法及装置
CN107704503A (zh) 用户关键词提取装置、方法及计算机可读存储介质
CN103838837B (zh) 基于语义模板的遥感元数据集成方法
CN104462547B (zh) 一种可配置的网页数据采集的方法及***
CN104035975B (zh) 一种利用中文在线资源实现远程监督人物关系抽取的方法
CN102135967A (zh) 网页关键词提取方法、装置及***
CN106250513A (zh) 一种基于事件建模的事件个性化分类方法及***
CN109492177B (zh) 一种基于网页语义结构的网页分块方法
CN109086361B (zh) 一种基于网页节点间互信息的网页文章信息自动抽取方法及***
US20100100544A1 (en) Document searching device, document searching method, and document searching program
CN102651002A (zh) 一种网页信息抽取方法及其***
CN105893571A (zh) 一种视频内容标签的建立方法和***
KR20140053888A (ko) 판식 파일중 구조화 정보 획득방법 및 장치
CN103345532A (zh) 一种网页信息抽取方法及装置
CN103778238A (zh) 一种从***半结构化数据自动构建分类树的方法
CN107958156A (zh) 一种基于模板获取漏洞信息的方法
CN114238575A (zh) 文档解析方法、***、计算机设备及计算机可读存储介质
CN109710864B (zh) 页面内容划分方法、装置、可读存储介质及电子设备
CN103870495A (zh) 用于从网站中提取信息的方法和装置
CN103455572A (zh) 获取网页中影视主体的方法及装置
CN109726398B (zh) 一种实体识别及属性判断方法、***、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180424