CN101996259A - 基于白名单机制的数据深度解析方法 - Google Patents

基于白名单机制的数据深度解析方法 Download PDF

Info

Publication number
CN101996259A
CN101996259A CN 201010583863 CN201010583863A CN101996259A CN 101996259 A CN101996259 A CN 101996259A CN 201010583863 CN201010583863 CN 201010583863 CN 201010583863 A CN201010583863 A CN 201010583863A CN 101996259 A CN101996259 A CN 101996259A
Authority
CN
China
Prior art keywords
data
white list
file
tabulation
plate fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 201010583863
Other languages
English (en)
Other versions
CN101996259B (zh
Inventor
冯良怀
马萧萧
孙孟田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHENGDU DONGFANGSHENGXING ELECTRONICS Co Ltd
Original Assignee
CHENGDU DONGFANGSHENGXING ELECTRONICS Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHENGDU DONGFANGSHENGXING ELECTRONICS Co Ltd filed Critical CHENGDU DONGFANGSHENGXING ELECTRONICS Co Ltd
Priority to CN2010105838638A priority Critical patent/CN101996259B/zh
Publication of CN101996259A publication Critical patent/CN101996259A/zh
Application granted granted Critical
Publication of CN101996259B publication Critical patent/CN101996259B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

本发明公开了基于白名单机制的数据深度解析方法,它包括以下步骤:建立白名单列表,建立匹配特征码列表,读入待解析的数据文件并检查文件的类型是否在白名单列表中存在对应的登记项,检查文件的类型是否在白名单列表中存在对应的登记项,读取通过白名单检验的文件的特征码,生成板块指纹并将板块指纹绑定在数据流上,将数据流传输到存储结点,接收数据流,并对数据流进行校验对比,用发送端公钥解密并校验板块指纹,判断解密得到的板块指纹与绑定在数据流中的板块指纹相同,本发明的有益效果是:解决了现有技术的不足,避免了现用的文件解析和过滤方法的弊端,提供了一种基于白名单机制的可以深度解析数据的方法。

Description

基于白名单机制的数据深度解析方法
技术领域
    本发明涉及一种基于白名单机制的数据深度解析方法。
背景技术
    目前,生活、学习和工作中的信息化越来越普及,随之而来的归档或者存储文件的安全性也越来越被人们重视,现如今归档或存储文件的过程中主要的问题在于现有的数据解析方法的深度不够,只是从数据的表层去解析数据的后缀名,这使得用户可以入库归档不允许的文件类型,比如非视频或非音频文件(.3dmax/.doc/.ppt……等),传统的解决方法只是简单的文件类型过滤,如果更改了非视频音频文件的后缀名,***也同样允许入库归档。
发明内容
本发明的发明目的在于解决现有技术的不足,避免现用的文件解析和过滤方法的弊端,提供一种可以深度解析传输数据的方法。
本发明的发明目的是通过以下技术方案实现的:基于白名单机制的数据深度解析方法,其特征在于:包括以下步骤:
(1)建立白名单列表,白名单列表中的每一个登记项对应一种有效的文件类型;
(2)建立匹配特征码列表,匹配特征码列表的每一个登记项表示一种有效的文件类型的特征;
(3)读入待解析的数据文件,检查文件的类型是否在白名单列表中存在对应的登记项,如果找不到对应的登记项,则丢弃该文件;
(4)读取通过白名单检验的文件的特征码,从匹配特征码列表中查找是否存在对应登记项,如果找不到对应的登记项,则丢弃该文件;
(5)生成板块指纹,并将板块指纹绑定在数据流上;
(6)将数据流传输到存储结点;
(7)接收数据流,并对数据流进行校验对比;
(8)用发送端公钥解密并校验板块指纹;
(9)判断解密得到的板块指纹与绑定在数据流中的板块指纹是否相同,如果相同则通过数据为合法性校验,对数据予以存储,否则丢弃该数据。
本发明所述的特征码与文件类型存在一定的对应关系。
本发明所述的板块指纹是指数字载体的一些标识信息通过加密的一种算法,该标识是板块内文件识别的唯一标识符,该数字指纹是个 64字节的二进制值,与数字载体一起传输到节点。
本发明的有益效果是:解决了现有技术的不足,避免了现用的文件解析和过滤方法的弊端,提供了一种基于白名单机制的可以深度解析数据的方法。
附图说明
图1 基于白名单机制的数据深度解析方法的工作过程示意图。
具体实施方式
下面结合附图进一步描述本发明的技术方案,如图1,基于白名单机制的数据深度解析方法,其特征在于:包括以下步骤:
(1)建立白名单列表,白名单列表中的每一个登记项对应一种有效的文件类型;
(2)建立匹配特征码列表,匹配特征码列表的每一个登记项表示一种有效的文件类型的特征;
(3)读入待解析的数据文件,检查文件的类型是否在白名单列表中存在对应的登记项,如果找不到对应的登记项,则丢弃该文件;
(4)读取通过白名单检验的文件的特征码,从匹配特征码列表中查找是否存在对应登记项,如果找不到对应的登记项,则丢弃该文件;
(5)生成板块指纹,并将板块指纹绑定在数据流上;
(6)将数据流传输到存储结点;
(7)接收数据流,并对数据流进行校验对比;
(8)用发送端公钥解密并校验板块指纹;
(9)判断解密得到的板块指纹与绑定在数据流中的板块指纹是否相同,如果相同则通过数据为合法性校验,对数据予以存储,否则丢弃该数据。
本发明所述的特征码与文件类型存在一定的对应关系,通过开放文件格式(OpenDocument Format)打开文件,找到特征码所在位置,将该特征码与匹配特征码列表进行比较。
  文件类型与特征码的对应关系如下表:
文件后缀 特征码
EXE/DLL MZ?或MZP
RAR Rar!
BMP BM
JPG/JPEG JFIF
GIF GIF87a、GIF89a
PNG PNG
AVI/WAV RIFF
RM/RMVB RMF
PDF %PDF-1
本发明所述的板块指纹指数字载体(包括多媒体、文档、软件等)一些标识信息通过加密的一种算法。该标识是板块内文件识别的唯一标识符,该数字指纹是一个 64字节的二进制值,与数字载体一起传输到节点。板块指纹有效判断非结构化是否被篡改的目的。板块指纹由于难以篡改或伪造,有效保证数据的真实性和完整性。
下面结合文件后缀为RAR的文件的深度解析来说明本发明的技术方案,如图1,步骤如下:
(1)建立白名单列表,白名单列表中的每一个登记项对应一种有效的文件类型;
(2)建立匹配特征码列表,匹配特征码列表的每一个登记项表示一种有效的文件类型的特征;
(3)读入文件后缀为RAR的数据文件,检查文件的类型是否在白名单列表中存在对应的登记项,如果找不到对应的登记项,则丢弃该文件;
(4)读取通过白名单检验的文件的特征码Rar!,从匹配特征码列表中查找是否存在对应登记项,如果找不到对应的登记项,则丢弃该文件;
(5)生成板块指纹,并将板块指纹绑定在数据流上;
(6)将数据流传输到存储结点;
(7)接收数据流,并对数据流进行校验对比;
(8)用发送端公钥解密并校验板块指纹;
(9)判断解密得到的板块指纹与绑定在数据流中的板块指纹是否相同,如果相同则通过数据为合法性校验,对数据予以存储,否则丢弃该数据。

Claims (3)

1.基于白名单机制的数据深度解析方法,其特征在于:包括以下步骤:
建立白名单列表,白名单列表中的每一个登记项对应一种有效的文件类型;
建立匹配特征码列表,匹配特征码列表的每一个登记项表示一种有效的文件类型的特征;
读入待解析的数据文件,检查文件的类型是否在白名单列表中存在对应的登记项,如果找不到对应的登记项,则丢弃该文件;
读取通过白名单检验的文件的特征码,从匹配特征码列表中查找是否存在对应登记项,如果找不到对应的登记项,则丢弃该文件;
生成板块指纹,并将板块指纹绑定在数据流上;
将数据流传输到存储结点;
接收数据流,并对数据流进行校验对比;
用发送端公钥解密并校验板块指纹;
判断解密得到的板块指纹与绑定在数据流中的板块指纹是否相同,如果相同则通过数据为合法性校验,对数据予以存储,否则丢弃该数据。
2.根据权利要求1所述的基于白名单机制的数据深度解析方法,其特征在于:所述的特征码与文件类型存在一一对应关系。
3.根据权利要求1所述的基于白名单机制的数据深度解析方法,其特征在于:所述的板块指纹是个64字节的二进制值,与数字载体一起传输到目标节点。
CN2010105838638A 2010-12-12 2010-12-12 基于白名单机制的数据深度解析方法 Expired - Fee Related CN101996259B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105838638A CN101996259B (zh) 2010-12-12 2010-12-12 基于白名单机制的数据深度解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105838638A CN101996259B (zh) 2010-12-12 2010-12-12 基于白名单机制的数据深度解析方法

Publications (2)

Publication Number Publication Date
CN101996259A true CN101996259A (zh) 2011-03-30
CN101996259B CN101996259B (zh) 2012-07-04

Family

ID=43786413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105838638A Expired - Fee Related CN101996259B (zh) 2010-12-12 2010-12-12 基于白名单机制的数据深度解析方法

Country Status (1)

Country Link
CN (1) CN101996259B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609515A (zh) * 2012-02-07 2012-07-25 奇智软件(北京)有限公司 一种文件快速扫描方法和***
CN102799613A (zh) * 2012-06-14 2012-11-28 腾讯科技(深圳)有限公司 一种最近使用文档的展示方法和装置
CN104715197A (zh) * 2012-02-07 2015-06-17 北京奇虎科技有限公司 一种文件快速扫描方法和***
CN106878074A (zh) * 2017-02-17 2017-06-20 杭州迪普科技股份有限公司 流量过滤方法及装置
CN112182659A (zh) * 2020-10-28 2021-01-05 东信和平科技股份有限公司 金融文件监听方法、装置、***和计算机可读存储介质
CN113051231A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 文件解析方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1591472A (zh) * 2003-09-01 2005-03-09 致伸科技股份有限公司 在数字装置中进行文件管理的方法
CN101398853A (zh) * 2008-10-14 2009-04-01 北京大学 一种文件打包的方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1591472A (zh) * 2003-09-01 2005-03-09 致伸科技股份有限公司 在数字装置中进行文件管理的方法
CN101398853A (zh) * 2008-10-14 2009-04-01 北京大学 一种文件打包的方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609515A (zh) * 2012-02-07 2012-07-25 奇智软件(北京)有限公司 一种文件快速扫描方法和***
CN102609515B (zh) * 2012-02-07 2013-10-16 北京奇虎科技有限公司 一种文件快速扫描方法和***
CN104715197A (zh) * 2012-02-07 2015-06-17 北京奇虎科技有限公司 一种文件快速扫描方法和***
CN104715197B (zh) * 2012-02-07 2019-03-08 北京奇虎科技有限公司 一种文件快速扫描方法和***
CN102799613A (zh) * 2012-06-14 2012-11-28 腾讯科技(深圳)有限公司 一种最近使用文档的展示方法和装置
CN106878074A (zh) * 2017-02-17 2017-06-20 杭州迪普科技股份有限公司 流量过滤方法及装置
CN106878074B (zh) * 2017-02-17 2020-09-08 杭州迪普科技股份有限公司 流量过滤方法及装置
CN113051231A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 文件解析方法、装置、计算机设备和存储介质
CN112182659A (zh) * 2020-10-28 2021-01-05 东信和平科技股份有限公司 金融文件监听方法、装置、***和计算机可读存储介质

Also Published As

Publication number Publication date
CN101996259B (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN101996259B (zh) 基于白名单机制的数据深度解析方法
CN100565546C (zh) 一种检验纸制文档内容是否被篡改的方法
CN107483181B (zh) 合同管理方法、装置及终端
US20120308003A1 (en) Authentic barcodes using digital signatures
CN101493918A (zh) 在线音乐盗版监控方法和***
CN106845242B (zh) 一种基于is4软件特征的隐藏信息检测及提取方法
CN102170448A (zh) 一种基于云媒体发行平台的版权保护***、多媒体数据发送接收设备及方法
CN103793997A (zh) 一种收件人通过自助设备收件的方法
CN103294953B (zh) 一种手机恶意代码检测方法及***
CN1777040A (zh) 一种可变长度结构化信息的编码和解码方法
CN102903072A (zh) 一种盲数字水印检测方法和***
CN103533522A (zh) 短信稽核的方法及***
CN106815779A (zh) 建设工程质量检测防假样***及方法
CN102013088B (zh) 基于数字档案资源综合特征的数字水印生成与嵌入方法
CN201657022U (zh) 网络式身份证件核对***
KR102319006B1 (ko) 블록체인을 이용한 최초 저작권자 인증 시스템 및 그 방법
KR20000049674A (ko) 웹 사이트를 이용한 전자서명 제공 및 인증 방법
CN101938475A (zh) 互联网信息发布者身份鉴别方法及其***
CN102567657A (zh) 数字作品权属认证***和方法
EP2697785A1 (en) Authentic barcodes using digital signatures
CN102096774A (zh) 一种公文的加密方法、验证方法及其装置
CN203133928U (zh) 一种物联网***防伪管理装置
CN103390121B (zh) 数字作品权属认证方法和***
CN104112201A (zh) 电子票据数据的发送和接收方法及设备
CN103258253A (zh) 一种物联网***防伪管理***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120704