CN105491023A - 一种面向电力物联网的数据隔离交换和安全过滤方法 - Google Patents

一种面向电力物联网的数据隔离交换和安全过滤方法 Download PDF

Info

Publication number
CN105491023A
CN105491023A CN201510824673.3A CN201510824673A CN105491023A CN 105491023 A CN105491023 A CN 105491023A CN 201510824673 A CN201510824673 A CN 201510824673A CN 105491023 A CN105491023 A CN 105491023A
Authority
CN
China
Prior art keywords
phrase
isolation
data
length
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510824673.3A
Other languages
English (en)
Other versions
CN105491023B (zh
Inventor
周诚
张涛
马媛媛
李伟伟
汪晨
邵志鹏
费稼轩
何高峰
楚杰
黄秀丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Smart Grid Research Institute of SGCC
Original Assignee
State Grid Corp of China SGCC
Smart Grid Research Institute of SGCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Smart Grid Research Institute of SGCC filed Critical State Grid Corp of China SGCC
Priority to CN201510824673.3A priority Critical patent/CN105491023B/zh
Publication of CN105491023A publication Critical patent/CN105491023A/zh
Application granted granted Critical
Publication of CN105491023B publication Critical patent/CN105491023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0227Filtering policies
    • H04L63/0245Filtering by information in the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • H04L63/0281Proxies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种面向电力物联网的数据隔离交换和安全过滤方法,所述方法包括:(1)构建一种基于前置代理和专有协议的隔离架构;(2)在前置代理部分进行特征向量提取;(3)在所述前置代理部分进行标签封装,在隔离服务侧进行标签解析;(4)在隔离服务侧实现标签过滤;(5)在所述隔离服务侧结合特征向量和标签过滤进行内容过滤。本发明通过引入前置代理和私有应用层协议实现了完善的协议隔离,大大提高了隔离强度。

Description

一种面向电力物联网的数据隔离交换和安全过滤方法
技术领域
本发明涉及一种安全隔离交换方法,具体涉及一种面向电力物联网的数据隔离交换和安全过滤方法。
背景技术
安全隔离与信息交换技术的基本原理是,通过一种专用硬件——隔离装置,使两个或者两个以上网络在不连通的情况下进行网络之间的安全数据传输和资源共享。具体做法一般是,隔离装置切断网络之间的TCP/IP连接,分解或重组TCP/IP数据包,进行安全审查,然后与另一边的主机建立有效连接并把数据发送出去。
在智能电网发展背景下,电力物联网环境中存在海量智能终端、智能刀闸、作业终端以及各种电力业务***,这些终端和***需要与电力信息网进行频繁的数据交互。由于电力信息网属于涉密网络,而上述终端和***多通过移动APN网络或者互联网完成接入,两者的交互对电力信息网来说存在明显的安全风险,因此必须采取隔离防护措施。然而现有的安全隔离与信息交换技术存在明显不足,难以满足电力物联网的隔离交换需求,具体表现为:
1、隔离强度不足
隔离与交换是一对矛盾,传统的安全隔离与信息交换技术基于TCP/IP数据包的分解和重组,在解决隔离与交换的矛盾问题上存在明显不足。绝大多数特定的数据交换都需要承载于特定的应用协议,而一旦在安全隔离与信息交换模型中加入应用层协议的考虑,就会发现TCP/IP报文重组并不能完全消除应用层协议引入的安全风险。假设非涉密网络通过安全隔离与信息交换***与涉密网络中的Oracle数据库进行数据交换,此时非涉密网络和涉密网络都必须基于TNS协议进行通信,而TCP/IP报文在经过硬件交换矩阵后仍需还原成TNS协议报文格式,这就导致非涉密网络的攻击者实际上完全可以通过公开的TNS协议报文实现对涉密网络数据库的攻击。传统安全隔离与信息交换技术对这种攻击的防御措施是尽可能增强应用层过滤能力,但这显然已经退化到应用层防火墙的水平。
2、过滤深度和效率存在矛盾
传统的安全隔离与信息交换技术体系中,安全过滤是重要的一环。许多相关产品都声称具备内容级的过滤能力。然而内容过滤算法不可能是没有性能代价的,内容过滤的深度越深,其造成的延迟和吞吐量下降情况越严重。传统的安全隔离与信息交换技术体系试图在隔离装置上完成深度过滤,这在工业环境中很可能是不可行的。例如电力物联网环境中涉及的终端数以亿计,数据交换流量巨大,对数据交换延迟也有严格要求,传统的安全隔离与信息交换技术体系只能通过关闭过滤功能或者降低过滤深度来应对,在解决过滤深度和效率的矛盾方面存在明显不足。
发明内容
为了克服上述现有技术的不足,本发明提供一种面向电力物联网的数据隔离交换和安全过滤方法,本发明通过引入前置代理和私有应用层协议实现了完善的协议隔离,大大提高了隔离强度。
为了实现上述发明目的,本发明采取如下技术方案:
一种面向电力物联网的数据隔离交换和安全过滤方法,所述方法包括如下步骤:
(1)构建一种基于前置代理和专有协议的隔离架构;
(2)在前置代理部分进行特征向量提取;
(3)在所述前置代理部分进行标签封装,在隔离服务侧进行标签解析;
(4)在隔离服务侧实现标签过滤;
(5)在所述隔离服务侧结合特征向量和标签过滤进行内容过滤。
优选的,所述步骤(1)中,所述隔离架构包括基于TCP/IP协议专有的应用层交换协议、专用安全隔离装置和前置代理,所述隔离架构用于将用户交互过程映射为所述应用层交换协议报文,以实现数据交换。
优选的,所述步骤(2)中,包括如下步骤:
步骤2-1、对报文内容Ti进行预处理;
步骤2-2、对所述报文内容Ti进行特征提取;
步骤2-3、生成报文特征向量V’和隔离服务侧中敏感库的特征向量V;
步骤2-4、将提取的特征向量保存到报文的标签字段中。
优选的,所述步骤2-1中,所述预处理为通过ICTCLAS分词接口,将文本文件进行分词解析,报文内容Ti分词后表示为如下形式:
Ti=((ai1,li1,pi1),(ai2,li2,pi2),......,(ain,lin,pin))
式中:Ti表示报文i,ain表示划分出来的词组,lin表示词组的长度,pin表示划分出来的词组的词性。
优选的,所述步骤2-2中,包括如下步骤:
步骤2-2-1、对所述报文内容Ti进行词性选择,提取分析后的文本词组中的名词性词组,删除其它词性,所述报文内容Ti经过词性选择后,表达式如下:
Ta i = ( ( a i 1 p , l i 1 p ) , ( a i 2 p , l i 2 p ) , ...... ( a i n p , l i n p ) )
式中:Tai为提取名词之后的文本, 为名词,为名词词组的长度;
步骤2-2-2、统计关键字的出现频率,形成分词三元组,包含词组、词组在本文本中出现的频率和词性,将Tai增加一个词频项,表达式如下:
Tb i = ( ( a i 1 f , l i 1 f , f i 1 f ) , ( a i 2 f , l i 2 f , f i 2 f ) , ...... ( a i n f , l i n f , f i n f ) )
式中:Tbi为统计词频之后的文本,为统计词频后的词组,为统计词频后词组的长度,的词频;
步骤2-2-3、计算每个关键字的长度并删除单个字的关键字,表达式如下:
Tc i = ( ( a i 1 l , f i 1 l ) , ( a i 2 l , f i 2 l ) , ...... ( a i n l , f i n l ) )
式中:Tci为删除关键字为单个字之后的文本,其中为长度大于一个字的词组,词频;
步骤2-2-4、剔除关键字出现一次的词组,得到的最终表达式为:
Td i = ( ( a i 1 m , f i 1 m ) , ( a i 2 m , f i 2 m ) , ...... ( a i m m , f i m m ) )
其中:Tdi为剔除关键字出现一次之后的文本,为剔除关键字出现一次之后的词组,的词频,其中 f i m m > 1.
优选的,所述步骤2-3中,包括如下步骤:
步骤2-3-1、基于TF-IDF公式对词组的权值进行计算,公式为:
dij=tij*log(N/nj)
其中,dij为词组aij在文本Ti中出现的次数,等于Tdi中的N为文档的总数,nj为文档库中包含词组aij的文档的个数;
步骤2-3-2、由敏感库数据组成的特征向量表示为:
V=((a11,d11),(a12,d12),......,(a1m,d1m),......,(an1,dn1),(an1,dn1),......,(anm,dnm))
简记为:
V=(d11,d12,......,d1m,......,dn1,dn2,......,dnm)
步骤2-3-3、根据步骤2-3-2,得到报文的特征向量简记为:
V′=(d′11,d′12,......,d′1m,......,d′n1,d′n2,......,d′nm)。
优选的,所述步骤(3)中,所述标签包括用户信息U(k,v)、数据属性信息Ad(k,v),特征向量V’、生成时间T和加密标识Fe信息,表达式为:
Label=(U(k,v),Ad(k,v),V’,T,Fe)
所述前置代理部分进行标签封装包括如下步骤:
步骤3-1-1、用户信息U、数据属性信息Ad(k,v),特征向量V’、生成时间T按序排列,并分块成N块;
步骤3-1-2、随机选择N块中的N1块,设置加密标识,并对数据进行加密获得EN1;
步骤3-1-3、记录随机选择过程R,将R作为块,设置加密标识,加密R获得ER;
步骤3-1-4、对剩余的N2(N-N1)块不设置加密标识;
步骤3-1-5、计算所述EN1的长度和所述ER的长度,并连接EN1长度、EN1、ER长度、ER和N2得标签封装后的私有协议数据E;
所述在隔离服务侧进行标签解析包括如下步骤:
步骤3-2-1、获取所述私有协议数据E;
步骤3-2-2、提取所述EN1长度,通过EN1长度提取EN1,并解密EN1获得N1;
步骤3-2-3、提取ER长度,通过ER长度提取ER,并解密ER获得R;
步骤3-2-4、提取后面的数据N2;
步骤3-2-5、通过随机选择过程R,将N1和N2恢复到U(k,v),Ad(k,v),V’和T。
优选的,所述步骤(4)中,所述标签过滤是通过策略规则,依客户端提供的数据属性,对数据进行过滤;所述策略规则由左括号[,关键字begin,表达式exp,关键字end,右括号]构成;所述表达式由基本项和构成项构成,所述基本项包括变量var、数值和字符串,所述构成项是由变量、数值和字符串,通过一元、二元操作符连接的复杂表达式。
优选的,所述标签过滤包括如下步骤:
步骤4-1、提取所述用户信息U(k,v)和所述数据属性信息Ad(k,v)重新赋给新的属性信息Ad’(k,v);
步骤4-2、从策略库中提取策略规则;
步骤4-3、遍历策略规则表达式exp,提取表达式中的变量var;
步骤4-4、将所述var为键从所述Ad’(k,v)中提取var对应值v;
步骤4-5、将策略规则中的var由v替代,并计算表达式;
步骤4-6、依据计算结果判定数据是否被过滤,并记录日志。
优选的,所述步骤(5)中,包括如下步骤:
步骤5-1、特征向量V’与隔离服务侧中敏感库的特征向量V通过余弦计算得到余弦相似度值,余弦相似度计算公式如下:
c o s θ = V ′ · V | | V ′ | | | | V | |
式中,V'和V为两个特征向量,V'·V为标准向量点积,定义为t为向量的维数,分母中的范数||V'||定义为分母中的范数||V||定义为
步骤5-2、通过将余弦相似度值与预定义的相似度阈值比较,分析得到报文是否携带涉密信息,对涉密的文档进行过滤。
与现有技术相比,本发明的有益效果在于:
本发明只需要提供一个私有的JDBC驱动,在非涉密网络并不需要开放TNS协议通信,仅在涉密网络开放TNS协议通信,这样隔离边界两侧网络的报文完全经过语义翻译,不具备简单映射关系,非涉密网络的攻击者无法攻击内网TNS协议漏洞,从而实现了完善的协议隔离,大大提高了隔离强度。
本发明通过基于特有的隔离交换架构,将深度内容解析和内容特征值提取前移到前置代理侧完成,在隔离装置侧则只进行特征值匹配,这样隔离边界的计算需求大幅降低。在电力物联网环境下,该技术可以利用数以亿计的智能终端设备实现分布式的内容过滤计算,从而实现高效率低延迟的分布式内容过滤。较好的解决了过滤深度和交换效率的矛盾。
本发明通过引入前置代理,将隔离交换的边界前移至终端侧,电力物联网环境下大量的智能终端基于可信计算的理念构建,运行在智能终端的前置代理软件可以与智能终端的可信计算体系相结合,通过私有应用层协议加固,将整个隔离交换体系纳入到可信交换系中去,从而实现可信隔离交换。
附图说明
图1是本发明提供的一种面向电力物联网的数据隔离交换和安全过滤方法流程图
图2是本发明提供的在前置代理部分实现特征向量提取的流程图
图3是本发明提供的标签及私有协议封装将标签内容进行私有格式化处理的流程图
图4是本发明提供的策略过滤的流程图
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1所示,本发明提供了一种面向电力物联网的数据隔离交换和安全过滤方法,采取如下技术方案:
步骤1、隔离架构的构建
构建一种基于前置代理和专有协议的隔离架构,包括一种基于TCP/IP协议的专有的应用层交互协议、一种专用安全隔离装置,该装置一方面具备硬件级的TCP/IP协议分解重组和交换能力,另一方面仅支持上述专用应用层协议通信,拒绝一切第三方公开应用层协议、一种前置代理,可以是驱动、SDK或者硬件插件等形式,在本架构中主要作用是将用户交互过程映射为专用应用层协议报文,以实现数据交换,前置代理在实际实现过程中也能够起到终端加固和可信认证的作用。
步骤2、在前置代理部分实现特征向量提取,如图2所示
首先对报文内内容Ti进行预处理,之后进行特征提取生成报文特征向量V’和敏感库特征向量V,并将提取的特征向量保存到报文的标签字段中。
(1)预处理
通过ICTCLAS分词接口,将文本文件进行分词解析,报文内容Ti分词后表示为如下形式:
Ti=((ai1,li1,pi1),(ai2,li2,pi2),......,(ain,lin,pin))
其中:Ti表示报文i,ain表示划分出来的词组,lin表示词组的长度,pin表示划分出来的词组的词性。
(2)特征提取
1)词性选择
在中文的文本中,根据词性取其中能够最强烈表达文章内容的关键词,用于后面的特征提取,有助于消除冗余,简便计算过程。因此提取分析后的文本词组中的名词性词组,删除其它词性。文本文件Ti经过词性选择后,表示为如下:
Ta i = ( ( a i 1 p , l i 1 p ) , ( a i 2 p , l i 2 p ) , ...... ( a i n p , l i n p ) )
式中:Tai为提取名词之后的文本, 为名词,为名词词组的长度。
2)词频统计
统计关键字的出现频率,形成分词三元组,包含词组,词组在本文本中出现的频率和词性。将增加一个词频项,进一步表达为:
Tb i = ( ( a i 1 f , l i 1 f , f i 1 f ) , ( a i 2 f , l i 2 f , f i 2 f ) , ...... ( a i n f , l i n f , f i n f ) )
式中:Tbi为统计词频之后的文本,为统计词频后的词组,为统计词频后词组的长度,的词频。
3)词长选择
在中文的文本中,词比字有着更强的表达能力,计算每个关键字的长度并删除单个字的关键词。进一步表达为:
Tc i = ( ( a i 1 l , f i 1 l ) , ( a i 2 l , f i 2 l ) , ...... ( a i n l , f i n l ) )
式中:Tci为删除关键字为单个字之后的文本,其中为长度大于一个字的词组,词频。
4)词频选择
在中文的文本中,只出现一次的词具有偶然性不具备代表性,因此剔除统计后的文本分词三元组中只出现过一次的词组。得到最终的特征二元组表达为:
Td i = ( ( a i 1 m , f i 1 m ) , ( a i 2 m , f i 2 m ) , ...... ( a i m m , f i m m ) )
其中:Tdi为剔除关键字出现一次之后的文本,为剔除关键字出现一次之后的词组,的词频,其中 f i m m > 1.
(3)生成特征向量
对词的权值的计算是衡量特征值的有效方法,目前广泛使用的是基于统计方法的TF-IDF公式,这个公式在大量实际使用中被证明是可行的有效的。其核心思想是,认为某个词在其它文本中出现的次数越是少,那么这个词就包含越多的信息,越能够代表文档的类型,相反,如果在其它文档中也是大量的出现,那么这个词就不具有代表性。
目前常用的计TF-IDF计算公式表示为:
dij=tij*log(N/nj)
其中,tij为词组aij在文本Ti中出现的次数,等于Tdi中的fim,N为文档的总数,nj为文档库中包含词组aij的文档的个数。
由敏感库数据组成的特征向量表示为:
V=((a11,d11),(a12,d12),......,(a1m,d1m),......,(an1,dn1),(an1,dn1),......,(anm,dnm))
简记为:
V=(d11,d12,......,d1m,......,dn1dn2,......,dnm)
同样的方法得到报文的特征向量简记为:
V'=(d'11,d'12,......,d'1m,......,d'n1d'n2,......,d'nm)
步骤3、在前置代理部分实现标签封装,在隔离服务侧实现标签解析
标签封装和解析包含有标签,标签及私有协议封装,标签及私有协议解析。标签封装和解析通过在发送端对访问用户的用户信息,发送数据属性信息,数据的特征向量信息进行标记,然后通过私有协议对数据进行随机分块加密,再发送至服务端。在服务端,通过解析技术首先将数据恢复。恢复后的数据为标签过滤和特征向量过滤服务。
标签包括用户信息U、数据属性信息,特征向量V、生成时间T和加密标识等信息。
Label=(U(k,v),Ad(k,v),V’,T,Fe)
其中,
1)用户信息包括用户身份信息和用户请求操作信息,用户信息以键值对的形式存在;
2)数据属性信息包含有数据类型、数据大小、数据创造者、数据修改时间等,数据属性也以键值对的形式存在。
3)特征向量用于服务端的基于特征向量的内容过滤;
4)生成时间为标签产生的时间;
5)加密标识用于标识标签分块后,块数据是否被加密,加密标识在服务端不解析时使用。
如图3所示,标签及私有协议封装将标签内容进行私有格式化处理,步骤如下,
步骤a:将用户信息U、数据属性信息Ad(k,v),特征向量V’、生成时间T按序排列,并分块成N块;
步骤b:随机选择N块中的N1块,设置加密标识,并对数据进行加密获得EN1;
步骤c:记录随机选择过程R,将R作为块,设置加密标识,加密R获得ER;
步骤d:对剩余的N2(N-N1)块不设置加密标识;
步骤e:计算EN1的长度和ER的长度,然后连接EN1长度、EN1、ER长度、ER和N2得E,上述过程如图例3所示。
标签及私有化协议封装后,将以报文形式发送至服务端。服务端首先对报告进行标签及私有协议解析,恢复标签值,步骤如下:
步骤a:获取私有协议数据E;
步骤b:提取EN1长度,通过EN1长度提取EN1,并解密EN1获得N1;
步骤c:提取ER长度,通过ER长度提取ER,并解密ER获得R;
步骤d:提取后面的数据N2;
步骤e:通过随机选择过程R,将N1和N2恢复到U(k,v),Ad(k,v),V’和T。
步骤4、在隔离服务侧实现标签过滤
标签过滤通过设计灵活的策略规则,依客户端提供的数据属性,对数据进行过滤。
策略规则为策略过滤的规范。策略规则提供了一个统一的策略描述,以能够处理属性信息来达到过滤数据的目的。为了方便计算与扩展,策略规则设计为自定义的表达式,它由变量、值和操作符构成。变量值依据变量从数据属性信息中提取,操作符和变量由具体策略设置。过滤时,将属性值替换变量值,然后计算策略表达式,最后输出计算结果。由于策略规则使用表达式,所以策略规则非常灵活。
形式化策略规则,
策略规则由左括号[,关键字begin,表达式(exp),关键字end,右括号]构成。表达式由两部分构成,
基本项:变量(var)、数值(float和integer)和字符串(string);
构成项:由变量、数值和字符串,通过一元(opu)、二元(opb)操作符连接的复杂表达式。
使用自定义的表达式来描述策略规则,能够使基于策略的过滤不仅方便、而且操作性强,扩展性灵活。策略过滤流程如图4所示,
步骤a:从解析步骤中提取用户信息和数据属性信息U(k,v)和Ad(k,v),并重新赋给新的属性信息Ad(k,v);
步骤b:从策略库中提取策略规则exp;
步骤c:遍历策略规则表达式exp,提取表达式中的变量var;
步骤d:将var为键从Ad(k,v)中提取var对应值v(整型数、浮点型数和字符串);
步骤e:将策略规则中的var由v替代,并计算表达式;
步骤f:依据计算结果判定数据是否被过滤,并记录日志。
步骤5、在隔离服务侧结合特征向量和标签过滤实现内容过滤
提取解析标签中的特征向量值V’,与隔离装置上的敏感库的特征向量V通过余弦计算得到相似度,余弦相似度计算公式如下:
c o s θ = V , · V | | V , | | | | V | |
式中,V'和V为两个特征向量,V'·V为标准向量点积,定义为t为向量的维数,向量一般可以表示为一个数列,数列中的每个数称为分量,维数即分量的个数,例如(a1,a2,a3)的维数为3,分母中的范数||V'||定义为
通过将余弦相似度值与预定义的相似度阈值比较,分析得到报文是否携带涉密信息,对涉密的文档进行过滤,达到内容过滤的功能。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。

Claims (10)

1.一种面向电力物联网的数据隔离交换和安全过滤方法,其特征在于,所述方法包括如下步骤:
(1)构建一种基于前置代理和专有协议的隔离架构;
(2)在前置代理部分进行特征向量提取;
(3)在所述前置代理部分进行标签封装,在隔离服务侧进行标签解析;
(4)在隔离服务侧实现标签过滤;
(5)在所述隔离服务侧结合特征向量和标签过滤进行内容过滤。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)中,所述隔离架构包括基于TCP/IP协议专有的应用层交换协议、专用安全隔离装置和前置代理,所述隔离架构用于将用户交互过程映射为所述应用层交换协议报文,以实现数据交换。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)中,包括如下步骤:
步骤2-1、对报文内容Ti进行预处理;
步骤2-2、对所述报文内容Ti进行特征提取;
步骤2-3、生成报文特征向量V’和隔离服务侧中敏感库的特征向量V;
步骤2-4、将提取的特征向量保存到报文的标签字段中。
4.根据权利要求3所述的方法,其特征在于,所述步骤2-1中,所述预处理为通过ICTCLAS分词接口,将文本文件进行分词解析,报文内容Ti分词后表示为如下形式:
Ti=((ai1,li1,pi1),(ai2,li2,pi2),......,(ain,lin,pin))
式中:Ti表示报文i,ain表示划分出来的词组,lin表示词组的长度,pin表示划分出来的词组的词性。
5.根据权利要求3所述的方法,其特征在于,所述步骤2-2中,包括如下步骤:
步骤2-2-1、对所述报文内容Ti进行词性选择,提取分析后的文本词组中的名词性词组,删除其它词性,所述报文内容Ti经过词性选择后,表达式如下:
式中:Tai为提取名词之后的文本, 为名词,为名词词组的长度;
步骤2-2-2、统计关键字的出现频率,形成分词三元组,包含词组、词组在本文本中出现的频率和词性,将Tai增加一个词频项,表达式如下:
式中:Tbi为统计词频之后的文本,为统计词频后的词组,为统计词频后词组的长度,的词频;
步骤2-2-3、计算每个关键字的长度并删除单个字的关键字,表达式如下:
式中:Tci为删除关键字为单个字之后的文本,其中为长度大于一个字的词组,词频;
步骤2-2-4、剔除关键字出现一次的词组,得到的最终表达式为:
其中:Tdi为剔除关键字出现一次之后的文本,为剔除关键字出现一次之后的词组,的词频,其中
6.根据权利要求3所述的方法,其特征在于,所述步骤2-3中,包括如下步骤:
步骤2-3-1、基于TF-IDF公式对词组的权值进行计算,公式为:
其中,dij为词组aij在文本Ti中出现的次数,等于Tdi中的N为文档的总数,nj为文档库中包含词组aij的文档的个数;
步骤2-3-2、由敏感库数据组成的特征向量表示为:
V=((a11,d11),(a12,d12),......,(a1m,d1m),......,(an1,dn1),(an1,dn1),......,(anm,dnm))
简记为:
V=(d11,d12,......,d1m,......,dn1,dn2,......,dnm)
步骤2-3-3、根据步骤2-3-2,得到报文的特征向量简记为:
V′=(d′11,d′12,......,d′1m,......,d′n1,d′n2,......,d′nm)。
7.根据权利要求1所述的方法,其特征在于,所述步骤(3)中,所述标签包括用户信息U(k,v)、数据属性信息Ad(k,v),特征向量V’、生成时间T和加密标识Fe信息,表达式为:
Label=(U(k,v),Ad(k,v),V’,T,Fe)
所述前置代理部分进行标签封装包括如下步骤:
步骤3-1-1、用户信息U、数据属性信息Ad(k,v),特征向量V’、生成时间T按序排列,并分块成N块;
步骤3-1-2、随机选择N块中的N1块,设置加密标识,并对数据进行加密获得EN1;
步骤3-1-3、记录随机选择过程R,将R作为块,设置加密标识,加密R获得ER;
步骤3-1-4、对剩余的N2(N-N1)块不设置加密标识;
步骤3-1-5、计算所述EN1的长度和所述ER的长度,并连接EN1长度、EN1、ER长度、ER和N2得标签封装后的私有协议数据E;
所述在隔离服务侧进行标签解析包括如下步骤:
步骤3-2-1、获取所述私有协议数据E;
步骤3-2-2、提取所述EN1长度,通过EN1长度提取EN1,并解密EN1获得N1;
步骤3-2-3、提取ER长度,通过ER长度提取ER,并解密ER获得R;
步骤3-2-4、提取后面的数据N2;
步骤3-2-5、通过随机选择过程R,将N1和N2恢复到U(k,v),Ad(k,v),V’和T。
8.根据权利要求7所述的方法,其特征在于,所述步骤(4)中,所述标签过滤是通过策略规则,依客户端提供的数据属性,对数据进行过滤;所述策略规则由左括号[,关键字begin,表达式exp,关键字end,右括号]构成;所述表达式由基本项和构成项构成,所述基本项包括变量var、数值和字符串,所述构成项是由变量、数值和字符串,通过一元、二元操作符连接的复杂表达式。
9.根据权利要求8所述的方法,其特征在于,所述标签过滤包括如下步骤:
步骤4-1、提取所述用户信息U(k,v)和所述数据属性信息Ad(k,v)重新赋给新的属性信息Ad’(k,v);
步骤4-2、从策略库中提取策略规则;
步骤4-3、遍历策略规则表达式exp,提取表达式中的变量var;
步骤4-4、将所述var为键从所述Ad’(k,v)中提取var对应值v;
步骤4-5、将策略规则中的var由v替代,并计算表达式;
步骤4-6、依据计算结果判定数据是否被过滤,并记录日志。
10.根据权利要求9所述的方法,其特征在于,所述步骤(5)中,包括如下步骤:
步骤5-1、特征向量V’与隔离服务侧中敏感库的特征向量V通过余弦计算得到余弦相似度值,余弦相似度计算公式如下:
式中,V'和V为两个特征向量,V'·V为标准向量点积,定义为t为向量的维数,分母中的范数||V'||定义为分母中的范数||V||定义为
步骤5-2、通过将余弦相似度值与预定义的相似度阈值比较,分析得到报文是否携带涉密信息,对涉密的文档进行过滤。
CN201510824673.3A 2015-11-24 2015-11-24 一种面向电力物联网的数据隔离交换和安全过滤方法 Active CN105491023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510824673.3A CN105491023B (zh) 2015-11-24 2015-11-24 一种面向电力物联网的数据隔离交换和安全过滤方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510824673.3A CN105491023B (zh) 2015-11-24 2015-11-24 一种面向电力物联网的数据隔离交换和安全过滤方法

Publications (2)

Publication Number Publication Date
CN105491023A true CN105491023A (zh) 2016-04-13
CN105491023B CN105491023B (zh) 2020-10-27

Family

ID=55677739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510824673.3A Active CN105491023B (zh) 2015-11-24 2015-11-24 一种面向电力物联网的数据隔离交换和安全过滤方法

Country Status (1)

Country Link
CN (1) CN105491023B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108923422A (zh) * 2018-07-13 2018-11-30 全球能源互联网研究院有限公司 物联代理数据处理方法、***及电网终端设备监测***
CN109936541A (zh) * 2017-12-18 2019-06-25 中国电子科技集团公司第十五研究所 软件定义网络数据隔离交换方法

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070149952A1 (en) * 2005-12-28 2007-06-28 Mike Bland Systems and methods for characterizing a patient's propensity for a neurological event and for communicating with a pharmacological agent dispenser
CN101035128A (zh) * 2007-04-18 2007-09-12 大连理工大学 基于中文标点符号的三重网页文本内容识别及过滤方法
US20080300878A1 (en) * 1999-11-12 2008-12-04 Bennett Ian M Method For Transporting Speech Data For A Distributed Recognition System
US7562393B2 (en) * 2002-10-21 2009-07-14 Alcatel-Lucent Usa Inc. Mobility access gateway
CN102006307A (zh) * 2010-12-16 2011-04-06 中国电子科技集团公司第三十研究所 一种基于应用代理的网管***隔离控制装置
US20120162449A1 (en) * 2010-12-23 2012-06-28 Matthias Braun Digital image stabilization device and method
CN103001862A (zh) * 2011-09-14 2013-03-27 日照市活点网络科技有限公司 一种物联网交换***及数据处理方法
CN103116620A (zh) * 2013-01-29 2013-05-22 中国电力科学研究院 基于策略的非结构化数据安全过滤方法
CN103338190A (zh) * 2013-06-13 2013-10-02 国家电网公司 基于用户行为可信的非结构化数据安全交换方法
CN103377252A (zh) * 2012-04-28 2013-10-30 国际商业机器公司 在物联网中进行数据过滤的方法和装置
US8838741B1 (en) * 2007-09-05 2014-09-16 Trend Micro Incorporated Pre-emptive URL filtering technique
CN104346379A (zh) * 2013-07-31 2015-02-11 克拉玛依红有软件有限责任公司 一种基于逻辑和统计技术的数据元识别方法
CN104378657A (zh) * 2014-09-01 2015-02-25 国家电网公司 一种基于代理与隔离的视频安全接入***及其方法
CN104881581A (zh) * 2015-05-28 2015-09-02 成都艺辰德迅科技有限公司 物联网数据高效分析方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080300878A1 (en) * 1999-11-12 2008-12-04 Bennett Ian M Method For Transporting Speech Data For A Distributed Recognition System
US7562393B2 (en) * 2002-10-21 2009-07-14 Alcatel-Lucent Usa Inc. Mobility access gateway
US20070149952A1 (en) * 2005-12-28 2007-06-28 Mike Bland Systems and methods for characterizing a patient's propensity for a neurological event and for communicating with a pharmacological agent dispenser
CN101035128A (zh) * 2007-04-18 2007-09-12 大连理工大学 基于中文标点符号的三重网页文本内容识别及过滤方法
US8838741B1 (en) * 2007-09-05 2014-09-16 Trend Micro Incorporated Pre-emptive URL filtering technique
CN102006307A (zh) * 2010-12-16 2011-04-06 中国电子科技集团公司第三十研究所 一种基于应用代理的网管***隔离控制装置
US20120162449A1 (en) * 2010-12-23 2012-06-28 Matthias Braun Digital image stabilization device and method
CN103001862A (zh) * 2011-09-14 2013-03-27 日照市活点网络科技有限公司 一种物联网交换***及数据处理方法
CN103377252A (zh) * 2012-04-28 2013-10-30 国际商业机器公司 在物联网中进行数据过滤的方法和装置
CN103116620A (zh) * 2013-01-29 2013-05-22 中国电力科学研究院 基于策略的非结构化数据安全过滤方法
CN103338190A (zh) * 2013-06-13 2013-10-02 国家电网公司 基于用户行为可信的非结构化数据安全交换方法
CN104346379A (zh) * 2013-07-31 2015-02-11 克拉玛依红有软件有限责任公司 一种基于逻辑和统计技术的数据元识别方法
CN104378657A (zh) * 2014-09-01 2015-02-25 国家电网公司 一种基于代理与隔离的视频安全接入***及其方法
CN104881581A (zh) * 2015-05-28 2015-09-02 成都艺辰德迅科技有限公司 物联网数据高效分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
朱长安: "网络层MPLS的安全VPN研究", 《计算机工程》 *
杜卿: "基于社交关系的问答***及最佳回答者推荐技术", 《华南理工大学学报》 *
毛秀伟: "电力数据通信综合传输平台探讨", 《电力***通信》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109936541A (zh) * 2017-12-18 2019-06-25 中国电子科技集团公司第十五研究所 软件定义网络数据隔离交换方法
CN109936541B (zh) * 2017-12-18 2021-10-01 中国电子科技集团公司第十五研究所 软件定义网络数据隔离交换方法
CN108923422A (zh) * 2018-07-13 2018-11-30 全球能源互联网研究院有限公司 物联代理数据处理方法、***及电网终端设备监测***

Also Published As

Publication number Publication date
CN105491023B (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
Hasan et al. Blockchain technology on smart grid, energy trading, and big data: security issues, challenges, and recommendations
Xu et al. A Markovian jump system approach to consensus of heterogeneous multiagent systems with partially unknown and uncertain attack strategies
CN112395643B (zh) 一种神经网络的数据隐私保护方法及***
CN103618652B (zh) 一种业务数据的审计和深度分析***及其方法
CN109525608A (zh) 日志上报方法和装置、日志管理方法和装置及终端设备
CN108040098B (zh) 基于可视信息单向传输的网络隔离方法和***
Kahvazadeh et al. Securing combined fog-to-cloud system through SDN approach
CN112235257A (zh) 融合式加密恶意流量检测方法及***
CN103530538B (zh) 一种基于Schema的XML安全视图查询方法
CN103957174B (zh) 语义交换机松耦合***进行信息处理的方法
CN111698291A (zh) 一种区块链节点存储云***
CN105491023A (zh) 一种面向电力物联网的数据隔离交换和安全过滤方法
CN113518042A (zh) 一种数据处理方法、装置、设备及存储介质
Yang et al. Review on application progress of federated learning model and security hazard protection
CN114205816B (zh) 一种电力移动物联网信息安全架构及其使用方法
Hong et al. Graph based encrypted malicious traffic detection with hybrid analysis of multi-view features
Wang Full‐scene network security protection system based on ubiquitous power Internet of things
CN104994107B (zh) 一种基于iec62351的mms报文离线分析方法
CN103944775A (zh) 一种网络流量采集分析及展示输出的方法
CN113946871A (zh) 隐私保护数据记录集成方法、***和计算机可读存储介质
CN101408955A (zh) 一种基于策略的责任认定方法与***
Lv et al. A review of big data security and privacy protection technology
CN117151736A (zh) 反电诈管理预警方法及***
CN103957173A (zh) 语义交换机
CN102195771B (zh) 安全协议分析方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant