CN105491023A

CN105491023A - 一种面向电力物联网的数据隔离交换和安全过滤方法

Info

Publication number: CN105491023A
Application number: CN201510824673.3A
Authority: CN
Inventors: 周诚; 张涛; 马媛媛; 李伟伟; 汪晨; 邵志鹏; 费稼轩; 何高峰; 楚杰; 黄秀丽
Original assignee: State Grid Corp of China SGCC; Smart Grid Research Institute of SGCC
Current assignee: State Grid Corp of China SGCC; Smart Grid Research Institute of SGCC
Priority date: 2015-11-24
Filing date: 2015-11-24
Publication date: 2016-04-13
Anticipated expiration: 2035-11-24
Also published as: CN105491023B

Abstract

本发明提供一种面向电力物联网的数据隔离交换和安全过滤方法，所述方法包括：(1)构建一种基于前置代理和专有协议的隔离架构；(2)在前置代理部分进行特征向量提取；(3)在所述前置代理部分进行标签封装，在隔离服务侧进行标签解析；(4)在隔离服务侧实现标签过滤；(5)在所述隔离服务侧结合特征向量和标签过滤进行内容过滤。本发明通过引入前置代理和私有应用层协议实现了完善的协议隔离，大大提高了隔离强度。

Description

一种面向电力物联网的数据隔离交换和安全过滤方法

技术领域

本发明涉及一种安全隔离交换方法，具体涉及一种面向电力物联网的数据隔离交换和安全过滤方法。

背景技术

安全隔离与信息交换技术的基本原理是，通过一种专用硬件——隔离装置，使两个或者两个以上网络在不连通的情况下进行网络之间的安全数据传输和资源共享。具体做法一般是，隔离装置切断网络之间的TCP/IP连接，分解或重组TCP/IP数据包，进行安全审查，然后与另一边的主机建立有效连接并把数据发送出去。

在智能电网发展背景下，电力物联网环境中存在海量智能终端、智能刀闸、作业终端以及各种电力业务***，这些终端和***需要与电力信息网进行频繁的数据交互。由于电力信息网属于涉密网络，而上述终端和***多通过移动APN网络或者互联网完成接入，两者的交互对电力信息网来说存在明显的安全风险，因此必须采取隔离防护措施。然而现有的安全隔离与信息交换技术存在明显不足，难以满足电力物联网的隔离交换需求，具体表现为：

1、隔离强度不足

隔离与交换是一对矛盾，传统的安全隔离与信息交换技术基于TCP/IP数据包的分解和重组，在解决隔离与交换的矛盾问题上存在明显不足。绝大多数特定的数据交换都需要承载于特定的应用协议，而一旦在安全隔离与信息交换模型中加入应用层协议的考虑，就会发现TCP/IP报文重组并不能完全消除应用层协议引入的安全风险。假设非涉密网络通过安全隔离与信息交换***与涉密网络中的Oracle数据库进行数据交换，此时非涉密网络和涉密网络都必须基于TNS协议进行通信，而TCP/IP报文在经过硬件交换矩阵后仍需还原成TNS协议报文格式，这就导致非涉密网络的攻击者实际上完全可以通过公开的TNS协议报文实现对涉密网络数据库的攻击。传统安全隔离与信息交换技术对这种攻击的防御措施是尽可能增强应用层过滤能力，但这显然已经退化到应用层防火墙的水平。

2、过滤深度和效率存在矛盾

传统的安全隔离与信息交换技术体系中，安全过滤是重要的一环。许多相关产品都声称具备内容级的过滤能力。然而内容过滤算法不可能是没有性能代价的，内容过滤的深度越深，其造成的延迟和吞吐量下降情况越严重。传统的安全隔离与信息交换技术体系试图在隔离装置上完成深度过滤，这在工业环境中很可能是不可行的。例如电力物联网环境中涉及的终端数以亿计，数据交换流量巨大，对数据交换延迟也有严格要求，传统的安全隔离与信息交换技术体系只能通过关闭过滤功能或者降低过滤深度来应对，在解决过滤深度和效率的矛盾方面存在明显不足。

发明内容

为了克服上述现有技术的不足，本发明提供一种面向电力物联网的数据隔离交换和安全过滤方法，本发明通过引入前置代理和私有应用层协议实现了完善的协议隔离，大大提高了隔离强度。

为了实现上述发明目的，本发明采取如下技术方案：

一种面向电力物联网的数据隔离交换和安全过滤方法，所述方法包括如下步骤：

(1)构建一种基于前置代理和专有协议的隔离架构；

(2)在前置代理部分进行特征向量提取；

(3)在所述前置代理部分进行标签封装，在隔离服务侧进行标签解析；

(4)在隔离服务侧实现标签过滤；

(5)在所述隔离服务侧结合特征向量和标签过滤进行内容过滤。

优选的，所述步骤(1)中，所述隔离架构包括基于TCP/IP协议专有的应用层交换协议、专用安全隔离装置和前置代理，所述隔离架构用于将用户交互过程映射为所述应用层交换协议报文，以实现数据交换。

优选的，所述步骤(2)中，包括如下步骤：

步骤2-1、对报文内容T_i进行预处理；

步骤2-2、对所述报文内容T_i进行特征提取；

步骤2-3、生成报文特征向量V’和隔离服务侧中敏感库的特征向量V；

步骤2-4、将提取的特征向量保存到报文的标签字段中。

优选的，所述步骤2-1中，所述预处理为通过ICTCLAS分词接口，将文本文件进行分词解析，报文内容T_i分词后表示为如下形式：

T_i＝((a_i1,l_i1,p_i1),(a_i2,l_i2,p_i2),......,(a_in,l_in,p_in))

式中：T_i表示报文i，a_in表示划分出来的词组，l_in表示词组的长度，p_in表示划分出来的词组的词性。

优选的，所述步骤2-2中，包括如下步骤：

步骤2-2-1、对所述报文内容T_i进行词性选择，提取分析后的文本词组中的名词性词组，删除其它词性，所述报文内容T_i经过词性选择后，表达式如下：

{Ta}_{i} = ((a_{i 1}^{p}, l_{i 1}^{p}), (a_{i 2}^{p}, l_{i 2}^{p}), ...... (a_{i n}^{p}, l_{i n}^{p}))

式中：Ta_i为提取名词之后的文本，为名词，为名词词组的长度；

步骤2-2-2、统计关键字的出现频率，形成分词三元组，包含词组、词组在本文本中出现的频率和词性，将Ta_i增加一个词频项，表达式如下：

{Tb}_{i} = ((a_{i 1}^{f}, l_{i 1}^{f}, f_{i 1}^{f}), (a_{i 2}^{f}, l_{i 2}^{f}, f_{i 2}^{f}), ...... (a_{i n}^{f}, l_{i n}^{f}, f_{i n}^{f}))

式中：Tb_i为统计词频之后的文本，为统计词频后的词组，为统计词频后词组的长度，为的词频；

步骤2-2-3、计算每个关键字的长度并删除单个字的关键字，表达式如下：

{Tc}_{i} = ((a_{i 1}^{l}, f_{i 1}^{l}), (a_{i 2}^{l}, f_{i 2}^{l}), ...... (a_{i n}^{l}, f_{i n}^{l}))

式中：Tc_i为删除关键字为单个字之后的文本，其中为长度大于一个字的词组，为词频；

步骤2-2-4、剔除关键字出现一次的词组，得到的最终表达式为：

{Td}_{i} = ((a_{i 1}^{m}, f_{i 1}^{m}), (a_{i 2}^{m}, f_{i 2}^{m}), ...... (a_{i m}^{m}, f_{i m}^{m}))

其中：Td_i为剔除关键字出现一次之后的文本，为剔除关键字出现一次之后的词组，为的词频，其中

f_{i m}^{m} > 1.

优选的，所述步骤2-3中，包括如下步骤：

步骤2-3-1、基于TF-IDF公式对词组的权值进行计算，公式为：

d_ij＝t_ij*log(N/n_j)

其中，d_ij为词组a_ij在文本T_i中出现的次数，等于Td_i中的N为文档的总数，n_j为文档库中包含词组a_ij的文档的个数；

步骤2-3-2、由敏感库数据组成的特征向量表示为：

V＝((a₁₁,d₁₁),(a₁₂,d₁₂),......,(a_1m,d_1m),......,(a_n1,d_n1),(a_n1,d_n1),......,(a_nm,d_nm))

简记为：

V＝(d₁₁,d₁₂,......,d_1m,......,d_n1,d_n2,......,d_nm)

步骤2-3-3、根据步骤2-3-2，得到报文的特征向量简记为：

V′＝(d′₁₁,d′₁₂,......,d′_1m,......,d′_n1,d′_n2,......,d′_nm)。

优选的，所述步骤(3)中，所述标签包括用户信息U(k,v)、数据属性信息Ad(k,v)，特征向量V’、生成时间T和加密标识Fe信息，表达式为：

Label＝(U(k,v),Ad(k,v),V’,T,Fe)

所述前置代理部分进行标签封装包括如下步骤：

步骤3-1-1、用户信息U、数据属性信息Ad(k,v)，特征向量V’、生成时间T按序排列，并分块成N块；

步骤3-1-2、随机选择N块中的N1块，设置加密标识，并对数据进行加密获得EN1；

步骤3-1-3、记录随机选择过程R，将R作为块，设置加密标识，加密R获得ER；

步骤3-1-4、对剩余的N2(N-N1)块不设置加密标识；

步骤3-1-5、计算所述EN1的长度和所述ER的长度，并连接EN1长度、EN1、ER长度、ER和N2得标签封装后的私有协议数据E；

所述在隔离服务侧进行标签解析包括如下步骤：

步骤3-2-1、获取所述私有协议数据E；

步骤3-2-2、提取所述EN1长度，通过EN1长度提取EN1，并解密EN1获得N1；

步骤3-2-3、提取ER长度，通过ER长度提取ER，并解密ER获得R；

步骤3-2-4、提取后面的数据N2；

步骤3-2-5、通过随机选择过程R，将N1和N2恢复到U(k,v),Ad(k,v),V’和T。

优选的，所述步骤(4)中，所述标签过滤是通过策略规则，依客户端提供的数据属性，对数据进行过滤；所述策略规则由左括号[，关键字begin，表达式exp，关键字end，右括号]构成；所述表达式由基本项和构成项构成，所述基本项包括变量var、数值和字符串，所述构成项是由变量、数值和字符串，通过一元、二元操作符连接的复杂表达式。

优选的，所述标签过滤包括如下步骤：

步骤4-1、提取所述用户信息U(k,v)和所述数据属性信息Ad(k,v)重新赋给新的属性信息Ad’(k,v)；

步骤4-2、从策略库中提取策略规则；

步骤4-3、遍历策略规则表达式exp，提取表达式中的变量var；

步骤4-4、将所述var为键从所述Ad’(k,v)中提取var对应值v；

步骤4-5、将策略规则中的var由v替代，并计算表达式；

步骤4-6、依据计算结果判定数据是否被过滤，并记录日志。

优选的，所述步骤(5)中，包括如下步骤：

步骤5-1、特征向量V’与隔离服务侧中敏感库的特征向量V通过余弦计算得到余弦相似度值，余弦相似度计算公式如下：

c o s θ = \frac{V^{'} \cdot V}{| | V^{'} | | | | V | |}

式中，V'和V为两个特征向量，V'·V为标准向量点积，定义为t为向量的维数，分母中的范数||V'||定义为分母中的范数||V||定义为

步骤5-2、通过将余弦相似度值与预定义的相似度阈值比较，分析得到报文是否携带涉密信息，对涉密的文档进行过滤。

与现有技术相比，本发明的有益效果在于：

本发明只需要提供一个私有的JDBC驱动，在非涉密网络并不需要开放TNS协议通信，仅在涉密网络开放TNS协议通信，这样隔离边界两侧网络的报文完全经过语义翻译，不具备简单映射关系，非涉密网络的攻击者无法攻击内网TNS协议漏洞，从而实现了完善的协议隔离，大大提高了隔离强度。

本发明通过基于特有的隔离交换架构，将深度内容解析和内容特征值提取前移到前置代理侧完成，在隔离装置侧则只进行特征值匹配，这样隔离边界的计算需求大幅降低。在电力物联网环境下，该技术可以利用数以亿计的智能终端设备实现分布式的内容过滤计算，从而实现高效率低延迟的分布式内容过滤。较好的解决了过滤深度和交换效率的矛盾。

本发明通过引入前置代理，将隔离交换的边界前移至终端侧，电力物联网环境下大量的智能终端基于可信计算的理念构建，运行在智能终端的前置代理软件可以与智能终端的可信计算体系相结合，通过私有应用层协议加固，将整个隔离交换体系纳入到可信交换系中去，从而实现可信隔离交换。

附图说明

图1是本发明提供的一种面向电力物联网的数据隔离交换和安全过滤方法流程图

图2是本发明提供的在前置代理部分实现特征向量提取的流程图

图3是本发明提供的标签及私有协议封装将标签内容进行私有格式化处理的流程图

图4是本发明提供的策略过滤的流程图

具体实施方式

下面结合附图对本发明作进一步详细说明。

如图1所示，本发明提供了一种面向电力物联网的数据隔离交换和安全过滤方法，采取如下技术方案：

步骤1、隔离架构的构建

构建一种基于前置代理和专有协议的隔离架构，包括一种基于TCP/IP协议的专有的应用层交互协议、一种专用安全隔离装置，该装置一方面具备硬件级的TCP/IP协议分解重组和交换能力，另一方面仅支持上述专用应用层协议通信，拒绝一切第三方公开应用层协议、一种前置代理，可以是驱动、SDK或者硬件插件等形式，在本架构中主要作用是将用户交互过程映射为专用应用层协议报文，以实现数据交换，前置代理在实际实现过程中也能够起到终端加固和可信认证的作用。

步骤2、在前置代理部分实现特征向量提取，如图2所示

首先对报文内内容Ti进行预处理,之后进行特征提取生成报文特征向量V’和敏感库特征向量V,并将提取的特征向量保存到报文的标签字段中。

(1)预处理

通过ICTCLAS分词接口，将文本文件进行分词解析，报文内容T_i分词后表示为如下形式：

T_i＝((a_i1,l_i1,p_i1),(a_i2,l_i2,p_i2),......,(a_in,l_in,p_in))

其中：T_i表示报文i，a_in表示划分出来的词组，l_in表示词组的长度，p_in表示划分出来的词组的词性。

(2)特征提取

1)词性选择

在中文的文本中，根据词性取其中能够最强烈表达文章内容的关键词，用于后面的特征提取，有助于消除冗余，简便计算过程。因此提取分析后的文本词组中的名词性词组，删除其它词性。文本文件T_i经过词性选择后，表示为如下：

{Ta}_{i} = ((a_{i 1}^{p}, l_{i 1}^{p}), (a_{i 2}^{p}, l_{i 2}^{p}), ...... (a_{i n}^{p}, l_{i n}^{p}))

式中：Ta_i为提取名词之后的文本，为名词，为名词词组的长度。

2)词频统计

统计关键字的出现频率，形成分词三元组，包含词组，词组在本文本中出现的频率和词性。将增加一个词频项，进一步表达为：

{Tb}_{i} = ((a_{i 1}^{f}, l_{i 1}^{f}, f_{i 1}^{f}), (a_{i 2}^{f}, l_{i 2}^{f}, f_{i 2}^{f}), ...... (a_{i n}^{f}, l_{i n}^{f}, f_{i n}^{f}))

式中：Tb_i为统计词频之后的文本，为统计词频后的词组，为统计词频后词组的长度，为的词频。

3)词长选择

在中文的文本中，词比字有着更强的表达能力，计算每个关键字的长度并删除单个字的关键词。进一步表达为：

{Tc}_{i} = ((a_{i 1}^{l}, f_{i 1}^{l}), (a_{i 2}^{l}, f_{i 2}^{l}), ...... (a_{i n}^{l}, f_{i n}^{l}))

式中：Tc_i为删除关键字为单个字之后的文本，其中为长度大于一个字的词组，为词频。

4)词频选择

在中文的文本中，只出现一次的词具有偶然性不具备代表性，因此剔除统计后的文本分词三元组中只出现过一次的词组。得到最终的特征二元组表达为：

{Td}_{i} = ((a_{i 1}^{m}, f_{i 1}^{m}), (a_{i 2}^{m}, f_{i 2}^{m}), ...... (a_{i m}^{m}, f_{i m}^{m}))

f_{i m}^{m} > 1.

(3)生成特征向量

对词的权值的计算是衡量特征值的有效方法，目前广泛使用的是基于统计方法的TF-IDF公式，这个公式在大量实际使用中被证明是可行的有效的。其核心思想是，认为某个词在其它文本中出现的次数越是少，那么这个词就包含越多的信息，越能够代表文档的类型，相反，如果在其它文档中也是大量的出现，那么这个词就不具有代表性。

目前常用的计TF-IDF计算公式表示为：

d_ij＝t_ij*log(N/n_j)

其中，t_ij为词组a_ij在文本T_i中出现的次数，等于Td_i中的f_im，N为文档的总数，n_j为文档库中包含词组a_ij的文档的个数。

由敏感库数据组成的特征向量表示为：

简记为：

V＝(d₁₁,d₁₂,......,d_1m,......,d_n1d_n2,......,d_nm)

同样的方法得到报文的特征向量简记为：

V'＝(d'₁₁,d'₁₂,......,d'_1m,......,d'_n1d'_n2,......,d'_nm)

步骤3、在前置代理部分实现标签封装，在隔离服务侧实现标签解析

标签封装和解析包含有标签，标签及私有协议封装，标签及私有协议解析。标签封装和解析通过在发送端对访问用户的用户信息，发送数据属性信息，数据的特征向量信息进行标记，然后通过私有协议对数据进行随机分块加密，再发送至服务端。在服务端，通过解析技术首先将数据恢复。恢复后的数据为标签过滤和特征向量过滤服务。

标签包括用户信息U、数据属性信息，特征向量V、生成时间T和加密标识等信息。

Label＝(U(k,v),Ad(k,v),V’,T,Fe)

其中，

1)用户信息包括用户身份信息和用户请求操作信息，用户信息以键值对的形式存在；

2)数据属性信息包含有数据类型、数据大小、数据创造者、数据修改时间等，数据属性也以键值对的形式存在。

3)特征向量用于服务端的基于特征向量的内容过滤；

4)生成时间为标签产生的时间；

5)加密标识用于标识标签分块后，块数据是否被加密，加密标识在服务端不解析时使用。

如图3所示，标签及私有协议封装将标签内容进行私有格式化处理，步骤如下，

步骤a:将用户信息U、数据属性信息Ad(k,v)，特征向量V’、生成时间T按序排列，并分块成N块；

步骤b:随机选择N块中的N1块，设置加密标识，并对数据进行加密获得EN1；

步骤c:记录随机选择过程R，将R作为块，设置加密标识，加密R获得ER；

步骤d:对剩余的N2(N-N1)块不设置加密标识；

步骤e:计算EN1的长度和ER的长度，然后连接EN1长度、EN1、ER长度、ER和N2得E，上述过程如图例3所示。

标签及私有化协议封装后，将以报文形式发送至服务端。服务端首先对报告进行标签及私有协议解析，恢复标签值，步骤如下：

步骤a:获取私有协议数据E；

步骤b:提取EN1长度，通过EN1长度提取EN1，并解密EN1获得N1；

步骤c:提取ER长度，通过ER长度提取ER，并解密ER获得R；

步骤d:提取后面的数据N2；

步骤e:通过随机选择过程R，将N1和N2恢复到U(k,v),Ad(k,v),V’和T。

步骤4、在隔离服务侧实现标签过滤

标签过滤通过设计灵活的策略规则，依客户端提供的数据属性，对数据进行过滤。

策略规则为策略过滤的规范。策略规则提供了一个统一的策略描述，以能够处理属性信息来达到过滤数据的目的。为了方便计算与扩展，策略规则设计为自定义的表达式，它由变量、值和操作符构成。变量值依据变量从数据属性信息中提取，操作符和变量由具体策略设置。过滤时，将属性值替换变量值，然后计算策略表达式，最后输出计算结果。由于策略规则使用表达式，所以策略规则非常灵活。

形式化策略规则，

策略规则由左括号[，关键字begin，表达式(exp)，关键字end，右括号]构成。表达式由两部分构成，

基本项：变量(var)、数值(float和integer)和字符串(string)；

构成项：由变量、数值和字符串，通过一元(opu)、二元(opb)操作符连接的复杂表达式。

使用自定义的表达式来描述策略规则，能够使基于策略的过滤不仅方便、而且操作性强，扩展性灵活。策略过滤流程如图4所示，

步骤a：从解析步骤中提取用户信息和数据属性信息U(k,v)和Ad(k,v),并重新赋给新的属性信息Ad(k,v)；

步骤b:从策略库中提取策略规则exp；

步骤c：遍历策略规则表达式exp，提取表达式中的变量var；

步骤d：将var为键从Ad(k,v)中提取var对应值v(整型数、浮点型数和字符串)；

步骤e：将策略规则中的var由v替代，并计算表达式；

步骤f：依据计算结果判定数据是否被过滤，并记录日志。

步骤5、在隔离服务侧结合特征向量和标签过滤实现内容过滤

提取解析标签中的特征向量值V’，与隔离装置上的敏感库的特征向量V通过余弦计算得到相似度，余弦相似度计算公式如下：

c o s θ = \frac{V^{,} \cdot V}{| | V^{,} | | | | V | |}

式中，V'和V为两个特征向量，V'·V为标准向量点积，定义为t为向量的维数，向量一般可以表示为一个数列，数列中的每个数称为分量，维数即分量的个数，例如(a1,a2,a3)的维数为3，分母中的范数||V'||定义为

通过将余弦相似度值与预定义的相似度阈值比较，分析得到报文是否携带涉密信息，对涉密的文档进行过滤，达到内容过滤的功能。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种面向电力物联网的数据隔离交换和安全过滤方法，其特征在于，所述方法包括如下步骤：

(1)构建一种基于前置代理和专有协议的隔离架构；

(2)在前置代理部分进行特征向量提取；

(4)在隔离服务侧实现标签过滤；

2.根据权利要求1所述的方法，其特征在于，所述步骤(1)中，所述隔离架构包括基于TCP/IP协议专有的应用层交换协议、专用安全隔离装置和前置代理，所述隔离架构用于将用户交互过程映射为所述应用层交换协议报文，以实现数据交换。

3.根据权利要求1所述的方法，其特征在于，所述步骤(2)中，包括如下步骤：

步骤2-1、对报文内容T_i进行预处理；

步骤2-2、对所述报文内容T_i进行特征提取；

步骤2-4、将提取的特征向量保存到报文的标签字段中。

4.根据权利要求3所述的方法，其特征在于，所述步骤2-1中，所述预处理为通过ICTCLAS分词接口，将文本文件进行分词解析，报文内容T_i分词后表示为如下形式：

T_i＝((a_i1,l_i1,p_i1),(a_i2,l_i2,p_i2),......,(a_in,l_in,p_in))

5.根据权利要求3所述的方法，其特征在于，所述步骤2-2中，包括如下步骤：

6.根据权利要求3所述的方法，其特征在于，所述步骤2-3中，包括如下步骤：

步骤2-3-1、基于TF-IDF公式对词组的权值进行计算，公式为：

步骤2-3-2、由敏感库数据组成的特征向量表示为：

简记为：

V＝(d₁₁,d₁₂,......,d_1m,......,d_n1,d_n2,......,d_nm)

步骤2-3-3、根据步骤2-3-2，得到报文的特征向量简记为：

7.根据权利要求1所述的方法，其特征在于，所述步骤(3)中，所述标签包括用户信息U(k,v)、数据属性信息Ad(k,v)，特征向量V’、生成时间T和加密标识Fe信息，表达式为：

Label＝(U(k,v),Ad(k,v),V’,T,Fe)

所述前置代理部分进行标签封装包括如下步骤：

步骤3-1-4、对剩余的N2(N-N1)块不设置加密标识；

所述在隔离服务侧进行标签解析包括如下步骤：

步骤3-2-1、获取所述私有协议数据E；

步骤3-2-3、提取ER长度，通过ER长度提取ER，并解密ER获得R；

步骤3-2-4、提取后面的数据N2；

8.根据权利要求7所述的方法，其特征在于，所述步骤(4)中，所述标签过滤是通过策略规则，依客户端提供的数据属性，对数据进行过滤；所述策略规则由左括号[，关键字begin，表达式exp，关键字end，右括号]构成；所述表达式由基本项和构成项构成，所述基本项包括变量var、数值和字符串，所述构成项是由变量、数值和字符串，通过一元、二元操作符连接的复杂表达式。

9.根据权利要求8所述的方法，其特征在于，所述标签过滤包括如下步骤：

步骤4-2、从策略库中提取策略规则；

步骤4-3、遍历策略规则表达式exp，提取表达式中的变量var；

步骤4-4、将所述var为键从所述Ad’(k,v)中提取var对应值v；

步骤4-5、将策略规则中的var由v替代，并计算表达式；

步骤4-6、依据计算结果判定数据是否被过滤，并记录日志。

10.根据权利要求9所述的方法，其特征在于，所述步骤(5)中，包括如下步骤：