CN110263343B

CN110263343B - 基于短语向量的关键词抽取方法及***

Info

Publication number: CN110263343B
Application number: CN201910548261.XA
Authority: CN
Inventors: 孙新; 赵永妍; 申长虹; 杨凯歌; 张颖捷
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2019-06-24
Filing date: 2019-06-24
Publication date: 2021-06-15
Anticipated expiration: 2039-06-24
Also published as: CN110263343A

Abstract

本发明涉及自然语言处理和深度学习技术领域，特别涉及一种基于短语向量的关键词抽取方法及***。本发明的主要技术方案包括：对原始文本分词并标注词性，根据词性保留n元组，得到候选词项集；对候选关键词集合中包含的大量短语构建向量表示；计算各候选词项的主题权重；以候选词项作为图中的顶点，以候选词项的共现信息为边构造图，以候选词项之间的语义相似度和共现信息计算边的权重，迭代计算每个候选词项的得分并排序。本发明提供的关键词抽取方法及***，既引入了文档中的主题信息，又通过短语间的语义相似度引入了上下文信息，更能够捕捉全文中的重点词，语义精度高，应用范围广。

Description

基于短语向量的关键词抽取方法及***

技术领域

本发明涉及自然语言处理和深度学习技术领域，特别涉及一种基于短语向量的关键词抽取方法及***。

背景技术

近年来，海量数据在给人们带来极大便利的同时，也同样给数据的分析和查找带来了巨大挑战。在大数据背景下，如何从海量数据中快速地获取所需要的重点信息成为人们迫切需要解决的问题。关键词抽取是指通过算法自动地从文档中抽取重要的、具有主题性的词或短语。在科技文献中，关键词或短语可以帮助用户快速了解论文内容。同时，关键词或短语还可以用作信息检索、自然语言处理和文本挖掘中的搜索条目。在关键词抽取任务上，包含单词语义的词向量已经得到了应用并取得了良好的效果。然而，很多专业论文，包括企业论文中含有大量的专有名词，而且这些名词往往都不是单个词而是短语，因此仅用词向量不足以满足关键词抽取任务的需要，文本需要对短语构建向量表示。

当前已有学者提出以词向量为基础利用自编码器进行组合来构建短语向量。自编码器(Auto Encoder)在结构上只有编码器和解码器两个部分，以自编码器对单词向量进行组合来构建短语向量时，可以在编码器部分输入短语中各单词的表示，然后把它们压缩为一个中间隐藏层向量，在解码器部分通过隐藏层向量重新解析出输入的短语，那么这个中间向量就可以认为是包含了语义信息的短语向量表示。然而，在传统自编码器中，直接使用基础的全连接网络进行编码和解码，其中层与层之间是全连接的，每层之间的节点是无连接的，这种普通的自编码网络无法处理类似短语这样的结构中的序列信息。

此外，已有的算法只通过词向量来计算单词的语义相似度，而忽略了文本的主题信息。TextRank是一种基于图的关键词抽取算法，它的基本思想是用文档中的候选词项构成图，用候选词项在文档中的共现关系构造边，然后通过候选词项之间的相互投票来迭代计算权值，最后根据得分对候选词项进行排序来确定最终抽取的关键词。在传统的TextRank中，图中每个顶点的初始权重均为1(或1/n，n为顶点个数)，每条边的权重也设为1，也就是说每个顶点的票数会均匀地投给与它相连的每个顶点。这样的方法虽然简单方便，但是既忽略了文档的主题性，又没有考虑顶点之间的语义关系。

在循环神经网络(Recurrent Neural Network，RNN)中，隐藏层之间的节点不再是无连接而是有连接的，并且隐藏层的输入不仅包含输入层的输出还包含上一时刻隐藏层的输出。因此RNN适合用来对序列数据进行编码。然而在RNN的传播过程中，历史信息的遗忘和误差的累积是一个重要问题，现在人们通常使用长短时记忆神经网络(Long Short-TermMemery，LSTM)来改进。

LSTM是一种RNN特殊类型，它使用细胞状态来记录信息，细胞状态在序列传输过程中只有少量的线***互，可以较好的保留历史信息。然后LSTM使用门控机制来保护和控制细胞状态。门控机制是一个抽象的概念，在具体实现时它实际上是由一个sigmoid函数和点乘运算构成的，门控机制通过输出一个0到1之间的值来控制信息的传递，输出值越接近0表示允许通过的信息越少，越接近1表示允许通过的信息越多。

在一个LSTM单元中，首先要处理的是上一步传递过来的信息，LSTM通过遗忘门(forget gate)来控制历史信息的遗忘和保留。遗忘门f_t根据当前信息，决定是否需要遗忘之前的信息，具体公式如下：

f_t＝σ(W_f·[h_t-1,x_t]+b_f)

其中σ表示sigmoid函数，W_f和b_f分别表示遗忘门中的权重矩阵和偏置。

之后LSTM需要处理的是当前输入的信息，先通过输入门控制当前输入信息要保留的部分，之后，用tanh函数创建一个细胞状态

将该时刻节点的信息添加到该细胞状态中。

i_t＝σ(W_i·[h_t-1,x_t]+b_i)

通过遗忘门和输入门，LSTM可以决定过去的哪些信息需要被留下，和当前的哪些信息需要被存储，从而计算当前的细胞状态C_t。

最后LSTM会利用sigmoid函数，根据历史信息和当前的输入信息，通过输出门(output gate)决定当前时刻需要输出的信息，与输入状态类似，输出状态也会用一个tanh函数过滤。

o_t＝σ(W_o·[h_t-1，x_t]+b_o)

o_t＝o_t*tanh(C_t)

通过巧妙的门机制，长短时记忆神经网络可以记忆之前的信息，同时又避免了“梯度消失”的问题。

发明内容

为了解决词向量不足以满足关键词抽取任务的需要，以及已有的算法忽略了文本的主题信息这两方面问题，本发明提供一种基于短语向量的关键词抽取方法及***。

为实现上述目的，第一方面，本发明提供一种基于短语向量的关键词抽取方法，所述方法包括：

S1、对文本进行分词并标注词性，保留n元组得到候选词项集；

S2、通过自编码器为候选词项构建短语向量；

S3、确定所述文本的主题，计算候选词项与主题向量的相似度，将所述相似度作为所述候选词项的主题权重；

S4、通过TextRank算法，从所述候选词项集中获取关键词。

进一步的，所述步骤S2中的自编码器包括编码器和解码器，编码器由双向LSTM层和全连接层组成，解码部分由单向LSTM层和softmax层组成。

进一步的，所述步骤S2中的自编码器包括编码器和解码器，训练方法包括以下步骤：

S21、选取训练样本，获取候选词项；

S22、对候选词项c_j＝(x₁，x₂，...，x_T)，在编码器中，使用双向LSTM从前后两个方向分别进行计算：

其中，

和

分别为t(t＝1，2，...，T)时刻从左向右和从右向左两个方向上的隐藏层状态和细胞状态，

和

分别为t-1时刻从左向右和从右向左两个方向上的隐藏层状态和细胞状态，x_t为t时刻输入的候选词项中的单词；T表示候选词项中单词的数量；

S23、在编码器中，通过公式计算得到ES_T：

h′_T＝f(W_hh_T+b_h)

C′_T＝f(W_cC_T+b_c)

其中，

为连接符，W_h、b_h、W_c、b_c代表全连接网络中的参数矩阵和偏置，f表示全连接网络中的激活函数ReLU，ES_T是h′_T和C′_T组成的一个元组；

S24、在解码器部分，以ES_T为初始状态使用单向LSTM进行解码：

其中，z_t是解码器在t时刻的隐藏层状态，z_t-1为t-1时刻的隐藏层状态，ES_T为编码器状态，

为t-1时刻输出的候选词项中的单词；

S25、根据z_t估算当前单词的概率：

其中，W_sz_t+b_s对每个可能的输出单词进行打分，softmax为归一化函数。

S26、当训练过程中损失函数L不断变小最终趋于稳定时，获得编码器的参数W_h、b_h、W_c、b_c，以及解码器中的W_s、b_s，从而确定自编码器；其中，损失函数L的计算公式为：

进一步的，所述步骤S2中，所述候选词项输入自编码器，编码器输出的ES_T中的值为所述候选词项的短语向量。

进一步的，所述步骤S3中主题向量

的计算公式为：

其中，

是主题词项t_i对应的向量表示，

是文本d_i的主题向量表示。

进一步的，在所述步骤S4的TextRank算法中，如果候选词项c_j和c_k在共现窗口中出现，则c_j和c_k之间存在一条边，边的权重的计算公式为：

w_jk＝similarity(c_j，c_k)×occur_count(c_j，c_k)

其中，

分别是候选词项c_j和c_k的向量表示，occur_count(c_j，c_k)表示c_j和c_k在共现窗口中共同出现的次数，similarity(c_j，c_k)为c_j和c_k之间的相似度，w_jk代表了c_j和c_k之间边的权重。

进一步的，在所述步骤S4的TextRank算法中还包括迭代计算顶点权重，包括以下步骤：

迭代计算候选词项的权重，直到达到最大迭代次数，权重得分

计算公式为：

其中，

表示候选词项c_j的得分，d为阻尼系数，优选的，d为0.85；

是候选词项c_j的主题权重，w_jk是候选词项c_j和候选词项c_k之间边的权重，w_kp是候选词项c_k和候选词项c_p之间边的权重，

表示与候选词项c_j相连的候选词项的集合，

是其中的元素，同理，

表示与候选词项c_k相连的候选词项的集合，

是其中的元素。

第二方面，本发明提供了一种基于短语向量的关键词抽取***，所述***包括文本预处理模块，用于对原始文本进行分词并标注词性，根据词性保留n元组，得到候选词项集；

短语向量构建模块，用于对候选词项c_i＝(x₁，x₂，...，x_T)，通过自编码器获得具有语义表示的短语向量；

主题权重计算模块，用于计算候选词项的主题权重；

候选词排序模块，用于为候选词项计算权重得分，取TopK个候选词项作为关键词。

进一步的，所述***还包括自编码器训练模块，用于通过样本训练得到自编码的参数，从而确定自编码器。

本发明提供的一种基于短语向量的关键词抽取方法及***，与现有关键词抽取方法及***相比，具有如下有益效果：

1、本发明提供的关键词抽取方法及***，既引入了文档中的主题信息，又通过词语之间的语义相似度引入了上下文信息，更能捕捉全文中的重点词，使抽取出的关键词更加精确。

2、本发明提供的关键词抽取方法及***，利用短语向量获取关键词，使得计算过程变得简洁高效。

3、本发明提供的短语向量计算方法，创新性地引入基于LSTM的自编码器对词向量进行压缩，可以更好地表示短语的语义信息，语义精度更高，应用范围更广。

4、本发明改进了TextRank算法，创新性地利用短语向量对每个候选词项计算主题权重，并以候选词项之间的语义相似度和共现信息共同计算边的权重，既能考虑整个文档的主题，又引入了顶点之间的语义信息，使排序算法的准确性更高。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些图获得其他的附图。

图1为本发明一个实施例的自编码器的结构示意图；

图2为本发明一个实施例的基于短语向量的关键词抽取方法的流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图和具体实施方式对本发明作进一步说明。

为了使本申请实例中的技术方案及优点更加清楚明白，以下结合附图对本申请的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本申请的一部分实施例，而不是所有实施例的穷举。需要说明的是，在不冲突的情况下，本申请中的实例可以相互结合。

本发明提供一种基于短语向量的关键词抽取方法，如图2所示，该方法包括如下步骤：

S1、对原始文本d_i进行分词并标注词性，根据词性保留n元组，得到候选词项集

S2、对每个候选词项c_j＝(x₁,x₂,…,x_T)，通过自编码器获得候选词项的短语向量表示。其中，x_i是候选词项c_j中第i个单词的词向量表示，T表示候选词项中的单词数量。

S3、计算每个候选词项c_j与主题向量

的相似度作为其主题权重

其中，d_i表示第i篇文档。自编码器包括编码器和解码器，编码器部分由双向LSTM层和全连接层组成，解码部分由单向LSTM层和softmax层组成。

S4、通过改进的TextRank算法，从所述候选词项集中获取关键词。

在步骤S2中，在编码器中，对每个待输入的候选词项c_j，使用双向LSTM从前后两个方向分别进行计算，取最后一个时刻隐藏层状态h_T和细胞状态C_T作为最终状态，并进行拼接，最后通过一个全连接层得到编码层的输出ES_T。

在解码器中，以ES_T为初始输入，使用单向的LSTM结构进行解码，通过softmax层得到每一步解码的概率分布，最后通过损失函数L最大化解码每一步对应的正确单词的概率。

训练的目的是优化自编码器的参数，使解码器能够以编码器的输出为输入，最大程度的还原编码器输入的候选词项的语义信息。

具体的训练方法为：

(1)选取训练样本，然后与S1一样，对样本进行分词等操作，获得候选词项集。

候选词项用c_j＝(x₁,x₂,…,x_T)表示，其中，x_i是候选词项c_j中第i个单词的词向量表示，T表示候选词项中的单词数量。以候选词项c_j为“北京理工大学”为例，x₁是“北京”对应的词向量，x₂是“理工”对应的词向量，x₃是“大学”对应的词向量。

(2)使用大量候选词项对模型进行训练。以候选词项“北京理工大学”为例，输入为“北京”“理工”“大学”对应的词向量表示，经编码获得“北京理工大学”的短语向量表示，并通过该短语向量解码得到解码序列依次为“北京”“理工”“大学”对应概率值，通过训练使其最大化。

对每个候选词项c_j＝(x₁,x₂,…,x_T)，在编码器部分，编码器使用双向LSTM从前后两个方向分别进行计算：

其中，

和

分别为t(t＝1,2,…,T)时刻从左向右和从右向左两个方向上的隐藏层状态和细胞状态，

和

分别为t-1时刻从左向右和从右向左两个方向上的隐藏层状态和细胞状态，x_t为t时刻输入的候选词项中的单词。在每一个时刻，当前隐藏层状态h_t和细胞状态C_t的计算都要依赖上一个时刻的隐藏层状态h_t-1、细胞状态C_t-1和当前输入x_t。

取最后一个时刻隐藏层状态h_T和细胞状态C_T作为最终状态，直接将两个方向上的状态进行连接。另外为了给解码层提供一个固定大小的输入，还需要通过一个全连接层对连接后的状态进行处理。计算如下公式获得解码器的一个固定大小的输入ES_T：

h′_T＝f(W_hh_T+b_h)

C′_T＝f(W_cC_T+b_c)

其中，

为连接符，W_h、b_h、W_c、b_c代表全连接网络中的参数矩阵和偏置，f表示全连接网络中的激活函数ReLU，ES_T是h′_T和C′_T组成最终提供给解码器的一个元组。

在解码器部分，以ES_T为初始状态使用单向LSTM进行解码：

为t-1时刻输出的候选词项中的单词。

根据z_t估算当前单词的概率：

其中，W_s是参数矩阵，W_s和b_s分别表示softmax函数的权重值和偏置值，z_t是解码器在t时刻的隐藏层状态，W_sz_t+b_s对每个可能的输出单词进行打分，用softmax归一化得到每个词

的概率

自编码器的训练目标是使输出正确短语的概率最大：自编码器输出的是对应每个单词的概率，训练目标是使输出正确单词的概率最大，也即，根据损失函数L进行训练，通过训练调整自编码器的参数(包括LSTM里的参数，编码器中的W_h、b_h、W_c、b_c，以及解码器中的W_s、b_s)，当训练过程中损失函数不断变小最终趋于稳定时，就能说明中间的向量可以很好地表示短语语义，我们就能把中间的向量表示作为短语向量。所述损失函数L计算如下：

在自编码器训练结束后，其损失函数值趋于稳定。此时自编码器训练完成，将候选词项输入自编码器的编码器中，ES_T中的值即为短语向量。通过以上构建的自编码器，利用候选词项序列上的信息对词向量压缩，得到候选词项的短语向量表示。

在自编码器训练完成后，当需要获取候选词项的短语向量表示时，只需利用编码部分计算，即可获得候选词项的短语向量表示ES_T，所得ES_T就能以一个候选词项的整体来考虑该候选词项的语义信息。

在步骤S3中，主题权重计算过程如下：

(1)确定主题词项集：以文本具有高度概括性的主题句子或段落为代表，例如论文的题目或摘要，从中确定文本的主题词项，加入文本的主题词项集：

其中d_i表示第i篇文档，n为主题词项集中的元素数目。例如，对“新形势下采矿设计行业发展思路实例分析”来说，主题词项集可以为“采矿设计”、“发展思路”、“实例分析”。

(2)计算主题向量：计算主题词项集

中所有词项对应的单词或短语向量的平均值，作为文档的主题向量

用于表示整篇文档的主题：

其中，

是主题词项t_i对应的向量表示，

是文档d_i的主题向量表示。

(3)计算主题权重：对每个候选词项c_j，计算它和文档d_i的主题向量

之间的余弦距离，作为其主题权重。

其中，

是文档d_i的候选词项c_j的主题权重，

是候选词项c_j的向量表示，cos表示余弦距离。

通过以上(1)～(3)步骤，即可为每个候选词项分配一个0到1之间的主题权重。需要说明的是，主题权重为1表示该候选词项最接近文本的主题，为0则表示该候选词项距离文本的主题较远。

在步骤S4中，以文档d_i的候选词项集

为顶点构造无向图，计算每个候选词项c_j的权重得分

取TopK(前K)个候选词项作为关键词。这是通过改进TextRank算法来实现的，具体的过程如下：

(1)构造无向图：以文档d_i的候选词项集

中的所有元素为顶点构造一个无向图。其中，如果候选词项c_j和c_k在一个长度为n的共现窗口中出现，则c_j和c_k之间存在一条边。

(2)计算边的权重：边的权重是本发明的改进之处。计算同样依赖自编码器构造的短语向量。根据两个候选词项c_j和c_k的向量表示之间的余弦距离similarity(c_j,c_k)和共现次数occur_count(c_j,c_k)为图中的每条边分配权重w_jk：

w_jk＝similarity(c_j,c_k)×occur_count(c_j,c_k)

其中

分别是是候选词项c_j和c_k的向量表示，cos表示向量的余弦距离，occur_count(c_j,c_k)表示c_j和c_k在共现窗口中共同出现的次数，将两者相乘用两个词同时出现的次数来加强它们的语义联系，w_jk代表了c_j和c_k之间边的权重。

(3)迭代计算顶点权重：顶点权重也是本发明的改进之处。迭代计算图中各个顶点的权重，直到达到最大迭代次数，权重得分

计算如下：

其中，

表示文档d_i的候选词项c_j的权重，d为阻尼系数，作用是使每个顶点都有一定的概率给其他顶点投票，这样每个顶点都会有一个不为零的得分，确保算法在多次迭代后可以收敛，通常取值为0.85。

是文档d_i的候选词项c_j的主题权重，w_jk是候选词项c_j和候选词项c_k之间边的权重，w_kp是候选词项c_k和候选词项c_p之间边的权重，

表示与候选词项c_j相连的候选词项集合，

是该集合中的元素，同理，

表示与候选词项c_k相连的候选词项集合，

是该集合中的元素，

表示文档d_i的候选词项c_k的权重，等式右边的后半部分表示的是与c_j相连的顶点给c_j的投票。

(4)候选词项排序：在多次迭代后，图中的每个顶点都能得到一个稳定的得分，将候选词项集

按权重得分

由大到小排序，保留前TopK个候选词项作为文档的关键词。

经过上述S1～S4四个步骤，就可以抽取出文档的关键词。

本发明还提供一种基于短语向量的关键词抽取***，包括：

文本预处理模块，用于对原始文本进行分词并标注词性，根据词性保留n元组，得到候选词项集；

短语向量构建模块，用于对候选词项c_j＝(x₁,x₂,…,x_T)，通过自编码器获得具有语义表示的短语向量；

主题权重计算模块，用于计算候选词项的主题权重；具体的计算方法如上文所述。

候选词排序模块，用于为候选词项计算权重得分，取TopK个候选词项作为关键词。具体的选取方法如上文所述。

进一步的，所述***还包括自编码器训练模块，用于处理短语结构中的序列信息，获取候选词项的短语向量表示，训练方法如上所述。

下面以企业论文数据库中的企业论文数据为例，说明具体的基于短语向量的关键词抽取方法。

企业论文数据库中有环保及其他多种领域的企业论文数据，数据中包括“题目”、“年份”、“摘要”、“关键词”、“英文关键词”、“分类号”等字段。在关键词抽取过程中，以数据库中的“题目”和“摘要”作为文本内容，“关键词”作为标注数据来验证抽取结果。

在训练自编码器时，取数据库中的“关键词”字段作为训练数据，训练过程中的部分参数如表1所示。

表1训练参数设置

在进行关键词抽取之前，对标注数据进行分析来确定算法中的部分参数。数据集中共有59913条论文数据，平均每篇论文有4.2个标注关键词。首先，统计标注关键词的长度，即每个关键词包含的单词数目，结果如表2所示。从表2中可以发现全部关键词的平均长度为1.98，而且绝大部分关键词的长度都在1到3之间，长度在1到3之间的关键词在全部254376个关键词中占据了93.9％。因此在选择候选词项时保留文本中的1元组、2元组和3元组。

然后，统计关键词中全部单词的词性，统计结果如表3所示。词性标注利用Jieba分词工具完成，部分词性说明如表4所示。根据表3，关键词中单词的词性分布没有长度分布集中，但是也主要聚集在名词、动词和具有名词功能的动词，这三种词性占据了全部单词词性的73.1％。因此，在进行候选词项选择时取文本中的名词、动词和名动词及其组合作为候选词项。

表2关键词长度分布

表3单词词性分布

表4Jieba词性说明

由于文本内容中只包括论文的题目和摘要，在计算主题权重时以题目作为全文主题的代表，从题目中抽取候选词项计算文本的主题向量。另外候选词排序中的共现窗口大小初始设置为3，最终保留的候选词个数取10，如表5所示。

表5关键词抽取结果(部分)

优选地，本发明取企业论文数据库中的一条论文数据为例，给出具体的关键词抽取过程。

数据内容为“新形势下采矿设计行业发展思路实例分析回顾了煤炭行业十年的高速发展期及其对采矿设计市场产生的深远影响。在当前煤炭行业经济急速下行，煤炭设计市场竞争激烈的背景下，以天地科技设计院采矿专业发展为例，分析了采矿专业的人力资源和业务变化特点，提出了采矿专业的发展思路及实施措施，为其他设计企业采矿专业的发展提供了参考”。

其中，“新形势下采矿设计行业发展思路实例分析”为论文的题目，其余内容为论文的摘要。

通过n元组词项和词性标注来选取候选词项，从论文的摘要中选出的候选词项作为文本的主题词项集，选出的候选词项如表6所示。

表6候选词项结果

利用自编码器获取主题词项集中所有词项对应的短语向量表示，计算主题词项集中所有词项对应的短语向量的平均值，作为文本的主题向量，计算得到文档的主题向量大小为400，部分值如表7所示。

表7主题权重结果(部分)

对每个候选词项，计算它和文本的主题向量之间的余弦距离，得到其主题权重，部分值如表8所示。

表8主题权重结果(部分)

将候选词项作为顶点，候选词项的共现信息作为边构造无向图，根据两个候选词项的向量表示之间的余弦距离和两者的共现次数为图中的每条边分配权重，根据主题权重与边的权重多次迭代计算得到顶点权重。在多次迭代后，图中的每个顶点都能得到一个稳定的得分，部分得分如表9所示。

表9权重得分结果(部分)

将得到的得分情况进行排序，以得分最高的Top10个候选词项作为最终的关键词，如表10所示。

表10关键词抽取结果(部分)

需要说明的是，本文中“第一”和“第二”仅仅用来区分名称相同的实体或操作，并不暗示这些实体或操作之间顺序或关系。

本领域普通技术人员可以理解：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。