CN103186696A

CN103186696A - 面向高维非线性软测量模型的辅助变量约简方法

Info

Publication number: CN103186696A
Application number: CN2013100685019A
Authority: CN
Inventors: 苏盈盈; 李太福; 颜克胜; 姚力忠; 曾诚
Original assignee: Chongqing University of Science and Technology
Current assignee: Chongqing tisai Technology Co.,Ltd.
Priority date: 2013-03-05
Filing date: 2013-03-05
Publication date: 2013-07-03
Anticipated expiration: 2033-03-05
Also published as: CN103186696B

Abstract

本发明公开了一种面向高维非线性软测量模型的辅助变量约简方法，其特征在于按如下步骤进行：一、确定与主导变量可能相关的n个原始辅助变量，采集n个原始辅助变量和主导变量取值数据并组成样本集；二、融合KICA和FNN方法分别计算n个原始辅助变量的权重值；三、组成原始辅助变量序列；四、建模并根据最小均方误差MSE确定最佳辅助变量；五、得到软测量的约简模型。本发明能够在建模效果最佳的基础上找出含辅助变量个数最少的辅助变量集对主导变量进行建模，实现对辅助变量的约简。

Description

面向高维非线性软测量模型的辅助变量约简方法

技术领域

本发明属于软测量技术领域，具体涉及一种面向高维非线性软测量模型的辅助变量约简方法，用于指导生产过程辅助变量的精简。

背景技术

当前，在工业过程、生物信息、环境保护、食品安全等领域出现大量非线性、复杂关联、不可测度对象参数的检测问题，基于软计算实现的软测量技术正是在这种强烈的工业需求下蓬勃发展起来，并成为解决这类问题的有效方法，有广阔的发展前景。例如中国专利(专利号：200410017533.7)就提出了一种基于支持向量机的软测量建模方法。

在软测量过程中，首先面对的问题就是辅助变量的选择，一方面希望尽可能不遗漏重要的解释因素；另一方面，又要遵循参数节省原则，使辅助变量的个数尽可能少。在实际工作中，为了较完备地描述和分析***，分析人员往往倾向于较周到地选取所能得到的一切辅助变量。而这样构成的辅助变量之间常常存在多重相关性，造成建模中协方差矩阵的病态，降低建模的精度，破坏模型的稳定性，影响着软测量的精度和泛化能力。因此，必须去除这种相关性，实现高维非线性软测量模型的辅助变量约简。

发明内容

本发明的目的在于提供一种面向高维非线性软测量模型的辅助变量约简方法，能够在建模效果最佳的准则上找出含辅助变量个数最少的辅助变量集对主导变量进行预测，实现对主导变量精简化的软测量。

本发明的技术方案如下：一种面向高维非线性软测量模型的辅助变量约简方法，其关键在于按如下步骤进行：

步骤一：确定与主导变量可能相关的n个原始辅助变量，采集n个原始辅助变量和主导变量的取值，组成样本集，样本集大小为m；

将n个原始辅助变量数据写成矩阵X＝[x₁，…，x_i，…x_m]^T形式，主导变量数据写成矩阵Y＝[y₁，…，y_i，…y_m]^T，其中，x_i∈R^x×1，y_i∈R，i＝1，2，…，m，并将X，Y进行标准化处理；

所述标准化处理就是：若n个原始辅助变量数据写成矩阵

形式，主导变量数据写成矩阵Y＝[y₁，…，y_i，…y_m]^I形式，其中，x_i∈R^n×1，y_i∈R，i＝1，2，…，m，标准化处理后得到的数据矩阵如下：

Y = {[\frac{y_{1} - Σ_{j = 1}^{m} y_{j}}{\sqrt{\frac{1}{m} \times Σ_{i = 1}^{m} {(y_{i} - Σ_{j = 1}^{m} y_{j})}^{2}}}, . . ., \frac{y_{m} - Σ_{j = 1}^{m} y_{j}}{\sqrt{\frac{1}{m} \times Σ_{i = 1}^{m} {(y_{i} - Σ_{j = 1}^{m} y_{j})}^{2}}}]}^{T};

步骤二：融合KICA和FNN方法分别计算n个原始辅助变量的权重值，如下步骤进行：

(一)、利用KICA算法计算样本集的k个KICA主元得分向量t_i，i＝1，2，…，k，组成主元得分矩阵T＝[t₁，…，t_i，…，t_k]，按如下步骤进行：

(1)输入：辅助变量X＝[x₁，…，x_i，…x_m]^T，输出为Y＝[y₁，…，y₁，…y_m]^T；

(2)定义辅助变量矩阵x的核矩阵：计算核矩阵K，其中，K的第ij位元素为K_ij＝k(x_i，x_j)，i，j＝1，2，…，m，其中k(●)为核函数；

(3)中心化核矩阵

K &LeftArrow; (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}) \times K \times (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}),

其中，I_m为m阶单位矩阵，

(4)计算协方差矩阵G的变量向量v和变量值e：[v，e]＝eig(G)；

(5)计算白化矩阵i，j＝1，…，m；

(6)计算分离矩阵W＝[w₁，…，w_i，…w_m]，如下：

w_{i} &LeftArrow; \frac{1}{n} \overset{&OverBar;}{X} {({(w_{i} \overset{&OverBar;}{X})}^{3})}^{T} - {3 w}_{i};

i＝1，2，…，m

w_{i} &LeftArrow; w_{i} - Σ_{j = 1}^{i - 1} ({w_{i}}^{T} w_{j}) w_{j};

w_i←w_i/||w_i||；

(7)求出KICA得到的独立信号：

(二)、借助FNN方法计算某个原始辅助变量x_i的权重值，按如下步骤进行：

(1)将原始辅助变量集中的第s维变量设置为零向量，其他原始辅助变量取值不变，得到新的样本集矩阵其中，

(2)计算核矩阵

其中，

的第ij位元素为

\overset{&OverBar;}{K_{ij}} = κ (\overset{&OverBar;}{x_{i}}, x_{j}) = \exp ({- | | \overset{&OverBar;}{x_{i}} - x_{j} | |}^{2} / c), i, j = 1,2, . . ., m,

c是高斯核函数的中心点；

(3)中心化核矩阵

\overset{&OverBar;}{K} &LeftArrow; (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}) \times \overset{&OverBar;}{K} \times (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}),

其中，I_m为m阶单位矩阵，

(4)重复(一)部分中的(4-6)步，计算新的分离矩阵W_s；

(5)计算原始辅助变量第s维置为零向量后的KICA主元得分矩阵

{\hat{X}}_{s} = W_{s} \overset{&OverBar;}{X_{s}};

(6)执行如下计算

其中，

为原始样本集的KICA得分主元矩阵，

表示将原始辅助变量第s维置为零向量后在KICA主元空间中的投影坐标；

(7)相似性测度d值刻画了原始辅助变量第s维置为零向量后，对样本集在KICA主元空间中的投影坐标的变化情况，相似性测度d越小，说明原始辅助变量s置零前后投影坐标的改变越大，从而说明原始辅助变量s对主导变量的解释能力越强，即可用相似性测度d值来度量原始辅助变量s的权重值；

步骤三：n个原始辅助变量组成原始辅助变量序列；

步骤四：确定最佳辅助变量集，包括以下步骤：

第一步，设定循环次数N＝n；

第二步，随机从样本集中选择p个样本作为训练样本，剩下的m-p个样本作为检验样本，所述训练样本个数p一般选取总样本数m的

左右为宜；

第三步，根据所述训练样本，利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型；

在利用BP神经网络建立原始辅助变量序列中所包含变量的非线性模型的过程中，输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数，隐含层的节点个数通过交互验证法确定，输出层的节点个数为1，其中，隐含层的传递函数为：

\tan sig (x) = \frac{2}{1 + e^{- 2 x}} = \frac{e^{x} - e^{- x}}{e^{x} + e^{- x}}, .

输出层的传递函数为： purelin(x)＝x；

第四步，将所述检验样本的当前辅助变量值输入至所述非线性模型，得到m-p个检验样本对应的主导变量预测值；

第五步，计算m-p个检验样本预测值的均方误差MSE，其中，均方误差MSE按下式计算：

MSE = \sqrt{\frac{Σ_{t = 1}^{m - p} {(P_{t} - {PC}_{t})}^{2}}{m - p}};

上式中，P_t表示所述m-p个检验样本中第t个样本的主导变量取值，PC_t表示所述m-p个检验样本中第t个样本的主导变量预测值；

第六步，删除当前原始辅助变量序列中权重值最小的原始辅助变量，组成新的原始辅助变量序列，并设定N＝N-1，判断此时N是否为0：

如果N≠0，则回到第三步；

如果N＝0，则最小的MSE对应原始辅助变量序列即为最佳辅助变量集；

步骤五：最佳辅助变量集在步骤四中对应的非线性模型即为软测量的约简模型；

得到精简化软测量模型后，在以后的生产过程中，只需要测量最佳辅助变量集中辅助变量的值，代入精简化软测量模型，就可以得到主导变量的值。

本发明的显著效果：在众多原始辅助变量中，找出与主导变量具有关键作用的关键辅助变量，实现了利用含辅助变量个数最少的辅助变量集对主导变量实现效果最好的软测量，节约了人力物力财力，并大大提高了测量的效率。

附图说明

图1是本发明的流程图；

图2是本发明的相似性测度示意图；

图3是实施例1中的残差图；

图4是实施例1中精简化前后模型的精度对比，其中(a)表示训练数据实际值与拟合值对比，(b)表示训练数据实际值与拟合值的残差，(c)表示检验数据实际值与拟合值对比，(d)表示检验数据实际值与拟合值的残差。

具体实施方式

下面结合附图和实施例对本发明作进一步说明：

实施例1：

以工业产品HCN的转化率的软测量为例，进行高维非线性软测量模型的约简，按如下步骤进行：

步骤一：确定与主导变量可能相关的n个原始辅助变量，采集n个原始轴助变量和主导变量的取值，组成样本集，样本集大小为m，并将n个原始辅助变量数据写成矩阵

形式，主导变量数据写成矩阵Y＝[y₁，…，y_i，…y_m]^T形式，其中，x_i∈R^n×1，y_i∈R，i＝1，2，…，m，标准化处理后得到的数据矩阵如下：

Y = {[\frac{y_{1} - Σ_{j = 1}^{m} y_{j}}{\sqrt{\frac{1}{m} \times Σ_{i = 1}^{m} {(y_{i} - Σ_{j = 1}^{m} y_{j})}^{2}}}, . . ., \frac{y_{m} - Σ_{j = 1}^{m} y_{j}}{\sqrt{\frac{1}{m} \times Σ_{i = 1}^{m} {(y_{i} - Σ_{j = 1}^{m} y_{j})}^{2}}}]}^{T};

试验中所用的非线性数据取自HCN生产工艺现场，过程变量注释及数据如表1所示，设x为由11个辅助变量构成的原始非线性数据矩阵，Y为产导变量。从中选择前80组作为训练样本，后80组为检测样本；

表1HCN生产工艺参数样本

注：x₁表示氨的补偿温度，x₂表示氨的流重，x₃表示天然气的流重，x₄表示空气的流重，x₅表示氨的补偿压力，x₆表示天然气的补偿压力。x_j表示空气的补偿压力，x₈表示气泡压力，x₉表示反应器出口温度，x₁₀表示大混合器出口温度，x₁₁表示氢氰酸的产量，Y表示氨的转化率。

(1)输入：辅助变量X＝[x₁，…，x_i，…x_m]^T，输出为Y＝[y₁，…，y_i，…y_m]^T；

(3)中心化核矩阵

K &LeftArrow; (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}) \times K \times (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}),

其中，I_m为m阶单位矩阵，

(4)计算协方差矩阵G的变量向量v和变量值e：[v，e]＝eig(G)；

(5)计算白化矩阵

i，j＝1，…，m；

(6)计算分离矩阵W＝[w₁，…，w_i，…w_m]，如下：

w_{i} &LeftArrow; \frac{1}{n} \overset{&OverBar;}{X} {({(w_{i} \overset{&OverBar;}{X})}^{3})}^{T} - {3 w}_{i};

i＝1，2，…，m

w_{i} &LeftArrow; w_{i} - Σ_{j = 1}^{i - 1} ({w_{i}}^{T} w_{j}) w_{j};

w_i←w_i/||w_i||；

(7)求出KICA得到的独立信号：

可以计算出经KICA提取出的独立成分、与独立成分对应的分离矩阵。表2表示用80个训练样本通过KICA算法提取出的典型成分。

表2独立成分

(1)将原始辅助变量集中的第s维变量设置为零向量，其他原始辅助变量取值不变，得到新的样本集矩阵

其中，

(2)计算核矩阵

其中，

的第ij位元素为

\overset{&OverBar;}{K_{ij}} = κ (\overset{&OverBar;}{x_{i}}, x_{j}) = \exp ({- | | \overset{&OverBar;}{x_{i}} - x_{j} | |}^{2} / c), i, j = 1,2, . . ., m,

c是高斯核函数的中心点；

(3)中心化核矩阵

\overset{&OverBar;}{K} &LeftArrow; (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}) \times \overset{&OverBar;}{K} \times (I_{m} - \frac{1}{m} \times 1_{m} \times {1_{m}}^{T}),

其中，I_m为m阶单位矩阵，

(4)重复(一)部分中的(4-6)步，计算新的分离矩阵W_s；

(5)计算原始辅助变量第s维置为零向量后的KICA主元得分矩阵

{\hat{X}}_{s} = W_{s} \overset{&OverBar;}{X_{s}};

(6)执行如下计算

其中，

为原始样本集的KICA得分主元矩阵，表示将原始辅助变量第s维置为零向量后在KICA主元空间中的投影坐标；

(7)相似性测度d值刻画了原始辅助变量第s维置为零向量后，对样本集在KICA主元空间中的投影坐标的变化情况，相似性测度d越小，说明原始辅助变量s置零前后投影坐标的改变越大，从而说明原始辅助变量s对主导变量的解释能力越强，即可用相似性测度d值来度量原始辅助变量s的权重值。

对提取出的独立成分进行虚假邻点法的运算，即计算剔除各变量后独立成分在特征空间中映射差值分布图，如图3所示。

从图3看出，当将x₁，x₅，x₆，x₇，x₈，x₉，x₁₀，x₁₁分别置零后，独立成分投影余弦值比x₂，x₃，x₄置零后独立成分投影余弦值大。

设

为原始辅助变量矩阵x经过KICA特征提取后的矩阵，

为将原始数据第i个变量置零后，经过KICA特征提取后的矩阵，特征空间中

中每一个样本到

的对应样本之间的余弦值为d，经计算所得d值见表3所示。

表3FNN计算相关性

根据虚假最近邻点法的定义知，余弦值越大，可说明剔除该变量对整个样本影响越小；反之，余弦值越小，则说明该变量对整个样本的影响较大，解释能力较强，辅助变量不可剔除。因此，x₂，x₃，x₄这3个变量对因变量的预测起关键作用；

步骤三：n个原始辅助变量组成原始辅助变量序列；

步骤四：确定最佳辅助变量集，包括以下步骤：

第一步，设定循环次数N＝n；

左右为宜；

建模过程中，BP神经网络输入层的节点个数等于当前原始辅助变量序列中所包含的变量个数，隐含层的节点个数通过交互验证法确定，输出层的节点个数为1，其中，隐含层的传递函数为：

输出层的传递函数为：purelin(x)＝x；

MSE = \sqrt{\frac{Σ_{t = 1}^{m - p} {(P_{t} - {PC}_{t})}^{2}}{m - p}};

如果N≠0，则回到第三步；

步骤五：最佳辅助变量集在步骤四中对应的非线性模型即为软测量的约简模型。

为了证明分析的正确性，需要比较所有变量组成的全模型与x₂，x₃，x₄这3个变量建立的模型的预测误差百分比。首先建立由x₁，x₂，…，x₁₁经过KICA提取后的独立成分s₁的全模型，利用最小二乘法建立模型。接着，采用经过KICA+FNN选择后的3个变量构造的独立成分的模型，再利用最小二乘法建立模型，得到的粘度结果如表4，如图4所示。与全变量模型精度相比，预测误差绝对值相差在0.12％，说明该传感器模型对待测变量有较强的解释能力。达到了辅助变量约简的目的。

表4全变量数学模型及所选3维变量的数学模型