CN105913079A - 基于目标域迁移极限学习的电子鼻异构数据识别方法 - Google Patents

基于目标域迁移极限学习的电子鼻异构数据识别方法 Download PDF

Info

Publication number
CN105913079A
CN105913079A CN201610216768.1A CN201610216768A CN105913079A CN 105913079 A CN105913079 A CN 105913079A CN 201610216768 A CN201610216768 A CN 201610216768A CN 105913079 A CN105913079 A CN 105913079A
Authority
CN
China
Prior art keywords
aiming field
electronic nose
extreme learning
data sample
learning machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610216768.1A
Other languages
English (en)
Other versions
CN105913079B (zh
Inventor
张磊
邓平聆
刘燕
田逢春
刘涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201610216768.1A priority Critical patent/CN105913079B/zh
Publication of CN105913079A publication Critical patent/CN105913079A/zh
Application granted granted Critical
Publication of CN105913079B publication Critical patent/CN105913079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • Electrochemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Pathology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

本发明提供了一种基于目标域迁移极限学习的电子鼻异构数据识别方法,其从机器学习角度提出域迁移极限学习机框架用于解决传感器漂移问题,利用电子鼻在未发生漂移时采集的气体传感器阵列感测数据矩阵以及发生漂移后采集的有标签的和无标签的气体传感器阵列感测数据矩阵分别构建源域数据集、目标域数据集和待测域数据集,并分别作为极限学习机的输入,对电子鼻的识别分类器进行学习,以提升识别分类器在电子鼻发生漂移后对气体识别的容差性能,达到漂移补偿和提高对气体识别中异构数据样本的识别精度的目的,并且持了极限学习机的技术优点,使得该方法具备了较好的泛化性和迁移性能,能够在不同的电子鼻产品针对不同的气体识别应用上广泛适用。

Description

基于目标域迁移极限学习的电子鼻异构数据识别方法
技术领域
本发明涉及电子鼻检测技术领域,具体涉及一种基于目标域迁移极限学习的电子鼻异构数据识别方法。
背景技术
电子鼻是利用气体传感器阵列的响应图谱来识别气体的智能电子装置或者人工嗅觉***。由于电子鼻中气体传感器阵列的交叉特性和广谱性,使得电子鼻的气体识别能力被广泛用于医疗诊断、茶叶质量评估、环境检测以及预测气体浓度等领域。
但是,电子鼻的气体传感器随使用时间的增长而不断老化,这大大缩短了电子鼻气体传感器阵列的使用寿命。中毒,老化或者环境变量都能造成电子鼻的气体传感器漂移,而气体传感器漂移会降低分类器的气体识别性能。对上述问题,研究人员们需要针对电子鼻所能够识别的各类别气体,定期的用新的带有标签的各类别气体的纯净标定样本重新训练电子鼻的分类器网络,而重新训练分类器网络较为费时,并且定期获取新的气体的纯净标定样本也较为困难。
电子鼻中气体传感器的漂移可表述如下。假设,在电子鼻在未发生漂移的状态下,其检测某种气体所得到的气体传感器阵列感测数据矩阵为 表示在未漂移状态下检测该气体时电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,N表示电子鼻气体传感器阵列中所包含的气体传感器数量,上角标T为转置符号;而在子鼻在发生漂移后,若其检测该同种气体所得到的气体传感器阵列感测数据矩阵为 在漂移后检测该气体时电子鼻气体传感器阵列的第n个气体传感器的感测特征向量;那么,电子鼻中气体传感器漂移问题则表现为矩阵XK的感测特征分布不同于矩阵X0的感测特征分布,通常将矩阵XK称为异构数据样本,所以,用未发生漂移的数据样本X0所训练得到识别分类器对漂移后的异构数据样本XK进行气体识别时,就会出现识别准确率降低的问题。而且,随着时间的推移,气体传感器的老化、漂移问题会逐渐增大,即检测漂移后数据样本XK的时间与检测未漂移数据样本X0的时间间隔越久,那么XK与X0之间的感测特征分布差异也会越大。
气体传感器的漂移补偿技术研究始于几十年前,目前的主要补偿方法有成分校正法、调节补偿法和机器学习法。
典型的多变量成分校正法有成分校正主成分分析法,其是通过用主成分分析找到漂移方向,从而去掉漂移成分;但是,成分校正主成分分析法的补偿思路需要建立在所有类别数据的漂移方向相一致的前提下,然而电子鼻的实际漂移情况并非如此,因此该方法难以有效的应用到电子鼻的漂移补偿上;而如果通过在成分校正主成分分析法的基础上增加一个乘子校正变量来改善对数据漂移方向一致性限制的问题,则又会随之带来其漂移补偿的泛化性会受到在线应用时气体传感器非线性动态特性的制约问题,导致其漂移补偿效果难以针对不同的气体识别应用中广泛适用。
调节补偿法,是通过对电子鼻的气体传感器阵列在进行不同阶段气体识别检测时的响应变化情况,对其感测特征分布差异进行调整,进而实现漂移补偿;但是这种刚调整补偿方法,容易在电子鼻的气体传感器阵列出现暂态响应情况时被误判为气体传感器阵列正发生剧烈变化的漂移,进而频繁地进行调整补偿,容易打乱电子鼻气体传感器阵列原有的特征值分布规律,导致原本较为准确的识别神经网络经过漂移补偿后反而不能够正确识别其匹配气体,影响电子鼻的气体识别精度。
此前,研究人员们也展开了一些通过机器学习法对电子鼻进行漂移补偿的方法研究,但目前所采用的机器学习法都主要基于支持向量机,其往往需要借助大量的训练样本加以学习,在训练样本有限的情况下补偿效果不佳,依然不能很好地通过漂移补偿来提升电子鼻在气体识别时对异构数据样本的识别精度,此外这类机器学习法通常需要训练很多基分类器,因此其域迁移能力和泛化性都受到限制。
综上所述,现有技术针对于电子鼻气体传感器漂移的补偿方法,普遍存在补偿后电子鼻的气体识别精度不高、迁移能力和泛化性较差的问题。
发明内容
针对现有技术中存在的上述不足,本发明的目的在于提供一种基于目标域迁移极限学习的电子鼻异构数据识别方法,其利用电子鼻在未发生漂移时和发生漂移后的有标签的气体传感器阵列感测数据矩阵分别作为源域数据集和目标域数据集分别作为极限学习机的输入,对电子鼻的识别分类器进行学习,以提升识别分类器在电子鼻发生漂移后对气体识别的容差性能,达到漂移补偿的识别效果,从而提高电子鼻在其气体传感器发生漂移后进行气体识别时对异构数据样本的识别精度和泛化性,并且具备较好的迁移性能。
为解决上述技术问题,本发明采用了如下的技术手段:
基于目标域迁移极限学习的电子鼻异构数据识别方法,包括如下步骤:
1)获取电子鼻在未发生漂移时所采集的NS个有标签的气体传感器阵列感测数据矩阵作为源域数据集对应的标签集合任意的第i个源域数据样本为电子鼻在未发生漂移时进行一次气体检测所得到的气体传感器阵列感测数据矩阵,i∈{1,2,…,NS},即:
X S i = [ x S i , 1 , x S i , 2 , ... , x S i , n , ... , x S i , N ] T ;
其中,表示第i个源域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N},N表示电子鼻气体传感器阵列中所包含的气体传感器数量;上角标T为转置符号;
所述第i个源域数据样本的标签为:
t ‾ S i = [ t S i , 1 , t S i , 2 , ... , t S i , m , ... , t S i , M ] T ;
其中,表示第i个源域数据样本在第m类目标气体类别序号上的类别标签值,若对第i个源域数据样本的识别结果为属于第m类气体,则令否则令由此构成第i个源域数据样本的标签m∈{1,2,…,M},M表示电子鼻所能够识别的目标气体种类数;
2)获取电子鼻在发生漂移后所采集的NT个有标签的气体传感器阵列感测数据矩阵作为目标域数据集对应的标签集合任意的第j个目标域数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,j∈{1,2,…,NT},即:
X T j = [ x T j , 1 , x T j , 2 , ... , x T j , n , ... , x T j , N ] T ;
其中,表示第j个目标域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;
所述第j个目标域数据样本的标签为:
t ‾ T j = [ t T j , 1 , t T j , 2 , ... , t T j , m , ... , t T j , M ] T ;
其中,表示第j个目标域数据样本在第m类目标气体类别序号上的类别标签值,若对第j个目标域数据样本的识别结果为属于第m类气体,则令否则令由此构成第j个目标域数据样本的标签m∈{1,2,…,M};
3)获取电子鼻在发生漂移后所采集的NU个未标记标签的气体传感器阵列感测数据矩阵作为待测域数据集任意的第k个待测数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,k∈{1,2,…,NU},即:
X U k = [ x U k , 1 , x U k , 2 , ... , x U k , n , ... , x U k , N ] T ;
其中,表示第k个待测数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;
4)设定源域数据样本的预测误差惩罚系数CS、目标域数据样本的预测误差惩罚系数CT和待测数据样本的预测误差惩罚系数CU,且设定源域极限学习机和目标域极限学习机的隐含层神经元个数均为NL
5)随机初始化源域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量然后,将源域数据集XS作为源域极限学习机的输入,计算得到相应的源域极限学习机的隐含层输出矩阵
H S = g S ( W 1 · X S + b 1 ‾ ) ;
其中,gS(·)表示源域极限学习机的激活函数;
6)判断源域数据集所包含的源域数据样本个数NS与源域极限学习机隐含层神经元个数NL的数值关系;
若NS≥NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵
β B = ( H S T H S + I L C S ) - 1 H S T T S ;
其中,IL为NL×NL的单位矩阵;
若NS<NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵
β B = H S T ( H S H S T + I S C S ) - 1 T S ;
其中,IS为NS×NS的单位矩阵;上角标T均为转置符号;
7)随机初始化目标域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量
然后,将目标域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵
H T = g T ( W 2 · X T + b 2 ‾ ) ;
将待测域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵
H U = g T ( W 2 · X U + b 2 ‾ ) ;
其中,gT(·)表示目标域极限学习机的激活函数;
由此得到的对应的隐含层输出矩阵 表示第k个待测数据样本所对应的隐含层输出向量;
8)判断目标域数据集所包含的目标域数据样本个数NT与目标域极限学习机隐含层神经元个数NL的数值关系;
若NT≥NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵
βT=(IL+CT·HT T·HT+CU·HU T·HU)-1(CT·HT T·TT+CU·HU T·HU·βB);
其中,IL为NL×NL的单位矩阵;
若NT<NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵
βT=HT T·FTU+HU T(FP -1·TU-FP -1·FO·FTU);
其中,FTU、FO、FP、FQ和FR均为缩写式,其各自的展开式为:
FTU=(FQ·FP -1·FO-FR)-1(FQ·FP -1·TU-TT);
FO=HUHT TFQ=HTHU T
其中,TU=HUβB,IT为NT×NT的单位矩阵;上角标T均为转置符号;
9)将步骤8)所得到的目标域极限学习机的隐含层与输出层之间的权重矩阵βT作为电子鼻的识别分类器,按下式分别计算待测域数据集中各个待测数据样本所对应的标签:
k∈{1,2,…,NU};
其中,表示计算得到的第k个待测数据样本的标签,且:
y ‾ U k = [ y U k , 1 , y U k , 2 , ... , y U k , m , ... , y U k , M ] T ;
表示第k个待测数据样本在第m类目标气体类别序号上的类别标签值;
对于第k个待测数据样本将其标签中最大类别标签值所在的目标气体类别序号所对应的目标气体类别判定识别为待测数据样本所属的气体类别;由此,判定得到待测域数据集中各个待测数据样本的气体类别识别结果。
上述基于目标域迁移极限学习的电子鼻异构数据识别方法中,作为优选方案,所述步骤4)中,源域数据样本的预测误差惩罚系数CS的优选取值范围为10-3~100
上述基于目标域迁移极限学习的电子鼻异构数据识别方法中,作为优选方案,所述步骤4)中,目标域数据样本的预测误差惩罚系数CT的优选取值范围为100~103
上述基于目标域迁移极限学习的电子鼻异构数据识别方法中,作为优选方案,所述步骤4)中,待测域无标签数据样本的预测误差惩罚系数CU的优选取值范围为10-3~103
上述基于目标域迁移极限学习的电子鼻异构数据识别方法中,作为优选方案,所述步骤4)中,源域极限学习机和目标域极限学习机的隐含层神经元个数NL的优选取值范围为102~104
上述基于目标域迁移极限学习的电子鼻异构数据识别方法中,作为优选方案,所述源域极限学习机的激活函数gS(·)选用径向基函数或sigmoid函数。
上述基于目标域迁移极限学习的电子鼻异构数据识别方法中,作为优选方案,所述目标域极限学习机的激活函数gT(·)选用径向基函数或sigmoid函数。
相比于现有技术,本发明具有以下有益效果:
1、本发明基于目标域迁移极限学习的电子鼻异构数据识别方法,从机器学习机的角度对该问题进行分析和解决,提出了一种基于目标域迁移极限学习的理念,借助少量电子鼻在未发生漂移时采集的气体传感器阵列感测数据矩阵以及发生漂移后采集的有标签的和无标签的气体传感器阵列感测数据矩阵,分别构建源域数据集、目标域数据集和待测域数据集,用以进行目标域域迁移极限学习获得一个鲁棒性好的识别分类器,能够提升识别分类器在电子鼻发生漂移后对气体识别的容差性能,再利用学习后得到的该识别分类器进行待测气体样本的识别时,就能够达到漂移补偿的识别效果,从而提高电子鼻在其气体传感器发生漂移后进行气体识别时对异构数据样本的识别精度。
2、本发明基于目标域迁移极限学习的电子鼻异构数据识别方法保持了极限学习机的技术优点,学习过程简单,且使得该方法具备了较好的泛化性和迁移性能,能够在不同的电子鼻产品针对不同的气体识别应用上广泛适用。
3、本发明基于目标域迁移极限学习的电子鼻异构数据识别方法提出的目标域迁移极限学习机框架建立了一个有良好学习能力和泛化能力的电子鼻漂移补偿学习框架。
附图说明
图1为本发明基于目标域迁移极限学习的电子鼻异构数据识别方法的流程图。
图2为本发明实施案例中实验数据集中10组数据漂移前后的多维传感器阵列响应曲线对比图。
图3为本发明实施案例中实验数据集中10组数据漂移引起空间分布变化的二维主成分投影分布图。
图4为本发明实施案例中采用本发明方法与各对比方法对实验配置①中各组数据进行识别的识别精度对比图。
图5为本发明实施案例中采用本发明方法与各对比方法对实验配置②中各组数据进行识别的识别精度对比图。
图6为本发明实施案例中采用本发明方法与正则化极限学习机方法ELM-rbf对配置①不同数量的目标域数据样本情况下进行识别的识别精度对比图。
图7为本发明实施案例中采用本发明方法与正则化极限学习机方法ELM-rbf对配置②不同数量的目标域数据样本情况下进行识别的识别精度对比图。
具体实施方式
针对于电子鼻的气体传感器漂移而影响气体识别精度的问题,本发明提供了一种基于目标域迁移极限学习的电子鼻异构数据识别方法,从机器学习机的角度对该问题进行分析和解决,提出了一种基于目标域迁移极限学习的理念,借助少量电子鼻在未发生漂移时采集的气体传感器阵列感测数据矩阵以及发生漂移后采集的有标签的和无标签的气体传感器阵列感测数据矩阵,分别构建源域数据集、目标域数据集和待测域数据集,用以进行目标域域迁移极限学习获得一个鲁棒性好的识别分类器,能够提升识别分类器在电子鼻发生漂移后对气体识别的容差性能,再利用学习后得到的该识别分类器进行待测气体样本的识别时,就能够达到漂移补偿的识别效果,从而提高电子鼻在其气体传感器发生漂移后进行气体识别时对异构数据样本的识别精度,并且其保持了极限学习机的技术优点,学习过程简单,且使得该方法具备了较好的泛化性和迁移性能,能够在不同的电子鼻产品针对不同的气体识别应用上广泛适用。
基于上述技术思路,首先对本发明所应用到的极限学习机技术加以简单的介绍。
1、极限学习机理论:
极限学习机(Extreme Learning Machine,ELM)算法是新加坡南洋理工大学的黄广斌教授提出来的,2004年正式发表文章。极限学习机算法是针对SLFNs(即含单个隐藏层前馈型神经网络)的监督型学习算法,其主要思想是:输入层与隐藏层之间的权值参数,以及隐藏层上的偏置向量参数是once for all(一次设置配、普遍适用)的,不需要像其他基于梯度的学习算法一样通过迭代反复调整刷新,因此求解过程很直接,只需求解一个最小范数最小二乘问题(最终可化归成求解一个矩阵的广义逆问题),具有训练参数少、学习运算速度快等优点。
极限学习机理论可以进行如下的描述。
假设,给定N个样本[x1,x2,…,xi,…,xN]和对应的标签[t1,t2,…,ti,…,tN],其中,xi=[xi,1,xi,2,…,xi,n]T∈Rn,ti=[ti,1,ti,2,…,ti,m]T∈Rm,n和m分别代表输入神经元的个数和输出层的神经元个数。隐含层的输出向量用h(xi)∈R1×L表示,其中L是隐层神经元的数目,隐含层和输出层之间的权值用β∈RL×m表示。
正则化极限学***方和,和输出权值的范数以防止过拟合求得输出权值,公式如下:
min β L E L M = 1 2 | | β | | 2 + C · 1 2 · Σ i = 1 N | | ξ i | | 2 s . t . h ( x i ) β = t i - ξ i , i = 1 , 2 , ... , N ; - - - ( 1 )
其中,ξi表示第i个训练样本的预测误差,C是预测误差的惩罚函数。
把约束项代入目标函数,得到一个与之等价的无约束的优化问题其表达式如下:
m i n β ∈ R L × m L E L M = 1 2 | | β | | 2 + C · 1 2 · Σ i = 1 N | | T - H β | | 2 ; - - - ( 2 )
其中,H=[h(x1),h(x2),…,h(xi),…,h(xN),]∈RN×L,T=[t1,t2,…,ti,…,tN]T
(2)式是一个正则化最小二乘优化问题。β的闭解可通过求(2)式对β求导并令其等于零方可求得。
求解β分两种情况。如果训练样本数量N大于或等于L时,求导式是超定的,β的解如下式:
β = ( H T H + I L C ) - 1 H T T ; - - - ( 3 )
其中,IL是L×L的单位矩阵。
第二种情况,如果训练样本数量N小于L时,β解如下式:
β = H T ( HH T + I N C ) - 1 T ; - - - ( 4 )
其中,IN是N×N的单位矩阵。所以,用极限学习机训练分类器,其输出权值可由(3)式或者(4)式得到。
2、基于目标域迁移极限学习机框架。
基于极限学习机理论,本发明提出了一种基于目标域迁移极限学习的理论框架,将电子鼻在未发生漂移时采集的有标签的气体传感器阵列感测数据矩阵作为源域数据集,加上少量电子鼻发生漂移后采集的有标签的气体传感器阵列感测数据矩阵作为目标域数据集,且将电子鼻发生漂移后采集的无标签的气体传感器阵列感测数据矩阵作为待测域数据集,并且将目标域极限学习机的隐含层与输出层之间的权重矩阵βT作为识别分类器;由此,目标域迁移极限学习机可以用下式表示:
m i n β T L D A E L M - T ( β T ) = 1 2 | | β T | | 2 + C T · 1 2 · | | T T - H T β T | | 2 + C U · 1 2 · | | H U β B - H U β T | | 2 ; - - - ( 17 )
其中,表示学习得到的目标域极限学习机的隐含层与输出层之间的权重矩阵,用以作为电子鼻的识别分类器,NL为极限学习机的隐含层神经元个数,M为电子鼻所能够识别的目标气体种类数;为目标域数据集对应的标签集合,表示第j个目标域数据样本的标签(即训练目标),j∈{1,2,…,NT},NT是目标域数据样本数量;CT和CU分别是目标域数据样本和的预测误差惩罚系数待测数据样本的预测误差惩罚系数,表示目标域数据集输入极限学习机的隐含层输出矩阵,表示待测域数据集输入极限学习机的隐含层输出矩阵,NU为待测域数据集中的待测数据样本数量。
为用源域数据集进行正则化极限学习得到的极限学习机隐含层与输出层之间的权重矩阵,用以作为基分类器,其可表示成下式:
m i n β B L E L M = 1 2 | | β B | | 2 + C S · 1 2 · Σ i = 1 N S | | T S - H S β B | | 2 ; - - - ( 18 )
其中,为源域数据集对应的标签集合,表示第i个源域数据样本的标签(即训练目标),i∈{1,2,…,NS},NS是源域数据样本数量;CS是源域数据样本的预测误差惩罚系数;表示源域数据集输入极限学习机的隐含层输出矩阵。
可以看到,要求解βT,需要先求解基分类器βB。根据极限学习机理论以及上述的(3)、(4)式可知,求解βB分两种情况:
如果训练样本数NS大于或等于NL时,βB的解如下式:
β B = ( H S T H S + I L C S ) - 1 H S T T S ;
其中,IL是大小为NL×NL的单位矩阵。
第二种情况,如果训练样本数NS少于NL时,βB的解如下式:
β B = H S T ( H S H S T + I S C S ) - 1 T S ;
其中,IS是大小为NS×NS的单位矩阵;上角标T均为转置符号。由此得到基分类器βB
在本发明提出的目标域迁移极限学习理论中,待测域数据集中的各个待测数据样本也被用于训练网络,并且该目标域迁移极限学习机算法能够同时对多个分类器进行学习。
在得到基分类器βB后,就可以利用该基分类器βB进一步求解目标域极限学习机的隐含层与输出层之间的权重矩阵βT。为了求解(17)式,设LDAELM-T对βT的偏导数为0,可得到下式:
▿ L D A E L M - T = β T - C T H T T ( T T - H T β T ) + C U H U T ( H U β B - H U β T ) = 0 ; - - - ( 19 )
求解βT分两种情况:
如果NT大于或等于NL,HT的行数大于或等于列数,为满秩矩阵。由(19)式可得:
βT=(IL+CT·HT T·HT+CU·HU T·HU)-1(CT·HT T·TT+CU·HU T·HU·βB); (20)
其中,IL是大小为NL×NL的单位矩阵。
如果NT小于NL,HT的列数大于行数,此时,有无穷解。为了解出唯一解,令TU=HUβB,则(17)式可改写为:
m i n β S , ξ T j , ξ U k 1 2 | | β T | | 2 + C T · 1 2 · Σ j = 1 N T | | ξ T j | | 2 + C U · 1 2 · Σ k = 1 N U | | ξ U k | | 2 ; - - - ( 21 )
s . t . h ‾ T j β S = t ‾ T j - ξ T j , j = 1 , 2 , ... , N T h ‾ U k β T = t ‾ U k - ξ U k , k = 1 , 2 , ... , N U ;
其中,分别表示第j个目标域数据样本的隐含层输出和预测误差;分别表示第k个待测数据样本的隐含层输出和预测误差;则为TU中对应于第k个待测数据样本的训练目标。
由上式可知,由极少的目标域数据样本引入用于正则化的第三项和(21)式的第二个约束式子,可使学习的分类器βT的迁移能力提高。
(21)式的拉格朗日乘子法等式如下:
L ( β T , ξ T j , ξ U k , α T , α U ) = 1 2 | | β T | | 2 + C T 2 Σ j = 1 N T | | ξ T j | | 2 + C T 2 Σ k = 1 N U | | ξ U k | | 2 - α T ( h ‾ T j β T - t ‾ T j + ξ T j ) - α U ( h ‾ U k β T - t ‾ U k + ξ U k ) ; - - - ( 22 )
αT和αU为拉格朗日乘子向量。
通过令(22)式分别关于βT,αTU的偏导数为0,令ξTU分别表示目标域数据集和待测域数据集的预测误差矩阵,可得:
∂ ∂ β T = 0 → β T = H T T α T + H U T α U ∂ ∂ ξ T = 0 → α T = C T ξ T T ∂ ∂ ξ U = 0 → α U = C U ξ U T ∂ ∂ α T = 0 → H T β T - T T + ξ T = 0 ∂ ∂ α U = 0 → H U β T - T U + ξ U = 0 ; - - - ( 23 )
把(23)式中的第一个方程和第二个方程代入第四和第五个方程,此时有:
H U H T T α T + ( H U H U T + I T C U ) α U = T U H T H U T α U + ( H T H T T + I T C T ) α T = T T ;
其中,IT为NT×NT的单位矩阵;上角标T均为转置符号。
令FO=HUHT TFQ=HTHU T那么上式可写成:
F O α T + F P α U = T U F Q α U + F R α T = T T → F P - 1 F O α T + α U = F O - 1 T U F Q α U + F R α T = T T ;
因此,αT和αU可求解成如下形式:
α T = ( F Q · F P - 1 · F O - F R ) - 1 ( F Q · F P - 1 · T U - T T ) α U = F P - 1 · T U - F P - 1 · F O · ( F Q · F P - 1 · F O - F R ) - 1 ( F Q · F P - 1 · T U - T T ) ; - - - ( 24 )
令FTU=(FQ·FP -1·FO-FR)-1(FQ·FP -1·TU-TT),把(17)式代入(24)式,当NT<NL,输出权值可由下式求得:
β T = H T T α T + H U T α U = H T T · F T U + H U T ( F P - 1 · T U - F P - 1 · F O · F T U ) ; - - - ( 25 )
求得βT后,对于待测域中无标签的待测数据样本而言,可以由以下式子求得其标签:
y ‾ U k = h ‾ U k · β T , k ∈ { 1 , 2 , ... , N U } ; - - - ( 26 )
其中,表示第k个待测数据样本的标签,且 表示第k个待测数据样本在第m类目标气体类别序号上的类别标签值;而在标签中的最大类别标签值所在序号所对应的目标类别即为第k个待测数据样本所属的类别,这样以来,就可以确定各个无标签的待测数据样本所述的类别,实现对待测数据样本的识别。
3、本发明基于目标域迁移极限学习的电子鼻异构数据识别方法。
根据上述基于目标域迁移极限学习的理论框架,本发明基于目标域迁移极限学习的电子鼻异构数据识别方法流程如图1所示,具体包括如下步骤:
1)获取电子鼻在未发生漂移时所采集的NS个有标签的气体传感器阵列感测数据矩阵作为源域数据集对应的标签集合任意的第i个源域数据样本为电子鼻在未发生漂移时进行一次气体检测所得到的气体传感器阵列感测数据矩阵,i∈{1,2,…,NS},即:
X S i = [ x S i , 1 , x S i , 2 , ... , x S i , n , ... , x S i , N ] T ;
其中,表示第i个源域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N},N表示电子鼻气体传感器阵列中所包含的气体传感器数量;上角标T为转置符号;
所述第i个源域数据样本的标签为:
t ‾ S i = [ r S i , 1 , t S i , 2 , ... , t S i , m , ... , t S i , M ] T ;
其中,表示第i个源域数据样本在第m类目标气体类别序号上的类别标签值,若对第i个源域数据样本的识别结果为属于第m类气体,则令否则令由此构成第i个源域数据样本的标签m∈{1,2,…,M},M表示电子鼻所能够识别的目标气体种类数;
2)获取电子鼻在发生漂移后所采集的NT个有标签的气体传感器阵列感测数据矩阵作为目标域数据集对应的标签集合任意的第j个目标域数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,j∈{1,2,…,NT},即:
X T j = [ x T j , 1 , x T j , 2 , ... , x T j , n , ... , x T j , N ] T ;
其中,表示第j个目标域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;
所述第j个目标域数据样本的标签为:
t ‾ T j = [ t T j , 1 , t T j , 2 , ... , t T j , m , ... , t T j , M ] T ;
其中,表示第j个目标域数据样本在第m类目标气体类别序号上的类别标签值,若对第j个目标域数据样本的识别结果为属于第m类气体,则令否则令由此构成第j个目标域数据样本的标签m∈{1,2,…,M};
3)获取电子鼻在发生漂移后所采集的NU个未标记标签的气体传感器阵列感测数据矩阵作为待测域数据集任意的第k个待测数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,k∈{1,2,…,NU},即:
X U k = [ x U k , 1 , x U k , 2 , ... , x U k , n , ... , x U k , N ] T ;
其中,表示第k个待测数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;
4)设定源域数据样本的预测误差惩罚系数CS、目标域数据样本的预测误差惩罚系数CT和待测数据样本的预测误差惩罚系数CU,且设定源域极限学习机和目标域极限学习机的隐含层神经元个数均为NL
5)随机初始化源域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量然后,将源域数据集XS作为源域极限学习机的输入,计算得到相应的源域极限学习机的隐含层输出矩阵
H S = g S ( W 1 · X S + b 1 ‾ ) ;
其中,gS(·)表示源域极限学习机的激活函数;
6)判断源域数据集所包含的源域数据样本个数NS与源域极限学习机隐含层神经元个数NL的数值关系;
若NS≥NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵
β B = ( H S T H S + I L C S ) - 1 H S T T S ;
其中,IL为NL×NL的单位矩阵;
若NS<NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵
β B = H S T ( H S H S T + I S C S ) - 1 T S ;
其中,IS为NS×NS的单位矩阵;上角标T均为转置符号;
7)随机初始化目标域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量
然后,将目标域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵
H T = g T ( W 2 · X T + b 2 ‾ ) ;
将待测域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵
H U = g T ( W 2 · X U + b 2 ‾ ) ;
其中,gT(·)表示目标域极限学习机的激活函数;
由此得到的对应的隐含层输出矩阵 表示第k个待测数据样本所对应的隐含层输出向量;
8)判断目标域数据集所包含的目标域数据样本个数NT与目标域极限学习机隐含层神经元个数NL的数值关系;
若NT≥NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵
βT=(IL+CT·HT T·HT+CU·HU T·HU)-1(CT·HT T·TT+CU·HU T·HU·βB);
其中,IL为NL×NL的单位矩阵;
若NT<NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵
βT=HT T·FTU+HU T(FP -1·TU-FP -1·FO·FTU);
其中,FTU、FO、FP、FQ和FR均为缩写式,其各自的展开式为:
FTU=(FQ·FP -1·FO-FR)-1(FQ·FP -1·TU-TT);
FO=HUHT TFQ=HTHU T
其中,TU=HUβB,IT为NT×NT的单位矩阵;上角标T均为转置符号;
9)将步骤8)所得到的目标域极限学习机的隐含层与输出层之间的权重矩阵βT作为电子鼻的识别分类器,按下式分别计算待测域数据集中各个待测数据样本所对应的标签:
k∈{1,2,…,NU};
其中,表示计算得到的第k个待测数据样本的标签,且:
y ‾ U k = [ y U k , 1 , y U k , 2 , ... , y U k , m , ... , y U k , M ] T ;
表示第k个待测数据样本在第m类目标气体类别序号上的类别标签值;
对于第k个待测数据样本将其标签中最大类别标签值所在的目标气体类别序号所对应的目标气体类别判定识别为待测数据样本所属的气体类别;由此,判定得到待测域数据集中各个待测数据样本的气体类别识别结果。
在本发明基于目标域迁移极限学习的电子鼻异构数据识别方法中,源域数据样本的预测误差惩罚系数CS的优选取值范围为10-3~100,目标域数据样本的预测误差惩罚系数CT的优选取值范围为100~103,待测数据样本的预测误差惩罚系数CU的优选取值范围为10-3~103;源域数据样本的预测误差惩罚系数CS、目标域数据样本的预测误差惩罚系数CT和待测数据样本的预测误差惩罚系数CU的的取值若超出上述取值范围,容易导致源域和目标域的欠学习和过学习问题,影响漂移补偿的效果,进而对漂移补偿后的电子鼻异构数据识别精度造成一定的负面影响。而源域极限学习机和目标域极限学习机的隐含层神经元个数NL的优选取值范围为102~104,过多的隐含层神经元数量容易造成学习运算过于复杂而对电子鼻异构数据识别精度的提高贡献不大;此外,源域极限学习机的激活函数gS(·)和目标域极限学习机的激活函数gT(·)都可以选用径向基函数,还可以选用sigmoid函数。
为了更好的说明和验证本发明基于目标域迁移极限学习的电子鼻异构数据识别方法的有效性,下面通过实验案例对本发明技术方案进行进一步的说明。
4、实验案例。
4.1、实验数据的描述。
在本实验案例中,使用了用公布于UCI机器学习数据库中的长达三年的传感器漂移数据对其进行验证。
这些数据是从2008年1月到2011年2月这个期间收集的,历时36个月。这个数据集共13910个观测值,用于采集数据的电子鼻***由16个气体传感器暴露于6种纯净的不同浓度值气体物质,包含丙酮,酒精,氨,乙醛,乙烯以及甲苯。每个传感器提取出8个特征,所以,特征向量的维数是128。不同时间阶段收集的数据共10组。详情请可查询UCI机器学习数据库的相应网站。
为了使数据集的漂移性质可视化,本案例给出了漂移前后的对比图。如图2所示,我们视第一组数据集(即图2中的before(b1))为未漂移的数据,选择第2组(即图2中的after(b1))、第7组(即图2中的after(b7))和第10组(即图2中的after(b10))作为漂移数据集,从图2中可以看到,多维传感器阵列表现出非线性特性,用线性和非线性方法对传感器响应进行直接校正是不可能的。我们把它看成是空间分布迁移问题,然后用迁移学习来实现漂移补偿。因此,为了获取数据集中10组数据漂移引起的空间分布变化,我们用主成份对数据进行分析,取前两个主成份,并将数据进行投影,每组投影后的2维分布如图3所示。
值得一提的是,有漂移的传感器响应由于非线性动态特性或者混沌特性不能直接进行校正。因此,数据分布调节和机器学习对传感器漂移进行补偿更有意义。因为在目标域迁移极限学习机中,首先准备好少量的目标域数据样本。所以,本实验案例中用基于欧式距离的样本选择算法选出有代表性的标签样本,其选择过程如下:
步骤1、准备数据:选用公布于UCI机器学习数据库中的长达三年的传感器漂移数据,且该数据库分为了10组;我们假定第1组数据并未发生漂移,而第K组的数据发生了漂移,其中,K=2,…,10;所以,第K组数据集符合要求,K=2,…,10。
步骤2、确定所需标本数:标签样本数量可结合分类器,根据识别精度判断所需数量。
步骤3、确定最初的两个样本:计算第K组数据集中两两数据的欧式距离,K=2,…,10,选择距离最大的两个数据作为最初的两个标签样本,即有
步骤4、选取每个剩余的最短距离:计算剩余样本分别与已选出的样本的欧式距离,选取每个剩余样本的最短距离,即有Nd(xi)。
步骤5、选取下一个样本:在Nd(xi)里选取最大值对应的样本为新的标签样本,即有
步骤6、判断是否结束:若选取的标签样本达到了预先设定的值,则结束;否则返回执行步骤4。
通过上述的样本选择算法可以更好的选出能代表整个空间分布的样本,从而有助于更好地体现本发明基于目标域迁移极限学习的电子鼻异构数据识别方法的泛化性。
4.2、实验设计。
本实施案例中,极限学习机的隐含层神经元数L设为1000,使用径向基函数为激活函数,且预设核宽设为1,对特征进行预处理,使得特征值介于(-1,1)。在本发明提出的目标域域迁移极限学习机算法中,设置源域数据样本的预测误差惩罚系数CS为0.001,设置目标域数据样本的预测误差惩罚系数CT为100,设置待测数据样本的预测误差惩罚系数CU为100,为了更好的对本发明所提出的方法进行验证,采用如下的两种实验配置:
配置①,将第1组数据集作为固定的训练集(源域),测试集为第K组数据集,其中K=2,…,10;并且在测试集中,选取部分作为目标域数据集,其余部分作为待测域数据集。
配置②,训练集(源域)是动态的,依次为第K-1组,而测试集为第K组数据集,其中K=2,…,10;并且在测试集中,选取部分作为目标域数据集,其余部分作为待测域数据集。
根据上述的两个实验配置,采用本发明所提出的目标域迁移极限学***均值作为运行结果。而且极限学习机的训练样本与本发明中目标域迁移极限学习机的样本是相同的。
4.3、实验结果和数据对比。
针对本发明提出的基于目标域迁移极限学习的电子鼻异构数据别方法以及上述作为对比的个方法,分别在配置①和配置②的条件下进行实验。采用本发明提出的目标域域迁移极限学习机训练时,分为选40个目标域数据样本(记为DAELM-T(40))和选50个目标域数据样本(记为DAELM-T(50))进行了对比。本发明方法以及各种对比方法对实验配置①中各组数据进行识别的识别精度如图4所示。从图4可得出以下结论:
(1)、SVM-comgfk的结果优于类主成份分析法CC-PCA和其它基于支持向量机的方法,除了第4组和第8组数据集。这同时也表明了机器学习在漂移补偿方面优于传统校正方法。
(2)、ML-comgfk方法的平均精度为67.3%,优于其他基本方法。同时也证明了,对于有限的样本,将正则化与核相结合在半监督学习方面更有效。
(3)、本发明基于目标域迁移极限学***均识别精度比传统极限学***均识别精度达到了92.46%。
(4)、本发明基于目标域迁移极限学习的电子鼻异构数据识别方法中,在学习目标域迁移极限学习机时,用50个目标域数据样本比用40个目标域数据样本的识别精度要略高。
从实验配置①下的实验结果可知,本发明所提出的基于目标域迁移极限学习的电子鼻异构数据识别方法,其识别精度明显优于其它现有技术的方法。
同样第,也对实验配置②下的各组数据采用本发明方法以及各种对比方法进行识别验证实验,实验结果的识别精度统计情况如图5所示。从图5可得出以下结论:
(1)、ML-comgfk的平均识别精度为79.6%,优于其它基于支持向量机的机器学习算法和单核方法。
(2)、类主成份分析法和集成分类器相连合的方法Ensemble能在一定程度上提高识别精度,但是,需要训练很多基分类器,且域迁移能力较差。
(3)、本发明基于目标域迁移极限学习的电子鼻异构数据识别方法的识别精度优于其它现有技术方法,且在电子鼻的漂移补偿上的鲁棒性较好。
为了研究目标域数据样本数量的变化对识别精度的影响,我们用上述样本选择算法选取了不同数量的目标域数据样本进行了对比,其中目标域数据样本个数取{5,10,15,20,25,30,35,40,45,50}一系列值;同时,为了公平比较,训练样本由源域数据样本、目标域数据样本以及待测数据样本组成以训练极限学习机。采用隐含层为径向基函数的正则化极限学习机ELM-rbf作为对比的算法,将本发明的识别方法(记为DAELM-T)与ELM-rbf方法分别对配置①和配置②下的识别实验精度统计结果分别如图6和图7所示,在图6和图7的各个曲线图中,横坐标为数据集样本数,纵坐标为识别率。从图6和图7可得以下结论:
(1)、随着目标域数据样本的增加,传统的极限学习机ELM-rbf的识别精度并未显著提高,这证明了极限学习机没有知识迁移能力。
(2)、随着目标域数据样本的增加,本发明基于目标域迁移极限学***均识别精度明显优于传统的极限学习机ELM-rbf。
(3)、当目标域数据样本数量较少时,本发明识别方法中所采用的目标域迁移极限学习机的识别效果依然优于传统的极限学习机,表明本发明方法在较少的目标域数据样本条件下,依然能够获得较好的漂移补偿识别效果,进而更好的提升气体识别时对异构数据样本的识别精度。
综上所述,本发明基于目标域迁移极限学习的电子鼻异构数据识别方法,从机器学习角度提出域迁移极限学习机框架用于解决传感器漂移问题,而不是直接地校正单一传感器响应,因为漂移具有非线性或者混沌特性,很难捕捉其规律,为此,本发明利用电子鼻在未发生漂移时采集的气体传感器阵列感测数据矩阵以及发生漂移后采集的有标签的和无标签的气体传感器阵列感测数据矩阵分别构建源域数据集、目标域数据集和待测域数据集,并分别作为极限学习机的输入,对电子鼻的识别分类器进行学习,以提升识别分类器在电子鼻发生漂移后对气体识别的容差性能,达到漂移补偿和提高对气体识别中异构数据样本的识别精度的目的,并且持了极限学习机的技术优点,学习过程简单,且使得该方法具备了较好的泛化性和迁移性能。由此也可见,本发明方法中提出的目标域迁移极限学习机框架建立了一个有良好学习能力和泛化能力的电子鼻漂移补偿学习框架。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (7)

1.基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,包括如下步骤:
1)获取电子鼻在未发生漂移时所采集的NS个有标签的气体传感器阵列感测数据矩阵作为源域数据集对应的标签集合任意的第i个源域数据样本为电子鼻在未发生漂移时进行一次气体检测所得到的气体传感器阵列感测数据矩阵,i∈{1,2,…,NS},即:
X S i = [ x S i , 1 , x S i , 2 , ... , x S i , n , ... , x S i , N ] T ;
其中,表示第i个源域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N},N表示电子鼻气体传感器阵列中所包含的气体传感器数量;上角标T为转置符号;
所述第i个源域数据样本的标签为:
t ‾ S i = [ t S i , 1 , t S i , 2 , ... , t S i , m , ... , t S i , M ] T ;
其中,表示第i个源域数据样本在第m类目标气体类别序号上的类别标签值,若对第i个源域数据样本的识别结果为属于第m类气体,则令否则令由此构成第i个源域数据样本的标签m∈{1,2,…,M},M表示电子鼻所能够识别的目标气体种类数;
2)获取电子鼻在发生漂移后所采集的NT个有标签的气体传感器阵列感测数据矩阵作为目标域数据集对应的标签集合任意的第j个目标域数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,j∈{1,2,…,NT},即:
X T j = [ x T j , 1 , x T j , 2 , ... , x T j , n , ... , x T j , N ] T ;
其中,表示第j个目标域数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;
所述第j个目标域数据样本的标签为:
t ‾ T j = [ t T j , 1 , t T j , 2 , ... , t T j , m , ... , t T j , M ] T ;
其中,表示第j个目标域数据样本在第m类目标气体类别序号上的类别标签值,若对第j个目标域数据样本的识别结果为属于第m类气体,则令否则令由此构成第j个目标域数据样本的标签m∈{1,2,…,M};
3)获取电子鼻在发生漂移后所采集的NU个未标记标签的气体传感器阵列感测数据矩阵作为待测域数据集任意的第k个待测数据样本为电子鼻在发生漂移后进行一次气体检测所得到的气体传感器阵列感测数据矩阵,k∈{1,2,…,NU},即:
X U k = [ x U k , 1 , x U k , 2 , ... , x U k , n , ... , x U k , N ] T ;
其中,表示第k个待测数据样本中电子鼻气体传感器阵列的第n个气体传感器的感测特征向量,n∈{1,2,…,N};上角标T为转置符号;
4)设定源域数据样本的预测误差惩罚系数CS、目标域数据样本的预测误差惩罚系数CT和待测数据样本的预测误差惩罚系数CU,且设定源域极限学习机和目标域极限学习机的隐含层神经元个数均为NL
5)随机初始化源域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量然后,将源域数据集XS作为源域极限学习机的输入,计算得到相应的源域极限学习机的隐含层输出矩阵
H S = g S ( W 1 · X S + b ‾ 1 ) ;
其中,gS(·)表示源域极限学习机的激活函数;
6)判断源域数据集所包含的源域数据样本个数NS与源域极限学习机隐含层神经元个数NL的数值关系;
若NS≥NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵
β B = ( H S T H S + I L C S ) - 1 H S T T S ;
其中,IL为NL×NL的单位矩阵;
若NS<NL,则按下式计算源域极限学习机的隐含层与输出层之间的权重矩阵
β B = H S T ( H S H S T + I S C S ) - 1 T S ;
其中,IS为NS×NS的单位矩阵;上角标T均为转置符号;
7)随机初始化目标域极限学习机的输入层与隐含层之间的权重矩阵和隐含层的偏置向量
然后,将目标域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵
H T = g T ( W 2 · X T + b ‾ 2 ) ;
将待测域数据集XT作为目标域极限学习机的输入,计算得到相应的目标域极限学习机的隐含层输出矩阵
H U = g T ( W 2 · X U + b ‾ 2 ) ;
其中,gT(·)表示目标域极限学习机的激活函数;
由此得到的对应的隐含层输出矩阵 表示第k个待测数据样本所对应的隐含层输出向量;
8)判断目标域数据集所包含的目标域数据样本个数NT与目标域极限学习机隐含层神经元个数NL的数值关系;
若NT≥NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵
βT=(IL+CT·HT T·HT+CU·HU T·HU)-1(CT·HT T·TT+CU·HU T·HU·βB);
其中,IL为NL×NL的单位矩阵;
若NT<NL,则按下式计算目标域极限学习机的隐含层与输出层之间的权重矩阵
βT=HT T·FTU+HU T(FP -1·TU-FP -1·FO·FTU);
其中,FTU、FO、FP、FQ和FR均为缩写式,其各自的展开式为:
FTU=(FQ·FP -1·FO-FR)-1(FQ·FP -1·TU-TT);
FO=HUHT TFQ=HTHU T
其中,TU=HUβB,IT为NT×NT的单位矩阵;上角标T均为转置符号;
9)将步骤8)所得到的目标域极限学习机的隐含层与输出层之间的权重矩阵βT作为电子鼻的识别分类器,按下式分别计算待测域数据集中各个待测数据样本所对应的标签:
y ‾ U k = h ‾ U k · β T , k ∈ { 1 , 2 , ... , N U } ;
其中,表示计算得到的第k个待测数据样本的标签,且:
y ‾ U k = [ y U k , 1 , y U k , 2 , ... , y U k , m , ... , y U k , M ] T ;
表示第k个待测数据样本在第m类目标气体类别序号上的类别标签值;
对于第k个待测数据样本将其标签中最大类别标签值所在的目标气体类别序号所对应的目标气体类别判定识别为待测数据样本所属的气体类别;由此,判定得到待测域数据集中各个待测数据样本的气体类别识别结果。
2.根据权利要求1所述基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,所述步骤4)中,源域数据样本的预测误差惩罚系数CS的优选取值范围为10-3~100
3.根据权利要求1所述基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,所述步骤4)中,目标域数据样本的预测误差惩罚系数CT的优选取值范围为100~103
4.根据权利要求1所述基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,所述步骤4)中,待测域无标签数据样本的预测误差惩罚系数CU的优选取值范围为10-3~103
5.根据权利要求1所述基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,所述步骤4)中,源域极限学习机和目标域极限学习机的隐含层神经元个数NL的优选取值范围为102~104
6.根据权利要求1所述基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,所述源域极限学习机的激活函数gS(·)选用径向基函数或sigmoid函数。
7.根据权利要求1所述基于目标域迁移极限学习的电子鼻异构数据识别方法,其特征在于,所述目标域极限学习机的激活函数gT(·)选用径向基函数或sigmoid函数。
CN201610216768.1A 2016-04-08 2016-04-08 基于目标域迁移极限学习的电子鼻异构数据识别方法 Active CN105913079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610216768.1A CN105913079B (zh) 2016-04-08 2016-04-08 基于目标域迁移极限学习的电子鼻异构数据识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610216768.1A CN105913079B (zh) 2016-04-08 2016-04-08 基于目标域迁移极限学习的电子鼻异构数据识别方法

Publications (2)

Publication Number Publication Date
CN105913079A true CN105913079A (zh) 2016-08-31
CN105913079B CN105913079B (zh) 2019-04-23

Family

ID=56745692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610216768.1A Active CN105913079B (zh) 2016-04-08 2016-04-08 基于目标域迁移极限学习的电子鼻异构数据识别方法

Country Status (1)

Country Link
CN (1) CN105913079B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220671A (zh) * 2017-05-27 2017-09-29 重庆大学 一种基于自组织图的人工嗅觉***在线校正样本生成方法
CN109060001A (zh) * 2018-05-29 2018-12-21 浙江工业大学 一种基于特征迁移学习的多工况过程软测量建模方法
CN109669009A (zh) * 2019-01-10 2019-04-23 重庆邮电大学 基于域校正的域自适应极限学习机电子鼻漂移抑制方法
CN110146655A (zh) * 2019-05-31 2019-08-20 重庆大学 一种基于自适应子空间学习范式的抗电子鼻漂移方法
CN110728299A (zh) * 2019-09-06 2020-01-24 三峡大学 基于多重极限学习机的电力***故障后暂态稳定分层评估方法
CN111340132A (zh) * 2020-03-10 2020-06-26 南京工业大学 一种基于da-svm的机器嗅觉模式识别方法
CN111931815A (zh) * 2020-07-08 2020-11-13 西南大学 基于迁移样本的跨域迁移电子鼻漂移抑制方法
CN112766405A (zh) * 2021-01-29 2021-05-07 重庆大学 基于多约束子空间投影的传感器数据分类方法
CN112816616A (zh) * 2019-11-18 2021-05-18 重庆邮电大学 一种基于盲领域自适应的电子鼻漂移补偿方法
CN113030197A (zh) * 2021-03-26 2021-06-25 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113804833A (zh) * 2021-09-17 2021-12-17 重庆大学 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN113837085A (zh) * 2021-09-24 2021-12-24 西南大学 基于领域自适应卷积神经网络的电子鼻漂移补偿方法
CN115808504A (zh) * 2022-12-01 2023-03-17 哈尔滨工业大学 一种用于浓度预测的气体传感器在线漂移补偿方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112098605A (zh) * 2020-09-21 2020-12-18 哈尔滨工业大学 一种高鲁棒性化学传感器阵列软测量方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006125848A1 (es) * 2005-05-23 2006-11-30 Consejo Superior De Investigaciones Científicas Sistema automático de análisis en continuo de la evolución del vino
CN103412003A (zh) * 2013-08-21 2013-11-27 电子科技大学 基于半监督领域自适应的气体检测方法
CN103544392A (zh) * 2013-10-23 2014-01-29 电子科技大学 基于深度学习的医学气体识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006125848A1 (es) * 2005-05-23 2006-11-30 Consejo Superior De Investigaciones Científicas Sistema automático de análisis en continuo de la evolución del vino
CN103412003A (zh) * 2013-08-21 2013-11-27 电子科技大学 基于半监督领域自适应的气体检测方法
CN103544392A (zh) * 2013-10-23 2014-01-29 电子科技大学 基于深度学习的医学气体识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SU LIM TAN.ETC: "E-nose Screening of Pesticide Residue on Chilli and Double-Checked Analysis through Different Data-Recognition Algorithms", 《2010 IEEE ELECTRONICS, ROBOTICS AND AUTOMOTIVE MECHANICS CONFERENCE》 *
刘涛: "用于气敏传感器漂移补偿的数据选择方法", 《重庆大学学报》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220671A (zh) * 2017-05-27 2017-09-29 重庆大学 一种基于自组织图的人工嗅觉***在线校正样本生成方法
CN107220671B (zh) * 2017-05-27 2020-07-14 重庆大学 一种基于自组织图的人工嗅觉***在线校正样本生成方法
CN109060001B (zh) * 2018-05-29 2021-02-26 浙江工业大学 一种基于特征迁移学习的多工况过程软测量建模方法
CN109060001A (zh) * 2018-05-29 2018-12-21 浙江工业大学 一种基于特征迁移学习的多工况过程软测量建模方法
CN109669009A (zh) * 2019-01-10 2019-04-23 重庆邮电大学 基于域校正的域自适应极限学习机电子鼻漂移抑制方法
CN110146655A (zh) * 2019-05-31 2019-08-20 重庆大学 一种基于自适应子空间学习范式的抗电子鼻漂移方法
CN110728299A (zh) * 2019-09-06 2020-01-24 三峡大学 基于多重极限学习机的电力***故障后暂态稳定分层评估方法
CN112816616A (zh) * 2019-11-18 2021-05-18 重庆邮电大学 一种基于盲领域自适应的电子鼻漂移补偿方法
CN111340132A (zh) * 2020-03-10 2020-06-26 南京工业大学 一种基于da-svm的机器嗅觉模式识别方法
CN111340132B (zh) * 2020-03-10 2024-02-02 南京工业大学 一种基于da-svm的机器嗅觉模式识别方法
CN111931815A (zh) * 2020-07-08 2020-11-13 西南大学 基于迁移样本的跨域迁移电子鼻漂移抑制方法
CN111931815B (zh) * 2020-07-08 2022-10-18 西南大学 基于迁移样本的跨域迁移电子鼻漂移抑制方法
CN112766405A (zh) * 2021-01-29 2021-05-07 重庆大学 基于多约束子空间投影的传感器数据分类方法
CN112766405B (zh) * 2021-01-29 2023-08-29 重庆大学 基于多约束子空间投影的传感器数据分类方法
CN113030197A (zh) * 2021-03-26 2021-06-25 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113030197B (zh) * 2021-03-26 2022-11-04 哈尔滨工业大学 一种气体传感器漂移补偿方法
CN113804833A (zh) * 2021-09-17 2021-12-17 重庆大学 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN113804833B (zh) * 2021-09-17 2022-04-29 重庆大学 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN113837085A (zh) * 2021-09-24 2021-12-24 西南大学 基于领域自适应卷积神经网络的电子鼻漂移补偿方法
CN115808504A (zh) * 2022-12-01 2023-03-17 哈尔滨工业大学 一种用于浓度预测的气体传感器在线漂移补偿方法
CN115808504B (zh) * 2022-12-01 2024-06-04 哈尔滨工业大学 一种用于浓度预测的气体传感器在线漂移补偿方法

Also Published As

Publication number Publication date
CN105913079B (zh) 2019-04-23

Similar Documents

Publication Publication Date Title
CN105891422B (zh) 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法
CN105913079A (zh) 基于目标域迁移极限学习的电子鼻异构数据识别方法
US20200150622A1 (en) Method for detecting abnormity in unsupervised industrial system based on deep transfer learning
CN106156401B (zh) 基于多组合分类器的数据驱动***状态模型在线辨识方法
CN105938116A (zh) 基于模糊划分和模型集成的气体传感器阵列浓度检测方法
CN103728431A (zh) 基于极限学习机的工业污水cod在线软测量方法
CN108596274A (zh) 基于卷积神经网络的图像分类方法
CN105572572A (zh) 基于wknn-lssvm的模拟电路故障诊断方法
CN101799888A (zh) 基于仿生智能蚁群算法的工业软测量方法
CN105787521A (zh) 一种面向标签不平衡性的半监督众包标注数据整合方法
CN104035431A (zh) 用于非线性过程监控的核函数参数的获取方法和***
CN106021671B (zh) 结合相关性关系和灰色聚类技术的电路健康分级评估方法
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN103279030B (zh) 基于贝叶斯框架的动态软测量建模方法及装置
CN107526294B (zh) 一种热场温度-硅单晶直径非线性时滞***智能辨识方法
CN103822960B (zh) 极谱法多金属离子浓度在线检测方法
CN107437112A (zh) 一种基于改进多尺度核函数的混合rvm模型预测方法
CN110487519A (zh) 基于alo-inm与加权迹范数的结构损伤识别方法
CN105787507A (zh) 基于预算支持向量集的LS-SVMs在线学习方法
CN107220671B (zh) 一种基于自组织图的人工嗅觉***在线校正样本生成方法
Nguyen et al. Deep learning models for predicting co2 flux employing multivariate time series
CN106289364B (zh) 一种传感器漂移的自适应调节方法
CN112068033B (zh) 基于1/6周期电流的逆变器功率管开路故障在线辨识方法
CN104516858B (zh) 一种非线性动力学行为分析的相图矩阵方法
Li et al. Knowledge-based genetic algorithms data fusion and its application in mine mixed-gas detection.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant