CN113378935A - 一种用于气体的嗅觉智能识别方法 - Google Patents

一种用于气体的嗅觉智能识别方法 Download PDF

Info

Publication number
CN113378935A
CN113378935A CN202110656610.7A CN202110656610A CN113378935A CN 113378935 A CN113378935 A CN 113378935A CN 202110656610 A CN202110656610 A CN 202110656610A CN 113378935 A CN113378935 A CN 113378935A
Authority
CN
China
Prior art keywords
gas
sample
value
sensor response
ith
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110656610.7A
Other languages
English (en)
Other versions
CN113378935B (zh
Inventor
王宇赫
余梦琪
毛强强
刘帅辰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202110656610.7A priority Critical patent/CN113378935B/zh
Publication of CN113378935A publication Critical patent/CN113378935A/zh
Application granted granted Critical
Publication of CN113378935B publication Critical patent/CN113378935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)

Abstract

本发明涉及一种用于气体的嗅觉智能识别方法,首先收集P种已知气体,构建气味数据样本库,其次构构建气体智能识别模型并利用气味数据样本库中的数据进行训练,最后对待检测气体进行信号特征提取并构建特征向量X,将X输入训练好的气体智能识别模型,输出该待检测气体的预测气体种类标签。本发明利用神经网络为基础构建气体智能识别模型,同时设置带有附加动量因子的权值、带有附加动量因子的阈值和自适应学习速率来影响训练过程,最后得到气体识别的智能化和可靠化。

Description

一种用于气体的嗅觉智能识别方法
技术领域
本发明涉及计算机嗅觉领域,特别涉及一种用于气体的嗅觉智能识别方法。
背景技术
当前气体的智能识别在工业、农业、商业等各领域均至关重要,包括石油化工、煤矿瓦斯领域的有毒有害易燃易爆气体的识别、消费品领域的白酒、葡萄酒、咖啡等不同品种的鉴别。一直以来,气体识别或气味识别在各行各业均是一个棘手的问题。不同于根据光的波长进行颜色识别,气体或气味难以捕捉类似于光的波长等明显的物理化学特征,仅根据气体特定分子特征很难辨识不同气味。目前,气体或气味的识别大多依赖人工嗅觉判断及实验检测,但嗅觉主观判断往往涉及较大的误差且存在潜在的人身安全风险。人工实验检测往往耗费大量的时间和精力,甚至造成巨大的人身安全损失,特别是有毒有害易燃易爆气体的滞后识别往往需要付出极大的代价,且不具备便携性,难以在特定场景大规模运用。
随着技术的发展与进步,凭借气体传感器和气体检测技术的便携式检测仪已经得到初步运用。但单纯依赖气体传感器技术受限于被测气体或气味的浓度。且由于气体传感器普遍存在交叉敏感度的问题,单一的传感器难以对环境中的混合气体进行精准地定性识别及定量检测。目前计算机视觉已经在人脸识别、目标检测等领域取得了突破性的发展,充分验证了深度学习的万能近似能力。而且学术界早就提出了“气体指纹”的概念,即不同气体或不同气味类似于指纹一样,具有独一无二的特征,这为实现计算机嗅觉提供了可能。为了降低气体识别的时间、人力成本及潜在危险并促进气味识别的高效化发展,应当聚焦当下科技前沿,尽可能减少气体识别过程中的人为干预,构建一种计算机嗅觉的实现方法。
发明内容
针对现有技术存在的上述问题,本发明要解决的技术问题是:如何智能化的且准确的进行气味的识别。
为解决上述技术问题,本发明采用如下技术方案:一种用于气体的嗅觉智能识别方法,包括如下步骤:
S100:收集P种已知气体,构建气味数据样本库,该数据样本库中的样本是已知气体的传感器响应数据和真实标签,气味数据样本库构建过程如下:
设时间段为T,该段时间T内每间隔相同时间取一次数据值,共提取t次数据值,当段时间T结束时,每个传感器会采集到t个数据值;
对于第p个已知气体,使用第j个气体传感器对探测已知气体,将第j个传感器探测到信号传出放大电路得到第j个电压信号值,对于第i个已知气体,在时间段T内,得到t个电压信号值;
对于第p个已知气体的第j个传感器,以时间为横轴,t个电压信号值为纵轴绘制一条传感器响应曲线,令j=1,2…N,则对第i个已知气体得到N条传感器响应曲线;
令p=1,2…P,则得到P种已知气体的传感器响应曲线。
S200:对气味数据样本库中第i个样本进行信号特征提取并构建特征向量Xi,所述特征向量Xi的具体表达式如下:
Figure BDA0003113156610000021
其中,
Figure BDA0003113156610000022
为第i个样本的传感器响应曲线的算术平均值向量,第i个样本的每条传感器响应曲线得到一个算术平均值,N条传感器响应曲线得到N个算术平均值,所述算术平均值向量则由该N个算术平均值构成;
Figure BDA0003113156610000023
为第i个样本的传感器响应曲线的峰值向量,第i个样本的每条传感器响应曲线得到一个最大电压值,N条传感器响应曲线得到N个最大电压值,所述峰值向量则由该N个最大电压值构成;
Vari为第i个样本的传感器响应曲线的方差向量,第i个样本的每条传感器响应曲线得到一个方差值,N条传感器响应曲线得到N个方差值,所述方差向量则由该N个方差值构成;
Si为第i个样本的传感器响应曲线的积分值向量,第i个样本的每条传感器响应曲线得到一个积分值,N条传感器响应曲线得到N个积分值,所述积分值向量则由该N个积分值构成;
Varli为第i个样本的传感器响应曲线在方差最大时刻的响应值向量,第i个样本的每条传感器响应曲线得到一个在方差最大时刻的响应值,N条传感器响应曲线得到N个在方差最大时刻的响应值,所述在方差最大时刻的响应值向量则由该N个在方差最大时刻的响应值构成;
Figure BDA0003113156610000024
为第i个样本的传感器响应曲线在稳态阶段中任一时刻的响应值向量,第i个样本的每条传感器响应曲线得到一个在稳态阶段中任一时刻的响应值,N条传感器响应曲线得到N个在稳态阶段中任一时刻的响应值,所述在稳态阶段中任一时刻的响应值向量则由该N个在稳态阶段中任一时刻的响应值构成。
S300:构建气体智能识别模型,所述气体智能识别模型使用深度神经网络框架,具体表达式如下:
Figure BDA0003113156610000031
其中,i=1,2,…,m,j=1,2,...n,即第l-1层共有m个神经元节点,第l层有n个神经元节点,上标/为神经网络层数,wji为前一层第i个节点连接后一层的第j个节点的权值,
Figure BDA0003113156610000032
为第l-1层第i个节点的输出,
Figure BDA0003113156610000033
为第1层第j个节点的输出,
Figure BDA0003113156610000034
为第1层第j个节点的阈值,wl为第1层n*m的权重矩阵,bl为第1层n*1的阈值向量矩阵,g(·)为激活函数。
S400:对步骤S300建立的气体智能识别模型进行训练,其具体步骤如下:
S410:设置带有附加动量因子的权值、带有附加动量因子的阈值和自适应学习速率,带有附加动量因子的权值的表达式如下:
Δw(k+1)=(1-μ)ηδ(k)+μΔw(k) (4-1)
带有附加动量因子的阈值的表达式如下:
Δb(k+1)=(1-μ)ηδ+μΔb(k) (4-2)
自适应学习速率的表达式如下:
Figure BDA0003113156610000035
其中,k为训练次数;μ为动量因子,E(k)为第k步误差平方和,E(k+1)第k+1步误差平方和,Δw(k)是第k次迭代的权值调整量,η为学习率,η(k)为第k次迭代时的自适应学习速率,δ(k)表示误差函数对输出层的神经元的偏导数,Δb(k+1)表示第k+1次迭代的阈值调整量,Δb(k)表示第k次迭代的阈值调整量;
S420:将样本的特征向量X作为气体智能识别模型的输入,气体智能识别模型的输出为该样本的气体种类预测标签;
S430:给TP、TN、FP、FN初始赋值;
若样本属于气体样本库,并且样本的预测标签与真实标签一致,则TP=TP+1;
若样本属于气体样本库,则TN=TN+1;
若样本属于气体样本库,并且样本的预测标签与真实标签不一致,则FP=FP+1;
若样本不属于气体样本库,则样本标注FN=FN+1;
S440:重复S410-S430,遍历所有样本,得到TP、TN、FP、FN的值;
S450:计算准确率的如公式(4-4):
Figure BDA0003113156610000041
其中,Accuracy表示预测准确率,TP+TN表示预测正确的样本数,TP+TN+FP+FN表示总样本数;
S460:设定准确率阈值,当预测准确率达到或准确率阈值时停止训练,得到训练好的气体智能识别模型,否则反向传播更新气体智能识别模型参数并返回步骤S410继续训练。
S500:对待检测气体进行信号特征提取并构建特征向量X,将X输入步骤S460得到的训练好的气体智能识别模型,输出该待检测气体的预测气体种类标签。
作为改进,S100对于第p个已知气体的第j个传感器,以时间为横轴,t个电压信号值为纵轴绘制一条传感器响应曲线,令j=1,2…N,则对第i个已知气体得到N条传感器响应曲线;
对所述N条传感器响应曲线进行去高频信号处理,并标注气体种类标签。
作为改进,所述S200中计算第i个样本的每条传感器响应曲线算术平均值、最大电压值、方差值、积分值、在方差最大时刻的响应值和在稳态阶段中任一时刻的响应值方法如下:
第i个样本的每条传感器响应曲线的算术平均值均采用公式(2-2)计算:
Figure BDA0003113156610000042
第i个样本的每条传感器响应曲线的峰值均采用公式(2-3)计算:
Figure BDA0003113156610000043
第i个样本的每条传感器响应曲线的方差值均采用公式(2-4)计算:
Figure BDA0003113156610000044
第i个样本的每条传感器响应曲线的积分值均采用公式(2-5)计算:
Figure BDA0003113156610000045
第i个样本的每条传感器响应曲线在方差最大时刻的响应值向量采用公式(2-6)计算:
Figure BDA0003113156610000046
其中,
Figure BDA0003113156610000047
表示第i个样本的第j条传感器响应曲线的算术平均值,y(t,i)表示在时间段T内第i个样本t次的电压信号值,
Figure BDA0003113156610000048
表示第i个样本的第j条传感器响应曲线的峰值,Vari,j表示第i个样本的第j条传感器响应曲线的方差值,Si,j表示第i个样本的第j条传感器响应曲线的积分值,Varli,j表示第i个样本的第j条传感器响应曲线在方差最大时刻的响应值。
作为改进,所述S460中准确率的阈值为99.5%。
相对于现有技术,本发明至少具有如下优点:
1.本发明着眼于气体智能识别,充分挖掘不同气味独特的抽象特征,基于智能传感器技术及人工智能方法,融合气味电信号数据采集、气味数据样本库构建及气味特征训练过程,构建完备气味数据样本库的基础上,通过对气味的智能分类识别,在一定程度上实现计算机嗅觉的高度自动化和智能化。
2.该计算机嗅觉实现方法不仅能识别单一气味,同样可以提取混合气味的特征,进而达到识别混合气味的目的;本发明能够提取出不同气味的独特抽象特征,针对混合多种气味的研究对象,在电信号数据采集后通过标注气味标签使得该混合气味数据存储于样本数据库中,一旦再次监测该气味数据就能根据输出标签判断混合气味的类型。
3.本发明利用神经网络为基础构建气体智能识别模型,同时设置带有附加动量因子的权值、带有附加动量因子的阈值和自适应学习速率来影响训练过程,最后得到气体识别的智能化和可靠化。
附图说明
图1为检测***结构流程图。
图2为单个传感器测试电路原理图。
图3为单个气体传感器电信号响应曲线。
图4为数据滤波前(左)后(右)响应曲线对比图。
图5为混淆矩阵示意图。
图6为实验验证中样品1、2、3的气体传感器响应曲线,其中图6(a)代表样品1,图6(b)代表样品2,图6(c)代表样品3。
具体实施方式
下面对本发明作进一步详细说明。
参见图1-图5,一种用于气体的嗅觉智能识别方法,包括如下步骤:
S100:收集P种已知气体,构建气味数据样本库,该数据样本库中的样本是已知气体的传感器响应数据和真实标签,气味数据样本库构建过程如下:
设时间段为T,该段时间T内每间隔相同时间取一次数据值,共提取t次数据值,当段时间T结束时,每个传感器会采集到t个数据值。
对于第p个已知气体,使用第j个气体传感器对探测已知气体,将第j个传感器探测到信号传出放大电路得到第j个电压信号值,对于第i个已知气体,在时间段T内,得到t个电压信号值。
对于第p个已知气体的第j个传感器,以时间为横轴,t个电压信号值为纵轴绘制一条传感器响应曲线,令j=1,2…N,则对第i个已知气体得到N条传感器响应曲线。
令p=1,2…P,则得到P种已知气体的传感器响应曲线。
将气体传感器放入具有一定浓度的已知气体中,传感器得到的电压信号其实很微弱,并不利于处理,为此发明人想到利用方法电路电压信号放大,便于后续处理。
S200:对气味数据样本库中第i个样本进行信号特征提取并构建特征向量Xi,所述特征向量Xi的具体表达式如下:
Figure BDA0003113156610000061
其中,
Figure BDA0003113156610000062
为第i个样本的传感器响应曲线的算术平均值向量,第i个样本的每条传感器响应曲线得到一个算术平均值,N条传感器响应曲线得到N个算术平均值,所述算术平均值向量则由该N个算术平均值构成。
Figure BDA0003113156610000063
为第i个样本的传感器响应曲线的峰值向量,第i个样本的每条传感器响应曲线得到一个最大电压值,N条传感器响应曲线得到N个最大电压值,所述峰值向量则由该N个最大电压值构成。
Vari为第i个样本的传感器响应曲线的方差向量,第i个样本的每条传感器响应曲线得到一个方差值,N条传感器响应曲线得到N个方差值,所述方差向量则由该N个方差值构成。
Si为第i个样本的传感器响应曲线的积分值向量,第i个样本的每条传感器响应曲线得到一个积分值,N条传感器响应曲线得到N个积分值,所述积分值向量则由该N个积分值构成。
Varli为第i个样本的传感器响应曲线在方差最大时刻的响应值向量,第i个样本的每条传感器响应曲线得到一个在方差最大时刻的响应值,N条传感器响应曲线得到N个在方差最大时刻的响应值,所述在方差最大时刻的响应值向量则由该N个在方差最大时刻的响应值构成。
Figure BDA0003113156610000064
为第i个样本的传感器响应曲线在稳态阶段中任一时刻的响应值向量,第i个样本的每条传感器响应曲线得到一个在稳态阶段中任一时刻的响应值,N条传感器响应曲线得到N个在稳态阶段中任一时刻的响应值,所述在稳态阶段中任一时刻的响应值向量则由该N个在稳态阶段中任一时刻的响应值构成。
S300:构建气体智能识别模型,所述气体智能识别模型使用深度神经网络框架,具体表达式如下:
Figure BDA0003113156610000071
ol=g(wlol-1+bl) (3-2)
其中,,i=1,2,…,m,j=1,2,...n,即第l-1层共有m个神经元节点,第l层有n个神经元节点,上标/为神经网络层数,wji为前一层第i个节点连接后一层的第j个节点的权值,
Figure BDA0003113156610000072
为第l-1层第i个节点的输出,
Figure BDA0003113156610000073
为第1层第j个节点的输出,
Figure BDA0003113156610000074
为第1层第j个节点的阈值,wl为第1层n*m的权重矩阵,bl为第1层n*1的阈值向量矩阵,g(·)为激活函数;激活函数取softmax函数,
其中,公式(3-1)表示代数表达式,公式(3-2)表示矩阵表达式;ol-1为m×1的向量;ol为n×1的向量;bl为n×1的向量;也就是说,如果l=2,则对应的o1即为输入层的特征向量x=[x1,x2,...,x6q]T
S400:对步骤S300建立的气体智能识别模型进行训练,其具体步骤如下:
S410:设置带有附加动量因子的权值、带有附加动量因子的阈值和自适应学习速率,带有附加动量因子的权值的表达式如下:
Δw(k+1)=(1-μ)ηδ(k)+μΔw(k) (4-1)
带有附加动量因子的阈值的表达式如下:
Δb(k+1)=(1-μ)ηδ+μΔb(k) (4-2)
自适应学习速率的表达式如下:
Figure BDA0003113156610000075
其中,k为训练次数;μ为动量因子,E(k)为第k步误差平方和,E(k+1)第k+1步误差平方和,Δw(k)是第k次迭代的权值调整量,η为学习率,η(k)为第k次迭代时的自适应学习速率,δ(k)表示误差函数对输出层的神经元的偏导数,Δb(k+1)表示第k+1次迭代的阈值调整量,Δb(k)表示第k次迭代的阈值调整量,此处的动量因子一般取值为0.95左右时,实验效果最佳。
S420:将样本的特征向量X作为气体智能识别模型的输入,气体智能识别模型的输出为该样本的气体种类预测标签。
S430:给TP、TN、FP、FN初始赋值;判断样本是否属于所述气体样本库,判断第m个样本的预测标签与第m个样本的真实标签是否一致,具体的:
若样本属于气体样本库,并且样本的预测标签与真实标签一致,则TP=TP+1。
若样本属于气体样本库,则TN=TN+1。
若样本属于气体样本库,并且样本的预测标签与真实标签不一致,则FP=FP+1。
若样本不属于气体样本库,则样本标注FN=FN+1。
S440:重复S410-S430,遍历所有样本,得到TP、TN、FP、FN的值。
S450:计算准确率的如公式(4-4):
Figure BDA0003113156610000081
其中,Accuracy表示预测准确率,TP+TN表示预测正确的样本数,TP+TN+FP+FN表示总样本数。
S460:设定准确率阈值,当预测准确率达到或准确率阈值时停止训练,得到训练好的气体智能识别模型,否则反向传播更新气体智能识别模型参数并返回步骤S410继续训练。
准确率的阈值为99.5%。混淆矩阵中,统计的是样本个数,希望预测分类正确的个数越大越好,即TP与TN的数量大,而FP与FN的数量小越好。当数据量较大时,只凭借个数,很难衡量模型的优劣,因此通过准确率来评价,当准确率达到99.5%时完成神经网络模型的训练过程。
S500:对待检测气体进行信号特征提取并构建特征向量X,将X输入步骤S460得到的训练好的气体智能识别模型,输出该待检测气体的预测气体种类标签。
作为改进,S100中对于第p个已知气体的第j个传感器,以时间为横轴,t个电压信号值为纵轴绘制一条传感器响应曲线,令j=1,2…N,则对第i个已知气体得到N条传感器响应曲线;对所述N条传感器响应曲线进行去高频信号处理,并标注气体种类标签。去高频信号处理即数据滤波,这里采用的是算数均值滤波,取一定数量的原始数据进行累加后取平均值,从而获取较稳定的输出数据;这样高频信号将会去掉,可以帮助消除尖锐噪声,使得采样曲线更加平滑,降低实验环境对实验数据造成的实验误差。
作为改进,所述S200中计算第i个样本的每条传感器响应曲线算术平均值、最大电压值、方差值、积分值、在方差最大时刻的响应值和在稳态阶段中任一时刻的响应值方法如下:
第i个样本的每条传感器响应曲线的算术平均值均采用公式(2-2)计算:
Figure BDA0003113156610000082
第i个样本的每条传感器响应曲线的峰值均采用公式(2-3)计算:
Figure BDA0003113156610000091
第i个样本的每条传感器响应曲线的方差值均采用公式(2-4)计算:
Figure BDA0003113156610000092
第i个样本的每条传感器响应曲线的积分值均采用公式(2-5)计算:
Figure BDA0003113156610000093
第i个样本的每条传感器响应曲线在方差最大时刻的响应值向量采用公式(2-6)计算:
Figure BDA0003113156610000094
稳态阶段某一随机时刻t=t′的响应值:y(t′,i)。
其中,
Figure BDA0003113156610000095
表示第i个样本的第j条传感器响应曲线的算术平均值,y(t,i)表示在时间段T内第i个样本t次的电压信号值,
Figure BDA0003113156610000096
表示第i个样本的第j条传感器响应曲线的峰值,Vari,j表示第i个样本的第j条传感器响应曲线的方差值,Si,j表示第i个样本的第j条传感器响应曲线的积分值,Varli,j表示第i个样本的第j条传感器响应曲线在方差最大时刻的响应值;Δt表示自变量增量,即采集一次数据的时间间隔。
y(t,i)为响应曲线函数式,其值表示第i个传感器在t时刻的响应值。
算数平均值、峰值、方差为静态特征参数,积分值,方差最大时刻响应值、在稳态阶段中任一时刻的响应值为动态特征参数,所选取这几个特征静态动态特征相结合具有一定的代表性,且能很好的表示曲线的变化幅度,选择太多的特征会增加神经网络的计算量,延缓计算速度。
实验验证
将样品1、样品2、样品3三种气味样本分别置于容器中,三种气味样本通过采样装置进行采样,先对样品1进行20次测试,得到一个样本的20个数据信息。3种气味共得到60(3*20)个数据样本。3种气味得到的代表性气体传感器响应曲线如图:
应用到气体识别领域的模式识别分类方法较多,例如KNN、SVM、RF等,虽然都取得了一定的效果,但这些方法都会随着样本类别的增加而准确率降低,将采集到的不同气味样本的数据进行数据处理及特征提取,
设计K近邻分类方法和深度神经网络方法即本发明方法对比实验开展三种样品的气味智能识别分类。
K最近邻分类方法不需要训练过程,只需要将待预测样本放入特征X所构成的空间中计算距离其最近的K个样本,该算法原理简单较为常用,在这里不做过多说明,统计出待检测样本所属类别重复度最大的那个类别,作为待识别样本的目标种类。下表显示的是最近邻分类方法对3种气味识别分类的混淆矩阵。表显示每一种气味类型都有识别错误的可能,最后计算最近邻分类方法准确率达到85%。
样品1 样品2 样品3 合计
样品1 17 1 3 21
样品2 0 18 2 20
样品3 2 1 16 19
合计 19 20 21 60
在本发明方法中,由于样本数据量较少,训练集和测试集为所采集三种气味样本的同一数据集,经过多次参数优化,由混淆矩阵显示,两个样品1被误判为样品3,一个样品2被误判为样品3,两个样品3被误判为样品1。整体而言,深度神经网络的预测效果达到91.67%的准确率,这可能是由于训练样本不足导致神经网络训练的拟合程度不够有关。
样品1 样品2 样品3 合计
样品1 18 0 2 20
样品2 0 19 1 20
样品3 2 0 18 20
合计 20 19 21 60
对比最近邻和深度神经网络分类器,深度神经网络对所检测的三个样品的分类能力要更好一点。传感器阵列的输出为离散数据,且提取了多维度的多个特征。K近邻算法在运算过程中需要对整个数据集不停的返回计算,当样本特征较多时预测过程中的计算复杂度相当大。而神经网络通过对神经元输出添加一个偏置项后再通过一个激活函数进行计算完成去线性化,具有很强的非线性处理能力,深度神经网络依靠不断地误差反向传播调整输入层到隐藏层、隐藏层到输出层之间的权值和阈值,从而降低神经网络的输出误差。
神经网络用于气味识别的缺点在于需要训练的样本数过多,在使用过程中我们需要采集足够丰富的样本进行训练,如果存在困难可以使用同一组样本周期性的训练多次,并且在后续预测分类过程中不断丰富样本集。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种用于气体的嗅觉智能识别方法,其特征在于:包括如下步骤:
S100:收集P种已知气体,构建气味数据样本库,该数据样本库中的样本是已知气体的传感器响应数据和真实标签,气味数据样本库构建过程如下:
设时间段为T,该段时间T内每间隔相同时间取一次数据值,共提取t次数据值,当段时间T结束时,每个传感器会采集到t个数据值;
对于第p个已知气体,使用第j个气体传感器对探测已知气体,将第j个传感器探测到信号传出放大电路得到第j个电压信号值,对于第i个已知气体,在时间段T内,得到t个电压信号值;
对于第p个已知气体的第j个传感器,以时间为横轴,t个电压信号值为纵轴绘制一条传感器响应曲线,令j=1,2…N,则对第i个已知气体得到N条传感器响应曲线;
令p=1,2…P,则得到P种已知气体的传感器响应曲线;
S200:对气味数据样本库中第i个样本进行信号特征提取并构建特征向量Xi,所述特征向量Xi的具体表达式如下:
Figure FDA0003113156600000011
其中,
Figure FDA0003113156600000012
为第i个样本的传感器响应曲线的算术平均值向量,第i个样本的每条传感器响应曲线得到一个算术平均值,N条传感器响应曲线得到N个算术平均值,所述算术平均值向量则由该N个算术平均值构成;
Figure FDA0003113156600000013
为第i个样本的传感器响应曲线的峰值向量,第i个样本的每条传感器响应曲线得到一个最大电压值,N条传感器响应曲线得到N个最大电压值,所述峰值向量则由该N个最大电压值构成;
Vari为第i个样本的传感器响应曲线的方差向量,第i个样本的每条传感器响应曲线得到一个方差值,N条传感器响应曲线得到N个方差值,所述方差向量则由该N个方差值构成;
Si为第i个样本的传感器响应曲线的积分值向量,第i个样本的每条传感器响应曲线得到一个积分值,N条传感器响应曲线得到N个积分值,所述积分值向量则由该N个积分值构成;
Varli为第i个样本的传感器响应曲线在方差最大时刻的响应值向量,第i个样本的每条传感器响应曲线得到一个在方差最大时刻的响应值,N条传感器响应曲线得到N个在方差最大时刻的响应值,所述在方差最大时刻的响应值向量则由该N个在方差最大时刻的响应值构成;
Figure FDA0003113156600000014
为第i个样本的传感器响应曲线在稳态阶段中任一时刻的响应值向量,第i个样本的每条传感器响应曲线得到一个在稳态阶段中任一时刻的响应值,N条传感器响应曲线得到N个在稳态阶段中任一时刻的响应值,所述在稳态阶段中任一时刻的响应值向量则由该N个在稳态阶段中任一时刻的响应值构成;
S300:构建气体智能识别模型,所述气体智能识别模型使用深度神经网络框架,具体表达式如下:
Figure FDA0003113156600000021
其中,i=1,2,…,m,j=1,2,...n,即第l-1层共有m个神经元节点,第l层有n个神经元节点,上标l为神经网络层数,wji为前一层第i个节点连接后一层的第j个节点的权值,
Figure FDA0003113156600000022
为第l-1层第i个节点的输出,
Figure FDA0003113156600000023
为第l层第j个节点的输出,
Figure FDA0003113156600000024
为第l层第j个节点的阈值,wl为第l层n*m的权重矩阵,bl为第l层n*1的阈值向量矩阵,g(·)为激活函数;
S400:对步骤S300建立的气体智能识别模型进行训练,其具体步骤如下:
S410:设置带有附加动量因子的权值、带有附加动量因子的阈值和自适应学习速率,带有附加动量因子的权值的表达式如下:
Δw(k+1)=(1-μ)ηδ(k)+μΔw(k) (4-1)
带有附加动量因子的阈值的表达式如下:
Δb(k+1)=(1-μ)ηδ+μΔb(k) (4-2)
自适应学习速率的表达式如下:
Figure FDA0003113156600000025
其中,k为训练次数;μ为动量因子,E(k)为第k步误差平方和,E(k+1)第k+1步误差平方和,Δw(k)是第k次迭代的权值调整量,η为学习率,η(k)为第k次迭代时的自适应学习速率,δ(k)表示误差函数对输出层的神经元的偏导数,Δb(k+1)表示第k+1次迭代的阈值调整量,Δb(k)表示第k次迭代的阈值调整量;
S420:将样本的特征向量X作为气体智能识别模型的输入,气体智能识别模型的输出为该样本的气体种类预测标签;
S430:给TP、TN、FP、FN初始赋值;
若样本属于气体样本库,并且样本的预测标签与真实标签一致,则TP=TP+1;
若样本属于气体样本库,则TN=TN+1;
若样本属于气体样本库,并且样本的预测标签与真实标签不一致,则FP=FP+1;
若样本不属于气体样本库,则样本标注FN=FN+1;
S440:重复S410-S430,遍历所有样本,得到TP、TN、FP、FN的值;
S450:计算准确率的如公式(4-4):
Figure FDA0003113156600000031
其中,Accuracy表示预测准确率,TP+TN表示预测正确的样本数,TP+TN+FP+FN表示总样本数;
S460:设定准确率阈值,当预测准确率达到或准确率阈值时停止训练,得到训练好的气体智能识别模型,否则反向传播更新气体智能识别模型参数并返回步骤S410继续训练;
S500:对待检测气体进行信号特征提取并构建特征向量X,将X输入步骤S460得到的训练好的气体智能识别模型,输出该待检测气体的预测气体种类标签。
2.如权利要求1所述的一种用于气体的嗅觉智能识别方法,其特征在于:所述S100对于第p个已知气体的第j个传感器,以时间为横轴,t个电压信号值为纵轴绘制一条传感器响应曲线,令j=1,2…N,则对第i个已知气体得到N条传感器响应曲线;
对所述N条传感器响应曲线进行去高频信号处理,并标注气体种类标签。
3.如权利要求1或2所述的一种用于气体的嗅觉智能识别方法,其特征在于:所述S200中计算第i个样本的每条传感器响应曲线算术平均值、最大电压值、方差值、积分值、在方差最大时刻的响应值和在稳态阶段中任一时刻的响应值方法如下:
第i个样本的每条传感器响应曲线的算术平均值均采用公式(2-2)计算:
Figure FDA0003113156600000032
第i个样本的每条传感器响应曲线的峰值均采用公式(2-3)计算:
Figure FDA0003113156600000033
第i个样本的每条传感器响应曲线的方差值均采用公式(2-4)计算:
Figure FDA0003113156600000034
第i个样本的每条传感器响应曲线的积分值均采用公式(2-5)计算:
Figure FDA0003113156600000035
第i个样本的每条传感器响应曲线在方差最大时刻的响应值向量采用公式(2-6)计算:
Figure FDA0003113156600000036
其中,
Figure FDA0003113156600000037
表示第i个样本的第j条传感器响应曲线的算术平均值,y(t,i)表示在时间段T内第i个样本t次的电压信号值,
Figure FDA0003113156600000041
表示第i个样本的第j条传感器响应曲线的峰值,Vari,j表示第i个样本的第j条传感器响应曲线的方差值,Si,j表示第i个样本的第j条传感器响应曲线的积分值,Varli,j表示第i个样本的第j条传感器响应曲线在方差最大时刻的响应值。
4.如权利要求3所述的一种用于气体的嗅觉智能识别方法,其特征在于,所述S460中准确率的阈值为99.5%。
CN202110656610.7A 2021-06-11 2021-06-11 一种用于气体的嗅觉智能识别方法 Active CN113378935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110656610.7A CN113378935B (zh) 2021-06-11 2021-06-11 一种用于气体的嗅觉智能识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110656610.7A CN113378935B (zh) 2021-06-11 2021-06-11 一种用于气体的嗅觉智能识别方法

Publications (2)

Publication Number Publication Date
CN113378935A true CN113378935A (zh) 2021-09-10
CN113378935B CN113378935B (zh) 2022-07-01

Family

ID=77574259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110656610.7A Active CN113378935B (zh) 2021-06-11 2021-06-11 一种用于气体的嗅觉智能识别方法

Country Status (1)

Country Link
CN (1) CN113378935B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116026787A (zh) * 2023-03-29 2023-04-28 湖南汇湘轩生物科技股份有限公司 一种香精品级检测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416178A (zh) * 2018-05-02 2018-08-17 南京航空航天大学 一种机械弹性车轮结构参数优化设计方法
CN108760829A (zh) * 2018-03-20 2018-11-06 天津大学 一种基于仿生嗅球模型和卷积神经网络的电子鼻识别方法
CN109102005A (zh) * 2018-07-23 2018-12-28 杭州电子科技大学 基于浅层模型知识迁移的小样本深度学习方法
CN111340132A (zh) * 2020-03-10 2020-06-26 南京工业大学 一种基于da-svm的机器嗅觉模式识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108760829A (zh) * 2018-03-20 2018-11-06 天津大学 一种基于仿生嗅球模型和卷积神经网络的电子鼻识别方法
CN108416178A (zh) * 2018-05-02 2018-08-17 南京航空航天大学 一种机械弹性车轮结构参数优化设计方法
CN109102005A (zh) * 2018-07-23 2018-12-28 杭州电子科技大学 基于浅层模型知识迁移的小样本深度学习方法
CN111340132A (zh) * 2020-03-10 2020-06-26 南京工业大学 一种基于da-svm的机器嗅觉模式识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHUCHU ZHU等: "the study of multimodal gas recognition algorithm based on machine olfaction", 《2016 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS-CHINA》 *
SIGERU OMATU等: "smells classification for human breath using a layered neural network", 《DISTRIBUTED COMPUTING AND ARTIFICIAL INTELLIGENCE,13TH INTERNATIONAL CONFERENCE》 *
宋洪庆等: "油气资源开发的大数据智能平台及应用分析", 《工程科学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116026787A (zh) * 2023-03-29 2023-04-28 湖南汇湘轩生物科技股份有限公司 一种香精品级检测方法及***
CN116026787B (zh) * 2023-03-29 2023-07-21 湖南汇湘轩生物科技股份有限公司 一种香精品级检测方法及***

Also Published As

Publication number Publication date
CN113378935B (zh) 2022-07-01

Similar Documents

Publication Publication Date Title
CN103544392B (zh) 基于深度学习的医学气体识别方法
CN111666169B (zh) 一种基于改进的孤立森林算法和高斯分布的联合数据异常检测方法
Guh A hybrid learning-based model for on-line detection and analysis of control chart patterns
CN110166484A (zh) 一种基于LSTM-Attention网络的工业控制***入侵检测方法
CN105678332A (zh) 火焰图像cnn识别建模的转炉炼钢终点判断方法及***
CN109919241A (zh) 基于概率模型和深度学习的高光谱未知类别目标检测方法
CN112580749B (zh) 基于机器嗅觉技术的智能火灾探测方法
CN111914897A (zh) 一种基于孪生长短时间记忆网络的故障诊断方法
CN114926825A (zh) 一种基于时空特征融合的车辆驾驶行为检测方法
CN112714130A (zh) 一种基于大数据自适应网络安全态势感知方法
CN115811440B (zh) 一种基于网络态势感知的实时流量检测方法
CN116930042B (zh) 建筑防水材料性能检测设备及方法
CN113378935B (zh) 一种用于气体的嗅觉智能识别方法
CN112329974A (zh) 基于lstm-rnn的民航安保事件行为主体识别与预测方法及***
CN115563546A (zh) 一种气体嗅觉智能识别方法、***、介质、设备及终端
CN116633601A (zh) 一种基于网络流量态势感知的检测方法
CN111079348A (zh) 一种缓变信号检测方法和装置
CN117350364A (zh) 基于知识蒸馏的代码预训练模型对抗样本生成方法及***
CN115598164B (zh) 一种集成机器学习的土壤重金属浓度检测方法及***
CN109840386B (zh) 基于因子分析的损伤识别方法
CN116952586A (zh) 基于1d-dcnn的车轴疲劳裂纹识别方法
CN114970745B (zh) 物联网智能安防与环境大数据***
CN115795353A (zh) 一种基于不均衡数据集的地下金属目标分类方法及***
Chen et al. Nt-com: a combined machine learning model for picking up first arrival
CN114218991A (zh) 一种基于加权BP-AdaBoost的转子故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant