CN115097064A - 一种气体检测方法、装置、计算机设备及存储介质 - Google Patents

一种气体检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN115097064A
CN115097064A CN202111119011.8A CN202111119011A CN115097064A CN 115097064 A CN115097064 A CN 115097064A CN 202111119011 A CN202111119011 A CN 202111119011A CN 115097064 A CN115097064 A CN 115097064A
Authority
CN
China
Prior art keywords
attention
self
multitask
network
gas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111119011.8A
Other languages
English (en)
Other versions
CN115097064B (zh
Inventor
刘时亮
潘晓芳
张哲�
赵晓锦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN202111119011.8A priority Critical patent/CN115097064B/zh
Publication of CN115097064A publication Critical patent/CN115097064A/zh
Application granted granted Critical
Publication of CN115097064B publication Critical patent/CN115097064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/20Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Combustion & Propulsion (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例属于人工智能中的医疗技术领域,涉及一种基于多任务自注意力网络的气体检测方法、装置、计算机设备及存储介质,该方法包括:接收电子鼻***发送的待测气体的气体成分数据;将气体成分数据输入至多任务自注意力网络检测待测气体的生物标志物以及与生物标志物相对应的标志物浓度信息,多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;根据生物标志物以及标志物浓度信息确认与待测气体相对应的气体检测结果。本申请采用端到端的深度学习网络模型,输入原始数据就可以检测样本组成成分并且得到相对应的标志物浓度,可以有效避免人为因素带来的干扰并且减少手动特征提取带来的信息丢失的问题。

Description

一种气体检测方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能中的医疗技术领域,尤其涉及一种基于多任务自注意力网络的气体检测方法、装置、计算机设备及存储介质。
背景技术
肺癌是全世界最为常见的癌症,也是全球死亡率最高的癌症。而早期的癌症筛查是降低癌症死亡率的最有效途径之一。
现有一种癌症检测方法,即根据机器学习算法,处理传感器信号,最终输出癌症检测结果。
然而,申请人发现,传统基于机器学习算法的癌症检测方法通常处理传感器信号时都需要手动的提取特征,手动提取特征的过程中会带来人为干扰因素,而这个不确定的干扰因素会从不同方面影响算法提取特征,导致最终识别算法的结果存在人为导致的差异。其次,传统机器学习算法不能处理高维数据,需要经过数据降维后才能进行接下来的气体识别功能。数据降维的过程必然会带来传感器信号数据的丢失问题,信息的丢失也同样会影响算法最终的识别准确度。
发明内容
本申请实施例的目的在于提出一种基于多任务自注意力网络的气体检测方法、装置、计算机设备及存储介质,以解决传统基于机器学习算法的癌症检测方法会导致传感器信号数据的丢失,进而影响算法最终的识别准确度的问题。
为了解决上述技术问题,本申请实施例提供一种基于多任务自注意力网络的气体检测方法,采用了如下所述的技术方案:
接收电子鼻***发送的待测气体的气体成分数据;
将所述气体成分数据输入至多任务自注意力网络检测所述待测气体的生物标志物以及与所述生物标志物相对应的标志物浓度信息,所述多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;
根据所述生物标志物以及所述标志物浓度信息确认与所述待测气体相对应的气体检测结果。
进一步的,所述多任务自注意力模块包括:
多头自注意力层、归一化层、前馈网络层以及残差结构。
进一步的,所述多头自注意力层的多头自注意力表示为:
headi=Attention(Qi,Ki,Vi)
AttentionMHA=(concat(head1,head2,…,headh))Wo
其中,Wo表示可学习的线性变换参数;i=1,2,...,h表示头的数量。
进一步的,所述前馈网络层表示为:
FNN=max(0,XW1+b1)W2+b2
为了解决上述技术问题,本申请实施例还提供一种基于多任务自注意力网络的气体检测装置,采用了如下所述的技术方案:
数据接收单元,用于接收电子鼻***发送的待测气体的气体成分数据;
气体检测单元,用于将所述气体成分数据输入至多任务自注意力网络检测所述待测气体的生物标志物以及与所述生物标志物相对应的标志物浓度信息,所述多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;
结果确认单元,用于根据所述生物标志物以及所述标志物浓度信息确认与所述待测气体相对应的气体检测结果。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的基于多任务自注意力网络的气体检测方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的基于多任务自注意力网络的气体检测方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请提供了一种基于多任务自注意力网络的气体检测方法,包括:接收电子鼻***发送的待测气体的气体成分数据;将所述气体成分数据输入至多任务自注意力网络检测所述待测气体的生物标志物以及与所述生物标志物相对应的标志物浓度信息,所述多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;根据所述生物标志物以及所述标志物浓度信息确认与所述待测气体相对应的气体检测结果。本申请采用端到端的深度学习网络模型,输入原始数据就可以检测样本组成成分并且得到相对应的标志物浓度,可以有效避免人为因素带来的干扰并且减少手动特征提取带来的信息丢失的问题。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性***架构图;
图2是本申请实施例一提供的基于多任务自注意力网络的气体检测方法的实现流程图;
图3是本申请实施例一提供的多任务自注意力网络的结构示意图;
图4是本申请实施例一提供的多头自注意力的结构示意图;
图5是本申请实施例一提供的残差结构与层归一化的结构示意图;
图6是本申请实施例二提供的基于多任务自注意力网络的气体检测装置的结构示意图;
图7是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于多任务自注意力网络的气体检测方法一般由服务器/终端设备执行,相应地,基于多任务自注意力网络的气体检测装置一般设置于服务器/终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了本申请实施例一提供的基于多任务自注意力网络的气体检测方法的实现流程图,为了便于说明,仅示出与本申请相关的部分。
上述的基于多任务自注意力网络的气体检测方法,包括以下步骤:
步骤S201:接收电子鼻***发送的待测气体的气体成分数据;
步骤S202:将气体成分数据输入至多任务自注意力网络检测待测气体的生物标志物以及与生物标志物相对应的标志物浓度信息,多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;
步骤S203:根据生物标志物以及标志物浓度信息确认与待测气体相对应的气体检测结果。
在本申请实施例中,参阅图3示出的多任务自注意力网络的结构示意图,本申请提供的多任务自注意力网络包含编码器和解码器两个部分,其中,编码器由位置编码和两层堆叠的自注意力模块组成。自注意力模块包括:多头自注意力层,归一化层,前馈网络层和残差结构。首先,包含位置信息的传感器数据并行地流入多头自注意力层获得名为中间向量的输出,其中位置信息由位置编码层提供。另外,多头自注意力机制可以对输入数据进行不同的线性变换,有助于模型捕捉信号的多种特征。并且,本申请的多头自注意力结构因为没有用上任何递归结构,它具有显著的并行处理性能,所以仅需要更短的训练时间即可达到更好的效果。另外,并行处理时间序列数据的能力使得多头自注意力模型更适合部署到边缘设备上。中间向量经过归一化层后流入到前馈神经网络层收获得低维特征向量。前馈神经网络为模型提供非线性变换,提高模型表达能力,而层归一化可以加速模型收敛。残差结构连接多头自注意力模块与前馈神经网络,可以防止训练过程中发生梯度丢失问题,而层归一化可以加速模型收敛。将低维特征向量流入第二个堆叠的自注意力模块获得名为高维特征向量的编码层输出。在解码器部分,全连接层对编码层提取的信息解码。然后,通过激活函数层和气体组成成分与浓度匹配机制,得到气体分类和浓度预测结果。
在本申请实施例中,由于时间序列数据中的每个元素同时流经编码器堆栈,导致时间序列的位置信息丢失。因此,仍然需要一种方法将元素的顺序合并到我们的模型中。我们在自注意力模块前加上了一层称为位置编码层用来标记位置信息。假设原始输入数据为X=Rt×d,t为输入数据长度,d为数据维度,位置编码层产生的位置矩阵形状与输入数据相同,即P∈Rt×d,将原始输入数据与编码结果相加就可以得到含有位置信息的序列数据。位置矩阵可由下获得:
Figure BDA0003276396270000061
其中i是数据在序列中的索引,d是序列数据维度大小,k是数据的第k个维度。上述式子表示在位置矩阵P的每个序列位置向量的偶数维度添加sin变量,奇数维度添加cos变量。每个位置的信息是特定且唯一的,将该信息添加到原始数据中便产生了具有位置信息的序列信号。
在本申请实施例中,多头自注意力结构如图4所示,注意力机制是在众多的信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注,从而提高处理任务的效率。而自注意力机制是将序列内部不同位置联系起来以计算序列表示的注意力机制。注意力机制可以描述为一个函数,该函数将一个查询向量Q和一系列键-值对(K-V)映射为一个表示序列元素相关性的输出值,其中查询Q、键K、值V向量都是输入向量的线性变化。自注意力可以通过按比例缩放的点积注意力的方法实现。计算注意力时主要分为三步:
①首先用查询向量Q与每个键值对(K-V)中的键K计算相似度序列元素之间的相似度可以通过点积实现,相似度计算表达式如下所示:
similarly(Q,{Ki,vi}M)=[similarly(Q,K1),…,similarly(Q,KM)]
②然后使用softmax函数将M个权重归一化;
③最后将归一化后的权重与相对应的值V加权求和得到注意力。实现方式如下式子所示:
Figure BDA0003276396270000071
其中dk为查询向量的维度,当dk很大时,点积结果将变得非常离散,点积结果除以
Figure BDA0003276396270000072
起到调节作用,使得内积结果不至于太大。
多头自注意力是在参数总量保持不变的情况下,将Q、K和V拆分为多个不同部分,多头机制不是只计算一次注意力,而是并行在不同子空间运行缩放的点积注意力。将不同子空间的自注意力信息拼接起来,再进行一次线性变换得到的值作为多头自注意力的输出结果。由于自注意力在不同子空间有不同的分布,多头自注意力机制可以寻找序列之间不同角度的关联信息,这也有助于学习长距离信息的依赖关系。多头自注意力计算公式如下所示:
headi=Attention(Qi,Ki,Vi)
AttentionMHA=(concat(head1,head2,…,headh))Wo
其中,Wo表示可学习的线性变换参数;i=1,2,...,h表示头的数量。
在本申请实施例中,多头自注意力模块之后是前馈神经网络模块。由于多头自注意力模块只涉及线性变换,前馈神经层为模型提供了可以增加模型的表现力非线性变换。该层由两个全连接层构成,第一个全连接层的激活函数为Relu,第二个全连接层则不使用激活函数。其表达式如下:
FNN=max(0,XW1+b1)W2+b2
在本申请实施例中,在多头自注意力层与前馈神经网络层之间和前馈神经网络层之后有一个残差连接和层标准化。残差连接通常用于解决多层网络训练问题,有助于避免梯度消失或梯度***问题。层标准化是将数据归一化,这样可以加快模型收敛速度且减少网络的训练时间,它也能提高模型的稳定性。残差结构与层归一化如下公式表示:
LayerNorm(X+MultiherdAttention(X))
LayerNorm(X+FeedForward(X))
其中X表示Multi-Head Attention或Feed Forward的输入,MultiHeadAttention(X)和FeedForward(X)表示输出,LayerNorm表示层归一化,如图5所示。
在本申请实施例中,分类与回归网络由全连接层和激活层构成,其作用是将多头自注意力网络提取的特征映射到样本空间中。转录层有两层全连接层,第一层全连接层进行特征变换和信息归纳,其激活函数为Relu函数,为分类回归层提供非线性变化同时加快网络收敛速度,Relu函数表达式如下:
Figure BDA0003276396270000081
第二层全连接层为数据预测输出,共5个神经元,前两个神经元为气体浓度预测输出,其余神经元为气体种类预测输出。输出都经过Sigmoid激活函数使得最终的输出结果位于0~1的范围内。Sigmoid函数表示如下:
Figure BDA0003276396270000082
在本申请实施例中,模型共分为两个部分,一个是编码器部分,一个是解码器部分。而编码器部分的主要作用是特征提取,特征提取部分可以有多种选择。编码器可以选择卷积神经网络(CNN),循环神经网络(RNN)或长短期记忆网络(LSTM)。这些网络都有较好的特征提取能力。但相对于气体数据来说,本申请的多头自注意力网络会是更好的选择。CNN适用于处理图像信号,而不适用与时间序列信号。RNN容易提取时间信号的特征,但由于其递归的网络结构,容易发生梯度消失或者是梯度***现象。而LSTM网络提取特征的能力会随着序列信号的长度增加而减弱,因此不适用于长序列信号的特征提取。本申请的多头自注意力网络是并行提取信号的全局特征关系,特征提取能力不会随着序列长度的增加而减弱,并且本申请的结构还可以并行训练,可以有效的提高模型的训练速度合识别速度。
在本申请实施例中,本申请的自注意力模块采取两个自注意力模块串行堆叠的方式连接。也可以采取其他不同的连接方式。当样本数据集的序列长度增加,可以适当的增加模块的堆叠,可以有效提取信号的深层特征。
综上所述,本申请实施例一提供了一种基于多任务自注意力网络的气体检测方法,包括:接收电子鼻***发送的待测气体的气体成分数据;将气体成分数据输入至多任务自注意力网络检测待测气体的生物标志物以及与生物标志物相对应的标志物浓度信息,多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;根据生物标志物以及标志物浓度信息确认与待测气体相对应的气体检测结果。本申请采用端到端的深度学习网络模型,输入原始数据就可以检测样本组成成分并且得到相对应的标志物浓度,可以有效避免人为因素带来的干扰并且减少手动特征提取带来的信息丢失的问题。同时,本申请也同样可以应用于其他疾病的筛查方法。例如通过检测呼出气体中丙酮的浓度来筛查糖尿病患者,人体呼出的氨气可作为肾衰竭病人的生物标志性气体。同样可以利用电子鼻技术以及本申请的多任务自注意力网络算法检测这些标志性气体作为疾病筛查的辅助检测方法。作为一种新型的气体检测方法,本申请不仅仅可以在医学领域上发挥疾病筛查的功能,也可以在在矿场应用本申请。本申请可以快速并且准确的检测出矿场易燃易爆和有毒气体,可以有效降低发生***或者中毒事件。
本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例二
进一步参考图6,作为对上述图2所示方法的实现,本申请提供了一种基于多任务自注意力网络的气体检测装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的基于多任务自注意力网络的气体检测装置600包括:数据接收单元610、气体检测单元620以及结果确认单元630。其中:
数据接收单元610,用于接收电子鼻***发送的待测气体的气体成分数据;
气体检测单元620,用于将气体成分数据输入至多任务自注意力网络检测待测气体的生物标志物以及与生物标志物相对应的标志物浓度信息,多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;
结果确认单元630,用于根据生物标志物以及标志物浓度信息确认与待测气体相对应的气体检测结果。
在本申请实施例中,参阅图3示出的多任务自注意力网络的结构示意图,本申请提供的多任务自注意力网络包含编码器和解码器两个部分,其中,编码器由位置编码和两层堆叠的自注意力模块组成。自注意力模块包括:多头自注意力层,归一化层,前馈网络层和残差结构。首先,包含位置信息的传感器数据并行地流入多头自注意力层获得名为中间向量的输出,其中位置信息由位置编码层提供。另外,多头自注意力机制可以对输入数据进行不同的线性变换,有助于模型捕捉信号的多种特征。并且,本申请的多头自注意力结构因为没有用上任何递归结构,它具有显著的并行处理性能,所以仅需要更短的训练时间即可达到更好的效果。另外,并行处理时间序列数据的能力使得多头自注意力模型更适合部署到边缘设备上。中间向量经过归一化层后流入到前馈神经网络层收获得低维特征向量。前馈神经网络为模型提供非线性变换,提高模型表达能力,而层归一化可以加速模型收敛。残差结构连接多头自注意力模块与前馈神经网络,可以防止训练过程中发生梯度丢失问题,而层归一化可以加速模型收敛。将低维特征向量流入第二个堆叠的自注意力模块获得名为高维特征向量的编码层输出。在解码器部分,全连接层对编码层提取的信息解码。然后,通过激活函数层和气体组成成分与浓度匹配机制,得到气体分类和浓度预测结果。
在本申请实施例中,由于时间序列数据中的每个元素同时流经编码器堆栈,导致时间序列的位置信息丢失。因此,仍然需要一种方法将元素的顺序合并到我们的模型中。我们在自注意力模块前加上了一层称为位置编码层用来标记位置信息。假设原始输入数据为X=Rt×d,t为输入数据长度,d为数据维度,位置编码层产生的位置矩阵形状与输入数据相同,即P∈Rt×d,将原始输入数据与编码结果相加就可以得到含有位置信息的序列数据。位置矩阵可由下获得:
Figure BDA0003276396270000121
其中i是数据在序列中的索引,d是序列数据维度大小,k是数据的第k个维度。上述式子表示在位置矩阵P的每个序列位置向量的偶数维度添加sin变量,奇数维度添加cos变量。每个位置的信息是特定且唯一的,将该信息添加到原始数据中便产生了具有位置信息的序列信号。
在本申请实施例中,多头自注意力结构如图4所示,注意力机制是在众多的信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注,从而提高处理任务的效率。而自注意力机制是将序列内部不同位置联系起来以计算序列表示的注意力机制。注意力机制可以描述为一个函数,该函数将一个查询向量Q和一系列键-值对(K-V)映射为一个表示序列元素相关性的输出值,其中查询Q、键K、值V向量都是输入向量的线性变化。自注意力可以通过按比例缩放的点积注意力的方法实现。计算注意力时主要分为三步:
①首先用查询向量Q与每个键值对(K-V)中的键K计算相似度序列元素之间的相似度可以通过点积实现,相似度计算表达式如下所示:
similarly(Q,{Ki,vi}M)=[similarly(Q,K1),…,similarly(Q,KM)]
②然后使用softmax函数将M个权重归一化;
③最后将归一化后的权重与相对应的值V加权求和得到注意力。实现方式如下式子所示:
Figure BDA0003276396270000131
其中dk为查询向量的维度,当dk很大时,点积结果将变得非常离散,点积结果除以
Figure BDA0003276396270000132
起到调节作用,使得内积结果不至于太大。
多头自注意力是在参数总量保持不变的情况下,将Q、K和V拆分为多个不同部分,多头机制不是只计算一次注意力,而是并行在不同子空间运行缩放的点积注意力。将不同子空间的自注意力信息拼接起来,再进行一次线性变换得到的值作为多头自注意力的输出结果。由于自注意力在不同子空间有不同的分布,多头自注意力机制可以寻找序列之间不同角度的关联信息,这也有助于学习长距离信息的依赖关系。多头自注意力计算公式如下所示:
headi=Attention(Qi,Ki,Vi)
AttentionMHA=(concat(head1,head2,…,headh))Wo
其中,Wo表示可学习的线性变换参数;i=1,2,...,h表示头的数量。
在本申请实施例中,多头自注意力模块之后是前馈神经网络模块。由于多头自注意力模块只涉及线性变换,前馈神经层为模型提供了可以增加模型的表现力非线性变换。该层由两个全连接层构成,第一个全连接层的激活函数为Relu,第二个全连接层则不使用激活函数。其表达式如下:
FNN=max(0,XW1+b1)W2+b2
在本申请实施例中,在多头自注意力层与前馈神经网络层之间和前馈神经网络层之后有一个残差连接和层标准化。残差连接通常用于解决多层网络训练问题,有助于避免梯度消失或梯度***问题。层标准化是将数据归一化,这样可以加快模型收敛速度且减少网络的训练时间,它也能提高模型的稳定性。残差结构与层归一化如下公式表示:
LayerNorm(X+MultiherdAttention(X))
LayerNorm(X+FeedForward(X))
其中X表示Multi-Head Attention或Feed Forward的输入,MultiHeadAttention(X)和FeedForward(X)表示输出,LayerNorm表示层归一化,如图5所示。
在本申请实施例中,分类与回归网络由全连接层和激活层构成,其作用是将多头自注意力网络提取的特征映射到样本空间中。转录层有两层全连接层,第一层全连接层进行特征变换和信息归纳,其激活函数为Relu函数,为分类回归层提供非线性变化同时加快网络收敛速度,Relu函数表达式如下:
Figure BDA0003276396270000141
第二层全连接层为数据预测输出,共5个神经元,前两个神经元为气体浓度预测输出,其余神经元为气体种类预测输出。输出都经过Sigmoid激活函数使得最终的输出结果位于0~1的范围内。Sigmoid函数表示如下:
Figure BDA0003276396270000142
在本申请实施例中,模型共分为两个部分,一个是编码器部分,一个是解码器部分。而编码器部分的主要作用是特征提取,特征提取部分可以有多种选择。编码器可以选择卷积神经网络(CNN),循环神经网络(RNN)或长短期记忆网络(LSTM)。这些网络都有较好的特征提取能力。但相对于气体数据来说,本申请的多头自注意力网络会是更好的选择。CNN适用于处理图像信号,而不适用与时间序列信号。RNN容易提取时间信号的特征,但由于其递归的网络结构,容易发生梯度消失或者是梯度***现象。而LSTM网络提取特征的能力会随着序列信号的长度增加而减弱,因此不适用于长序列信号的特征提取。本申请的多头自注意力网络是并行提取信号的全局特征关系,特征提取能力不会随着序列长度的增加而减弱,并且本申请的结构还可以并行训练,可以有效的提高模型的训练速度合识别速度。
在本申请实施例中,本申请的自注意力模块采取两个自注意力模块串行堆叠的方式连接。也可以采取其他不同的连接方式。当样本数据集的序列长度增加,可以适当的增加模块的堆叠,可以有效提取信号的深层特征。
综上所述,本申请实施例二提供了一种基于多任务自注意力网络的气体检测装置600,包括:数据接收单元610,用于接收电子鼻***发送的待测气体的气体成分数据;气体检测单元620,用于将气体成分数据输入至多任务自注意力网络检测待测气体的生物标志物以及与生物标志物相对应的标志物浓度信息,多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;结果确认单元630,用于根据生物标志物以及标志物浓度信息确认与待测气体相对应的气体检测结果。本申请采用端到端的深度学习网络模型,输入原始数据就可以检测样本组成成分并且得到相对应的标志物浓度,可以有效避免人为因素带来的干扰并且减少手动特征提取带来的信息丢失的问题。同时,本申请也同样可以应用于其他疾病的筛查方法。例如通过检测呼出气体中丙酮的浓度来筛查糖尿病患者,人体呼出的氨气可作为肾衰竭病人的生物标志性气体。同样可以利用电子鼻技术以及本申请的多任务自注意力网络算法检测这些标志性气体作为疾病筛查的辅助检测方法。作为一种新型的气体检测方法,本申请不仅仅可以在医学领域上发挥疾病筛查的功能,也可以在在矿场应用本申请。本申请可以快速并且准确的检测出矿场易燃易爆和有毒气体,可以有效降低发生***或者中毒事件。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
所述计算机设备200包括通过***总线相互通信连接存储器210、处理器220、网络接口230。需要指出的是,图中仅示出了具有组件210-230的计算机设备200,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器210至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器210可以是所述计算机设备200的内部存储单元,例如该计算机设备200的硬盘或内存。在另一些实施例中,所述存储器210也可以是所述计算机设备200的外部存储设备,例如该计算机设备200上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器210还可以既包括所述计算机设备200的内部存储单元也包括其外部存储设备。本实施例中,所述存储器210通常用于存储安装于所述计算机设备200的操作***和各类应用软件,例如基于多任务自注意力网络的气体检测方法的计算机可读指令等。此外,所述存储器210还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器220在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器220通常用于控制所述计算机设备200的总体操作。本实施例中,所述处理器220用于运行所述存储器210中存储的计算机可读指令或者处理数据,例如运行所述基于多任务自注意力网络的气体检测方法的计算机可读指令。
所述网络接口230可包括无线网络接口或有线网络接口,该网络接口230通常用于在所述计算机设备200与其他电子设备之间建立通信连接。
本申请提供的计算机设备,采用端到端的深度学习网络模型,输入原始数据就可以检测样本组成成分并且得到相对应的标志物浓度,可以有效避免人为因素带来的干扰并且减少手动特征提取带来的信息丢失的问题。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于多任务自注意力网络的气体检测方法的步骤。
本申请提供的计算机可读存储介质,采用端到端的深度学习网络模型,输入原始数据就可以检测样本组成成分并且得到相对应的标志物浓度,可以有效避免人为因素带来的干扰并且减少手动特征提取带来的信息丢失的问题。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种基于多任务自注意力网络的气体检测方法,其特征在于,包括下述步骤:
接收电子鼻***发送的待测气体的气体成分数据;
将所述气体成分数据输入至多任务自注意力网络检测所述待测气体的生物标志物以及与所述生物标志物相对应的标志物浓度信息,所述多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;
根据所述生物标志物以及所述标志物浓度信息确认与所述待测气体相对应的气体检测结果。
2.根据权利要求1所述的基于多任务自注意力网络的气体检测方法,其特征在于,所述多任务自注意力模块包括:
多头自注意力层、归一化层、前馈网络层以及残差结构。
3.根据权利要求2所述的基于多任务自注意力网络的气体检测方法,其特征在于,所述多头自注意力层的多头自注意力表示为:
headi=Attention(Qi,Ki,Vi)
AttentionMHA=(concat(head1,head2,…,headh))Wo
其中,Wo表示可学习的线性变换参数;i=1,2,...,h表示头的数量。
4.根据权利要求2所述的基于多任务自注意力网络的气体检测方法,其特征在于,所述前馈网络层表示为:
FNN=max(0,XW1+b1)W2+b2
5.一种基于多任务自注意力网络的气体检测装置,其特征在于,包括:
数据接收单元,用于接收电子鼻***发送的待测气体的气体成分数据;
气体检测单元,用于将所述气体成分数据输入至多任务自注意力网络检测所述待测气体的生物标志物以及与所述生物标志物相对应的标志物浓度信息,所述多任务自注意力网络包括由位置编码模块和多任务自注意力模块组成的编码器和解码器;
结果确认单元,用于根据所述生物标志物以及所述标志物浓度信息确认与所述待测气体相对应的气体检测结果。
6.根据权利要求5所述的基于多任务自注意力网络的气体检测装置,其特征在于,所述所述多任务自注意力模块包括:
多头自注意力层、归一化层、前馈网络层以及残差结构。
7.根据权利要求6所述的基于多任务自注意力网络的气体检测方法,其特征在于,所述多头自注意力层的多头自注意力表示为:
headi=Attention(Qi,Ki,Vi)
AttentionMHA=(concat(head1,head2,…,headh))Wo
其中,Wo表示可学习的线性变换参数;i=1,2,...,h表示头的数量。
8.根据权利要求6所述的基于多任务自注意力网络的气体检测方法,其特征在于,所述前馈网络层表示为:
FNN=max(0,XW1+b1)W2+b2
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至4中任一项所述的基于多任务自注意力网络的气体检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至4中任一项所述的基于多任务自注意力网络的气体检测方法的步骤。
CN202111119011.8A 2021-09-24 2021-09-24 一种气体检测方法、装置、计算机设备及存储介质 Active CN115097064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111119011.8A CN115097064B (zh) 2021-09-24 2021-09-24 一种气体检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111119011.8A CN115097064B (zh) 2021-09-24 2021-09-24 一种气体检测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN115097064A true CN115097064A (zh) 2022-09-23
CN115097064B CN115097064B (zh) 2023-06-20

Family

ID=83287627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111119011.8A Active CN115097064B (zh) 2021-09-24 2021-09-24 一种气体检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN115097064B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116189800A (zh) * 2023-02-23 2023-05-30 深圳大学 基于气体检测的模式识别方法、装置、设备及存储介质
CN116502158A (zh) * 2023-02-07 2023-07-28 北京纳通医用机器人科技有限公司 肺癌分期识别方法、装置、设备及存储介质
CN117091799A (zh) * 2023-10-17 2023-11-21 湖南一特医疗股份有限公司 医用中心氧气供应安全智能立体监测方法及***

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103018282A (zh) * 2012-12-21 2013-04-03 上海交通大学 用于肺癌早期检测的电子鼻***
US20140096590A1 (en) * 2012-05-07 2014-04-10 Alexander Himanshu Amin Electronic nose system and method
CN104751004A (zh) * 2015-04-15 2015-07-01 苏州大学 一种疾病预警方法、装置及***
US20160106935A1 (en) * 2014-10-17 2016-04-21 Qualcomm Incorporated Breathprint sensor systems, smart inhalers and methods for personal identification
CN105738434A (zh) * 2016-02-01 2016-07-06 清华大学深圳研究生院 一种基于电子鼻检测呼吸气体的糖尿病诊断***
CN107463766A (zh) * 2017-06-23 2017-12-12 深圳市中识创新科技有限公司 血糖预测模型的生成方法、装置及计算机可读存储介质
CN108693353A (zh) * 2018-05-08 2018-10-23 重庆大学 一种基于电子鼻检测呼吸气体的远程糖尿病智能诊断***
CN110146642A (zh) * 2019-05-14 2019-08-20 上海大学 一种气味分析方法及装置
CN111540463A (zh) * 2019-12-18 2020-08-14 中国科学院上海微***与信息技术研究所 一种基于机器学习的呼出气体检测方法和***

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140096590A1 (en) * 2012-05-07 2014-04-10 Alexander Himanshu Amin Electronic nose system and method
CN103018282A (zh) * 2012-12-21 2013-04-03 上海交通大学 用于肺癌早期检测的电子鼻***
US20160106935A1 (en) * 2014-10-17 2016-04-21 Qualcomm Incorporated Breathprint sensor systems, smart inhalers and methods for personal identification
CN104751004A (zh) * 2015-04-15 2015-07-01 苏州大学 一种疾病预警方法、装置及***
CN105738434A (zh) * 2016-02-01 2016-07-06 清华大学深圳研究生院 一种基于电子鼻检测呼吸气体的糖尿病诊断***
CN107463766A (zh) * 2017-06-23 2017-12-12 深圳市中识创新科技有限公司 血糖预测模型的生成方法、装置及计算机可读存储介质
CN108693353A (zh) * 2018-05-08 2018-10-23 重庆大学 一种基于电子鼻检测呼吸气体的远程糖尿病智能诊断***
CN110146642A (zh) * 2019-05-14 2019-08-20 上海大学 一种气味分析方法及装置
CN111540463A (zh) * 2019-12-18 2020-08-14 中国科学院上海微***与信息技术研究所 一种基于机器学习的呼出气体检测方法和***

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116502158A (zh) * 2023-02-07 2023-07-28 北京纳通医用机器人科技有限公司 肺癌分期识别方法、装置、设备及存储介质
CN116502158B (zh) * 2023-02-07 2023-10-27 北京纳通医用机器人科技有限公司 肺癌分期识别方法、装置、设备及存储介质
CN116189800A (zh) * 2023-02-23 2023-05-30 深圳大学 基于气体检测的模式识别方法、装置、设备及存储介质
CN116189800B (zh) * 2023-02-23 2023-08-18 深圳大学 基于气体检测的模式识别方法、装置、设备及存储介质
CN117091799A (zh) * 2023-10-17 2023-11-21 湖南一特医疗股份有限公司 医用中心氧气供应安全智能立体监测方法及***
CN117091799B (zh) * 2023-10-17 2024-01-02 湖南一特医疗股份有限公司 医用中心氧气供应安全智能立体监测方法及***

Also Published As

Publication number Publication date
CN115097064B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
CN115097064B (zh) 一种气体检测方法、装置、计算机设备及存储介质
Wu et al. Vulnerability detection with deep learning
WO2020232861A1 (zh) 命名实体识别方法、电子装置及存储介质
CN111428044A (zh) 多模态获取监管识别结果的方法、装置、设备及存储介质
CN111241304A (zh) 基于深度学习的答案生成方法、电子装置及可读存储介质
CN109743311A (zh) 一种WebShell检测方法、装置及存储介质
CN112084779B (zh) 用于语义识别的实体获取方法、装置、设备及存储介质
CN112560504B (zh) 抽取表单文档中信息的方法、电子设备和计算机可读介质
CN111783471A (zh) 自然语言的语义识别方法、装置、设备及存储介质
CN112836521A (zh) 问答匹配方法、装置、计算机设备及存储介质
CN108229680B (zh) 神经网络***、遥感图像识别方法、装置、设备及介质
CN113901836A (zh) 基于上下文语义的词义消歧方法、装置及相关设备
CN117807482B (zh) 海关报关单的分类方法、装置、设备及存储介质
CN113569998A (zh) 票据自动识别方法、装置、计算机设备及存储介质
CN110222144B (zh) 文本内容提取方法、装置、电子设备及存储介质
CN115438149A (zh) 一种端到端模型训练方法、装置、计算机设备及存储介质
CN114398466A (zh) 基于语义识别的投诉分析方法、装置、计算机设备及介质
CN113807089A (zh) 文本数据的处理方法、神经网络的训练方法以及相关设备
CN112232052A (zh) 文本拼接方法、装置、计算机设备及存储介质
CN115730237A (zh) 垃圾邮件检测方法、装置、计算机设备及存储介质
CN112364649B (zh) 命名实体的识别方法、装置、计算机设备及存储介质
CN114781358A (zh) 基于强化学习的文本纠错方法、装置、设备及存储介质
CN115309862A (zh) 基于图卷积网络和对比学习的因果关系识别方法及装置
CN112733645A (zh) 手写签名校验方法、装置、计算机设备及存储介质
CN113657104A (zh) 文本抽取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant