CN114518337A - 一种基于太赫兹光谱定性识别氨基酸混合物的方法 - Google Patents
一种基于太赫兹光谱定性识别氨基酸混合物的方法 Download PDFInfo
- Publication number
- CN114518337A CN114518337A CN202210106259.9A CN202210106259A CN114518337A CN 114518337 A CN114518337 A CN 114518337A CN 202210106259 A CN202210106259 A CN 202210106259A CN 114518337 A CN114518337 A CN 114518337A
- Authority
- CN
- China
- Prior art keywords
- amino acid
- terahertz
- sample
- convolution
- acid mixture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000001413 amino acids Chemical class 0.000 title claims abstract description 54
- 239000000203 mixture Substances 0.000 title claims abstract description 44
- 238000001228 spectrum Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000005070 sampling Methods 0.000 claims abstract description 24
- 239000000126 substance Substances 0.000 claims abstract description 22
- 238000010586 diagram Methods 0.000 claims abstract description 20
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000000862 absorption spectrum Methods 0.000 claims description 22
- 238000011176 pooling Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- 238000010521 absorption reaction Methods 0.000 claims description 10
- 230000003595 spectral effect Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000004611 spectroscopical analysis Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 9
- 238000001514 detection method Methods 0.000 abstract description 4
- 150000001875 compounds Chemical class 0.000 abstract description 3
- 238000005259 measurement Methods 0.000 abstract description 2
- 229940024606 amino acid Drugs 0.000 description 38
- 239000000523 sample Substances 0.000 description 35
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 20
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 15
- 229960003136 leucine Drugs 0.000 description 14
- 229960004441 tyrosine Drugs 0.000 description 13
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 11
- 235000019454 L-leucine Nutrition 0.000 description 7
- 239000004395 L-leucine Substances 0.000 description 7
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 6
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 6
- 229960004295 valine Drugs 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 239000004474 valine Substances 0.000 description 4
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 108091033411 PCA3 Proteins 0.000 description 2
- 239000004696 Poly ether ether ketone Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 229920002530 polyetherether ketone Polymers 0.000 description 2
- 239000003826 tablet Substances 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 239000007891 compressed tablet Substances 0.000 description 1
- 229920006351 engineering plastic Polymers 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3581—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation
- G01N21/3586—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation by Terahertz time domain spectroscopy [THz-TDS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Toxicology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于太赫兹光谱定性识别氨基酸混合物的方法,首先通过分量空间模式分析CSP分析得到每个采样点某种化合物出现的概率化学图,然后通过卷积神经网络识别CSP分析的结果来确定混合物中是否存在特定成分。所提出的方法将使我们能够在单次测量中定性地检测未知混合物中的成分,并将用于现实生活中的生物分子检测。
Description
技术领域:
本发明属于太赫兹光谱和成像技术领域,具体涉及一种基于太赫兹光谱定性识别氨基酸混合物的方法。
背景技术:
太赫兹波是一种波长介于红外线和微波之间的电磁波,由于处于光子学到电子学的过渡区域,其具有很多独特的属性,如指纹光谱性、低能性、特殊穿透性等。太赫兹波与性材料作用会产生独特的吸收谱-指纹谱。极性分子,如水分子,非极性分子,如二氧化碳分子,对太赫兹波的吸收有着非常明显的区别,因此太赫兹吸收谱对检验分子特性也有着重要价值。时域太赫兹光谱扫描技术利用高精度延时线将飞秒脉冲的采样时间延长至几十皮秒,并通过硬件预处理来降低噪声。由其产生的时域信号经傅里叶变换得到被检测物质的特征吸收谱,其谱宽可达5THz以上,动态范围可达70dB以上。这种频谱性能可满足绝大多数化合物的检测需求,从而为太赫兹时域光谱扫描提供了大量的应用场景。
鉴于太赫兹吸收光谱的指纹特性,对于物质识别分类具有重要应用。目前许多方法可以定性或定量地识别混合物的光谱,比如偏最小二乘法(PLS)、支持向量回归(SVR)等,然而,这些方法侧重于一维太赫兹光谱,往往受到振动峰的加宽和重叠性质的影响,并且仅在某些诱导和低湿度下才可行,因此在实际环境中使用起来很麻烦。因此,本发明基于分量空间模式分析和卷积神经网络提出一种从吸收光谱库中识别混合物质成分的方法
发明内容:
为了解决上述问题,本发明旨在提供一种从吸收光谱库中识别混合物质成分的方法,首先通过分量空间模式分析CSP分析得到每个采样点某种化合物出现的概率化学图,然后通过卷积神经网络识别CSP分析的结果来确定混合物中是否存在特定成分。所提出的方法将使我们能够在单次测量中定性地检测未知混合物中的成分,并将用于现实生活中的生物分子检测。
为了实现上述目的,本发明涉及的一种基于太赫兹光谱定性识别氨基酸混合物的方法,具备包括以下步骤:
步骤1:采用透射式太赫兹时域***对样品进行逐点扫描,得到氨基酸混合物样品采样点对应的太赫兹时域光谱数据;
步骤2:通过傅里叶变换将时域光谱数据转换成频谱数据,采用公式(1)-(2)计算吸收率,得到待测氨基酸混合样品采样点的吸收光谱图;
式中,n(ω)表示折射率,ω是角频率,φ(ω)表示在样品中传播引起的相位改变,c是真空中的光速,d是样品厚度,α(ω)表示吸收率,ρ(ω)表示样品和参考信号的幅值比;
步骤3:构建氨基酸混合物样品的太赫兹光谱数据矩阵FN×L,采用公式(4)计算得到矩阵PM×L,即氨基酸混合物样品的化学图;
[PM×L]=([SN×M]t[SN×M])-1[SN×M]t[FN×L], (4)
式中,L表示氨基酸混合物样品上的像素点,即采样点(事先将样品上的采样点的二维坐标转变为一维坐标,与L对应),N表示每一个像素点对应的N个太赫兹光谱数据频率分量,即FN×L为氨基酸混合物样品中L个采样点的太赫兹吸收光谱的N个频率分量组成的矩阵,SN×M表示已知的M种氨基酸的太赫兹光谱矩阵,每种氨基酸的太赫兹吸收光谱数据都有N个频率分量,即SN×M为已知的M种氨基酸的太赫兹吸收光谱的N个频率分量组成的矩阵,PM×L表示每个像素点出现某种氨基酸的概率,也被描述为化学图;
步骤4:采用公式(5)对PM×L中的每一个数据自适应阈值去除背景,高于该阈值像素值设置为1,否则为0,得到处理后的化学图;
C1=min(P)+C0[max(P)-min(P)] (5)
式中,C1表示阈值0;max(P)是矩阵PM×L中元素的最大值,min(P)是矩阵PM×L中元素的最小值;C0是[max(P)-min(P)]值范围的权重,设置为0.6;
步骤5:基于LeNet-5构建了一个卷积神经网络,对卷积神经网络进行训练;
步骤6:将按照步骤1到4得到的待测氨基酸混合物样品的化学图输入到训练好卷积神经网络中,输出样品中含有的氨基酸种类。
所述卷积神经网络包括依次相连的第一卷积-池化层、第二卷积-池化层、第一全连通层、第二全连通层和平面层,其中,6个卷积核组成第一卷积-池化层,16个卷积核组成的第二卷积-池化层,第一全连通层大小为120、第二全连通层的大小为大小为84,卷积滤波器的核大小为5,步进为1;两个全连通层将第二卷积-池化层的输出转换为平面层的线性输入,全连通层使用sigmoid激活函数进行二进分类,网络选择Adam训练策略,并使用二元交叉熵损失函数计算预测结果和数据标记之间的距离,训练的最大迭代次数为50,并在精度停止增长10个迭代期之后,提前终止训练。
本发明与现有技术相比具有以下有益效果:能够在室温和潮湿空气中从混合物中识别出不同成分的氨基酸,可达到100%的准确率。该方法克服了颗粒中高湿度和粒度分布不均等干旱条件的影响,具有在海关和机场等现实生活场景中定性检测生物分子的潜力。
附图说明:
图1为本发明采用的透射式太赫兹时域***的实验装置图。
图2a为氨基酸混合物样品中某一个采样点的太赫兹时域光谱图。
图2b为氨基酸混合物样品中某一个采样点的太赫兹频谱图。
图2c为L亮氨酸的吸收光谱图。
图2d为L酪氨酸的吸收光谱图。
图2e为L亮氨酸和L酪氨酸1:1混合物的吸收光谱图。
图3a为纯L亮氨酸的化学图。
图3b为纯L酪氨酸的化学图。
图3c为L亮氨酸、L酪氨酸和peek的1:1:1混合物的化学图。红点代表L酪氨酸,绿点代表L亮氨酸,黄点代表两者共存。
图4a为6种氨基酸1:1二元混合物压片照片,从左上到右下依次为L亮氨酸和L缬氨酸、L亮氨酸和DL酪氨酸、L缬氨酸和DL酪氨酸、L亮氨酸和L酪氨酸、DL酪氨酸和L酪氨酸、L酪氨酸和L缬氨酸。
图4b为对图4a中6个压片进行分量空间模式分析(CSP分析)后识别的L亮氨酸的化学图。含L亮氨酸的压片所在区域明显亮于其他区域。
图4c为对图4a中6个压片进行分量空间模式分析(CSP分析)后识别的L酪氨酸的化学图。含L酪氨酸的压片所在区域明显亮于其他区域。
图4d为DL-Tyrosine(DL酪氨酸),L-Leucine(L亮氨酸)、L-Valine(L缬氨酸)、L-Tyrosine(L酪氨酸)四种氨基酸的吸收光谱图。
图5a为本发明涉及的卷积神经网络框架图。
图5b为采用卷积神经网络进行训练的损失函数。
图5c为采用卷积神经网络对L亮氨酸进行测试的准确度。
图5d为采用卷积神经网络对L亮氨酸进行测试的精度。
图5e为召回率随训练过程变化的曲线。
图6a为L亮氨酸识别结果的分类混淆矩阵图。
图6b为L酪氨酸识别结果的分类混淆矩阵图。
具体实施方式:
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
如图1所示,本实施例采用的透射式太赫兹时域***包括飞秒激光器1、光延迟线2、发射器PCA 3和样品台4和接收器PCA 5。
透射式太赫兹时域***数据采集过程具体为:
飞秒激光器1发出激光束,输入激光束的中心波长为1560nm,脉冲宽度约为100fs,重复率约为100MHz,功率约为80mW。在通过线性偏振器6和半波片7后,输入光束被平均分成泵浦光束和探测光束,分别用于太赫兹的产生和检测。探测光束经光学延迟线2(采样范围为120ps)平移,使激光脉冲由接收到的太赫兹脉冲的幅度调制,然后转换为模拟电信号,由计算机***进行处理。来自发射器PCA3的太赫兹光束由两个TPX透镜准直和聚焦,并由另外两个TPX透镜准直和聚焦到接收器PCA5。透射式太赫兹时域***的横向分辨率为30μm。样品放置在样品台4上并通过夹子固定,样品台4由计算机***控制平移。THz波穿过样品,测量和收集样品的时域光谱数据。透射式太赫兹时域***扫描的步长在水平和垂直轴上均为0.5mm。实验在25℃的温度和40%左右的湿度下进行。
本实施例涉及的一种基于太赫兹光谱定性识别氨基酸混合物的方法,具备包括以下步骤:
步骤1:将按照不同比例将DL酪氨酸、L亮氨酸、L缬氨酸、L酪氨酸四种氨基酸中的任意两种与聚醚醚酮(peek)混合压片,得到六个氨基酸混合物样品,如图4a所示。聚醚醚酮(peek)是一种特种工程塑料,在太赫兹波段透明。
步骤2:采用透射式太赫兹时域***对氨基酸混合物样品进行逐点扫描,得到每个样品采样点对应的时域光谱数据(如图2a),通过傅里叶变换将时域光谱数据转换成频谱数据(如图2b),采用公式(1)-(2)计算吸收率,得到样品采样点的吸收光谱图,即一维吸收光谱(如图2c、2d和2e)。
式中,n(ω)表示折射率,ω是角频率,φ(ω)表示在氨基酸混合物样品中传播引起的相位改变,c是真空中的光速,d是氨基酸混合物样品厚度,α(ω)表示吸收率,ρ(ω)表示氨基酸混合物样品和参考信号的幅值比。
步骤3:构建氨基酸混合物样品的太赫兹光谱数据矩阵FN×L,采用公式(4)计算得到矩阵PM×L,即氨基酸混合物样品的化学图。
[PM×L]=([SN×M]t[SN×M])-1[SN×M]t[FN×L], (4)
式中,L表示氨基酸混合物样品上的像素点,即采样点(事先将样品上的采样点的二维坐标转变为一维坐标,与L对应),N表示每一个像素点对应的N个太赫兹光谱数据频率分量,即FN×L为氨基酸混合物样品中L个采样点的太赫兹吸收光谱的N个频率分量组成的矩阵,SN×M表示己知的M种氨基酸的太赫兹光谱矩阵,每种氨基酸的太赫兹吸收光谱数据都有N个频率分量,即SN×M为已知的M种氨基酸的太赫兹吸收光谱的N个频率分量组成的矩阵,PM×L表示每个像素点出现某种氨基酸的概率,也被描述为化学图。本实施例中,SN×M表示采用的四种氨基酸的太赫兹吸收光谱的N个频率分量组成的矩阵,FN×L为任一个样品中L个采样点(所有采样点)的太赫兹吸收光谱的N个频率分量组成的矩阵,设i对应L-酪氨酸,Pij表示在像素j处L-酪氨酸出现的概率。
步骤4:采用公式(5)对PM×L中的每一个数据自适应阈值去除背景,高于该阈值像素值设置为1,否则为0,得到处理后的化学图;
C1=min(P)+C0[max(P)-min(P)] (5)
式中,C1表示阈值0;max(P)是矩阵PM×L中元素的最大值,min(P)是矩阵PM×L中元素的最小值;C0是[max(P)-min(P)]值范围的权重,在本文中设置为0.6。
步骤5:基于LeNet-5构建了一个卷积神经网络,将对两组六个氨基酸混合物压片样品的25次扫描得到的50幅化学图分割成300张图像(2*6*25=300),将60%的图像用作训练数据,送入卷积神经网络进行训练,在经过四个迭代期后,网络实现收敛(如图5b所示),训练完成。
如图5a所示,所述卷积神经网络包括依次相连的第一卷积-池化层(Conv1)、第二卷积-池化层(Conv2)、第一全连通层(FC1)、第二全连通层(FC2)和平面层(FC3)。其中,6个卷积核组成第一卷积-池化层(Conv1),16个卷积核组成的第二卷积-池化层(Conv2),第一全连通层(FC1)大小为120、第二全连通层(FC2)的大小为大小为84。卷积滤波器的核大小为5,步进为1;两个全连通层将第二卷积-池化层(Conv2)的输出转换为平面层的线性输入,全连通层使用sigmoid激活函数进行二进分类。网络选择Adam训练策略,并使用二元交叉熵损失函数计算预测结果和数据标记之间的距离。训练的最大迭代次数为50,并在精度停止增长10个迭代期之后,提前终止训练。
步骤6:将剩下的40%的图像作为测试数据输入到训练好的卷积神经网络进行测试,输出样品中采样点对应的氨基酸种类,如图4b和4c所示,对混合物组分的识别准确率达到100%,识别精度也达到100%,如图5c和5d所示。图6a中31表示True Positve,0表示False Positve,0表示False Negative,27表示True Negative,因此有31个含有L亮氨酸的被正确识别出来,27个不含L亮氨酸的也被正确识别,识别结果的分类混淆矩阵图。同理,图6b中32表示True Positve,0表示False Positve,0表示False Negative,30表示TrueNegative,因此有31个含有L酪氨酸的被正确识别出来,30个不含L酪氨酸的也被正确识别,识别结果的分类混淆矩阵图。
Claims (2)
1.一种基于太赫兹光谱定性识别氨基酸混合物的方法,其特征在于,具备包括以下步骤:
步骤1:采用透射式太赫兹时域***对样品进行逐点扫描,得到氨基酸混合物样品采样点对应的太赫兹时域光谱数据;
步骤2:通过傅里叶变换将时域光谱数据转换成频谱数据,采用公式(1)-(2)计算吸收率,得到待测氨基酸混合样品采样点的吸收光谱图;
式中,n(ω)表示折射率,ω是角频率,φ(ω)表示在样品中传播引起的相位改变,c是真空中的光速,d是样品厚度,α(ω)表示吸收率,ρ(ω)表示样品和参考信号的幅值比;
步骤3:构建氨基酸混合物样品的太赫兹光谱数据矩阵FN×L,采用公式(4)计算得到矩阵PM×L,即氨基酸混合物样品的化学图;
[PM×L]=([SN×M]t[SN×M])-1[SN×M]t[FN×L], (4)
式中,L表示氨基酸混合物样品上的像素点,即采样点(事先将样品上的采样点的二维坐标转变为一维坐标,与L对应),N表示每一个像素点对应的N个太赫兹光谱数据频率分量,即FN×L为氨基酸混合物样品中L个采样点的太赫兹吸收光谱的N个频率分量组成的矩阵,SN×M表示已知的M种氨基酸的太赫兹光谱矩阵,每种氨基酸的太赫兹吸收光谱数据都有N个频率分量,即SN×M为已知的M种氨基酸的太赫兹吸收光谱的N个频率分量组成的矩阵,PM×L表示每个像素点出现某种氨基酸的概率,也被描述为化学图;
步骤4:采用公式(5)对PM×L中的每一个数据自适应阈值去除背景,高于该阈值像素值设置为1,否则为0,得到处理后的化学图;
C1=min(P)+C0[max(P)-min(P)] (5)
式中,C1表示阈值0;max(P)是矩阵PM×L中元素的最大值,min(P)是矩阵PM×L中元素的最小值;C0是[max(P)-min(P)]值范围的权重,设置为0.6;
步骤5:基于LeNet-5构建了一个卷积神经网络,对卷积神经网络进行训练;
步骤6:将按照步骤1到4得到的待测氨基酸混合物样品的化学图输入到训练好卷积神经网络中,输出样品采样点中含有的氨基酸种类。
2.根据权利要去1所述的基于太赫兹光谱定性识别氨基酸混合物的方法,其特征在于,所述卷积神经网络包括依次相连的第一卷积-池化层、第二卷积-池化层、第一全连通层、第二全连通层和平面层,其中,6个卷积核组成第一卷积-池化层,16个卷积核组成的第二卷积-池化层,第一全连通层大小为120、第二全连通层的大小为大小为84,卷积滤波器的核大小为5,步进为1;两个全连通层将第二卷积-池化层的输出转换为平面层的线性输入,全连通层使用sigmoid激活函数进行二进分类,网络选择Adam训练策略,并使用二元交叉熵损失函数计算预测结果和数据标记之间的距离,训练的最大迭代次数为50,并在精度停止增长10个迭代期之后,提前终止训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210106259.9A CN114518337A (zh) | 2022-01-28 | 2022-01-28 | 一种基于太赫兹光谱定性识别氨基酸混合物的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210106259.9A CN114518337A (zh) | 2022-01-28 | 2022-01-28 | 一种基于太赫兹光谱定性识别氨基酸混合物的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114518337A true CN114518337A (zh) | 2022-05-20 |
Family
ID=81596915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210106259.9A Pending CN114518337A (zh) | 2022-01-28 | 2022-01-28 | 一种基于太赫兹光谱定性识别氨基酸混合物的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114518337A (zh) |
-
2022
- 2022-01-28 CN CN202210106259.9A patent/CN114518337A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mittleman et al. | Gas sensing using terahertz time-domain spectroscopy. | |
CN101915744B (zh) | 物质成分含量的近红外光谱无损检测方法及装置 | |
CN101105446B (zh) | 差分吸收光谱空气质量检测*** | |
JPH10153547A (ja) | 媒体の解析処理方法 | |
Jiang et al. | Machine learning and application in terahertz technology: A review on achievements and future challenges | |
US9002113B2 (en) | Processing and analyzing hyper-spectral image data and information via dynamic database updating | |
Bird et al. | High definition infrared chemical imaging of colorectal tissue using a Spero QCL microscope | |
Reddy et al. | Accurate histopathology from low signal-to-noise ratio spectroscopic imaging data | |
CN110542668A (zh) | 一种基于太赫兹成像技术定量分析叶片成分分布情况的方法 | |
CN112862077B (zh) | 多模光纤结合深度学习网络替代传统光谱仪的***及方法 | |
CN112465077A (zh) | 水果糖度无损检测方法、装置、计算机设备和存储介质 | |
CN105486655A (zh) | 基于红外光谱智能鉴定模型的土壤有机质快速检测方法 | |
US20110052019A1 (en) | Analyzing Objects Via Hyper-Spectral Imaging and Analysis | |
CN110632002A (zh) | 一种基于压缩感知的孔径编码光谱探测装置 | |
CN211927689U (zh) | 一种光谱检测装置 | |
Zhou et al. | Research on hyperspectral regression method of soluble solids in green plum based on one-dimensional deep convolution network | |
WO2023231903A1 (zh) | 适用于检测农产品中微量元素的光谱仪及其应用 | |
CN114518337A (zh) | 一种基于太赫兹光谱定性识别氨基酸混合物的方法 | |
CN116399850A (zh) | 一种用于光信号处理的光谱探测识别***及其探测方法 | |
CN116883720A (zh) | 基于空谱注意力网络的果蔬农药残留检测方法及*** | |
AU2021102705A4 (en) | THz-TDS image defocus processing method based on deep learning | |
Brigada et al. | Chemical identification with information-weighted terahertz spectrometry | |
CN109238973A (zh) | 一种检测苹果可溶性固形物含量和含水量的方法 | |
CN211148422U (zh) | 一种基于压缩感知的孔径编码光谱探测装置 | |
CN210376134U (zh) | 基于太赫兹的室内环境污染物检测装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |