CN110320173A - 基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法 - Google Patents

基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法 Download PDF

Info

Publication number
CN110320173A
CN110320173A CN201910513187.8A CN201910513187A CN110320173A CN 110320173 A CN110320173 A CN 110320173A CN 201910513187 A CN201910513187 A CN 201910513187A CN 110320173 A CN110320173 A CN 110320173A
Authority
CN
China
Prior art keywords
sample
model
vehicle
tinctorial pattern
pattern product
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910513187.8A
Other languages
English (en)
Inventor
龚自明
王胜鹏
高士伟
叶飞
桂安辉
郑鹏程
滕靖
王雪萍
郑琳
刘盼盼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Fruit and Tea of Hubei Academy of Agricultural Sciences
Original Assignee
Institute of Fruit and Tea of Hubei Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Fruit and Tea of Hubei Academy of Agricultural Sciences filed Critical Institute of Fruit and Tea of Hubei Academy of Agricultural Sciences
Priority to CN201910513187.8A priority Critical patent/CN110320173A/zh
Publication of CN110320173A publication Critical patent/CN110320173A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N2021/3595Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,包括:样品收集与分类;扫描获得不同等级眉茶车色样品的近红外光谱;对样品光谱进行预处理剔除噪声信息后,将样品光谱转化为成对的数据点;再将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的粒子群优化算法模型,筛选出建模的最佳子区间数据;应用主成分分析法抽提、压缩最佳光谱子区间信息;以主成分得分为输入值,不断调整神经元个数和传递函数,建立unsupervised Kohonen结构人工神经网络预测模型;模型稳健性检验。实现了湖北眉茶车色样品等级快速、准确、客观预测,起到提高预测湖北眉茶车色样品等级准确度和增强模型实用性的目的。

Description

基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判 定方法
技术领域
本发明涉及一种判定眉茶车色样品等级的方法,更具体的说涉及一种基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法。
背景技术
眉茶,属绿茶类珍品之一;湖北眉茶是我国一种主要的出口茶产品,深受国外广大客户的喜爱,其品质有贸易标准样可供参考。通常眉茶的精制工序如下:①初制绿毛茶②复滚③分筛④毛抖⑤机检⑥精扇⑦电捡⑧车色⑨紧门⑩匀堆,其中车色是眉茶精制中的关键工序,车色关系到条索紧结挺直、色泽绿润起霜,从而形成了眉茶特有的品质。
随着经济的不断发展,劳动力短缺日益突出,因而通常采用机器采摘茶鲜叶。机采鲜叶加工为眉茶后还需进行精制,眉茶经精制后,还需将车色后的不同等级眉茶进行拼配,以调剂产品品质、保证产品质量稳定。目前在眉茶车色后的产品等级判定方面,通常依赖于茶叶加工人员的自身工作经验和感官器官进行判定;因此存在着较大的主观性和不确定性、极易出现差错,不利于后期眉茶拼配产品的品质保持稳定;因而不利于湖北眉茶的出口,易给茶叶加工厂和经销商带来较大的经济损失,而这也不利于湖北当地茶农早日摆脱贫困。因此,亟需建立一种快速、准确、无损地判定机采鲜叶眉茶车色样品等级的方法。
发明内容
本发明的目的在于针对目前精制眉茶茶叶加工人员通常依靠自身工作经验和感官器官判定机采鲜叶眉茶车色样品等级存在的主观性强、易出错等缺陷,提供基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法。
为实现上述目的,本发明的技术解决方案是:基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,扫描获得不同等级眉茶车色样品的近红外光谱,然后对样品光谱进行预处理剔除噪声信息后,将样品光谱转化为成对的数据点于excel表中保存;然后将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的粒子群优化算法模型,筛选出建模的最佳子区间数据;再应用主成分分析法对子区间数据点信息进行压缩抽提,以主成分得分为输入数值,通过调节隐含层神经元个数和信息传递函数,建立不同等级眉茶车色样品的人工神经网络预测模型,用于预测眉茶车色样品等级,具体包括以下步骤:
步骤一、样品收集与分类
收集湖北省3个不同等级机采鲜叶眉茶车色样品,依据样品等级不同将样品分为校正集和验证集2个集合,分别用于建立校正集近红外光谱预测模型和对校正集预测模型稳健性进行检验;
步骤二、光谱扫描
应用近红外光谱仪扫描获得全部3个等级车色样品的近红外光谱,光谱扫描范围4000-10000cm-1、分辨率8cm-1、检测器为InGaAs,每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该车色样品的最终光谱用于后续建立模型;
步骤三、光谱噪声信息预处理
应用多款化学计量学软件对步骤二中扫描得到的不同等级车色样品的近红外光谱采用矢量归一化方法进行去噪声预处理,提高光谱的信噪比,有利于建立稳健的预测模型;光谱去噪声后,再将样品光谱转化为成对的数据点;
步骤四、光谱子区间划分
将全部光谱信息数据均等分为20个光谱信息子区间,精准筛选反映车色样品等级的光谱信息子区间,用于后续建立粒子群优化算法模型;
步骤五、粒子群优化算法模型建立
应用粒子群优化(PSO,particle swarm optimization)方法分别建立每个光谱信息子区间的光谱数据预测模型,比较模型相关系数(correlation coefficient ofcalibration,Rc)和交互验证均方根方差(root mean square error of calibration,RMSECV)大小,初步筛选出建模的最佳光谱信息子区间数据,达到精准筛选眉茶车色样品等级的光谱信息的目的,其中,Rc最大、RMSECV最小,表示建立的粒子群优化算法模型结果最佳,
其中,RMSECV计算公式为:
Rc计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n;
步骤六、unsupervised Kohonen结构人工神经网络预测模型建立
应用非线性的人工神经网络方法进一步精准预测眉茶车色样品的等级,包括:
1)最佳光谱信息子区间主成分分析
采用主成分分析方法(PCA)对筛选的最佳光谱子区间数据进行主成分分析,得到每个主成分的单独贡献率值、累计贡献率值和主成分得分;在主成分累计贡献率≥85%才可以有效代表样品建模光谱子区间信息;
2)人工神经网络预测模型建立
以最佳光谱信息子区间的主成分得分为输入值、以眉茶不同车色样品等级为输出值,应用Neuro Shell 2软件建立unsupervised Kohonen结构的人工神经网络预测模型,unsupervised Kohonen结构人工神经网络结构含有1个隐含层、3、4、5个神经元数和logistic、linear[0,1]和tanh三种信息传递函数,比较模型相关系数(correlationcoefficient of calibration,Rc)和交互验证均方根方差(root mean square error ofcalibration,RMSECV)大小,得到最佳近红外光谱预测模型,其中,Rc越大、RMSECV越小,表示模型预测效果越好;
其中RMSECV计算公式为:
Rc计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n;
其中以相关系数Rc最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型;
步骤七、模型稳健性检验
应用全部验证集样品对不同等级眉茶车色样品的人工神经网络预测模型效果进行检验,所得结果用相关系数(correlation coefficient of prediction,Rp)和验证均方差(root mean square error of prediction,RMSEP)表示,其中Rp越大、RMSEP越小则表示模型稳健性越好,可以准确的预测眉茶车色样品的等级;
其中RMSEP计算公式为:
Rp计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,式中i≤n。
所述的步骤一中眉茶车色鲜叶样品数量为120份,鲜叶样品按照3:1的比例划分为校正集和验证集,其中校正集样品90个、验证集样品30个。
所述步骤一中眉茶车色鲜叶样品的3个等级为7-8目等级样品、9-10目等级样品和11-16目等级样品,其中7-8目等级样品化学值设定为1.000、9-10目等级样品化学值设定为2.000、11-16目等级样品化学值设定为3.000。
所述步骤五中筛选出建模的最佳光谱信息子区间数据为6707.2-7004.2cm-1
所述步骤六中在采用主成分分析方法(PCA)对筛选的最佳光谱信息子区间数据进行主成分分析时,采用前3个主成分代表最佳光谱子区间的光谱信息。
所述步骤六中选择4个神经元和logistic信息传递函数建立不同等级眉茶车色样品的unsupervised Kohonen结构人工神经网络模型。
与现有技术相比,本发明的有益效果:
1、本发明先剔除不同等级眉茶车色样品噪声信息,将样品光谱转化为成对的数据点保存,然后将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的粒子群优化算法模型,筛选出建模的最佳子区间数据;应用主成分分析方法对最佳子区间数据点进行主成分分析,对光谱信息进行压缩和抽提,有利于降低模型的运算量,增加模型的稳健性;再以主成分得分为输入值建立不同等级眉茶车色样品的人工神经网络预测模型,实现了湖北眉茶车色样品等级的快速、准确、客观预测,起到提高预测湖北眉茶车色样品等级准确度和增强模型实用性的目的。
2、本发明应用粒子群优化算法模型精准筛选反映湖北眉茶车色样品等级的光谱信息,通过不断实践比较预测效果得到了最佳光谱信息的主成分得分,以此为输入数据,通过不断反复优化unsupervised Kohonen结构人工神经网络方法内部的神经元个数和传递函数,达到了精准预测湖北眉茶车色样品等级的目的;大大降低了模型运算量、简化了模型结构,同时提高了模型的预测准确度和增强模型的实用性。
附图说明
图1是本发明中全部120个鲜叶样品不同等级车色近红外光谱图。
图2是本发明中unsupervised Kohonen神经网络模型结构。
具体实施方式
以下结合附图说明和具体实施方式对本发明作进一步的详细描述。
参见图1至图2,基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,扫描获得不同等级眉茶车色样品的近红外光谱,然后对样品光谱进行预处理剔除噪声信息后,再将样品光谱转化为成对的数据点于excel表中保存;然后将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的粒子群优化算法模型,筛选出建模的最佳子区间数据;再应用主成分分析法对最佳子区间数据点信息进行压缩抽提,以主成分得分为输入数值,通过调节隐含层神经元个数和信息传递函数,建立不同等级眉茶车色样品的人工神经网络预测模型,用于预测眉茶车色样品等级。具体包括以下步骤:
步骤一、样品收集与分类
收集湖北省3个不同等级机采鲜叶眉茶车色样品,依据样品等级不同将样品分为校正集和验证集2个集合,分别用于建立校正集近红外光谱预测模型和对校正集预测模型稳健性进行检验。
步骤二、光谱扫描
应用美国赛默飞.世尔AntarisⅡ型傅里叶变换近红外光谱仪获得全部3个等级车色样品的近红外光谱,光谱扫描范围4000-10000cm-1、分辨率8cm-1、检测器为InGaAs,每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该车色样品的最终光谱用于后续建立模型。
步骤三、光谱噪声信息预处理
由于在光谱扫描过程中存在着高频噪声和基线扰动存在的背景信息,如果不对光谱噪声进行预处理、直接用于建立预测模型会造成模型的预测效果较差,而且模型还不稳定,因此在建模前需对原光谱信息进行去噪声处理。本步骤中应用多款化学计量学软件对步骤二中扫描得到的不同等级车色样品的近红外光谱采用平滑、一阶导数,二阶导数、多元散射校正和矢量归一化方法进行去噪声预处理,提高光谱的信噪比,从而有利于建立稳健的预测模型;其中的矢量归一化预处理方法可以扣除样品光谱中的线性平移的影响,对每条光谱进行单独校正,具有较强的信息处理能力,为最佳光谱预处理方法。
光谱去噪声后,再将样品光谱转化为成对的数据点(X-Y一一对应),存储于excel表中。
步骤四、光谱子区间划分
近红外光谱包含了样品所有的信息,如产地、采摘时间、样品等级和内含成分信息等,因此,为了提高模型的预测效果,需要筛选反映眉茶车色样品等级的光谱信息波段,去除与建模无用的光谱信息;不仅可以提高模型预测准确度,还可以大大降低模型的运算量,减少建模的运算时间,降低建模成本。因此,本发明将全部光谱信息数据均等分为20个光谱信息子区间,精准筛选反映眉茶车色样品等级的光谱信息子区间,用于后续建立粒子群优化算法模型。
步骤五、粒子群优化算法模型建立
粒子群优化(PSO,particle swarm optimization)算法是计算智能领域的一种群体智能的优化算法,PSO算法首先在可行解空间中初始化一群粒子,每个粒子都代表极值优化问题的一个潜在最优解,用位置、速度和适应度值三项指标表示该粒子特征;粒子在解空间中运动,通过跟踪个体极值Pbest和群体极值Gbest更新个***置,个体极值Pbest是指个体所经历位置中计算得到的适应度值最优位置,群体极值Gbest是指种群中的所有粒子搜索到的适应度最优位置。粒子每更新一次位置,就计算一次适应度值,并且通过比较新粒子的适应度值和个体极值、群体极值的适应度值更新个体极值Pbest和群体极值Gbest位置,非常适用于实际应用。
因此,为了更好地预测眉茶车色样品的不同等级,本发明应用粒子群优化(PSO,particle swarm optimization)方法分别建立每个光谱信息子区间的光谱数据预测模型,比较模型相关系数(correlation coefficient of calibration,Rc)和交互验证均方根方差(root mean square error of calibration,RMSECV)大小,初步筛选出建模的最佳光谱信息子区间数据,达到精准筛选眉茶车色样品等级的光谱信息的目的。其中,Rc最大、RMSECV最小,表示建立的粒子群优化算法模型结果最佳。
其中,RMSECV计算公式为:
Rc计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,y为样品集中第i个样品的实测值的平均值,式中i≤n。
同时,该PSO方法也反过来验证步骤三中选择的为哪种最佳光谱预处理方法。
步骤六、unsupervised Kohonen结构人工神经网络预测模型建立
在上述步骤五的基础上,虽然初步得到了反映不同等级眉茶车色样品的光谱信息,但输入模型的光谱数据点还较多,而且各个数据点间很可能还存在着非线性关系,因此,为了更加精准的预测样品的不同等级,本发明应用非线性的人工神经网络方法进一步精准预测眉茶车色样品的等级。包括:
1)最佳光谱信息子区间主成分分析
在建立人工神经网络方法时,要求输入的数据较少才行,因此,需要进一步压缩、抽提样品的光谱信息,而主成分分析方法(PCA)就是一种有效的抽提光谱信息的方法。因此,应用Matlab 2012a软件中的主成分分析程序采用主成分分析方法(PCA)对筛选的最佳光谱子区间数据进行主成分分析,得到每个主成分的单独贡献率值、累计贡献率值和主成分得分,且在主成分累计贡献率≥85%才可以有效代表样品建模光谱子区间信息。
2)人工神经网络预测模型建立
以最佳光谱信息子区间的主成分得分为输入值、以眉茶不同车色样品等级为输出值,应用Neuro Shell 2软件建立unsupervised Kohonen结构的人工神经网络预测模型,unsupervised Kohonen结构人工神经网络方法含有1个隐含层、3、4、5个神经元数和logistic、linear[0,1]和tanh三种信息传递函数。为了达到最佳的预测效果,需要大量实验数据对得到的9种unsupervised Kohonen结构人工神经网络结构进一步筛选最佳的神经元个数和传递函数的组合,才能够达到最佳的预测效果;因此比较模型相关系数(correlation coefficient of calibration,Rc)和交互验证均方根方差(root meansquare error of calibration,RMSECV)大小,得到最佳近红外光谱预测模型,其中,Rc越大、RMSECV越小,表示模型预测效果越好。
其中RMSECV计算公式为:
Rc计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n。
其中以相关系数Rc最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型。
步骤七、模型稳健性检验
为避免出现过拟合现象,建立一个稳健的预测模型,达到实际应用的目的,因此,应用全部验证集样品对不同等级眉茶车色样品的人工神经网络预测模型效果进行检验,所得结果用相关系数(correlation coefficient of prediction,Rp)和验证均方差(rootmean square error of prediction,RMSEP)表示,其中Rp越大、RMSEP越小则表示模型稳健性越好,可以准确的预测眉茶车色样品的等级。
其中RMSEP计算公式为:
Rp计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,式中i≤n。
具体的,所述的步骤一中眉茶车色鲜叶样品数量为120份,鲜叶样品按照3:1的比例随机划分为校正集和验证集,其中校正集样品90个、验证集样品30个。
具体的,所述步骤一中眉茶车色鲜叶样品的3个等级为7-8目等级样品、9-10目等级样品和11-16目等级样品。其中7-8目等级样品化学值设定为1.000,9-10目等级样品化学值设定为2.000,11-16目等级样品化学值设定为3.000。
具体的,所述步骤五中筛选出建模的最佳光谱信息子区间数据为6707.2-7004.2cm-1
具体的,所述步骤六中在采用主成分分析方法(PCA)对筛选的最佳光谱信息子区间数据进行主成分分析时,采用前3个主成分代表最佳光谱子区间的光谱信息。
具体的,所述步骤六中选择4个神经元和logistic信息传递函数建立不同等级眉茶车色样品的unsupervised Kohonen结构人工神经网络模型。
具体实施例一:
(1)样品收集与分类
收集湖北省机采鲜叶眉茶车色样品120个,分为3个不同等级:7-8目等级样品,9-10目等级样品和11-16目等级样品。依据样品等级不同将样品按照3:1比例划分为校正集和验证集2个集合,其中校正集90个样品,验证集样品30个,用于检验校正集模型的稳健性。其中,7-8目等级样品化学值设定为1.000,9-10目等级样品化学值设定为2.000,11-16目等级样品化学值设定为3.000。
(2)光谱扫描
应用美国赛默飞.世尔AntarisⅡ型傅里叶变换近红外光谱仪(FT-NIR)、选用积分球漫反射光学平台扫描获得全部3个等级车色样品的近红外光谱,光谱扫描范围4000-10000cm-1、分辨率8cm-1、检测器为InGaAs。每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该样品的最终光谱用于后续建立模型。
在扫描样品光谱前,将该近红外光谱仪预热30分钟,保持室内温度和湿度基本一致后,再将样品装入与仪器配套的旋转杯中进行光谱扫描,每次样品的装样厚度保持一致,保证近红外光无法穿透样品,全部3个等级眉茶车色样品光谱参见图1。
(3)光谱噪声信息预处理
在光谱采集过程中,通常会产生高频噪声和基线漂移等影响模型预测效果的噪声信息,因此,在建立校正集模型前需要对光谱进行预处理。应用化学计量学软件TQ Analyst9.4.45软件和OPUS 7.0软件对对步骤二中扫描得到的不同等级眉茶车色样品的近红外光谱分别进行平滑、一阶导数,二阶导数、多元散射校正和矢量归一化预处理,然后将每个样品光谱转化为1560对数据点于excel表中用于后续数据分析,建立预测模型。
经过比较,可知最佳光谱预处理方法为矢量归一化。
(4)光谱子区间划分
将全部光谱数据点均等分为20个光谱信息子区间,每个子区间含有的数据点为78个。
(5)粒子群优化算法模型建立
分别建立每个光谱子区间数据的粒子群优化算法模型,所得结果见下面的表1:
表1粒子群优化算法建模结果
建模数 光谱区间/cm-1 相关系数 RMSECV
1 3999.6-4296.6 0.567 8.06
2 4300.5-4597.5 0.638 7.02
3 4601.3-4898.3 0.672 6.82
4 4902.2-5199.1 0.594 7.31
5 5203-5500 0.570 8.08
6 5503.8-5800.8 0.542 8.01
7 5804.7-6101.7 0.555 8.04
8 6105.5-6402.5 0.881 6.78
9 6406.4-6703.4 0.887 6.94
10 6707.2-7004.2 0.900 5.95
11 7008-7305 0.858 6.01
12 7308.9-7605.9 0.871 6.05
13 7609.7-7906.7 0.844 6.11
14 7910.6-8207.6 0.704 7.03
15 8211.4-8508.4 0.740 6.03
16 8512.3-8809.2 0.767 6.03
17 8813.1-9110.1 0.697 7.04
18 9113.9-9407.1 0.733 6.04
19 9410.9-9704 0.753 6.25
20 9707.9-10000 0.757 6.05
由上面的表1可以看出,应用粒子群优化算法分别建立20个子区间的近红外模型,当RMSECV最小、而相关系数最大时,此时建模的光谱区间即为最佳的建模子区间。当6707.2-7004.2cm-1时,模型相关系数0.900、RMSECV为5.95,此时建立的粒子群优化算法模型结果最佳,由此可知最佳建模光谱子区间为:6707.2-7004.2cm-1
(6)Unsupervised Kohonen结构人工神经网络预测模型建立,包括:
1)最佳光谱信息子区间主成分分析
应用Matlab 2012a软件对预处理后的不同等级眉茶车色样品最佳光谱子区间数据进行主成分分析,求得主成分数、贡献率和主成分得分值。前8个主成分的贡献率分别如下面表2所示:
表2前8个主成分贡献率
从表2可以看出,PC1贡献率最大、为91.48%,从PC1—PC8主成分贡献率急剧降低,PC8贡献率仅为0.01%。其中,PC1,PC2和PC3三个主成分的累计贡献率为99.85%,可以完全代表最佳光谱子区间的光谱信息,用于后续数据分析,校正集样品前3个主成分得分如下面表3所示:
表3校正集样品前3个主成分得分
2)Unsupervised Kohonen结构人工神经网络预测模型建立
为有效提高模型的稳健性,减少噪声信息的输入对模型的不利影响,要求建模时输入变量尽可能的少,但还要有效的代表原始光谱数据信息,因此,以上述主成分分析筛选的前3个主成分得分为输入值、以不同等级眉茶车色样品为输出值(7-8目等级样品化学值设定为1.000,9-10目等级样品化学值设定为2.000,11-16目等级样品化学值设定为3.000),经多次优化神经元个数和传递函数,建立了9种不同等级眉茶车色样品的人工神经网络预测模型。
在建立模型时,由于模型内部神经元个数和输出层间信息传递函数的不同会对模型预测效果产生较大的影响;因此,在建立unsupervised Kohonen结构的人工神经网络模型时,分别比较了不同神经元个数和不同内部信息传递函数对模型预测结果的影响,具体参见下面的表4。通过将前3个主成分得分输入到该人工神经网络模型中,比较该模型相关系数Rc和交互验证均方根方差RMSECV值,得到最佳预测模型。最佳校正集模型为:slab1具有4个神经元,传递函数logistic,此时,模型Rc为0.977,RMSECV为0.45。
表4 9种人工神经网络模型结果
(7)模型稳健性检验
为防止出现过拟合现象,应用验证集30份样品对校正集模型进行检验,所得结果用相关系数Rp和验证集均方差RMSEP表示,具体结果参见上面的表4。
从表4可以看出,不同等级眉茶车色样品unsupervised Kohonen结构的人工神经网络模型中,当神经元为3个、传递函数为linear[0,1]时,最佳校正集模型Rc为0.948、RMSECV为0.78,当用全部30个验证集样品对校正集模型稳健性进行检验时,得到验证集模型Rp为0.934、RMSEP为0.95。当神经元为4个、传递函数为logistic时,最佳校正集模型Rc为0.977、RMSECV为0.45,当用全部30个验证集样品对校正集模型稳健性进行检验时,得到验证集模型Rp为0.965、RMSEP为0.57。当神经元为5个、传递函数为logistic时,最佳校正集模型Rc为0.965、RMSECV为0.57,当用全部30个验证集样品对校正集模型稳健性进行检验时,得到验证集模型Rp为0.941、RMSEP为0.89。可见,在应用同样的unsupervised Kohonen结构但内部不同神经元个数和不同信息传递函数的情况下建立的人工神经网络模型中,以具有4个神经元和传递函数为logistic时建立的不同等级眉茶车色样品人工神经网络模型预测结果最佳,模型预测效果最好;其次为具有5个神经元和传递函数为logistic时建立的不同等级眉茶车色样品人工神经网络模型;最差的为具有3个神经元和传递函数为linear[0,1]时建立的不同等级眉茶车色样品人工神经网络模型。由此可知,同样的人工神经网络建模方法,但内部神经元个数与信息传递函数的不同,会对建立模型的预测结果产生较大的影响,因此,建立模型时,要合理选择神经元个数和信息传递函数。
应用4个神经元和传递函数为logistic时建立的最佳人工神经网络模型对30个验证集样品的等级进行预测,预测结果见下面的表5。从表5可以看出,不同等级眉茶车色样品的真值和预测值的差值(偏差)全部在±0.500范围内,表明模型对所有样品预测正确,判别率为100%。可见,当应用4个神经元和传递函数为logistic时建立的不同等级眉茶车色样品unsupervised Kohonen结构人工神经网络模型实现了对机采鲜叶眉茶车色样品等级的快速、准确预测。
表5 30个验证集样品等级预测结果
综上所述,本发明提供一种基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,先剔除样品噪声信息,得到最佳光谱预处理方法为矢量归一化;应用粒子群优化算法筛选出最佳光谱区间,然后应用主成分分析得出前3个主成分,前3个主成分的累计贡献率为99.85%,以前3个主成分得分为输入值建立不同神经元个数和信息传递函数的unsupervised Kohonen结构人工神经网络预测模型,以具有4个神经元和传递函数为logistic时建立的unsupervised Kohonen结构人工神经网络模型预测结果最佳(Rp=0.965,RMSEP=0.57);其次为具有5个神经元和传递函数为logistic时建立的unsupervised Kohonen结构人工神经网络模型;最差为具有3个神经元和传递函数为linear[0,1]时建立的unsupervised Kohonen结构人工神经网络模型。因此,本发明应用近红外光谱技术、且将粒子群优化算法和unsupervised Kohonen结构人工神经网络方法相结合,完美实现了对湖北省3个等级机采鲜叶眉茶车色样品的精准预测(预测偏差全部在±0.500范围内,预测准确率为100%),建立的预测模型不仅达到大大降低模型运算量(建模所用光谱信息占全部光谱信息的5.00%)、简化模型的目的,同时还起到提高模型的预测准确度和增强模型实用性的目的。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,上述结构都应当视为属于本发明的保护范围。

Claims (6)

1.基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,其特征在于,扫描获得不同等级眉茶车色样品的近红外光谱,然后对样品光谱进行预处理剔除噪声信息后,将样品光谱转化为成对的数据点于excel表中保存;然后将全部光谱数据均划分为20个子区间,分别建立每个子区间数据的粒子群优化算法模型,筛选出建模的最佳子区间数据;再应用主成分分析法对最佳子区间数据点信息进行压缩抽提,以主成分得分为输入数值,通过调节隐含层神经元个数和信息传递函数,建立不同等级眉茶车色样品的人工神经网络预测模型,用于预测眉茶车色样品等级,具体包括以下步骤:
步骤一、样品收集与分类
收集湖北省3个不同等级机采鲜叶眉茶车色样品,依据样品等级不同将样品分为校正集和验证集2个集合,分别用于建立校正集近红外光谱预测模型和对校正集预测模型稳健性进行检验;
步骤二、光谱扫描
应用近红外光谱仪扫描获得全部3个等级车色样品的近红外光谱,光谱扫描范围4000-10000cm-1、分辨率8cm-1、检测器为InGaAs,每个样品采集3次光谱、每次扫描64次,然后对3次采集的光谱进行平均,以平均光谱作为该车色样品的最终光谱用于后续建立模型;
步骤三、光谱噪声信息预处理
应用多款化学计量学软件对步骤二中扫描得到的不同等级车色样品的近红外光谱采用矢量归一化方法进行去噪声预处理,提高光谱的信噪比,有利于建立稳健的预测模型;光谱去噪声后,再将样品光谱转化为成对的数据点;
步骤四、光谱子区间划分
将全部光谱信息数据均等分为20个光谱信息子区间,精准筛选反映车色样品等级的光谱信息子区间,用于后续建立粒子群优化算法模型;
步骤五、粒子群优化算法模型建立
应用粒子群优化(PSO,particle swarm optimization)方法分别建立每个光谱信息子区间的光谱数据预测模型,比较模型相关系数(correlation coefficient ofcalibration,Rc)和交互验证均方根方差(root mean square error of calibration,RMSECV)大小,初步筛选出建模的最佳光谱信息子区间数据,达到精准筛选眉茶车色样品等级的光谱信息的目的,其中,Rc最大、RMSECV最小,表示建立的粒子群优化算法模型结果最佳,
其中,RMSECV计算公式为:
Rc计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n;
步骤六、unsupervised Kohonen结构人工神经网络预测模型建立
应用非线性的人工神经网络方法进一步精准预测眉茶车色样品的等级,包括:
1)最佳光谱信息子区间主成分分析
采用主成分分析方法(PCA)对筛选的最佳光谱子区间数据进行主成分分析,得到每个主成分的单独贡献率值、累计贡献率值和主成分得分;在主成分累计贡献率≥85%才可以有效代表样品建模光谱子区间信息;
2)人工神经网络预测模型建立
以最佳光谱信息子区间的主成分得分为输入值、以眉茶不同车色样品等级为输出值,应用Neuro Shell2软件建立unsupervised Kohonen结构的人工神经网络预测模型,unsupervised Kohonen结构人工神经网络结构含有1个隐含层、3、4、5个神经元数和logistic、linear[0,1]和tanh三种信息传递函数,比较模型相关系数(correlationcoefficient of calibration,Rc)和交互验证均方根方差(root mean square error ofcalibration,RMSECV)大小,得到最佳近红外光谱预测模型,其中,Rc越大、RMSECV越小,表示模型预测效果越好;
其中RMSECV计算公式为:
Rc计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,为样品集中第i个样品的实测值的平均值,式中i≤n;
其中以相关系数Rc最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型;
步骤七、模型稳健性检验
应用全部验证集样品对不同等级眉茶车色样品的人工神经网络预测模型效果进行检验,所得结果用相关系数(correlation coefficient of prediction,Rp)和验证均方差(root mean square error of prediction,RMSEP)表示,其中Rp越大、RMSEP越小则表示模型稳健性越好,可以准确的预测眉茶车色样品的等级;
其中RMSEP计算公式为:
Rp计算公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的实测值和预测值,式中i≤n。
2.根据权利要求1所述的基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,其特征在于:所述的步骤一中眉茶车色鲜叶样品数量为120份,鲜叶样品按照3:1的比例划分为校正集和验证集,其中校正集样品90个、验证集样品30个。
3.根据权利要求1所述的基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,其特征在于:所述步骤一中眉茶车色鲜叶样品的3个等级为7-8目等级样品、9-10目等级样品和11-16目等级样品,其中7-8目等级样品化学值设定为1.000、9-10目等级样品化学值设定为2.000、11-16目等级样品化学值设定为3.000。
4.根据权利要求1所述的基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,其特征在于:所述步骤五中筛选出建模的最佳光谱信息子区间数据为6707.2-7004.2cm-1
5.根据权利要求1所述的基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,其特征在于:所述步骤六中在采用主成分分析方法(PCA)对筛选的最佳光谱信息子区间数据进行主成分分析时,采用前3个主成分代表最佳光谱子区间的光谱信息。
6.根据权利要求1所述的基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法,其特征在于:所述步骤六中选择4个神经元和logistic信息传递函数建立不同等级眉茶车色样品的unsupervised Kohonen结构人工神经网络模型。
CN201910513187.8A 2019-06-14 2019-06-14 基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法 Pending CN110320173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910513187.8A CN110320173A (zh) 2019-06-14 2019-06-14 基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910513187.8A CN110320173A (zh) 2019-06-14 2019-06-14 基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法

Publications (1)

Publication Number Publication Date
CN110320173A true CN110320173A (zh) 2019-10-11

Family

ID=68119712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910513187.8A Pending CN110320173A (zh) 2019-06-14 2019-06-14 基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法

Country Status (1)

Country Link
CN (1) CN110320173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114018863A (zh) * 2021-11-03 2022-02-08 杭州电子科技大学 基于近红外光谱和对比学习的烟叶部位判别方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507480A (zh) * 2011-11-23 2012-06-20 浙江大学 基于12个特征波长的无损快速检测茶叶含水率的方法
CN102589470A (zh) * 2012-02-14 2012-07-18 大闽食品(漳州)有限公司 一种基于模糊神经网络的茶叶外观品质的量化方法
CN103743698A (zh) * 2013-12-20 2014-04-23 贵州省分析测试研究院 一种采用近红外光谱对茶叶感官审评的方法
CN106295802A (zh) * 2016-08-01 2017-01-04 安徽农业大学 一种基于粒子群算法优化bp神经网络的茶叶存储时间分类方法
CN106568738A (zh) * 2016-10-31 2017-04-19 湖北省农业科学院果树茶叶研究所 一种近红外光谱快速判定不同质量等级茶鲜叶的方法
CN108508055A (zh) * 2018-03-27 2018-09-07 广西医科大学 一种基于代谢组学的广西瑶山甜茶抗糖尿病潜在标志物代谢通路及研究方法
CN108872132A (zh) * 2018-08-24 2018-11-23 湖北省农业科学院果树茶叶研究所 一种利用近红外光谱判别茶鲜叶品种的方法
CN109002855A (zh) * 2018-07-20 2018-12-14 长沙湘丰智能装备股份有限公司 一种基于卷积神经网络的红茶发酵程度的鉴定方法
CN109100323A (zh) * 2018-08-20 2018-12-28 江苏大学 一种苹果水心病的透射光谱无损定量评价方法
CN109452380A (zh) * 2018-11-09 2019-03-12 浙江工业大学 一种基于粒子群算法的茶叶加工设备控制方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102507480A (zh) * 2011-11-23 2012-06-20 浙江大学 基于12个特征波长的无损快速检测茶叶含水率的方法
CN102589470A (zh) * 2012-02-14 2012-07-18 大闽食品(漳州)有限公司 一种基于模糊神经网络的茶叶外观品质的量化方法
CN103743698A (zh) * 2013-12-20 2014-04-23 贵州省分析测试研究院 一种采用近红外光谱对茶叶感官审评的方法
CN106295802A (zh) * 2016-08-01 2017-01-04 安徽农业大学 一种基于粒子群算法优化bp神经网络的茶叶存储时间分类方法
CN106568738A (zh) * 2016-10-31 2017-04-19 湖北省农业科学院果树茶叶研究所 一种近红外光谱快速判定不同质量等级茶鲜叶的方法
CN108508055A (zh) * 2018-03-27 2018-09-07 广西医科大学 一种基于代谢组学的广西瑶山甜茶抗糖尿病潜在标志物代谢通路及研究方法
CN109002855A (zh) * 2018-07-20 2018-12-14 长沙湘丰智能装备股份有限公司 一种基于卷积神经网络的红茶发酵程度的鉴定方法
CN109100323A (zh) * 2018-08-20 2018-12-28 江苏大学 一种苹果水心病的透射光谱无损定量评价方法
CN108872132A (zh) * 2018-08-24 2018-11-23 湖北省农业科学院果树茶叶研究所 一种利用近红外光谱判别茶鲜叶品种的方法
CN109452380A (zh) * 2018-11-09 2019-03-12 浙江工业大学 一种基于粒子群算法的茶叶加工设备控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NABARUN BHATTACHARYA,ET: "Preemptive identification of optimum fermentation time for black tea using electronic nose", 《SENSORS AND ACTUATORS B:CHEMICAL》 *
王凯 等: "《煤与瓦斯突出的非线性特征及预测模型》", 31 March 2005, 徐州:中国矿业大学出版社 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114018863A (zh) * 2021-11-03 2022-02-08 杭州电子科技大学 基于近红外光谱和对比学习的烟叶部位判别方法及装置
CN114018863B (zh) * 2021-11-03 2023-07-28 杭州电子科技大学 基于近红外光谱和对比学习的烟叶部位判别方法及装置

Similar Documents

Publication Publication Date Title
CN106568738A (zh) 一种近红外光谱快速判定不同质量等级茶鲜叶的方法
CN108872132A (zh) 一种利用近红外光谱判别茶鲜叶品种的方法
CN105630743A (zh) 一种光谱波数的选择方法
CN110308111A (zh) 一种应用近红外光谱技术快速预测远安黄茶闷黄时间的方法
CN113533236B (zh) 水果光谱的特征提取方法、模型训练方法、检测方法
CN104062258B (zh) 一种采用近红外光谱快速测定复方阿胶浆中可溶性固形物的方法
CN110186871A (zh) 一种茶鲜叶产地的判别方法
CN110334714A (zh) 一种基于人工神经网络技术的机采眉茶车色样品等级预测方法
CN114611582B (zh) 一种基于近红外光谱技术分析物质浓度的方法及***
CN110320173A (zh) 基于粒子群优化算法的机采鲜叶眉茶车色样品等级的快速判定方法
CN110361334A (zh) 应用general regression结构无损预测机采眉茶车色样品等级的方法
CN110186870B (zh) 一种极限学习机光谱模型判别恩施玉露茶鲜叶产地的方法
CN106442400B (zh) 一种近红外光谱快速判定不同土壤类型茶鲜叶的方法
CN113310934A (zh) 骆驼奶中掺加奶牛奶及其掺加比例的快速鉴定方法
CN110320174A (zh) 应用polynomial net结构人工神经网络快速预测远安黄茶闷黄时间的方法
CN106568740A (zh) 一种近红外光谱快速判定茶鲜叶品种的方法
CN115452758A (zh) 大米类别鉴别模型及其构建方法以及鉴别大米类别的方法
CN106442399B (zh) 一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法
CN112326574B (zh) 一种基于贝叶斯分类的光谱波长选择方法
CN113607683A (zh) 一种近红外光谱定量分析的自动建模方法
CN113418889A (zh) 一种基于深度学习的干菜水分含量和菌落总数的实时检测方法
CN113310938A (zh) 一种巴氏杀菌的水牛鲜奶和奶牛鲜奶的快速鉴定方法
CN112749906A (zh) 卷烟主流烟气光谱数据的感官评价方法
CN112697745A (zh) 一种白酒酒精含量测定方法
CN106568741B (zh) 一种近红外光谱快速判定茶鲜叶产地的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191011

RJ01 Rejection of invention patent application after publication