CN104792722A - 一种沉香含油率近红外光谱预测模型的建立 - Google Patents

一种沉香含油率近红外光谱预测模型的建立 Download PDF

Info

Publication number
CN104792722A
CN104792722A CN201510216871.1A CN201510216871A CN104792722A CN 104792722 A CN104792722 A CN 104792722A CN 201510216871 A CN201510216871 A CN 201510216871A CN 104792722 A CN104792722 A CN 104792722A
Authority
CN
China
Prior art keywords
sample
near infrared
agalloch eaglewood
spectrum
oleaginousness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510216871.1A
Other languages
English (en)
Inventor
黄少伟
阮唯坚
罗峰
蒋开斌
刘天颐
刘纯鑫
赵静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN201510216871.1A priority Critical patent/CN104792722A/zh
Publication of CN104792722A publication Critical patent/CN104792722A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及一种沉香含油率近红外光谱预测模型的建立,属于理化检测技术领域。本发明包括如下步骤:应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图,再用偏最小二乘法将沉香含油量的常规测定结果与经光谱预处理过的样品的近红外光谱数据相关联而建立起来的。该发明建立的模型预测准确度较高,可用于未知样品的实际预测,主要可用于沉香结香品质的快速检测。

Description

一种沉香含油率近红外光谱预测模型的建立
技术领域
本发明涉及一种近红外光谱预测模型的建立,具体涉及一种沉香含油率近红外光谱预测模型的建立,属于理化检测技术领域。
背景技术
近年来,随着光导纤维及传感技术的发展,近红外光谱检测技术和计算机网络技术相结合的进一步深入,近红外光谱技术的非侵入式定性和定量分析成为可能,同时,由于生物体中不同的透明组织对近红外光具有不同的吸收和散射特性,因此近红外光对不同的软组织和变化的组织具有较强的区分能力。根据这种特性,可以利用近红外光谱法测量组织的某些光学参数从而得到组织的某些生理参数,或者建立某些生理参数和光谱数据的关系,从而可以检测出组织中的异物或生成二维的图像;也可监测皮肤组织受外界环境影响的变化;还可用于临床分析和血液某种成分的测定。近红外光谱法可以直接对活体组织进行无创伤检测,使过去无法开展的研究工作成为可能,极大地提高了分析检测效率,使近红外光谱成为近年来发展较为迅速的一种高新分析测试技术,是光谱测量技术、计算机技术、计量学技术与基础测量技术有机结合的产物。与传统分析技术相比,其具有无损检测、分析效率高分析速度快、分析成本低、重复性好、样品测量一般无需预处理、光谱测量方便、适合于现场检测和在线分析等独特优势。
近红外光谱技术应用于药物的鉴别和定性、定量的分析不仅具有快速、方便、准确、非侵入式分析、易于实现生产过程的在线控制等优点,而且可以鉴定某些药物如光学异构体、具有光学活性物质的纯度,因此在药物的定性鉴定、定量分析、质量控制及在线检测等方面显示了巨大的作用。利用近红外光谱和多变量统计分类技术***聚类分析、逐步聚类分析、主成分分析和逐步判别等可很好地对药材和成药进行定性判别和分类;利用近红外漫反射光谱分析技术,针对药品的活性成分建模,能够直接分析不同厂家的相同品种,实现现场对药品进行快速定性定量分析。
欧洲的许多发达国家已经在多个领域内将近红外光谱分析技术作为行业产品质量评定的标准技术,几乎完全替代了先前广泛使用的化学分析方法,在生产效率和产品质量方面取得了很好的效果。
沉香,一种药材,属药瑞香科植物,性温,味辛、苦,归脾、胃、肾、肺经;主产于海南,广东、广西、香港、云南;印度尼西亚、马来西亚、越南等地;功效为降气温中,暖肾纳气;主治气逆喘息,呕吐呃逆,脘腹胀痛,腰膝虚冷,大肠虚秘,小便气淋,男子精冷。上等沉香历来以斤两论值,可见其珍贵。天然野生土沉香资源曾经十分丰富,史书上曾有“交干连枝,岗岭相连,千里不绝”的记载,但近年由于常被采取供药用,不合理的滥采乱伐,土沉香林遭到严重破坏,再加上种子易丧失发芽力,天然更新能力弱,现自然生长土沉香种群己是罕见,仅零星散生的伤残植株,大株己不常见,致使本种己处于渐危状态,为国家Ⅱ级重点保护野生植物。因其经济价值高,市场前景好,导致仿冒品层出不穷,但目前主要还只能依靠传统的色泽、比重来进行鉴别,准确率低,且对于沉香的重要品质指标含油率的近红外光谱预测模型的建立及检测还未见报道。
发明内容
本发明的目的是建立一种沉香含油率近红外光谱快速预测模型,本发明采用近红外漫反射光谱法建立沉香含油率近红外光谱快速预测模型,用于沉香结香品质的快速检测。
为实现上述发明的目的,本发明采取的技术方案如下:
一种沉香含油率近红外光谱预测模型的建立,包括如下步骤:
(1)光谱采集:取沉香样品粉末,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;
(2)按照2010版《中国药典》的测定方法测定沉香的含油量;
(3)建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
(4)未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
所述的沉香样品粉末是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
所述《中国药典》(2010版)的测定方法为:取样品2~4g(m),称定重量,置150ml的锥形瓶中;准确加入95%乙醇100ml,塞紧,称定重量,静置1h;连接回流冷凝管,加热至沸腾(85℃),并保持微沸1h;冷却后,取下锥形瓶,密塞,称定重量,用乙醇补足减失的重量;100ml容量瓶定容,摇匀,干燥过滤;准确量取滤液50ml(M1),至已干燥的恒量的蒸发皿中;在水浴上蒸干后,于85℃干燥3h;移至干燥器中,冷却30min,迅速准确称定重量(M2);已干燥品计算供试品醇溶性浸出物的含量x(%):
x % = M 2 - M 1 m × 2 .
所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
所述的光谱采集是利用瑞典波通公司的DA7200近红外光谱分析仪和仪器自带的样品杯进行光谱采集,在使用近红外光谱仪扫描样品光谱之前,提前开机预热30min,待光源稳定时才开始采集光谱;光谱数据采集的实验条件为:测样方式为漫反射,光斑直径为3.5cm,光谱扫描范围为950~1650nm,分辨率为5nm,环境温度控制在22~23℃,环境湿度控制在30~70%。每一个沉香和木质部样品都采用扫描2次和重复装样3次取平均的光谱收集方式。这是由于在对沉香与木质部样品进行粉碎的过程中,人工操作的不稳定性会造成松脂样品的颗粒度大小不一,从而可能会导致样品之间出现较大的光谱差异,所以必须采用多次装样和多次重复扫描的方式以减少样品的不均匀性带来的影响,并收集尽可能多的样品信息。
所述DA7200型近红外成份分析仪主要技术参数如下:光谱采集速度:约100条光谱每秒;样品扫描:非接触,向下照射,旋转样品杯;样品重量:固体或粉末为0.5g-300g、液体为2ml-100ml;波长范围:900nm-1700nm,使用950nm–1650nm;带宽:0.5nm-10nm可调;检测器:铟镓砷二极管阵列检测器;扫描次数:100次/s;光栅:镀金全息固定光栅;噪音:小于0.00006μA,3秒测量时间;光源寿命:大于10000h。
应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图。图1为87个沉香粉样品的近红外原始光谱图,由图1可以看出,尽管不同的样品在同一波长下的吸收强度各不相同,但是绝大多数的样品在不同波长下的近红外光谱吸收趋势都很相似,在1455nm处都存在较强的吸收峰。在近红外漫反射光谱中,沉香粉中各种不同组织结构或化学成分都存在特定的吸收峰,而且不同基团产生的光谱在吸收峰位和强度上都有所不同,随着样品内部的组织结构以及物质含量的变化,其光谱特征也将随之发生变化。
在利用近红外光谱仪采集样品光谱的过程中,往往会发生光谱偏移或漂移等现象,近红外光谱仪所采集的原始数据中除含有与样品组成有关的化学信息外,还有来自于各方面干扰信息及噪声的影响,如电噪声、杂散光、样品背景干扰和仪器响应等,这些噪音信号会对谱图信息产生干扰,在有些情况下会很严重,从而影响校正模型的建立和之后对未知样品组成或性质的预测。因此,为了提高模型的准确性和可靠性,减少光谱中干扰信息和噪音信号对模型的负面影响,需要采用不同的光谱预处理方法对光谱进行处理。光谱预处理的主要目的是除噪声干扰、优化光谱信号,为下一步校正模型的建立的未知样品的预测打下基础;另外,通过对光谱的预处理,还可以解决模型的适用性和模型的传递问题。选择合适的光谱预处理方法对建立预测能力强、稳健性好的回归模型是至关重要的,有时甚至起着决定性的作用。目前常用的光谱预处理方法有平滑处理(Smoothing)、归一化(Normalization)、导数处理(Deviation)、多元散射校正(Multiplicative Scattering Correction,MSC)、标准正态变量变换(Standard Normal Variate transformation,SNV)、小波变换(Wavelet Transform,WT)和正交信号校正(Orthogonal Signal Correction,OSC)等。此外,为了使光谱同时具有双重的校正作用,也可以采用复合光谱预处理方法,即两种或两种以上的光谱预处理方法相结合。如一阶导数(First Deviation)+卷积平滑法(Savitzky-Golay)+标准正态变量变换(Standard NormalVariate transformation),便是目前近红外分析中很常用的一种组合式的光谱预处理方法。
a.平滑处理
平滑处理(Smoothing)是光谱预处理中最常用的一种消除噪音、提高信噪比的方法。该方法是基于假设光谱含有的噪音为零均随机白噪音,可以通过多次测量取平均值降低噪音,以提高光谱的信噪比,其中平滑点数是一个重要参数,平滑点数过少容易产生新的计算误差,从而造成模型精度的下降,平滑点数过多则会使得包含样品信息的光谱信息数据磨光丢失,同样也会造成模型精度的下降。因此,合理选择平滑点数是非常必要的,常用的平滑方法主要包括移动窗口平均平滑法(Moving Average)、卷积平滑法(Savitzky-Golay)等。
b.归一化
归一化(Normalization)可以消除光谱的多余信息,增加各样品之间的差异,提高模型的稳定性和预测性能。其基本原理是把光谱数据变换为0至1之间的小数,将有量纲的表达式经过变换,转化为无量纲的表达式,从而使变量和平均值的分布更加均衡。
c.导数处理
光谱的导数(Deviation)处理可以有效地消除近红外光谱分析中经常出现的基线漂移或偏移以及其它的背景干扰,强化光谱特征,分辨不同的组分之间互相干扰而出现的光谱重叠峰,从而获得分辨率和清晰度更高的光谱信息,光谱的导数处理通常有两种方法:卷积平滑求导法(S-G)和直接差分法(Direct Difference Method)。对分辨率高且波长采集数据点较多的光谱,直接差分法得到的导数光谱同实际结果相差不明显,但对波长采集数据点较少的光谱来说,这种方法所求的导数便存在较大误差,这时若釆用卷积平滑求导法(S-G)计算则更为理想。光谱求导一般常用一阶导数处理(First Deviation,FD)和二阶导数处理(SecondDeviation,SD),一阶导数可以消除与波长无关的漂移,二阶导数则可以消除与波长线性相关的漂移。
d.多元散射校正
在近红外光谱分析中,样品的均匀程度对所测样品的光谱具有很大的影响。多元散射校正(Multiplicative Scattering Correction,MSC)用于消除由于样品颗粒大小不同和分布不均产生的散射对其光谱的影响。MSC是由Martens等人提出的,之后又在MSC的基础上开发了一种新的扩展多元散射校正方法(Extended Multiplicative Signal Correction,EMSC),并且取得了比MSC更好的校正效果。
e.标准正态变量变换
标准正态变量变换(Standard Normal Variate transformation,SNV)的目的与MSC基本相同,主要用来消除固体颗粒大小、表面散射和光程变化对近红外漫反射光谱的影响。SNV与标准化计算公式相同,不同在于标准化是对一组光谱进行处理,而SNV是对一条光谱进行处理。
f.小波变换
小波变换(Wavelet Transform,WT)(Estienne et al,2000;Da Costa Filho et al,2001)是近年来新出现并不断获得应用推广的一种高效信号处理方法。该方法可把各种频率组成的混合重叠信号分解为一系列不同频率的基元信号,达到对信号时频域的局部化分析。目前,通常处理方法是先将光谱进行小波变换得到一系列小波系数,或通过阈值等方法去除小波系数中的高频元素(即平滑去噪),或根据相关系数等方法选择与待测组分最为相关的一个或多个小波系数(即特征化学信息提取),然后将这些小波系数进行反变换(重构),最终得到处理后的光谱信号。
g.正交信号校正
Wold等(1998)人在1998年提出正交信号校正(Orthogonal Signal Correction,OSC)方法,并已用于NIR光谱预处理中,近年来得到了广泛的应用。这种方法的主要思想就是去除光谱数据集中与分析量无关的光谱信息,使得多元校正模型的预测能力得到加强,提高模型的稳定性。
沉香粉的样品的原始光谱经以上几种方法预处理后所得光谱如图2至10所示。
以上几种光谱预处理方法中,归一化(Normalization)处理主要用于消除光谱的多余信息,增加各样品之间的差异,以提高模型的稳定性和预测性能;多元散射校正(MSC)处理与标准正态变量变换(SNV)处理的目的基本相同,主要用于消除因样品颗粒大小不同和分布不均产生的表面散射和光程变化对近红外漫反射光谱的影响;光谱的导数(Deviation)处理用于消除近红外光谱分析中经常出现的基线漂移或偏移以及其它的背景干扰,强化光谱特征,分辨光谱重叠峰,从而获得分辨率和清晰度更高的光谱信息。
在近红外光谱分析中,常用的多元定量校正方法主要有多元线性回归(Multiple LinearRegression,MLR)、逐步回归(Stepwise Multiple Regression,SMR)、主成分回归(PrincipleComponent Regression,PCR)和偏最小二乘法(Partial Least Square Regression,PLS)等线性校正方法,以及人工神经网络(Artificial Neural Network,ANN)、拓扑法(Topology Method,TP)和支持向量机(Support Vector Machine,SVM)等非线性校正方法,偏最小二乘法作为一种标准的常用方法在近红外光谱分析中已经得到了广泛的应用。
偏最小二乘回归方法(Partial Least Square Regression,PLS)是一种多因变量对多自变量的回归建模方法,由Wold等人在1966年首次提出,它是一种将多元线性回归分析、典型相关分析和主成分分析的基本功能集为一体的多元回归分析方法。在近红外光谱分析中,由于偏最小二乘法(PLS)可以提取成分复杂、谱峰重叠的光谱信息,并且可以有效地去除噪声、解决光谱共线问题和多重相关性问题,所以近年来其在理论分析和应用上都得到了迅速的发展,事实上偏最小二乘法的在近红外光谱分析中的应用越来越广泛,现在已经成为了一种标准的常用方法。
偏最小二乘法是一种新型的多元统计数据分析方法,是将因子分析和回归分析相结合通过因子分析将多维空间光谱数据压缩为较低维空间数据,其方法是将光谱数据向协方差最大的方向投影,将原近红外光谱分解为多种主成分光谱,不同近红外光谱的主成分分别代表不同组分和因素对光谱的贡献,通过对主成分的合理选取,去掉代表干扰组分和干扰因素主成分,仅选取有用的主成分参与与化学成分标准化学分析数据的回归。用偏最小二乘法进行模型分析,比对逐个因变量做多元回归更有效,其分析结果更加可靠,整体性更强,预测精度更高更稳定。偏最小二乘法的基本原理如下:
PLS法首先将n个样品m个组分的浓度矩阵Y=(yij)n×m和仪器测定n个样品p个波长点处吸光度矩阵X=(xij)n×xp分解成特征向量形式:
Y=UQ+F
X=TP+E  (1)
其中U和T分别为n行d列(d为抽象组分数)的浓度特征因子矩阵和吸光度特征因子矩阵,Q为d×m阶浓度载荷阵,P为d×p阶吸光度载荷阵,F和E分别为n×m阶浓度残差阵和n×p吸光度残差阵。
PLS法是根据特征向量的相关性分解Y和X,建立回归模型:
U=TB+Ed  (2)
其中为E随机误差阵,B为d维对角回归系数阵。
对待测样品,如果吸光度向量为x,则浓度为:
y=x(UX)′BQ  (3)
偏最小二乘法PLS最显著的特点就是它不限制参与分析的光谱数据,可以是全谱,也可是其中的一部分,并且同时对自变量X和因变量Y进行主成分分析(Principle ComponentAnalysis,PCA)分析,滤除噪音和干扰项,与MLR、PCR相比,分析性能最好。另外,PLS可以利用全部光谱信息,压缩所需样品的数量,将高度相关的波长点归于一个自变量中,然后根据为数不多的自变量建立回归方程,通过内部检验来防止过模型现象,所以PLS方法比较适用于处理变量多而样本数少的多元数据的分析。
在分别对光谱数据进行不同的预处理后,本发明利用偏最小二乘法PLS进行模型的建立,不同光谱预处理下沉香含油量的建模结果如表1所示。由表1可以看出,应用不同的光谱预处理方法对原始光谱预处理后其所建模型的效果都有所不同,但与原始光谱相比,其所建模型的主成分数大都相应地减少,这样就有效地降低了模型主成分过高而产生过拟合的风险。另外,从表1中还可以看出,采用平滑S-G这种光谱预处理的组合方法对光谱进行预处理后,所建模型的校正集相关系数0.9803和交互验证集相关系数0.9603均为最高,同时其校正集均方根误差0.7088和交互验证集均方根误差1.10113都为最低,与其它预处理方法相比,平滑SG对光谱进行预处理后所建模型的效果最佳,因此,本发明的建模工作都采用平滑SG的组合法对光谱进行预处理。
表1不同光谱预处理方法下建立沉香含油量PLS建模结果
Tab1NIR Prediction models of agarwood oil content
在应用偏最小二乘法(PLS)建立的回归模型中,最佳主成分数的选择对所建模型的优劣及其预测准确度具有很大的影响。如果建模时主成分数太小,则不能完全反映未知样品特征组分产生的数据变化,光谱中一些有用的信息可能不会反映在模型当中,模型的预测准确度就会大大降低;但如果主成分数过大,则又会使模型的噪音增加,校正集的结果可能会比较好但验证集的结果却会受到影响,从而使模型预测能力下降,易造成模型的过拟合现象。因此,合理选择主成分数对建模的结果具有很大影响,目前常采用的方法是,预测残差平方和(Prediction Residual Error Sum of Square,PRESS)和交互验证均方根误差(Root Mean SquareError of Validation)。本发明选择的模型主成分数是在光谱波段和预处理方法确定后,根据交互验证集的均方根误差(RMSEV)最小的原则来确定最佳主成分数。由图11可以看出,沉香含油量近红外模型的交互验证集均方根误差(RMSEV)随着主成分数的增加呈现出先降低后增加的趋势,根据RMSEV越小则模型的预测能力越强的原则,由表2可以看出当主分数为8时,模型所对应的RMSEV最小,因此本次建模所选择的最佳主成分数为8。
表2不同主成分数下所建沉香含油量PLS建模结果
Tab 2Different principal component under construction eaglewood oil content PLS modelingresults
本模型是应用偏最小二乘法将沉香含油量的常规测定结果与经光谱预处理过的样品的近红外光谱数据相关联而建立起来的,结果表明在全光谱段范围下,采用一阶导数SG对光谱进行预处理且当主成分数为8时,所建模型的效果最好,其校正集的相关系数为0.980866,校正集均方根误差为0.958973,交互验证集相关系数为0.69738,交互验证集均方根误差为1.029032,本模型可以满足对未知样品进行快速预测的要求。沉香含油量近红外校正模型的具体参数如图12所示。
评价近红外光谱校正模型优劣的标准,可从模型自身相关性的优劣和外部预测能力的优劣两个方面进行评价。在模型的自身相关性方面,模型应该有较高的校正集相关系数(Relatedcoefficient of calibration,Rc)、交互验证集相关系数(Related coefficient of validation,RV)和较低的校正集均方根误差(Root Mean Square Error of Calibration,RMSEC)、交互验证集均方根误差(Root Mean Square Error of validation,RMSEV)。其中更为重要的指标为RV和RMSEV。因为虽然较高的RC的和较低的RMSEC表示模型预测建模样品的能力更强,但有可能产生过拟合,使预测未知样品的能力下降,而更高的RV和更低的RMSEV则表明模型预测外部样品的准确性更高,同时校正集均方根误差与交互验证集的均方根误差越接近越好。在模型的外部预测能力方面,模型的预测值与实测值应该具有较高的相关系数(Relatedcoefficient,R)和较低的预测均方根误差(Root Mean Square Error of prediction,RMSEP)。通常用以下几个统计量来评价近红外模型的优劣:
(1)残差(e):
残差=预测值-测定值;
残差是最基本的评价指标,其最理想的结果是对于一组样品,它们的残差一部分为正值,另一部分为负值,残差分布在零点的上下。
(2)相关系数(R):
分析数学模型对样品的预测值和样品真实值之间的吻合程度,一般都使用相关系数(Related Coefficient,R),越接近1表示其预测效果越好。
R = Σ ( y b - y ) 2 Σ ( y ‾ b - y ) 2
式中y是通过定标回归模型预测的结果;yb是第b个样品用标准方法测定的参考值;是样本用标准方法测定的参考值的平均值。
(3)决定系数(R2):
决定系数R2为相关系数R的平方。决定系数R2指的是校正集决定系数(coefficients ofdetermination for calibration,R2cal)和交互验证集决定系数(coefficients of determination forvalidation,R2val)。R2综合考察了模型预测误差与预测范围,接近1表示预测浓度值接近真实值,等于1则表示完全拟合。
(4)校正集样本的均方根误差(RMSEC):
校正集样本的均方根误差反映的是校正集样品的近红外光谱预测值与其真值之间的误差大小,是由参与校正的样品集对模型进行检验而来,是评价模型预测能力重要的参数。
RMSEC = Σ ( y b - y ) 2 n - m - 1
式中n是建模用的样本数;m是回归因子数即主成分数。
(5)交叉验证集的均方根误差(RMSEV):
交叉验证均方根误差反映的是交叉验证集样本的近红外光谱预测值与其真实值之间的误差大小,是由未参与校正的内部验证集样本对模型进行检验而来,是评价模型实际预测能力最重要的参数。
RMSEV = Σ ( y b - y ) 2 n - m - 1
式中n是建模用的样本数;m是回归因子数即主成分数。
(6)外部验证集均方根误差(RMSEP):
预测均方根误差是指外部验证集样本的近红外光谱预测值与真值之间的误差大小的直接反映,是由未参与校正的外部验证集样本对模型进行检验而来,是模型评价最直接的标准。
RMSEP = Σ ( y b - y ) 2 n - 1
(7)相对分析误差(RPD):
校正相对分析误差:RPD=SD/SEC
验证相对分析误差:RPD=SD/SECV
式中:SD分别是校正样品集标准偏差或外部验证样品集标准偏差。SEC和SECV分别代表校正样品集标准误差和外部验证集标准误差。相对分析误差(Relative Percent Deviation,RPD)可以用来确定校正模型的预测能力,当RPD大于2.5时表明模型的预测效果良好,预测精度高;如果RPD达到1.5左右,模型预测能力普通。
为了检验模型的预测效果及稳定性,通常在模型建立之后要对模型进行外部验证。具体过程为利用未参与建模的外部验证集样品对所建模型进行检验,将预测结果和常规测定值进行统计比较,以确定模型的实际预测能力。图13为利用所建的沉香含油量近红外预测模型对外部验证集的15个样品对应的单株产脂量进行预测的结果。在去除2个预测超限的异常样品后,余下13个样品所对应的单株产脂量常规测定值与模型预测值的统计分析结果如表5-3所示,结果表明模型预测值与常规测定值之间的绝对误差不超过2.631,且两者之间具有较好的相关性,其相关系数为0.9559,预测均方根误差为0.6010,比较接近于校正集均方根误差。另外,对于给定的显著性水平0.05,将外部验证集样品所对应的沉香含油量与模型的预测值进行配对T检验,结果表明两者差异不显著(P=0.6747>0.05)。说明该模型的预测准确度较高,可用于未知样品的实际预测。
表3外部验证集沉香含油量常规测定值和预测值的统计分析
Tab 3The prediction results of the external validation set eaglewood oil content
样品号 预测值 实测值 绝对误差 样品号 预测值 实测值 绝对误差
YB1 23.37 26.001 -2.631 YB33 15.22 14.469 0.751
YB3 11.9 14.153 -2.253 YB34 18.69 19.22 -0.53
YB4 22.58 24.009 -1.429 HZ22 9.37 9.431 -0.061
YB5 19.49 17.42 2.07 HZ8 8.37 10.284 -1.914
YB30 13.68 11.559 2.121 HZ4 20.13 21.133 -1.003
YB31 15.32 15.526 -0.206 HZ20 17.25 16.838 0.412
YB32 13.33 11.538 1.792
本发明的有益效果是:本模型是应用偏最小二乘法将沉香含油量的常规测定结果与经光谱预处理过的样品的近红外光谱数据相关联而建立起来的,其校正集的相关系数为0.980866,校正集均方根误差为0.958973,交互验证集相关系数为0.69738,交互验证集均方根误差为1.029032,可以满足对未知样品进行快速预测的要求,可用于沉香结香品质的快速检测。
使用13个样品所对应的单株产脂量常规测定值与模型预测值的统计分析,结果表明模型预测值与常规测定值之间的绝对误差不超过2.631,且两者之间具有较好的相关性,其相关系数为0.9559,预测均方根误差为0.6010,比较接近于校正集均方根误差。另外,对于给定的显著性水平0.05,将外部验证集样品所对应的沉香含油量与模型的预测值进行配对T检验,结果表明两者差异不显著(P=0.6747>0.05)。说明该模型的预测准确度较高,可用于未知样品的实际预测。
附图说明
图1沉香样品的NIR原始光谱图;
图2FD+S-G法处理NIR光谱图;
图3FD+S-G+MSC法处理NIR光谱图;
图4FD+S-G+SNV法处理NIR光谱图;
图5MSC法处理NIR光谱图;
图6SD+S-G法处理NIR光谱图;
图7SD+S-G+MSC法处理NIR光谱图;
图8SD+S-G+SNV法处理NIR光谱图;
图9S-G法处理NIR光谱图;
图10SNV法处理NIR光谱图;
图11沉香含油量近红外模型的RMSEV随主成分数变化图;
图12沉香含油量近红外校正模型的参数;
图13外部验证集沉香含油量预测结果。
具体实施方式
下面通过实例对本发明做进一步详细说明,这些实例仅用来说明本发明,并不限制本发明的范围。
实施例1
一种沉香含油率近红外光谱预测模型的建立,包括如下步骤:
1.光谱采集:取沉香样品粉末5g,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;近红外光谱数据预处理:对采集的光谱波段进行预处理,预处理方法采用一阶导数处理(First Deviation,FD)+卷积平滑求导法(S-G)的组合,如图2所示;
2.按照《中国药典》(2010版)的测定方法测定沉香的含油量;
3.建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
4.未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取5g样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
所述的沉香样品粉末是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
所述《中国药典》(2010版)的测定方法为:取样品2~4g(m),称定重量,置150ml的锥形瓶中;准确加入95%乙醇100ml,塞紧,称定重量,静置1h;连接回流冷凝管,加热至沸腾(85℃),并保持微沸1h;冷却后,取下锥形瓶,密塞,称定重量,用乙醇补足减失的重量;100ml容量瓶定容,摇匀,干燥过滤;准确量取滤液50ml(M1),至已干燥的恒量的蒸发皿中;在水浴上蒸干后,于85℃干燥3h;移至干燥器中,冷却30min,迅速准确称定重量(M2);已干燥品计算供试品醇溶性浸出物的含量x(%):
x % = M 2 - M 1 m × 2
所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
所述的光谱采集是利用瑞典波通公司的DA7200近红外光谱分析仪和仪器自带的样品杯进行光谱采集,在使用近红外光谱仪扫描样品光谱之前,提前开机预热30min,待光源稳定时才开始采集光谱;光谱数据采集的实验条件为:测样方式为漫反射,光斑直径为3.5cm,光谱扫描范围为950~1650nm,分辨率为5nm,环境温度控制在22~23℃,环境湿度控制在30~70%。每一个沉香和木质部样品都采用扫描2次和重复装样3次取平均的光谱收集方式。
所述DA7200型近红外成份分析仪主要技术参数如下:光谱采集速度:约100条光谱每秒;样品扫描:非接触,向下照射,旋转样品杯;样品重量:固体或粉末为0.5g-300g、液体为2ml-100ml;波长范围:900nm-1700nm,使用950nm–1650nm;带宽:0.5nm-10nm可调;检测器:铟镓砷二极管阵列检测器;扫描次数:100次/s;光栅:镀金全息固定光栅;噪音:小于0.00006μA,3秒测量时间;光源寿命:大于10000h。
实施例2
一种沉香含油率近红外光谱预测模型的建立,包括如下步骤:
1.光谱采集:取沉香样品粉末5g,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;近红外光谱数据预处理:对采集的光谱波段进行预处理,预处理方法采用一阶导数处理(First Deviation,FD)+卷积平滑求导法(S-G)+多元散射校正(MultiplicativeScattering Correction,MSC)的组合,如图3所示;
2.按照《中国药典》(2010版)的测定方法测定沉香的含油量;
3.建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
4.未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取5g样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
所述的沉香样品粉末是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
所述《中国药典》(2010版)的测定方法为:取样品2~4g(m),称定重量,置150ml的锥形瓶中;准确加入95%乙醇100ml,塞紧,称定重量,静置1h;连接回流冷凝管,加热至沸腾(85℃),并保持微沸1h;冷却后,取下锥形瓶,密塞,称定重量,用乙醇补足减失的重量;100ml容量瓶定容,摇匀,干燥过滤;准确量取滤液50ml(M1),至已干燥的恒量的蒸发皿中;在水浴上蒸干后,于85℃干燥3h;移至干燥器中,冷却30min,迅速准确称定重量(M2);已干燥品计算供试品醇溶性浸出物的含量x(%):
x % = M 2 - M 1 m × 2
所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
所述的光谱采集是利用瑞典波通公司的DA7200近红外光谱分析仪和仪器自带的样品杯进行光谱采集,在使用近红外光谱仪扫描样品光谱之前,提前开机预热30min,待光源稳定时才开始采集光谱;光谱数据采集的实验条件为:测样方式为漫反射,光斑直径为3.5cm,光谱扫描范围为950~1650nm,分辨率为5nm,环境温度控制在22~23℃,环境湿度控制在30~70%。每一个沉香和木质部样品都采用扫描2次和重复装样3次取平均的光谱收集方式。
所述DA7200型近红外成份分析仪主要技术参数如下:光谱采集速度:约100条光谱每秒;样品扫描:非接触,向下照射,旋转样品杯;样品重量:固体或粉末为0.5g-300g、液体为2ml-100ml;波长范围:900nm-1700nm,使用950nm–1650nm;带宽:0.5nm-10nm可调;检测器:铟镓砷二极管阵列检测器;扫描次数:100次/s;光栅:镀金全息固定光栅;噪音:小于0.00006μA,3秒测量时间;光源寿命:大于10000h。
实施例3
一种沉香含油率近红外光谱预测模型的建立,包括如下步骤:
1.光谱采集:取沉香样品粉末5g,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;近红外光谱数据预处理:对采集的光谱波段进行预处理,预处理方法采用一阶导数处理(First Deviation,FD)+卷积平滑求导法(S-G)+标准正态变量变换(Standard NormalVariate transformation,SNV)的组合,如图4所示;
2.按照《中国药典》(2010版)的测定方法测定沉香的含油量;
3.建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
4.未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取5g样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
所述的沉香样品粉末是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
所述《中国药典》(2010版)的测定方法为:取样品2~4g(m),称定重量,置150ml的锥形瓶中;准确加入95%乙醇100ml,塞紧,称定重量,静置1h;连接回流冷凝管,加热至沸腾(85℃),并保持微沸1h;冷却后,取下锥形瓶,密塞,称定重量,用乙醇补足减失的重量;100ml容量瓶定容,摇匀,干燥过滤;准确量取滤液50ml(M1),至已干燥的恒量的蒸发皿中;在水浴上蒸干后,于85℃干燥3h;移至干燥器中,冷却30min,迅速准确称定重量(M2);已干燥品计算供试品醇溶性浸出物的含量x(%):
x % = M 2 - M 1 m × 2
所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
所述的光谱采集是利用瑞典波通公司的DA7200近红外光谱分析仪和仪器自带的样品杯进行光谱采集,在使用近红外光谱仪扫描样品光谱之前,提前开机预热30min,待光源稳定时才开始采集光谱;光谱数据采集的实验条件为:测样方式为漫反射,光斑直径为3.5cm,光谱扫描范围为950~1650nm,分辨率为5nm,环境温度控制在22~23℃,环境湿度控制在30~70%。每一个沉香和木质部样品都采用扫描2次和重复装样3次取平均的光谱收集方式。
所述DA7200型近红外成份分析仪主要技术参数如下:光谱采集速度:约100条光谱每秒;样品扫描:非接触,向下照射,旋转样品杯;样品重量:固体或粉末为0.5g-300g、液体为2ml-100ml;波长范围:900nm-1700nm,使用950nm–1650nm;带宽:0.5nm-10nm可调;检测器:铟镓砷二极管阵列检测器;扫描次数:100次/s;光栅:镀金全息固定光栅;噪音:小于0.00006μA,3秒测量时间;光源寿命:大于10000h。
实施例4
一种沉香含油率近红外光谱预测模型的建立,包括如下步骤:
1.光谱采集:取沉香样品粉末5g,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;近红外光谱数据预处理:对采集的光谱波段进行预处理,预处理方法采用多元散射校正(Multiplicative Scattering Correction,MSC),如图5所示;
2.按照《中国药典》(2010版)的测定方法测定沉香的含油量;
3.建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
4.未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取5g样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
所述的沉香样品粉末是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
所述《中国药典》(2010版)的测定方法为:取样品2~4g(m),称定重量,置150ml的锥形瓶中;准确加入95%乙醇100ml,塞紧,称定重量,静置1h;连接回流冷凝管,加热至沸腾(85℃),并保持微沸1h;冷却后,取下锥形瓶,密塞,称定重量,用乙醇补足减失的重量;100ml容量瓶定容,摇匀,干燥过滤;准确量取滤液50ml(M1),至已干燥的恒量的蒸发皿中;在水浴上蒸干后,于85℃干燥3h;移至干燥器中,冷却30min,迅速准确称定重量(M2);已干燥品计算供试品醇溶性浸出物的含量x(%):
x % = M 2 - M 1 m × 2
所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
所述的光谱采集是利用瑞典波通公司的DA7200近红外光谱分析仪和仪器自带的样品杯进行光谱采集,在使用近红外光谱仪扫描样品光谱之前,提前开机预热30min,待光源稳定时才开始采集光谱;光谱数据采集的实验条件为:测样方式为漫反射,光斑直径为3.5cm,光谱扫描范围为950~1650nm,分辨率为5nm,环境温度控制在22~23℃,环境湿度控制在30~70%。每一个沉香和木质部样品都采用扫描2次和重复装样3次取平均的光谱收集方式。
所述DA7200型近红外成份分析仪主要技术参数如下:光谱采集速度:约100条光谱每秒;样品扫描:非接触,向下照射,旋转样品杯;样品重量:固体或粉末为0.5g-300g、液体为2ml-100ml;波长范围:900nm-1700nm,使用950nm–1650nm;带宽:0.5nm-10nm可调;检测器:铟镓砷二极管阵列检测器;扫描次数:100次/s;光栅:镀金全息固定光栅;噪音:小于0.00006μA,3秒测量时间;光源寿命:大于10000h。
实施例5
一种沉香含油率近红外光谱预测模型的建立,包括如下步骤:
1.光谱采集:取沉香样品粉末5g,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用DA7200近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;近红外光谱数据预处理:对采集的光谱波段进行预处理,预处理方法采用二阶导数处理(Second Deviation,SD)+卷积平滑求导法(S-G)的组合,如图6所示;
2.按照《中国药典》(2010版)的测定方法测定沉香的含油量;
3.建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
4.未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取5g样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
所述的沉香样品粉末是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
所述《中国药典》(2010版)的测定方法为:取样品2~4g(m),称定重量,置150ml的锥形瓶中;准确加入95%乙醇100ml,塞紧,称定重量,静置1h;连接回流冷凝管,加热至沸腾(85℃),并保持微沸1h;冷却后,取下锥形瓶,密塞,称定重量,用乙醇补足减失的重量;100ml容量瓶定容,摇匀,干燥过滤;准确量取滤液50ml(M1),至已干燥的恒量的蒸发皿中;在水浴上蒸干后,于85℃干燥3h;移至干燥器中,冷却30min,迅速准确称定重量(M2);已干燥品计算供试品醇溶性浸出物的含量x(%):
x % = M 2 - M 1 m × 2
所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
所述的光谱采集是利用瑞典波通公司的DA7200近红外光谱分析仪和仪器自带的样品杯进行光谱采集,在使用近红外光谱仪扫描样品光谱之前,提前开机预热30min,待光源稳定时才开始采集光谱;光谱数据采集的实验条件为:测样方式为漫反射,光斑直径为3.5cm,光谱扫描范围为950~1650nm,分辨率为5nm,环境温度控制在22~23℃,环境湿度控制在30~70%。每一个沉香和木质部样品都采用扫描2次和重复装样3次取平均的光谱收集方式。
所述DA7200型近红外成份分析仪主要技术参数如下:光谱采集速度:约100条光谱每秒;样品扫描:非接触,向下照射,旋转样品杯;样品重量:固体或粉末为0.5g-300g、液体为2ml-100ml;波长范围:900nm-1700nm,使用950nm–1650nm;带宽:0.5nm-10nm可调;检测器:铟镓砷二极管阵列检测器;扫描次数:100次/s;光栅:镀金全息固定光栅;噪音:小于0.00006μA,3秒测量时间;光源寿命:大于10000h。

Claims (4)

1.一种沉香含油率近红外光谱预测模型的建立,其特征在于:包括如下步骤:
(1)光谱采集:取沉香样品粉末,放入近红外仪器样品杯中,使样品自然填满样品杯,自然摊平,勿震荡勿挤压,以空气为参比,扣除背景后采集近红外光谱,得样品的近红外光谱值,每一个沉香样品都采用重复装样3次和扫描3次的光谱收集方式;应用近红外光谱分析仪采集沉香粉的光谱数据,然后从SimplicityTM软件中将采集到的光谱数据以JCAMP-DX的格式导入化学计量学软件The Unscrambler9.8中,可以得到沉香粉样品的近红外原始光谱图;
(2)按照2010版《中国药典》的测定方法测定沉香的含油量;
(3)建立沉香含油量近红外校正模型:根据统计学方法结合沉香中含油量,将样品分为校正集和验证集两部分,将步骤(1)采集到的校正集样品的近红外光谱值和步骤(2)得到的校正集样品的含油量的化学值导入The Unscrambler 9.8软件中,利用软件对样品光谱进行预处理,采用偏最小二乘法结合交互验证法对校正集样品建立校正模型,同时作交互验证,并用验证集样品对所建模型进行外部验证,再根据近红外定量校正模型的主要参数确定得到最终的沉香含油量近红外预测模型;
(4)未知沉香样品含油量的快速测定:将未知沉香样品经过预处理制成样品粉末,取样品粉末,采用步骤(1)的方法采集其近红外光谱,将光谱经过预处理再将近红外光谱值带入步骤(3)建立的近红外预测模型中,经模型运算,即可获得未知沉香样品中的含油量。
2.根据权利要求1所述一种沉香含油率近红外光谱预测模型的建立,其特征在于:步骤(1)所述的沉香粉样品是指将采集到的沉香研磨成均匀粉末,过40目筛后收集得到的粉末。
3.根据权利要求1所述一种沉香含油率近红外光谱预测模型的建立,其特征在于:步骤(1)所述的近红外光谱条件为:测样方式为漫反射,光斑直径3.5cm,光谱扫描范围为950-1650nm,分辨率5nm,环境温度22-25℃,环境湿度45~55%,对样品集中的每一个样品扫描两次重复装样三次,取平均值作为样品光谱。
4. 根据权利要求1所述一种沉香含油率近红外光谱预测模型的建立,其特征在于:步骤(3)所述的外部验证,具体方法是利用校正模型对验证集光谱进行预测,即将验证集样品的近红外光谱值经过预处理代入步骤(3)得到的最终的近红外预测模型中,获得含油量,将预测含油量与步骤(2)含油量测定得到的对应的验证集样品的含油量进行统计分析,通过分析结果判定模型的预测准确度。
CN201510216871.1A 2015-04-30 2015-04-30 一种沉香含油率近红外光谱预测模型的建立 Pending CN104792722A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510216871.1A CN104792722A (zh) 2015-04-30 2015-04-30 一种沉香含油率近红外光谱预测模型的建立

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510216871.1A CN104792722A (zh) 2015-04-30 2015-04-30 一种沉香含油率近红外光谱预测模型的建立

Publications (1)

Publication Number Publication Date
CN104792722A true CN104792722A (zh) 2015-07-22

Family

ID=53557711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510216871.1A Pending CN104792722A (zh) 2015-04-30 2015-04-30 一种沉香含油率近红外光谱预测模型的建立

Country Status (1)

Country Link
CN (1) CN104792722A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105136686A (zh) * 2015-08-28 2015-12-09 河南科技大学 紫叶李叶片花青素含量的测定方法
CN106018329A (zh) * 2016-05-09 2016-10-12 广西大学 一种近红外光谱快速检测白砂糖指标的方法
CN106706547A (zh) * 2017-01-19 2017-05-24 华南农业大学 一种利用近红外光谱无损检测整粒麻疯树种籽含油量的方法
JP2017194426A (ja) * 2016-04-22 2017-10-26 株式会社松栄堂 沈香の品質評価方法
CN107860744A (zh) * 2017-11-01 2018-03-30 北京林业大学 一种沉香四醇含量的预测方法
CN108287046A (zh) * 2018-02-05 2018-07-17 广东轻工职业技术学院 一种车用发动机漏液检测仪器及方法
CN108318447A (zh) * 2018-05-04 2018-07-24 山东大学 一种基于近红外光谱技术快速测定吡喹酮对映体组成的方法
CN109116005A (zh) * 2018-08-31 2019-01-01 中国林业科学研究院林业研究所 一种日本落叶松木材化学性状检测方法
CN109724917A (zh) * 2018-12-26 2019-05-07 西安电子科技大学 基于神经网络及宽带滤波调制的分光方法
CN109765198A (zh) * 2019-01-10 2019-05-17 中国海洋石油集团有限公司 一种实时定量测量井下流体含油率的方法及其模型
CN110160987A (zh) * 2019-07-03 2019-08-23 温州大学 一种柴胡药材的质量快速检测方法
WO2019209099A1 (en) * 2018-04-23 2019-10-31 Universiti Malaysia Pahang (Ump) A method of determining grade of agarwood oil at ambient temperature
CN111272696A (zh) * 2020-03-24 2020-06-12 山东大学 一种快速检测普洱茶中掺杂香精的方法
CN111272695A (zh) * 2020-02-26 2020-06-12 北京市农林科学院 青花菜粉状原料中抗肿瘤成分前体物质3-甲基吲哚基硫苷含量的无损检测方法
CN111272694A (zh) * 2020-02-26 2020-06-12 北京市农林科学院 一种无损快速检测青花菜蔬菜粉中4-甲基硫氧丁基硫苷含量的方法
CN112179871A (zh) * 2020-10-22 2021-01-05 南京农业大学 一种酱类食品中己内酰胺含量无损检测的方法
CN112285055A (zh) * 2020-09-25 2021-01-29 贵州中烟工业有限责任公司 一种基于光谱投影的干燥过程终点测定方法
CN113933263A (zh) * 2021-10-11 2022-01-14 四川启睿克科技有限公司 基于指标拟合的近红外光谱模型建立方法
CN114112981A (zh) * 2020-08-27 2022-03-01 广东省林业科学研究院 一种阴香叶片精油含量快速检测方法及***
CN114486786A (zh) * 2022-03-03 2022-05-13 上海园林绿化建设有限公司 土壤有机质测定方法及测定***
WO2022141674A1 (zh) * 2020-12-30 2022-07-07 北京中科生仪科技有限公司 一种pcr检测仪及其方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010000910A1 (en) * 1997-04-18 2001-05-10 Zeltex, Inc. Multiple gain portable near-infrared analyzer
CN101299022A (zh) * 2008-06-20 2008-11-05 河南中医学院 利用近红外光谱技术评价中药药材综合质量的方法
CN102353643A (zh) * 2011-06-22 2012-02-15 中国林业科学研究院林产化学工业研究所 一种近红外漫反射光谱(nirs)快速测定油茶籽含油率的方法
CN103184102A (zh) * 2013-01-14 2013-07-03 中山市国林沉香科学研究所 一种沉香精油的提取方法及沉香精油的应用
CN104142311A (zh) * 2014-08-15 2014-11-12 华南农业大学 一种用近红外光谱技术预测火炬松松脂产量的方法
CN104155264A (zh) * 2014-08-15 2014-11-19 华南农业大学 一种用近红外光谱技术预测火炬松松脂中松节油含量的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010000910A1 (en) * 1997-04-18 2001-05-10 Zeltex, Inc. Multiple gain portable near-infrared analyzer
CN101299022A (zh) * 2008-06-20 2008-11-05 河南中医学院 利用近红外光谱技术评价中药药材综合质量的方法
CN102353643A (zh) * 2011-06-22 2012-02-15 中国林业科学研究院林产化学工业研究所 一种近红外漫反射光谱(nirs)快速测定油茶籽含油率的方法
CN103184102A (zh) * 2013-01-14 2013-07-03 中山市国林沉香科学研究所 一种沉香精油的提取方法及沉香精油的应用
CN104142311A (zh) * 2014-08-15 2014-11-12 华南农业大学 一种用近红外光谱技术预测火炬松松脂产量的方法
CN104155264A (zh) * 2014-08-15 2014-11-19 华南农业大学 一种用近红外光谱技术预测火炬松松脂中松节油含量的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈志雄等: "动态-微波辅助法提取沉香精油的中试工艺研究", 《食品科技》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105136686A (zh) * 2015-08-28 2015-12-09 河南科技大学 紫叶李叶片花青素含量的测定方法
JP2017194426A (ja) * 2016-04-22 2017-10-26 株式会社松栄堂 沈香の品質評価方法
CN106018329A (zh) * 2016-05-09 2016-10-12 广西大学 一种近红外光谱快速检测白砂糖指标的方法
CN106706547A (zh) * 2017-01-19 2017-05-24 华南农业大学 一种利用近红外光谱无损检测整粒麻疯树种籽含油量的方法
CN107860744A (zh) * 2017-11-01 2018-03-30 北京林业大学 一种沉香四醇含量的预测方法
CN108287046A (zh) * 2018-02-05 2018-07-17 广东轻工职业技术学院 一种车用发动机漏液检测仪器及方法
CN108287046B (zh) * 2018-02-05 2024-04-05 广东轻工职业技术学院 一种车用发动机漏液检测仪器及方法
WO2019209099A1 (en) * 2018-04-23 2019-10-31 Universiti Malaysia Pahang (Ump) A method of determining grade of agarwood oil at ambient temperature
CN108318447A (zh) * 2018-05-04 2018-07-24 山东大学 一种基于近红外光谱技术快速测定吡喹酮对映体组成的方法
CN108318447B (zh) * 2018-05-04 2020-12-18 山东大学 一种基于近红外光谱技术快速测定吡喹酮对映体组成的方法
CN109116005A (zh) * 2018-08-31 2019-01-01 中国林业科学研究院林业研究所 一种日本落叶松木材化学性状检测方法
CN109724917A (zh) * 2018-12-26 2019-05-07 西安电子科技大学 基于神经网络及宽带滤波调制的分光方法
CN109724917B (zh) * 2018-12-26 2021-01-22 西安电子科技大学 基于神经网络及宽带滤波调制的分光方法
CN109765198A (zh) * 2019-01-10 2019-05-17 中国海洋石油集团有限公司 一种实时定量测量井下流体含油率的方法及其模型
CN110160987A (zh) * 2019-07-03 2019-08-23 温州大学 一种柴胡药材的质量快速检测方法
CN111272694A (zh) * 2020-02-26 2020-06-12 北京市农林科学院 一种无损快速检测青花菜蔬菜粉中4-甲基硫氧丁基硫苷含量的方法
CN111272695A (zh) * 2020-02-26 2020-06-12 北京市农林科学院 青花菜粉状原料中抗肿瘤成分前体物质3-甲基吲哚基硫苷含量的无损检测方法
CN111272696A (zh) * 2020-03-24 2020-06-12 山东大学 一种快速检测普洱茶中掺杂香精的方法
CN114112981A (zh) * 2020-08-27 2022-03-01 广东省林业科学研究院 一种阴香叶片精油含量快速检测方法及***
CN112285055A (zh) * 2020-09-25 2021-01-29 贵州中烟工业有限责任公司 一种基于光谱投影的干燥过程终点测定方法
CN112285055B (zh) * 2020-09-25 2024-04-26 贵州中烟工业有限责任公司 一种基于光谱投影的干燥过程终点测定方法
CN112179871A (zh) * 2020-10-22 2021-01-05 南京农业大学 一种酱类食品中己内酰胺含量无损检测的方法
CN112179871B (zh) * 2020-10-22 2022-10-18 南京农业大学 一种酱类食品中己内酰胺含量无损检测的方法
WO2022141674A1 (zh) * 2020-12-30 2022-07-07 北京中科生仪科技有限公司 一种pcr检测仪及其方法
JP2023516354A (ja) * 2020-12-30 2023-04-19 北京中科生儀科技有限公司 Pcr検出器及びその方法
JP7438580B2 (ja) 2020-12-30 2024-02-27 北京中科生儀科技有限公司 Pcr検出器及びその方法
CN113933263A (zh) * 2021-10-11 2022-01-14 四川启睿克科技有限公司 基于指标拟合的近红外光谱模型建立方法
CN114486786A (zh) * 2022-03-03 2022-05-13 上海园林绿化建设有限公司 土壤有机质测定方法及测定***

Similar Documents

Publication Publication Date Title
CN104792722A (zh) 一种沉香含油率近红外光谱预测模型的建立
CN104062263B (zh) 光物性相近水果品质指标的近红外通用模型检测方法
Xiaobo et al. Use of FT-NIR spectrometry in non-invasive measurements of soluble solid contents (SSC) of ‘Fuji’apple based on different PLS models
Zhang et al. Rapid determination of leaf water content using VIS/NIR spectroscopy analysis with wavelength selection
US7698105B2 (en) Method and apparatus for improving performance of noninvasive analyte property estimation
CN100590417C (zh) 一种植物叶片生理指标无损检测方法
CN102879353B (zh) 近红外检测花生中蛋白质组分含量的方法
Luo et al. Robustness improvement of NIR-based determination of soluble solids in apple fruit by local calibration
He et al. Nondestructive determination of tomato fruit quality characteristics using VIS/NIR spectroscopy technique
CN104990895B (zh) 一种基于局部区域的近红外光谱信号标准正态校正方法
Xie et al. Applications of near-infrared systems for quality evaluation of fruits: A review
Zhu et al. Wavelength selection of hyperspectral scattering image using new semi-supervised affinity propagation for prediction of firmness and soluble solid content in apples
Chia et al. Neural network and principal component regression in non-destructive soluble solids content assessment: a comparison
CN103792198A (zh) 牛奶中掺三聚氰胺的中红外-近红外相关谱判别方法
Shetty et al. Development of NIR calibration models to assess year-to-year variation in total non-structural carbohydrates in grasses using PLSR
CN101446548A (zh) 基于响应量转换实现牛奶成分测量的装置及方法
CN103293118A (zh) 一种基于近红外光谱分析技术的潲水油鉴别方法
CN106950192A (zh) 一种基于近红外光谱分析技术的植物蛋白饮料中主要成分含量快速检测的方法
CN105092513B (zh) 一种测定混合药物中的药物成分的含量的方法
CN101780141A (zh) 一种近红外光谱测定丹参提取液中鞣质含量的方法
CN101791331B (zh) 一种快速测定丹参提取液中鞣质含量的方法
CN107917897A (zh) 近红外光谱测定特医食品多组分含量的方法
CN105784672A (zh) 一种基于双树复小波算法的毒品检测仪标准化方法
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
CN106198446A (zh) 近红外光谱快速测定艾纳香叶粉中左旋龙脑含量的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150722

RJ01 Rejection of invention patent application after publication