CN107101972B - 一种近红外光谱快速检测三叶青产地方法 - Google Patents

一种近红外光谱快速检测三叶青产地方法 Download PDF

Info

Publication number
CN107101972B
CN107101972B CN201710371389.4A CN201710371389A CN107101972B CN 107101972 B CN107101972 B CN 107101972B CN 201710371389 A CN201710371389 A CN 201710371389A CN 107101972 B CN107101972 B CN 107101972B
Authority
CN
China
Prior art keywords
sample
place
radix tetrastigme
production
near infrared
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710371389.4A
Other languages
English (en)
Other versions
CN107101972A (zh
Inventor
蔡逢煌
赖添悦
彭昕
王武
柴琴琴
林琼斌
林双杰
林伟群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201710371389.4A priority Critical patent/CN107101972B/zh
Publication of CN107101972A publication Critical patent/CN107101972A/zh
Application granted granted Critical
Publication of CN107101972B publication Critical patent/CN107101972B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • G01N1/286Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q involving mechanical work, e.g. chopping, disintegrating, compacting, homogenising

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种近红外光谱快速鉴别三叶青产地的方法。由于三叶青近红外光谱数据还未完善,因此在其产地鉴别上,应对鉴别算法提出更高的要求,即在实现三叶产地鉴别的同时,还要能够有效地识别出其它或未知新产地的三叶青。针对这一问题,本文结合三叶青近红外光谱数据的特点,对算法共做了三方面改进:①从距离的角度估计样本的概率密度;②以训练样本可信度的方式计算带宽参数;③在未知新产地的识别上,提出一种基于训练集样本的概率密度函数的识别方法。本发明提出一种新的特征波长选择方法,其操作简单,通用性强,能够有效提高定量模型,稳健性与准确性。

Description

一种近红外光谱快速检测三叶青产地方法
技术领域
本发明属于中草药产地鉴别领域,具体涉及一种近红外光谱快速检测三叶青产地方法。
背景技术
三叶青是我国特有的珍稀中草药材,具含有酚类、氨基酸类、黄酮类、萜类、强心苷类、甾体类等成分。研究表明其具有保护肝脏、抗病毒、抗炎镇痛、抗肿瘤,临床上对麻疹并发肺炎、小儿高热、扁桃体炎等多种疾病也有显著疗效。由于三叶青特殊的药用价值,需求量越来越大。然而,三叶青资源十分短缺,野生三叶青稀少,人工栽培难度大,具有药用价值的地下块根需要3~5年的时间才能达到商品药材要求,而且其不同产地、不同种质的植物学特征特性、地下块根产量以及有效成分含量存在明显差异。据报道,三叶青中黄酮类成分含量不同产地差异悬殊,如浙江和广西产地间黄酮类成分含量差异最大可达到7倍。现阶段,主要对三叶青的药用价值及其化学成分进行研究,针对其产地鉴别却鲜有报导,而一种针对三叶青产地鉴别的有效方法,对规范三叶青市场、保护消费者利益具有非常重要的现实意义。
传统中药材鉴定手段主要是依据其外部形态、显微结构和化学成分,甚至依靠有经验医师的主观判断。但由于植物根类药材大多外部形态相似,特别经过加工和饮片泡制后,难以看出具本身形状和颜色,显微特征也被不同程度破坏,造成鉴定困难。这种鉴定方法对专业要求高,化学成分鉴定过程复杂,鉴定成本高。
近红外光谱分析技术作为一种新型实用分析技术,反映给定样品的物理和化学信息,不仅适用于固体、液体、气体样品分析,而且具有快速、非破坏性、廉价和样品量少等优点。近年来,近红外光谱分析技术结合主成分分析法(Principal Component Analysis,PCA)、支持向量机(Support Vector Machine,SVM)、相关向量机(Relevance VectorMachine,RVM)等分析方法,在食品、生物、药品、石化、环境等方面得到广泛应用。
上述分类器必须事先利用训练集中的各类样本数据对模型本身进行训练,才能够对训练集中的各类实现鉴别,在分类过程中,不同分类器的按照其各自的分类机制,将待测样本匹配为训练集中的某一类,从而实现分类,但这就要求待测样本必须属于训练样本中的其中一类,分类器才能做出正确的鉴别,而当待测样本属于训练集样本之外的其它类时,则无法做出正确的鉴别。
发明内容
本发明的目的是提供一种近红外光谱快速检测三叶青产地方法,防止三叶青以次充好。
本发明采用以下技术方案:一种近红外光谱快速检测三叶青产地方法,具特征在于:采用基于核密度估计的改进算法进行定性分析,具体步骤包括如下:S1:采集各重点产地的三叶青样本,利用近红外光谱分析仪采集其近红外光谱,建立一个常见三叶青近红外光谱数据库;S2:建立一个基于核密度估计分类算法的三叶青产地分类模型。
在本发明一实施例中,S2包括以下步骤:S21:确定分类器的基本模型,如下:
Figure GDA0002160950140000021
其中K(*)为核函数;k指训练样本中的第k类样本,且k=1,2,L,……,c,其中c为总类别数;nk为训练集样本中第k类的样本数;h(k)为核函数K(*)的带宽参数;取第k类训练集样本的均值作为簇类中心,记为u(k);S22:针对整个三叶青近红外光谱数据库概率密度函数计算如下:
Figure GDA0002160950140000022
S23:以权重的形式实现分类,及其分类原则如下:
Figure GDA0002160950140000023
分类的原则可以设计如下:分类原则1:如果ρ(k)=max{ρ(1),ρ(2),…,ρ(c)};则待测样本属于第k类,分类原则2:当
Figure GDA0002160950140000024
时;待测样本属于已知类;当
Figure GDA0002160950140000025
时;待测样本属于未知类;将训练样本对应的所有
Figure GDA0002160950140000028
函数值中的最小值作为阈值,即
Figure GDA0002160950140000026
r属于训练样本集。
较佳的,核函数K(*)为:K(x)=exp(-x),(x≥0)。
较佳的,带宽参数h(k)的计算公式为:
Figure GDA0002160950140000027
与传统的中草药产地鉴别方法过程复杂,可靠性低,本发明的方法操作简单,通用性强,能够有效提高定量模型稳健性与准确性。
附图说明
图1基于核密度估计的分类算法实施图。
图2为各产地近红外光谱图。
具体实施方式
下面结合附图和具体实施例对本发明做进一步解释说明。
一种近红外光谱快速检测三叶青产地方法,其特征在于:采用基于核密度估计的改进算法进行定性分析,具体步骤包括如下:S1:采集各重点产地的三叶青样本,利用近红外光谱分析仪采集其近红外光谱,建立一个常见三叶青近红外光谱数据库;S2:建立一个基于核密度估计分类算法的三叶青产地分类模型。
在本发明一实施例中,S2包括以下步骤:S21:确定分类器的基本模型,如下:
其中K(*)为核函数;k指训练样本中的第k类样本,且k=1,2,L,……,c,其中c为总类别数;nk为训练集样本中第k类的样本数;h(k)为核函数K(*)的带宽参数;取第k类训练集样本的均值作为簇类中心,记为u(k);S22:针对整个三叶青近红外光谱数据库概率密度函数计算如下:
Figure GDA0002160950140000032
S23:以权重的形式实现分类,及其分类原则如下:
Figure GDA0002160950140000033
分类的原则可以设计如下:分类原则1:如果ρ(k)=max{ρ(1),ρ(2),…,ρ(c)};则待测样本属于第k类,分类原则2:当
Figure GDA0002160950140000034
时;待测样本属于已知类;当
Figure GDA0002160950140000035
时;待测样本属于未知类;将训练样本对应的所有
Figure GDA0002160950140000036
函数值中的最小值作为阈值,即
Figure GDA0002160950140000037
r属于训练样本集。
本发明的基于核密度估计的分类算法实施图,参见图1。
较佳的,核函数K(*)为:K(x)=exp(-x),(x≥0)。
较佳的,带宽参数h(k)的计算公式为:
Figure GDA0002160950140000038
在本发明一具体实施例中,
1三叶青近红外采集
(1)采集浙江、云南、安徽、广西和湖北5个产地的三叶青样本,每个产地收集5份,每份样品不少于30g。每份样本均用中药粉碎机粉碎,过200目筛,充分混匀,置于烘箱65℃干燥,存放于自封袋,备用。
(2)实验采用美国Thermo公司生产的ANTARIS II型傅里叶变换近红外光谱分析仪,配有InGaAs检测器、积分球漫反射采样***和旋转石英样品杯,扫描范围10000~4000cm-1,分辨率为8cm-1,扫描64次。每次称取样品约10g,置于近红外旋转样品杯扫描光谱。各产地近红外光谱图参见图2。
2.样本分配情况如表1所示:
表1样本分配情况
Figure GDA0002160950140000041
3.带宽参数计算,取参数α=0.98,按公式(3)计算如下:
h(1)=0.0275,h(2)=0.0398,h(3)=0.0502,h(4)=0.0269
4.模型的鉴别情况
(1)模型训练完成后,先用训练集中的样本数据对模型的鉴别精度进行检验,结果如表3所示,不管选取哪一产地的三叶青为未知产地,分类器对训练集中样本数据的鉴别精度均可以达到100%。
表3训练集的鉴别精度
Figure GDA0002160950140000042
(2)三叶青产地的鉴别模型建立完成之后,最重要的是其预测精度是否能到要求,表4展示了其对预测集样本的鉴别精度,从表中可知,分类器对浙江产地的三叶青的预测精度为100%;对云南产地的三叶青的预测精度为100%;对安徽产地的三叶青的预测精度为90%(20组数据中有2组被误识别为未知产地);对广西产地的三叶青的预测精度为95%(20组数据中有1组被误识别为未知产地);且可以100%将湖北产地的三叶青识别为未知产地,而不是误识别为训练集中的某一类。
表4分类器对预测集样本的鉴别情况
Figure GDA0002160950140000043
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (1)

1.一种近红外光谱快速检测三叶青产地方法,其特征在于:采用基于核密度估计的改进算法进行定性分析,具体步骤包括如下:
S1:采集各重点产地的三叶青样本,利用近红外光谱分析仪采集其近红外光谱,建立一个常见三叶青近红外光谱数据库;
S2:建立一个基于核密度估计分类算法的三叶青产地分类模型;
S2包括以下步骤:
S21:确定分类器的基本模型,如下:
Figure FDA0002152383020000011
其中K(*)为核函数;k指训练样本中的第k类样本,且k=1,2,……,c,其中c为总类别数;nk为训练集样本中第k类的样本数;h(k)为核函数K(*)的带宽参数;取第k类训练集样本的均值作为簇类中心,记为u(k);N为总样本数量;
S22:针对整个三叶青近红外光谱数据库概率密度函数计算如下:
Figure FDA0002152383020000012
S23:以权重的形式实现分类,及其分类原则如下:
Figure FDA0002152383020000013
分类的原则可以设计如下:
分类原则1:如果ρ(k)=max{ρ(1),ρ(2),...,ρ(c)},则待测样本属于第k类,
分类原则2:当
Figure FDA0002152383020000014
时;待测样本属于已知类;当
Figure FDA0002152383020000015
时;待测样本属于未知类;
将训练样本对应的所有
Figure FDA0002152383020000016
函数值中的最小值作为阈值,即
Figure FDA0002152383020000017
r属于训练样本集;
核函数K(*)为:K(x)=exp(-x),x≥0;
带宽参数h(k)的计算公式为:
Figure FDA0002152383020000018
CN201710371389.4A 2017-05-24 2017-05-24 一种近红外光谱快速检测三叶青产地方法 Active CN107101972B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710371389.4A CN107101972B (zh) 2017-05-24 2017-05-24 一种近红外光谱快速检测三叶青产地方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710371389.4A CN107101972B (zh) 2017-05-24 2017-05-24 一种近红外光谱快速检测三叶青产地方法

Publications (2)

Publication Number Publication Date
CN107101972A CN107101972A (zh) 2017-08-29
CN107101972B true CN107101972B (zh) 2019-10-15

Family

ID=59670446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710371389.4A Active CN107101972B (zh) 2017-05-24 2017-05-24 一种近红外光谱快速检测三叶青产地方法

Country Status (1)

Country Link
CN (1) CN107101972B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110110789A (zh) * 2019-05-08 2019-08-09 杭州麦迪特检测技术服务有限公司 一种基于多谱图信息融合技术的中草药品质鉴别方法
CN111169937B (zh) * 2020-01-06 2022-06-07 山东大学 一种中药原材料智能投料***
CN113466224B (zh) * 2021-06-30 2024-05-14 宁波慈溪生物医学工程研究所 用于鉴别三叶青产地的阵列传感器及其制备方法与应用

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317517B1 (en) * 1998-11-30 2001-11-13 Regents Of The University Of California Statistical pattern recognition
CN102081740B (zh) * 2011-03-07 2012-12-12 中国科学院自动化研究所 一种基于尺度不变特征的三维图像分类方法
CN102254180B (zh) * 2011-06-28 2014-07-09 北京交通大学 一种基于几何特征的人脸美感分析方法
CN105740898A (zh) * 2016-01-29 2016-07-06 广西中烟工业有限责任公司 一种利用光谱特征向量结合主成分分析建立分类模型的方法
CN106560694A (zh) * 2016-10-20 2017-04-12 中国计量大学 基于多种检验技术的武夷岩茶产地智能鉴别方法

Also Published As

Publication number Publication date
CN107101972A (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
Cai et al. Using FTIR spectra and pattern recognition for discrimination of tea varieties
CN104316491B (zh) 基于同步‑异步二维近红外相关谱检测牛奶掺尿素的方法
CN107101972B (zh) 一种近红外光谱快速检测三叶青产地方法
Yao et al. Geographic identification of Boletus mushrooms by data fusion of FT-IR and UV spectroscopies combined with multivariate statistical analysis
CN101975845A (zh) 中药品质自动检测***
CN103389281A (zh) 一种基于近红外光谱技术的普洱茶聚类分析方法
CN101256177A (zh) 中药数字化色谱指纹谱相似度评价***
Yang et al. Rapid discrimination of adulteration in Radix Astragali combining diffuse reflectance mid-infrared Fourier transform spectroscopy with chemometrics
CN107132194A (zh) 一种基于紫外可见光谱及化学模式识别的三七及其伪品鉴别方法
Ma et al. Efficient identification of Bachu mushroom by flourier transform infrared (FT-IR) spectroscopy coupled with PLS-GS-SVM
Li et al. Multi-information based on ATR-FTIR and FT-NIR for identification and evaluation for different parts and harvest time of Dendrobium officinale with chemometrics
Zhang et al. Identification and evaluation of Polygonatum kingianum with different growth ages based on data fusion strategy
CN101957316A (zh) 一种用近红外光谱技术鉴别响水大米的方法
Li et al. Fine classification and untargeted detection of multiple adulterants of Gastrodia elata BI.(GE) by near-infrared spectroscopy coupled with chemometrics
Lin et al. A novel method for geographical origin identification of Tetrastigma hemsleyanum (Sanyeqing) by near-infrared spectroscopy
CN106226267B (zh) 一种辣椒干色价的近红外测定方法
Fan et al. Geographical-origin discrimination and volatile oil quantitative analysis of Zanthoxylum bungeanum Maxim. with a portable near-infrared spectrometer
CN107290304A (zh) 一种对三七及其伪品的快速鉴别方法
Guo et al. The combination of NIR spectroscopy and HPLC chromatography for differentiating lotus seed cultivars and quantitative prediction of four main constituents in lotus with the aid of chemometrics
Jiang et al. Near-infrared spectroscopy combined with machine learning for rapid identification of Atractylodis rhizoma decoction pieces
Li et al. Ultraviolet spectroscopy used to fingerprint five wild‐grown edible mushrooms (Boletaceae) collected from Yunnan, China
CN113176227A (zh) 一种快速预测河南石斛掺伪霍山石斛的方法
CN109685099A (zh) 一种光谱波段优选模糊聚类的苹果品种辨别方法
Zou et al. Comparative study of distance discriminant analysis and BP neural network for identification of rapeseed cultivars using visible/near infrared spectra
Tan et al. Rapid and non-destructive discrimination of tea varieties by near infrared diffuse reflection spectroscopy coupled with classification and regression trees

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Cai Fenghuang

Inventor after: Lai Tianyue

Inventor after: Peng Cuan

Inventor after: Wang Wu

Inventor after: Chai Qinqin

Inventor after: Lin Qiongbin

Inventor after: Lin Shuangjie

Inventor after: Lin Weiqun

Inventor before: Cai Fenghuang

Inventor before: Lai Tianyue

Inventor before: Wang Wu

Inventor before: Chai Qinqin

Inventor before: Lin Qiongbin

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant