CN107273421B - 一种高准确性茶叶香气类型和品质的模式识别检测方法 - Google Patents

一种高准确性茶叶香气类型和品质的模式识别检测方法 Download PDF

Info

Publication number
CN107273421B
CN107273421B CN201710344596.0A CN201710344596A CN107273421B CN 107273421 B CN107273421 B CN 107273421B CN 201710344596 A CN201710344596 A CN 201710344596A CN 107273421 B CN107273421 B CN 107273421B
Authority
CN
China
Prior art keywords
type
tea
tea aroma
quality
aroma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710344596.0A
Other languages
English (en)
Other versions
CN107273421A (zh
Inventor
王进
于润泽
费少梅
常美茁
林海裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201710344596.0A priority Critical patent/CN107273421B/zh
Publication of CN107273421A publication Critical patent/CN107273421A/zh
Application granted granted Critical
Publication of CN107273421B publication Critical patent/CN107273421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/02Food
    • G01N33/14Beverages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Computational Linguistics (AREA)
  • Tea And Coffee (AREA)

Abstract

本发明公开了一种高准确性茶叶香气类型和品质的模式识别检测方法。通过气敏传感器采集已知、未知类型和品质的茶叶香气的香气数据,经特定处理获得样本向量;根据所有已知的不同类型和品质的茶叶香气构建模式识别模型;用模式识别模型识别未知类型和品质的茶叶香气的样本向量和已知类型和品质的茶叶香气的样本向量之间的相似性,根据相似性结果优化重复步骤重新构建模式识别模型,取相似性最高的茶叶香气的类型和品质作为识别结果。本发明适用于快速、准确、同步地得到茶叶的类型和品质,克服了相同类型不同品质的茶叶香气差异不大,难以准确识别的难点,扩大了检测适用范围,提高了检测准确性。

Description

一种高准确性茶叶香气类型和品质的模式识别检测方法
技术领域
本发明涉及了一种模式识别优化方法,尤其是涉及了一种高准确性茶叶香气类型和品质的模式识别检测方法。
背景技术
模式识别的方法多种多样,常用的包括PCA、LDA、BP神经网络等。而选取的方法是否高效准确,常常取决于数据有何特点。茶叶香气被电子鼻采集形成电信号数据,由于数据是由几个气敏传感器测得的,所以该数据可以通过预处理降维至与传感器数目构成倍数关系的维数。因此茶叶香气数据具有维数不大,样本采集成本较高的特点,使用PCA或LDA法进行识别可以满足要求。
然而,茶叶香气的另一特点是不同类型间差异很大,同一类型的不同品质间差异不大。如果希望同时识别出茶叶的类型和品质,则需要不同类型以及相同类型不同品质的茶叶香气数据在同一模式识别模型下有相近的分辨率,这与数据的特点相矛盾;或提高模式识别模型整体的分辨率,但这对样本数量、质量以及测量误差都有着很高的要求。
发明内容
为了解决背景技术中存在的问题,本发明提出了一种高准确性检测茶叶类型和品质的模式识别优化方法,通过改变预处理方法和模式识别方法建立多个模式识别模型,并通过改变限定条件对模型进行优化,从而获得一个或多个观察样本数据在模型中分布的角度,减少与待测茶叶差异较大的样本对建模的干扰,得到更加准确的模型。
本发明的技术方案包括如下步骤:
1)通过气敏传感器采集已知类型和品质的茶叶香气的香气数据,针对每一类型的茶叶香气采集有不同品质的香气数据,每个类型下每个品质的茶叶香气的数据值均经特定处理获得样本向量,并存入数据库;
2)通过气敏传感器采集未知类型和品质的茶叶香气的香气数据,经特定处理获得样本向量;
3)根据所有已知的不同类型和品质的茶叶香气构建模式识别模型;
4)用模式识别模型识别未知类型和品质的茶叶香气的样本向量与已知类型和品质的茶叶香气的样本向量之间的相似性,获得相似性结果;
5)根据相似性结果优化重复步骤重新构建模式识别模型,直至相似性结果达到要求;
6)判断数据库中是否存在与未知茶叶香气的类型和品质相匹配的已知茶叶香气:
若存在,则取相似性最高的茶叶香气的类型和品质作为识别结果,作为未知茶叶香气的类型和品质;
否则认为数据库中不包含未知茶叶香气所属的类型和品质。
所述步骤1)和2)中经特定处理获得样本向量具体是:针对每个传感器,求取传感器采集到原始数据的均值或方差最大时刻对应的电压值,作为样本向量。
均值为每个传感器在60s内电压值的均值。
方差最大对应时刻的电压值具体采用以下方式获得:针对传感器的每个采集时刻,计算该时刻所有已知类型和品质的茶叶香气的香气数据电压值的方差,取方差最大所在的时刻的传感器电压值。
具体解释如何求方差最大对应时刻。例如:步骤1共有5种已知类型和品质的茶叶香气,每种茶叶香气对应8个传感器,因此每秒能得到8个电压值,5种已知类型和品质的茶叶香气每秒共能得到40个电压值。假设检测时间为60秒,则计算第一秒的40个电压值的方差,第二秒的40个电压值的方差,以此类推直至第60秒。得到的60个方差取最大值,对应的时刻为方差最大对应时刻。
所述步骤2)的模式识别模型是采用PCA(主成分分析)法或LDA(线性判别分析)法对数据进行分别处理获得的PCA(主成分分析)模型或LDA(线性判别分析)模型。
所述步骤4)具体为:
4.1)未知类型和品质的茶叶香气的一个样本向量和不同已知类型的茶叶香气的多个样本向量分别与模式识别模型相乘后获得二维坐标,再将所有获得的各个二维坐标绘制在直角坐标系上;
4.2)求取每一已知类型的茶叶香气对应的多个二维坐标的均值作为该类型的茶叶香气的样本坐标中心,以未知类型和品质的茶叶香气对应的二维坐标分别和各个已知类型的茶叶香气对应的样本坐标中心之间距离中的最小值作为最小距离d;
4.3)以未知类型和品质的茶叶香气对应的二维坐标作为圆心,以最小距离d的M倍为半径构建圆,样本坐标中心在所述圆范围内所对应的茶叶香气与未知类型和品质的茶叶香气相似,去除不相似的茶叶香气对应的数据,保留相似的茶叶香气对应的数据,未知类型和品质的茶叶香气对应的二维坐标分别和已知类型的茶叶香气对应的样本坐标中心之间距离越近表示相似性越高,获得相似性结果。
具体实施的M为一个事先确定的定常数。
所述步骤5)具体为:取相似的茶叶香气重复步骤3)和步骤4),直至相似性结果达到要求。
相似性结果达到要求是指剩余茶叶香气只有一个已知类型的茶叶香气与类型和品质的茶叶香气相似,或者剩余茶叶香气所有已知类型的茶叶香气与类型和品质的茶叶香气相似。即使得达到具有一个相似结果或者所有结果同时相似的情况。
所述步骤6)具体为:取各个二维坐标到各自对应所属的样本坐标中心之间距离的最大值作为最大半径r,若未知类型的茶叶香气对应的二维坐标到各个已知类型的茶叶香气对应的样本坐标中心之间距离的最小值大于最大半径r的N倍,则数据库中不包含未知茶叶香气所属的类型和品质;否则以样本坐标中心到未知类型的茶叶香气对应的二维坐标之间距离最小所对应的茶叶香气类型作为未知茶叶香气的类型。
具体实施的N为一个事先确定的定常数。
由于本发明的样本向量可以采用两种方式获得,模式识别模型也可以采用两种方式获得,因此通过实施本发明可以建立不同的模型并得到识别结果,具体分别为均值-PCA法、均值-LDA法、最大方差时刻电压值-PCA法、最大方差时刻电压值-LDA法共4种方式,分别建立并迭代处理所得到的相似性最高的种类,每个模型均能够准确识别茶叶香气的种类。
本发明在实施例利用乌龙茶、红茶、毛尖、碧螺春以及龙井特级、一级、二级共7个种类的茶作为数据库样本,另一龙井一级样本作为待测样本即假设其类别未知,检测该待测样本来验证本发明的合理性和准确性。
本发明的有益效果是:
本发明在传统模式识别方法的基础上采用缩小建模范围、投票法等创新方法,实现快速、准确、同步地检测茶叶的类型和品质,克服了相同类型不同品质的茶叶香气差异不大,难以准确识别的难点,扩大了检测适用范围,提高了检测准确性。
附图说明
图1为本发明模式识别优化方法的流程框图;
图2为实施例第一次建立的模型后数据库中样本及待测样本对应的二维坐标的分布图。
图3为实施例第二次重新建立的新模型后四种类样本及待测样本对应的二维坐标的分布图。
图4为实施例第三次重新建立的新模型后三种类样本及待测样本对应的二维坐标的分布图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明的实施例如下:
1)采集并处理已知种类茶叶香气样本后存入数据库中
已有的茶叶种类包括:乌龙茶、红茶、毛尖、碧螺春以及龙井特级、一级、二级共7种。将这7种茶叶从1至7依次编号。每个种类取5份样品,每份5g,用250ml100℃沸腾适当的纯净水冲泡。冲泡5分钟后,茶水滤出,在500ml的烧杯中将茶底密封静置45min,使烧杯顶空富集茶叶挥发性成分,同时进行冷却以减少烧杯内水蒸气。静置时室温为25±1℃,湿度为80±2%。
抽取烧杯中的气体进入电子鼻腔体,以采集茶叶香气数据。电子鼻由8个传感器构成,每秒每个传感器读一次数,检测时间为60s。因此原始数据为60*8=480维。首先采用均值法处理原始数据,求每个传感器在60s内电压值的均值,从而将数据降为8维。采集并处理共7*5=35份样品后,将处理后的数据存入一张数据表中,每份样品对应的数据占一行,该行除8维均值外还有样品的种类编号,因此表中共有35行*9列的数据。由于数据较多,仅取乌龙茶、红茶、龙井特级三种(编号分别为1、2、3)作为示意列于表1。将表存入数据库中指定的位置。
表1均值法处理的已知种类茶叶香气样本数据(部分)
Figure BDA0001296146760000041
Figure BDA0001296146760000051
之后使用方差最大时刻电压值法处理原始数据。计算得到所有35份样本在第一秒处电压值的方差最大,因此将每份样本第一秒的数据存入数据表中,格式与均值法相同。
2)从7种类茶中任选1种另取一份样品采集并处理
为突出本发明效果,体现本发明能快速、准确、同步地得到茶叶的类型和品质的特点,本实施例选取龙井一级作为待测样本,检验本发明能否正确检测其类型和品质。
采集环境条件和采集、处理方法与1)相同。分别得到一行8维的均值数据和一行8维的第一秒采集值数据,存入本地待检验。均值数据列于表2。
表2均值法处理的待测种类茶叶香气样本数据
Figure BDA0001296146760000052
3)建立模式识别模型
本实施例以均值-LDA法为例介绍建模、优化的过程,另三种方法的建模、优化过程与之相似。
本实施例中,茶香气类型数量为7,样品数量为35。得到的模式识别模型为:
Figure BDA0001296146760000053
4)计算数据库中样本及待测样本对应的坐标
数据库中样本及待测样本对应的坐标在二维坐标系中的分布如图2所示。
5)寻找与待测样本相似性高的几种种类
如图2所示,计算待测样本坐标到各坐标中心距离的最小值为最小距离,记录坐标中心到待测样本坐标距离在最小距离的M倍范围内的种类为相似性高的种类。本实施例中,M取4。
图2中,待测样本距一级龙井的中心最近,与一级龙井相似性最高。满足种类坐标中心距待测样本距离在最小距离4倍范围内的种类包括(按距离远近即相似性高低排序):一级龙井、二级龙井、特级龙井、红茶。
6)优化模式识别模型
以一级龙井、二级龙井、特级龙井、红茶为原始数据重新采用均值-LDA法构建模式优化模型并更新绘制这四种类样本及待测样本对应的坐标图,坐标在二维坐标系中的分布如图3所示。
图3的新模型中,相似性最高的种类为二级龙井,满足相似性高定义的几种茶分别为(按距离远近即相似性高低排序):二级龙井、一级龙井、特级龙井。
以三个等级的龙井为限定条件再次优化模型并更新这三种类样本及待测样本对应的坐标。坐标在二维坐标系中的分布如图4所示。图4的新模型中,相似性最高的种类为一级龙井,且全部三种种类都为相似性高的种类,模型无法继续优化,达到要求。
如图4所示,实施例结果显示一级龙井为均值-LDA法的识别结果,这与先前设定的龙井一级作为待测样本相符。
本发明实施最终通过交叉检测法对实施例的35组样本数据进行实际测试,识别准确性高达97%。
由此可见,本发明能够缩小建模范围,实现快速、准确、同步地检测茶叶的类型和品质,克服了相同类型不同品质的茶叶香气差异不大,难以准确识别的难点,扩大了检测适用范围,提高了检测准确性。

Claims (5)

1.一种高准确性茶叶香气类型和品质的模式识别检测方法,其特征在于包括如下步骤:
1)通过气敏传感器采集已知类型和品质的茶叶香气的香气数据,针对每一类型的茶叶香气采集有不同品质的香气数据,每个类型下每个品质的茶叶香气的数据值均经特定处理获得样本向量,并存入数据库;
2)通过气敏传感器采集未知类型和品质的茶叶香气的香气数据,经特定处理获得样本向量;
3)根据所有已知的不同类型和品质的茶叶香气构建模式识别模型;
4)用模式识别模型识别未知类型和品质的茶叶香气的样本向量与已知类型和品质的茶叶香气的样本向量之间的相似性,获得相似性结果;
所述步骤4)具体为:
4.1)未知类型和品质的茶叶香气的一个样本向量和不同已知类型的茶叶香气的多个样本向量分别与模式识别模型相乘后获得二维坐标,再将所有获得的各个二维坐标绘制在直角坐标系上;
4.2)求取每一已知类型的茶叶香气对应的多个二维坐标的均值作为该类型的茶叶香气的样本坐标中心,以未知类型和品质的茶叶香气对应的二维坐标分别和各个已知类型的茶叶香气对应的样本坐标中心之间距离中的最小值作为最小距离d;
4.3)以未知类型和品质的茶叶香气对应的二维坐标作为圆心,以最小距离d的M倍为半径构建圆,样本坐标中心在所述圆范围内所对应的茶叶香气与未知类型和品质的茶叶香气相似,去除不相似的茶叶香气对应的数据,保留相似的茶叶香气对应的数据,未知类型和品质的茶叶香气对应的二维坐标分别和已知类型的茶叶香气对应的样本坐标中心之间距离越近表示相似性越高,获得相似性结果;
5)根据相似性结果优化重复步骤重新构建模式识别模型,直至相似性结果达到要求;
6)判断数据库中是否存在与未知茶叶香气的类型和品质相匹配的已知茶叶香气:
若存在,则取相似性最高的茶叶香气的类型和品质作为识别结果,作为未知茶叶香气的类型和品质;
否则认为数据库中不包含未知茶叶香气所属的类型和品质。
2.根据权利要求1所述的一种高准确性茶叶香气类型和品质的模式识别检测方法,其特征在于:所述步骤1)和2)中经特定处理获得样本向量具体是:针对每个传感器,求取传感器采集到原始数据的均值或方差最大时刻对应的电压值,作为样本向量。
3.根据权利要求1所述的一种高准确性茶叶香气类型和品质的模式识别检测方法,其特征在于:所述步骤2)的模式识别模型是采用PCA(主成分分析)法或LDA(线性判别分析)法对数据进行分别处理获得的PCA(主成分分析)模型或LDA(线性判别分析)模型。
4.根据权利要求1所述的一种高准确性茶叶香气类型和品质的模式识别检测方法,其特征在于:所述步骤5)具体为:取相似的茶叶香气重复步骤3)和步骤4),直至相似性结果达到要求。
5.根据权利要求1所述的一种高准确性茶叶香气类型和品质的模式识别检测方法,其特征在于:所述步骤6)具体为:取各个二维坐标到各自对应所属的样本坐标中心之间距离的最大值作为最大半径r,若未知类型的茶叶香气对应的二维坐标到各个已知类型的茶叶香气对应的样本坐标中心之间距离的最小值大于最大半径r的N倍,则数据库中不包含未知茶叶香气所属的类型和品质;否则以样本坐标中心到未知类型的茶叶香气对应的二维坐标之间距离最小所对应的茶叶香气类型作为未知茶叶香气的类型。
CN201710344596.0A 2017-05-16 2017-05-16 一种高准确性茶叶香气类型和品质的模式识别检测方法 Active CN107273421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710344596.0A CN107273421B (zh) 2017-05-16 2017-05-16 一种高准确性茶叶香气类型和品质的模式识别检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710344596.0A CN107273421B (zh) 2017-05-16 2017-05-16 一种高准确性茶叶香气类型和品质的模式识别检测方法

Publications (2)

Publication Number Publication Date
CN107273421A CN107273421A (zh) 2017-10-20
CN107273421B true CN107273421B (zh) 2020-10-23

Family

ID=60064068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710344596.0A Active CN107273421B (zh) 2017-05-16 2017-05-16 一种高准确性茶叶香气类型和品质的模式识别检测方法

Country Status (1)

Country Link
CN (1) CN107273421B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107991444B (zh) * 2017-11-28 2019-02-26 宁德师范学院 一种用于茶叶品质检测的方法及装置
CN110440892A (zh) * 2019-08-10 2019-11-12 徐州市澳新木制品有限公司 一种木质茶则
CN112528806B (zh) * 2020-12-02 2023-06-16 广东省农业科学院农业质量标准与监测技术研究所 基于仿生嗅觉的单丛茶香气类型分类方法、装置
CN112580741B (zh) * 2020-12-28 2021-08-06 天津同阳科技发展有限公司 一种基于多传感器快速学习的气体种类识别方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1226372A (zh) * 1997-12-23 1999-08-25 朱大恒 一种提高烟叶香气品质的方法
CN102435713A (zh) * 2010-09-21 2012-05-02 成都中医药大学 中药品质自动检测***

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101487825B (zh) * 2009-03-03 2011-11-16 中国农业大学 一种识别茶叶种类和/或等级的方法
US9282097B2 (en) * 2010-05-07 2016-03-08 Citrix Systems, Inc. Systems and methods for providing single sign on access to enterprise SAAS and cloud hosted applications
CN103134850B (zh) * 2013-03-01 2016-05-25 河南农业大学 一种基于特征香气的茶叶品质快速检测方法
CN103487537A (zh) * 2013-07-30 2014-01-01 中国标准化研究院 一种基于遗传算法优化西湖龙井茶产地检测方法
CN103487558B (zh) * 2013-07-30 2016-10-12 中国标准化研究院 一种应用智能感官信号进行茶叶品质的模式识别分析过程中检测异常样本的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1226372A (zh) * 1997-12-23 1999-08-25 朱大恒 一种提高烟叶香气品质的方法
CN102435713A (zh) * 2010-09-21 2012-05-02 成都中医药大学 中药品质自动检测***

Also Published As

Publication number Publication date
CN107273421A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN107273421B (zh) 一种高准确性茶叶香气类型和品质的模式识别检测方法
CN108182433B (zh) 一种表计读数识别方法及***
CN109978822B (zh) 一种基于机器视觉的香蕉成熟度评判建模方法和评判方法
CN102096921B (zh) 基于邻域对数比值及各向异性扩散的sar图像变化检测方法
CN113838054B (zh) 基于人工智能的机械零件表面损伤检测方法
CN109002859B (zh) 基于主成分分析的传感器阵列特征选择和阵列优化方法
CN109741314A (zh) 一种零件的视觉检测方法及***
TW201514472A (zh) 整合影像分析與資料挖礦之自動光學檢測缺陷影像分類方法
CN102982534B (zh) 基于弦线切线法的Canny边缘检测双阈值获取方法
CN112508105A (zh) 一种采油机故障检测与检索方法
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN108205645B (zh) 一种异源图像匹配***的基准图质量评价方法
CN106933977A (zh) 一种基于大数据挖掘分类剔除飞行参数野值的方法
CN106935038B (zh) 一种停车检测***及检测方法
CN102360503A (zh) 基于空间贴近度和像素相似性的sar图像变化检测方法
CN109993723A (zh) 一种基于机器视觉的枕簧分类检测方法
CN114776304A (zh) 一种深海矿产异常区识别的方法、装置、设备及介质
CN117093947B (zh) 一种发电柴油机运行异常监测方法及***
CN105718723B (zh) 一种质谱数据处理中谱峰位置检测方法
CN102982345B (zh) 基于连续小波变换的时序遥感影像半自动分类方法
CN106951924B (zh) 基于AdaBoost算法的地震相干体图像断层自动识别方法及***
CN116401535A (zh) 基于差分法的时序数据粗差识别方法及***
CN110020686A (zh) 一种基于群智感知传感数据的路面异常检测方法
CN110907015A (zh) 室内环境下的基于rfid的液位监测方法
CN114925731A (zh) 检测柔性测斜仪监测数据异常值的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant