CN112528806A - 基于仿生嗅觉的单丛茶香气类型分类方法、装置 - Google Patents
基于仿生嗅觉的单丛茶香气类型分类方法、装置 Download PDFInfo
- Publication number
- CN112528806A CN112528806A CN202011402079.2A CN202011402079A CN112528806A CN 112528806 A CN112528806 A CN 112528806A CN 202011402079 A CN202011402079 A CN 202011402079A CN 112528806 A CN112528806 A CN 112528806A
- Authority
- CN
- China
- Prior art keywords
- aroma type
- clump
- tea
- type classification
- characteristic variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Medicinal Chemistry (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Combustion & Propulsion (AREA)
- Signal Processing (AREA)
- Food Science & Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Sampling And Sample Adjustment (AREA)
Abstract
本申请涉及一种基于仿生嗅觉的单丛茶香气类型分类方法、装置、计算机设备和存储介质。该方法包括:获取单丛茶茶叶的校正样本集;其中,校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本;利用具有传感器阵列的电子鼻采集校正样本的挥发物气体与传感器阵列发生作用的时序传感信号;从时序传感信号中提取特征变量值,对特征变量值进行标准化预处理后构建特征变量矩阵;根据特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。采用本方法能够快速、高效地对单丛茶茶叶样本进行香气类型分类。
Description
技术领域
本申请涉及品质检测技术领域,特别是涉及一种基于仿生嗅觉的单丛茶香气类型分类方法、装置、计算机设备和存储介质。
背景技术
单丛茶是世界三大高香茶之一,主要生产于中国广东省潮州市。2018年数据显示,潮州市单丛茶种植面积达到19.3万亩,茶叶总产量2.4万吨,产值超过35亿元。例如,潮州花香型“凤凰单丛茶”和蜜香型“岭头单丛茶”是该地区两个主打产品,于2013年均获得地理标志保护产品。为提升单丛茶产业效益,在实现单丛茶现代化、规模化生产过程中,保障香气类型品质是的单丛茶品质控制的重要一环。
传统的针对单丛茶香气类型的分类,主要通过人工审评的方式来实现,该方法需要对样本进行破坏检测。而且,人工审评的结果受评审员的主观意识和生理状态影响,不利于得出精度高和重复性好的检测结果。针对茶叶香气类型检测方法中,尚未有可快速分类单丛茶香气类型的技术和方法。可见开发单丛茶香气类型快速分类方法,实现单丛茶香气类型快速分类,对提升单丛茶产业发展水平具有重要的生产实践意义。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高单丛茶香气类型分类效率的基于仿生嗅觉的单丛茶香气类型分类方法、装置、计算机设备和存储介质。
一种基于仿生嗅觉的单丛茶香气类型分类方法,该方法包括:
获取单丛茶茶叶的校正样本集;其中,所述校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本;
利用具有传感器阵列的电子鼻采集所述校正样本的挥发物气体与所述传感器阵列发生作用的时序传感信号;
从所述时序传感信号中提取特征变量值,对所述特征变量值进行标准化预处理后构建特征变量矩阵;
根据所述特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。
在一个实施例中,时序传感信号包括芳香苯类成分、氨氧化物成分、氨类成分、氢气成分、烷烃成分、甲烷成分、硫化氢成分、乙醇成分、硫化氢类成分,和/或芳香烷烃类成分的时序传感信号。
在一个实施例中,从所述时序传感信号中提取特征变量值,包括:
提取预设采样时间内所述时序传感信号的数据曲线的最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值,和/或一阶导数平均值作为特征变量值。
在一个实施例中,该方法还包括:
运用交叉验证方法对所述单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型。
在一个实施例中,运用交叉验证方法对所述单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型,包括:
获取所述单丛茶香气类型分类模型的交叉验证模型的均方根误差与潜变量个数的第一关系曲线;
获取所述单丛茶香气类型分类模型的交叉验证模型的分类平均错误率与潜变量个数的第二关系曲线;
根据所述第一关系曲线和所述第二关系曲线确定目标潜变量个数,根据所述目标潜变量个数确定最优的单丛茶香气类型分类模型。
在一个实施例中,该方法还包括:
获取单丛茶茶叶的测试样本集;其中,所述测试样本集中包括多个不同香气类型的单丛茶茶叶的测试样本;
利用所述单丛茶香气类型分类模型对所述测试样本的香气类型进行分类以对所述单丛茶香气类型分类模型的有效性进行验证。
在一个实施例中,校正样本的挥发物气体的获取方法,包括:
称取各所述校正样本15g,分别装入350mL烧杯中,使用密封膜对烧杯的杯口进行密封处理;密封处理后的烧杯放置在26±1℃室温环境中静置60min以上,待密封处理后的烧杯顶空的气体饱和稳定后,从烧杯的顶空获取各所述校正样本的挥发物气体。
在一个实施例中,在所述利用具有传感器阵列的电子鼻采集所述校正样本的挥发物气体与所述传感器阵列发生作用的时序传感信号之前,还包括:
对所述电子鼻的采样参数进行设置;其中,采样时间为100s,采样时间间隔为1s,传感器阵列单元的自动清洗时间为60s,传感器阵列单元的归零时间为10s,挥发物的进气速度为240mL/min。
在一个实施例中,该方法还包括:
利用构建的单丛茶香气类型分类模型对未知香气类型的单丛茶茶叶的待分类样本进行香气类型分类。
一种基于仿生嗅觉的单丛茶香气类型分类装置,该装置包括:
校正样本获取模块,用于获取单丛茶茶叶的校正样本集;其中,所述校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本;
传感信号采集模块,用于利用具有传感器阵列的电子鼻采集所述校正样本的挥发物气体与所述传感器阵列发生作用的时序传感信号;
特征变量提取模块,用于从所述时序传感信号中提取特征变量值,对所述特征变量值进行标准化预处理后构建特征变量矩阵;
分类模型构建模块,用于根据所述特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于仿生嗅觉的单丛茶香气类型分类方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述基于仿生嗅觉的单丛茶香气类型分类方法的步骤。
上述基于仿生嗅觉的单丛茶香气类型分类方法、装置、计算机设备和存储介质,获取单丛茶茶叶的校正样本,利用电子鼻采集各校正样本的时序传感信号,从时序传感信号中提取特征变量值构建特征变量矩阵,并利用特征变量矩阵结合香气类型标签构建单丛茶香气类型分类模型。利用该单丛茶香气类型分类模型可以在不破坏样本的情况下,实现对样本香气类型的快速分类,满足规模化生产中的对单丛茶香气类型快速、无损检测的需求。
附图说明
图1为一个实施例中基于仿生嗅觉的单丛茶香气类型分类方法的流程示意图;
图2为一个应用实例中基于仿生嗅觉的单丛茶香气类型分类方法的技术构架图;
图3为一个应用实例中各茶叶样品的时序传感信号图;
图4为一个应用实例中包含90个单丛茶样本的特征变量矩阵热力图;
图5为一个应用实例中利用偏最小二乘算法建立的单丛茶香气类型分类模型的分类结果随潜变量个数变化的趋势图;
图6为一个实施例中基于仿生嗅觉的单丛茶香气类型分类装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了便于理解本发明,下面将参照实施例对本发明进行更全面的描述,以下给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。应理解,下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用试剂,均为市售产品。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
在一个实施例中,如图1所示,提供了一种基于仿生嗅觉的单丛茶香气类型分类方法,包括以下步骤:
步骤S10:获取单丛茶茶叶的校正样本集;其中,校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本。
其中,单丛茶是世界三大高香茶之一,为提升单丛茶产业效益,在实现单丛茶现代化、规模化生产过程中,保障单丛茶的香气类型是的单丛茶品质控制的重要一环。具体地,在校正样本的选取时,可以尽量选择充足数量的样本,且样本最好为不同香气类型的无损伤、无受潮、无污染的单丛茶茶叶样本。优选的,校正样本的数量不少于60。
步骤S20:利用具有传感器阵列的电子鼻采集校正样本的挥发物气体与传感器阵列发生作用的时序传感信号。
具体地,电子鼻是一种利用气体传感器阵列的响应来识别气味的电子***,校正样本具有一定的挥发性,利用电子鼻分别对各校正样本中的挥发性物质形成的挥发物气体进行采集,该挥发物气体与电子鼻中的传感器阵列相接触后发生作用产生时序传感信号。
在一个实施例中,校正样本的挥发物气体的获取方法,包括:称取各校正样本15g,分别装入350mL烧杯中,使用密封膜对烧杯的杯口进行密封处理;密封处理后的烧杯放置在26±1℃室温环境中静置60min以上,待密封处理后的烧杯顶空的气体饱和稳定后,从烧杯的顶空获取各校正样本的挥发物气体。
采用本实施例的校正样本的挥发物气体的获取方法,可以得到各校正样本的稳定性较高的挥发物气体,从而提高后续时序传感信号采集的准确性,可以更加准确、全面地反映样本成分特征。
在一个实施例中,在利用具有传感器阵列的电子鼻采集校正样本的挥发物气体与传感器阵列发生作用的时序传感信号之前,还包括:对电子鼻的采样参数进行设置;其中,采样时间为100s,采样时间间隔为1s,传感器阵列单元的自动清洗时间为60s,传感器阵列单元的归零时间为10s,挥发物的进气速度为240mL/min。
在本实施例中,在利用电子鼻对样本的挥发物气体进行采集之前,还可以根据需求对电子鼻的采样参数进行设置,以提高采样的准确性。采样参数可以根据样本品类、精确度需求等进行调整。优选的,采样时间为100s,采样时间间隔为1s,传感器阵列单元的自动清洗时间为60s,传感器阵列单元的归零时间为10s,挥发物的进气速度为240mL/min,采用该采样参数可以确保样本的挥发物气体与传感器阵列的充分接触,从而提高后续计算的准确性。
在一个实施例中,时序传感信号包括芳香苯类成分、氨氧化物成分、氨类成分、氢气成分、烷烃成分、甲烷成分、硫化氢成分、乙醇成分、硫化氢类成分和/或芳香烷烃类成分的时序传感信号。
在本实施例中,单丛茶茶叶的校正样本的挥发物成分可以包括芳香苯类成分、氨氧化物成分、氨类成分、氢气成分、烷烃成分、甲烷成分、硫化氢成分、乙醇成分、硫化氢类成分和芳香烷烃类成分。具体地,可以对应选择包括能够与上述挥发物成分反应产生时序传感信号的传感器阵列单元的电子鼻进行采样,例如,可以利用德国AIRSENSE公司制造的PEN3.5型电子鼻仪器,采用获取名称为W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W和W3S的传感器阵列单元的时序传感信号,上述各传感器阵列单元分别对应检测芳香苯类成分、氨氧化物成分、氨类成分、氢气成分、烷烃成分、甲烷成分、硫化氢成分、乙醇成分、硫化氢类成分和芳香烷烃类成分的时序传感信号。
步骤S30:从时序传感信号中提取特征变量值,对特征变量值进行标准化预处理后构建特征变量矩阵。
具体地,特征变量值指的是能够反映时序信号数据曲线基本特征信息的变量值。提取特征变量值的维度不限,例如,可以从预设采样时间内的时序传感信号数据中提取最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值和/或一阶导数平均值作为特征变量值。
在一个实施例中,从时序传感信号中提取特征变量值,包括:提取预设的采样时间内时序传感信号的数据曲线的最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值和/或一阶导数平均值作为特征变量值。
本实施例,通过从上述的维度提取特征变量值可以得到更加准确且全面反映各样本时序传感信号基本特征的数据。
具体地,上述特征变量值的数学表达式可以分别如式(1)、式(2)、式(3)、式(4)、式(5)、式(6)所示。
x稳定值=xt,t=85s (3)
其中,式(1)、式(2)、式(3)、式(4)、式(5)、式(6)中xt表示单个传感器阵列单元在ts时刻的读数,dt表示对时间t的微分。
进一步地,可以对提取的特征变量值进行标准化预处理,标准化预处理可以采用下述式(7)计算得到,标准化预处理后特征变量的均值为0,方差为1。
步骤S40:根据特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。
其中,香气类型标签的确定标准不限,例如,可以参考国家标准(GB/T 23776-2018)进行确定。具体地,可以运用偏最小二乘判别分析算法等数学建模方法,基于各校正样本的特征变量矩阵以及香气类型标签建立用于判断单从茶茶叶香气类型的分类检测模型。
上述基于仿生嗅觉的单丛茶香气类型分类方法,获取单丛茶茶叶的校正样本,利用电子鼻采集各校正样本的时序传感信号,从时序传感信号中提取特征变量值构建特征变量矩阵,并利用特征变量矩阵结合香气类型标签构建单丛茶香气类型分类模型。利用该单丛茶香气类型分类模型可以在不破坏样本的情况下,实现对样本香气类型的快速分类,满足规模化生产中的对单丛茶香气类型快速、无损检测的需求。
在一个实施例中,上述方法还包括:运用交叉验证方法对单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型。
本实施例,通过利用交叉验证方法对基于校正集样本建立的单丛茶香气类型分类模型的检测结果进行分析,并基于检测结果调整模型建立的相关参数,确定出检测结果最优的建模参数,再基于该建模参数确定最优的单丛茶香气类型分类模型,从而提高单丛茶香气类型分类模型在后续实际分类过程中对未知样本分类的准确性和精度。
在一个实施例中,运用交叉验证方法对单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型,包括:获取单丛茶香气类型分类模型的交叉验证模型的均方根误差与潜变量个数的第一关系曲线;获取单丛茶香气类型分类模型的交叉验证模型的分类平均错误率与潜变量个数的第二关系曲线;根据第一关系曲线和第二关系曲线确定目标潜变量个数,根据目标潜变量个数确定最优的单丛茶香气类型分类模型。
在本实施例中,通过运用交叉验证法,构建单丛茶香气类型分类模型的交叉验证模型的均方根误差与潜变量个数之间的关系曲线作为第一关系曲线,构建单丛茶香气类型分类模型的交叉验证模型的分类平均错误率与潜变量个数之间的关系曲线作为第二关系曲线,通过分析第一关系曲线确定均方根误差最小时的第一潜变量个数,通过分析第二关系曲线确定分类平均错误率最小时的第二潜变量个数,综合第一潜变量个数和第二潜变量个数确定目标潜变量个数。优选的,第一潜变量个数为4,第二潜变量个数为4和5,目标潜变量个数为4。
本实施例,通过交叉验证方法构建模型检测的均方根误差和分类平均错误率分别与潜变量个数之间的关系曲线,可以更加准确地确定出模型构建最优的目标潜变量个数,由于潜变量个数过少,模型计算速度加快,但容易出现欠拟合,准确性不足;潜变量个数过多,模型计算速度减慢,易出现模型对校正集数据过拟合,准确性不足。因此,本实施例,通过确定目标潜变量个数并基于最优的目标潜变量个数构建最优的单丛茶香气类型分类模型,能够在保证分类速度的同时提高后续分类检测的准确性。
在一个实施例中,上述方法还包括:获取单丛茶茶叶的测试样本集;其中,测试样本集中包括多个不同香气类型的单丛茶茶叶的测试样本;利用单丛茶香气类型分类模型对测试样本的香气类型进行分类以对单丛茶香气类型分类模型的有效性进行验证。
具体地,采集一定数量的单丛茶茶叶的测试样本,利用电子鼻采集各测试样本的挥发物气体与电子鼻的传感器阵列发生作用的时序传感信号,测试样本可以在采集校正样本步骤的同时进行采集,也可以在进行模型验证之前进行采集,测试样本的时序传感信号的采集方式与校正样本相似,在此不再赘述。通过测试样本的时序传感信号以及基于校正样本构建的单丛茶香气类型分类模型对测试样本进行香气类型分类,根据分类结果验证模型的有效性。
在一个实施例中,上述方法还包括:利用构建的单丛茶香气类型分类模型对未知香气类型的单丛茶茶叶的待分类样本进行香气类型分类。
具体地,获取未知香气类型的未知香气类型的单丛茶茶叶的待分类样本,获取待分类样本的利用电子鼻采集的时序传感信号,从待分类样本的时序传感信号中提取特征变量值构建特征变量矩阵并输入到上述的基于校正样本构建的单丛茶香气类型分类模型中,单丛茶香气类型分类模型输出得到待分类样本的香气类型标签,实现单丛茶香气类型快速分类。
其中,待分类样本的时序传感信号的采集、特征变量值的提取、特征变量矩阵的构建的具体方式可以参见校正样本的相关操作,在此不再赘述。
利用本申请涉及方法构建的单丛茶香气类型分类模型进行未知香气类型的单丛茶茶叶样本的分类,优势在于分类精度高、速度快且成本较低,此外,对样本不会造成破坏,可满足规模化生产中的对单丛茶香气类型快速、无损检测的需求。
下面,结合一个应用实例,对本申请涉及的基于仿生嗅觉的单丛茶香气类型分类方法进行进一步说明。可结合图2进行理解,图2示出了一个应用实例中基于仿生嗅觉的单丛茶香气类型分类方法的技术构架图。
首先,收集单丛茶茶叶的原始样本集,并采集各原始样本的时序传感信号以及感官评审标签(香气类型标签)。具体地,收集包含花香型“凤凰单丛茶”和蜜香型“岭头单丛茶”茶叶样品90个。对每个茶叶样品,称取15g茶叶装入350mL烧杯中密封,放置在26±1℃室内环境中60min后,使用电子鼻抽取烧杯顶空气体进行检测,采集得到样本的时序传感信号。设置电子鼻分析采样时间为100s,采样时间间隔为1s,传感器自动清洗时间为60s,传感器归零时间为10s,进气速度为240mL/min。抽取气体进样时,茶叶样本挥发性物质与传感器阵列单元发生作用,传感器信号根据挥发性成分信息差异发生变化,各茶叶样品的时序传感信号如图3所示。从采集得到的100s时序传感信号数据中提取最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值和一阶导数平均值,构成特征变量矩阵以描述样本的挥发性物质成分信息。包含90个单丛茶样本的特征变量矩阵热力图如图4所示。
本应用实例中使用的是德国AIRSENSE公司制造的PEN3.5型电子鼻仪器,该电子鼻***包含10个金属氧化物传感器,其名称和特性如表1所示。
表1 PEN3.5型电子鼻传感器阵列单元特性
参考国家标准(GB/T 23776-2018)使用茶叶感官审评方法,确定对所收集的单丛茶样本的香气类型标签。
从90个茶叶样品按照2:1的比例划分成用于建模的校正样本集和用于校验的测试样本集,其中校正样本集包含花香型和蜜香型样本分别为46个和14个,用于建立分类模型,测试样本集包含花香型和蜜香型样本分别为24个和6个,用于测试分类模型性能。
对校正样本集中各校正样本的特征变量值采用标准化预处理后,构成特征变量矩阵,特征变量矩阵,包含传感器阵列单元中名称为W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S十个传感器的信号特征值。所述的信号特征值包括各传感器在100s内数据曲线的最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值和一阶导数平均值。由此,每个样本可得到长度为60的一维特征行向量,其排列顺序为:1~10列为传感器W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S的最大值,11~20为传感器W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S的平均值,21~30为传感器W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S的85s稳定值,31~40为传感器W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S的一阶导数最大值,41~50为传感器W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S的一阶导数最小值,51~60为传感器W1C、W5S、W3C、W6S、W5C、W1S、W1W、W2S、W2W、W3S的一阶导数平均值。
对特征变量矩阵运用偏最小二乘判别分析算法,建立单丛茶香气类型分类模型,运用十折交叉验证方法对分类模型结果进行观察,选择最优的分类模型。
图5示出了利用偏最小二乘算法建立的单丛茶香气类型分类模型的分类结果随潜变量个数变化的趋势图。其中,基于校正样本集建立的单丛茶香气类型分类模型为校正模型,校正模型的均方根误差随着潜变量个数的增加不断降低,代表模型对建模集数据拟合度越来越高。交叉验证模型的均方根误差随着潜变量个数的增加先降低后升高,在潜变量个数为4时取得最小值0.3509。校正模型分类平均错误率随着潜变量个数的增加总体呈下降趋势,趋势与校正模型均方根误差变化趋势相同。交叉验证模型的分类平均错误率随着潜变量个数增加先降低后升高,在潜变量个数为4和5时取得最小值0.1258。对于通过偏最小二乘法建立的分类模型,潜变量个数过少,模型计算速度加快,但容易出现欠拟合,准确性不足。潜变量个数过多,模型计算速度减慢,易出现模型对校正集数据过拟合,准确性不足。对潜变量个数的优化,是对模型计算速度和准确度两者的耦合优化。在十折交叉验证优化模型参数过程中,随着校正模型选用潜变量的个数增加,校正模型的均方根误差下降,表示模型对校正集样本数据拟合度升高,通过查看由不同潜变量个数所建立交叉验证模型的均方根误差(RMSEC),取得均方根误差(RMSEC)最小时,对应的潜变量个数可以作为最优的建模参数。因此,由图5示出的结果可以确定潜变量个数为4时建立的模型为最优的单丛茶香气类型分类模型。
将测试样本带入最优的单丛茶香气类型分类模型,计算得到本应用实例中单丛茶香气类型分类模型的完整检测结果如表2所示。其中,所建立的最优的分类模型对测试样本集的测试样本分类的准确率为86.67%。在不破坏茶叶样本的条件下,对未知香气类型的单丛茶样本进行香气类型分类,可以获得86.67%的分类准确率,表明基于仿生嗅觉可以实现对单丛茶香气类型的快速分类。
表2单丛茶香气类型分类模型的完整检测结果
应该理解的是,虽然各流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种基于仿生嗅觉的单丛茶香气类型分类装置,包括:校正样本获取模块10、传感信号采集模块20、特征变量提取模块30、分类模型构建模块40,其中:
校正样本获取模块10,用于获取单丛茶茶叶的校正样本集;其中,校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本;
传感信号采集模块20,用于利用具有传感器阵列的电子鼻采集校正样本的挥发物气体与传感器阵列发生作用的时序传感信号;
特征变量提取模块30,用于从时序传感信号中提取特征变量值,对特征变量值进行标准化预处理后构建特征变量矩阵;
分类模型构建模块40,用于根据特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。
在一个实施例中,传感信号采集模块20采集氨氧化物成分、氨类成分、氢气成分、烷烃成分、甲烷成分、硫化氢成分、乙醇成分、硫化氢类成分,和/或芳香烷烃类成分的时序传感信号。
在一个实施例中,特征变量提取模块30提取预设采样时间内时序传感信号的数据曲线的最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值,和/或一阶导数平均值作为特征变量值。
在一个实施例中,分类模型构建模块40,还用于运用交叉验证方法对单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型。
在一个实施例中,分类模型构建模块40获取单丛茶香气类型分类模型交叉验证的均方根误差与潜变量个数的第一关系曲线;获取单丛茶香气类型分类模型交叉验证的分类平均错误率与潜变量个数的第二关系曲线;根据第一关系曲线和第二关系曲线确定目标潜变量个数,根据目标潜变量个数确定最优的单丛茶香气类型分类模型。
在一个实施例中,上述装置还包括分类模型验证模块50,用于获取单丛茶茶叶的测试样本集;其中,测试样本集中包括多个不同香气类型的单丛茶茶叶的测试样本;利用单丛茶香气类型分类模型对测试样本的香气类型进行分类以对单丛茶香气类型分类模型的有效性进行验证。
在一个实施例中,上述装置还包括未知样本分类模块60,用于利用构建的单丛茶香气类型分类模型对未知香气类型的单丛茶茶叶的待分类样本进行香气类型分类。
在一个实施例中,传感信号采集模块20称取各校正样本15g,分别装入350mL烧杯中,使用密封膜对烧杯的杯口进行密封处理;密封处理后的烧杯放置在26±1℃室温环境中静置60min以上,待密封处理后的烧杯顶空的气体饱和稳定后,从烧杯的顶空获取各校正样本的挥发物气体。
在一个实施例中,传感信号采集模块20还用于对电子鼻的采样参数进行设置;其中,采样时间为100s,采样时间间隔为1s,传感器阵列单元的自动清洗时间为60s,传感器阵列单元的归零时间为10s,挥发物的进气速度为240mL/min。
关于基于仿生嗅觉的单丛茶香气类型分类装置的具体限定可以参见上文中对于基于仿生嗅觉的单丛茶香气类型分类方法的限定,在此不再赘述。上述基于仿生嗅觉的单丛茶香气类型分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本时序传感信号数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于仿生嗅觉的单丛茶香气类型分类方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于仿生嗅觉的单丛茶香气类型分类方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述基于仿生嗅觉的单丛茶香气类型分类方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于仿生嗅觉的单丛茶香气类型分类方法,所述方法包括:
获取单丛茶茶叶的校正样本集;其中,所述校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本;
利用具有传感器阵列的电子鼻采集所述校正样本的挥发物气体与所述传感器阵列发生作用的时序传感信号;
从所述时序传感信号中提取特征变量值,对所述特征变量值进行标准化预处理后构建特征变量矩阵;
根据所述特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。
2.根据权利要求1所述的方法,其特征在于,所述时序传感信号包括芳香苯类成分、氨氧化物成分、氨类成分、氢气成分、烷烃成分、甲烷成分、硫化氢成分、乙醇成分、硫化氢类成分,和/或芳香烷烃类成分的时序传感信号。
3.根据权利要求1所述的方法,其特征在于,所述从所述时序传感信号中提取特征变量值,包括:
提取预设采样时间内所述时序传感信号的数据曲线的最大值、平均值、85s稳定值、一阶导数最大值、一阶导数最小值,和/或一阶导数平均值作为特征变量值。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
运用交叉验证方法对所述单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型。
5.根据权利要求4所述的方法,其特征在于,所述运用交叉验证方法对所述单丛茶香气类型分类模型的分类结果进行分析,确定最优的单丛茶香气类型分类模型,包括:
获取所述单丛茶香气类型分类模型的交叉验证模型的均方根误差与潜变量个数的第一关系曲线;
获取所述单丛茶香气类型分类模型的交叉验证模型的分类平均错误率与潜变量个数的第二关系曲线;
根据所述第一关系曲线和所述第二关系曲线确定目标潜变量个数,根据所述目标潜变量个数确定最优的单丛茶香气类型分类模型。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取单丛茶茶叶的测试样本集;其中,所述测试样本集中包括多个不同香气类型的单丛茶茶叶的测试样本;
利用所述单丛茶香气类型分类模型对所述测试样本的香气类型进行分类以对所述单丛茶香气类型分类模型的有效性进行验证。
7.根据权利要求1所述的方法,其特征在于,所述校正样本的挥发物气体的获取方法,包括:
称取各所述校正样本15g,分别装入350mL烧杯中,使用密封膜对烧杯的杯口进行密封处理;密封处理后的烧杯放置在26±1℃室温环境中静置60min以上,待密封处理后的烧杯顶空的气体饱和稳定后,从烧杯的顶空获取各所述校正样本的挥发物气体。
8.根据权利要求1所述的方法,其特征在于,在所述利用具有传感器阵列的电子鼻采集所述校正样本的挥发物气体与所述传感器阵列发生作用的时序传感信号之前,还包括:
对所述电子鼻的采样参数进行设置;其中,采样时间为100s,采样时间间隔为1s,传感器阵列单元的自动清洗时间为60s,传感器阵列单元的归零时间为10s,挥发物的进气速度为240mL/min。
9.根据权利要求1至8任意一项所述的方法,其特征在于,所述方法还包括:
利用构建的单丛茶香气类型分类模型对未知香气类型的单丛茶茶叶的待分类样本进行香气类型分类。
10.一种基于仿生嗅觉的单丛茶香气类型分类装置,其特征在于,所述装置包括:
校正样本获取模块,用于获取单丛茶茶叶的校正样本集;其中,所述校正样本集中包括多个不同香气类型的单丛茶茶叶的校正样本;
传感信号采集模块,用于利用具有传感器阵列的电子鼻采集所述校正样本的挥发物气体与所述传感器阵列发生作用的时序传感信号;
特征变量提取模块,用于从所述时序传感信号中提取特征变量值,对所述特征变量值进行标准化预处理后构建特征变量矩阵;
分类模型构建模块,用于根据所述特征变量矩阵并结合校正样本的香气类型标签构建单丛茶香气类型分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011402079.2A CN112528806B (zh) | 2020-12-02 | 2020-12-02 | 基于仿生嗅觉的单丛茶香气类型分类方法、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011402079.2A CN112528806B (zh) | 2020-12-02 | 2020-12-02 | 基于仿生嗅觉的单丛茶香气类型分类方法、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112528806A true CN112528806A (zh) | 2021-03-19 |
CN112528806B CN112528806B (zh) | 2023-06-16 |
Family
ID=74997395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011402079.2A Active CN112528806B (zh) | 2020-12-02 | 2020-12-02 | 基于仿生嗅觉的单丛茶香气类型分类方法、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112528806B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106198446A (zh) * | 2016-06-22 | 2016-12-07 | 中国热带农业科学院热带作物品种资源研究所 | 近红外光谱快速测定艾纳香叶粉中左旋龙脑含量的方法 |
CN107273421A (zh) * | 2017-05-16 | 2017-10-20 | 浙江大学 | 一种高准确性茶叶香气类型和品质的模式识别检测方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
WO2019211243A1 (en) * | 2018-05-04 | 2019-11-07 | Givaudan Sa | Interactive aroma dispensing system |
CN111855757A (zh) * | 2020-07-21 | 2020-10-30 | 广西壮族自治区亚热带作物研究所(广西亚热带农产品加工研究所) | 一种基于电子鼻的六堡茶陈香香味识别方法 |
-
2020
- 2020-12-02 CN CN202011402079.2A patent/CN112528806B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106198446A (zh) * | 2016-06-22 | 2016-12-07 | 中国热带农业科学院热带作物品种资源研究所 | 近红外光谱快速测定艾纳香叶粉中左旋龙脑含量的方法 |
CN107273421A (zh) * | 2017-05-16 | 2017-10-20 | 浙江大学 | 一种高准确性茶叶香气类型和品质的模式识别检测方法 |
CN108593592A (zh) * | 2018-04-19 | 2018-09-28 | 广东药科大学 | 一种基于近红外光谱技术的半夏掺伪鉴别方法 |
WO2019211243A1 (en) * | 2018-05-04 | 2019-11-07 | Givaudan Sa | Interactive aroma dispensing system |
CN111855757A (zh) * | 2020-07-21 | 2020-10-30 | 广西壮族自治区亚热带作物研究所(广西亚热带农产品加工研究所) | 一种基于电子鼻的六堡茶陈香香味识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112528806B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Steffen et al. | A comparison of data quality control protocols for atmospheric mercury speciation measurements | |
CN103134850B (zh) | 一种基于特征香气的茶叶品质快速检测方法 | |
US11408875B2 (en) | Method for detecting and identifying toxic and harmful gases based on machine olfaction | |
CN101419207B (zh) | 烤烟烟气主要指标的预测方法 | |
CN104820873A (zh) | 一种基于金属定量构效关系的淡水急性基准预测方法 | |
CN102338780B (zh) | 一种卷烟品牌判别方法 | |
CN108195895B (zh) | 基于电子鼻和分光测色仪的茶树叶片氮含量快速检测方法 | |
CN111855757B (zh) | 一种基于电子鼻的六堡茶陈香香味识别方法 | |
CN105223240A (zh) | 一种利用电子鼻检测蟹新鲜度的方法 | |
CN107132311A (zh) | 一种基于频域特征提取的快速气体识别算法 | |
CN112528806A (zh) | 基于仿生嗅觉的单丛茶香气类型分类方法、装置 | |
Maho et al. | Olfactive robot for gas discrimination over several months using a new optoelectronic nose | |
CN109239207B (zh) | 基于电子鼻的气味识别方法、装置和电子鼻*** | |
CN105092509A (zh) | 一种基于pcr-elm算法的样品成份测定方法 | |
CN105758897A (zh) | 一种基于电子鼻检测信息的白牡丹香气等级判别方法 | |
CN111474293B (zh) | 一种青枯病菌溶液测定方法及测定*** | |
CN114169903A (zh) | 一种可融合无损检测技术的中药材数字化质控追溯方法 | |
CN114004138A (zh) | 基于大数据人工智能的建筑监测方法、***及存储介质 | |
CN117094477B (zh) | 一种稀土矿开采过程中环境评价方法及*** | |
CN113921092B (zh) | 一种快速筛查生鲜乳中中和酸类物质的方法 | |
Bootsmaa et al. | Online air monitoring with enoses at the tata steel plant in the Netherlands | |
CN117517245B (zh) | 评估茶叶滋味、香气和整体感官方法、***、设备及介质 | |
CN116777251B (zh) | 一种基于全流程的药剂制备工序监测分析*** | |
CN112213363B (zh) | 一种基于气体传感器判别香菇干燥阶段的方法 | |
CN107748735A (zh) | 森林可燃物平均值调查的样本数确定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: No. 20, Jinying Road, Tianhe District, Guangzhou, Guangdong 510630 Applicant after: Institute of agricultural quality standards and monitoring technology, Guangdong Academy of Agricultural Sciences Address before: No. 20, Jinying Road, Tianhe District, Guangzhou, Guangdong 510630 Applicant before: AGRICULTURAL PUBLIC MONITORING CENTER, GUANGDONG ACADEMY OF AGRICULTURAL SCIENCES |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |