CN117708719B - 基于波段数量约束的近红外高光谱塑料分选***及方法 - Google Patents
基于波段数量约束的近红外高光谱塑料分选***及方法 Download PDFInfo
- Publication number
- CN117708719B CN117708719B CN202311700390.9A CN202311700390A CN117708719B CN 117708719 B CN117708719 B CN 117708719B CN 202311700390 A CN202311700390 A CN 202311700390A CN 117708719 B CN117708719 B CN 117708719B
- Authority
- CN
- China
- Prior art keywords
- wavelength
- plastic
- near infrared
- algorithm
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229920003023 plastic Polymers 0.000 title claims abstract description 100
- 239000004033 plastic Substances 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 78
- 238000001228 spectrum Methods 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 30
- 230000003595 spectral effect Effects 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 29
- 238000002790 cross-validation Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000002329 infrared spectrum Methods 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000012795 verification Methods 0.000 claims description 17
- 238000010183 spectrum analysis Methods 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 14
- 230000036961 partial effect Effects 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000017105 transposition Effects 0.000 claims description 4
- 239000002699 waste material Substances 0.000 abstract description 11
- 230000000452 restraining effect Effects 0.000 abstract 1
- 238000010521 absorption reaction Methods 0.000 description 15
- 238000005070 sampling Methods 0.000 description 13
- 229920000122 acrylonitrile butadiene styrene Polymers 0.000 description 10
- 238000010238 partial least squares regression Methods 0.000 description 8
- 239000004743 Polypropylene Substances 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000007635 classification algorithm Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000010239 partial least squares discriminant analysis Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 229920001903 high density polyethylene Polymers 0.000 description 3
- 239000004700 high-density polyethylene Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 229910000530 Gallium indium arsenide Inorganic materials 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000000701 chemical imaging Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 239000005020 polyethylene terephthalate Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- -1 polypropylene Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920000915 polyvinyl chloride Polymers 0.000 description 1
- 239000004800 polyvinyl chloride Substances 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02W—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
- Y02W30/00—Technologies for solid waste management
- Y02W30/50—Reuse, recycling or recovery technologies
- Y02W30/62—Plastics recycling; Rubber recycling
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了基于波段数量约束的近红外高光谱塑料分选***及方法,通过采集废旧塑料样品和相应的高光谱数据,采用余弦相似度算法对目标塑料逐一进行自适应标记,构建废旧塑料样品库,利用PLS‑DA方法进行分类;此外,还设置了一个可以约束特征波长数量范围的SPAsa算法提取的特征变量的数量,在限定范围内从256个波长的塑料近红外全谱数据中择优提取出了8个特征波长。建立的SPAsa‑PLS‑DA模型应用于塑料分选后,能够在保证分选准确率的同时,处理一帧数据所需的运行时间得到了答复提高,从而进一步的提高了塑料分选的速度。
Description
技术领域
本发明属于近红外光谱分析技术领域,具体涉及基于波段数量约束的近红外高光谱塑料分选***及方法。
背景技术
随着塑料制品的广泛应用,废旧塑料的污染问题越来越成为目前亟待解决的一大难题。近红外高光谱线扫描相机以其特征性好、对样品颜色不敏感、测样速度快、可以对固体样品直接进行快速无损测量等特点,特别适用于废旧塑料的回收利用***。近红外高光谱成像***多采用线阵近红外高光谱相机对传送带上的物体进行成像,可以将光谱特征与塑料样品的像素位置一一对应,进行可视化分类,并应用识别算法对采样结果进行分析后,控制分选机构剔除或抓取特征物体。
实际应用时需要对传送带上的塑料碎片进行实时的分选,因此对模型判别的速度有较高要求。在单个塑料碎片的大小≥3mm2、传送带速度为3m/s的情况下,要求在5ms时间内完成一帧近红外光谱数据的检测和计算。在使用线阵传感器对传送带进行采样时,采集速度至少要达到1000帧/s才能满足上述要求。而目前的线阵近红外高光谱测量***均小于该采样速度,限制了近红外高光谱***在塑料分选中的应用。
现有技术中,通过一种用于提取连续投影特征波长的耦合平均影响值的算法,设置特征波长的数量范围,并在这个范围之内进行优选,最终得到了37个特征波长,并构建一个神经网络模型来对五个级别的玉米种子活力进行分级,该模型的预测精度能够达到了99.1%,但是特征波长的数量较高,未加载在图形处理器上运算,计算时间仍有优化空间。此外,运用遗传算法和模拟退火算法对支持向量机算法进行计算量上的优化,筛选出20个关键波长,再进行分类预测,经遗传算法优化后预测废塑料光谱准确率,但筛选得出的波长数目具有随机性,计算时间无法保证。还有使用竞争性自适应重加权算法来处理特征波长,并运用SVM算法建立模型,对聚氯乙烯,尼龙、聚丙烯、聚苯乙烯4类塑料进行分类,平均准确率高达96.67%,但筛选得出的波长多达68个,无法精简计算量,提高计算速度。从以上现有技术中可以看出,在近红外光谱分析领域,对废旧塑料分选技术上可以实施,但是未以提升计算速度和保证模型精度为前提对特征波长的数量进行研究。
发明内容
为解决现有技术的不足,通过构建特征波长优选和分类模型,实现高速的近红外光谱采集和数据分析的目的,本发明采用如下的技术方案:
基于波段数量约束的近红外高光谱塑料分选***,包括近红外高光谱数据采集模块、光谱分析模块和分选控制机构;
所述近红外高光谱数据采集模块,用于采集塑料物品近红外光谱数据;
所述光谱分析模块,根据近红外光谱数据,基于波段数量约束的连续投影算法筛选波长,预设最优波长数量H的取值范围[M,N],M为最小波长数量,N为最大波长数量,当H=M时,进行第一次基于连续投影算法的波长选择,得到一定范围的波长集合,当H=N时,进行N-M次基于连续投影算法波长选择,得到N-M组波长集合,使用PLS交叉验证对每个波长集合计算N-M组最小交叉验证均方根误差RMSECVi(1≤i≤N-M)和相应的波长组合,选择相应的最小值RMSECVi和相应的波长组合,使得到的数值在一定范围内是最优的;根据波长组合的波段和波段个数,构建偏最小二乘判别分析算法模型进行塑料分类判别,该模型是基于偏最小二乘回归的分类算法,偏最小二乘回归可以实现回归的同时进行数据的降维,因而适用于光谱数据这样的高维度数据;由于波长数量越小,运算速度越快,相对于准确度损来说带来的收益更大,当Ncur取最小波长数量M时,修正系数为1;当Ncur>M时,对ACC进行缩小的修正,以此对取得更小波长数量的计算进行奖励,但是当M和N的差距过小时,会出现过修正情况,因此,当N-M>100,且M大于2时,以权修正准确度ACC(accuracy)作为模型评价标准:
其中,Ncur表示当前波长数量;
所述分选控制机构,根据光谱分析模块的分类判别结果,对塑料物品进行分选。
进一步地,所述近红外高光谱数据采集模块,对传感器进行感兴趣区域处理,从空间唯独选择全部行像素,光谱维度选择特定的列像素,以选取所需的波段,从而显著提高传感器的采样速度,对于铟镓砷面阵传感器IMX990,选择特定列像素时,最小的范围需包括8列像素,选取互不重叠的8个范围的情况下,实际选择了1280×8×8个像素,采样速度从235帧/秒提升至1800帧/秒。
进一步地,所述光谱分析模块中,连续投影算法对于有n个样本数,m个波长个数的光谱矩阵Xn×m,假定需要的波长个数为H,其执行过程如下:
1、任意选择原始光谱矩阵的第j列xj,当迭代次数t=1时,对应的xj记作xk(1);
2、将没有被选择的列向量位置的集合记为:
3、分别计算xj对其余列向量的投影:
其中,I表示单位矩阵,T表示矩阵的转置;
4、提取含有最大投影向量的光谱波长:
5、如果t<H,令t=t+1,进行下一次迭代,返回步骤2;如果t=H,循环终止;当循环终止时,得到的波长集合{xk(1),xk(2),...,xk(H)}即为经过SPA选取的特征波长集合。
进一步地,在所述偏最小二乘判别分析算法模型分类判别前,基于塑料样本库,将近红外光谱数据通过非监督聚类算法进行分类标记;选用余弦相似度算法设定阈值,通过自适应标记的方式对目标塑料样本进行分类:
其中,P、Q为任意两个不同光谱数据;
余弦值大于阈值则判别参与计算的两个光谱数据来源于同一类塑料样本,由此计算得出相应的标签矩阵。
进一步地,所述偏最小二乘判别分析算法模型,采用k-fold交叉验证,确定所述模型用于最小二乘回归的潜在波长变量的数量,具体地,是将一个训练集随机地划分为k个子集,每次都将其中的一个子集用作交叉验证集,而剩余的k-1个子集构成一个训练集,改变参数,重复训练和预测的过程k次,以交叉验证集的k次平均预测结果评价模型好坏,以寻找最佳的模型参数;训练集和验证集的得分最高时对应的主成分数作为选取原则,并且,验证集的得分不高于训练集。
基于波段数量约束的近红外高光谱塑料分选方法,包括如下步骤:
步骤S1:采集塑料物品近红外光谱数据;
步骤S2:光谱分析,根据近红外光谱数据,基于波段数量约束的连续投影算法筛选波长,根据筛选的波段和波段个数,构建偏最小二乘判别分析算法模型进行塑料分类判别,该模型是基于偏最小二乘回归的分类算法,偏最小二乘回归可以实现回归的同时进行数据的降维,因而适用于光谱数据这样的高维度数据,波长筛选包括如下步骤:
步骤S2.1.1:预设最优波长数量H的取值范围[M,N],M为最小波长数量,N为最大波长数量;
步骤S2.1.2:当H=M时,进行第一次基于连续投影算法的波长选择,得到一定范围的波长集合;
步骤S2.1.3:当H=N时,进行N-M次基于连续投影算法波长选择,得到N-M组波长集合,使用PLS交叉验证对每个波长集合计算N-M组最小交叉验证均方根误差RMSECVi(1≤i≤N-M)和相应的波长组合,选择相应的最小值RMSECVi和相应的波长组合,使得到的数值在一定范围内是最优的;根据波长组合得到相应的波段和波段个数;由于波长数量越小,运算速度越快,相对于准确度损来说带来的收益更大,当Ncur取最小波长数量M时,修正系数为1;当Ncur>M时,对ACC进行缩小的修正,以此对取得更小波长数量的计算进行奖励,但是当M和N的差距过小时,会出现过修正情况,因此,当N-M>100,且M大于2时,以权修正准确度ACC(accuracy)作为模型评价标准:
其中,Ncur表示当前波长数量;
步骤S3:根据分类判别结果对塑料物品进行分选。
进一步地,所述步骤S1的近红外高光谱数据采集中,对传感器进行感兴趣区域处理,从空间唯独选择全部行像素,光谱维度选择特定的列像素,以选取所需的波段,从而显著提高传感器的采样速度,对于铟镓砷面阵传感器IMX990,选择特定列像素时,最小的范围需包括8列像素,选取互不重叠的8个范围的情况下,实际选择了1280×8×8个像素,采样速度从235帧/秒提升至1800帧/秒。
进一步地,所述步骤S2的光谱分析中,连续投影算法对于有n个样本数,m个波长个数的光谱矩阵Xn×m,假定需要的波长个数为H,其执行过程如下:
步骤S2.2.1:任意选择原始光谱矩阵的第j列xj,当迭代次数t=1时,对应的xj记作xk(1);
步骤S2.2.2:将没有被选择的列向量位置的集合记为:
步骤S2.2.3:分别计算xj对其余列向量的投影:
其中,I表示单位矩阵,T表示矩阵的转置;
步骤S2.2.4:提取含有最大投影向量的光谱波长:
步骤S2.2.5:如果t<H,令t=t+1,进行下一次迭代,返回步骤2;如果t=H,循环终止;当循环终止时,得到的波长集合{xk(1),xk(2),...,xk(H)}即为经过SPA选取的特征波长集合。
进一步地,所述步骤S2中,在偏最小二乘判别分析算法模型分类判别前,基于塑料样本库,将近红外光谱数据通过非监督聚类算法进行分类标记;选用余弦相似度算法设定阈值,通过自适应标记的方式对目标塑料样本进行分类:
其中,P、Q为任意两个不同光谱数据;
余弦值大于阈值则判别参与计算的两个光谱数据来源于同一类塑料样本,由此计算得出相应的标签矩阵。
进一步地,所述步骤S2中的偏最小二乘判别分析算法模型,采用k-fold交叉验证,确定所述模型用于最小二乘回归的潜在波长变量的数量,具体地,是将一个训练集随机地划分为k个子集,每次都将其中的一个子集用作交叉验证集,而剩余的k-1个子集构成一个训练集,改变参数,重复训练和预测的过程k次,以交叉验证集的k次平均预测结果评价模型好坏,以寻找最佳的模型参数;训练集和验证集的得分最高时对应的主成分数作为选取原则,并且,验证集的得分不高于训练集。
本发明的优势和有益效果在于:
本发明的基于波段数量约束的近红外高光谱塑料分选***及方法,通过对高光谱采集模块进行ROI处理,从而提高传感器的采样速度;随后进行波长数量约束,采集来自日常生活的废弃塑料,对它们的近红外光谱进行分析,建立多种类别的塑料高光谱样本库并采集光谱数据,利用优化后的SPA算法限定波长数量,并筛选出波长组合,极大减少了待处理的光谱数据数量,提高了***运算速度;此外,还选取余弦相似度算法,通过对目标塑料样品建立自适应标签的方法创建标签矩阵,建立SPAsa-PLS-DA模型进行塑料分类,通过将本发明的模型与全谱PLS-DA模型和SPA-PLS-DA模型比较,三种模型对多种塑料的分类准确率都达到了97%以上;而三个模型应用于分选***对ABS塑料进行分类判别、整体测试和速度对比后,本发明的SPAsa-PLS-DA模型速度明显高于其他模型所在的分选***,达到了在2ms帧/s,分类准确度为100%。
附图说明
图1是本发明实施例中***的结构示意图。
图2是本发明实施例中12种塑料的平均光谱曲线图。
图3a是本发明实施例中SPAsa算法中RMSECV因预设变量个数发生的变化图。
图3b是本发明实施例中SPAsa算法中SPA特征波长选择结果图。
图4a是本发明实施例中基于余弦相似度算法的自适应塑料物品标记示意图。
图4b是本发明实施例中基于余弦相似度算法的自适应塑料物品分离示意图。
图5是本发明实施例中基于交叉验证的不同得分的主成分数目示意图。
图6是本发明实施例中PP、HDPE、TPE、POM、PLA光谱曲线对比图。
图7是本发明实施例中PP、PET、PBT光谱曲线对比图。
图8是本发明实施例中PPO、PPS、ABS、SAN光谱曲线对比图。
图9是本发明实施例中方法的流程图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
如图1所示,基于波段数量约束的近红外高光谱塑料分选***,包括高光谱数据采集模块、光谱分析模块和分选控制机构,其中高光谱数据采集和光谱分析对***整体速度起决定性作用。
高光谱数据采集模块,为近红外线阵高光谱相机。线阵近红外高光谱相机的工作光谱范围为900-1700nm,光谱分辨率为5nm,空间分辨率为1280pix,光谱波段为1024。线阵高光谱相机单次采样可以获得900-1700nm波长范围内1024个波段的光谱信号,传感器为铟镓砷面阵传感器IMX990,该传感器可以达到235帧/秒的成像速度。由于实际分析中不需要用到1024个波段,可以将实际使用波段数量降低,通过对传感器进行感兴趣区域选择(ROI)处理,选择实际需要的波段可以显著提高传感器的采样速度。在保证识别精度的前提下进行ROI时,空间维度上选择全部行像素,光谱维度上选择特定的列像素。而IMX990选择特定列像素时,最小的范围需包括8列像素。在选取互不重叠的8个范围的情况下,实际选择了1280×8×8个像素,采样速度可以提升至1800帧/秒,满足***的实际采样速度要求。
光谱分析模块,通过计算机对采集到的样品近红外光谱数据进行分析,判别出种类。实际应用时经过波长选择算法筛选波长后,速度得到进一步提高;选择合适的波段数量和合适的光谱波长后,应用PLS-DA算法建立分析模型,对采集到的光谱数据判断塑料材质。
连续投影算法(Successive Projections algortm,SPA)是一种在光谱分析中被广泛应用的波长选择算法。该算法基于变量信息,采用了一种在变量方面进行降维的方法,通过向量的投影分析得出含有最少冗余信息的变量组合。对于有n个样本数,m个波长个数的光谱矩阵Xn×m,假定需要的波长个数为H,SPA按照以下步骤进行执行:
1、迭代次数t=1时,任意选择原始光谱矩阵的1列(第j列)记为xj,记作xk(1)。
2、将没有被选择的列向量位置的集合记为s,
3、分别计算xj对其余列向量的投影:
其中,I为单位矩阵。
4、提取含有最大投影向量的光谱波长,
5、如果t<H,令t=t+1,进行下一次迭代,返回步骤2;如果t=H,循环终止。
当循环终止时,得到的波长集合{xk(1),xk(2),...,xk(H)}就是经过SPA选取的特征波长集合。虽然在算法中设定了目标波长个数H,但是经过运算得到的固定个数的特征波长,并不能保证是最优解。
在解决塑料分选实际问题时,特征波长的个数只要小于特定数量即可以满足要求。而且为了提高采样的速度,波长数量少的方案在采集和运算速度上有更大的优势。为了保证获得小于特征波长个数H的情况下获得最优解,通过基于波段数量约束的SPA(SPAsa)对SPA进行以下改进,以寻找小于特定数量的最优波长数量H和最优波长集合{xk(1),xk(2),...,xk(H)}。修改SPA算法为基于的SPA算法:
对于有n个样本数,m个波长个数的光谱矩阵Xn×m,假定需要的波长个数为H,SPA按照以下步骤进行执行:
1、迭代次数t=1时,任意选择原始光谱矩阵的1列(第j列)记为xj,记作xk(1)。
2、将没有被选择的列向量位置的集合记为s,
3、分别计算xj对其余列向量的投影:
其中,I为单位矩阵。
4、提取含有最大投影向量的光谱波长,
5、如果t<H,令t=t+1,进行下一次迭代,返回步骤2;如果t=H,循环终止。
当循环终止时,得到的波长集合{xk(1),xk(2),...,xk(H)}就是经过SPA选取的特征波长集合。虽然在算法中设定了目标波长个数H,但是经过运算得到的固定个数的特征波长,并不能保证是最优解。
1、当H=M时,进行上述第一次SPA算法波长选择。
2、当H=N时,进行(N-M)次SPA算法波长选择,得到(N-M)组波长集合。使用PLS交叉验证对每个波长集合计算(N-M)组最小交叉验证均方根误差RMSECVi(1≤i≤N-M)和相应的波长组合。选择相应的最小值RMSECVi和相应的波长组合,使得到的数值在一定范围内是最优的。
本发明实施例中,使用的样品为12种不同聚合物和结构组分的废弃塑料碎片,分别为PP、PET、HDPE、TPE、PLA、PBT、TPU、POM、PPO、PPS、ABS、SAN。废塑料来源包括家庭用品、医用器械附件和汽车部件等,如表1所示。
表1废塑料样品信息
对所有塑料样品按照种类分别拍摄高光谱图像,建立样本库,用于后续的PLS-DA算法建模。完成高光谱图像拍摄之后,分别在每一片样本区域提取光谱曲线,共180组高光谱数据,按照种类将光谱数据平均后绘制光谱曲线,如图2所示。此数据用于SPAsa算法筛选波长和确定最优波长数目。
根据图2可以看出,大部分塑料样品在1200nm,1400nm和1650nm附近都有吸收峰,可能分别是C-H键的二级倍频峰,C-H键的组频峰和C-H键伸缩振动的一级倍频峰。SAN塑料的近红外光谱和其他的11类塑料有着明显的不同,在900-1700nm范围内吸收峰的数量明显少于其他类塑料,最显著的区别是SAN没有1400nm附近的吸收峰。
使用SPAsa算法,对180组光谱数据进行波长变量选择,将H的变化范围设置为[0,20],将训练集和测试集样本的设置为随机分割7:3,变量H的选择结果如图3a所示,在H的变化期间,将所选的变量数设为横坐标,将RMSECV值设为纵坐标,绘制出RMSECV随着变量数的变化的曲线图,随着选取变量数目的增加,RMSECV的最小值逐渐降低,当选取变量数目为8时,最小值为0.0292,如图3b所示,选取的波段分别为203,244、93,231,249、22、68,252;随着变量个数的不断增大,RMSECV趋于稳定;
根据所选取的波段以及波段个数,构建偏最小二乘判别分析(partial least-square discriminate analysis,PLS-DA)算法模型。PLS-DA算法是基于偏最小二乘回归的分类算法,偏最小二乘回归可以实现回归的同时进行数据的降维,因而适用于光谱数据这样高维度数据。
本发明通过PLS回归进行分类判别,将1或0的数值赋值给标签矩阵Y,表示每个样本的类别。Y有12列,每一列对应一种塑料,类别1训练集的y赋值为(1,0,0,0,0,0,0,0,0,0,0,0);若为类别2,y赋值为(0,1,0,0,0,0,0,0,0,0,0,0),以此类推,之后建立光谱数据X和表达类别的Y之间的预测函数进行分类判别。因而,进行PLS-DA算法建模之前,需要对采集到的光谱数据通过非监督聚类算法进行分类标记,本发明选用余弦相似度算法设定阈值,通过自适应标记的方式对目标塑料样本进行分类,如公式(4)所示,余弦值大于阈值则判别参与计算的两个光谱数据来源于同一类塑料样本,由此计算得出相应的标签矩阵Y,再用于PLS-DA建模。
其中,P、Q为任意两个不同光谱数据。
所用目标塑料样本的高光谱图像均来自于上述所建立的样本库,如图4a所示,左侧塑料样本为ABS,右侧塑料样本为PP,在原始图像上自适应标记目标样品PP,图4b通过掩膜的方式将目标塑料与其他塑料以及背景整体分类,以此类推,建立12种塑料样本的标签数据库。
采用k-fold交叉验证的方法确定PLS-DA的分类模型用于PLS回归的潜在变量的数量,具体地,是将一个训练集随机地划分为k个子集,每次都会将其中的一个子集用作交叉验证集,而剩余的k-1个子集构成一个训练集,改变参数,重复训练和预测的过程k次,以交叉验证集的k次平均预测结果评价模型好坏,以寻找最佳的模型参数。在本发明实施例中,k取10,做10-fold交叉验证,训练集和验证集的得分最高时对应的主成分数作为选取原则,并且,验证集的得分不高于训练集,
将样本数据按7:3的比例随机分为训练集和验证集,以权修正准确度ACC(accuracy)作为模型评价标准,其中权修正准确度ACC计算公式:
其中,预设H的取值范围为[M,N],M为最小波长数量,N为最大波长数量,Ncur为当前波长数量。
由于在实际使用中,波长数量越小,运算速度越快,相对于准确度损来说带来的收益更大。当Ncur取最小波长数量M时,修正系数为1;当Ncur>M时,对ACC进行缩小的修正,以此对取得更小波长数量的计算进行奖励。但是当M和N的差距过小时,会出现过修正情况。在实际使用测试中,当N-M>100,且M大于2时,使用该方法较为理想。
计算结果如图5所示,取n=4时获得最大ACC值。
通过光谱曲线上的吸收峰数量和特征波长的区别,将12类塑料大致划分为三大类进行塑料的近红外光谱对比,分析PLS-DA算法分类结果合理性。第一类塑料为PP、HDPE、TPE、POM、PLA,其光谱曲线对比如图6所示,在900-1700nm范围内的吸收峰数量基本一致,谱线形状也大体类似,但在1200nm和1400nm附近的吸收峰存在不同程度的偏移,可以通过特征波长的不同将其区分,在PLS-DA分类结果中也得到了证实。
第二类为PET、PBT,其光谱曲线对比如图7所示,在同一的光源下,呈现不同的反射强度,PET塑料反射强度较高,PBT塑料反射强度较低。其光谱曲线在形状上十分相似,在900-1700nm范围内的吸收峰数量一致,但在1200nm附近的吸收峰两者有明显偏差,在1198nm左右的吸收峰向短波区域发生了偏移,通过这一特征可以将其区分,从侧面验证了算法准确度。
第三类为PPO、PPS、ABS、SAN,其光谱曲线对比如图8所示,SAN在1400nm附近少一个吸收峰,因此,其与PPO、ABS、PPS能够区分。PPO与PPS、ABS的区分度较小,但是,1200nm和1400nm附近的吸收峰与其他两类存在偏差,通过特征波长的差异可以区分。ABS和PPS的近红外光谱非常相似,在900-1700nm的范围内吸收峰的个数一致,位置也十分类似,在1150nm和1200nm附近的吸收峰存在重叠,应该比较难区分,这一点也在PLS-DA分类结果中得到了证实。
分别对全光谱PLS-DA模型、SPA-PLS-DA模型、SPAsa-PLS-DA分类模型进行精度验证,按照7:3的比例随机划分原始数据集,得到待测试的训练集和测试集,相同的参数建立分类模型,预测结果通过ACC值和平均计算时间展现,结果如表2所示。
表2随机分割各分类模型效果评估
通过对传感器进行ROI处理之后,将3个模型应用于分选***进行整体测试。搭载NVIDIA tesla M40显卡、10代I7CPU以及16G内存的计算机可以计算每秒钟500帧的数据,在此速度基础上,分选***对目标ABS塑料与其他塑料进行分类判别,比较分离准确度,并且统计计算机处理一帧数据所需要的运算时间,如表3所示。
表3各模型整体测试时间
通过表2和表3综合得出,通过对传感器进行ROI处理,减少待处理光谱波段,并结合SPAsa算法对光谱数据进行波长数量约束,明显减少了运算时间,达到了在2ms时间内完成对一帧数据的计算,分类精度也未受到大幅损失,进行实时分选的目标ABS塑料均被准确分离。
分选控制机构,包括传送带、喷嘴阵列、空气泵和目标塑料物料盒,传送带一端设置近红外高光谱相机对传送带上的塑料进行拍摄,另一端设置喷嘴阵列,分选控制机构根据分选结果发出指令,控制喷嘴阵列和空气泵,使气嘴在适当的时间执行吹气的操作,将目标塑料从传送带上吹入指定的物料盒,从而剔除特定材质。
如图9所示,基于波段数量约束的近红外高光谱塑料分选方法,包括如下步骤:
步骤S1:采集塑料物品近红外光谱数据;
步骤S2:光谱分析,根据近红外光谱数据,基于波段数量约束的连续投影算法筛选波长,根据筛选的波段和波段个数,构建偏最小二乘判别分析算法模型进行塑料分类判别,该模型是基于偏最小二乘回归的分类算法,偏最小二乘回归可以实现回归的同时进行数据的降维,因而适用于光谱数据这样的高维度数据,波长筛选包括如下步骤:
步骤S2.1.1:预设最优波长数量H的取值范围[M,N],M为最小波长数量,N为最大波长数量;
步骤S2.1.2:当H=M时,进行第一次基于连续投影算法的波长选择,得到一定范围的波长集合;
步骤S2.1.3:当H=N时,进行N-M次基于连续投影算法波长选择,得到N-M组波长集合,使用PLS交叉验证对每个波长集合计算N-M组最小交叉验证均方根误差RMSECVi(1≤i≤N-M)和相应的波长组合,选择相应的最小值RMSECVi和相应的波长组合,使得到的数值在一定范围内是最优的;根据波长组合得到相应的波段和波段个数;
步骤S3:根据分类判别结果对塑料物品进行分选。
这部分内容实施方式与上述***实施例的实施方式类似,此处不再赘述。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
Claims (10)
1.基于波段数量约束的近红外高光谱塑料分选***,包括近红外高光谱数据采集模块、光谱分析模块和分选控制机构,其特征在于:
所述近红外高光谱数据采集模块,用于采集塑料物品近红外光谱数据;
所述光谱分析模块,根据近红外光谱数据,基于波段数量约束的连续投影算法筛选波长,预设最优波长数量H的取值范围[M,N],M为最小波长数量,N为最大波长数量,当H=M时,进行第一次基于连续投影算法的波长选择,当H=N时,进行N-M次基于连续投影算法波长选择,得到N-M组波长集合,使用交叉验证对每个波长集合计算N-M组最小交叉验证均方根误差RMSECVi(1≤i≤N-M)和相应的波长组合,选择相应的最小值RMSECVi和相应的波长组合;根据波长组合的波段和波段个数,构建偏最小二乘判别分析算法模型进行塑料分类判别;当N-M>100,且M大于2时,以权修正准确度ACC作为模型评价标准:
其中,Ncur表示当前波长数量;
所述分选控制机构,根据光谱分析模块的分类判别结果,对塑料物品进行分选。
2.根据权利要求1所述的基于波段数量约束的近红外高光谱塑料分选***,其特征在于:所述近红外高光谱数据采集模块,对传感器进行感兴趣区域处理,从空间维度选择全部行像素,光谱维度选择特定的列像素,以选取所需的波段。
3.根据权利要求1所述的基于波段数量约束的近红外高光谱塑料分选***,其特征在于:所述光谱分析模块中,连续投影算法对于有n个样本数,m个波长个数的光谱矩阵Xn×m,假定需要的波长个数为H,最优波长数量H的取值范围[M,N],M为最小波长数量,N为最大波长数量,其执行过程如下:
1、任意选择原始光谱矩阵的第j列xj,当迭代次数t=1时,对应的xj记作xk(1);
2、将没有被选择的列向量位置的集合记为:
3、分别计算xj对其余列向量的投影:
其中,I表示单位矩阵,T表示矩阵的转置;
4、提取含有最大投影向量的光谱波长:
5、如果t<H,令t=t+1,进行下一次迭代,返回步骤2;如果t=H,循环终止;当循环终止时,得到的波长集合{xk(1),xk(2),...,xk(H)}即为经过SPA选取的特征波长集合。
4.根据权利要求1所述的基于波段数量约束的近红外高光谱塑料分选***,其特征在于:在所述偏最小二乘判别分析算法模型分类判别前,基于塑料样本库,将近红外光谱数据通过非监督聚类算法进行分类标记;选用余弦相似度算法设定阈值,通过自适应标记的方式对目标塑料样本进行分类:
其中,n表示样本数量,P、Q为任意两个不同光谱数据;
余弦值大于阈值则判别参与计算的两个光谱数据来源于同一类塑料样本,由此计算得出相应的标签矩阵。
5.根据权利要求1所述的基于波段数量约束的近红外高光谱塑料分选***,其特征在于:所述偏最小二乘判别分析算法模型,采用k-fold交叉验证,确定所述模型用于最小二乘回归的潜在波长变量的数量,具体地,是将一个训练集随机地划分为k个子集,每次都将其中的一个子集用作交叉验证集,而剩余的k-1个子集构成一个训练集,改变参数,重复训练和预测的过程k次,以交叉验证集的k次平均预测结果评价模型好坏,以寻找最佳的模型参数;训练集和验证集的得分最高时对应的主成分数作为选取原则,并且,验证集的得分不高于训练集。
6.基于波段数量约束的近红外高光谱塑料分选方法,其特征在于包括如下步骤:
步骤S1:采集塑料物品近红外光谱数据;
步骤S2:光谱分析,根据近红外光谱数据,基于波段数量约束的连续投影算法筛选波长,根据筛选的波段和波段个数,构建偏最小二乘判别分析算法模型进行塑料分类判别,波长筛选包括如下步骤:
步骤S2.1.1:预设最优波长数量H的取值范围[M,N],M为最小波长数量,N为最大波长数量;
步骤S2.1.2:当H=M时,进行第一次基于连续投影算法的波长选择;
步骤S2.1.3:当H=N时,进行N-M次基于连续投影算法波长选择,得到N-M组波长集合,使用交叉验证对每个波长集合计算N-M组最小交叉验证均方根误差RMSECVi(1≤i≤N-M)和相应的波长组合,选择相应的最小值RMSECVi和相应的波长组合;根据波长组合得到相应的波段和波段个数;当N-M>100,且M大于2时,以权修正准确度ACC作为模型评价标准:
其中,Ncur表示当前波长数量;
步骤S3:根据分类判别结果对塑料物品进行分选。
7.根据权利要求6所述的基于波段数量约束的近红外高光谱塑料分选方法,其特征在于:所述步骤S1的近红外高光谱数据采集中,对传感器进行感兴趣区域处理,从空间维度选择全部行像素,光谱维度选择特定的列像素,以选取所需的波段。
8.根据权利要求6所述的基于波段数量约束的近红外高光谱塑料分选方法,其特征在于:所述步骤S2的光谱分析中,连续投影算法对于有n个样本数,m个波长个数的光谱矩阵Xn×m,假定需要的波长个数为H,其执行过程如下:
步骤S2.2.1:任意选择原始光谱矩阵的第j列xj,当迭代次数t=1时,对应的xj记作xk(1);
步骤S2.2.2:将没有被选择的列向量位置的集合记为:
步骤S2.2.3:分别计算xj对其余列向量的投影:
其中,I表示单位矩阵,T表示矩阵的转置;
步骤S2.2.4:提取含有最大投影向量的光谱波长:
步骤S2.2.5:如果t<H,令t=t+1,进行下一次迭代,返回步骤2;如果t=H,循环终止;当循环终止时,得到的波长集合{xk(1),xk(2),...,xk(H)}即为经过SPA选取的特征波长集合。
9.根据权利要求6所述的基于波段数量约束的近红外高光谱塑料分选方法,其特征在于:所述步骤S2中,在偏最小二乘判别分析算法模型分类判别前,基于塑料样本库,将近红外光谱数据通过非监督聚类算法进行分类标记;选用余弦相似度算法设定阈值,通过自适应标记的方式对目标塑料样本进行分类:
其中,n表示样本数量,P、Q为任意两个不同光谱数据;
余弦值大于阈值则判别参与计算的两个光谱数据来源于同一类塑料样本,由此计算得出相应的标签矩阵。
10.根据权利要求6所述的基于波段数量约束的近红外高光谱塑料分选方法,其特征在于:所述步骤S2中的偏最小二乘判别分析算法模型,采用k-fold交叉验证,确定所述模型用于最小二乘回归的潜在波长变量的数量,具体地,是将一个训练集随机地划分为k个子集,每次都将其中的一个子集用作交叉验证集,而剩余的k-1个子集构成一个训练集,改变参数,重复训练和预测的过程k次,以交叉验证集的k次平均预测结果评价模型好坏,以寻找最佳的模型参数;训练集和验证集的得分最高时对应的主成分数作为选取原则,并且,验证集的得分不高于训练集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311700390.9A CN117708719B (zh) | 2023-12-12 | 2023-12-12 | 基于波段数量约束的近红外高光谱塑料分选***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311700390.9A CN117708719B (zh) | 2023-12-12 | 2023-12-12 | 基于波段数量约束的近红外高光谱塑料分选***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117708719A CN117708719A (zh) | 2024-03-15 |
CN117708719B true CN117708719B (zh) | 2024-06-14 |
Family
ID=90161772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311700390.9A Active CN117708719B (zh) | 2023-12-12 | 2023-12-12 | 基于波段数量约束的近红外高光谱塑料分选***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117708719B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017153726A1 (en) * | 2016-03-07 | 2017-09-14 | Micromass Uk Limited | Spectrometric analysis |
CN108872143A (zh) * | 2018-05-22 | 2018-11-23 | 南京农业大学 | 一种基于近红外光谱的小麦感染赤霉病等级检测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106092957A (zh) * | 2016-06-02 | 2016-11-09 | 浙江农林大学 | 红木家具的近红外光谱识别方法 |
CN105928901B (zh) * | 2016-07-11 | 2019-06-07 | 上海创和亿电子科技发展有限公司 | 一种定性定量相结合的近红外定量模型构建方法 |
-
2023
- 2023-12-12 CN CN202311700390.9A patent/CN117708719B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017153726A1 (en) * | 2016-03-07 | 2017-09-14 | Micromass Uk Limited | Spectrometric analysis |
CN108872143A (zh) * | 2018-05-22 | 2018-11-23 | 南京农业大学 | 一种基于近红外光谱的小麦感染赤霉病等级检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117708719A (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11861889B2 (en) | Analysis device | |
US9989463B2 (en) | Material classification | |
CN104657752B (zh) | 一种基于深度学习的安全带佩戴识别方法 | |
Hong et al. | Comparative study on vision based rice seed varieties identification | |
Dacal-Nieto et al. | Non–destructive detection of hollow heart in potatoes using hyperspectral imaging | |
CN110717368A (zh) | 一种纺织品定性分类方法 | |
Mustafa et al. | Classification of fruits using Probabilistic Neural Networks-Improvement using color features | |
Cai et al. | Nondestructive gender identification of silkworm cocoons using X-ray imaging with multivariate data analysis | |
CN107818298A (zh) | 用于机器学习物质识别算法的通用拉曼光谱特征提取方法 | |
Lin et al. | Determination of the varieties of rice kernels based on machine vision and deep learning technology | |
CN111563519A (zh) | 基于Stacking加权集成学习的茶叶杂质识别方法及分选设备 | |
Daskalov et al. | Performance of an automatic inspection system for classification of Fusarium Moniliforme damaged corn seeds by image analysis | |
Estévez et al. | Genetic input selection to a neural classifier for defect classification of radiata pine boards | |
Bhuiyan et al. | Automatic acute lymphoblastic leukemia detection and comparative analysis from images | |
Deulkar et al. | An automated tomato quality grading using clustering based support vector machine | |
Duth et al. | Intra class vegetable recognition system using deep learning | |
Setiawan et al. | Rice Foreign Object Classification Based on Integrated Color and Textural Feature Using Machine Learning. | |
CN117708719B (zh) | 基于波段数量约束的近红外高光谱塑料分选***及方法 | |
Shweta et al. | External feature based quality evaluation of Tomato using K-means clustering and support vector classification | |
Jeny et al. | Machine vision-based expert system for automated cucumber diseases recognition and classification | |
Clark et al. | Fabric composition classification using hyper-spectral imaging | |
Marin et al. | Image-based Fruit Recognition and Classification | |
Naik et al. | Evaluation of optimization techniques with support vector machine for identification of dry beans | |
Prabuwono et al. | Natural produce classification using computer vision based on statistical color features and derivative of radius function | |
Habiburrohman et al. | Maturity classification of golek mango using fuzzy c means clustering method based on hsi and ycbcr color space transformation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |