库尔勒香梨含糖量的近红外光谱检测模型研究

您所在的位置:网站首页 库尔勒香梨的糖分含量高吗 库尔勒香梨含糖量的近红外光谱检测模型研究

库尔勒香梨含糖量的近红外光谱检测模型研究

2024-07-10 08:18| 来源: 网络整理| 查看: 265

王彦群,贾浩坤,范振岐

(1.华中农业大学信息学院,武汉 430070;2.塔里木大学信息工程学院,阿拉尔 843300)

0 引言

库尔勒香梨在中国具有较好的声誉,是新疆特色水果和地理标志产品,已成为当地支柱产业之一[1-2]。

糖度,即含糖量,是库尔勒香梨的主要内部品质,因可溶性固形物含量中80%以上的成份是糖度,因此常以可溶性固形物含量反映糖度。传统的糖度检测方法是采用数字式糖度计[3-4]测量可溶性固形物含量,以此作为糖度值。但此方法是有损检测,很难用于无损检测仪及分级设备的研发中。因此,急需寻找糖度检测的无损、简捷方法,光谱分析技术便成为研究的热点。

近红外光谱分析技术是通过研究物质对光的透射、反射、吸收的能力来确定特定成分含量的一种方法,是一种低成本、快速、高效的技术,已广泛用于农产品品质无损检测。在蜜柑的糖度[5],凤梨的水分、纤维素和糖度[6],甜瓜、蜜瓜、土豆、洋葱等可溶性固形物含量(SSC)及干物质含量(DMC)[7],猕猴桃可溶性固形物和酸度[8],苹果糖度[9],草莓中维生素C[10],脐橙可溶性固形物[11],芒果的糖度[12]等检测方面得到较好应用。关于梨的品质研究方面,有梨表面色泽[13]、梨酸度[14]、砂梨的糖度[15]、南国梨的可溶性固形物[16]、翠冠梨可溶性固形物含量[17]以及梨坚实度[18]等方面的研究。

库尔勒香梨皮薄多汁的属性为无损检测技术的应用提供了很好的条件。将振动频谱技术[2]、介电谱技术[3,19-20]、可见/近红外光谱技术[4]、高光谱技术[21]分别用于无损检测库尔勒香梨的可溶性固形物含量和硬度,并取得了较好的预测效果。

总之,有关库尔勒香梨果实品质的研究相对较少。利用近红外光谱技术进行库尔勒香梨糖度的检测更是少见。考虑水果品种的差异性,糖分在不同水果中的光谱响应不尽相同。需要综合系统地比较各种近红外光谱变量筛选方法和建模理论在库尔勒香梨糖度预测中的性能,从而获取适用于库尔勒香梨糖分定量分析的近红外光谱的最佳建模理论。

本研究以成熟库尔勒香梨含糖量为研究指标,采集波段范围介于900~1700 nm之间的样本数据,对原始光谱选择合适的预处理方法,筛选特征波段,通过偏最小二乘法和支持向量机等方法分别建立香梨含糖量的检测模型,并针对模型的优劣进行比较,从而建立适用于库尔勒香梨含糖量检测的近红外光谱模型。

1 材料及方法1.1 样本采集

选取350个品质优良的库尔勒香梨作为实验样本。对样本清洗并依次编号后放在室温中24小时以消除温度对建模的影响。采集光谱数据前,在样本赤道部位每隔120o进行标记,每个样本标记3个采样区。

1.2 数据采集

采用Micro NIR 1700便携式光谱仪,扫描获得样本吸光度的原始光谱,采集每个样本的3次近红外光谱数据,取平均值作为实验数据。重复此操作,直到采集完全部样品的光谱图像,扫描的光谱数据以Excel表格的形式导出。

然后,在样品的3个标记区各切取一块带皮的果肉,压汁并过滤后,用糖度计进行测量,记录3个糖度值,取平均值作为糖度参考值。依次获取350个样本的糖度值。

1.3 光谱数据处理方法

通过四种方法对原始光谱数据进行处理与分析,分别采用标准正态变量变换(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)、一阶差分、二阶差分方法对光谱数据进行处理。

1.4 样本划分

从复杂信息中提取具有代表性的信息建模,需对样本进行选择,最常用的方法是基于欧式距离和浓度的样本选择方法(sample set partitioning based on joint x-y distance,简称SPXY)。本实验使用SPXY算法将样本按4∶1进行划分,80%构成定标集,20%构成预测集。将样本的光谱数据建模为数据向量,吸光度作为特征值。

1.5 特征波长提取方法

原始光谱数据中存在大量的噪声及冗余信息,不利于数据的建模。需要选取具有一定代表性的特征波长,使模型简化且具有较强的预测能力和稳健性。本研究利用相关系数法对光谱数据进行降维,筛选出相关性异常显著的特征波长用于建模。

1.6 模型的建立与分析

使用多元线性回归、偏最小二乘法(partial least squares,PLS)、支持向量机(support vector machine,SVM)等方法建立模型,采用相关系数r、精度(precision)、均方根误差(root mean square error,RMSE)等参数来评价模型的优劣。相关系数越接近1,说明预测结果越好;均方根误差越小,说明预测结果越准确;预测精度越接近1,说明精确度越高。

综上所述,基于近红外光谱的库尔勒香梨含糖量检测技术的主要流程如图1所示。

2 结果与分析2.1 香梨糖分含量

由香梨糖度测定结果可知,糖度最大值为16.58,最小值为11.02,平均值为13.60,标准偏差为1.14。

2.2 原始光谱及处理后光谱

图2为原始光谱数据,从图2可以看出存在大量噪声和散射基线漂移,因此需要对原始光谱数据进行预处理。利用一阶差分、二阶差分、SNV、MSC四种方法处理,并进行比较分析,得出最优处理方法。如图3所示,经过MSC预处理后的光谱有效地去除了噪声、散射等影响,光谱特征增强。

2.3 特征波长选择

糖类物质主要含O-H、C-H基团,游离O-H基团对应的近红外光谱吸收波段为960~980 nm、1360~1390 nm、1400~1420 nm;结合O-H基团对应波段为1000~1130 nm;CH2及CH3基团对应波段为1150~1220 nm、1410~1450 nm。利用相关系数法对光谱数据进行处理,根据图4的极值点选取出十二个特征波长,分别为914 nm、933 nm、951 nm、970 nm、976 nm、1001 nm、1131 nm、1150 nm、1397 nm、1404 nm、1416 nm和1540 nm,这些特征波长几乎都与糖类物质近红外光谱敏感基团对应,可用于后续模型的建立。

2.4 预测模型的建立

采用三种方法对特征谱段进行建模,预测结果如表1所示。

表1 不同模型下的预测结果

从表1可以看出,PLS模型均方根误差最小,相关系数最大,预测准确度也最高(达到0.9887),而线性回归模型次之。SVM建模方法的效果不太理想,可能受样本数量的影响。总之,PLS模型各方面均优于其它两种预测模型,可用于构建香梨糖分含量的预测模型。

3 结语

通过一阶差分、二阶差分、SNV、MSC预处理方法对原始光谱进行预处理分析,结果表明,MSC方法更适合于香梨近红外光谱数据的预处理。

使用相关系数法提取12个特征波长变量,通过线性回归、PLS和SVM方法分别建立香梨含糖量的检测模型,预测结果表明,PLS模型均方根误差为0.5457,预测精度为0.9918,相关系数为0.5802,均优于另外两种预测模型。MSC+PLS处理方法可用于库尔勒香梨含糖量快速无损检测,这可为进一步研究库尔勒香梨含糖量的便携式检测装置提供理论参考。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3