近红外光谱分析法快速测定稻谷常规化学指标

杨学文

(江西省粮油质量监督检验中心,江西南昌 330046)

摘 要:采集150份有代表性的我国南方地区稻谷样品的近红外光谱,用偏最小二回归分析法(PLS),建立了稻谷的水分、直链淀粉、蛋白以及胶稠度的近红外定量分析模型,并对30份预测集样品进行了验证。水分、直链淀粉、蛋白以及胶稠度的校正集模型的决定系数所(R2)分别为0.990 3、0.560 3、0.913 2以及0.678 0,交互验证均方根误差(RMSECV)分别为0.372 8%、1.456 9%、0.305 4%以及5.031 5%;验证集标准预测偏差(RMSEP)分别为0.382 5%、1.465 0%、0.510 0%以及5.052 1%。结果表明,近红外光谱分析法可以满足快速分析的要求。

关键词:近红外光谱;偏最小二回归;稻谷;品质指标测定

水稻是我国最主要的粮食作物之一,我国水稻的播种面积约占粮食作物总面积的1/4,产量约占全国粮食总产量的40%。目前水稻的常规化学成分如水分、直链淀粉、蛋白、胶稠度等指标主要通过常规的化学分析法进行[1-3],样品往往需要进行去壳等前处理操作,过程繁琐,检测速度较慢,无法满足粮食收购和水稻质量快速分析的需要。因此,开发一种水稻常规化学指标的快速分析方法具有十分重要的意义。

近红外光谱分析法是一种绿色环保、简单快速且能够无损检测的一种分析方法,已广泛应用于食品[4]、医药[5]、生物[6]和石油化工[7]等领域。目前,在水稻的近红外光谱分析方面已有部分研究[8-10],但尚无同时测定稻谷水分、蛋白、直链淀粉以及胶稠度的相关研究。为此,本实验通过采集我国南方地区150份稻谷样品的近红外光谱,应用偏最小二乘回归(PLS),研究近红外光谱分析法同时快速测定稻谷水分、直链淀粉、粗蛋白含量以及胶稠度常规化学指标的可行性。

1 材料与方法

1.1 样品与仪器

采用来自我国南方水稻产区共150份稻谷样品,其中江西50份、广西30份、广东份40份、海南30份。样品水分含量范围为10.20%~27.30%;直链淀粉含量范围为13.40%~28.00%;蛋白质含量范围为8.30~13%;胶稠度范围为52~89 mm。

IM9500近红外谷物分析仪:瑞典Perten公司;Unscrambler软件:挪威CAMO公司;3100旋风粉碎磨:瑞典Perten公司;ED 115烘箱:德国BINDER;VAP300凯氏定氮仪:德国Gerhardt公司;JLGJ-45砻谷机:河南中主良仪器设备有限公司;GY100高速旋转粉碎机:五洲鼎创(北京)科技有限公司;TU -1900紫外可见分光光度计:北京普析通用仪器有限公司;HH.S21-Ni8恒温水浴锅:北京三二八科学仪器有限公司。

1.2 实验方法

1.2.1 光谱采集

在室温下直接采集稻谷样品的近红外光谱。谱区采集范围:570~1 100 nm,光谱数据间隔:0.5 nm,扫描次数:10次。每个稻谷样品重复测量3次,采用3次测量的平均光谱进行建模。

1.2.2 光谱建模方法

从各省份样品中随机选取20%,共30个样品作为检验集进行外部预测,剩余的120个样品作为校正集进行交互验证建立定量分析模型。采用Unscrambler软件建立偏最小二乘回归定量分析模型并对预测集进行预测。偏最小二乘法是目前使用最为广泛的近红外定量分析方法。

1.2.3 模型评价方法

模型的评价主要由决定系数(R2)、交互验证均方根误差(RMSECV)、和预测集均方根误差(RMSEP)等参数来评价。R2越接近于1,说明参照值与预测值的数值越接近。模型的RMSECV值越小说明模型的校正效果越好,RMSEP值越小模型预测效果越好。一般情况下,如果没有特别指明,R2一般为校正集的决定系数。

决定系数计算公式:

其中,yi为第i个样品的实测值,y为第i个样品的预测值,ym

为样品实测值的平均值。RMSECV和RMSEP计算公式:

其中,yi为第i个样品的实测值,y^i 为第i个样品的预测值,n为校正集或预测集的样品数。当为校正集的预测结果时,(7)式为RMSECV;当yi为预测集的预测结果时,(7)式则为RMSEP。在实际应用中RMSECV常用来确定模型的维数,RMSEP则用来对模型的实际预测效果进行评价。

1.2.4 化学指标测定

稻谷的水分含量按GB/T 21305—2007方法进行测定。

稻谷蛋白含量按GB/T 5511—2008方法进行测定。稻谷直链淀粉按GB/T 15683—2008方法进行测定。

胶稠度按GB/T 22294—2008方法进行测定。

2 结果与分析

2.1 光谱预处理方法选择

由于近红外光谱中包含一些与待测样品性质无关的因素干扰,如样品的状态、光的散射、杂散光及仪器响应等的影响,使得光谱的基线发生漂移,从而影响光谱的重复性,因此在建模前往往需要对原始光谱进行预处理,以消除这些不利因素对模型的影响。

本实验中采用的预处理方法是对光谱进行Savitzky-Golay一阶导数处理。光谱求导可以消除信号的背景,确定光谱峰位置并改善光谱的分辨率。稻谷样品的原始光谱图如图1所示,从图中可以看出原始光谱的光谱基线漂移较为严重;经过一阶导数处理后,光谱基线漂移得到了较好地解决。

图1 稻谷样品原始光谱与一阶导数光谱对比图

在使用导数法进行预处理时,导数平滑点数的选择十分重要,点数过小噪声会偏大从而影响所建分析模型的预测能力;点数过大,平滑过度又会使得光谱失真而失去大量的有用信息。可通过不同平滑点数与模型的交互验证标准偏差(RMSECV)的变化情况来确定最佳的平滑点数。

不同平滑点数下稻谷各指标校正集模型结果见表1。

表1 不同平滑点数下稻谷常规化学指标校正集模型RMSECV值

注:a.“0”表示没有进行预处理。

由表1可以看出,经过预处理后,模型的RMSECV明显降低,且均在5点平滑时模型RMSECV值最小,故本实验采用一阶导数+5点平滑的预处理方法。

2.2 主成分数的确定

在确定模型的最佳预处理方法后,还需要确定模型的最佳主成分数。模型的主成分数过小,模型的拟合不足,交互验证和预测效果都不佳;主成分数过大,模型容易过拟合,出现交互验证结果较好但预测效果却不理想的情况。各指标模型在不同维数下的RMSECV值由图2所示。

从图中可以看出,水分、直链淀粉、蛋白质和胶稠度校正集模型的最佳主成分数分别为2、5、9和5。模型在达到最佳主成分数后,RMSECV值不再明显降低。

模型在最佳预处理方法和最佳主成分数下的校正集建模结果如表2所示:

图2 各指标模型RMSECV vs主成分数示意图

表2 稻谷各指标校正集建模结果

由图2和表2的结果表明,水分和蛋白质模型具有良好的自我预测效果,R2达到了90%以上,RMSECV值也较小。而直链淀粉和胶稠度这两个指标的模型R2较低,说明模型的校正偏差相对较大,这主要与其化学值测定方法的稳定性等因素有关。

为进一步检验模型的实际预测能力,采用所建立的定量分析模型对30个预测集样品进行预测,水分、直链淀粉、蛋白质和胶稠度模型的RMSEP分别为0.382 5%、1.465 0%、0.510 0%和5.052 1mm,相关预测结果如表3和图3所示。

表3 稻谷近红外分析模型预测结果统计结果

图3 稻谷近红外各指标模型预测值vs实测值关系图

从表3和图3可以看出水分和蛋白质两个指标模型的预测结果比较理想,RMSEP分别为0.382 5%和0.510 0%,能够满足相关指标分析的要求。与校正集结果类似,直链淀粉和胶稠度这两个指标预测偏差则相对较大,RMSEP分别为1.465 0%和5.052 1mm。尽管直链淀粉和胶稠度近红外分析模型的预测效果不如水分和蛋白质的理想;但从结果上来看,采用近红外光谱分析法能对这两个指标的进行大致的预测,预测结果仍具有一定的参考价值,可用于粮食收购环节的快速检测。

3 结论

采用近红外光谱谷物分析仪可以同时对稻谷常规化学指标进行预测。水分、直链淀粉、蛋白质和胶稠度模型的RMSEP分别达到了0.382 5%、1.465 0%、0.510 0%和5.052 1mm,基本满足了水稻常规化学指标析的要求。由于该方法无需稻谷去壳等前处理操作,且仪器易用、效果良好,适合进一步的应用和推广。

参考文献:

[1]丁文平,丁霄霖.大米直链淀粉的研究进展[J].粮食与饲料工业,2002(1):38-40.

[2]陈静静,孙志高.大米蛋白的研究进展[J].粮油食品科技,2008(6):8-10.

[3]姜松,刘锦伟,朱婷,等.籼米胶稠度测定方法的研究[J].中国粮油学报.2012(11):87-91.

[4]王玉霞,徐荣荣,任广鑫,等.绿茶茶汤中主要品质成分近红外定量分析模型的建立[J].茶叶科学,2011,31(4):355-361.

[5]Reboucas M V,Batista dos Santos J,Domingos D,et al.Near-infrared spectroscopic prediction of chemical composition of a series of petrochemical process streams for aromatics production[J].Vib Spectrosc,2010,52(1):97-102.

[6]叶旭君,钱琼秋,何勇,等.基于紫外—可见—近红外光谱技术的蔬菜细胞ATP含量无损检测研究[J].光谱学与光谱分析,2012,32(4):978-981.

[7]欧阳爱国,刘军.基于近红外与拉曼光谱的甲醇汽油定量分析[J].西南师范大学学报(自然科学版),2012,37(9):98-100.

[8]范维燕,邢邯.近红外光谱快速测定稻谷水分含量的研究[J].粮油食品科技.2008,16(5):49-52.

[9]徐彦,李忠海,付湘晋,等.近红外光谱技术在稻米品质快速检测中的应用[J].食品与机械.2011(1):158-161.

[10]李君霞,闵顺耕,张洪亮,等.水稻糙米粗蛋白近红外光谱定量分析模型的优化研究[J].光谱学与光谱分析.2006(5):833-837.

Rapid determination of rice conventional chemical index by near infrared spectroscopy

YANG Xue-wen
(Jiangxi Grain and Oil Quality Supervision and Inspection Center,Nanchang Jiangxi 330046)

Abstract:150 near infrared spectrum of rice which obtained from southern China were collected.Combined with partial least square(PLS)regression method,the quantitative analysis models of rice moisture,protein,amylose,and gel consistency were established and verified by 30 predication sets.The coefficient of determination(R2)and the root-mean-square error of cross-validation(RMSECV)of the moisture,amylose,protein and gel consistency models were 0.990 3 and 0.372 8%,0.560 3 and 1.456 9%,0.913 2 and 0.305 4%,and 0.678 0 and 5.031 5%,respectively;standard error of prediction(RMSEP)were 0.382 5%,1.465 0%,0.510 0%and 5.052 1%,respectively.The results indicated that near-infrared analysis method can meet the demand of rapid determination.

Key words:near infrared spectroscopy;partial least square regression;rice; quality index determination

中图分类号:TS 212.7

文献标识码:A

文章编号:1007-7561(2016)05-0065-05

收稿日期:2016-02-28

作者简介:杨学文,1973年出生,男,高级工程师.