林家永:近红外光谱技术在稻米品质分析中的应用
- 时间:2016-10-13
林家永 范维燕 邢郸
稻谷是我国主要的粮食作物之一,其产量占粮食总产量的1/3左右。稻米是我国人民的主要食物,全国约有2/3的人口以大米为主食。随着人们生活水平的不断改善,对稻米的品质要求愈来愈高,因此,有关部门和企业对稻米品质的快速、准确检测技术的需求日益强烈。近红外光谱分析技术是20世纪80年代以来发展最快、最引人注目的高效和快速的现代分析技术,它综合运用了计算机技术、光谱技术和化学计量学等多个学科的研究成果,在许多领域特别是在农业领域得到了广泛应用。它具有成本低、分析速度快、稳定性好、非破坏性等的优点,已成为粮食品质分析的重要手段。本文对近红外光谱技术在稻米品质分析中的应用情况进行综述。
一、近红外光谱分析原理与分析程序
(一)分析原理近红外光谱(near infrared spectroscopy,NIRS)的波长为780~2526nm,介于可见光和中红外光之间。通常又将近红外区分为近红外短波(780~1100nm)和近红外长波(1100~2526nm)两个区域。近红外光谱是由于分子振动从基态向高能级跃迁时产生的,主要是有机分子中含氢基团X-H(X=C、N、O)振动的倍频和合频吸收。不同基团产生的光谱在吸收峰位置和强度都有明显差异,并随样品组成的变化其光谱特征也发生变化。粮食中含有蛋白质、脂肪、糖、淀粉和纤维等有机成分,它们在近红外区域有丰富的吸收光谱,每种成分都有特定的吸收特征,这些吸收特征为近红外光谱定性定量分析提供了依据。
近红外光谱分析技术是利用有机物质在其近红外光谱区内的光学特性快速估测一项或多项化学成分含量。被测样品的光谱特征是多种组分的反射光谱的综合表现。各组分含量的测定基于各组分最佳波长的选择,按照式(1)回归方程计算组分含量。
组分含量=C0+C1(Dp)1+C2(Dp)2+....Cn(Dp)n(1)
式中C0-n为多元线性回归系数;(Dp)1-n为各组分最佳波长的反射或透射光密度值。
(二)近红外光谱分析程序近红外光谱分析技术是一种间接的测量方法,未知样品的分析是基于预先建立的数学模型,一般的分析程序为:(1)选择具有代表性的样品;(2)用标准方法测定样品的化学值;(3)扫描样品的近红外光谱;(4)运用化学计量学方法如偏最小二乘法(PLC)的软件,建立样品近红外光谱和化学值之间的数学模型;(5)用已知组分含量未参与定标的样品来检验定标方程的准确性,并在分析过程定期对模型进行校准;(6)测定时扫描待测样品的近红外光谱,通过对应的定标模型可以得到样品的组分含量。具体流程见图1:

其中定标的合理性决定了近红外分析准确度和稳定性。影响建立定标模型合理性的主要因素有:(1)参与定标样品的代表性。定标样品集应尽量覆盖待分析样品的变化范围,分布应尽量均匀,因此需要收集足够多的样品。(2)化学分析数据的准确性在很大程度上决定了近红外分析的准确性,因此参与定标样品的化学分析方法必须是权威和标准的,以保证结果的准确性。(3)近红外光谱的处理方式和定标技术要合适和最佳化。
二、近红外光谱分析技术的特点
近红外光谱分析技术之所以发展迅速,应用广泛,甚至被称为“分析巨人”,是由其高效、快捷、绿色、经济等技术特点所决定的。近红外光谱分析技术主要有如下特点。(1)分析速度快。样品的近红外光谱的信息需由计算机进行数据处理分析,获得光谱数据即可得到定量分析结果,整个过程可以在几分钟内完成,所用的时间比常规方法短得多。(2)使用方便。近红外光谱分析可以用透射和漫反射技术对样品进行直接测定,制样简单,不需要大量的样品前处理工作。(3)多组分同时测定。近红外光谱所含的信息量很大,一台仪器一次可以同时检测多个成分,如同时可以得到稻米的水分、蛋白质、直链淀粉含量等。(4)安全环保。近红外光谱分析只是取得样品的光谱信号,经定标建立模型后直接进行测定,无需用其他分析手段,是一种典型的绿色分析技术。(5)测定结果精度高。由于光谱测量的稳定性,测试结果很少受人为因素的影响,与常规分析方法相比,一般具有更好的重现性。(6)检测成本低。检测中不需要其他试剂等,检测成本低,非常适合于实验室和生产线上大批量样品的分析。(7)远程在线分析。近红外光谱分析可使用光纤,实现远程在线分析检测,而传统的分析技术一般是离线分析方法,分析耗时较长。
但是近红外光谱分析技术也有一些局限性:(1)一般物质在近红外区域的吸收较弱,所以近红外光谱分析技术不适于痕量分析;(2)近红外光谱分析是一种间接分析技术,分析未知样品是基于预先建立数学模型,因此,需要采集大量有代表性的样品,前期投入较大;(3)近红外测定精度与参比分析精度直接相关,在参比方法精度不够的情况下,无法得到满意结果。
三、近红外光谱分析技术在稻米品质检测中的应用
近红外光谱分析技术真正用于农产品实用分析始于20世纪60年代,Karl Norris等首先应用于测定谷物中的水分含量。但是当时的仪器由于测量噪声大、分辨率低以及谱带重叠等问题未能很好解决,影响了测定的准确性,以致于近红外光谱分析技术的研究曾经一度陷入低谷。80年代以后,由于计算机技术的迅速发展,带动了分析仪器的数字化,特别是化学计量学方法的发展大大解决了光谱信息提取和背景干扰等难题,近红外光谱技术得到进一步的发展。近红外光谱分析仪器已经由第一代的棱镜分光、第二代的滤光片分光、第三代的光栅分光,发展为第四代的干涉分光的近红外光谱仪。进入90年代,近红外光谱分析技术步入一个快速发展的新时期,应用领域几乎遍及各行各业,成为一种近乎全能的技术。目前近红外光谱分析技术在稻米中已用于蛋白质、脂肪、淀粉、直链淀粉、氨基酸、脂肪酸等品质的快速分析。
(一)稻米蛋白质含量测定稻米蛋白质含量是评价稻米品质的一个重要指标。稻米中含有适宜的蛋白质含量,不但可使稻米具有较高的营养品质,而且具有良好的外观和食味品质。但是稻米蛋白质含量过高,会影响外观并使食味下降。采用近红外光谱分析技术测定蛋白质含量可以大大缩短检测时间,简化操作,提高工作效率,在稻米蛋白质定量分析中已取得很好的结果。
舒庆尧等研究了用近红外反射光谱技术测定糙米粉和精米粉样品的蛋白质含量,结果表明测定蛋白质含量效果好。糙米粉样品定标和检验相关系数分别为0.995和0.932,精米粉样品分别为0.99和0.91。刘建学等以97个不同蛋白质含量的稻谷为样品,用主成分回归分析法,建立近红外反射光谱测定蛋白质定标模型。预测值与化学值间的相关系数达到0.94。同时比较了不同粒度样品对建模的影响,发现样品粒度越小,模型的预测效果越好。Himmerlsbach等应用不同国家和地区的稻谷品种样品90份,采用偏最小二乘法,建立了傅立叶近红外光谱测定精米蛋白质的定标模型。研究表明蛋白质含量的化学值与预测结果的相关系数达0.992。谢新华等以186份整粒稻谷为样品,用近红外透射谷物分析仪测定了蛋白质含量。采用多种回归统计方法进行定标方程的开发和比较,优化后用小量(5g)稻谷种子测定蛋白质含量。定标和交叉验证相关系数分别为0.9728和0.9675。他们采用改进偏最小二乘法(MPLS)建立糙米蛋白质近红外透射光谱定量分析模型。定标和交叉验证相关系数分别为0.9807和0.9768。结果表明可以替代常规分析方法。毕京翠等以稻谷、米粒、米粉3种形态的样品,建立了6个稻米蛋白质含量近红外光谱数学模型,并对模型预测结果进行了评价。稻谷、糙米粒和糙米粉定标模型相关系数分别为0.893、0.971和0.987,精米粒和精米粉定标模型相关系数分别为0.984和0.986。稻谷、糙米粒和糙米粉验证相关系数分别为0.683、0.801和0.939;精米粒和精米粉验证相关系数分别为0.921和0.959。米粉样品所建立的近红外光谱预测模型准确性最高,米粒次之。肖昕等利用籼稻、粳稻和糯稻样品169份,其中129份作为定标样品,40份作为检验样品,采用3种不同回归方法建立精米蛋白质含量定标方程。结果表明,用改进最小二乘法、偏最小二乘法和主成分回归法建立定标时,定标标准差分别为0.1258、0.1340、0.1177,定标相关系数分别为0.9941、0.9931、0.9950。3种方法在建立定标方程时差异不明显,均具有较好的预测效果。人工神经网络是用计算机软件或硬件模拟人脑神经网络功能的产物,为一种新型信息处理技术。刘建学等借助主成分分析,确立了用于近红外光谱分析的BP神经网络的输入输出模式对;并用BP神经网络方法建立了不同类型、不同粒度的稻米样品蛋白质含量预测模型,预测值与化学值间具有良好线性关系,相关系数达0.90以上。用BP神经网络可降低样品粒度的不同对预测结果造成的差异。谢新华等应用近红外透射光谱技术,采用多种回归统计方法建立定标数学模型,优化得到了单粒糙米蛋白质含量测定的近红外定标模型。其定标相关系数和检验相关系数分别为0.924和0.940。内部交叉验证和外部验证结果表明,近红外定量分析有很高的准确度。
(二)稻米脂肪含量测定脂肪是稻米中主要的化学成分,对稻米食味和外观品质有较大影响。脂肪含量还是影响稻米贮藏性能的重要因子,脂肪的酸败会使稻米的贮藏寿命大大缩短。因此,快速测定稻米脂肪含量,对于评价稻米的食用品质和营养价值具有重要意义。
王海莲等利用159份不同的稻谷品种,应用近红外光谱分析技术和偏最小二乘法建立脂肪定量数学模型。结果表明,糙米粒和糙米粉数学模型的交叉验证预测值和化学值间的相关系数分别为0.944和0.955;外部验证相关系数分别为0.795和0.871。唐绍清等利用154份精米粉样品建立近红外反射光谱脂肪含量数学模型。选取3段谱区(6100~4250cm-1;6100~5450cm-1并4600~4250cm-1;7500~5450cm-1并4600~4250cm-1),分别采用4种不同的预处理方法(直线扣除、散射校正、矢量归一、一阶导数),对其结果进行比较,发现选择不同谱区和光谱预处理方法对所建模型有很大影响,中谱区(6100~4250cm-1)和光谱预处理(直线扣除)的组合较为理想,交叉验证的预测值和实际值的相关系数为0.9084。15份精米样品脂肪含量为0.20%~0.80%作为检验集,其预测值和化学值都比较接近。
(三)稻米直链淀粉含量测定直链淀粉是衡量稻米品质的一个重要指标,能较好地评价稻米的蒸煮品质。上世纪90年代初以来,利用近红外光谱技术快速分析稻米直链淀粉含量的研究一直都非常活跃。
Villareal等应用168个稻谷样品,建立了测定糙米和精米直链淀粉含量的近红外透射光谱定标模型。糙米和精米直链淀粉定标模型的相关系数分别达到0.94和0.93,在育种选育中被国际水稻中心所采用。Delwiche等用近红外光谱(1100~2498nm)技术测定精米粉的直链淀粉含量,97份实验样品来自美国5个稻谷主产区。定标模型相关系数达0.95。实验室间的再现性标准偏差0.5%,说明所建立直链淀粉定标方程的预测精度良好。舒庆尧等采用近红外反射光谱技术建立了测定稻米中直链淀粉含量的定标模型,并探索了影响定标的因素。定标方程相关系数达到0.91,可在实际中应用。他们用该技术测定小样品量糙米粉和精米粉样品的直链淀粉含量。结果表明糙米粉的定标和检验相关系数分别为0.927和0.65,精米粉的定标和检验相关系数分别为0.985和0.93。他们还研究稻米中直链淀粉含量近红外测定建立回归方程时样品群体的界定与选择。共用1106份稻米样品为起始群体,根据光谱特征,有16份样品因为马氏距离H大于3.0而被剔除。在分别选用H距离≥0.0、0.4,0.6、0.8、1.0的样品作为定标群体时,样品数量分别为896、840、649、431和277个。对其分别建立回归方程,并用1个样品数为194个的独立群体对回归方程进行检验。结果发现,用H≥1.0选定的277份样品群体和用H≥0.0选定的896个样品群体所建立的回归方程效果相似,定标相关系数和检验相关系数都达0.98以上,而标准差也几乎相似。从而表明可用SELECT程序选择H≥1.0的代表性样品,可以大大减少样品的数量。刘建学等对不同粒度、不同类型稻米样品建立了稻米直链淀粉含量的预测模型,精米样品预测值与化学值间的相关系数达0.95。刘建学等用BP神经网络方法建立了不同类型、不同粒度的稻米中直链淀粉含量的近红外光谱预测模型,其预测值与化学值间具有良好线性关系,相关系数达0.9。用BP神经网络可降低因样品粒度的不同而对预测结果造成的差异。王林友等用傅立叶变换近红外漫反射光谱法测定水稻糙米粒直链淀粉含量。结果表明该方法与常规方法有类似的准确性和精度,相关系数为0.9908。胡昌泉等用不同直链淀粉含量的稻谷样品265份,探讨用透射式近红外分析仪测定糙米直链淀粉含量的可行性。结果的交叉验证相关系数0.821,标准差1.822。肖昕等以124份稻谷种子为样品,利用Infratec1255型近红外谷物品质分析仪测定了直链淀粉含量。结果的定标相关系数为0.885。陆艳婷等分别建立了稻米、糙米、精米、糙米粉和精米粉直链淀粉含量的预测模型,定标相关系数分别为0.8136、0.8864、0.8915,0.9261、0.9505,粉末样品的测定结果偏差比整粒样品的偏差小。肖昕等对222粒单粒稻谷进行扫描并测定了直链淀粉含量。优化得到了单粒水稻种子直链淀粉含量测定的近红外定标方程。其定标标准差和相关系数分别为2.828和0.848。
(四)稻米水分含量测定稻谷水分含量是稻谷国家质量标准的一个重要定等指标,也是判断储藏过程中稻谷是否安全的一个监测指标。因此,快速准确测定稻谷水分含量对于提高粮食收购作业的效率和粮食安全储藏的监测水平具有重要作用。
范维燕等收集了144份稻米样品,应用近红外光谱技术研究建立稻米水分含量测定定标模型,探讨了光谱散射处理、数学导数处理等对定标模型的影响。结果表明修正偏最小二乘法所建立的定标模型最好,相关系数为0.9999;55份样品外部检验的相关系数为0.996,两种方法T检验值为1.685(P<0.05),无显著性差异,预测值与实测值平均绝对偏差为0.03,说明有很高的预测准确性,可作为快速分析方法,应用于实际分析。康月琼等采用傅立叶变换近红外光谱法建立了整粒稻谷种子的预测模型,样品共87个,水分含量范围为11.6%~13.6%,所建数学模型的定标标准差为0.1847,预测标准差为0.2212,检验集中水稻水分真实值与预测值的相关系数为0.8321。
(五)稻米氨基酸含量测定氨基酸是蛋白质的基本组成单位,氨基酸的组成对蛋白质的营养效价具有重要作用,是粮食育种和种质资源鉴定及筛选的重要测定项目。吴建国等建立近红外光谱法检测稻米中苏氨酸、胱氨酸和赖氨酸3种必需氨基酸含量的定量模型,探讨了不同数学处理方法、光谱散射定标和回归统计方法的影响。研究表明,光谱数据的数学预处理对定标回归方程有很大影响,光谱散射处理对氨基酸的定标改善也有一定作用。以偏最小二乘法和修正偏最小二乘法建立的回归方程效果好。苏氨酸、胱氨酸、赖氨酸的定标相关系数高达0.927、0.888和0.823,而定标标准差分别小至0.258、0.179和0.298,可用于稻米的苏氨酸、胱氨酸和赖氨酸含量的测定。
(六)稻米脂肪酸值测定脂肪酸值的变化可以反映稻谷在储藏过程中的品质变化和劣变程度,是稻谷储存品质判定的一项重要指标。Li等以140个水稻样品,采用偏最小二乘回归法,建立测定整粒糙米、糙米粉脂肪酸值的定标模型。研究表明整粒糙米定标模型的相关系数为0.87,标准差为0.83;糙米粉的定标模型相关系数和标准差分别为0.94和0.83。温度的变化会影响脂肪酸值的测定值,从10℃变到40℃,测定结果的脂肪酸值会增加0.24mgKOH/100g干物质。
(七)稻米矿物质元素测定稻米中Fe、Zn、Se、Ca等元素对消费者的健康很重要,因而提高稻谷有益矿质元素含量是改善人们矿质营养的关键。蒋淑丽分别用274份和216份的两组样品,通过不同的数学处理和散射处理,建立了K、Mg、P、Zn、Cu、Mn和Se含量的最佳近红外反射光谱定标方程,定标的相关系数分别为0.78、0.74、0.81、0.57、0.56、0.75和0.58,外部检验相关系数分别为0.66、0.68、0.65、0.39、0.57、0.32和0.53,结果较差。
(八)稻米糊化特性测定稻米糊化特性与米饭质地和口感紧密相关,是评价稻米蒸煮食用品质的重要指标。舒庆尧等比较了用近红外反射光谱直接测定约0.5g糙米粉和约3g精米粉样品的糊化温度,结果表明,糙米粉定标模型的定标标准差和相关系数分别为0.349和0.827,检验标准差和相关系数分别为0.48和0.74;精米粉定标模型的定标标准差和相关系数分别为0.224和0.949,检验标准差和相关系数分别为0.36和0.84。刘义富等建立了稻米淀粉RVA谱特征值崩解值(BDV)、消减值(SBV)、回复值(CSV)3项指标的近红外分析模型。结果显示BDV、SBV和CSV的模型定标相关系数分别为0.9707、0.9966和0.9943。内部交叉检验的相关系数分别为0.942、0.9942和0.9913。验证相关系数除DBV外均达到0.99以上,模型准确性较高,具有实用价值。
(九)稻米胶稠度测定胶稠度是评价稻米蒸煮食用品质的重要指标之一。刘建学等研究了用近红外光谱分析技术检测稻米的胶稠度,对60个样品的光谱数据用偏最小二乘法建立了测定稻米胶稠度的数学模型,其结果与化学值间的相关系数为0.95,验证相关系数达0.92,预测标准差为0.78,可用于稻米胶稠度的快速检测。
上述可以看出,近红外测定稻米品质一般采用近红外漫反射和透射光谱技术,数学算法多采用偏最小二乘回归法,样品既有粉状样品又有整粒样品。从研究结果来看,用粉状样品的测定精度要高于整粒样品;近红外漫反射光谱技术的测定精度要高于近红外透射光谱技术。为了简明起见,以上就近红外光谱分析技术在稻米各个品质分析中应用分别进行论述。但是一台近红外光谱分析仪可以同时进行多个组分的定标和多组分的分析,这也是近红外光谱分析的最大优势。
四、展望
近红外光谱分析技术由于分析速度快、不破坏样品、操作简单、稳定性好、效率高、无污染和成本低等特点,在稻米品质检测中已得到了大量的应用,主要集中在稻谷的蛋白质、直链淀粉、脂肪、氨基酸含量、糊化特性等品质的分析。但是在我国许多还处于定标模型摸索阶段,还没有在实际中应用,有的指标定标模型的预测精度还不高,并且还有很多的稻米品质如淀粉、粗纤维、储藏害虫等都还没有开发测定模型。通用的定标模型软件还没有,使得不同单位近红外光谱定标模型无法转移,造成了很大的人力和物力的浪费。不过随着对计算机技术、光谱学、图像识别处理技术和化学计量学融合的深入研究,这些问题将得到解决,近红外光谱分析预测能力及预测精度也将得到进一步提高,多组分的快速检测、远程在线分析、定标模型软件标准化工作将不断拓展,近红外光谱技术在我国粮食品质的快速分析中将得到更加广泛的应用。
| 相关附件 |


