• 589.12 KB
  • 2022-04-22 13:45:15 发布

基于遗传算法的茶多酚快速测定模型优化研究.pdf

  • 11页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'中国科技论文在线http://www.paper.edu.cn基于遗传算法的茶多酚快速测定模型优化研究#王冰玉1,商虎2,3,4,黄艳2,3,4,林馥茗2,3,4,孙威江1,2,3,4**5(1.福建农林大学园艺学院,福建福州350002;2.福建农林大学安溪茶学院,福建福州350002;3.福建茶产业技术开发基地福建福州,350002;4.福建省茶产业工程技术研究中心,福建福州,350002)10摘要:本研究基于遗传算法建立GA-PLS多酚定量检测模型。优化结果表明,优化后的茶多酚GA-PLS测定模型,与全谱段PLS模型对比,建模波数从1557个数据精简为552个,有效简化模型,对验证集样品预测相关系数从0.73提高至0.97,提高了32.9%;预测均方根误差也从0.91减小到0.3,降低了67%,能够很好的实现对安溪铁观音的茶多酚含量快速、准确的测定。15关键词:茶学;遗传算法;铁观音;茶多酚中图分类号:S571.1StudiesontheoptimizationofteapolyphenolsrapiddeterminationmodelbasedonGeneticAlgorithm20WANGBingyu1,SHANGHu2,3,4,HUANGYan2,3,4,LinFuming2,3,4,SUNWeijiang1,2,3,4(1.CollegeofHorticulture,FujianAgricultureandForestryUniversity;2.AnxiCollegeofTeaScience,Fuzhou350002,China;3.TechnologicalExploitingBaseofFujianTeaIndustry,Fuzhou350002China;254.FujianTeaIndustryEngineeringTechnologyResearchCenter,Fuzhou,350002,China;Abstract:Inthispaper,WebuilttheAnxitieguanyinteapolyphenolsquantitativeanalysisGA-PLSmodelbasedonthegeneticalgorithm.Optimizationresultsshowedthat,comparedwithfullspectrumofPLSmodel,theoptimizedteapolyphenolsdeterminationofGA-PLSmodelbecameleanerandmore30nimble,andthedatavolumeforbuildingcalibrationmodelreducedfrom1557to552byGeneticalgorithm.Thepredictioncorrelationcoefficient(Rp)ofvalidationsetsamplesincreasedfrom0.73to0.97,increasedby32.9%;therootmeansquareerrorofprediction(RMSEP)reducedfrom0.91to0.3,decreasedby67%.ThequantitativeanalysisGA-PLSmodelcanaccuratelyandrapidlydeterminatethepolyphenolsofAnxitieguanyinteawell.35Keywords:Teascience;GeneticAlgorithm(GA);Tieguanyintea;Teapolyphenols0引言茶叶品质不仅是指传统意识上单一的感官品质,广义的茶叶品质,由三部分组成:感官品质、理化成分和质量安全水平。近年来,随着消费者对茶叶的营养成分和保健功能更加深40入的了解,茶叶的理化品质成分在茶叶品质中的作用受到越来越多消费者和研究者的关注。茶多酚是茶叶中酚类物质的总称。在茶叶中,茶多酚含量约占18%~36%,有助于清除人体自由基,具有杀菌、抗癌和防治心血管疾病等作用,是茶叶中最重要的保健成分之一。基金项目:高等学校博士学科点专项基金(20133515110006)作者简介:王冰玉,女,1991年生,福建农林大学园艺学院硕士研究生通信联系人:孙威江(1964-),男,博士,教授,研究方向:茶叶品质与质量安全调控.E-mail:swj8103@126.com-1- 中国科技论文在线http://www.paper.edu.cn茶叶品质评价方法,传统形式包括化学测定法和感官评定法。其中,感官评定法是基于审评人员的嗅觉、味觉、视觉、触觉及大量的专业知识和丰富经验对茶叶的品质进行评45价,诸多主观因素容易对审评结果的客观性和真实性造成影响[1,2];化学测定法也存在步骤繁琐、成本高、耗时费工等弊端。现有将电子舌与电子鼻结合使用的方法对茶汤进行评价,虽提高了灵敏度与识别能力[3],但传感器的选择性以及在模式识别系统上亦应多样化的局限也影响了评价精度[4]。现有的指纹认证技术操作方法和步骤也较为繁琐,样品前处理复杂,且要求对茶叶内含物质的其中一种成分进行有效分离和分析[5]。50综上所述,在对大量的茶叶品质进行分类评价时,要尽量避免传统评价方式在茶叶品质鉴定过程中的局限性,寻找出一种快速、灵敏、准确,并且能较全面的覆盖其化学信息的评价方法,也正是茶叶品质研究领域的热点和难点所在。因此,本实验基于近红外光谱技术结合遗传算法对茶多酚含量的快速检测进行研究,从理化成分的角度对茶叶品质进行评价分析。551材料与方法1.1实验材料基于遗传算法的茶多酚测定模型优化实验共收集安溪铁观音茶样81个,均为清香型铁观音茶叶。其中31个茶样为2012-2013年不同厂家不同批次的茶样,由福建安溪铁观音集团和安溪八马茶业有限公司提供,是建立安溪铁观音茶多酚测定PLS模型的实验茶样,另6050个安溪铁观音茶样收集于2014-2015年,安溪县的长坑乡、感德镇、桃舟乡、祥华乡、西坪镇及剑斗镇等地,均从茶农或者茶叶生产厂家直接收集购买未包装的毛茶,作为补充和优化茶多酚测定PLS模型的试验样品。1.2仪器和软件采用AntarisII傅立叶近红外光谱仪(ThermoFisherScientific,美国),基于Workflow65光谱采集工作流获取茶样近红外光谱信息,实验地点:赛默飞世尔(上海)仪器有限公司;分析天平:感量0.001g;水浴锅:70℃;离心机:转速3500r/min;分光光度计;使用红外处理软件OPUS进行近红外光谱预处理和数据格式转换;利用MatlabR2010a软件进行数据分析和数学建模。1.3试剂和药品70甲醇(CH3OH,分子量32.04)、无水碳酸钠(Na2CO3,分子量105.99)、没食子酸、福林酚(Folin-Ciocalteu)试剂。1.4实验方法1.4.1样品前处理在采集近红外光谱数据前,将茶样放入中药粉碎机研磨,粉碎1min左右至粉末状,过7580目样品筛,取筛下茶粉,称取10-15g茶粉进行编号、封装,作为近红外光谱数据采集的待测样品。-2- 中国科技论文在线http://www.paper.edu.cn1.4.2茶多酚含量的化学分析参照国家标准GB/T8313-2008《茶叶中茶多酚和儿茶素含量的检测方法》对安溪铁观音茶样中的茶多酚含量进行测定。其基本原理是:采用70%的甲醇在70℃水浴中提取茶粉中80的茶多酚,茶多酚中的-OH基团遇到福林酚(Folin-Ciocalteu)试剂后发生氧化并显蓝色,在最大吸收波长765nm的条件下,用没食子酸作校正标准,定量茶多酚。表1安溪铁观音茶多酚实测值统计表Table1StatisticofAnxiTieguanyinteapolyphenolscontent茶多酚样本数最小值最大值均值标准差Teapolyphenols/%numbersamplesMinMaxMeanvalueStandarddeviation校正集3210.8517.0013.721.573验证集5012.7718.7514.921.35385注:校正集数据来自本实验室应用近红外光谱技术测定铁观音茶多酚含量的研究—于英杰Note:thedataofcalibrationisfromthestudyonteapolyphenolsrapiddeterminationoftieguanyin—YuYingjie图1没食子酸标准曲线图Fig1Gallicacidcanonicalplotting901.4.3近红外光谱数据的采集保持实验室操作环境温湿度基本恒定,利用AntarisII傅立叶近红外光谱仪采集得到近红外范围内茶样漫反射光谱信息。将10g茶粉装于光谱仪的采样杯,基于Workflow设置茶粉光谱采集工作流,自动完成样品和背景采集。光谱扫描波数范围:10000cm-1-4000cm-1,采样杯在旋转过程中光谱扫描次数为64次,分辨率8cm-1,数据点间距为3.8569cm-1,光谱95数据点为1557个,数据格式为log(1/R)。1.4.4近红外光谱数据的采集基于茶多酚PLS定量分析模型中校正集样品近红外光谱数据的预处理方式,本实验使用红外处理软件OPUS对茶粉的近红外光谱信息进行二阶导数+归一化处理(“+”表示光谱预处理方式结合),并进行数据格式转换。1001.4.5基于遗传算法的模型优化为进一步优化传统的PLS铁观音茶多酚定量检测模型,本实验引入遗传算法,对茶样的近红外光谱信息进行特征波长的筛选,对原有的茶多酚PLS测定模型进行整合和优化,从而建立全新的安溪铁观音茶多酚GA-PLS测定模型。-3- 中国科技论文在线http://www.paper.edu.cn遗传算法具体步骤如下:105(1)结合近红外光谱特征波长信息,选用近红外光谱数据6670cm-1-4000cm-1谱段,平均分为30个子区间并以0或1编码各子区间,其中“0”表示剔除谱区间,“1”表示选用谱区。(2)以PLS交叉校验预测值与标准值的相关系数(R)和均方根误差(RMSEC)作为评价指标。针对传统遗传算法易产生局部最优的现象,将适应值函数设置为F=R/(1+RMSEP),以F最大值作为评价指标,F越大则模型的预测能力越强。110(3)利用选择、交叉和变异三种算法操作,进行遗传迭代和选优。(4)在波长筛选过程中设置迭代次数,群体数目、杂交概率和变异概率等相应参数,最终选取最佳子区间组合作为参与建模的光谱谱区。1.4.6模型的验证采集验证集样品的近红外光谱数据作为模型验证的输入量,带入安溪铁观音茶多酚115GA-PLS测定模型,预测茶样的茶多酚含量,将预测值与依照国家标准的化学分析测定值作对比分析,对茶多酚GA-PLS测定模型进行评价和验证,检测模型的预测能力。模型结果的评价指标以校正集相关系数(RC)、校正集均方根误差(RMSEC)、验证集相关系数(RP)、验证集均方根误差(RMSEP)表示[6],其中,R的大小决定了预测值与实测值之间相关的密切程度。RMSEP反映了预测值与实测值之间的偏离程度。R越大,RMSEP越小,模型的预120测准确度越好[7,8]。(1)相关系数Rnn222R1((ab)/(bc))ii11式中:n为样品数;a为第i个样品的预测值;b为第i个样品的实测值即真值;c为样品真值的平均值。125(2)预测均方根误差(RMSEP)n2RMSEP(ba)/ni1式中:n为样品数;a为预测集中第i个样品的预测值;b为预测集中第i个样品的实测值。2结果与分析1302.1近红外光谱预处理结果分析原始的安溪铁观音茶多酚测定PLS模型在建立过程中,对比了不同光谱预处理方式对定量模型的影响,结果显示,基于二阶导数+归一化方式处理后的光谱数据,输入分析模型可以得到最优的预测结果,相关系数为0.73,预测均方根误差RESEC为0.91。根据前期研究基础,本实验依然选择二阶导数+归一化作为优化PLS模型过程中的光谱预处理方式。135近红外光谱检测仪器受外界环境干扰且仪器自身的稳定性对光谱影响较大,容易导致光谱曲线在不同谱段呈现不同的光滑程度,有些谱区噪声较大,基线漂移严重[9]。二阶导数+归一化作用在消除光谱中基线的漂移,有效降低随机噪声造成的影响,同时,归一化可以较-4- 中国科技论文在线http://www.paper.edu.cn好的改善因样品颗粒不均匀导致的实验误差,提高灵敏度和增强茶样光谱特征。140图2安溪铁观音原始光谱图Fig2OriginalspectrumofAnxitieguanyintea145图3安溪铁观音二阶导数+归一化处理图Fig3SD+NormalizationSpectrumofAnxitieguanyintea2.2基于遗传算法的近红外光谱区筛选遗传算法运行程序由MatlabR2010a软件进行编写和分析数据。茶叶的物质组成结构复杂,在建立较复杂样品体系的近红外光谱分析模型时,应明确干扰样品分析体系的主要因素150并找到消除干扰的方法,进行特征波长的筛选,从而保证模型的精度和稳健性。遗传算法能有-5- 中国科技论文在线http://www.paper.edu.cn效保留足够的近红外光谱的信息,同时达到优化和压缩近红外光谱数据的作用。这主要取决于交叉算子,交叉是遗传算法中的核心部分,在遗传算法运行过程中起局部搜索的作用,交叉和变异这一对算子相互竞争的遗传模式,决定了遗传算法的高度搜索能力,使算法具有全局收敛,能对最优光谱区间进行搜索,从而剔除不相关或非线性变量,重组建模数据,提高茶155多酚测定模型的精确度与强化模型预测能力。遗传算法和光谱分析理论方法结合对研究对象特征波长的选择方法,对近红外技术应用和推广具有很高的实用价值。160生成初始种群计算适应度终止结束165选择复制交叉170变异生成新一代种群175图4遗传算法流程图Fig4FlowchartofGeneticAlgorithm1802.3茶多酚PLS和GA-PLS测定模型结果分析根据茶粉近红外光谱图中吸收峰分布规律:6860cm-1处一般为N-H键伸缩振动一次倍频峰;5780cm-1处集中亚甲基C-H伸缩振动的一次倍频峰;5180cm-1处为C-O伸缩振动的二次倍频峰;4610cm-1处为一级胺与三级胺伸缩振动的合频峰;亚甲基C-H伸缩振动和弯曲振动的合频峰[10,11]一般集中于4330cm-1处。因此,本实验选取近红外光谱谱区1856670cm-1-4000cm-1范围进行特征波长的筛选,遗传算法的参数设置为:种群大小为50,基因数为30,变异概率为0.01,交叉概率为0.6,迭代次数为10,以F=R/(1+RMSEP)的最大值作为模型的优化指标。即将6670cm-1-4000cm-1谱区平均分为30个子区间,每个子区间包含23个数据点,将子区间进行随机编码,通过选择、交叉和变异等算法进行优选,筛选最优谱区。190茶粉近红外光谱信息在经过二阶导数+归一化预处理后,基于遗传算法筛选特征波长,优化茶多酚PLS模型,建立GA-PLS模型。实验结果显示,经过遗传算法优选出最佳的谱区编码为:111111110111101001111101011111,其中编码为“1”的基因个数为24个,表示平-6- 中国科技论文在线http://www.paper.edu.cn均分割的30个子区间有24段谱区被选择参与GA-PLS模型的建立,即建模点数为23×24=552。195从模型评价结果可知:茶多酚GA-PLS测定模型对校正集和验证集的预测能力均远超于全谱段的PLS模型。其中,全谱段PLS模型校正集相关系数RC=0.73,校正集均方根误差RMSEC=0.91,模型的预测精度较差;优化后GA-PLS模型校正集相关系数RC=0.99,校正集均方根误差为RMSEC=0.104,验证集相关系数RP=0.97,验证集均方根误差RMSEP=0.304。与优化前PLS模型对比可得,验证集相关系数RP提高了32.88%,均方根200误差RMSEP降低了66.6%,且建模点数从全谱段1557个数据减少到552个变量,简化了分析模型,预测精度提高。表2茶多酚PLS和GA-PLS测定模型结果Table2StatisticresultsbyPLSandGA-PLSmodel建模方法建模波段最佳染色体校正集验证集RCRMSECFRPRMSEPFPLS1557全谱段0.730.910.8GA-PLS55211111111011110100.990.1049.510.970.3053.1801111101011111205图5茶多酚PLS和GA-PLS测定模型的线性回归散点图(a)偏最小二乘模型;(b)遗传算法-偏最小二乘模型Fig5LinearregressionscatterplotchartsofPLSandGA-PLSmodel(a)PLS;(b)GA-PLS210215表3茶多酚PLS测定模型预测值与实际测量值对比结果Table3Comparisonresultsofteapolyphenols’actualvalueandcalculatedvaluebyPLSmodel-7- 中国科技论文在线http://www.paper.edu.cn茶样编号真值预测值绝对偏差相对百分偏差113.14812.24220.9056.89%212.42212.8060.3843.09%312.21712.8870.6705.49%220411.92612.74430.8186.86%511.75013.14811.39811.90%611.38212.33690.9548.39%712.47213.03520.5644.52%812.57713.39710.8206.52%916.95614.8052.15112.68%2251012.47712.34520.1321.05%1110.84911.67330.8257.60%1210.04811.60811.56015.52%1312.65612.23160.4253.36%1413.90012.51791.3829.94%1511.97312.02810.0550.46%2301611.79211.10740.6855.81%1711.87511.12210.7536.34%1812.16811.6030.5654.64%1912.27311.69440.5794.72%2011.36911.21070.1581.39%2112.35913.38331.0258.29%2213.09513.6330.5384.11%2352313.21512.47960.7365.57%2412.94312.8530.0900.69%2512.24412.68970.4463.64%2613.50613.10780.3982.95%2713.61214.18890.5774.24%2814.08614.43160.3462.46%2402913.93013.96070.0310.22%3013.80714.07530.2681.94%3115.80013.47852.32114.69%平均值12.73612.7360.7285.68%245表4茶多酚GA-PLS测定模型预测值与实际测量值对比结果Table4Comparisonresultsofteapolyphenols’actualvalueandcalculatedvaluebyGA-PLSmodel茶样编号真值预测值绝对偏差相对百分偏差-8- 中国科技论文在线http://www.paper.edu.cn115.57315.8490.2751.77%218.74918.7260.0240.13%313.70013.6900.0100.07%415.64115.7280.0870.56%515.24215.3720.1300.85%615.16215.5980.4362.88%717.74016.1981.5428.69%814.63714.5340.1030.70%915.92215.8440.0780.49%1015.52215.4600.0610.40%1113.63913.4640.1751.28%1215.53315.6140.0810.52%1318.01417.8040.2101.16%1414.92714.8710.0560.38%1515.98515.9520.0330.20%1615.49516.0480.5523.56%1717.43017.5130.0820.47%1815.82715.5400.2871.81%1915.43115.4650.0330.21%2014.25914.1360.1230.86%2115.10615.0710.0350.23%2214.20714.4220.2151.51%2315.28115.2310.0500.32%2415.29215.6580.3662.39%2513.52613.6320.1060.78%2613.46613.5530.0870.65%2712.77012.9570.1861.46%2813.61413.7990.1851.36%2912.92812.7000.2281.76%3013.64113.7260.0850.62%3114.89815.0050.1060.71%3215.42015.4240.0040.03%3313.78014.4270.6474.69%3415.37515.3080.0670.44%3517.23917.2850.0470.27%3614.01713.4150.6024.30%3717.49317.5200.0260.15%3813.65213.5690.0830.61%3914.92315.0790.1571.05%4013.38913.3740.0150.11%4114.22414.2580.0330.23%4214.17014.2830.1120.79%-9- 中国科技论文在线http://www.paper.edu.cn4314.25414.1410.1140.80%4414.31414.5290.2151.50%4513.93013.8440.0860.62%4614.08013.9900.0900.64%4714.15714.1630.0050.04%4813.60013.7410.1411.04%4913.92813.5970.3312.38%5015.10615.0710.0350.23%平均值14.92414.9240.1771.17%250表5茶多酚GA-PLS测定模型预测值与真实值进行配对t检验结果Table5T-testofpredictedvaluesandactualvaluesbyGA-PLSmodel两组均数t检验处理样本个数均值标准差标准误95%置信区间真值5014.92421.35330.191414.539615.3088预测值5014.92361.31830.186414.548915.2982两处理方差齐性检验结果F=1.0537p=0.8554两处理方差齐性,均值差异检验t=0.0022df=98p=0.9982从表3与表4数据可知,优化前的PLS模型对茶多酚含量进行预测,绝对偏差的最大值为2.321,平均值为0.728,相对百分偏差的最大值为15.52%,平均值为5.68%;经遗传255算法优化后,GA-PLS模型对茶多酚含量预测结果显示,绝对偏差的最大值为1.542,平均值为0.177,较优化前分别降低了33.6%和75.7%,相对百分偏差的最大值为8.69%,平均值为1.17%,较优化前分别降低了6.83个百分点和4.51个百分点。表5中,对验证集中50个样品的预测值与审评真值进行配对t检验,结果显示:两处理方差齐性检验结果p=0.8554,P值大于检验水平0.05,表明预测值与真实值无显著差异。茶多酚GA-PLS预测模型对安溪260铁观音样品中茶多酚含量的检测,其准确性可靠。3讨论本实验用遗传算法筛选建模波段,并与偏最小二乘法结合,优化茶多酚检测方法,建立茶多酚GA-PLS快速测定模型。优化结果表明,茶多酚GA-PLS测定模型,充分利用了遗传算法全局寻优和收敛性的特征,既有效保留主要光谱信息,且减少建模的数据变量,建模波265长远远少于全谱段PLS模型,降低模型的运算量,精简模型。GA-PLS测定模型的预测相关系数从0.73提高至0.97,预测均方根误差也从0.91降低至0.3。遗传算法结合近红外光谱技术,筛选特征变量,成功实现提高茶多酚测定模型的精确度与强化模型预测能力的目的,解决单纯PLS较难校正关联的体系问题。能在短时间内快速、准确的测定多个样品的茶多酚含量,完成其它方法需花费几天才能完成的分析任务,可以代270替传统的化学检测方法,节约成本,提高检测效率和精度,为茶叶品质成分检测技术提供方法借鉴,有较好的推广价值。-10- 中国科技论文在线http://www.paper.edu.cn4结论基于遗传算法的茶多酚快速测定模型优化研究,以安溪铁观音茶多酚PLS定量分析模型为基础,进行数据重组和剔除,优选近红外光谱信息的特征波长,并建立GA-PLS安溪铁275观音茶多酚定量检测模型。优化结果表明,优化后的茶多酚GA-PLS测定模型,与全谱段PLS模型对比,建模波数从1557个数据精简为552个,有效简化模型,对验证集样品预测相关系数从0.73提高至0.97,提高了32.9%,预测均方根误差也从0.91减小到0.3,降低了67%,达到优化模型,提高茶多酚测定模型的精确度与强化模型预测能力的目的,能够很好的实现对安溪铁观音的茶多酚含量快速,准确的测定,有望代替传统的化学检验方法。280[参考文献](References)[1]刘栩.茶叶感官审评的误差控制[J].中国茶叶,2005,27(2):25-26.[2]傅志民.茶叶感官审评存在的不足和改进建议[J].中国茶叶,2005,27(2):25-26.[3]于慧春,王俊.电子鼻技术在茶叶品质检测中的应用研究[J].传感技术学报,2008,28(5):748-752.285[4]赵爱凤,于国锋,刘晓艳,等.电子鼻/电子舌在茶叶审评中的应用[J].福建农机,2007,(3):23-26+7.[5]张正竹,廖步岩,阎守和,等.近红外光谱NIRS技术在茶叶品质保真中的应用前景[J].食品工业科技,2009,30(6):349-352.[6]严衍禄,赵龙莲,韩东海,等.近红外光谱分析技术与应用[M].北京:中国轻工业出版社,2005.1-149.[7]Terhoeven-UrselmansT,SchmidtH,GeorgJoergensenR,eta1.Usefulneofnear-infraredspectroscopyto290determinebiologicalandchemicalsoilpropertieImportanceofsamplepre-treatment[J].SoilBiologyandBiochemistry40(5):1178-1188.[8]LudwigB,SchmilewskiG,Terhoeven-UrselmansT.Useofnearinfraredspectroscopytopredictchemicalparametersandphytotoxicityofpeatsandgrowingmedia[J].ScientiaHorticulturae,2006,109(1):86-91.[9]张小超,吴静珠,徐云.近红外光谱分析技术及其在现代农业中的应用[M].北京:电子工业出版社2952012.125-129.[10]徐立恒,吕进,林敏,孙耀国.茶叶中3类主要组分的近红外光谱分析作为茶叶质量的快速评定方法[J].理化检验(化学分册),2006,05:334-336.[11]刘辉军,吕进,张维刚,陈华才.茶叶中茶多酚含量的近红外光谱检测模型研究[J].红外技术,2007,07:429-432.300-11-'