RBF神经网络在可溶性糖含量预测中的应用

时间:2022-10-28 10:01:56

RBF神经网络在可溶性糖含量预测中的应用

摘要:在小麦(Triticum aestivum L.)幼苗生长过程中,将RBF神经网络应用到可溶性糖含量的预测和数据变化的分析中,试验数据经过RBF神经网络的训练和仿真后得到,网络输出结果的误差小,网络输出矢量与目标矢量相关性好。说明可以将RBF神经网络作为农作物幼苗生长中预测数据变化的有效方法。

关键词:RBF神经网络;小麦(Triticum aestivum L.)幼苗;可溶性糖;误差;回归分析

中图分类号:TP273 文献标识码:A 文章编号:0439-8114(2013)02-0455-03

小麦(Triticum aestivum L.)是中国主要的粮食作物之一,干旱一直是影响小麦生产的最主要非生物胁迫因素[1]。在干旱胁迫条件下,植物为了减缓由胁迫造成的生理代谢不平衡,细胞大量积累了一些小分子有机化合物,如脯氨酸、甜菜碱等。其中,可溶性糖是干旱胁迫诱导的一种小分子溶质,其种类主要包括葡萄糖、海藻糖、蔗糖等。这些可溶性糖类参与渗透调节,并可能在维持植物蛋白质稳定方面起到重要作用[2]。在小麦发芽过程中多种酶类活力激增,淀粉、蛋白质、非淀粉多糖等组分都得到良好降解。发芽小麦中的淀粉酶主要包括α-淀粉酶、β-淀粉酶和极限糊精酶。

20世纪80年代末,Powell提出了径向基函数(Radial-Basis Function,RBF)方法[3]。RBF神经网络多用于函数逼近和分类问题的研究,函数逼近的目的就是找到一个函数能够满足一组输入/输出数据之间的关系[4]。经过理论证明,RBF神经网络具有良好的任意非线性函数逼近能力和解析系统内在规律性的能力,并且具有极快的学习收敛速度[5]。在干旱条件下对小麦幼苗进行数据监测发现,在小麦幼苗生长过程中,其中的酶、淀粉以及可溶性糖的含量在不断地发生变化,本研究试图利用人工神经网络分析它们之间的含量关系,并对可溶性糖的含量进行预测,意在对干旱胁迫条件下幼苗生长产生一定的指导作用。

1 材料与方法

1.1 材料

选用小麦品种百农207和华育198作为试验材料,材料由河南科技学院遗传育种实验室提供。

1.2 方法

1.2.1 试验设计 挑选子粒饱满的种子用0.1% H2O2消毒30 min,冲洗3遍。取灭菌的小桶和沙土,试验采用200 g/L聚乙二醇(PEG 6000)人工模拟干旱胁迫处理,桶中加200 g/L PEG-6000、沙土混合物(质量比为1∶4),厚度约10 cm。每桶播50粒种子,每个品种做5次重复,在光照培养箱中培养,光照度12 000 lx,光暗周期14 h/10 h,昼夜温度19 ℃/15 ℃,相对湿度60%,通过称重法控制胁迫程度。待幼苗长至二叶一心时对每个品种进行指标测定,每个品种均分成两组,分别测定数据,一组数据作为训练数据,另一组作为测试数据。测定幼苗的淀粉含量、可溶性糖含量及α-淀粉酶和β-淀粉酶含量,试验3次重复,每3天测定一次指标,训练组共测定6组数据,测试组测定5组数据。

1.2.2 指标测定 淀粉含量用蒽酮硫酸法[6]。可溶性糖含量用蒽酮比色法[6]。α-淀粉酶和β-淀粉酶含量用比色法测定[6]。

2 结果与分析

通过试验数据分析小麦幼苗淀粉酶含量、淀粉含量和可溶性糖含量的关系,并对可溶性糖含量进行预测。试验挑选了百农207和华育198两个品种,所测数据如表1和表2所示。表中前6组数据为训练组数据,后5组为测试组数据;表中数据均为原始测得数据。数据分析在Matlab环境下进行,分别采用RBF神经网络的两种方法对数据进行训练,以α-淀粉酶酶活、β-淀粉酶酶活、淀粉含量作为输入量,以可溶性糖含量作为输出量。首先利用函数Newrb创建一个广义的RBF神经网络,该函数在创建RBF神经网络时,能自动增加隐含层神经元的数目,直到均方误差满足精度要求或者神经元数目达到最大为止[7]。这里取误差为0.01%[5]。训练网络时取分布密度Spread为1。首先对数据进行归一化处理,归一化处理后数据分布在[-1,1]之间,然后用训练数据对网络进行训练,接下来用测试数据对网络进行仿真,验证其预测性能。

先对百农207的数据进行训练和仿真,当用测试数据测试训练好的网络时,得到仿真结果,可溶性糖含量为[0.201 1%,0.163 5%,0.261 4%,0.317 4%,0.298 4%],同实际值[0.227 0%,0.178 0%,0.230 0%,0.296 0%,0.305 0%]相比较,可得出预测误差,误差如图1所示,可见误差都在+0.04%以内,对于可溶性糖含量的预测来说,网络的预测误差并不大,说明网络测试结果可信。同样再对华育198的数据进行训练和仿真,当用测试数据测试时,得到仿真结果的可溶性糖含量为[0.226 6%,0.242 4%,0.311 6%,0.305 0%,0.302 5%],同实际值[0.205 0%,0.241 0%,0.276 0%,0.306 0%,0.328 0%]相比较,误差较小,误差如图2所示。通过两个小麦品种的数据分析发现,小麦幼苗在干旱胁迫条件下淀粉酶酶活、淀粉含量和可溶性糖含量之间确实具有一定的关系。

为了验证网络性能,利用Postreg函数对神经网络的仿真结果进行线性回归分析,可以得到目标矢量对网络输出的相关系数。其中目标矢量记为T,网络输出矢量记为A,相关系数记为R。当R为1时,输出矢量和目标矢量之间的相关性最好。百农207的网络输出回归曲线如图3所示,由图3可知,网络输出与目标矢量的相关系数为0.935,数据点分布合理,说明网络性能较好,预测值可信度高。同样再将华育198的测试样本数据回代网络中作回归曲线,得到结果如图4所示,由图4可知,网络输出矢量与目标矢量的相关系数为0.885,数据点分布和最佳拟合线均与期望值接近,网络性能较好。通过以上的网络性能测试可知,RBF神经网络可以作为小麦幼苗中可溶性糖含量预测的有效方法。

3 结论

淀粉是小麦的主要贮藏物质,在小麦萌发过程中,淀粉酶分解淀粉形成可溶性糖。糖作为代谢的中间产物或终产物调节了植物生长、发育、抗性形成等多个生理过程;同时参与了细胞内信号调节或转导过程。本研究将RBF神经网络应用到幼苗可溶性糖含量的预测和分析中,并对分析结果进行了性能测试和回归分析,该模型不仅结构简单、误差小,而且计算准确性高,是预测和分析农作物在生长过程中糖含量的一种有效的方法。

参考文献:

[1] 左文博,吴静利,杨 奇,等.干旱胁迫对小麦根系活力和可溶性糖含量的影响[J].华北农学报,2010,25(6):191-193.

[2] 赵江涛,李晓峰,李 航,等.可溶性糖在高等植物代谢调节中的生理作用[J]. 安徽农业科学,2006,34(24):6423-6425,6427.

[3] POWELL M J D. Radial basis functions for multivariable interpolation:a review[A]. MASON J C,COX M G. Algorithms for approximation[C]. Oxford:Clarendon Press,1987. 143-167.

[4] 董长虹.MATLAB神经网络与应用[M].北京:国防工业出版社,2005.

[5] 李 雪,熊建桥,邵秋萍,等. 基于BP神经网络的微孔钻削实时监测[J].机床与液压,2010,38(20):12-14.

[6] 陈毓荃.生物化学实验方法和技术[M].北京:科学出版社,2005. [7] 罗成汉.基于MATLAB神经网络工具箱的BP网络实现[J].计算机仿真,2004,21(5):69-72.

上一篇:我国机械制造技术及CAD支持的现状分析 下一篇:三峡库区规模化养殖场粪污资源化利用新模式