基于叶脉聚类分析技术的叶片快速分类

时间:2022-08-28 09:21:10

基于叶脉聚类分析技术的叶片快速分类

摘要:根据叶脉密度、距离、圈数等参数,采用Blonder等的叶脉数学模型和层次聚类分析方法,最终确定将25种具有地域代表性的树木树叶分为4大类,研究还发现叶片曝光率、树枝轮廓都会影响叶片的形状。该树叶类型分类方法理论清晰,简单易于实现,在植物叶片迅速分类等农林业领域有一定的实用和推广价值。

关键词:叶脉;层次聚类;相关性分析;叶片快速分类

中图分类号:Q94 文献标识码:A 文章编号:0439-8114(2013)14-3423-05

树叶的形状是多种多样的,是什么因素导致了树叶形状的多样性,目前学术界还没有定论。一直以来,国内外的学者们从不同的角度探讨了树叶形状多样性的原因。李志英等[1]研究了叶片气孔密度大小与起源地的关系,杨传友等[2]系统研究了苹果树叶片气孔的结构特征,并得出叶片气孔大小、结构、密度可作为树木起源地分类的重要指标;吕政涛[3]通过观察并总结发现了叶形与树形的相关关系;Pierce等[4]研究了乔本科植物叶的经济学谱系对其生存的影响;Karlik等[5]提出了计算树木叶片质量的方法。然而,这些研究并没有从叶片的内部本质上分析树叶形状多样性的原因,2011年Blonder等[6]通过对叶脉的研究,从生物学理论及叶脉经济学原理角度建立了一种新的数学模型,这为找到叶片形状千差万别的原因迈出了极其重要的一步。本研究在Blonder等建立的叶脉数学模型的基础上提出了树叶叶片的快速分类方法,并从环境等角度具体探讨了影响叶形的主要因素。

1 叶片分类模型

为了对树叶进行分类,此次研究假设叶形是进行分类的惟一依据,而根据Blonder等的叶脉数学模型可知道密度(σ)、距离(d)、圈数(ξ)是影响叶形的最基本的3个因素,其中密度(σ)表示单位面积的叶脉长度;距离(d)表示单位叶片面积中所有完整叶脉圈的最大内切圆直径;圈数(ξ)表示单位面积完整的叶脉圈的个数。这3个量的定义图如图1所示。可以根据这3个因素对叶片进行分类。从现实上考虑,圈数(ξ)对叶片形状的影响不会很大,而对于其他两个因素,很难确定哪个因素对叶脉布局的影响最大,因此研究分别以距离(d)和密度(σ)对叶片进行分类,具体操作过程如下:由于树木的种类过多,地域分布也很广泛,对所有的树木叶片进行分类将十分繁琐,因此研究选取了25种具有地域代表性的树木树叶(表1)进行分类研究[6]。分别提取这25种树叶的叶脉,并分别对叶脉多次进行距离测量,取多次测量的平均值作为这种树叶的叶脉距离(d)。密度(σ)的测量方法与之相同。

2 叶片聚类原理与结果分析

聚类分析(Cluster analysis)是一组将研究对象分为相对同质的群组的统计分析技术。聚类分析的目标就是在相似的基础上收集数据来分类,聚类分析的方法主要有快速聚类法、谱系聚类法、变量聚类法、层次聚类法和非层次聚类法等,本研究将使用层次聚类方法来对叶片进行分类。

2.1 层次聚类基本原理

层次聚类方法是依据给定的簇间距离度量准则,构造一棵由簇和子簇形成的聚类树,直到满足某个结束条件为止[7]。根据要求的不同,可以分为自顶向下的层次聚类以及自底向上的层次聚类,主要有凝聚和分裂两种层次聚类方法。现实中,大部分层次聚类都使用凝聚的方法,其策略是首先将每个样本点都看成一个类,然后逐渐合并成一个越来越大的类,直到最终合并成一类为止。

不同的层次聚类在每一层上的合并方式也有所区别,主要有:平均距离,取两个聚类间样本的平均距离作为这两个类间的距离;最小距离,取两个聚类间样本的最近距离作为这两个类间的距离;最大距离,取两个聚类间样本的最远距离作为这两个类间的距离[8-10]。此次研究使用最小距离来对类进行合并。层次聚类算法的主要流程如图2所示。

2.2 层次聚类结果

根据以上所测得的数据,运用统计分析软件SPSS可以得出层次聚类结果,如图3所示。观察聚类结果发现,根据这两个因素(距离和密度)分别聚类,所得大部分的归类都是相同的,只有少部分的结果不同,原因可能是测量误差对聚类分析有影响,故而对于大部分树叶来说本分析方法还是适用的,因此依据距离(d)以及密度(σ)对树叶进行分类是可行的,以下具体分析通过距离(d)进行聚类的结果。由图3的聚类结果可知比较难确定类别数目,研究决定分别选定2、3、4、5个类别,并通过以下步骤分析得到最终的分类:设置每组的平均距离为给定的标准组;分别计算每组相对于标准组的距离,并通过图像呈现出来,结果如图4至图7所示。

分析发现当类别数目越大时,距离越小,即类别数目越大,会使得分类结果越精确。这样就可以推测出,当每种树叶都分为单独一类时,所得的分类结果最满意,显然这种情况在实际情况下是行不通的,根本就没有达到将树叶分类的目的,也就是说分类并不是越细越好,因此应该找到一个分类的平衡点使得分类更具合理性,更加有效。在这4种分类中,分2类和3类时的距离比较大,分4类、5类的距离都比较小,结果都比较合理,而一般的分类,分4类就差不多了,分5类的话会显得多余,所以经过综合考虑,研究决定将这25种树的树叶分成了4类,结果如表2所示。

3.2.2 叶形与树枝轮廓的相关性 运用SPSS软件对树枝密度和叶片密度进行相关性分析,所得结果见表3。首先假设树叶形状与树枝轮廓没有联系,由相关性分析结果可知,两种密度的Pearson相关系数为0.765,树干特征与叶片特征不相关的假设检验值为0.016,显然,这个结果是在置信水平为0.05对应的置信空间之外,所以假设不成立,即树叶的形状与树枝轮廓有一定的相关性。

4 小结

研究在Blonder等[6]的叶脉数学模型的基础上,提出了一种切实有效的叶片分类方法,从内因和外因两方面分析了叶片形状的影响因素,得到如下结论。

1)测定了25种树叶叶片的密度(σ)、距离(d)和圈数(ξ),并依据其中的密度(σ)以及距离(d)分别进行了层次聚类分析,观察得出利用这两个因素进行分类差别不大,因而选取距离(d)对树叶进行分类,综合考虑精确度和有效性,最终得出将这些叶片分为4类更加合理。

2)考虑影响叶片形状多样性的内部及外部原因,基于叶片光合作用及曝光率讨论了影响叶片形状的不同因素,运用能量转化理论分析发现,叶片的曝光率大小会影响叶片的形状;继而提取9棵树的树干及树叶特征值并进行相关性分析,结果表明,树叶的形状与树枝轮廓形状有一定的相关性。

参考文献:

[1] 李志英,梁艳荣,胡晓红.梨不同系统叶气孔的密度、大小与起源地气象因子的关系[J].内蒙古农业科技,1994(5):31-32.

[2] 杨传友,史金生,村欣阁,等.苹果叶片气孔的研究[J]. 山东农业大学学报,1998,29(1):8-14.

[3] 吕政涛. 一项有趣的观察——叶形与树形的相关[J]. 落叶果树,1986(4):34.

[4] PIERCE S,CERIANI R M,ANDREIS D E,et al. The leaf economics spectrum of Poaceae reflects variation in survival strategies[J]. Plant Biosystems,2007,141(3):337-343.

[5] KARLIK J F,WINER A M. Comparison of calculated and measured leaf masses of urban trees[J]. Ecological Applications,9(4):1168-1176.

[6] BLONDER B,VIOLLE C,BENTLEY L P,et al.Venation networks and the origin of the leaf economics spectrum [J]. Ecology Letters,2011,14(2):91-100.

[7] 段明秀.层次聚类算法的研究及应用[D].长沙:中南大学,2009.

[8] 贾瑞玉,查 丰,耿锦威,等. 一种基于引力的分层聚类算法[J].计算机技术与发展,2011,21(3):76-79.

[9] NOWAK D I. Notes:estimating leaf area and leaf biomass of open-grown deciduous urban trees[J]. Forest Science,1996, 42(4):504-507.

[10] 刘兆刚,刘继明,李凤日,等.樟子松人工林树冠结构的分形分析[J].植物研究,2005,25(4):465-470.

上一篇:探讨提高数学课堂有效教学的途径 下一篇:泉州市发展高技术产业的若干思考