1
药用植物学
1.18.7.2 二、数量分类学研究步骤
二、数量分类学研究步骤

(一)选择运筹分类单位OTUs

OTUs(operational taxonomicunit)即数据源样本。通常选择比研究对象低一级的分类阶元的分类群作为OTUs。如研究对象是种,则OTUs是居群;研究对象是属,OTUs是物种;研究对象是科,OTUs是属等。但属或者属以上的分类阶元不宜作为OTUs,在分析一个科,比较科内的几个属时,应取各个属的代表种,以获取信息。

(二)性状的选择与编码

所谓性状,就是一个分类单位区分于其他分类单位的性质、特征或属性。如形态(解剖)特征、花冠类型、雄蕊数目、叶的形状等,以及细胞、生理生化等各方面的性状。为了获得稳定和可靠的分类,选择性状的数量一般应不少于60个,最好多于100个。

性状选出后,为了进行计算机运算,必须对其进行适当地编码。不同的性状有不同的编码方法,如形态中的长度、面积等数值性状,可直接应用,不需编码;对于表现为对立状态的性状(二歧形状),如植物的习性为木本或草本、花冠离瓣与合瓣等,可用“+”“-”或“0”“1”表示;若表现为3个以上的有序多态性状,如无毛、具毛、具密毛等,可用连续排列的非负整数0、1、2、3、…N表示;而表现为3个以上没有次序的无序多态性状,如花冠颜色为白色、红色、蓝色、粉色等,一般可将其分解为互相独立的二元性状,如花冠白色对应于非白色,蓝色对应于非蓝色等。这样的分类方法难免会造成对这些性状的加权,但在具有大量数据的情况下,这样的偏差会被中和。

(三)相似性的测定

相似性的测定是以各OTU间的相似性系数S来表示的,求S的方法是把每一个OTU的各项特征与另一个OTU的各项特征逐个进行比较。S通常以百分比表示,100%表示两个OTU间完全相似,0则表示没有相似性。相似性系数算出后通常排列成矩阵。

(四)聚类分析

聚类分析是将OTUs以相似性逐渐浓缩,重排上述相似性矩阵,从而使矩阵中相似性系数S很接近的OTUs被集中在一起形成簇,这些簇称为表征群(phenon),把这些簇进一步分阶层地排成树状图则为表征树谱图,然后再根据相似值规定分类等级。

近年来,随着计算机技术的进一步发展,有关聚类分析的软件更加易于操作而行之有效。这些软件基于分析方法可分为2类,凝聚法和拆分法。凝聚法是从某个OTUs开始,使它们逐步合并直到最终形成一个聚群。而拆分法相对于凝聚法,它最初将所有OTUs放在一个群中,然后逐步将其拆分成亚群,直到不能再进一步拆分为止。