Botanical Research
Vol.3 No.06(2014), Article ID:14307,10 pages
DOI:10.12677/BR.2014.36027

Factor Analysis and Numerical Taxonomy Applied in the Research of Germpasm Genetic Polymorphism in Brassica napus L.

Daojie Wang*, Cuiling Yang, Yanping Li, Zaiqing Wang

Key Laboratory of Plant Stress Biology, State Key Laboratory of Cotton Biology, College of Life Science, Henan University, Kaifeng

Email: *wangdj@henu.edu.cn

Copyright © 2014 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

Received: Sep. 2nd, 2014; revised: Oct. 4th, 2014; accepted: Oct. 15th, 2014

ABSTRACT

Using computer systems, the factor and cluster analysis was done to 14 quality traits of 87 rapeseed germplasm resources. The results showed that the coefficient of variability of 14 agronomic traits ranged greatly from 6.02% (oil content) to 96.87% (glucosinolate content), which indicated the diversity of materials was significant. The correlation analysis shows that the effective silique of main inflorescence is an important trait. It is in significant or highly significant positive correlation with most factors of yield components, and it is in significant positive correlation with plant height, an effective branch height, effective length of main inflorescence and other plant traits. Adopting the principal component analysis, 14 traits were divided into 6 principal components, which accounted for 80.43% of total genetic variations. After 14 quality traits of 87 materials have been standardized, through cluster analysis, all materials were classified into 5 groups, but 6 groups according to 4 quality traits.

Keywords:Brassica napus L., Diversity, Factor Analysis, Germplasm, Numerical Taxonomy

因子分析和数量分类在油菜种质资源遗传多样性研究中的应用

王道杰*,杨翠玲,李艳萍,王再青

河南大学生命科学学院,棉花生物学国家重点实验室,植物逆境生物学重点实验室,开封

Email: *wangdj@henu.edu.cn

收稿日期:2014年9月2日;修回日期:2014年10月4日;录用日期:2014年10月15日

摘  要

应用计算机系统对87份油菜种质资源的14个性状进行了因子和聚类分析。结果表明,14个性状的变异系数值从6.02% (含油量)到96.87%(硫苷)含量,变异范围较大,表明供试材料的遗传多样性是显著的。通过相关分析表明,主花絮有效角果数是1个比较重要的性状,它与多数产量构成因子呈显著或极显著正相关,与株高、一次有效分枝部位、主花序有效长度等株型性状呈极显著正相关。采用主成分分析将14个性状归纳为6个主成分,它们占总遗传变量的80.43%。将87份材料的14个性状值标准化处理后进行聚类分析,结果将87份油菜种质资源分为5个类群,而根据4个品质性状指标进行聚类,将87份油菜种质资源分为6个类群。

关键词

油菜,遗传多样性,因子分析,种质资源,数量分类

1. 引言

油菜作为我国重要的油料作物,是食用油和蛋白饲料的主要来源。随着油菜生产的发展和人民生活水平的不断提高,油菜育种目标和要求也在不断提高,如何培育出优质、高产的新品种是育种工作面临的首要问题。优异丰富的种质资源是油菜育种工作的物质基础,而对种质资源的科学评价和合理利用则是新品种选育成败的关键。目前,多元统计分析方法已越来越多地被应用于品种资源评价和遗传育种工作中,用其分析性状间的相关关系,测定品种间的遗传差异,了解亲本间的遗传距离等。20世纪70年代初期,Anderbery [1] 就将聚类分析应用于育种研究。近年来,主成分分析法和聚类分析法已大量应用于育种工作中[2] -[4] 。主成分分析法和聚类分析法在油菜育种和资源评价中也有报道[5] -[9] ,但前人对油菜性状的研究大多集中在聚类分析上,而应用主成分分析的报道则不多见,同时前人的研究主要集中于农艺性状的分析,未将农艺性状和品质性状结合起来对种质资源进行综合评价。因此,本试验以不同来源的87份油菜种质资源为材料,同时采用主成分分析法和聚类分析法对其主要农艺性状和品质性状进行分析,旨在找出对育种目标有益的综合指标,揭示材料间的遗传差异,对供试材料进行科学评价,为油菜育种提供参考依据。

2. 材料与方法

2.1. 供试材料

所选用的不同来源的甘蓝型油菜种质资源87份,系河南大学植物逆境生物学重点实验室多年征集和培育的多代连续自交系。各品种资源代号分别用1~87表示。

2.2. 试验方法

2008年9月28日将供试材料播于河南大学植物逆境生物学重点实验室试验场,其土壤肥力中等,地力均匀。田间采取3行区(边行6行区)顺序排列,并进行常规管理。成熟时每材料随机选取5株(剔除边行)正常株按标准进行室内考种(刘后利,1985),取其平均值。测定指标包括:X1:株高(cm),X2:一次有效分枝部位(cm),X3:一次有效分枝数(个),X4:二次有效分枝数(个),X5:主花序有效长度(cm),X6:主花序有效角果数(个),X7:单株有效角果数(个),X8:每果粒数(个),X9:千粒重(g),X10:单株产量(g),X11:含油量(%),X12:蛋白质含量(%),X13:芥酸含量(%)和X14:硫苷含量(µmol/g)等14个农艺性状和品质性状。含油量、蛋白质含量、芥酸含量和硫苷含量采用近红外光谱分析仪(FOSS NIRSystem)测定。

2.3. 数据处理方法

将上述87个油菜种质材料14个性状共1218个数据,输入计算机,用SPSS软件包[10] 对观察值进行相关分析,同时采用标准差标准化方法对数据进行标准化处理后,由计算机进行主成分分析和聚类分析。

3. 结果与分析

3.1. 主要农艺性状变异性分析

表1可知,油菜种质资源的各性状变异系数从大到小依次为芥酸 > 二次有效分枝数 > 硫苷 > 一次有效分枝数 > 一次有效分枝部位 > 单株有效角果数 > 单株产量 > 每果粒数 > 主花序有效角果数 > 千粒重 > 主花序有效长度 > 株高 > 蛋白质含量 > 含油量。说明供试的87份种质材料在芥酸、二次有效分枝数、硫苷、一次有效分枝数、一次有效分枝部位等性状上变异丰富,而蛋白质含量和含油量的变异较小,其余性状居于二者之间。总体来说,除蛋白质含量和含油量变异系数为6.35%和6.02%外,其余性状变异系数都在10%以上,最大为芥酸含量,其变异系数为96.87%。另外,从极差值看,除蛋白质含量和含油量外,其余性状极差值都达相同性状最小值的1倍以上,芥酸最大,达549倍。即使极差值最小的含油量也达最小值的38.53%。可见,供试材料各具特点,差距较明显,类型较广泛。

3.2. 不同性状间的相关分析

表2可以看出,油菜的株型性状中株高与一次有效分枝部位、主花序有效长度呈极显著正相关,其相关系数分别为0.818、0.519。一次有效分枝部位与主花序有效长度呈显著正相关,相关系数为0.257。一次有效分枝数与其它株型性状的相关性均不显著。二次有效分枝数与主花序有效长度呈极显著负相关,相关系数为−0.291。油菜的产量性状中主花序有效角果数与单株有效角果数、单株产量呈极显著正相关,其相关系数分别为0.308、0.278;单株有效角果数与单株产量呈显著正相关,与每果粒数呈极显著负相关,与千粒重呈显著负相关,其相关系数分别为0.268、−0.416、−0.223;每果粒数与单株产量呈极显著正相关,相关系数为0.539;千粒重与单株产量呈极显著正相关,相关系数为0.326。油菜的品质性状中含油量与蛋白质含量呈极显著负相关,相关系数为−0.572;蛋白质含量与硫苷含量呈极显著正相关,相关系数为0.374;芥酸与硫苷呈极显著正相关,相关系数为0.478。

油菜的株型性状和产量性状也存在一定的相关性。主花序有效角果数与株高、一次有效分枝部位、主花序有效长度呈极显著正相关,其相关系数分别为0.585、0.515、0.649。单株有效角果数与株高、二次有效分枝数呈极显著正相关,其相关系数分别为0.383、0.822。每果粒数与二次有效分枝数呈极显著负相关,相关系数为−0.378。千粒重与二次有效分枝数呈显著负相关,相关系数为−0.273。单株产量与株高呈极显著正相关,与主花序有效长度呈显著正相关,其相关系数分别为0.302、0.261。

油菜的品质性状和产量性状间也存在一定的相关性。主花序有效角果数与硫苷含量呈显著正相关,相关系数为0.501。单株有效角果数与蛋白质含量呈极显著正相关,与含油量呈显著负相关,其相关系数分别为0.342、−0.223。千粒重、单株产量与含油量呈显著正相关,其相关系数分别为0.252、0.217。

油菜的株型性状和品质性状间的相关性较小,只有个别性状之间有一定的相关性,如二次有效分枝数与含油量呈显著负相关,与蛋白质含量呈显著正相关,其相关系数分别为−0.226、0.251。主花序有效

Table 1. Variations of agronomic and quality traits

表1. 各性状变异情况

Table 2. The correlation coefficients of different traits in Brassica napus L.

表2. 油菜各性状间的相关系数

**Correlation is significant at the 0.01 level (2-tailed); *Correlation is significant at the 0.05 level (2-tailed).

长度与硫苷含量呈极显著正相关,相关系数为0.501。

综上所述,油菜株型性状及各产量构成因子中,主花絮有效角果数是比较重要的性状,它与多数产量构成因子呈显著或极显著正相关,与株高、一次有效分枝部位、主花序有效长度等株型性状呈极显著正相关;单株有效角果数与单株产量呈显著正相关,与株高、二次有效分枝数呈极显著正相关,与千粒重、每果粒数呈显著或极显著负相关;每果粒数、千粒重与单株产量呈极显著正相关,与二次有效分枝数呈显著或极显著负相关。

油菜的品质性状中含油量与蛋白质含量呈极显著负相关,蛋白质含量与硫苷含量呈极显著正相关,芥酸与硫苷呈极显著正相关。油菜的品质性状和产量性状间也存在一定的相关性。主花序有效角果数与硫苷含量呈显著正相关,单株有效角果数与蛋白质含量呈极显著正相关,与含油量呈显著负相关,千粒重、单株产量与含油量呈显著正相关。油菜的品质性状和株型性状间的相关性较小。

3.3. 因子分析

对87份种质资源的14个性状的方差分析(表1)结果表明,14个性状中有12个达到显著或极显著水平,只有千粒重和蛋白质含量2个性状差异不显著,说明有必要进一步进行因子分析。

计算14个性状间的相关系数与相应的特征向量矩阵,将特征值按大小次序排列(表4)。由表4可知,前6个特征值的累积贡献率达80.43%,根据累积贡献率 ≥ 80%的标准,其可以概括14个性状绝大部分的信息量,并以此对该部分材料进行综合评价。前6个主因子的特征值、特征值的累积贡献率和初始因子载荷矩阵列于表3表3中还列出各性状的共同度,第i个性状的共同度是全部因子对第i个性状的总方差所做的贡献,共同度越大,说明所选主因子代表该变量的效果越好。从表4可看出单株产量、二次有效分枝数、单株有效角果数、一次有效分枝数、株高的共同度较大,说明6个主因子对这5个性状有较好的代表性;千粒重的共同度较小,说明6个主因子对千粒重性状的代表性较差;其余性状的共同度介于二者之间。

因子分析不仅要找出主因子,更要知道每个主因子的意义。但是,用上述方法所求出的主因子,初始因子载荷矩阵并不满足简单结构准则,各因子的典型变量代表性也不突出,因而容易使因子意义含糊不清,不便于对因子进行解释。因此需要对因子载荷矩阵进行旋转,使因子载荷的平方按列向0和1两级转化,达到使结构简化的目的[10] 。

Table 3. Primary factor loading matrix in Brassica napus L.

表3. 油菜种质资源初始因子载荷矩阵

Table 4. Factor loading matrix after varimax rotation in Brassica napus L.

表4. 油菜种质资源方差极大正交旋转因子载荷矩阵

方差极大旋转方法是使因子载荷矩阵中各因子载荷值的总方差达到最大,并将此作为因子载荷矩阵简化的准则。油菜种质资源6个主因子的方差极大旋转因子载荷矩阵见表4。方差极大旋转因子载荷矩阵与初始因子载荷矩阵相比,主因子中重要因子的载荷值明显增加,说明方差极大旋转后的主因子生物学意义更加明显。由表4可知,第1主因子是株高、一次有效分枝部位和主花序有效角果数载荷值较大,且株高和一次有效分枝部位的影响比主花序有效角果数的影响要大,故称为株高因子;第2主因子是二次有效分枝数和单株有效角果数载荷值较大,而且这两个性状之间呈极显著正相关,故称为果数因子;第3主因子是蛋白质含量的载荷值较大,故称为蛋白质因子;第4主因子是单株产量的载荷值较大,故称为产量因子;第5主因子是芥酸的载荷值较大,芥酸含量主要体现油的品质,故称为油品因子;第6主因子是一次有效分枝数的载荷值较大,故称为分枝因子。这6个主因子中,第1、2主因子既是株型因子,又是产量因子;第4主因子是产量因子;第6主因子是株型因子,第3、5主因子是品质因子。从表5还可以看出,方差极大旋转后主因子特征值也发生了变化,第1、2主因子的特征值减小,后面的主因子特征值增加,但6个主因子的特征值累积贡献率保持不变。

在方差极大旋转过程中,因子轴互相正交,始终保持初始解中因子间互不相关的特点,但品种的各种内在因素之间始终存在着错综复杂的联系,需要引入斜交因子解,即用相关因子对变量进行线性描述,使得新的因子模型最大程度地模拟自然模型[11] 。油菜种质资源的14个性状Promax斜旋转后的斜交参数因子载荷阵如表5。6个主因子重要变量的组成与方差极大旋转的结果相似,且所有重要变量的载荷值都有所增加,说明Promax斜交旋转的主因子的生物学意义比方差极大旋转更加明了,更符合品种性状的实际情况。

3.4. 聚类分析

对87份油菜种质资源的14个性状值进行标准化处理后,计算品种间的欧氏距离D2,用类平均法

Table 5. Factor loading matrix after Promax rotation in Brassica napus L.

表5. 油菜种质资源Promax斜交旋转因子载荷矩阵

(UOGMA)进行聚类,聚类结果见图1。从图1可知,它将87份油菜种质资源分为5个品种群。第I个品种群包括的品种最多,包括81个品种,其余各类群包括的品种如下:

品种群II (1个品种):41;

品种群III (1个品种):29;

品种群IV (3个品种):46,62,63;

品种群V (1个品种):85。

统计5大类品种群的14个性状的平均值列于表6。从表6可知,由于第Ⅰ类包含了整个资源的90%的品种,所以各性状均不突出,接近于平均值。第Ⅱ类最显著的特征是品质较好,双低,千粒重最高,籽粒大。第Ⅲ类最显著的特征是单株产量最高,而且构成产量的各种主要因子均比较高,如主花序有效长度、主花序有效角果数、单株有效角果数、每果粒数、单株产量均较高,主要缺点是硫苷含量较高;第Ⅳ类最显著的特征是单株有效角果数最高,但硫苷和芥酸也较高,有高产潜力,但品质需要进一步改进。第Ⅴ类最显著的特征是一次有效分枝数最多,二次有效分枝数最少,在株型育种中有较高的利用价值。

为了筛选出品质优良的特异种质资源,对87份油菜种质资源的4个品质性状值进行标准化处理后,计算品种间的欧氏距离D2,用类平均法(UOGMA)进行聚类,聚类结果见图2。从图2可知,它将87份油菜种质资源分为6个品种群。统计6大类品种群的4个品质性状的平均值列于表7。从表7图2可知:

第I类群包括52个品种,其主要特征是低芥酸;

第II类群包括17个品种,各类品质指标均不突出,接近平均值水平;含油量相对较高;

第III类群包括1个品种,其特征是高含油量;

第IV类群包括3个品种,特征也不突出;

第V类群包括13个品种,其特征是硫苷含量高,品质较差;

Figure 1. Cluster analysis tree of 87 Brassica napus L. in 14 traits

图1. 根据14个性状值分析的聚类图

Figure 2. Cluster analysis tree of 87 Brassica napus L. in 4 quality traits

图2. 根据4个品质性状值分析的聚类图

Table 6. Character-value means of each group

表6. 各类群性状平均值

Table 7. Quality-value means of each group

表7. 各类群品质性状平均值

第VI类群包括1个品种,其品质最差,含油量低,芥酸、硫苷含量高,唯一的优点是蛋白质含量较高。但是油菜的主要用途是榨油,其次是饼粕作饲料。高蛋白饼粕作为饲料有意,但硫苷含量高也不适宜作饲料。所以本类型的油菜资源利用价值不大,除非它有特殊的抗性基因可利用。

致  谢

国家自然科学基金(31201148)河南省科技攻关项目(132102110111)资助。

参考文献 (References)

  1. [1]   Anderberym, R. (1972) Cluster analysis for application. Academic Press, Waltham, 2-235.

  2. [2]   王志蜂, 孙小镭, 曹齐卫, 等 (2003) 山东黄瓜地方种质资源的聚类分析. 山东农业科学, 5, 19-22.

  3. [3]   马恢, 尹江, 张希近, 等 (2004) 冀西北盐碱地马铃薯无性系农艺性状主成分及聚类分析. 中国马铃薯, 18, 136- 138.

  4. [4]   刘玉爱, 侯建华, 高志军, 等 (2006) 玉米引种材料的主成分分析和聚类分析. 玉米科学, 14, 16-18.

  5. [5]   段利云, 王通强, 阳标仁 (2007) 甘蓝型油菜主要农艺性状的主成分和聚类分析. 山地农业生物学报, 26, 381- 385.

  6. [6]   高必军, 李平, 江洪 (2007) 甘蓝型油菜若干农艺性状与单株产量的关系分析. 生物数学学报, 22, 137-144.

  7. [7]   韩继祥, 刘后利 (1993) 甘蓝型油菜杂种主要农艺性状和品质性状的主成分分析. 华中农业大学学报, 12, 427- 432.

  8. [8]   王建林, 何燕, 栾运芳, 等 (2006) 西藏野生油菜形态及生态特征多元统计分析. 作物研究, 3, 223-226.

  9. [9]   许鲲, 陈碧云, 王汉中 (2004) 长江中下游地区白菜型油菜遗传多样性RAPD分析及其与农艺性状的相关性. 中国油料作物学报, 26, 20-26.

  10. [10]   张力 (2008) SPSS在生物统计中的应用. 厦门大学出版社, 厦门, 83-284.

NOTES

*通讯作者。

期刊菜单