Hans Journal of Agricultural Sciences
Vol.4 No.03(2014), Article ID:13685,5 pages
DOI:10.12677/HJAS.2014.43010

Single Nucleotide Polymorphism and Its Utilization in Plant Research

Ying Shi, Mu Li, Ping He, Fusheng Li*

Agronomy and Biotechnology College, Yunnan Agricultural University, Kunming

Email: ashiyinga@163.com, *Lfs810@sina.com

Copyright © 2014 by authors and Hans Publishers Inc.

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

Received: Apr. 22nd, 2014; revised: May 7th, 2014; accepted: May 19th, 2014

ABSTRACT

SNP (single nucleotide polymorphisms) had become the third generation molecular maker technology in recent years. It had the characteristics of wide distribution, the polymorphism information content big, easy detection and statistics analysis etc. In crops research, SNP had many applications, such as genetic marker, molecular marker assisted selection (MAS), construction of genetic linkage map with high density, mapping expressed sequence tag (EST), and so on.

Keywords:SNP, Molecular Markers, Crops

SNP技术及其在作物研究上的应用

石  莹,李  穆,何  平,李富生*

云南农业大学农学与生物技术学院,昆明

Email: ashiyinga@163.com, *Lfs810@sina.com

收稿日期:2014年4月22日;修回日期:2014年5月7日;录用日期:2014年5月19日

摘  要

SNP(单核苷酸多态性)是最新发展起来的第三代分子标记技术,具有分布广、多态信息量大、易于检测和统计分析等特点。目前,SNP技术在水稻、玉米、大豆等作物研究中应用较多。本文综述该技术在这些作物的遗传标记、分子标记辅助选择、构建高密度遗传连锁图谱、绘制EST图谱等方面的研究进展。

关键词

SNP,分子标记,作物

1. 引言

生物个体之间存在的差异,实质上是生物个体间基因型的差异,而DNA分子标记可以直接反映基因水平上的差异。随着分子生物学的发展,DNA分子标记已经逐渐取代蛋白质(酶)水平上的生化标记,在遗传标记研究中成为新的热点[1] 。而目前以SNP(单核苷酸多态性)分子标记最为研究者所关注。SNP所反映的DNA遗传变异更多体现在单个碱基的变异水平,由于其有许多优点,在一定程度上弥补了第一代分子标记(如:限制性片段长度多态性,RFLP)[2] [3] 和第二代分子标记(如:微卫星DNA多态性,SSR)方法的不足,所以被称为第三代基因遗传标记方法[4] 。SNP可以定位在每一个基因的附近区域,在对每个基因的等位基因与表现型相关性方面进行检测具有巨大应用潜力[5] [6] 。本文主要介绍SNP技术及其目前在一些主要作物研究上的应用情况。

2. SNP技术简介

单核苷酸多态性(Single Nucleotide Polymorphisms, SNP)指在基因组上单个核苷酸变异所形成的遗传变异,理论上包括单碱基的缺失、转换、插入及颠换等,但实际发生目前有两种:转换和颠换,转换是嘌呤突变成嘌呤(或嘧啶突变成嘧啶),颠换指嘧啶和嘌呤之间的转换,而且颠换发生频率是转换的1/2[7] 。其突变的碱基可以是A、T、G、C中任何一个,但就目前观察到的情况而言,SNP基本都是发生在相连碱基之间,而且多数为C和T之间[4] 。

SNP的特点可归纳为以下6个方面:1) 遗传稳定性高;2) 位点丰富且分布广泛,如人类基因组中大约每1000 bp出现1个SNP[8] 、其他哺乳类动物中每500~1000 bp出现1个SNP[9] ,而在水稻中则每232 bp出现1个[10] ;3) 位于基因编码区的SNP可导致蛋白质功能的改变,是生物发生变异或病变的可能的直接原因,因此富有代表性;4) 二态性和等位基因性:SNP一般有2种等位型的碱基组成,具有二态性,且是双等位的,故杂合期望值较低;5) 可快速检测,易实现自动化分析;6) 密度高、分布广。

SNP有不同的分类:1) SNP在基因组分布的位置:基因间SNP(iSNP)、基因编码区SNP(cSNP)、基因周边SNP(pSNP)[11] ;2) SNP对生物遗传性状的影响:蛋白编码SNP、非蛋白编码SNP,而在蛋白编码SNP中,如果不引起所编码氨基酸序列的改变,称为同义蛋白编码SNP,反之,则称非同义蛋白编码SNP[7] [12] -[14] 。

SNP分析技术按其研究对象分为:1) 对未知SNP进行研究,即寻找未知的SNP或确定某一未知SNP与某遗传病的关系;2) 对已知SNP进行分析,即对不同群体SNP遗传多样性或在临床上对已知治病基因的遗传病进行基因诊断。检测未知SNP的方法有:变性梯度凝胶电泳(DGGE)、限制性片段长度多态性(RFLP)、温度梯度凝胶电泳(TGGE)、随机扩增多态性DNA(RAPD)、变性的高效液相色谱检测(DHPLC)、单链构想多态性(SSCP)等;检测已知SNP的方法有:核苷酸片段分析(ASO)、错配扩增突变分析(MAMA)、(基因芯片,gene chips)等。

3. SNP标记在作物研究中的应用

近年来,已在不少作物中发现了SNP位点并进行具体应用。例如,玉米基因组中含有丰富的SNP。Selinger等对11个玉米栽培种和7个原始种进行SNP鉴定,在调节基因中发现116个SNP[15] 。Rafalski等报道,玉米基因组序列中平均每70bp有1个SNP[16] 。在水稻中,最高SNP数量可达20127个,每154个碱基就存在一个SNP,在水稻亚种内的品种间也含有丰富的SNP[17] 。Nasu等在3个粳稻种,2个籼稻种和1个野生稻种的DNA区段中检测,在约250,000个碱基的序列中一共找到2800个SNP,平均每89个碱基就会发现一个SNP[18] 。Zhu等人对22个有差异性表型的大豆基因型序列多态性的研究表明编码区和非编码区均有SNP出现,且出现频率是:编码区少于非编码区[5] 。Yang等[19] 在对番茄SNP标记开发研究中,利用3个品种的EST数据,在44个基因中发掘了101个候选SNP,经实验检测证明其中的83%是真实的。Bundock等的研究结果表明,在大麦的某些基因中也存在SNP,频率为每131个碱基就出现一个SNP[20] 。以上研究表明,作物基因组序列均含有丰富的SNP,对其进行SNP研究,有利于揭示作物生长发育规律。目前,SNP技术在作物研究中的应用可归纳为以下几个方面。

3.1. 遗传标记

遗传标记(genetic markers)是遗传分析上用作标记的基因,它在发展过程中形成了四种不同类型的标记:形态学标记、细胞学标记、生化标记和分子标记。其中,分子标记是目前较受欢迎的,已得到广泛的应用,主要有RFLP、RAPD、SSR、AFLP等,但这些分子标记都有各自的优缺点。如:试验发现SSR不适用于关联分析(association analysis)[21] ,所以SSR分子标记的使用受到限制,但SNP正好可以弥补SSR标记所受到的限制,而且SNP是双等位的,杂合期望值较低,SNP的杂合期望值是0.263,而SSR的却达到0.77[22] [23] 。研究发现,两个基因座上的等位基因不是随机组合和分离的[24] 。如,玉米的一个基因座上,只在很少数的碱基对区间上就能鉴别出SNP单元型,而这个基因组片段所鉴别出来的SNP基因座是连锁不平衡(Linkage Disequilibrium, LD)的[7] [23] [25] 。近年来,随着某些作物种质多样性的持续减少,LD增长,方便了目的基因座上SNP的单元型与表型之间相关性的分析[26] 。此外,因为大豆是自交的,使其具有高度的连锁不平衡。如果有足够多的连锁不平衡存在于一个作物的基因组中,全基因组扫描会有利于鉴别与目的性状相关的基因组区域[23] 。此策略的采用,为将SSR标记转换为SNP标记开辟了道路。如:郝岗平等(2004)在拟南芥中抗旱基因CBF4单核苷酸多态性的研究分析,显示出各拟南芥抗旱生态型品种之间的表型差异与SNP的相关性;韩继成等(2003)对水果基因组DNA中乙烯受体基因保守序列进行SNP分析,发现了19个SNP的位点可能与呼吸跃变型果实有关;Kanazin等(2002)在大麦中112个SNP的进化研究发现大麦野生种与大麦栽培种间可能存在多重驯化行为。

3.2. 分子标记辅助选择

依赖于植株的表现型选择的传统育种遇到了很多困难,一个优良品种的培育往往需要花费十几年的时间。为了提高选择效率,育种专家在实践中不断探索运用遗传标记来进行育种选择。因为能利用的SNP标记的具有分布广和数量多的优势,所以,和其他的遗传标记相比较,SNP标记在标记辅助选择(marker-assisted selection, MAS)育种方面更具有潜力。如:Hayashi[27] 使用等位基因特异PCR方法进行水稻抗瘟病基因Piz位点的等位基因间SNP基因分型,结果表明利用这种PCR方法对SNP进行基因分型在水稻MAS育种中是一个十分方便、有价值的工具;Huang X等[28] 对514份水稻核心群体的l4种不同农艺性状的全基因组SNP进行相关分析,揭示了不同的水稻种质农艺性状的表型差异与SNP的相关性;随后[29] 又通过进一步对950份水稻种质资源开花期及产量相关性状进行全基因组SNP关联分析,揭示了其相关性。

3.3. 构建高密度的遗传连锁图谱

如果要绘制高分辨率的遗传图谱,就要构建大小不受限制的作图群体。基因组中的SNP,因为其分布的广泛性及其双等位性等,使SNP非常适合用于自动化大规模扫描,成为了最受欢迎的作图标记,而且具有高密度性的SNP遗传图谱的建成,使我们可以更精确的进行标记辅助选择(MAS),降低或消除在目的基因之外的遗传背景带来的坏的影响[30] 。大豆、番茄、玉米、小麦等其它重要作物的SNP遗传图谱的构建工作已取得重大进展。

物理图谱的组成是因为一系列BAC克隆(按顺序排列的)的重叠,在将传统遗传图谱和物理图谱整合时,需要筛选和检测BAC克隆的末端,用来筛选出没有重复序列的末端[23] 。鉴别出的序列用于找出父本和母本基因型间具有多态性的SNP,绘制SNP图谱。如,玉米中,1/5的BAC末端序列可用于传统遗传图谱与物理图谱的整合[31] 。

3.4. 绘制EST图谱

表达序列标签(Expressed Sequence Tag, EST)是遗传物质DNA与蛋白质之间的过度产物,反映了遗传信息传递过程的[23] [24] 。EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,而EST最后会形成蛋白质,决定了生命的差异现象,因此,EST能更有效地反映遗传信息对生命所起到的作用[24] 。

SNP反映的是相对应染色体基因座上的遗传多态性的状态,所以可以用来绘制遗传图谱[23] 。利用大豆、玉米、水稻等作物的SNP多态性,就易绘制出EST图谱。通用的技术方法是先对作图群体父本和母本的目的基因3ꞌ端的翻译区进行单核苷酸多态性分析,然后对上诉群体中所有个体进行单核苷多态性基因型的检测[1] [23] [24] [32] 。例如,Bhattramakki等人利用B73 × Mo17这个分辨率高的群体和单核苷酸多态性焦磷酸测序技术来将玉米EST谱的绘制完成。相同的,缺失或插入多态性也能用来绘制EST谱[33] 。目前,Useche等正在从玉米EST数据库中大规模开发SNP[34] 。

4. 小结

4.1. SNP技术存在的问题

虽然SNP作为新一代遗传标记对各方面的发展都有应用价值,但就现在来说,SNP技术应用的制约因素很多。第一,全基因组SNP标记的开发仍有赖于基因组草图搜索法,这种开发策略只能应用于少数动植物种类。第二,SNP标记的开发费用仍相对较高。第三,大规模的进行SNP的分析需SNP检测技术的进一步成熟。第四,缺乏大规模和具有普遍应用价值的SNP数据库,是科研工作者获取SNP位点信息受限。第五,SNP在植物研究方面仍处于起步阶段。

4.2. 展望

具有多态性丰富、密度大、具有代表性和检测速度快等特点的SNP,在生物领域有广阔的应用前景和发展潜力[35] 。首先,由于生物技术的发展,SNP在某些方面弥补了前两代分子标记方法的不足之处。其次,由于SNP检测和分析技术的逐渐成熟和不断完善,上述问题也会逐步解决,使实验结果更加可靠。相信在不就的将来,SNP作为新一代的分子遗传标记会对生物的各个领域产生较为深远的影响。

基金项目

云南省现代农业甘蔗产业技术体系建设专项(2009~2014);云南省重点新产品开发计划(2012BB014);云南省创新团队之“高原山地特色作物种质创新及利用”项目(云科人发[2012]18号)。

参考文献 (References)

  1. [1]   许阳, 李东潮, 李晓丽, 等 (2004) 单核苷酸多态性在大豆育种中的应用. 安徽农业科学, 5, 1000-1020.

  2. [2]   程备久, 凌杏元 (1994) 利用RFLP进行数量基因定位及效应分析对的原理和方法. 生物数学学报, 5, 200-206.

  3. [3]   曹永国, 王国英, 王守才, 等 (1999) 玉米RFLP遗传图谱的构建及矮生基因定位. 科学通报, 40, 2178-2182.

  4. [4]   孙红霞, 杜玮南, 方福德 (2000) 单核苷酸多态性研究进展. 中国医学科学院学报, 4, 392-394.

  5. [5]   刘惠民, 杜春芳, 李润植, 等 (2003) 单核苷酸多态性在作物遗传及改良中的应用. 遗传, 6, 735-739.

  6. [6]   Liu, W.Q. and He, L. (1998) SNP: Tracing new blueprint for human genome. Herrditas, 20, 38-40.

  7. [7]   王艳芳 (2007) 针茅属植物水孔蛋白基因多态性分析及分子进化的研究. 硕士论文, 内蒙古农业大学, 呼和浩特.

  8. [8]   Selinger, D.A., Handler, C. and Bolivia, V.L.B. (2001) An allele of them aizeb1gene with variable expression, contains a high copy retro transposon related sequence immediately up stream. Plant Physiology, 1, 1363-1379.

  9. [9]   曾燕如, 黄敏仁, 王明麻 (2003) 一种新的分子标记——单核苷酸多态(SNP). 南京林业大学学报, 3, 84-88.

  10. [10]   Rafalski, A. (2002) Applications of single nucleotide polymorphisms in crop genetics. Current Opinion in Plant Biotechnology, 5, 94-100.

  11. [11]   Wang, D.G., Fan, J.B. and Siao, C.J. (1998) Large sale identification, mapping, and genotype of single nucleotide polymorphism in the human genome. Science, 280, 1077-1082.

  12. [12]   Gottgens, B., Barton, L.M., Gilbert, J.G., et al. (2000) Analysis of vertebrate SCL loci identifies conserved enhancers. Nature Biotechnology, 18, 181-186.

  13. [13]   Loots, G.G., Locksley, R.M., Blankespoor, C.M., et al. (2000) Identification of a coordinate regulator of interleukins 4, 13 and 5 by cross-species sequence comparisons. Science, 288, 136-140.

  14. [14]   Tao, H., Cox, D.R. and Frazer, K.A. (2006) Allele-specific KRTI expression is a complex trait. PLOS Genetics, 2, 93.

  15. [15]   刘传光, 张桂全 (2006) 水稻单核苷酸多态性及其应用. 遗传, 28, 737-744.

  16. [16]   Nasu, S., Suzuki, J., Ohta, R., Hasegawa, K., et al. (2002) Search for and analysis of single nucleotide polymorphisms( SNPs) in rice (Oryza sativa, Oryza rufipogon) and establishment of SNP markers. DNA Research, 9, 163-171.

  17. [17]   Yang, W.C., Bai, X.D., Kabelka, E., et al. (2004) Discovery of single nucleotide polymorphisms in Lycoper sicones culentum by computer aided analysis of expressed sequence tags. Molecular Breeding, 14, 21-34.

  18. [18]   Bundock, C., Christopher, T., Eggler, P., et al. (2003) Single nucleotide polymorphisms in cytochrome P450 genes from barley. Theoretical and Applied Genetics, 106, 676-682.

  19. [19]   Phillips, R.L. and Vasil, I.K. (2001) DNA-based markers in plants. Knuckler Academic Publishers, Dordrecht.

  20. [20]   Powell, W., Morgante, M., Andre, C., et al. (1996) The comparison of RFLP, RAPD, AFLP and SSR (micro-satellite) markers for germ plasm analysis. Molecular Breeding, 2, 225-238.

  21. [21]   Viard, F., Franck, P., Dubois, M.P., et al. (1998) Variation of micro-satellite size homoplasy across electro morphs, loci, and populations in three invertebrate species. Journal of Molecular Evolution, 47, 42-51.

  22. [22]   Taramino, G. and Tingey, S. (1996) Simple sequence repeats for germ plasm analysis and mapping in maize. Genome, 39, 277-287.

  23. [23]   任启军 (2004) 基于棉花微卫星序列的SNP变异和系统进化. 硕士论文, 南京农业大学, 南京.

  24. [24]   梁惠珍, 李卫东, 王辉, 等 (2004) SNPs在大豆等作物遗传及改良中的应用. 农业生物技术科学, 5, 37-53.

  25. [25]   郑璐璐 (2008) SNAP分子标记检测玉米Ael, Sul, D9, ZmRap基因多态性. 硕士论文, 华中师范大学, 武汉.

  26. [26]   聂庆华, 张细权, 雷明明 (2003) 单核苷酸多态性及其在鸡QTL定位上的应用. 遗传, 6, 729-734.

  27. [27]   Hayashi, K., Hashimoto, N., Daigen, M., et al. (2004) Development of PCR-based SNP markers for rice blast resistance genes at the piz locus. Theoretical and Applied Genetics, 108, 1212-1220.

  28. [28]   Huang, X., Wei, X., Sang, T., et al. (2010) Genome-wide association studies of 14 agronomic traits in rice landraces. Nature Genetics, 42, 961-969.

  29. [29]   Huang, X., Zhao, Y., Wei, X., et al. (2012) Genome-wide association study of flowering time and grain yield traits in a worldwide collection of rice germplasm. Nature Genetics, 44, 32-41.

  30. [30]   郝岗平, 杨清, 吴忠义, 等 (2004) 植物的单核苷酸多态性及其在作物遗传育种中的应用. 植物学通报, 5, 618-624.

  31. [31]   Meyers, B.C., Tingey, S.V. and Morgante, M. (2001) Abundance distribution and transcriptional activity of repetitive elements in the maize genome. Genome Research, 11, 1660-1676.

  32. [32]   王萱 (2008) 玉米直链淀粉扩充基因ae SNP位点查找及ae基因对有关性状的影响分析. 硕士论文, 甘肃农业大学, 兰州.

  33. [33]   Bhattramakki, D., Dolan, M., Hanafey, M., et al. (2002) Insertion deletion polymorphisms in 3’regions of maize genes occur frequently and can be used as highly informative genetic markers. Plant Molecular Biology, 48, 537-547.

  34. [34]   Useche, F., Morgant, M., Hanafey, M., et al. (2001) Computer Detection of Single Nucleotide Polymorphisms (SNP) in Maize ESTs. Plant and Animal Genome, IX, 333.

NOTES

*通讯作者。

期刊菜单