红松转录组SSR分析及EST

您所在的位置:网站首页 转录组unigene序列 红松转录组SSR分析及EST

红松转录组SSR分析及EST

2024-05-01 01:02| 来源: 网络整理| 查看: 265

红松(Pinus koraiensis)在我国主要分布于长白山及其北部的张广才岭、老爷岭、完达山和小兴安岭(马建路等,1992),既是优良的用材树种,也是珍贵的食用干果和油料树种。红松为二倍体(2n=24)裸子植物;球果圆锥状卵形,花期6月,雌雄同株,风媒传粉,球果生长期2年,于翌年9—10月成熟。我国具有丰富的红松资源,自20世纪80年代开展红松的遗传改良工作,在分布区内陆续营建初级种子园、子代测定林及改良代种子园,但前期的遗传改良工作主要依据表型选择,生长发育、生态习性等,育种周期较长(张振等,2014;施季森,2012)。遗传标记手段在杂交育种、种质资源保存、新种质挖掘等方面优势明显(Milee et al., 2008),在红松的育种工作中围绕现代分子育种技术已开发出来的分子标记,缺乏共显性的遗传标记,尚不能满足红松分子标记辅助育种的需要。

鉴定试验材料的遗传多样性是研究物种起源进化、发现新的基因资源、改良现有育种材料的基础工作。随着高通量测序技术的发展,EST数据不断增加,不少研究者基于转录组或公共数据库挖掘EST-SSR,在品种鉴定及改良、资源分析、遗传图谱构建、功能基因发掘等方面得到了广泛应用(Yi et al., 2006;Portis et al., 2007;Zhang et al., 2013;杨秀艳等,2011)。简单序列重复(simple sequence repeats,SSRs),又称为微卫星DNA(microsatellite DNA),是一类由1~6个核苷酸串联重复组成的DNA序列(Kalia et al., 2011)。SSR标记具有多态性高、重复性好、共显性、易检测、操作简单等优点,在DNA指纹图谱的构建、遗传多样性分析、基因定位、分子标记辅助育种等方面得到广泛应用(罗冉等,2010)。SSR荧光标记毛细管电泳法是基于DNA测序仪为平台的检测方法,具有高效自动化等技术优势,冯锦霞等(2011)、李雄伟等(2013)、陈雅琼等(2011)、程本义等(2011)分别于杨树(Populus)、桃树(Prunus persica)、烟草(Nicotiana tabacum)、水稻(Oryza sativa)中比较得出,在同一检测成本上,荧光标记技术检测效率高于银染法,结果更为精确灵敏。SSR标记主要包括基因组(gSSR)和表达序列标签SSR(EST-SSR)。表达序列标签直接反映基因的表达信息,EST数据来源于基因的转录区域,其多态性可能与基因功能直接相关,因此,比gSSR标记具有更高通用性(Eujayl et al., 2002;Nicolai et al., 2012)。本实验室利用获得的红松转录组数据,开发EST-SSR标记,同时对其组成、分布及特征进行分析,进一步开发出适用于红松的SSR标记,并以4个种子园的53个自由授粉子代为材料进行EST-SSR遗传变异分析。

1 材料与方法 1.1 材料

转录组测序样本为黑龙江省林口县青山林场红松种子园内无性系‘LK15’与无性系‘LK20’的针叶、嫩梢、雌花和球果,液氮速冻后送百迈克基因公司(北京)进行全转录组的Illumina高通量深度测序,共包含41 476条Unigenes。

SSR扩增用的53份红松样本分别来自1979年于黑龙江省苇河、铁力、鹤岗和林口营建的嫁接种子园(表 1),种子园亲本来源:苇河青山为鹤北优树,鹤岗为五营优树,林口青山为当地人工林优树,铁力为五营优树。造林株行距为4 m×6 m,无性系错位排列。每个无性系将采集后的球果晾干、制种,于2013年冬进行催芽处理。

表 1 红松试验材料 Tab.1 Pinus koraiensis accessions used in this study

表 1红松试验材料

Tab.1 Pinus koraiensis accessions used in this study

种子园Seed orchard无性系编号Clone No. 鹤岗 Hegang1,10,12,14,17,2,21,23,39,41,43,44,49,6,8 林口 Linkou11,13,15,16,18, 19, 20,24,26,27,3,32,6,79-36,8 铁力 Tieli1024,1048,1061,1104,1112,1131,1185,1209,1357,1383,3083,3101 苇河 Weihe008,019,028,042,056,063,065,067,071,117,162 1.2 方法

1)样本DNA提取每个无性系选取1个无病虫害的单株嫩苗,采用世阳生物公司新型植物基因组提取试剂盒提取红松基因组DNA,用1%的琼脂糖凝胶电泳检测DNA的质量,-20 ℃保存备用。

2)红松转录组SSR位点的鉴别及SSR引物设计对红松的针叶、嫩梢、雌花和球果的41 476条Unigenes,利用MISA软件(Guo et al., 2010)查找SSR位点。查找标准:二、三、四、五、六核苷酸的最小重复次数分别为6,5,5,5,5次。用Primer5软件进行引物设计。

3)引物筛选与PCR扩增按照SSR引物设计原则,对含1 757个SSR位点的EST序列进行引物设计,舍去引物合成不理想的序列,最终合成101对SSR引物(北京鼎国昌盛生物技术公司),SSR位点包括2~5个核苷酸重复单元。PCR反应体系为25 μL:模板DNA(25 ng·μL-1)2.0 μL,10×PCR buffer 2.5 μL,1 U Taq酶0.5 μL,引物(10 μmol·L-1)各0.5 μL,dNTPs 0.5 μL,ddH2O 18.5 μL。PCR扩增程序: 95 ℃预变性5 min;95 ℃变性30 s,最佳退火温度30 s,72 ℃延伸30 s,35个循环;72 ℃延伸10 min。每个种子园选用1个DNA模板对101对引物进行扩增检验。PCR产物首先采用2%琼脂糖凝胶电泳进行初步检测,舍去无扩增产物的引物,之后在6%变性聚丙烯酰胺凝胶上电泳分离检测。收集扩增产物,送测序验证(上海生工生物工程有限公司)。选择出扩增反应稳定、条带清晰、具有多态性位点的6对引物,进而合成荧光标记引物。PCR扩增后,取1 μL PCR产物,加入8.5 μL去离子甲酰胺、0.5 μL ROX-500分子量内标,95 ℃变性5 min,于4 ℃保温10 min,3 000 r·min-1离心1 min,于ABI3730 DNA分析仪上进行毛细管电泳,并收集数据。

4)数据分析用GeneMapper 4.0软件对收集的原始数据进行分析,系统将各峰值的位置与其泳道中的Rox-500分子质量内标予以比较,读取SSR标记片段大小,按照大写英文字母顺序记录等位基因,即同一位点最大的等位基因记为A,其余等位基因则依次记为B,C,D等,若只有1条峰值,则按照纯合基因型处理。用POPgene1.31软件(Yeh et al., 1999;Nei,1973)统计分析等位基因数(Na)、Shannon信息指数(I),利用PowerMarkerV3.25软件(Liu et al.,2005)计算多态性信息量(PIC)。

2 结果与分析 2.1 红松转录组中SSR位点的数量与分布

从红松转录组的41 476条Unigene序列中发现1 757个SSR位点,分布在1 549个Unigene中,发生频率(含有SSR的Unigene数量与总Unigene数量之比)为3.74%,其中,含2个及2个以上的SSR位点的Unigene序列有56条,1 493条序列含1个SSR位点,SSR的分布频率(SSR的个数与总Unigene的数量比)为4.24%,红松转录组序列中平均17.38 kb发现1个SSR位点。红松转录组中SSR种类包括一至五核苷酸重复类型,主要集中在一至三核苷酸重复类型上,占SSR总量的98.68%(表 2)。

表 2 红松转录组中SSR重复单元的分布特征 Tab.2 Distribution of the SSR motifs in Pinus koraiensis transcriptome

表 2红松转录组中SSR重复单元的分布特征

Tab.2 Distribution of the SSR motifs in Pinus koraiensis transcriptome

重复类型Type of repeat数目Number各类型比例Proportion of each type (%)频率Frequency (%)平均距离Average distance/kb平均长度Average length/bp主要重复单元Main repeat motif 单核苷酸Mononucleotide82446.901.9937.0711.81A/T, C/G 二核苷酸Dinucleotide30217.120.73101.1414.34AC/GT, AG/CT, AT/AT, CG/CG 三核苷酸Trinucleotide60934.661.4750.1616.37AAC/GTT, AAG/CTT, AAT/ATT,ACC/GGT,ACG/CGT,ACT/AGT,AGC/CTG,AGG/CCT,ATC/ATG,CCG/CGG 四核苷酸Tetranucleotide181.020.041 696.9621.11AAAC/GTTT,AAAG/CTTT,AAAT/ATTT,AAGC/CTTG,AAGG/CCTT,AATC/ATTG,AATG/ATTC,ACTC/AGTG,AGGC/CCTG 五核苷酸Pentanucleotide40.230.017 636.3120AAAAC/GTTTT,AATTC/AATTG,ACACT/AGTGT,AGCCC/CTGGG 总计Total1 7571004.2417.3813.94

红松转录组SSR位点的序列平均长度为13.94 bp,二、三、四、五核苷酸重复的平均长度分别为11.81,14.34,16.37,21.11,20 bp。如图 1所示,重复序列长度10~14 bp最多,达到52.82%,其次为15~18 bp(37.56%),19~22 bp(7.63%),>23 bp(1.94%)。SSR重复单元的重复次数分布在5~24次之间,如图 2所示,5~10次重复的最多,占75.41%。

图 1 SSR重复长度分布 Fig. 1 Distribution of the length of repeats in SSR loci 图 2 SSR重复次数分布 Fig. 2 Distribution of the number of repeats in SSR loci 2.2 红松转录组SSR分布特征

1 757个SSR位点共包含31种重复基元,其中,一、二、三、四、五核苷酸重复基元分别有4,4,10,9,4种。从出现频率来看,频率较高的前5种重复基元分别为A/T,AT/AT,AGC/CTG,AGG/CCT,AAG/CTT,分别占总SSR位点数的46.1%,10.76%,7.63%,6.66%,6.55%,共占总SSR位点数的77.7%。

2.3 EST-SSR引物筛选与验证

参试的101对引物中有21对引物扩增可检测出多态性位点,占引物总数的20.8%。然后利用检测出多态性位点的21对引物,进行PCR扩增,收集扩增产物,测序验证。通过测序验证表明,21对引物扩增出的特异条带中有16对引物(表 3)能够扩增出目标序列,成功率为76.19%。

表 3 SSR引物序列与重复类型 Tab.3 SSR primer sequences and repeat types

表 3SSR引物序列与重复类型

Tab.3 SSR primer sequences and repeat types

引物编号No.引物序列Primer sequence(5′—3′)SSR类型 SSR motifTm/℃ P11F: TGAGAATGAGGCGAACTGR: GAAGGAAAGGTAAGGTGGA(CT)953 P25F: AAAGTTCACATTGGCACATCR: TCAGTCCAGCGACAACAG(CTC)755 P44F: TTTCGGTTCTCAGGCTCTR: CCCTGGTGGTACAATGAC(ATG)5acgatgaag(ATG)653 P47F: GTTTCCGAGATTCCCAGACR: CAGTAGTAATATCCCGTTT(AT)951 P49F: GAGATGAGCGAATCTGGGR: TACAAGTTCCACCTACGG(AAG)752 P60F: AAACGCAGAGTGGAGGAAR: AACTCGGAGCATTTGGTG(CTG)652 P62F: AGTGGTCTACGCTGGAGTR: AACATTTAGGTCTTGGAGG(GCA)751 P63F: GCAGCAGATCAGAGGGAGR: CAGCCAACAACTGGTCATAC(CAG)756 P67F: TGAACGCACAGGCAAGTTR: GCGAAGGCAATGGTGAAA(ACAA)552 P70F: CAACATCGCCAATGACTCR: CCTACCTACGCTCTGCTC(CTCA)654 P72F: TGGGTTACCACCTTTAGCR: CAATCAGAGTCTGGAGCA(GCT)652 P74F: ACGCTACCGATTCTTACCR: GTGTTCGCCTACAACTCAT(GAA)652 P79F: CCACCGCCAAGTCCATTAR: GCTTTGTTAGCCGTCCAG(CAA)755 P82F: GGAAGATGAATCGCAAACCR: ACACCCGCCTGAAGAGCA(GCG)654 P90F: CCGCAAATCCGAGCAATGR: GCAGCAGACGATAATGAACCC(CCA)756 P92F: ACTTTGCGTGAATCAGACCR: AAAGTAAGGCTGCTTGCATGA(CAG)753 2.4 SSR位点多态性检测

选取具有多态性的6对引物,合成荧光标记引物,对53个红松无性系DNA进行PCR扩增,用以检测红松种子园无性系的遗传多样性,图 3、图 4为引物P92、P79分别扩增4个模板的毛细管电泳图。采用GeneMapper4.0软件进行数据分析,53个样本在6个SSR位点检测到的遗传变异见表 4,6对引物共检测到18个等位基因,平均每对引物检测到3个等位基因,多态性信息量(PIC)为0.036 3~0.667 4,平均为0.325。根据Botstein等(1980)的理论,有2个标记为低度多态位点(0<PIC<0.25),3个标记为中度多态位点(0.25<PIC<0.5),剩余1个为高度多态位点(PIC>0.5),P63位点PIC最高(0.667 4)。

图 3 HG2,LK19,TL1048和WH056的P92号SSR位点的基因型 Fig. 3 No. P92 SSR locus genotype of HG2, LK19, TL1048 and WH056 图 4 HG2,LK19,TL1048和WH056的P79号SSR位点的基因型 Fig. 4 No. P79 SSR locus genotype of HG2, LK19, TL1048 and WH056 表 4 SSR引物的扩增产物及其多态性分析 Tab.4 The SSR primers amplified products and their polymorphism

表 4SSR引物的扩增产物及其多态性分析

Tab.4 The SSR primers amplified products and their polymorphism

SSR引物SSR primer扩增片段大小Size/bp等位基因频率Overall allele frequencyShannon信息指数Shannon’s information index (I)多态性信息量Polymorphisminformation content(PIC) P92240~2720.084 9~0.641 50.848 80.437 8 P60140~2420.047 2~0.792 50.719 10.332 9 P63234~2480.037 7~0.320 81.367 30.667 4 P74134~1390.019 8~0.980 20.093 60.036 3 P79190~1960.217 0~0.783 00.523 10.282 1 P90234~2380.122 6~0.877 40.372 20.192 0 平均Mean0.654 00.325 0 3 结论与讨论

红松属于基因组序列比较庞大的裸子植物,本研究从红松41 476条Unigene序列发掘出1 757个SSR位点,平均17.38 kb发现1个SSR位点,SSR的分布频率(SSR的个数与总Unigene的数量比)为4.24%,小于杨树(Populus)(14.83%)(张新叶等,2009)、油茶(Camellia)(6.7%)(温强等,2013)等树种,与火炬松(Pinus taeda)(4.32%)(林元震等,2009)、马尾松(Pinus massoniana)(3.62%)(刘公秉等,2009)、日本落叶松(Larix kaempferi)(3.85%)(杨秀艳等,2011)相当。参试的101对引物中有21对引物扩增可检测出多态性位点,占引物总数的20.8%。在对不同树种的研究中,EST中含有SSR重复序列的比例及类型有差异,本研究可扩增出多态性位点的引物重复单元以二、三核苷酸重复为主。由于密码子以三核苷酸为一个功能单位,因此,三核苷酸位移对一个表达基因的阅读框不会造成太大影响,所以在EST序列中发现三核苷酸重复的SSR类型最多,在大多数物种中均以二核苷酸和三核苷酸是最常见的转录组SSR重复单位类型(Varshoey et al., 2002),本研究结果印证了这一点;本研究以三核苷酸重复较多,占SSR总数的34.66%,二核苷酸重复占SSR总数的17.12%。同时验证了低级单元SSR的多态性普遍高于高级单元(Dreisigacker et al., 2004)的推断,因此在设计SSR引物时应侧重于含低级单元的序列。

开发出6对引物用于53个红松子代家系的多态性检测分析,结果表明平均等位基因数为3.0,Shannon信息指数为0.654,多态性信息量(PIC)平均值为0.325,检测基因多样性水平的结果与张悦等(2013)研究红松微卫星标记相似。这些结果说明基于红松转录组序列开发和筛选出的EST-SSR引物可用于红松育种资源的遗传多样性评价。

EST-SSR在构建种质资源遗传多样性评价与保护等研究中具有很大优势,但同时它也存在一定的缺陷,由于EST-SSR来自相对保守的功能基因序列,因此与Genomic SSR标记相比较,EST-SSR标记的多态性较低(Eujayl et al., 2001);SSR分子标记多态性是基于扩增片段中不同的微卫星重复数目产生的,但对于长度相同而由不同碱基重复序列组成的SSR或者长度相近的SSR不能有效加以区分。随着公共数据库中不断增加的EST序列开发新的EST-SSR标记,及基于高通量测序技术更为有效地获得EST序列,有助于增加多态性SSR引物的数量,从而弥补EST-SSR标记本身多态性较低的问题;同时,结合其他分子标记如AFLP,SNP等进行比较研究,可以提高试验的可靠性和准确性。本研究采用ABI3730 DNA分析仪对6对荧光SSR引物所扩增的PCR产物进行毛细管电泳片段分析,克服了聚丙烯酰胺凝胶电泳方法中人工估算片段大小所造成的误差,试验结果更加客观。然而更多了解红松资源之间的遗传信息和遗传关系,还需要使用更多的SSR标记。本项研究印证了利用红松转录组数据开发SSR标记的可行性,同时采用荧光标记技术检测红松自由授粉子代材料,为红松种质资源遗传多样性分析、分子标记辅助育种、遗传图谱构建和功能基因的挖掘等奠定了基础。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3