大花序桉基因组SSR的分布特征及序列分析.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《大花序桉基因组SSR的分布特征及序列分析.docx》由会员分享,可在线阅读,更多相关《大花序桉基因组SSR的分布特征及序列分析.docx(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、大花序核基因组SSR的分布特征及序列分析邱炳发梁馨元王建忠白天道蒋维昕表I大花序检基因组SSR中不同重复基元类型统计结果fable 1 DiHercnt repeat motif types in genomic SSR sequences of E. cloeziana而乂类仪 Repeat lype数;it Number比例() Proport 沁n发生频率(%)frequency of oecunence平均冷离(kb) Average distance单核 fl 酸 Mononucleotide11891866.9011.954.68:核件版 Dinucleotide3603620.2
2、73.6215.46三核付酸 Trinucleotide130077.321.3142.82四核伴酸 Tetranucleotide2409i.360.24231.21日核件腋 Pentanucleotide7800.440.08714.09六核件酸 1 Icxanuclcotidc3800.210.041465.77”合型SSR Compound SSR62203.50.6389.55总计Total17775010017.863.13SSR分布特征及标记开发的研究报道。【拟解决的关键问题】通过高通量测序获得大花序核基因组序列信息,经严格过滤、拼接和组装后获得scaffolds, 利用MISA
3、网站对Scaffolds进行SSR位点检索及分析,并利用Primer 5. 0对 具有较大多态性开发潜力(二基元重复次数210、三基元重复次数27)的SSR 序列进行引物设计,随机挑选48对基因组SSR引物进行有效性检测及有效扩增 引物筛选,以期开发大花序楼SSR标记,为大花序接种质资源鉴定、遗传多样 性及分子标记辅助育种打下基础。1材料与方法1. 1试验材料高通量测序所用材料为2年生大花序楼顶芽,采集自广西崇左市扶绥县国有东 门林场大花序校种源试验林基地(107 14, 108.00 E,22。17 22.30 N)。样品采集后迅速投入液氮速冻保存,由上海欧易生物医 学科技提取其基因组DNA
4、并建库,通过Hlumina HiSeq X Ten高通量 测序平台进行双端测序。后续SSR引物扩增所用样本为6株大花序核新鲜叶 片,随机采自广西东门林场以实生苗营造的3年生大花序核子代试验林。该试 验林种子来自澳大利亚昆士兰州的大花序校天然母树林。采集后于干冰保存带 回实验室-80 保存。基因组DNA快速提取试剂盒及PCR Mix均购自北京擎科 新业生物技术。1. 2基因组SSR标记开发及引物设计采用Trimmomati对高通量测序的原始数据进行严格过滤和质量评估(Bolgeret al. , 2014),获得高质量的clean reads,将clean reads之间重叠区域拼接形成cont
5、igs,再根据序列信息将contigs组装成更长的scaffolds (Xie et al. , 2014)。 基于 MISA ( : /pgrc. ipk-gatersleben. de/misa/) 网 站对大花序楼全部scaffolds进行SSR位点检索及分析。SSR搜索参数设置标 准如下:重复基元16 bp,分别代表单核甘酸六核昔酸,各核甘酸类型最 小重复次数分别为10、6、5、5、5和5次,复合型SSR的检索条件是2个SSR 片段间的距离低于100 bpo利用Primer 5. 0对含有SSR且位点上、下游序列 N100 bp的二基元(重复次数N10次)、三基元(重复次数27次)核甘
6、酸重 复序列进行引物批量设计。参数设置为:SSR引物长度为1822 bp;退火温度(Tm)为5862 ,且上、下游引物相差的退火温度2 ;PCR产物片段长度 为100350 bp, G+C含量为50%55%;防止引物二级结构。1. 3 PCR扩增及SSR引物有效性验证随机挑选48对基因组SSR引物,由生工生物工程(上海)股份合成。 利用基因组DNA快速提取试剂盒提取6株大花序接新鲜叶片的基因组DNA,以 其为模板进行PCR扩增。反响体系10.0 PL: 10XBuffer 1.0 uL, dNTPs终 浓度200 umol/L,正、反向引物终浓度0.40 umol/L, Taq DNA聚合酶1
7、 U, DNA模板5 ng, ddH20定容至10.0 uL。扩增程序:95 预变性6 min;95 变性30 s, 58 退火30 s, 72 延伸1 min,进行35个循环;72 延伸5 min,最后4寸保存。扩增产物采用8%非变性聚丙烯酰胺凝胶电泳别离,银染 显色,拍照保存,统计其中能够稳定扩增、条带明亮且符合预期目的片段大 小。2结果与分析 2. 1大花序校基因组SSR的重复基元类型 对大花序校进行基因组测序,经拼接、组装后获得995093条Scaffolds,总长 度556992 kbo通过MISA网站对全部Scaffolds进行SSR位点检索,共获得 177750个SSR位点,包括
8、171530个SSR独立位点和6220个复合型SSR位点(表1)。由表1可知,大花序校基因组SSR发生频率为17. 86%, SSR位点分 布密度为1/3. 13 kb;大花序枝基因组重复基元类型较丰富,以单核甘酸的重复 基元类型数量最多,分别占基因组SSR数量69. 33% (118918个SSR位点),其 次为二、三核甘酸的重复基元类型,占基因组SSR数量的21. 01% (36036个 SSR位点)和7.58% (13007个SSR位点);四、五、六核甘酸的重复基元类型 所占比例均相对较低,三者的比例含量总和为2.08% (共3569个SSR位点)。 总整来看,含SSR位点的序列数量随核
9、昔酸基元碱基数的增加逐渐减小。2. 2大花序核基因组SSR的重复基元碱基构成对大花序核基因组中52612个二核甘酸六核甘酸重复基元进一步分析,结果 共发现138种重复基元类型,比例最高的20种类型SSR (图1)共计43618个(占82. 91%)。在这些核甘酸重复类型中,二核甘酸基元重复类型中以AG/CT 占绝对优势(共16812个,占31. 95%),其次为AT/AT (共8193个,占 15. 57%)和AC/GT基元类型(共2863个,占5. 44%);三核甘酸重复类型中那么 以AAG/CTT (共4404个,占8. 37%)为优势重复基元类型,其次为AAT/ATT(4. 93%)、A
10、GG/CCT (2.91%)和 CCG/CGG (2.86%)基元类型;大花序校基因组 SSR中四、五、六核甘酸重复基元虽然类型也较丰富,但占SSR位点总数的比 例较低,且其中有76种基元类型仅出现1次。2. 3大花序校基因组SSR基元重复次数分布 大花序校基因组各类型核甘酸重复基元的数量和比例随着基元重复次数的增加 而逐渐降低(图2)。除去单核甘酸类型,大花序板基因组不同SSR类型重复 次数主要集中于511次之间,占独立位点SSR总数的79.89% (表3);重复次 数212的SSR位点以二核甘酸类型SSR为优势,占19.29% (10151个),其 中,高重复次数(220次)的SSR位点数
11、共983个。在大花序楼基因组所有类 型SSR序列中,占比例最高的重复次数依次为6次、5次、7次和8次重复类 型,分别为12333、8276、7382和5049个,各占SSR总数的23. 44%、 16. 58%、14. 03%和 9. 60% o2. 4大花序核基因组SSR重复片段长度由于SSR序列长度220 bp时具有较高多态性,是理想的标记位点;序列长度在 1220 bp之间时标记多态性适中;12 bp时SSR标记的多态性表现极低(Temnykh et al. , 2001),因此本研究选取212 bp的二六核甘酸重彳复基 元作进一步片段长度分析,结果图3所示。大花序板基因组SSR重复片段
12、的长 度变化规律和基元重复次数一致,SSR序列长度主要集中于1220 bp,为 38735个,占SSR总数的73. 26%;分布于2128 bp的SSR数量为9868个,占 SSR总数的18. 66%; 230 bp以上的SSR数量为4265个,占SSR总数的8. 07%。 另外,大花序校基因组SSR最长重复片段为三核昔酸类型ATT/AAT (102-111 bp),出现次数为7。总整来看,大花序校SSR长度主要集中在中等多态性长 度,具有较大的多态性标记开发潜力。2. 5大花序核基因组SSR标记的扩增有效性检测结果对大花序校基因组中具有较大多态性开发潜力的10585个SSR标记进行引物设 计
13、,从中随机挑选48对SSR标记引物,以6株大花序楼新鲜叶片DNA为模板进 行PCR扩增,并从中筛选扩增效果较好且符合预期大小的引物。由图4可知, 有31对引物能有效扩增出清晰、明亮条带,且大小与预期相符(表2),其中 有14对引物在6株大花序枝中扩增出多态性条带,多态百分率为29. 17%, 8对 引物扩增效果不佳或扩增出非目的条带,9对引物未扩增出条带。结合表2还 可知,未呈现多态性的SSR基元重复次数为733次;呈现多态性的SSR位点 中,除复合型位点Ec015外,二基元类型占85.71%,重复次数为1644次;三 基元类型仅有一个SSR位点(即Ec007),重复次数为34次。3讨论经本研
14、究分析发现,大花序校基因组177750个SSR位点,SSR分布密度为 1/3. 13 kb,发生频率为17.86%,高于赤楼(E. camaldulensis)的SSR分布 密度(1/7. 1 kb) (Hirakawa et al. , 2011)以及基于NCBI数据库分析的巨 核(E. grandis) (11.8%)、苹果核(E. gunnii) (4.6%)和细叶才安(E. tereticornis) (8. 3%) EST-SSR 发生频率(Yasodha et al. , 2008),但低 于基于FORESTs数据库分析的巨校、赤楼、蓝桂等EST-SSR分布频率(25. 6%和 2
15、5. 6%) (Ceresini et al. , 2005;Rabello et al. , 2005) 可见,不同树种 基因组中SSR的分布特征存在较大的差异,相对于其他校树,大花序核基因组 中SSR发生频率处于中等水平。Varshney等(2005)研究认为,SSR分布频度 之所以出现差异,除了物种间差异因素外,还与测序数据深度、序列拼接数据 质量及SSR位点查找软件以及SSR搜索标准不同有关。罩核昔酸、二核甘酸和三核甘酸重复基元是绝大多植物基因组SSR序列中优势 重复类型(Biet et al. , 1999) 0本研究发现,大花核基因组SSRs中,单、二和三核甘酸重复基元类型分别占基
16、因组SSR数量的69. 33%. 21. 01%和7. 58%,且二核甘酸基元类型以AG/CT为优势重复基元(16812个,占31.95%),该结果和绝大局部植物中观测到的结果一致(Sumathi andYasodha, 2014)。而三核甘酸重复基元优势类型那么因物种而异(Victoria et al. , 2011) o本研究中,大花序校SSR序列中三核甘酸重复类型占比从高至低 依次为 AAG/CTT (8. 37%)、AAT/ATT (4. 93%)、AGG/CCT (2.91%)和 CCG/CGG(2.86%),与苹果楼(E. gunnii) (Rengel et al. , 2009
17、)和赤楼(E.camaldulensis) (Hirakawa et al. , 2011)的基因组 SSR 三核甘酸重复类型 中AAG/CTT为优势重复基元类型的结论一致。但蓝枝、尾叶校、巨枝及细叶技 等校树基因组SSR三核甘酸重复类型中CCG/GGC为优势重复基元类型(Ceresini et al. , 2005; Yasodha et al. , 2008;Sumathi and Yasodha, 2014;Liu et al. , 2018) o对于大花序校而言,其根部转录组三核甘酸重复序 列中CCG/GGC也为优势类型(朱林生等,2018)。上述基因组和转录组间的差 异间接反映了三核
18、甘酸重复类型SSR在核树基因组上分布不随机。研究说明,SSR基元重复次数越高,多态性标记的开发潜力越大,尤其当基元 的重复次数212次或片段长度N20 bp时多态信息含量(PIC)较高(Thao et al. , 2013) o本研究对大花序核基因组中具有较大多态性开发潜力的10585个SSR序列(二基元重复次数210、三基元重复次数27)进行引物设计,从中随 机挑选48对基因组SSR标记引物进行初筛选,结果发现有31对引物能有效扩 增,其中有14对引物在6株大花序校中均呈现多态性。进一步将多态与非多态SSR位点基元重复次数进行比拟,结果发现重复次数最高的SSR并非一定表现 出多态性,但从占比
19、最高的二基元类型分析,SSR长度W30 bp (或重复次数小 于16次)的位点多态性表现极低。本研究得出,大花序校基因组SSR引物的多 态百分率为 29. 17%,与 E. victrix (33. 33%) (Nevill et al. , 2013)和 E.gomphocephala (25%) (Bradbury et al. , 2013)的多态百分率相近,但远低 于赤核(E. camaldulensis) (56%) (Silva et al. , 2009)的多态百分率。 今后应对大花序校群体的多态信息含量(PIC)、观察等位基因数(Na)、有效 等位基因数(Ne)、期望杂合度(H
20、e)和观察杂合度(Ho)进行深入研究,为 群体遗传学分析和分子标记辅助育种打下理论基础。4结论花序校基因组SSR位点发生频率高,基元类型较丰富,SSR多态性标记开发潜 力大。该研究结果为大花序校SSR引物开发和筛选,以及开展大花序校及其他 校树遗传多样性分析和遗传图谱构建提供依据。Reference:邓紫宇,陈健波,郭东强,李昌荣,卢翠香.2019.大花序校的遗传多样性分 析J.林业科学研究,32 (4) : 41-46. Deng Z Y, Chen J B, Guo D Q, Li C R, Lu C X. 2019. Genetic diversity of Eucalyptus clo
21、ezianaJ.Forest Research, 32 (4) : 41-46. doi: 10. 13275/j. cnki. lykxyj. 2019. 04. 006.黄振,张俊,陈炙,王丽华,郭洪英.2018.大花序楼国内遗传育种现状与研 究展望J.四川林业科技,39 (1) : 17-21. Huang Z, Zhang J, Chen Z, Wang L H, Guo H Y. 2018. Development and prospects of heredity and breeding researches on Eucalyptus cloezianaJ. Journal o
22、f Sichuan Forestry Science & Technology, 39 (1) : 17-21. doi: 10.16779/j. cnki. 1003-5508. 2018. 01. 004. 李昌荣,项东云,陈健波,翟新翠,阚荣飞,兰俊.2012.大花序板木材基本 密度的变异研究J.中南林业科技大学学报,32 (6) : 158-162. Li C R, Xiang D Y, Chen J B, Zhai X C, Kan R F, Lan J. 2012. Study on wood basic density variation of Eucalyptus clozia
23、naJ. Journal of Central South University of Forestry & Technology, 32 (6) : 158-162. doi: 10. 14067/j. cnki. 1673-923x. 2012. 06. 010.祁述雄.2002.中国校树M.北京:中国林业出版社.Qi S X. 2002. Eucalyptus in ChinaM. Beijing: Chinese Fore-stry Press.朱林生,刘果,何沙娥,李慧,刘学锋,陈少雄.2018.基于Hlumina HiSeq 2000测序技术对大花序棱根的转录组特性分析J.分子植物
24、育种,16(13) : 4245-4254. Zhu L S, Liu G, He S E, Li H, Liu X F, Chen S X. 2018. Transcriptome characterization analysis of Eucalyptus cloeziana root based on Illumina HiSeq 2000 sequencing technologyJ. Molecular Plant Breeding, 16 (13) : 4245-4254. doi: 10. 13271/j. mpb. 016. 004245.Biet E, Sun J, Dut
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 花序 基因组 SSR 分布 特征 序列 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内