基于文冠果基因组的SSR分子标记设计与开发
文冠果(Xanthoceras sorbifolium Bunge),无患子科、文冠果属落叶灌木或小乔木,高可达5米;小枝褐红色粗壮,叶连柄长可达30厘米;小叶对生,两侧稍不对称,顶端渐尖,基部楔形,边缘有锐利锯齿,两性花的花序顶生,雄花序腋生,直立,总花梗短,花瓣白色,基部紫红色或黄色,花盘的角状附属体橙黄色,花丝无毛;蒴果长达6厘米;种子黑色而有光泽。春季开花,秋初结果。文冠果原产于中国北方黄土高原地区,分布于北纬32°-46°,东经100°-127°即东至山东,西至甘肃宁夏,南自安徽省萧县到河南南部,北到辽宁西部和吉林西南部。集中分布在内蒙、陕西、山西、河北、甘肃等地,辽宁、吉林、河南、山东等省均有少量分布。在黑龙江省南部,吉林省和宁夏等地区还有较大面积的栽培树林。在垂直方向上,文冠果分布于海拔52-2260米,甚至更高的区域。文冠果适合生长在草沙地、撂荒地、多石的山区、黄土丘陵和沟壑等处、在崖畔上也能正常生长发育。栽培技术有播种、嫁接、根插和分株繁殖。文冠果是我国特有的经济木本油料树种,种子含油率为30.4%-47%,种仁含油量高达66.39%,其油脂的基本组成如下:硬脂酸、油酸38.9%、亚油酸40.2%。文冠果作为药用树种,果仁中含有神经酸,可以帮助缓解记忆力减退等问题。文冠果的果壳苷对阿尔茨海默病有治疗效果,种皮中蕴含的香豆素类化合物能够有效抑制HIV-1 蛋白酶活性。油中所含亚油酸是中药益寿宁的主要成份,具有较好的降血压作用,因此食用文冠果可有效预防高血压、高血脂、血管硬化等病症。文冠果种仁除可加工食用油外,还可制作高级润滑油、高级油漆、增塑剂、化妆品等工业原料。由文冠果籽油制备的生物柴油相关烃脂类成分含量高,内含18C的烃类占93.4%,而且无S、无N等污染环境因子,符合理想生物柴油指标。文冠果同时也是木材坚实致密,纹理美,是制作家具及器具的好材料。文冠果花序大而且花朵密集,树形优美、花色鲜艳,花期较长能够持续20 多天,可以用于公园、庭园、绿地孤植或群植,是一种景观性绿化树种。成龄文冠果根系发达,深度和分布广泛;根的皮层占91%,能充分吸收和贮存水分。文冠果具有较强的抗旱能力和抗寒能力,在年降雨量达到150 mm 的区域和在零下35℃的环境中也能够正常度过。是防风固沙、小流域治理和荒漠化治理的优良树种。在国家林业局2006-2015年的能源林建设规划中成为三北地区的首选树种。
1.1基因组测序的相关背景知识
基因组测序是指弄清楚基因组中DNA核苷酸或碱基的顺序-组成生物体DNA的As,Cs,Gs和Ts的顺序。当前基因组测序已经成为分子生物学研究的基础数据平台,它可以为基因克隆、基因功能研究、代谢途径分析、信号传导通路、生长发育等基础理论研究提供可靠的基因序列信息。测序技术发展快速,已从第一代发展到第三代测序。第一代具有数据准确、读段较长,但是通量低、速度慢,成本高、效率低,目前已不再用于基因组的测序。第二代测序技术属于高通量测序(张丁予等2016),数据较准确,测序费用低廉,但是读段短,基因组中遇到重复序列便无法继续组装(Pop amp; Salzburg 2008),因此难以组装到染色体水平。第三代测序技术也是高通量测序,具有读长长的特点,测序费用也在逐年降低,如果基因组中没有大片段的重复序列,可以组装到染色体水平,但是读段中的插入/缺失错误率可高达 15%以上(Koren et al. 2012)。为了提高三代测序的准确性,通常是采用提高测序深度来解决,这导致测序费用的提高[1]。大规模基因组测序的几个主要技术为Sanger双脱氧末端终止法,PCR技术、DNA自动测序仪的发展、生物信息学分析软硬件设施。其两种主要方法是逐步克隆法和全基因组霰弹法。逐步克隆法需要构建精确的物理图谱、速度慢、费用高、计算机性能低,适用于精细图。全基因组霰弹法不需要遗传背景、速度快、费用低、计算机性能高、适用于工作框架图。
1.2基因组测序的相关应用
高通量测序技术(high throughput sequencing,HTS)又称为下一代测序技术(next generation sequencing,NGS),能一次对几十万到几百万条DNA分子的序列进行测定,与第一代测序技术相比具有成本低、速度快及测序通量高等优点。根据测序目的不同,HTS主要分为全外显子测序、全基因组测序、靶向性区域测序、转录组测序等。在肿瘤学方面的应用主要有:通过血清中肿瘤标志物的测定,协助肿瘤的诊断、预后判断及疗效评价;通过检测肿瘤患者特定的基因变异情况,协助实施针对靶点精准治疗方案;检测正常人体中是否有肿瘤高危变异基因,可对其进行及时诊断并开展早期的预防性治疗[2]。
来自中国农业科学院棉花研究所的棉花基因组测序团队,联合北京大学、武汉大学、华大基因、美国农业部南方平原研究中心以及河北农业大学等研究单位,综合利用第二代高通量测序技术并结合BAC末端大片段测序方法,完成了世界上最重要的棉种陆地棉(At Dt 基因组)的全序列测定和组装,结束了棉花没有参考基因组图谱的历史。棉花基因组的解析,对棉花产量和品质形成生物学机制的深入研究、优异基因的选择和利用、高通量基因分型及建立更加有效的育种策略奠定了坚实基础[3]。
1.3分子标记种类和原理
广义的分子标记(molecular marker)是指可遗传的并可检测的DNA序列或蛋白质。蛋白质标记包括种子贮藏蛋白和同工酶(指由一个以上基因位点编码的酶的不同分子形式)及等位酶(指由同一基因位点的不同等位基因编码的酶的不同分子形式)。狭义的分子标记概念只是指DNA标记,而这个界定现在被广泛采纳。目前主要的分子标记有限制性片段长度多态性(restriction fragmentlength polymorphism,缩写RFLP)、随机扩增多态性DNA(random amplifiedpolymorphic DNA,缩写RAPD)、扩增片段长度多态性(Amplified FragmentLength Polymorphism,缩写AFLP)、特定序列位点(sequence- tagged site,缩写STS)。RFLP是发展最早的分子标记技,RFLP技术的原理是检测DNA在限制性内切酶酶切后形成的特定DNA片段的大小。RAPD以PCR(聚合酶链式反应)为基础的分子标记,该技术用一个(有时用两个)随机引物(一般8~ 10个碱基)非定点地扩增DNA片段,然后用凝胶电泳分开扩增片段。AFLP的特点是把RFLP和PCR结合了起来。其基本步骤是:把DNA进行限制性内切酶酶切,然后选择特定的片段进行PCR扩增(在所有的限制性片段两端加上带有特定序列的“接头”,用与接头互补的但3′端有几个随机选择的核苷酸的引物进行特异PCR扩增,只有那些与3′端严格配对的片段才能得到扩增),再在有高分辨力的测序胶上分开这些扩增产物,用放射性法、荧光法或银染染色法均可检测之。STS是对由其特定引物序列所界定的一类标记的统称。利用特异PCR技术的最大优点是它产生的信息非常可靠,而不象RAPD、AFLP和利用随机探针产生的RFLP存在某种模糊性(如难以鉴别片段的来源)。这类分子标记包括STMS(Sequence- tagged microsatellites)通常又称为SSR,也可称为SSRP(Simple SequenceRepeat Polymorphisms)[4]。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。